新聞中心

        EEPW首頁 > 智能計算 > 設計應用 > 行業(yè)性中游KG的實踐范例與解說

        行業(yè)性中游KG的實踐范例與解說

        作者:高煥堂 時間:2025-06-29 來源:EEPW 收藏


        本文引用地址:http://www.104case.com/article/202506/471816.htm

        1 前言:的關(guān)鍵角色

        在上一期里,介紹了< 三層KG架構(gòu)設計>,其中的核心是:訓練<主權(quán)式>中游領(lǐng)域性GNN模型。這GNN模型就如同光影般在枝干之間流轉(zhuǎn),發(fā)掘那些隱形的脈絡,這AI模型對世界潛在邏輯的無聲咀嚼。而人類專家的反事實直覺,則像是一陣陣富有靈性的風,為知識樹注入主觀判斷與未來想象的氣息(圖1)。

        image.png

        圖1

        GNN不斷向樹內(nèi)注入可能的連結(jié)(如同春天的芽)。專家思辨則回應、取舍、養(yǎng)護(如同秋天的修枝)。于是,KG隨著一次次有機回饋,在冬藏與夏茂之間,持續(xù)拓枝展葉(如同夏天得茂盛)。垂直行業(yè)的本地專屬性KG(中游),搭配企業(yè)專屬性KG(下游),兩這結(jié)合來提供主權(quán)式的語境,讓LLM入鄉(xiāng)隨俗,也讓本地專家反事實思考來持續(xù)更新KG(圖2)。于是,「中游+ 下游KG的語境融合設計」正是實踐主權(quán)AI的關(guān)鍵路徑之一。

        1751175126409454.png

        圖2

        這個新架構(gòu),能讓LLM成為「受過企業(yè)訓練的AI助理」:

        ●   用中游+下游KG作為LLM的「訓練文化背景」與「工作目標指令」。

        ●   再用RAG機制或LoRA微調(diào),只需少量數(shù)據(jù)就可讓模型變得非常貼近企業(yè)需求。

        ●   其中,保留了「反事實思考」這道人類控制關(guān)卡,是一項安全的創(chuàng)新設計。

        亦即,讓LLM變得「入鄉(xiāng)隨俗」,又能由企業(yè)自己主導更新與推理。在生成式AI快速普及的時代,數(shù)據(jù)不再只是資源,更可能成為風險,并引發(fā)信任危機。于是,以企業(yè)專屬的中游主權(quán)KG,不是替代LLM,而是給AI一個可信的語境,從而產(chǎn)生可信的判斷。

        于是,這項創(chuàng)新流程,從知識圖譜到GNN,到大型語言模型整合,讓企業(yè)能夠打造出真正屬于自己的AI系統(tǒng),而不是完全依賴外部云端平臺。未來,不論是餐飲、醫(yī)療,還是供應鏈管理,都能靠這樣的方法,走向更智慧、更有主控權(quán)的AI 時代。

        2   復習:+GNN模型訓練

        剛才已經(jīng)說明了,上述<三層KG架構(gòu)>的核心是:訓練< 主權(quán)式> 中游領(lǐng)域性GNN模型。在訓練時,首先從上游DRKG里讀取藥物實體的嵌入向量(Embeddings),成為這中游MutationKG的< 藥物>節(jié)點的起始特征(Initial Features)。同時,也從上游KDGene里讀取基因?qū)嶓w的嵌入向量(Embeddings),成為這中游MutationKG的< 基因> 節(jié)點的起始特征。然后,搭配本地機構(gòu)自主性癌癥及其類型數(shù)據(jù),就準備就緒了(圖3):

        1751175276131789.png

        圖3

        這樣可以順利訓練出一個能夠把突變數(shù)據(jù)轉(zhuǎn)換成嵌入向量的GNN模型, 能產(chǎn)生節(jié)點的嵌入向量(Embedding),來提供給后續(xù)的下游任務使用(如分類、群聚、或與影像特征融合等)。例如,下游任務可以結(jié)合醫(yī)學影像特征(Ultrasound/MRI)進行多模態(tài)推論,也將GNN輸出的嵌入與CNN影像特征進行融合,提供AI輔助診斷(如預測、分類)等各種應用。

        3   實踐范例

        此范例使用Python代碼來實踐模型訓練,并搭配xlwings和openvino套件,來提供可操作的Excel畫面和部署(Deployment)環(huán)境。首先,開啟ee01.py,如下:

        1751175369792767.png

        Step-1:建立

        接著,執(zhí)行它(即ee01.py),并且在Excel畫面按下< 建立中游KG> 按鈕,就建立了一個中游KG(圖-2):

        1751175466338069.png

        這個中游KG含有4 種節(jié)點(Node),以及5種邊(Edge)。為什么需要中游KG ?中游KG 讓推理不只是輸出結(jié)果,而是結(jié)合本地知識,做出更貼合使用情境的智慧推理。中游KG是什么?它和一般數(shù)據(jù)庫有何不同?中游KG是一個語義結(jié)構(gòu)化的知識層,不只是儲存數(shù)據(jù),而是讓機器理解本地知識與語境的推理支持系統(tǒng)。

        中游KG是行業(yè)語境的橋梁,也有助於解決LLM的通用性盲點:

        ●   LLM強在語言理解與生成,但弱在「行業(yè)知識的語境精準性」。

        ●   而中游KG 是來自行業(yè)、地區(qū)、語言語意等本地知識、地區(qū)文化、專業(yè)詞匯、歷史案例(例如在醫(yī)療中同一病名的不同處理方式),強化模型語境理解,提升語義精度。正是補足LLM「不懂地方、不懂細節(jié)」的關(guān)鍵資產(chǎn)。

        ●   中游KG讓LLM能「入鄉(xiāng)隨俗」,說得專業(yè)、理解場域,是可信AI 的知識背景層(Context layer) ---即讓LLM能「說行話、講道理、不亂編(有資料依據(jù))」。

        Step-2:訓練GNN模型

        接著,按下<訓練GNN模型>,就展開訓練流程,如下:

        1751175557882938.png

        訓練完成了,就生成各節(jié)點的嵌入(Embeddings),并儲存于c:/ox_M3_embeddgins/里, 將提供給下游任務使用。由于當今的下游AI部署流程,常常缺乏語境在地化(Contextualization),導致模型布署后難以完全貼合本地知識、生產(chǎn)流程與客戶需求。于是,以中游KG作為語境支撐層,結(jié)合智慧布署技術(shù)(如OpenVINO),即可讓AI 真正入鄉(xiāng)隨俗、自主成長。

        其核心做法是:

        ●   先構(gòu)建一個企業(yè)或行業(yè)專屬的中游KG(知識圖),承載本地知識、術(shù)語、作業(yè)流程。

        ●   當AI模型要智能布署到各種終端(Edge)設備時,可透過這個中游KG來提供實時語境信息。

        ●   這讓AI模型在布署時,不只是推理(Inference),而是帶著在地知識智能地推理與更新。

        因有語境支撐,模型可自動或半自動地針對本地變化(新流程、新規(guī)范)進行增量學習或推薦修正,增加AI持續(xù)更新與微調(diào)能力,降低模型老化風險。中游KG可本地部署,無須上云傳輸大量敏感數(shù)據(jù),符合GDPR、CCPA 等合規(guī)需求:數(shù)據(jù)隱私與主權(quán)保障。無論是CPU、GPU、VPU 或其他異質(zhì)硬件,各種布署環(huán)境(如OpenVINO)都能結(jié)合中游KG,來讓部署端實時獲得「語境智慧加持」,具有跨設備與異質(zhì)環(huán)境靈活性。

        Step-3:探索CF_Links

        接著,按下< 探索CF_Links>,就出現(xiàn):

        1751175919335396.png

        GNN探索反事實邊(CF_Links),例如:針對ID是<C0001202>的癌癥,GNN探索出3項反事實邊,然後提出潛在的用藥推薦(如上圖所示)。其目的是:由GNN探索反事實邊,來激發(fā)人類專家的反事實思維(CF_Thinking)。人機協(xié)作完成知識誕生與AI可解釋推理,這是主權(quán)AI的治理核心,保有人類主導權(quán),防止AI幻覺或誤導。亦即:人類CF思考+ 創(chuàng)新決策。然後,將人類專家的創(chuàng)新決策回饋更新KG,讓靜態(tài)KG 變成有生命的KG,成為動態(tài)AI 推理資產(chǎn),也讓LLM 響應與企業(yè)內(nèi)知識結(jié)合。于是,完整實踐了< 知識– 推理– 決策– 更新> 的人機協(xié)作模式,也落實了主權(quán)AI 精神。

        4   結(jié)語

        行業(yè)性中游的實踐效益是:

        ●   跳脫單向推論模型:這方法是「知識推理+ 人類決策」雙循環(huán),不是死數(shù)據(jù)庫,也不是死推論器

        ●   融入反事實思維(CF Thinking):這符合全球最新的AI推理領(lǐng)域趨勢,特別是醫(yī)療、金融、制造業(yè)開始要求AI能模擬「如果……那會如何?」這種推理。

        ●   主權(quán)AI治理完整框架:除了本地部署之外,也設計了知識版本控制、人機共生更新。這正是主權(quán)AI最難、最稀缺的部分。

        (本文來源于《EEPW》



        關(guān)鍵詞: 202506 中游KG

        評論


        技術(shù)專區(qū)

        關(guān)閉
        主站蜘蛛池模板: 安义县| 运城市| 天祝| 塔河县| 康保县| 犍为县| 壤塘县| 山西省| 庆元县| 泸溪县| 南充市| 湄潭县| 巫溪县| 聂拉木县| 八宿县| 扎赉特旗| 长岛县| 中牟县| 诏安县| 蒙城县| 深州市| 福泉市| 大田县| 高平市| 荃湾区| 惠来县| 牡丹江市| 那曲县| 宁城县| 浏阳市| 海晏县| 光泽县| 阿克苏市| 尤溪县| 永川市| 九龙县| 叶城县| 平罗县| 专栏| 山阴县| 迁西县|