下游KG與GNN模型的范例解說
1 複習:三層KG架構
首先復習已經詳細介紹過的< 三層KG 架構>。然后基于這項創新架構,可以構建出一種<KG+GNN+LLM>整合式知識推理流程。其包含LLM 協助構建知識圖譜(KG)、GNN推理潛在知識與反事實邊、人類進行創新決策后回饋知識圖,最終結合RAG與LLM完成可信、可控、可更新的主權AI 演化生態圈。此生態圈的最大價值是:
● 從無到有(用LLM建立KG):使用BERTopic預訓練模型擷取候選實體,并由LLM 萃取語意關系并建構初步三元組(Triple)圖譜,大幅提升初建KG 的在地性與語義密度。
● 從靜態到推理(用GNN 和CF 探索):訊練GNN預測潛在關系,并透過GAT、R-GCN 等模型進行鏈接預測,探索反事實連結(CF Link),來激勵人們的反事實思考(CF Thinking)。其將傳統AI 推理升級為反事實推理與探索。
● 從推理到創新(人機協作產生決策):人類開始進行創新思考,并對潛在關系進行專家審查和反思,優化人們的決策。其中,引入了人機協作治理,人類專家主導反事實推理的解釋與修正,避免AI 幻覺的偏差。
● 從創新到資產化(知識回饋更新KG,讓KG 不斷進化):依據人的決策回饋,來更新KG,形成動態進化式的知識生態。然后,透過RAG 框架,讓LLM 響應與企業內知識結合,提升準確與可信度。
2 支援下游應用任務
在上一期里,已成功演示了一個案例,其中訓練出一個能夠把突變數據轉換成嵌入向量的中游KG + GNN模型,而且嵌入已儲存于mutation_embeddings_gin.csv檔案里,可供給下游任務使用(如分類、群聚、可視化、或與影像特征融合等)。中游KG 扮演行業語境的橋梁,讓LLM能入鄉隨俗,理解場域,成為可信任AI 的知識背景層(Context Layer)。
現在,基于已經訓練好的節點嵌入(Node Embedding),來支撐下游應用<KG + GNN> 模型。這項下游任務結合了醫學影像特征(Ultrasound/MRI)進行多模態推論,也將GNN輸出的嵌入與CNN影像特征進行融合,提供AI輔助診斷(如預測、分類等)。如下圖3 所示:
圖3
這樣可以順利訓練出一個能夠把突變數據轉換成嵌入向量的GNN模型,能產生節點的嵌入向量(Embedding),來提供給后續的下游任務使用(如分類、群聚、或與影像特征融合等)。例如,下游任務可以結合醫學影像特征(Ultrasound/MRI)進行多模態推論,也將GNN 輸出的嵌入與CNN影像特征進行融合,提供AI 輔助診斷(如預測、分類)等各種應用。
3 實踐范例
例如,乳腺癌癥的診斷與治療策略高度仰賴基因、突變、生物標志物與病理影像等異質信息。而上述的三階段知識圖譜架構(KG)為基礎的乳腺癌主權AI 解決方案。透過串接國際生物醫學數據、結合院內檢測與病例數據,最終建構可用于推理、推薦與決策輔助的AI系統。例如,結合病理影像模型與KG 多模態推理,建構問答式臨床決策支持接口,進而- 建立跨院共享型乳癌主權知識平臺等。
此范例使用Python代碼來實踐模型訓練,并搭配xlwings和openvino套件,來提供可操作的Excel畫面和部署(Deployment)環境。首先,開啟ee01.py,如下:
Step-1:建立下游KG
接著,執行它(即ii01.py),并且在Excel 畫面按下< 建立下游KG> 按鈕,就建立了一個下游KG(圖-2):
這個下游KG 含有4 種節點:疾病(cancer)、基因(gene)、突變(mutation)和超聲波檢測(ultra),其整合ultra節點特征參與訊息傳遞與分類。這種以疾病-基因-藥物為核心的多重鏈接結構,非常適合用KG+GNN建模。此類系統若整合影像與知識,可有效推促進醫療AI的發展。例如本案例融合了Ultra node所提供的視覺特征,進一步提升癌癥分類的準確性與上下文理解能力。
同時,這個下游KG可賦能乳癌精準醫療,從串聯基因與治療決策邏輯,透過attention與反事實推理回溯依據,提升AI推論可解釋性。并且符合主權AI要求:數據本地處理、自研模型訓練、決策過程可控。
Step-2:訓練GNN模型
接著,按下< 訓練下游模型>,就展開訓練GNN流程,如下:
訓練完成了,就導出ONNX模型,并儲存于ultra_cancer_classifier.onnx檔案里,將會在OpenVINO 平臺上進行模型部署。
除了醫療領域之外,在其它制造業、醫療、法務、教育等「需本地知識又要求精準推理」的場景中,上述方法都具高度適用性。而且,不需要訓練大型模型,只需整合KG+GNN+LLM,就能實踐商業應用目標。
Step-3:部署模型&推論
接著,按下<OpenVINO 部署&推論>,就出現:
于是,完成了「用下游KG來預測癌癥類型」的初步實作。其將影像推論(ultra 特征)作為語意節點納入異質知識圖中,透過GNN 傳遞形成融合的癌癥語義表示。最終分類器已導出為ONNX,可于OpenVINO 原型環境下進行輕量推論。
這使用突變+ 基因節點特征,透過異質GNN,預測癌癥節點的類別(乳癌vs 非乳癌)。這下游任務中的GNN模型訓練與推理(例如癌癥分類、mutation 預測)。
本案例的系統架構,也可預測多種癌癥(如Bladder Cancer、Bone Cancer、Breast Neoplasms 等),并透過混淆矩陣與ROC 曲線驗證模型判斷能力,證實中游語義嵌入能有效支持下游分類任務。
4 結語
由于許多AI 部署流程, 常常缺乏語境在地化(Contextualization)特性,導致模型布署后難以完全貼合本地知識、生產流程與客戶需求。這種以中游KG 作為語境支撐層,讓下游AI 系統真正入鄉隨俗、自主成長。
例如,藉由知識圖譜結構化推理與持續自我更新,AI甚至能預測、引導、優化用戶的決策,達成超越人類直覺的智慧支持。也讓每一個裝置,都能懂你,而且比你更懂你!
(本文來源于《EEPW》202507)
評論