新聞中心

        EEPW首頁 > 設計應用 > 下游KG與GNN模型的范例解說

        下游KG與GNN模型的范例解說

        作者:高煥堂 時間:2025-07-16 來源:EEPW 收藏

        1   複習:三層KG架構

        首先復習已經詳細介紹過的< 三層KG 架構>。然后基于這項創新架構,可以構建出一種<KG+GNN+LLM>整合式知識推理流程。其包含LLM 協助構建知識圖譜(KG)、GNN推理潛在知識與反事實邊、人類進行創新決策后回饋知識圖,最終結合RAG與LLM完成可信、可控、可更新的主權AI 演化生態圈。此生態圈的最大價值是:

        ●   從無到有(用LLM建立KG):使用BERTopic預訓練模型擷取候選實體,并由LLM 萃取語意關系并建構初步三元組(Triple)圖譜,大幅提升初建KG 的在地性與語義密度。

        ●   從靜態到推理(用GNN 和CF 探索):訊練GNN預測潛在關系,并透過GAT、R-GCN 等模型進行鏈接預測,探索反事實連結(CF Link),來激勵人們的反事實思考(CF Thinking)。其將傳統AI 推理升級為反事實推理與探索。

        ●   從推理到創新(人機協作產生決策):人類開始進行創新思考,并對潛在關系進行專家審查和反思,優化人們的決策。其中,引入了人機協作治理,人類專家主導反事實推理的解釋與修正,避免AI 幻覺的偏差。

        ●   從創新到資產化(知識回饋更新KG,讓KG 不斷進化):依據人的決策回饋,來更新KG,形成動態進化式的知識生態。然后,透過RAG 框架,讓LLM 響應與企業內知識結合,提升準確與可信度。

        2   支援下游應用任務

        在上一期里,已成功演示了一個案例,其中訓練出一個能夠把突變數據轉換成嵌入向量的中游KG + GNN模型,而且嵌入已儲存于mutation_embeddings_gin.csv檔案里,可供給下游任務使用(如分類、群聚、可視化、或與影像特征融合等)。中游KG 扮演行業語境的橋梁,讓LLM能入鄉隨俗,理解場域,成為可信任AI 的知識背景層(Context Layer)。

        現在,基于已經訓練好的節點嵌入(Node Embedding),來支撐下游應用<KG + GNN> 模型。這項下游任務結合了醫學影像特征(Ultrasound/MRI)進行多模態推論,也將GNN輸出的嵌入與CNN影像特征進行融合,提供AI輔助診斷(如預測、分類等)。如下圖3 所示:

        image.png

        圖3

        這樣可以順利訓練出一個能夠把突變數據轉換成嵌入向量的GNN模型,能產生節點的嵌入向量(Embedding),來提供給后續的下游任務使用(如分類、群聚、或與影像特征融合等)。例如,下游任務可以結合醫學影像特征(Ultrasound/MRI)進行多模態推論,也將GNN 輸出的嵌入與CNN影像特征進行融合,提供AI 輔助診斷(如預測、分類)等各種應用。

        3   實踐范例

        例如,乳腺癌癥的診斷與治療策略高度仰賴基因、突變、生物標志物與病理影像等異質信息。而上述的三階段知識圖譜架構(KG)為基礎的乳腺癌主權AI 解決方案。透過串接國際生物醫學數據、結合院內檢測與病例數據,最終建構可用于推理、推薦與決策輔助的AI系統。例如,結合病理影像模型與KG 多模態推理,建構問答式臨床決策支持接口,進而- 建立跨院共享型乳癌主權知識平臺等。

        此范例使用Python代碼來實踐模型訓練,并搭配xlwings和openvino套件,來提供可操作的Excel畫面和部署(Deployment)環境。首先,開啟ee01.py,如下:

        1752667054525326.png

        Step-1:建立下游KG

        接著,執行它(即ii01.py),并且在Excel 畫面按下< 建立下游KG> 按鈕,就建立了一個下游KG(圖-2):

        1752667099834870.png

        這個下游KG 含有4 種節點:疾病(cancer)、基因(gene)、突變(mutation)和超聲波檢測(ultra),其整合ultra節點特征參與訊息傳遞與分類。這種以疾病-基因-藥物為核心的多重鏈接結構,非常適合用KG+GNN建模。此類系統若整合影像與知識,可有效推促進醫療AI的發展。例如本案例融合了Ultra node所提供的視覺特征,進一步提升癌癥分類的準確性與上下文理解能力。

        同時,這個下游KG可賦能乳癌精準醫療,從串聯基因與治療決策邏輯,透過attention與反事實推理回溯依據,提升AI推論可解釋性。并且符合主權AI要求:數據本地處理、自研模型訓練、決策過程可控。

        Step-2:訓練GNN模型

        接著,按下< 訓練下游模型>,就展開訓練GNN流程,如下:

        1752667173295875.png

        訓練完成了,就導出ONNX模型,并儲存于ultra_cancer_classifier.onnx檔案里,將會在OpenVINO 平臺上進行模型部署。

        除了醫療領域之外,在其它制造業、醫療、法務、教育等「需本地知識又要求精準推理」的場景中,上述方法都具高度適用性。而且,不需要訓練大型模型,只需整合KG+GNN+LLM,就能實踐商業應用目標。

        Step-3:部署模型&推論

        接著,按下<OpenVINO 部署&推論>,就出現:

        1752667359231134.png

        于是,完成了「用下游KG來預測癌癥類型」的初步實作。其將影像推論(ultra 特征)作為語意節點納入異質知識圖中,透過GNN 傳遞形成融合的癌癥語義表示。最終分類器已導出為ONNX,可于OpenVINO 原型環境下進行輕量推論。

        這使用突變+ 基因節點特征,透過異質GNN,預測癌癥節點的類別(乳癌vs 非乳癌)。這下游任務中的GNN模型訓練與推理(例如癌癥分類、mutation 預測)。

        本案例的系統架構,也可預測多種癌癥(如Bladder Cancer、Bone Cancer、Breast Neoplasms 等),并透過混淆矩陣與ROC 曲線驗證模型判斷能力,證實中游語義嵌入能有效支持下游分類任務。

        4   結語

        由于許多AI 部署流程, 常常缺乏語境在地化(Contextualization)特性,導致模型布署后難以完全貼合本地知識、生產流程與客戶需求。這種以中游KG 作為語境支撐層,讓下游AI 系統真正入鄉隨俗、自主成長。

        例如,藉由知識圖譜結構化推理與持續自我更新,AI甚至能預測、引導、優化用戶的決策,達成超越人類直覺的智慧支持。也讓每一個裝置,都能懂你,而且比你更懂你!

        (本文來源于《EEPW》


        關鍵詞: 202507

        評論


        技術專區

        關閉
        主站蜘蛛池模板: 焦作市| 诸暨市| 易门县| 凌源市| 资溪县| 浑源县| 宜章县| 开鲁县| 永州市| 岑巩县| 马关县| 夹江县| 广元市| 邵阳县| 宣恩县| 峨眉山市| 德庆县| 灵宝市| 新郑市| 南皮县| 栾城县| 察隅县| 长沙市| 巴林右旗| 兴国县| 万山特区| 石城县| 北碚区| 丰台区| 肥西县| 泾阳县| 邳州市| 平武县| 云霄县| 南丹县| 三原县| 安宁市| 庆阳市| 响水县| 宿松县| 海安县|