全地形神經網絡更接近于人類視覺系統
卷積神經網絡 (CNN) 和遞歸神經網絡 (RNN) 等深度學習模型旨在部分模擬生物神經網絡的功能和結構。因此,除了解決各種現實世界的計算問題外,它們還可以幫助神經科學家和心理學家更好地了解特定感覺或認知過程的基礎。
本文引用地址:http://www.104case.com/article/202506/471666.htm奧斯納布呂克大學、柏林自由大學和其他研究所的研究人員最近開發了一類新型人工神經網絡 (ANN),它可以比 CNN 和其他現有的深度學習算法更好地模擬人類視覺系統。他們新提出的、受視覺系統啟發的計算技術,被稱為全地形神經網絡 (All-TNN),在發表在《自然人類行為》上的一篇論文中進行了介紹。
“以前,了解大腦如何處理視覺信息的最強大模型是從 AI 視覺模型衍生而來的,”該論文的資深作者 Tim Kietzmann 博士告訴 Tech Xplore。
“這些通常本質上是卷積的——一種機器學習黑客,允許相應的神經網絡在視覺輸入中的任何位置搜索完全相同的特征。這種方法非常強大:您在空間的一個位置學到的東西可以轉移到所有其他位置。然而,這是大腦無法做到的(大腦不能將信息從皮層的一個位置'復制'和'粘貼'到另一個位置)。
除了執行靈長類動物大腦無法執行的一些動作外,CNN 的組織信息還與生物神經網絡不同。與 CNN 相比,大腦是視網膜組織的,這意味著視覺信號從視網膜傳播到視覺皮層(大腦外層已知處理視覺信息的區域)。
“大腦還表現出它所響應的特征類型與它搜索它們的位置之間的系統關系,”Kietzmann 說。
“空間和皮層表面特征的這種相互關系是視覺處理的一個重要方面,但如上所述,機器學習中沒有考慮這一特征。為了解決這個缺點,我們開發了一個生物學上更真實的模型類'所有地形神經網絡',其中特征選擇性在空間上組織在'皮層片'上,即一個 2D 表面,其中相鄰特征必然相似,但在更大的距離上有所不同)。
大多數通常用于模擬人類視覺系統如何處理自然圖像的計算方法都依賴于深度神經網絡 (DNN),例如 CNN。這些是強大的模型,可以對其進行訓練以對視覺數據進行分類,例如腦成像掃描,或識別圖像中的特定對象。
Kietzmann 解釋說:“這些模型的問題在于它們通常與生物學相去甚遠,而較新的 ML 模型盡管功能更強大,但也不再是大腦中更好的視覺處理模型(這種關系在過去是正確的)。
“在一系列論文中,我的實驗室展示了我們可以將 ML 模型更改為更好的生物學模型的方法。例如,通過在更好的圖像數據集上進行訓練,通過在網絡架構中包含遞歸連接,通過考慮應該為什么任務訓練模型,以及最近,通過考慮大腦在皮層表面對齊的特征檢測器。
Kietzmann 和他的同事證明,他們開發的新模型基于 (All-TNN),比 CNN 和其他 DNN 更緊密地反映了人類視覺系統。這是因為它們不僅復制了支撐視覺皮層組織的原則,而且還比以前開發的模型更好地捕捉了人類的行為模式。
未來,All-TNN 可用于進行神經科學和心理學研究,有可能為人類視覺系統的神經基礎提供新的思路。例如,它們可以幫助更好地了解整個皮層的特征選擇性排列(也稱為地形)如何影響人類的感知和行為。
Kietzmann 補充道:“我們目前正在嘗試改進訓練,以提高任務執行效率,因為與卷積網絡相比,地形網絡的參數豐富。
“此外,我們目前需要引導模型在空間上實現平滑的特征選擇性——這是皮層地形的一個關鍵特征。然而,生物學可能已經開發出使皮層選擇性平滑的隱含機制。找出哪些方面允許這種情況發生是我們希望能夠做出貢獻的主要研究領域。
全 TNN 更好地近似人類視覺行為中的空間偏差。圖片來源:Nature Human Behaviour (2025)。DOI: 10.1038/s41562-025-02220-7
評論