博客專欄

        EEPW首頁 > 博客 > 用Transformer定義所有ML模型,特斯拉AI總監Karpathy發推感嘆AI融合趨勢

        用Transformer定義所有ML模型,特斯拉AI總監Karpathy發推感嘆AI融合趨勢

        發布人:計算機視覺工坊 時間:2021-12-15 來源:工程師 發布文章

        特斯拉 AI 總監 Andrej Karpathy 連發多條推文表示,AI 不同領域(視覺、語音、自然語言等)正在打通,融合速度令人驚嘆。

        轉自《機器之心》

        今日,特斯拉 AI 總監、Autopilot Vision 團隊領導人 Andrej Karpathy 在推特上發文,對 AI 領域正在進行中的融合(consolidation)表示驚嘆。

        他表示,「10 年前,視覺、語音、自然語言、強化學習等都是完全分離的,甚至沒有跨領域的論文。方法也完全不同,通常不是基于機器學習。」

        1.png

        從 2010 年開始,視覺、語言、自然語言、強化學習等領域的壁壘逐漸打破,它們開始轉向同一個技術方向,即機器學習,特別是神經網絡。它們使用的網絡架構具有多樣性,但至少論文開始讀起來更加相似,基本上都用到了大型數據集和網絡優化。

        隨著 AI 技術的發展,近兩年,不同領域模型架構似乎也變得相同起來。很多研究者開始專注于 Transformer 架構,在此基礎上做較小的改動以進行研究。

        例如 2018 誕生的 GPT,1.17 億參數;2019 年 GPT-2,15 億參數;2020 年更是將其擴展到 1750 億參數 GPT-3。Karpathy 基于 PyTorch,僅用 300 行左右的代碼就寫出了一個小型 GPT 訓練庫,并將其命名為 minGPT,這個 minGPT 能夠進行加法運算和字符級的語言建模,而且準確率還不錯。核心的 minGPT 庫包含兩個文檔:mingpt/model.py 和 mingpt/trainer.py。前者包含實際的 Transformer 模型定義,大約 200 行代碼,后者是一個與 GPT 無關的 PyTorch 樣板文件,可用于訓練該模型。

        2.png

        部分代碼截圖。

        197 行完整代碼:https://github.com/karpathy/minGPT/blob/master/mingpt/model.py

        隨著模型架構的融合,現在,我們可以向模型輸入詞序列、圖像 patch 序列、語音序列、強化學習序列(狀態、行為、獎勵)。我們可以在條件設置中添加任意 token,這種模式是極其簡單、靈活的建模框架。

        即使是在某個領域(如視覺)內部,過去在分類、分割、檢測和生成任務上存在一些差異。但是,所有這些也正在轉換為相同的框架,例如 patch 的檢測 take 序列和邊界框的輸出序列。

        現在,區別性特征主要包括以下幾個方面:

        1)數據

        2)將自身問題映射到向量序列以及從向量序列映射出自身問題的輸入 / 輸出規范

        3)位置編碼器的類型以及注意力 mask 中針對特定問題的結構化稀疏模式

        所以,從技術上來說,AI 領域的方方面面,包括前景、論文、人才和想法突然之間變得極其相關。每個人基本上都在使用相同的模型,大多數改進和想法可以快速地在所有 AI 領域「復制粘貼」(copy paste)。

        正如其他很多人注意到并指出的那樣,新大腦皮質(neocortex)在其所有的輸入模態中也有一個高度統一的架構。也許自然界偶然發現了一個非常相似的強大架構,并以類似的方式復制了它,并只在一些細節上做了改變。

        這種架構上的融合將使我們專注于軟硬件和基礎設施建設,進一步加速 AI 領域的進展。「無論如何,這是激動人心的時刻。」

        對于 Andrej Karpathy 描述的 AI 融合趨勢,網友也紛紛發表意見。

        推特網友 @Neural Net Nail 表示,「這是一個有價值的見解。融合將加速 AI 領域的創新步伐,在邊緣端使用 AI 的尖端產品變得更加可行。我想,變化(variation)才是質量的最大敵人。」

        3.png

        網友 @sisil mehta 也認為,「ML 基礎設施迎來了激動人心的時刻。隨著模型架構的融合,建模框架和基礎設施也將融合。我當然希望 PyTorch Lightning 也會這樣。」

        4.png

        網友 @Marcos Pereira 表示,「一方面,處處都在用 transformers,我們已經遇到了障礙,需要創新;另一方面,處處都在用 transformers,所以跟上來吧。」

        5.png

        原文出自 @Andrej Karpathy 的推特:https://twitter.com/karpathy/status/1468370605229547522

        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: AI

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 丰台区| 炎陵县| 康马县| 太和县| 炉霍县| 荆门市| 武乡县| 乐昌市| 正定县| 宜宾市| 长武县| 黑河市| 石门县| 温泉县| 迁西县| 板桥市| 西青区| 霍州市| 务川| 灵武市| 汉源县| 阿勒泰市| 武强县| 台南市| 甘泉县| 凌云县| 民县| 同江市| 康保县| 丽江市| 孝昌县| 河北省| 会昌县| 衡水市| 东明县| 赫章县| 呼伦贝尔市| 宣武区| 牡丹江市| 延边| 娱乐|