博客專欄

        EEPW首頁 > 博客 > 挑戰英偉達!00 后哈佛輟學小哥研發史上最快 AI 芯片,比 H100 快 20 倍

        挑戰英偉達!00 后哈佛輟學小哥研發史上最快 AI 芯片,比 H100 快 20 倍

        發布人:傳感器技術 時間:2024-06-27 來源:工程師 發布文章
        整理 | 鄭麗媛

        出品 | CSDN 

        自 2022 年底以來,在由 ChatGPT 掀起的這場席卷全球的 AI 浪潮中,作為 AI 底層算力“霸主”的英偉達(Nvidia),可謂是最大受益者之一:不久前,英偉達一舉超越微軟和蘋果,以 3.34 萬億美元的市值成為全球最有價值的公司。

        歸根結底,是因為英偉達在 AI 芯片市場占據著近乎壟斷的地位:強大性能的 GPU 產品如 A100 和 H100 芯片,是大模型訓練上的“硬通貨”;CUDA 軟件生態也幾乎是英偉達的“護城河”。

        因此誰也沒想到,敢對著市值超 3 萬億美元、擁有 2.8 萬名員工、處于壟斷地位的英偉達高調“下戰書”的,會是一支由 3 名大學輟學生創立、目前僅 35 名員工、剛籌集了 1.2 億美元的團隊:Etched。

        圖片

        (圖片來自Etched官網)

        圖片

        ChatGPT 問世前的一場“豪賭”

        從網上資料來看,Etched 是由三位哈佛大學輟學生 Gavin Uberti、Robert Wachen 和 Chris Zhu 在 2022 年創立的。

        最初,Gavin Uberti 和 Chris Zhu 在大學暑期實習時進入了一家芯片公司,接觸到底層硬件領域并為之吸引后,便決定從哈佛大學退學,又拉上了 Uberti 的大學室友 Robert Wachen,共同創立了 Etched 公司——據悉,當時 Gavin Uberti 正在攻讀數學學士學位和計算機科學碩士學位。

        圖片

        (從左到右:Robert Wachen、Gavin Uberti 和 Chris Zhu)

        Etched 初步成立后,三位 00 后創始人在 2022 年 6 月、ChatGPT 還未問世前就對 AI 進行了一場“豪賭”:“我們打賭,Transformer 將席卷全球。”

        基于這個設想,他們推測專用 ASIC 芯片(專為特定架構設計的 AI 芯片)是一種必然趨勢。

        事實上,當時的 AI 模型種類繁多,有用于自動駕駛汽車的 CNN、用于語言的 RNN,還有用于生成圖像和視頻的 U-Nets 等等。而 Uberti 他們注意到,Transformer(ChatGPT 中的“T”)是第一個可以擴展的模型。

        現階段看來,他們似乎(暫時性)賭贏了:如今每一個最先進的 AI 模型都基于 Transformer,包括 ChatGPT、Sora、Gemini、Stable Diffusion 3 等等。

        圖片

        GPU 遭遇瓶頸,唯一方法是 ASIC

        如開頭所說,在這場 AI 大模型的全球競賽中,大多數企業都離不開 GPU,這也是英偉達能成功壟斷市場的原因之一。

        然而,Etched 在博文中指出:這四年來,GPU 本身并沒有多少提升,即芯片單位面積的計算能力(TFLOPS)變動不大,只是芯片面積變得更大了。

        圖片

        不論是英偉達的 B200、AMD 的 MI300,還是英特爾的 Gaudi 3 和亞馬遜的 Trainium2,都是把兩張芯片算作一張,以此實現所謂的“雙倍”性能。

        圖片

        基于這個發現,Etched 確定了其發展路線:隨著摩爾定律的放緩,提高芯片性能的唯一方法就是專業化——但在 ChatGPT 出現之前,Etched 認定的這個方向幾乎沒有市場。

        當時,Transformer 還沒風靡全球,許多公司都構建了靈活的 AI 芯片和 GPU 來處理數百種不同的架構,例如英偉達的 GPUs、Amazon 的 Trainium、AMD 的加速器、Graphcore 的 IPUs、D-Matrix 的 Corsair 和英特爾的 Gaudi 等。

        如此背景下,自然沒人想要制造專為特定架構設計的 AI 芯片(ASIC):Transformer 的市場不大,而芯片項目的成本為 5000 萬至 1 億美元,還需要數年時間才能投入生產。

        但突然之間,ChatGPT 的全球爆火令情況發生了巨大變化:

        (1)前所未有的需求:在 ChatGPT 之前,Transformer 推理的市場約為 5000 萬美元,現在則已達數十億美元。所有大型科技公司都在使用 Transformer 模型(OpenAI、谷歌、亞馬遜、微軟、Meta 等)。

        圖片

        (2)架構逐漸趨同:AI 模型過去變化很大,但自 GPT-2 以來,最先進的模型架構幾乎保持一致。OpenAI 的 GPT 系列、谷歌的 PaLM、Meta 的 LLaMa、甚至特斯拉的 FSD 都是基于 Transformer。

        圖片

        Etched 聯合創始人兼 CEO Gavin Uberti 表示:“當 ChatGPT 問世時,英偉達股票大漲,尤其是所有即將推出的 AI 模型都將成為 Transformer 時,我們才發現自己在正確的時間出現在了正確的地點。”

        誠然如他所說,當模型的訓練成本超過 10 億美元,推理成本超過 100 億美元時,專用芯片就是不可避免的了:在這種規模下,只要有 1% 的性能改進,都能證明成本為 5000 萬至 1 億美元的芯片項目是值得的。

        圖片

        全球第一款專為 Transformer 設計的專用芯片 Sohu

        朝著這個方向,Etched 花了兩年時間,打造出了全球第一款專為 Transformer 設計的專用芯片,名為 Sohu,并于昨日正式官宣:認識一下 Sohu,這是史上最快的 AI 芯片。

        圖片

        據 Gavin Uberti 介紹,Sohu 采用臺積電的 4nm 工藝制造,只有 1 個核心,每張芯片配有 144GB HBM3E 高帶寬內存,可提供比 GPU 和其他通用 AI 芯片更好的推理性能,且耗能更少、成本更低。

        為了更直觀地衡量 Sohu 的強悍性能,Gavin Uberti 把英偉達作為參照:

        在運行文本、圖像和視頻轉換器時,Sohu 的速度比英偉達下一代 Blackwell GB200 GPU 還要快一個數量級,且成本更低;700 億參數 Llama 3 吞吐量能達到每秒 50 萬 tokens;一臺 8xSohu 服務器可取代 160 個 H100 GPU……對于需要專用芯片的企業領導者來說,Sohu 將是一個更經濟、更高效、更環保的選擇。

        圖片

        而之所以 Sohu 能實現如此性能,正是因為它的“專用性”:無法運行大多數傳統的 AI 模型,如為 Instagram 廣告提供動力的 DLRMs、AlphaFold 2 等蛋白質折疊模型、Stable Diffusion 2 等較老的圖像模型,也無法運行 CNN、RNN 或 LSTM——專為 Transformer 設計,只能運行 Transformer。

        基于這個特點,作為 ASIC 芯片的 Sohu 在設計之初就直接摒棄了與 Transformer 無關的硬件組件,極大簡化推理硬件和軟件管道,以此最大程度地提高性能。

        Etched 在博文中提到,相較之下,通用 AI 芯片如英偉達的 H100,雖擁有 800 億個晶體管,卻只有 3.3% 用于矩陣乘法(大模型推理時最常見的運算):“這是英偉達和其他靈活的 AI 芯片有意為之的設計決策。如果你想支持所有類型的模型(CNN、LSTM、SSM 和其他),這種方案固然是最好的。”

        Gavin Uberti 指出:“我們無法運行 CNN、RNN、LSTM 和其他 AI 模型,但對于 Transformer 來說,Sohu 就是有史以來最快的芯片,甚至沒有競爭對手。”

        圖片

        Etched 能否打敗英偉達?

        對于能否打敗英偉達這個問題,Etched 首席運營官 Robert Wachen 的回應如下:

        “過去,AI 計算市場是分散的,人們使用不同種類的模型,如 CNN、DLRM、LSTM、RNN 和其他數十種跨領域的模型,每種架構的花費都在數千萬到數億美元之間,通用芯片(GPU)有著龐大的市場;但現在,市場正在迅速整合為一種架構:Transformer,那么專用芯片就是大勢所趨。

        我們的芯片在大多數工作負載上都無法擊敗 GPU,因為 Sohu 無法支持它們。但是,對于Transformer 專用芯片來說,我們將會占據這個市場。”

        除此之外,Thiel Fellowship 主任 Alex Handy 也在一份聲明中表示:“投資 Etched 是對 AI 價值的戰略押注。他們的芯片解決了競爭對手害怕解決的可擴展性問題,也挑戰了同行中普遍存在的性能停滯不前的現象。”

        目前來看,Etched 受到業界的廣泛關注和許多支持,但正如 Gavin Uberti 所說,這場豪賭還沒有結束:“如果未來 Transformer 消失或被取代了,我們就會死;但如果他繼續存在,我們就會是有史以來最大的公司。”


        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: 英偉達

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 富裕县| 永城市| 金华市| 米脂县| 临潭县| 陕西省| 木兰县| 峨眉山市| 许昌市| 巴楚县| 邳州市| 加查县| 遵化市| 霍山县| 鄂州市| 信阳市| 娄底市| 清远市| 饶平县| 青田县| 东莞市| 内乡县| 衢州市| 乐东| 宜宾市| 彭泽县| 介休市| 石门县| 衢州市| 越西县| 林西县| 铜梁县| 桦甸市| 轮台县| 友谊县| 钦州市| 弥渡县| 梁河县| 宁夏| 明水县| 潼南县|