新聞中心

        EEPW首頁 > 智能計算 > 新品快遞 > 英偉達的中國版 A800 GPU 性能揭曉

        英偉達的中國版 A800 GPU 性能揭曉

        作者:tomshardware 時間:2023-05-09 來源:半導體產業縱橫 收藏

        去年 10 月,美國商務部對向中國供應芯片實施了全面限制,此后拜登 (Joe Biden) 政府已暗示可能實施進一步制裁。

        本文引用地址:http://www.104case.com/article/202305/446345.htm

        制裁導致中國企業與 AI 開發行業內最受歡迎的芯片 A100 無緣,今年 3 月份發布的下一代版本 H100 也是如此,后者提供更強大算力。

        Nvidia A800 計算 是為中國市場制造的。根據 MyDrivers 的說法,A800 的運行速度是 A100 的 70%,同時符合嚴格的美國出口標準,該標準限制了 Nvidia 可以銷售的處理能力。

        Nvidia 的 A100 推出已經三年了,它為 HPC 提供 9.7 FP64/19.5 FP64 Tensor TFLOPS,為 AI 工作負載提供高達 624 BF16/FP16 TFLOPS(具有稀疏性)。即使減少了 30% 左右,這些數字看起來仍然令人生畏:6.8 FP64/13.7 FP64 Tensor TFLOPS 以及 437 BF16/FP16(具有稀疏性)。

        盡管像 MyDrivers 所說的那樣「閹割」(性能上限),但 Nvidia 的 A800 在計算能力方面與成熟的中國壁仞科技的 BR104 和 BR100 計算 完全不相上下。同時,Nvidia 的計算 GPU 及其 CUDA 架構得到其客戶運行的應用程序的廣泛支持,而壁仞科技的處理器尚未被采用。由于最新規定,甚至壁仞科技也無法將其成熟的計算 GPU 運送到中國。

        美國于 2021 年 10 月實施的出口規則禁止向中國出口允許在 41,600 立方英尺(1,178 立方米)或更小空間內性能超過 100 FP64 PetaFLOPS 或 200 FP32 PetaFLOPS 的超級計算機的美國技術。雖然出口限制并未具體限制出售給中國實體的每個計算 GPU 的性能,但它們限制了它們的吞吐量和可擴展性。

        新規定生效后,無法在沒有出口許可證的情況下向中國客戶銷售其超高端 A100 和 H100 計算 GPU,而出口許可證很難獲得。為了滿足中國超大規模用戶對性能的需求,該公司推出了其 A100 GPU 的精簡版 A800。到目前為止,還不清楚這款 GPU 的性能如何。

        隨著人工智能在消費者和企業中的使用越來越多,能夠處理適當工作負載的高性能硬件正在蓬勃發展。Nvidia 是 AI 大趨勢的主要受益者之一,這就是為什么其 GPU 的需求如此之高,以至于即使是精簡版 A800 在中國也已售罄。

        壁仞科技的 BR100 將采用 OAM 外形,功耗高達 550W。該芯片支持該公司專有的 8 路 Blink 技術,允許每個系統安裝多達八個 BR100 GPU。相比之下,300W BR104 將采用 FHFL 雙寬 PCIe 卡外形并支持多達 3 路多 GPU 配置。據 EETrend 報道,這兩款芯片都使用 PCIe 5.0 x16 接口,頂部帶有用于加速器的 CXL 協議。

        壁仞科技表示,其兩款芯片均采用臺積電的 7nm 級制造工藝制造(未詳細說明是使用 N7、N7+ 還是 N7P)。更大的 BR100 包含 770 億個晶體管,超過了同樣使用臺積電 N7 節點之一制造的 Nvidia A100 的 542 億個。該公司還表示,為了克服臺積電光罩尺寸的限制,它必須使用小芯片設計和代工廠的 CoWoS 2.5D 技術,這是完全合乎邏輯的,因為 Nvidia 的 A100 接近光罩尺寸,而 BR100 應該是均勻的更大,因為它的晶體管數量更多。

        鑒于規格,我們可以推測 BR100 基本上使用兩個 BR104,盡管開發人員尚未正式證實這一點。

        為了將其 BR100 OAM 加速器商業化,壁仞科技與 Inspur 合作開發了一款 8 路 AI 服務器,該服務器將于 2022 年第四季度開始提供樣品。百度和中國移動將成為首批使用壁仞科技計算 GPU 的客戶。

        新加坡國立大學 (National University of Singapore) 教授尤洋表示,許多中國公司現在正在研究組合三、四塊性能相對較差的芯片,包括 A800 和 H800,來替代最先進的處理器。尤洋運營著 AI 基礎設施公司 HPC-AI Tech。

        尤洋說,這正促使一些公司加速開發技術,使用不同類型的芯片來訓練大規模 AI 模型。此前這一研究領域在硬件資源有限、渴望降低成本的中國公司中已經很普遍。論文顯示,阿里巴巴、百度和華為已在尋求使用 A100、老一代英偉達芯片 V100 和 P100 以及華為昇騰芯片的各種組合。

        AI 專家說,相比之下,同時使用多種類型芯片的情況在美國公司中很少見,因為要讓不同類型芯片可靠地協同工作存在技術挑戰。Meta 的 Zhang 說,這是萬不得已的最后手段。

        與此同時,中國公司也正在研究使用各種軟件技術來降低訓練大規模 AI 模型的計算強度,這種方法已在全球范圍內加速推廣,包括在美國公司中。不過,論文顯示,與美國公司不同,中國公司在結合使用多種軟件技術方面更加積極主動。

        雖然其中許多方法在全球研究界仍處于不斷完善中、難以實施,但中國研究人員已取得了一些成功。

        在今年 3 月的一篇論文中,華為研究人員展示了他們如何利用這種技術,只使用該公司的昇騰芯片而不是英偉達的芯片,來訓練其最新一代大語言模型。研究人員在論文中寫道,盡管存在一些缺點,但這個名為盤古的大語言模型在處理閱讀理解和語法挑戰等一些中文任務上都具有最先進性能。



        關鍵詞: 英偉達 GPU

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 巫山县| 安达市| 永修县| 中山市| 汉阴县| 扎兰屯市| 南澳县| 宣恩县| 新巴尔虎左旗| 淮北市| 大埔区| 揭东县| 兴和县| 修武县| 普格县| 于田县| 高邑县| 西乌珠穆沁旗| 河南省| 兴山县| 南丹县| 错那县| 通江县| 德钦县| 通海县| 兴义市| 长岛县| 无极县| 冕宁县| 蒙阴县| 静海县| 兰考县| 盈江县| 永清县| 登封市| 西充县| 静海县| 新河县| 泗阳县| 溧水县| 海林市|