新聞中心

        EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > xAI宣布開源大語言模型Grok-1并開放下載

        xAI宣布開源大語言模型Grok-1并開放下載

        作者: 時(shí)間:2024-03-18 來源:網(wǎng)易科技 收藏

        3月18日消息,美國(guó)當(dāng)?shù)貢r(shí)間周日,埃隆·馬斯克(Elon Musk)旗下的人工智能初創(chuàng)企業(yè)宣布,其大語言模型已實(shí)現(xiàn)開源,并向公眾開放下載。感興趣的用戶可通過訪問GitHub頁面github.com/xai-org/grok來使用該模型。

        本文引用地址:http://www.104case.com/article/202403/456418.htm

        介紹稱,是一款基于混合專家系統(tǒng)(Mixture-of-Experts,MoE)技術(shù)構(gòu)建的大語言模型,擁有3140億參數(shù)。近期,公司發(fā)布了的基本模型權(quán)重和網(wǎng)絡(luò)架構(gòu)詳情。

        該公司表示,Grok-1始終由自行訓(xùn)練,其預(yù)訓(xùn)練階段于2023年10月完成。此次發(fā)布的是Grok-1預(yù)訓(xùn)練階段結(jié)束時(shí)的原始基礎(chǔ)模型檢查點(diǎn),即該模型未經(jīng)過針對(duì)任何具體應(yīng)用的微調(diào)。

        xAI強(qiáng)調(diào),Grok-1的權(quán)重和架構(gòu)均依照Apache 2.0開源許可協(xié)議發(fā)布。

        xAI還特別強(qiáng)調(diào)了Grok-1的幾大特性:

        首先,Grok-1是一個(gè)未針對(duì)特定任務(wù)進(jìn)行微調(diào)的基礎(chǔ)模型,它基于大量文本數(shù)據(jù)訓(xùn)練而成;

        其次,作為一款基于混合專家技術(shù)構(gòu)建的大語言模型,Grok-1擁有3140億參數(shù),在處理每個(gè)token時(shí)有25%的權(quán)重處于活躍狀態(tài);

        最后,Grok-1是xAI團(tuán)隊(duì)使用JAX和Rust編程語言自定義訓(xùn)練棧從零開始訓(xùn)練的成果,訓(xùn)練完成于2023年10月。

        此外,xAI還提到,Grok-1的封面配圖是借助人工智能繪圖工具M(jìn)idjourney生成的,基于以下提示創(chuàng)作而成:展示一個(gè)3D插圖的神經(jīng)網(wǎng)絡(luò),其中包含透明的節(jié)點(diǎn)和發(fā)光的連接線,通過線條的粗細(xì)和顏色變化來表示權(quán)重的不同。




        關(guān)鍵詞: xAI 開源大語言模型 Grok-1

        評(píng)論


        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉
        主站蜘蛛池模板: 长海县| 蒙山县| 新干县| 大邑县| 钟山县| 苍山县| 湘西| 湘阴县| 伊宁县| 东辽县| 道孚县| 吐鲁番市| 永顺县| 瑞丽市| 富蕴县| 禄劝| 称多县| 冀州市| 无锡市| 陈巴尔虎旗| 慈利县| 平湖市| 获嘉县| 长春市| 玉山县| 西青区| 拉萨市| 分宜县| 涡阳县| 赤城县| 阿合奇县| 大渡口区| 莱芜市| 贞丰县| 潜江市| 普洱| 阳城县| 丹棱县| 昔阳县| 宁安市| 浦北县|