新聞中心

        EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 深言科技聯(lián)合清華大學(xué)開(kāi)源 LingoWhale-8B 模型:免費(fèi)商用,號(hào)稱(chēng)性能超 GPT-3.5 Turbo

        深言科技聯(lián)合清華大學(xué)開(kāi)源 LingoWhale-8B 模型:免費(fèi)商用,號(hào)稱(chēng)性能超 GPT-3.5 Turbo

        作者: 時(shí)間:2023-11-03 來(lái)源:IT之家 收藏

        IT之家 11 月 3 日消息,據(jù)官方公眾號(hào)消息,由與清華大學(xué) NLP 實(shí)驗(yàn)室共同研發(fā)的語(yǔ)鯨 LingoWhale-8B 模型目前已面向社會(huì)開(kāi)源,對(duì)學(xué)術(shù)研究完全開(kāi)放,允許免費(fèi)商用。

        本文引用地址:http://www.104case.com/article/202311/452462.htm

        IT之家經(jīng)過(guò)查詢(xún)得知,LingoWhale-8B 模型是擁有約 80 億參數(shù)的中英雙語(yǔ)大語(yǔ)言模型,在 C-Eval、MMLU、CMMLU 等多個(gè)權(quán)威的公開(kāi)評(píng)測(cè)基準(zhǔn)上,在 10B 以下開(kāi)源模型據(jù)稱(chēng)“達(dá)到領(lǐng)先效果”。

        不過(guò)官方同時(shí)聲稱(chēng),受模型參數(shù)量影響,固有的幻覺(jué)問(wèn)題、數(shù)學(xué)計(jì)算能力相對(duì)較弱、生成內(nèi)容有無(wú)法預(yù)見(jiàn)性等問(wèn)題在 LingoWhale-8B 模型中仍然存在。

        在性能方面,截至 10 月 24 日,在中文領(lǐng)域權(quán)威評(píng)測(cè) C-Eval 中,LingoWhale-8B 模型的性能僅次于 GPT-4。在 C-Eval、CMMLU、GAOKAO 測(cè)評(píng)中,性能超過(guò) GPT-3.5Turbo,在 10B 以下尺寸模型中性能處于領(lǐng)先位置。

        圖片

        官方給予了一些典型示例,以介紹 LingoWhale-8B 模型的特點(diǎn)。

        圖片

        圖片

        官方據(jù)此表示,LingoWhale-8B 模型具有一定數(shù)學(xué)運(yùn)算能力。

        在以上示例中,LingoWhale-8B 模型能夠根據(jù)上文正確地列式并進(jìn)行運(yùn)算,包括函數(shù)求導(dǎo)、函數(shù)值計(jì)算、切線方程計(jì)算等操作,并最終得到結(jié)果。

        而在代碼聲稱(chēng)方面,官方也同時(shí)提供了一些演示:

        圖片

        LingoWhale-8B 具有強(qiáng)大的代碼理解與生成能力,能夠更好地生成代碼并解決具體的問(wèn)題。在本示例中,LingoWhale-8B 模型生成了詳細(xì)的 python 代碼以及注釋信息,幫助用戶(hù)更好地理解并使用生成的代碼。

        在邏輯方面,官方也同樣進(jìn)行了舉例:

        圖片

        LingoWhale-8B 模型具有解決復(fù)雜邏輯推理任務(wù)的能力。在以上的例子中,LingoWhale-8B 將復(fù)雜的邏輯問(wèn)題進(jìn)行拆解,按步驟進(jìn)行分析并解決問(wèn)題。

        上下文對(duì)話(huà)

        樣例:

        圖片

        在以上示例中,LingoWhale-8B 模型表現(xiàn)出了較強(qiáng)的角色扮演、方案設(shè)計(jì)、長(zhǎng)文本理解以及多輪對(duì)話(huà)能力,能夠根據(jù)用戶(hù)需求制定方案并組織結(jié)構(gòu)化的輸出,應(yīng)對(duì)更加復(fù)雜的任務(wù)場(chǎng)景。

        知識(shí)百科

        樣例 1:

        圖片

        圖片

        官方表示,在上面兩個(gè)例子中,相較于 GPT-3.5,LingoWhale-8B 模型生成的結(jié)果更加準(zhǔn)確詳實(shí)。

        經(jīng)過(guò)在大規(guī)模高質(zhì)量語(yǔ)料上的預(yù)訓(xùn)練,LingoWhale-8B 模型掌握了多個(gè)領(lǐng)域的知識(shí),包括科學(xué)、歷史、文學(xué)、藝術(shù)等,能夠理解并回答各種知識(shí)相關(guān)問(wèn)題,提供準(zhǔn)確詳細(xì)的答案。

        IT之家的小伙伴們可以在官方 GitHub 頁(yè)面中獲取更多詳細(xì)信息:點(diǎn)此訪問(wèn)




        關(guān)鍵詞: 深言科技 AI 大模型

        評(píng)論


        相關(guān)推薦

        技術(shù)專(zhuān)區(qū)

        關(guān)閉
        主站蜘蛛池模板: 洪泽县| 尉犁县| 方城县| 长葛市| 社旗县| 门源| 宜城市| 阿坝县| 深水埗区| 通化县| 洪泽县| 松溪县| 宁都县| 东兴市| 青神县| 罗山县| 沛县| 高安市| 西乌珠穆沁旗| 贡觉县| 沙坪坝区| 洞头县| 青冈县| 大方县| 伊金霍洛旗| 枞阳县| 措美县| 丹东市| 韶山市| 苗栗县| 云梦县| 洛扎县| 邮箱| 茂名市| 长顺县| 轮台县| 专栏| 乌鲁木齐县| 平邑县| 崇仁县| 罗山县|