新聞中心

        EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 中國電信發(fā)布全球首個單體稠密萬億參數語義模型 Tele-FLM-1T

        中國電信發(fā)布全球首個單體稠密萬億參數語義模型 Tele-FLM-1T

        作者: 時間:2024-06-19 來源:IT之家 收藏

        IT之家 6 月 19 日消息,中國電信人工智能研究院(Tele)和智源研究院聯合發(fā)布全球首個單體稠密萬億參數語義模型 Tele-FLM-1T,該模型與百億級的 52B 版本,千億級的 102B 版本共同構成 Tele-FLM 系列模型。

        本文引用地址:http://www.104case.com/article/202406/460043.htm

        Tele 和智源研究院基于模型生長和損失預測等技術,Tele-FLM 系列模型僅使用了業(yè)界普通訓練方案 9% 的算力資源,基于 112 臺 A800 服務器,用 4 個月完成 3 個模型總計 2.3T tokens 的訓練。模型訓練全程做到了零調整零重試,算力能效高且模型收斂性和穩(wěn)定性好,Tele-FLM-1T 版本即將開源

        目前,TeleFLM 系列模型已經全面開源了 52B 版本,核心技術 (生長技術、最優(yōu)超參預測)、訓練細節(jié) (loss 曲線、最優(yōu)超參、數據配比和 Grad Norm 等) 均開源,開源模型下載量過萬,積累超 40 萬用戶。

        此外,中國電信在某市民生訴求場景項目上,通過引入 TeleChat-52B 模型能力,整體應用效果提升 40%,達到行業(yè)領先水平。

        IT之家附 Tele-FLM-52B 版本開源地址:https://huggingface.co/Cofe/Tele-FLM

        Tele-FLM-Chat 試用 (純模型單輪對話版) 地址:https://modelscope.cn/studios/FLM/ChatFLM




        關鍵詞: LLM AI 大語言模型

        評論


        相關推薦

        技術專區(qū)

        關閉
        主站蜘蛛池模板: 紫云| 临洮县| 舒城县| 鄯善县| 罗江县| 济南市| 天祝| 安塞县| 南陵县| 丰台区| 咸宁市| 建昌县| 乌鲁木齐县| 陆丰市| 永胜县| 同心县| 乌兰察布市| 合肥市| 安陆市| 宝兴县| 遵义市| 南阳市| 扬州市| 含山县| 响水县| 台州市| 文水县| 西丰县| 常山县| 奈曼旗| 洱源县| 和田市| 柘荣县| 汾阳市| 平阴县| 营口市| 中卫市| 襄垣县| 邹城市| 丰原市| 泰来县|