博客專欄

EEPW首頁 > 博客 > 體驗過百度文心一言，也許真會超出你的預期（2）

體驗過百度文心一言，也許真會超出你的預期（2）

發布人：機器之心時間：2023-03-19 來源：工程師

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

發布文章

專注中文理解與生成

揭秘文心一言背后的關鍵技術

體驗完文心一言，我們來了解下其背后的技術。在昨天的發布會上，百度 CTO 王海峰總結介紹了文心一言背后的關鍵技術。

從整體來看，百度文心一言基于知識增強千億大模型 ERNIE，同時借鑒了文心對話大模型 PLATO，二者的技術都在文心一言身上得到了延伸，在訓練過程中不斷改進。

具體來講，文心一言包含了六個核心技術模塊，分別是有監督精調、人類反饋的強化學習、提示以及知識增強、檢索增強和對話增強。其中前三類技術是對話大模型都會用到的，后三類技術為百度已有技術優勢的再創新，它們共同構筑了文心一言的技術根基，并在對話效果上得到充分釋放和呈現。

持續優化對話大模型通用技術

針對有監督精調，除了標準的有監督精調技術，百度也做了針對性的優化。首先文心一言做了更多中文標注數據，基于對中國語言文化和中文應用場景的理解來選擇數據，因而在中文任務上更好用。其次服務應用，百度在為其個人用戶和企業客戶服務中積累了大量對應用需求的理解，在精調數據時發揮了作用。最后富含知識，除了將知識圖譜應用在知識增強過程中，還基于知識圖譜產生了很多事實證明有效的數據來用于數據精調。

我們知道，OpenAI 在調優 ChatGPT 時使用了監督學習和強化學習的組合，其中強化學習組件用到了人類反饋的強化學習（RLHF）訓練機制，使得模型在訓練中使用人類反饋以最小化無益、失真或偏見的輸出。

百度也非?？粗?RLHF 機制在訓練中的重要性，提出了一套完整的技術，也被證明非常有效。首先接收人類反饋，然后使用反饋數據來訓練獎勵模型，最后再做強化學習的策略優化。但應看到，由于文心一言剛剛上線，用戶需求和反饋數據尚不充分，因而后續一定會基于更多真實反饋獲得進化。

提示（prompt）已經成為與大模型尤其是對話大模型互動最自然直觀的方式。千億以上參數的大模型往往蘊含了極其豐富的數據和知識，如何快速準確找到并應用這些數據和知識變得至關重要。這時提示構建得好不好將直接影響語言模型表現出的能力，因此文心一言在這方面下了大功夫。

當用戶輸入提示時可以基于很多自動構建的方法來提升效果，比如補充實例（解題時給出示例）、創作時給出提綱、規范等。此外大語言模型也會出現錯誤，這時加入已知的準確知識點也能提升回答準確性。最后在構建提示時加入思維鏈也會使答案更合理，邏輯更清晰。

獨特優勢構成文心一言強大根基

除了繼續強化打磨大語言模型的通用技術，百度還針對知識增強、檢索增強和對話增強三個已有優勢進行再創新。

知識增強是文心大模型的核心特色之一，通過從海量的知識和數據中融合學習，模型能夠實現更高的效率、更好的效果、更強的可解釋性。做到這些需要兩方面的技術 —— 知識內化和知識外用。知識內化是從大規模知識和無標注數據中，基于語義單元學習，利用知識構造訓練數據，將知識學習到模型參數中；知識外用是指知識在模型參數中未內化進去，但在推理過程中引入外部多源異構知識，做知識推理、提示構建等。

此外通過知識圖譜來構建訓練數據，達到知識內化的效果。百度擁有世界上最大的多源異構知識圖譜，包含了 50 億實體和 5500 億事實，并在不斷演進和更新。除了基于知識圖譜進行知識推理，還可以基于知識來構建提示。

百度在搜索領域擁有很多領先技術，每天響應幾十億次真實的用戶使用需求。發展到了今天，百度新一代搜索架構已經發展到了基于語義理解和匹配，其中文心大模型分別理解用戶輸入和文檔，形成雙塔模型，然后基于理解進行匹配。

這套搜索架構與包括文心一言在內的文心大模型有著天然不可分的關聯，在做生成模型時可以進行聯合優化，將檢索中一些有價值的結果（如精準的信息）帶入生成過程。通過引入搜索結果，為大模型提供時效性強、準確率高的參考信息，更好地滿足用戶需求。

百度在對話領域同樣擁有很多對話技術和應用積累。我們知道，對話很多時候不是一個問題和一個答案，有上下文的多輪對話才是常態，因此記憶機制和上下文理解都很重要。同時長對話還要考慮對話規劃，這些結合起來才能實現更好的對話連貫性、合理性和邏輯性。

可以看到，打造出一個出色的大模型哪有那么容易，在技術上需要持續創新。AI 研發就像燒一壺開水，比 100℃更難的是從 0℃到 99℃。王海峰表示，文心一言是百度多年技術積累和產業實踐的水到渠成。

這一切可以追溯到 2010 年，彼時深度學習尚未大火，百度即開始全面布局人工智能，是全球為數不多、進行全棧布局的人工智能公司。從底層芯片到框架、模型和應用，百度都擁有領先的自研技術和產品，通過層與層之間的相互反饋、端到端優化提升效率，貫通整個 AI 全產業鏈。

尤其飛槳深度學習平臺和文心大模型的聯合優化為文心一言提供了堅實的技術支撐。飛槳支撐了文心一言從開發訓練到推理部署的整個流程，在開發訓練層面，飛槳動靜統一的開發范式和自適應分布式架構，實現大模型的靈活開發和高效訓練；在推理部署層面，飛槳支持大模型高效推理，提供服務化部署能力，包括計算融合、軟硬協同的稀疏量化、模型壓縮等。

同時，文心大模型自 2019 年發布 ERNIE 1.0 以來，已經全面涵蓋了 NLP、CV、跨模態、生物計算以及行業大模型，并基于大模型推出了 AI 作畫產品文心一格和產業級搜索系統文心百中。

飛槳深度學習平臺和文心大模型是支撐文心一言的底氣。文心一言還延續了文心大模型知識增強的特色，通過理解和生成能力的集成獲得極大助益。

作為國內搜索領域的頭號玩家，在可預見的未來，百度或將憑借文心一言引領中文搜索市場的代際變革，為用戶帶來更便捷友好的搜索體驗。此外以文心一言為契機的大語言模型和生成式 AI 也將助力金融、能源、媒體、政務等千行百業的智能化變革。

正如李彥宏在會上所說，「百度希望和大家一起，推動人工智能技術進步，讓所有人都能使用最先進的生產力工具，讓所有人都能從中受益。」

最后感慨一句，ChatGPT、GPT-4 的連番發布，讓我們一直憂心中國 AI 技術能否跟上海外的步伐。昨天百度的新聞發布會，我們能看到有人調侃吐槽，但也看到更多人愿意抱著寬容的態度看待百度勇敢邁出的第一步。期待在百度的這一步之后，更多中國企業能夠走的更遠。

*博客內容為網友個人發布，僅代表博主個人觀點，如有侵權請聯系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： AI

焦點

更多>>

技術專區

關閉

博客專欄

體驗過百度文心一言，也許真會超出你的預期（2）

相關推薦

技術專區