博客專欄

        EEPW首頁 > 博客 > 在AI“必爭之地”,全球最大規模人工智能巨量模型誕生

        在AI“必爭之地”,全球最大規模人工智能巨量模型誕生

        發布人:中國科學報 時間:2021-10-02 來源:工程師 發布文章
        作者 | 張雙虎


        當學界和業界均相信“大力出奇跡”的時候,就該大模型閃亮登場了。
        9月28日,浪潮人工智能研究院發布全球最大人工智能巨量模型——源1.0。
        這個幾乎把近5年中文互聯網的浩瀚內容全部讀完,在數據量、參數規模與模型精度方面均居全球之最的大模型,將以開源、開放、共享的策略,降低巨量模型研究和應用的門檻,推動AI產業化和產業AI化的進步。
        中國工程院院士王恩東認為,人工智能的大模型時代已經到來,利用先進算法,整合大規模數據,匯聚大量算力,訓練出巨量人工智能模型是未來的發展方向……



        “博學”的模型  |



        “戰鼓催征千嶂寒,陰陽交會九皋盤。”
        這句詩出自哪位邊塞詩人之手?出自“初唐四杰”抑或“大歷才子”?你也許有些恍惚,然而這些都不是,它出自一個名為“源1.0”的大模型。


        前不久,浪潮招募近百人參與了一場“類圖靈測試”,將源1.0大模型生成的對話、新聞、詩歌、對聯,小說續寫5類作品混雜在文學大師的作品中,由測試者判斷該作品是“人為”還是“機為”。
        測試中,人們會把自認為優秀的作品歸功于人類,不夠理想的判定為機器創作。
        最后的測試結果“令人振奮”,在源1.0的挑戰測試中,人們能夠準確分辨人與“源1.0”作品差別的總體成功率低于50%。
        “測試者的平均區分正確率是49.16%。”浪潮人工智能研究院首席研究員吳韶華對《中國科學報》說,“這意味著,多數人不能辨別作品出自文學大師之手還是由源1.0創作。”
        在5類測試作品中,新聞類作品誤判率最高,達到57.88%,即大多數人很難分別作品到底是人類作品還是機器創作。
        在記者看到的一篇關于“中國稀土行業存在問題”的新聞作品中,從文體、布局到遣詞造句,妥妥的規范“新華體”,難怪近6成參與測試者難以辨別。
        即使誤判率最低的詩歌類作品(37.69%),如文章開始提到那兩句詩,也字順意達,不仔細推敲,確實難以想到是機器創作。
        圖靈測試是判斷機器是否具有智能的經典方法。通常認為,進行多次測試后,如果人工智能讓平均每個參與者做出超過30%的誤判,那么這臺機器就通過了測試,并被認為具有人類智能。
        以類圖靈測試判斷,這個能詩善文,可以和人對話、能給我們講故事的源1.0 有資格被稱為目前最“博學”的模型。
        那么,是什么讓機器如此“聰明”?



         大力出奇跡  |



        “認知智能是人工智能研究者追求的方向之一。”中國工程院院士王恩東告訴《中國科學報》,“除了加速深度學習技術,開發全新的算法范式研究方向外,大規模數據訓練超大參數量的巨量模型也是未來發展方向,即利用先進的算法,整合大規模的數據,匯聚大量算力,訓練出巨量人工智能模型。”
        2020年6月,OpenAI發布了參數量高達1750億的大模型GPT-3,該模型一推出就引起人工智能學界和業界的轟動。
        “語言模型是全球AI界的‘必爭之地’。”一位人工智能研究領域的專家說,“參數規模大到遠超我們想象的時候,會發生一些難以解釋的現象。”
        浪潮信息副總裁劉軍同樣認為,生命從簡單進化到復雜,這種智能水平本身就是一種模型。如果把模型比作元宇宙中的生命,大模型的這種綜合系統能力,可能會決定未來數字世界和智能世界里的智能水平。“人的神經元突觸超過100萬億,而現有大模型的參數量還遠遠不夠,所以我們還有很遠路要走”。
        伴隨著人工智能應用廣度與深度的不斷提升,眾多行業、諸多業務場景的智能化創新需求日益增多。
        然而當前大多數AI模型只能用于某一特定領域,通用性不強,這對AI技術提出了挑戰,也限制了AI的產業化進程。
        大模型在今天初露崢嶸絕非偶然。技術、算力、資源、需求等多因素的“風云際會”,讓被AI業界視為“核力量”的大模型嶄露頭角。



        最大中文語言模型  |



        源1.0幾乎把近5年整個中文互聯網的浩瀚內容全部讀完,在收集并清洗數據后,最終獲得5TB高質量數據,成為迄今業界最大的高質量中文數據集。
        在語言智能方面,源1.0獲得中文語言理解評測基準CLUE榜單零樣本學習和小樣本學習兩類總榜冠軍,獲得小樣本學習的文獻分類、商品分類、文獻摘要識別、名詞代詞關系等4項任務冠軍。



        “在數據量、參數規模與模型精度方面,源1.0均居全球之最。”浪潮人工智能研究院首席研究員吳韶華說。
        對標OpenAI的GPT-3,源1.0參數規模為2457億,訓練采用的中文數據集達5TB。相比GPT-3模型1750億參數量和570GB訓練數據集,源1.0參數規模領先40%,訓練數據集規模領先近10倍。
        “得益于我們設計模型時,對精度和計算性能的協同。”吳韶華說,“在算法上,我們解決了巨量模型訓練不穩定的業界難題,提出穩定訓練巨量模型的算法,打造了巨量模型推理方法創新;在數據方面,我們生成了迄今業界最大的高質量中文數據集;在算力上,我們通過算法與算力協同優化,極大提升了計算效率,在實現業界訓練性能第一的同時,還達到了業界領先的精度。”
        人工智能模型目前存在諸多挑戰。
        一是語言模型的通用性不高,一個模型專用于特定領域,換個地方就效果欠佳。而訓練超大規模模型能一定程度上解決通用性問題,可以被應用于翻譯、問答、文本生成等,涵蓋自然語言理解的所有領域,可被廣泛地應用于各種AI場景。
        二是模型開發成本高、周期長。而經過預訓練的大模型可以讓研究機構和企業“不必從0做起,可以在大模型的基礎上,從60、或者從90開始做到100”。
        “通過一個預訓練的大模型,面向任務做小樣本學習、零樣本學習以及微調,可用于各行各業。”吳韶華說,“大模型最重要的優勢是進入大規模可復制的工業落地階段,只需小樣本的學習也能達到比以前更好的效果,且模型參數規模越大這種優勢越明顯,這能大大降低各類用戶的開發使用成本。”



        共建“通天塔” |



        發展大模型曾被稱作“富人的燒錢游戲”。OpenAI為開發GPT-3花費了10億美元,研發團隊用了1萬個GPU,訓練了1個月。
        國內某課題組為進行一項較復雜的計算,購置了數臺服務器。運行起來后,該團隊負責人坦言,“光電費每天得1萬元”。
        因為在算法、軟硬件適配方面做了大量優化,源1.0比GPT-3用的CPU更少,訓練時間更短。這讓源1.0一定程度上摘下了“富人燒錢游戲”的帽子。
        同時,得益于浪潮在服務器和人工智能計算方面的長期投入和深厚的積累,浪潮開發大模型就如魚得水。浪潮并未細致切割出開發源1.0大模型到底投入了多大人力物力,但相信這也不會是個小數字。
        在源1.0發布的專家研討會前,幾位自然語言處理方面的專家前后到場。
        因為同在一個研究領域,他們或是故交、或相互聽說過姓名,見面聊起當前大模型的熱度,談笑間,“這(發展大模型)是一場新的‘軍備競賽’”的共識已經達成。
        學界普遍認為,大模型猶如“望遠鏡”“顯微鏡”一樣,當人們沒有這些設備時,不知道瀚瀚宇宙和原子分子等微觀世界到底有什么,是什么樣。有了大模型,人類或許就能發現一番嶄新的天地。
        因此,不管實力雄厚的頭部企業、研究機構,還是課題小組、單個研究人員,都期望能盡快用上大模型。
        業內人士認為,別說千億量級的模型,百億量級的模型對研究機構來說都難實現。而且,業界和學術界非常希望大模型能開放共享,開放模型可以讓大家一起來開發應用,優化和構建共同生態。
        “開放、開源、共享,是我們做這個事情的目的。”劉軍說,“我們不希望這么一個強大的武器有很高的門檻,成為少數人的專利,我們希望把它變成一個普惠性的能力建設。”
        劉軍認為,巨量數據、巨量算法和巨量算力正在成為邁向通用人工智能的重要路徑。巨量模型最后會變成創新的源頭,變成不同應用場景里快速產生模型的源頭。
        “浪潮源1.0大模型只是一個開始,它只是提供一片廣闊的肥沃土壤。浪潮未來將定向開放大模型API,服務于元腦生態社區內所有開發者,供全球的開發人員在我們的平臺上開發應用于各行各業的應用程序。”劉軍說,“源1.0將面向學術機構和產業界用戶開源,降低巨量模型研究和應用的門檻,推動AI產業化和產業AI化的進步,為國家在人工智能研究創新和產業發展作出貢獻。”
        大模型時代已經到來,如果頭部企業能站在行業發展的高處,以開源、開放、共享的理念來協同發展大模型,也許一場高損耗的“軍備競賽”會消弭于無形,一座通向智能世界的“通天塔”或許就能建成。
        編輯 | 趙路
        排版 | 郭剛


        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: 人工智能

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 南部县| 宽城| 合阳县| 南通市| 牟定县| 通海县| 茂名市| 新巴尔虎左旗| 大埔县| 昭觉县| 平潭县| 湖北省| 沙雅县| 东丽区| 洪洞县| 金溪县| 子长县| 仁怀市| 南岸区| 海门市| 洪泽县| 太保市| 钦州市| 文成县| 柘荣县| 昌吉市| 错那县| 依安县| 乌什县| 诸城市| 淳化县| 鹤壁市| 清苑县| 安宁市| 桐梓县| 怀远县| 平乡县| 南阳市| 五莲县| 湛江市| 新津县|