大模型修復傳世名畫,飛槳幫助母羊產羔……這屆百度世界大會,科技感與接地氣并存
2022 年的百度世界大會上,百度諸多亮眼發布背后的飛槳和文心大模型正在受到越來越多的關注。
在中國古代的水墨山水畫中,元代畫壇宗師、「元四家」之首黃公望的《富春山居圖》稱得上巔峰之筆,更被列為「中國十大傳世名畫之一」。然而,該畫作由于遭火焚斷為長短兩卷。前半卷《剩山圖》現藏于浙江省博物館,后半卷《無用師卷》現藏于臺北故宮博物院。
在今天上午舉行的 2022 百度世界大會上,我們見證了 AI 讓兩岸畫卷完成「合璧」的智能創作能力。現場,百度首席技術官王海峰博士展示了基于文心大模型補全后的《富春山居圖》。文心大模型還按照古人傳統作文以記之,生成的畫作更是得到黃公望紀念館負責人毛傳鑌的高度評價,「補全的富春山居圖與現存真跡風格一致。」
不過,《富春山居圖》畫作的補全只是百度 AI 實力的牛刀小試。會上,百度與中國航天聯合推出世界首個航天領域大模型 —— 航天 - 百度?文心大模型;百度第六代量產無人駕駛汽車 Apollo RT6 亮相,車輛成本 25 萬,僅為同行業十分之一;百度智能交通幫助人們實現「綠燈自由」,車均延遲率降低近三成;百度智能云開物 2.0 深耕重點行業,讓企業低成本享受 AI 紅利;智慧大腦讓城市會思考;數字人度曉曉在唱歌、畫畫、寫作之余,更在百度 APP 端陪伴億萬用戶;全屋智能構建未來生活……
與此同時,百度在會上以實際案例展示自身踐行普惠 AI 的行動,讓 AI 技術走入田間地頭和車間廠房,讓牧民、農民和電廠工人親身體驗到 AI 的魅力,助力萬物生長。
這所有的一切都離不開百度飛槳、文心大模型等底層 AI 技術能力的支持。作為百度自主研發的中國首個開源開放的產業級深度學習平臺,飛槳已經成為 AI 開發應用、賦能千行百業、惠及千家萬戶的技術支撐。目前,飛槳平臺凝聚了 477 萬開發者、服務 18 萬家企事業單位,創建 56 萬個 AI 模型,根據國際權威調研機構報告,位列中國深度學習平臺市場綜合份額第一。
文心則是百度自主研發的產業級知識增強大模型,涵蓋基礎大模型、任務大模型和行業大模型,并結合豐富的工具與平臺支撐企業與開發者開展高效便捷的應用開發。文心大模型已經在百度內外部實現了包括 AI 智能創作在內的多樣化能力,各行各業都能找到它的身影。
本次世界大會上,百度借助飛槳平臺和文心大模型彰顯其長久以來利用 AI 技術惠及人們生產生活的決心,以及不斷創新 AI 應用場景的內驅力。
正如王海峰博士在會上所講的那樣,「人工智能現在已經遍地開花,成為新一輪科技革命和產業變革的重要驅動力量。既能夠支持人類對星辰大海的探索,也在實實在在改善人們的生產生活,賦能千行百業,惠及千家萬戶。」
走入牧場、農田和電廠,百度用飛槳促進 AI 技術、產業、生態繁榮
自 2016 年飛槳開源以來,百度就立足于開源開放,與廣大企業和個人開發者一起為推動 AI 技術、產業和生態繁榮努力。在這一過程中,飛槳平臺以及依托該平臺的文心大模型成為了重要的助推力。
今天的世界大會上,百度通過三個生動的產業案例闡釋了飛槳如何助力牧民、農民和電廠工人用上強大的 AI。
首先談到了內蒙古草原上重要的生產資料 —— 母羊。內蒙古草原上,為了應對母羊生產時難產、小羊羔被凍死的情況,牧民在寒冬深夜里需要多次往返住所和羊圈,費時費力。內蒙古工業大學教授秦俊平帶領團隊與內蒙古智慧牧業信息技術集團公司合作,使用飛槳開發母羊分娩預測和預警系統,切實減輕了牧民工作量,提高羊羔成活率。
對牧羊的智能化分析。
接著關注農業領域近年來發展迅速的無人駕駛農機,但由于相關技術的作業精度要求極高,且農田中存在的暗溝等對全程自主作業帶來很多困難。因此,國家農業智能裝備工程技術研究中心王昊博士開展農田地塊分割和農田障礙物識別方法研究,利用飛槳克服各種技術難題,成功在相關系統當中完成落地,即使在形狀不規則、環境復雜的農田地塊里,也能方便快速獲取高精度農田場景模型,保障農機精準作業。
無人駕駛拖拉機。
最后來到關乎國計民生的電力行業。能源安全、電力保供關系國計民生,但傳統發電生產依靠人員 “傳幫帶” 傳授業務技能,信息經驗分享溝通不夠及時高效;面對新技術問題老師傅也會出現研判不準確的問題,可能會給電網安全、居民用電帶來不便。浙能集團數字科技有限公司算法工程師朱凌風和團隊利用飛槳開發電廠設備智能研判系統,可智能診斷設備故障,自動分析故障原因及可能產生的后果,還能結合業務流程自動推送處置信息和運維策略,幫助生產人員有效提高了設備運維工作質量,提升應急搶險和設備故障搶修效率。
電廠設備維護工人在作業中。
從以上三個案例中,百度飛槳的開源開放以及產業級屬性表現得淋漓盡致。開發者利用飛槳共享且經過大量產業實踐驗證的底層技術,從實際情況出發創新 AI 技術或系統,切實解決自身問題,提升生產效益。
這些案例只是飛槳賦能千行百業的一個縮影,百度更在智慧產業、智慧生活、前沿科技、創新與公益等更廣闊領域中以多樣化的方式造福著不同用戶群體。
文心繼續探索行業大模型以及 AIGC 全新內容生產方式
近年來,深度學習領域掀起了一波聲勢浩大的「練大模型」潮流。從 OpenAI 發布 1750 億參數的 GPT-3 開始,千億、萬億級大模型不斷涌現。大模型具有效果好、泛化能力強等特點,能夠進一步促進 AI 的通用性。開發者也能以更低的成本和門檻開發 AI 模型,使 AI 擁有更廣泛的應用場景。種種優勢之下,大模型已經成為了 AI 技術和應用的新基座。
百度從 2019 年就開始積累預訓練和大模型技術,力爭在 AI 巨頭的競爭中始終保持「頭雁」地位,因而于近年做出了一系列重磅動作,并在探索過程中形成了自己的核心競爭力 —— 知識增強。2021 年 12 月,參數量達 2600 億的全球首個知識增強大模型鵬城 - 百度?文心發布,產業級知識增強大模型文心全景圖也在當時首次亮相。
今年 5 月的 Wave Summit 峰會上,全新升級的文心大模型在知識增強和產業級這兩方面得到了進一步加強,新增 10 個大模型,在業界首發兩個行業大模型 —— 國網 - 百度?文心和浦發 - 百度?文心,融合任務相關知識的 ERNIE 3.0 Zeus 千億大模型讓百度 AI 數字人度曉曉 40 秒完成 40 篇高考作文,拓展了 AI 的內容生產能力。
截至目前,文心大模型已經發布了 20 多個大模型,構建了一套完整的大模型生態體系。在今天的大會上,文心不僅迎來了新的行業大模型成員,它的視覺大模型更是通過《富春山居圖》畫作的補全進一步拓展了百度 AI 的智能創作實力。
航天領域有了自己的大模型
百度與中國探月航天一直保持著密切合作,2021 年 12 月正式成為了中國探月航天工程人工智能全球戰略合作伙伴。中國航天對百度 AI 技術的深度認可是雙方合作的前提,比如采用 AI 實現即時優化飛行軌道與姿態控制,最大限度規避飛行風險;再比如將 AI 與遙操作結合,更好實現深空探測器自主規劃探測路線、自主選擇探測目標等。
與此同時,雙方也在不斷探索新的合作模式和途徑,此次行業大模型成為了新的合作契合點。
會上,王海峰博士宣布與航天合作研制出了世界上第一個航天領域的大模型 —— 航天 - 百度?文心大模型,成為了文心行業大模型行列中的新成員。
王海峰博士與中國探月工程副總指揮、國家航天局探月與航天工程中心主任劉繼忠主任現場連線。
就其功能而言,航天 - 百度?文心大模型可以將航天領域的數據和知識融合學習,對航天數據進行智能的采集、分析和理解,助力深空智能感知、規劃和控制等技術突破。
正如王海峰博士所說,「人工智能在航天領域有著非常大的應用場景,將推動深空探測的智能化。」
文心視覺大模型補全傳世名畫《富春山居圖》
除了繼續研發引入行業特色數據和知識的行業大模型之外,文心大模型在助力智能創作領域有了新的成果 —— 視覺大模型實現了對黃公望《富春山居圖》的補全。這也表明,文心大模型的理解和生成能力得到了進一步的增強。
與以往 AI 復原畫作最大的不同是,每個人都可以親身體驗《富春山居圖》的虛擬修復過程,根據自己的想法補全缺失的部分。只要在百度 APP 搜索「富春山居圖」,在中間空白處簡單勾勒幾筆,不到 1 秒鐘即可在文心大模型的支持下自動補全畫卷,畫出屬于自己的傳世之作。生成的畫作還能左右滑動,非常地神奇。
《富春山居圖》的修復需要解決清晰度、還原度和全民參與這三方面的問題,這就要求模型既要足夠大,滿足分辨率訴求和創意泛化需求,又能充分考慮生成結果與原畫作的一致性。該團隊基于文心視覺大模型 VIMER,提出了「視覺生成大模型 + 單樣本微調」的方案。
針對類似畫作的樣本稀缺問題,百度技術團隊搜集大量的山水畫樣本數據,提出讓基于多尺度圖像塊的生成大模型來學習模擬筆觸和畫作之間的關系。在過程中,為了生成更加逼真的畫作,團隊還引入了層次化先驗信息編碼模塊來指導模型完成細膩的高質量筆觸生成。
雖然團隊沒有接觸到《富春山居圖》的實物畫,但爭取到了電子掃描版的授權。他們針對這一單幅畫對生成大模型進行了單樣本微調訓練,使補全出來的畫作在風格、筆觸等細節上與現存真跡保持高度一致。
修復過程中,團隊需要解決的最大難點是:如何同時滿足不同用戶多樣化的創作期望。由于不同用戶輸入的筆觸在形態上千變萬化,既要保證生成畫作風格與原畫的一致性,又要充分體現用戶的創作意圖,因此一方面在模型結構設計上準確提取畫作多尺度圖像塊中的風格特征作為生成依據,另一方面保證生成的畫面結構盡可能符合用戶筆觸。
百度技術團隊通過大量調試確定畫作風格與用戶筆觸的對應關系,并收集更多不同用戶參與修復過程中繪制筆觸的特點,做好修復效果與用戶筆觸引導結果之間的權衡。同時在部分尺度上引入隨機性來讓生成結果擁有更多可能性,模型也能通過強大的泛化能力來保證生成結果的穩定。
得益于參數量大、建模能力強的優勢,文心視覺大模型在補全《富春山居圖》過程中實現了高分辨率的生成結果,這在當前大模型中非常少見。文心視覺大模型還能「以不變應萬變」,將不同用戶多樣化的創意實時轉換生成看得見的實物畫作。
未來 10 年,AIGC 將顛覆現有內容生產模式
此前,文心大模型支持下的度曉曉就顯示出了 AI 寫作、AI 繪畫、AI 寫歌等 AIGC(AI generated content)能力,即運用人工智能技術自主生產內容。此次文心視覺大模型的畫作補全是百度探索 AI 智能創作一系列動作的延續,契合了當下這一備受關注的新型內容生產方式。繼 UGC、PGC 之后,大模型賦能下的 AIGC 已經成為了近來百度 AI 技術加速落地的著陸點。
可以看到,在不斷完善的 AI 大模型技術的加持下,AIGC 這一新型內容生產方式不僅能夠提升內容生產的效率和效果,而且帶來了新的內容創意和方式。這也意味著 AIGC 的適用性不斷擴展,更多內容生產領域勢必會被發掘出來。
在會上,百度創始人、董事長兼 CEO 李彥宏對 AIGC 發表了自己的觀點。他認為,AIGC 不僅可以提升內容生產的效率,還能創造獨有價值和獨有視角的內容。
李彥宏將 AIGC 的發展分為了三個階段。第一階段是 “助手階段”,AIGC 輔助人類進行內容生產;第二階段是 “協作階段”,AIGC 以虛實并存的虛擬人形態出現,形成人機共生的局面;第三階段是 “原創階段”,AIGC 將獨立完成內容創作。
未來十年,AIGC 將顛覆現有內容生產模式,實現以十分之一的成本、百倍千倍的生產速度去生成 AI 原創內容。在這一過程中,效率更高、學習能力更高且能夠跨語言跨模態學習的百度文心大模型勢必發揮重要作用。
但同時,文心大模型帶來提升的遠不止 AIGC 方向。目前,文心大模型不僅正在搜索、信息流、百度地圖等百度內部場景中發揮作用,更在工業、能源、金融、教育、通信、媒體、醫療等外部行業逐漸找到契合的應用場景,在助力這些行業的智能化轉型升級中進一步實現自身的應用價值。
在生態和社區層面,百度也專門面向文心大模型推出了創意社區 —— 文心?旸谷社區,將大模型的能力開放給更多普通開發者,讓他們通過實操親身體驗文心大模型的能力,并充分發揮開發者群體的智慧探索大模型的更多玩法。目前,文心大模型的個人、企業開發者數量已超過 6 萬人。
開源開放、生態繁榮這條路要一直走下去
開源開放、生態繁榮絕不只是空喊的口號,更要落到實處。百度也正是這樣做的,近年來不斷創新底層技術,在與開發者和社會各界的共同努力下,在各行各業中持續降低 AI 應用門檻。其中,飛槳和文心大模型都發揮了「主力軍」作用。
就飛槳而言,該平臺集深度學習框架、產業級模型庫以及豐富的開發套件和工具組件為一體,持續在技術、場景和生態三大領域進行深化,夯實工業大生產強大底座,推動 AI 規模化落地。開發者依托開源開放的飛槳平臺在產業實踐中開展技術創新,最終形成更廣闊的技術和應用生態。
同時,大模型作為深度學習技術的新突破,已經成為 AI 應用的「基礎設施」,不僅進一步增強 AI 技術的通用性,也讓廣大深度學習開發者以更低成本、低門檻親身體驗。文心大模型在做好基礎通用大模型和任務大模型之外,細分出了行業大模型,更精準地匹配真實場景的方方面面。
未來,飛槳和文心大模型將持續降低應用門檻,推動產業智能化升級,讓 AI 技術惠及每一個人。王海峰博士表示,希望飛槳能夠在促進我國人工智能技術和產業繁榮的同時,助力實現科技自立自強。
參考連接:https://wenxin.baidu.com/https://www.sohu.com/a/559610000_129720https://www.jiqizhixin.com/articles/2021-08-19https://video.cdn.huierkj.com/PaddlePaddle.pdfhttps://www.jiqizhixin.com/articles/2022-05-20-8
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。