谷歌全面反攻 ChatGPT!PaLM 2、Gemini 雙殺,Bard 正式開放(1)
前幾日,在 Google 官方發布的文章中提到,「自 2008 年 Google 首次舉辦 I/O 大會,已經過去了整整十五年。」
在過去的十五年中,Google 作為全球一直領先的科技公司,深刻影響了全世界互聯網產業的格局與發展方向。每年一度 I/O 大會(除 2020 年因疫情取消),更是成為 Google 大秀肌肉、推陳出新的舞臺。
直到近期 OpenAI 連續發布多個劃時代意義的產品與技術,提前推進了 AIGC 時代的進度條。隨后微軟快速采取了各種行動,將 GPT 能力集成進瀏覽器、搜索引擎,甚至辦公套件,讓微軟在人工智能賽道上探出身位。人們開始好奇移動開發時代的絕對霸主—— Google,將如何通過本次 I/O 的技術發布,重回技術領導地位。
今天凌晨 2023 Google I/O 大會的主題演講環節,Google and Alphabet CEO Sundar Pichai 及數位技術、產品負責人,從 AI、移動開發、云服務和消費者產品幾個方面,快速介紹了多項重要的更新:
正式發布 5400 億參數大模型 PaLM 2,已為 Google 旗下產品 25 項產品賦能。同時宣告了多模態基礎模型 Gemini,Google 所有產品都將基于它們,包括 Google Bard、搜索、云。
Google 產品一覽圖,圖源:Jedi Lu(基于 CC 共享協議引用)
Google 對標 ChatGPT 的智能聊天機器人 Bard 也迎來了新進展,正式面向 180 個國家/地區開放使用,目前支持英語、日語、韓語交互,近期將擴展其他 40 種語言。
Android 14 新增 Magic Compose 功能,可幫助用戶智能回復文本信息。
Google 官方的折疊機來了!推出首款折疊屏手機 Pixel Fold 售價 1799 美金,及配有智能支架的平板電腦 Pixel Tablet,售價 499 美金、以及中端系列手機 Pixel 7A,售價 499 美金。不知蘋果在今年是否會緊隨發布折疊機。
Google 辦公套件 Workspace 推出 AIGC 工具包—Duet AI,現開放試用。
Google 搜索推出 Perspectives 功能,利用 AI 能力,優化搜索體驗。
Wear OS 4 即將發布,將延長電池壽命,完善與智能家居的交互使用。
PaLM 2 發布,能力滲透 Google 全線產品
在正式發布 PaLM 2 前, Pichai 先通過發布 Gmail、Google Map、Google Photo 三個產品中的新功能,展現其實際應用能力。現場介紹了 Gmail 產品中基于 PaLM 2 實現的三項新能力:Help me write 幫我寫、Smart Compose 智能補全、Smart Reply 智能回復。并且據統計過去一年中,智能寫作的相關功能已經穩定為用戶了 1800 億次服務。同樣的 AI 能力還應用在了 Google Map 中,提供了沉浸式的導航路線視圖,這項功能將在不久后開放,在今年年底前支持第一批城市。同樣,在 Google Photo 中引入 AI 能力后,也為用戶提供了強大的圖片編輯能力。
Pichai 嚴肅強調了 Google 的使命是:整合全球信息以供大眾使用,并讓人人受益(Organize the world's information and make it universally accessible and useful.)。這句強調不禁聯想到,本屆 I/O 大會前一周,圖靈獎得主、人工智能學界泰斗、Google 前人工智能專家 Geoffrey Hinton 辭去谷歌工作,并表示了對人工智能技術快速發展的擔憂。
PaLM 2(Pathway Language Model)也是本次大會 AI 板塊最重大的發布之一,這是 Google 開發的 5400 億參數的大型語言模型(LLM),在本次發布的 PaLM 2 預覽版中,重點改進了模型的多語言翻譯、數學、程序語言、推理和自然語言生成能力。
其中多語言翻譯能力的提升,來源于 PaLM 2 基于 100 多種語言中文本的訓練。這使得模型在理解、生成和翻譯細微差別的文本(如成語、詩歌和謎語)的能力都有了顯著提高。
在推理方面,PaLM 2 的數據集包括科學論文、大量涵蓋數學公式的各類網頁,提高了模型的邏輯、常識推理和數學能力。
在程序語言方面,PaLM 2 在海量開源代碼的基礎上進行了預訓練。除了 Python 和 JavaScript 這類流行語言,這還包括 Prolog、Fortran 和 Verilog 這類語言。另外,Google 在 PaLM 2 的基礎上訓練了用于編程和調試的專業模型 Codey,安全知識模型 Sec-PaLM 以及醫學知識模型 Med-PaLM 2 。
目前 PaLM 2 提供四個大小版本,適用于不同的使用場景,每種規格并以動物名,從最小到最大:Gecko 壁虎、Otter 水獺、Bison 野牛和 Unicorn 獨角獸。其中 Gecko 非常輕巧,可以在移動設備上工作,并且速度足夠快,即使在離線時也能在設備上穩定運行。
值得一提的還有,Google 公布了其下一代多模態基礎模型 Gemini,由 DeepMind 仍然還在訓練過程中,支持多種輸入方式,包含高效的工具,能夠讓開發者實現 API 集成。
而 Google 做模型和微軟等不一樣的地方可能就是對于社會責任的體現。如何判別 AIGC 生成的內容?Google 帶來了兩項工具——嵌入水印和嵌入元數據(meta data)。
Bard 取消試用制,用來寫代碼更順暢了!
作為直接對標 ChatGPT 的產品,Bard (https://bard.google.com/)一直被寄予厚望。在這次大會上,Bard 正式取消了排隊試用機制,180 多個國家和地區目前可以直接使用 Bard,但中國地區訪問仍然受限。目前版本的 Bard 僅支持英語、日語、韓語內容,并承諾在未來盡快支持其他 40+種語言。
在本次的演示中,升級后的 Bard 更適合生成代碼,包括 20 多種語言的代碼生成、調試、編寫注釋。在 Bard 演示的環節強調了其可擴展性,例如使用 Bard 寫代碼可以一鍵拖拽至 Colab 直接運行。除此之外,如果使用 Bard 生成了比如郵件內容、表格之類的,也可以直接拖拽進 Gmail、以及 Google 云端硬盤的文件中。
除了 Colab,Bard 還將與包括 Adobe Firefly 在內的更多合作伙伴進一步合作,未來可以使用 Bard 直接生成代碼,在各個軟件工具平臺上使用。
在現場的展示中,Bard 可以在其回答中顯示圖像,比如用戶正在尋找有關旅游目的地的信息,Bard 可以在回復框中輸出圖片,展示熱門景點的圖片。就目前展示和線上試用的效果而言,這些能力對比當前 ChatGPT ,Bard 僅僅做到了追趕,少部分功能的實用性讓人眼前一亮。
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。