阿里云賈揚清:用4S標準帶領團隊鍛造大數據+AI產品體系「阿里靈杰」
10 月 20 日,在 2021 云棲大會上,阿里巴巴集團副總裁、阿里云計算平臺事業部負責人、達摩院 AI 平臺負責人賈揚清發布大數據 + AI 產品體系“阿里靈杰”。
“時至今日,我們可以越來越清晰的看到算力、算法、數據和場景的融合,尤其是 AI 和數據。沒有數據,AI 是留在實驗室里的火花;而沒有 AI,數據就是堆在那里的一堆成本”,賈揚清提到,“阿里靈杰是我們在過去幾年思考實踐的過程中所沉淀下來的基于 Scale、Speed、Simplicity 和 Scenario 這樣的 4S 標準的產品的體系。它不是一個為了創新而創新的過程,而是在我們希望 AI 能更加簡易落地的時候不斷生根的一個結果。我們希望阿里靈杰幫助我們和各行各業開發者一起,能夠在云上畫出人工智能增長的第二曲線。”
據悉,“阿里靈杰”是中國最大的大數據+AI 一體化平臺。“阿里靈杰”包含機器學習平臺 PAI、云原生大數據計算服務 MaxCompute、實時計算 Flink 版、大數據開發治理平臺 DataWorks、實時數倉 Hologres 等產品,可調動規模高達 10 萬臺以上計算集群,擁有云邊端一體的高性能訓練和推理引擎,能提供毫秒級延遲的實時數據分析能力等,也提供開箱即用的視覺、語音、決策、NLP、業務增長引擎等開放服務。
在過去一年,賈揚清介紹,他帶領的團隊在 4S 標準下也在不斷提升產品能力,主要體現在四點:
Scale:靈活擴縮的大數據、大模型、大應用
賈揚清向大家分享了幾個數字:1. 云原生大數據平臺 Max?Compute 已經以 10 萬臺集群,支持 2000 萬表和千萬級的調度。但同時也可以從一張表,一個 GB,一個任務開始,用零啟動成本來使用近乎無限的彈性。2. 在 AI 領域,阿里云發布了大規模分布式訓練框架 Whale,提供分布式 comp graph 建模和自動優化,達摩院的科學家們用 Whale 訓練了全球首個十萬億級參數的預訓練模型M6, 以及AliceMind等模型。
Speed:極致的運行、開發、運維效率
今天性能已經不是刀耕火種的手工優化。基于 AI for Systems 的邏輯,通過自動優化,阿里云的成熟產品 MaxCompute 和實時計算 Flink 版持續提升自己性能,MaxCompute 已經是第五年拿到 TPCx-BB 的性能第一名。
賈揚清介紹,“人力成本是最大的成本,開發效率越來越重要。我們的 AI 平臺在前面一年完全實現云原生化,使我們可以一鍵式地完成從建模 / 訓練 / 服務全鏈路的搭建過程。”
Simplicity:標準、像調用函數般易用
AI 先驅 Richard Sutton 說過一句話:70 年研究得出的最大經驗,最有效也最顯著的技術,就是找到通用的方法來利用大量計算。
今年,阿里云 MaxCompute 和 DataWorks 提供了豐富的生態和數據建模治理工具。阿里云 AI 工程團隊與達摩院算法的合作,在十多個 AI 場景下提供了上百個標準化的算法模型服務,解決 AI 落地應用最后一公里的問題。使用 OCR、NLP 等,應該像下一個 App 那么簡單。
Scenario:向場景而生
沒有場景化的 AI 能力是沒有用處的。誰都需要算力,但是不一定管得好算力。阿里的云原生化的 PAI 軟件層和 Eflops 高性能集群的結合,提供開箱即用的算力解決方案,支持從學術研究、工業制造場景的落地。
在金融領域,阿里云湖倉一體架構、離線實時一體化數倉,將各種形態的數據匯聚在一起,從傳統的反欺詐到創新的用戶營銷,提升多個場景的應用效果。
和之前基于運營的增長黑客相比,今天的增長引擎很多都是基于數據和算法的。PAI 將這些場景算法標準化,可以實現 RTA、用戶觸達、智能搜索等多個客戶應用中的明顯的業務提升。
在過去一年,阿里靈杰也跟犀牛制造、北京大學化學與分子工程學院來魯華教授組(靶向****物研究)、老視頻修復 B 站 Up 主 AI 開發者大谷 Spitzer,在一起探索各種業務場景,為企業和開發者提供 “開箱即用” 的大數據 + AI 一體化能力。
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。