Gartner:企業通過數據管理獲取AI價值的五大要素
DeepSeek R1的推出加快了大語言模型在生成式人工智能領域的商品化和多極化,使未來數據管理戰略的重點轉向了人工智能(AI)就緒度和數據主權。Gartner預測,到2028年,80%的生成式AI(GenAl)業務應用將在企業現有的數據管理平臺上開發,從而使部署的復雜度和交付時間降低50%。到2028年,50%的AI數據管理工作內容將是管理數據主權和多極化AI所帶來的偏見,使其至少符合三個地區的法規。
圖1 企業數據-AI平臺的價值金字塔
DeepSeek將其R1模型做成開源模型并顯著降低了推理和訓練成本,引領了大語言型格局的變革。其實在DeepSeekR1推出之前,大語言模型的價格在過去兩年中就已大幅下降。
Gartner高級研究總監顧星宇表示:“這些創新勢必引發一波成本和能耗下降,進一步壓低大語言模型價格,加速模型的商品化。這一戰略性舉措不僅使大語言模型更加觸手可及,而且促進了AI技術格局的全球演變。在這種情況下,特定的大語言模型將不再被視為企業取得GenAl成功的關鍵差異點。相反,其他企業難以獲得或復制的獨特內部數據將成為AI之旅成功的唯一競爭優勢。”
AI提供商的多極化給各企業機構帶來了數據管理挑戰,包括更復雜的數據主權和合規要求以及對影子AI和偏見的數據治理。企業必須積極加強數據管理戰略,以降低風險并充分利用AI演進動態帶來的機遇。
模型提供商的多極化需要更加穩健和合理的數據主權和合規管理
作為一家中國公司,DeepSeek利用其特定的訓練數據,滿足了中國及周邊市場特有的語言、文化和監管要求。這種方法建立了一個獨特的“極點”,使其區別于美國流行的GPT-4和Gemini,特別是在法律、政治、文化和技術方面,其中許多與數據有關。這種多極化引起了人們對AI治理和偏見的擔憂,特別是在全球政治環境不確定的情況下。
Gartner研究副總裁孫鑫表示:“多極化生態系統有助于打破壟斷控制,鼓勵創新和韌性,但同時也需要有系統的數據管理框架,以及與數據生態系統供應商建立強有力的伙伴關系,以確保符合數據合規和數據主權的要求。”
知識源與大語言模型的脫鉤已變得至關重要
一些GenAl的早期采用者已開始咨詢如何用DeepSeek R1替換現有GenAI應用中的大語言模型,這表明他們之前用的與大語言模型緊密耦合的GenAI應用正在成為沉沒成本。R1發布后不到兩周,OpenAl和Google就分別于2025年2月1日和2月5日發布了最新的大語言模型——o3 mini和Gemini 2.0。企業不應將任何特定大語言模型(包括DeepSeek R1)視為其GenAl計劃中的永久組成部分。
Gartner高級研究總監方琦表示:“數據和分析(D&A)領導者應該與AI領導者合作,采用更強健的架構,將大語言模型和企業內部知識源慢慢脫鉤。集中管理AI相關的數據戰略有助于減少知識孤島,從而在AI計劃規模擴大后提高數據治理的效率。”
將無監督AI使用作為企業運營的新常態
AI推理成本的大幅降低,減少了業務用戶與企業數據交互的障礙。圍繞DeepSeek的媒體宣傳已經導致員工不受管理地使用DeepSeek應用(如移動設備和聊天機器人)。AI正勢不可擋地涌向業務的每一個角落。在這種新常態下,以控制為重點的數據治理流程正迅速變得過時,并且會阻礙員工的數據驅動型創新。
數據編織領域的主動元數據,特別是運行時元數據(操作元數據和社交元數據)的管理,是使數據管理團隊始終處于企業數據使用前沿的關鍵方法。Gartner高級研究總監顧星宇表示:“為了應對這些挑戰,D&A領導者應優先考慮有助于跨平臺輸出和導入元數據的工具,從而支持更廣泛的協調和優化。評估當前的數據管理能力對于支持高級元數據功能,尤其是運行時元數據共享和元數據標準,以確保互操作性。”
擁抱云部署,獲得最佳數據-AI平臺
DeepSeek降低了推理成本,因此可以在各種基礎設施(包括本地甚至個人計算機)上進行部署。然而,云數據生態系統提供了獨特的優勢,包括以較低的前期成本試驗新數據管理技術的機會,以及快速適應新AI模式的能力。因此,當前總體趨勢仍然傾向于GenAI應用的云部署。
在考慮部署涉及內部數據的GenAl業務應用時,企業應同時評估云部署和本地部署,以確定最適合其需求的方法。
提升數據管理團隊的數據和AI素養,充分利用推理模型
DeepSeek R1仍然會產生幻覺,但其推理能力使人類能夠以更透明、更高效的方式檢查其輸出內容。這意味著,在數值預測、代碼開發、數據工程等重要業務流程中,GenAl的采用將逐漸增加,但要經過人工審查。
D&A領導者應該為這一變化做好準備,提高數據管理專家的技能水平,使其能夠使用由推理模型賦能的AI增強功能。
評論