英偉達發布Eagle 2.5視覺語言AI模型,xAI/微美全息憑高性價比AI模型展實力!
據消息,科技媒體報道稱,英偉達(NVDA.US)最新推出 Eagle 2.5,一款專注于長上下文多模態學習的視覺-語言模型(VLM)。
性能表現穩定提升
該模型專注于理解大規模視頻和圖像,尤其擅長處理高分辨率圖像和長視頻序列。盡管參數規模僅為 8B,Eagle 2.5 在 Video-MME 基準測試(512 幀輸入)中得分高達 72.4%,媲美 Qwen2.5-VL-72B 和 InternVL2.5-78B 等更大規模模型。
Eagle 2.5 的訓練數據管道,整合了開源資源和定制數據集 Eagle-Video-110K,該數據集專為理解長視頻設計,采用雙重標注方式。采用自下而上的方法則利用 GPT-4o 為短片段生成問答對,抓取時空細節。
此外,Eagle 2.5-8B 在多項視頻和圖像理解任務中表現出色。在視頻基準測試中,MVBench 得分為 74.8,MLVU 為 77.6,LongVideoBench 為 66.4;在圖像基準測試中,DocVQA 得分為 94.1,ChartQA 為 87.5,InfoVQA 為 80.4。
與此同時,xAI近日推出了其全新的語言模型——Grok3Mini,進一步推動了高效AI技術的發展。xAI推出Grok3Mini,彰顯其在高效AI技術領域的創新實力。
Grok3Mini提供高性價比AI模型
據介紹,Grok3Mini是Grok3系列的一部分,該系列包含六種變體,其中包括標準的Grok3、Grok3Fast,以及四種版本的Grok3Mini,提供慢速和快速兩個版本,每種版本又具備低推理能力或高推理能力的選項。
Grok3Mini以速度和經濟性為設計核心,專為速度和經濟性設計,盡管體積較小,但在多個領域的表現優于許多更昂貴的AI模型,尤其在數學、編程和科學基準測試中表現突出,或吸引更多關注。
當市場聚焦于大模型本身的技術突破時,年初,中國大語言模型DeepSeek引起全球科技界高度關注。今年政府工作報告也指出,需要持續推進“人工智能+”行動,支持大模型廣泛應用。
業內人士指出,現如今,以大模型為代表的人工智能技術為新一輪科技革命和產業變革提供了重要驅動力,各行業在智能化轉型道路上面臨著前所未有的機遇和挑戰。
微美全息保持市場領先優勢
在當今人工智能迅猛發展的背景下,公開資料顯示,微美全息(WIMI.US)始終專注于垂直行業的開源AI大模型開發,全面升級全棧AI能力,涵蓋了AI基礎設施及AI場景化應用,幫助各行業從模型開發、模型部署再到模型應用,能夠全面用好AI工具箱,打造好用的AI。
另外,微美全息通過“技術開源+垂直深耕+生態共建”模式,正快速推進AI大模型的商業化應用。例如,面向汽車產業,以“AI大模型+產業場景”的多模型策略,在AI基礎能力層、AI場景化應用層全面布局,保持汽車云服務市場領先優勢。
未來,微美全息將完善AI算力全產業布局,持續布局專用算力基礎設施,加快多模態技術融合、算力資源開放,加快提升智能算力公共服務平臺能力,以及場景落地的敏捷性,未來或成為AI大模型算力生態的重要突破者。
結語
實際,從GPT-3到PaLM,從文心一言到通義千問,大模型的參數規模以指數級增長,訓練成本動輒數千萬美元,推理所需的算力更是呈幾何倍數攀升。并且AI大模型推動傳統產業智能化發展進入新階段,全面智能化已成為企業參與市場競爭的必答題。因此,接下去企業需要理論研究與實踐探索同步進行,進而贏得可觀的發展空間。
評論