新聞中心

        EEPW首頁 > 智能計算 > 業界動態 > 谷歌發布旗艦推理模型:單次可處理百萬token

        谷歌發布旗艦推理模型:單次可處理百萬token

        作者: 時間:2025-03-26 來源:網易科技 收藏

        3月26日消息,美國時間周二,發布系列推理模型。該系列模型在回答問題前會“思考”片刻。

        本文引用地址:http://www.104case.com/article/202503/468624.htm

        作為這一系列模型的首發產品,Gemini 2.5 Pro Experimental已經率先亮相。這款多模態推理模型被稱為“目前最智能的模型”。這一模型將于周二登陸開發者平臺Google AI Studio,同時向每月支付20美元訂閱“Gemini Advanced”的用戶開放。

        谷歌表示,未來所有新推出的模型都將集成推理能力。

        自從于2024年9月份發布首個人工智能推理模型o1以來,科技行業紛紛爭相開發推理模型,想要匹配或超越o1的性能。目前,Anthropic、DeepSeek(深度求索)、谷歌和xAI等公司均已推出各自的人工智能推理模型,這些模型利用額外算力和時間,在輸出答案之前先進行事實核查和邏輯推演。

        推理技術使得人工智能模型在數學與編程任務中實現突破。許多科技界人士認為,推理模型將成為智能體的重要組成部分,使得這些人工智能系統可以無需人工干預自動完成任務,但成本也更高。

        谷歌此前也曾嘗試開發人工智能推理模型,去年12月份曾發布過具備“思考能力的Gemini,但系列模型則是谷歌挑戰“o”系列模型迄今最重磅嘗試。

        無標題.jpg

        谷歌聲稱, Pro在多項基準測試中都超越了前沿模型以及頂級競爭對手的部分產品,在視覺化網頁應用開發和自動化編程等領域的表現尤為突出。

        谷歌稱,在名為Aider Polyglot的代碼編輯評估中,Gemini 2.5 Pro得分為68.6%,力壓、Anthropic以及DeepSeek的部分頂尖模型。

        但在軟件開發能力測試SWE-bench Verified中,Gemini 2.5 Pro得分只有63.8%,雖然優于OpenAI的o3-mini和DeepSeek R1,但表現仍不敵Anthropic的Claude 3.7 Sonnet,后者得分為70.3%。

        在涵蓋數學、人文以及自然科學的綜合性測試“人類終極考試”(Humanity’s Last Exam)中,谷歌表示Gemini 2.5 Pro得分為18.8%,表現優于大多數競爭對手的旗艦級模型。

        此外,谷歌表示Gemini 2.5 Pro支持高達100萬的超大上下文窗口,單次可以處理約75萬英文單詞,遠超《指環王》三部曲的總字數。谷歌透露,未來Gemini 2.5 Pro將支持200萬的雙倍輸入長度。

        目前,谷歌尚未公布Gemini 2.5 Pro的API定價,但表示將在未來幾周內公布。



        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 安龙县| 南澳县| 阿尔山市| 宝山区| 凯里市| 城步| 乐安县| 新宁县| 河东区| 宿迁市| 珲春市| 菏泽市| 荔浦县| 海南省| 武陟县| 新泰市| 桑植县| 南靖县| 安阳市| 鄂伦春自治旗| 石首市| 沭阳县| 墨脱县| 高唐县| 忻州市| 新龙县| 满洲里市| 安泽县| 龙州县| 呼伦贝尔市| 皮山县| 监利县| 内江市| 延安市| 朝阳市| 土默特左旗| 祁东县| 乐安县| 夏津县| 桐城市| 宝应县|