分析發現,“推理”人工智能模型的改進可能會很快放緩
非營利性人工智能研究機構Epoch AI的一項分析表明,人工智能行業可能無法通過推理人工智能模型獲得巨大的性能提升。根據報告的調查結果,在一年內,推理模型的進展可能會放緩。
本文引用地址:http://www.104case.com/article/202505/470376.htm近幾個月來,OpenAI的o3等推理模型在人工智能基準上取得了重大收益,特別是衡量數學和編程技能的基準。這些模型可以將更多的計算應用于問題,這可以提高其性能,但缺點是它們比傳統模型需要更長的時間來完成任務。
推理模型是通過首先在大量數據上訓練常規模型,然后應用一種稱為強化學習的技術來開發的,這有效地為模型提供了對其難題解決方案的“反饋”。
據Epoch稱,到目前為止,像OpenAI這樣的前沿人工智能實驗室還沒有將大量的計算能力應用于推理模型培訓的強化學習階段。
那正在改變。OpenAI表示,它應用的計算比其前身o1多10倍左右來訓練o3,Epoch推測,這些計算大部分都用于強化學習。OpenAI研究員Dan Roberts最近透露,該公司的未來計劃要求優先使用強化學習,以使用更多的計算能力,甚至比初始模型培訓還要多。
但每個紀元,有多少計算可以應用于強化學習仍然有一個上限。
Epoch的分析師、分析的作者Josh You解釋說,標準人工智能模型培訓的績效收益目前每年翻兩番,而強化學習的績效收益每3-5個月增長十倍。他繼續說,推理訓練的進展“到2026年可能與整體前沿相融合”。
Epoch的分析提出了一些假設,并部分借鑒了人工智能公司高管的公開評論。但它也證明,由于計算以外的原因,包括高昂的研究間接費用,擴展推理模型可能被證明具有挑戰性。
“如果研究需要持續的間接費用,推理模型可能不會像預期的那樣擴展,”你寫道。“快速計算縮放可能是推理模型進展中非常重要的因素,因此值得密切跟蹤這一點。”
任何表明推理模型在不久的將來可能會達到某種限制,這可能會讓人工智能行業擔心,因為人工智能行業投入了大量資源來開發這些類型的模型。研究表明,推理模型的運行成本可能非常昂貴,但存在嚴重的缺陷,例如比某些傳統模型更傾向于產生幻覺。
評論