分析發(fā)現(xiàn),“推理”人工智能模型的改進(jìn)可能會(huì)很快放緩
非營(yíng)利性人工智能研究機(jī)構(gòu)Epoch AI的一項(xiàng)分析表明,人工智能行業(yè)可能無(wú)法通過(guò)推理人工智能模型獲得巨大的性能提升。根據(jù)報(bào)告的調(diào)查結(jié)果,在一年內(nèi),推理模型的進(jìn)展可能會(huì)放緩。
本文引用地址:http://www.104case.com/article/202505/470376.htm近幾個(gè)月來(lái),OpenAI的o3等推理模型在人工智能基準(zhǔn)上取得了重大收益,特別是衡量數(shù)學(xué)和編程技能的基準(zhǔn)。這些模型可以將更多的計(jì)算應(yīng)用于問(wèn)題,這可以提高其性能,但缺點(diǎn)是它們比傳統(tǒng)模型需要更長(zhǎng)的時(shí)間來(lái)完成任務(wù)。
推理模型是通過(guò)首先在大量數(shù)據(jù)上訓(xùn)練常規(guī)模型,然后應(yīng)用一種稱(chēng)為強(qiáng)化學(xué)習(xí)的技術(shù)來(lái)開(kāi)發(fā)的,這有效地為模型提供了對(duì)其難題解決方案的“反饋”。
據(jù)Epoch稱(chēng),到目前為止,像OpenAI這樣的前沿人工智能實(shí)驗(yàn)室還沒(méi)有將大量的計(jì)算能力應(yīng)用于推理模型培訓(xùn)的強(qiáng)化學(xué)習(xí)階段。
那正在改變。OpenAI表示,它應(yīng)用的計(jì)算比其前身o1多10倍左右來(lái)訓(xùn)練o3,Epoch推測(cè),這些計(jì)算大部分都用于強(qiáng)化學(xué)習(xí)。OpenAI研究員Dan Roberts最近透露,該公司的未來(lái)計(jì)劃要求優(yōu)先使用強(qiáng)化學(xué)習(xí),以使用更多的計(jì)算能力,甚至比初始模型培訓(xùn)還要多。
但每個(gè)紀(jì)元,有多少計(jì)算可以應(yīng)用于強(qiáng)化學(xué)習(xí)仍然有一個(gè)上限。
Epoch的分析師、分析的作者Josh You解釋說(shuō),標(biāo)準(zhǔn)人工智能模型培訓(xùn)的績(jī)效收益目前每年翻兩番,而強(qiáng)化學(xué)習(xí)的績(jī)效收益每3-5個(gè)月增長(zhǎng)十倍。他繼續(xù)說(shuō),推理訓(xùn)練的進(jìn)展“到2026年可能與整體前沿相融合”。
Epoch的分析提出了一些假設(shè),并部分借鑒了人工智能公司高管的公開(kāi)評(píng)論。但它也證明,由于計(jì)算以外的原因,包括高昂的研究間接費(fèi)用,擴(kuò)展推理模型可能被證明具有挑戰(zhàn)性。
“如果研究需要持續(xù)的間接費(fèi)用,推理模型可能不會(huì)像預(yù)期的那樣擴(kuò)展,”你寫(xiě)道。“快速計(jì)算縮放可能是推理模型進(jìn)展中非常重要的因素,因此值得密切跟蹤這一點(diǎn)。”
任何表明推理模型在不久的將來(lái)可能會(huì)達(dá)到某種限制,這可能會(huì)讓人工智能行業(yè)擔(dān)心,因?yàn)槿斯ぶ悄苄袠I(yè)投入了大量資源來(lái)開(kāi)發(fā)這些類(lèi)型的模型。研究表明,推理模型的運(yùn)行成本可能非常昂貴,但存在嚴(yán)重的缺陷,例如比某些傳統(tǒng)模型更傾向于產(chǎn)生幻覺(jué)。
評(píng)論