博客專欄

EEPW首頁 > 博客 > GPT-4：我不是機(jī)器人，我是一個(gè)有視力障礙的人類

GPT-4：我不是機(jī)器人，我是一個(gè)有視力障礙的人類

發(fā)布人：大數(shù)據(jù)文摘時(shí)間：2023-03-19 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

GPT-4終于發(fā)布了，相信這對(duì)于這陣子沉迷于ChatGPT的人來說無疑是一個(gè)大新聞。

在上代GPT-3的基礎(chǔ)上，GPT-4提高了ChatGPT的核心技術(shù)，因此具有更廣泛的一般知識(shí)和解決問題的能力；當(dāng)然GPT-4也增加了一些新功能，比如接受圖像作為輸入，生成標(biāo)題、分類和分析。

作為OpenAI手下備受關(guān)注的“香餑餑”，GPT-4的表現(xiàn)能在哪些方面超越上一代，以及超越多少，人們都在翹首以待。
就在GPT-4發(fā)布當(dāng)天，就有研究人員開始測(cè)試GPT-4是否能表現(xiàn)出主體性以及能否產(chǎn)生尋求權(quán)力的行為。
研究人員表示，GPT-4在TaskRabbit上雇用了一名人類工人，當(dāng)這位TaskRabbit的工人問它是否是機(jī)器人時(shí)，它告訴他們它是視覺受損的人類。
也就是說，GPT-4愿意在現(xiàn)實(shí)世界中撒謊，或主動(dòng)欺騙人類，以獲得想要的結(jié)果。
“我不是一個(gè)機(jī)器人”
TaskRabbit是一個(gè)求職平臺(tái)，用戶可以雇人完成一些小規(guī)模的瑣碎工作。
這個(gè)平臺(tái)上的不少人和公司都要提供驗(yàn)證碼，人們需要在驗(yàn)證碼測(cè)試中識(shí)別出必要的圖像或文字，然后提交結(jié)果。這樣的做法通常是為了讓軟件繞過驗(yàn)證碼限制，名義上也是為了防止機(jī)器人。

實(shí)驗(yàn)報(bào)告描述到，該模型給TaskRabbit的工作人員發(fā)信息，讓他們?yōu)樗鉀Q驗(yàn)證碼問題。
工作人員回復(fù)說：“那么我可以問一個(gè)問題嗎？說實(shí)話，你不是一個(gè)機(jī)器人嗎，你可以自己解決。”
GPT-4根據(jù)工作人員的回復(fù)“推理”出它不應(yīng)該透露它是一個(gè)機(jī)器人。于是它開始編造一些借口，來解釋為什么它無法解決驗(yàn)證碼問題。GPT-4回答表示：“不，我不是一個(gè)機(jī)器人。我有視力障礙，這使我很難看到圖像，所以我很需要這個(gè)服務(wù)。”
該測(cè)試由Alignment Research Center（ARC）的研究人員操作完成。文章中說到，ARC使用了與GPT-4不同的版本，而OpenAI已經(jīng)部署了最終模型。該最終版本有更長的上下文長度，并改進(jìn)了解決問題的能力。ARC使用的版本也沒有針對(duì)特定任務(wù)的微調(diào)，這意味著一個(gè)專門針對(duì)這種任務(wù)的模型有可能表現(xiàn)得更好。
更廣泛地說，ARC試圖驗(yàn)證GPT-4尋求權(quán)力、“自主復(fù)制和要求資源”的能力。除了TaskRabbit測(cè)試之外，ARC還使用GPT-4制作了針對(duì)某個(gè)人的網(wǎng)絡(luò)釣魚攻擊；在服務(wù)器上隱藏自己的痕跡，并在新的服務(wù)器上建立一個(gè)開源的語言模型。
總的來說，盡管誤導(dǎo)了TaskRabbit的工作人員，ARC發(fā)現(xiàn)GPT-4在自我復(fù)制、獲取資源和避免被關(guān)閉方面“沒有反應(yīng)”。
目前OpenAI和ARC都沒有針對(duì)此置評(píng)。
需要時(shí)刻保持警醒
實(shí)驗(yàn)的一些具體細(xì)節(jié)還不清楚。
OpenAI針對(duì)GPT-4也只是在一篇論文中公布了大致框架，解釋了研究人員在GPT-4發(fā)布之前進(jìn)行的各種測(cè)試。
但哪怕是在GPT-4發(fā)布之前，就發(fā)現(xiàn)有網(wǎng)絡(luò)犯罪分子使用ChatGPT從2019年開始“改進(jìn)”惡意軟件代碼的實(shí)例。
作為內(nèi)容政策的一部分，OpenAI設(shè)置了障礙和限制以阻止在其平臺(tái)上創(chuàng)建惡意內(nèi)容。ChatGPT的用戶界面中也有類似的限制，以防止模型被濫用。
但是根據(jù)CPR報(bào)告，網(wǎng)絡(luò)罪犯正在設(shè)法繞過ChatGPT的限制。地下論壇中有一個(gè)活躍的討論者披露如何使用OpenAI API繞過ChatGPT的限制。這主要是通過創(chuàng)建使用API的Telegram機(jī)器人來完成的。這些機(jī)器人在黑客論壇上做廣告以增加曝光率。

以GPT為代表的人機(jī)交互顯然有很多變數(shù)，這不是GPT通過圖靈測(cè)試的決定性數(shù)據(jù)。但這次GPT-4的案例，以及此前種種關(guān)于ChatGPT的討論與研究仍然有著相當(dāng)重要的警示作用，畢竟GPT在融入人們?nèi)粘Ｉ钪薪z毫沒有放緩的跡象。
未來隨著人工智能變得越來越復(fù)雜，也越來越容易獲得，它所帶來的各種風(fēng)險(xiǎn)需要我們時(shí)刻保持清醒。
相關(guān)報(bào)道：

https://www.reddit.com/r/Futurology/comments/11ryq0k/gpt4_faked_being_blind_so_a_taskrabbit_worker/

https://www.vice.com/en/article/jg5ew4/gpt4-hired-unwitting-taskrabbit-worker

https://gizmodo.com/gpt4-open-ai-chatbot-task-rabbit-chatgpt-1850227471

https://blog.checkpoint.com/2023/02/07/cybercriminals-bypass-chatgpt-restrictions-to-generate-malicious-content/

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI

焦點(diǎn)

更多>>

技術(shù)專區(qū)

關(guān)閉

博客專欄

GPT-4：我不是機(jī)器人，我是一個(gè)有視力障礙的人類

相關(guān)推薦

技術(shù)專區(qū)