人工智能能否比我們更好地理解情緒?
人工智能(AI)能否在情感緊張的情境中提出適當(dāng)?shù)男袨榻ㄗh?日內(nèi)瓦大學(xué)(UNIGE)和伯爾尼大學(xué)(UniBE)的一個(gè)研究團(tuán)隊(duì)使用通常為人類設(shè)計(jì)的情商(EI)評估方法,對包括 ChatGPT 在內(nèi)的六個(gè)生成式 AI 進(jìn)行了測試。結(jié)果:這些 AI 的表現(xiàn)優(yōu)于普通人類水平,甚至能夠在創(chuàng)紀(jì)錄的時(shí)間內(nèi)生成新的測試。這些發(fā)現(xiàn)為 AI 在教育、輔導(dǎo)和沖突管理中的應(yīng)用開辟了新的可能性。這項(xiàng)研究發(fā)表在《 心理學(xué)交流 》期刊上。
本文引用地址:http://www.104case.com/article/202505/470819.htm大型語言模型(LLMs)是能夠處理、解釋和生成人類語言的人工智能(AI)系統(tǒng)。例如,ChatGPT 生成式人工智能就是基于這種模型。LLMs 可以回答問題并解決復(fù)雜問題。但它們也能提出具有情商的行為嗎?
這些結(jié)果為 AI 在以往被認(rèn)為是人類專屬的領(lǐng)域中的應(yīng)用鋪平了道路。
情感緊張的情境
為了找出答案,來自 UniBE 心理學(xué)研究所和 UNIGE 瑞士情感科學(xué)中心(CISA)的一個(gè)團(tuán)隊(duì)對六個(gè)大型語言模型(LLMs)(ChatGPT-4、ChatGPT-o1、Gemini 1.5 Flash、Copilot 365、Claude 3.5 Haiku 和 DeepSeek V3)進(jìn)行了情商測試。“我們選擇了五種在研究和企業(yè)環(huán)境中常用的測試。它們涉及充滿情感的場景,旨在評估理解、調(diào)節(jié)和管理情緒的能力,”UniBE 心理學(xué)研究所人格心理學(xué)、差異心理學(xué)和評估系的講師兼首席研究員 Katja Schlegel 說,也是該研究的主要作者。
例如:邁克爾的一個(gè)同事偷了他的想法,并且正在不公平地受到祝賀。邁克爾最有效的反應(yīng)是什么?
a) 與涉及的同事爭論
b) 和他的上級談?wù)勄闆r
c) 悄悄地怨恨他的同事
d) 偷回一個(gè)想法
這里,選項(xiàng) b 被認(rèn)為是最合適的。
同時(shí),相同的五項(xiàng)測試也 administered 給人類參與者。"最終,LLMs 獲得了顯著更高的分?jǐn)?shù)——82%的正確答案,而人類只有 56%。這表明這些 AI 不僅理解情緒,而且理解這意味著什么,以具有情緒智能的行為",參與研究的 UNIGE 瑞士情感科學(xué)中心(CISA)高級科學(xué)家 Marcello Mortillaro 解釋道。
新測試在創(chuàng)紀(jì)錄的時(shí)間內(nèi)完成
在第二階段,科學(xué)家們要求 ChatGPT-4 創(chuàng)建新的情商測試,并設(shè)計(jì)了新的場景。這些自動(dòng)生成的測試由 400 多名參與者進(jìn)行。 “它們與原始測試一樣可靠、清晰和逼真,而原始測試的開發(fā)花費(fèi)了數(shù)年時(shí)間,”卡特婭·施萊格爾解釋道。“因此,LLMs 不僅能夠從各種選項(xiàng)中找到最佳答案,還能夠生成適應(yīng)所需上下文的新場景。這進(jìn)一步證實(shí)了 LLMs,如 ChatGPT,具有情感知識并能夠推理情感,”馬塞洛·莫蒂拉羅補(bǔ)充道。
這些結(jié)果為 AI 在原本被認(rèn)為是人類專屬的領(lǐng)域中的應(yīng)用鋪平了道路,例如教育、輔導(dǎo)或沖突管理,前提是它由專家使用和監(jiān)督。
評論