蘋果或推AI手機?論文顯示其正研究放棄“嘿Siri”,轉而使用AI大模型
近日發表的一篇論文顯示,蘋果公司的研究人員正在探索是否有可能使用人工智能來檢測用戶何時對 iPhone 等設備說話,從而消除對 Siri 等觸發詞的技術需求。
在一篇未經同行評審的預印本中,研究人員訓練了一個大型語言模型,訓練所使用的聲學數據,來自智能手機所捕獲的語音和背景噪聲,借此試圖從中尋找用戶通過語音喚醒設備的規律。
研究人員表示,該模型中的一部分是用 OpenAI 的 GPT-2 構建的,“因為它相對較小,有可能在智能手機等設備上運行”。
該論文指出,訓練模型所用的數據包括超過 129 小時的聲音數據,以及額外的文本數據,但沒有給出這些數據來自哪里。
七位作者中有六位列出了他們與蘋果的關系,其中三位的 LinkedIn 資料顯示,他們在 Siri 團隊工作。而第七位作者在該公司實習期間做了與該論文相關的工作。
該論文稱,研究結果很有希望。與純音頻或純文本模型相比,模型能夠做出更準確的預測,并且其性能會隨著模型尺寸的增大而提升。
除了探索這個研究問題,目前還不清楚蘋果是否打算取消“嘿 Siri”這個經典的語音助手觸發短語。
該公司和論文作者都沒有立即回復置評請求。
目前,Siri 可以短暫地保存少量音頻,但在聽到觸發短語之前不會開始錄制或準備回答用戶。
美國斯坦福大學“以人為本”人工智能研究院的隱私和數據政策研究員簡·金(Jen King)說,移除“嘿 Siri”觸發詞可能會增加人們對電子設備“總是在監聽”的擔憂。
此前,蘋果處理音頻數據的方式曾受到隱私倡導者的審查。2019 年,《衛報》的報道顯示,該公司的質量控制承包商在處理 Siri 數據時,經常聽到從 iPhone 收集的私人音頻,包括醫生和患者之間的敏感對話。
兩年后,該公司做出了政策改變,包括在設備上存儲更多數據,并允許用戶選擇不允許他們的錄音被用于改進 Siri。
2021 年,一場針對該公司的集體訴訟在美國加利福尼亞州提起,指控 Siri 即使在未激活的情況下也會被打開。
(來源:蘋果中國官網,圖文無關)
金表示,“嘿 Siri”提示詞對用戶來說十分重要。其在接受《麻省理工科技評論》采訪時表示,這些提示詞讓人們了解設備何時在聽,去掉這些激活詞可能意味著便利性的提升,但降低了透明度。
這項研究沒有詳細說明,觸發詞是否會被任何其他信號所取代。
她說:“一家公司是否應該強制實施這種形式的互動,我對此持質疑的態度。”
最近的一系列信號表明,蘋果計劃在其產品中加入更多的人工智能技術,該論文是最新信號之一。該公司被認為在人工智能競賽中落后于其他科技巨頭。
根據 VentureBeat 報道,該公司正在構建一個名為 MM1 的生成式人工智能模型,該模型可以處理文本和圖像,這將是該公司對 Open AI ChatGPT 和其他科技巨頭的聊天機器人的回應。
與此同時,彭博社報道稱,該公司正在與 Google 就在 iPhone 中使用該公司的人工智能模型 Gemini 展開對話。此外,《華爾街日報》還報道稱,蘋果已與百度就使用該公司的人工智能產品進行了對話。
支持:Ren


01/ 復雜分子合成新方法!科學家將純水作為光化學反應溶劑,可用于大規模流式合成和藥物修飾
02/ 光芯片領域迎新進展:科學家研發鈮酸鋰微波光芯片,兼具超寬帶處理和高精度計算
03/ 二氧化碳做輪胎!椿范立院士團隊用CO2造出丁二烯橡膠輪胎,正和業界合作用于賽車
04/ 先天性耳聾基因療法獲重大突破,復旦團隊研發耳聾基因治療藥物,讓多位耳聾患者恢復聽力
05/ 中科大團隊開發新型電解體系,成功制備高濃度甲酸,可為燃料電池提供動力
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。