新聞中心

        EEPW首頁 > 智能計算 > 業界動態 > YouTube成AI訓練新寵? OpenAI操作手法曝光

        YouTube成AI訓練新寵? OpenAI操作手法曝光

        作者: 時間:2024-04-08 來源:工商時報 收藏

        以聊天機器人ChatGPT一炮而紅的人工智能公司Open,去年發布功能更強大的GPT-4,成為領域的衡量標竿。而這樣快速的進步或許靠的正是影片的「幫忙」。據《紐約時報》報導,Open利用AI版權法的模糊地帶,轉錄了超過100萬小時的影片,用于訓練其先進大型語言模型GPT-4。

        本文引用地址:http://www.104case.com/article/202404/457277.htm

        是網絡上最大且最豐富的圖像、音頻與文字記錄來源。在AI技術迅速發展之際,數據對推動AI模型的進步至關重要,各相關企業對訓練數據的需求更為迫切。YouTube因此成為科技公司鎖定的目標。

        據《紐約時報》報導,在2021年底就面臨了訓練數據短缺的難題。為了開發最新的人工智能系統,已耗盡網絡上所有有信譽的英語文字庫,然而為了訓練其技術的下一個版本,顯然還需要更多的數據。

        為了克服數據短缺的難題,的研究人員開發出一款名為「Whisper」的語音識別工具,將超過100萬小時的YouTube影片內容轉化為文字,用于訓練其先進的大型語言模型GPT-4。

        《紐約時報》報導中指出,其實OpenAI的部分員工也討論過這個做法可能違反YouTube 的規則??墒窍⑷耸勘硎?,盡管了解這樣做在法律層面有問題,但OpenAI 團隊最終仍轉錄了超過100萬小時的YouTube 影片,而這個團隊中還包括了OpenAI總裁Greg Brockman,他甚至親自幫忙收集這些影片。

        可是對于旗下的YouTube被OpenAI當作訓練工具,Google并未出面制止,原因似乎與Google自身也同樣藉由YouTube影片內容訓練其人工智能模型有關。

        YouTube執行長Neal Mohan日前曾在受訪時表示,他沒有直接證據能夠證明OpenAI確實使用了YouTube的影片來訓練其文字生成影片AI工具Sora,但同時也強調,如果OpenAI真的使用了,那就明顯違反了YouTube平臺的使用條款。

        但《紐約時報》指出,為了在AI競賽中搶先,搜尋推動技術所需的數字數據已成為重要課題,而為了取得這些數據,包括OpenAI、Google與臉書母公司 Meta 在內的科技公司紛紛選擇走快捷方式,無視公司政策,甚至還討論如何扭曲法規限制。



        關鍵詞: YouTube AI OpenAI

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 威海市| 杨浦区| 安阳县| 衡山县| 河曲县| 白山市| 长沙县| 墨玉县| 安仁县| 蓝田县| 湖口县| 南康市| 平江县| 九寨沟县| 大埔区| 彝良县| 陆良县| 攀枝花市| 秭归县| 杨浦区| 西和县| 大冶市| 牙克石市| 敦煌市| 云和县| 永仁县| 浦东新区| 谢通门县| 巩义市| 宣威市| 津南区| 休宁县| 拉萨市| 龙游县| 天门市| 丹江口市| 甘孜县| 车致| 庆安县| 固安县| 宁晋县|