新聞中心

        EEPW首頁 > 智能計(jì)算 > 業(yè)界動態(tài) > 沒有授權(quán)也阻止不了,多家AI公司繞過網(wǎng)絡(luò)標(biāo)準(zhǔn)抓取出版商網(wǎng)站內(nèi)容

        沒有授權(quán)也阻止不了,多家AI公司繞過網(wǎng)絡(luò)標(biāo)準(zhǔn)抓取出版商網(wǎng)站內(nèi)容

        作者: 時間:2024-06-24 來源:IT之家 收藏

        6 月 24 日消息,據(jù)路透社上周六報(bào)道,專注于“內(nèi)容許可”領(lǐng)域的初創(chuàng)公司 TollBit 近日向新聞出版商發(fā)出警告稱,多家公司正在規(guī)避出版商用來阻止抓取內(nèi)容的常見網(wǎng)絡(luò)標(biāo)準(zhǔn),并將抓取的內(nèi)容用于訓(xùn)練生成式 系統(tǒng)。

        本文引用地址:http://www.104case.com/article/202406/460214.htm

        這一消息是在 搜索初創(chuàng)公司 Perplexity 與媒體《福布斯》之間就同一網(wǎng)絡(luò)標(biāo)準(zhǔn)公開爭執(zhí)的背景下發(fā)出的。當(dāng)前,科技和媒體公司之間正在就生成式 時代的內(nèi)容價(jià)值展開更廣泛的辯論。

        Tollbit 將自己定位為內(nèi)容匱乏的 AI 公司與愿意與他們達(dá)成重大許可協(xié)議的出版商之間的“媒人”。

        IT之家注:《福布斯》曾指責(zé) Perplexity 在 AI 生成的摘要中剽竊其報(bào)道內(nèi)容,然而前者并未標(biāo)注消息來源,也沒有獲得《福布斯》的許可。

        另外,《連線》(Wired)雜志上周也發(fā)表了一篇調(diào)查報(bào)道并指出,Perpexity 可能繞過了(新聞出版商設(shè)置的)“機(jī)器人排除協(xié)議(Robots Exclusion Protocol)”或其他阻止網(wǎng)絡(luò)爬蟲的程序。

        圖源 Pexels

        自稱代表 2000 多家美國出版商的貿(mào)易組織“新聞媒體聯(lián)盟”也對這一行為表示擔(dān)憂 ——AI 公司對出版商設(shè)置的“禁止抓取”機(jī)制或“robots.txt”等工具置若罔聞。該組織主席 Danielle Coffey 表示,“如果 AI 公司無法停止大規(guī)模抓取的話,我們就無法通過有價(jià)值的內(nèi)容獲利,也無法為記者們支付報(bào)酬。”

        Tollbit 表示,Perplexity 并不是唯一無視出版商網(wǎng)站“禁止抓取”機(jī)制的違規(guī)者。根據(jù)其分析,“大量”AI 平臺繞過了這一機(jī)制,而該機(jī)制為 AI 平臺抓取自家內(nèi)容設(shè)置了一份“白名單”—— 指示其網(wǎng)站哪些部分可以被抓取。

        “這意味著,來自多個來源(而不僅僅是一家公司)的 AI 平臺正在選擇繞過 robots.txt 協(xié)議來從網(wǎng)站中檢索內(nèi)容,”TollBit 寫道,“我們獲取的出版商日志越多,這種模式出現(xiàn)的次數(shù)就越多。”

        包括《紐約時報(bào)》在內(nèi)的一些出版商已就這些侵權(quán)行為起訴 AI 公司。其他出版商則與公司簽署了許可協(xié)議,AI 公司們也愿意為內(nèi)容付費(fèi),盡管雙方往往對材料的價(jià)值存在分歧。許多 AI 開發(fā)者認(rèn)為,他們免費(fèi)獲取內(nèi)容并未違反任何法律。




        關(guān)鍵詞: AI 人工智能

        評論


        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉
        主站蜘蛛池模板: 独山县| 怀安县| 祁阳县| 呼玛县| 额尔古纳市| 青河县| 舞阳县| 乌拉特前旗| 台山市| 马边| 石景山区| 新野县| 新郑市| 陆河县| 临高县| 大新县| 云安县| 章丘市| 仙居县| 深州市| 西乌| 华容县| 和龙市| 古交市| 平昌县| 玉环县| 弥渡县| 灵川县| 汾阳市| 始兴县| 绍兴县| 牟定县| 浦江县| 沙坪坝区| 达孜县| 密山市| 蕉岭县| 灵山县| 资中县| 拉孜县| 都江堰市|