新聞中心

        EEPW首頁 > 業(yè)界動態(tài) > 揭秘阿里打假AI大腦:數(shù)據(jù)總量186個國家圖書館,1 AI=50000人類,獲創(chuàng)新大獎

        揭秘阿里打假AI大腦:數(shù)據(jù)總量186個國家圖書館,1 AI=50000人類,獲創(chuàng)新大獎

        作者:李根 時間:2019-08-15 來源:量子位 收藏

        另一項體現(xiàn)場景挑戰(zhàn)和技術(shù)水平的是安全場景特有的對抗性問題。

        本文引用地址:http://www.104case.com/article/201908/403730.htm

        售假賣家往往會通過改變“標(biāo)題”和“描述”以躲避傳統(tǒng)規(guī)則和模型的識別,但這并非完全無跡可尋。

        混淆語言是一種被用于在對抗交流場景下實現(xiàn)規(guī)避檢測的技術(shù)手段。

        對抗交流場景包括敏感信息傳播、負(fù)面情感表達(dá)、秘密行動策劃以及違法交易等?;煜Z言的實現(xiàn)方式通常是在原始文本里進(jìn)行變異詞的替換。

        監(jiān)管機(jī)構(gòu)在識別此類文本時,需要根據(jù)一組關(guān)鍵詞進(jìn)行掃描過濾。盡管引入了一些語義擴(kuò)展技術(shù),但是由于文本中的歧義性以及變異的無邊界,導(dǎo)致識別此類文本的準(zhǔn)確率和召回率都十分有限。

        在WWW 2019上發(fā)表的論文,集中披露了該方向上的核心進(jìn)展。

        該論文的主要思路是將混淆語言識別轉(zhuǎn)化為一個文本匹配任務(wù),即每條待檢測信息,是否匹配一個掃描關(guān)鍵詞,并且同時整合了文本信息的文本表示和視覺表示。

        這里的視覺表示指的是文字自身的視覺效果,而不是信息中的圖片,主要是因為在進(jìn)行文本變異混淆時,經(jīng)常會出用一些看起來像的字符進(jìn)行替換,這種變異導(dǎo)致了混淆后的內(nèi)容在語義上可能已經(jīng)跟原始內(nèi)容沒有任何關(guān)聯(lián),但是從視覺效果上卻可以產(chǎn)生聯(lián)系。

        的模型利用BiLSTM對文本特征進(jìn)行表示,通過基于模板匹配的方式對視覺特征進(jìn)行表示,通過多模態(tài)的整合,可以比傳統(tǒng)方法表現(xiàn)出更高的準(zhǔn)確率和召回率。

        另外就是結(jié)合圖像視頻和自然語言處理的多模態(tài)任務(wù)解決方法。

        論文發(fā)表于ICASSP 2019,其中列舉的任務(wù)也頗有意思:通過一段文本描述,自動地編輯源圖像使其符合給出的文本描述,從而簡化圖像編輯流程,是一種基于文本的圖像編輯方法。電商網(wǎng)站中的商品本身就是文字與圖片的混合內(nèi)容,因此可以期待這項技術(shù)可以加強(qiáng)對商品內(nèi)涵的理解,更有助于發(fā)現(xiàn)假、劣商品。

        感興趣的盆友可移步傳送門:http://arxiv.org/abs/1903.07499

        最后再介紹一項業(yè)內(nèi)sexy,且對打假貢獻(xiàn)不小的技術(shù)進(jìn)展:小樣本學(xué)習(xí)。

        假貨問題(安全問題)中最頭疼的點,莫過于對新出現(xiàn)的風(fēng)險缺乏足夠訓(xùn)練的樣本,導(dǎo)致諸多優(yōu)秀機(jī)器學(xué)習(xí)算法望而卻步。

        在CVPR 2018上,安全圖靈實驗室團(tuán)隊,圍繞業(yè)內(nèi)前沿的“零樣本視頻檢索”挑戰(zhàn),給出解決方案。

        視頻檢索,通常要在文本和視頻之間提取跨模態(tài)相關(guān)性,需要基于內(nèi)容匹配。

        但阿里的方法之不同,在于提出了一種內(nèi)容無關(guān)的方法,通過雙重深度編碼網(wǎng)絡(luò)來將視頻和文本編碼為各自模態(tài)的密集式表征。

        并且雙重編碼概念簡單、切實有效,還可以端到端學(xué)習(xí)。

        在三個基準(zhǔn)數(shù)據(jù)集MSR-VTT、TRECVID2016、2017上實驗后,證明阿里提出的零樣本視頻檢索方法已達(dá)到目前最佳。

        論文傳送門:http://arxiv.org/abs/1809.06181

        就在最近的機(jī)器學(xué)習(xí)頂會IJC-2019上,阿里安全成功舉辦了第一屆AAAC競賽(Alibaba Adversarial Challenge)以及AIBS研討會(Artificial Intelligence for Business Security),旨在探索面臨對抗攻擊時,如何解決AI模型的安全性問題。競賽和會議吸引了來自24個國家和地區(qū)的2000多支隊伍參與,過程中涌現(xiàn)出不少新思路和新方法,極大地推動了這一領(lǐng)域的發(fā)展。

        “AI發(fā)展趨勢是一定的,但AI應(yīng)用來解決安全問題時并不能生搬硬套,需要根據(jù)實際場景進(jìn)行AI的技術(shù)升級,”薛暉在今年年初的公開采訪中就指出,安全會成為未來AI開發(fā)的最大挑戰(zhàn), “安全AI”會成為未來網(wǎng)絡(luò)安全問題的新解法,也將在2019年迎來爆發(fā)期。

        如今阿里“知產(chǎn)保護(hù)科技大腦”的成功實踐不斷得到行業(yè)乃至全球的認(rèn)可,正印證了這一斷言。

        阿里打假AI,用技術(shù)解決社會問題

        打假AI大腦成功,幕后原因并不難分析。這也會是阿里各項業(yè)務(wù)在AI時代里還會更繁榮的保證。

        打假作為綜合因素導(dǎo)致的社會問題,利用AI等技術(shù)實現(xiàn)其實并非易事,沒有對比,可能就難看出誠心誠意。

        比如美國電商巨頭亞馬遜,其實也在今年新推出一項名為“Project Zero”的打假防偽項目,通過與品牌方合作,打擊消除假貨。

        但在具體技術(shù)機(jī)制上,就目前披露情況而言,相較阿里的打假AI大腦,技術(shù)上稍遜一籌。

        因為亞馬遜的打假AI,還需要合作品牌提供logo、商標(biāo)和其他信息,甚至讓品牌方利用工具標(biāo)記并禁止仿冒品。

        仍更多依賴監(jiān)督學(xué)習(xí)的方式,自動化程度和AI通用能力還相對不足,對于阿里無監(jiān)督、小數(shù)據(jù)學(xué)習(xí)和系統(tǒng)性大腦,技術(shù)能力和挑戰(zhàn),高下立判。

        所以也難怪美國眾議院司法委員會副主席道格·柯林斯在調(diào)研了亞馬遜、eBay、阿里在內(nèi)的電商平臺后,給出評價:“阿里巴巴的打假政策和項目比任何美國同行都有效得多?!?/p>

        阿里之道の一以貫之

        最后,阿里的做事方式,依然值得關(guān)注。

        宏觀層面來看,知產(chǎn)保護(hù)科技大腦,依然是又一次阿里式創(chuàng)新的成功。

        打假難題,源頭在社會發(fā)展階段和人性劣根處。面臨的挑戰(zhàn),跟電商、支付、物流、計算和自主芯片,本質(zhì)相同,困難無差。

        但阿里之道一以貫之,為打假而生的AI大腦系統(tǒng),依然是淘寶天貓、支付寶、阿里云,菜鳥和平頭哥模式的延續(xù):

        技術(shù)驅(qū)動,打造系統(tǒng)平臺,從根本上解決問題。而且俠之大者,未來也會兼濟(jì)天下,賦能各行各業(yè)甚至各國,能力所至,皆受其益。

        會有那么一天,天下再無假貨嗎?夢想或許還是可以有的。

        畢竟 AI can do,Ali is doing……


        上一頁 1 2 下一頁

        關(guān)鍵詞: 阿里 AI

        評論


        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉
        主站蜘蛛池模板: 蒙城县| 会同县| 余干县| 榆中县| 上林县| 通渭县| 平乡县| 渝中区| 清新县| 芦溪县| 西安市| 松江区| 龙江县| 德保县| 改则县| 唐海县| 资兴市| 德化县| 崇义县| 缙云县| 瓦房店市| 汝南县| 开鲁县| 措勤县| 靖西县| 宜丰县| 鸡西市| 江安县| 榆树市| 株洲市| 宝应县| 普格县| 阜新市| 紫金县| 贵德县| 乌鲁木齐市| 磴口县| 淳安县| 郧西县| 定南县| 桦南县|