新聞中心

        EEPW首頁 > 智能計算 > 業界動態 > Google的設備上文本分類AI的準確率達到86.7%

        Google的設備上文本分類AI的準確率達到86.7%

        作者: 時間:2018-11-07 來源:網絡 收藏

          深度神經網絡 - 模仿人類大腦中神經元行為的數學函數層 - 是最先進的機器翻譯和異議識別系統的核心。它們有助于將一種語言翻譯成另一種語言并從名片中提取地址。問題是,它們經常受到智能手機,可穿戴設備和其他移動設備的硬件限制 - 特別是在內存和計算方面。

        本文引用地址:http://www.104case.com/article/201811/393953.htm

          不過,對于高性能的離線算法還有希望。在本周于比利時布魯塞爾舉行的自然語言處理經驗方法會議上發表的一篇論文中,谷歌研究人員描述了離線的設備上系統 - 自我管理神經網絡(SGNN) - 它們實現了空中狀態導致特定的對話框相關任務。

          “在設備上開發和部署深度神經網絡模型的主要挑戰是:(1)微小的內存占用,(2)推理延遲和(3)與高性能計算系統(如CPU,GPU)相比顯著低的計算容量和云上的TPU,“該團隊寫道?!癧SGGNs]允許我們在設備上以非??斓乃俣扔嬎銈魅胛谋镜耐队埃驗槲覀儾恍枰鎯魅氲奈谋竞妥智度??!?/p>

          正如該論文的作者所解釋的那樣,有許多方法可以設計一個輕量級的設備上文本分類模型,比如將模型與圖形學習相結合,這就是谷歌智能回復中使用的模型, 并自動生成簡短的電子郵件回復。但大多數要么不能很好地擴展,要么導致大型模型。

          相比之下,SGGN采用了局部敏感散列(LSH)的修改版本,這種技術通過散列或映射輸入項來減少數據中的維數,以便類似的項以高概率映射到相同的“桶”。顧名思義,它是自我控制的 - 它可以通過動態地將輸入轉換為具有投影函數的低維表示來學習模型而無需初始化,加載或存儲任何特征。此外,在對數據進行訓練時,它學會選擇并應用對給定任務更具預測性的特定操作。

          該團隊寫道,這減少了數百萬個獨特單詞的輸入維度,縮短了固定長度的短序列,并且無需存儲文本和單詞嵌入(代表單詞和短語的向量)。在實驗中,與存儲要求超過數十萬維的字嵌入方法相比,SGGN使用固定的1120維向量,而不管輸入數據的詞匯表或特征大小。

          研究人員使用兩個對話行為基準數據集來評估SGGN:交換機對話法案語料庫(SWDA),其中包含兩個發言人和42個對話行為,以及ICSI會議記錄器對話法案語料庫,一個多方會議的對話語料庫。

          沒有預處理,標記,解析或預訓練嵌入,SGGN的表現優于基線系統12%至35%。通過SWDA和MRDA數據集,它實現了83.1%的準確率和86.7%的準確度 - 高于基準 - 針對尖端卷積神經網絡和遞歸神經網絡 - 并且日本的準確度達到73%,接近最佳性能系統。

          在未來的工作中,研究人員計劃調查SGGN在其他自然語言任務中的使用。

          “我們的研究還表明,與更復雜的神經網絡架構相比,所提出的方法對于這種自然語言任務非常有效,例如深CNN和RNN變體,”研究人員寫道?!拔覀兿嘈艍嚎s技術,如與非線性函數結合的局部敏感投影,可有效捕獲對文本分類應用有用的低維語義文本表示?!?/p>

          近年來,邊緣人工智能系統取得了突飛猛進的發展。

          9月,都柏林創業公司 Voysis 宣布推出基于WaveNet的技術,該技術不僅可以在線下運行,還可以在智能手機和其他帶有移動處理器的設備上運行。8月,的研究人員開發了具有記錄面部識別和物體檢測速度的離線。5月份,高通聲稱其設備上的語音識別系統準確率達到了95%。



        關鍵詞: Google AI

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 佛山市| 龙井市| 青浦区| 遵义县| 华容县| 龙南县| 岗巴县| 禄劝| 行唐县| 石首市| 沅陵县| 洪江市| 泽普县| 莫力| 洛扎县| 昌平区| 武功县| 永仁县| 赤壁市| 台前县| 嘉祥县| 高阳县| 玉门市| 沂南县| 晋州市| 江永县| 阿克苏市| 贵定县| 迁安市| 长岛县| 新晃| 阜城县| 建阳市| 贵定县| 盘锦市| 滨州市| 新兴县| 天峨县| 什邡市| 盐源县| 海南省|