博客專欄

        EEPW首頁 > 博客 > AAAI 2022|AI頂會論文究竟關注什么?(1)

        AAAI 2022|AI頂會論文究竟關注什么?(1)

        發布人:MSRAsia 時間:2022-02-19 來源:工程師 發布文章

        編者按:AAAI 是由美國人工智能協會(Association for the Advance of Artificial Intelligence)主辦的人工智能領域頂級學術會議之一。今年的AAAI 大會將于2月22日-3月1日舉辦,微軟亞洲研究院共有十余篇論文入選,涵蓋概念漂移、平面布局自動生成、假新聞檢測、視頻分割、跨語言預訓練、文本摘要、注意力機制、連續深度神經網絡、領域泛化、在線影響力最大化等等人工智能的多個領域。今天,我們為大家精選了其中的12篇進行分享,并配有此前的論文分享直播視頻,希望可以幫助大家更深入地了解人工智能領域的前沿進展!



        01

        基于數據分布生成的可預測概念漂移適應
        圖片論文鏈接:https://arxiv.org/abs/2201.04038代碼鏈接:https://github.com/microsoft/qlib/tree/main/examples/benchmarks_dynamic/DDG-DA
        在時序數據中,由于環境的不穩定性,數據分布常常會隨時間變化,且這種變化通常被認為是難以預測的。這種現象被稱為概念漂移(Concept Drift),它會導致在歷史數據上訓練的模型在概念漂移后性能下降。為了應對這一問題,此前的工作會檢測概念漂移是否發生,然后調整模型以適應最近的數據分布。但是在很多實際場景中,環境的變化是有規律可預測的,即可預測的概念漂移(Predictable Concept Drift)。因此,可以對概念漂移的未來趨勢進行建模,而不僅僅讓模型適應最近的數據分布。
        微軟亞洲研究院的研究員們提出了一種新方法 DDG-DA 來預測數據分布未來的變化,然后利用預測的數據分布生成新的訓練數據來學習模型以適應概念漂移,最終提升模型性能。
        圖片圖1:DDG-DA 學習如何生成數據來最小化歷史數據分布和未來數據分布的差異 
        具體來說,如圖1所示,在時序數據中樣本隨時間產生,算法可以利用當前時刻已經產生的歷史樣本學習或調整模型用于未來一段時間的預測。由于歷史數據的分布和未來數據分布存在差異,這會影響所學模型的預測性能,DDG-DA 則致力于縮小這種分布差距。DDG-DA 會輸出歷史數據的采樣權重,基于該權重重新采樣生成數據集,該數據集的分布會作為未來一段時間分布的預測。同時,研究員們還設計了一個和 KL-divergence 等價的分布距離函數來計算預測的分布和未來一段時間實際分布的距離。該距離函數具有可導的性質,因此可以利用它高效地學習 DDG-DA 的參數來最小化它預測的分布誤差。在學習階段,DDG-DA 先在歷史時序數據上學習如何重采樣數據;在預測階段,DDG-DA 會定期通過重采樣歷史數據生成訓練數據集,在 DDG-DA 生成的數據集上訓練的模型將能更好地適應未來變化的數據分布/概念漂移。 
        如表1,研究員們在股價、電力負荷和日照輻照度三個真實場景預測任務和多個模型上進行了實驗驗證并且性能得到了顯著提升,在同類方法中 DDG-DA 也取得了最佳性能。
        圖片表1:DDG-DA 和同類方法在不同場景下的對比

        02

        平面布局的層次化生成式建模
        圖片論文鏈接:https://www.microsoft.com/en-us/research/publication/coarse-to-fine-generative-modeling-for-graphic-layouts/ 
        平面布局(graphic layout)在工作和生活中隨處可見,如海報的布局、文檔的布局、移動應用用戶界面的布局等。設計一個美觀的平面布局不僅需要過硬的專業知識而且需要花費大量的精力。為了輔助平面布局的設計,平面布局的自動生成(layout generation),即預測布局中各個元素的位置和大小,逐漸受到越來越多的關注。 
        現有的大多數模型會將平面布局抽象成一系列的元素,并直接預測每個元素的位置和大小。本文提出將平面布局切割為不同的“區域”(region),其中每個區域都可以看作是一個簡單的布局且比整體布局包含更少的元素,并基于此設計了一種層次化的模型。 
        具體來說,研究員們將 VAE 中的****分解為兩個步驟:第一個步驟為預測區域。由于平面布局中沒有顯式的包含區域的劃分,本文設計了一種基于網格線的方法來抽取此步驟中的監督信息。第二個步驟為基于生成的區域,預測區域中每個元素的具體位置和大小。為了使模型能夠將區域中元素的預測問題當作一個簡單的布局生成問題,此步驟中的所有位置被轉成了對于區域的相對位置。

        圖片圖2:模型架構
        大量的定性和定量實驗證明,本文提出的方法優于現有方法,其優勢在復雜布局生成上尤為突出。表2比較了不同模型的 FID 值,圖3則比較了在不同復雜度的布局上各個模型的效果。更多定量和定性結果請參考論文。
        圖片表2:模型 FID 值比較
        圖片圖3:不同復雜度的布局上模型效果比較

        03

        基于推理的假新聞檢測
        圖片論文鏈接:https://arxiv.org/abs/2110.15064

        目前假新聞檢測方法以數據驅動的方式進行預測,充分證明了利用大數據進行假新聞檢測的有效性。然而,現在仍缺少從推理的角度來做假新聞檢測的研究。在心理學中,推理能力是指有意識地運用邏輯探索真理的能力,通常被認為是一種人類獨有的能力。這種推理能力對提高假新聞檢測的可解釋性和準確性至關重要。比如,如果能讓模型學會像人一樣有邏輯地把微小的線索組織起來(圖4),就能給假新聞檢測方法帶來強大的細粒度推理能力,從而提升準確性。
        圖片圖4:判斷新聞真假常常需要精細推理的能力。雖然圖中四組證據看上去眾說紛紜,但人類可以通過諸如 "property" 等微妙線索將它們在邏輯上聯系起來,從而對文章得出更可信的結論。

        圖片

        圖5:推理框架 FinerFact
        在本文中,微軟亞洲研究院的研究員們提出了一個通用的推理框架 FinerFact,用于對假新聞檢測進行細粒度推理(圖5)。FinerFact 遵循人類的信息處理模式,能夠更好地反映人類的邏輯推理過程,增強了可解釋性。同時,FinerFact 引入了一種基于 Mutual-Reinforcement 的方法來將線索進行排序,這使研究員們能夠更好地了解哪些類型的證據對識別假新聞更重要,并為融入人類的知識經驗提供基礎。最后,FinerFact 引入了一個雙通道的 Kernel Graph Network 建模不同類型線索之間的細微差異與影響。

        圖片

        表3:FinerFact 在 PolitiFact 和 GossipCop 數據集上的表現 
        大量實驗表明,FinerFact 優于目前最先進的方法并能提供較強的可解釋性(如表3所示)。除了提高準確性之外,FinerFact 還使人類能夠理解其推理過程中的大部分內容。在 Case Study 中,FinerFact 不僅成功地識別新聞為假,而且對重要的證據、細微線索以及每個觀點的預測分數都進行了詳細解釋(圖6)。
        圖片圖6:可視化 FinerFact 的推理過程:(a)Mutual Reinforcement Graph 中的 keyword 層,每個 keyword 的顯著性表示為 keyword 的大小;(b) 在 Claim-Evidence Graph 進行細粒度推理。每種顏色表示新聞證據中的一個主題。


        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: AI

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 宜良县| 晋中市| 平谷区| 会昌县| 静乐县| 辽阳市| 新晃| 西林县| 海宁市| 宝坻区| 溧阳市| 商丘市| 华池县| 三河市| 滦平县| 郑州市| 永修县| 长葛市| 当阳市| 登封市| 图们市| 鹤山市| 泸定县| 赣州市| 桂林市| 万宁市| 金溪县| 交口县| 林西县| 色达县| 德庆县| 浦东新区| 建昌县| 巴中市| 镇赉县| 许昌县| 抚宁县| 临朐县| 大姚县| 陇南市| 建湖县|