盤點2018年計算機視覺領域技術突破
回顧2018年,是屬于人工智能的一年,不論是Google、Facebook、Intel、阿里巴巴等通過產業布局進入人工智能領域的互聯網企業,亦或如曠視科技Face++、極鏈科技Video++、優必選科技這樣直接以人工智能起家的原生技術企業,都將AI注入到每個角落,掀起了一輪又一輪的技術高潮。
本文引用地址:http://www.104case.com/article/201901/396390.htm因而,除了NLP研究突破接連不斷,CV領域同樣精彩紛呈,伴隨著各式各樣落地應用如此接近人們的生活,技術也變得越發成熟。本文整理了在2018年,在CV技術領域取得的最主要的一些重大技術突破。

BigGAN發布
Ian Goodfellow在2014年設計了GAN,在之后的幾年中,圍繞這個概念產生了多種多樣的應用程序。
其中,在ICLR 2019論文中出現的BigGAN,同樣是一個GAN,只不過更強大,是擁有了更聰明的課程學習技巧的GAN,由它訓練生成的圖像連它自己都分辨不出真假,因為除非拿顯微鏡看,否則將無法判斷該圖像是否有任何問題,因而,它更被譽為史上最強的圖像生成器。

在計算機圖像研究史上,BigGAN帶來的突破是劃時代的,比如在ImageNet上進行128×128分辨率的訓練后,它的IS得分能達到166.3,是之前最佳得分52.52分3倍;除了搞定128×128小圖之外,BigGAN還能直接在256×256、512×512的ImageNet數據上訓練,生成更讓人信服的樣本。
英偉達Video-to-Video Synthesis
英偉達在2018年的收獲頗豐,他們的研究焦點從標準的監督學習轉向更具挑戰性的機器學習,如半監督學習,領域適應,主動學習和生成模型等。其中,由英偉達在2018年末發布的最大成果之一便是視頻到視頻生成(Video-to-Video synthesis),它通過精心設計的發生器、鑒別器網絡以及時空對抗物鏡,合成高分辨率、照片級真實、時間一致的視頻,實現了讓AI更具物理意識,更強大,并能夠推廣到新的和看不見的更多場景。

評論