新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 從神經(jīng)網(wǎng)絡到天體物理，沒有什么是AI做不到的

從神經(jīng)網(wǎng)絡到天體物理，沒有什么是AI做不到的

作者：時間：2019-03-21 來源：獵云網(wǎng)

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

編者按：爆發(fā)式的數(shù)據(jù)讓科學家不得不求助AI。在人類輸入最少的情況下，AI系統(tǒng)(比如人工神經(jīng)網(wǎng)絡，模仿大腦功能的計算機模擬神經(jīng)元網(wǎng)絡)可以挖掘海量數(shù)據(jù)、突出異常現(xiàn)象，并檢測出人力永遠無法發(fā)現(xiàn)的東西。

　　如今，物理學、天文學實驗所產(chǎn)生的海量信息是人類團隊難以企及的。一些實驗每天記錄萬億字節(jié)的數(shù)據(jù)，并且不斷累積增加。世界最大的射電望遠鏡項目Square Kilmeter Array預計在2020年開啟，它每年產(chǎn)生的數(shù)據(jù)量將相當于整個互聯(lián)網(wǎng)的總量。

本文引用地址：http://www.104case.com/article/201903/398700.htm

　　爆發(fā)式的數(shù)據(jù)讓科學家不得不求助AI。在人類輸入最少的情況下，AI系統(tǒng)(比如人工神經(jīng)網(wǎng)絡，模仿大腦功能的計算機模擬神經(jīng)元網(wǎng)絡)可以挖掘海量數(shù)據(jù)、突出異常現(xiàn)象，并檢測出人力永遠無法發(fā)現(xiàn)的東西。

　　計算機應用于科學研究已經(jīng)有75年歷史，人類對自然數(shù)據(jù)的觀察研究更是伴隨著人類的發(fā)展史。但是，隨著機器學習和AI的發(fā)展，科學研究的方法已經(jīng)發(fā)生徹底的革新。其中一種方法稱為生成模型(Generative Modeling)，對于觀測數(shù)據(jù)的不同解釋，它可以僅僅基于數(shù)據(jù)就辨別出最可信的理論。更重要的是，它不需要關于物理過程的預編程知識。生成模型的支持者認為它非常新穎，可以被視作研究宇宙的“第三類方式”。

　　傳統(tǒng)上，人類通過觀察來了解自然。想想十六世紀天文學家約翰尼斯·開普勒正在仔細研究另一位同時期天文學家第谷·布拉赫的行星位置圖，開普勒最終推斷出行星在橢圓軌道上運動。科學通過模擬而進步。天文學家模擬銀河系及其鄰近星系仙女座的運動，并預測它們將在幾十億年后發(fā)生碰撞。觀察和模擬都有助于科學家產(chǎn)生假說，再通過進一步的觀察來驗證這些假說。但是，生成模型既不是觀察也不是模擬。

　　天體物理學家Kevin Schawinski(供職于蘇黎世聯(lián)邦理工學院)是生成模型的積極倡導者，他說：“這是介于觀察和模擬之間的第三類方法，是解決問題的另一種方式。”

　　雖然一些科學家仍然把生成模型和其它新技術簡單地看作是傳統(tǒng)科學的補充工具。但大多數(shù)人都同意AI正在產(chǎn)生巨大的影響，它在科學研究中的作用必然會越來越大。費米實驗室的天體物理學家Brian Nord使用人工神經(jīng)網(wǎng)絡研究宇宙，他擔心人類科學家所做的任何事情都可能實現(xiàn)計算機自動化——這有點讓人不寒而栗。

　　生成模型帶來的發(fā)現(xiàn)

　　研究生時代，Schawinski就因數(shù)據(jù)驅(qū)動領域的成就而聞名。攻讀博士期間，他需要根據(jù)星系的外觀對它們進行分類。由于沒有現(xiàn)成的軟件可用，所以Galaxy Zoo眾包科學項目誕生了。從2007年開始，普通計算機用戶通過猜測記錄星系分類來幫助天文學家，服從多數(shù)原則一般可以得出正確的分類結果。這個項目無疑是成功的，只不過今時今日的AI技術使它顯得過時了。現(xiàn)在，一個有機器學習和云計算背景的優(yōu)秀科學家可以在一個下午就完成以上任務。

　　Schawinski在2016年轉向強大的生成模型工具。本質(zhì)上，在給定條件X的情況下，生成模型會詢問觀察到結果Y的可能性有多大。這種方法已被證明是非常有效且具有通用性。舉個例子，假設你提供一組人臉圖像給生成模型，并逐一標注年齡。當計算機程序梳理這些訓練數(shù)據(jù)時，會把年長者面部和皺紋增加聯(lián)系起來。最終，計算機可以根據(jù)面部判斷年齡，也就是說，它可以通過給定的面部預測其經(jīng)歷的物理變化。

　　這些人臉都不是真的。A 行和B 列的人臉都是由GAN使用真實面部搭建元素來構建的。然后，GAN結合A行臉部的基本特征(包括性別、年齡、臉形)和B列更精細的臉部特征(例如發(fā)色、眼睛顏色)，創(chuàng)造出上圖中其它的人臉圖像。

　　最著名的生成模型系統(tǒng)是“生成式對抗網(wǎng)絡(GAN)”。在充分地暴露于訓練數(shù)據(jù)之后，GAN可以修復已損壞或丟失像素的圖像，它也可以使模糊的照片變得清晰。GAN通過博弈(術語稱作“對抗”)來學習推斷丟失的信息：網(wǎng)絡的一部分(稱為生成器)生成偽數(shù)據(jù)，而第二部分(判別器)試圖對真?zhèn)螖?shù)據(jù)進行區(qū)分。隨著程序的運行，兩個部分都逐漸演化提升。對于最近出現(xiàn)的一些超現(xiàn)實的、GAN制作的“人臉”，有文章評價道：這些計算機創(chuàng)造的詭異假臉跟真人沒有分別。

　　更廣泛地說，生成模型采用數(shù)據(jù)集(通常是圖像)，并將每個數(shù)據(jù)集分解為一組基本的抽象構建模塊，科學家將其稱為數(shù)據(jù)的“隱空間”。隱空間的概念是抽象的，很難將其視覺化，粗略地類比一下，當你試圖確定人臉的性別時，想想你的大腦可能是怎么思考的，也許你會注意到發(fā)型、鼻子形狀等等，還有的判斷模式可能很難用文字表達。相似地，計算機程序也是在數(shù)據(jù)中尋找突出的特征：雖然它不知道什么是胡子，什么是性別，但如果它接受過數(shù)據(jù)集的訓練，其中一些圖像被貼上“男人”或“女人”的標簽，一些圖像被貼上“胡子”的標簽，計算機會很快推演出它們之間的聯(lián)系。

　　在與同事合著的一篇論文中，Schawinski利用生成模型研究了星系在演化過程中所經(jīng)歷的物理變化。模型創(chuàng)建了人工數(shù)據(jù)集，以此作為檢驗物理過程假設的方式。例如，恒星猝熄(恒星形成速度急劇下降)如何與星系環(huán)境密度增加相關聯(lián)。

　　關鍵問題在于：有多少關于恒星和銀河系的信息可以單獨從數(shù)據(jù)中提取出來。Schawinski說：“讓我們抹掉所有關于天體物理學固有的知識。然后僅僅利用數(shù)據(jù)本身，能在多大程度上重新認知宇宙?”

　　首先，星系圖像被縮小到隱空間，然后，Schawinski可以調(diào)整空間的一個元素，使其對應星系環(huán)境的特定變化(比如周圍的密度)。然后他可以重新生成星系，看看會有什么不同。Schawinski解釋說：“所以現(xiàn)在我有了一個假說生成機器。通過這個過程，我可以讓原本處于低密度環(huán)境中的一整束星系看起來像處于高密度環(huán)境中。”研究者發(fā)現(xiàn)，隨著星系從低密度變?yōu)楦呙芏拳h(huán)境，它們的顏色變得更紅，恒星分布更集中。這與現(xiàn)有的星系觀測結果相吻合。問題是為什么會這樣。

　　對于這個過程，有兩種可能的解釋：也許星系在高密度環(huán)境中顏色更紅，因為它們含有更多的塵埃，又或者是因為其范圍內(nèi)的恒星趨于衰退。有了生成模型，這兩個想法都可以進行測試：改變隱空間中有關塵埃和恒星形成速率的元素，然后觀察星系顏色的變化。結論很清楚，星系顏色更紅的地方是“恒星形成速率下降的地方”，而不是“塵埃發(fā)生改變的地方”。

　　通過生成模型，天體物理學家可以研究星系從宇宙的低密度區(qū)域到高密度區(qū)域是如何變化的，以及是什么物理過程導致了這些變化。

　　該方法與傳統(tǒng)的模擬有關，但存在關鍵差別。Schawinski說，模擬“本質(zhì)上是假設驅(qū)動的”，對于某種宇宙現(xiàn)象，我首先假設一個可以解釋它的物理原則，比如說我們對于暗物質(zhì)、對于恒星形成都有一套理論假設，然后對照假設運行模擬操作，接著再思考：模擬是否符合現(xiàn)實?但是生成模型則不同，某種意義上來說，它與模擬完全相反。我們什么都不知道也不想做任何假設，只是讓數(shù)據(jù)告訴我們可能會發(fā)生什么。

　　生成模型的成功應用當然不意味著天文學家要失業(yè)，但這也確實讓我們思考，天體物理學研究多大程度上可以由智能系統(tǒng)完成。Schawinski表示，這不是完全自動化的科學，但它表明我們至少能夠部分地構建工具——使科學過程自動化。

　　生成模型顯然是強大的，但它是否真正代表了一種新的科學方法仍有待商榷。David Hogg是紐約大學的宇宙學家，它認為，這仍然只是從數(shù)據(jù)中抓取模型，數(shù)個世紀以來天文學家都是這樣進行工作的，只不過如今的技術相當強大。換句話說，生成模型是一種先進的觀察加分析的方式。Hogg自己的工作也嚴重依賴AI。他使用神經(jīng)網(wǎng)絡根據(jù)恒星的光譜對它們進行分類，并使用數(shù)據(jù)驅(qū)動模型來推斷恒星的其它物理屬性。但他不認為生成模型是另類方法。他說：“只是科學家在如何使用數(shù)據(jù)方面變得更加老練了。特別是在比較數(shù)據(jù)方面比以前進步很多。但在我看來，我的工作仍處于觀察模式。”

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： AI

焦點

更多>>

技術專區(qū)

關閉

新聞中心

從神經(jīng)網(wǎng)絡到天體物理，沒有什么是AI做不到的

評論

相關推薦

技術專區(qū)