博客專欄

        EEPW首頁 > 博客 > 你真的了解計算生物學和AI for Science嗎?

        你真的了解計算生物學和AI for Science嗎?

        發布人:MSRAsia 時間:2022-03-17 來源:工程師 發布文章

        編者按:近年來,計算生物學無疑是人工智能領域的一大熱門話題。但,計算生物學究竟是什么?目前進展如何?未來又蘊藏了怎樣的機遇?


        近期,在量子位對撞派推出的“計算生物學”專題直播中,微軟亞洲研究院副院長劉鐵巖、首席研究員邵斌和主管研究員王童介紹了微軟亞洲研究院計算生物學領域的最新研究,并對未來 AI for Science 的發展和融合進行了分享。 
        回放視頻以及精華版文字內容如下,趕快一鍵收藏吧!



        Q1:AlphaFold2的最大意義是什么?




        A1:這個看似突破性的進展,其實是技術演進的必然結果。 


        此外,如果我們換個視角來看待這個問題,蛋白質結構預測僅僅是計算生物學這個大門類里面一個相對來說定義得比較清晰(well-defined)的問題。還有很多比蛋白質結構預測更加復雜也更有挑戰性的問題,等著我們用人工智能的手段去推進。




        Q2:我們認為應該如何去定義計算生物學這一個學科,它里面又會有哪些細分的領域和維度呢? 




        A2:研究對象的角度,有宏觀的,也有微觀的。從微觀的角度,可以小到一個蛋白、DNA 或者是一個單細胞。從宏觀的角度,可以大到人類或者說生物體的組織、器官、個體甚至是群體。


        研究手段來講,既有傳統的生物實驗,也有包括計算手段在內的數學建模、數值仿真、數據分析或者是機器學習。 


        應用門類來講,幾乎和我們平時生活或者科學發展的方方面面都有關系,它既有在基礎科學方面的潛力,也在制****診療方面有著巨大價值。




        Q3:2021年,微軟亞洲研究院首次針對新冠病毒中的 NTD 提出了對應的楔型模型,并鑒定了潛在的****物靶點。能否介紹一下這項工作是怎么基于計算生物學完成的呢?




        A3:之前科學家們發現,新冠感染人體的物質叫 S 蛋白。我們可以把它想象成一個英文字母 Y,有兩個枝杈,還有一個中軸。S 蛋白的中軸會固定在病毒的表面,而伸出的這兩個枝杈(RBD 和 NTD),其中的 RBD 會和我們的受體蛋白發生識別,然后進入人體。 


        我們的研究主要圍繞著機理還未明確的 NTD 展開。我們和清華大學計算生物學的老師通力合作,利用分子動力學模擬技術對整個 S 蛋白,全構象是百萬級原子的巨大體系,進行了數十億步的動力學平衡模擬。通過分子動力學,我們發現 NTD 就像一個開關,可以去控制另一個枝杈 RBD 是否能和人體的蛋白發生識別、結合。而 NTD 和 RBD 兩者結合的界面,就自然形成了****物和疫苗設計的一個潛在靶點




        Q4:計算生物學算是一門交叉性非常強的學科,一方面是生物知識和人工智能的交叉,也就是所謂的 BT+IT。另一方面,也是干實驗和濕實驗的一種交叉。那請問幾位老師是如何看待這兩種強的交叉關系的? 




        A4:計算生物學是一個非常典型的交叉學科。這個交叉二字其實有幾個不同的層次。 


        首先是知識層面上,有生物學、醫學、****學、計算機科學,包括人工智能這些不同的知識門類的交叉。 


        還有一個研究方法的交叉,比如說傳統生物學的生物實驗,就是“濕實驗”。計算機的模擬或者人工智能的手段,我們通常稱為“干實驗”。 


        更重要的其實是人才的交叉。因為在這個過程中會涉及到計算機的人才、生物學的人才。而最有趣的是,每個人其實都是有自己的個性的,甚至是有一些偏見的。當我們面對著一個新的課題或者一個新的事物的時候,通常會帶入我們固有的一些思維。所以想要讓交叉學科發展得非常好,我們就需要一個開放、包容、多元化的環境,讓不同的知識做交融,讓不同類型的人才去做碰撞,讓不同的研究手段去進行互補或者形成某種閉環。


        圖片

        對談嘉賓: 微軟亞洲研究院副院長劉鐵巖(左二),微軟亞洲研究院首席研究員邵斌(右二),微軟亞洲研究院主管研究員王童(右一)




        Q5: 是否存在哪些明顯的瓶頸?




        A5:高質量數據。盡管過去我們在生物學領域積累了大量的數據,但是高質量的數據仍然十分短缺。 


        從技術上來說,在做計算生物學的過程中,我們還是碰到了非常多的挑戰。比如說,真正的蛋白質其實是處在一個非常復雜的細胞環境中的,這種微環境使得計算機的建模難度非常大。比如說在 NTD 的分子動力模擬中,就需要考慮到這個蛋白在人體內真正的環境是什么樣的?是不是處在一個水溶液的環境里?是不是會有一些離子?在計算生物學的研究中,我們也要盡量地去仿照人體中真實的微環境,這可能是一個比較大的挑戰。 


        那還有一個挑戰是什么呢?在做計算免疫學的時候,其實每個人內在的免疫環境都是千差萬別的。我們做一個 AI 模型,如果想在每個人身上都適用,取得很好的效果,也是很大的一個挑戰。這也就是為什么我們要對每個人有一個更個性化的建模過程和解決方案。 


        還有動態變化的問題。


        生命科學很特別的一點,就是它的研究對象是活的。比如說,人體每天應對著我們所在的環境,包括各種病源的侵擾,我們是不斷地在進化、在變化中去抵抗它們的。所以當我們使用傳統的機器學習或人工智能的手段去做了分析建模,很可能這個模型未來要使用的對象已經發生了變化。


        所以當我們用人工智能的手段去解決這些生物問題的時候,怎么能夠做更好的泛化外推,能夠去解決和應對生物體本身的變化,這是一個非常有趣的問題,它不僅僅是對計算生物學有意義,對人工智能、對機器學習都是一個新的挑戰。




        Q6:那我們是如何看待 AI for Science 這種形式的?




        A6:當我們用人工智能跟自然科學進行交叉的時候,其實有兩個視角。


        一個是我們已經知道了自然科學的規律,也產生了很多的數據,我們怎么用人工智能從里面學到某種模型去加速這個過程


        另一分支就是當我們能夠有那么多的觀測數據,這些數據可能是科學家們用肉眼分析不過來的。如果我們有很好的人工智能技術,我們能不能去通過大量的高通量數據分析,總結出一些現有的科學家還沒有發現的科學規律,這個科學發現的價值可能比加速的價值更高。




        Q7:在 AI for Science,這個具體的融合過程中,有沒有什么經驗和大家分享?




        A7:人工智能帶來了科學研究范式的轉型。因為從計算機科學的視角看,現在很多的問題求解不再單純依賴于人工的算法設計,而更多的是轉成以數據驅動的模型構建。


        此外,從基礎科學研究的視角去看,傳統基礎科學研究更多是一種提出科學假設,然后驗證科學假設的研究范式。隨著大數據和人工智能的發展、普及和成熟,我們觀察到越來越多的科學研究從假設推動的范式,走向了利用大數據和計算機技術挖掘科學洞見的這種數據驅動的科學研究范式


        從生物科學的角度出發,我們之前更多是基于專業領域知識(domain knowledge)的觸發來做研究。通俗來講,AI 其實只是作為一種計算手段扮演了配角的作用。更多是在有大量的生物學數據和生物領域知識的前提下,用一種非常簡單的統計模型或者是機器學習來做簡單的擬合。


        但伴隨著 AI 技術的發展和深化,AI 在 AI for Science 里逐漸變成了主角。它并不是只去對生物數據做簡單的擬合,而是從 AI 入手去認識科學問題,即為科學問題量身定制一套 AI 的算法與開發。


        但從另一方面來說,傳統計算生物學的研究,更多是為了提升性能,也就是追求更高的數字。現在的 AI for Science 并不是這樣。以 AI+****物設計研發為例,我們并不像之前一樣只關注準確率,而更關注可解釋性。比如說在****物虛擬篩選里,是潛在****物的哪些原子和我們的受體蛋白的哪一些殘基、哪一些原子能發生相互作用,這個模型能否提供更好的解釋性等等。


        傳統的自然科學領域有一個研究范式,就是科學家們受到實驗數據的啟發,然后大膽假說提出一套科學理論,再通過設計實驗去進一步地驗證這些理論或者推論。人工智能其實就是使傳統科學家做研究的這種過程變得自動化、規模化、并行化。所以,如果我們說傳統的自然科學的發展嚴重依賴于少數頂級科學家的智慧的話,在未來,有了人工智能技術的加持,我們相信有更多的科學工作者可以以更高的通量去做更了不起的研究。



        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: AI

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 社会| 奇台县| 长顺县| 杭锦旗| 周至县| 临颍县| 锡林郭勒盟| 绥江县| 孝义市| 勃利县| 长垣县| 钟山县| 双桥区| 蓬溪县| 石棉县| 修文县| 台前县| 江津市| 上饶市| 大田县| 陈巴尔虎旗| 龙陵县| 日照市| 山阴县| 贡嘎县| 凤凰县| 泽州县| 简阳市| 嘉荫县| 甘谷县| 安达市| 荥经县| 哈密市| 于都县| 岳普湖县| 忻州市| 邵阳县| 合山市| 大理市| 疏勒县| 吉木萨尔县|