計算生物學揭秘奧密克戎強感染性原因
以下文章來源于DeepTech深科技 ,作者LXS
編者按:2019年底開始的新冠疫情席卷全球,影響著我們每一個人。病毒的不斷變異使得抗疫變得愈加艱辛和漫長。如何預測病毒的變異和疫情的發展,甚至從根本上遏制病毒的傳播,這似乎已經超出了傳統生物學的能力范圍。
對此,微軟亞洲研究院積極展開了一系列針對新冠病毒相關的研究,并取得了一定的階段性成果。就在近期,微軟亞洲研究院和清華大學生命科學學院及醫學院在奧密克戎變異株強傳染性的機理解釋方面又有了新的突破,相關成果已被生物學領域的頂級期刊《Cell Research》接收。想了解奧密克戎為什么感染性這么強么?讓我們在今天的文章中一探究竟。
也歡迎大家點擊下方視頻,了解新冠病毒的感染機理,探索AI新用法,看看AI如何為人類抗疫提供新的可能!本文轉載自公眾號“DeepTech深科技”。年來,微軟亞洲研究院在新冠病毒方面進行了一系列研究。
2021 年,微軟亞洲研究院與清華大學在《Advanced Theory and Simulations》上共同發表了封面文章《通過分子動力學模擬探索 SARS-CoV-2 刺突蛋白 NTD 的調控功能》(Exploring the Regulatory Function of the N-terminal Domain of SARS-CoV-2 Spike Protein Through Molecular Dynamics Simulation)[1]。
這是微軟亞洲研究院和清華大學生命科學學院龔海鵬教授團隊共同開展的一項計算生物學研究,主要通過分子動力學模擬、研究新冠病毒侵染人類機理中 N 端結構域 NTD(N-Terminal Domain)的作用。
據了解,在新冠病毒表面有一層 S 蛋白,只有在被人體的受體蛋白 ACE 2 識別以后,病毒才能進入人體。兩者結合能力越強,就越容易造成感染。
S 蛋白的形態有點像字母“Y”,向下的一豎即 S2 區域嵌入在病毒表面,起到固定的作用。伸出來的兩個“枝丫”分別叫作 NTD 和 RBD(受體結合域,Receptor Binding Domain)。
圖1:新冠病毒 S 蛋白結構(左圖為 S 蛋白三聚體結構,由三條鏈組成;右圖為 S 蛋白單體結構,由 NTD、RBD 以及 S2 組成)
在該研究之前,人們已經通過實驗知道了 RBD 可以直接起到一個識別人體受體蛋白的作用,而 NTD 的具體作用還不十分清晰。
微軟亞洲研究院和龔海鵬教授實驗室合作搭建了一個有百萬個原子的穩定模擬體系,在進行了數十億步(1 步是 1 飛秒,即一千萬億分之一秒)的分子動力學模擬之后,提出了一個“楔形”模型假說,簡單來說,可以把 NTD 看作是安插在了 RBD 和“Y”字底部的一個“楔子”。
研究發現,RBD 有 down 和 up 兩種狀態,只有 up 狀態才有可能與人的受體蛋白做識別。該項研究發現,RBD 傾向于從 up 的狀態轉變為 down 的狀態,而當 NTD 像楔子一樣塞入 RBD 下端時,阻止了 RBD 的這一傾向,即 NTD 使得 RBD 保持 up 狀態,進一步讓其擁有了感染的能力。
可以說,NTD 在病毒的侵染過程中起到了一個調控作用,調節 RBD 的形態,從而改變了病毒感染人體的傾向。
圖2:NTD 在 SARS-CoV-2 的 S 蛋白構象變化中發揮調控功能示意圖
由此可以預見,NTD 調控 RBD 的界面可能成為潛在的****物靶點。若能設計一個****物分子可以把 NTD 向外拉出,也就是把這個“楔子”拔出來,那 RBD 就傾向于 down 的狀態,變成沒有感染能力的構象,病毒感染人的能力就會減小很多。
“我們這項工作在世界范圍內首次提出了 NTD 在病毒侵染過程中的調控模型。此外,我們根據這個潛在的****物靶點,設計了****物的虛擬篩選算法,并對新冠病毒的一些潛在性****物做了一定篩選,為新冠病毒****物研發提供了一定的參考價值。”微軟亞洲研究院主管研究員王童說道。
近期,微軟亞洲研究院和清華大學生命科學學院王新泉教授和醫學院張林琦教授課題組開展合作,在奧密克戎變異株強傳染性的機理解釋方面有了新的突破,其成果已被生物學領域的頂級期刊《Cell Research》接收。
據了解,在此次合作中,王新泉教授課題組率先解析了奧密克戎高分辨率的晶體結構,為奧密克戎感染機理研究奠定了基礎。
相比于靜態的晶體結構,王童團隊利用分子動力學模擬從“動態視角”模擬和分析奧密克戎結構變異及其侵染機理。
研究中,微軟亞洲研究院的研究員們首先構建了兩個模擬體系,分別以原始的新冠病毒結構和奧密克戎的結構作為起始結構,對這兩個結構平行地進行長時間、數億步的分子動力學模擬,模擬出的是原子級別的運動過程,從而觀察病毒在人體中的真實變化。
(來源:Pixabay)
“對分子運動進行模擬的方法可以分成兩種,經典的分子動力學模擬和基于第一性的量子模擬,”王童說,“對于研究新冠病毒中蛋白大分子、大尺度的構象變化運動,經典動力學模擬方法是一種更適合的手段。”
據王童介紹,經典模擬適用于大體系,像蛋白質成千上萬的原子,比如此次模擬體系就包含上百萬的原子。從時間上來說,經典模擬做的都是數億到數十億步的模擬。相比之下,量子模擬相對準確,但計算過程的耗時使其只能適用于非常小的體系,比如對只有十余個原子的體系計算性質或進行短暫的模擬。
構建了模擬體系之后,微軟亞洲研究院利用自研算法,分析了原始新冠病毒和奧密克戎感染人體的能力,以及它們結構上非常細微的差異。
值得注意的是,研究過程中產生的數據量極其龐大,整個模擬下來,至少有數億個結構,產生了數億到數十億幀的結構變化。
為此,研究人員創造性地提出一種全新的馬爾科夫模型算法對數據進行分析。其對分子動力學模擬的數據分析有著更強的表征能力,可以更加真實地模擬出蛋白的動態變化過程。
在對海量的數據進行篩選和分析后,研究人員將數十億的結構聚合成幾類代表性的結構,再去分析它們之間的區別和如何相互轉換,以及與人受體蛋白的結合能力,從而更好地理解奧密克戎感染的分子機理。
這些聚合出來的代表性構象被稱為“亞狀態”,研究人員對其做了定性的結合自由能計算,以此在一定程度上反映病毒的感染能力。
具體來說,在研究中,聚類以后的奧密克戎和原始病毒都有三個亞狀態。由于奧密克戎本身只是原始病毒的變體,所以它們各自占比最高的一個亞態,無論是從結構上,還是和人的受體蛋白結合的能力上來說都是非常類似的。
由此可見,奧密克戎結構的關鍵不同之處在其他兩個亞狀態上。相比原始病毒的兩個亞狀態,奧密克戎的兩個亞狀態和人的受體蛋白ACE2有更多的相互作用,結合能力更強(結合自由能更低),因此可能導致了更強的感染能力。
同時研究還發現,奧密克戎的三個亞狀態之間相互轉換非常快,很容易從類似于原始病毒的主亞狀態,轉換成結合能力更強的另外兩個亞狀態。這也從動態視角解釋了為什么奧密克戎感染性這么強的一個原因。
圖3:分子動力學模擬揭示奧密克戎的狀態變化及感染機理(左圖為新冠病毒 S 蛋白,右圖為奧密克戎變異株的 S 蛋白,其中兩個體系的 State3 基本一致且為主要構象,奧密克戎的另外兩個亞態結合自由能明顯高于新冠病毒的兩個亞態)
在最新有關奧密克戎的研究工作中,王童表示,“這項研究在世界上首次使用‘干濕結合’的方式和動態視角,從結構生物學和計算生物學兩個角度同時出發,提出了奧密克戎感染性強的分子機理。”
上面提到的“干濕結合”,也就是“干實驗”(計算實驗)和“濕實驗”(傳統科學實驗)的結合。
據了解,“干實驗”可以對“濕實驗”現有的一些結論做驗證和補充,還能做一些“濕實驗”做不了的或者是需要花很多時間、人力去做的研究。
比如,在奧密克戎的研究中,若在“濕實驗”實驗室里一個個去分析突變位點結構的變化,可能需要數月時間,在疫情如此嚴峻的情況下,顯然不利于疫情防控工作。而使用計算的手段來模擬這種突變造成的影響,可能只需要一周到兩周的時間。
另外,“濕實驗”在前期很多時候都是探索性質的,甚至在研究方向上是非常迷茫的。這時“干實驗”可以在一定程度上引導“濕實驗”的實驗設計,幫助其找到一個更容易成功的方法。
值得注意的是,兩者并不是互相取代,而是同等重要、相互指導、相輔相成的。“我們在和研究伙伴合作的過程中就有這樣的感覺,我們認為‘干濕結合’會對整個科學研究起到一個螺旋式上升、波浪式前進的推動作用。”王童說道。
微軟亞洲研究院主管研究員王童
他還補充說,在新冠病毒的研究方面,與清華大學多位老師的合作是一個非常好的起點。微軟亞洲研究院非常希望能和海內外高校、科研院所的專家學者們有更多的深入合作和跨領域交流。
據了解,微軟亞洲研究院后續還會就新冠病毒為何在整個冠狀病毒進化過程中感染性如此強的原因方面開展相關研究。
最后,關于計算生物學等跨學科領域對人才的要求和發展趨勢,王童也發表了自己的看法。
他認為跨學科發展主要是圍繞一個關鍵詞,就是“交叉”。交叉不是簡單的“加法”,而是“乘法”。兩個學科之間要發生一定的化學反應和深度的融合。
拿計算生物學來說,其本質上就是計算機科學與生物學的交叉,需要結合兩個領域的知識,并真正消化理解,才能在計算生物學領域產生真正的學術影響力,解決真正的科學問題。
而這也對人才的培養或者說對人才的需求,提出了一個更高的要求。如果研究人員只掌握某一方面的知識,對另一學科的認識不夠深入,只停留在簡單的工具使用層面,那么研究工作就只能浮于表面,也很容易造成計算參數設置有誤等問題,導致最終計算結果與實驗結果完全不一樣的情況。
未來,各學科之間的交叉融合一定會越來越多,在具體的科研工作中,不同背景的人才在合作交流過程中,需要更多傾聽對方領域的知識和訴求,只有建立在互信、開放心態的基礎上,才能推動跨學科間的研究持續向前發展。
參考:
1. Y. Li,T. Wang,J. Zhang,B. Shao,H. Gong,Y. Wang,X. He,S. Liu,T. Liu.Exploring the Regulatory Function of the N-terminal Domain of SARS-CoV-2 Spike Protein through Molecular Dynamics Simulation.Advanced Theory and Simulations 4(2021).
https://doi.org/10.1002/adts.202100152
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。