這被業(yè)內(nèi)認(rèn)為是首次使用計算機(jī)成功模擬多粒子系統(tǒng)動力學(xué)的嘗試。
當(dāng)時的算力條件遠(yuǎn)比不上今天,但這項工作為后續(xù)物理學(xué)、生物學(xué)和化學(xué)等領(lǐng)域的研究開辟了新的路徑。這些領(lǐng)域的科學(xué)家們一直在尋求從物質(zhì)的微觀結(jié)構(gòu)洞察其宏觀物理性質(zhì)的高效研究工具,基于計算模擬的分子動力學(xué)正是為了這個需求而誕生。
分子動力學(xué):粒子運動的「顯微鏡」
分子動力學(xué)的基本思想源于牛頓時代,即只要已知系統(tǒng)組分的初始條件和相互作用力,就能通過計算來預(yù)測整個系統(tǒng)的行為。
簡單概括一下,分子動力學(xué)的計算模擬過程,就是按照一定規(guī)則為模擬對象(各種粒子)賦予初始位置和速度,讓其遵循力學(xué)規(guī)律運動。然后計算出粒子在每個時間步長的運動狀態(tài),得到原子和分子在模擬系統(tǒng)中的運動軌跡、相對位置和能量轉(zhuǎn)化等豐富的信息。依據(jù)這些信息,研究人員就可以分析體系的動力學(xué)行為、熱力學(xué)性質(zhì)等,進(jìn)而解釋和預(yù)測物質(zhì)的各種宏觀特性。
計算模擬如今是除了理論和實驗之外的第三種主要研究手段,也是分子動力學(xué)方法的核心優(yōu)勢。分子動力學(xué)也因此兼具理論和實驗的雙重性質(zhì),一方面,它可以做預(yù)測,為實驗提供可能性和可行性的理論分析;另一方面,它也可以做解釋,通過模擬解釋實驗現(xiàn)象、探討過程機(jī)理等。
經(jīng)過幾十年的發(fā)展,分子動力學(xué)模擬技術(shù)逐漸成熟,從最初的小尺度簡單模型模擬能力,升級到能夠模擬大尺度復(fù)雜模型,成為許多領(lǐng)域不可或缺的科研利器。
例如,在生物化學(xué)領(lǐng)域,該方法可以用來復(fù)制和預(yù)測生物分子如蛋白質(zhì)的折疊和對接,揭示生命的奧秘;在材料領(lǐng)域,利用分子動力學(xué)可以模擬材料在特定環(huán)境下的性質(zhì)、相變過程和穩(wěn)定性,從而發(fā)現(xiàn)高性能的新材料。
分子動力學(xué)被發(fā)明后的很長一段時間內(nèi),登上各領(lǐng)域頂級刊物的研究論文可謂碩果累累,但回顧起來會發(fā)現(xiàn),這門技術(shù)在產(chǎn)業(yè)落地方面卻很少見比較亮眼的成績。其實,在算法探索方面,分子動力學(xué)方法已經(jīng)走得比較遠(yuǎn)了,最大的瓶頸就在于計算效率。
而究其原因,分子動力學(xué)的核心優(yōu)勢,同時也是導(dǎo)致它計算效率低下的局限性所在。
持續(xù)多年的計算效率難題
這要如何理解呢?
我們知道,與其他的分子模擬方法如蒙特卡洛方法顯著不同的是,分子動力學(xué)引入了時間這一重要維度,可以計算粒子系統(tǒng)隨時間推移而發(fā)生的動態(tài)性質(zhì)演化,模擬的質(zhì)量也更高。
與此同時,分子動力學(xué)的痛點也在于時間。為了能夠與自然過程的動力學(xué)相匹配,我們想要的模擬時間跨度當(dāng)然是要足夠長的,這樣才能從模擬中得出在統(tǒng)計學(xué)上有效的結(jié)論,如果模擬時間過短,就無異于僅通過觀察一個不完整的腳步就聲稱得出了人類如何行走的結(jié)論。
但現(xiàn)實的難題是,計算機(jī)的算力有限,需要對模擬體系的大小、時間步長和總持續(xù)時間的選擇加以限制,以便計算任務(wù)可以在合理的時間內(nèi)完成,當(dāng)計算資源受限時,必須縮小模擬體系規(guī)模或縮短體系的演化時間,否則模擬效果就會大打折扣。如果要對于大體系(數(shù)十萬上百萬量級)進(jìn)行計算模擬,就只能在模擬速度和模擬質(zhì)量之間做出取舍了。一般來說,現(xiàn)有超級計算機(jī)每天能夠?qū)崿F(xiàn)的大體系分子動力學(xué)模擬時長,幾乎都是在皮秒到納秒的時間尺度。
這無疑是攔在分子動力學(xué)技術(shù)邁向產(chǎn)業(yè)落地的路上的一堵高墻。
拿藥物研發(fā)行業(yè)舉例,一直以來,分子動力學(xué)技術(shù)都難以成為科研人員選取的主流研究方法,這是因為要想研究藥物小分子的結(jié)構(gòu)和性質(zhì),模擬的時長至少也需要到微秒級別(可能還不夠),即便是每天模擬10納秒的高性能計算機(jī),都需要100天的時間才能模擬1微秒的蛋白動態(tài)構(gòu)象,而為了找到合適的藥物分子結(jié)構(gòu),需要模擬的分子數(shù)量至少也是成百上千的,因此如果硬是要靠分子動力學(xué)來取代傳統(tǒng)實驗的篩選,完全是天方夜譚中的天方夜譚。分子動力學(xué)模擬要想真正步入新藥研發(fā)的產(chǎn)業(yè)應(yīng)用,至少還需要三四個數(shù)量級的加速,人們普遍認(rèn)為這需要好幾個代際的軟硬件效率革命,等上幾十年都不為過。
誰曾想,分子動力學(xué)發(fā)展歷史上的一位傳奇人物的登場,直接掀起了一場顛覆性的計算效率革命。
David E. Shaw,這位叱咤金融量化領(lǐng)域多年的大牛,在他人生的五十歲之際,毅然轉(zhuǎn)身投入到生物計算的事業(yè)中,帶領(lǐng)一群頂尖的技術(shù)人才,于2007年發(fā)明出了分子動力學(xué)模擬加速專用超級計算機(jī)——Anton(安騰)。
它能夠以3-4個數(shù)量級的加速比更快地計算模擬更大體系規(guī)模、更長模擬時長的生物大分子運動,將分子模擬從納秒時代帶入了微秒甚至毫秒時代。
超算安騰:為加速分子動力學(xué)模擬而生
事實上,為了適應(yīng)各領(lǐng)域計算密集型任務(wù)的需求,超級計算機(jī)最早在70年代就出現(xiàn)了,后來的Frontier(前沿)等世界最快超算設(shè)備也都算力驚人,能夠在極短的時間內(nèi)處理龐大的數(shù)據(jù)和復(fù)雜的計算任務(wù)。
但論針對分子動力學(xué)模擬的計算任務(wù),通用型超算卻遠(yuǎn)比不上安騰,安騰的實測計算效率比Frontier還要快至少幾十倍以上!這是因為安騰的設(shè)計初衷只有一個,那就是為了專門加速分子動力學(xué)模擬計算。
從硬件上的芯片、主板和布線,到配套的動力學(xué)模擬軟件,David E. Shaw團(tuán)隊都做了特殊定制。具體來說,超算安騰有兩大突出的創(chuàng)新:
一是采用深度定制的ASIC芯片,可以針對性地執(zhí)行分子動力學(xué)模擬中最消耗算力的任務(wù)模塊如分子之間相互作用力的計算,為其提供硬件算法上的優(yōu)化,同時由于這類任務(wù)屬于通訊密集型,每個節(jié)點需要執(zhí)行的運算并不復(fù)雜,對單個計算單元的計算能力要求也就沒那么高,所以安騰并沒有使用其他并行計算硬件中常見的緩存,而是把更多的硅片面積留給通信和計算性能和優(yōu)化。
二是在通信網(wǎng)絡(luò)方面,為了滿足分子動力學(xué)模擬的快速大規(guī)模并行計算需求,安騰將整個服務(wù)器緊密排列在一個正方體機(jī)箱中,這樣就可以降低網(wǎng)絡(luò)的傳輸距離,提高節(jié)點間通訊效率。
經(jīng)過如此強(qiáng)大設(shè)計的超算安騰一問世,就成了生物計算領(lǐng)域當(dāng)之無愧的最強(qiáng)王者,破解了多年來分子動力學(xué)模擬的計算效率難題。隨之而來的,就是分子動力學(xué)終于不再局限于學(xué)術(shù)研究的范疇,而是真正實現(xiàn)了大規(guī)模的產(chǎn)業(yè)化應(yīng)用,尤其是在藥物研發(fā)行業(yè)顯示了巨大的市場潛力。
正是在超算安騰的幫助下,美國的一個年輕公司Relay Therapeutics在2016年成功確定了一款用于治療膽管癌的抑制劑藥物RLY-4008的結(jié)構(gòu),Relay利用安騰重塑了新藥研發(fā)的技術(shù)手段,把獲取對蛋白質(zhì)靶點的認(rèn)識從過去基于靜態(tài)圖轉(zhuǎn)變?yōu)榛诘鞍踪|(zhì)運動的動態(tài)影像,這被他們稱為“基于運動的藥物設(shè)計”(Motion Based Drug DesignTM,MBDD)。
在這種新范式下,這款新藥的發(fā)現(xiàn)僅僅花費了18個月、不到1億美金,極大地縮短了從藥物發(fā)現(xiàn)到臨床前研究過程中90%的投入時間與成本,打破了藥物研發(fā)行業(yè)的“雙十”魔咒。
回到1950年代,Alder和Wainwright曾在布魯塞爾的統(tǒng)計力學(xué)大會上,報告了他們關(guān)于使用分子動力學(xué)模擬多體系統(tǒng)的研究論文。論文中,他們不僅第一次令人信服地向人們展示了分子動力學(xué)的技術(shù)價值,而且還特別對這門技術(shù)的未來做了暢想:更強(qiáng)大的計算設(shè)備將帶來更大的可能性。
五十年后的超算安騰,就是對這一舊時預(yù)測的完美注腳,也必定會是將來分子動力學(xué)發(fā)展的重要路徑指引。在生物計算和藥物研發(fā)之外,更多運用分子動力學(xué)技術(shù)的科學(xué)領(lǐng)域,正呼喚著類似安騰這樣的專用超級計算機(jī),以創(chuàng)造更多產(chǎn)業(yè)落地的可能性。