來源:特斯拉

投身專用超級計算機  只為實現(xiàn)最佳計算效率

全球超算競賽持續(xù)白熱化,從不斷刷新的全球超算Top500排行榜中可見一斑,尤其在短短六年間,最強超算的性能增速超過了十倍。然而,除了圍繞運算速度的激烈角逐,專用超級計算機領域逐漸嶄露頭角,成為一個不可忽視的焦點。這類超算在特定應用場景下追求計算效率的極致優(yōu)化,通過犧牲一定的通用性,實現(xiàn)針對特定問題的最高性能表現(xiàn)和計算效率,從而在各專業(yè)細分領域展現(xiàn)無可比擬的競爭優(yōu)勢。不過,這類專用超算由于往往不會參選諸如超算Top500的榜單,一直以來都鮮少受到關注。

科技巨頭們紛紛研發(fā)專用超算,是因為它們意識到只有針對特定領域或任務進行深度定制化設計,才能有效克服通用超級計算機在處理復雜計算密集型問題時可能出現(xiàn)的數(shù)據(jù)傳輸慢、內(nèi)存訪問效率低等瓶頸。通過定制硬件、軟件架構(gòu)和算法優(yōu)化,專用超算不僅在科學研究、工程技術(shù)等領域?qū)崿F(xiàn)重大突破,搶占技術(shù)高地,而且在保證高性能計算需求的同時,降低了成本和能耗,滿足了企業(yè)和研究機構(gòu)追求科研創(chuàng)新與經(jīng)濟效益的雙重訴求。

近期,隨著AI大模型的興起,針對算力需求的AI超算也開始嶄露頭角,專門解決大規(guī)模密集AI訓練和推理等計算難題,再次證實了專用超算在特定領域內(nèi)的巨大價值和潛力。

如果要談論專用超算,那么在生物計算領域最為知名的安騰(Anton)超級計算機無疑極具代表性。它在執(zhí)行分子動力學模擬任務時展現(xiàn)出了驚人的計算效率,甚至比通用超算Top500榜首的最強超算 Frontier還要高出50 倍以上。自 2007 年首次發(fā)布以來,安騰超算迭代升級了三次, 每一代在執(zhí)行分子動力學模擬時的計算效率都要比同一時期最強大的通用超算快約100倍。憑借其在高性能計算領域的出色表現(xiàn),安騰超級計算機曾兩度榮膺高性能計算領域的最高榮譽——“ACM戈登貝爾獎”。

安騰超級計算機

安騰超級計算機憑什么能降維打擊通用超算?

在 1683 年的荷蘭,生物學家安東尼·范·列文虎克(Antonie van Leeuwenhoek)自制顯微鏡,為人類打開了認識微觀生物結(jié)構(gòu)和生命現(xiàn)象的窗口。

三百多年后,一臺以他的名字命名的計算顯微鏡——專用超級計算機「安騰」(Anton),在美國的 D. E. Shaw 研究所橫空出世,極大地加速了分子運動模擬的計算過程,使得我們能在微秒級別上看到蛋白質(zhì)運動的「影片」,更進一步打開了微觀世界的“視界”。而在超算安騰出現(xiàn)之前,我們只能看到蛋白質(zhì)運動的「照片」。

分子動力學模擬(Molecular Dynamics Simulation, 簡稱MD)旨在揭示生物分子在原子級別上的運動規(guī)律和相互作用機制,為科研人員提供一個觀察藥物靶標分子行為的超高分辨率窗口,進而助力設計出更為精準的藥物療法來應對各種疾病。自上世紀80年代以來,計算效率一直是制約分子動力學模擬技術(shù)在生物計算領域取得重大突破的關鍵瓶頸。由于分子行為模擬涉及海量的計算需求,在計算速度受限的情況下,能夠模擬的實際生物時間尺度相對較短。而安騰超級計算機(Anton)通過優(yōu)化計算能耗和提升計算效率,成功地延長了此類分子模擬的可持續(xù)時長,為科學研究開辟了新的途徑。

在安騰超級計算機的助力下,美國在基礎生命科學研究和生物制藥領域取得了顯著優(yōu)勢,許多基于安騰超算進行的蛋白質(zhì)折疊和分子動力學模擬的重要研究成果,已在Nature、Science、Cell等權(quán)威學術(shù)期刊上陸續(xù)發(fā)表,其科研成果的數(shù)量和質(zhì)量上的突出表現(xiàn),使得全球科研工作者都為之震撼。

不僅如此,在科研成果轉(zhuǎn)化為實際應用的過程中,安騰超級計算機同樣發(fā)揮了關鍵作用。它極大地推動了美國生物制藥領域的技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展,創(chuàng)造出可觀的市場價值,為新藥研發(fā)、疾病治療和醫(yī)療健康科技進步注入了強大動力。

Relay Therapeutics 這家美國公司成為藥物研發(fā)行業(yè)龍頭的背后,就離不開安騰超算。

新藥研發(fā)是個黃金賽道,但它回報周期長、成本高,在以往的經(jīng)驗和認知中,要研發(fā)一款新藥起碼要花上 10 年、10 億美金。而且這個領域充滿了失敗,據(jù)一項來自麻省理工學院的研究統(tǒng)計,2000 年至 2015 年間開發(fā)的候選藥物中,有 86% 以失敗告終。而 Relay 這家于 2016 年才創(chuàng)立的年輕公司,竟僅用了 18 個月、不到 1 億美金的投入,就確認了一款膽管癌治療藥物 RLY-40089(一種高度選擇性的 FGFR2 不可逆和口服小分子抑制劑)的結(jié)構(gòu),在藥物發(fā)現(xiàn)行業(yè)一鳴驚人。

Relay成為行業(yè)新星的背后,離不開安騰超算。從技術(shù)路徑上來說,Relay成功的關鍵,在于其創(chuàng)造性地提出了基于運動的藥物設計(Motion Based Drug Design(TM),MBDD)的方法,這種方法將以往的蛋白質(zhì)靜視圖轉(zhuǎn)變?yōu)榈鞍踪|(zhì)運動的動態(tài)視圖,這有助于在突變蛋白中發(fā)現(xiàn)新的變構(gòu)袋,從而開展對難成藥靶點的研發(fā)。

而讓蛋白質(zhì)動起來的,就是第二代安騰超級計算機(Anton2)。Relay 在公司成立伊始,就跟 D.E.Shaw 研究所建立了合作關系,他們的研發(fā)人員利用超算安騰對藥物靶點和成藥小分子的結(jié)構(gòu)進行分子動力學模擬和篩選設計,從而突破了長時間大尺度分子動力學模擬的計算瓶頸。

圖片來源:hpcwire

如果沒有安騰超算,恐怕 Relay 就不會那么快在 2020 年就登陸納斯達克,成為全球第二家上市的 AI 制藥公司。

另一個值得一提的案例,是在 2020 年 3 月 27 日,D. E. Shaw 研究所發(fā)布了由安騰超算模擬的、100 微秒新冠病毒 3CL 蛋白酶 MD 模擬動畫及數(shù)據(jù)。這種蛋白酶是新冠藥物開發(fā)的一個熱門靶點,安騰超算以最短的時間,當時針對 3CL 蛋白酶研發(fā)抑制劑提供了非常寶貴的數(shù)據(jù)。這長達 100 微秒的模擬結(jié)果,安騰這臺分子動力學模擬專用超算只用了十幾天的時間完成計算,這是當今全球最強超算也難以企及的。

那么,為什么安騰超級計算機能算這么快?

顯而易見的原因就是它在設計之初就只瞄準了一種計算問題,即加速分子動力學模擬計算。從最初的規(guī)劃階段開始,安騰超級計算機就被定向設計為專注于解決單一但計算密集型的分子動力學模擬問題,區(qū)別于通用型超級計算機需要應對多種不同類型計算任務的特點。正是這種對特定計算領域的深度聚焦,使安騰在分子動力學模擬方面突破了通用超級計算機的傳統(tǒng)性能極限。

安騰超級計算機在進行分子動力學模擬時,尤其注重優(yōu)化針對通訊密集型并行計算問題的解決方案。不同于普遍服務于訪存密集型任務的GPU和通用超級計算機,安騰采取了集成定制化ASIC專用芯片的方式,以最大限度地減少無效數(shù)據(jù)傳輸,優(yōu)化數(shù)據(jù)存儲布局與本地計算操作,并簡化指令集以規(guī)避非必要的計算步驟。此外,超算安騰通過細粒度劃分芯片內(nèi)部的計算任務,并根據(jù)不同精度需求進行差異化調(diào)度和分配,使得在模擬分子間復雜相互作用時,能夠?qū)崿F(xiàn)遠高于一般計算平臺的高效計算性能。

同時,安騰超級計算機的設計理念嚴格遵循了阿姆達爾定律。這一定律由計算機科學家Gene Amdahl于1967年提出,描述了在系統(tǒng)性能優(yōu)化過程中,某一組件的改進對其整體性能提升的影響。D.E.Shaw研究所運用這一原理,找準了系統(tǒng)性能提升的關鍵瓶頸,有針對性地對軟硬件資源進行集中優(yōu)化,以犧牲一定程度的通用性為代價,換取在分子動力學模擬計算領域的巨大性能提升。

中國超算之路:專用化大有可為

在世界超算的競技場中,中國顯然也是其中一支實力強大的隊伍。在 2023 年底的超算 Top500 榜單統(tǒng)計中,中國最強超算「神威·太湖之光」已經(jīng)達到了 93.01 PFlop/s(接近每秒十億億次浮點運算)的速度。2014-2017 年期間,「天河二號”和「神威·太湖之光」和「天河二號」還曾連續(xù) 4 年問鼎 Top500 的榜首。這些閃亮的數(shù)字和名次都顯示了我國通用超級計算機沖擊科學研究頂峰的勢頭,但在特定科學領域的應用上,國內(nèi)的整體步伐則顯得沒有那么快,而且應用領域較單一,目前主要還是集中在量子計算或者人工智能方面,大規(guī)模產(chǎn)業(yè)化落地的成果也不是十分突出。

通用型超算固然算力驚人,但在特定的計算問題上,未必比得上規(guī)模更小的專用超算。對中國超算的未來發(fā)展而言,應用于特定領域的專用超算無疑是一片藍海,這也是安騰超級計算機帶給我們的啟示。

不過,在專用超算這條賽道上,無論是從 0 到 1 還是跟跑世界頂尖水平,都不是簡單之事。就以安騰超級計算機為例,目前全球僅有的幾臺機器分別位于美國紐約市 D. E. Shaw 研究所和匹茲堡超算中心,其他機構(gòu)需要提交美國國家科學院獨立專家委員會一份研究提案,可以排隊免費使用,但并不接受其他國家學術(shù)機構(gòu)的申請,這已然形成了一種技術(shù)壟斷。

不僅是美國,其他有實力的國家也都在競相打造專用超算,比如英偉達 CEO 黃仁勛最近大力鼓吹生物計算,開始和制造商諾和諾德(Novo Nordisk Foundation)聯(lián)手,在丹麥建立世界上最強大的 AI 超算「Gefion」。在去年年底《自然》發(fā)布的“2024 年值得關注的科學事件”中,專用超級計算機也有上榜:文章預測 2024 年研究人員啟動歐洲首個百億億次的超級計算機「Jupiter」,它每秒能執(zhí)行一千萬億次計算,后續(xù)將被應用于構(gòu)建醫(yī)療目的的人類心臟和大腦數(shù)字孿生模型,以及進行地球氣候的高分辨率模擬。美國也會安裝兩臺百億億次級別的超級計算機,一臺是位于伊利諾伊州勒蒙的阿貢國家實驗室的「Aurora」,用來繪制大腦神經(jīng)回路地圖;另一臺是位于加利福尼亞州勞倫斯利弗莫爾國家實驗室的「El Capitan」,它將被用于模擬核武器爆炸效果。

總之,專用超算擺在我們面前的機遇是巨大的,同時這場科技的角逐顯然是激烈的,而研發(fā)之路必然道阻且長,我們可能會走得慢,但方向要走對,我們需要突出重圍,打造一臺屬于中國自己的「安騰」。

分享到

崔歡歡

相關推薦