在新冠病毒的刺突蛋白序列上的計算機模擬實驗表明,LinearDesign能夠設計出結構最穩(wěn)定的序列,而且設計時間只需要1個半小時。如果采用線性時間近似算法,所需時間可以進一步縮短到11分鐘。對此,羅徹斯特大學教授、RNA生物中心主任David Mathews給出了極高的評價:“LinearDesign算法設計了一組結構更穩(wěn)定的序列,并使用翻譯效率高的密碼子,它高效的運行速度是序列設計的關鍵,這些設計序列可以通過實驗檢驗它們作為疫苗的效果?!?/p>
解決困擾世界難題LinearDesign是基于今年1月底百度研究院對外開放的線性時間算法LinearFold升級而來。LinearFold預測RNA二級結構的速度堪稱全球最快,整個分析時間能夠從55分鐘縮短至27秒,提速120倍。
其實,百度研究院用人工智能技術開展基因分析、RNA二級結構相關的研究可以追溯到更早。吳甜在盛典中談到,“百度在AI領域深耕和布局多年,積累了非常深厚的AI技術能力。百度研究院早在2018年就開始研究LinearFold、LinearPartition等算法,希望與不同領域進行深度的融合,助力產(chǎn)業(yè)轉(zhuǎn)型發(fā)展”。 這些研究成果在業(yè)內(nèi)受到廣泛重視,并相繼被計算生物學領域頂級會議ISMB接收。
吳甜表示,LinearDesign算法是百度AI技術在生命科學研究方向上極具代表性的一次嘗試,也是百度AI技術積累及經(jīng)驗的產(chǎn)物。疫情爆發(fā)后百度研究院第一時間成立專項技術小組,開展了一系列的AI、生物抗疫工作。短短3個月,完成了新的LinearDesign 的mRNA設計算法,并且獲得了多個疫苗公司和機構的關注和合作意向。1月底2月初,為了支持國家抗疫工作,百度派駐專人到中國疾病預防控制中心,進行專項跟進,支持抗疫工作。在此過程中,百度發(fā)現(xiàn),AI能力和生物信息的緊密聯(lián)合,在病毒分析、疫苗研發(fā)方面對中國疾病預防控制中心有非常重要的價值。因此,百度牽頭與中國疾病預防控制中心聯(lián)合成立了”中國CDC應急技術中心-百度基因測序工作站”,展開長期戰(zhàn)略性抗疫支持工作。
今年6月,北京新發(fā)地突發(fā)疫情時,CDC工作站在樣本接收后10個小時即完成了北京四個樣本的全基因組測序,功不可沒。中國疾病預防控制中心病毒病預防控制所病毒病應急技術中心主任、博士研究員譚文杰表示:“我們想把百度在mRNA二級結構的預測上的優(yōu)勢,轉(zhuǎn)化成將來疫苗的生產(chǎn)和研發(fā)。未來還能服務于其他任何未知的、新發(fā)的傳染病的防控?!眳翘鹨舱劦?,百度將在深度和廣度兩個維度上,繼續(xù)依托在AI算法領域的深耕優(yōu)勢,深化與學術界和生物制藥企業(yè)的合作。
百度AI在此次疫情中的快速響應,側面反映了其前沿技術實力與行業(yè)深度結合的能力。吳甜透露,新算法的研究借鑒了自然語言處理技術(NLP)領域的算法思想,而百度在NLP領域有非常深厚的積累和沉淀。吳甜作為百度NLP十年發(fā)展參與者和見證者之一,投身參與了各種AI核心技術、產(chǎn)品的研究與發(fā)展,在AI技術與產(chǎn)業(yè)的相互促進的過程中,百度擁有越來越多優(yōu)質(zhì)產(chǎn)品及技術成果。
關于人工智能未來發(fā)展,吳甜表示,各行各業(yè)都在AI技術的紅利中享受產(chǎn)業(yè)融合帶來的全新價值。比如智能客服,它可以提供親切、耐心和專業(yè)的客戶服務;醫(yī)療領域,AI技術助力醫(yī)護人員,為病患提供更優(yōu)質(zhì)的服務。可以預見,隨著新技術的加持,如百度大腦、飛槳等AI平臺在更加廣泛的應用,各行各業(yè)都可以擁有平臺化、生態(tài)化的生產(chǎn)模式,加速各產(chǎn)業(yè)智能化進程。正如百度CTO王海峰在2020中國互聯(lián)網(wǎng)大會中所講,百度正在利用領先的AI技術幫助企業(yè)建立競爭優(yōu)勢,并支持中國制造業(yè)實現(xiàn)智能化升級。