OGB是目前公認的圖學(xué)習(xí)基準數(shù)據(jù)集代表,由斯坦福大學(xué)Jure Leskovec教授團隊建立,于2019年國際頂級學(xué)術(shù)會議NeurIPS上正式開源。其囊括了節(jié)點性質(zhì)預(yù)測、邊性質(zhì)鏈接預(yù)測、圖性質(zhì)預(yù)測等圖學(xué)習(xí)領(lǐng)域眾多權(quán)威賽道,以質(zhì)量高、規(guī)模大、場景復(fù)雜、難度高著稱,素有圖學(xué)習(xí)領(lǐng)域“ImageNet”之稱,吸引了包括微軟、Deepmind、Facebook、阿里巴巴、百度、字節(jié)跳動、斯坦福、MIT、北京大學(xué)等眾多頂尖高校和科技公司參與。
?分子屬性預(yù)測過程示意圖
圖神經(jīng)網(wǎng)絡(luò)(GNN)由于其強大的非結(jié)構(gòu)化數(shù)據(jù)的處理能力受到了工業(yè)界以及學(xué)術(shù)屆的廣泛關(guān)注。此次,騰訊優(yōu)圖實驗室參與了圖屬性預(yù)測賽道下Ogbg-molhiv、Ogbg-molpcba等四項極具價值的任務(wù)。其中,騰訊優(yōu)圖實驗室在transformer和GNN結(jié)合的分子建模基礎(chǔ)上針對分子的2D-3D結(jié)構(gòu)建模、數(shù)據(jù)擴充、訓(xùn)練算法等方向進行了一系列改進,例如改進的FLAG算法、圖插值算法等。
值得期待的是,該類技術(shù)近年來也逐漸為新能源、生物制藥等產(chǎn)業(yè)帶來更多AI助力。以新能源產(chǎn)業(yè)鋰電池研發(fā)為例,在新型電解液篩選中通過預(yù)測分子屬性可以擴大分子篩選范圍、減少研發(fā)周期,這方面AI相對傳統(tǒng)仿真技術(shù)可以有萬倍以上的加速。在生物制藥產(chǎn)業(yè),通過AI對分子建??梢灶A(yù)測小分子藥物效果加速藥物研發(fā),例如在新冠疫苗研發(fā)中AI技術(shù)也起到了加速作用。