上??萍即髮W(xué)獲得ASC18超算競(jìng)賽e Prize計(jì)算挑戰(zhàn)獎(jiǎng)

e Prize計(jì)算挑戰(zhàn)獎(jiǎng)是ASC競(jìng)賽獨(dú)有的獎(jiǎng)項(xiàng),旨在打造青年人才的戈登·貝爾獎(jiǎng)(Gordon Bell Prize),鼓勵(lì)青年人才勇于解決超算應(yīng)用難題敢于挑戰(zhàn)計(jì)算性能極限,激勵(lì)青年人才利用超級(jí)計(jì)算機(jī)推動(dòng)科學(xué)與工程領(lǐng)域?qū)崿F(xiàn)應(yīng)用突破。獎(jiǎng)項(xiàng)命名來(lái)源于,e是科學(xué)中最重要的自然常數(shù),同時(shí)也代表著人類(lèi)下一個(gè)超級(jí)計(jì)算機(jī)性能的挑戰(zhàn)目標(biāo)——百億億次(exascale)。

ASC18的e Prize計(jì)算挑戰(zhàn)獎(jiǎng)賽題是由微軟提供的人工智能機(jī)器閱讀理解,這道賽題要求參賽隊(duì)使用自己搭建的超算系統(tǒng)運(yùn)用CNTK深度學(xué)習(xí)框架,獨(dú)立開(kāi)發(fā)機(jī)器閱讀理解和問(wèn)答的算法模型,使用最新超算技術(shù)結(jié)合MS MARCO數(shù)據(jù)集進(jìn)行訓(xùn)練,最終實(shí)現(xiàn)讓機(jī)器準(zhǔn)確地回答問(wèn)題。

MS MARCO是由微軟開(kāi)發(fā)的機(jī)器閱讀理解與問(wèn)答的數(shù)據(jù)庫(kù),這個(gè)數(shù)據(jù)集是基于bing和Cortana上收集的真實(shí)數(shù)據(jù)構(gòu)建的,包括100,000個(gè)問(wèn)題,100萬(wàn)個(gè)段落,以及超過(guò)20萬(wàn)個(gè)文件的鏈接。此次ASC18總決賽使用的數(shù)據(jù)集包括近10萬(wàn)個(gè)人工標(biāo)注的問(wèn)題及其答案,基準(zhǔn)代碼使用單節(jié)點(diǎn)單塊NVIDIA Tesla P100 GPU訓(xùn)練耗時(shí)接近一天,基準(zhǔn)預(yù)測(cè)精度值為30(ROUGE-L=30)。而在決賽中,每支隊(duì)伍的訓(xùn)練時(shí)間不會(huì)超過(guò)12小時(shí),要想在如此短的時(shí)間內(nèi)得到更高的ROUGE-L值,不僅要在訓(xùn)練集群上優(yōu)化代碼性能以更快的找到最佳參數(shù),還需要對(duì)算法模型進(jìn)行創(chuàng)新和改進(jìn)來(lái)達(dá)到更好的預(yù)測(cè)精度。

首次入圍總決賽的上??萍即髮W(xué)展現(xiàn)出令評(píng)審專(zhuān)家為之驚嘆的AI模型設(shè)計(jì)與優(yōu)化能力,在數(shù)據(jù)、算法和訓(xùn)練方法上都實(shí)現(xiàn)了相當(dāng)有效的改進(jìn)。在數(shù)據(jù)上,隊(duì)員們對(duì)組委會(huì)提供的訓(xùn)練數(shù)據(jù)集予以擴(kuò)充,以獲得更多的訓(xùn)練樣本;在算法上,隊(duì)員們使用多任務(wù)同時(shí)訓(xùn)練的方式對(duì)答案進(jìn)行重新排序,并集成多個(gè)優(yōu)秀的模型。最終,上??萍即髮W(xué)代表隊(duì)使用浪潮AI超算服務(wù)器NF5280M5搭配Tesla V100 GPU加速器構(gòu)建了先進(jìn)的異構(gòu)加速超算系統(tǒng),在8個(gè)小時(shí)內(nèi)完成10萬(wàn)樣本級(jí)別的大規(guī)模數(shù)據(jù)集的并行模型訓(xùn)練,并實(shí)現(xiàn)46.46的高預(yù)測(cè)精度,接近當(dāng)今世界上最先進(jìn)的算法能達(dá)到的水平,以滿分成績(jī)獲得e Prize計(jì)算挑戰(zhàn)獎(jiǎng)。

微軟相關(guān)負(fù)責(zé)人認(rèn)為,就本科生的知識(shí)結(jié)構(gòu)和優(yōu)化能力而言,能在不到8小時(shí)內(nèi)訓(xùn)練出如此高精度的模型,這是非常了不起的成績(jī),體現(xiàn)出上??萍即髮W(xué)的隊(duì)員們非凡的創(chuàng)造力、對(duì)AI模型的深刻理解以及與之相匹配的實(shí)際動(dòng)手能力。

此外,總冠軍得主清華大學(xué)和獲得最高計(jì)算性能獎(jiǎng)的臺(tái)灣清華大學(xué)也在該賽題上表現(xiàn)出色,預(yù)測(cè)精度值均超過(guò)40。其中,清華大學(xué)在訓(xùn)練和數(shù)據(jù)處理上,性能相比基準(zhǔn)代碼實(shí)現(xiàn)了3-30倍的提升。

在人工智能機(jī)器閱讀理解賽題上,從初賽的小試牛刀到?jīng)Q賽的驚艷成績(jī),背后蘊(yùn)藏著數(shù)個(gè)月來(lái)大學(xué)生們研讀最新論文,實(shí)現(xiàn)算法以及性能優(yōu)化的艱辛努力。在賽后交流中,絕大多數(shù)參賽隊(duì)員們表示都是第一次接觸到深度學(xué)習(xí)賽題,很多隊(duì)伍參考了諸如S-NET和QANet等最新學(xué)術(shù)成果。通過(guò)ASC競(jìng)賽,參賽學(xué)生得以更加深入的理解HPC與AI如何更好的進(jìn)行融合,這不僅對(duì)他們未來(lái)的職業(yè)規(guī)劃和發(fā)展帶來(lái)深遠(yuǎn)影響,也將有助于緩解當(dāng)前AI人才短缺的局面,為AI真正滲透到生產(chǎn)、生活以及社會(huì)各個(gè)方面奠定發(fā)展的根基。

ASC 世界大學(xué)生超級(jí)計(jì)算機(jī)競(jìng)賽(ASC Student Supercomputer Challenge)由中國(guó)發(fā)起組織,并得到亞洲及歐美相關(guān)專(zhuān)家和機(jī)構(gòu)支持,旨在通過(guò)大賽平臺(tái)推動(dòng)各國(guó)及地區(qū)間超算青年人才交流和培養(yǎng),提升超算應(yīng)用水平和研發(fā)能力,發(fā)揮超算的科技驅(qū)動(dòng)力,促進(jìn)科技與產(chǎn)業(yè)創(chuàng)新。大賽迄今已連續(xù)舉行7屆,共吸引了全球超過(guò)5500名大學(xué)生參賽,是目前全球規(guī)模最大、參與人數(shù)最多的大學(xué)生超算賽事。ASC18由亞洲超算協(xié)會(huì)、浪潮集團(tuán)和南昌大學(xué)聯(lián)合舉辦,共有全球300余支高校代表隊(duì)報(bào)名。

分享到

zhupb

相關(guān)推薦