近日, SKA上海大會(huì)暨第六屆SKA工程大會(huì)的召開,讓華為云帶領(lǐng)人類打破壁壘,使人們與頭頂?shù)男强赵俅慰拷奶剿髦?又一次揭開神秘面紗。而解密的開始,要從SKA科學(xué)工程開始說起。
探索宇宙星空的“SKA”時(shí)代
作為歷史上最大的科學(xué)工程之一,SKA(平方公里陣列射電望遠(yuǎn)鏡)是即將在澳大利亞和南非建造的新一代射電望遠(yuǎn)鏡項(xiàng)目,其成員國包括澳大利亞、加拿大、中國、印度、英國等10個(gè)國家,超過20個(gè)國家的約100個(gè)組織參與了SKA的設(shè)計(jì)和開發(fā)。SKA最終將建設(shè)上千面反射面天線和一百多萬個(gè)低頻天線,其獨(dú)特的配置使其具備無可匹敵的觀測范圍,它將具有對空中大片區(qū)域成像的能力,其他巡天望遠(yuǎn)鏡從未完成過在如此高靈敏度上開展如此規(guī)模的壯舉。這也意味著,人類對于宇宙星空的探索,開始進(jìn)入“SKA時(shí)代”。
正如SKA總干事Philip Diamond介紹“這個(gè)項(xiàng)目的目的是觀察宇宙,了解我們在宇宙中的位置,從大爆炸到我們銀河系和太陽所在的局部區(qū)域。至于它的價(jià)值,除了用于天文研究外,這個(gè)項(xiàng)目還將給我們帶來許多技術(shù)和計(jì)算等方面的創(chuàng)新?!?/p>
SKA項(xiàng)目所面臨的問題主要體現(xiàn)在兩個(gè)方面。首要是計(jì)算能力本身,科研數(shù)據(jù)往往體量巨大,對這些數(shù)據(jù)進(jìn)行挖掘、將其訓(xùn)練成AI模型以提升未來的研究效率更是困難;其次還有科研協(xié)作,龐大數(shù)據(jù)量不僅僅受計(jì)算能力影響,同時(shí)也在影響協(xié)作效率。SKA需要把望遠(yuǎn)鏡或望遠(yuǎn)鏡陣列建設(shè)在世界各地,對于科研項(xiàng)目來說,想要實(shí)現(xiàn)分布式的協(xié)作研究,往往要耗費(fèi)大量成本在本地建立數(shù)據(jù)中心。
澎湃算力,天文研究進(jìn)程更快一步
為有效地推進(jìn)我國SKA區(qū)域中心的建設(shè)和科學(xué)預(yù)研究,上海天文臺選擇與華為云合作,雙方將發(fā)揮各自優(yōu)勢探索人工智能在天文研究中的應(yīng)用,展開更加高效的天文研究,以及創(chuàng)新天文研究方法。
對于天文研究項(xiàng)目中云和AI的應(yīng)用前景,SKA區(qū)域中心指導(dǎo)委員會(huì)中方代表、上海天文臺SKA課題組長安濤認(rèn)為,“對于計(jì)算和存儲(chǔ)靈活的資源配置,云提供了一個(gè)很好的解決方案,這也是未來SKA科學(xué)計(jì)算的一個(gè)趨勢。”
據(jù)了解,使用傳統(tǒng)方法處理SKA先導(dǎo)項(xiàng)目星空觀測數(shù)據(jù)時(shí),天文學(xué)家需要169天才能完成一次對南半球星空中大約20多萬個(gè)射電星系的定位和識別。而現(xiàn)在,上海天文臺與華為合作,通過深度學(xué)習(xí)方法訓(xùn)練AI模型,并利用華為云AI昇騰集群服務(wù)的世界頂級的AI強(qiáng)勁算力僅要用時(shí)10秒即可完成此任務(wù),同時(shí)AI模型的平均精度均值mAP可以達(dá)到81%,極大提高了科研效率。
同時(shí),SKA設(shè)施將遍布南北半球、三個(gè)大洲,該項(xiàng)目將產(chǎn)生10倍于目前全球互聯(lián)網(wǎng)的數(shù)據(jù)流量,這樣一來,數(shù)據(jù)存儲(chǔ)及數(shù)據(jù)分析就成為了該項(xiàng)工程面臨的重大挑戰(zhàn)。在數(shù)據(jù)存儲(chǔ)方面,SKA建成后每年存檔大約600PB的數(shù)據(jù)。在數(shù)據(jù)分析方面,海量的天文數(shù)據(jù)價(jià)值挖掘需要強(qiáng)大的算力,同時(shí)無法對大面積星空進(jìn)行實(shí)時(shí)性觀測分析,容易錯(cuò)過天文現(xiàn)象的觀測和研究機(jī)會(huì)。依托于華為云彈性存儲(chǔ)服務(wù),海量數(shù)據(jù)得以被快速且靈活地存儲(chǔ)。針對海量數(shù)據(jù)分析,華為云AI昇騰集群服務(wù)可按需提供澎湃算力,縮短SKA天文研究進(jìn)程。
此外,除了對宇宙中星體進(jìn)行定位和分類,華為云和上海天文臺還展開了脈沖星信號識別方面的研究。該研究展開來說,是在數(shù)以十萬計(jì)的噪聲信號中識別出兩千個(gè)脈沖星信號數(shù)據(jù),利用華為云AI昇騰集群服務(wù)在短時(shí)間內(nèi)訓(xùn)練并建立AI脈沖星識別模型,解析該信號是否為脈沖星信號。目前,其識別精準(zhǔn)率和召回率均高達(dá)98%以上。
未來,除了天文探索領(lǐng)域,華為云AI昇騰集群服務(wù)也將在未來觸及石油勘探,氣象預(yù)測等領(lǐng)域,持續(xù)將AI普惠,讓千行百業(yè)都能夠享受“行業(yè)+云+AI”帶來的驚喜改變。