華為數(shù)據(jù)存儲(chǔ)與機(jī)器視覺(jué)產(chǎn)品線陳默博士發(fā)表主題報(bào)告
隨著智能化的加速,AI和大數(shù)據(jù)成為引領(lǐng)科技創(chuàng)新的熱點(diǎn)技術(shù);且隨著HPC與AI、大數(shù)據(jù)技術(shù)架構(gòu)融合,實(shí)現(xiàn)交叉科學(xué)創(chuàng)新,科學(xué)研究由第三范式(計(jì)算科學(xué)HPC)向第四范式(數(shù)據(jù)密集型科學(xué)HPDA)演進(jìn)。
HPDA(高性能數(shù)據(jù)分析)作為HPC+AI+大數(shù)據(jù)的技術(shù)融合,匹配了面向未來(lái)數(shù)據(jù)密集型應(yīng)用的發(fā)展趨勢(shì),具體到超算領(lǐng)域定義為數(shù)據(jù)密集型超算。數(shù)據(jù)密集型超算是以數(shù)據(jù)為中心的高性能數(shù)據(jù)分析平臺(tái),具備傳統(tǒng)超算、大數(shù)據(jù)分析及AI分析能力,在為科研及商業(yè)應(yīng)用提供多樣性算力的同時(shí),能夠基于數(shù)據(jù)累積,提供高階數(shù)據(jù)價(jià)值服務(wù),實(shí)現(xiàn)“底座不動(dòng),數(shù)據(jù)不遷,綠色高效”。
值得一提的是,近期在蘭州舉行的超級(jí)計(jì)算創(chuàng)新聯(lián)盟年度會(huì)議上正式成立了數(shù)據(jù)密集型超算工作組,數(shù)據(jù)密集型超算的主張已經(jīng)在加速形成產(chǎn)業(yè)共識(shí)。
“我們要加速數(shù)據(jù)密集型超算產(chǎn)業(yè)的發(fā)展。首先我們要打破傳統(tǒng)意義上關(guān)于超算的認(rèn)知誤區(qū)?!标惸┦恐赋??!俺愫椭撬悴⒉皇欠谴思幢说年P(guān)系,更多是相互滲透和融合。其本質(zhì)在于超算的算力呈現(xiàn)異構(gòu)化態(tài)勢(shì),因此我們認(rèn)為HPDA全流程計(jì)算才是應(yīng)對(duì)數(shù)據(jù)密集型應(yīng)用爆發(fā)的解決之道。另一個(gè)誤區(qū)是:認(rèn)為超算等于計(jì)算,數(shù)據(jù)相對(duì)沒(méi)那么重要。而真相是當(dāng)前新增的超算場(chǎng)景大多是數(shù)據(jù)密集型,數(shù)據(jù)越來(lái)越重要,80%應(yīng)用場(chǎng)景數(shù)據(jù)量是PB級(jí)?!?陳默博士表示。
數(shù)據(jù)存儲(chǔ)作為數(shù)據(jù)底座變得越來(lái)越重要,專業(yè)的存儲(chǔ)底座才是超算中心可持續(xù)發(fā)展的基石。而過(guò)去30年,計(jì)算和存儲(chǔ)發(fā)展并不平衡,有數(shù)據(jù)表明算力和訪存帶寬的增長(zhǎng)存在剪刀差,算力每十年增長(zhǎng)百倍,訪存帶寬卻僅增長(zhǎng)八倍。
此外,相較超算發(fā)達(dá)國(guó)家的科學(xué)數(shù)據(jù)中心來(lái)說(shuō),中國(guó)超算的存算比明顯偏低,存算比(即存儲(chǔ)容量PB與計(jì)算算力PFLOPS的比值)普遍低于1:3。譬如,某知名國(guó)超,10PFLOPS的算力只配備了不到1PB的存儲(chǔ)。而在超算領(lǐng)先的國(guó)家,這個(gè)數(shù)值普遍在1:2以上。高性能計(jì)算需要高性能的存儲(chǔ)能力相匹配,才能廣納海量應(yīng)用數(shù)據(jù),最大化超算系統(tǒng)使用效率,應(yīng)對(duì)數(shù)據(jù)密集型超算的挑戰(zhàn)。
華為推出的面向數(shù)據(jù)密集型的HPDA解決方案目前已經(jīng)在基因測(cè)序、石油勘探以及自動(dòng)駕駛等多個(gè)行業(yè)領(lǐng)域?qū)崿F(xiàn)了廣泛應(yīng)用。近日,華西醫(yī)院、華為、賽樂(lè)基因聯(lián)合發(fā)布了多組學(xué)數(shù)據(jù)加速分析平臺(tái),全球首次將人類全基因組分析推進(jìn)至分鐘級(jí)時(shí)代。此外,在全球SKA天文望遠(yuǎn)鏡陣列中,上海天文臺(tái)與華為合作,搭建了世界首臺(tái)SKA區(qū)域中心原型機(jī)核心業(yè)務(wù)存儲(chǔ)系統(tǒng)。在油氣勘探領(lǐng)域,華為與中石油東方物探也已完成了單體數(shù)據(jù)量最大的油氣地震勘探數(shù)據(jù)處理項(xiàng)目。種種跡象表明,數(shù)據(jù)密集型超算的發(fā)展正逢其時(shí)、數(shù)據(jù)密集型超算的實(shí)踐正當(dāng)時(shí)。
“今天,在呼和浩特,20家國(guó)家科學(xué)數(shù)據(jù)中心共聚一堂,我們擁有最核心的數(shù)據(jù)資產(chǎn),我們擁有最具價(jià)值的海量科研數(shù)據(jù),已經(jīng)具備了發(fā)展數(shù)據(jù)密集型超算的先決條件?!标惸┦吭谘葜v最后表示,“我們呼吁產(chǎn)學(xué)研加速協(xié)同,形成合力,共同發(fā)展國(guó)產(chǎn)HPDA系統(tǒng)軟件、國(guó)產(chǎn)并行文件系統(tǒng)、國(guó)產(chǎn)數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)管理系統(tǒng)等,共同推進(jìn)并加速數(shù)據(jù)密集型超算產(chǎn)業(yè)及應(yīng)用技術(shù)生態(tài)的發(fā)展?!?/p>