這也是AI就是HPC的靈感來源。

早已經(jīng)是產(chǎn)業(yè)共識

AI與高性能計(jì)算,這已經(jīng)是產(chǎn)業(yè)界的共識。

但以小編的知識結(jié)構(gòu),其實(shí)一時(shí)轉(zhuǎn)不過來,沒有領(lǐng)悟其中的奧秘。

“HPC為AI提供了計(jì)算引擎,大數(shù)據(jù)為AI提供了數(shù)據(jù)引擎;反過來,AI、大數(shù)據(jù)給HPC帶來了新的業(yè)態(tài)?!边@就是結(jié)論。

如何理解這個(gè)結(jié)論呢?

先說說AI,如今AI有泛化的趨勢,無助于人們的理解。

簡單說,這一波AI浪潮的興起和深度神經(jīng)元網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)有關(guān)。AlphaGO就是最初的表現(xiàn)。其中最關(guān)鍵的技術(shù)是以大數(shù)據(jù)處理為基礎(chǔ)的機(jī)器學(xué)習(xí),對于算法模型的不斷調(diào)優(yōu),從而使得其具備智能判斷、分析的能力。

說到AI,很容易和人臉識別、語音識別、步態(tài)識別等具體技術(shù)聯(lián)系在一起。

但實(shí)際上,AI分為重型AI和輕型AI。

其中,輕型AI在消費(fèi)級產(chǎn)品領(lǐng)域應(yīng)用比較快,更加容易被人們所熟悉,例如AI手機(jī),如攝影模式的智能判斷和選擇等

輕型AI的特點(diǎn)是針對目標(biāo)硬件進(jìn)行裁剪,可以通過硬件固化,如AI芯片,來實(shí)現(xiàn)秒級處理的效果。

但對于重型AI來說,體現(xiàn)出來的特點(diǎn)就是大數(shù)據(jù)、大模型和多任務(wù)。其模型訓(xùn)練需要大數(shù)據(jù)和大機(jī)器,其中HPC首當(dāng)其沖。追求的是高吞吐率的智能推理以及復(fù)雜的關(guān)聯(lián)關(guān)系分析。

簡單說,當(dāng)今的AI可以理解為算法、機(jī)器學(xué)習(xí)和人工經(jīng)驗(yàn)的結(jié)合,是基于數(shù)據(jù)和結(jié)果,對于控制參數(shù)進(jìn)行調(diào)優(yōu)的結(jié)果。

繞不開的GPU話題

談到AI,GPU是一個(gè)繞不開的話題。

實(shí)際上,不僅是GPU,圍繞著復(fù)雜繁多的AI應(yīng)用場景,如今GPU、TPU、HPU、BPU、IPU、NPU、VPU、XPU等百花齊放。幾乎26字母都已經(jīng)被用到。

原因很簡單,沒有任何一款通用處理器或者芯片可以滿足所有AI應(yīng)用場景的需要。

似乎這些和HPC無關(guān)。

說到HPC,離不開Top500排行,以Link Pack測試性能指標(biāo)為前提的排行。

HPC、超級計(jì)算機(jī)的性能被譽(yù)為一個(gè)國家科技實(shí)力象征,王冠上的明珠。

中國在Top500排行榜上取得了突破性的進(jìn)展,天河2號和神威太湖之光連續(xù)6次和4次拿到了冠軍,連續(xù)5年占據(jù)榜首。今年,才剛剛被美國Summit超過,行內(nèi)人透露,用不了多久,也許就是半年之后,就會(huì)被國產(chǎn)機(jī)超過。

這個(gè)成績是怎么取得的呢?

答案就是抓住了“異構(gòu)并行計(jì)算”的機(jī)會(huì)。其中,GPU、FPGA和APU功不可沒,從百萬億次,千萬億次,都是靠這樣的一個(gè)技術(shù)。

HPC接下里的目標(biāo)是E級計(jì)算,靠“異構(gòu)并行計(jì)算”,靠花錢是沒有辦法突破E級計(jì)算的,接下來要面臨“訪存墻、通信墻、可靠性墻、能耗墻、并行計(jì)算可擴(kuò)展性”等一系列難題。

簡單說就是互聯(lián)、網(wǎng)絡(luò)、可靠性和功耗。

E級計(jì)算有用嗎?

除了象征意義之外,計(jì)算能力也是非常重要的。

在采訪中,諾禾致源高級副總裁吳俊表示,作為一家開展基因測序服務(wù)和研究的公司,從測序儀產(chǎn)生的海量數(shù)據(jù)處理,到最終結(jié)果的分析判定,都需要強(qiáng)大的數(shù)據(jù)處理能力。


諾禾致源高級副總裁吳俊

此前,1臺(tái)基因測序儀產(chǎn)生的數(shù)據(jù)量是200GB~300GB,如今已經(jīng)快速發(fā)展到6TB,時(shí)間也從7天~8天,縮短到2.5天。基因測序的成本,也從1萬人民幣暴跌到1000元左右,具備了商業(yè)化應(yīng)用的前景。

HPC計(jì)算性能的提升,顯然有助于服務(wù)流程的優(yōu)化,快速相應(yīng)需求。但是與此同時(shí),也要根據(jù)商業(yè)模式選擇合理的方案,沒有辦法無限制的追逐高性能。

相比于性能,諾禾致源更加看重的可靠性、穩(wěn)定性以及節(jié)能的水平。聯(lián)想在溫水冷卻等節(jié)能技術(shù)上獨(dú)樹一幟,在IBM x86服務(wù)器的基礎(chǔ)上,有很多讀到技術(shù)和可靠性、穩(wěn)定性保障,這也是他們選擇聯(lián)想高性能計(jì)算的原因。

吳俊表示,現(xiàn)有基因測序分析軟件并不適用于GPU。但在AI助力方面,HPC的計(jì)算能力、數(shù)據(jù)處理能力仍然是可以信賴的基礎(chǔ)。

聯(lián)想數(shù)據(jù)中心業(yè)務(wù)集團(tuán)制造行業(yè)總監(jiān)許子牛表示:HPC助力AI是一個(gè)方面,另外AI也可以助力HPC,例如能耗問題,訪存效率的提升,都可以借助AI技術(shù)。這對于E級計(jì)算機(jī)的實(shí)現(xiàn),也具有重要意義。

即使對于E級計(jì)算,“異構(gòu)并行計(jì)算”仍然是首選的技術(shù),各種XPU加速技術(shù)也有助于目標(biāo)的實(shí)現(xiàn)。

未來的HPC不僅針對科學(xué)計(jì)算,將同樣適用于大數(shù)據(jù)、AI的應(yīng)用場景,這將會(huì)是一個(gè)應(yīng)用領(lǐng)域兼顧的過程。

本次聯(lián)想全球超算峰會(huì),聯(lián)想發(fā)布自主研發(fā)的AI產(chǎn)品家族:ThinkSystem SR670、ThinkSystem HG680、ThinkSystem HG690共3款產(chǎn)品,其實(shí)是HPC、AI優(yōu)化的結(jié)果。聯(lián)想還推出第三代溫水水冷解決方案“海王星”系統(tǒng),其中包括Direct-to-Node溫水水冷技術(shù)、后門熱交換器、以及由空氣和液體冷卻組成的混合冷卻技術(shù),使數(shù)據(jù)中心的運(yùn)行效率提升高達(dá)50%。

這就是聯(lián)想接地氣的結(jié)果。

在本次峰會(huì)上,聯(lián)想沒有披露更多E級計(jì)算機(jī)進(jìn)展,但其并不遙遠(yuǎn)。

小結(jié)

AI技術(shù)思路的突破,正在顛覆、改變就有的格局。以HPC為例,也在從科學(xué)計(jì)算、工程計(jì)算,滲透到大數(shù)據(jù)和AI,HBM (High Bandwidth Memory)、XPU、3D NAND、Optane等新技術(shù)產(chǎn)品的出現(xiàn),也會(huì)極大改變現(xiàn)有的商業(yè)格局。

世界正在快速變化中,HPC當(dāng)然也不例外!

分享到

songjy

相關(guān)推薦