SC2017聯(lián)想四連冠

如此看來,SC 2017還有哪些新看點呢?HPC和人工智能AI應(yīng)該是看點之一。

有多少人能夠把HPC和AI聯(lián)系在一起呢?實際上,HPC/大數(shù)據(jù)一體化一度成為HPC領(lǐng)域的熱點。熟悉技術(shù)的朋友知道,如今,所說的人工智能AI,其實可以理解為以大數(shù)據(jù)處理為基礎(chǔ),結(jié)合神經(jīng)元網(wǎng)絡(luò)+機器學習的算法,既然如此,HPC、AI親密無間,也是自然而然的事。

SC2017聯(lián)想展區(qū)

HPC和AI相同點

·相同點之一,它們都需要巨大計算和處理能力。

·相同點之二,它們都需要高可靠性??梢院唵斡嬎阋幌?,如今HPC集群規(guī)模動輒上萬臺,如果單臺服務(wù)器的故障率是萬分之一,這就意味Linkpack測試無論如何是完不成的,萬分之一故障率,意味著HPC系統(tǒng)100%失敗。

·相同點之三,它們都需要借助GPU或者APU的處理能力,不用多解釋,請參閱神威·太湖之光的配置。

·相同點之四,它們都關(guān)注能耗,造得起用不起,這是HPC領(lǐng)域一直以來的話題。兩個維度,一個讓HPC更加節(jié)能;第二個就讓HPC做更多的事情,大數(shù)據(jù)、AI就是很好的對象,物盡其用。

看聯(lián)想如何拆招

HPC和AI能夠真正做到親密無間嗎?

今年4月,楊元慶提到聯(lián)想要投資1.2億美元在AI這個產(chǎn)業(yè)上,也因為這個承諾,目前有超過100位AI方面的科學家,在聯(lián)想位于美國莫里斯維爾、德國斯圖加特以及中國北京的創(chuàng)新中心投入AI的研究。每一個中心都有自己的特色,客戶可以連進來使用這些中心,同時也會有專家?guī)椭龑Э蛻粢黄饋硗瓿善渲械牟僮?。這是一個開放的架構(gòu),只要有想法,就可以利用此種架構(gòu)跟聯(lián)想的專家一起去做討論。

聯(lián)想將用戶的AI之旅分為三個階段:

·發(fā)現(xiàn):幫助發(fā)現(xiàn)人工智能在廣泛應(yīng)用中的潛能和優(yōu)勢;

·開發(fā):提供專為人工智能優(yōu)化的硬件和人工智能框架選擇,以加速人工智能應(yīng)用的開發(fā);

·部署:利用簡化的端到端解決方案和專業(yè)服務(wù)知識,快速完成部署。

聯(lián)想數(shù)據(jù)中心業(yè)務(wù)集團副總裁兼人工智能與高性能計算業(yè)務(wù)總經(jīng)理Madhu Matta表示:“AI是一項復雜的工作,它需要優(yōu)異的處理能力和一定程度的技術(shù)專業(yè)知識和人才,而此類資源往往是客戶最缺乏的?!睘榇?,聯(lián)想創(chuàng)建了一個端到端生態(tài)系統(tǒng),能夠在AI的每一步使用進程中為客戶提供重要支持。

聯(lián)想數(shù)據(jù)中心業(yè)務(wù)集團中國區(qū)企業(yè)級營銷產(chǎn)品營銷總監(jiān)李煒表示:對比其他友商方案,聯(lián)想最大的優(yōu)勢就是自主研發(fā),以及對機器性能、可靠性的嚴格要求,因此能夠向用戶交付更好、更優(yōu)質(zhì)量的產(chǎn)品。

SD530和LiCO,為AI優(yōu)化

在聯(lián)想看來,HPC如果想要滿足AI、機器學習和深度學習等工作負載需要,就需要在靈活、敏捷性加以提高,為此,聯(lián)想推出了兩款專為未來工作負載設(shè)計的卓越產(chǎn)品:

·用于ThinkSystem SD530的全新GPU :?支持最新基于NVIDIA Volta架構(gòu)的Tesla V100 GPU加速器和英特爾至強可擴展處理器系列,ThinkSystem SD530可以按需調(diào)整,可以根據(jù)計算規(guī)模的需要靈活擴展性,同時保持HPC系統(tǒng)可靠性和可用性。

通過采用全新Tesla V100,ThinkSystem SD530為AI應(yīng)用提供了一個強大選擇,適用于大規(guī)模訓練工作負載和推理工作負載等的需要。

·智能超算管理平臺(LiCO):熟悉聯(lián)想HPC的用戶,對于LiCO肯定不陌生,這是一套這是一款功能強大的管理套件,同時這也是一套對外開源的軟件;為了滿足AI應(yīng)用的需要,聯(lián)想強化了上一代LiCO的全部功能,更在HPC軟硬件平臺上整合支撐了各種深度學習應(yīng)用,融合了主流的人工智能框架,比如谷歌的Tensorflow、臉書的Caffe、微軟的MXNET等。

此外,LiCO分布式的資源調(diào)度系統(tǒng),可以從容應(yīng)對各種深度學習訓練對于不同規(guī)模計算的需求,如:人臉識別、自然語言處理;LiCO所提供的任務(wù)模板可以讓初學者、專家、數(shù)據(jù)科學家,都能夠快速上手; 而LiCO提供的數(shù)據(jù)預(yù)處理、訓練、參數(shù)調(diào)整、過程監(jiān)控、測試等端到端解決方案,更可以讓用戶能夠集中精力在AI算法和業(yè)務(wù)應(yīng)用,無需要為硬件集群管理分心。

ThinkSystem數(shù)據(jù)中心基礎(chǔ)設(shè)施和解決方案產(chǎn)品組合展示

為了控制能耗,聯(lián)想提供了第二代溫水水冷技術(shù),將水溫從45℃提升到50℃,冷卻效率從80%上升到了90%。技術(shù)之外,更加重要的是,聯(lián)想的溫水水冷是唯一一個有全球案例,而且做到非常大集群的產(chǎn)品,在國內(nèi)外都有成功案例,在參觀中可以看到一個城市都在使用聯(lián)想的水冷產(chǎn)品。

未來HPC要挑戰(zhàn)E級計算,聯(lián)想水冷技術(shù)將會是一項非常重要的技術(shù)。如今,以神威·太湖之光的計算能力,E級計算將是其規(guī)模的10倍,耗電量將需要一個中型發(fā)電站來專供,這還沒有考慮空間上的占用。而采用聯(lián)想溫水水冷技術(shù),就可以壓縮90%能耗和占地水平。應(yīng)該說,這也恰好滿足了AI應(yīng)用的需求

小結(jié)

以智慧計算為依托,在推動HPC商用化進程中,AI讓多樣化、個性化、定制化的聯(lián)想HPC解決方案有了更多用武之地。可以預(yù)計,AI市場的深入應(yīng)用也必將反哺HPC系統(tǒng)應(yīng)用,迎接E級計算的新突破。

分享到

songjy

相關(guān)推薦