圖1 曙光公司副總裁、研發(fā)中心總經(jīng)理邵宗有

互聯(lián)網(wǎng)行業(yè)到底哪些應用會需要用到高性能計算呢?我們常常認為高性能計算是陽春白雪,是那些傳統(tǒng)高端領域的專利。對此,邵宗有表示,“互聯(lián)網(wǎng)行業(yè)中,很多地方都需要對大量的數(shù)據(jù)處理和分析,比如搜索、電商的交易處理系統(tǒng)等等,這些應用跟傳統(tǒng)的股票交易系統(tǒng)其實是不相上下的。高性能計算和分布式處理本身就沒有特別嚴格的界限,互聯(lián)網(wǎng)企業(yè)盡管價格競爭非常激烈,但是其系統(tǒng)的復雜度、精妙程度一點都不比傳統(tǒng)的高性能計算差,一些互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)中心包含幾萬臺服務器。”

當人們紛紛談論如何實現(xiàn)“百億億次計算”的時候,邵宗有已經(jīng)把更多的精力投入了高性能計算在互聯(lián)網(wǎng)行業(yè)的應用上,基于整機柜的優(yōu)化方案、與百度的聯(lián)合實驗室等等。

系統(tǒng)設計新思路:整機柜模塊HPC系統(tǒng)

整機柜模塊HPC系統(tǒng)的設計靈感源于百度的系統(tǒng)結構,“互聯(lián)網(wǎng)企業(yè)的系統(tǒng)規(guī)模相當大,百度現(xiàn)在就有好幾萬臺服務器,著眼一個一個節(jié)點,就太細了,做起來就會非常地復雜。我們未來要著眼一個一個的機柜,從增強整個機柜的可靠性、功耗、性能的角度出發(fā),解決這些問題”,邵宗有對記者解釋道,這也是計算機領域解決問題經(jīng)常用到的二叉樹的思想,層級越多,樹上的葉子也就越多,比如Cache的設計也就是采取了這樣的思路,隨著Cache容量的增加,Cache從一層Cache演變成三層Cache。

圖2 曙光整機柜模塊HPC系統(tǒng)

邵宗有也非常坦白地告訴記者,整機柜模塊HPC系統(tǒng)的投入非常大,意味著要重做所有的模塊,包括交換模塊、存儲模塊、計算模塊,一共差不多十來種模塊。如果沒有用戶的支持,很難投入那么大。更重要的是,大數(shù)據(jù)、云計算給高性能計算機帶來了一個非常廣闊的市場。

當然,從另一個角度看,新的系統(tǒng)設計思路也讓高性能計算向百億億次邁出了非常重要的一步。無論是從可靠性、管理,還是功耗方面,都能夠得到改善。

除了整機柜模塊HPC系統(tǒng)之外,曙光還在跟百度聯(lián)合建立高性能計算聯(lián)合實驗室,共同研究面向互聯(lián)網(wǎng)的計算的特殊需求,包括游戲、電子商務等。據(jù)悉,聯(lián)合實驗室占地500平米,兩三個月后就能夠建起來了。邵宗有表示,曙光將會投入大量的人力物力。

超強的定制能力 滿足互聯(lián)網(wǎng)行業(yè)的特殊需求

互聯(lián)網(wǎng)行業(yè)對于計算機的定制化需求非常高,通用計算機很難滿足互聯(lián)網(wǎng)巨頭的需求,Google、Amazon、FaceBook等都是自己定制的服務器,曙光就是依靠自身超強的定制能力在互聯(lián)網(wǎng)行業(yè)占有一席之地,因為,國外的企業(yè)不可能到中國來給它們定制,而國內(nèi)技術實力不強的企業(yè)也定制不出來。

“其實整機柜交付的計算系統(tǒng)其實就是互聯(lián)網(wǎng)企業(yè)的特殊需求,因為只有互聯(lián)網(wǎng)企業(yè)才會部署到上萬個節(jié)點,沒有哪一個超算中心會部署一萬個節(jié)點”,邵宗有談道,在機器設計時,就充分考慮到互聯(lián)網(wǎng)企業(yè)的需求,同時定制計算模塊、供電方案、交換方案、散熱方案等等。對于計算模塊來說,傳統(tǒng)的超算領域不需要其他的模塊,互聯(lián)網(wǎng)領域可能用到基于ARM處理器,基于MIC處理器,甚至基于國產(chǎn)CPU等等。

“過去我們總是在想上海超算中心是怎么想的,近一兩年來,我們一直在想百度是怎么想的,這也是曙光這兩年來很關鍵的一個變化。”

擔起民族使命 構建HPC生態(tài)系統(tǒng)

“作為HPC領域當之無愧的國產(chǎn)領導企業(yè),曙光的最終目標不是去掠奪市場,而是需要去培育市場,在國內(nèi)構建一個良好的高性能計算生態(tài)系統(tǒng)。”

事實上,國內(nèi)市場的培育工作往往都是由國外企業(yè)來做,高性能計算領域之前就是IBM等廠商做的比較多。從曙光自己辦超算大會,到曙光跟大學合作讓他們?nèi)ラ_設并行編程、CUDA編程的課,包括把超級計算機推進到IDC,推進到云計算,這都是曙光站在行業(yè)領軍者的位置上,去打造的生態(tài)系統(tǒng)。只有這樣,才能支撐未來高性能計算機的高速發(fā)展。邵宗有強調(diào),“為什么參加SC12比賽?一個隊去參賽,至少有一百個隊來選拔吧?一個隊5個人,這就500個人,這就是未來的500個潛在用戶啊。”

除此之外,曙光還有一個任重而道遠的目標——提升高性能計算機的國產(chǎn)化比率。“一個高性能計算機幾十個億,光是CPU就買了6、7個億,這相當于科技部直接把錢撥給了國外,我們辛辛苦苦爭取的項目,卻不得不把很大一部分收入直接撥給國外。作為一個自主可控的企業(yè),我們會想盡一切辦法在保證用戶性能、應用前提下,提升國產(chǎn)比率”,邵總的話語簡潔卻很有力。

據(jù)透露,龍芯3C現(xiàn)在正在調(diào)試,按照曙光的想法,有望今年做出來。

分享到

tangrong

相關推薦