無獨有偶,在IT界的高性能計算機(jī)領(lǐng)域,也有這樣的事情,我們最近就采訪了東京工業(yè)大學(xué)高性能計算機(jī)(TSUBAME)的主要發(fā)明人松崗博士(Satoshi Matsuoka),他想我們詳細(xì)的介紹了這只王謝燕是如何成為今天百姓可隨便享用的機(jī)器的。


    說到高性能計算機(jī),相信對服務(wù)器有些了解的人就會知道一些,之所以將其跟古詩中的燕子聯(lián)系起來,并不是非要這么有文采,而是東京工業(yè)大學(xué)的?;站褪且恢谎嘧樱闶莻€巧合吧。由于日本的IT技術(shù)發(fā)展相比于中國要早一些,所以超級計算機(jī)的研制和開發(fā)很多是由個人發(fā)起的,而TSUBAME也是這樣一個情況。


    “很多人都覺得TSUBAME超級計算機(jī)是一夜之間建成的,但是我們知道那是不可能的,” 松崗博士對我們說,“TSUBAME從1996年開始,經(jīng)歷了十年的時間,才一朝成名天下知。”


    由于這個系統(tǒng)是博士自己的個人愛好,所以在十年前其實就是一個集群服務(wù)器(Cluster),一共用了Sun的14個SuperSPARC處理器。由于當(dāng)時也沒有多少對性能的要求,而且費(fèi)用也很少,所以最初的雛形就是10M的Switched 10Base-T + Myrinet網(wǎng)絡(luò)。而整體的性能最高的峰值是32Gflops,系統(tǒng)傳輸64Gbps,總存儲容量為4GB。


    今天的TSUBAME顯然要比當(dāng)初時髦且強(qiáng)大了許多,它采用了Sun Galaxy 4服務(wù)器做節(jié)點機(jī),共計10480顆Opteron處理器,而存儲也是采用的Sun的產(chǎn)品,我們在問博士關(guān)于存儲產(chǎn)品的采購是否與服務(wù)器一起的原因而選擇Sun的產(chǎn)品時,博士的回答讓我吃驚:除了Sun,我們別無選擇??紤]到如何提升整體網(wǎng)絡(luò)的系統(tǒng)性能,他們采用的是Infiniband Network,這對網(wǎng)絡(luò)存儲設(shè)備的要求就提高了很多,而當(dāng)時的存儲產(chǎn)品,只有Sun可以滿足這個條件。由于Sun的技術(shù)人員也在場,我也來印證此事,而且我還發(fā)現(xiàn)TSUBAME在2004和2005年的時候,就已經(jīng)開始采購這些設(shè)備了,熟悉服務(wù)器市場的人都清楚,Sun的X4600和X4500是去年才推出的,這也說明博士當(dāng)時敢于在自己的系統(tǒng)中用最新的產(chǎn)品,還是非常大膽啊。


    提到高性能計算,很多人以為就是超級計算機(jī),其實系統(tǒng)的設(shè)計和網(wǎng)絡(luò)以及存儲的搭建才是最重要的,否則,很多應(yīng)用都不能跑,那沒有什么意義。這方面博士顯然早就考慮到了,所以博士對網(wǎng)絡(luò)的高性能要求做得很明確,采用了Voltaire公司的Infiniband高速網(wǎng)絡(luò)交換機(jī)。


    可以這樣說,TSUBAME之所以能夠成為日本最大的高性能計算機(jī),跟Infiniband高速網(wǎng)絡(luò)密不可分。我們知道,這種胖節(jié)點的PC服務(wù)器在成本上比傳統(tǒng)的大機(jī)集群要占優(yōu)勢,但是存在的問題就是性能瓶頸。教授采用了這種聯(lián)結(jié)方式之后,則很有限得解決了這個問題。如果把主服務(wù)器和存儲服務(wù)器等比喻成一個人的骨骼和各個器官,那么告訴交換網(wǎng)絡(luò)就是血管和神經(jīng)系統(tǒng),高速網(wǎng)絡(luò)如果沒有好的信息交換系統(tǒng),計算機(jī)如果不能共享存儲,那后果可想而知。顯然,博士將IP存儲融入到Infiniband高速網(wǎng)絡(luò)中是很明智的選擇。這方面,Voltaire公司應(yīng)該說是非常重要的,他們的Voltaire Grid Director ISR9288交換機(jī)在這里建了奇功。因為只有Infiniband網(wǎng)絡(luò)才能提供博士所需要的性能,另外,這款交換機(jī)的288個端口讓整個系統(tǒng)的布線變得簡單了許多。不要小看這個設(shè)計,就這一方面,就讓以后的系統(tǒng)管理與升級和設(shè)備排查變得輕松了。因為交換機(jī)就那幾臺(一共就8臺),從控制臺上就可以發(fā)現(xiàn)是哪個交換模塊或者端口的故障,這要比用傳統(tǒng)的網(wǎng)絡(luò)方便許多。


    整個系統(tǒng)就這樣不可思議的搭建起來了,占據(jù)了大學(xué)的三層樓房,面積達(dá)到350多平方米,共計50噸。在我們的眼里,它那是我們心中的小燕子啊,應(yīng)該是神秘莫測的鳳凰才對。


    然而,盡管TSUBAME今天已經(jīng)成長得落落大方,但是,她還是平民血統(tǒng),因此,應(yīng)用TSUBAME的人很多,可以說她非常平易近人,這也是很多高性能計算機(jī)不能做到的。


    由于TSUBAME生在東京工業(yè)大學(xué),所以她也肩負(fù)這學(xué)校的學(xué)籍注冊與管理的功能,你可以用自己的學(xué)生證登陸到TSUBAME上,用她來查閱資料,或者做自己的畢業(yè)設(shè)計等大型程序運(yùn)算。


    現(xiàn)在很多學(xué)校的老師領(lǐng)到科研經(jīng)費(fèi)后,都用TSUBAME來做科學(xué)計算。比如我們知道的海嘯模型的運(yùn)算,以及汽車的工業(yè)設(shè)計。很多學(xué)生也會根據(jù)自己的需要,分到幾個CPU,去做自己的動畫設(shè)計或者圖形視頻的處理等??梢哉f,在大家的眼中,TSUBAME根本就不是我們傳統(tǒng)意義上的超級計算機(jī)。


    也正是因為這樣,現(xiàn)在整個高性能方面大家開始探討新的模式,到底該怎樣做到低成本而高應(yīng)用率,因為這如果現(xiàn)實可行的化那么計算經(jīng)濟(jì)時代可能會提前到來,這比先前我們經(jīng)常提的網(wǎng)格經(jīng)濟(jì)還要實際。目前,日本很多大學(xué)紛紛效仿,都在做這方面的工作。博士這次趁著亞洲學(xué)術(shù)交流會議的時間,也走訪了中國的清華大學(xué),希望更多得展開合作和技術(shù)交流,讓TSUBAME的計算能力為中國的用戶出力。


    最后,博士還告訴我們,TSUBAME也在升級,2007年TSUBAME將達(dá)到 110 TF, Storage 1.6 PB, 128GB nodes。而到2010年,TSUBAME2.0的計算能力將達(dá)到1PF ,還會保持日本第一的位置 ,到那時候,TSUBAME一定會讓世界人們所共享的,真正實現(xiàn)飛入尋常百姓家!


    筆者起筆這篇文章的時候,也正值國內(nèi)高性能計算要繼續(xù)沖擊新高度的時候,博士以學(xué)者的樸實和直率建議我們,中國的高樓大廈起來的非???,但是對高性能的投入并不是很多,希望中國在這方面多多努力,迎接信息爆炸時代的到來。

分享到

多易

相關(guān)推薦