高性能計(jì)算機(jī)與普通計(jì)算機(jī)有什么不同呢?第一個(gè)是系統(tǒng)的規(guī)模越來(lái)越大?,F(xiàn)在世界上最快的機(jī)器是IBM生產(chǎn)的,它有13萬(wàn)個(gè)處理器,這樣帶來(lái)什么樣的結(jié)果呢?就是很容易出故障,就是高性能計(jì)算需要故障率是很低的。第二個(gè)是對(duì)網(wǎng)絡(luò)要求比較高,下面有這樣一張圖,這是用Intel的工具把一個(gè)并行程序分開(kāi)來(lái),大家可以看到橫著的都是一個(gè)一個(gè)處理器
可以看到通信是非常頻繁的,也就是說(shuō)高性能計(jì)算的程序?qū)W(wǎng)絡(luò)的要求是很高的,可能現(xiàn)在數(shù)據(jù)處理千兆以太網(wǎng)可能就不夠了。第三,單點(diǎn)故障會(huì)影響整個(gè)程序,在執(zhí)行過(guò)程中只有有一個(gè)CPU出現(xiàn)故障的話,如果沒(méi)有做特殊軟件可靠性處理的話,整個(gè)程序就會(huì)失效。大家想想過(guò)去石油方面的程序一算要算一個(gè)月,如果算到第28天的時(shí)候有一個(gè)程序不可靠了,那就需要重新算,單點(diǎn)故障會(huì)影響到整個(gè)并行應(yīng)用的運(yùn)行。
高性能計(jì)算會(huì)給我們做高性能計(jì)算系統(tǒng)帶來(lái)一些挑戰(zhàn)。首先耗電特別大就會(huì)帶來(lái)一些問(wèn)題,現(xiàn)在有關(guān)部門(mén)提了一個(gè)很大的問(wèn)題,他們買(mǎi)機(jī)器的錢(qián)國(guó)家給批了,但是電費(fèi)、空調(diào)運(yùn)行的錢(qián)國(guó)家一直沒(méi)有批,所以在和國(guó)家發(fā)改委討論有一大部分錢(qián)是用于機(jī)器運(yùn)行的。所以低功耗的版本確實(shí)可以使制革的不成本大大降低。
第二,不光是本身耗電多了,在空調(diào)方面也是需要很多的電把熱散出去,這也是一個(gè)很大的挑戰(zhàn)。在05年我們測(cè)試曙光4000A的時(shí)候,當(dāng)時(shí)只能測(cè)320個(gè)節(jié)點(diǎn),也就是沒(méi)有把全部的節(jié)點(diǎn)都測(cè)掉,這還是相當(dāng)于我們做驗(yàn)收測(cè)試的時(shí)候做的,這是由散熱問(wèn)題導(dǎo)致的。另外一個(gè)問(wèn)題是機(jī)房的面積。
右邊這個(gè)圖是在全球TOP500企業(yè)里面處理器的個(gè)數(shù)是多少,這上面表示的是大致從128到2048個(gè)處理器,我們看到最下面的128k,就是說(shuō)系統(tǒng)規(guī)模確實(shí)是非常的大。
高性能計(jì)算節(jié)點(diǎn)運(yùn)算非常的頻繁,第一要做一套專用的計(jì)算寬帶網(wǎng)絡(luò),整個(gè)這套系統(tǒng)里有存儲(chǔ)網(wǎng)絡(luò),這又是一套網(wǎng)絡(luò),除了這些以外其有一個(gè)管理網(wǎng)絡(luò)。另外還有鍵盤(pán)、鼠標(biāo)控制這些機(jī)器,如果按照傳統(tǒng)方法做的話至少需要4套網(wǎng)絡(luò)才能實(shí)現(xiàn),我本來(lái)想照張照片機(jī)器后面這些線為什么聯(lián)起來(lái)亂了,因?yàn)橐恍┰虿惶谜?,所以沒(méi)有照出來(lái),就是說(shuō)這些線是很混亂的。這個(gè)結(jié)果是什么呢?故障是跟你的復(fù)雜度成正比的,你知道這些都是潛在故障的源泉。
我這里有一張圖,橫著和豎著是兩個(gè)進(jìn)程,比如說(shuō)左上角就是通信1和通信2的延遲,大家可以看到還有一行紅色的,代表的是某一個(gè)進(jìn)程和其它進(jìn)程的延遲都是比其它很正常的延遲大,實(shí)際上這個(gè)網(wǎng)絡(luò)不是不通,網(wǎng)絡(luò)是通的,但實(shí)際上就是比較慢。這樣大家覺(jué)得對(duì)一般的應(yīng)用不是很?chē)?yán)重,但是這在高性能計(jì)算里面是比較嚴(yán)重的故障。
我們討論了高性能計(jì)算對(duì)系統(tǒng)的需求和挑戰(zhàn)以后,我們來(lái)看一看刀片服務(wù)器能夠給我們提供什么樣的好處。首先第一個(gè)好處刀片服務(wù)器的密度比較高,可以節(jié)省機(jī)房的面積。這里我們有一套HP Bladesystem C-Class刀片機(jī)箱,有10U的高度,這樣可以插16個(gè)BL46O刀片,在空間上就可以節(jié)省40%,這是很明顯的。
第二,新一代刀片服務(wù)器機(jī)柜里面集成了供電和冷卻工作,在整個(gè)機(jī)柜里面把風(fēng)路和供電都設(shè)計(jì)好了,這樣的效率會(huì)比較高一點(diǎn),可以節(jié)電約20-30%。同樣如果在耗電方面降低了這么多,在散熱方面也就降低了一些,這樣使得整個(gè)機(jī)房的維護(hù)性都提高了。
第三個(gè)優(yōu)點(diǎn),刀片服務(wù)器在背板上集成了交換網(wǎng)絡(luò),所以線纜的數(shù)量是大大減少的。這張圖,那么這類的問(wèn)題就可以減少了很多,然后還可以提高部署速度,在背板上就可以把這些很好的管理起來(lái)。
另外還有一點(diǎn),其實(shí)做電信的朋友都很清楚,機(jī)架式服務(wù)器都是橫著放的,為什么刀片都是豎著放的?電信有者路由器的老師準(zhǔn)備跟我討論過(guò)這個(gè)問(wèn)題,刀片服務(wù)器豎著放可以降低存儲(chǔ)的短路,同樣在某種程度上就減少了故障。
當(dāng)然我是從學(xué)術(shù)的觀點(diǎn)來(lái)談的,雖然這是刀片的論壇,但也會(huì)講講刀片服務(wù)器的不足。一方面購(gòu)買(mǎi)成本高,對(duì)小規(guī)模用戶價(jià)格較貴。第二個(gè)刀片的不足是標(biāo)準(zhǔn)比較多,剛才Intel也說(shuō)加入了很多聯(lián)盟,那么這有一個(gè)問(wèn)題就是這些聯(lián)盟之間是不是互操作的,能不能很好的互相兼容,這是很多用戶很關(guān)心的問(wèn)題,我想這也是整個(gè)產(chǎn)業(yè)下一步發(fā)展需要關(guān)注的問(wèn)題。
包括HP PCLASS和CCLASS都不能兼容,所以標(biāo)準(zhǔn)怎么制定也是一個(gè)很大的問(wèn)題。如果對(duì)小規(guī)模的用戶來(lái)講沒(méi)有必要追求時(shí)髦,如果只有10個(gè)處理器以外的應(yīng)用,現(xiàn)在傳統(tǒng)的機(jī)架式的服務(wù)器我想應(yīng)該能夠很好的滿足你的要求。
剛才討論了高性能計(jì)算的特點(diǎn),也討論了刀片服務(wù)器的優(yōu)點(diǎn)和缺點(diǎn),我們下面來(lái)討論一下計(jì)算與刀片架構(gòu)的區(qū)別。優(yōu)點(diǎn)是密度高,節(jié)約機(jī)房面積,集成供電和冷卻、省電。缺點(diǎn),購(gòu)買(mǎi)成本高,對(duì)小規(guī)模用戶價(jià)格較貴,表針較多,互操作性和擴(kuò)展性不足,這個(gè)問(wèn)題對(duì)于高性能計(jì)算系統(tǒng)來(lái)說(shuō)也不是很?chē)?yán)重。
作為一個(gè)結(jié)果我們還是來(lái)看在世界前500強(qiáng)的刀片服務(wù)器已經(jīng)處于什么樣的位置,HP的刀片系統(tǒng)沒(méi)有進(jìn)入前10名,但500性中有152套HP C-CLASS Blade系統(tǒng),所以HP還是很值得一提的。刀片服務(wù)器在國(guó)際上已經(jīng)被廣泛的使用了,但是國(guó)內(nèi)的采用還是要滯后一點(diǎn)。
從高性能計(jì)算的角度我們對(duì)刀片還有哪些需求,能不能做的更好,我覺(jué)得有以下幾個(gè)方面能夠做的更好。第一是集成更高速度的互聯(lián)網(wǎng)絡(luò),從原來(lái)的2G到今后的10G、20G,我們?cè)诂F(xiàn)在的刀片服務(wù)器系統(tǒng)之間需要5微妙的時(shí)間。第二個(gè)是管理軟件,一會(huì)兒VMware公司也會(huì)講虛擬化技術(shù),目前我們也在做這方面的一些研究,因?yàn)閭鹘y(tǒng)的高性能計(jì)算跟用戶的接口是一個(gè)任務(wù)調(diào)度器,我們現(xiàn)在希望把虛擬化技術(shù)與刀片服務(wù)器技術(shù)提供起來(lái),能夠提供一個(gè)類似于專用的虛擬計(jì)算機(jī)。
另外跟剛才我講的高性能計(jì)算越來(lái)越大的趨勢(shì)有一點(diǎn)相反的是,桌面的高性能計(jì)算,原因是當(dāng)多內(nèi)核系統(tǒng)越來(lái)越常見(jiàn)的情況下,刀片可以集成很多的密度,就是12個(gè)處理器、16個(gè)處理器的計(jì)算機(jī)也是可以做出來(lái)的。
這有什么要求呢,第一就是高密度,這個(gè)刀片已經(jīng)解決掉了。第二就是需要低功耗。第三個(gè)就是低噪音。我們實(shí)驗(yàn)室有準(zhǔn)備的機(jī)房,因?yàn)槲覀兘?jīng)常做高性能計(jì)算,我們做媒體的一位老師,現(xiàn)在發(fā)現(xiàn)有的學(xué)生不愿意去實(shí)驗(yàn)室了,因?yàn)樗莾旱脑胍籼?,所以在低噪音方面也可以做一些新的嘗試。我想多核的發(fā)展本來(lái)是從低端拉到高端的過(guò)程,要想使得這個(gè)過(guò)程更加順暢,我想應(yīng)該把它從機(jī)房請(qǐng)出來(lái),請(qǐng)到桌面上,那么低噪音是今后努力的一個(gè)方向。
總結(jié)一下,一開(kāi)始沒(méi)有機(jī)架式服務(wù)器,那么機(jī)架式服務(wù)器提供了一個(gè)擺放的方式,那么在這基礎(chǔ)上出現(xiàn)了刀片服務(wù)器,它的優(yōu)點(diǎn)也是我們非常歡迎的,我們也說(shuō)了刀片服務(wù)器的一些特點(diǎn)和高性能計(jì)算的特點(diǎn),我們認(rèn)為這兩個(gè)是配合的非常好的,它以后會(huì)在這個(gè)領(lǐng)域得到進(jìn)一步的發(fā)展。謝謝。