四川物探戴爾HPCC系統(tǒng)拓?fù)鋱D
穩(wěn)定運行彰顯優(yōu)異性能
方案確定后,為確保本項目在實施過程中萬無一失,戴爾為此成立了專門的項目組織機構(gòu),制訂了覆蓋產(chǎn)品出廠驗收、發(fā)貨、到貨安裝、驗收、項目交接、售后服務(wù)等全部環(huán)節(jié)的詳盡實施方案,并派出6個小組分別負(fù)責(zé)領(lǐng)導(dǎo)、調(diào)度、實施、技術(shù)支持與維護(hù)、項目協(xié)調(diào)與意見反饋和整理文檔任務(wù)。作為在本項目的負(fù)責(zé)人,四川物探計算機所所長曾偉先生對此印象深刻:“要成功部署這樣大規(guī)模的HPCC系統(tǒng),供應(yīng)商必須擁有資深技術(shù)背景的專家團(tuán)隊、豐富的實踐經(jīng)驗,以及銜接緊密的工作鏈條,戴爾在這幾方面都有較強的優(yōu)勢,最終確保了全部安裝工作如期完成并順利通過驗收?!?BR>
2005年5月中旬,這套戴爾HPCC系統(tǒng)正式投入運行,截止目前,四川物探已有三個地震處理項目移師到新的計算平臺上開展。曾偉先生介紹說,“在正式運行之前,我們曾在這套HPCC系統(tǒng)上做過Linpack測試,它的浮點運算速度高達(dá)每秒七千億次(700GFLOPS)。就目前實際運行效果而言,整個系統(tǒng)運行非常穩(wěn)定,數(shù)據(jù)處理速度非???,能夠支持我們開展更多、更大的三維疊前深度偏移計算。”
具體而言,這套戴爾HPCC系統(tǒng)的優(yōu)異之處主要體現(xiàn)在以下三個方面:
首先,戴爾新一代服務(wù)器實現(xiàn)了系統(tǒng)整體性能的顯著提升。PE1850是基于帶有800MHz總線的英特爾至強處理器和英特爾E7520芯片組的新一代雙路服務(wù)器,它集成了一系列全新的和增強的平臺技術(shù),例如:與傳統(tǒng)的PCI相比,新的PCI Express I/O技術(shù)設(shè)計有更低的內(nèi)存和I/O延遲以及更高的帶寬,在地震資料處理這樣的計算和I/O密集型應(yīng)用環(huán)境中,能夠提供充分利用處理器功能所需的數(shù)據(jù)傳輸速度;此外,新一代DDR2-400內(nèi)存帶寬更大,延遲更短,并能夠降低40%的功耗;而超線程(HT)技術(shù)帶來的線程級并行計算能力,則有助于提高處理器利用率,從而改進(jìn)整個系統(tǒng)的響應(yīng)時間和響應(yīng)效率。這些技術(shù)賦予了它支持高性能計算所需的卓越的計算性能和響應(yīng)能力,也為四川物探進(jìn)一步開拓地震資料處理業(yè)務(wù)奠定了堅實的硬件基礎(chǔ)。
其次,合理的網(wǎng)絡(luò)架構(gòu)為大規(guī)模數(shù)據(jù)傳輸提供恰如所需的I/O性能。針對計算網(wǎng)絡(luò)、管理網(wǎng)絡(luò)和存儲系統(tǒng)對于帶寬資源的不同需求,本系統(tǒng)量身定制了三種方案:
應(yīng)用功能強大的CISCO 4507核心交換機支持計算節(jié)點之間、計算節(jié)點與I/O節(jié)點之間的通訊,不僅如此,在數(shù)據(jù)傳輸任務(wù)最密集的I/O節(jié)點中,還特別將其雙千兆網(wǎng)卡采用Teaming技術(shù)連接到該核心交換機中,這樣,一方面可利用多網(wǎng)卡同時工作來提高網(wǎng)絡(luò)速度,另一方面則實現(xiàn)了不同網(wǎng)卡之間的負(fù)載均衡(Load balancing)和網(wǎng)卡冗余(Fault tolerance),從而大大提高了系統(tǒng)整體的I/O性能。
對于I/O壓力稍輕的管理網(wǎng)絡(luò),方案選擇了戴爾百兆交換機來支持通訊,既滿足了應(yīng)用的需要,又有效控制了IT投資支出,同時管理網(wǎng)絡(luò)獨立運行,不占用計算網(wǎng)絡(luò)的帶寬,從而真正實現(xiàn)了帶外(Out of band)管理;而對于數(shù)據(jù)存取最為頻繁的存儲網(wǎng)絡(luò),方案采用了DELL|EMC DS-16B2光纖交換機來連接I/O節(jié)點與后臺存儲,2GB的全光纖通道為海量地震資料的輸入輸出提供了充裕的帶寬資源。
第三,海量存儲資源系統(tǒng)得到最充分的利用。本項目中,擁有30TB存儲空間的DELL|EMC CX700身兼二職:一方面支持本套HPCC中的數(shù)據(jù)存儲,另一方面,還將為四川物探已有的4套較小規(guī)模的HPCC系統(tǒng)提供重要數(shù)據(jù)的備份服務(wù),從而進(jìn)一步加強數(shù)據(jù)的安全保障。目前,這套新的HPCC系統(tǒng)已通過骨干交換網(wǎng)與原有的4套HPCC系統(tǒng)相連,以此構(gòu)建起了一個超大規(guī)模的高性能計算集群,備份計劃正在有序進(jìn)行。
談到未來的發(fā)展,曾所長表示,未來幾年內(nèi)四川物探HPCC系統(tǒng)將陸續(xù)擴展到3000個節(jié)點以上,“我們不僅要發(fā)展成為國內(nèi)最大的山地地震勘探工程與技術(shù)服務(wù)商,而且還要努力在技術(shù)上趕超世界先進(jìn)水平。憑借先進(jìn)強大的HPCC系統(tǒng),我們會爭取盡早實現(xiàn)這一目標(biāo),并努力為西部油氣開發(fā)做出更大貢獻(xiàn)?!?BR>