挑戰(zhàn): 減少高要求的大學(xué)環(huán)境中的高性能計(jì)算的成本
  
    解決方案: 一個(gè)128節(jié)點(diǎn)的DellTM PowerEdgeTM 1550服務(wù)器群集,每個(gè)節(jié)點(diǎn)配置了Intel® Pentium® III處理器,并運(yùn)行Linux® 操作系統(tǒng)
  
    優(yōu)勢(shì): 節(jié)省費(fèi)用;超級(jí)計(jì)算機(jī)等級(jí)的性能使新的研究類型成為可能;計(jì)算機(jī)資源供更多的研究人員使用;更高的可用性
  
    大學(xué)研究者傳統(tǒng)上都使用大量的計(jì)算資源。在建模從天氣到經(jīng)濟(jì)理論的各種事情,他們可能會(huì)使用成千上萬(wàn)的MIPS(每秒數(shù)百萬(wàn)條指令)。但在大多數(shù)學(xué)校,都不能提供足夠的計(jì)算資源。傳統(tǒng)上用來進(jìn)行數(shù)字密集型研究的超級(jí)計(jì)算機(jī)需要花費(fèi)數(shù)百萬(wàn)美元?而且需要專業(yè)化的昂貴的管理和維護(hù)。
  
    賓西法尼亞州立大學(xué)(賓州大學(xué))開創(chuàng)了一個(gè)新的途徑。他們利用DellTM PowerEdgeTM 服務(wù)器中數(shù)百個(gè)現(xiàn)成的Intel® 處理器提供超級(jí)計(jì)算機(jī)的處理性能,但成本僅占超級(jí)計(jì)算機(jī)的一小部分。
  
    賓州大學(xué)在1998年夏季使用Dell PrecisionTM 工作站進(jìn)行了第一次評(píng)測(cè)。在確認(rèn)了擴(kuò)展性之后,學(xué)校使用33個(gè)Dell PowerEdge 4350 服務(wù)器構(gòu)建了一個(gè)完整的群集。64處理器 LION-X 群集 – 以學(xué)校的吉祥物和群集的操作系統(tǒng)命名 – 為30多個(gè)研究者提供計(jì)算能力,這些研究者從事的工作不盡相同,從材料的設(shè)計(jì)到天氣的建模。
  
  以四分之一的空間提供兩倍性能
  
    在2001年,賓州大學(xué)通過構(gòu)建它的第二個(gè)Dell-Linux群集,提高了性能,降低了價(jià)格。這個(gè)群集包括Dell PowerEdge 15501 服務(wù)器,其中的CPU是第一個(gè)群集中的CPU的性能兩倍,但空間是以前的服務(wù)器的四分之一。
  
    “我們的兩個(gè)LION-X群集對(duì)于我們支持并行計(jì)算和增強(qiáng)計(jì)算研究人員的環(huán)境的能力來說非常關(guān)鍵,”高級(jí)研究程序員Jeff Nucciarone說,”充分利用Dell PowerEdge服務(wù)器的可靠性和性能以及基于標(biāo)準(zhǔn)的計(jì)算環(huán)境經(jīng)濟(jì)高效的特點(diǎn),我們可以使研究人員訪問具有強(qiáng)大運(yùn)算功能的硬件系統(tǒng),幫助他們解決復(fù)雜的計(jì)算問題。”
  
  




  
  圖1:機(jī)柜優(yōu)化Dell PowerEdge服務(wù)器在小空間內(nèi)最大化了計(jì)算能力
  
    群集作為可擴(kuò)展的企業(yè)計(jì)算和一個(gè)經(jīng)濟(jì)、價(jià)格具有競(jìng)爭(zhēng)力的學(xué)術(shù)研究和科學(xué)計(jì)算方法的一個(gè)新模型,正在快速贏得大家對(duì)它的關(guān)注。Dell服務(wù)器構(gòu)成的一個(gè)群集,再加上分解和在網(wǎng)絡(luò)上發(fā)布處理任務(wù)的計(jì)劃軟件,使得基于標(biāo)準(zhǔn)的日用設(shè)備即可以提供可與專用的、更為昂貴、高性能的計(jì)算機(jī)相媲美的計(jì)算速度。
  
  每平方英寸的性能是原來的八倍
  
    賓州大學(xué)在評(píng)測(cè)過程中考慮了很多因素?初始價(jià)格,易于維護(hù),可靠性,占用面積和外形,最后選擇了Dell作為供應(yīng)商。”我們已經(jīng)與Dell建立了穩(wěn)固的聯(lián)系,因此我們確信我們將會(huì)得到很好的支持,”賓州大學(xué)高性能計(jì)算和可視化部門主管Vijay Agarwala說,”Dell的定價(jià)極具競(jìng)爭(zhēng)力,而且他們的服務(wù)器的范圍滿足了我們的需求規(guī)范。他們的系統(tǒng)具有足夠的冗余性滿足我們對(duì)運(yùn)行時(shí)間和恢復(fù)的需要。最后,我們需要一個(gè)機(jī)柜安裝的系統(tǒng)來滿足我們的物理空間需要,PowerEdge很好地滿足了這一類型的配置需要。”
  
    新的LION-XE群集包括128個(gè)PowerEdge 1550服務(wù)器,每臺(tái)服務(wù)器配置了兩個(gè)1GHz的Intel Pentium® III處理器,配備了2GB內(nèi)存和36GB SCSI硬盤。其它的特性還包括一個(gè)快速64位、66MHz的外設(shè)部件互聯(lián)(PCI)總線,連接到兩個(gè)Gigabit 2 網(wǎng)絡(luò),并在主板上集成了兩個(gè)以太網(wǎng)適配器。
  
    超薄的1U外形是PowerEdge 1550的另一個(gè)優(yōu)勢(shì)。”因?yàn)镻owerEdge 1550很薄而且處理器的性能比我們第一個(gè)群集中的處理器更高,我們現(xiàn)在每平方英寸的能力是以前的八倍,”Agarwala說,”在專用系統(tǒng)世界中您不會(huì)看到如此快速的改進(jìn)性價(jià)比。”
  
  開放源碼Linux的自由
  
  Linux® 操作系統(tǒng)在軟件方面提供了同樣的自由、低成本和快速創(chuàng)新。”因?yàn)長(zhǎng)inux是開放源碼軟件,我們可以輕松進(jìn)入Linux世界,”研究編程人員Jason Holmes說,”我們不會(huì)受到專用系統(tǒng)的限制。開放性使我們能夠與其它人合作,貢獻(xiàn)和利用其它人員開發(fā)的解決方案。我們不用等待提供商開發(fā)我們需要的應(yīng)用。”
  
  由于在線提供,LIOX-X和LION-XE群集的性能已經(jīng)超過了預(yù)期值。賓州大學(xué)研究計(jì)算的工作人員運(yùn)行的基準(zhǔn)測(cè)試同樣證明了它們的出色性能。這些基準(zhǔn)提供在LION-XE網(wǎng)站上(http://gears.aset.psu. edu/hpc/systems/lionxe/performance/)。
  
  高需求
  
  來自校內(nèi)的各個(gè)系的需求非常高,因此Holmes實(shí)現(xiàn)了一個(gè)計(jì)劃系統(tǒng)來容納每個(gè)人的項(xiàng)目。LION-XE群集實(shí)際上是由賓州大學(xué)的13個(gè)不同的研究小組和學(xué)術(shù)計(jì)算中心共同購(gòu)買的。沒有提供資助的其它研究者也可以使用它。
  
  “這些小組認(rèn)識(shí)到可以將他們的資金集中起來購(gòu)買一個(gè)大型的共享計(jì)算機(jī),而不是每個(gè)小組購(gòu)買一臺(tái)小型的機(jī)器,”Holmes說,”現(xiàn)在他們都可以使用一個(gè)更為強(qiáng)大的系統(tǒng),因?yàn)槿杭诟鱾€(gè)任務(wù)之間會(huì)出現(xiàn)休閑時(shí)間,所以我們實(shí)現(xiàn)了一個(gè)計(jì)劃系統(tǒng),允許運(yùn)行較短的任務(wù),另外還支持其它的小組在群集沒有被優(yōu)先的團(tuán)隊(duì)使用時(shí)使用群集。”
  
  一切都與數(shù)據(jù)相關(guān)
  
  總體看來,大約80%的研究者在全時(shí)地使用LION-XE群集。LION-XE群集為大量的研究性工作提供支持。
  
  昆蟲學(xué)和生物學(xué)教授Ottar N. Bjornstad使用LION-XE群集來研究傳染性疾病流行性的升降,重點(diǎn)是了解感染的空間分布和預(yù)測(cè)本地流行的范圍。他的研究工作廣泛使用了群集來估計(jì)空間網(wǎng)絡(luò)和隨機(jī)模擬時(shí)空模型。對(duì)于設(shè)計(jì)干預(yù)戰(zhàn)略和控制人類的疾病和bioterror agents來說,這項(xiàng)工作有著十分重要的切實(shí)可行的結(jié)果。
  
  而Garrison小組利用LION-XE群集進(jìn)行分子動(dòng)態(tài)(MD)模擬,從而對(duì)能源的快速分解過程進(jìn)行建模。其中的一個(gè)過程是激光切除。這個(gè)小組已經(jīng)開發(fā)一個(gè)新的呼吸球模型,使他們可以延長(zhǎng)仿真的時(shí)間和長(zhǎng)度。激光切除應(yīng)用中包括對(duì)大型生物分子進(jìn)行大量的光譜測(cè)定、薄膠片分解以及醫(yī)療過程,例如眼睛手術(shù)LASIK。
  
  “我們十分吃驚地看到使用現(xiàn)成的技術(shù)能夠使科研團(tuán)體更好地訪問并行計(jì)算資源,”學(xué)術(shù)計(jì)算中心的高級(jí)主管Kevin Morooney說,”利用LIOX-XE群集,我們已經(jīng)采取了一個(gè)均衡的方法,提供了不僅具有非??斓牟⑿杏?jì)算周期而且具有高可用性的環(huán)境。”
  
  賓州大學(xué)正在評(píng)測(cè)基于Intel新的64位架構(gòu)的Dell的服務(wù)器。”毫無疑問,它是我們的未來,”Agarwala說,”64位架構(gòu)是很多大規(guī)模計(jì)算的理想選擇。Dell服務(wù)器的發(fā)展速度是驚人的。”

分享到

多易

相關(guān)推薦