• 按使用量付費(fèi)——客戶可以按照應(yīng)用程序的運(yùn)行時(shí)間或者按使用存儲(chǔ)和數(shù)據(jù)傳輸服務(wù)的時(shí)間支付費(fèi)用。
• 近乎無限的基礎(chǔ)架構(gòu)——幾乎可以實(shí)時(shí)享用基礎(chǔ)架構(gòu);反過來,沒有工作負(fù)載時(shí),基礎(chǔ)架構(gòu)可以縮回到近乎零資源。
• 根據(jù)工作負(fù)載配置資源——可以根據(jù)工作負(fù)載,隨時(shí)分配操作系統(tǒng)或服務(wù)器的類型,大幅改進(jìn)了資源配置方面的靈活性。
實(shí)施HPC云面臨的障礙
盡管云計(jì)算有諸多優(yōu)勢(shì),但是在考慮云計(jì)算是否適合HPC環(huán)境時(shí)還有很多障礙需要克服。
• 安全性和知識(shí)產(chǎn)權(quán)——云環(huán)境中的數(shù)據(jù)對(duì)商業(yè)企業(yè)來說常常是核心的知識(shí)產(chǎn)權(quán)。絕不能忽視這種可能性:商業(yè)競(jìng)爭(zhēng)對(duì)手可能使用相同的共享計(jì)算資
• 軟件許可——大多數(shù)商業(yè)企業(yè)使用獨(dú)立軟件開發(fā)商(ISV)提供的第三方軟件來運(yùn)行或管理HPC作業(yè)。這些應(yīng)用軟件在購買時(shí)都附有法律協(xié)議,明確了該應(yīng)用程序可以在何處運(yùn)行,通常都規(guī)定該應(yīng)用程序只能在客戶的場(chǎng)地運(yùn)行。
• 數(shù)據(jù)轉(zhuǎn)移——除非企業(yè)完全采用云計(jì)算,棄用自己的數(shù)據(jù)中心,否則用于模擬的模和結(jié)果就必須在云計(jì)算提供商與客戶數(shù)據(jù)中心之間進(jìn)行傳輸。然而這項(xiàng)工作很復(fù)雜,因?yàn)榫蛡鬏敶笕萘课募?,互?lián)網(wǎng)帶寬很有限;而且對(duì)大多數(shù)基礎(chǔ)架構(gòu)即服務(wù)(IaaS)提供商來說,進(jìn)出云環(huán)境傳輸?shù)乃袛?shù)據(jù)都是按字節(jié)數(shù)計(jì)費(fèi)的“收費(fèi)服務(wù)”。
• 定價(jià)模式——按使用量付費(fèi)的模式常常對(duì)客戶有很大的吸引力,但如果長期使用公共云,其費(fèi)用通常比在兩年內(nèi)自己擁有和維護(hù)硬件的成本貴兩三倍。公司應(yīng)認(rèn)真確定在多長時(shí)間內(nèi)使用公共云比使用本地服務(wù)器更有優(yōu)勢(shì)。
面向HPC的云計(jì)算
HPC數(shù)據(jù)中心必須綜合考慮采用云計(jì)算的商業(yè)理由及其面臨的障礙,才能確定這種模式是否適合本企業(yè)以及哪種模式最適合自己。
實(shí)現(xiàn)HPC云需要幾款工具,包括虛擬機(jī)管理程序平臺(tái)、工作負(fù)載管理器和基礎(chǔ)架構(gòu)管理工具包。管理工具包應(yīng)該提供策略定義及執(zhí)行、配置管理、資源預(yù)留及報(bào)告等功能。虛擬機(jī)管理程序平臺(tái)應(yīng)該為云計(jì)算資源的虛擬部分提供良好的基礎(chǔ)。最后,工作負(fù)載管理器應(yīng)該提供作業(yè)管理功能。
對(duì)多數(shù)大型HPC環(huán)境來說,用戶需要考慮采用私有云還是混合云解決方案。在混合云環(huán)境中,可以在峰值需求期間使用外部公共云,這又叫“云爆發(fā)”(cloud bursting);比較小的HPC環(huán)境可能應(yīng)該考慮公共云,使用的所有資源都在云端。不管使用哪一種模式的云,特別重要的是確保基礎(chǔ)架構(gòu)包含可以同時(shí)充分利用物理資源和虛擬資源的管理層,因?yàn)镠PC應(yīng)用程序仍主要放置在物理機(jī)器上。在理想情況下,該管理層應(yīng)該能夠把虛擬機(jī)管理程序環(huán)境和物理環(huán)境合并為一個(gè)動(dòng)態(tài)共享的基礎(chǔ)架構(gòu),既支持多種操作系統(tǒng),又支持異構(gòu)環(huán)境。
混合云方案對(duì)HPC環(huán)境來說可能非常有優(yōu)勢(shì),因?yàn)樗梢蕴峁┩瓿勺鳂I(yè)所需要的額外計(jì)算能力。在下列情況尤其應(yīng)該考慮采用云爆發(fā)方案:
• 預(yù)計(jì)作業(yè)在本地運(yùn)行的等待時(shí)間過長時(shí);
• 如果作業(yè)在本地運(yùn)行所需的累計(jì)運(yùn)行時(shí)間過長時(shí);
• 當(dāng)作業(yè)對(duì)進(jìn)出云環(huán)境的數(shù)據(jù)傳輸要求不高時(shí)。
一旦確定了企業(yè)實(shí)施云計(jì)算的最佳方案,就可以采用多種方法來評(píng)估IaaS提供商,看看哪一家提供商最適合本企業(yè)的應(yīng)用和工作負(fù)載要求。評(píng)估時(shí)要考慮的因素包括性能、可靠性、創(chuàng)建實(shí)例的速度、價(jià)格等,此外,還應(yīng)該考慮每一家IaaS提供商的洽談和定價(jià)流程以及政策,還要對(duì)照服務(wù)級(jí)別協(xié)議(SLA)評(píng)估可靠性??紤]上述每一個(gè)因素對(duì)于企業(yè)選擇最適合其用途的提供商大有幫助。
作者介紹
Chris Porter 現(xiàn)任Platform公司HPC云產(chǎn)品經(jīng)理,他在HPC和云計(jì)算領(lǐng)域有著豐富的經(jīng)驗(yàn),他曾經(jīng)撰寫過眾多有關(guān)HPC和云計(jì)算的白皮書。