基于x86架構(gòu)的MS SQL開放數(shù)據(jù)平臺(tái)

  基于x86架構(gòu)的MS SQL開放數(shù)據(jù)平臺(tái)

數(shù)據(jù)管理挑戰(zhàn)正在不斷升級(jí)

10 年前,數(shù)據(jù)庫(kù)管理員(DBA)主要關(guān)心的問題是如何優(yōu)化其數(shù)據(jù)庫(kù)管理系統(tǒng)的性能。而今天,DBA們開始注重如何實(shí)施高效的數(shù)據(jù)庫(kù)管理。因?yàn)橐坏┕芾韱T可以自動(dòng)化任務(wù)、標(biāo)準(zhǔn)化數(shù)據(jù)格式,制定維護(hù)流程,數(shù)據(jù)庫(kù)能夠自行履行其存儲(chǔ)和檢索數(shù)據(jù)的職責(zé)。

同時(shí),隨著Web 2.0 和其它技術(shù)的發(fā)展與應(yīng)用,數(shù)據(jù)庫(kù)需要處理的數(shù)據(jù)量也在急速增加,其中包括視頻、音頻文件等大容量數(shù)據(jù),而且數(shù)據(jù)已經(jīng)滲透到了日常業(yè)務(wù)運(yùn)營(yíng)的方方面面。因此,今天的DBA們實(shí)際上面臨比10年前更加復(fù)雜的情形與挑戰(zhàn),主要集中在以下幾點(diǎn):

一是數(shù)據(jù)量飛速增加。由于最近幾年來(lái)數(shù)據(jù)更新速度日益增加,各種新技術(shù)層出不窮,以及數(shù)據(jù)使用方式不斷推陳出新,企業(yè)生成的數(shù)據(jù)量也逐漸呈井噴之勢(shì)?,F(xiàn)在,各大企業(yè)都已經(jīng)采用ERP、CRM等解決方案,因此每天都會(huì)產(chǎn)生大量數(shù)據(jù)。

二是數(shù)據(jù)關(guān)聯(lián)性增加。新技術(shù)為我們使用數(shù)據(jù)的方式開創(chuàng)了更多可能性。在日常業(yè)務(wù)運(yùn)營(yíng)中,從電子商務(wù)網(wǎng)站到庫(kù)存管理,都需要借助數(shù)據(jù)和數(shù)據(jù)庫(kù)管理系統(tǒng)的能力,來(lái)將數(shù)據(jù)迅速傳遞給需要它的應(yīng)用。

三是服務(wù)器數(shù)量激增帶動(dòng)成本上升。由于順應(yīng)業(yè)務(wù)增長(zhǎng)部署了更多物理服務(wù)器,而服務(wù)器CPU等資源的利用率卻出現(xiàn)大幅下降,從而導(dǎo)致企業(yè)每年都需要從 IT 預(yù)算中支出大量的管理、維護(hù)和散熱成本,使得IT預(yù)算不斷緊縮的企業(yè)面臨更大的壓力。

四是數(shù)據(jù)挖掘與分析處理的壓力加大。如果這些數(shù)據(jù)不能被實(shí)時(shí)、有效地加以利用,形成對(duì)實(shí)際業(yè)務(wù)決策有用的信息,數(shù)據(jù)增長(zhǎng)反過來(lái)會(huì)帶來(lái)負(fù)面影響。

挑戰(zhàn)驅(qū)動(dòng)創(chuàng)新

上述挑戰(zhàn)一方面給企業(yè)帶來(lái)現(xiàn)實(shí)壓力,但另一方面也帶來(lái)了創(chuàng)新機(jī)會(huì)。那么,面向ERP、CRM等關(guān)鍵業(yè)務(wù)的數(shù)據(jù)密集型工作負(fù)載,需要什么樣的軟硬件數(shù)據(jù)管理平臺(tái)呢?筆者認(rèn)為,至少需要滿足以下幾個(gè)方面的要求:

一是可擴(kuò)展的處理能力。為管理數(shù)據(jù)密集型工作負(fù)載,將海量原始數(shù)據(jù)轉(zhuǎn)化成有用的信息,并提供實(shí)時(shí)分析和查詢服務(wù),需要有非常強(qiáng)大的系統(tǒng)處理能力做支撐,以優(yōu)化復(fù)雜多線程的應(yīng)用性能。

二是出色的可靠性。由于某個(gè)數(shù)據(jù)庫(kù)出現(xiàn)故障所產(chǎn)生的負(fù)面效應(yīng)可能會(huì)波及整個(gè)企業(yè),影響重大,因此需要平臺(tái)能確保7*24小時(shí)不間斷提供服務(wù)。

三是靈活的虛擬化性能。為減少物理服務(wù)器的數(shù)量,提高IT的靈活性,通過虛擬化實(shí)現(xiàn)整合的能力已經(jīng)成為標(biāo)配,同時(shí)還需要通過虛擬機(jī)實(shí)時(shí)遷移、災(zāi)備等功能來(lái)提高可用性。

四是成本節(jié)省。對(duì)于許多處在激烈競(jìng)爭(zhēng)市場(chǎng)環(huán)境,IT預(yù)算緊縮的企業(yè)而言,降低包括硬件采購(gòu)、軟件許可證、管理維護(hù)、能耗等方面的成本一直是企業(yè)追求的目標(biāo)。

基于行業(yè)標(biāo)準(zhǔn)的開放數(shù)據(jù)管理平臺(tái)

2010年,微軟推出了這樣一款全新數(shù)據(jù)管理平臺(tái):在英特爾至強(qiáng)7500服務(wù)器上部署SQL Server 2008 R2所提供的托管型自助式 BI解決方案,可以針對(duì)超大型數(shù)據(jù)集近乎實(shí)時(shí)地分析和查詢復(fù)雜數(shù)據(jù)。

據(jù)了解,使用微軟自助式BI方案,最終用戶可以利用面向 Excel 的 PowerPivot插件等自助式分析工具,迅速查找到所需信息,進(jìn)行特定分析和建模,幫助用戶近乎實(shí)時(shí)地在大型數(shù)據(jù)集上執(zhí)行復(fù)雜運(yùn)算,從而獲得有用信 息,做出更好的業(yè)務(wù)決策。管理員也同樣可以借助SQL Server 2008 R2的StreamInsight技術(shù),在不到一秒內(nèi)橫跨多條數(shù)據(jù)流處理大量事件,幫助企業(yè)通過歷史數(shù)據(jù)挖掘和持續(xù)了解動(dòng)態(tài)數(shù)據(jù),更迅速地識(shí)別和響應(yīng)新趨 勢(shì)。

因此,這種方案對(duì)事務(wù)處理能力提出非常高的要求,而基于至強(qiáng)7500的服務(wù)器可以擴(kuò)展至8個(gè)以上處理器,每個(gè)處理器可容納8個(gè)內(nèi)核,支持 16 條線程,而且還有1-2TB超大內(nèi)存容量,大大降低延遲,提高數(shù)據(jù)庫(kù)性能和 SQL Server 2008 R2 的能力。當(dāng)然,數(shù)據(jù)密集型工作負(fù)載,對(duì)于系統(tǒng)的可擴(kuò)展性要求也很高。比如現(xiàn)在的SQL Server 2008 R2可以支持多達(dá)256 顆邏輯處理器(原來(lái)是64顆處理器)和超過 64 條線程,用戶還可通過 SQL Server 2008 R2將數(shù)據(jù)倉(cāng)庫(kù)容量從數(shù)十萬(wàn)億字節(jié)到數(shù)百萬(wàn)億字節(jié)。對(duì)此,至強(qiáng)7500和至強(qiáng)E7也提供了相應(yīng)的擴(kuò)展性,在單一系統(tǒng)內(nèi),最大可以支持到256顆CPU,從 而能夠支持到最苛刻的數(shù)據(jù)密集型應(yīng)用。

在可靠性上,至強(qiáng)7500 系列的服務(wù)器具備 20多項(xiàng)全新 RAS 特性,這些特性包括處理器間動(dòng)態(tài)工作負(fù)載分配、互聯(lián)錯(cuò)誤檢測(cè)和恢復(fù),以及虛擬環(huán)境中的單個(gè)虛擬機(jī)恢復(fù)等。比如,Windows Server 2008 R2 具備 的Windows 硬件錯(cuò)誤體系結(jié)構(gòu)(WHEA)支持至強(qiáng)7500中的機(jī)器校驗(yàn)架構(gòu)恢復(fù)(MCA)特性,可幫助平臺(tái)在不中斷操作系統(tǒng)應(yīng)用的情況下,控制和恢復(fù)內(nèi)存與高速緩存 中的多位 ECC 錯(cuò)誤——以前只有成本高昂的 RISC/UNIX 平臺(tái)和大型機(jī)才具備這些功能。

在TCO方面,X86服務(wù)器的硬件采購(gòu)成本往往只有小型機(jī)的幾分之一,但更重要的是,使用開放平臺(tái),有助于節(jié)省大量軟件支持和許可成本。由于基于 UNIX 的軟件通常按處理器內(nèi)核數(shù)量而并非按插座數(shù)量計(jì)價(jià),因此可節(jié)省成倍的成本。此外,由于微軟不額外收取在線分析處理(OLAP)、數(shù)據(jù)挖掘、數(shù)據(jù)壓縮、分區(qū) 及其它特性的相關(guān)費(fèi)用,因此相比Oracle等其他平臺(tái),在Windows Server 2008 R2 上運(yùn)行 SQL Server 2008 R2的成本也更低。

另外,值得一提的是,SQL Server 2008 R2 已經(jīng)支持 Hyper-V 實(shí)時(shí)遷移,允許用戶在確保不停機(jī)的情況下在主機(jī)之間轉(zhuǎn)移正在運(yùn)行中的虛擬機(jī)。SQL Server 2008 R2還支持Sysprep,這樣一來(lái),管理員可以更輕松地創(chuàng)建 SQL Server 圖像,隨時(shí)隨地迅速將它們部署在虛擬機(jī)中。對(duì)此,企業(yè)可以通過至強(qiáng)7500,以20:1的整合比率更換和整合過去的單核服務(wù)器,并可在1年內(nèi)通過能耗、軟 件、許可證和維護(hù)成本的節(jié)省收回服務(wù)器更新帶來(lái)的投資。

測(cè)試:Temenos T24銀行核心軟件

下面我們進(jìn)一步通過測(cè)試來(lái)了解一下,“至強(qiáng)7500+微軟SQL Server 2008 R2”這一組合的性能表現(xiàn)。

Temenos 是一家全球性的銀行軟件系統(tǒng)供應(yīng)商,它的產(chǎn)品涵蓋了零售銀行、對(duì)公及代理銀行、通用銀行、私人銀行、伊斯蘭銀行以及微型金融及社區(qū)銀行等市場(chǎng),在120個(gè) 國(guó)家里為1100多家客戶提供服務(wù)。Temenos T24是該公司推出的目前世界上技術(shù)水平最高的銀行系統(tǒng)軟件,旨在面向24小時(shí)不間斷提供服務(wù)的銀行業(yè)務(wù)應(yīng)用。

2010年7-8月,微軟、Temenos和英特爾在美國(guó)華盛頓進(jìn)行了一次聯(lián)合測(cè)試,主要了解Temenos T24在最新x86平臺(tái)上性能和可擴(kuò)展性方面的表現(xiàn)。

測(cè)試結(jié)果表明,在至強(qiáng)7500服務(wù)器上,運(yùn)行微軟SQL 2008 R2企業(yè)版、Windows Server 2008 R2數(shù)據(jù)中心版和Temenos T24 R10零售銀行系統(tǒng)模型,每秒可處理的交易量達(dá)到5230 TPS(來(lái)自于320個(gè)代理),在線測(cè)試達(dá)到3437 TPS,每秒最大可執(zhí)行14萬(wàn)個(gè)SQL批處理,IOPS性能是每秒7.8個(gè)收支操作,在兩小時(shí)之內(nèi)可執(zhí)行2500萬(wàn)個(gè)COB帳戶處理,這些結(jié)果刷新了以往 的記錄。

小結(jié):走向開放

數(shù)據(jù)管理不再是存儲(chǔ)-檢索的過程,隨著技術(shù)應(yīng)用的發(fā)展,以至強(qiáng)為核心的X86服務(wù)器,以及微軟SQL Server數(shù)據(jù)庫(kù)軟件也在不斷改進(jìn)企業(yè)處理大規(guī)模數(shù)據(jù)的方式——對(duì)海量數(shù)據(jù)進(jìn)行實(shí)時(shí)分析,并向企業(yè)各級(jí)用戶快速提供有用的信息。比如中國(guó)人壽業(yè)務(wù)決策平 臺(tái)正是如此,將分散在公司各處的海量數(shù)據(jù)快速整合在 SQL Server 2008 R2 數(shù)據(jù)倉(cāng)庫(kù)內(nèi),然后提供決策分析時(shí)隨時(shí)調(diào)用。

以往,專用的數(shù)據(jù)平臺(tái)通常都是基于 RISC 或 SPARC 架構(gòu)而構(gòu)建,上面跑基于UNIX 的軟件,此類平臺(tái)不僅購(gòu)買成本高,在申請(qǐng)?jiān)S可證、實(shí)施維護(hù)和培訓(xùn)方面的成本也較高。對(duì)于注重創(chuàng)新和成本效率的企業(yè)來(lái)說(shuō),今天開放的數(shù)據(jù)平臺(tái)提供了新的選 擇。但這也意味著使用專有平臺(tái)的企業(yè)需要做好遷移工作——將小型機(jī)換成X86服務(wù)器,將UNIX操作系統(tǒng)換成Linux或Windows,將應(yīng)用和數(shù)據(jù)從 原有系統(tǒng)遷移到新的系統(tǒng)中來(lái)。

分享到

zhabin

相關(guān)推薦