以金融及保險(xiǎn)服務(wù)業(yè)為例,其將歷史性與外部數(shù)據(jù)整合在一起,能立即評(píng)估出客戶的終生價(jià)值;無線通訊業(yè),則運(yùn)用詳細(xì)的客戶通話紀(jì)錄,來評(píng)估新的計(jì)費(fèi)方案;零售業(yè)使用客戶與存貨數(shù)據(jù),達(dá)到更有效的行銷、交叉銷售,且讓貨架上擺滿客戶所要的貨品。這類相關(guān)的例子可以說是不勝枚舉。


    近來,因?yàn)榇鎯?chǔ)設(shè)備成本降低,企業(yè)開始考慮永久儲(chǔ)存其所有數(shù)據(jù),認(rèn)為深度的歷史數(shù)據(jù),在時(shí)機(jī)來臨時(shí),可產(chǎn)生前所未有的商業(yè)智能與其它益處。


    但如果企業(yè)未仔細(xì)思考數(shù)據(jù)儲(chǔ)存容量的選擇,將可能導(dǎo)致系統(tǒng)運(yùn)算效能降低,進(jìn)而影響實(shí)時(shí)決策的制定以及策略方案的推行。然而,策略行動(dòng)也許會(huì)失敗,其原因可能是決策不夠?qū)崟r(shí),或是管理階層錯(cuò)認(rèn)為自己對外部挑戰(zhàn)與公司的能力有完整的了解。既使策略行動(dòng)勉強(qiáng)持續(xù),往往需要花費(fèi)眾多人力,來調(diào)整容量不適合公司商業(yè)需求的系統(tǒng),這樣不僅成本高昂也會(huì)令人感到挫敗。


    錯(cuò)以每個(gè)Megabyte的成本為重心


    由于詳細(xì)通聯(lián)記錄、交易數(shù)據(jù)與網(wǎng)絡(luò)點(diǎn)選流等數(shù)據(jù)的快速增加,企業(yè)的數(shù)據(jù)每8個(gè)月就增加一倍??上攵?,采用數(shù)據(jù)倉庫的企業(yè)會(huì)以每Megabyte的成本作為比較標(biāo)準(zhǔn),選擇成本最低的數(shù)據(jù)儲(chǔ)存系統(tǒng)。廠商也提供超高容量的硬盤,滿足企業(yè)日漸增加的數(shù)據(jù)需求,進(jìn)一步刺激了此方式的發(fā)展。


    但是,如果I/O的速度固定—-I/O速度的增加不像儲(chǔ)存容量提升一樣快,增加硬盤的容量,只會(huì)讓極需實(shí)時(shí)決策的企業(yè)難以快速存取數(shù)據(jù)。在這樣的情況下,選擇大容量所節(jié)省的成本則失去其意義,因?yàn)榛藬?shù)百萬美元的新系統(tǒng)無法快速存取數(shù)據(jù),便無法達(dá)到原有的功效。


    當(dāng)然,除了磁盤容量之外,企業(yè)還有其它方式來解決效能的問題,例如分割、壓縮、先后順序排程、查詢最佳化與進(jìn)階索引(advancedindexing)等,都能提供有效的協(xié)助。但若能搭配符合企業(yè)策略目標(biāo)、運(yùn)算能力與數(shù)據(jù)溫度的儲(chǔ)存功能,上述技術(shù)便能發(fā)揮更大的效力。


    多重溫度的數(shù)據(jù)倉儲(chǔ)


    要了解數(shù)據(jù)倉庫的儲(chǔ)存需求,必須先了解多溫度數(shù)據(jù)倉庫的概念。幾乎在所有數(shù)據(jù)倉庫系統(tǒng)中,數(shù)據(jù)具有不同的溫度。溫度高的數(shù)據(jù)是最近、最常用的數(shù)據(jù),同時(shí)擁有許多使用者及應(yīng)用程序進(jìn)行存取多種應(yīng)用。


    隨著需求降低,數(shù)據(jù)的溫度也降低。溫度較低的數(shù)據(jù)是歷史數(shù)據(jù),占據(jù)的數(shù)據(jù)倉庫容量比較熱的數(shù)據(jù)還大。但溫度低的數(shù)據(jù)偶爾會(huì)回溫。例如,健康保險(xiǎn)公司也許需要產(chǎn)生好幾年的紀(jì)錄,證實(shí)公司如何保護(hù)病人的隱私。


    考量數(shù)據(jù)溫度的容量規(guī)劃


    在了解多重溫度數(shù)據(jù)后,企業(yè)可以進(jìn)行容量的規(guī)劃,其中要測量的項(xiàng)目包含:數(shù)據(jù)的匯總溫度、系統(tǒng)容量、系統(tǒng)效能的需求與能力。此規(guī)劃過程需要商業(yè)與IT專業(yè)人員緊密合作,確保IT人員了解各種數(shù)據(jù)日后可能的使用方式。


    第一步是依據(jù)數(shù)據(jù)的存取頻率與大小,將數(shù)據(jù)分類。企業(yè)一開始可將數(shù)據(jù)分類為主要策略數(shù)據(jù)、目前決策支持?jǐn)?shù)據(jù)或歷史性決策支持?jǐn)?shù)據(jù),最后再?zèng)Q定各類別的數(shù)據(jù)溫度(測量數(shù)據(jù)溫度的公式也包含了數(shù)據(jù)查詢、更新與維護(hù)的效能需求)。


    接下來,企業(yè)必須決定各類別數(shù)據(jù)的容量與效能需求,進(jìn)而決定系統(tǒng)的需求。若采用較小的數(shù)據(jù)倉庫來儲(chǔ)存溫度高的數(shù)據(jù),目標(biāo)則是兼顧成本與效能,讓系統(tǒng)能提供支持重要決策的實(shí)時(shí)商業(yè)智能。大多數(shù)的企業(yè)會(huì)采用目前市場上最小的磁盤(如36GB,15KRPMdisks)與RAID-1備份系統(tǒng)。


    相對地,如果大部分儲(chǔ)存溫度低數(shù)據(jù)的數(shù)據(jù)倉庫,就比較不需要高效能,企業(yè)可以選擇更高的單位容量(如73GB或146GB磁盤)。也有些數(shù)據(jù)倉庫所儲(chǔ)存的數(shù)據(jù)在溫度上較平均,但不論是何種情形,在選擇磁盤容量大小時(shí),必須先測量各類數(shù)據(jù)的溫度,并且找到一個(gè)匯總溫度。


    做個(gè)有數(shù)據(jù)智能的人


    總而言之,數(shù)據(jù)倉庫所含的數(shù)據(jù),其價(jià)值在于其可支持決策的功能,特別是現(xiàn)今商業(yè)環(huán)境中重要的實(shí)時(shí)決策。商業(yè)與技術(shù)的合作,再加上了解多重溫度數(shù)據(jù)倉庫的概念,是數(shù)據(jù)倉庫是否能發(fā)揮應(yīng)有功效的關(guān)鍵所在。

分享到

多易

相關(guān)推薦