圖1:數(shù)據(jù)保留的各項(xiàng)要求
上圖表明,1%的企業(yè)數(shù)據(jù)必須為了訴訟需求而保留下來(lái),5%的數(shù)據(jù)必須受控以滿(mǎn)足合規(guī)性要求。另外還有25%的數(shù)據(jù)是具有商業(yè)價(jià)值的。 那意味著69%的數(shù)據(jù)其實(shí)是毫無(wú)價(jià)值的。
也許有人會(huì)對(duì)這些數(shù)據(jù)的準(zhǔn)確性提出質(zhì)疑,但是讓我們先來(lái)進(jìn)行一項(xiàng)合理的測(cè)試:在很大程度上,企業(yè)和它們的IT部門(mén)主要專(zhuān)注于當(dāng)前正在發(fā)生的事情(當(dāng)前的交易、電子郵件和分析等),而并不是數(shù)據(jù)積累的過(guò)程。
IT部門(mén)就向是數(shù)據(jù)的監(jiān)護(hù)人一樣,而且該部門(mén)同時(shí)承擔(dān)著存儲(chǔ)和管理數(shù)據(jù)的成本,但他們并不是那樣數(shù)據(jù)的所有者。可能業(yè)務(wù)部才是那些數(shù)據(jù)真正的所有者,對(duì)于個(gè)人員工來(lái)說(shuō),他們只是某些特定數(shù)據(jù)集的管理員。 但是如果員工帶著他們的電子郵件離開(kāi)公司會(huì)怎么樣呢?那么剩下的數(shù)據(jù)是否就是再也不會(huì)被用到的數(shù)據(jù)碎片了呢? 誰(shuí)知道呢?這又該誰(shuí)來(lái)管理呢? 答案是:也許沒(méi)人來(lái)管理那些數(shù)據(jù)。
進(jìn)行數(shù)據(jù)處理的原因
現(xiàn)在我要提出一個(gè)問(wèn)題了:清除掉無(wú)用的數(shù)據(jù)到底有多重要呢?
假如20%的IT預(yù)算是用于存儲(chǔ)領(lǐng)域,而且你們70%的數(shù)據(jù)對(duì)企業(yè)來(lái)說(shuō)是毫無(wú)價(jià)值的。那就意味著14%左右的IT存儲(chǔ)預(yù)算被浪費(fèi)掉了。 各位首席信息官們,這能夠引起你們的重視嗎? 現(xiàn)在,即便能夠通過(guò)一些技術(shù)將所有沒(méi)有用的數(shù)據(jù)都安全地清除掉,那也不一定能夠馬上在成本節(jié)約上看到成效。雖然可以省下大量的磁盤(pán)空間,但是企業(yè)并不能將已經(jīng)配置的陣列再賣(mài)掉。 坦白說(shuō),你能夠從中省下來(lái)的開(kāi)支可能遠(yuǎn)比你以前花掉的開(kāi)支要少得多(這就好比是舊車(chē)折舊的問(wèn)題)。
釋放磁盤(pán)空間意味著以后的存儲(chǔ)設(shè)備采購(gòu)計(jì)劃可以延期了,但那并不能馬上轉(zhuǎn)化為成本上的節(jié)約。但是尋求成本節(jié)約最終是為了提高生產(chǎn)力,比如現(xiàn)在資金投入不足但又迫切需要的IT改革,這也許就是解決這一問(wèn)題最好的理由。
這個(gè)問(wèn)題是一種永遠(yuǎn)無(wú)法徹底解決的問(wèn)題。那意味著雖然你現(xiàn)在暫時(shí)還能容忍它,但是新數(shù)據(jù)的持續(xù)快速增長(zhǎng)必然會(huì)令情況不斷惡化,讓這個(gè)問(wèn)題越來(lái)越難以解決。
將業(yè)務(wù)轉(zhuǎn)到云并不能解決這個(gè)問(wèn)題,但是它也許會(huì)迫使企業(yè)加大對(duì)這個(gè)問(wèn)題的關(guān)注力度。云計(jì)算的其中一個(gè)目的是提供服務(wù)型IT,即讓用戶(hù)從一個(gè)自助服務(wù)目錄中選擇他們想要的服務(wù)。 然而,這種令人愉快的體驗(yàn)是有代價(jià)的。各種資源被分配給用戶(hù)并被他們消費(fèi)掉,這意味著必須使用chargeback(或者至少是showback)。 猜猜看, 一家擁有數(shù)據(jù)的企業(yè)是否愿意為具備3美元價(jià)值的數(shù)據(jù)支付10美元呢?
可能要花很長(zhǎng)的時(shí)間才能說(shuō)清數(shù)據(jù)處理面臨的各種難題。這不但是一件很困難的事,它可能是很難處理的,而且可能沒(méi)有一家科技公司能夠解決存儲(chǔ)的問(wèn)題。 另外,還有一些邏輯上和技術(shù)上的問(wèn)題需要解決。數(shù)據(jù)管理功能必須設(shè)定和建立政策。 必須找到一種方法論將優(yōu)質(zhì)數(shù)據(jù)與劣質(zhì)數(shù)據(jù)區(qū)分開(kāi)來(lái)。 這個(gè)過(guò)程可能不能通過(guò)人工的方式完成,可能需要用到自動(dòng)化處理軟件工具。
從現(xiàn)實(shí)的角度來(lái)說(shuō),也許必須用最小的投資來(lái)實(shí)現(xiàn)數(shù)據(jù)量的最大縮減。即使在最理想的環(huán)境下,你可能也不得不接受這樣一個(gè)事實(shí),那就是你永遠(yuǎn)也不可能做到盡善盡美。 況且,你不但需要解決現(xiàn)在的海量數(shù)據(jù)問(wèn)題,而且你還必須使用合適的工藝和程序來(lái)避免類(lèi)似的情況再次發(fā)生。清理海量數(shù)據(jù)并不是一件容易的事,但是企業(yè)用戶(hù)們必須獲得合適的工具并制定合適的政策以實(shí)現(xiàn)那一目標(biāo)。
Mesabi沉思
存儲(chǔ)需求持續(xù)快速增長(zhǎng)是當(dāng)前的一個(gè)熱門(mén)話(huà)題,大數(shù)據(jù)是其中最醒目的因素。海量數(shù)據(jù)的背后隱藏著什么樣的問(wèn)題?雖然人們似乎還不太重視這方面的問(wèn)題,但是卻又不得不面對(duì)數(shù)據(jù)清理的問(wèn)題。
如果存儲(chǔ)在IT預(yù)算中占用的比例為20%,而且現(xiàn)在70%的數(shù)據(jù)是毫無(wú)價(jià)值的,那就等于每年14%的IT預(yù)算被浪費(fèi)掉了。正視這一問(wèn)題是企業(yè)用戶(hù)們需要做的第一件事。 找出解決這個(gè)問(wèn)題的辦法需要時(shí)間、心理訓(xùn)練和努力,但是這些付出都是值得的。如何解決這個(gè)問(wèn)題令所有人都受益呢?這是我下一篇文章將要討論的話(huà)題。