數(shù)據(jù)倉(cāng)庫(kù)首要的任務(wù)就是建立可獲取和可操作的數(shù)據(jù),并建立便捷高效的數(shù)據(jù)查詢(xún),以使管理部門(mén)得到所需業(yè)務(wù)問(wèn)題的答案。因此,建立數(shù)據(jù)倉(cāng)庫(kù)的第一步工作就是確定什么樣的信息是企業(yè)最需要的。管理部門(mén)最想知道的是什么?最重要的業(yè)務(wù)問(wèn)題是什么?
為了確定這些問(wèn)題的答案,你應(yīng)該做一些實(shí)際的調(diào)查工作。但是應(yīng)該向誰(shuí)做調(diào)查呢,調(diào)查時(shí)又該問(wèn)些什么問(wèn)題呢?就我看來(lái),調(diào)查的對(duì)象可以歸結(jié)為兩類(lèi)人群:一類(lèi)是存有問(wèn)題的人,另一類(lèi)是掌握數(shù)據(jù)的人。這看起來(lái)可能不是很容易理解,那么我們就先從第一類(lèi)人,也就是存有問(wèn)題的人著手開(kāi)始我們的討論。
存有問(wèn)題的人
存有問(wèn)題的人,也可以說(shuō)是需要數(shù)據(jù)的人,他們一般都處于企業(yè)的管理階層,當(dāng)然這也并不絕對(duì)。對(duì)你來(lái)說(shuō),如果想要順利的進(jìn)行調(diào)查,就應(yīng)該從你能接觸到的各個(gè)部門(mén)的最高層開(kāi)始,然后逐漸向下展開(kāi)。第一個(gè)要調(diào)查的對(duì)象就是那個(gè)任命你實(shí)施數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的領(lǐng)導(dǎo),問(wèn)清楚為什么要讓你創(chuàng)建數(shù)據(jù)倉(cāng)庫(kù),這是他自己的主意還是企業(yè)更高層的安排?
以上的問(wèn)題并不需要浪費(fèi)你很長(zhǎng)時(shí)間,而且詢(xún)問(wèn)之后你就可以對(duì)從何處下手胸有成竹了。下面所要做的,就是列出你需要被訪者回答的問(wèn)題。也許你覺(jué)得一開(kāi)始應(yīng)該問(wèn)”你想從數(shù)據(jù)倉(cāng)庫(kù)中得到什么?”,可這并不是個(gè)好問(wèn)題,因?yàn)楸辉L問(wèn)者大部分都對(duì)數(shù)據(jù)倉(cāng)庫(kù)知之甚少,你冒然問(wèn)他想從數(shù)據(jù)倉(cāng)庫(kù)中得到什么好處,自然不會(huì)得到有價(jià)值的答案。
正確的問(wèn)題應(yīng)該是”你對(duì)現(xiàn)在的業(yè)務(wù)還存有什么無(wú)法解決的問(wèn)題嗎,或者你認(rèn)為現(xiàn)在的業(yè)務(wù)中最難解決的問(wèn)題是什么?”,另外你也可以這樣問(wèn)”對(duì)你來(lái)說(shuō)最重要的信息是什么,并告訴我為什么認(rèn)為這些信息最重要。”這些問(wèn)題的答案會(huì)讓你體會(huì)到什么數(shù)據(jù)才是目前對(duì)企業(yè)來(lái)說(shuō)最有意義的數(shù)據(jù)。
掌握數(shù)據(jù)的人
一旦你明確了何種信息是重要的,你就可以開(kāi)始面對(duì)那些最了解數(shù)據(jù)的人了。一般情況下,這類(lèi)人是企業(yè)的DBA,但也并不絕對(duì)。有些部門(mén)有針對(duì)某個(gè)領(lǐng)域的數(shù)據(jù)專(zhuān)家,他們對(duì)自己所接觸的數(shù)據(jù)非常了解。他們會(huì)告訴你對(duì)于之前你通過(guò)訪問(wèn)得來(lái)的各種問(wèn)題,數(shù)據(jù)庫(kù)中是否有足夠的信息用以解決,以及這些數(shù)據(jù)的格式是什么樣子的。從中你會(huì)了解到數(shù)據(jù)源的數(shù)量和質(zhì)量。
很明顯,在你不能獲取保密數(shù)據(jù)的情況下,你的第一個(gè)數(shù)據(jù)倉(cāng)庫(kù)應(yīng)該首先關(guān)注那些可以方便獲取并具有較高質(zhì)量的數(shù)據(jù)源,這樣可以提高項(xiàng)目的成功機(jī)會(huì)?,F(xiàn)在,你擁有了所需的信息,并且知道它是準(zhǔn)確并可以獲取的,下一步就要決定如何將這些數(shù)據(jù)放進(jìn)數(shù)據(jù)倉(cāng)庫(kù)以及要采用何種數(shù)據(jù)格式。
設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)
現(xiàn)在我們進(jìn)入了數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的設(shè)計(jì)/架構(gòu)階段。如果你已經(jīng)總結(jié)好了數(shù)據(jù)倉(cāng)庫(kù)的實(shí)施目的,并且詳細(xì)了解了數(shù)據(jù)源的結(jié)構(gòu),那么這個(gè)階段對(duì)你來(lái)說(shuō)就輕松了很多。相反,如果你在這個(gè)階段還沒(méi)有明確的需求目標(biāo),而且對(duì)數(shù)據(jù)源也不是很清楚,那么這個(gè)階段對(duì)你來(lái)說(shuō)就變的相當(dāng)復(fù)雜,并且會(huì)使整個(gè)項(xiàng)目陷入危機(jī)。
設(shè)計(jì)階段可以分成兩個(gè)部分,你可以同時(shí)進(jìn)行也可以依次進(jìn)行,這完全取決于時(shí)間壓力:
你所設(shè)計(jì)的數(shù)據(jù)倉(cāng)庫(kù)類(lèi)型以及計(jì)劃使用的實(shí)現(xiàn)工具,都會(huì)影響到這兩部分。數(shù)據(jù)倉(cāng)庫(kù)類(lèi)型包括:
數(shù)據(jù)倉(cāng)庫(kù)的實(shí)際設(shè)計(jì)工作遠(yuǎn)比這篇文章所說(shuō)的要復(fù)雜。不過(guò)也有很多可用資源可以幫助你走好實(shí)施數(shù)據(jù)倉(cāng)庫(kù)的第一步。我建議你將預(yù)算的一部分用在聘用數(shù)據(jù)倉(cāng)庫(kù)實(shí)施專(zhuān)家上。
尋求外援
較謹(jǐn)慎的方法是在企業(yè)內(nèi)部尋求幫助,但由于這是企業(yè)的第一個(gè)數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目,在你周?chē)?jīng)驗(yàn)豐富的人員不會(huì)很多,因此最好還是從外面聘請(qǐng)幾個(gè)數(shù)據(jù)倉(cāng)庫(kù)專(zhuān)家來(lái)幫助你,并且在這個(gè)領(lǐng)域具有專(zhuān)業(yè)知識(shí)的顧問(wèn)數(shù)量也不少。
事實(shí)上,每個(gè)數(shù)據(jù)倉(cāng)庫(kù)都是不同的。對(duì)數(shù)據(jù)倉(cāng)庫(kù)的管理需求和數(shù)據(jù)源質(zhì)量,都存有太多的變化。因此你要確定你所聘請(qǐng)的技術(shù)顧問(wèn)針對(duì)你的項(xiàng)目必須完全能給予技術(shù)支援。另外,除非你的數(shù)據(jù)倉(cāng)庫(kù)非常小,否則你現(xiàn)有的數(shù)據(jù)庫(kù)團(tuán)隊(duì)肯定無(wú)法承受明顯增加的工作量。因此你要調(diào)整團(tuán)隊(duì)的成員數(shù)量以應(yīng)付額外的工作。
最后,你要做好重新設(shè)計(jì)并創(chuàng)建數(shù)據(jù)倉(cāng)庫(kù)的準(zhǔn)備。為什么呢?因?yàn)閿?shù)據(jù)倉(cāng)庫(kù)項(xiàng)目是一個(gè)循環(huán)的過(guò)程,你的公司不可能停滯不前,為了適應(yīng)公司的發(fā)展,數(shù)據(jù)倉(cāng)庫(kù)必須作出相應(yīng)調(diào)整。而公司業(yè)務(wù)的發(fā)展所帶來(lái)的可能是不同的業(yè)務(wù)需求,或者是不同的數(shù)據(jù)源,因此你又要回到本文開(kāi)始的地方從頭來(lái)過(guò)。