數(shù)據(jù)遷移是數(shù)據(jù)系統(tǒng)整合中保證系統(tǒng)平滑升級(jí)和更新的關(guān)鍵部分。在信息化建設(shè)過(guò)程中,隨著技術(shù)的發(fā)展,原有的信息系統(tǒng)不斷被功能更強(qiáng)大的新系統(tǒng)所取代。從兩層結(jié)構(gòu)到三層結(jié)構(gòu),從Client/Server 到Browser/Server。在新舊系統(tǒng)的切換過(guò)程中,必然要面臨一個(gè)數(shù)據(jù)遷移的問(wèn)題。

    6.1 數(shù)據(jù)遷移的概念

    原有的舊系統(tǒng)從啟用到被新系統(tǒng)取代,在其使用期間往往積累了大量珍貴的歷史數(shù)據(jù),其中許多歷史數(shù)據(jù)都是新系統(tǒng)順利啟用所必須的。另外,這些歷史數(shù)據(jù)也是進(jìn)行決策分析的重要依據(jù)。數(shù)據(jù)遷移,就是將這些歷史數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換,并裝載到新系統(tǒng)中的過(guò)程。數(shù)據(jù)遷移主要適用于一套舊系統(tǒng)切換到另一套新系統(tǒng),或多套舊系統(tǒng)切換到同一套新系統(tǒng)時(shí),需要將舊系統(tǒng)中的歷史數(shù)據(jù)轉(zhuǎn)換到新系統(tǒng)中的情況。銀行、電信、稅務(wù)、工商、保險(xiǎn)以及銷售等領(lǐng)域發(fā)生系統(tǒng)切換時(shí),一般都需要進(jìn)行數(shù)據(jù)遷移。對(duì)于多對(duì)一的情況,例如由于信息化建設(shè)的先后,造成有多個(gè)不同的系統(tǒng)同時(shí)運(yùn)行,但相互間不能做到有效信息共享,所以就需要一套新系統(tǒng)包容幾套舊系統(tǒng)的問(wèn)題。

    數(shù)據(jù)遷移對(duì)系統(tǒng)切換乃至新系統(tǒng)的運(yùn)行有著十分重要的意義。數(shù)據(jù)遷移的質(zhì)量不光是新系統(tǒng)成功上線的重要前提,同時(shí)也是新系統(tǒng)今后穩(wěn)定運(yùn)行的有力保障。如果數(shù)據(jù)遷移失敗,新系統(tǒng)將不能正常啟用;如果數(shù)據(jù)遷移的質(zhì)量較差,沒(méi)能屏蔽全部的垃圾數(shù)據(jù),對(duì)新系統(tǒng)將會(huì)造成很大的隱患,新系統(tǒng)一旦訪問(wèn)這些垃圾數(shù)據(jù),可能會(huì)由這些垃圾數(shù)據(jù)產(chǎn)生新的錯(cuò)誤數(shù)據(jù),嚴(yán)重時(shí)還會(huì)導(dǎo)致系統(tǒng)異常。

    相反,成功的數(shù)據(jù)遷移可以有效地保障新系統(tǒng)的順利運(yùn)行,能夠繼承珍貴的歷史數(shù)據(jù)。因?yàn)闊o(wú)論對(duì)于一個(gè)公司還是一個(gè)部門(mén),歷史數(shù)據(jù)無(wú)疑都是十分珍貴的一種資源。例如公司的客戶信息、銀行的存款記錄、稅務(wù)部門(mén)的納稅資料等。

    6.2 數(shù)據(jù)遷移的特點(diǎn)

    系統(tǒng)切換時(shí)的數(shù)據(jù)遷移不同于從生產(chǎn)系統(tǒng)OLTP (On-line Transaction Processing),到數(shù)據(jù)倉(cāng)庫(kù)DW(Data Warehouse)的數(shù)據(jù)抽取。后者主要將生產(chǎn)系統(tǒng)在上次抽取后所發(fā)生的數(shù)據(jù)變化同步到數(shù)據(jù)倉(cāng)庫(kù),這種同步在每個(gè)抽取周期都進(jìn)行,一般以天為單位。而數(shù)據(jù)遷移是將需要的歷史數(shù)據(jù)一次或幾次轉(zhuǎn)換到新的生產(chǎn)系統(tǒng),其最主要的特點(diǎn)是需要在短時(shí)間內(nèi)完成大批量數(shù)據(jù)的抽取、清洗和裝載。

    數(shù)據(jù)遷移的內(nèi)容是整個(gè)數(shù)據(jù)遷移的基礎(chǔ),需要從信息系統(tǒng)規(guī)劃的角度統(tǒng)一考慮。劃分內(nèi)容時(shí),可以從橫向的時(shí)間和縱向的模塊兩個(gè)角度去考慮。

    橫向劃分

    以產(chǎn)生數(shù)據(jù)的時(shí)間為劃分依據(jù),需要考慮比較久遠(yuǎn)的歷史數(shù)據(jù)如何遷移的問(wèn)題。由于信息技術(shù)的發(fā)展,以及存儲(chǔ)工程師對(duì)計(jì)算機(jī)依賴性的增強(qiáng),新系統(tǒng)每天往往需要比舊系統(tǒng)存儲(chǔ)更多的信息,同時(shí)為了解決數(shù)據(jù)量高增長(zhǎng)帶來(lái)的性能瓶頸,新系統(tǒng)一般只保留一定時(shí)期的數(shù)據(jù),比如1 年,而把超過(guò)保存周期的數(shù)據(jù),即1 年以前的數(shù)據(jù)轉(zhuǎn)移到數(shù)據(jù)倉(cāng)庫(kù)中,以便用于決策分析。對(duì)于這種新系統(tǒng)的數(shù)據(jù)遷移,主要遷移1 年以內(nèi)的數(shù)據(jù),1 年以前的歷史數(shù)據(jù)需要另外考慮。

    縱向劃分

    以處理數(shù)據(jù)的功能模塊為劃分依據(jù),需要考慮在新系統(tǒng)中沒(méi)有被包含的功能模塊,其所涉及數(shù)據(jù)的處理問(wèn)題。這類數(shù)據(jù)由于無(wú)法建立映射關(guān)系,一般不需要遷移到新系統(tǒng)中。但對(duì)于模塊間偶合度比較緊密的舊系統(tǒng),在縱向劃分時(shí)需要注意數(shù)據(jù)的完整性。

分享到

多易

相關(guān)推薦