之所以存在如此之多的數(shù)據(jù)未被激活,是因為企業(yè)數(shù)據(jù)管理還面臨著諸多挑戰(zhàn),如數(shù)據(jù)獲取,數(shù)據(jù)存儲,數(shù)據(jù)使用,數(shù)據(jù)安全,我們將這些關鍵問題歸納為現(xiàn)代企業(yè)數(shù)據(jù)管理的“七宗罪”。
一宗罪:系統(tǒng)資源耗費高
企業(yè)數(shù)字化轉型的快速發(fā)展使得數(shù)據(jù)飛速增長,數(shù)據(jù)的來源和結構也變得越來越復雜多樣。IDC的調查數(shù)據(jù)顯示,2020年有64.2ZB的數(shù)據(jù)被創(chuàng)建或復制,據(jù)預測,在2020-2025年的預測期內,全球數(shù)據(jù)創(chuàng)建和復制的復合年增長率(CAGR)將達到23%?,F(xiàn)在每小時創(chuàng)建的數(shù)據(jù)甚至要比20年前一整年創(chuàng)建的數(shù)據(jù)還多。
這些海量的數(shù)據(jù)遵循“二八定律”的分布原則,即關鍵業(yè)務的生產數(shù)據(jù)僅占20%,占據(jù)了高吞吐、低時延的主存儲系統(tǒng)。與此同時,企業(yè)內為了滿足開發(fā)測試、分析、備份與歸檔等次級業(yè)務的復制數(shù)據(jù)(數(shù)據(jù)副本或拷貝數(shù)據(jù))等高達80%,通常使用二級存儲單元來保存。
統(tǒng)計表明,一份生產數(shù)據(jù)往往帶來8-10份的復制數(shù)據(jù),而77%的企業(yè)在生產環(huán)境中擁有的數(shù)據(jù)庫實例數(shù)量超過200個,這意味著大多數(shù)企業(yè)僅數(shù)據(jù)庫擁有的副本數(shù)量就超過2000個。
大量泛濫的數(shù)據(jù)副本不僅需要額外占用不必要的存儲空間,產生大量的數(shù)據(jù)孤島,并且相同數(shù)據(jù)的冗余副本過多,還影響了系統(tǒng)性能,使得正常的數(shù)據(jù)訪問或恢復數(shù)據(jù)的工作負載變得更加緩慢。
二宗罪:數(shù)據(jù)交付時間長
現(xiàn)有的拷貝方式需要數(shù)據(jù)的兩次操作,一次是從生產環(huán)境導出,第二次是導入到非生產環(huán)境,時間成本較高。數(shù)據(jù)的導入導出都需要人為操作,不能自動完成,并且需要通過人為的傳遞才能完成數(shù)據(jù)從生產環(huán)境到測試環(huán)境的遷移,人力成本較高。
由于自動化程度低,主要依靠人工操作,同時數(shù)據(jù)的導出導入時間長,阻礙了數(shù)據(jù)的快速交付,通常是以天級為單位交付數(shù)據(jù)。如果是較大的數(shù)據(jù)量,甚至需要花費數(shù)周時間。
另外,對于一些中大型企業(yè)來說,一般在每年都會固定編制IT采購預算計劃,而過多的數(shù)據(jù)副本對系統(tǒng)資源的需求往往又會超出計劃之外,數(shù)據(jù)使用者需要花費更長的時間等待空閑的資源釋放。
三宗罪:數(shù)據(jù)安全風險大
數(shù)據(jù)作為企業(yè)的核心資產,一旦丟失或者泄露,將給企業(yè)帶來巨大的損失。IT Policy Compliance Group的報告表明,數(shù)據(jù)丟失的企業(yè)預計將導致其客戶量及相關收入降低8%;對于上市企業(yè)而言,每股股價會下降8%;平均每丟失一個客戶記錄便會造成100美元的額外損失。IBM《2020年數(shù)據(jù)泄露成本報告》也指出,數(shù)據(jù)泄露事件給企業(yè)造成的平均成本為386萬美元。調查顯示,全球每年有近百萬企業(yè)因數(shù)據(jù)丟失而倒閉。
另外,為了配合法規(guī)遵從,保證數(shù)據(jù)的完整性、安全性和可用性,我國也陸續(xù)出臺了許多法律法規(guī)。例如,我國《網(wǎng)絡安全法》要求:數(shù)據(jù)流動過程中應重視保護個人隱私、社保信息、資產信息、醫(yī)療信息等敏感信息的安全。特別是當數(shù)據(jù)應用于開發(fā)、測試、培訓等環(huán)境時,安全風險較大,使用真實數(shù)據(jù)將面臨嚴重數(shù)據(jù)泄露的風險。為滿足這一要求,數(shù)據(jù)共享時需要使用數(shù)據(jù)脫敏技術。
傳統(tǒng)方式下,數(shù)據(jù)移交到使用部門之后,管控權利完全在使用部門,甚至有些場景下,數(shù)據(jù)使用者利用個人便攜式硬盤拷貝數(shù)據(jù),只能用流程來控制數(shù)據(jù)的用后銷毀,缺乏系統(tǒng)層面的全局管控,不僅容易造成數(shù)據(jù)丟失或泄露,而且無法以統(tǒng)一的數(shù)據(jù)基礎架構實現(xiàn)整體的法規(guī)遵從,存在較高的安全風險。
四宗罪:權限管控失衡
“刪庫跑路”已經不是一個新鮮事,由“刪庫跑路”引發(fā)關鍵業(yè)務數(shù)據(jù)無法恢復,企業(yè)業(yè)務癱瘓,甚至直接導致企業(yè)倒閉,這背后折射的一個事實是:用戶權限管控的失衡。
基于用戶和權限分離的安全策略,最小粒度控制用戶行為,杜絕類似“刪庫跑路”等高危動作的發(fā)生,變得極其必要。但這又引發(fā)了另外一個新問題:細顆粒度的權限管控意味著需要開通更多的管理賬戶來進行管控,導致存在更多的潛在風險節(jié)點。管理賬戶少,權限顆粒度又過于粗大。如何實現(xiàn)權限顆粒度和賬號管理壓力的平衡,值得深思。
五宗罪:環(huán)境穩(wěn)定性和資源占用的矛盾
企業(yè)的開發(fā)測試環(huán)境由于頻繁的版本變更,以及部署未經充分驗證的代碼,極其容易出故障的情況。雖然通過增加部署多套開發(fā)測試環(huán)境的數(shù)據(jù)副本,能夠有效控制故障的影響范圍,然而受制于有限的資源環(huán)境,企業(yè)需要在提高開發(fā)測試環(huán)境穩(wěn)定性和降低資源環(huán)境成本上找到最佳平衡點。
另外,當前的開發(fā)測試環(huán)境缺少高效的版本管理和控制機制,不利于版本的敏捷迭代和保證測試的一致性。
六宗罪:備份數(shù)據(jù)缺少利用
備份一般是指利用第三方備份軟件把數(shù)據(jù)從磁盤備份到磁帶進行離線保存,或者磁盤備份到磁盤,也就是把磁盤作為備份數(shù)據(jù)的存放介質,以加快數(shù)據(jù)的備份和恢復速度。備份數(shù)據(jù)的格式與原格式不同,不能被數(shù)據(jù)處理系統(tǒng)直接訪問。
備份通常只有在源數(shù)據(jù)被破壞或丟失時,才會開始使用,使用的頻率并不高,而且備份數(shù)據(jù)必須先由備份軟件恢復成可用數(shù)據(jù),才能讓數(shù)據(jù)處理系統(tǒng)訪問。對于企業(yè)來說,一方面是隨著備份數(shù)據(jù)的增長需要持續(xù)對備份系統(tǒng)進行投資,另一方面?zhèn)浞輸?shù)據(jù)的價值卻鮮有得到利用。
七宗罪:數(shù)據(jù)運營的缺失
根據(jù)IDC的定義,數(shù)據(jù)運營(DataOps)是將數(shù)據(jù)創(chuàng)建者與數(shù)據(jù)使用者進行連接的重要環(huán)節(jié),以實現(xiàn)協(xié)作和加速創(chuàng)新,數(shù)據(jù)運營應該是每一個成功的數(shù)據(jù)管理策略的重要組成部分。但在現(xiàn)有的業(yè)務環(huán)境中,數(shù)據(jù)運營是數(shù)據(jù)管理缺失的環(huán)節(jié)。希捷“數(shù)據(jù)新視界”調研結果顯示,在各個地區(qū)和行業(yè)中,平均只有10%的企業(yè)表示全面實施了數(shù)據(jù)運營,數(shù)據(jù)運營的機會有待發(fā)掘。
堪比“瑞士軍刀”,一站式解決數(shù)據(jù)全生命周期管理問題
有沒有一種解決方案,類似“瑞士軍刀”,能夠一站式解決數(shù)據(jù)全生命周期管理的“七宗罪”?
上訊信息基于數(shù)據(jù)虛擬化等核心技術,打造了國內首款商業(yè)化CDM產品——敏捷數(shù)據(jù)管理平臺(ADM,Agile Data Management)。ADM以數(shù)據(jù)為中心,打通數(shù)據(jù)上中下游鏈條,實現(xiàn)了從數(shù)據(jù)獲取,數(shù)據(jù)存儲,數(shù)據(jù)構建,數(shù)據(jù)使用,數(shù)據(jù)歸檔到數(shù)據(jù)銷毀的數(shù)據(jù)全生命周期管理,為用戶提供一站式數(shù)據(jù)運營(DataOps)解決方案。
ADM目前擁有哪些核心功能?
第一,生產數(shù)據(jù)備份:ADM可以主動實現(xiàn)業(yè)務數(shù)據(jù)的備份,并對備份數(shù)據(jù)實現(xiàn)自動化的數(shù)據(jù)恢復校驗。
第二,備份數(shù)據(jù)有效性驗證:ADM可以對接用戶的備份系統(tǒng),實現(xiàn)備份數(shù)據(jù)的自動化獲取和自動化恢復驗證。
第三,敏感數(shù)據(jù)脫敏:提供給開發(fā)測試等非生產環(huán)境的數(shù)據(jù)在交付前的脫敏處理功能,實現(xiàn)了對數(shù)據(jù)中敏感信息的自動化發(fā)現(xiàn)和智能化脫敏,包括靜態(tài)脫敏和動態(tài)脫敏。
第四,測試數(shù)據(jù)的極速交付:ADM通過一份數(shù)據(jù)副本,幾分鐘內即可快速創(chuàng)建出若干個虛擬數(shù)據(jù)副本,這些虛擬數(shù)據(jù)副本幾乎不占用任何存儲空間,在降低了存儲成本的同時實現(xiàn)了測試環(huán)境數(shù)據(jù)的極速交付,并且支持測數(shù)據(jù)的版本管理。
第五,數(shù)據(jù)訪問權限管理:針對每一個使用者創(chuàng)建虛擬賬號,并對每個虛擬賬號分配相應的權限,杜絕特權賬號共享。
第六,數(shù)據(jù)庫審計:提供針對數(shù)據(jù)庫的訪問和風險行為的防控、告警和追溯功能,保存日志記錄,監(jiān)控數(shù)據(jù)庫壓力,統(tǒng)計安全信息等。
第七,數(shù)據(jù)運營:基于自動化編排,無縫連接數(shù)據(jù)獲?。〝?shù)據(jù)創(chuàng)建)和數(shù)據(jù)使用,數(shù)據(jù)按需流動,進一步精簡數(shù)據(jù)管理流程,軟件開發(fā)和測試變得更加敏捷,確保產品交付和部署的快速和無縫改進。
“瑞士軍刀”雖然提供了全面的各種用戶所需功能,但對于一些用戶來說,在特定的場景中往往只需要其中一種或幾種功能。對于這一需求,ADM基于靈活的License控制,可按需交付任意單一或多個功能模塊,如同“樂高積木”自由組合。甚至還支持與第三方獨立產品功能進行組合,例如用戶已有的第三方的脫敏產品與ADM組合,既滿足了用戶自動化脫敏平臺的構建需求,加速數(shù)據(jù)交付,又保護了用戶原有投資。
另外,ADM還支持在本地數(shù)據(jù)中心和混合多云之間靈活部署?;旌隙嘣萍軜嬜層脩艏瓤梢韵硎芩接性频陌踩煽貎?yōu)勢,又可以利用公有云的經濟和彈性,在通用環(huán)境中構建和部署應用或服務,而無需大規(guī)模的IT投入,實現(xiàn)快速增長和規(guī)?;?。ADM支持無縫融合私有云和多公有云資源,并提供多云的互通和互操作,統(tǒng)一調用和管理資源,實現(xiàn)數(shù)據(jù)從本地到邊緣以及多公有云的自由流動。
從2016年正式發(fā)布到如今,經過五年多的潛心打磨,ADM產品無論是功能的豐富性、產品的穩(wěn)定性,還是對用戶業(yè)務場景的理解,都取得了遙遙領先的優(yōu)勢。ADM產品在中國的CDM市場也開始迎來了屬于它的高光時刻,不但相繼斬獲了金融和運營商兩個主要行業(yè)的一大批頭部用戶,在應用上ADM產品也開始逐步替代了功能分散并獨立的備份、容災、數(shù)據(jù)管理、數(shù)據(jù)脫敏、數(shù)據(jù)庫審計等產品,基于端到端的流程自動化和數(shù)據(jù)集中管控,真正幫助用戶實現(xiàn)了數(shù)據(jù)價值的利用。
數(shù)據(jù)無小事。奔向下一個五年,上訊信息打造ADM產品的初心未改,那就是把“數(shù)據(jù)用好管好”這件事做到極致!