以下為《中國(guó)金融》雜志刊發(fā)原文。
提升數(shù)據(jù)管理能力是數(shù)字化轉(zhuǎn)型根本
云信達(dá)公司創(chuàng)始人兼CEO張兵
在嚴(yán)峻的新冠疫情期間,國(guó)內(nèi)某知名的互聯(lián)網(wǎng)企業(yè)發(fā)生嚴(yán)重的“刪庫(kù)”事件,一夜之間蒸發(fā)12億港元的市值。盡管數(shù)據(jù)保護(hù)在金融業(yè)一直是最重要最基本的風(fēng)險(xiǎn)管理目標(biāo),但作為數(shù)據(jù)管理行業(yè)的一名老兵,筆者認(rèn)為這個(gè)事件給所有行業(yè)的數(shù)字工作者以警示,數(shù)字化既是機(jī)遇也是挑戰(zhàn)。人民銀行提出的做好數(shù)據(jù)治理推動(dòng)數(shù)字化轉(zhuǎn)型的規(guī)劃和部署,其中數(shù)據(jù)保護(hù)、數(shù)據(jù)治理和數(shù)字化業(yè)務(wù)轉(zhuǎn)型,這三者之間究竟是什么關(guān)系,是一個(gè)需要首先討論的課題。
做好數(shù)據(jù)治理迎接數(shù)字化時(shí)代到來(lái)
數(shù)據(jù)是企業(yè)最核心的IT資產(chǎn),數(shù)字化時(shí)代,數(shù)字化生存離開了數(shù)據(jù)一切都灰飛煙滅。近年來(lái),各行各業(yè)在進(jìn)行數(shù)字化轉(zhuǎn)型,無(wú)疑疫情會(huì)加速中國(guó)及世界的數(shù)字化轉(zhuǎn)型,使競(jìng)爭(zhēng)更加白熱化。古語(yǔ)說(shuō),積小流成江海。金融業(yè)的數(shù)據(jù)資產(chǎn)是在長(zhǎng)期業(yè)務(wù)發(fā)展過(guò)程中沉淀下來(lái)的,無(wú)論按照單位數(shù)據(jù)價(jià)值(Value per bit)還是數(shù)量,金融行業(yè)無(wú)疑排在前列。如何用好數(shù)據(jù)海洋,這一重要課題一直為金融業(yè)以及金融監(jiān)管者所關(guān)注。
在數(shù)據(jù)達(dá)到一定規(guī)模之后,金融業(yè)都會(huì)面臨全局?jǐn)?shù)據(jù)治理的問(wèn)題。在此之前,金融機(jī)構(gòu)的數(shù)據(jù)是離散的,分布在多個(gè)信息系統(tǒng)內(nèi)部,形成人們經(jīng)常說(shuō)的“數(shù)據(jù)孤島”,這是金融行業(yè)數(shù)據(jù)治理首先要面臨的課題,其實(shí)何嘗不是數(shù)字化時(shí)代的基礎(chǔ)課題,然而,現(xiàn)實(shí)中這個(gè)問(wèn)題并沒(méi)有很好地得到解決,不少機(jī)構(gòu)還沿用傳統(tǒng)的數(shù)據(jù)管理方式。
應(yīng)用煙囪和數(shù)據(jù)孤島
就銀行內(nèi)部來(lái)說(shuō),數(shù)字化轉(zhuǎn)型首先開始于信息科技部門。組織內(nèi)部的業(yè)務(wù)部門和職能部門,一般形成垂直與橫向交叉的矩陣式架構(gòu),以業(yè)務(wù)為中心,而職能部門從業(yè)務(wù)單元抽離出來(lái)形成橫向管控和支撐。于是我們提出了橫跨信息科技部門和業(yè)務(wù)部門的數(shù)據(jù)管理職能,類似許多管理矩陣中存在的大量虛線匯報(bào)關(guān)系的虛擬組織,某些金融科技公司的數(shù)據(jù)管理職能目前普遍虛擬化或者干脆缺失。科技部門有數(shù)據(jù)庫(kù)管理員卻沒(méi)有“數(shù)據(jù)管理員”,這個(gè)現(xiàn)象和“數(shù)據(jù)孤島”互相作用,形成一個(gè)死循環(huán)。上述現(xiàn)象在人民銀行科技司李偉司長(zhǎng)撰寫了一篇文章《做好數(shù)據(jù)治理推動(dòng)數(shù)字化轉(zhuǎn)型》中被視為金融數(shù)據(jù)治理中所存在的障礙,該文中在金融業(yè)數(shù)據(jù)治理之“術(shù)”的開篇就提到了要做好頂層設(shè)計(jì)。數(shù)字化轉(zhuǎn)型前的金融科技部門,有應(yīng)用(APP)開發(fā)者、系統(tǒng)管理員、數(shù)據(jù)庫(kù)管理員……這些職能和角色都是基于“顯性”IT資產(chǎn)——應(yīng)用軟件、硬件設(shè)備、系統(tǒng)軟件而設(shè)立的。這些“前數(shù)字化”職能如何面對(duì)數(shù)字化時(shí)代的企業(yè)數(shù)據(jù)資產(chǎn)——生產(chǎn)和交易信息、客戶與合作伙伴信息、資產(chǎn)和位置信息、代碼、知識(shí)、算法、模型……離開了數(shù)據(jù)企業(yè)無(wú)法生存,就是說(shuō),數(shù)字化時(shí)代的金融科技公司的頂層設(shè)計(jì)應(yīng)該轉(zhuǎn)向以數(shù)據(jù)為中心。
數(shù)據(jù)資產(chǎn) “邏輯集中”的誤區(qū)
既然數(shù)字化轉(zhuǎn)型需要把數(shù)據(jù)管理職能從業(yè)務(wù)單元中抽離出來(lái),那么數(shù)據(jù)的管理范疇也需要從業(yè)務(wù)范疇中抽離出來(lái)。數(shù)據(jù)中臺(tái)和大數(shù)據(jù)都不是數(shù)據(jù)資產(chǎn)平臺(tái),屬于典型的業(yè)務(wù)范疇,但是很容易成為認(rèn)知誤區(qū),而這樣的誤區(qū)往往會(huì)直接導(dǎo)致數(shù)據(jù)治理走上彎路。
現(xiàn)實(shí)中被誤導(dǎo)的例子時(shí)有發(fā)生,比如自從阿里提出數(shù)據(jù)中臺(tái)的概念,一些金融企業(yè)跟風(fēng)向往。如果說(shuō),數(shù)據(jù)中臺(tái)更偏重流程型業(yè)務(wù),大數(shù)據(jù)更偏重分析型業(yè)務(wù),那么,它們整合數(shù)據(jù)的業(yè)務(wù)目的顯然大于資產(chǎn)管理目的。大數(shù)據(jù)平臺(tái)和數(shù)據(jù)倉(cāng)庫(kù)都是以決策支持為目的建造的,通過(guò)應(yīng)用數(shù)學(xué)模型和算法,揭示數(shù)據(jù)在更大時(shí)空、更多維度、更廣泛主題所呈現(xiàn)的規(guī)律,用于輔助決策;基于算力和方法,高速處理海量數(shù)據(jù),直接驅(qū)動(dòng)流程和業(yè)務(wù)??傊?大數(shù)據(jù)是面向復(fù)雜決策支持的數(shù)據(jù)業(yè)務(wù)平臺(tái),為了適應(yīng)業(yè)務(wù)模型和運(yùn)算的方便,數(shù)據(jù)可能會(huì)變形或轉(zhuǎn)換,從而失去了原生性,導(dǎo)致數(shù)據(jù)的資產(chǎn)屬性喪失。
就是說(shuō)在整個(gè)數(shù)據(jù)管理中,中臺(tái)不是萬(wàn)能的,數(shù)據(jù)中臺(tái)的核心思想是將業(yè)務(wù)數(shù)據(jù)整合到一個(gè)分布式的數(shù)據(jù)服務(wù)平臺(tái)快速支撐業(yè)務(wù)創(chuàng)新、業(yè)務(wù)交叉和業(yè)務(wù)彈性。金融IT是典型的雙態(tài)IT架構(gòu)(穩(wěn)態(tài)和敏態(tài)),顯然,如果將決定生死存續(xù)成熟穩(wěn)定的核心業(yè)務(wù)平臺(tái)拆掉,單靠裝入靈活的中臺(tái)是與銀行初衷與風(fēng)控原則相悖的。中臺(tái)是典型的敏態(tài)架構(gòu),是金融企業(yè)的業(yè)務(wù)平臺(tái)之一。對(duì)一個(gè)敏捷業(yè)務(wù)平臺(tái)賦予數(shù)據(jù)資產(chǎn)管理職能顯然是小馬拉大車,而數(shù)字技術(shù)已提供了既能夠堅(jiān)守銀行風(fēng)險(xiǎn)管理底線又同時(shí)支持靈活創(chuàng)新的兩全可能。
數(shù)據(jù)治理與數(shù)據(jù)保護(hù)的協(xié)同性
那么,我們有怎樣的數(shù)據(jù)治理工具呢?泛企業(yè)的數(shù)據(jù)資產(chǎn)發(fā)現(xiàn)和數(shù)據(jù)治理工具并不缺乏,它們將數(shù)據(jù)的管理范疇像“虛擬組織”那樣從業(yè)務(wù)范疇中抽象出來(lái)。可是我們知道企業(yè)的數(shù)據(jù)每年以50%的速度增長(zhǎng),數(shù)據(jù)發(fā)現(xiàn)、分類、分級(jí)、變遷、使用等,會(huì)遇到諸多技術(shù)和管理問(wèn)題。況且業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)是動(dòng)態(tài)變化的,治理一個(gè)變化中的對(duì)象需要對(duì)它進(jìn)行持續(xù)的管控,管理和控制的邏輯疊加在業(yè)務(wù)系統(tǒng)上有時(shí)并不合適。于是,從業(yè)務(wù)系統(tǒng)中抽離數(shù)據(jù)資產(chǎn)自然而然成為科技部門的一個(gè)任務(wù)。抽離就是從業(yè)務(wù)系統(tǒng)中把數(shù)據(jù)復(fù)制出來(lái),建立一個(gè)生產(chǎn)數(shù)據(jù)的“孿生數(shù)據(jù)”,一個(gè)處理業(yè)務(wù)邏輯和業(yè)務(wù)壓力,另一個(gè)處理管理邏輯和管理壓力。數(shù)據(jù)復(fù)制如同印刷術(shù)在IT的發(fā)展史上已經(jīng)存在了很多年。
根據(jù)IDC統(tǒng)計(jì),一個(gè)中型企業(yè)內(nèi)出于各種目的產(chǎn)生的復(fù)制數(shù)據(jù)有8-10份之多,常見的有:備份、容災(zāi)、歸檔、分析、審計(jì)、開發(fā)測(cè)試等。復(fù)制手段和工具多,復(fù)制下來(lái)的數(shù)據(jù)多,存放方式和地點(diǎn)多,已然成為一個(gè)管理難題。復(fù)制數(shù)據(jù)管理在數(shù)字化轉(zhuǎn)型的當(dāng)口既是管理問(wèn)題又是技術(shù)問(wèn)題。復(fù)制數(shù)據(jù)有些是無(wú)條件、不得不做的,有些是有一定選擇性的。所以復(fù)制數(shù)據(jù)管理就從不得不做的領(lǐng)域發(fā)端,并成長(zhǎng)起來(lái)。
數(shù)據(jù)保護(hù)是IT運(yùn)維的日常業(yè)務(wù),也就是數(shù)據(jù)備份。金融行業(yè)對(duì)數(shù)據(jù)備份有著嚴(yán)格的規(guī)矩與監(jiān)管,金融系統(tǒng)的原生數(shù)據(jù),包括數(shù)據(jù)發(fā)生邏輯變化的時(shí)間變量,全都被忠實(shí)地記錄在數(shù)據(jù)備份系統(tǒng)。最近發(fā)生刪庫(kù)事件的互聯(lián)公司居然沒(méi)有備份,這在金融企業(yè)是難以想象的。然而,備份系統(tǒng)的情況并不妙。據(jù)IDC 2018年的一項(xiàng)報(bào)告,全球70%的CIO對(duì)現(xiàn)有數(shù)據(jù)備份系統(tǒng)不滿意?,F(xiàn)行的備份技術(shù)20年沒(méi)有升級(jí),導(dǎo)致海量備份數(shù)據(jù)只在災(zāi)難恢復(fù)時(shí)用一用,平時(shí)這份可以救命的數(shù)據(jù)淪為 “暗數(shù)據(jù)”。一方面,人們想要從業(yè)務(wù)系統(tǒng)抽離數(shù)據(jù)用于管理目的,另一方面,“暗數(shù)據(jù)”濫觴,這是一對(duì)巨大的矛盾。
為應(yīng)對(duì)數(shù)字化轉(zhuǎn)型,全球知名的IT研究咨詢機(jī)構(gòu)Gartner在2016年定義了一種 “復(fù)制數(shù)據(jù)管理”或“副本數(shù)據(jù)管理”的新技術(shù)——Copy Data Management,簡(jiǎn)稱CDM。CDM首先是一種備份新技術(shù),以“原格式”獲取生產(chǎn)數(shù)據(jù)各個(gè)時(shí)間序列的副本;其次,CDM是一個(gè)副本數(shù)據(jù)管理平臺(tái),備份數(shù)據(jù)能夠被管理和使用,不再是暗數(shù)據(jù)。CDM統(tǒng)一了復(fù)制數(shù)據(jù)的過(guò)程,統(tǒng)一了副本數(shù)據(jù)的管理,統(tǒng)一了副本數(shù)據(jù)的流轉(zhuǎn)和使用。CDM管理著生產(chǎn)數(shù)據(jù)的新鮮副本的總集,并且是“原生的”,具備天然的資產(chǎn)屬性。在多個(gè)國(guó)家,備份數(shù)據(jù)的這個(gè)屬性被用來(lái)作為客觀證據(jù)。這使得CDM成為一個(gè)從業(yè)務(wù)系統(tǒng)中抽離的數(shù)據(jù)資產(chǎn)集散地,一個(gè)副本數(shù)據(jù)資源中心。
副本數(shù)據(jù)成為管理范疇的焦點(diǎn)也僅僅是數(shù)據(jù)治理得到重視之后,那么,數(shù)據(jù)保護(hù)和數(shù)據(jù)治理究竟是怎樣的關(guān)系?數(shù)據(jù)保護(hù)是傳統(tǒng)IT運(yùn)維的范疇,數(shù)據(jù)治理然是資產(chǎn)與合規(guī)管理的范疇。數(shù)字化轉(zhuǎn)型就是要打破部門之間的藩籬,讓數(shù)據(jù)成為最活躍的生產(chǎn)要素,副本數(shù)據(jù)管理自然上升為推動(dòng)數(shù)字化轉(zhuǎn)型的跨界“生物”。
副本數(shù)據(jù)的價(jià)值和運(yùn)用
盤活數(shù)據(jù)資產(chǎn)的前提條件是健全治理體系。人民銀行提出了三點(diǎn):一是做好數(shù)據(jù)資產(chǎn)管理,二是做好數(shù)據(jù)分級(jí)管理,三是做好數(shù)據(jù)共享管理。
金融業(yè)的數(shù)據(jù)治理是一個(gè)動(dòng)、靜結(jié)合的體系,靜態(tài)能力包括數(shù)據(jù)資產(chǎn)的建檔、分級(jí)、分類、關(guān)聯(lián)、確權(quán)、定價(jià),等等;動(dòng)態(tài)能力包括數(shù)據(jù)檢索、審計(jì),數(shù)據(jù)流通、共享、交換管理,去標(biāo)簽化(脫敏),加密,等等。數(shù)據(jù)治理平臺(tái)做完三件事可以建立消費(fèi)數(shù)據(jù)的基礎(chǔ),首先建立元數(shù)據(jù)管理,也就是描述數(shù)據(jù)的數(shù)據(jù);其次提供便捷的數(shù)據(jù)資產(chǎn)檢索、定位;然后建立數(shù)據(jù)輸出到企業(yè)內(nèi)部、外部的標(biāo)準(zhǔn)。
副本數(shù)據(jù)是數(shù)據(jù)保護(hù)的結(jié)果,繼而成為了數(shù)據(jù)治理的對(duì)象,治理之后又返身進(jìn)入數(shù)據(jù)消費(fèi)的環(huán)節(jié)。剛才提到IDC統(tǒng)計(jì)過(guò)企業(yè)內(nèi)部基于各種目的產(chǎn)生多份副本數(shù)據(jù)(復(fù)制數(shù)據(jù)),有了副本數(shù)據(jù)資源中心之后,既可以減少?gòu)?fù)制的動(dòng)作,數(shù)據(jù)消費(fèi)的出口也可以很方便地扎口管理。隨機(jī)舉幾個(gè)業(yè)務(wù)場(chǎng)景的例子:一是CDM可以成為數(shù)據(jù)倉(cāng)庫(kù)之前的ODS,大數(shù)據(jù)之前的數(shù)據(jù)湖,CDM即數(shù)據(jù)湖;二是固化數(shù)據(jù)用于審計(jì)目的;三是CDM給DevOps(開發(fā)運(yùn)維一體化)賦能。
三位一體的數(shù)據(jù)“底盤”
副本數(shù)據(jù)管理誕生于運(yùn)維,因資產(chǎn)屬性成為治理對(duì)象,因?yàn)槭腔钴S的生產(chǎn)要素直接進(jìn)入驅(qū)動(dòng)數(shù)字化業(yè)務(wù)的環(huán)節(jié),運(yùn)維、治理和流通環(huán)環(huán)相扣,既是一個(gè)完整的跨界循環(huán),又是一個(gè)有機(jī)的整體。下圖描繪了副本數(shù)據(jù)管理的三位一體特征,已經(jīng)大大超出了Gartner早期的定義。
三位一體的數(shù)據(jù)底盤
數(shù)據(jù)管理固然是金融業(yè)數(shù)字化轉(zhuǎn)型的重大課題,不過(guò)眼下數(shù)據(jù)保護(hù)、數(shù)據(jù)治理和數(shù)據(jù)流通還存在不少相互制約現(xiàn)象,導(dǎo)致創(chuàng)新和轉(zhuǎn)型步履維艱。比如:互聯(lián)企業(yè)既有支付創(chuàng)新也有刪庫(kù)事件,共享經(jīng)濟(jì)隱含著隱私數(shù)據(jù)外泄等違法隱患……科技進(jìn)步使得數(shù)據(jù)這一生產(chǎn)要素變得更加活躍也更加危險(xiǎn),創(chuàng)新必須在風(fēng)險(xiǎn)可以管控的前提下,這就給風(fēng)險(xiǎn)管理提出了新的課題。副本數(shù)據(jù)平臺(tái)是一個(gè)理想的抓手,副本數(shù)據(jù)是企業(yè)可管理、可操作的資產(chǎn)對(duì)象,圍繞副本數(shù)據(jù)平臺(tái)可以把數(shù)據(jù)保護(hù)、數(shù)據(jù)治理和數(shù)據(jù)流通放在一個(gè)整體的框架內(nèi)統(tǒng)一考慮。聚焦副本數(shù)據(jù)建立數(shù)字化底盤,不斷豐富和完善相關(guān)的技術(shù)體系、管理規(guī)范和行業(yè)生態(tài),可以加速各項(xiàng)數(shù)字化舉措的落地。
副本數(shù)據(jù)管理的三位一體架構(gòu)除了應(yīng)用于企業(yè)內(nèi)部,監(jiān)管單位、分支機(jī)構(gòu)和外部合作伙伴的數(shù)據(jù)上收或共享也變得更簡(jiǎn)便、可靠。隨著5G的建設(shè),多云數(shù)據(jù)管理可以加速金融云的構(gòu)建,符合行業(yè)標(biāo)準(zhǔn)的跨企業(yè)的數(shù)據(jù)共享、交換也變得更加可行。當(dāng)然,有了這個(gè)“底座”,還需要行業(yè)數(shù)據(jù)治理規(guī)范、數(shù)據(jù)主權(quán)立法、數(shù)據(jù)流通的相應(yīng)標(biāo)準(zhǔn)制訂等等的同時(shí)跟進(jìn),才能真正建立起數(shù)據(jù)治理的生態(tài)環(huán)境,完成金融業(yè)的數(shù)字化轉(zhuǎn)型,從而才能真正成為推動(dòng)數(shù)字化經(jīng)濟(jì)的主要力量。