在日前舉行的2018中國金融科技產(chǎn)業(yè)峰會上,中國信息通信研究院大數(shù)據(jù)研究部主任、可信區(qū)塊鏈聯(lián)盟(籌)秘書長、國際電聯(lián)分布式賬本焦點組副主席魏凱圍繞金融大數(shù)據(jù)和區(qū)塊鏈標準與評測,從三大方面解讀大數(shù)據(jù)之“大”的內(nèi)涵。

中國信息通信研究院大數(shù)據(jù)研究部主任 魏凱

魏凱表示:大數(shù)據(jù)要解決三個問題——大分析、大事務(wù)與大資產(chǎn),才能帶來大的價值,這是對大數(shù)據(jù)含義的理解,也是信通院近年在金融科技方面、大數(shù)據(jù)方面相關(guān)工作的代表。

大分析

“圍繞金融行業(yè),大分析的發(fā)展,可以劃分成幾個階段?!蔽簞P介紹。

2000年以前,銀行業(yè)是最早引入數(shù)據(jù)倉庫、數(shù)據(jù)分析的行業(yè)之一。銀行業(yè)傳統(tǒng)上是數(shù)據(jù)密集型行業(yè)。有相關(guān)報告顯示,每單位產(chǎn)值里,金融業(yè)的數(shù)據(jù)投資是最多的。在2000年之前,金融業(yè)就開始使用數(shù)據(jù)挖掘的技術(shù),主要依靠的是專用的數(shù)據(jù)庫、專用的硬件,應(yīng)用方面主要是經(jīng)營分析報表等較為簡單。

隨后,金融業(yè)的大數(shù)據(jù)應(yīng)用發(fā)生了顛覆性的轉(zhuǎn)變。以互聯(lián)網(wǎng)崛起為標志,互聯(lián)網(wǎng)公司在軟件上的創(chuàng)新,用價格低廉的計算資源來做大分析,隨就又進入到金融業(yè),進入到更多傳統(tǒng)行業(yè)如電信、公安、醫(yī)療、交通等等。

從2010年起,大數(shù)據(jù)進一步在社會各方面廣泛滲透,并產(chǎn)生了很強的技術(shù)基礎(chǔ),如Hadoop、Spark等等技術(shù)都成為支撐大數(shù)據(jù)發(fā)展非常堅強的基礎(chǔ)。

回顧大分析所產(chǎn)生的重要變化,魏凱提到,首先,在互聯(lián)網(wǎng)業(yè)務(wù)的推動下,不得不做的一件事就是分析系統(tǒng)的分布式轉(zhuǎn)型,必須采用分布式架構(gòu),既有成本上的考慮,更重要的是性能和擴展性的需求,因此分析系統(tǒng)、數(shù)據(jù)挖掘系統(tǒng)首先進行分布式的遷移。其次,新的理念從互聯(lián)網(wǎng)行業(yè)持續(xù)向金融業(yè)拓展,在銀行或其他金融機構(gòu)建設(shè)大數(shù)據(jù)分析系統(tǒng)時,基于分布式成為了普遍選擇。其中的原因在于大分析的技術(shù)近年來突飛猛進的發(fā)展,同時互聯(lián)網(wǎng)創(chuàng)造了開源的福利。

對于大分析技術(shù)的演進,魏凱主任從軟件、硬件層次的演進給出了一張全面的圖解。

圍繞大分析這一主題,中國信通院近年來持續(xù)進行相關(guān)的標準和評測的工作,從大數(shù)據(jù)產(chǎn)品、服務(wù)兩個方面,在基礎(chǔ)產(chǎn)品、數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)分析應(yīng)用的多個維度,展開相關(guān)標準研究與測試,目前已經(jīng)有50多款相關(guān)產(chǎn)品參與了大數(shù)據(jù)平臺的評測。

大資產(chǎn)

“第二個大是資產(chǎn),如果數(shù)據(jù)是垃圾,我們的分析結(jié)果肯定靠不住,這是大家所有從業(yè)者的共識?!蔽簞P表示。

幾年前,傳統(tǒng)的金融機構(gòu)一直專注于投入大量資金去請咨詢公司做數(shù)據(jù)治理的項目。魏凱指出,幾年前,大家認為,數(shù)據(jù)需要管理,需要去養(yǎng)數(shù)據(jù),不是說系統(tǒng)、平臺建好以后應(yīng)用就能運行很順暢,數(shù)據(jù)還需要去管理、治理、運維。近年來,數(shù)據(jù)管理也發(fā)生了很大的變化,帶來了概念上的升級,主要的變化在于:

第一, 數(shù)據(jù)應(yīng)用對象已經(jīng)發(fā)生了很大變化。原來的數(shù)據(jù)管理都是面向一些報表的等任務(wù),所以數(shù)據(jù)的應(yīng)用對象主要在于少數(shù)人?,F(xiàn)在,很多金融機構(gòu)的數(shù)據(jù)應(yīng)用對象是基層員工、柜員,甚至是最終用戶。
第二, 數(shù)據(jù)管理的手段也發(fā)生很大變化,以前數(shù)據(jù)的管理靠人工,現(xiàn)在越來越多地依靠人工智能等手段進行語義字段的匹配。

第三, 數(shù)據(jù)管理的職能發(fā)生了重要變化。以前金融機構(gòu)的數(shù)據(jù)管理部門和業(yè)務(wù)部門涇渭分明。在信息科技下,數(shù)據(jù)和業(yè)務(wù)越來越分不開,因此數(shù)據(jù)管理職能也發(fā)生了重要變化。

第四, 數(shù)據(jù)架構(gòu)發(fā)生很大變化,從經(jīng)典的數(shù)據(jù)倉庫類型的架構(gòu),正在向數(shù)據(jù)湖的方向發(fā)展,數(shù)據(jù)不需要去清洗、轉(zhuǎn)換、加載,而是數(shù)據(jù)線加載,需要使用的時候再轉(zhuǎn)換,這意味著架構(gòu)上的變化。

第五, 數(shù)據(jù)種類發(fā)生變化。原有的數(shù)據(jù)主要是結(jié)構(gòu)化的數(shù)據(jù)為主,現(xiàn)在非結(jié)構(gòu)化數(shù)據(jù)越來越多。

“這五個層次的變化導(dǎo)致了數(shù)據(jù)管理需要向下一代演進?!蔽簞P表示。“最重要的,數(shù)據(jù)要成為資產(chǎn)?!?/p>

因此,中國信通院牽頭成立了數(shù)據(jù)資產(chǎn)管理工作組,與業(yè)界在這方面領(lǐng)先的企業(yè)共同歸納總結(jié)數(shù)據(jù)資產(chǎn)管理的方法論,希望能夠給大家提供參考。在大數(shù)據(jù)的時代下,要把大數(shù)據(jù)資產(chǎn)管好,面臨的挑戰(zhàn)巨大。未來,大數(shù)據(jù)資產(chǎn)管理面臨的是大集中、全鏈接的趨勢,是支撐業(yè)務(wù)運營深度融合的趨勢,同時將有更多新的技術(shù)可以支撐數(shù)據(jù)資產(chǎn)管理的發(fā)展。

大事務(wù)

魏凱主任從雙十一的電商年度大戰(zhàn)展開對于大事務(wù)的解讀:每年雙十一,阿里、京東等電商平臺的交易峰值節(jié)節(jié)攀高,基本上保持在每年都能夠翻一番的節(jié)奏。隨著網(wǎng)銀、互聯(lián)網(wǎng)金融的發(fā)展,傳統(tǒng)金融機構(gòu)這幾年交易處理量也在飛速增長,傳統(tǒng)的依賴主機中心化數(shù)據(jù)庫難以應(yīng)對增長如此迅猛的事物處理流量。

于是,金融機構(gòu),特別是各大銀行都開始了“核心下移”的工作,也就是用分布式數(shù)據(jù)庫承載越來越多的交易,為核心系統(tǒng)“減負”,并逐步向全開放的分布式架構(gòu)演進。我們都知道,任何一家金融機構(gòu),用戶交易數(shù)據(jù)的處理系統(tǒng),是企業(yè)的生命線,是核心系統(tǒng)。但是,事物數(shù)據(jù)處理的分布式處理,實現(xiàn)起來難度很大,是硬骨頭,目前還沒有非常成熟的方案。為了解決這個痛點,信通院也正在與多家銀行和數(shù)據(jù)庫廠商聯(lián)合攻關(guān)。

總的來看,當前無論是金融業(yè)還是IT業(yè),都正在經(jīng)歷臨翻天覆地的變化,技術(shù)需求方與技術(shù)供給方都需要攜手,共同解決金融大數(shù)據(jù)應(yīng)用面臨的挑戰(zhàn)。

“我們信通院希望能夠扮演的角色,就是成為大數(shù)據(jù)技術(shù)發(fā)展的橋梁,鏈接各個方面,成為一個平臺,推動術(shù)變得更好用,讓技術(shù)與金融行業(yè)融合的門檻不斷降低,讓科技更好的服務(wù)金融業(yè)務(wù)創(chuàng)新。”魏凱表示。

為進一步落實國家《促進大數(shù)據(jù)發(fā)展行動綱要》和《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016-2020年)》,支撐國家大數(shù)據(jù)戰(zhàn)略落地,推動大數(shù)據(jù)產(chǎn)業(yè)交流與合作,展示我國大數(shù)據(jù)產(chǎn)業(yè)最新發(fā)展成果,由中國信息通信研究院與數(shù)據(jù)中心聯(lián)盟大數(shù)據(jù)發(fā)展促進委員會共同主辦的“2018大數(shù)據(jù)產(chǎn)業(yè)峰會”將于2018年4月18-19日在北京國家會議中心隆重開。

分享到

xiesc

相關(guān)推薦