柴洪峰教授介紹說:“中國銀聯(lián)有豐富的大數(shù)據(jù)資源,涉及43億張銀行卡,超過9億的持卡人,超過一千萬戶的商戶,每天有七千萬筆的交易數(shù)據(jù),每天核心交易數(shù)據(jù)都要超過TB級,我們銀聯(lián)的數(shù)據(jù)資源無論宏觀層面還是微觀層面都有很高的價值。這個價值體現(xiàn)在哪?我就要說一下銀聯(lián)的數(shù)據(jù)價值,支付數(shù)據(jù)的特點是更具參考性,他們可以衡量真實的購買行為,從而促進用戶定向,個性定價,產(chǎn)品推薦,用戶忠誠度和流失建模等策略。”
壓力與挑戰(zhàn)
銀聯(lián)開展大數(shù)據(jù)工作有很多背景要素,從銀聯(lián)支付數(shù)據(jù)看,銀聯(lián)數(shù)據(jù)處理過程中也遇到了挑戰(zhàn)。銀聯(lián)原來的處理方法已經(jīng)滿足大數(shù)據(jù)的需求,從銀聯(lián)自身業(yè)務(wù)看,很多精細化的業(yè)務(wù)也需要大數(shù)據(jù)的強力支撐。從合作伙伴角度來看,合作伙伴對多樣性的數(shù)據(jù)服務(wù)有需求,從電子商務(wù)這個行業(yè)來看,通過大數(shù)據(jù)的挖掘來提升行業(yè)發(fā)展水平。從國家示范項目建設(shè)來看,大數(shù)據(jù)相關(guān)工作也是銀聯(lián)承接國家項目的工作重點,銀聯(lián)也在這方面加大了力度。銀聯(lián)對大數(shù)據(jù)有個指導思想,首先我們希望整合各類內(nèi)外部的數(shù)據(jù),通過大家合作,基于這些數(shù)據(jù),建立相應大數(shù)據(jù)基礎(chǔ)設(shè)施,可以使這些數(shù)據(jù)可以安全方便獲取,基于大數(shù)據(jù)的平臺,我們會開展大跨度的數(shù)據(jù)統(tǒng)計分析以及深度化的數(shù)據(jù)挖掘工作,這些分析和挖掘工作對外對內(nèi)合作伙伴都進行服務(wù)。
大數(shù)據(jù)系統(tǒng)實踐
銀聯(lián)大數(shù)據(jù)分四個層次,這個層次就是基礎(chǔ)數(shù)據(jù),基礎(chǔ)平臺,基礎(chǔ)數(shù)據(jù),模型研究和應用服務(wù),建設(shè)大數(shù)據(jù)平臺是銀聯(lián)開展大數(shù)據(jù)工作的第一步,有一個云平臺,充分匯集各方面的數(shù)據(jù),我們集成常見的分布式機器學習算法,我們已經(jīng)支撐了十幾個業(yè)務(wù)應用系統(tǒng)在實際生產(chǎn)著。我們和新華社一塊聯(lián)合發(fā)布了銀行卡消費信心指數(shù),BCCI,通過這個指數(shù)可以讀出居民消費水平和居民消費結(jié)構(gòu)的變化。銀聯(lián)大數(shù)據(jù)也在BCCI指數(shù)上有所體現(xiàn)。我們利用大數(shù)據(jù),也為持卡人提供數(shù)據(jù)服務(wù),首先持卡人可以通過銀聯(lián)錢包這一手機APP平臺,查詢到自己各張銀行卡的歷史交易。同時可以向持卡人提供更為豐富的持卡人帳單這些服務(wù)。客戶的細分工作也是今后電子商務(wù)與電子支付行業(yè)的熱點和重點,銀聯(lián)大數(shù)據(jù)實踐,基于外部數(shù)據(jù)和數(shù)據(jù)量化的指標以及數(shù)據(jù)總體特征,基于數(shù)據(jù)量化指標,我們可以分析出每個持卡人的個體特征,基于持卡人個體特征和總體特征,我們可以為持卡人打上各類類型的標簽。如商旅標簽,醫(yī)療標簽,購車標簽,形成我們每個人購買習慣、生活習慣的圖象。除了持卡人維度,我們在商戶維度上做了相應的工作,我們?yōu)樯虘籼峁┫鄳纳虡I(yè)智能分析,可以使商戶認識到自身的經(jīng)營情況,我們還為商戶提供同業(yè)商戶的比較,為商戶提供最佳合作對象,也是他這個鏈條當中的合作對象的聯(lián)合服務(wù)。同時我們也為商戶提供了客戶忠誠度、流失商戶的分析、回頭客的分析等等。
同時我們大數(shù)據(jù)還應用到了風險控制領(lǐng)域。我們利用機器學習的方法,對銀聯(lián)歷史數(shù)據(jù)進行挖掘,得到了七大交易的判斷模型,可以對銀聯(lián)轉(zhuǎn)接交易系統(tǒng)進行實時的判斷。銀聯(lián)大數(shù)據(jù)還有一個實踐,就是數(shù)據(jù)集合工作,這源于我們對大數(shù)據(jù)不同階段的認識。我們認為大數(shù)據(jù)從1.0、2.0、3.0不同發(fā)展階段,各階段的成熟度逐步提升,我們很清楚銀聯(lián)大數(shù)據(jù)資源有很高的質(zhì)量和價值,但有些不足。使得我們對終端客戶的到達能力還是有限的,因此我們希望通過數(shù)據(jù)的集合工作,融合內(nèi)外部的數(shù)據(jù),從而使銀聯(lián)的數(shù)據(jù)得到價值的提升。
我們在數(shù)據(jù)集合方面嘗試從兩個角度,第一利用公開的外部技術(shù)進行集合,我們利用爬蟲技術(shù),在互聯(lián)網(wǎng)上找持卡人、商戶的信息。另外通過合作伙伴的數(shù)據(jù)進行集合,如通信運營商的相關(guān)數(shù)據(jù),大家都知道斯諾登事件,說一個消息,如果利用一個月你的電話信息和一個月的信用卡信息,基本上分析這個人是什么樣的人,什么行為的人,是什么家庭背景的人,就能分析出來了,我們現(xiàn)在正在和通信運營商來做這項工作。
對于金融的大數(shù)據(jù),我們還是認為這將是大數(shù)據(jù)最有可為的領(lǐng)域之一。金融機構(gòu)可以說是大數(shù)據(jù)天生的合作者,一方面自身有著強烈的利用技術(shù)紅利帶來收益沖動,另一方面又有國內(nèi)較好良好的信息化基礎(chǔ),從數(shù)據(jù)層面,金融領(lǐng)域有著優(yōu)質(zhì)的數(shù)據(jù)資源,從技術(shù)層面看,金融企業(yè)的技術(shù)團隊也有強大的實力,從思維層面看,金融行業(yè)擁有最專業(yè)的金融能力,可以研究和開發(fā)最專業(yè)的金融大數(shù)據(jù)的產(chǎn)品和服務(wù)。面向金融大數(shù)據(jù)帶給行業(yè)的變革將是全方位的,例如在信用風險評估方面,實際我們征用系統(tǒng)還有待進一步挖掘,服務(wù)于這個社會。同時也可以在客戶服務(wù)方面基于大數(shù)據(jù)的技術(shù),也可以實現(xiàn)對客戶智能化的服務(wù)。在智能運營方面,大數(shù)據(jù)技術(shù)也可以對金融企業(yè)的數(shù)據(jù)進行分析,從而幫助金融機構(gòu)進行運營決策,降低成本,在產(chǎn)品創(chuàng)新方面,大數(shù)據(jù)參與新產(chǎn)品的設(shè)計,結(jié)合各方的數(shù)據(jù),使企業(yè)產(chǎn)品推陳出新。總之金融服務(wù)將從粗放式管理轉(zhuǎn)向科學化的管理,從以利潤為中心轉(zhuǎn)向以客戶為中心。銀聯(lián)大數(shù)據(jù)將圍繞客戶服務(wù)展開,結(jié)合內(nèi)外部的資源,形成對持卡人的各方面認知,如消費習慣、生活習慣,基于持卡人的認知,我們可以形成持卡人的響應預測。比如精準營銷,個性化服務(wù),在商戶層面,我們同樣會基于大數(shù)據(jù)的資源,形成對商戶各方面進一步深度的認知。如商戶的客戶群體經(jīng)營狀況,基于這些認識,我們將會形成商戶的響應預測,如商戶的發(fā)展預測,信用評估。
銀聯(lián)大數(shù)據(jù)工作將圍繞提供穩(wěn)定、高效、豐富的數(shù)據(jù)服務(wù)開展工作,我們還將提升大數(shù)據(jù)系統(tǒng)的穩(wěn)定性和效率。我們認為在大數(shù)據(jù)快速發(fā)展的背景下,合作共贏是大勢所趨,合作共贏第一方面是數(shù)據(jù)的互補,數(shù)據(jù)的共享,可以融合,創(chuàng)造新的價值。第二方面是資源的互補,資源的協(xié)同合作將帶來挖掘能力的提升,合作共贏的第三方面是業(yè)務(wù)互補。業(yè)務(wù)的互補與互用將發(fā)揮出大數(shù)據(jù)的最大效用,通過數(shù)據(jù)、資源等多方面的合作,必然可以產(chǎn)生眾多聯(lián)合跨界的創(chuàng)新成果。可以給大家大數(shù)據(jù)建設(shè)帶來更廣闊的想象發(fā)展空間。合作共贏是銀聯(lián)的一貫態(tài)度,我們的合作領(lǐng)域可以在很多方面,包括技術(shù)交流合作,數(shù)據(jù)的開放共享,模型模式的研究,行業(yè)的最佳實踐,以及數(shù)據(jù)的應用合作,銀聯(lián)愿攜手各方合作伙伴,共建銀行卡產(chǎn)業(yè)的大數(shù)據(jù)生態(tài)系統(tǒng)。
技術(shù)展望
我們對大數(shù)據(jù)的展望。首先大數(shù)據(jù)是在發(fā)展中完善的。在很多角度都體現(xiàn)了兩面性,大數(shù)據(jù)一方面在很多行業(yè)被廣泛應用,一方面又不夠成熟。大數(shù)據(jù)使用了全新的技術(shù)框架,但有時又不適宜傳統(tǒng)的應用場景,大數(shù)據(jù)概念已經(jīng)充分被解讀,但高價值的應用卻不豐富。大數(shù)據(jù)一方面百花齊放,一方面存在應用對接不平滑的現(xiàn)象。我們認為再經(jīng)過一段大家的努力,大數(shù)據(jù)的價值可以得到進一步的凸顯,但是是不是一個通用性的技術(shù),有待考量。
第二個感悟,關(guān)于數(shù)據(jù)開放中的信息安全問題,數(shù)據(jù)開放帶來數(shù)據(jù)價值的提升,帶來1+1>2的效果,但是也會帶來信息安全的問題,如個人隱私泄露的問題,更好的提升大數(shù)據(jù)的價值,我們需要法律政策層面的指導。更需要政府和企業(yè)的眾多嘗試,也需要在座各位朋友們大家互相支持,能夠產(chǎn)生合作。