來自國家新一代人工智能戰(zhàn)略咨詢委員會、國家兩院院士、人民銀行等有關(guān)領(lǐng)導(dǎo)以及國家開發(fā)銀行、中農(nóng)工建交五大行及20余家商業(yè)銀行及保險等金融領(lǐng)域?qū)<?00余人出席會議。
大會聯(lián)合發(fā)布了專題報告《智能金融聯(lián)合報告:與AI共進(jìn),致勝未來》,同時中國工商銀行、中國農(nóng)業(yè)銀行、中國銀行、國泰君安等國內(nèi)主流金融機(jī)構(gòu)以及百度、騰訊、百度等知名科技企業(yè)、研究機(jī)構(gòu)發(fā)布了金融科技最新成果和應(yīng)用創(chuàng)新案例;微軟、IBM、埃森哲、畢馬威、普華永道等國際知名科技與咨詢公司就“區(qū)塊鏈、數(shù)字貨幣與智能金融”等當(dāng)前熱點話題進(jìn)行了圓桌對話。
中國金融科技創(chuàng)新大會在國家互聯(lián)網(wǎng)信息辦公室、中國人民銀行、工業(yè)和信息化部等部委的指導(dǎo)和支持下,已成功舉辦三屆,活動立足國內(nèi),放眼全球,已成為金融科技業(yè)界理論研究、趨勢探討、案例推介、成果分享、應(yīng)用指導(dǎo)和業(yè)務(wù)對接的交流平臺,對于推動我國金融科技的理論研究和業(yè)務(wù)創(chuàng)新,維護(hù)國家金融信息安全和金融體系穩(wěn)定有著積極意義。
天云大數(shù)據(jù)獲獎全文:天云大數(shù)據(jù)有效對銀行信用卡申卡欺詐預(yù)警
當(dāng)前,伴隨著金融市場向著國際化、自由化的方向發(fā)展,由金融衍生出的信貸工具越來越多,信用卡作為一種新型的、大眾化的金融電子產(chǎn)品給銀行帶來了兼有利弊的機(jī)遇和挑戰(zhàn)。所謂挑戰(zhàn)則是在辦理信用卡中存在的風(fēng)險問題,銀行每年因金融欺詐損失數(shù)十億元,傳統(tǒng)的離散式反欺詐分析方法的漏洞暴露得越來越多,已無法有效阻止這些欺詐行為,經(jīng)驗豐富的欺詐者利用這些漏洞創(chuàng)造出更多的欺詐手段而不被金融機(jī)構(gòu)發(fā)現(xiàn)。如何迅速有效的預(yù)測信用卡欺詐者,成為避免信用卡風(fēng)險的關(guān)鍵。在這個需求的推動下,大數(shù)據(jù)信用卡申卡欺詐預(yù)警應(yīng)運而生。
天云大數(shù)據(jù)致力于幫助企業(yè)解決內(nèi)部數(shù)據(jù)的分析和已有數(shù)據(jù)孤島問題,基于對金融、保險、運營商、廣視等行業(yè)的數(shù)據(jù)治理經(jīng)驗的沉淀和復(fù)制,在服務(wù)過程中,研究由數(shù)據(jù)衍生出的各類產(chǎn)品的共性,探索出一套完整的數(shù)據(jù)產(chǎn)品服務(wù)體系。其在金融服務(wù)領(lǐng)域為銀行、保險等客戶提供歷史數(shù)據(jù)挖掘、風(fēng)險一體化、風(fēng)險種子識別、申卡欺詐預(yù)警等服務(wù)。
需要解決的問題
2016年上半年中國信用卡行業(yè)整體逾期半年未償貸款總額超過480億元,壞賬率較年初上升0.2個百分點。為更好應(yīng)對欺詐風(fēng)險,提高欺詐預(yù)警效率,國內(nèi)銀行不斷加強研究反欺詐手段,加強不同產(chǎn)品條線、業(yè)務(wù)部門之間的分工協(xié)作,防范欺詐風(fēng)險。但是,從總體情況來看,國內(nèi)銀行的欺詐風(fēng)險分析預(yù)警工作仍處于初級階段,面對欺詐者越來越多樣的高新技術(shù)手段,欺詐團(tuán)伙越來越組織嚴(yán)禁密切復(fù)雜的欺詐活動,欺詐范圍逐漸趨向國際化的現(xiàn)狀,以及隨著信用卡交易由有卡交易逐漸向無卡交易過度,為欺詐者提供了更多的便利,加強了其欺詐手段的隱蔽性,造成欺詐分析預(yù)警工作難度的增大,銀行亟需系統(tǒng)研究銀欺詐風(fēng)險,積極探尋應(yīng)對之策。
目前行業(yè)申卡欺詐分析預(yù)警工作存在的問題如下:
1.欺詐分析數(shù)據(jù)僅僅局限于歷史數(shù)據(jù)
銀行現(xiàn)有的申卡欺詐分析預(yù)警系統(tǒng)主要基于歷史數(shù)據(jù)進(jìn)行分析建立相關(guān)規(guī)則,對申卡信息進(jìn)行規(guī)則匹配判斷預(yù)警欺詐人員以及進(jìn)行欺詐類別判斷。而對于目前大部分銀行來說,其欺詐分析預(yù)警系統(tǒng)都是由不同部門在不同時期根據(jù)各自業(yè)務(wù)需要建立的,不同系統(tǒng)間信息相對隔離,不能做到及時傳遞、整合和共享,風(fēng)險信息條線化、碎片化問題嚴(yán)重。此外,已經(jīng)建立的系統(tǒng)主要是客戶信息采集系統(tǒng),以收集客戶信息、檢測業(yè)務(wù)動態(tài)、提供綜合查詢和統(tǒng)計報表等功能為主,對損失歷史數(shù)據(jù)的積累和分析嚴(yán)重不足,在缺乏損失事件基礎(chǔ)數(shù)據(jù)庫支撐的情況下,難以對欺詐風(fēng)險進(jìn)行定量識別和評估。
2.基于規(guī)則匹配預(yù)判,受限制性強
目前銀行的申卡欺詐分析工作主要基于規(guī)則匹配進(jìn)行實現(xiàn)。一方面,傳統(tǒng)的規(guī)則匹配普適性較差,伴隨著新的參數(shù)狀態(tài)的出現(xiàn)常常有新的匹配規(guī)則需要被及時定制以進(jìn)行新的欺詐判斷。長久積累的結(jié)果就是規(guī)則積累的數(shù)量不斷增多,與此同時規(guī)則維護(hù)需要的人員也迅速增長,銀行壓力漸漸增大,到最后已經(jīng)無力應(yīng)付規(guī)則維護(hù)強大的壓力沖擊。另一方面,規(guī)則匹配要求業(yè)務(wù)的可表達(dá)性強,需要人工的介入,此種情況下,必然受到職業(yè)素養(yǎng)、道德品質(zhì)等主觀因素影響,造成的結(jié)果為較強的規(guī)則可規(guī)避性,引起欺詐風(fēng)險的提高。
3.人才配備不能滿足需要,專業(yè)人才能力要求較高。
欺詐風(fēng)險分析預(yù)警對商業(yè)銀行而言是一項難度系數(shù)比較高的工作,專業(yè)人才的積累和培養(yǎng)還需要一定時間,二隨著新技術(shù)的引入,人才空缺的范圍進(jìn)一步擴(kuò)大,接受過系統(tǒng)培訓(xùn)的人才一旦跳槽,很難從市場上找到合適人選。此外,銀行人才資源主要向前臺傾斜,中后臺配置高素質(zhì)人才在薪酬激勵、職業(yè)發(fā)展等方面也都存在諸多制約。反欺詐工作缺乏高素質(zhì)、復(fù)合性人才資源支撐,直接影響了反欺詐工作的專業(yè)化水平。
解決方案
隨著互聯(lián)網(wǎng)+時代的到來,各種各樣的信息越來越多的被以“數(shù)據(jù)”的形式記錄、存儲下來。對于銀行而言,其數(shù)據(jù)體系也逐漸發(fā)展成包括結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù),半結(jié)構(gòu)化數(shù)據(jù)的完整體系,涵蓋除了申卡系統(tǒng)及其相關(guān)流程的文本數(shù)據(jù)之外的email數(shù)據(jù)、錄音數(shù)據(jù)、視頻數(shù)據(jù)等以及其他的外部數(shù)據(jù)如銀聯(lián)數(shù)據(jù)。數(shù)據(jù)體系的擴(kuò)展如雙刃劍一般對銀行欺詐分析預(yù)警帶來機(jī)遇和挑戰(zhàn)。一方面,數(shù)據(jù)的豐富拓展,提高了欺詐風(fēng)險分析預(yù)警的準(zhǔn)確度,帶來了新的研究方式與研究角度;另一方面,數(shù)據(jù)量的增大,數(shù)據(jù)類型的增多,增加了數(shù)據(jù)處理的難度,傳統(tǒng)的基于規(guī)則匹配的離散式欺詐分析預(yù)警系統(tǒng)已經(jīng)無法適應(yīng)龐大的數(shù)據(jù)系統(tǒng),無法提供更為合適準(zhǔn)確的判斷方法。
天云融創(chuàng)融合銀行內(nèi)部的數(shù)據(jù),建立數(shù)據(jù)挖掘系統(tǒng),引入地域關(guān)系、聯(lián)系關(guān)系、推薦關(guān)系等拓展建立申請人社交關(guān)系復(fù)雜網(wǎng)絡(luò),聯(lián)合銀行信用卡申請系統(tǒng)數(shù)據(jù),利用大數(shù)據(jù)分析技術(shù),建立信用卡申卡欺詐分析預(yù)警新模式。
1.引入復(fù)雜網(wǎng)絡(luò),構(gòu)建申請客戶社交關(guān)系網(wǎng)絡(luò)
具有自組織、自相似、吸引子、小世界、無標(biāo)度中部分或全部性質(zhì)的網(wǎng)絡(luò)稱為復(fù)雜網(wǎng)絡(luò),只要能抽象出網(wǎng)絡(luò)結(jié)構(gòu)的客觀事務(wù),都可以作為復(fù)雜網(wǎng)絡(luò)的研究的對象。天云融創(chuàng)將某大型股份制商業(yè)銀行北京地區(qū)信用卡申請客戶的基礎(chǔ)信息數(shù)據(jù)(總計超過30萬)借助復(fù)雜神經(jīng)網(wǎng)絡(luò)Hilbert,把申請人、申請人親屬、聯(lián)系人及推廣人這四種角色的移動電話、家庭電話、辦公電話的相同作為關(guān)系,構(gòu)建客戶社交網(wǎng)絡(luò)圖,設(shè)計并計算出相關(guān)社交數(shù)據(jù)。
2.引入深度學(xué)習(xí),構(gòu)建欺詐分析新模式
深度學(xué)習(xí)是在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上構(gòu)建一個多層結(jié)構(gòu)學(xué)習(xí)能力的算法。2016年Gartner在全球范圍內(nèi)對于計算智能的統(tǒng)計顯示,深度學(xué)習(xí)的熱度僅次于機(jī)器人被列入前三名的位置。近年來依托分布式、內(nèi)存等機(jī)器計算能力的飛速發(fā)展,深度學(xué)習(xí)在金融領(lǐng)域有了更廣泛的應(yīng)用。
神經(jīng)網(wǎng)絡(luò)是一種通過模仿人腦信息,類似于大腦神經(jīng)突觸聯(lián)接的結(jié)構(gòu)加工過程的智能化信息處理技術(shù)及進(jìn)行信息處理的數(shù)學(xué)模型,與博弈論中的動態(tài)博弈很相似,具有自適應(yīng)性、自組織性以及較強勁的穩(wěn)健性,在應(yīng)用過程中具有很強的魯棒性和容錯性,能夠并行處理方法,具有自學(xué)習(xí)性,擁有自組織、自適應(yīng)性和很強的信息綜合能力等良好性能,能同時處理定量和定性的信息,能很好的協(xié)調(diào)多種輸入信息關(guān)系,適用于處理復(fù)雜非線性和不確定對象,能成功的應(yīng)用于多種不同的信息處理。天云融創(chuàng)將復(fù)雜網(wǎng)絡(luò)得出的申請人社交數(shù)據(jù),聯(lián)合推廣人信息數(shù)據(jù)、申請人信息數(shù)據(jù)、單位聯(lián)系數(shù)據(jù)等引入神經(jīng)網(wǎng)絡(luò)模型,神經(jīng)網(wǎng)絡(luò)在真實的數(shù)據(jù)集環(huán)境中學(xué)習(xí),通過不斷地學(xué)習(xí)過程提高效率,交互式的調(diào)整其連接權(quán)重,通過不斷增加學(xué)習(xí)過程,增強神經(jīng)網(wǎng)絡(luò)模型對真實數(shù)據(jù)集的環(huán)境的了解,當(dāng)所有用于估計模型的訓(xùn)練集樣本誤差達(dá)到最小時,神經(jīng)網(wǎng)絡(luò)擬合完成,并且隱含的神經(jīng)網(wǎng)絡(luò)模型決定屬性的分類規(guī)則。根據(jù)需求把新的申請信用卡客戶屬性轉(zhuǎn)換為相應(yīng)的數(shù)據(jù)代入模型,便可以得到客戶是否數(shù)據(jù)欺詐屬性以及其所屬類別。
圖 一個簡單的神經(jīng)網(wǎng)絡(luò)
3.申卡客戶社交關(guān)系網(wǎng)絡(luò)構(gòu)建
在申卡客戶復(fù)雜關(guān)系網(wǎng)絡(luò)的過程中,天云融創(chuàng)利用具體某地區(qū)信用卡申請客戶的基礎(chǔ)信息數(shù)據(jù),對該地區(qū)進(jìn)件審批數(shù)據(jù)有全面的了解之后,確定該數(shù)據(jù)中包含申請人、推薦人在內(nèi)的四種角色,借助復(fù)雜神經(jīng)網(wǎng)絡(luò)Hilbert將申請人角色作為社交網(wǎng)絡(luò)的關(guān)鍵節(jié)點,把四種角色的電話、地址等的相同作為關(guān)系,來實現(xiàn)復(fù)雜網(wǎng)絡(luò)的構(gòu)建,設(shè)計并計算出相關(guān)社交數(shù)據(jù)。
圖 申卡客戶社交關(guān)系復(fù)雜網(wǎng)絡(luò)
4.基于神經(jīng)網(wǎng)絡(luò)模型的客戶欺詐分析預(yù)警
天云融創(chuàng)將該地區(qū)信用卡申請客戶基礎(chǔ)信息數(shù)據(jù),以及復(fù)雜網(wǎng)絡(luò)計算所得社交數(shù)據(jù),主要使用神經(jīng)網(wǎng)絡(luò)模型和邏輯回歸模型進(jìn)行模型訓(xùn)練和樣本測試。選取指標(biāo)對模型測試結(jié)果進(jìn)行評價,并進(jìn)行相應(yīng)的改進(jìn),最終運用模型對申卡客戶進(jìn)行欺詐分析。
通過神經(jīng)網(wǎng)絡(luò)和邏輯回歸模型的交叉驗證以及預(yù)測結(jié)果可以看出,神經(jīng)網(wǎng)絡(luò)模型的AUC值能夠達(dá)到0.9,相比邏輯回歸模型的AUC值0.86,具有明顯的優(yōu)化效果。
達(dá)到的效果
當(dāng)前階段,大數(shù)據(jù)申卡欺詐分析預(yù)警技術(shù)是傳統(tǒng)欺詐預(yù)警的有力補充,二者結(jié)合既提高了申卡欺詐分析預(yù)警的效果,使普惠金融得以有可能真正落地。尤其隨著互聯(lián)網(wǎng)+的發(fā)展,各種信息以數(shù)據(jù)的形式被存儲記錄,大數(shù)據(jù)欺詐預(yù)警更是發(fā)揮了重要的作用,其使欺詐預(yù)警的評估維度更多、預(yù)警效率更高、應(yīng)用場景也更加多樣化。
1.擴(kuò)大了申卡欺詐數(shù)據(jù)源
目前的大數(shù)據(jù)反欺詐技術(shù)離不開文本挖掘,最重要的是語義識別。其次重要的是圖像的挖掘,包括OCR識別圖像文字、相似圖片等等。傳統(tǒng)申卡欺詐分析中往往運用強變量來評估個人在未來信用卡使用行為中的表現(xiàn),沒有整合分析其他維度的數(shù)據(jù)源。大數(shù)據(jù)申卡欺詐分析預(yù)警系統(tǒng),首先,融合了信用卡申請環(huán)節(jié)的各個業(yè)務(wù)數(shù)據(jù),解決了數(shù)據(jù)孤島的問題;其次,引入第三方數(shù)據(jù),比如銀聯(lián)數(shù)據(jù)等,擴(kuò)展了數(shù)據(jù)的維度;最后,通過復(fù)雜網(wǎng)絡(luò)技術(shù),構(gòu)建申卡客戶的社交復(fù)雜網(wǎng)絡(luò)提供客戶的社交數(shù)據(jù),在拓展覆蓋維度的同時,以弱變量來體現(xiàn)強變量,并且實現(xiàn)了社交數(shù)據(jù)的高頻率更新,提高了數(shù)據(jù)的準(zhǔn)確有效性。
2.極大提高申卡欺詐預(yù)警準(zhǔn)確率
傳統(tǒng)的申卡欺詐分析預(yù)警技術(shù)需要大量的人工審核工作,必然摻雜了員工的主觀因素,同時也提高了銀行內(nèi)外部聯(lián)合詐騙的風(fēng)險?;诖髷?shù)據(jù)技術(shù)的申卡欺詐分析預(yù)警系統(tǒng),大量減少了人工操作部分,同時提供了社交關(guān)系數(shù)據(jù)庫,提高申卡欺詐預(yù)警的準(zhǔn)確率。
3.擴(kuò)大了申卡欺詐分析模式
傳統(tǒng)的申卡欺詐分析模式主要是基于規(guī)則匹配模型進(jìn)行實現(xiàn)。隨著經(jīng)濟(jì)的發(fā)展,市場的變化,科技的創(chuàng)新,欺詐方式不斷更新積累,這倒是規(guī)則的數(shù)量不斷增多到非常龐大的數(shù)量,維護(hù)和迭代更新的壓力增大?;诖髷?shù)據(jù)技術(shù)的申卡欺詐分析預(yù)警模式,主要是對大量數(shù)據(jù)進(jìn)行挖掘,提供和清洗訓(xùn)練樣本,針對億級別的訓(xùn)練樣本,提取擴(kuò)展千萬的特征,結(jié)合社交關(guān)系數(shù)據(jù),利用大規(guī)模機(jī)器學(xué)習(xí)和深度學(xué)習(xí)平臺進(jìn)行模型訓(xùn)練。新型模式具有準(zhǔn)召率高、預(yù)測效率高、善于發(fā)現(xiàn)新模型、從海量數(shù)據(jù)中總結(jié)規(guī)律、模型穩(wěn)定、還有能力同時應(yīng)對多個分類的優(yōu)勢。