隨著大數(shù)據(jù)、機(jī)器學(xué)習(xí)、圖像識(shí)別等核心技術(shù)的發(fā)展,人工智能正在重構(gòu)金融服務(wù)業(yè)態(tài)。從最初的理念滲透到運(yùn)營(yíng)的各個(gè)層面,金融機(jī)構(gòu)的業(yè)務(wù)流程正在加速向智能化過(guò)渡。同時(shí),通過(guò)數(shù)據(jù)、技術(shù)的驅(qū)動(dòng),實(shí)現(xiàn)高精度反作弊識(shí)別,對(duì)數(shù)據(jù)更多維度的深度挖掘,將提高金融與場(chǎng)景的融合,重構(gòu)金融體驗(yàn)。
作為大數(shù)據(jù)領(lǐng)域的領(lǐng)先人物,白冬立從熱云數(shù)據(jù)近年的的創(chuàng)新與實(shí)踐成果出發(fā),與參會(huì)人員和嘉賓分享了金融領(lǐng)域大數(shù)據(jù)營(yíng)銷、反作弊等前沿見(jiàn)解。
白冬立首先介紹了2017年移動(dòng)廣告點(diǎn)擊數(shù)據(jù),2017年熱云數(shù)據(jù)所服務(wù)的1000多家2B客戶,2017年在廣告投放過(guò)程中的數(shù)據(jù),也就是廣告點(diǎn)擊數(shù)據(jù)。大家可以看到我們所服務(wù)的客戶2017年在互聯(lián)網(wǎng)尤其是移動(dòng)互聯(lián)網(wǎng)營(yíng)銷這方面,投放量實(shí)際上是逐步在上升的。但是通過(guò)監(jiān)測(cè)發(fā)現(xiàn),75%以上都是欺詐流量。2017年所監(jiān)測(cè)到的全網(wǎng)廣告點(diǎn)擊數(shù)量超過(guò)2000億次。到12月份我們知道國(guó)內(nèi)這么多的客戶累計(jì)9.5億的設(shè)備在移動(dòng)互聯(lián)網(wǎng)領(lǐng)域的用戶行為數(shù)據(jù),而這些用戶行為數(shù)據(jù)是從廣告點(diǎn)擊開(kāi)始跳轉(zhuǎn)到應(yīng)用的下載頁(yè)面,從下載頁(yè)面再到產(chǎn)品被使用、激活后續(xù)的行為數(shù)據(jù)包括付費(fèi),電商客戶、金融客戶也會(huì)把一些消費(fèi)的數(shù)據(jù)或者說(shuō)貸款數(shù)據(jù)報(bào)送給我們。
白冬立表示熱云數(shù)據(jù)能夠監(jiān)測(cè)廣告平臺(tái)帶來(lái)的客戶的真實(shí)性,是否具有欺詐行為,也包括數(shù)據(jù)背后都有什么屬性。當(dāng)我們有了這么多互聯(lián)網(wǎng)行為數(shù)據(jù)之后,這個(gè)服務(wù)到底能為客戶帶來(lái)什么樣的價(jià)值?我們拿到的都是真實(shí)的每天上網(wǎng)、使用APP或者玩游戲,甚至是購(gòu)物的真實(shí)行為數(shù)據(jù),將會(huì)補(bǔ)充我們真實(shí)的數(shù)據(jù)模型。
另外,白冬立介紹到,在這基礎(chǔ)上還做了反欺詐和反作弊的算法服務(wù),因?yàn)槲覀兎e累了很多數(shù)據(jù),所以我們認(rèn)為基于歷史數(shù)據(jù)行為其實(shí)是可以做這樣的事情,由于我們有些設(shè)備的行為已經(jīng)非常清晰了,不用做任何算法、不用做機(jī)器學(xué)習(xí)和人工智能處理就基于真實(shí)行為本身可以做一些參考,所以我們做了這樣的服務(wù),另外,各種各樣的流量入口、流量來(lái)源、信息流、廣告來(lái)檬、Adx/DSP、WAP站最上層的是真實(shí)客戶、欺詐流量或者欺詐設(shè)備,有這樣的體系我們就可以去為金融以及互聯(lián)網(wǎng)客戶從用戶獲取新增客戶判斷用戶或者設(shè)備真假性。一旦我們已經(jīng)知道這個(gè)人是誰(shuí)了、知道真與假了,剩下的事情就是如何留存,或者說(shuō)讓他盡可能在我們這多消費(fèi)、讓我們維護(hù)他。
剛才我提到了過(guò)程當(dāng)中的防欺詐和反作弊的算法服務(wù),基于我們的統(tǒng)計(jì)和數(shù)據(jù)就可以做一些事情。首先第一個(gè)設(shè)備級(jí)的反作弊,因?yàn)槲覀冎垃F(xiàn)在我們的客戶80%甚至90%以上都是通過(guò)移動(dòng)設(shè)備去操作,我們做一件事情就是設(shè)備級(jí)反作弊是不是模擬器、機(jī)刷、是不是預(yù)裝等等的,首先先把藍(lán)牙識(shí)別出來(lái)。第二就是黑名單的反作弊,基于我們對(duì)用戶歷史行為數(shù)據(jù)的統(tǒng)計(jì)和分析得出來(lái)的數(shù)據(jù)庫(kù),經(jīng)常作弊的設(shè)備做了一個(gè)黑名單,我們發(fā)現(xiàn)有很多這樣的移動(dòng)設(shè)備行為已經(jīng)很清晰的知道作弊,一旦發(fā)現(xiàn)有這樣一個(gè)設(shè)備我們潛意識(shí)就認(rèn)為這是有問(wèn)題的,所以我們會(huì)做標(biāo)注,會(huì)打分評(píng)級(jí)降低,這個(gè)行為跟專家講的基于單個(gè)用戶的征信不一樣的地方就在于我們數(shù)據(jù)的量級(jí)其實(shí)可以做到全網(wǎng)的反作弊模型,
這涉及兩個(gè)方面:第一個(gè)是跨APP的機(jī)器學(xué)習(xí),人工智能算法。判斷的標(biāo)準(zhǔn)就在于假設(shè)說(shuō)一個(gè)用戶同時(shí)或者在很短的時(shí)間范圍內(nèi)再多家相同類型、不同類型APP當(dāng)中都有異常行為,或者可能會(huì)傷害到客戶利益的行為我們都認(rèn)為有可能在作弊。
第二個(gè)就是跨推廣媒體的學(xué)習(xí),我們會(huì)在多家推廣媒體有做線下的、做視頻廣告和信息流投放的,經(jīng)過(guò)這幾步設(shè)備級(jí)以及我們基于黑名單庫(kù)、全網(wǎng)跨APP/跨媒體數(shù)據(jù)分析的話,我們就能夠通過(guò)用戶行為數(shù)據(jù)的角度幫助客戶做防欺詐和反作弊工作。
DMP方面,白冬立介紹,把每個(gè)客戶身上帶的行為、屬性都做了一些標(biāo)準(zhǔn)化,有了這樣的一個(gè)標(biāo)準(zhǔn)化的系統(tǒng)我們就可以對(duì)外提供一些服務(wù)了,我們會(huì)把這些數(shù)據(jù)以標(biāo)準(zhǔn)API接口的形式開(kāi)放出來(lái),當(dāng)然我們其實(shí)沒(méi)有太多客戶的隱私數(shù)據(jù),都是一些互聯(lián)網(wǎng)的行為數(shù)據(jù)去掉敏感的信息之后提供出來(lái)的,假設(shè)說(shuō)有一個(gè)客戶想要知道用戶的互聯(lián)網(wǎng)行為數(shù)據(jù)我們這里就有一些,我們跟運(yùn)營(yíng)商去做“三號(hào)合一”做唯一設(shè)備識(shí)別就可以獲取到一些數(shù)據(jù),都是一些什么數(shù)據(jù)呢?大概就是這樣的8大類、62個(gè)標(biāo)簽以及400多個(gè)二級(jí)標(biāo)簽?;緦傩源蠹叶己苁煜ち耍袨榱?xí)慣以及興趣偏好,更多的我認(rèn)為我們的價(jià)值停留在用戶互聯(lián)網(wǎng)行為數(shù)據(jù)偏好這塊,如果大家對(duì)這塊數(shù)據(jù)有訴求的話我們可以提供這方面的支持和保障。
基于數(shù)據(jù)、算力和新的人工智能算法的提升,白冬立認(rèn)為,未來(lái)各行業(yè)將迎來(lái)人工智能爆發(fā)的時(shí)代,而熱云數(shù)據(jù)作為第三方獨(dú)立的大數(shù)據(jù)服務(wù)提供商,會(huì)在這個(gè)大趨勢(shì)里有更加廣闊的發(fā)展空間,為客戶提供更多的優(yōu)質(zhì)數(shù)據(jù)產(chǎn)品服務(wù)。