Bots安裝作弊,是指作弊者通過 Bots來模擬真實用戶的應(yīng)用安裝行為,從而竊取廣告主的廣告預(yù)算。Bots安裝作弊之所以難以檢測是因為Bots看起來很像真實用戶,它具有真實的IP、Device等,甚至可以進行應(yīng)用內(nèi)的事件,如:在指定時間打開應(yīng)用,加購等。
目前,許多基于機器學(xué)習(xí)的移動廣告作弊檢測方法都旨在解決廣告展現(xiàn)或點擊作弊問題,但很少有關(guān)于安裝作弊檢測,尤其是Bots安裝作弊檢測的研究。Mobvista集團副總裁朱亞東博士介紹,當(dāng)下的許多方法都采用了集成方法等技術(shù),例如:Random Forest和XGBoost等,盡管這些方法能夠通過復(fù)雜的特征工程挖掘出豐富的作弊模式,但由于它們無法利用結(jié)構(gòu)信息來構(gòu)建實體之間的各類關(guān)系,因此這些方法并非最好的解決方案。
在此背景下,Mobvista反作弊團隊提出了一種混式學(xué)習(xí)方法,該方法結(jié)合了神經(jīng)網(wǎng)絡(luò)(GNN)和梯度提升分類器,能夠同時考慮局部上下文信息和全局上下文信息,以此來更好地檢測移動廣告中的Bots安裝作弊。該團隊并未直接利用現(xiàn)有的GNN模型,而是根據(jù)Mobvista的具體業(yè)務(wù)和Bots安裝作弊的特點構(gòu)建一個異構(gòu)圖并設(shè)計了一種新穎的消息傳遞機制來提取局部上下文信息;以及通過一個Pre-trained的梯度提升分類器模型來提取全局上下文信息。 BotSpot模型的架構(gòu)如下圖所示:
通過在Mobvista上對真實數(shù)據(jù)進行的實驗結(jié)果顯示,BotSpot模型在檢測Bots安裝作弊方面具有更大的優(yōu)越性。在指定精確率(Precision)為90%的情況下,BotSpot模型在兩個離線數(shù)據(jù)集上相比所有其它Baseline方法在召回率(Recall)方面分別提高至少2.2%和5.75%。
作為全球領(lǐng)先的技術(shù)平臺,在Mobvista每天有超過100萬次應(yīng)用安裝,因此Mobvista十分重視對各類移動應(yīng)用安裝作弊手段的研究,以防廣告主的預(yù)算在沒有任何實際轉(zhuǎn)換的情況下被浪費。值得一提的是,今年5月份,Mobvista針對移動廣告作弊問題,還發(fā)布了《移動廣告反作弊白皮書2.0》,詳細闡述了當(dāng)前的移動廣告領(lǐng)域的作弊情況、作弊方式及相應(yīng)的反作弊策略等。
朱亞東博士表示,研究移動廣告領(lǐng)域的Bots安裝作弊檢測問題,是增強移動廣告行業(yè)的透明度并推動行業(yè)規(guī)范化發(fā)展的關(guān)鍵,然而目前卻鮮少有機構(gòu)針對該領(lǐng)域進行研究,Mobvista始終站在移動廣告反作弊攻防這一戰(zhàn)場的最前線,希望通過此次論文的分享,能夠為行業(yè)帶來更多的思考。
公開資料顯示,Mobvista成立于2013年,目前已覆蓋全球超85個國家,在全球18個城市設(shè)有辦事處,為全球超過3000個應(yīng)用開發(fā)者提供移動廣告推廣服務(wù),且在其700多名員工中,有超過45%為技術(shù)研發(fā)人員。本次被CIKM錄用的論文,是在集團副總裁朱亞東指導(dǎo)下完成,并得到了中山大學(xué)梁上松教授的指點和幫助。10月22日,Mobvista高級算法工程師姚天峻及資深算法工程師李青也將代表反作弊團隊在CIKM大會上進行該成果的詳細分享,敬請期待。
完整論文下載鏈接:https://www.mobvista.com/en/college#botspot