KDD CUP(國(guó)際知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘競(jìng)賽)是由美國(guó)計(jì)算機(jī)協(xié)會(huì)知識(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘?qū)N瘯?huì)(ACM SIGKDD)發(fā)起的國(guó)際數(shù)據(jù)挖掘領(lǐng)域最高水平競(jìng)賽,每年吸引著眾多世界頂級(jí)企業(yè)、高校與研究機(jī)構(gòu)參與,在賽題上多年來保持著對(duì)解決實(shí)際問題的高敏感度。

此次螞蟻安全實(shí)驗(yàn)室參與的“商品搜索”賽道,是一個(gè)機(jī)器學(xué)習(xí)“深水區(qū)”應(yīng)用場(chǎng)景。據(jù)賽題發(fā)起方亞馬遜介紹,選手要挑戰(zhàn)的是電商中的核心技術(shù)之一,“從非常有難度的搜索查詢數(shù)據(jù)里匹配相關(guān)商品”。眾所周知,提高搜索結(jié)果的相關(guān)性可以顯著改善客戶體驗(yàn)及其對(duì)搜索的參與度,重要性不言而喻;但因商品量級(jí)巨大且多樣、商品信息缺失、搜索輸入噪聲大等疑難雜癥,使得正確分類特定搜索查詢商品在當(dāng)下仍具有極大技術(shù)挑戰(zhàn)性。

換句話說,這一賽道的要求是需要AI能夠不斷排除干擾,理解用戶可能拼錯(cuò)的搜索詞背后的真實(shí)需求,給出帶來更優(yōu)體驗(yàn)的結(jié)果。

此賽道分為三個(gè)賽題:指定搜索查詢下的商品排序、查詢與商品相關(guān)性分類、商品替代品識(shí)別。螞蟻安全實(shí)驗(yàn)室憑借多年來在圖像識(shí)別和自然語言處理領(lǐng)域的積累,對(duì)參賽模型的“搜索查詢理解增強(qiáng)能力”做了重點(diǎn)升級(jí),在查詢準(zhǔn)確率上表現(xiàn)優(yōu)異,從全球1699名選手中成功突圍,攬下雙賽題冠軍。

針對(duì)搜索內(nèi)容文本過于簡(jiǎn)短、包含信息較少的普遍痛點(diǎn),螞蟻安全實(shí)驗(yàn)室提出從關(guān)聯(lián)商品描述中提取關(guān)鍵詞作為搜索文本特征,同時(shí)通過算法大幅擴(kuò)充搜索文本信息量的方案,實(shí)現(xiàn)模型效果的顯著提升;面對(duì)噪音干擾,則采用自蒸餾手段有效降低噪音影響,從而提升了模型的魯棒性。

據(jù)介紹,本次大賽中螞蟻安全實(shí)驗(yàn)室所使用的關(guān)鍵詞挖掘及自蒸餾技術(shù),已大規(guī)模應(yīng)用于交互式風(fēng)控模型,對(duì)支付寶萬億規(guī)模交易中的欺詐、賭博風(fēng)險(xiǎn)關(guān)鍵詞挖掘發(fā)揮了重要作用。技術(shù)上來看,交互式風(fēng)控場(chǎng)景是一個(gè)類“商品搜索”問題:AI需要與潛在被騙用戶進(jìn)行對(duì)話,在用戶模糊且充滿噪音的語義表達(dá)中敏銳捕捉關(guān)鍵詞,判斷其真實(shí)情況和所處欺詐類型,進(jìn)而從語料庫(kù)中自動(dòng)實(shí)時(shí)匹配并輸出更精準(zhǔn)的勸阻話術(shù),以達(dá)到用戶愿意對(duì)話且聽從勸阻的目的。當(dāng)前,螞蟻交互式風(fēng)控產(chǎn)品每天與7.1萬用戶進(jìn)行深度交流,用戶交流意愿平均時(shí)長(zhǎng)超過90s,涉詐交易用戶勸阻止付率提高了80%。

根據(jù)公開信息顯示,今年5月,國(guó)際電信聯(lián)盟通信標(biāo)準(zhǔn)化組織(ITU)已正式立項(xiàng)由螞蟻集團(tuán)牽頭的交互式智能風(fēng)控技術(shù)國(guó)際標(biāo)準(zhǔn)。這是全球首個(gè)交互式風(fēng)控國(guó)際標(biāo)準(zhǔn)。

分享到

xiesc

相關(guān)推薦