ACM SIGKDD(國際知識發(fā)現(xiàn)與數(shù)據(jù)挖掘大會(huì),簡稱KDD),是機(jī)器學(xué)習(xí)領(lǐng)域的頂級國際學(xué)術(shù)會(huì)議,由ACM(國際計(jì)算機(jī)學(xué)會(huì))創(chuàng)辦于1995年,已經(jīng)連續(xù)舉辦了26屆,今年將于8月14日至18日在新加坡舉辦。目前KDD已經(jīng)發(fā)展成為AI領(lǐng)域最具活力、影響最大的國際學(xué)術(shù)組織之一,代表了學(xué)術(shù)界和工業(yè)界的研究方向,被中國計(jì)算機(jī)協(xié)會(huì)推薦為A類會(huì)議。
據(jù)KDD2021官方發(fā)布的信息,本屆會(huì)議共吸引了1541篇論文投遞,其中有238篇論文被接收,接收率為15.44%,低于KDD2020的16.9%的接收率。KDD對論文接收以嚴(yán)格著稱,非??粗卣撐牡摹翱芍噩F(xiàn)性”。與其它AI頂會(huì)“允許Rebuttal(辯駁)”的方式不同,KDD自2019年開始使用雙盲(作者和評委互為匿名)審稿制度,每年的接收率僅為15%左右,入圍論文的水準(zhǔn)和含金量很高。
阿里媽媽此次共有6篇論文入選KDD2021,是近年來被KDD接收最多的一次,這也代表了國際頂會(huì)對于阿里媽媽技術(shù)團(tuán)隊(duì)探索AI前沿技術(shù)并應(yīng)用于實(shí)踐的認(rèn)可。
另外,阿里媽媽技術(shù)同學(xué)懷人和廣呆,將在8月15日KDD 2021會(huì)議期間組織和主持兩場重要的workshop(線上線下同步):DLP-KDD和AdKDD,旨在深入、系統(tǒng)性地探討深度學(xué)習(xí)在大規(guī)模工業(yè)級稀疏數(shù)據(jù)上的應(yīng)用實(shí)踐,以及高度個(gè)性化內(nèi)容體驗(yàn)?zāi)繕?biāo)下的數(shù)字廣告趨勢。
資料顯示,阿里媽媽是阿里巴巴集團(tuán)的核心商業(yè)化部門,阿里媽媽技術(shù)團(tuán)隊(duì)引領(lǐng)了AI在互聯(lián)網(wǎng)廣告領(lǐng)域的探索和大規(guī)模應(yīng)用,并通過技術(shù)創(chuàng)新驅(qū)動(dòng)業(yè)務(wù)高速成長,讓商業(yè)營銷更簡單高效。
記者了解到,據(jù)不完全統(tǒng)計(jì),在過去三年中,阿里媽媽技術(shù)團(tuán)隊(duì)發(fā)表在國際頂會(huì)的論文數(shù)量在50篇以上,包括KDD、ICDM、WWW、SIGIR、WSDM、CIKM、ICML、NeurIPS、IJCAI、AAAI、CVPR、EMNLP、PVLDB、AAMAS等,很多工作已經(jīng)成為業(yè)內(nèi)學(xué)習(xí)的標(biāo)桿。
比如,深度興趣網(wǎng)絡(luò)(Deep Interest Network,簡稱DIN),由阿里媽媽技術(shù)團(tuán)隊(duì)在KDD2018首先提出,被業(yè)內(nèi)人士普遍認(rèn)為是該領(lǐng)域的開篇之作。DIN是一種有效的用于CTR(點(diǎn)擊率)、個(gè)性化推薦的深度學(xué)習(xí)模型,其效果在阿里媽媽的業(yè)務(wù)中得到驗(yàn)證并已經(jīng)開源,可適用于其他很多場景。
“深研AI前沿技術(shù),是為了大規(guī)模應(yīng)用于實(shí)際業(yè)務(wù)。”阿里媽媽CTO鄭波表示,作為驅(qū)動(dòng)AI技術(shù)取得真金白銀的底座,阿里媽媽技術(shù)團(tuán)隊(duì)構(gòu)建了業(yè)界領(lǐng)先的在/離線AI Infrastructure,并突破常規(guī),重新定義了“算法+算力+架構(gòu)”的新計(jì)算范式。
“論文不是目的,重要的是分享。我們會(huì)盡可能多的開源,和大家共享AI技術(shù)帶來的紅利。”據(jù)鄭波介紹,阿里媽媽技術(shù)團(tuán)隊(duì)以深度學(xué)習(xí)為中心,在阿里自研的業(yè)界領(lǐng)先AIOS、MaxComputer等基礎(chǔ)上面,構(gòu)建XDL、MDL、EULER三大AI平臺(其中XDL、EULER已經(jīng)開源)和八大智能方向:
三大AI平臺包括:XDL,海量數(shù)據(jù)超大規(guī)模建模平臺,模型能夠達(dá)到百億級別特征、千億級別參數(shù),這些模型通過萬億級別的樣本訓(xùn)練產(chǎn)生;MDL,多媒體創(chuàng)意智能生成和優(yōu)選平臺,每天產(chǎn)生8000萬的圖文創(chuàng)意、100萬的短視頻創(chuàng)意,為客戶帶來10億次以上的曝光;EULER,圖學(xué)習(xí)的引擎平臺,具有一定的推理能力,能夠深度挖掘人貨場之間的關(guān)聯(lián)。
八大智能方向包括:深度匹配(Intelligent Matching)、行為預(yù)測(Deep Response Prediction)、機(jī)制設(shè)計(jì)學(xué)習(xí)(Learning-based Mechanism Design)、智能出價(jià)(Smart Bidding)、智能創(chuàng)意(Smart Creative)、智能多觸點(diǎn)歸因(Multi-Touch Attribution)、
聯(lián)邦學(xué)習(xí)(Federated Learning)、圖神經(jīng)網(wǎng)絡(luò)(Graph Neural Network)。
“把阿里媽媽比作一家AI公司,也不為過?!编嵅ū硎荆涂蛻艄渤砷L,通過AI技術(shù)助力商家長期可持續(xù)經(jīng)營,是阿里媽媽技術(shù)團(tuán)隊(duì)一直追求的。