創(chuàng)略科技創(chuàng)始人胡世杰在接受商界專訪的時候告訴記者,關于數(shù)據(jù)和人工智能的應用,目前形成三大趨勢:
第一,大數(shù)據(jù)隱私越來越受到各方重視,相關政策法規(guī)也陸續(xù)出臺,數(shù)據(jù)的使用必然受到諸多限制;
第二,消費者對個人數(shù)據(jù)的重要性與隱私性的認知程度不斷提升,企業(yè)也更加重視數(shù)據(jù)資產(chǎn)保護,對于跨組織的數(shù)據(jù)合作越來越謹慎,潛在數(shù)據(jù)孤島問題更加嚴重;3
第三,數(shù)據(jù)資產(chǎn)的形成集中在BAT這種頭部互聯(lián)網(wǎng)企業(yè),如何打破BAT的數(shù)據(jù)“圍墻花園”,保護自己私域數(shù)據(jù)資產(chǎn),形成良性的競爭環(huán)境和市場環(huán)境,成為各方企業(yè)關注的又一焦點。
胡世杰表示,在大數(shù)據(jù)發(fā)展之初,客戶數(shù)據(jù)高度集中在頭部互聯(lián)網(wǎng)企業(yè),互聯(lián)網(wǎng)領域形成了中心化發(fā)展模式。企業(yè)要實現(xiàn)更多的客戶洞察數(shù)據(jù),唯一的途徑就是與BAT類型第三方數(shù)據(jù)合作。但這種中心化模式,除去數(shù)據(jù)的積累愈發(fā)集中,易形成壟斷趨勢的弊端,另一方面,部分企業(yè)對于自有數(shù)據(jù)資產(chǎn)的保護意識大幅提升,特別是規(guī)?;ㄖ写笮停┑钠髽I(yè)或機構,則獲得高質量、真實有效的第三方數(shù)據(jù),越來越困難。
如何破除AI落地應用的兩大阻礙:數(shù)據(jù)孤島和數(shù)據(jù)隱私安全
企業(yè)數(shù)據(jù)資產(chǎn)安全以及隱私是必然的,也算是整體數(shù)字化變革不可或缺的要素之一。數(shù)據(jù)使用的限制使得互聯(lián)網(wǎng)數(shù)據(jù)分散在不同企業(yè)、部門,組織中,形成“數(shù)據(jù)孤島”,各方數(shù)據(jù)難以實現(xiàn)價值共享或協(xié)作。而企業(yè)數(shù)據(jù)隱私化形成孤島,使人工智能技術發(fā)揮最大化價值受限,同時各機構、企業(yè)所擁有的數(shù)據(jù)又具有極大的潛在應用價值。那么,如何在滿足數(shù)據(jù)安全、合規(guī)的前提下,利用多方異構數(shù)據(jù)進一步進行學習、建模以推動人工智能的發(fā)展呢?
“聯(lián)邦學習作為分布式機器學習范式,可以實現(xiàn)各方在不公開各自數(shù)據(jù)的情形下,協(xié)同完成模型訓練,解決一系列AI應用落地面臨的數(shù)據(jù)安全和隱私障礙,以及創(chuàng)造一個健康的數(shù)據(jù)價值協(xié)作新模式,是人工智能領域發(fā)展的必然趨勢。”胡世杰如是說。
在傳統(tǒng)的AI應用模式中,企業(yè)以自己為中心化匯集盡可能多的數(shù)據(jù),并基于此訓練AI模型。企業(yè)采集的數(shù)據(jù)量越大、數(shù)據(jù)維度越豐富,則驅動的洞察也就越準確。而在聯(lián)邦學習模式下,加入學習的各方不需要把數(shù)據(jù)匯集到中心化的體系,而是在參與方自己的設備或者數(shù)據(jù)中心通過AI算法產(chǎn)出數(shù)據(jù)洞察和預測,以及模型參數(shù),并將結果同步回傳到聯(lián)邦學習的中心節(jié)點。在聯(lián)邦學習的體系內,將各方回傳的模型平均后繼續(xù)學習、訓練,得出更精準的結果,分發(fā)到各參與者,用以各自的業(yè)務場景。在這個過程中,參與者并沒有交換數(shù)據(jù),卻可以實現(xiàn)較大規(guī)模的AI以及機器學習的應用場景。
區(qū)塊鏈技術保障聯(lián)邦學習共享模型安全有效
在聯(lián)邦學習模式下,為避免由于行業(yè)競爭造成的故意混淆錯誤結果到聯(lián)邦學習的體系中,以及一系列其他機制層面的系統(tǒng)性風險,造成訓練模型的錯誤結果等,就需要透明、有效的安全機制進行干預,建立體系各方的相互信任。
談及如何完善聯(lián)邦學習的共享機制,胡世杰認為,區(qū)塊鏈技術可以幫助企業(yè)各方在去中心化AI體系中,創(chuàng)造一系列的自動化透明管理,信任以及治理機制。在聯(lián)邦學習過程中的參與者(企業(yè)或組織)都是主角,在一個嚴格的“機制創(chuàng)建信任”環(huán)境中,這一過程也未必需要一個中心化主導方。這個所謂的機制在聯(lián)邦學習場景下,可以理解是由應用區(qū)塊鏈技術提供的“智能合約”體系完成的。智能合約技術能使一個業(yè)務流程或交易在無中心主導方或“擔保方”的情況下,有一個透明、去中心化以及自動化的管理機制,來消除參與者之間“信任程度”的風險要素。
“在聯(lián)邦學習場景的應用中,可以采取投票機制,由聯(lián)盟各方共同確認每個共享結果的質量,這樣就可以有效地減少學習體系中不被信任的第三方以偽造的、有疑問的數(shù)據(jù)破壞整體洞察結果的情況發(fā)生?!?/strong>
聯(lián)邦學習在多維場景實現(xiàn)應用落地
目前國內外較早實現(xiàn)聯(lián)邦學習應用落地的,是醫(yī)療和金融行業(yè)。比如對于新冠疫情的研究,各醫(yī)療機構根據(jù)病人圖像或者數(shù)據(jù)挖掘出病人的肺部特征,通過聯(lián)邦學習共享這些特征,既可以共同研究病情相關洞察,又保障了病人隱私;而在金融行業(yè),加入聯(lián)邦學習的銀行之間可以分享客戶信用預估模型,在不需要知道客戶在其他哪些銀行機構貸過款的情況下,獲知某一客戶的綜合風險等級,做出相關預警。
創(chuàng)略科技作為國內領先的智能數(shù)據(jù)解決方案提供商,一直專注于營銷領域,為國內外大中型企業(yè)提供應用于全局營銷場景的數(shù)據(jù)及AI技術解決方案。胡世杰告訴記者,其實國內大部分B2C企業(yè),其積累的客戶數(shù)據(jù)體量都足夠大,但是在應用AI技術進行模型訓練時,卻常出現(xiàn)數(shù)據(jù)維度不足的狀況。而創(chuàng)略科技在服務了上百家企業(yè)的過程中,洞察到很多同行業(yè)甚至跨領域的企業(yè)之間,存在著客戶及潛客的重疊交叉,從理論上可以互相補充、完善客戶洞察。
基于此,創(chuàng)略科技已經(jīng)開始探索把聯(lián)邦學習融合區(qū)塊鏈技術應用到智能營銷領域,旨在幫助企業(yè)客戶在安全合規(guī)的前提下,獲得更加深刻、全面的客戶洞察。
“創(chuàng)略目前已經(jīng)在嘗試幫助一些客戶通過聯(lián)邦學習的模式,共享AI訓練模型產(chǎn)出的結果。其實相較于數(shù)據(jù)本身,通過AI挖掘潛在的客戶行為預測及洞察,才是對于企業(yè)具有真正的應用價值。當然,聯(lián)邦學習在營銷領域的拓展還處于初級階段,需要客戶之間以及對提供通道的供應商具有高度的信任,因此創(chuàng)略科技目前并沒有在整個客戶體系內去推動聯(lián)邦學習,而是在具有相同客戶交集的企業(yè)之間實現(xiàn)1對1的共享機制——當企業(yè)雙方都對彼此的數(shù)據(jù)洞察有需求時,創(chuàng)略科技就在AI應用場景下建立聯(lián)邦學習通道,幫助企業(yè)實現(xiàn)安全、高效的多維度數(shù)據(jù)洞察。”胡世杰介紹。
數(shù)據(jù)孤島和數(shù)據(jù)隱私正成為大數(shù)據(jù)時代新的挑戰(zhàn),聯(lián)邦學習作為“數(shù)據(jù)孤島”間的橋梁,必將成為未來AI技術發(fā)展的一個重要方向,最終解決數(shù)據(jù)安全共享的世界性難題,全面激活數(shù)字經(jīng)濟。