數(shù)據(jù)運算提效70% 加速企業(yè)應用落地
博士畢業(yè)于澳大利亞國立大學的劉洋,同時是騰訊云的高級研究員,負責騰訊神盾沙箱的隱私保護算法部分。劉洋表示,因自身從業(yè)領域的緣故,從年初就開始密切關注著“聯(lián)邦學習”。
也因此,F(xiàn)ATE進入了其視野,受到了劉洋及騰訊云團隊的重點關注。在對FATE進行深入了解后,劉洋認為騰訊神盾沙箱打造的隱私安全+分布式學習的理念,與FATE要解決的“數(shù)據(jù)安全”“數(shù)據(jù)隱私”“數(shù)據(jù)合規(guī)”三大問題不謀而合,并逐步開始使用FATE滿足神盾沙箱的功能需求。
劉洋表示,經(jīng)過長期接觸后,對FATE的邏輯回歸和XGBoost算法流十分認同,因此也開始加入FATE開源社區(qū)建設,提出了優(yōu)化建議——利用對稱的仿射密碼替代Paillier密碼,將訓練時間提升70%以上,從而給同態(tài)運算“減負”。未來合作企業(yè)在應用優(yōu)化過后的FATE版本時,可以有效降低數(shù)據(jù)運算的時間成本,提升企業(yè)在AI時代的技術競爭能力。
行業(yè)負重前行 數(shù)據(jù)安全迫在眉睫
AI應用場景中,將多方數(shù)據(jù)中心式合并處理的傳統(tǒng)合作方式,存在著嚴重的隱私泄露問題,這一癥結甚至成為了企業(yè)大規(guī)模應用AI的關鍵阻礙。
在劉洋看來,破局關鍵仍在于數(shù)據(jù)安全問題的解決,即數(shù)據(jù)privacy和utility的折衷問題。具體來說,數(shù)據(jù)要想安全的從孤島分享出去,必須經(jīng)歷某些“蒙面”操作:通過密碼學工具將有效數(shù)據(jù)轉換成亂碼,privacy保住了,但密鑰在誰手中,極大的影響數(shù)據(jù)的utility;用噪聲混淆原始數(shù)據(jù)也可以,例如差分隱私,噪聲越大,越保證privacy,但使用者拿到數(shù)據(jù)發(fā)揮的utility越低。怎樣在privacy和utility中尋求一條折衷之路,是數(shù)據(jù)安全流通的關鍵問題之一。
未來理想的狀態(tài)是,任何數(shù)據(jù)使用者能夠在自由流動和聚合的分布式數(shù)據(jù)之上,進行高效的數(shù)據(jù)挖掘操作,而絲毫感覺不到隱私保護的羈絆。在MPC(Multi-party Computation,多方安全計算)領域,目前行業(yè)還停留在混淆電路、可信計算等解決方案,雖然支持的計算任務具有一般性,但需要額外的硬件支持,學習成本較高,阻礙了規(guī)?;瘧玫耐瑫r,也不利于安全數(shù)據(jù)聯(lián)盟的形成。
而聯(lián)邦學習在具有普適性的聯(lián)邦框架中,針對每一種或每一類機器學習算法進行訂制化的隱私保護改造,使它們的使用無異于經(jīng)典的中心式機器學習模型。相比之下,聯(lián)邦學習在穩(wěn)住成本的基礎上,確保了易用性。劉洋稱,對于企業(yè)而言,聯(lián)邦學習提供的解決方案更具吸引力;對于行業(yè)而言,更便捷的操作將吸引更多開發(fā)人員的投入,從而推進安全數(shù)據(jù)聯(lián)盟的構建。
FATE生態(tài)×騰訊云 數(shù)據(jù)安全未來可期
今年5月初起,F(xiàn)ATE和騰訊云神盾沙箱就開始進行業(yè)務往來和技術交流,目前神盾沙箱的核心計算模塊由FATE提供。在搭建平臺過程中,雙方緊密合作。劉洋在采訪中表示,團隊在使用FATE框架、算法時,會將有效建議貢獻到FATE開源項目中,參與開源社區(qū)建設。
這種帶有“互助互惠,開源共筑”特色的合作形式,在促進了神盾沙箱的產品打磨和FATE項目的完善的同時,也給其他技術項目或團隊提供了很好的樣板示范——以開放的姿態(tài)擁抱新的技術,不僅于自身有利,也將助推整個行業(yè)的發(fā)展。
在劉洋的設想中,未來兩者可以在提升技術影響力和業(yè)務落地等方面進行更深層次的協(xié)作,例如合作發(fā)表重要論文、提交專利和聯(lián)手接手內外部實際業(yè)務,形成“學術”“業(yè)界”兩開花的美好局面。
隨著越來越多貢獻者加入FATE理論標準與行業(yè)應用的建設,F(xiàn)ATE勢必會迎來更廣闊的前景。對此,劉洋表示,神盾沙箱和FATE的聯(lián)手將會加速數(shù)據(jù)安全的扎根與生長,在數(shù)據(jù)孤島之上構建起安全數(shù)據(jù)聯(lián)盟的未來可期。