近年來,各國政府越來越重視用戶隱私的問題,相繼制定了以隱私為重點的數(shù)據(jù)保護法規(guī)。與此同時,企業(yè)對于數(shù)據(jù)的流通交易和共享也存在切實需求,如何打破“數(shù)據(jù)孤島”,保障數(shù)據(jù)安全動態(tài)的使用,成為當(dāng)前企業(yè)重點關(guān)注和迫切需要解決的問題。隱私計算技術(shù)的出現(xiàn),是解決數(shù)據(jù)可用不可見的突破口,逐漸成為數(shù)字經(jīng)濟發(fā)展的新基建。
在隱私計算領(lǐng)域,能效平衡和應(yīng)用生態(tài)是兩個關(guān)鍵的挑戰(zhàn),因此如何既滿足安全性的要求又能滿足實用化的效率要求,是業(yè)內(nèi)一直探索的方向;同時由于隱私計算起步較晚,當(dāng)前缺少一些殺手锏級別的應(yīng)用。針對上述的兩個挑戰(zhàn),抖音集團啟動了Jeddak Project,推出一款面向數(shù)據(jù)安全與隱私計算的綜合平臺,實現(xiàn)端到端的數(shù)據(jù)安全和計算過程中的隱私保護。
Jeddak-HE在業(yè)務(wù)風(fēng)控場景典型應(yīng)用
如果說隱私計算構(gòu)成了用戶信任的護城河,那隱私計算背后的功臣莫屬密碼學(xué),眾所周知同態(tài)加密是密碼學(xué)的皇冠,那么Jeddak是如何落地同態(tài)加密的呢?
在企業(yè)內(nèi)部,很多的財務(wù)和人事的敏感數(shù)據(jù),從數(shù)據(jù)治理角度看是需要進行訪問控制的;但是從業(yè)務(wù)角度需要對敏感數(shù)據(jù)進行分析處理,Jeddak使用ABE技術(shù)授權(quán)專業(yè)人員完成。但由于數(shù)據(jù)屬于高敏類型,分析人員往往沒有獲取明文數(shù)據(jù)的權(quán)限,借助Jeddak-HE讓分析人員實現(xiàn)安全外包計算。宏觀上看,上述流程實現(xiàn)了端到端的全生命周期的數(shù)據(jù)保護,整個分析處理是在密文下完成的。
Jeddak-DPSQL在隱私數(shù)據(jù)脫敏的應(yīng)用實踐
為了解決統(tǒng)計查詢以及用戶數(shù)據(jù)采集場景中的隱私泄露問題,Jeddak基于差分隱私技術(shù),實現(xiàn)數(shù)據(jù)脫敏和隱私度量,自研了面向查詢保護的 DPSQL (Differentially Private SQL Query Service)服務(wù),將差分隱私計算應(yīng)用到數(shù)據(jù)的SQL查詢中,比如與ClickHouse數(shù)據(jù)庫結(jié)合,實現(xiàn)統(tǒng)計查詢的差分攻擊保護。
Jeddak-MPC在聯(lián)合查詢與統(tǒng)計場景的實戰(zhàn)
在面對需要利用多方數(shù)據(jù)進行聯(lián)合查詢時,Jeddak-MPC也有不俗實力。比如一方擁有人群的特征數(shù)據(jù),另一方擁有購買標(biāo)簽數(shù)據(jù),需要聯(lián)合分析廣告的投放效果。首先MPC的底層實現(xiàn)對用戶是透明的,用戶通過使用常規(guī)的SQL發(fā)起任務(wù),Jeddak將SQL重寫技術(shù)與MPC算子結(jié)合,從而實現(xiàn)在各方數(shù)據(jù)均不出域的情況下實現(xiàn)聯(lián)合查詢,目前Jeddak-MPC已支持億級的聯(lián)合查詢。
Jeddak-FL助力金融機構(gòu)精準(zhǔn)營銷
同時,在金融領(lǐng)域的聯(lián)合營銷案例中,需要基于人群特征和金融標(biāo)簽兩方數(shù)據(jù)建立營銷模型,實現(xiàn)存量客戶促活。Jeddak-FL提供了豐富的算法協(xié)議支持,以及完整的聯(lián)邦學(xué)習(xí)任務(wù)。首先通過高性能PSI來實現(xiàn)訓(xùn)練樣本的對齊,用聯(lián)邦特征工程進行訓(xùn)練預(yù)處理,之后利用樹模型/深度神經(jīng)網(wǎng)絡(luò)來實現(xiàn)聯(lián)邦建模,最后通過離線或在線預(yù)測的方式進行打分和投放,實現(xiàn)在保護各方數(shù)據(jù)不出域情況下的營銷閉環(huán)。
Jeddak-TEE企業(yè)敏感數(shù)據(jù)合規(guī)治理場景的應(yīng)用
在典型的企業(yè)場景中,如數(shù)據(jù)提供方比如客戶服務(wù)部擁有大量的CRM數(shù)據(jù),但是需要定期提交給相關(guān)數(shù)據(jù)治理部門來更新和糾錯,比如電話號碼的缺失、合適的規(guī)則校驗等,這一場景屬于公司內(nèi)部十分常見的上下游數(shù)據(jù)使用情況。如何保障數(shù)據(jù)協(xié)同過程中不出現(xiàn)隱私泄露,保護數(shù)據(jù)安全和計算的完整性與機密性。Jeddak-TEE讓數(shù)據(jù)提供方和數(shù)據(jù)治理方分別加密各自數(shù)據(jù),之后安全傳輸至沙箱進行數(shù)據(jù)融合。在數(shù)據(jù)沙箱中,其他實體無法修改運行的服務(wù)邏輯,也無法窺探在沙箱中的數(shù)據(jù)。計算任務(wù)完成后,平臺側(cè)僅可獲取到預(yù)期的結(jié)果,規(guī)避了數(shù)據(jù)直接提供給數(shù)據(jù)治理部門的合規(guī)風(fēng)險。
路漫漫其修遠(yuǎn)兮,火山引擎Jeddak平臺及相關(guān)解決方案將會出現(xiàn)在火山引擎云安全系列產(chǎn)品矩陣中,服務(wù)更多的火山引擎云客戶?;鹕揭姘踩芯繄F隊也希望聯(lián)合行業(yè)同行一起深入實際應(yīng)用場景,通過創(chuàng)新突破解決數(shù)據(jù)安全隱私的卡脖子問題,完成真正高效、易用的數(shù)據(jù)“可用不可見”過程,實現(xiàn)合規(guī)下的數(shù)據(jù)價值最大發(fā)揮,努力為用戶帶來豐富和便捷的安全計算功能。