快商通首席科學家李海洲教授

為什么聲紋技術可以進行有效安全防范?

李海洲教授向記者介紹道:“聲紋識別技術,是用說話人的聲音,以逆向工程(reverse engineering)來描述說話人的聲道、口腔、口腔容量、聲道長度、鼻腔等相關器官的結構和狀態(tài)。聲紋識別具有唯一性、穩(wěn)定性等特征。” 隨著聲紋識別率的提高,聲紋技術已經(jīng)在安全,金融,社交,通信平臺上進入廣泛的商業(yè)應用。因此,它的安全性也得到廣泛的關注。目前全球?qū)τ诼暭y技術的安全性研究主要集中在“聲紋技術的反欺詐”。

對于聲紋反欺詐的安全防范方式,李海洲教授認為可以概括為以下幾種:

首先是數(shù)據(jù)學習方法(Adversary training),即通過離異數(shù)據(jù)訓練,使機器學習到真實的說話人數(shù)據(jù)與虛假/其他說話人數(shù)據(jù)之間的邊界,以數(shù)據(jù)分布式學習的方式實現(xiàn)反欺詐。

第二是輸入確認:聲紋先進入非自然語音檢測的輸入確認模塊,排除干擾,保護說話人識別模塊。這也是當下較主流的做法。

2.jpg

輸入確認

第三是拒接絕對拷貝(錄音回放):每一次聲紋輸入,都將其絕對拷貝下來。在進行聲紋驗證時,若對比判斷為一致,則該聲紋為錄音。

第四是檢測電磁場干擾:錄音回放時會,手機內(nèi)置揚聲器周圍的電磁場會受到擾動,指南針隨之擺動,據(jù)此可判斷該聲音為回放。

第五是檢測物理聲波:即通過改變硬件設計達到反欺詐效果。

簡單來說,聲紋識別技術目前已經(jīng)能夠有效地進行風險防范。李海洲教授已帶領快商通團隊研究出1:N場景下的身份識別應用。與傳統(tǒng)驗證方式相比,1:N的識別能在電話端實現(xiàn)遠距離、高精度的身份認證與身份反欺詐,只需要一通電話,幾秒鐘時間就能確定說話人的真實身份。

各領域用戶要如何應用聲紋識別技術?

以聲紋反欺詐進行風險防范,這一方式已被越來越多的產(chǎn)業(yè)單位所接受,也逐漸得到各級監(jiān)管部門的認可。然而,面對一系列諸如《關于加強II、III類銀行結算賬戶風險防范有關事項》的建設要求,各領域用戶當如何高效運用聲紋技術,使其發(fā)揮出反欺詐的最大效能?

這個問題,當與欺詐方式結合思考。李教授表示,欺詐行為一般分為兩種:

其一是數(shù)據(jù)入侵,即黑客進入數(shù)據(jù)庫,并將修改的聲紋放入系統(tǒng)中。目前數(shù)據(jù)入侵分為三種形式。黑盒子攻擊,以機器學習的方法來攻擊機器學習,無窮盡地向系統(tǒng)輸入數(shù)據(jù),觀察其輸出結果,便可得知該系統(tǒng)的數(shù)據(jù)偏好。白盒子攻擊,則是針對已知市場上各系統(tǒng)算法的模型、機制,并倒推其弱點進行攻擊?;液凶庸艚Y合了以上兩種方法,既有機器學習的工具,又了解系統(tǒng)的運作結構。

李教授認為,防止數(shù)據(jù)入侵,需要技術廠商與企業(yè)用戶共同努力,主動、及時了解黑客的做法,有針對性地完善聲紋識別系統(tǒng)前端安全性。

另一種欺詐行為,則是公檢法、金融、社保等各個領域普遍關心的物理入侵。

以金融領域為例,大部分金融機構壞賬來源于黑中介主導的產(chǎn)業(yè)鏈式詐騙。因此,在審查環(huán)節(jié)及時鑒別出黑中介,成為降低消費金融公司壞賬率的關鍵因素。在傳統(tǒng)單一身份識別手段低效的情況下,如快商通“遠程實時身份認證與身份反欺詐平臺”的解決方案毫無疑問成為金融風控的核心。

3.jpg

聲紋反欺詐應用流程

在公共安全領域中,聲紋反欺詐也能對電信詐騙等問題提供有效的解決方案。針對犯罪分子錄音、回放等欺詐形式,可以參考快商通“聲紋鑒定工作站”、“聲紋偵查作戰(zhàn)平臺”等方案,有針對性的識破違法行為,進而維護社會治安,保障國家人民財產(chǎn)安全。

聲紋技術應用落地,用戶最關心什么?

“聲紋識別系統(tǒng)魯棒性和安全性之間的平衡和相關參數(shù)的調(diào)整,是各大用戶關注的重點,同時也是全世界范圍內(nèi)聲紋相關廠商現(xiàn)階段面臨的主要難題?!崩詈V藿淌谌缡钦f道。

在聲紋識別的過程中,傳感器和信道的不同、環(huán)境的變化以及周圍的噪音、說話人情緒、健康狀態(tài)的變化以及其年齡的增長、不同語言的使用等因素,都會影響聲紋識別的識別率,進而降低用戶的使用體驗與效率。

想要克服這些影響,便需要提升系統(tǒng)的魯棒性(robustness),也就是抗變換性,以保障聲紋系統(tǒng)在不同的條件下的識別率。但與此同時,還要關注系統(tǒng)魯棒性和安全性之間的平衡問題。

針對聲紋安全系統(tǒng),目前各技術廠家主流的做法是在聲紋識別模塊前建立非自然語音檢測模塊,但這顯然犧牲了一定的魯棒性。而聲紋系統(tǒng)的使用者,更希望得到的數(shù)據(jù)是檢測系統(tǒng)的拒絕數(shù)量以及正確認證數(shù)量,這正是大部分聲紋技術廠商現(xiàn)階段需要突破的問題。

對于這一點,李海洲教授認為,聲紋企業(yè)當如快商通一般,既研究安全性的提升,也兼做魯棒性,把自然語音判斷和聲紋系統(tǒng)相結合,進而得到最優(yōu)答案,提供完整的系統(tǒng)性結論。

推動聲紋反欺詐發(fā)展,科技惠民,賦能百業(yè)

作為在人工智能領域從事科研工作三十余年的權威專家,李海洲教授曾任亞太信號與信息處理協(xié)會 (APSIPA)主席及國際語音通信協(xié)會(ISCA)主席,并先后在第四屆亞太信號與信息處理協(xié)會年度會議 (APSIPA Annual Conference and Summit 2013) 和第十九屆國際語音通信年會 (INTERSPEECH 2018)上 做了專題報告。李海洲教授對聲紋反欺詐的理解和技術積累,在一定程度上推動了聲紋反欺詐的國際科技合作和系統(tǒng)評測標準化。

李教授表示,隨著聲紋識別技術的逐漸成熟以及聲紋反欺詐的不斷落地,未來會涌現(xiàn)出更多的聲紋識別應用場景。如何引導聲紋識別技術向著更加產(chǎn)業(yè)化、規(guī)范化的方向發(fā)展,如何合理挖掘應用場景并進行針對性開發(fā),這是快商通作為業(yè)內(nèi)先進企業(yè)的責任,同時也是產(chǎn)學研各界未來必須要關注的問題。

“2018年是聲紋技術發(fā)展的元年,而今年,圍繞聲紋技術展開的科學研究和落地項目都將會有井噴式的爆發(fā)”李海洲教授講道,金融、公檢法等各個應用領域的用戶,都要抓住技術賦能產(chǎn)業(yè)的重大機遇,改善產(chǎn)業(yè)結構,實現(xiàn)智能化發(fā)展。

分享到

songjy

相關推薦