為了滿足更多業(yè)務(wù)場景中對實體信息的識別,本次更新新增了二十余種系統(tǒng)內(nèi)置常用實體,如,數(shù)字、金額、銀行卡號、郵編、車牌號等。
2、賬號體系升級
為滿足不同客群的需求,本次對系統(tǒng)的賬號體系進行了全面升級,在之前的多租戶賬號體系上,增加了多渠道賬號體系,實現(xiàn)渠道間的租戶端、管理端數(shù)據(jù)全隔離。
3、情緒識別結(jié)果輸出
情緒識別結(jié)果輸出基于情緒引擎分析,自動檢測會話內(nèi)容中文本蘊含的情緒特征,幫助企業(yè)更全面的把握產(chǎn)品體驗、監(jiān)控客戶服務(wù)質(zhì)量。
4、NLP原子能力不斷擴容
本次升級除了對產(chǎn)品體驗、數(shù)據(jù)安全、穩(wěn)定運行等方面進行了數(shù)十項優(yōu)化處理,我們也在持續(xù)不斷擴容NLP原子能力。
中文分詞
將自然語言文本切分成語義合理、完整的詞匯序列,并為每個詞匯賦予一個詞性,如:動詞、名詞、介詞等。
文本糾錯
自動更正文本中存在錯誤的字段,減少由此帶來的語義解析不準確或閱讀障礙。
知識聚類
在沒有業(yè)務(wù)場景和標準問的情況下,通過聚類算法對無標簽數(shù)據(jù)集自動構(gòu)建業(yè)務(wù)場景和標簽。協(xié)助運營人員進行數(shù)據(jù)預(yù)處理,提升數(shù)據(jù)運營效率,減輕運營人員工作量。
中心詞提取
基于BERT多任務(wù)訓(xùn)練和MMR重排算法,借助積累的通用、專業(yè)詞庫對結(jié)果再處理,自動提取體現(xiàn)文本核心主題的關(guān)鍵詞語。
文本相似度計算
基于海量數(shù)據(jù)訓(xùn)練的網(wǎng)絡(luò)模型,計算兩個句子之間的相似度,實現(xiàn)高精度語義相似度比對。文本相似度可以幫助用戶快速實現(xiàn)推薦、檢索、排序等應(yīng)用。
句式識別
輸入對話中自然語句,返回對應(yīng)的句式分類結(jié)果。支持陳述句、疑問句、感嘆句和祈使句識別。
文本摘要
基于深度語義分析模型,自動抽取文本中的關(guān)鍵信息生成簡短的文本摘要。
來源:互聯(lián)網(wǎng)科技看點