本次競賽的視頻語義理解任務(wù)包含分類標簽預(yù)測和語義標簽預(yù)測兩個子任務(wù)。在分類標簽預(yù)測任務(wù)中,商湯NLP團隊利用預(yù)訓(xùn)練模型和類Transformer結(jié)構(gòu)對不同模態(tài)的數(shù)據(jù)進行編碼和融合,并進行了數(shù)據(jù)增強和模型融合,出色地完成了視頻中兩個級別的標簽分類。在語義標簽預(yù)測任務(wù)中,商湯NLP團隊提出了將命名實體識別模型和標簽分類模型結(jié)合的方案,經(jīng)過創(chuàng)新地數(shù)據(jù)增強和模型融合后,不僅可以發(fā)掘文本中存在的標簽,還可以提供額外的標簽預(yù)測。憑借在多模態(tài)和NLP領(lǐng)域的不斷積累和創(chuàng)新能力,商湯NLP團隊在這兩個子任務(wù)中均摘得桂冠。

隨著人工智能技術(shù)的發(fā)展以及在不同場景的快速落地,NLP領(lǐng)域的需求和應(yīng)用越來越廣泛,重要性日益突顯。例如在數(shù)字人領(lǐng)域,語音語義理解是數(shù)字人“AI大腦”的重要組成部分?;谡Z音識別(ASR)、語音合成(TTS)、自然語言理解(NLP)等技術(shù)組合,結(jié)合商湯所積累的語音語義理解和生成能力,以及知識庫自動學(xué)習(xí)和模型訓(xùn)練能力,可以根據(jù)不同行業(yè)業(yè)務(wù)需求,快速定制AI數(shù)字人的智能語音對話和問答系統(tǒng),并可通過接入后臺運營管理平臺,支持知識庫的在線更新和維護,實現(xiàn)AI數(shù)字人的深度學(xué)習(xí)和迭代升級。依托深厚的技術(shù)積累,商湯數(shù)字人解決方案已覆蓋超過200款手機、平板電腦、AR/VR眼鏡、智慧大屏及線下一體機等多種終端設(shè)備。在不久前知名研究機構(gòu)沙利文聯(lián)合頭豹研究院發(fā)布的報告中,商湯被列入數(shù)字人領(lǐng)導(dǎo)者陣營。

自成立以來,商湯科技長期持續(xù)投入引領(lǐng)全球的人工智能技術(shù)研究,不斷斬獲佳績,積累了深厚的技術(shù)基礎(chǔ)與人才優(yōu)勢。目前,商湯已在各項全球競賽中已獲得70多項冠軍,發(fā)表超過600篇頂級學(xué)術(shù)論文,擁有8,000多項人工智能專利及專利申請。商湯科技還前瞻打造了行業(yè)領(lǐng)先的人工智能基礎(chǔ)設(shè)施SenseCore商湯AI大裝置,為技術(shù)研發(fā)和落地提供重要支撐,并幫助研究人員快速實驗并驗證新的想法,加速創(chuàng)新與迭代。

通過凝聚頂尖人才,持續(xù)打造更具擴展性、更普惠的人工智能軟件平臺,商湯未來將更加高效地推動前沿AI技術(shù)的創(chuàng)新轉(zhuǎn)化和落地應(yīng)用,更好地滿足多領(lǐng)域、多場景的產(chǎn)業(yè)應(yīng)用,為學(xué)術(shù)及產(chǎn)業(yè)界發(fā)展貢獻力量。



分享到

xiesc

相關(guān)推薦