網(wǎng)絡(luò)最后是池化層和全連接層。池化層的輸入為殘差幀經(jīng)掩蓋效應(yīng)處理后的結(jié)果,它代表了人眼可感知殘差。全連接層學習整體感知質(zhì)量和目標質(zhì)量分數(shù)區(qū)間的非線性回歸關(guān)系。
在評測結(jié)果上,騰訊多媒體實驗室在LIVE和CSIQ兩個視頻質(zhì)量數(shù)據(jù)集上對所提出算法的性能進行驗證。并使用標準的PLCC和SROCC作為質(zhì)量準則來比較不同算法的性能。將所提出的C3DVQA與常用的全參考質(zhì)量評估算法進行對比,包括PSNR,MOVIE,ST-MAD,VMAF和DeepVQA,結(jié)果如下表所示。
(LIVE和CSIQ兩個數(shù)據(jù)庫上不同全參考算法性能比較)
目前該評估算法已在騰訊內(nèi)外部多款產(chǎn)品中進行使用驗證,如騰訊會議就借助實驗室上百個符合ITU/3GPP/AVS等國外內(nèi)標準的指標進行評判,閉環(huán)監(jiān)控全網(wǎng)的用戶體驗質(zhì)量,從用戶真實體驗出發(fā),不斷優(yōu)化產(chǎn)品性能。
作為最早布局音視頻領(lǐng)域的公司之一,從最早的QQ平臺,騰訊就試圖解決在當年網(wǎng)絡(luò)條件下若干的音視頻通信問題。伴隨著5G、云計算、大數(shù)據(jù)、人工智能技術(shù)的發(fā)展,騰訊多媒體實驗室基于多年的技術(shù)沉淀和行業(yè)經(jīng)驗,逐步打磨出一條完善且高質(zhì)量的音視頻技術(shù)鏈條。