圖1 帶離散隱變量對(duì)話生成預(yù)訓(xùn)練的網(wǎng)絡(luò)架構(gòu)

PLATO訓(xùn)練使用了三個(gè)目標(biāo)函數(shù)(loss function) — negative log-likelihood (NLL) loss,bag-of-words (BOW) loss和response selection (RS) loss,如圖1最后一列所示。在文本生成任務(wù)中,最常用的是NLL loss,PLATO引入了BOW loss是為了促進(jìn)離散隱變量的訓(xùn)練。此外,RS可以輔助判斷一個(gè)回復(fù)與上文的相關(guān)性。

PLATO的模型由大規(guī)模語(yǔ)義預(yù)訓(xùn)練模型進(jìn)行參數(shù)初始化,在預(yù)訓(xùn)練中,PLATO使用了8.3M Twitter和Reddit對(duì)話樣本。預(yù)訓(xùn)練的PLATO模型以及代碼,已經(jīng)在GitHub上開(kāi)源(https://github.com/PaddlePaddle/Research/tree/master/NLP/Dialogue-PLATO)。

3. 實(shí)驗(yàn)結(jié)果及分析

為了驗(yàn)證預(yù)訓(xùn)練模型的效果,百度公布的論文在3個(gè)公開(kāi)對(duì)話數(shù)據(jù)集上進(jìn)行了測(cè)試:Persona-Chat,Daily Dialog以及DSTC7-AVSD。Persona-Chat是典型的知識(shí)聊天任務(wù):兩個(gè)人講述自己信息(persona profiles),并在對(duì)話中盡量了解對(duì)方;Daily Dialog偏向日常閑聊類型;DSTC7-AVSD是對(duì)話式問(wèn)答,根據(jù)視頻場(chǎng)景信息,兩人進(jìn)行多輪問(wèn)答,討論視頻中物體和事件。

在每個(gè)數(shù)據(jù)集上的實(shí)驗(yàn),百度對(duì)比了基線方法,以及每個(gè)數(shù)據(jù)集上的SOTA方法。PLATO在Persona-Chat和Daily Dialog上的自動(dòng)和人工評(píng)估結(jié)果,如表1所示;PLATO在DSTC7-AVSD上的結(jié)果,如表2所示。由這些結(jié)果可見(jiàn),PLATO在各個(gè)對(duì)話數(shù)據(jù)上,均超過(guò)了當(dāng)前最優(yōu),取得了新的最優(yōu)效果。

表1 Persona-Chat和Daily Dialog上的自動(dòng)和人工評(píng)估結(jié)果

表2 DSTC7-AVSD上的自動(dòng)評(píng)估結(jié)果

PLATO也與其他預(yù)訓(xùn)練模型進(jìn)行了對(duì)比,在Persona-Chat上的實(shí)驗(yàn)結(jié)果如表3所示。其中2.2是不使用latent space的對(duì)比模型,3.1是完整PLATO模型。通過(guò)對(duì)比這些結(jié)果,可以看出:靈活的注意力機(jī)制可以充分利用上文的雙向信息(model 1.2 v.s. model 1.3);大規(guī)模的Twitter和Reddit語(yǔ)料,顯著改善回復(fù)生成(group 2&3 v.s. group 1);離散隱變量的引入,則可以進(jìn)一步提升回復(fù)質(zhì)量(model 3.1 v.s. model 2.2)。

表3 不同預(yù)訓(xùn)練模型在Persona-Chat的PPL結(jié)果

對(duì)于PLATO的定性分析,百度也在表4中提供了一些case。給定一個(gè)上文,通過(guò)對(duì)離散隱變量進(jìn)行不同賦值, PLATO可以產(chǎn)生多樣且都合理的回復(fù)。

表4 PLATO模型生成的回復(fù)

4. 總結(jié)和未來(lái)工作

盡管越來(lái)越多的工作證明了隨著預(yù)訓(xùn)練和大規(guī)模語(yǔ)料的引入,自然語(yǔ)言處理領(lǐng)域開(kāi)啟了預(yù)訓(xùn)練然后微調(diào)的范式,但是在對(duì)話模型上,大規(guī)模預(yù)訓(xùn)練還處于初級(jí)階段,需要繼續(xù)深入探索。百度提出的隱變量空間預(yù)訓(xùn)練模型,可能成為端到端對(duì)話系統(tǒng)邁上一個(gè)新臺(tái)階的關(guān)鍵點(diǎn)之一。據(jù)悉,百度也在持續(xù)優(yōu)化當(dāng)前對(duì)話模型,或許在不久的將來(lái),更加強(qiáng)大的對(duì)話預(yù)訓(xùn)練模型會(huì)被陸續(xù)披露。

分享到

songjy

相關(guān)推薦