當(dāng)古典詩詞與現(xiàn)代風(fēng)觸碰到AI技術(shù)后,生成出一首首個(gè)性化詩詞,祝福不再千篇一律,乘著拜年的習(xí)俗、伴著祝福的味道,讓很多人都體會(huì)了“一秒變李白”的神奇,也讓使用AI技術(shù)成為了拜年新風(fēng)尚。

中國首個(gè)智能作詩送祝福應(yīng)用

中國是“禮儀之邦”,春節(jié)拜年是中國優(yōu)秀傳統(tǒng)文化的集中展示。通過使用人工智能技術(shù),由機(jī)器作出個(gè)性化的詩句,“AI李白”成為了中國首個(gè)被大量人群使用的智能作詩拜年送祝福的應(yīng)用。區(qū)別于其他智能作詩應(yīng)用,“AI李白”具有三個(gè)特點(diǎn):

智能化:在研發(fā)階段,考慮到詩詞中有自己的平仄韻律美和組合規(guī)律,傳統(tǒng)的N-Gram語言模型表達(dá)能力有限,無法較好的處理長距離的上下文語言依賴問題。因此,百分點(diǎn)NLP團(tuán)隊(duì)利用先進(jìn)的深度神經(jīng)網(wǎng)絡(luò)技術(shù),訓(xùn)練出以春節(jié)祝福為主題的詩詞自動(dòng)生成模型。

個(gè)性化:

“AI李白”不僅可以支持使用者向親人、朋友、師長、領(lǐng)導(dǎo)、愛人等拜年,還可以提供不同的風(fēng)格和形式,不僅有唐詩、宋詞,還有祝福語、現(xiàn)代風(fēng)、Freestyle等風(fēng)格和形式,來滿足中國人在新春佳節(jié)互相拜年的需求。

趣味性:

為了讓大家在春節(jié)期間玩起來,增加了互動(dòng)性和趣味性,在唐詩和宋詞中特別地支持用戶輸入個(gè)性化的4-8個(gè)字的祝福語句,從而生成個(gè)性化詩詞,并且在生成頁面用高亮的呈現(xiàn)效果散落在詩詞中。

中國是一個(gè)詩的國度,中國人的詩心一直在,“為你寫詩”的AI李白,借AI技術(shù)在春節(jié)期間激活了中國人的詩情。因其兼具祝福的高雅性和趣味性,通過在人民日?qǐng)?bào)平臺(tái)、騰訊客戶端廣泛的傳播后,據(jù)人民日?qǐng)?bào)統(tǒng)計(jì),產(chǎn)品上線6天的點(diǎn)擊量就超過了1100萬,成為春節(jié)送祝福產(chǎn)品中被廣泛好評(píng)的爆款。

AI技術(shù)與古典文化的碰撞

“AI李白”H5由人民日?qǐng)?bào)和全國黨媒信息公共平臺(tái)策劃出品,百分點(diǎn)提供技術(shù)支持,從開始的創(chuàng)意策劃、研發(fā)到優(yōu)化、測(cè)試、上線,時(shí)間只有短短數(shù)周,在H5上線后百分點(diǎn)和人民日?qǐng)?bào)中央廚房相關(guān)團(tuán)隊(duì)一起全程保障產(chǎn)品運(yùn)行。

在整體設(shè)計(jì)上,“AI李白”產(chǎn)品是百分點(diǎn)卓越的自然語言處理技術(shù)與中國傳統(tǒng)文學(xué)典籍的巧妙結(jié)合,是技術(shù)+藝術(shù)的美好嘗試。 具體表現(xiàn)在:

首先,以深度神經(jīng)網(wǎng)絡(luò)展現(xiàn)詩詞韻律美。

百分點(diǎn)首席算法科學(xué)家蘇海波博士介紹,百分點(diǎn)NLP團(tuán)隊(duì)利用了先進(jìn)的深度學(xué)習(xí)技術(shù),采用長短期記憶網(wǎng)絡(luò)模型LSTM(Long-Short-Term Memory),結(jié)合大規(guī)模的詩詞訓(xùn)練語料,自動(dòng)學(xué)習(xí)發(fā)現(xiàn)詩詞中的特征和規(guī)律,捕獲上下文復(fù)雜的語言依賴關(guān)系,從而訓(xùn)練出智能作詩的模型。尤其是在宋詞中,五十多個(gè)詞牌模型全部依靠AI習(xí)得。

其次,80余萬首詩詞構(gòu)建為大規(guī)模數(shù)據(jù)集。

為了達(dá)到更好的生成效果,在對(duì)詩詞上下文建模中,采用的訓(xùn)練語料包括全部的唐詩、宋詞、詩經(jīng)以及經(jīng)典的現(xiàn)代散文和現(xiàn)代詩共計(jì)80萬首,構(gòu)建了大規(guī)模的數(shù)據(jù)集。

第三,以詞向量技術(shù)呈現(xiàn)春節(jié)祝福主題。

在相關(guān)詩詞專家團(tuán)隊(duì)的指導(dǎo)下,利用詞向量(Word2Vec)技術(shù)發(fā)現(xiàn)與春節(jié)語義相關(guān)的詞匯,并智能化填入各種風(fēng)格的詩詞中,呈現(xiàn)出春節(jié)送祝福的美好意境。

第四,個(gè)性化祝福。

為了保證用戶插入的祝福語滿足詩詞自身的平仄和諧,百分點(diǎn)NLP團(tuán)隊(duì)運(yùn)用了啟發(fā)式搜索技術(shù)實(shí)現(xiàn)了這種插入邏輯,而且在前端還支持用戶上傳自己的照片,最終讓用戶生成的每一首詩詞都是滿滿的個(gè)性化祝福。

最重要的是智能審核環(huán)節(jié)。為保障詩詞中不出現(xiàn)黃色、非法或廣告詞匯,在本項(xiàng)目中所使用的敏感詞審核系統(tǒng)是百分點(diǎn)為主流媒體機(jī)構(gòu)開發(fā)并實(shí)際使用的一款智能審核系統(tǒng),系統(tǒng)中包括數(shù)萬條的敏感詞庫,結(jié)合先進(jìn)的機(jī)器學(xué)習(xí)算法,可以實(shí)現(xiàn)各種敏感詞變種識(shí)別,并且從訓(xùn)練語料庫、輸入環(huán)節(jié)、生成詩詞的各個(gè)階段都有極為嚴(yán)苛的技術(shù)保障。

NLP:懂語言者得天下

在春節(jié)之際,“AI李白”讓人們使用人工智能技術(shù)寫詩,傳承了民族文化、弘揚(yáng)中華經(jīng)典,同時(shí),也是百分點(diǎn)NLP技術(shù)能力的一次對(duì)外展示。未來,在深度學(xué)習(xí)算法持續(xù)升級(jí)換代,以及在大量用戶使用中積累了更多數(shù)據(jù)集后,系統(tǒng)將持續(xù)進(jìn)行自學(xué)習(xí)、自優(yōu)化。可以預(yù)想,“AI李白”會(huì)越來越貼近人寫詩的效果。

中國正成為全球人工智能(AI)行業(yè)領(lǐng)軍者,人工智能應(yīng)用逐漸走進(jìn)各行各業(yè),讓人類生活更加美好。對(duì)比人工智能在視覺(圖像)、聽覺(語音)等的感知能力突飛猛進(jìn),認(rèn)知智能應(yīng)用在引入深度學(xué)習(xí)方面還需要深化。但因NLP處于認(rèn)知智能最核心的地位,被比爾·蓋茨形容為“人工智能皇冠上的明珠”,自然語言處理的技術(shù)的發(fā)展將會(huì)推動(dòng)人工智能整體的進(jìn)展。

實(shí)際上,NLP不僅是可以應(yīng)用于詩詞的自動(dòng)生成,還可應(yīng)用在智能推薦、智能搜索、智能校驗(yàn)、智能問答、智能商情等眾多的業(yè)務(wù)場(chǎng)景,百分點(diǎn)在這些方面積累了豐富的業(yè)務(wù)實(shí)踐經(jīng)驗(yàn),覆蓋新零售、媒體出版、公安、教育等行業(yè),未來在“NLP+”方面將會(huì)有越來越多的落地項(xiàng)目。

分享到

xiesc

相關(guān)推薦