對(duì)話式人工智能開啟更廣闊前景

對(duì)話式人工智能正在成為新一代智能應(yīng)用的核心。現(xiàn)代開發(fā)者必須懂得如何打造一個(gè)對(duì)話機(jī)器人,以及如何部署和運(yùn)行它,因?yàn)檫@是來自客戶的呼聲——企業(yè)迫切需要能夠針對(duì)銷售咨詢、人力資源、招聘、客戶支持和服務(wù)等不同應(yīng)用場景進(jìn)行定制、優(yōu)化和訓(xùn)練的智能業(yè)務(wù)機(jī)器人。

Azure Bot Services對(duì)話機(jī)器人服務(wù)讓開發(fā)者和企業(yè)能夠輕松開發(fā)出自己的對(duì)話機(jī)器人,發(fā)布兩年來已經(jīng)有30萬開發(fā)者采用該服務(wù)開發(fā)。對(duì)話機(jī)器人服務(wù)能夠根據(jù)業(yè)務(wù)需求進(jìn)行定制,還支持發(fā)布到微軟小娜(Cortana)上,并能利用簡單易用的開發(fā)工具為小娜賦予更多業(yè)務(wù)技能。微軟已經(jīng)與亞馬遜合作,將微軟小娜結(jié)合到Alexa智能音箱中,讓用戶通過Alexa調(diào)用小娜及其背后的人工智能服務(wù)。

微軟小冰是面向情商(EQ)維度發(fā)展的人工智能系統(tǒng),已在五個(gè)國家落地。今天,微軟宣布一項(xiàng)人工智能內(nèi)容創(chuàng)造的全新技能,為每個(gè)孩子定制專屬于他們的有聲童話故事,將于“六一”兒童節(jié)正式上線。家長可以設(shè)置童話故事的主人公和故事傾向,如更偏教育意義等,然后安排微軟小冰完成創(chuàng)作。微軟小冰采用專門訓(xùn)練的深度學(xué)習(xí)模型,能夠從故事文本階段即進(jìn)行定制化生成,并自動(dòng)分配聲音角色和背景音樂,在短短20秒內(nèi)即可完成一集約10分鐘左右的有聲童話故事,語音講述的質(zhì)量能達(dá)到主流專業(yè)人類播音員的水準(zhǔn)。該項(xiàng)服務(wù)完全免費(fèi),微軟會(huì)持續(xù)向訂閱家庭每天推送最新作品,讓每個(gè)家庭的孩子都可以擁有一位專屬于自己的故事主播。

目前,微軟小冰團(tuán)隊(duì)已經(jīng)進(jìn)入內(nèi)容創(chuàng)造領(lǐng)域并開始落地生產(chǎn),內(nèi)容涉及歌曲演唱、電臺(tái)電視臺(tái)節(jié)目、新聞評(píng)論、詩歌生成和有聲讀物等。在有聲讀物領(lǐng)域,微軟已擁有接近4萬集有聲童話內(nèi)容。這些有聲讀物全部由人工智能技術(shù)生成,在與人類主播質(zhì)量相當(dāng)?shù)那疤嵯拢瑪?shù)量足以陪伴一個(gè)孩子從2歲到9歲的全部時(shí)光。6個(gè)月來,這些有聲讀物已順利投放到占中國市場90%的兒童早教機(jī)、故事機(jī)和在線播客平臺(tái),播放總時(shí)長超過400萬小時(shí)。

此外,微軟還將向合作伙伴和開發(fā)者開放“全雙工語音技術(shù)(Full Duplex)”,將“人機(jī)交互”進(jìn)化為能像人類一樣自然的“人機(jī)交流”,開發(fā)者可以使用這項(xiàng)技術(shù)打造自己的對(duì)話應(yīng)用。今年四月,微軟正式在美國和中國同步宣布了Full Duplex感官,并已完成產(chǎn)品化落地。自2016年8月起,微軟(亞洲)互聯(lián)網(wǎng)工程院通過人類用戶主動(dòng)發(fā)起的方式,在明確告知用戶小冰并非人類的前提下,已讓小冰與人類用戶完成了累計(jì)超過60萬通電話交流。小米生態(tài)鏈企業(yè)億聯(lián)客開發(fā)的Yeelight語音助手是全球首個(gè)搭載全雙工語音交互感官的智能設(shè)備,其硬件產(chǎn)品已開始進(jìn)入千家萬戶。

開源框架讓更多開發(fā)者駕馭機(jī)器學(xué)習(xí)

今天人工智能的發(fā)展處于一個(gè)百家爭鳴的發(fā)展階段,開源框架內(nèi)的人工智能技術(shù)發(fā)展得尤其活躍。而不斷敞開胸懷擁抱開源的微軟,也與時(shí)俱進(jìn)地推出了開放人工智能平臺(tái)(Open AI)戰(zhàn)略及開發(fā)工具,積極參與和推動(dòng)技術(shù)的創(chuàng)新與快速發(fā)展。

在支持諸如TensorFlow、CNTK等業(yè)界主流的深度學(xué)習(xí)平臺(tái)的同時(shí),微軟還發(fā)起了開放神經(jīng)網(wǎng)絡(luò)交換(ONNX)項(xiàng)目,旨在推動(dòng)人工智能研究的互操作性,讓任何深度學(xué)習(xí)框架在任何芯片與任何設(shè)備上都能運(yùn)行。目前,已經(jīng)有15家公司支持ONNX,并且還有更多公司正在加入進(jìn)來。現(xiàn)在已經(jīng)有PyTorch等六種頂級(jí)框架支持ONNX,其它框架則可以通過轉(zhuǎn)換器獲得支持。

在Build 2018微軟全球開發(fā)者大會(huì)上,微軟宣布推出跨平臺(tái)、開源機(jī)器學(xué)習(xí)框架ML.NET開放預(yù)覽。ML.NET讓任何 .NET開發(fā)者都能開發(fā)出自己的定制化機(jī)器學(xué)習(xí)模型,并將其融入到自己的應(yīng)用中去——開發(fā)者完全無需具備開發(fā)和調(diào)試機(jī)器學(xué)習(xí)模型的經(jīng)驗(yàn)。這一框架最初由微軟研究院開發(fā),并且在Windows、Bing、Azure等微軟產(chǎn)品上都得到了成功的應(yīng)用。通過將這一技術(shù)框架開源,微軟希望能夠?yàn)槊恳晃婚_發(fā)者賦予駕馭機(jī)器學(xué)習(xí)的能力。

微軟Project Brainwave能利用Azure上最先進(jìn)的FPGA基礎(chǔ)架構(gòu)完成實(shí)時(shí)的人工智能處理。用戶只需通過實(shí)時(shí)的單一批數(shù)據(jù),就能得到以往需要多得多的批數(shù)據(jù)處理才能得到的性能,真正實(shí)現(xiàn)人工智能的實(shí)時(shí)計(jì)算。而且,F(xiàn)PGA運(yùn)算不僅僅只在云端提供——通過合作伙伴,也可以通過Azure Stack混合云在本地提供FPGA。如此強(qiáng)大的實(shí)時(shí)計(jì)算能力不僅存在于云端,同時(shí)也適用于邊緣計(jì)算,這將讓更多創(chuàng)新成為可能。

微軟研究院,開啟人工智能的未來

今天,人工智能已經(jīng)在潛移默化間給人們生活、工作的方式帶來巨大的改變,那么未來的人工智能技術(shù)將如何發(fā)展?將近20年前,微軟在北京成立了微軟亞洲研究院,與微軟研究院遍布全球各地的科研實(shí)驗(yàn)室一起,以全球最頂尖的智慧解決計(jì)算機(jī)科學(xué)中最具挑戰(zhàn)性的難題,并為未來5到10年的發(fā)展開啟更多可能。

作為美國以外規(guī)模最大、功能最全的研究機(jī)構(gòu),微軟亞洲研究院在計(jì)算機(jī)視覺、自然語言理解等方面取得了舉世矚目的突破,甚至已經(jīng)接近或者達(dá)到了人類的水平:在計(jì)算機(jī)視覺方面,2015年微軟亞洲研究院發(fā)布的152層殘差網(wǎng)絡(luò)(ResNet)的圖像識(shí)別準(zhǔn)確率已經(jīng)達(dá)到96%,勝過人類;2017年8月,微軟在Switchboard語音識(shí)別基準(zhǔn)測試中的錯(cuò)誤率已經(jīng)降低至5.1%,達(dá)到了媲美人類專業(yè)速記員的水平;2018年1月,微軟亞洲研究院自然語言計(jì)算組率先在斯坦福大學(xué)發(fā)起的SQuAD文本理解挑戰(zhàn)賽上獲得超越人類的分?jǐn)?shù);2018年3月,微軟亞洲研究院與微軟雷德蒙研究院宣布,其研發(fā)的機(jī)器翻譯系統(tǒng)在通用新聞報(bào)道測試集newstest2017的中-英測試集上,第一個(gè)達(dá)到了可以與人工翻譯媲美的水平。

微軟亞洲研究院開發(fā)的OCR (Optical Character Recognition光學(xué)字符識(shí)別)技術(shù),將為各種人工智能應(yīng)用增加圖形文字識(shí)別功能,目前支持從Office到Skype、Bing、HoloLens的微軟應(yīng)用,能識(shí)別打印字體、美術(shù)字、手寫字體,可以滿足從智能云到邊緣計(jì)算的各種場景。目前手寫識(shí)別OCR引擎V3.0版本的精度達(dá)到了70.5%,已經(jīng)部署于微軟認(rèn)知服務(wù),可供開發(fā)者用于自己開發(fā)的智能應(yīng)用。

分享到

xiesc

相關(guān)推薦