作為國內(nèi)智能語音圈數(shù)一數(shù)二的語音技術(shù)服務(wù)商捷通華聲在中國語音產(chǎn)業(yè)聯(lián)盟年會(huì)結(jié)束后,審時(shí)度勢,借助在京城中關(guān)村軟件園的“地利”之勢以及核心團(tuán)隊(duì)人員來自清華大學(xué)的“人和”關(guān)系,積極聯(lián)動(dòng)清華學(xué)府,并成功吸引清華大學(xué)注資捷通華聲,成為第二大股東。更重要的是捷通華聲得到了清華大學(xué)的長年積累研究的學(xué)術(shù)和技術(shù)支持,打通了國內(nèi)產(chǎn)、學(xué)、研三派互通有無的“任督二脈”,也成就了“TTS+ASR”雙劍合璧的靈云智能語音完美展現(xiàn)。
縱觀國內(nèi)外語音產(chǎn)業(yè)發(fā)展規(guī)律,生存下來的企業(yè)無外有幾種方式,國外首推美國Nuance,伴隨語音產(chǎn)業(yè)的發(fā)展規(guī)律,通過全球范圍不斷的兼并,Nuance形成全球范圍內(nèi)的壟斷得以生存發(fā)展。國內(nèi)企業(yè)則以訊飛、捷通華聲為代表,兩家公司均以高校為支撐,捷通華聲依托清華大學(xué)、訊飛依靠科大; 訊飛長于調(diào)動(dòng)各種社會(huì)資源,高打高唱;捷通華聲相對低調(diào),以務(wù)實(shí)為本,強(qiáng)調(diào)合作共贏。三家公司雖各具特點(diǎn),卻有一個(gè)共同點(diǎn),均以TTS贏取市場與利潤,ASR多為企業(yè)品牌知名度服務(wù)。國外語音市場相對成熟理性,Nuance經(jīng)過不斷的收購擴(kuò)大實(shí)力,但終于在蘋果Siri的高潮過后,先后傳出將要被蘋果、三星收購的傳聞。如果Nuance出售收購,多少也標(biāo)示著智能語音經(jīng)過幾起幾落發(fā)展之后,進(jìn)入到一個(gè)相對理性的發(fā)展階段,也預(yù)示著人工智能一個(gè)新的時(shí)代的開始。
捷通華聲雖為國內(nèi)的老牌語音技術(shù)服務(wù)商,早在三年前即推出國內(nèi)外第一個(gè)全方位人工智能技術(shù)云服務(wù)平臺(tái)靈云(www.hcicloud.com),智能語音則為其人工智能整體布局中關(guān)鍵一環(huán)。
在這里不得不提的是,智能語音交互技術(shù)涵蓋語音合成(TTS)和語音識(shí)別(ASR)兩項(xiàng)技術(shù)——而2013年整整一年都在炒作語音識(shí)別——捷通華聲靈云以支持13種國際語言的語音合成技術(shù)在國內(nèi)獨(dú)占鰲頭,雖然語音識(shí)別技術(shù)在2012年的時(shí)候還稍遜于國際IT巨頭Nuance、Google,但是在自2013年后,借助清華的力量,語音識(shí)別技術(shù)突飛猛進(jìn),迅速實(shí)現(xiàn)商品化,具有中國特色的漢語言智能語音體系嶄露頭角,靈云語音合成與語音識(shí)別相輔相成,形成一套完整的智能語音解決方案,目前已應(yīng)用于國內(nèi)眾多產(chǎn)業(yè)中,并加速布局移動(dòng)互聯(lián)網(wǎng)應(yīng)用?,F(xiàn)在,靈云智能語音已成功為百度地圖、搜狗導(dǎo)航、導(dǎo)航犬等經(jīng)典應(yīng)用提供語音服務(wù)。伴隨靈云語音識(shí)別技術(shù)的升級(jí),靈云語音技術(shù)在語音質(zhì)檢領(lǐng)域也取得突破,將幫助電信、金融等領(lǐng)域的企業(yè)大大提升客服的服務(wù)質(zhì)量和效率。
捷通靈云智能語音交互技術(shù)目前已在全新改版的靈云全方位人工智能開放平臺(tái)上免費(fèi)開放,可供開發(fā)者、企業(yè)自由調(diào)用,而除了“TTS+ASR”雙劍合璧的特性外,捷通靈云智能語音還提供“云+端”服務(wù),既可提供私有云服務(wù)器解決企業(yè)內(nèi)部服務(wù)器運(yùn)行壓力,也可以派遣專業(yè)技術(shù)人員前往企業(yè)內(nèi)部搭建私人定制的智能語音技術(shù)平臺(tái),并且永久跟蹤服務(wù),響應(yīng)及時(shí),無后顧之憂。
壯志靈云,開啟人工智能新時(shí)代
作為國內(nèi)老牌語音技術(shù)民族企業(yè),捷通華聲立足智能語音,全面發(fā)展圖像識(shí)別(OCR)、手寫識(shí)別(HWR)、自然語言理解(NLU)、機(jī)器翻譯(MT)等人工智能技術(shù)能力,率先突破傳統(tǒng)語音范圍,形成獨(dú)特的“全智能”效應(yīng),2011年,捷通華聲全面整合具有自主知識(shí)產(chǎn)權(quán)的多項(xiàng)智能人機(jī)交互技術(shù),突破性地創(chuàng)建了第一個(gè)最大最全的人工智能技術(shù)云服務(wù)開放平臺(tái)——靈云(www.hcicloud.com),率先拉開了中國人工智能產(chǎn)業(yè)化的大幕!
2014年伊始,人工智能在幾大互聯(lián)網(wǎng)巨頭的推波助瀾中成為產(chǎn)業(yè)焦點(diǎn),而智能語音則為人工智能領(lǐng)域中不可或缺的組成部分。人工智能是一個(gè)由淺入深的智能化模型、機(jī)制和過程,智能語音處于較淺層次上;在深層次上,人工智能意味著基于機(jī)器學(xué)習(xí)技術(shù)的知識(shí)表達(dá)、歸納、推理等智能計(jì)算過程??梢哉f智能語音等人機(jī)交互技術(shù)是人工智能的觸角,智能計(jì)算是人工智能的核心,二者缺一不可,共同組成一個(gè)智能網(wǎng)絡(luò)。在清華大學(xué)各人工智能頂尖學(xué)科團(tuán)隊(duì)的支持下,捷通靈云智能語音等人機(jī)交互能力更加成熟。靈云語音識(shí)別,采用最新深度神經(jīng)網(wǎng)絡(luò)算法技術(shù),識(shí)別準(zhǔn)確率突破95%;語音合成方面,捷通靈云在國內(nèi)率先推出支持中、英、德、法、阿拉伯等多達(dá)十三種國際語言的語音合成技術(shù)服務(wù),在國內(nèi)智能語音服務(wù)達(dá)到了50%的市場占有率,而靈云智能語音 “TTS+ASR”使人與機(jī)器之間“說與聽”兩項(xiàng)能力的強(qiáng)化,讓人與機(jī)器的自然交流變得更加通暢。
靈云OCR與手寫識(shí)別等智能圖像識(shí)別技術(shù),又猶如人的“眼睛與手”。目前靈云手寫識(shí)別已能夠識(shí)別92種國際語言;靈云OCR更是在文檔、票據(jù)、證照識(shí)別領(lǐng)域中異軍突起,保證靈云智能平臺(tái)擁有更全面的“視覺與感觀”能力。
人類無論用語音交互還是通過文字傳遞信息,其獲取信息的目的都是為了在相互理解之后進(jìn)行彼此的溝通。靈云智能平臺(tái)近日全面升級(jí)并推出的語義分析、意圖理解及機(jī)器翻譯,進(jìn)一步推動(dòng)靈云向人工智能更深層次發(fā)展,不僅讓靈云“能說會(huì)聽”、“能寫會(huì)看”,也開始學(xué)會(huì)如何思考。如今,通過靈云語音識(shí)別不在僅是聽懂人的話,同時(shí)能夠?qū)λR(shí)別出的文字信息進(jìn)行分析理解,然后應(yīng)用靈云語音合成技術(shù)將所要表達(dá)的信息以語音方式朗讀出來,從而實(shí)現(xiàn)人與機(jī)器交流的一個(gè)完整應(yīng)用過程。
隨著人工智能在互聯(lián)網(wǎng)產(chǎn)業(yè)中關(guān)注度越來越高,人工智能似乎一夜間成為產(chǎn)業(yè)的熱點(diǎn),捷通靈云智能平臺(tái)憑借對人工智能產(chǎn)業(yè)發(fā)展的獨(dú)特理念與執(zhí)著信心,終于逐漸顯現(xiàn)出其超前的魄力的魅力。
捷通華聲創(chuàng)始人張連毅表示:“靈云智能平臺(tái)的創(chuàng)建,不僅有力推動(dòng)智能語音等人機(jī)交互技術(shù)在中國的發(fā)展與普及化應(yīng)用,也改變了智能語音產(chǎn)業(yè)發(fā)展的趨勢。伴隨產(chǎn)業(yè)的需求變化、技術(shù)的跨越式進(jìn)步,在清華大學(xué)的支持下,靈云智能平臺(tái)已成功完成向多模態(tài)、全方位人工智能云平臺(tái)的升級(jí)與發(fā)展。如果說捷通華聲是中國人工智能產(chǎn)業(yè)的倡導(dǎo)者,那么捷通華聲靈云智能平臺(tái)就是中國人工智能產(chǎn)業(yè)的開拓者。”
靈云全方位人工智能體驗(yàn)平臺(tái)www.hcicloud.com