浪潮 發(fā)表于:14年11月24日 10:32 [來稿] DOIT.com.cn
呂克·貝松執(zhí)導(dǎo)的《超體》,讓人們再一次將目光投向大腦開發(fā)。而對于眾多從事人工智能研究的工程師們來說,讓機器“超體”則是夢寐以求的目標。在人工智能領(lǐng)域,智能語音識別被眾多專家認為是未來10年間信息技術(shù)領(lǐng)域十大重點發(fā)展技術(shù)之一,而一項由科大訊飛主導(dǎo)的“訊飛超腦計劃”正在致力于將這一夢想變成現(xiàn)實。
無解?人腦能耗比=天河2號的200萬倍
智能語音目前主要依靠深度學(xué)習(xí)的技術(shù)實現(xiàn),作為機器學(xué)習(xí)的一個重要分支,深度學(xué)習(xí)在于建立、模擬人腦進行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),使得機器能從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而對新的樣本做智能識別或?qū)ξ磥碜鲱A(yù)測,以達到具有人類一樣的思考能力。目前,F(xiàn)acebook、Google、IBM、蘋果、微軟、百度、科大訊飛等均在此方面做了多種嘗試。
深度學(xué)習(xí)技術(shù)有很多支撐的計算機算法,而目前最常用的是DNN算法(k近鄰分類算法),它能比較好地模擬人腦神經(jīng)元多層深度傳遞的過程,解決智能語音中的復(fù)雜問題。然而,要模擬人腦絕非易事,人腦的計算能耗比是世界上最快的超級計算機天河2號的200萬倍,據(jù)了解,人類大腦大致有1000億神經(jīng)元,每個神經(jīng)元有大約5000個神經(jīng)突觸。要使機器無限接近人類的思考能力意味著要模擬出更多的神經(jīng)元和神經(jīng)突觸,這就會帶來巨大的計算挑戰(zhàn)。
挑戰(zhàn)!模擬1/10人腦神經(jīng)元
對于神經(jīng)學(xué)領(lǐng)域的工程師們來說,他們所面臨的最終挑戰(zhàn)就是在提供更好配置性和規(guī)模的同時,實現(xiàn)類似于人腦一般的超高能耗比。
在現(xiàn)階段,即使世界IT巨頭都無法徹底解決上述難題,不過科大訊飛卻宣布要實現(xiàn)基于類人神經(jīng)網(wǎng)絡(luò)的認知智能引擎,預(yù)期成果是實現(xiàn)世界上第一個中文認知智能計算引擎。
目前,科大訊飛已經(jīng)集結(jié)了在認知智能領(lǐng)域最強研究團隊,將在知識圖譜構(gòu)建與推理、人工神經(jīng)網(wǎng)絡(luò)模擬、人腦原理分析模擬幾個方向展開研究。
為了搶占國內(nèi)智能語音市場先機,科大訊飛計劃將模擬人腦神經(jīng)元的1/10,以期讓該公司的智能語音設(shè)備擁有初步的人類思考能力。
破題!算法優(yōu)化+高效集群
要實現(xiàn)人腦神經(jīng)元的1/10的深度模擬,意味著科大訊飛面臨著數(shù)千倍訓(xùn)練數(shù)據(jù)及數(shù)千倍模型參數(shù)的巨大挑戰(zhàn),迫切需求更大規(guī)模、更多存儲的超算平臺集群建設(shè)、更優(yōu)的深度學(xué)習(xí)并行化及集群調(diào)度算法和深度定制的人工神經(jīng)網(wǎng)絡(luò)專屬芯片系統(tǒng)。
面對這些棘手的問題,該采用何種方式有效解決?首先是算法上優(yōu)化,科大訊飛將整個DNN環(huán)節(jié)進行優(yōu)化壓縮,只保留部分核心等流程,整個架構(gòu)循環(huán)由優(yōu)化了40%,大幅度的增加了運算速度與效率。
在算法調(diào)整完以后面臨的就是基礎(chǔ)設(shè)施的建設(shè),如何設(shè)計一套占地面積小、計算性能高、又綠色節(jié)能的高性能計算集群成為科大訊飛面臨的下一個難題。浪潮曾參與研制天河1A、天河2號超級計算機具備非常豐富和領(lǐng)先的系統(tǒng)構(gòu)建能力,并且擁有一支上百人的應(yīng)用專家團隊,對高性能計算的專業(yè)應(yīng)用也十分了解,因此浪潮成為科大訊飛的選擇的廠商之一。
浪潮!伙伴的力量
針對該公司面臨的問題,雙方聯(lián)合設(shè)計了針對DNN算法特點的GPU集群并行計算框架,通過GPU提高計算能力、通過IB網(wǎng)絡(luò)提速節(jié)點之間的通信速度,最終完成GPU集群版的DNN并行算法,大幅減低了DNN的計算時間。
除了為科大訊飛構(gòu)建高性能集群系統(tǒng),浪潮還特別在軟件方面與該公司算法專家團隊共同成立專門聯(lián)合項目組,節(jié)點內(nèi)使用CPU+GPU協(xié)同計算,大幅降低了計算時間。雙方聯(lián)合針對GPU架構(gòu)進行了算法層面的優(yōu)化,重寫了計算部分代碼,將整體速度大幅提升。
解決了算法和平臺的問題,浪潮成功幫助科大訊飛有效提升了語音識別的正確率。浪潮-英特爾中國并行計算聯(lián)合實驗室首席工程師張清介紹:“浪潮已經(jīng)分別與英特爾和英偉達成立聯(lián)合并行計算實驗室,合作開發(fā)優(yōu)化基于MIC和GPU的并行應(yīng)用。目前已經(jīng)建立了一套非常完善的高性能計算集群解決方案,將不僅為用戶提供好用的高性能計算集群,還會針對每一個用戶的應(yīng)用特點量身定制集群解決方案,這也就說明未來浪潮將跟用戶在應(yīng)用測試、集群搭建、加速優(yōu)化等各方面展開合作,把用戶的需求看作是浪潮設(shè)計構(gòu)建集群的根本要求。”而這些聯(lián)合實驗室的成果對于支持科大訊飛人工智能超算應(yīng)用需求起到了關(guān)鍵性的作用。
公司簡介 | 媒體優(yōu)勢 | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會員注冊 | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.