為了填補(bǔ)這個(gè)鴻溝,一種新的AI基礎(chǔ)設(shè)施誕生了,它就是:人工智能計(jì)算中心。

在此之前,人類建過許多大型的計(jì)算中心。比如,我們熟知的超算中心,集中了一個(gè)國家或地區(qū)的最強(qiáng)算力,主要用于科研。還有阿里、華為等云廠商興建的云計(jì)算中心,基于云平臺(tái),向全社會(huì)提供大數(shù)據(jù)的計(jì)算、存儲(chǔ)等服務(wù)。它們雖然也對(duì)外提供AI算力,但畢竟不是主業(yè)。而人工智能計(jì)算中心專為AI打造,主要用于AI模型的開發(fā)、訓(xùn)練和推理,能夠?yàn)槿鐣?huì)提供AI所需的專用算力。

這種新的AI基礎(chǔ)設(shè)施,自誕生之日起,就成為全球主要AI大國的角力場(chǎng)。比如,美國投資18億美金,計(jì)劃在全國打造三個(gè)E級(jí)超算,其中一個(gè)的算力,超過目前全球十大超算的總和。德國早在2018年就推出國家級(jí)人工智能戰(zhàn)略,并資助一批高校建設(shè)人工智能計(jì)算中心。中國也先后建成了深圳鵬城云腦和武漢人工智能計(jì)算中心,還有多個(gè)城市已開工或者正在籌建人工智能計(jì)算中心。

在政府主導(dǎo)下,許多頭部企業(yè)也紛紛下場(chǎng)。谷歌自研AI專用的TPU芯片,并通過云平臺(tái)對(duì)外輸出AI云服務(wù)。微軟也宣布,斥資10億美元,構(gòu)建一個(gè)AI計(jì)算平臺(tái)。在中國,阿里投入重金,建立超大規(guī)模機(jī)器學(xué)習(xí)平臺(tái)。而華為,更是鵬城云腦和武漢人工智能計(jì)算中心背后的建設(shè)主力軍。

蓬勃發(fā)展的AI產(chǎn)業(yè),無限放大了全社會(huì)對(duì)算力的需求。為了邁過這道鴻溝,全世界以政府主導(dǎo)、頭部企業(yè)參建的模式,正掀起一場(chǎng)AI算力的軍備競(jìng)賽。

“一中心四平臺(tái)”,人工智能計(jì)算中心是AI產(chǎn)業(yè)發(fā)展的最佳路徑

在人工智能計(jì)算中心出現(xiàn)前,人們是如何解決AI算力問題的呢?

除了超算中心和云計(jì)算中心“兼職”外,更多靠企業(yè)自建。例如,谷歌早期就用GPU來加速。后來,為了訓(xùn)練AlphaGo,開發(fā)了TPU芯片。但像谷歌這樣財(cái)大氣粗的企業(yè),畢竟是少數(shù)。更多的企業(yè),缺乏足夠的資金來搭建自己的AI算力。勉強(qiáng)搭起來,算力也有限。而且不同企業(yè)的算力,還分散在全國,各自為政。以這樣的算力,很難訓(xùn)練出大模型,更別提GPT-3這種超級(jí)大模型。而后者,是推動(dòng)AI技術(shù)不斷進(jìn)步、產(chǎn)業(yè)不斷發(fā)展的關(guān)鍵。

未來,AI產(chǎn)業(yè)要想大發(fā)展,亟需降低算力門檻。而在各地集中建設(shè)AI基礎(chǔ)設(shè)施,也就是人工智能計(jì)算中心,不失為一個(gè)好的解決方案,可以有效降低AI的算力成本,一改過去AI算力分散的局面。

在地方政府的產(chǎn)業(yè)政策引導(dǎo)下,通過集中建設(shè),這種AI基礎(chǔ)設(shè)施可將算力普惠地輸出給全社會(huì),包括企業(yè)、科研機(jī)構(gòu)和高校。

過去,訓(xùn)練一個(gè)大模型,動(dòng)輒上千萬美元。如今,企業(yè)和開發(fā)者,可按需租用算力,花小錢辦大事,極大地降低了門檻,加速了AI創(chuàng)新。這一點(diǎn),對(duì)于AI產(chǎn)業(yè)的繁榮,極為關(guān)鍵。

就像電廠一樣,人工智能計(jì)算中心首先是一個(gè)公共算力服務(wù)平臺(tái)。

但,光有算力還不夠。電廠之所以是社會(huì)經(jīng)濟(jì)的發(fā)動(dòng)機(jī),背后是一個(gè)生態(tài),包括上下游產(chǎn)業(yè)鏈、設(shè)備廠商和終端用戶,等等。因此,人工智能計(jì)算中心除了是一個(gè)算力服務(wù)平臺(tái),還是一個(gè)AI產(chǎn)業(yè)聚集發(fā)展平臺(tái),能夠聚合AI產(chǎn)業(yè)鏈上的各類公司,包括算法公司、數(shù)據(jù)處理公司、行業(yè)集成公司等,形成完整的產(chǎn)業(yè)閉環(huán),促進(jìn)和推動(dòng)AI產(chǎn)業(yè)集群發(fā)展。

此外,它還是一個(gè)應(yīng)用創(chuàng)新孵化平臺(tái),通過開發(fā)者AI創(chuàng)新,與本地優(yōu)勢(shì)產(chǎn)業(yè)(如制造、醫(yī)療、交通、智能電動(dòng)車等)相結(jié)合,讓技術(shù)轉(zhuǎn)化為產(chǎn)業(yè)價(jià)值,帶動(dòng)當(dāng)?shù)禺a(chǎn)業(yè)智能化升級(jí)。以武漢為例,庫柏特的智能機(jī)器人在武漢人工智能計(jì)算中心的支持下,通過視覺處理算法創(chuàng)新,其機(jī)械臂每次抓取藥盒的拍照時(shí)間,從過去200毫秒縮短至50毫秒!武漢市政府計(jì)劃,到2023年孵化60個(gè)以上類似的AI深度應(yīng)用場(chǎng)景,形成AI應(yīng)用示范項(xiàng)目超過100個(gè)。

人工智能計(jì)算中心也是一個(gè)科研創(chuàng)新和人才培養(yǎng)平臺(tái),為將來儲(chǔ)備技術(shù)和人才。目前,經(jīng)教育部批準(zhǔn)設(shè)立AI本科專業(yè)的高校已達(dá)200余所。有了人工智能計(jì)算中心,這些院校可聯(lián)合行業(yè)龍頭企業(yè),基于前者充沛的算力,開展技術(shù)研發(fā)和關(guān)鍵人才的培養(yǎng)。在深圳,鵬城實(shí)驗(yàn)室就依托“鵬城云腦Ⅱ”,聚集了31位院士和2000多名科研人員,使得深圳一躍成為國內(nèi)AI人才高地。

今天的中國,正在打造國家新一代人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū)。

人工智能計(jì)算中心通過“1個(gè)中心+4個(gè)平臺(tái)”,形成一個(gè)完整的算力生態(tài),徹底打通了“產(chǎn)”“學(xué)”“研”“用”全產(chǎn)業(yè)鏈,滿足了國家和地方對(duì)人工智能產(chǎn)業(yè)發(fā)展的需求。從這個(gè)意義上講,人工智能計(jì)算中心是我國發(fā)展人工智能產(chǎn)業(yè)的最佳路徑。

未來,小到手機(jī)、人臉識(shí)別,大到無人駕駛、工業(yè)機(jī)器人……人工智能計(jì)算中心將為全社會(huì)的智能化,提供源源不斷廉價(jià)充沛的AI算力,從而托起中國經(jīng)濟(jì)的明天。

培育人工智能根技術(shù),夯實(shí)我國AI基礎(chǔ)設(shè)施底座

先行一步的武漢和深圳,已經(jīng)看到了這種希望。

在武漢,華為助力打造的人工智能計(jì)算中心,AI峰值性能可達(dá)100PFlops(1P相當(dāng)于每秒1000萬次浮點(diǎn)運(yùn)算)。在深圳,基于華為Atlas 900集群的“鵬城云腦Ⅱ”可提供世界頂級(jí)算力,在最新一期IO500榜單中位居榜首,其全系統(tǒng)輸入輸出性能得分是排名第二的近20倍。武漢和深圳之外,包括成都在內(nèi),全國20多個(gè)城市也在積極籌建人工智能計(jì)算中心。充沛的算力,給當(dāng)?shù)啬酥寥珖?jīng)濟(jì)注入了強(qiáng)勁的動(dòng)力。

從深圳到武漢,再到已開工的成都,中國在興建人工智能計(jì)算中心的路上,再次展現(xiàn)了“基建狂魔”的本色。但同時(shí),我們也要清醒地看到,在這個(gè)事關(guān)未來的AI基礎(chǔ)設(shè)施建設(shè)上,我們還存在短板。

過去十年,中國在目標(biāo)識(shí)別等AI應(yīng)用上,領(lǐng)先于世界。可當(dāng)我們向上捅破天,低下頭來建人工智能計(jì)算中心時(shí)才發(fā)現(xiàn):與西方先進(jìn)水平相比,自己在AI根技術(shù)上還有不小的差距。

電廠的核心是發(fā)電機(jī)組,人工智能計(jì)算中心的核心是芯片。

過去,無論超算還是云計(jì)算中心,多采用CPU+GPU組合。如今,人工智能計(jì)算中心加入了FPGA、NPU等異架構(gòu)處理器,以多樣化算力,加速AI計(jì)算。

NPU是一種AI專用芯片,可在電路層模擬人類的神經(jīng)元和突觸。與傳統(tǒng)芯片相比,AI算力有數(shù)十上百倍的提升。

下圖對(duì)比了CPU、GPU和TPU(谷歌開發(fā)的NPU)的數(shù)據(jù)處理方式。

圖片2.jpg

NPU的這種大吞吐量,對(duì)于需要數(shù)據(jù)清洗、模型生成、訓(xùn)練和推理的AI計(jì)算來講,優(yōu)勢(shì)尤其明顯。美國排名第二的打車軟件Lyft,自從用了谷歌Cloud TPU,也就是云上AI算力后,以前幾天才能干完的活,現(xiàn)在幾小時(shí)就搞定了。但無論CPU、GPU,還是NPU,國內(nèi)企業(yè)在這些底層芯片上的積累,還比較薄弱。CPU、GPU幾乎被英特爾、AMD和英偉達(dá)三家公司壟斷。NPU相對(duì)好一些,華為有昇騰系列,寒武紀(jì)也開發(fā)了思元系列。

而這,還只是硬件問題。

軟件方面,人工智能計(jì)算中心是一個(gè)算力多樣化的平臺(tái),如何將眾多異架構(gòu)芯片放在一起還能相互兼容,需要統(tǒng)一的編程框架。當(dāng)年,英偉達(dá)為了將圖形處理芯片GPU用在通用計(jì)算上,開發(fā)了CUDA。如今,華為為了提高開發(fā)效率,設(shè)計(jì)了異構(gòu)計(jì)算架構(gòu)CANN。

算法是AI的核心。

全世界每天都在產(chǎn)生新的算法和模型,開發(fā)者不需要從頭學(xué)習(xí),但他們需要一個(gè)統(tǒng)一的AI算法平臺(tái)和框架。

目前,全球大多數(shù)開發(fā)者都選擇了谷歌的TensorFlow和Facebook的Pytorch。國內(nèi)企業(yè)最初在這個(gè)領(lǐng)域一片空白,后來才有了華為的MindSpore和百度的飛槳,但在開發(fā)者人數(shù)上,與對(duì)手還有不小的差距。有了芯片,有了編程平臺(tái)和AI框架,再往上,就到了AI應(yīng)用軟件開發(fā)平臺(tái)。在這一層上,國內(nèi)企業(yè)實(shí)力不俗,阿里有PAI,華為有ModelArts,百度有AI Studio。開發(fā)者們?cè)谶@些平臺(tái)上,最終做出賦能千行百業(yè)的APP。

AI根技術(shù)是AI的基石,只有根深,才能葉茂,才能從底層釋放出充沛的算力,支撐起整個(gè)頂層應(yīng)用的全面繁榮。

這種從底層算力釋放,到頂層應(yīng)用使能的AI全棧能力,可以用下圖一欄全貌:

圖片3.jpg

從圖上可知,谷歌無疑是AI能力最強(qiáng)也最全面的科技公司之一。在國內(nèi),擁有類似能力的企業(yè)屈指可數(shù),華為算是一家。

作為引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的戰(zhàn)略性技術(shù),人工智能無疑已成為全球大國角力的主戰(zhàn)場(chǎng),并在很大程度上決定著一個(gè)國家或地區(qū)未來的命運(yùn)。在我國,人工智能早已上升到國家戰(zhàn)略,并在十四五規(guī)劃中被正式列為前沿科技領(lǐng)域的最高優(yōu)先級(jí)。

道阻且艱,行則將至。各城市人工智能計(jì)算中心的陸續(xù)落成,無疑讓我們向發(fā)展為人工智能領(lǐng)域的世界領(lǐng)導(dǎo)者目標(biāo)又邁出一大步。未來,可期!

分享到

songjy

相關(guān)推薦