王堅(jiān):各位來(lái)賓,非常感謝有這么一次機(jī)會(huì),我算是把過(guò)去幾年甚至幾十年有關(guān)的一些想法、一些教訓(xùn)或者一些經(jīng)驗(yàn)在這兒跟大家分享一下。
今天我自己找了三個(gè)關(guān)鍵詞:AI、AI+跟AI基礎(chǔ)設(shè)施,這三個(gè)關(guān)鍵詞都繞不開(kāi)一個(gè)關(guān)鍵詞叫AI,剛才Michael I. Jordan也講了,AI可能一千個(gè)人有一千個(gè)人的理解,一千個(gè)人有一千個(gè)人的想法。但是今天碰巧,這三個(gè)不同的方法,AI、AI+和AI基礎(chǔ)設(shè)施,在今天被結(jié)合在一起了。
人工智能有很長(zhǎng)的過(guò)去,卻只有非常短的歷史
第一個(gè)是我經(jīng)常說(shuō)的一句話,我說(shuō)人工智能有很長(zhǎng)的過(guò)去,卻只有非常短的歷史。其實(shí)這是一個(gè)非常非常糾結(jié)的一件事情,最困惑的就是到今天為止,人工智能到底它在說(shuō)什么事情呢?還是值得非常的探討一下的。
大概在(20世紀(jì))40年代末、50年代初,圖靈寫(xiě)的一篇文章叫《Intelligent Machinery》(智能機(jī)器),我自己覺(jué)得這是一個(gè)很長(zhǎng)過(guò)去的開(kāi)始,如果你要追關(guān)于機(jī)器智能的事情,可能可以追到幾百年以前。
圖靈在這篇文章里面,談了一些很有意思的事情,這篇文章發(fā)表在心理學(xué)一個(gè)哲學(xué)雜志上,第一次在探討關(guān)于機(jī)器跟智能之間的關(guān)系。大家知道,在那個(gè)時(shí)候“計(jì)算機(jī)”這個(gè)詞還沒(méi)有完全出來(lái),大家習(xí)慣叫做“Computing machinary”,這就是為什么美國(guó)計(jì)算機(jī)學(xué)會(huì)叫ACM的原因。那個(gè)時(shí)候“計(jì)算機(jī)”雖然沒(méi)有詞,但是圖靈在那篇文章第一次用了“數(shù)字計(jì)算機(jī)”這個(gè)詞。所以,這篇文章它的深遠(yuǎn)的意義,還是到今天為止看,都是非常值得重新思考的,我們很多最早的概念都是從這邊來(lái)的。
當(dāng)然,大家都會(huì)講到達(dá)特茅斯這個(gè)會(huì),當(dāng)時(shí)Michael I. Jordan特別講了Cybermetics(控制論),我聽(tīng)完以后我就很感觸,如果當(dāng)年那個(gè)會(huì)不在達(dá)特茅斯開(kāi),可能這十個(gè)人的想法就被維納給滅掉了??赡芪覀兘裉爝€是在講的叫Submetics來(lái)稱呼今天說(shuō)的人工智能。但事實(shí)上說(shuō)不定從單詞角度,可能用Submetics會(huì)更好一點(diǎn),但人工智能就這么流行了。為什么在Herbert Simon這邊我打了一個(gè)紅色的框,就是來(lái)設(shè)想我自己對(duì)人工智能的理解,就是從Herbert Simon開(kāi)始的。這個(gè)人很神奇,他是個(gè)心理學(xué)家,但是全參與了這個(gè)會(huì),得了諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。他第一次訪問(wèn)中國(guó)是1972年,以美國(guó)計(jì)算機(jī)協(xié)會(huì)的名義到中國(guó)來(lái)的,80年代初又以美國(guó)心理學(xué)會(huì)的名義到了中國(guó)來(lái),那時(shí)候我在大學(xué)讀三年級(jí),他到我們系講了關(guān)于人工智能。
可一個(gè)大學(xué)三年級(jí)的學(xué)生在中國(guó),在80年代初,有一個(gè)人告訴你,人工智能在下面十年會(huì)有一次天翻地覆的變化,你大概可以設(shè)想一下,那時(shí)候我有多么的激動(dòng)。但事實(shí)上等了十年,沒(méi)有什么發(fā)生,所以后來(lái)該干什么就去干什么了。但事實(shí)上里面的很多最基礎(chǔ)的東西,在那個(gè)時(shí)候也被提到了,甚至大家今天知道的神經(jīng)網(wǎng)絡(luò),我印象很深,當(dāng)時(shí)在80年代末的時(shí)候,有一本教課書(shū)叫PDP(Parallel Distrbuted Processing),里面通篇講的都是神經(jīng)網(wǎng)絡(luò)理論,那時(shí)候講的每一個(gè)層兩個(gè)節(jié)點(diǎn)只有三層,大概你能做到那個(gè)程度就結(jié)束了,但是今天的規(guī)模跟那個(gè)時(shí)候沒(méi)法比。
所以我想說(shuō),今天的人工智能跟80年代初大家講的同一個(gè)人工智能,是一個(gè)完全不同的人工智能。我剛才講了,剛才Michael I. Jordan也講到這了一點(diǎn)。
為什么AI是一個(gè)非常短的歷史呢? 2017年,Google提出了Transformer這件事情。今天我們能夠談人工智能,又重新回到了大家的視野,重新在產(chǎn)業(yè)上有那么大影響的話,就是從2017年開(kāi)始的。所以,2017年以前的人工智能跟我們今天說(shuō)的人工智能還是有一次非常非常不同的差別的。我想這就是我說(shuō)只有7年歷史的原因。
當(dāng)然,這段歷史就是從一篇文章開(kāi)始的,大家都知道。但是我想強(qiáng)調(diào)一下的事情是,這篇文章的8個(gè)作者現(xiàn)在都不在Google,聽(tīng)說(shuō)有一個(gè)最近又會(huì)回去,但沒(méi)關(guān)系,盡管他發(fā)明了很多東西,但是沒(méi)有Google什么事。這里面有一些發(fā)明今天大家被忽視掉的,比如說(shuō)他第一次有了Token這個(gè)概念,聽(tīng)起來(lái)好像也沒(méi)什么了不起的,但是大家都知道今天一個(gè)商業(yè)服務(wù)都是用Token來(lái)計(jì)價(jià)的,大家可以設(shè)想一下如果里面最基本的計(jì)價(jià)邏輯都不清楚的話,大概是不會(huì)有一個(gè)好好的產(chǎn)業(yè)的。更不用講,待會(huì)兒我主題里面講到的關(guān)于基礎(chǔ)設(shè)施的事情。同樣的,大家都知道在Google那個(gè)時(shí)候的前后(發(fā)表這個(gè)文章的前后)有一家公司叫OpenAI,OpenAI的出現(xiàn)站在我的角度來(lái)說(shuō),就是讓我們重新思考一下創(chuàng)新的機(jī)制是什么?所以那就有了在2022年GPT的發(fā)布。
這兩件事情結(jié)合在一起,我總是覺(jué)得是一件很怪的事情,所以我說(shuō)了一句話,Google很行,Google也很不行。Google很行,中國(guó)都在講從0到1的創(chuàng)新,Google是100%完成了從0到1的創(chuàng)新,甚至還要多一點(diǎn)。為什么Google不行呢?大家都可能知道Eric Schmidt前段時(shí)間在斯坦福有一個(gè)發(fā)言,搞的沸沸揚(yáng)揚(yáng)的,說(shuō)的Google很不行,那確實(shí)也不行,為什么呢?他沒(méi)有創(chuàng)造出一個(gè)東西像Open AI創(chuàng)造出的那么有價(jià)值,對(duì)社會(huì)來(lái)說(shuō)。
所以這是讓我們重新思考這個(gè)創(chuàng)新的機(jī)制到底是什么?它不是一個(gè)簡(jiǎn)單的從0到1創(chuàng)新,不是一個(gè)簡(jiǎn)單的你有一個(gè)好的想法,這中間的機(jī)制是遠(yuǎn)遠(yuǎn)超出我覺(jué)得在今天學(xué)者甚至產(chǎn)業(yè)界可以來(lái)理解的,我覺(jué)得這也是一個(gè)對(duì)我們最大的挑戰(zhàn),所以我用了Google很行、Google也很不行。
在ChatGPT后面,它的光芒對(duì)大眾而言,不是對(duì)業(yè)界而言,是被掩蓋了很多事情的。大家都知道AlphaFold,特別是AlphaFold3出來(lái)了,但是很少人會(huì)談?wù)撜f(shuō),它其實(shí)背后還是Transformer+Diffusion,大家今天在講能生成一個(gè)圖片,能生成一段視頻,大家會(huì)講到Transformer+Diffusion,可是很少人理解,為什么Google那篇文章有那么大的影響?也就是說(shuō)到最后大家今天聽(tīng)到的一些最基本的東西,到最后也離不開(kāi)Transformer,當(dāng)然從AlphaFold2到Alphafold3,中間用了一個(gè)Pairformer,但是最后的東西還是這個(gè)Transformer。
從ChatGPT到AlphaFlod、到今天大家在媒體上經(jīng)常會(huì)看到關(guān)于天氣預(yù)報(bào)的時(shí)候,這是三個(gè)跨度非常大的應(yīng)用。但是他們的背后有一個(gè)最基本的東西是脫離不掉的,就是Transformer。所以,我想AI為什么只有7年歷史,大家再回過(guò)頭來(lái)看,事實(shí)上是你愿意不愿意我們生活在Transformer這樣一個(gè)陰影下,也可能以后是一個(gè)陽(yáng)光燦爛的東西。
人工智能+到底是什么
在這樣的背景下再回過(guò)頭來(lái),在李強(qiáng)總理的政府工作報(bào)告當(dāng)中多次談到了人工智能,同時(shí)提到人工智能+。大家設(shè)想一下,在Transformer這個(gè)邏輯下,我們要理解的人工智能+到底是什么?大家今天一談到人工智能+的時(shí)候就會(huì)簡(jiǎn)單的,我加一個(gè)行業(yè)進(jìn)去,這是我用我自己的話來(lái)講,沒(méi)有再比人工智能+后面簡(jiǎn)單加一個(gè)行業(yè),把人工智能庸俗化的做法了。所以反復(fù)思考人工智能+到底是什么?我們?cè)賮?lái)扒開(kāi)來(lái)看GPT或者是今天要說(shuō)的這件事情的話,可能需要有一次重新的思考的。如果ChatGPT如果在人工智能+這個(gè)邏輯下,ChatGPT不是一個(gè)應(yīng)用,它是個(gè)應(yīng)用平臺(tái)。就像在上一個(gè)年代的offce一樣,它不是一個(gè)應(yīng)用,是一個(gè)應(yīng)用平臺(tái)。但如果把GPT再拆一拆,變成一個(gè)基礎(chǔ)模型的話,事實(shí)上Chat就是一個(gè)應(yīng)用,所以ChatGPT就是GPT+Chat,這是我的理解。
我想多說(shuō)一句,Chat不是一個(gè)簡(jiǎn)單的應(yīng)用場(chǎng)景。大家都知道微軟跟OpenAI合作過(guò)程當(dāng)中,不只是做了Chat,其實(shí)他們到比爾蓋茨家里討論了GPT這樣的東西可以用到什么場(chǎng)景,最后只有Chat是最革命的,所以變成了產(chǎn)品。他們做了一大堆很有用,但是沒(méi)有革命的東西,后來(lái)都寫(xiě)成了書(shū)。所以有時(shí)候我經(jīng)常開(kāi)玩笑,這個(gè)書(shū)是很危險(xiǎn)的,不是革命的東西都寫(xiě)成了書(shū),可能最革命的東西做成了產(chǎn)品。這是我們今天真正發(fā)生的事情。
所以,我想沒(méi)有Open AI這個(gè)公司的人對(duì)Chat本身有更深的了解。今天我還是要講一句話,當(dāng)你做不出一個(gè)比ChatGPT好的這樣一個(gè)東西的時(shí)候,至少有兩個(gè)原因在約束你,第一,當(dāng)然是你的技術(shù)有沒(méi)有做好,就是模型;第二,你對(duì)這個(gè)問(wèn)題理解的深度,你能不能真正找到這個(gè)領(lǐng)域的問(wèn)題,事實(shí)上是你約束的最大的一個(gè)前提。我們往往在很多時(shí)候?qū)@個(gè)問(wèn)題不理解,以為有了GPT就可以解決很多的問(wèn)題。
當(dāng)然,我今天講的重點(diǎn)是,這個(gè)+到底是什么?這個(gè)+就讓我想到了,當(dāng)時(shí)Chat做這件事情的時(shí)候,事實(shí)上只是反映了當(dāng)年比爾蓋茨的一個(gè)愿景,就是讓計(jì)算機(jī)能聽(tīng)、能說(shuō)。所以我想,今天因?yàn)橛辛薈hatGPT以后,當(dāng)計(jì)算機(jī)變成一個(gè)手機(jī)以后,我們今天就做到了這一點(diǎn)。
那么這背后真正的+的機(jī)制就是ChatGPT當(dāng)我們講那個(gè)+的時(shí)候,不是+什么東西,而是怎么加,更加重要的是一個(gè)機(jī)制的創(chuàng)新。這句話聽(tīng)起來(lái)很抽象,再把它回過(guò)頭來(lái),ChatGPT是什么意思?這個(gè)+就是OpenAI這家公司,沒(méi)有Open AI這家公司,GPT和Chat是不會(huì)變成這樣一個(gè)影響大家的產(chǎn)品的。
Open AI這家公司為什么是一個(gè)機(jī)制的創(chuàng)新呢?
到今天為止,大家都知道Open AI是一個(gè)怪物,也就是說(shuō)它有Nonprofit(非盈利)的AI,也有OpenAI LP這樣的東西。一個(gè)Nonprofit這樣一個(gè)機(jī)構(gòu),跟一個(gè)商業(yè)機(jī)構(gòu),跟OpenAI這么一個(gè)主體里面,被這樣莫名其妙的存在在一起。所以過(guò)去發(fā)生的所有事情,都跟OpenAI,大家講的OpenAI都是講的OpenAI LP,但是大家知道它的最早的創(chuàng)辦是一個(gè)非盈利機(jī)構(gòu)的話,大家可以想象,它中間的機(jī)制是多么復(fù)雜的一件事情。我經(jīng)常跟投資人講,你用傳統(tǒng)的方法是投不出Open AI這樣一家公司來(lái)的。
當(dāng)然,因?yàn)檫@樣的成功,讓我們重新反思了一下,黃仁勛說(shuō)了一句話,ChatGPT是人工智能的iPhone時(shí)刻。這句話被很多人引用,我自己一開(kāi)始聽(tīng)的時(shí)候也很激動(dòng),后來(lái)想了想,不知道在說(shuō)什么?為什么呢?因?yàn)镃hat GPT是什么?也沒(méi)有完全說(shuō)清楚,人工智能是什么?也沒(méi)有完全說(shuō)清楚。iPhone到底是什么?也沒(méi)有說(shuō)清楚。把這三個(gè)說(shuō)不清楚的東西放在那里變成了一句話,這是讓我困惑了很長(zhǎng)時(shí)間。大家也不要覺(jué)得說(shuō)清楚iPhone是什么,(其實(shí))是一件很困難的事情,我說(shuō)一個(gè)現(xiàn)象就知道了,大家說(shuō)起這個(gè)iPhone都覺(jué)得App Store是它非常重要的事情,今天任何一個(gè)人發(fā)言都說(shuō)生態(tài)多么的重要,可是很少有人理解。你們?nèi)タ词返俜颉滩妓拱l(fā)布第一代iPhone的時(shí)候是沒(méi)有App Store的。如果你要講它的生態(tài)系統(tǒng),當(dāng)年跟史蒂夫·喬布斯一起發(fā)布iPhone第一代的那些公司,今天都不見(jiàn)了。所以它到底是什么?也是值得我們非常深思的。
當(dāng)然,這句話我自己覺(jué)得,它其實(shí)抄襲了另外一句話,這是當(dāng)年我自己看了、看了非常激動(dòng)的,就是當(dāng)AlphaFold出來(lái)的時(shí)候,AlphaFold2出來(lái)的時(shí)候,有人說(shuō)了一句話“AlphaFold是生物學(xué)的ImageNet時(shí)刻”,我自己覺(jué)得這是真正反映了技術(shù)發(fā)展的背后的。當(dāng)然這個(gè)就回到了也是那篇文章,杰夫跟他的兩個(gè)學(xué)生寫(xiě)的,大家只要在做機(jī)器學(xué)習(xí)也好,做圖象識(shí)別也好,一定知道這篇文章。但是你把這篇文章抽象出來(lái)就三個(gè)東西,就是今天構(gòu)成人工智能大家天天講的三個(gè)東西,ImageNet就是有組織的數(shù)據(jù),然后它有一個(gè)模型,那時(shí)候叫CNN,然后+GPU。這是第一次一篇文章完美的把三個(gè)東西結(jié)合在一起。只不過(guò)這三個(gè)東西在那個(gè)時(shí)候都談不上是新的,ImageNet也存在了很多,CNN也不是一個(gè)新的算法,GPU那個(gè)時(shí)候在每一個(gè)網(wǎng)吧里面都有,但是是這篇文章、這三個(gè)學(xué)生把它結(jié)合在一起,使得GPU模型和數(shù)據(jù)成為做這個(gè)行業(yè)的一個(gè)最基本的標(biāo)準(zhǔn),特別是GPU,在那篇文章之后才成為學(xué)術(shù)界的標(biāo)準(zhǔn)。在他的這篇文章之后,才成為工業(yè)界的標(biāo)準(zhǔn)。而當(dāng)時(shí)他們用了兩塊GPU卡,是一個(gè)非常非常普通的GPU卡,盡管這兩張GPU卡在當(dāng)時(shí)大概已經(jīng)超過(guò)了上萬(wàn)個(gè)CPU核的算力。但是我剛才講了,這是在中國(guó)每一個(gè)網(wǎng)吧里面都有的GPU卡,但是因?yàn)檫@樣發(fā)生了一次非常大的變化。所以,算力重不重要?算力重要。但是在創(chuàng)新階段,大家知道,沒(méi)有比人的創(chuàng)造力再重要的事情。
技術(shù)變成基礎(chǔ)設(shè)施,就會(huì)對(duì)人類產(chǎn)生最長(zhǎng)遠(yuǎn)的影響
到了今天發(fā)生的變化,為什么要引出基礎(chǔ)設(shè)施呢?就是因?yàn)橐?guī)模。也就是說(shuō),當(dāng)數(shù)據(jù)、模型、算力的規(guī)模都變成了一個(gè)巨大的變化的時(shí)候,這個(gè)時(shí)候一定要引入新的東西,不然它沒(méi)法解決了。這個(gè)也是做IT、做程序設(shè)計(jì)看到這句話以后很激動(dòng)的,“一歲孩子爬行速度的千倍就是超音速噴氣機(jī)的速度”,E.Dijkstra結(jié)構(gòu)程序設(shè)計(jì)倡導(dǎo)者(Pascal講的)。也就是說(shuō),在世界上任何事情的規(guī)模增加了一千倍,它就會(huì)發(fā)生天翻地覆的變化。
大家都知道,在我剛才講的三個(gè)組合的規(guī)模上,在每一個(gè)單元都超過(guò)了一千倍。正是這一千倍,使得今天我們繞不開(kāi)一個(gè)最基本的東西,就是AI的基礎(chǔ)設(shè)施。大家知道,一旦有一個(gè)事情要談到基礎(chǔ)設(shè)施的時(shí)候,我覺(jué)得這是一個(gè)技術(shù)滲透的終結(jié)的形式。你看人類發(fā)展歷史上,任何技術(shù)的發(fā)展,什么技術(shù)會(huì)對(duì)人類產(chǎn)生最長(zhǎng)遠(yuǎn)的影響?就是它變成了基礎(chǔ)設(shè)施。當(dāng)然AI基礎(chǔ)設(shè)施不是我發(fā)明的,今天大家都在談的。所以,為什么從AI到AI+,到今天我們可以講AI基礎(chǔ)設(shè)施,是一個(gè)非常值得我們深思的。
這是紅杉在一次研討會(huì)上用的一個(gè)PPT,我拿過(guò)來(lái)了,拿過(guò)來(lái)的目的只是為了讓大家看最下面一行,在云時(shí)代、移動(dòng)時(shí)代、AI時(shí)代,他們覺(jué)得的基礎(chǔ)設(shè)施就是云計(jì)算。他把蘋果是劃到了基礎(chǔ)設(shè)施這一類的,同樣的大家可以看到在今天,他把英偉達(dá)也劃到了基礎(chǔ)設(shè)施那一類。所以,這是一個(gè)非常非常有意思的分類方法。這個(gè)也不奇怪,為什么英偉達(dá)大家都覺(jué)得他應(yīng)該去做云計(jì)算。
我看到這張PPT的時(shí)候也非常激動(dòng),這張圖不是我畫(huà)的,但是這個(gè)解釋是我解釋的。這是6個(gè)在美國(guó)做AI的獨(dú)角獸,大家看到背后對(duì)基礎(chǔ)設(shè)施的支持跟有意思,OpenAI大家都知道,它得到了100億美金的投資,背后是Microsoft,第二的背后是AWS。大家看到在這些企業(yè)真正背后的排名是什么?全世界排名第一、第二、第三、第五、第六的云計(jì)算服務(wù)商,都是今天美國(guó)獨(dú)角獸公司的背后支撐的來(lái)源。這里當(dāng)然大家看到很神奇的一件事情,在這里有第一、第二、第三、第五、第六,就是沒(méi)有第四,第四就是阿里云。這種基礎(chǔ)設(shè)施對(duì)將來(lái)這些事情的影響,從計(jì)算這個(gè)角度,也能看得出來(lái)。當(dāng)然我想從另外一個(gè)角度也反映了這個(gè)產(chǎn)業(yè)之間的差距到底在哪里。
所以,從這個(gè)角度讓我想起了一句話,微軟很不行,微軟也很行。也就是說(shuō)他在人工智能沒(méi)有做出Transformer這樣的東西,但是他因?yàn)樵?,因?yàn)檫@個(gè)基礎(chǔ)設(shè)施,他在跟Open AI創(chuàng)造出這么一個(gè)今天我們可以看到的東西出來(lái)的話,我自己覺(jué)得你從另外一個(gè)角度也可以看得出來(lái)好像微軟不行,但是微軟還是很行。
所以在AI、AI+、AI基礎(chǔ)設(shè)施這個(gè)邏輯上,所有人都是可以做他自己可以創(chuàng)造歷史的事情。我前幾天看到一個(gè)創(chuàng)業(yè)公司,為了證明他創(chuàng)業(yè)的重要性畫(huà)了一張圖,我相信今天老是講數(shù)據(jù)、講計(jì)算、講算法,但是大家設(shè)想一下,這些東西不在一個(gè)基礎(chǔ)設(shè)施里面,事實(shí)上是沒(méi)有價(jià)值的。所以,我把這個(gè)紅框里面畫(huà)出來(lái),很有意思的告訴大家,數(shù)據(jù)是基礎(chǔ)設(shè)施核心的組成部分,數(shù)據(jù)不只是一個(gè)模型的附屬品,數(shù)據(jù)也不只是一個(gè)計(jì)算的附屬品,只有所有這些東西變成一個(gè)完整的基礎(chǔ)設(shè)施的時(shí)候,我們才會(huì)有那一次更加激動(dòng)人心的創(chuàng)新。如果大家看最前面里面講到的事情,去做了兩個(gè)區(qū)分,在傳統(tǒng)的IT時(shí)代的云計(jì)算以及在AI時(shí)代的云計(jì)算,盡管這兩種計(jì)算有差別,但都是云計(jì)算。同樣的他數(shù)據(jù)也做了區(qū)分,在傳統(tǒng)意義上的數(shù)據(jù),跟在AI這個(gè)意義上的數(shù)據(jù),他是做了這么一個(gè)細(xì)微的區(qū)分的。時(shí)間原因具體不展開(kāi)講了。
AI、AI+、AI基礎(chǔ)設(shè)施,一起創(chuàng)造未來(lái)
最后總結(jié)一下,當(dāng)你看AI、AI+、AI基礎(chǔ)設(shè)施的時(shí)候,你就會(huì)發(fā)現(xiàn),這個(gè)世界不但技術(shù)在革命,機(jī)制也在革命,基礎(chǔ)設(shè)施也在革命。沒(méi)有比這三項(xiàng)革命在同一個(gè)時(shí)間發(fā)生再令人激動(dòng)了。所以,我想這些革命正在創(chuàng)造未來(lái)。謝謝大家。
【根據(jù)速記整理,標(biāo)題為編者所加】