商湯CEO徐立說,這是商湯長(zhǎng)線核心競(jìng)爭(zhēng)力的標(biāo)志、公司持續(xù)經(jīng)營(yíng)和更大規(guī)模躍遷的護(hù)城河,以及推動(dòng)AI時(shí)代生產(chǎn)要素降低的關(guān)鍵一步。
實(shí)際上,企業(yè)家一面的徐立對(duì)此還顯得克制,當(dāng)他科學(xué)家的那一面流露,會(huì)激動(dòng)得語速飛快:
靠人腦的方式可能永遠(yuǎn)趕不上宇宙膨脹的速度,如果要真正解開宇宙真理,輸入的依據(jù)就不能單靠此時(shí)此地此身的人類有限認(rèn)知,甚至不必追求當(dāng)下的過程可解釋,可以試著用更大的數(shù)據(jù),更強(qiáng)的算力,或許還會(huì)撞出更多預(yù)期之外的結(jié)果。
所以商湯的AI大裝置,你可以理解為GPT-3、AlphaFold路徑上的更大規(guī)模落地,是大數(shù)據(jù)、大模型和超強(qiáng)算力的三位一體實(shí)踐,也是input到output之間沿著“大致正確方向”的大力出奇跡。
商湯AI大裝置如何組成?
在上海臨港新片區(qū),一座宛如芯片的建筑群將在今年年底投入使用。
這是商湯全新的AI算力中心(AIDC),計(jì)算峰值速度將達(dá)到3740 Petaflops(1 petaflop等于每秒1千萬億次浮點(diǎn)運(yùn)算)——作為參照,OpenAI的千億參數(shù)模型GPT-3完整訓(xùn)練一次需要3.14E23次浮點(diǎn)運(yùn)算,而商湯臨港AIDC的算力僅在一天內(nèi)即可完成。
毫無疑問,商湯的這個(gè)全新AIDC,目標(biāo)就是為更大規(guī)模參數(shù)模型的訓(xùn)練而來。
但在商湯AI大裝置中,AIDC不到1/3又1/3。
商湯AI大裝置SenseCore的全貌,包含了三層:
三位一體,以基礎(chǔ)設(shè)施方式輸出模型,把AI能力輸出到企業(yè)服務(wù)、城市管理和個(gè)人生活等三大落地方向中。
區(qū)別于“AI模型”小作坊式的打造,AI大裝置更像流水線工廠,可以實(shí)現(xiàn)不同場(chǎng)景的算法模型的底層抽象,以模塊化平臺(tái)套件打造通用型服務(wù)平臺(tái)。
特別是針對(duì)AI落地中更長(zhǎng)尾的客戶和場(chǎng)景,能夠在組合不同算法套件的基礎(chǔ)上完成新場(chǎng)景的定制,以低邊際成本實(shí)現(xiàn)對(duì)新場(chǎng)景的規(guī)?;采w。
并且商湯基于AI平臺(tái)基礎(chǔ)設(shè)施的系統(tǒng)協(xié)同性,可以以半自動(dòng)化、自適應(yīng)的方式,就能實(shí)現(xiàn)批量的算法模型生產(chǎn)和迭代升級(jí)。
為什么商湯要搞AI大裝置?
商湯CEO徐立說,本質(zhì)是讓AI落地?cái)[脫人力密集的狀態(tài)。
他認(rèn)為AI之所以人力密集,是因?yàn)樯a(chǎn)效率不高,而生產(chǎn)效率提升的關(guān)鍵,是生產(chǎn)要素的成本能足夠低。
在AI落地初期階段,項(xiàng)目定制是行業(yè)最普遍的方式,比如做一個(gè)手機(jī)檢測(cè)的算法,需要上百人的團(tuán)隊(duì),但換一種場(chǎng)景的應(yīng)用模型,又得上百人進(jìn)來……
好比不同的場(chǎng)景里蓋樓,堆人是解決問題常用的方法。
但如果按照上述項(xiàng)目包工的方式搞,AI落地就會(huì)顯得天方夜譚。
商湯的模式不是秘密:“商湯驅(qū)動(dòng),賦能百業(yè)”,用“1(基礎(chǔ)研究)+1(產(chǎn)品及解決方案)+X(行業(yè))”的方式展開各行各業(yè)的落地。
據(jù)官方數(shù)據(jù),創(chuàng)辦6年來,商湯集結(jié)起一支2000人規(guī)模的研發(fā)團(tuán)隊(duì),推出了13000多個(gè)技術(shù)模型,以及17000多個(gè)商業(yè)模型。
所以規(guī)?;鄨?chǎng)景不同領(lǐng)域落地的過程中,就提出了通用模型的要求。
只是問題也隨之而來,模型越通用,訓(xùn)練數(shù)據(jù)就越大,模型參數(shù)也越大,對(duì)算力的要求也就越高。
在GPT-3一炮打響之前,對(duì)于這種大規(guī)模參數(shù)的通用模型,業(yè)內(nèi)外都存在質(zhì)疑。
因?yàn)橹暗?strong>共識(shí)是:越厲害的算法,參數(shù)和算力可以更少,提升模型精度才是正道。
而且這種“精妙”著稱的算法方向,意味著模型對(duì)于運(yùn)算和執(zhí)行的精準(zhǔn)部署,就像數(shù)學(xué)解題中,嚴(yán)絲合縫地過程推導(dǎo),最后精準(zhǔn)給出結(jié)果。
所需的“算力”,理應(yīng)越少越好。
要來一個(gè)暴力解題的方式:吃最多數(shù)據(jù),一通暴力計(jì)算,最后給出結(jié)果——即便是正確答案,也不被推崇。
商湯起步伊始,為手機(jī)、互聯(lián)網(wǎng)公司供應(yīng)AI方案,走的就是精妙模型的路線。
但隨著規(guī)?;瘮U(kuò)張,開始進(jìn)入To B行業(yè)和城市業(yè)務(wù)領(lǐng)域后,精妙技術(shù)模型在行業(yè)長(zhǎng)尾需求和應(yīng)用中的“短板”也就暴露出來。
比如在業(yè)務(wù)落地中,優(yōu)先選擇的自然是流量大、顯示度高、高頻,投入產(chǎn)出比高的頭部應(yīng)用。于是大家爭(zhēng)奪的就是像地鐵刷臉通行這樣的應(yīng)用。
而城市里防火、防水等應(yīng)用,頻次低,需要累積和投入的資源又一點(diǎn)不比頭部應(yīng)用少,雖然有剛需,但處于長(zhǎng)尾端,不受青睞。
最終,從需求方角度,如果不能在一個(gè)場(chǎng)景里解決包括長(zhǎng)尾在內(nèi)的問題,切換新方案、并為此買單的意愿就會(huì)降低。
所以從AI落地的商業(yè)化和價(jià)值閉環(huán)出發(fā),從需求端推動(dòng)來看,“眉毛頭發(fā)一把抓”,大參數(shù)模型也就變得自然而然。
此外,AI技術(shù)的演進(jìn)路線上,反共識(shí)的趨勢(shì)從更多維度顯現(xiàn)。
從AlexNet以來看過去十年AI模型的發(fā)展,每年最新的算法網(wǎng)絡(luò)、最好的技術(shù),對(duì)于算力的需求,幾乎是呈數(shù)量級(jí)的增長(zhǎng),每年都大概會(huì)有十倍的算力需求增長(zhǎng)。
徐立躬身其間,對(duì)這種趨勢(shì)的感知也非常明顯。
他認(rèn)為造成這種趨勢(shì)的原因其實(shí)很簡(jiǎn)單:表達(dá)越來越豐富,模型越來越通用,參數(shù)也就越來越多,算力要求也就越高。
行業(yè)整體而言,最領(lǐng)先的算法對(duì)于算力的需求翻了近百萬倍。
其次,技術(shù)本身的演進(jìn)。
原先的技術(shù)路線朝著單一方向、單一路線前進(jìn)。通用AI看起來可望不可及,然而過去幾年在通用問題的剛需驅(qū)動(dòng)下,一些通用語言模型、通用視覺模型,甚至通用多模態(tài)模型開始取得突破,曾經(jīng)不work的正在變成可能。
商湯CEO坦承,通用模型的打造確實(shí)花費(fèi)了大力氣,但好處是在長(zhǎng)尾問題解決上效果顯著。
伴隨而來的挑戰(zhàn),是對(duì)新一波以算力為核心的AI基礎(chǔ)設(shè)施的渴求。
“就好像在物理探索中,如果沒有粒子對(duì)撞機(jī),很多核心工作沒法展開?!?/p>
徐立強(qiáng)調(diào),商湯在AI規(guī)?;涞氐拇蟪崩?,必須到了解決通用模型挑戰(zhàn)、必須有集中化大規(guī)模算力的時(shí)候。
他回溯稱,2016年、2017年開始,商湯就開始了大參數(shù)模型的挑戰(zhàn),SenseNet被做到了1000多層。
隨著模型網(wǎng)絡(luò)越深、參數(shù)越大,算力的問題變得突出。
于是2018年開始,商湯開始更加嚴(yán)肅地審視芯片、硬件,并在自建算力中心的基礎(chǔ)上,完成了大裝置的“原型機(jī)”打造。
其后,投資56億的AIDC智算中心開工,2021年底交付。
當(dāng)然,過程中還發(fā)生了兩件AI領(lǐng)域的最大新突破,給商湯上下吃下定心丸。
一件發(fā)生在2019年,OpenAI開始大參數(shù)模型打造,并在2020年以GPT-3轟動(dòng)全球。
另一件則是DeepMind的AlphaFold 2。
在徐立看來,兩大不同方向的進(jìn)展,背后其實(shí)有同一個(gè)核心路徑:
輸出方向大致可確定,輸入更大的數(shù)據(jù),“撞”出結(jié)果。
而商湯的AI大裝置,不正是這種核心路徑的實(shí)踐機(jī)器、基礎(chǔ)設(shè)施,AI領(lǐng)域的粒子對(duì)撞機(jī)嗎?
AI大裝置有什么用?
自然是可以打造大參數(shù)模型。
首先可以解決AI落地中的長(zhǎng)尾問題。
比如在城市的日常治理中,把“城管”的工作場(chǎng)景,實(shí)現(xiàn)全AI流程覆蓋。
無論是暴露垃圾的問題,共享單車亂堆亂放的問題,還是疫情、火災(zāi)、汛情、人群擁擠踩踏、危化品泄露……等等公共場(chǎng)景中的各類問題,不管高頻還是低頻,都能實(shí)現(xiàn)一站式解決。
從發(fā)現(xiàn)、報(bào)警、執(zhí)行到結(jié)案,全流程都可以實(shí)現(xiàn)AI化,用人機(jī)交互的方式實(shí)現(xiàn)更加高效的城市治理。
而且這不是設(shè)想,是商湯用AI大裝置原型機(jī),在上海一網(wǎng)統(tǒng)管項(xiàng)目中落地的現(xiàn)實(shí)。
其次,大參數(shù)模型的打造,還是批量打造的那種。
按商業(yè)場(chǎng)景分,大的如城市、汽車、工業(yè),小的像螺絲螺帽、冰箱內(nèi)物品識(shí)別……
按技術(shù)場(chǎng)景分,視覺領(lǐng)域、語言領(lǐng)域、自動(dòng)駕駛領(lǐng)域、醫(yī)療領(lǐng)域、制藥領(lǐng)域……
每一個(gè)領(lǐng)域,是不是都可以足夠多的數(shù)據(jù)輸入,然后用大裝置對(duì)撞生成結(jié)果?
比如在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方向,之前即便用AI的方法,也需要既有非常懂生物的專家,還得非常懂AI的專家協(xié)作……雙方精心設(shè)計(jì)流程,精心準(zhǔn)備輸入數(shù)據(jù),最后才有可能得到正確的結(jié)果?
大裝置會(huì)有什么不同?
知道大致正確的方向和目標(biāo),就是預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),但不用精心準(zhǔn)備輸入數(shù)據(jù)和流程,甚至可以群策群力,把所有可能相關(guān)的數(shù)據(jù)都輸入,最后“大裝置”窮盡所有可能性,同樣解出正確的結(jié)果。
所以沿著這個(gè)層面展開,AI大裝置意味著落地門檻的降低。
從AI展開行業(yè)落地那一天開始,主導(dǎo)權(quán)到底是歸屬AI博士們,還是傳統(tǒng)行業(yè)老兵的話題,討論從未有過間斷,也從未有過共識(shí)。
最具參考的一種答案是既要也要,強(qiáng)調(diào)融合共生。
然而如果需要融合,那落地的規(guī)模和速度自然就會(huì)大受局限,畢竟懂AI、掌握AI能力的人,相比傳統(tǒng)行業(yè)人才,實(shí)在九牛一毛。
而作為基礎(chǔ)設(shè)施,AI大裝置在本質(zhì)路徑上,把AI能力變成了一個(gè)輸入→輸出的機(jī)器和工具。
運(yùn)用這個(gè)工具的,可以來自任何行業(yè)和領(lǐng)域。
只要有數(shù)據(jù)思維,定義清楚目標(biāo)方向,懂得找可能的數(shù)據(jù),然后大裝置就跟“相機(jī)”、“電腦”沒有本質(zhì)不同,都是工具。
所以徐立說,這就是為什么商湯把AI教育作為重要業(yè)務(wù)組成的原因。
“現(xiàn)在的教育告訴年輕人,需要每一步嚴(yán)格推導(dǎo)產(chǎn)生正確結(jié)果才能給分,但未來可能也有一種得出正確結(jié)果的方法,不需要你掌握推導(dǎo)過程?!?/p>
用好你需要的數(shù)據(jù),知道如何操作和使用,然后把數(shù)據(jù)放入“裝置”,一樣能解題。
這也是為什么會(huì)有一種觀點(diǎn)認(rèn)為:下一個(gè)柯潔李世石一樣的圍棋高手,不一定要學(xué)圍棋。
實(shí)際上,這種思維下,教育方法確實(shí)值得被重新審視。
畢竟現(xiàn)如今我們稱贊的“計(jì)算天才”,不是口算、心算最厲害的那類人,而是最懂得如何利用計(jì)算機(jī)工具的人。
當(dāng)然,如果沿著“AI大裝置”的思路,擴(kuò)展到更宏觀的“認(rèn)識(shí)世界”,人類對(duì)于規(guī)律的發(fā)現(xiàn)和認(rèn)知,是否也會(huì)被刷新?
人類對(duì)于世界的認(rèn)識(shí)和改造,究竟是一種怎樣的模式?
亞里士多德提倡演繹,這是一種強(qiáng)調(diào)因果的強(qiáng)推導(dǎo),是一種線性的演進(jìn)和發(fā)展。
但另一種模式,牛頓的時(shí)代、愛因斯坦的時(shí)代,展現(xiàn)的卻是躍遷式進(jìn)步。
他們帶來的基礎(chǔ)理論突破,當(dāng)時(shí)甚至只是一種“假設(shè)”,是在其后一代甚至幾代天才歸因中,才完成過程論證。
只是歷史車輪相似的是,每一次基礎(chǔ)理論的突破,都帶來一波更有力量的發(fā)明創(chuàng)造和更高級(jí)的文明。
徐立把這種天才推動(dòng)的文明躍遷,笑稱為“上帝拍腦袋”。
不過更令他著迷的是,接下來是不是可以由大裝置來拍?
回顧過去,人類的科學(xué)探索都是基于已知認(rèn)知推未知,毫無疑問就會(huì)受限于“已知認(rèn)知”,更何況人類歷史上不少重要的發(fā)明和發(fā)現(xiàn),還是“無心插柳”的結(jié)果。
但AI大裝置提供的新范式,提供了另一種路徑:
探索未知,可以不依賴于人類已經(jīng)理解的輸入來作為輸入,可以嘗試把更大更多的數(shù)據(jù)放進(jìn)來,搞不好就能找出更趨近本質(zhì)的規(guī)律。
而AI最終極的工具能力,不正是幫助人類發(fā)現(xiàn)、找出更多,更終極的規(guī)律和真理嗎?
刷新商湯
最后,在AI大裝置浮出水面之際,也是時(shí)候重新審視商湯。
商湯是一家什么樣的公司?
創(chuàng)辦6年來,它備受矚目,但又面目“模糊”。
商湯時(shí)常被談?wù)撍囊?guī)模增速和融資估值,也始終被熱議“AI賦能百業(yè)”的可能性和可行性。
更因?yàn)槠渎涞仡I(lǐng)域廣泛,技術(shù)和產(chǎn)品不直接To C,又容易在輿論認(rèn)知中被盲人摸象。
但現(xiàn)如今,最新集大成成果AI大裝置建立完成,商湯的歸去來都得到了最好的連點(diǎn)成線,商湯的核心和邊界、商湯的護(hù)城河、商湯從技術(shù)到商業(yè)的可持續(xù),以及商湯將會(huì)帶來的AI變革,都能在AI大裝置得到完整解答。
在AI大裝置的思路之下,商湯把聚集的AI博士之力,架構(gòu)成了不需要AI博士才能使用的AI工具,并且可以在各個(gè)領(lǐng)域都實(shí)現(xiàn)輸出和賦能。
就像電被發(fā)現(xiàn)后,發(fā)電機(jī)和發(fā)電廠所承擔(dān)的角色一樣。
徐立透露,2018年開始大膽設(shè)想時(shí),這種發(fā)展路線甚至是反共識(shí)的,但商湯內(nèi)部還是頂住壓力,做重做深,碰硬件碰底層,然后一搞就是3年。
這有點(diǎn)像黎明前的登山,知道在向上走,卻不知道是否是登頂?shù)恼_道路。
好在OpenAI的GPT-3、DeepMind的AlphaFold,以及越來越多業(yè)內(nèi)巨頭玩家拿出的超大參數(shù)模型,不同維度驗(yàn)證了這確實(shí)是一條通向未來的路。
徐立還透露,按照內(nèi)部規(guī)劃,硬件成本投入56億起的AI大裝置,在開起運(yùn)行的2年后就能回本,到2025年就會(huì)進(jìn)入盈利軌道。
這是商湯面向未來的長(zhǎng)線核心競(jìng)爭(zhēng)力,而建立這種長(zhǎng)線競(jìng)爭(zhēng)力的時(shí)間周期,則構(gòu)成壁壘和護(hù)城河。
更重要的是,AI大裝置啟動(dòng),AI賦能的門檻進(jìn)一步降低,整個(gè)數(shù)字化和智能化的進(jìn)程,就會(huì)進(jìn)一步被加速。
商湯當(dāng)前的北京辦公室所在地,理想國(guó)際大廈,是上一代原創(chuàng)技術(shù)公司百度,從技術(shù)創(chuàng)新到商業(yè)創(chuàng)新的“福地”。
徐立也喜歡用搜索引擎來類比“AI大裝置”會(huì)給商湯、給AI行業(yè)帶來的變革。
他認(rèn)為今天互聯(lián)網(wǎng)的繁榮,是因?yàn)樗阉饕娉晒Φ匕研畔ⅰ哳l的、低頻的、高價(jià)值的、長(zhǎng)尾的,在虛擬空間實(shí)現(xiàn)了鏈接。
而現(xiàn)實(shí)世界,始終缺少一樣的“搜索引擎”。
因?yàn)楝F(xiàn)實(shí)世界中很多東西還無法結(jié)構(gòu)化的、可解析。但AI大裝置如果成功,就能加速這種真實(shí)世界的結(jié)構(gòu)化、數(shù)字化。
順理成章,互聯(lián)網(wǎng)發(fā)展中兩大核心技術(shù)——搜索和推薦,也就能在現(xiàn)實(shí)世界得到復(fù)刻和應(yīng)用。
并且相比互聯(lián)網(wǎng)經(jīng)濟(jì)創(chuàng)造的價(jià)值,人類更大一部分的經(jīng)濟(jì)活動(dòng)和創(chuàng)造,原本就在線下。
所以徐立堅(jiān)信,AI正在進(jìn)入下一個(gè)時(shí)間點(diǎn),一個(gè)從技術(shù)創(chuàng)新周期轉(zhuǎn)入商業(yè)創(chuàng)新周期的時(shí)間點(diǎn)。
“搜索引擎起來的時(shí)候,有圍繞搜索引擎創(chuàng)業(yè)的生態(tài);視頻平臺(tái)起來的時(shí)候,有圍繞視頻平臺(tái)展開的商業(yè)生態(tài)?!?/p>
這位商湯聯(lián)合創(chuàng)始人說,很多人問他,AI創(chuàng)業(yè)是不是過時(shí)了?
他的回答是:
恰恰是正當(dāng)其時(shí)的時(shí)候。