以下內(nèi)容是此次直播內(nèi)容的提煉:
關(guān)鍵詞
姚欣 PPTV PPIO 分布式云 算力資源 AI算力 AI推理 互聯(lián)網(wǎng) 智算云 數(shù)據(jù)中心 公有云 大模型 GPU 計算中心 算力調(diào)度 云計算 生命周期 技術(shù)壁壘
摘要
成立于2018年的PPIO派歐云,專注打造分布式云服務,旨在整合分散的算力資源,為人工智能、音視頻、元宇宙等新一代場景,以更低成本提供更快速、更靈活的一站式算力、模型及邊緣計算服務。
姚欣分享了從首次創(chuàng)業(yè)到二次創(chuàng)業(yè)的心路歷程,強調(diào)算力產(chǎn)業(yè)的快速發(fā)展、面臨的挑戰(zhàn)及巨大機遇。
當前,云計算市場需求與供給的不匹配,以及AI大模型驅(qū)動下的算力需求快速增長,顯示出算力行業(yè)正面臨新的挑戰(zhàn)與機遇。
姚欣指出,未來推理算力將超越訓練算力成為重點。PPIO派歐云致力于通過持續(xù)的技術(shù)創(chuàng)新,提供高效經(jīng)濟的算力解決方案。
觀點
PPTV網(wǎng)絡電視依托P2P技術(shù),曾是中國最大的視頻網(wǎng)絡之一。隨后,姚欣在2018年創(chuàng)立PPIO,專注于分布式云服務,利用碎片化和閑置算力資源,構(gòu)建了全國性的分布式云計算網(wǎng)絡,目前已在中國建立3700個算力節(jié)點。隨著AI技術(shù)發(fā)展,特別是大規(guī)模AI推理需求增加,PPIO進軍AI算力行業(yè),提供分布式的推理算力服務。
姚欣回顧了云計算和算力建設的發(fā)展,指出早期互聯(lián)網(wǎng)企業(yè)傾向于自建數(shù)據(jù)中心,但隨著技術(shù)進步,公有云成為更經(jīng)濟的解決方案。他強調(diào),當前智算行業(yè)處于早期發(fā)展階段,面臨資源浪費、重復建設等挑戰(zhàn),需要優(yōu)化算力使用效率,推動算力資源的整合和共享,特別是在AI推理領域。
姚欣指出,算力的快速發(fā)展得益于大模型和AI技術(shù)的推動,自己從使用者變?yōu)楣┙o者,這使得他能更好地洞察云計算市場,尤其是算力供需匹配方面的挑戰(zhàn)。PPIO作為分布式云的定位,旨在解決市場上的調(diào)度、資源利用率和成本問題,通過應用反哺供給側(cè)的“飛輪效應”來推動市場發(fā)展。
問答回顧
主持人:您對于當前算力市場的發(fā)展觀察是什么?
姚欣:算力話題并非新事物,其發(fā)展與云計算緊密相連。過去十年間,從大家開始接觸、接受并上云,到最近三年GPU為主的智算云發(fā)展,這兩大發(fā)展過程有相似之處。早期企業(yè)傾向于自建數(shù)據(jù)中心,但隨著技術(shù)和市場的發(fā)展,大家逐漸認識到使用公有云服務的優(yōu)勢。如今,智算業(yè)務正處在早期數(shù)據(jù)中心建設階段,預計未來會面臨資源浪費問題,需要整合碎片化算力資源以提高效率。
主持人:您如何看待目前算力行業(yè)供需匹配的問題?
姚欣:當前算力行業(yè)供需失衡的現(xiàn)象明顯,部分小型數(shù)據(jù)中心因缺乏規(guī)?;寐什桓撸霈F(xiàn)閑置和供大于求的情況。從長期看,無論是互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、云計算還是AI應用及其基礎設施,都經(jīng)歷過周期性的供需不匹配階段,半導體元器件如服務器、GPU等底層硬件也會經(jīng)歷供大于求和供小于求的周期性波動。因此,作為算力行業(yè),在面對短期市場波動時要有清醒的認識,同時也要看到長期來看,隨著最終需求的持續(xù)增長,算力行業(yè)仍有很大價值和發(fā)展空間。
主持人:與云計算相比,智算有哪些相同和不同的地方?
姚欣:相同之處在于兩者都對電力的需求較高,不同之處在于智算對電力的單位密度需求更高。在當前智算中心中,電費成本可能占到運營總成本的一半左右,而在云計算時代,電費僅占20%左右。此外,電力的價格在中國不同城市和地區(qū)間存在巨大差異,這種價差在智算時代對GPU算力價格的影響變得非常顯著。
主持人:智算時代數(shù)據(jù)中心面臨的挑戰(zhàn)有哪些?
姚欣:智算時代數(shù)據(jù)中心面臨的挑戰(zhàn)主要有三個:一是面臨重復建設的問題,各個企業(yè)都在建立數(shù)據(jù)中心,未來需要整合利用;二是能源價格的波動,需要進行算力調(diào)度以降低成本;三是如何延長GPU等計算設備的生命周期,實現(xiàn)其在不同任務如訓練、推理等方面的高效利用,類似動力電池的梯次利用。
主持人:您為什么選擇分布式云這個賽道,并如何打造差異化競爭力?
姚欣:選擇分布式云賽道的原因是看中云計算作為天花板足夠高的萬億級大行業(yè),且增長持續(xù)。同時,在市場格局已經(jīng)形成的背景下,尋找一條與眾不同的獨特路徑,借鑒共享經(jīng)濟(如airbnb)的模式創(chuàng)新,整合閑置的算力和IDC資源,為客戶提供新穎的服務模式,從而實現(xiàn)差異化競爭。
主持人:在2018年,中國建設了大量機房和機柜,但平均使用率卻只有40%,存在大量閑置資源,能否詳細說明一下這個問題以及背后的多種原因?
姚欣:當時全中國在一年內(nèi)建設了300萬個機柜,但第二年的平均使用率僅為40%,這意味著超過一半的機柜空間被浪費了。造成這一現(xiàn)象的原因有多方面:一是部分機房建在偏遠地區(qū),無法有效利用;二是有些機房建得較小,只能容納較少的服務器設備;三是由于銷售策略的問題,一些供應商在面對最小采購單位要求十個機柜起購時,導致剩余的少量機柜難以出售,造成資源碎片化和閑置。
主持人:PPIO采取了什么創(chuàng)新方式來應對云計算資源利用率問題?
姚欣:PPIO通過整合現(xiàn)有閑置資源,采用類似airbnb的整合模式來進行云計算創(chuàng)新的機會,無需額外投資建設新資產(chǎn)。我們致力于解決找到閑置機房資源和調(diào)度使用這些碎片化資源的技術(shù)挑戰(zhàn),以提高整體資源利用率。
主持人:PPIO是如何從早期集中式小集群向分布式的節(jié)點資源能力轉(zhuǎn)變的?
姚欣:PPIO通過一系列推演發(fā)現(xiàn),隨著用戶規(guī)模的增長,集中式小集群無法滿足大規(guī)模分布式計算的需求。因此,逐步將產(chǎn)品演變?yōu)橹С职偃f和千萬級別用戶訪問的分布式節(jié)點資源架構(gòu),最終推出派歐算力云產(chǎn)品,集成大模型API、serverless和推理加速引擎等技術(shù),以更高的性價比降低AI應用成本,簡化搭建過程。
主持人:PPIO為何會選擇進入這個領域,以及在這一領域的競爭優(yōu)勢是什么?
姚欣:PPIO憑借其在管理用戶側(cè)千家萬戶電腦應用服務的經(jīng)驗,能夠有效管理機房和機柜資源。盡管2018年我們才開始創(chuàng)業(yè)并逐步發(fā)展商業(yè)化,但是利用已有的技術(shù)能力和團隊,整合碎片化機房資源相對容易。特別是在疫情期間音視頻需求激增的背景下,團隊整合資源的能力得到了驗證。
主持人:PPIO如何定位自己在云計算中的角色,并針對資源調(diào)度、利用率提升和成本問題推出的產(chǎn)品或服務有哪些?
姚欣:PPIO扮演著承上啟下的角色,致力于提升算力資源的調(diào)度效率和利用率,降低使用成本。我們推出的PPIO產(chǎn)品和服務就是針對解決當前云計算中的調(diào)度問題、資源利用率問題以及成本問題,通過提供高彈性、低成本且方便使用的大型推理服務,以應對未來AI應用普及帶來的挑戰(zhàn)。
主持人:PPIO是否考慮了從需求側(cè)出發(fā),預測未來市場發(fā)展需求來構(gòu)建基礎設施?
姚欣:PPIO從需求側(cè)出發(fā),預判未來幾年市場對計算需求的增長趨勢,比如人工智能、5G、數(shù)字人、云游戲等領域的興起。算力供給問題與應用場景落地問題應結(jié)合考慮,從而提供相應的基礎設施,如分布式節(jié)點資源能力,以滿足大規(guī)模分布式計算的需求,并確保服務的安全穩(wěn)定性。
主持人:對于模型的應用廠商和使用者,如何通過一個平臺實現(xiàn)GPU資源的彈性使用?
姚欣:我們擁有一個統(tǒng)一的算力平臺,用戶可以將模型加載上去,根據(jù)需求在全國各地彈性和按需使用GPU資源。這種模式下,用戶只需為實際使用的資源付費,不再需要預先占用資源,相比目前的AI計算裸金屬時代按月或按小時租用的方式更為靈活經(jīng)濟。
主持人:PPIO如何解決大規(guī)模應用推理的問題,并推出了哪些方案?
姚欣:我們推出了一種基于服務的分布式GPU網(wǎng)絡,當大規(guī)模應用需要更多資源時,系統(tǒng)會自動調(diào)配更多GPU和服務器以滿足十萬、百萬甚至上億級用戶的訪問需求。這一方案幫助大規(guī)模應用推理更方便落地。
主持人:大模型技術(shù)對云市場和算力市場產(chǎn)生怎樣的影響?
姚欣:我認為在未來兩年內(nèi),AI應用將迎來爆發(fā)期,類似于2012年移動互聯(lián)網(wǎng)出現(xiàn)拐點的情況。目前大模型推理成本已下降超過十倍,預計在未來兩年內(nèi)仍將持續(xù)下降。當推理成本降低到一定閾值時,將帶來從量變到質(zhì)變的重大機會,就像當年P(guān)PTV通過降低成本推動視頻行業(yè)劇增一樣,AI推理應用也將在免費時代經(jīng)歷用戶量級的劇增,從而顯著擴大整個算力市場的規(guī)模。
主持人:成本下降對于當前算力行業(yè)意味著什么?
姚欣:隨著AI應用成本的大幅下降,行業(yè)從業(yè)者的盤子將會擴大上千倍甚至上萬倍,這是值得大家高興的。在規(guī)劃架構(gòu)和提供服務時,應重視從訓練需求轉(zhuǎn)向推理需求的變化,因為推理需求的增長將遠大于訓練需求。
主持人:您為何出售PPTV?
姚欣:出售PPTV是出于追尋內(nèi)心的聲音,盡管PPTV取得了成功并改變了人們的生活,但我始終懷揣著用技術(shù)改變生活的夢想,希望能夠開創(chuàng)出具有時代意義、能夠被寫進計算機教科書的技術(shù)。最終我選擇賣掉并創(chuàng)建了PPIO,成立一家具有底層技術(shù)創(chuàng)新并走向全球的科技公司。
主持人:AI行業(yè)是否存在泡沫?
姚欣:AI行業(yè)確實存在泡沫現(xiàn)象,每個行業(yè)在高速發(fā)展初期都會有早期泡沫階段。目前的AI行業(yè)正處在泡沫破滅的過程中,例如大模型領域的泡沫正在逐漸破裂,這反而意味著模型之上應用生態(tài)開始起步。隨著模型發(fā)布速度放緩,開發(fā)成本降低,模型的穩(wěn)定性和迭代速度的變化有利于應用開發(fā),所以大模型領域的泡沫正在破滅,但模型應用層面可能正形成新的泡沫。
主持人:算力共享經(jīng)濟模式是否可行?
姚欣:算力共享經(jīng)濟模式已經(jīng)存在且是必然趨勢。如同airbnb等共享經(jīng)濟模式整合利用閑置資源,PPIO也在運營模式中整合匯聚各類算力資源,實現(xiàn)算力的共享經(jīng)濟。
主持人:PPIO有哪些合作伙伴?
姚欣:PPIO擁有眾多合作伙伴,包括上游的算力合作伙伴,他們幫助整合和尋找閑置算力資源;以及與擁抱開源的大模型企業(yè)緊密合作,通過開源模型進行針對性優(yōu)化,以適應不同類型的異構(gòu)算力資源,共同推動整個行業(yè)資源利用率的提升。
主持人:對于未來市場發(fā)展有何展望?
姚欣:預計2025年將是一個轉(zhuǎn)折點,推理算力將超越訓練算力,推動這一變化的動力來自多模態(tài)應用需求的增長,尤其是音頻和視頻化趨勢的推進。同時,從2023年開始,信息相關(guān)行業(yè)將經(jīng)歷十倍降本的連續(xù)過程,預計到2025年,市場將看到日活躍用戶過千萬甚至月活躍用戶達到億級別的應用誕生和發(fā)展。對于算力建設方來說,需要及時調(diào)整建設策略以應對可能出現(xiàn)的資源閑置問題,抓住機遇迎接行業(yè)變化。