文字編輯|李祥敬

1

云計算大模型調(diào)用服務(wù)市場現(xiàn)狀

從市場份額分布來看,當前呈現(xiàn)出“一超多強”的格局。火山引擎以46.4%的市場份額位居首位,百度智能云、阿里云緊隨其后,而騰訊云、中國移動、天翼云等公有云廠商整體占據(jù)15%的市場份額。從大模型模態(tài)角度出發(fā),目前大語言模型、文本類能力的調(diào)用量占主導地位。不過自2024年第四季度起,語音類模型調(diào)用量已開始呈現(xiàn)增長態(tài)勢,預(yù)計在2025年,圖像、視頻類大模型的調(diào)用量也將逐步興起,這表明市場對于大模型的應(yīng)用需求正朝著多元化方向發(fā)展。自2024年下半年開始,隨著云廠商大模型能力的快速提升以及模型調(diào)用降價策略的實施,MaaS平臺大模型調(diào)用量開始迅速增長。調(diào)用量從2024年中期的月度日均963億Tokens,急劇發(fā)展到2024年12月整體市場調(diào)用量日均達到9522億Tokens,進入2025年,在DeepSeek以及Manus類產(chǎn)品的影響下,大模型日均調(diào)用量繼續(xù)保持高速增長的趨勢。

2

企業(yè)通過公有云進行大模型調(diào)用的優(yōu)勢

相較于私有部署,企業(yè)選擇通過公有云進行大模型調(diào)用具有諸多顯著優(yōu)勢。在成本方面,公有云憑借技術(shù)紅利和規(guī)模效應(yīng),為企業(yè)帶來了巨大的成本優(yōu)勢。例如阿里云,其基于自研的異構(gòu)芯片互聯(lián)、高性能網(wǎng)絡(luò)HPN7.0、高性能存儲CPFS、人工智能平臺PAI等核心技術(shù)和產(chǎn)品,構(gòu)建了極致彈性的AI算力調(diào)度系統(tǒng),并結(jié)合百煉分布式推理加速引擎,大幅壓縮了模型推理成本。企業(yè)無需自行投入大量資金購置硬件設(shè)備以及搭建復雜的軟件系統(tǒng),只需按需付費使用公有云上的大模型服務(wù),便能獲得強大的計算能力,這對于中小企業(yè)來說,極大地降低了技術(shù)應(yīng)用門檻和前期投入成本。在數(shù)據(jù)安全與隔離方面,公有云能夠為企業(yè)提供有力保障。以阿里云為例,可為每個企業(yè)提供專屬VPC環(huán)境,實現(xiàn)計算隔離、存儲隔離、網(wǎng)絡(luò)隔離以及數(shù)據(jù)加密,充分確保數(shù)據(jù)安全,并且阿里云已主導或深度參與10多項大模型安全相關(guān)國際國內(nèi)技術(shù)標準的制定。企業(yè)將數(shù)據(jù)交由這樣的公有云平臺處理,在享受大模型服務(wù)的同時,無需過度擔憂數(shù)據(jù)泄露等安全問題。此外,公有云廠商具有天然的開放性,能為企業(yè)提供豐富多樣的模型和完善的工具鏈。阿里云百煉平臺上匯聚了通義、百川、ChatGLM、Llama系列等上百款國內(nèi)外優(yōu)質(zhì)模型,內(nèi)置大模型定制與應(yīng)用開發(fā)工具鏈,企業(yè)開發(fā)者可以便捷地測試比較不同模型,開發(fā)專屬大模型,并輕松搭建RAG等應(yīng)用,從選模型、調(diào)模型、搭應(yīng)用到對外服務(wù),一站式即可搞定,大大提高了企業(yè)開發(fā)和應(yīng)用大模型的效率。

3

公有云上大模型調(diào)用量對評估企業(yè)格局的參考價值

公有云上大模型調(diào)用量是評估大模型市場企業(yè)格局的關(guān)鍵參考指標之一。調(diào)用量在很大程度上反映了企業(yè)所提供大模型服務(wù)的受歡迎程度與市場認可度?;鹕揭嬷阅苷紦?jù)46.4%的市場份額,正是因為其大模型服務(wù)獲得了眾多企業(yè)的青睞,大量企業(yè)頻繁調(diào)用其服務(wù),足以證明其在模型性能、價格、易用性等方面具有突出優(yōu)勢。通過分析不同企業(yè)在各類大模型模態(tài)上的調(diào)用量占比,能夠洞察企業(yè)在不同技術(shù)領(lǐng)域的優(yōu)勢與發(fā)展?jié)摿?。如果某企業(yè)在圖像類大模型調(diào)用量方面占據(jù)較大份額,說明該企業(yè)在圖像識別、處理等相關(guān)技術(shù)和應(yīng)用場景方面具有較強的實力和深入的布局。而且,大模型調(diào)用量的變化趨勢也能反映企業(yè)的市場競爭力變化。當某企業(yè)的大模型調(diào)用量持續(xù)增長,表明其在不斷優(yōu)化服務(wù)、拓展客戶群體,市場競爭力日益增強;反之,若調(diào)用量出現(xiàn)下滑,則可能意味著企業(yè)在某些方面需要改進,以適應(yīng)市場的動態(tài)變化。IDC中國研究總監(jiān)盧言霞指出,在大模型開源開放浪潮不斷高漲、模型選擇豐富而又復雜的當下,高性價比、靈活易用、開發(fā)工具鏈完善、安全可信的大模型服務(wù)平臺對于企業(yè)快速上手并落地大模型至關(guān)重要。

4

火山引擎在大模型方面的優(yōu)勢

火山引擎作為字節(jié)跳動旗下云和AI服務(wù)平臺,在大模型方面展現(xiàn)出了獨特而顯著的優(yōu)勢。在模型自身實力上,其搭載的豆包大模型包含大語言模型、語音大模型、視覺大模型等豐富的垂類模型,適配企業(yè)多種業(yè)務(wù)場景。通過字節(jié)內(nèi)部50多個業(yè)務(wù)場景實踐驗證,每日數(shù)萬億Tokens大使用量持續(xù)打磨,并且在智源等權(quán)威機構(gòu)測評結(jié)果中,豆包大模型最新模型效果國內(nèi)領(lǐng)先;在知識、代碼、推理、中文等多個國際權(quán)威測評基準上的自主測評中,也獲得最佳成績,這充分證明了其模型的高質(zhì)量和強大性能?;鹕揭鏋槠髽I(yè)提供從底層算力到上層應(yīng)用的全棧AI服務(wù)。除了提供豆包大模型全模態(tài)模型家族,在平臺方面,火山方舟能夠?qū)Χ拱竽P?、Deepseek-V3、DeepSeek-R1等34個大模型進行調(diào)用,提供模型精調(diào)、推理、評測等全方位功能與服務(wù),并通過HiAgent、扣子等AI應(yīng)用開發(fā)平臺,支持企業(yè)靈活開發(fā)行業(yè)垂直智能體應(yīng)用。在基礎(chǔ)設(shè)施層面,2024冬季FORCE原動力大會上,火山引擎正式提出計算范式將從云原生進入到AI云原生的新時代,并為客戶提供以GPU為核心的AI云原生基礎(chǔ)設(shè)施。火山引擎提供以AI云原生為理念的云基礎(chǔ)設(shè)施服務(wù),包括新一代的火山引擎GPU實例、vRDMA網(wǎng)絡(luò)連接、EIC彈性極速緩存、PCC私密云服務(wù)等。在性能方面,豐富機型支持不同版本的模型部署,提供高速互聯(lián)帶寬,全棧系統(tǒng)化推理優(yōu)化,具備模型調(diào)優(yōu)和一站式定制能力;性價比上,得益于與字節(jié)跳動國內(nèi)業(yè)務(wù)并池的規(guī)模優(yōu)勢,可實現(xiàn)同款配置價格最優(yōu);穩(wěn)定性強,觀測全面、檢測手段豐富、修復效率高;安全性好,自研防火墻可提升算力可用性、降低數(shù)據(jù)泄露風險、減少回復不準確情況、保障內(nèi)容合規(guī),為企業(yè)提供了堅實可靠的運行環(huán)境。在服務(wù)支持方面,火山引擎始終堅持定制化服務(wù)方案,架構(gòu)師1V1量身定制契合業(yè)務(wù)需求的高性價比服務(wù)方案;提供7乘24小時全天候人工客服,多渠道覆蓋支持客戶各種類型的業(yè)務(wù)訴求,飛書值班號提供快捷、全面的響應(yīng)支持;甄選100%通過火山引擎技術(shù)考核的服務(wù)工程師,做到技術(shù)有支持,服務(wù)有溫度,問題有響應(yīng),落地有閉環(huán),為企業(yè)客戶提供了全方位、貼心的服務(wù)保障。面對AI應(yīng)用的快速爆發(fā),火山引擎近日宣布,將大模型應(yīng)用開源,正式上線“大模型應(yīng)用實驗室”平臺,開源手機助手、DeepResearch等眾多高頻AI應(yīng)用,以“易集成、易落地、更開放”的方式幫助千行百業(yè)快速落地AI應(yīng)用。

5

未來云端大模型服務(wù)調(diào)用的發(fā)展趨勢

未來,云端大模型服務(wù)調(diào)用將朝著更加多元化、智能化和安全化的方向發(fā)展。隨著技術(shù)的不斷進步,大模型模態(tài)將進一步豐富,除了當前的語言、語音、圖像、視頻類模型外,可能會涌現(xiàn)出更多融合多種模態(tài)的綜合性模型,以滿足企業(yè)更加復雜和多樣化的業(yè)務(wù)需求。例如,騰訊云推出的視頻創(chuàng)作引擎已支持復雜舞蹈編排算法,而天翼云在政務(wù)領(lǐng)域部署的DeepSeek-R1大模型也展示了多模態(tài)能力的實際應(yīng)用。在應(yīng)用場景方面,大模型將更加深入地滲透到各個行業(yè)的細分領(lǐng)域,如醫(yī)療領(lǐng)域的智能診斷、教育領(lǐng)域的個性化學習輔導、金融領(lǐng)域的風險精準評估等,為行業(yè)帶來更具針對性和高效的解決方案。IDC調(diào)研顯示,8成企業(yè)計劃在未來18個月內(nèi)引入更多生成式AI,預(yù)計研發(fā)和技術(shù)用例的支出增長將更為明顯。隨著市場競爭的加劇,云廠商將不斷優(yōu)化模型性能、降低調(diào)用成本,以提高自身的市場競爭力。這將使得更多中小企業(yè)能夠以更低的成本享受到高質(zhì)量的大模型服務(wù),從而進一步推動大模型在企業(yè)級市場的普及和應(yīng)用。例如,阿里云的百煉平臺推出的Qwen-Max模型直降88%,而火山引擎的豆包大模型價格僅為行業(yè)平均的0.8%,顯著降低了企業(yè)的使用門檻。安全與隱私保護將始終是未來發(fā)展的重中之重。隨著數(shù)據(jù)安全相關(guān)法律法規(guī)的不斷完善以及企業(yè)對數(shù)據(jù)安全重視程度的不斷提高,云廠商將投入更多資源用于研發(fā)先進的安全技術(shù)和措施,確保企業(yè)在使用大模型服務(wù)過程中的數(shù)據(jù)安全和隱私保護,例如采用更高級的數(shù)據(jù)加密技術(shù)、強化訪問控制機制等。騰訊云的星脈高性能計算網(wǎng)絡(luò)和天翼云的“息壤”智算平臺,均在安全合規(guī)方面進行了深度布局。

結(jié)語

云計算大模型調(diào)用服務(wù)市場正處在高速發(fā)展的關(guān)鍵時期。從當下的市場格局到企業(yè)在公有云調(diào)用大模型的優(yōu)勢,從調(diào)用量對評估企業(yè)格局的重要意義到火山引擎等頭部廠商的獨特優(yōu)勢,再到未來多元化、智能化與安全化的發(fā)展趨勢,這一系列的變化與發(fā)展不僅勾勒出行業(yè)的動態(tài)輪廓,也為企業(yè)與投資者提供了豐富的思考方向。隨著技術(shù)的持續(xù)革新、市場的不斷成熟,云計算大模型調(diào)用服務(wù)有望在更多領(lǐng)域發(fā)揮更大價值,助力企業(yè)在數(shù)字化與智能化浪潮中實現(xiàn)創(chuàng)新突破,我們也將持續(xù)關(guān)注這一領(lǐng)域,為大家?guī)碜钚碌男袠I(yè)洞察與分析。

分享到

lixiangjing

算力豹主編

相關(guān)推薦