文字編輯|宋雨涵
1
OpenAI定價策略遭挑戰(zhàn)
技術代差難掩成本短板
2月28日,OpenAI發(fā)布GPT-4.5預覽版,開發(fā)者API定價飆升至每百萬Token 75美元,較前代暴漲30倍,引發(fā)行業(yè)震蕩。分析指出,其定價策略本質是“以價換質”,試圖通過技術壁壘維持高端市場壟斷地位。然而數(shù)據(jù)顯示,GPT-4.5的輸入成本為DeepSeek常規(guī)服務的280倍,若對比后者在緩存命中場景的淡季折扣價,價差甚至超過1000倍。
“OpenAI的純Transformer堆疊架構已逼近邊際成本極限?!币晃籄I基礎設施分析師表示,“密集計算模式導致其單機推理效率難以突破,而DeepSeek的分布式架構打開了新的降本空間。”
2
技術揭秘
跨節(jié)點專家并行重構算力效率
3月1日,DeepSeek官方親自揭秘了DeepSeek-V3/R1推理系統(tǒng)。并且公開披露了模型推理系統(tǒng)的成本利潤為545%。
同時,DeepSeek還指出,實際上沒有這么多收入,因為 V3 的定價更低,同時收費服務只占了一部分,另外夜間還會有折扣。
針對模型成本問題,DeepSeek在文中提到,DeepSeek-V3/R1推理服務的優(yōu)化目標是:提高吞吐量和降低延遲。
吞吐量躍升
EP技術將批處理規(guī)模擴大至傳統(tǒng)單機的數(shù)十倍,GPU矩陣計算效率提升超90%;
延遲銳減
每臺GPU僅需處理少量專家模塊,內存訪問需求降低70%,端到端推理延遲壓縮至毫秒級。
“多機分布式推理不再是理論構想。”
DeepSeek其核心邏輯是:通過動態(tài)負載均衡算法,讓計算、存儲、通信壓力在集群中智能分配,單機性能天花板被徹底打破?!睆亩鴮崿F(xiàn)高吞吐和低成本。
3
技術平權時代
算力投資轉向硬件深水區(qū)
此次技術公開正在重構全球AI產(chǎn)業(yè)的投資邏輯。據(jù)第三方機構測算,2025年中國AI算力市場因多機推理技術帶動的擴容規(guī)模將超1200億元,服務器集群、光通信、分布式存儲等領域迎來爆發(fā)式增長。
“企業(yè)開始重新評估AI預算分配?!蹦吃品丈藽TO透露,“過去購買軟件許可的成本正加速向定制化硬件基礎設施遷移,分布式架構的邊際成本優(yōu)勢在百億級Token場景下尤其顯著?!?/p>
中國方案定義新規(guī)則
DeepSeek的突破性進展是這場變革的核心引擎。這家中國AI企業(yè)通過“大規(guī)??绻?jié)點專家并行(EP)”技術,將6710億參數(shù)模型的專家激活率從傳統(tǒng)模型的10%提升至80%,同時結合計算通信重疊優(yōu)化與錯峰定價策略,實現(xiàn)單日成本利潤率高達545%。其實際定價僅為理論利潤率的1/5,并通過夜間折扣等分級計價模式,將API調用成本壓縮至OpenAI同類產(chǎn)品的1/7至1/2。
這種“高利潤空間支撐低定價”的策略,正在倒逼行業(yè)重建技術-成本-定價的三維競爭體系。行業(yè)觀察人士指出,當技術代差被分布式架構抹平,OpenAI的定價霸權將難以為繼。這場由跨節(jié)點并行技術引發(fā)的革命,或將終結大模型時代的“暴力堆算力”競爭,開啟以系統(tǒng)級創(chuàng)新為主導的新周期。
寫在最后
此次DeepSeek-V3/R1技術路線的全公開不僅驗證了多機推理模式的正確性,更以545%的驚人成本利潤率,向全球展示了分布式推理技術的商業(yè)可行性。隨著企業(yè)將AI預算從軟件許可轉向硬件投資,2025年中國AI算力市場因多機推理技術擴容的規(guī)模預計將突破1200億元,這一數(shù)據(jù)與《中國人工智能計算力發(fā)展評估報告》中智能算力規(guī)模兩年翻番的預測形成共振。行業(yè)專家指出,跨節(jié)點專家并行(EP)技術通過分散計算壓力突破單機性能瓶頸,其引發(fā)的算力需求分層與智算中心轉型,正推動國產(chǎn)算力芯片、數(shù)據(jù)中心等基礎設施加速升級。在政策與市場雙重驅動下,AI產(chǎn)業(yè)正迎來硬件投資與算法創(chuàng)新協(xié)同發(fā)展的新周期。