DeepSeek的爆發(fā)式適配,不僅是一場技術(shù)狂歡,更揭示了國產(chǎn)AI發(fā)展的新范式——從依賴單一算力規(guī)模轉(zhuǎn)向“芯片-模型-場景”協(xié)同優(yōu)化。

文字編輯| 宋雨涵

1

國產(chǎn)芯片與大模型的“雙向奔赴”

推動產(chǎn)業(yè)鏈協(xié)同發(fā)展

技術(shù)實力與協(xié)同效應(yīng):這些企業(yè)能夠快速完成對DeepSeek模型的適配,充分展示了中國AI產(chǎn)業(yè)鏈的技術(shù)實力和協(xié)同效應(yīng)。DeepSeek的創(chuàng)新提升了算力使用效率,降低了算力硬件的門檻,無需依賴高端芯片也可實現(xiàn)應(yīng)用落地。

市場影響:隨著DeepSeek模型在國產(chǎn)AI芯片上的快速適配,有望推動國產(chǎn)AI芯片在推理場景的應(yīng)用,減少對海外硬件的依賴。同時,這也為構(gòu)建自主可控的人工智能技術(shù)生態(tài)奠定了基礎(chǔ)。

行業(yè)趨勢:從芯片到算法,從算力到應(yīng)用,再到云服務(wù),DeepSeek的出現(xiàn)促進了整個產(chǎn)業(yè)鏈的協(xié)同進化??萍紕?chuàng)新正從“硬件堆砌”的競賽轉(zhuǎn)向“算法-硬件-場景”協(xié)同發(fā)展,未來競爭更依賴生態(tài)整合能力而非單一技術(shù)優(yōu)勢。

從“替代”到“引領(lǐng)”的轉(zhuǎn)型信號

資本市場熱度飆升:科創(chuàng)芯片ETF規(guī)模突破204億元,寒武紀、龍芯中科等概念股春節(jié)后股價連續(xù)漲停。

華為昇騰、沐曦等芯片獨角獸借勢加速IPO進程,國產(chǎn)AI芯片產(chǎn)業(yè)迎來資本密集注入。

破解“卡脖子”難題:通過昇騰自研推理引擎,DeepSeek在國產(chǎn)硬件上的效果已比肩國際高端GPU。

南京智算中心、浙東南智算中心基于全國產(chǎn)算力部署滿血版DeepSeek模型,推動零售、工業(yè)等垂直場景應(yīng)用。

企業(yè)級部署門檻降低:聯(lián)想聯(lián)合沐曦推出訓推一體機,企業(yè)可低成本實現(xiàn)本地化AI部署;浪潮云、青云科技等推出預置模型的一體機方案,滿足國央企、高校的私有化需求。

2

這些企業(yè)具體做了些什么?

1、華為昇騰2月1日,華為云宣布與硅基流動聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的DeepSeek R1/V3推理服務(wù)。得益于自研推理加速引擎加持,該服務(wù)支持部署的DeepSeek模型可獲得持平全球高端GPU部署模型的效果。2月4日,DeepSeek R1、V3、V2、Janus-Pro模型正式上線昇騰社區(qū),支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺上開箱即用,推理快速部署。天翼云、聯(lián)通云、移動云三大運營商云均已采用昇騰算力底座來支持DeepSeek模型。神州數(shù)碼也特別提到其神州鯤泰推理服務(wù)器產(chǎn)品搭載昇騰硬件,可全面支持DeepSeek模型的快速部署。

2、沐曦國產(chǎn)GPU獨角獸沐曦對DeepSeek的支持,由國內(nèi)一站式大模型托管平臺Gitee AI代為官宣。Gitee AI在2月2日宣布上線1.5B、7B、14B、32B四個尺寸的DeepSeek R1模型并均部署在國產(chǎn)沐曦曦云GPU上。2月5日,Gitee AI再度發(fā)文,宣布經(jīng)測試已確認DeepSeek-V3全精度滿血版(671B)可以成功運行在沐曦訓推一體GPU上,并將V3滿血版上線到平臺上。同日,聯(lián)想聯(lián)合沐曦發(fā)布基于DeepSeek大模型的首個國產(chǎn)一體機解決方案。該方案以“聯(lián)想服務(wù)器/工作站+沐曦訓推一體國產(chǎn)GPU+自主算法”為核心架構(gòu),配合聯(lián)想AI Force智能體開發(fā)平臺,推出智能體一體機與訓推一體服務(wù)器雙產(chǎn)品形態(tài)。面向敏捷部署的DeepSeek智能體一體機,采用ThinkStation PX工作站為載體,搭載沐曦曦思N260國產(chǎn)GPU,可支持本地部署DeepSeek各種參數(shù)蒸餾模型推理。面向更廣泛場景的DeepSeek訓推一體機,基于聯(lián)想問天WA5480 G3 AI服務(wù)器,搭載8張曦云C500國產(chǎn)GPU,可為大模型訓練和推理提供強大的算力支撐。浪潮云在2月7日發(fā)布的預置DeepSeek R1和V3模型的海若一體機時,也采用了沐曦的國產(chǎn)GPU。

3、天數(shù)智芯2月4日,天數(shù)智芯與Gitee AI聯(lián)合發(fā)布,在雙方的高效協(xié)作下,僅用時一天,便成功完成了與DeepSeek R1的適配工作,并已正式上線多款大模型服務(wù),包括1.5B、7B、14B等尺寸。

天數(shù)智芯還在聯(lián)合并行科技、算力互聯(lián)等多家伙伴,全力開展DeepSeek多款模型的適配與上線。此前,DeepSeek V3 671B剛一發(fā)布,天數(shù)智芯便迅速響應(yīng),完成了與該模型的適配工作。經(jīng)測試與驗證,適配后的模型精度高度對標論文精度,展現(xiàn)出出色的穩(wěn)定性與可靠性,可快速投入應(yīng)用場景。

4、摩爾線程2月4日,摩爾線程宣布快速實現(xiàn)DeepSeek R1蒸餾模型推理服務(wù)在摩爾線程夸娥(KUAE)GPU智算集群上的高效部署。摩爾線程即將開放夸娥GPU智算集群,全面支持DeepSeek V3、R1模型及新一代蒸餾模型的分布式部署。用戶也可以基于摩爾線程MTT S80和MTT S4000顯卡進行DeepSeek-R1蒸餾模型的推理部署。早在1月28日,就已經(jīng)有B站UP主在MTT S80上手動完成推理DeepSeek R1模型的實踐?;贠llama開源框架,摩爾線程完成DeepSeek-R1-Distill-Qwen-7B蒸餾模型的部署,并在多種中文任務(wù)中展現(xiàn)了優(yōu)異的性能,驗證了摩爾線程全功能GPU的通用性與CUDA兼容性。

5、海光信息2月4日~5日,海光信息宣布其技術(shù)團隊近日成功完成DeepSeek V3模型、R1模型、Janus-Pro多模態(tài)大模型與海光DCU的適配優(yōu)化,并正式上線。DCU(深度計算單元)是海光信息推出的高性能GPGPU架構(gòu)AI加速卡,DeepSeek模型可直接在DCU上運行,并不需要大量適配工作,技術(shù)團隊的主要工作是進行精度驗證和持續(xù)的性能優(yōu)化。用戶可通過“光合開發(fā)者社區(qū)”中的“光源”板塊訪問并下載相關(guān)模型,或登錄?[www.sourcefind.cn]?搜索“DeepSeek”,即可基于DCU平臺快速部署和使用相關(guān)模型。

6、壁仞科技2月5日,壁仞科技宣布壁仞AI算力平臺正式上線DeepSeek R1全系列蒸餾模型推理服務(wù),供開發(fā)者云端體驗。該服務(wù)具備兩大核心優(yōu)勢:一是零部署成本,實現(xiàn)“開箱即用”的云端推理體驗;二是多場景覆蓋,針對大語言模型等不同任務(wù)預置優(yōu)化配置方案。壁仞科技已聯(lián)合上海智能算力科技有限公司、中興通訊、科華數(shù)據(jù)、無問芯穹、開源中國(Gitee AI)、UCloud優(yōu)刻得、一驀科技等戰(zhàn)略伙伴,基于壁礪系列訓推產(chǎn)品106M、106B、106E、110E,全面開展DeepSeek全系列模型的適配與上線。同日,UCloud優(yōu)刻得發(fā)文宣布,優(yōu)刻得與壁礪系列進行適配兼容,僅用數(shù)小時即完成了對DeepSeek R1全系列蒸餾模型的支持。

7、太初元碁2月5日,太初元碁宣布在太初T100加速卡上僅用2小時便完成DeepSeek-R1系列模型的適配工作,快速上線多款大模型服務(wù)。DeepSeek-R1系列模型可在太初元碁官網(wǎng)的模型中心獲取。該模型中心為用戶提供免費的太初T100加速卡,并提供模型權(quán)重下載、在線/離線推理腳本、模型評測腳本等全流程內(nèi)容。當前,DeepSeek-R1系列推理API無限量限時免費。太初元碁正積極聯(lián)手京算、是石科技、神威數(shù)智、龍芯中科等合作伙伴,全力打造DeepSeek系列模型的云端推理平臺。

8、云天勵飛2月5日,云天勵飛宣布其芯片團隊完成DeepEdge10芯片平臺與DeepSeek R1(1.5B、7B、8B)大模型的適配,可以交付客戶使用。DeepSeek R1(32B、70B)以及V3/R1 671B MoE大模型也在有序適配中。適配完成后,DeepEdge10芯片平臺將在端、邊、云全面支持DeepSeek全系列模型。

9、燧原科技2月6日,燧原科技宣布完成了對DeepSeek全量模型的高效適配,包括DeepSeek R1/V3 671B原生模型和蒸餾模型。目前,DeepSeek的全量模型已在慶陽、無錫、成都等智算中心完成了數(shù)萬卡的快速部署。這一成果標志著燧原科技在國內(nèi)率先實現(xiàn)了DeepSeek全量模型的部署和落地。燧原科技與并濟科技、并行科技、東華軟件、道客網(wǎng)絡(luò)、光環(huán)云、邁富時、清程極智、燧弘華創(chuàng)、未來速度、無問芯穹、向量棧、億算智能、中科加禾等合作伙伴緊密合作,積極推進DeepSeek全量模型的更多系統(tǒng)級優(yōu)化,進一步推理性價比。燧原科技還與萬物安全、飛渡科技、萬物之宜等深度合作,即將推出面向智慧城市、智慧園區(qū)、智慧交通等AIoT場景的國內(nèi)首個DeepSeek智算訓推一體機,幫助用戶解決國產(chǎn)化私有算力、超清數(shù)字孿生及物聯(lián)網(wǎng)安全等問題。

10、昆侖芯2月6日,昆侖芯宣布已完成Deepseek R1、V3系列模型訓練推理全版本適配,包括MoE模型及其蒸餾小模型,且性能卓越、成本效率極致,一鍵部署。據(jù)介紹,P800顯存規(guī)格優(yōu)于同類主流GPU 20%-50%,對MoE架構(gòu)更加友好,且率先支持8bit推理,單機8卡即可運行671B模型,可輕松完成DeepSeek-V3/R1全版本推理任務(wù);并能支撐Deepseek系列MoE模型大規(guī)模訓練任務(wù),僅需32臺即可支持模型全參訓練,高效完成模型持續(xù)訓練和微調(diào)。昆侖芯前身為百度智能芯片及架構(gòu)部,于2021年4月完成獨立融資。2月5日,百度智能云宣布其成功點亮昆侖芯三代P800萬卡集群三萬卡集群也將于近日點亮。

11、靈汐科技2月6日,靈汐科技宣布,節(jié)后開工第一天,其團隊聯(lián)合類腦技術(shù)社區(qū)(“腦啟社區(qū)”)的開發(fā)者,僅用半天時間,就完成了DeepSeek-R1系列模型在靈汐KA200類腦芯片及相關(guān)智算卡的適配,助力國產(chǎn)大模型與類腦智能硬件系統(tǒng)的深度融合。據(jù)?“腦啟社區(qū)“的開發(fā)者反饋,在DeepSeek-R1-Distill-Qwen的1.5B、7B等系列模型測試中,模型在4K上下文情形下體驗順暢,具備交付客戶使用的能力。后續(xù),靈汐科技也將聯(lián)合產(chǎn)業(yè)生態(tài)伙伴及腦啟社區(qū),適時發(fā)布云上服務(wù)。

12、鯤云科技2月6日,鯤云科技宣布其全新一代可重構(gòu)數(shù)據(jù)流AI芯片CAISA 430成功適配DeepSeek R1蒸餾模型推理。CAISA 430的可重構(gòu)數(shù)據(jù)流架構(gòu)能夠根據(jù)DeepSeek R1模型的特點進行動態(tài)配置,生成面向該模型的高性能定制化流水線,進一步優(yōu)化推理性能。該芯片原生支持DeepSeek R1蒸餾模型的開源基礎(chǔ)模型。DeepSeek R1的Qwen和Llama模型可直接在CAISA 430上運行,不需要復雜的適配工作。

13、希姆計算2月6日,希姆計算宣布其技術(shù)團隊僅用數(shù)小時,就將DeepSeek R1全系列蒸餾模型快速適配到自研RISC-V開源指令集的推理加速卡系列之上,并落地全國多個千卡級以上智算中心。企業(yè)級用戶可通過希姆智算云平臺,一鍵使用DeepSeek R1全系列蒸餾模型。

14、算能2月7日,算能宣布,搭載算豐第四代智能視覺深度學習處理器BM1684的算能微服務(wù)器SE7,已完成DeepSeek R1 7B/1.5B蒸餾模型適配,性能強勁,為R1蒸餾模型提供最佳國產(chǎn)邊緣部署方案。

15、清微智能2月7日,清微智能宣布其可重構(gòu)算力芯片RPU已完成DeepSeek R1系列模型的適配和部署運行。清微智能算力服務(wù)器具有訓推一體特點,支持無交換機自組網(wǎng)調(diào)度,顯著提升計算資源利用率與能效比,單機支持DeepSeek全尺寸模型,具有高性價比特點。除推理外,該服務(wù)器高性能支持基于DeepSeek模型對其他模型進行蒸餾訓練,便于實現(xiàn)大模型本地私有化部署。

16、芯動力2月7日,芯動力宣布在24小時內(nèi)完成了與DeepSeek R1大模型的適配。其高性能AI加速卡AzureBlade K340L M.2內(nèi)嵌AE7100芯片,尺寸大約半張名片大小,算力達到32TOPS,功耗不到8W,已經(jīng)可以支撐大模型在AI PC等設(shè)備上運行。

3

未來展望

展望未來,隨著DeepSeek技術(shù)的不斷成熟和應(yīng)用場景的不斷拓展,其在產(chǎn)業(yè)中的影響力將進一步擴大。一方面,DeepSeek將繼續(xù)深耕技術(shù)創(chuàng)新,不斷提升模型的性能和效率;另一方面,DeepSeek將加強與產(chǎn)業(yè)鏈上下游企業(yè)的合作與聯(lián)動,共同推動AI技術(shù)的普及和應(yīng)用。

對于國產(chǎn)AI芯片企業(yè)而言,與DeepSeek的合作將是一次難得的發(fā)展機遇。通過共同探索AI技術(shù)的無限可能,這些企業(yè)有望在激烈的市場競爭中脫穎而出,成為推動中國AI產(chǎn)業(yè)發(fā)展的中堅力量。同時,聯(lián)網(wǎng)搜索功能的加入也將為這些企業(yè)帶來更多的市場機會和商業(yè)價值,助力其在未來的發(fā)展中取得更加輝煌的成就。

分享到

lixiangjing

算力豹主編

相關(guān)推薦