H3C UniCube DeepSeek大模型一體機
產(chǎn)品規(guī)格與型號
中科曙光
2月14日,曙光云推出的全國產(chǎn)DeepSeek大模型超融合一體機,主要應(yīng)用場景為政務(wù)云、企業(yè)數(shù)據(jù)中心還有多行業(yè)適配。產(chǎn)品亮點第一個我們就能關(guān)注到的——全國產(chǎn)化。這款一體機采用了國產(chǎn)X86 CPU和國產(chǎn)GPGPU加速卡,支持全精度和半精度混合訓練與推理,這樣能有更高的計算性價比。
另外一體機全面適配DeepSeek系列模型(如V3、R1、Janus Pro),并支持全系列量化蒸餾版本,同時兼容QWen2.5、LLama3.2、ChatGLM等主流大模型。而且內(nèi)置文心雕龍智能化應(yīng)用,通過快速問答和知識庫管理,幫助企業(yè)高效處理信息,提升運營效率。
寧暢
2月14日,寧暢發(fā)布DeepSeek大模型一體機解決方案。DeepSeek 大模型一體機解決方案從底層技術(shù)到業(yè)務(wù)場景深度優(yōu)化。除了易部署,這些不同版本還集成了多款行業(yè)知識庫與模板,并且通過內(nèi)置資源監(jiān)控與自優(yōu)化算法,算力利用率可提升至85%,大幅降低總擁有成本,幫助企業(yè)實現(xiàn)高效、低成本的運維管理。
DeepSeek 大模型一體機解決方案產(chǎn)品矩陣
華為
2月13日,華為對外推出昇騰DeepSeek一體機,深度融合昇騰高性能算力底座與DeepSeek全系列大模型能力,覆蓋語言理解、圖像分析、知識推理等全場景需求。以DeepSeek-R1-Distill-Llama-70B為例,其系統(tǒng)每秒吞吐量可達3300 Tokens,輕松應(yīng)對海量文本分析和復(fù)雜業(yè)務(wù)場景模擬。
一體機還支持低至50ms的每用戶時延,就是哪怕很多人同時用,系統(tǒng)對每個用戶的時延也控制在50ms以內(nèi)(簡單來說就是打游戲不卡的程度),可以提升個人辦公效率。以DeepSeek V3/R1滿血版為例,能支持高達192個用戶的并發(fā),滿足大型企業(yè)多部門協(xié)同工作的需求。
一體機采用華為Atlas800l A2推理服務(wù)器,搭載鯤鵬920+昇騰AI處理器,支持全精度和半精度混合訓練與推理。混合推理跟曙光提到的點相同,就是回答你的問題,簡單的要求能快速批量處理(半精度),復(fù)雜的精密任務(wù)就會更注重細節(jié)(全精度)。
截止2月12日,已有13家伙伴基于昇騰產(chǎn)品打造自有DeepSeek一體機產(chǎn)品。
宏杉科技
2月13日,宏杉科技對外推出基于DeepSeek的大模型一體機解決方案。宏杉科技DeepSeek一體機解決方案除了易部署,還提到了靈活擴展性,能滿足私有化部署對海量數(shù)據(jù)存儲的需求。同時,內(nèi)置多種數(shù)據(jù)保護模式,并可根據(jù)數(shù)據(jù)訪問級別配置性價比更高的存儲介質(zhì)。
宏杉科技還內(nèi)置了自研功能組件,可無縫對接各類型生產(chǎn)系統(tǒng),實現(xiàn)數(shù)據(jù)自由流轉(zhuǎn)。同時,搭載智能AI文檔庫產(chǎn)品,支持知識協(xié)作共享和跨領(lǐng)域多模態(tài)檢索,提升企業(yè)數(shù)據(jù)管理效率。
聯(lián)想集團
2月初,聯(lián)想集團與國產(chǎn)GPU企業(yè)沐曦股份聯(lián)合發(fā)布了基于DeepSeek大模型的首個國產(chǎn)一體機解決方案。方案以“聯(lián)想服務(wù)器/工作站+沐曦訓推一體國產(chǎn)GPU+自主算法”為核心架構(gòu),配合聯(lián)想AI Force智能體開發(fā)平臺,推出智能體一體機與訓推一體服務(wù)器雙產(chǎn)品形態(tài)。
聯(lián)想創(chuàng)新性推出兩大產(chǎn)品:面向敏捷部署的DeepSeek智能體一體機采用ThinkStation PX工作站為載體,搭載沐曦曦思N260國產(chǎn)GPU。實測數(shù)據(jù)顯示,在相同并發(fā)條件下,沐曦曦思N260國產(chǎn)GPU在Qwen2.5-14B模型推理實測性能達到NVIDIA L20 GPU的110%-130%,可支持本地部署DeepSeek各種參數(shù)蒸餾模型推理。而面向更廣泛場景的DeepSeek訓推一體機則基于聯(lián)想問天WA5480 G3 AI服務(wù)器,搭載8張曦云C500國產(chǎn)GPU,可為大模型訓練和推理提供強大的算力支撐。
基于聯(lián)想ThinkStation PX的智能體一體機
基于聯(lián)想問天WA5480 G3 AI服務(wù)器的訓推一體機
浪潮
2月7日,浪潮云聯(lián)合沐曦股份、銓興科技等生態(tài)伙伴,對外發(fā)布了預(yù)置DeepSeek-R1和DeepSeek-V3模型的海若一體機,實現(xiàn)671B DeepSeek大模型國產(chǎn)GPU單機推理服務(wù)。同樣是開箱即用,部署時間1-3天。大模型推理性能有大幅提升,解碼生成速度提升185.7%,平均首字時延降低55.9%。
開放兼容性高,支持浪潮海若、DeepSeek、GPT-4、通義千問等主流大模型;支持EmBedding、ReRanker、ASR、TTS多類型;內(nèi)置模型池適配沐曦、昇騰等多種芯片。規(guī)格也有版本之分,有啟航版、進階版、旗艦版等多種規(guī)格,可根據(jù)模型參數(shù)和應(yīng)用規(guī)模靈活選擇。
海若一體機產(chǎn)品能力全景圖
銓興科技
2月18日,銓興科技對外發(fā)布DeepSeek R1 671B 超顯存融合訓推一體機系列。包括三個版本:
671B 推理一體機入門版:價格 9.8W 起,支持 DeepSeek R1 671B 模型部署,強調(diào)極致性價比,輸出最高可達 12TPS。
671B 推理一體機滿血版:被稱為 “性能機皇”,支持 DeepSeek R1 671B 滿血版模型部署,超顯存融合賦能高效推理,配置為 RTX5880 ada 48GB x10、Intel 4410Y x 2、512GB DRAM。
671B 滿血版訓推一體機:成本再降 95%,助力國產(chǎn)模型訓練,支持 DeepSeek R1 671B 滿血版本地訓練,采用雙節(jié)點配置,每節(jié)點含 RTX5880 ada 48GB x 8、Intel 4410Y x 2、2TB DRAM、400Gb 網(wǎng)卡、AI Cache Pro 2TB x 4 。
超聚變
2月17日,超聚變對外發(fā)布deepseek大型一體機。其優(yōu)勢在于開箱即用,分鐘級交付。擁有一站式工具鏈,兼容主流模型,提供專業(yè)服務(wù);多元算力融合,AI 資源可視可管,算力共享等。
產(chǎn)品規(guī)格包括:
輕量版:適用于低成本、低時延推理,如文本生成、簡單問答,支持 1.5B – 14B 模型。
標準版:平衡成本與性能,適用于代碼輔助、學術(shù)研究等,支持 32B – 70B 模型。
旗艦版:面向高性能推理,如尖端科研、商業(yè)決策,支持 671B 滿血模型。
紫光云
紫光云公司推出的是紫鸞大模型一體機,已經(jīng)全系優(yōu)化適配并預(yù)制DeepSeek R1系列推理模型,支持英偉達、天數(shù)、昆侖芯、燧原科技等異構(gòu)芯片的統(tǒng)一調(diào)度。通過一體化開箱即用私域部署,紫鸞大模型實現(xiàn)了DeepSeek的部署,為政企用戶提供高性價比的生產(chǎn)級AI解決方案。
京東云
2月8日,京東云對外發(fā)布DeepSeek大模型一體機,基于“本地化開箱即用”的理念,提供從底層算力、模型服務(wù)、推理能力、應(yīng)用開發(fā)的全棧解決方案,支持華為昇騰、海光、寒武紀、摩爾線程、天數(shù)智芯等國產(chǎn)AI加速芯片,在滿足自主可控的同時,降低算力投資成本,主要面向金融、政府及企業(yè)用戶。
昆侖技術(shù)+中科加禾
2月18日,昆侖技術(shù)與中科加禾攜手推出的DeepSeek本地化部署一體機,產(chǎn)品基于昆侖技術(shù)的KunLun AI服務(wù)器算力和中科加禾的SigInfer模型推理引擎,提供穩(wěn)定可靠的生產(chǎn)級DeepSeek-R1和V3服務(wù)。這個要簡單說兩句,河南昆侖技術(shù)有限公司成立于2022年10月,核心團隊來自鯤鵬與昇騰的原班人馬,是一家專注于算力基礎(chǔ)設(shè)施與服務(wù)的高科技企業(yè)。中科加禾的 SigInfer 模型推理引擎可以理解為是一個非常聰明的 “大腦助手”。它主要做的事情就是幫助各種人工智能模型快速、準確地 “理解” 和處理數(shù)據(jù),然后給出相應(yīng)的結(jié)果或判斷。這個是昨天才發(fā)布的,但是兩家公司一個背靠華為一個背靠中科院,產(chǎn)品應(yīng)該不會差,這里先備注一下。
產(chǎn)品優(yōu)勢生態(tài)兼容:全面兼容昇騰生態(tài),滿足本地化部署需求。
靈活配置:2節(jié)點起配,支持64并發(fā),可按需線性擴容。
性能定制:高性能推理引擎,支持靈活定制以實現(xiàn)領(lǐng)先推理性能。
開發(fā)加速:集成 AI Space 開發(fā)平臺,加速 AI 場景化持續(xù)創(chuàng)新。
技術(shù)支持:超100人的 FAE 團隊提供安裝部署及調(diào)優(yōu)技術(shù)支持。