GLM-Z1-32B-0414 是具有深度思考能力的推理模型,這是在智譜最新32B基座模型的基礎(chǔ)上,通過冷啟動和擴(kuò)展強(qiáng)化學(xué)習(xí),以及在數(shù)學(xué)、代碼和邏輯等任務(wù)上對模型的進(jìn)一步訓(xùn)練得到的。相對于基礎(chǔ)模型,顯著提升了數(shù)理能力和解決復(fù)雜任務(wù)的能力。在訓(xùn)練的過程中,智譜還引入了基于對戰(zhàn)排序反饋的通用強(qiáng)化學(xué)習(xí),進(jìn)一步增強(qiáng)了模型的通用能力。
在部分任務(wù)的性能表現(xiàn)上,在僅使用 32B 參數(shù)的情況下,可與參數(shù)高達(dá) 6710 億的 DeepSeek-R1 相媲美。在AIME 24/25、LiveCodeBench、GPQA 等基準(zhǔn)測試中,GLM-Z1-32B-0414 展現(xiàn)了較為強(qiáng)大的數(shù)理推理能力、指令遵循能力和綜合工具調(diào)用能力,為更多復(fù)雜任務(wù)的解決提供了支持。
GLM-Z1-9B-0414 是一個驚喜。智譜沿用了上述一系列技術(shù),訓(xùn)練了一個 9B 的小尺寸模型。雖然參數(shù)量更少,但是在數(shù)學(xué)推理及通用任務(wù)上依然表現(xiàn)出色,整體性能已躋身同尺寸開源模型的領(lǐng)先水平。特別是在資源受限的場景下,該模型可以很好地在效率與效果之間取得平衡,為需要輕量化部署的用戶提供強(qiáng)有力的選擇。
此前,優(yōu)刻得就憑借自身在云計算領(lǐng)域的深厚積淀,為智譜 AI 提供底層算力支持,可靠支撐大模型應(yīng)用智譜清言、AI智能體AutoGLM等多款A(yù)IGC項(xiàng)目的快速上線和對外服務(wù)。合作中,優(yōu)刻得烏蘭察布智算中心的定制化高電機(jī)柜和 GPU 算力,幫助智譜大模型迅速搭建起訓(xùn)練和推理集群,并不斷擴(kuò)大規(guī)模,極大地提升了智譜大模型的研發(fā)效率,使得大模型應(yīng)用能夠快速上線并對外服務(wù),為智譜 AI 后續(xù)的模型研發(fā)筑牢根基。
優(yōu)刻得模型服務(wù)平臺融合豐富的行業(yè)模型資源,可針對不同行業(yè)需求定制,提供精準(zhǔn)高效推理能力。合作期間,雙方還以 “大模型一體機(jī)” 為載體,聯(lián)合探索行業(yè)大模型解決方案,助力金融、醫(yī)療、汽車、制造等行業(yè)快速落地大模型業(yè)務(wù)。
此次首批接入在推理能力、端側(cè)算力、運(yùn)行成本等方面具有獨(dú)特優(yōu)勢的智譜GLM Z1系列推理模型,標(biāo)志著優(yōu)刻得與智譜在智能算力基礎(chǔ)設(shè)施領(lǐng)域的進(jìn)一步深化合作。通過將 GLM-Z1-32B 深度思考能力與優(yōu)刻得智算集群能力相結(jié)合,助力客戶獲取極致推理體驗(yàn)。
優(yōu)刻得深耕 AI 領(lǐng)域多年,構(gòu)建了覆蓋AI訓(xùn)練、推理、應(yīng)用落地的全棧服務(wù)體系,至今已為超千款 AI 應(yīng)用提供智能算力服務(wù),支持超大規(guī)模分布式訓(xùn)練、多模態(tài)模型加速及云邊端協(xié)同部署,并以異構(gòu)算力調(diào)度引擎實(shí)現(xiàn) GPU 資源利用率的大幅提升。
優(yōu)刻得將持續(xù)以”技術(shù)普惠”為核心理念,通過構(gòu)建開放兼容的智能算力平臺,攜手更多像智譜這樣的國內(nèi)頂尖 AI 企業(yè),共同推動中國大模型技術(shù)應(yīng)用創(chuàng)新,為數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展注入新動能。