除了顯著降低推理成本,焱融 YRCloudFile KVCache技術(shù)還大幅提升了系統(tǒng)的并發(fā)處理能力。從上圖實(shí)測(cè)的數(shù)據(jù)可以看出,在沒有使用YRCloudFile KVCache時(shí),為保證首個(gè)Token在2秒內(nèi)返回,系統(tǒng)最多只能支持5個(gè)并發(fā)請(qǐng)求。而采用焱融YRCloudFile KVCache方案后,并發(fā)能力提升至16個(gè),整體處理效率提升了 3 倍以上。

這一技術(shù)突破充分凸顯了存儲(chǔ)系統(tǒng)在 AI 推理中的核心價(jià)值。在更普遍的層面上,存儲(chǔ)系統(tǒng)在數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、模型推理等場(chǎng)景中都發(fā)揮著非常關(guān)鍵的作用,正在從傳統(tǒng)意義上的存放數(shù)據(jù)的倉庫,轉(zhuǎn)變?yōu)橹蜛I發(fā)展的“關(guān)鍵引擎”。

國(guó)產(chǎn)存儲(chǔ)之光:性能至上,焱融打造高性能存儲(chǔ)的新標(biāo)桿

焱融科技是一家成立于2016年的存儲(chǔ)公司,核心團(tuán)隊(duì)成員主要來自IBM、華為、金山云、阿里云等科技公司,研發(fā)實(shí)力充足。在2024年IDC全閃軟件定義存儲(chǔ)出貨量排行當(dāng)中,榮膺中國(guó)第四,產(chǎn)品、服務(wù)以及市場(chǎng)表現(xiàn)都獲得了認(rèn)可。

焱融科技專注于高性能文件存儲(chǔ),曾在存儲(chǔ)系統(tǒng)性能評(píng)測(cè)榜單IO500中躋身前六。2024年,在國(guó)際權(quán)威 AI 存儲(chǔ)性能MLPerf Storage基準(zhǔn)測(cè)試中,憑借極致性能斬獲多項(xiàng)世界第一,代表了中國(guó)文件存儲(chǔ)技術(shù)的頂尖水平。

可以說,卓越的性能是焱融科技高性能分布式文件存儲(chǔ)的核心優(yōu)勢(shì)之一。正因如此,焱融科技高度重視與高性能存儲(chǔ)設(shè)備廠商 Solidigm 的合作。在 2022 年推出的全閃分布式存儲(chǔ)一體機(jī) F8000X 中,焱融科技采用了22 塊 Solidigm PCIe Gen4 NVMe 固態(tài)硬盤,充分發(fā)揮硬件與自研分布式文件系統(tǒng)的協(xié)同優(yōu)勢(shì),進(jìn)一步提升了整體系統(tǒng)的讀寫性能與業(yè)務(wù)響應(yīng)效率。

2024年,焱融科技推出了新一代全閃分布式存儲(chǔ)一體機(jī) F9000X,搭載 Solidigm D7-PS1010 PCIe 5.0 NVMe SSD,并集成了 NVIDIA 400Gb InfiniBand 高速網(wǎng)絡(luò),全面釋放帶寬與 IOPS 性能潛力,為高性能 AI 計(jì)算場(chǎng)景提供強(qiáng)勁支撐。

在 AI 應(yīng)用的全生命周期中,包括數(shù)據(jù)采集、預(yù)處理、模型訓(xùn)練、模型驗(yàn)證、模型推理及數(shù)據(jù)歸檔,焱融科技強(qiáng)調(diào)“一站式存儲(chǔ)平臺(tái)”建設(shè),貫穿 AI 數(shù)據(jù)處理全流程,避免各階段頻繁遷移數(shù)據(jù)帶來的性能損耗和管理負(fù)擔(dān)。

焱融科技副總裁黎俊鴻表示,當(dāng)前 AI 存儲(chǔ)面臨四大核心挑戰(zhàn):一是通過智能分層降低整體數(shù)據(jù)存儲(chǔ)成本;二是實(shí)現(xiàn)在線業(yè)務(wù)不中斷的平滑擴(kuò)容;三是優(yōu)化海量小文件的讀寫性能;四是應(yīng)對(duì)帶寬與 IOPS 的高強(qiáng)度需求,尤其是在 KVCache 場(chǎng)景中,存儲(chǔ)系統(tǒng)需快速響應(yīng) GPU 與存儲(chǔ)間 KV 數(shù)據(jù)的讀寫請(qǐng)求,直接影響推理效率和系統(tǒng)整體性能表現(xiàn)。

焱融不僅提供軟硬件一體化的全閃產(chǎn)品解決方案,更自主研發(fā)了高性能分布式文件系統(tǒng) YRCloudFile,具備無損擴(kuò)容、冷熱數(shù)據(jù)自動(dòng)分層、智能數(shù)據(jù)加載、海量小文件優(yōu)化等功能。目前,該方案已成功應(yīng)用于智譜 AI、知乎、以及多家頭部車企與運(yùn)營(yíng)商的智算中心,持續(xù)為客戶 AI 業(yè)務(wù)的穩(wěn)定運(yùn)行和高效擴(kuò)展提供堅(jiān)實(shí)支撐。

與 Solidigm 深度合作,共同推動(dòng)存儲(chǔ)系統(tǒng)性能突破

自 2019 年起,焱融科技便與 Solidigm 建立穩(wěn)定合作關(guān)系,攜手經(jīng)歷了存儲(chǔ)接口從 SATA 到 NVMe、從 PCIe 4.0 到 PCIe 5.0 的技術(shù)演進(jìn)。無論是 2022 年推出的基于 PCIe 4.0 平臺(tái)的全閃分布式一體機(jī) F8000X,還是 2024 年發(fā)布的新一代 PCIe 5.0 平臺(tái)產(chǎn)品 F9000X,焱融科技均選擇 Solidigm 高性能 SSD 作為核心組件。

焱融科技副總裁黎俊鴻指出,作為一家專注高性能分布式并行存儲(chǔ)系統(tǒng)的企業(yè),焱融始終致力于為對(duì)數(shù)據(jù)訪問性能要求極高的客戶提供軟硬件一體化解決方案,這也使其在產(chǎn)品選型時(shí)尤為重視性能表現(xiàn),Solidigm 在該領(lǐng)域的技術(shù)優(yōu)勢(shì)正好與之高度契合。

雙方合作不僅基于 Solidigm 在性能、可靠性和性價(jià)比方面的均衡表現(xiàn),也得益于雙方在技術(shù)支持和工程師文化層面的高度協(xié)同。Solidigm 持續(xù)提供專業(yè)技術(shù)支持,使雙方在產(chǎn)品調(diào)優(yōu)與項(xiàng)目落地中合作順暢,持續(xù)推進(jìn)產(chǎn)品性能優(yōu)化。

焱融科技在軟件棧持續(xù)迭代優(yōu)化的同時(shí),也通過搭配 Solidigm Gen5 SSD 與高速網(wǎng)絡(luò)等關(guān)鍵組件,實(shí)現(xiàn)了 F9000X 性能的顯著躍升。實(shí)測(cè)顯示,僅三節(jié)點(diǎn)集群即可達(dá)到 480GB/s 帶寬和最高 750 萬 IOPS 的領(lǐng)先性能表現(xiàn),充分滿足智算中心、AI 模型訓(xùn)練和推理等高負(fù)載應(yīng)用需求。

隨著生成式 AI 技術(shù)的迅猛發(fā)展,焱融科技長(zhǎng)期堅(jiān)持的高性能戰(zhàn)略正在顯現(xiàn)戰(zhàn)略價(jià)值。黎俊鴻強(qiáng)調(diào),盡管業(yè)界普遍關(guān)注算力本身,但真正的性能瓶頸往往來自底層數(shù)據(jù)訪問的限制。焱融科技通過軟硬一體的技術(shù)積累,正幫助客戶突破這一關(guān)鍵瓶頸,釋放 AI 潛能。

在某算力運(yùn)營(yíng)商智算平臺(tái)中,焱融追光全閃存儲(chǔ)一體機(jī)F9000X用400Gb的InfiniBand網(wǎng)絡(luò)對(duì)接了一個(gè)128節(jié)點(diǎn)GPU服務(wù)器,單存儲(chǔ)集群就給客戶提供了TB級(jí)別的讀帶寬和2000萬以上的IOPS,穩(wěn)穩(wěn)支撐了頭部自動(dòng)駕駛客戶的模型訓(xùn)練需求。

某家電制造企業(yè)使用焱融科技F8000X全閃文件存儲(chǔ)系統(tǒng),構(gòu)建了匹配大規(guī)模GPU可計(jì)算集群的數(shù)據(jù)存儲(chǔ)系統(tǒng),解決了百億級(jí)別小文件和大文件混合場(chǎng)景的數(shù)據(jù)訪問挑戰(zhàn),用更強(qiáng)的數(shù)據(jù)訪問性能,大幅提升了整體的訓(xùn)練效率。

國(guó)內(nèi)某知名大模型開發(fā)商使用了內(nèi)蒙千卡集群的資源,而該GPU集群的AI存儲(chǔ)系統(tǒng)中使用了焱融科技F8000X存儲(chǔ)系統(tǒng),支撐前端千卡GPU集群。在這套系統(tǒng)的支持下,大大提升了模型迭代效率,還滿足了該服務(wù)商對(duì)外提供算力租賃服務(wù)的需求。

結(jié)束語

KVCache技術(shù)為大模型應(yīng)用帶來了革命性的效率提升和成本優(yōu)化。焱融科技憑借其卓越的高性能存儲(chǔ)解決方案,特別是與Solidigm的深度合作,成功將KVCache的潛力發(fā)揮到極致。

焱融科技致力于打造超高性能存儲(chǔ)系統(tǒng),實(shí)踐案例也充分證明,高性能存儲(chǔ)已成為驅(qū)動(dòng)AI發(fā)展的核心引擎,它不僅為各行業(yè)的AI創(chuàng)新提供了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ),也進(jìn)一步印證了——存儲(chǔ),在 AI 時(shí)代的重要性不可忽視。

分享到

zhupb

相關(guān)推薦