寧暢CEO秦曉寧

據(jù)寧暢CEO秦曉寧介紹,“全局智算”戰(zhàn)略六“全”特點(diǎn)分別是全體系、全液冷、全服務(wù)、全場(chǎng)景、全行業(yè)、全階段。

全體系,是指從通用、A1、邊緣計(jì)算、整機(jī)柜、AI工作站、AI算力棧等硬件軟件、平臺(tái)、應(yīng)用、開(kāi)發(fā)工具支撐與適配整體的軟硬件棧全部具備,并且把服務(wù)器和數(shù)據(jù)中心級(jí)別的AI算力帶到了桌面。

全場(chǎng)景,寧暢AI全棧能力,全面支持大模型開(kāi)發(fā)適配、部署場(chǎng)景。

全液冷覆蓋服務(wù)器、機(jī)柜、數(shù)據(jù)中心多形態(tài),支持風(fēng)冷、冷板式液冷、浸沒(méi)液冷多方式,秉承“冷靜“計(jì)算策略,有效化解額外能耗以及成本居高不下的問(wèn)題。

全行業(yè),滿足互聯(lián)網(wǎng)、金融、科研、自動(dòng)駕駛等幾乎所有重要行業(yè)業(yè)務(wù)需求。

全服務(wù),提供從前期咨詢、設(shè)計(jì)到制造、咨詢及后續(xù)運(yùn)維、售后等全時(shí)算力服務(wù),一個(gè)明顯的特征是不只交付硬件,如今有更多的軟件交付。

全階段,滿足客戶從大模型的開(kāi)發(fā)、適配、部署、全場(chǎng)景不同業(yè)務(wù)發(fā)展階段關(guān)鍵需求,提供最具價(jià)比的定制化智算中心方案。

“全局智算”戰(zhàn)略:六層邏輯能力

寧暢“全局智算”戰(zhàn)略包括六層邏輯能力。

最底層是硬件資源層,包括傳統(tǒng)的通用服務(wù)器、GPU、整機(jī)柜、存儲(chǔ)、網(wǎng)絡(luò)多種形態(tài)的產(chǎn)品。

硬件上層是集群設(shè)計(jì)層。這一層并非海量硬件的簡(jiǎn)單連接與堆疊。寧暢基于整體業(yè)務(wù)的運(yùn)行特征和系統(tǒng)的量化需求,提供從微架構(gòu)、網(wǎng)絡(luò)、存儲(chǔ)、AI模型特征等一系列的方案化的設(shè)計(jì)。

集群層之上是軟件層。

寧暢CTO趙雷

為什么寧暢要做軟件?寧暢CTO趙雷解釋說(shuō),未來(lái)越來(lái)越多的情況下,軟件將成為進(jìn)一步提升AI的運(yùn)算能力和產(chǎn)品使用率的最優(yōu)方案。

在計(jì)算能力方面,通過(guò)分析出什么樣的算力不足,哪個(gè)地方的算力存在缺口,從而對(duì)網(wǎng)絡(luò)和系統(tǒng)進(jìn)行針對(duì)性的優(yōu)化與升級(jí),確定算力的均衡負(fù)載并做出最好的選擇。其中,在算子優(yōu)化能力方面,寧暢以硬件資源優(yōu)勢(shì),減少模型執(zhí)行的時(shí)間,降低資源消耗,提高了能效比,以NEX AIOM軟件支持Slam,快速部署IaaS、PaaS、SaaS層,實(shí)現(xiàn)系統(tǒng)工程能力的優(yōu)化;在AI中臺(tái)層,寧暢提供全面支持NVAIE中臺(tái)系統(tǒng),實(shí)現(xiàn)AI算力棧在軟件層面包括基礎(chǔ)的操作、運(yùn)行庫(kù)以及MPI、NCCL和其他基礎(chǔ)框架的快速部署與實(shí)現(xiàn)。

在模型優(yōu)化層,寧暢可集合用戶內(nèi)部即時(shí)通信軟件的聊天數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行清洗和優(yōu)化,形成良好的數(shù)據(jù)集,防止在訓(xùn)練過(guò)程中出現(xiàn)過(guò)擬合問(wèn)題。此舉一方面方便公司內(nèi)部員工的檢索與問(wèn)答,另一方面則是檢驗(yàn)自己開(kāi)發(fā)的軟件系統(tǒng)所構(gòu)建的AI解決方案能力和服務(wù)能力。目前還在不斷完善中。

最上層是業(yè)務(wù)層和場(chǎng)景層。大模型的落地過(guò)程中,無(wú)論是算法、算力、數(shù)據(jù),還是算效、精度和服務(wù),都面臨各種變化和需求,“全局智算”戰(zhàn)略,以六“全”能力矩陣,既化解了極致算效、精度增強(qiáng)、高效穩(wěn)定問(wèn)題,也能夠賦能千行百業(yè),讓大模型真正成為各行各業(yè)的新質(zhì)生產(chǎn)力。

1)首個(gè)“AI算力?!盢EX AI Lab落地桐鄉(xiāng)

集成了寧暢在AI計(jì)算領(lǐng)域能力,以底層硬件到頂層應(yīng)用平臺(tái)系統(tǒng)化方案的“AI算力?!盢EX AI Lab(Nettrix AI Open Lab)新近在桐鄉(xiāng)落成。

NEX AI Lab由X640G50組成,搭配GPU及400G網(wǎng)絡(luò),以及可支持X680G55液冷服務(wù)器與全閃存儲(chǔ)節(jié)點(diǎn),可滿足大模型落地所需的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、建設(shè)、管理、應(yīng)用及液冷等全方位需求,以其全面、靈活、深度的支撐能力,為中高端智算中心的構(gòu)建提供強(qiáng)有力的支持。

值得一提的是,X680G55系列液冷服務(wù)器除了單獨(dú)使用,還可以與風(fēng)冷CPU結(jié)合使用,有效地實(shí)現(xiàn)傳統(tǒng)機(jī)房的液冷改造,讓性能得到最大程度釋放的同時(shí)保護(hù)客戶的投資成本。

目前,NEX AI Lab已先期開(kāi)放預(yù)約免費(fèi)的算力,支持用戶嘗試不同的業(yè)務(wù)組合、不同的網(wǎng)絡(luò)方案與不同的軟件和框架,并進(jìn)行相應(yīng)地調(diào)整,以便快速做出購(gòu)買(mǎi)決策。

NEX AI Lab的應(yīng)用,還有力地證明寧暢具備了從軟件到硬件全平臺(tái)服務(wù)的能力。

2)成功打造以全面AI體系支撐的自動(dòng)駕駛系統(tǒng)

基于“全局智算”戰(zhàn)略,寧暢綜合某車(chē)企客戶的各種需求,最終選擇預(yù)制模塊化機(jī)房,成功搭建了一個(gè)面向自動(dòng)駕駛領(lǐng)域的算力系統(tǒng)。

在機(jī)柜方面,液冷覆蓋率超過(guò)95%、功率高達(dá)100KW每柜的整機(jī)柜,電液盲插方式非常便于運(yùn)維和部署,同時(shí)還為特定的硬件平臺(tái)推薦最優(yōu)能耗比配置,PUE最低可至1.09。

為滿足自動(dòng)駕駛對(duì)實(shí)時(shí)性和延遲性要求,寧暢基于AI軟件棧提供優(yōu)化的深度學(xué)習(xí)框架和加速庫(kù),充分平衡訓(xùn)練,提升了推理效率;數(shù)據(jù)預(yù)處理自動(dòng)標(biāo)注方式,提高了數(shù)據(jù)的利用效率。

自動(dòng)駕駛對(duì)安全性有更高的要求,車(chē)企需要進(jìn)行大量的模擬測(cè)試。寧暢AI智駕中臺(tái)提供強(qiáng)大的模擬和測(cè)試工具,支持虛擬環(huán)境的創(chuàng)建與場(chǎng)景的重現(xiàn),測(cè)試運(yùn)率的自動(dòng)生成和執(zhí)行,加速了模型的訓(xùn)練過(guò)程,實(shí)現(xiàn)模型訓(xùn)練閉環(huán)。

通過(guò)種種舉措,寧暢以覆蓋數(shù)據(jù)收集、數(shù)據(jù)處理、模型訓(xùn)練、參數(shù)調(diào)優(yōu)、模型評(píng)估、模型發(fā)布全流程的技術(shù)支持,幫助客戶專注業(yè)務(wù),提升計(jì)算和測(cè)試效率,縮短了新產(chǎn)品上市的進(jìn)程。

與生態(tài)伙伴互補(bǔ)融合,構(gòu)建起“全局智算”能力

秦曉寧表示,“全局智算”僅憑寧暢一己之力難以完成,無(wú)論是硬件、集群、中臺(tái)、內(nèi)容,還是服務(wù)層,都離不開(kāi)各方面伙伴的通力合作。

“只有通過(guò)每一個(gè)個(gè)體的能力互補(bǔ)與融合,才能夠真正構(gòu)建起‘全局智算’的能力,開(kāi)拓智算未來(lái)的產(chǎn)業(yè)發(fā)展局面?!扒貢詫幭M麑帟衬軌蛞愿鼜?qiáng)大的AI算力,推動(dòng)大模型在各個(gè)行業(yè)的實(shí)際落地添磚加瓦,加速科技快速發(fā)展、造福人民,提升人民生活幸福感。

分享到

xiesc

相關(guān)推薦