基于當(dāng)前大模型技術(shù)發(fā)展現(xiàn)狀,中國電子云認(rèn)為構(gòu)建一個好用的大模型應(yīng)該具備以下幾個建設(shè)思路:
◆ 應(yīng)用場景滿足度高;
◆ 可通過數(shù)據(jù)飛輪讓大模型持續(xù)給業(yè)務(wù)提供價值;
◆ 通過L1大模型+場景小模型高效解決實際問題;
◆ 推理引擎和芯片深度優(yōu)化,提升應(yīng)用落地的性價比。
為實現(xiàn)以上四個目標(biāo),中國電子云聯(lián)合天數(shù)智芯、清程極智從芯片、AI-Infra(智能基礎(chǔ)設(shè)施)、模型、工具鏈、應(yīng)用5個層面進(jìn)行了布局優(yōu)化。
在芯片層面,天數(shù)智芯與中國電子云通用芯片對大模型算子的指令集、矩陣乘、片上緩存以及流水線進(jìn)行了深度優(yōu)化,充分發(fā)揮通用架構(gòu)在靈活性、兼容性與擴展性上的優(yōu)勢。通過軟硬協(xié)同,顯著提升訓(xùn)推效率與資源利用率,目前在同等并發(fā)情況下,芯片成本可以下降15%;
AI-Infra:中國電子云聯(lián)合清程極智推出并行加速框架以及AI編譯器,并協(xié)助芯片廠商對通信庫以及芯片編程語言進(jìn)行了優(yōu)化,在不損失精度前提下,極致優(yōu)化推理效率,在同等硬件配置下,并發(fā)提升10倍以上,響應(yīng)延遲降低50%;
在模型、工具鏈及應(yīng)用層面:中國電子云主導(dǎo)設(shè)計了最優(yōu)的匹配方案,中國電子云L1模型相比業(yè)界的SOTA模型冷啟動時間縮短至1天,冷啟動的效果提升20%以上;并提供系統(tǒng)級的支撐優(yōu)化,模型開發(fā)時間可縮短了70%;使得黨政及關(guān)鍵行業(yè)用戶可通過中國電子云提供的工具平臺構(gòu)建相應(yīng)的智能體應(yīng)用。
中國電子云聯(lián)合天數(shù)智芯以及清程極智芯片和訓(xùn)推引擎的整體優(yōu)化,實現(xiàn)了在分布式訓(xùn)練場景下加速效果接近2倍,推理吞吐量提升10倍,單機硬件成本下降10%以上。
當(dāng)前,中國電子云已經(jīng)構(gòu)建了端到端的AI解決方案,中國電子云的大模型應(yīng)用是基于異構(gòu)算力平臺、模型開發(fā)平臺、大模型應(yīng)用平臺構(gòu)建。其中算力平臺支持異構(gòu)算力的統(tǒng)一調(diào)度與管理。模型開發(fā)平臺、大模型應(yīng)用平臺通過各種工具加速智能體應(yīng)用的生產(chǎn),上層應(yīng)用分為通用應(yīng)用和行業(yè)應(yīng)用,通用主要解決客戶跨行業(yè)的通用需求,行業(yè)應(yīng)用主要是針對具體的行業(yè),需要深入行業(yè),了解行業(yè)know-how和行業(yè)的知識才能構(gòu)建的應(yīng)用。
目前,中國電子云AI解決方案已經(jīng)成功在石家莊、天津紅橋、湖北江陵、南航、湖北機場集團(tuán)、深圳龍崗城投集團(tuán)、山東公用集團(tuán)等政企行業(yè)客戶進(jìn)行了落地應(yīng)用。未來,中國電子云將深化AI技術(shù)與解決方案在千行百業(yè)落地應(yīng)用,助力千行百業(yè)向“全要素、全流程、全場景”智能化邁進(jìn)