AI的發(fā)展推動著云計算的演進,加速行業(yè)從云原生時代邁向AI原生時代。在這一進程中,企業(yè)對算力的需求日益多樣化,同時對高性價比、高穩(wěn)定性的需求也與日俱增?;诙嗄甑膹V泛合作,英特爾與火山引擎繼續(xù)攜手共進,一方面充分利用雙方的優(yōu)勢,打造涵蓋從通用到智能的彈性AI算力底座,為企業(yè)提供強大、靈活、兼顧成本效益的AI算力基礎(chǔ)設(shè)施;另一方面,雙方亦通過共建開放生態(tài),支持大模型應(yīng)用、智能體DevOps中臺與高性價比智算平臺相結(jié)合,構(gòu)建AI生態(tài)新范式,加速企業(yè)的智能化進程。
高效算力底座,推動云端算力躍升
本次大會上,英特爾攜手火山引擎共同發(fā)布了全新第四代 ECS 實例家族,不僅功能上更加豐富,在性能與架構(gòu)上也得到了進一步提升。與上一代實例相比,通用計算基礎(chǔ)型實例 g4i在MySQL 數(shù)據(jù)庫和Web 應(yīng)用上分別實現(xiàn)了20%和19%的性能提升,算力增強型實例 g4ie在視頻解碼和圖像渲染上帶來了15%和26%提升,I/O增強型實例 g4il在Spark大數(shù)據(jù)和Redis數(shù)據(jù)庫上也實現(xiàn)了13%和30%的提升。值得一提的是,得益于英特爾? 高級矩陣擴展(AMX)的深度優(yōu)化,基礎(chǔ)型實例 g4i在RAG全鏈路提速、WDL 模型推理優(yōu)化上均展現(xiàn)了出色的性能。其中,RAG全鏈路在文檔處理、Embedding、向量數(shù)據(jù)庫檢索和Reranking加速中,耗時減少了40%-90%。1
高性價比智算平臺,助力企業(yè)智能體進階
邊緣AI應(yīng)用的發(fā)展,對定制化、便捷化和安全化提出了新的需求,這讓具備靈活、高效、高性價比的智算平臺成為理想之選。在基于英特爾至強處理器和多張英特爾銳炫顯卡的一體機解決方案中,全新英特爾銳炫TM Pro B60,單卡可提供24GB顯存,在上下文擴展和并發(fā)擴展等場景中,提供更強的處理能力。因此,在邊緣和企業(yè)AI等應(yīng)用場景中,該方案能夠以出色的成本效益優(yōu)勢,提供高效、可靠的AI算力。此外,英特爾提供了包括vLLM、PyTorch在內(nèi)的完善的主流生態(tài)軟件棧和封裝成服務(wù)化的企業(yè)AI平臺(EAP),幫助用戶將上層應(yīng)用平滑遷移到英特爾平臺上,加速用戶私有化部署LLM應(yīng)用和智能體。
軟硬件協(xié)同加速,煥新模型開發(fā)至應(yīng)用落地
通過幫助企業(yè)打造彈性的AI算力底座,英特爾與火山引擎正攜手推動AI技術(shù)在云端的普及與應(yīng)用,護航AI云原生從開發(fā)到生產(chǎn)的全流程,本次活動的現(xiàn)場展區(qū)也展示了雙方合作的豐富成果。
在企業(yè)AI應(yīng)用開發(fā)側(cè),英特爾攜手火山引擎基于第四代實例提供了大模型應(yīng)用的開發(fā)環(huán)境——“開源大模型應(yīng)用-知識庫問答”應(yīng)用鏡像,支持開發(fā)者快速完成大模型的微調(diào)和推理環(huán)境的搭建。在結(jié)合HiAgent大模型能力中臺時,能夠從Dev到Ops全方位支持智能體規(guī)劃、開發(fā)與應(yīng)用,幫助降低AI落地的技術(shù)門檻和運營成本。在助力企業(yè)AI生產(chǎn)領(lǐng)域,英特爾至強處理器和AMX加速引擎、配合火山引擎的深度優(yōu)化,讓企業(yè)在大模型落地階段可以實現(xiàn)全流程性能提升,降低AI應(yīng)用的部署成本,保障在高并發(fā)場景下的系統(tǒng)穩(wěn)定性的同時,提升產(chǎn)品的整體性能與實際落地效率。
通過共同構(gòu)建開放的AI生態(tài),英特爾與火山引擎正在推動AI算力普惠,打造高性價比的智算平臺。展望未來,雙方也將繼續(xù)探索AI時代云計算的更多創(chuàng)新應(yīng)用,以高效的算力加速低成本AI應(yīng)用落地,助力企業(yè)的智能化升級之路。
注釋