即將于9月3日舉行的英特爾酷睿Ultra發(fā)布會將公布有關Lunar Lake的更多細節(jié)。
英特爾? Gaudi 3 AI加速器:針對生成式AI的訓練和推理而設計
AI加速器首席架構師Roman Kaplan指出,生成式AI模型的訓練與部署對算力提出了極為嚴苛的要求。隨著系統(tǒng)規(guī)模從單節(jié)點擴展至數(shù)千節(jié)點的龐大集群,這使得成本與能效也迎來巨大挑戰(zhàn)。
英特爾? Gaudi 3 AI加速器能夠有效應對上述挑戰(zhàn)。該加速器通過創(chuàng)新的架構——優(yōu)化的計算、內(nèi)存和網(wǎng)絡架構,高能效矩陣乘法引擎、兩級緩存集成,以及廣泛的RoCE網(wǎng)絡(以太網(wǎng)融合RDMA技術)等策略,使得Gaudi 3 AI加速器能夠?qū)崿F(xiàn)卓越的性能與能效,助力AI數(shù)據(jù)中心以低成本、可持續(xù)的方式運行,并解決了部署生成式AI工作負載時的擴展性問題。
英特爾將在今年9月分享Gaudi 3 AI加速器和未來英特爾至強6產(chǎn)品的更多信息。
傳輸速度高達4 Tbps的光學計算互連(OCI)芯粒,用于XPU之間的連接
英特爾硅光集成解決方案(IPS)團隊展示了業(yè)界領先、完全集成的OCI芯粒與英特爾CPU封裝在一起時,運行真實數(shù)據(jù)的情況。
硅光集成解決方案事業(yè)部光子芯片架構師Saeed Fathololoumi介紹了這一OCI芯粒及其設計。該芯??稍谧铋L可達100米的光纖上,單向支持64個32 Gbps通道。Fathololoumi還討論了該芯粒如何滿足AI基礎設施對更高帶寬、更低功耗和更長傳輸距離日益增長的需求。英特爾的OCI芯粒推動了高帶寬互連技術的進步,將有助于實現(xiàn)可擴展的CPU和GPU集群連接以及新型計算架構,包括新興AI基礎設施中的一致性內(nèi)存擴展及資源解耦,適用于數(shù)據(jù)中心和HPC(高性能計算)應用。
AI讓企業(yè)和消費者有機會更快地推進創(chuàng)新。例如,消費者現(xiàn)在可以選擇AI PC,通過智能化功能提高效率、創(chuàng)造力、游戲和娛樂體驗以及安全性,而企業(yè)則可以利用強大的邊緣計算和AI來改善決策,提高自動化水平,并從專有數(shù)據(jù)中獲取價值。
在Hot Chips 2024的深度技術研討會上,英特爾的不同產(chǎn)品團隊還展現(xiàn)了獨到的技術洞見,以共同推動下一代AI技術的市場化進程。