精品国产三级a在线观看网站,自拍偷自拍亚洲精品情侣,亚洲精品国产第一区第二区

為了解決這個(gè)問(wèn)題，Panmnesia開(kāi)發(fā)了一個(gè)符合CXL 3.1標(biāo)準(zhǔn)的根復(fù)合體（RC），配備了多個(gè)支持通過(guò)PCIe擴(kuò)展外部?jī)?nèi)存的根端口（RP），以及一個(gè)帶有主機(jī)管理設(shè)備內(nèi)存（HDM）解碼器的主橋，該解碼器連接到GPU的系統(tǒng)總線。

HDM解碼器負(fù)責(zé)管理系統(tǒng)內(nèi)存的地址范圍，使GPU的內(nèi)存子系統(tǒng)“認(rèn)為”它在處理系統(tǒng)內(nèi)存。但實(shí)際上，子系統(tǒng)使用的是連接到PCIe的DRAM或NAND。這意味著可以使用DDR5或SSD來(lái)擴(kuò)展GPU顯存池。

據(jù)Panmnesia稱，該解決方案（基于一些定制的GPU，針對(duì)CXL做了優(yōu)化的，標(biāo)記為CXL-Opt）經(jīng)過(guò)廣泛測(cè)試，顯示出兩位數(shù)納秒的往返延遲（相比之下，三星和Meta開(kāi)發(fā)的原型的往返延遲為250ns），包括標(biāo)準(zhǔn)內(nèi)存操作和CXL數(shù)據(jù)傳輸之間的協(xié)議轉(zhuǎn)換所需的時(shí)間。

而且，它已經(jīng)成功集成到內(nèi)存擴(kuò)展器和GPU/CPU原型的硬件RTL中，展示了其與各種計(jì)算硬件的兼容性。

根據(jù)Panmnesia的測(cè)試，由于主機(jī)運(yùn)行時(shí)在頁(yè)面錯(cuò)誤期間的干預(yù)開(kāi)銷和頁(yè)面級(jí)別的數(shù)據(jù)傳輸，UVM在所有測(cè)試的GPU內(nèi)核中表現(xiàn)最差，這通常無(wú)法滿足GPU的要求。相比之下，CXL允許通過(guò)加載/存儲(chǔ)指令直接訪問(wèn)擴(kuò)展存儲(chǔ)，從而克服了這些問(wèn)題。

因此，CXL-Proto的執(zhí)行時(shí)間比UVM短1.94倍。Panmnesia的CXL-Opt進(jìn)一步將執(zhí)行時(shí)間減少了1.66倍，優(yōu)化的控制器實(shí)現(xiàn)了兩位數(shù)納秒延遲，并最小化了讀/寫(xiě)延遲。

這種模式在另一張圖中也很明顯，該圖顯示了在GPU內(nèi)核執(zhí)行期間記錄的IPC值。它表明，Panmnesia的CXL-Opt性能速度分別比UVM和CXL-Proto快3.22倍和1.65倍。

最后

總體而言，CXL支持可以為AI/HPC GPU做很多事情，但性能問(wèn)題仍是一個(gè)大問(wèn)題。

此外，英偉達(dá)官方是否會(huì)讓GPU增加對(duì)這種CXL方案的支持也是一個(gè)問(wèn)題。

如果使用PCIe連接的內(nèi)存來(lái)擴(kuò)展GPU的方法確實(shí)能落地的話，互聯(lián)網(wǎng)巨頭們會(huì)采用Panmnesia的方案嗎？畢竟這些巨頭都喜歡自己搞類似的技術(shù)。

原文作者：Anton Shilov

原文地址如下:

https://www.tomshardware.com/pc-components/gpus/gpus-get-a-boost-from-pcie-attached-memory-that-boosts-capacity-and-delivers-double-digit-nanosecond-latency-ssds-can-also-be-used-to-expand-gpu-memory-capacity-via-panmnesias-cxl-ip

分享到

zhupb

相關(guān)推薦

近期文章

熱門(mén)標(biāo)簽