Stratix 10 FPGA和SoC FPGA使用了英特爾14nm制程工藝

在發(fā)布的博客中,微軟詳細(xì)介紹了采用英特爾FPGA的Project Brainwave平臺(tái)如何以“前所未有”的高性能來(lái)靈活處理極具挑戰(zhàn)性的深度學(xué)習(xí)模型。微軟在2017年高效能芯片大會(huì)(Hot Chips 2017)上展示了基于FPGA的深度學(xué)習(xí)平臺(tái),該盛會(huì)主要展示半導(dǎo)體技術(shù)領(lǐng)域中的最新成就。微軟是第一家在其公有云基礎(chǔ)設(shè)施中部署FPGA的大型云服務(wù)提供商,而其通過(guò)英特爾Stratix 10 FPGA實(shí)現(xiàn)的技術(shù)進(jìn)步加速了深度神經(jīng)網(wǎng)絡(luò)(DNN),這種網(wǎng)絡(luò)可以通過(guò)概念類似的方式復(fù)制人類大腦的“思維”。

人工智能是一個(gè)快速發(fā)展的領(lǐng)域,需要多種技術(shù)來(lái)有效管理各種工作負(fù)載的需求。英特爾提供廣泛的技術(shù)以推動(dòng)市場(chǎng)演進(jìn),包括英特爾至強(qiáng)處理器,英特爾FPGA和英特爾Nervana ASIC技術(shù)。與那些為運(yùn)行單個(gè)工作負(fù)載而優(yōu)化的專用深度學(xué)習(xí)硬件加速器相比,英特爾FPGA的高度靈活性讓用戶可以自定義硬件以滿足特定的工作負(fù)載需求,并可以隨著深度學(xué)習(xí)工作負(fù)載和使用模式的更改而快速地重新配置硬件。英特爾Stratix 10 FPGA結(jié)合了硬化處理器模塊,這種模塊可提供高水平的持續(xù)性能和效率,并可根據(jù)用戶的自定義來(lái)靈活的編程。

許多硅人工智能加速器目前需要將多個(gè)請(qǐng)求分組(稱為“批處理”)以實(shí)現(xiàn)高性能。微軟的Project Brainwave平臺(tái)利用英特爾Stratix 10技術(shù),在單個(gè)請(qǐng)求上展示了超過(guò)每秒39萬(wàn)億次浮點(diǎn)運(yùn)算的性能,在云中確立了實(shí)時(shí)人工智能計(jì)算的新標(biāo)準(zhǔn)。Stratix 10 FPGA為實(shí)時(shí)人工智能計(jì)算確立了新的云性能標(biāo)準(zhǔn),具有創(chuàng)紀(jì)錄性的低延遲、高性能以及無(wú)需批量處理人工智能請(qǐng)求的多種特點(diǎn)。

微軟研究院NexT的著名工程師Doug Burger說(shuō):“我們利用英特爾FPGA的高度靈活性快速整合創(chuàng)新,同時(shí)提供與許多基于ASIC的深度學(xué)習(xí)處理單元相當(dāng)或更高的性能。微軟正努力在Azure云中部署Project Brainwave,以便客戶最終能夠以創(chuàng)紀(jì)錄式的高性能運(yùn)行復(fù)雜的深度學(xué)習(xí)模型?!?/p>

通過(guò)加速模型訓(xùn)練、快速評(píng)分和高度可擴(kuò)展的基礎(chǔ)設(shè)施,基于英特爾技術(shù)的機(jī)器學(xué)習(xí)平臺(tái)將數(shù)據(jù)轉(zhuǎn)化為可操作的商業(yè)智能。結(jié)合最新的英特爾至強(qiáng)可擴(kuò)展處理器,英特爾FPGA可自定義和編程以提供低延遲和靈活的精度,與單獨(dú)的英特爾?至強(qiáng)?處理器相比,在深度學(xué)習(xí)推理方面每瓦特功耗具有更高的性能。

分享到

xiesc

相關(guān)推薦