據(jù)介紹,Alveo 加速器卡針對各種類型的應(yīng)用提供顯著的性能優(yōu)勢??蛻粼谶\行實時機器學(xué)習(xí)推斷以及視頻處理、基因組學(xué)、數(shù)據(jù)分析等關(guān)鍵的數(shù)據(jù)中心應(yīng)用時,有望以較低時延實現(xiàn)突破性的性能提升。就機器學(xué)習(xí)而言,Alveo U250實時推斷吞吐量比高端 CPU高出20 倍,相對于高端 GPU等固定功能的加速器,能讓 2 毫秒以下的低時延應(yīng)用性能提升 4 倍以上。此外,Alveo 加速器卡相對于 GPU 能將時延減少 3 倍,在運行實時推斷應(yīng)用時提供顯著的性能優(yōu)勢。數(shù)據(jù)庫搜索等一些應(yīng)用可從根本上得到加速,性能比 CPU 高90 倍以上。
Alveo 得到合作伙伴和 OEM 廠商生態(tài)系統(tǒng)的支持,OEM 廠商開發(fā)和認(rèn)證的關(guān)鍵應(yīng)用涵蓋 AI/ML、視頻轉(zhuǎn)碼、數(shù)據(jù)分析、金融風(fēng)險建模、安全和基因組學(xué)等。14 家生態(tài)系統(tǒng)合作伙伴開發(fā)完成的應(yīng)用可立即投入部署。這些生態(tài)系統(tǒng)合作伙伴包括以下公司:Algo-Logic Systems Inc、Bigstream、BlackLynx Inc.、CTAccel、Falcon Computing、Maxeler Technologies、Mipsology、NGCodec、Skreens、SumUp Analytics、Titan IC、Vitesse Data、VYUsync 和 Xelera Technologies。此外,頂級 OEM 廠商也在同賽靈思合作,認(rèn)證采用 Alveo 加速器卡的多個服務(wù)器 SKU,包括 Dell EMC、Fujitsu Limited 和 IBM 等,此外還有 OEM 廠商會加入進(jìn)來。
賽靈思的數(shù)據(jù)中心副總裁 Manish Muthal 指出:“ Alveo 加速器卡的推出進(jìn)一步推進(jìn)了賽靈思向平臺公司的轉(zhuǎn)型,使不斷增長的應(yīng)用合作伙伴生態(tài)系統(tǒng)以比以往更快的速度加速創(chuàng)新。我們很高興客戶對 Alveo 加速器的高度興趣,也很高興與我們的應(yīng)用生態(tài)系統(tǒng)展開合作,共同向客戶推出采用 Alveo 的各種可產(chǎn)品化的的解決方案?!?/p>
OEM 廠商對此次發(fā)布給予高度評價。
Dell EMC 服務(wù)器和基礎(chǔ)設(shè)施系統(tǒng)的產(chǎn)品管理和市場營銷高級副總裁 Ravi Pendekanti :“現(xiàn)代數(shù)據(jù)中心中基于 FPGA 的加速解決方案越來越受歡迎,這是因為可編程和可重編程的加速器能輕松滿足用戶需求。我們與賽靈思合作共同打造業(yè)界一流的加速解決方案,將讓來自視頻內(nèi)容流、風(fēng)險管理和金融服務(wù)等一系列不同應(yīng)用領(lǐng)域的客戶共同受益?!?/p>
富士通公司副總裁兼網(wǎng)絡(luò)產(chǎn)品副主任 Masaki Taniguchi :“富士通恭喜賽靈思發(fā)布其全新板級產(chǎn)品和解決方案。隨著無人駕駛、遠(yuǎn)程醫(yī)療、虛擬現(xiàn)實等 5G 使用案例的不斷發(fā)展,基于 COTS 服務(wù)器的 vRAN 應(yīng)用范圍有望在今后大幅擴展。富士通公司 和 富士通研究所(Fujitsu Laboratories Ltd.)正在一直與賽靈思合作,共同驗證 4G vRAN 系統(tǒng)中關(guān)鍵軟件功能的 3 倍性能提升。Fujitsu 期待通過將其 x86 服務(wù)器和賽靈思靈活應(yīng)變的加速板結(jié)合起來,打造功能強大的解決方案?!?/p>
HPE 的服務(wù)器全球業(yè)務(wù)部副總裁兼首席技術(shù)專家 Keith McAuliffe :“賽靈思標(biāo)準(zhǔn)加速板產(chǎn)品的發(fā)布激動人心,擴展了迅速崛起的推動高性能需求應(yīng)用發(fā)展的技術(shù)領(lǐng)域。我們期待著與賽靈思合作,將其技術(shù)推向市場,并幫助我們的客戶創(chuàng)造突破性的商業(yè)價值?!?/p>
IBM 認(rèn)知系統(tǒng)副總裁 Steve Sibley :“IBM 推出 Power Systems AC922 服務(wù)器,展現(xiàn)出我們能為企業(yè) AI 培訓(xùn)提供最佳平臺。IBM 認(rèn)識到,推斷技術(shù)是全面的端到端 AI 平臺的關(guān)鍵組成部分,POWER9 在數(shù)據(jù)移動領(lǐng)域的 I/O 帶寬領(lǐng)先地位與賽靈思新推出的 Alveo U200 加速器卡理想配對,為企業(yè)提供推斷技術(shù)?!?/p>
與所有賽靈思技術(shù)一樣,客戶能對硬件進(jìn)行重配置,從而針對工作負(fù)載遷移、新標(biāo)準(zhǔn)和更新的算法進(jìn)行優(yōu)化,而且無需支付替代產(chǎn)品衍生的成本。Xilinx Alveo U200 和 U250 加速器卡現(xiàn)已面向市場,起價 8995 美元,用戶也可選擇先在云端試用 Nimbix。
發(fā)布業(yè)界首款自適應(yīng)計算加速平臺?Versal
同時,賽靈思也宣布了 業(yè)界首款自適應(yīng)計算加速平臺 (Adaptive Compute Acceleration Platform ,ACAP)推出 Versal,為所有的開發(fā)者開發(fā)任何應(yīng)用開啟了一個快速創(chuàng)新的新時代。Versal ACAP 整合標(biāo)量處理引擎、自適應(yīng)硬件引擎和智能引擎以及前沿的存儲器和接口技術(shù),能為所有的應(yīng)用提供強大的異構(gòu)加速功能。不過,最重要的是, Versal ACAP 的硬件和軟件均可由軟件開發(fā)者、數(shù)據(jù)科學(xué)家和硬件開發(fā)者進(jìn)行編程和優(yōu)化,這要歸功于其符合業(yè)界標(biāo)準(zhǔn)設(shè)計流程的一系列工具、軟件、庫、IP、中間件和框架。
賽靈思產(chǎn)品及技術(shù)營銷高級總監(jiān)Kirk Saban介紹ACAP自適應(yīng)計算加速平臺Versal如致力于為所有開發(fā)者、所有應(yīng)用開啟快速創(chuàng)新新時代
Versal 產(chǎn)品組合基于 臺積電(TSMC)的 7 nm FinFET 工藝技術(shù),是第一個將軟件可編程性與特定領(lǐng)域硬件加速和靈活應(yīng)變能力相結(jié)合的平臺,這對于跟上當(dāng)今快速的創(chuàng)新步伐至關(guān)重要。該產(chǎn)品組合包括 6 個系列的器件,其獨特架構(gòu)針對云端、網(wǎng)絡(luò)、無線通信乃至邊緣計算和端點等不同市場的眾多應(yīng)用提供了可擴展性和 AI 推斷功能。
賽靈思軟件及IP產(chǎn)品執(zhí)行副總裁Salil Raje激情描繪靈活應(yīng)變的新型器件將如何加速當(dāng)今AI時代各種創(chuàng)新的整體應(yīng)用
賽靈思總裁及CEO Victor Peng 指出:“隨著 AI 和大數(shù)據(jù)的爆炸性發(fā)展以及摩爾定律的放緩,行業(yè)已經(jīng)走到了一個關(guān)鍵的轉(zhuǎn)折點。芯片設(shè)計的周期已經(jīng)無法跟上創(chuàng)新的腳步。Versal 歷經(jīng) 4 年的開發(fā),是業(yè)界首款 ACAP。我們對其進(jìn)行了獨特設(shè)計,支持所有類型的開發(fā)者通過優(yōu)化的軟硬件來為他們的整體應(yīng)用提速,同時具備即時的靈活應(yīng)變能力,從而能夠跟上科技快速發(fā)展的步伐。在業(yè)界需求最迫切的時刻 ACAP 雪中送炭?!?/p>
該產(chǎn)品組合包括 Versal 基礎(chǔ)系列( Versal Prime),Versal 旗艦系列 (Versal Premium旗艦)系列和 HBM 系列,能針對要求最嚴(yán)格的應(yīng)用提供業(yè)界領(lǐng)先的性能、連接性、帶寬和集成功能。此外,該產(chǎn)品組合還包括 AI 核心系列(AI Core),AI 邊緣系列 ( AI Edge) 和 AI 射頻系列(AI RF),采用突破性的 AI 引擎。AI 引擎是一種新型硬件模塊,專為解決各種應(yīng)用低時延 AI 推斷的新需求而設(shè)計,同時支持高級 DSP 實現(xiàn)方案,滿足無線和雷達(dá)等應(yīng)用要求。它與 Versal 自適應(yīng)硬件引擎緊密結(jié)合,支持整體應(yīng)用加速,也就是說軟硬件都能調(diào)節(jié),從而確保最高性能和效率。
該組合中率先亮相的是 Versal Prime 系列,跨多個市場提供廣泛的適用性,同時推出的還有 Versal AI Core 系列,相對于業(yè)界領(lǐng)先的 GPU[1],AI 推斷性能預(yù)計能提升 8 倍。
VERSAL AI 核心系列
Versal AI 核心系列提供該系列最高計算性能和最低時延,實現(xiàn)突破性的 AI 推斷吞吐量和性能。該系列針對云端、網(wǎng)絡(luò)和自動駕駛技術(shù)進(jìn)行了優(yōu)化,提供業(yè)界最廣泛的 AI 和工作負(fù)載加速功能。Versal AI 核心系列 有 5 款產(chǎn)品,提供 128 到 400 個 AI 引擎。該系列包括雙核 Arm Cortex-A72 應(yīng)用處理器、雙核 Arm Cortex-R5 實時處理器、256KB 片上 ECC 存儲器、超過 1900 個專為高精度低時延浮點運算而優(yōu)化的 DSP 引擎。此外,它還包括 190 多萬個系統(tǒng)邏輯單元以及超過 130Mb 的 UltraRAM、高達(dá) 34Mb 的塊 RAM 和 28Mb 分布式 RAM 和 32Mb 新加速器 RAM 塊,任何引擎都能直接訪問,這也是 Versal AI 系列的獨特之處,而且都能支持定制存儲器架構(gòu)。該系列還包括 PCIe Gen4 8 信道和 16 信道以及 CCIX 主機接口、功耗優(yōu)化型 32G SerDes、多達(dá) 4 個集成型 DDR4 存儲器控制器、多達(dá) 4 個多速率以太網(wǎng) MAC、650 個高性能 I/O(用于 MIPI D-PHY)、NAND、存儲級內(nèi)存接口和 LVDS、78 個多路復(fù)用 I/O(連接外部組件)和超過 40 個 HD I/O(3.3V 接口)。以上所有器件均通過業(yè)界一流的片上網(wǎng)絡(luò) (NoC) 實現(xiàn)互聯(lián),具有多達(dá) 28 個主/從端口,以低時延提供每秒多 Tb 帶寬,而且提供高功率效率和原生軟件的可編程性。完整的產(chǎn)品列表現(xiàn)已發(fā)布。
THE VERSAL PRIME 系列
Versal Prime 系列經(jīng)過精心設(shè)計,適用于多個市場的廣泛應(yīng)用,并針對各種工作負(fù)載的連接性和在線加速進(jìn)行了優(yōu)化。這款中端系列包括 9 款產(chǎn)品,每款產(chǎn)品都采用雙核 Arm Cortex-A72 應(yīng)用處理器、雙核 Arm Cortex-R5 實時處理器、256KB 片上存儲器(帶 ECC)、超過 4000 個專為低時延高精度浮點運算優(yōu)化的 DSP 引擎。此外,它還包括 200 多萬個系統(tǒng)邏輯單元,結(jié)合 200Mb 以上 UltraRAM、超過 90Mb 的塊 RAM 以及 30Mb 分布式 RAM,能支持定制存儲器架構(gòu)。該系列還包括 PCIe Gen4 8信道和 16 信道以及 CCIX 主機接口、功耗優(yōu)化型 32Gb 每秒的 SerDes 和主流 58Gb 每秒的 PAM4 SerDes、多達(dá) 6 個集成型 DDR4 存儲器控制器、多達(dá) 4 個多速率以太網(wǎng) MAC、700 個高性能 I/O(支持 MIPI D-PHY)、NAND、存儲級內(nèi)存接口和 LVDS、78 個多路復(fù)用 I/O(連接外部組件)和超過 40 個 HD I/O(3.3V 接口)。以上均通過業(yè)界一流的片上網(wǎng)絡(luò) (NoC) 實現(xiàn)互聯(lián),具有多達(dá) 28 個主/從端口,以低時延提供每秒多 Tb 帶寬,而且提供高功率效率和原生的軟件可編程性。完整的產(chǎn)品列表現(xiàn)已發(fā)布。
VERSAL 工具和軟件
Versal 產(chǎn)品組合得到開發(fā)環(huán)境支持,提供全面的軟件堆棧,包括驅(qū)動程序、中間件、庫和軟件框架支持。關(guān)于軟件編程工具的更多詳情將于明年發(fā)布。
賽靈思目前正通過早期試用計劃與多家關(guān)鍵客戶合作。Versal Prime 系列和 Versal AI Core 系列將于 2019 年下半年上市。