Alveo U55C支持RoCE v2、DCBx、MPI在現(xiàn)有網(wǎng)絡(luò)和基礎(chǔ)架構(gòu)上為數(shù)據(jù)中心提供了最尖端的計(jì)算集群,支持現(xiàn)有應(yīng)用開發(fā)人員利用Vitis平臺(tái)上的已有的API、庫(kù)及MPI來(lái)擴(kuò)展其工作負(fù)載。Alveo U55C也藉此成為賽靈思有史以來(lái)功能最強(qiáng)大的加速器卡。

 “Alveo U55C的問(wèn)世,意味著數(shù)據(jù)中心的計(jì)算擴(kuò)展比以往任何時(shí)候都更加容易、更加高效,更易于進(jìn)行組合和配置,也標(biāo)志著賽靈思在數(shù)據(jù)中心領(lǐng)域又邁出了一大步?!?1月3日,賽靈思數(shù)據(jù)中心事業(yè)部HPC產(chǎn)品經(jīng)理Nathan Chang先生告訴筆者。

賽靈思數(shù)據(jù)中心事業(yè)部HPC產(chǎn)品經(jīng)理Nathan Chang先生

統(tǒng)一軟件平臺(tái)Vitis的功能不斷完善

賽靈思專門針對(duì)那些重要而且新興的技術(shù)領(lǐng)域不斷拓展自己的工具,以解鎖計(jì)算性能。Vitis就是一個(gè)典型的代表。

基于堆棧架構(gòu)之上的Vitis是賽靈思兩年前免費(fèi)提供給所有開發(fā)者的一個(gè)統(tǒng)一軟件平臺(tái)。這個(gè)全面的內(nèi)核開發(fā)套件包括Vitis AI 開發(fā)環(huán)境、Vitis 加速庫(kù)和Vitis Core 開發(fā)套件,可無(wú)縫構(gòu)建加速的應(yīng)用。

伴隨Alveo U55C的問(wèn)世,Vitis支持更多高層次的,諸如支持主流AI框架的編程語(yǔ)言。也就是說(shuō),賽靈思擁有CPU、GPU難以實(shí)現(xiàn)的性能優(yōu)勢(shì),如實(shí)現(xiàn)“圖分析”的功能,以及像有限元分析等系列先進(jìn)的HPC工作負(fù)載,在特定領(lǐng)域的API和庫(kù)加速關(guān)鍵功能。

Vitis還可幫助開發(fā)者結(jié)合硬件抽象出開發(fā)機(jī)器級(jí)代碼的需要,如RTL或者Verilog,讓硬件設(shè)計(jì)嵌入到整個(gè)應(yīng)用的開發(fā)過(guò)程中,直接在熟悉的更高層次框架中進(jìn)行開發(fā)。由于Vitis涵蓋了主要的計(jì)算和高性能計(jì)算方面的工作需求,特別是一些實(shí)時(shí)應(yīng)用?,F(xiàn)在進(jìn)行工作負(fù)載設(shè)計(jì)和加速,比過(guò)去要更加容易和自如。

功耗是數(shù)據(jù)中心的一個(gè)大挑戰(zhàn)。高性能往往意味著高功耗。雖然FPGA卡中的佼佼者U55C加速器卡提供了優(yōu)秀的能耗比,但賽靈思并沒有滿足于此。

目前Alveo U55C還離不開PCIe插槽,需要接到服務(wù)器的機(jī)架或主機(jī)上。但越來(lái)越多的HPC集群正在利用更多的專業(yè)化加速器開展工作,而不必像過(guò)去那樣需要龐大的服務(wù)器與CPU。這有利于整個(gè)HPC服務(wù)器集群功耗的降低。

盡管賽靈思不認(rèn)為會(huì)在這樣領(lǐng)域進(jìn)行競(jìng)爭(zhēng),但是FPGA已經(jīng)做到了低功耗。同時(shí),賽靈思在存儲(chǔ)器結(jié)構(gòu)以及相關(guān)的技術(shù)方面有著巨大的實(shí)力,嫁接到平臺(tái)上以后將進(jìn)一步降低功耗。

Alveo U55C的“C”代表著“計(jì)算”,很快,一款后面代碼有“N”的加速器卡也將亮相,這個(gè)“N”就代表聯(lián)網(wǎng)。

展示Alveo U55C的生態(tài)合作與行業(yè)實(shí)踐

Alveo U55C發(fā)布之前,已經(jīng)在一些企業(yè)得到了率先試用;在部分公有云和特定的數(shù)據(jù)中心也進(jìn)行了評(píng)估和測(cè)試。

澳大利亞國(guó)家實(shí)驗(yàn)室(CSIRO)正在構(gòu)建世界上最大的射電天文天線陣列,每平方公里有13.1萬(wàn)支天線。其規(guī)模是21個(gè)節(jié)點(diǎn),采用了420張U55C卡(每個(gè)節(jié)點(diǎn)是20張卡),在集群里每秒的數(shù)據(jù)傳輸量達(dá)到了15TB。盡管要處理和通過(guò)的數(shù)據(jù)量如此龐大,此之上還需要處理比如光線生成模擬器以及成像相關(guān)功能等非常復(fù)雜的工作負(fù)載,再加上實(shí)驗(yàn)室建設(shè)在沙漠中、其電源多是來(lái)自于可再生能源的供應(yīng)(僅以一個(gè)柴油機(jī)作為后備能源儲(chǔ)備),因此,在這樣的環(huán)境中實(shí)現(xiàn)高性能、低功耗成為挑戰(zhàn)。

在此之前,CSIRO也考慮過(guò)用GPU卡搭建集群,但這樣做需要雙插槽GPU卡,占用兩個(gè)PCIe接口,同時(shí)也需要每個(gè)CPU旁的插槽來(lái)處理相關(guān)帶寬,才能為板卡提供支持,僅此就需要三個(gè)PCIe插槽。

Alveo U55C的應(yīng)用,有效化解了上述難題。

另一個(gè)典型的案例,是與Alveo U55C的合作。

日常工作和生活中,數(shù)據(jù)往往分布在不同的孤島上,數(shù)據(jù)量越大,孤島也越來(lái)越多,成為惡性循環(huán)。要把尋求不同孤島上數(shù)據(jù)之間的聯(lián)系,不僅難度大,而且數(shù)據(jù)處理時(shí)間較長(zhǎng),影響用戶體驗(yàn)。

圖數(shù)據(jù)庫(kù)作為一項(xiàng)顛覆性的平臺(tái),能夠?qū)?shù)據(jù)從孤島里提取出來(lái),幫助數(shù)據(jù)科學(xué)家快速獲取數(shù)據(jù)之間的關(guān)系,因此其市場(chǎng)前景看好;Gartner預(yù)測(cè),到2025年有80%的數(shù)據(jù)庫(kù)將會(huì)是圖數(shù)據(jù)庫(kù)。

TigerGraph與賽靈思合作,引領(lǐng)了該領(lǐng)域的一項(xiàng)潮流:通過(guò)將余弦相似性和Louvain模塊度作為用戶定義的函數(shù),數(shù)據(jù)工程師和科學(xué)家借助賽靈思驅(qū)動(dòng)推薦引擎和集群這兩個(gè)算法并在U55C加速卡上加速,可以獲得數(shù)據(jù)驅(qū)動(dòng)實(shí)時(shí)應(yīng)用的關(guān)鍵算法。

應(yīng)用在醫(yī)療機(jī)構(gòu),在對(duì)患者數(shù)據(jù)進(jìn)行歸納再對(duì)關(guān)鍵的特征矢量化,個(gè)性化的診療和護(hù)理奠定基礎(chǔ)。這樣,即使是上億規(guī)模的患者資源,呼叫等待的時(shí)間也可以從分鐘級(jí)降低到毫秒級(jí),不同的呼入電話還可以得到針對(duì)性的建議,此舉不僅降低了呼叫中心巨量的運(yùn)營(yíng)成本,保險(xiǎn)公司也獲益不小。

大量的欺詐性的交易為銀行乃至整個(gè)系統(tǒng)帶來(lái)的損失不可估量。。在Alveo上運(yùn)行的TigerGraph,通過(guò)Louvain模塊度用戶定義的函數(shù)并重新設(shè)計(jì)算法,一舉變革了戲規(guī)則,讓質(zhì)量分?jǐn)?shù)提高35%,誤報(bào)率降至個(gè)位數(shù),加速率超過(guò)45倍的x86集群,客戶的信心大大提高。

談到與TigerGraph的 合作,Nathan Chang表示,雙方之間“關(guān)系非常非常棒,合作也非常成功”。賽靈思加速器卡和技術(shù)極有利于TigerGraph幫助客戶打造所需的解決方案。比如,一些最大的獨(dú)立集(Independent Set),又如更大規(guī)模的算法、需要更多的算力資源的案例,以及圖方面需要利用更大規(guī)模的存儲(chǔ)器架構(gòu)、更高規(guī)模的案例,未來(lái)賽靈思與TigerGraph在算法方面的合作還將繼續(xù)深入,一些在AI、圖、推理方面具有突破性的算法也將逐步推出。

巧合的是,筆者在兩年前的云棲大會(huì)上與TigerGraph的創(chuàng)始人Rick先生有過(guò)交流。此次采訪間隙,他回復(fù)了筆者的咨詢,對(duì)與賽靈思的合作也十分滿意,對(duì)未來(lái)高度期待。

Alveo U55C加速器卡已經(jīng)上市,賽靈思官網(wǎng)及分銷商處可以供貨。

分享到

xiesc

相關(guān)推薦