本月早些時(shí)候微軟亞洲研究院實(shí)習(xí)生李博杰曾在知乎上介紹了FPGA的技術(shù)特點(diǎn),其優(yōu)勢(shì)已是路人皆知。但在FPGA云服務(wù)器大規(guī)模應(yīng)用之前,大家需要思考的是它對(duì)產(chǎn)業(yè)鏈的影響是什么,如云服務(wù)商該如何部署FPGA云服務(wù)器?哪些業(yè)務(wù)適合放在FPGA云服務(wù)器上?它對(duì)開(kāi)發(fā)者帶來(lái)了什么樣的挑戰(zhàn)?(以下為雷鋒網(wǎng)對(duì)騰訊云FPGA團(tuán)隊(duì)的專訪。)

據(jù)介紹,騰訊云FPGA團(tuán)隊(duì)由騰訊云基礎(chǔ)產(chǎn)品中心、騰訊架構(gòu)平臺(tái)部組成的團(tuán)隊(duì),該主要負(fù)責(zé)FPGA云服務(wù)器的開(kāi)發(fā)。

FPGA云服務(wù)器是一個(gè)什么樣的概念?

專訪騰訊云FPGA團(tuán)隊(duì):FPGA云服務(wù)器給產(chǎn)業(yè)鏈帶來(lái)了哪些價(jià)值?

FPGA云服務(wù)器

FPGA云服務(wù)器,一方面它是屬于異構(gòu)計(jì)算平臺(tái)的硬件體系結(jié)構(gòu),通過(guò)并行計(jì)算方式,提高服務(wù)器計(jì)算性能、能效比和計(jì)算實(shí)時(shí)性,對(duì)應(yīng)用實(shí)現(xiàn)底層的硬件加速處理;另一方面,通過(guò)云服務(wù)提供給用戶,用戶可按需付費(fèi)使用FPGA,極大降低FPGA的使用成本。

以騰訊云為例,騰訊云已經(jīng)在國(guó)內(nèi)提供了第三方FPGA知識(shí)產(chǎn)權(quán)市場(chǎng),通過(guò)騰訊云服務(wù)市場(chǎng),F(xiàn)PGA開(kāi)發(fā)者和使用者可以實(shí)現(xiàn)高效交易;對(duì)于FPGA使用者而言,可以在此購(gòu)買(mǎi)已開(kāi)發(fā)并驗(yàn)證好的FPGA知識(shí)產(chǎn)權(quán)功能,可節(jié)約長(zhǎng)達(dá)數(shù)月的FPGA研發(fā)周期,同時(shí)采用按需使用的付費(fèi)模式,能最大化地幫助使用者節(jié)省硬件投入成本。

在FPGA云服務(wù)器中,CPU會(huì)被替代還是“CPU+FPGA”的異構(gòu)計(jì)算模式,它的優(yōu)勢(shì)是什么?

FPGA云服務(wù)器并不是要用FPGA替代CPU,而是要將一些CPU做不了的或者不擅長(zhǎng)的工作offload到FPGA,讓FPGA和CPU協(xié)同工作,是一個(gè)以FPGA為協(xié)處理器的異構(gòu)計(jì)算平臺(tái)。

FPGA獨(dú)特的架構(gòu)帶來(lái)了其他處理器無(wú)法比擬的優(yōu)勢(shì),主要體現(xiàn)在它在吞吐率,延遲,功耗和靈活性4個(gè)維度上達(dá)到了很好的平衡,不存在短板。

具體來(lái)講,F(xiàn)PGA跟CPU相比,吞吐率、延遲及單位功耗計(jì)算性能都有明顯的優(yōu)勢(shì);與GPU相比,則因?yàn)镕PGA很容易做到流水線并行和數(shù)據(jù)并行,因此能同時(shí)做到高吞吐和低延時(shí),而GPU幾乎只能做數(shù)據(jù)并行,因此延遲比較大;ASIC則因?yàn)樗拈L(zhǎng)開(kāi)發(fā)周期和低靈活性,很難適應(yīng)數(shù)據(jù)中心業(yè)務(wù)的變化,也很難完成硬件資源在不同業(yè)務(wù)中的分配和調(diào)度。

另外由于FPGA有高速SERDES等豐富的接口,而且能靈活控制實(shí)現(xiàn)的粒度和操作數(shù)據(jù),因此非常適合進(jìn)行協(xié)議處理和數(shù)據(jù)格式的轉(zhuǎn)換。比如說(shuō)FPGA可以很方便的接入以太網(wǎng)數(shù)據(jù),并對(duì)以太網(wǎng)包進(jìn)行用戶自定義的包過(guò)濾等處理,而其他處理器卻很難做到。

騰訊云使用的是哪家的FPGA芯片?如何部署,一臺(tái)服務(wù)器有多少FPGA?

目前騰訊云使用的芯片廠家包括業(yè)界主流的Xilinx和Intel兩大廠商。前期我們推出的FPGA實(shí)例是基于Xilinx芯片平臺(tái),基于Intel平臺(tái)的服務(wù)會(huì)盡快推出。

FPGA云服務(wù)器為了提高單臺(tái)服務(wù)器計(jì)算密度和加強(qiáng)FPGA之間通信,每臺(tái)服務(wù)器支持4個(gè)FPGA或8個(gè)FPGA配置,滿足用戶超大計(jì)算需求。一期針對(duì)簡(jiǎn)單業(yè)務(wù)場(chǎng)景,我們提供單機(jī)單實(shí)例的FPGA云服務(wù)器;針對(duì)更高性能需求的業(yè)務(wù)場(chǎng)景,我們近期也將提供單機(jī)多實(shí)例的FPGA云服務(wù)器。

什么業(yè)務(wù)/應(yīng)用場(chǎng)景適合使用FPGA云服務(wù)器?能否舉例說(shuō)明?

FPGA云化對(duì)整個(gè)FPGA行業(yè)來(lái)講有著革命性的影響,F(xiàn)PGA的云化大大降低了FPGA的使用門(mén)檻,完全不需要新的硬件定制,只需要比較少的投入就可以得到較高的收益。會(huì)使得之前一些不傾向于使用FPGA或不會(huì)使用FPGA的行業(yè)或者業(yè)務(wù)場(chǎng)景,現(xiàn)在重新審視是否需要用FPGA的優(yōu)勢(shì)來(lái)做點(diǎn)什么。

FPGA的優(yōu)勢(shì)是計(jì)算的高吞吐量、低延時(shí)、低功耗。

1.在機(jī)器學(xué)習(xí)領(lǐng)域、金融領(lǐng)域、大數(shù)據(jù)領(lǐng)域、基因檢測(cè)領(lǐng)域都存在比較大的數(shù)據(jù)量需要分析計(jì)算,這些是FPGA云服務(wù)器可以發(fā)揮高吞吐優(yōu)勢(shì)的領(lǐng)域。

2.網(wǎng)絡(luò)安全領(lǐng)域有更安全、更低延時(shí)的需求,這些場(chǎng)景也可以發(fā)揮FPGA低延時(shí)的優(yōu)勢(shì)。

3.超大規(guī)模圖像處理,這些圖片的處理都使用FPGA來(lái)進(jìn)行處理加速都可以得到滿意的效果。

4. 現(xiàn)在比較熱門(mén)的自然語(yǔ)言處理和語(yǔ)音識(shí)別這些也都是FPGA可以發(fā)揮優(yōu)勢(shì)的場(chǎng)景。
一言以蔽之,F(xiàn)PGA云化之后,F(xiàn)PGA的使用門(mén)檻降低,可以極大地拓寬FPGA的使用場(chǎng)景,這些需要我們所有人去進(jìn)一步探索。

如何滿足開(kāi)發(fā)者的需求?

IP(Intellectual Property)即知識(shí)產(chǎn)權(quán),是在FPGA設(shè)計(jì)中,使用Verilog等硬件描述語(yǔ)言開(kāi)發(fā)的功能模塊。一直以來(lái),F(xiàn)PGA行業(yè)內(nèi)的IP提供者和使用者缺乏一個(gè)公開(kāi)的交易平臺(tái)和信用保證機(jī)制,IP交易環(huán)節(jié)冗長(zhǎng),價(jià)格不透明,很難達(dá)成交易。

騰訊云現(xiàn)在的做法是為開(kāi)發(fā)者提供一個(gè)FPGA IP商店——騰訊云服務(wù)市場(chǎng),IP開(kāi)發(fā)者和IP提供商可以通過(guò)該IP商店為其他客戶無(wú)償或有償?shù)靥峁〧PGA IP和對(duì)應(yīng)的測(cè)試程序。當(dāng)然,這些IP都是基于騰訊FPGA的標(biāo)準(zhǔn)硬件來(lái)開(kāi)發(fā)定制的,IP的驗(yàn)證和測(cè)試可以很方便地在云平臺(tái)上完成,一個(gè)IP的交易可以由幾個(gè)月縮短到幾分鐘,提高交易效率,也使得IP交易變得更加透明;另外,騰訊云FPGA提供了FPGA的底層硬件支撐平臺(tái),類(lèi)似操作系統(tǒng)的部分功能,簡(jiǎn)化了開(kāi)發(fā)者對(duì)底層通用設(shè)備的訪問(wèn),比如DDR和PCIE這些通用設(shè)備,可以使開(kāi)發(fā)者更聚焦到業(yè)務(wù)功能的開(kāi)發(fā)。

從這一點(diǎn)來(lái)看,F(xiàn)PGA云化意義重大,可以推動(dòng)整個(gè)FPGA行業(yè)的發(fā)展,給FPGA產(chǎn)業(yè)鏈的各方都可以帶來(lái)收益。

與傳統(tǒng)的FPGA解決方案相比,F(xiàn)PGA云服務(wù)器的費(fèi)用有什么變化?整體有哪些區(qū)別?

專訪騰訊云FPGA團(tuán)隊(duì):FPGA云服務(wù)器給產(chǎn)業(yè)鏈帶來(lái)了哪些價(jià)值?

傳統(tǒng)FPGA 解決方案 :

硬件成本高:高服務(wù)器投資運(yùn)營(yíng)成本,F(xiàn)PGA 硬件交易價(jià)格不透明;

部署難度大:設(shè)計(jì)并大規(guī)模生產(chǎn)需要解決供應(yīng)鏈、制造工藝、可靠性測(cè)試等多個(gè)環(huán)節(jié),需耗費(fèi)數(shù)月甚至數(shù)年;

運(yùn)維成本高:為保障服務(wù)穩(wěn)定需承受高額的運(yùn)維IT成本 。
FPGA 云服務(wù)器:

使用成本低:您無(wú)需預(yù)先采購(gòu) FPGA 或采購(gòu)硬件資源來(lái)運(yùn)行 FPGA,騰訊云提供按需售賣(mài)的方式提供FPGA云服務(wù)器,您可按需購(gòu)買(mǎi),無(wú)需投入大量資金購(gòu)置物理服務(wù)器;

部署時(shí)間短:部署開(kāi)發(fā)時(shí)間從數(shù)年或數(shù)月縮減到數(shù)天;

運(yùn)維成本低:低服務(wù)器運(yùn)維成本,避免本地?cái)?shù)據(jù)中心開(kāi)發(fā) FPGA 無(wú)差別的繁重工作,助您有效降低基礎(chǔ)設(shè)施建設(shè)人力和成本投入。

之前在微信、QQ等業(yè)務(wù)上已經(jīng)有應(yīng)用,為何選擇在這個(gè)時(shí)候?qū)ν忾_(kāi)放?

我們目前內(nèi)部業(yè)務(wù)如微信和QQ等在FPGA的成功應(yīng)用,已經(jīng)驗(yàn)證了FPGA在互聯(lián)網(wǎng)業(yè)務(wù)中可以起到異構(gòu)加速的作用。對(duì)于行業(yè)來(lái)說(shuō),云是一種共享服務(wù)的思想,用戶不以占有的方式使用硬件和軟件,而是共享復(fù)用,因此大大降低了使用成本,提升了資源的使用效率。

FPGA云服務(wù)能給行業(yè)生態(tài)鏈各方帶來(lái)價(jià)值:

芯片原廠:不需要經(jīng)過(guò)層層代理,增加成本,而是可以通過(guò)云提供硬件板卡的服務(wù)。因?yàn)橛布y(tǒng)一采購(gòu)和維護(hù),也大大提升了穩(wěn)定性和可靠性。

IP提供商:可以把IP放到云平臺(tái)的市場(chǎng)中去,最終用戶使用時(shí),通過(guò)云平臺(tái)完成部署和交付,用戶不需要接觸可執(zhí)行文件(網(wǎng)表文件),因此不存在產(chǎn)權(quán)泄露的風(fēng)險(xiǎn)。這將鼓勵(lì)I(lǐng)P提供商提供更多的服務(wù)方式,可以提供按時(shí)長(zhǎng)計(jì)費(fèi),買(mǎi)斷計(jì)費(fèi),乃至試用版免費(fèi)等方式,用戶也可以迅速驗(yàn)證。

設(shè)計(jì)和開(kāi)發(fā):云提供框架方式,封裝了常用的系統(tǒng)級(jí)操作(DDR內(nèi)存的訪問(wèn)、DMA、PCIE設(shè)備控制等),可以支持硬件描述語(yǔ)言,也支持OPENCL以及類(lèi)似C的高級(jí)語(yǔ)言。提供通用的驅(qū)動(dòng)和調(diào)用庫(kù),不需要用戶編程。對(duì)高階用戶而言,也可以使用OPENCL或者硬件描述語(yǔ)言實(shí)現(xiàn)自己的功能。
正是云對(duì)FPGA行業(yè)的顛覆、革命和價(jià)值,所以我們通過(guò)云端開(kāi)放FPGA計(jì)算服務(wù),把FPGA作為云端基礎(chǔ)架構(gòu)的一部分,從硬件層面加速云計(jì)算在各個(gè)場(chǎng)景中的應(yīng)用,降低大中小型企業(yè)以及用戶的使用門(mén)檻和成本。

如何看待云服務(wù)商開(kāi)始推FPGA解決方案?騰訊云與其它云服務(wù)企業(yè)的方案有何區(qū)別?

我們樂(lè)于看到更多企業(yè)提供FPGA的云服務(wù),共同加速各行各業(yè)使用FPGA的進(jìn)程,加快完善FPGA生態(tài)圈。

總結(jié)來(lái)看,這次FPGA的發(fā)布,騰訊云在業(yè)內(nèi)有幾點(diǎn)領(lǐng)先的差異化優(yōu)勢(shì):例如,騰訊云的FPGA技術(shù)已經(jīng)在騰訊的QQ、微信業(yè)務(wù)中長(zhǎng)期部署和驗(yàn)證。騰訊云通過(guò)解決FPGA云服務(wù)器的部署、知識(shí)產(chǎn)權(quán)(IP)提供者分享IP以及應(yīng)用程序開(kāi)發(fā)者購(gòu)買(mǎi)IP三大問(wèn)題,用于建設(shè)與完善FPGA開(kāi)發(fā)者生態(tài)。

另外值得一提的是,騰訊云和業(yè)界兩大FPGA 廠商(Xilinx 和 Intel)保持著有良好的關(guān)系,這也可以方便開(kāi)發(fā)者選擇自己熟悉的開(kāi)發(fā)模式,避免切換平臺(tái)。

騰訊云接下來(lái)有什么規(guī)劃?

接下來(lái),一方面在硬件機(jī)型上,我們會(huì)推出一臺(tái)服務(wù)器具有多個(gè)FPGA,提供更大的硬件加速性能;另一方面,在軟件層面上,我們進(jìn)一步完善FPGA開(kāi)發(fā)框架,該開(kāi)發(fā)框架支持 C/C++、OpenCL、Verilog/VHDL等開(kāi)發(fā)語(yǔ)言,F(xiàn)PGA 開(kāi)發(fā)人員可以選擇自己熟悉的語(yǔ)言方式進(jìn)行 FPGA 邏輯設(shè)計(jì)。同時(shí),該開(kāi)發(fā)框架提供類(lèi)似操作系統(tǒng)的支持,可以方便訪問(wèn)DDR、使用DMA完成主機(jī)和FPGA之間通訊,開(kāi)發(fā)者只需關(guān)注面向應(yīng)用的邏輯設(shè)計(jì)。

為何FPGA云服務(wù)器逐漸受到了主流云服務(wù)商的青睞?是人工智能驅(qū)動(dòng)?這會(huì)是行業(yè)的必然趨勢(shì)?

騰訊云包括國(guó)內(nèi)外其他同行都在推FPGA云服務(wù)器,這是產(chǎn)業(yè)發(fā)展和市場(chǎng)需求的雙重驅(qū)動(dòng)。

一方面隨著芯片制程逼近理論極限,可以預(yù)見(jiàn)通用處理器(CPU)性能再也無(wú)法按照摩爾定律進(jìn)行增長(zhǎng),另一方面移動(dòng)互聯(lián)網(wǎng)帶來(lái)的數(shù)據(jù)增長(zhǎng)對(duì)計(jì)算性能要求超過(guò)了按“摩爾定律”增長(zhǎng)的速度,比如騰訊內(nèi)部業(yè)務(wù)隨著移動(dòng)互聯(lián)網(wǎng)的快速增長(zhǎng),例如圖片數(shù)據(jù)體量的急劇膨脹,同時(shí)伴隨著對(duì)這些數(shù)據(jù)的計(jì)算需求也在迅猛上漲。從市場(chǎng)看,人工智能的發(fā)展也對(duì)數(shù)據(jù)的計(jì)算需求凸顯,也是另一個(gè)驅(qū)動(dòng)因素。

騰訊曾在2013年開(kāi)始考慮如何解決計(jì)算需求的增長(zhǎng),而FPGA作為一種可編程的加速硬件彼時(shí)進(jìn)入了大家的視野。騰訊內(nèi)部已經(jīng)對(duì)FPGA技術(shù)展開(kāi)了多年的研究,可以確定的是,F(xiàn)PGA在數(shù)據(jù)中心里可以提供強(qiáng)大的計(jì)算能力和足夠的靈活性應(yīng)對(duì)數(shù)據(jù)中心對(duì)硬件加速的挑戰(zhàn),把FPGA的技術(shù)積累服務(wù)推廣給更多的企業(yè),這也是騰訊云推出國(guó)內(nèi)首款高性能異構(gòu)計(jì)算基礎(chǔ)設(shè)施——FPGA云服務(wù)器的原因之一。

從全球看,亞馬遜等同行已經(jīng)使用FPGA在其公有云網(wǎng)絡(luò)中進(jìn)行了諸多積極嘗試,可以看出,F(xiàn)PGA在云服務(wù)領(lǐng)域已經(jīng)勢(shì)不可擋。

后記

騰訊云FPGA團(tuán)隊(duì)表示,在騰訊云公眾號(hào)發(fā)布后的幾小時(shí)內(nèi),他們收到了數(shù)百名開(kāi)發(fā)者的試用申請(qǐng)以及一些大客戶的咨詢。雖然,F(xiàn)PGA云服務(wù)器對(duì)大多數(shù)企業(yè)來(lái)說(shuō),還是一個(gè)相對(duì)陌生的概念,但從主流云服務(wù)廠商陸續(xù)開(kāi)放這一服務(wù)的趨勢(shì)來(lái)看,F(xiàn)PGA對(duì)數(shù)據(jù)中心將會(huì)越來(lái)越重要,而未來(lái)也會(huì)有更多的企業(yè)把業(yè)務(wù)部署在FPGA云服務(wù)器上。

分享到

zhangnn

相關(guān)推薦