RDMA有什么優(yōu)勢?

延遲低

參考上圖,傳統(tǒng)TCP/IP數(shù)據(jù)傳輸方式需要經(jīng)過大量協(xié)議層,RDMA通過Kernel Bypass方式可以避免那些開銷。市場上在售的Mellanox CX3 PCIe3 FDR HCA延遲小于1ms。

高帶寬

經(jīng)過測試,Mellanox CX3 PCIe3 FDR HCA 帶寬可以超過50Gbps。

低CPU使用率

由于RDMA減少大量內(nèi)核協(xié)議處理工作,數(shù)據(jù)實現(xiàn)零拷貝,因此計算機CPU使用率可以大大減少。

RDMA可用方案:

基于以太網(wǎng)(iWARP)

基于聚合網(wǎng) (RDMA over Converged Network)

基于Infiniband (RDMA over infiniband)

RDMA常見應(yīng)用場景:

RDMA常見使用場景包括:HPC高性能計算,集群數(shù)據(jù)庫(IBM DB2 pureScale和Oracle ExaData/RAC),分布式文件系統(tǒng)(IBM GPFS和Lustre和Red Hat Storage Gluster),分布式Cache(Dell RNA),金融領(lǐng)域和大數(shù)據(jù)(Hadoop:Mellanox加速器)

vSphere可選 RDMA方案:

全功能模式DirectPath I/O passthrough

SR-IOV VF模式的DirectPath I/O passthrough

半虛擬化的RDMA HCA(vRDMA)

前兩種方案現(xiàn)在已經(jīng)可用,第三種方案還在開發(fā)中。

vMotion與RDMA:

vMotion是vSphere專門提供用于虛擬機在線遷移的功能,現(xiàn)有方案基于TCP/IP協(xié)議。由于虛擬機遷移最大的問題是需要在兩臺ESX/ESXi服務(wù)器之間同步虛擬機的內(nèi)存,因此當(dāng)虛擬機內(nèi)存很大, 而且業(yè)務(wù)很繁忙時,虛擬機在線遷移會對ESX/ESXi服務(wù)器性能產(chǎn)生嚴(yán)重挑戰(zhàn)。如果vMotion基于RDMA,可以在遷移過程實現(xiàn)數(shù)據(jù)零拷貝、低延遲、消除內(nèi)核中TCP/IP的協(xié)議開銷。

測試項目

SPECjbb2005 50GB workload

測試環(huán)境

Two HP ProLiant ML 350 G6 machines, 2x Intel Xeon (E5520, E5620), HT enabled, 60 GB RAM

Mellanox 40GbE RoCE cards •ConnectX-2 VPI PCIe 2.0 x8, 5.0 GT/s

56 GB, 4 vCPU Linux VM

測試結(jié)果

通過測試可以發(fā)現(xiàn),基于RDMA在線遷移對比TCP/IP可以節(jié)省36%時間,帶寬性能提升30%,遷移過程中源ESX服務(wù)器CPU使用率下降92%,目的ESX服務(wù)器CPU使用率下降84%。

分享到

huanghui

相關(guān)推薦