金山云CDN首席架構(gòu)師周超勇(中)和金山云技術(shù)總監(jiān)斯文(右一)

提升單臺(tái)設(shè)備服務(wù)能力

周超勇介紹說(shuō),金山云CDN業(yè)務(wù)增長(zhǎng)迅猛,儲(chǔ)備帶寬突破100Tbps規(guī)模。CDN行業(yè)是成本敏感型行業(yè),隨著帶寬的增長(zhǎng),成本壓力也越來(lái)越大,提高單臺(tái)設(shè)備的服務(wù)能力是金山云CDN研發(fā)團(tuán)隊(duì)的工作重心之一。

所謂單臺(tái)設(shè)備的服務(wù)能力,主要是指單臺(tái)設(shè)備所能提供的加速帶寬,而服務(wù)器透過(guò)帶寬輸出的數(shù)據(jù)流量往往受限于磁盤(pán)I/O,磁盤(pán)的帶寬低就算網(wǎng)卡再快也無(wú)濟(jì)于事。換言之,在CDN節(jié)點(diǎn)的服務(wù)器上,磁盤(pán)才是單臺(tái)服務(wù)器服務(wù)能力的瓶頸。

為了提高單臺(tái)服務(wù)器的服務(wù)能力,金山云選擇了英特爾今年新發(fā)布的第二代至強(qiáng)可擴(kuò)展處理器加上QLC NVMe SSD和25G網(wǎng)卡的解決方案,從計(jì)算能力到存儲(chǔ)能力都有大幅提升。

普通SATA HDD的混合讀寫(xiě)能力是40MB/s,普通SATA SSD的混合讀寫(xiě)能力是150MB/s的水平。金山云CDN實(shí)測(cè)發(fā)現(xiàn),混合讀寫(xiě)場(chǎng)景下,英特爾的QLC NVMe SSD讀性能達(dá)到3GB/s,寫(xiě)性能達(dá)到1GB/s,多盤(pán)加持下的單臺(tái)服務(wù)器IO能比較充分地發(fā)揮25G網(wǎng)卡的吞吐能力。

去年開(kāi)始,英特爾在市場(chǎng)上推出創(chuàng)新的QLC NVMe SSD,單GB容量成本(Price per GB)相對(duì)于TLC有了大幅下降。與此同時(shí),寫(xiě)壽命(DWPD)相對(duì)于TLC NAND也有所降低,金山云最初是有所顧慮的,但經(jīng)過(guò)了許多理論計(jì)算和真實(shí)業(yè)務(wù)測(cè)試,并且在軟件上采取了一系列優(yōu)化措施和技術(shù)革新后,最終有了QLC在CDN場(chǎng)景下的第一次突破性的應(yīng)用。

2019年8月,金山云在生產(chǎn)環(huán)境上線這一解決方案后發(fā)現(xiàn),單臺(tái)服務(wù)器的服務(wù)能力提升了四倍。雖然,單臺(tái)設(shè)備的成本有所增加,但是整體性?xún)r(jià)比以及服務(wù)質(zhì)量有了明顯提升。

降低CDN運(yùn)營(yíng)成本

單臺(tái)設(shè)備能力的提升不僅僅是提升性?xún)r(jià)比,更重要的是,新的方案能降低金山云CDN業(yè)務(wù)的運(yùn)營(yíng)成本,這點(diǎn)對(duì)于成本敏感型的CDN行業(yè)至關(guān)重要。

CDN行業(yè)IT資源方面的投入成本一部分是硬件購(gòu)置成本,而更主要的是另外一部分帶寬成本。帶寬成本主要分為兩部分,一部分是用戶(hù)訪問(wèn)邊緣節(jié)點(diǎn)產(chǎn)生的帶寬成本,為正常業(yè)務(wù)消耗,另一部分則是回源帶寬成本,通常由CDN廠商承擔(dān)。所謂回源帶寬成本是指CDN節(jié)點(diǎn)從源站獲取資源過(guò)程產(chǎn)生的帶寬成本。金山云CDN技術(shù)總監(jiān)斯文介紹說(shuō),金山云CDN使用QLC加上高端的CPU和網(wǎng)卡之后,可以建設(shè)更大的節(jié)點(diǎn),合并回源帶寬,從而減少回源帶寬成本。

CDN的基本原理是,每個(gè)CDN節(jié)點(diǎn)需要從源站獲取數(shù)據(jù)并緩存到本地,當(dāng)終端用戶(hù)需要這些數(shù)據(jù)的時(shí)候,網(wǎng)絡(luò)會(huì)直接從最近的CDN節(jié)點(diǎn)獲取數(shù)據(jù),用戶(hù)的加速體驗(yàn)會(huì)比較好。但是,當(dāng)用戶(hù)訪問(wèn)CDN節(jié)點(diǎn)上沒(méi)有的數(shù)據(jù)時(shí),就需要從源站獲取這些數(shù)據(jù),這就是回源,回源占用的帶寬是CDN廠商日常最耗費(fèi)成本的地方。

對(duì)于金山云CDN來(lái)說(shuō),單臺(tái)設(shè)備服務(wù)能力的提升,首先意味著同樣硬件配置的節(jié)點(diǎn)可以提供更高的網(wǎng)絡(luò)流量輸出能力;其次,從金山云CDN整體業(yè)務(wù)規(guī)劃和帶寬規(guī)模來(lái)看,單個(gè)CDN節(jié)點(diǎn)的服務(wù)能力有了質(zhì)的提升之后,就可以建設(shè)更大規(guī)模的節(jié)點(diǎn),滿(mǎn)足支撐100Tbps帶寬的成本要求,滿(mǎn)足低延遲、高吞吐量和業(yè)務(wù)全覆蓋的目標(biāo)。這就是金山云CDN選用第二代至強(qiáng)可擴(kuò)展處理器+QLC+25G網(wǎng)卡方案最終能降低成本、獲得競(jìng)爭(zhēng)力的原因。

或?qū)⒄饎?dòng)CDN行業(yè)

周超勇介紹說(shuō),在CDN上采用第二代至強(qiáng)可擴(kuò)展處理器加上QLC NVMe SSD和25G網(wǎng)卡的解決方案,在行業(yè)是一次顛覆,并且認(rèn)為未來(lái)可能會(huì)震動(dòng)CDN行業(yè),引發(fā)CDN市場(chǎng)版圖的變更。不過(guò),新硬件的引入存在一定的門(mén)檻。

周超勇表示,原來(lái)的瓶頸主要是硬件,而現(xiàn)在硬件的提升又給軟件帶來(lái)了很大的優(yōu)化空間。金山云CDN在英特爾專(zhuān)家的協(xié)助下克服來(lái)自包括軟件和硬件方面的多重挑戰(zhàn),已經(jīng)將單臺(tái)設(shè)備的服務(wù)能力提升了4倍,但同時(shí)也表示,這一結(jié)果離硬件能力的上限還有大約30%的距離,仍有很大空間去做優(yōu)化提升。

金山云CDN在技術(shù)上大概領(lǐng)先業(yè)內(nèi)一年。軟件優(yōu)化和革新體現(xiàn)了金山云CDN技術(shù)積累的優(yōu)勢(shì),這也是除了成本以外,金山云跟友商拉開(kāi)差距的地方,而新的硬件方案的引入可以幫助金山云CDN鞏固優(yōu)勢(shì)。

分享到

zhupb

相關(guān)推薦