容器在生產(chǎn)環(huán)境的應(yīng)用的比例快速上漲,從2016年首次調(diào)查的23%,到2018年上漲到73%,實(shí)際到2020年已經(jīng)上漲到84%
云原生應(yīng)用正在引領(lǐng)各個(gè)應(yīng)用領(lǐng)域?qū)崿F(xiàn)云原生化,同時(shí)也在深刻改變著應(yīng)用服務(wù)的方方面面。存儲(chǔ)作為應(yīng)用運(yùn)行的基石,也在服務(wù)云原生化過程中提出了更多的需求。云原生存儲(chǔ)為了滿足云原生特性的要求,可用性、穩(wěn)定性、擴(kuò)展性、性能等核心能力都有大幅的優(yōu)化。
作為國(guó)內(nèi)最大的云產(chǎn)商,阿里云提供了豐富的云原生服務(wù)。和網(wǎng)絡(luò),計(jì)算的編排不同的是,存儲(chǔ)需要考慮如何無縫的接入到K8S中進(jìn)行編排和調(diào)度。K8S推出了CSI,通過統(tǒng)一的標(biāo)準(zhǔn)將存儲(chǔ)和K8S進(jìn)行了無縫的對(duì)接。本文討論云原生容器對(duì)存儲(chǔ)的挑戰(zhàn),面向云原生和容器等領(lǐng)域的發(fā)展,阿里云文件存儲(chǔ)不斷進(jìn)行云原生適配和演進(jìn),完美應(yīng)對(duì)云原生存儲(chǔ)挑戰(zhàn),阿里云NAS是容器存儲(chǔ)的自然選擇。
云原生帶來的存儲(chǔ)挑戰(zhàn)
新的企業(yè)負(fù)載/智能工作負(fù)載容器化、遷云、存儲(chǔ)方面遇到的性能、彈性、高可用、安全及生命周期等方面的問題,不但需要存儲(chǔ)產(chǎn)品層次的改進(jìn),還需要在云原生的控制/數(shù)據(jù)平面的改進(jìn),推進(jìn)云原生存儲(chǔ)和云存儲(chǔ)的演進(jìn)。
1.存儲(chǔ)性能挑戰(zhàn):云原生應(yīng)用在大數(shù)據(jù)分析、AI 等場(chǎng)景得到廣泛應(yīng)用,這些場(chǎng)景對(duì)存儲(chǔ)吞吐和IOPS的需求也非常高。通過容器集群,集中處理海量數(shù)據(jù),同時(shí)啟動(dòng)數(shù)千Pod,彈出海量Pod對(duì)共享文件系統(tǒng)進(jìn)行讀寫。重負(fù)載下導(dǎo)致時(shí)延增加,高延遲毛刺增多,讀寫穩(wěn)定性不足,同時(shí)云原生應(yīng)用的快速擴(kuò)容、極致伸縮等特性也會(huì)考驗(yàn)存儲(chǔ)服務(wù)在短時(shí)間內(nèi)迎接峰值流量的能力。
a.集中式高吞吐對(duì)共享存儲(chǔ)池沖擊:高性能計(jì)算場(chǎng)景中,集中處理批量數(shù)據(jù),同一個(gè)存儲(chǔ)集群中帶寬擠占,造成訪問質(zhì)量下降。
b.峰值吞吐不足:大規(guī)模數(shù)據(jù)處理,文件數(shù)目少,峰值吞吐高,請(qǐng)求密集,接近獨(dú)占集群的極限帶寬。
c.時(shí)延增加導(dǎo)致 GPU 等待:多機(jī)多卡 GPU 訓(xùn)練,讀密集型。時(shí)延增加導(dǎo)致 IOwait 和 GPU 等待。
2.存儲(chǔ)彈性挑戰(zhàn):云原生的極致彈性,給存儲(chǔ)在彈性方面帶來了新的挑戰(zhàn)。隨著云原生多元業(yè)務(wù)發(fā)展,數(shù)據(jù)庫如MySQL等擴(kuò)容,元數(shù)據(jù)管理應(yīng)用如Zookeeper等在線擴(kuò)容,本地盤存儲(chǔ)容量無法彈性擴(kuò)容。
3.存儲(chǔ)高可用挑戰(zhàn):應(yīng)用運(yùn)維、系統(tǒng)運(yùn)維時(shí),存儲(chǔ)隨容器遷移的穩(wěn)定性和可發(fā)現(xiàn)性挑戰(zhàn)。
4.存儲(chǔ)的安全挑戰(zhàn):面向的隔離性要求場(chǎng)景主要是多應(yīng)用共享,文件系統(tǒng)多租戶環(huán)境的容量配合,集群級(jí)文件系統(tǒng)共享訪問的權(quán)限控制。用戶應(yīng)用的全鏈路數(shù)據(jù)加密要求。
5.存儲(chǔ)的生命周期管理挑戰(zhàn):共享文件系統(tǒng)、緩存系統(tǒng)的聲明方式創(chuàng)建和刪除。
阿里云文件存儲(chǔ)如何來應(yīng)對(duì)這些挑戰(zhàn)
針對(duì)以上在新的計(jì)算模式下,存儲(chǔ)方面遇到的性能,彈性,高可用,安全,生命周期等方面的問題,不但是需要存儲(chǔ)產(chǎn)品層次的改進(jìn),更需要在云原生的控制/數(shù)據(jù)平面的改進(jìn),在不久的將來實(shí)現(xiàn)穩(wěn)定,安全,和效率并舉的云原生存儲(chǔ)。需要在云原生應(yīng)用層、存儲(chǔ)云產(chǎn)品層、底層存儲(chǔ)適配和存儲(chǔ)核心層都需要做相應(yīng)的改進(jìn)和提升才有可能提供更加穩(wěn)定,安全和高效的面向應(yīng)用的云原生存儲(chǔ)。
隨著云原生技術(shù)的發(fā)展,各個(gè)公有云廠商都開始對(duì)其云服務(wù)進(jìn)行云原生化改造或適配,提供更加敏捷、高效的服務(wù)來適應(yīng)云原生應(yīng)用的需求。阿里云存儲(chǔ)服務(wù)也在云原生應(yīng)用適配做了很多優(yōu)化,阿里云文件存儲(chǔ)支持 CSI 、Flexvolume存儲(chǔ)驅(qū)動(dòng)無縫的銜接了云原生應(yīng)用和存儲(chǔ)服務(wù)之間的數(shù)據(jù)接口。實(shí)現(xiàn)了用戶使用存儲(chǔ)資源時(shí)對(duì)底層存儲(chǔ)無感知,而專注于自己的業(yè)務(wù)開發(fā)。
文件存儲(chǔ)NAS為云原生提供了一個(gè)完全彈性和共享的文件系統(tǒng),按需使用,滿足云原生極致的彈性。文件存儲(chǔ)從性能,彈性,安全,生命周期管理等方面對(duì)云原生存儲(chǔ)進(jìn)行了打造和演進(jìn)。
1.在AI,大數(shù)據(jù)分析,高性能計(jì)算領(lǐng)域,阿里云文件系統(tǒng)分散工作負(fù)載多文件系統(tǒng)和多個(gè)存儲(chǔ)集群、多個(gè)可用區(qū)通過容器編排分散IO到多文件系統(tǒng)。支持客戶端本地只讀緩存技術(shù)、分布式存儲(chǔ),降低網(wǎng)絡(luò)延遲和IO、GPU等待時(shí)間。可以支持剛性交付數(shù)十GB吞吐的能力,提升算力。
2.彈性方面,NAS支持自由擴(kuò)縮容,按量付費(fèi),是完全托管的文件系統(tǒng)。極速型NAS提供了百us的延時(shí),在金融,互聯(lián)網(wǎng)等典型的突發(fā)彈性場(chǎng)景中,能夠在幾分鐘內(nèi)啟動(dòng)數(shù)千個(gè)容器,并完成數(shù)據(jù)的極速加載、卸載。
3.高可用方面,NAS支持容器快速Failover,同時(shí)支持存儲(chǔ)快照、備份等企業(yè)級(jí)特性。
4.在安全方面,支持全面的AD/ACL權(quán)限管理,支持配額,打造了統(tǒng)一命名空間,支持對(duì)海量pod間的IO進(jìn)行隔離和統(tǒng)一管理;文件存儲(chǔ)產(chǎn)品支持傳輸加密、落盤加密等功能。
5.面對(duì)海量數(shù)據(jù),提供了數(shù)據(jù)生命周期管理,自動(dòng)歸檔冷數(shù)據(jù),可以降低90%的用戶成本。
為什么選擇阿里云文件存儲(chǔ)作為容器存儲(chǔ)?
阿里云文件存儲(chǔ)NAS為非結(jié)構(gòu)化數(shù)據(jù)提供存儲(chǔ)服務(wù)。隨著云原生的快速發(fā)展,許多公司的容器化應(yīng)用程序使用NAS存儲(chǔ)數(shù)據(jù),有些甚至存儲(chǔ)PB級(jí)數(shù)據(jù)。阿里云在云原生布局上提供容器K8s服務(wù)(ACK)和彈性容器實(shí)例(ECI),容器實(shí)例使用NAS文件系統(tǒng)作為持久化存儲(chǔ)。容器存儲(chǔ)離不開共享文件存儲(chǔ)。
阿里云文件存儲(chǔ)是云原生、高可用、成本優(yōu)化的完全托管的文件系統(tǒng)。阿里云文件存儲(chǔ)有三款產(chǎn)品,通用型NAS,極速型NAS和并行文件系統(tǒng)CPFS。
阿里云NAS是容器存儲(chǔ)的自然選擇,因?yàn)樗且环N完全托管的服務(wù),配置簡(jiǎn)單,添加或刪除數(shù)據(jù)時(shí)自動(dòng)擴(kuò)展,和容器基礎(chǔ)架構(gòu)一樣靈活便捷。
通常,彼此共享數(shù)據(jù)的容器自然需要共享文件存儲(chǔ),長(zhǎng)期運(yùn)行的容器也可使用共享文件存儲(chǔ)應(yīng)對(duì)故障。阿里云文件存儲(chǔ)同時(shí)滿足容器應(yīng)用場(chǎng)景對(duì)持久化存儲(chǔ)彈性伸縮、靈活掛載、高性能的需求。此外,容器鏡像的配置文件或初始加載數(shù)據(jù)存儲(chǔ)可以在 NAS 文件存儲(chǔ)上實(shí)現(xiàn)共享,在容器批量加載時(shí)實(shí)時(shí)讀取,多 POD 間通過 NAS 共享持久化數(shù)據(jù),在 POD 故障時(shí)可以進(jìn)行故障切換。
隨著新技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)AI和基因處理等大量使用共享文件存儲(chǔ)。我們通??吹饺缦乱恍┦纠?/p>
總結(jié)
以容器和云原生計(jì)算被企業(yè)快速接納,Kubernetes 逐漸成為云原生時(shí)代的基礎(chǔ)設(shè)施,容器服務(wù)成為云原生時(shí)代基礎(chǔ)設(shè)施。新的工作負(fù)載推進(jìn)云原生存儲(chǔ)和云存儲(chǔ)的演進(jìn),云原生控制平面實(shí)現(xiàn)效率等方面的能力,從數(shù)據(jù)面提升存儲(chǔ)穩(wěn)定和減小安全隱患,云存儲(chǔ)繼續(xù)夯實(shí)性能,容量,彈性,密度等基礎(chǔ)能力,共建云原生環(huán)境下的存儲(chǔ)生態(tài)。
阿里云文件存儲(chǔ)是容器存儲(chǔ)的自然選擇,完美應(yīng)對(duì)云原生存儲(chǔ)在性能,彈性,高可用,安全,生命周期等方面的數(shù)據(jù)挑戰(zhàn)。阿里云基于云原生文件存儲(chǔ)技術(shù)的快速演進(jìn)將不斷賦能云原生和容器領(lǐng)域的快速發(fā)展。(轉(zhuǎn)載自阿里云,侵刪)