傳統(tǒng)SAN/NAS存儲(chǔ)的硬件架構(gòu)采用“控制器+硬盤(pán)柜”的方式。中高端存儲(chǔ)支持多個(gè)控制器,以保障高可用并提高性能。多控制器為緊耦合,通過(guò)PCIE總線或Infiniband網(wǎng)絡(luò)互連,共享磁盤(pán)陣列,共享緩存。
傳統(tǒng)存儲(chǔ)的系統(tǒng)架構(gòu)具有I/O路徑短,訪問(wèn)延遲小的優(yōu)勢(shì)。傳統(tǒng)存儲(chǔ)通過(guò)內(nèi)置BBU電池或外置的UPS來(lái)實(shí)現(xiàn)掉電保護(hù),保障緩存中的數(shù)據(jù)在掉電后不丟失,結(jié)合雙活、容災(zāi)、CDP等技術(shù)保障業(yè)務(wù)系統(tǒng)的連續(xù)性和數(shù)據(jù)安全性。
傳統(tǒng)集中式存儲(chǔ)起步早,技術(shù)成熟,架構(gòu)簡(jiǎn)單,表現(xiàn)出足夠的穩(wěn)定性,對(duì)高IOPS、低延時(shí)、和數(shù)據(jù)強(qiáng)一致性有很好支持。另外,近年來(lái)全閃存陣列存儲(chǔ)發(fā)展迅速,IOPS性能提高到機(jī)械硬盤(pán)存儲(chǔ)的100倍以上,能夠有效解決IOPS性能痛點(diǎn)。
傳統(tǒng)集中式存儲(chǔ)的特性適合作為金融/醫(yī)療等核心業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫(kù)存儲(chǔ)。
傳統(tǒng)存儲(chǔ)的系統(tǒng)架構(gòu)決定了其擴(kuò)展能力有限,無(wú)法很好支撐高并發(fā)訪問(wèn)性能。隨著我們進(jìn)入大數(shù)據(jù)時(shí)代,集中式存儲(chǔ)增長(zhǎng)空間越來(lái)越有限。
分布式存儲(chǔ)
企業(yè)不斷快速增長(zhǎng)的海量數(shù)據(jù),需要更有彈性可擴(kuò)展的存儲(chǔ)架構(gòu)。
分布式存儲(chǔ)是新興的存儲(chǔ)技術(shù),采用“標(biāo)準(zhǔn)的x86服務(wù)器硬件+存儲(chǔ)軟件”的架構(gòu),將標(biāo)準(zhǔn)X86/ARM服務(wù)器通過(guò)高速以太網(wǎng)或Infiniband互連,通過(guò)分布式存儲(chǔ)軟件將服務(wù)器本地的HDD、SSD等存儲(chǔ)介質(zhì)組織成統(tǒng)一的大規(guī)模存儲(chǔ)資源池。分布式存儲(chǔ)實(shí)現(xiàn)了存儲(chǔ)的硬件與軟件解耦,數(shù)據(jù)中心能夠以標(biāo)準(zhǔn)化硬件搭建存儲(chǔ)平臺(tái),提升IT敏捷性,降低運(yùn)維成本,符合軟件定義數(shù)據(jù)中心的發(fā)展趨勢(shì)。
分布式存儲(chǔ)也稱為軟件定義分布式存儲(chǔ)(SDS: Software Defined Storage)。
分布式存儲(chǔ)的存儲(chǔ)單元為x86/ARM服務(wù)器(也稱為節(jié)點(diǎn)),以標(biāo)準(zhǔn)2U 存儲(chǔ)服務(wù)器為例,前面板可插入12塊3.5寸硬盤(pán)。
硬盤(pán)的容量,有4TB\6TB\8TB\10TB\12TB\16TB等。
如果選擇10TB硬盤(pán),則單個(gè)節(jié)點(diǎn)的物理容量為 12 * 10 = 120TB。
分布式存儲(chǔ)有效解決了傳統(tǒng)集中式存儲(chǔ)的可擴(kuò)展性問(wèn)題,規(guī)??蓴U(kuò)展至上千個(gè)節(jié)點(diǎn),容量擴(kuò)展到上百PB甚至EB級(jí),性能隨容量線性提升。按需在線擴(kuò)容后,自動(dòng)實(shí)現(xiàn)數(shù)據(jù)再均衡。分布式存儲(chǔ)的多個(gè)存儲(chǔ)節(jié)點(diǎn)能夠同時(shí)提供讀寫(xiě)服務(wù),因此具有很高的吞吐率,可達(dá)到幾十GB/s。
分布式存儲(chǔ)支持3種存儲(chǔ)功能,能夠打造統(tǒng)一的數(shù)據(jù)存儲(chǔ)平臺(tái):
SAN塊存儲(chǔ),SCSI/iSCSI接口協(xié)議
NAS文件存儲(chǔ),CIFS/NFS接口協(xié)議
對(duì)象存儲(chǔ),S3接口協(xié)議
分布式存儲(chǔ)使用多副本和糾刪碼技術(shù)實(shí)現(xiàn)數(shù)據(jù)保護(hù)。多副本方式(業(yè)界常用的多副本方式一般為2副本或3副本),其優(yōu)點(diǎn)是可靠性高,性能高;但缺點(diǎn)是存儲(chǔ)容量有效利用率低(2副本為50%,3副本為33%)。業(yè)界常用的糾刪碼配置方式一般為8+4(8個(gè)數(shù)據(jù)塊,4個(gè)校驗(yàn)塊,容量利用率為66%)。糾刪碼的優(yōu)點(diǎn)是可靠性高,容量利用率高,缺點(diǎn)是性能低。
一般選擇原則是:
在線存儲(chǔ)設(shè)備用多副本;備份歸檔用糾刪碼;
小文件用多副本;大文件用糾刪碼。
目前,國(guó)內(nèi)有多種分布式存儲(chǔ)產(chǎn)品可以選擇,包括開(kāi)源軟件、基于開(kāi)源軟件優(yōu)化的產(chǎn)品、國(guó)產(chǎn)研發(fā)的分布式存儲(chǔ)產(chǎn)品等。
上海霄云研發(fā)的碧海分布式存儲(chǔ),性能優(yōu)異,解決了海量小文件存儲(chǔ)的痛點(diǎn),性能達(dá)到傳統(tǒng)集中式高端存儲(chǔ)和Ceph類(lèi)產(chǎn)品的3倍,文件數(shù)可達(dá)到百億級(jí)以上,為醫(yī)療PACS影像、金融電子票據(jù)、自動(dòng)駕駛、工業(yè)自動(dòng)化等海量數(shù)據(jù)場(chǎng)景提供了革新的存儲(chǔ)解決方案。
結(jié)語(yǔ)
綜上所述,分布式存儲(chǔ)是一種未來(lái)主流的存儲(chǔ)技術(shù),具備非常好的發(fā)展前景,但是分布式存儲(chǔ)并不能適應(yīng)所有的業(yè)務(wù)場(chǎng)景,需要根據(jù)實(shí)際的業(yè)務(wù)需求進(jìn)行合理選擇。