優(yōu)點(diǎn):實(shí)現(xiàn)簡單
缺點(diǎn):寫入性能會(huì)受到較大影響,因?yàn)槊看螌懭攵夹枰葟?fù)制數(shù)據(jù)
ROW 快照: ROW 快照則是在修改數(shù)據(jù)時(shí),將修改操作重定向到新的存儲(chǔ)區(qū)域,保持原始數(shù)據(jù)不變。
優(yōu)點(diǎn):寫入性能更高,因?yàn)闊o需復(fù)制原始數(shù)據(jù)
缺點(diǎn):讀取數(shù)據(jù)時(shí)可能需要查詢多個(gè)指針,導(dǎo)致讀取性能略有下降
“不可能完成的任務(wù)” —— 數(shù)據(jù)庫秒級(jí)備份恢復(fù)
當(dāng)前主流的開源數(shù)據(jù)庫產(chǎn)品以PostgreSQL還是MySQL為主,大多數(shù)是私有化部署,如果需要實(shí)現(xiàn)數(shù)據(jù)庫基于快照的備份恢復(fù)方案,大多數(shù)場(chǎng)景需要對(duì)接第三方存儲(chǔ)或者本地盤來實(shí)現(xiàn)。
本地盤(HDD或者SSD)方案一般會(huì)選用操作系統(tǒng)自帶的LVM來實(shí)現(xiàn)快照,而對(duì)接第三方存儲(chǔ)多數(shù)會(huì)架構(gòu)在ceph等分布式存儲(chǔ)的基礎(chǔ)上,使用ceph的快照。而無論是LVM還是Ceph,都是使用COW實(shí)現(xiàn)的快照,帶來的快照和克隆都是有大幅的性能下降風(fēng)險(xiǎn)。別說秒級(jí),就算小時(shí)級(jí)都達(dá)不到。
所以當(dāng)前私有化部署的數(shù)據(jù)庫大多數(shù)沒有基于快照克隆的太好的存儲(chǔ)解決方案,大多數(shù)第三方存儲(chǔ)方案由于快照實(shí)現(xiàn)的方案的各種局限性,也不能完全滿足數(shù)據(jù)庫秒級(jí)數(shù)據(jù)備份的需求,至此實(shí)現(xiàn)數(shù)據(jù)庫“秒級(jí)備份恢復(fù)”成為了一個(gè)“不可能完成的任務(wù)”。
主流云數(shù)據(jù)庫的技術(shù)實(shí)踐 —— “秒級(jí)備份恢復(fù)”
在公有云產(chǎn)品中數(shù)據(jù)庫的功能實(shí)現(xiàn)相較于私有部署場(chǎng)景具備更加完整的能力實(shí)現(xiàn),很多公有云數(shù)據(jù)庫都已經(jīng)具備或者接近“秒級(jí)備份恢復(fù)”的數(shù)據(jù)庫數(shù)據(jù)保護(hù)能力,我們基于行業(yè)的一些主流資料對(duì)于幾個(gè)主流的頭部云數(shù)據(jù)庫產(chǎn)品的數(shù)據(jù)備份恢復(fù)能力做了分析:
AWS:RDS 和 Aurora(基于COW優(yōu)化接近秒級(jí)備份恢復(fù)體驗(yàn))
RDS:AWS RDS 主要依賴于 EBS實(shí)現(xiàn)的快照來實(shí)現(xiàn)備份和恢復(fù)。
克隆:AWS RDS 的實(shí)例克隆主要通過“從快照還原”(Restore Snapshot)操作實(shí)現(xiàn),本質(zhì)上是數(shù)據(jù)的完全復(fù)制。
快照:EBS 快照是增量式的,僅存儲(chǔ)自上一個(gè)快照以來發(fā)生變化的數(shù)據(jù)塊。
PITR:RDS 的 PITR 結(jié)合了快照和事務(wù)日志,可以恢復(fù)到指定的某個(gè)時(shí)間點(diǎn)。
Aurora:AWS Aurora 采用了一種計(jì)算和存儲(chǔ)分離的架構(gòu),并在此基礎(chǔ)上實(shí)現(xiàn)了更高效的快照和克隆。
克?。篈urora 的克隆利用了“寫時(shí)復(fù)制”(Copy-on-Write,CoW)機(jī)制,只需創(chuàng)建指向共享存儲(chǔ)的元數(shù)據(jù)指針,無需拷貝數(shù)據(jù),因此速度極快。
快照:Aurora 快照實(shí)際上是在這個(gè)連續(xù)備份流中的元數(shù)據(jù)指針或標(biāo)記,是一個(gè) O(1) 操作。
PITR:Aurora 的 PITR 基于連續(xù)備份流,可以實(shí)現(xiàn)秒級(jí)恢復(fù)。
阿里云:RDS 和 PolarDB(基于高性能快照實(shí)現(xiàn)了秒級(jí)備份恢復(fù))
RDS:阿里云 RDS 與 AWS RDS 類似,也主要依賴于云盤的快照功能來實(shí)現(xiàn)備份和恢復(fù)。
克?。喊⒗镌?RDS 的克隆是通過將源實(shí)例的數(shù)據(jù)恢復(fù)到一個(gè)新實(shí)例來實(shí)現(xiàn)的,本質(zhì)上是一個(gè)還原操作,創(chuàng)建數(shù)據(jù)的完整副本。
快照:阿里云 RDS 的快照也是增量式的。
PITR:阿里云 RDS 的 PITR 同樣結(jié)合了快照和日志備份。
PolarDB:阿里云 PolarDB 的架構(gòu)與 AWS Aurora 類似,也采用了計(jì)算存儲(chǔ)分離的設(shè)計(jì),并實(shí)現(xiàn)了快速克隆和恢復(fù)。
克隆:PolarDB 利用其底層存儲(chǔ)的快照技術(shù)來實(shí)現(xiàn)快速克隆。
通過對(duì)比分析 AWS 和阿里云兩家基于自己不同的存儲(chǔ)快照能力實(shí)現(xiàn)的備份恢復(fù)效果,我們可以看到,主流云數(shù)據(jù)庫服務(wù)在利用快照技術(shù)提升數(shù)據(jù)備份恢復(fù)的效率和性能的方向已經(jīng)取得了一定的成績。
但是如何提升企業(yè)私有化部署場(chǎng)景的數(shù)據(jù)庫數(shù)據(jù)備份恢復(fù)能力呢?
數(shù)據(jù)庫秒級(jí)備份恢復(fù)的破局者:華瑞指數(shù)云的“ROW無損快照克隆”
在前文COW與ROW的實(shí)現(xiàn)原理中,可以看到,雖然 ROW 快照在寫入性能方面優(yōu)于 COW 快照,但通用的 ROW 實(shí)現(xiàn)方案通常會(huì)犧牲一定的讀取性能。而一些前沿的分布式數(shù)據(jù)庫廠商(比如:華瑞指數(shù)云),已經(jīng)實(shí)現(xiàn)了更先進(jìn)的“無損 ROW 快照”技術(shù),即在保證寫入性能的同時(shí),也實(shí)現(xiàn)了讀取性能的零損耗。在私有化部署場(chǎng)景讓客戶能夠擁有近乎完美的快照體驗(yàn)。
當(dāng)前華瑞指數(shù)云 WDS 基于自己的快照能力真正實(shí)現(xiàn)了“無損 ROW 快照克隆”技術(shù),克服了通用 ROW 快照的局限性,實(shí)現(xiàn)了真正的秒級(jí)快照和讀寫性能零損耗 。
讀寫零損耗: 傳統(tǒng)快照技術(shù)可能會(huì)對(duì)數(shù)據(jù)庫的讀寫性能產(chǎn)生一定的影響,而華瑞指數(shù)云WDS的“ROW無損快照”技術(shù),通過針對(duì)讀場(chǎng)景的針對(duì)性優(yōu)化,解決了ROW快照讀流程實(shí)現(xiàn)中的缺陷,真正能夠確保在快照創(chuàng)建和使用過程中,數(shù)據(jù)庫的讀寫性能始終如一,不會(huì)出現(xiàn)任何下降。
秒級(jí)快照: 通過快照實(shí)現(xiàn)流程的精細(xì)化實(shí)現(xiàn),華瑞指數(shù)云WDS實(shí)現(xiàn)的ROW快照真正支持以秒級(jí)的粒度創(chuàng)建快照,這意味著可以更加頻繁地備份數(shù)據(jù),實(shí)現(xiàn)更精細(xì)的數(shù)據(jù)恢復(fù),將數(shù)據(jù)丟失的風(fēng)險(xiǎn)降到最低。甚至單卷的快照個(gè)數(shù)可以達(dá)到數(shù)萬個(gè)級(jí)別。
靈活的備份策略: 由于華瑞指數(shù)云ROW快照技術(shù)的出色實(shí)現(xiàn),WDS高性能塊存儲(chǔ)產(chǎn)品也可以通過快照實(shí)現(xiàn)并支持多種數(shù)據(jù)備份策略,用戶可以根據(jù)自身的業(yè)務(wù)需求,靈活地設(shè)置備份頻率、保留時(shí)間和備份方式,實(shí)現(xiàn)定制化的數(shù)據(jù)保護(hù)。
秒級(jí)克隆:基于“無損快照”技術(shù),華瑞指數(shù)云WDS實(shí)現(xiàn)了數(shù)據(jù)庫的秒級(jí)克隆能力. 傳統(tǒng)數(shù)據(jù)庫克隆為了解決克隆卷讀寫性能折損的問題,需要進(jìn)行大量的數(shù)據(jù)拷貝來用Flatten功能與原快照解耦,耗時(shí)漫長,而華瑞指數(shù)云WDS只需秒級(jí)即可完成一個(gè)數(shù)據(jù)庫的克隆,由于讀寫性能真正做到了無損,無需再使用Flatten克隆來做大量的全量拷貝,極大地提升了數(shù)據(jù)庫的敏捷性。
通過以上的“無損 ROW 快照克隆”技術(shù),可以真正幫助私有化部署場(chǎng)景的數(shù)據(jù)庫對(duì)接華瑞指數(shù)云WDS存儲(chǔ)實(shí)現(xiàn)“秒級(jí)備份恢復(fù)”能力,可以讓企業(yè)用戶在私有化部署場(chǎng)景真正能夠體驗(yàn)公有云數(shù)據(jù)庫一樣的流暢的備份恢復(fù)效果。
實(shí)踐案例:PostgreSQL 數(shù)據(jù)庫的備份與恢復(fù)
IF Club 技術(shù)研討會(huì)上,蕭少聰老師帶來的主題分享《復(fù)刻云數(shù)據(jù)庫的高端特性:秒級(jí)克隆、備份與恢復(fù)》PPT 中還提供了 PostgreSQL 數(shù)據(jù)庫在使用 Ceph 和華瑞指數(shù)云 WDS 進(jìn)行備份和恢復(fù)的詳細(xì)操作步驟:
備份過程: 通過 pg_backup_start 和 pg_backup_stop 命令配合存儲(chǔ)系統(tǒng)的快照功能,實(shí)現(xiàn)數(shù)據(jù)庫的備份 。
恢復(fù)過程: 通過克隆快照并掛載到目標(biāo)服務(wù)器,實(shí)現(xiàn)數(shù)據(jù)庫的快速恢復(fù) 。
性能恢復(fù): Ceph 需要進(jìn)行 flatten 操作才能恢復(fù)性能,而華瑞指數(shù)云 WDS 無此步驟,恢復(fù)速度更快 。
秒級(jí)克隆:基于快照創(chuàng)建完整數(shù)據(jù)庫副本,無需全量拷貝。
PITR精準(zhǔn)恢復(fù):結(jié)合WAL日志,實(shí)現(xiàn)任意時(shí)間點(diǎn)數(shù)據(jù)回溯,誤差<1秒。
# 華瑞WDS克隆操作示例(3步完成)
cli_ts snap create –snap_name prod_snap –vol_name pg_main # 創(chuàng)建快照
cli_ts snap clone –vol_name pg_clone –snap_name prod_snap # 克隆快照
cli_ts vol attach –vol_name pg_clone –target nqn.2024-06.wds # 掛載克隆體
詳細(xì)流程可以參見《復(fù)刻云數(shù)據(jù)庫的高端特性:秒級(jí)克隆、備份與恢復(fù)》。(下載鏈接:https://ifclub.com.cn/details/1921836782856605698?t=1747099511716)
華瑞指數(shù)云WDS:定義新一代企業(yè)級(jí)數(shù)據(jù)庫存儲(chǔ)
華瑞指數(shù)云所有的產(chǎn)品能力無論是ROW無損快照,還是極致的低時(shí)延都得益于華瑞指數(shù)云先進(jìn)的存儲(chǔ)架構(gòu)能力,為數(shù)據(jù)庫應(yīng)用帶來了前所未有的靈活性和性能提升。在數(shù)字化轉(zhuǎn)型的浪潮中,企業(yè)對(duì)于數(shù)據(jù)庫的依賴日益加深。數(shù)據(jù)庫使用的傳統(tǒng)存儲(chǔ)架構(gòu)的種種局限性,如擴(kuò)展性瓶頸、性能瓶頸、資源浪費(fèi)等,已經(jīng)成為制約企業(yè)發(fā)展的桎梏。華瑞指數(shù)云WDS,作為一款創(chuàng)新的分布式存儲(chǔ)解決方案,旨在打破這些束縛,為企業(yè)級(jí)數(shù)據(jù)庫應(yīng)用帶來前所未有的自由度和效率提升。
高性能、無限擴(kuò)展的分布式存儲(chǔ):數(shù)據(jù)庫的“超強(qiáng)引擎”
華瑞指數(shù)云WDS不僅在快照和克隆方面表現(xiàn)出色,更具備卓越的存儲(chǔ)性能和擴(kuò)展能力,為數(shù)據(jù)庫應(yīng)用提供強(qiáng)大的支撐。
極致性能: 華瑞指數(shù)云WDS的性能經(jīng)過權(quán)威機(jī)構(gòu) SPC-1 的驗(yàn)證,IOPS 達(dá)到數(shù)千萬,延遲低至微秒級(jí)別,超越了眾多高端全閃存陣列,為數(shù)據(jù)庫應(yīng)用提供極致的性能體驗(yàn)。
線性擴(kuò)展: 華瑞指數(shù)云WDS的分布式架構(gòu)支持無限的線性擴(kuò)展,可以輕松應(yīng)對(duì)數(shù)據(jù)庫數(shù)據(jù)量的增長和業(yè)務(wù)規(guī)模的擴(kuò)大,滿足業(yè)務(wù)持續(xù)發(fā)展的需求。
全信創(chuàng)、純軟件定義: 華瑞指數(shù)云WDS實(shí)現(xiàn)了全棧的信創(chuàng)支持,滿足了對(duì)信息安全有較高要求的行業(yè)和場(chǎng)景的需求。同時(shí),純軟件定義的架構(gòu),可以靈活地部署在各種硬件平臺(tái)之上,降低用戶的采購成本和運(yùn)維復(fù)雜度。
數(shù)據(jù)庫與分布式存儲(chǔ)的深度融合:釋放數(shù)據(jù)潛能,定義新的能力邊界
華瑞指數(shù)云WDS與數(shù)據(jù)庫的結(jié)合,打破了傳統(tǒng)架構(gòu)的束縛,釋放了數(shù)據(jù)的巨大潛能,并能夠?qū)崿F(xiàn)一些過去只能在公有云數(shù)據(jù)庫產(chǎn)品上才能實(shí)現(xiàn)的高級(jí)能力,在私有云環(huán)境中為數(shù)據(jù)庫賦予了新的生命力。
高級(jí)能力普惠化: 華瑞指數(shù)云WDS將公有云上的數(shù)據(jù)庫高級(jí)能力,如彈性伸縮、多活容災(zāi)等,帶到私有云環(huán)境,讓更多的企業(yè)能夠享受到這些技術(shù)紅利,加速數(shù)字化轉(zhuǎn)型。
定義新的能力邊界: 通過分布式存儲(chǔ)帶來的高性能、無限擴(kuò)展能力,數(shù)據(jù)庫可以處理更大規(guī)模的數(shù)據(jù),支撐更復(fù)雜的業(yè)務(wù)場(chǎng)景,突破傳統(tǒng)數(shù)據(jù)庫的能力邊界,為企業(yè)帶來更大的創(chuàng)新空間。
結(jié)論
通過華瑞指數(shù)云WDS以其“無損快照克隆”技術(shù),真正可以實(shí)現(xiàn)數(shù)據(jù)庫的”秒級(jí)備份恢復(fù)“的能力,讓客戶在私有化部署場(chǎng)景一樣可以體驗(yàn)到云數(shù)據(jù)庫的備份恢復(fù)能力。結(jié)合華瑞指數(shù)云的各種高性能存儲(chǔ)能力,為企業(yè)級(jí)數(shù)據(jù)庫應(yīng)用帶來了革命性的變革。它不僅能夠滿足客戶對(duì)高性能、高擴(kuò)展性、高安全性的需求,更能夠賦能數(shù)據(jù)庫應(yīng)用,實(shí)現(xiàn)更多高級(jí)功能,助力企業(yè)在數(shù)字經(jīng)濟(jì)時(shí)代獲得更大的競(jìng)爭(zhēng)優(yōu)勢(shì)。
另外感謝IF Club 技術(shù)研討會(huì)為我們提供了一個(gè)深入了解數(shù)據(jù)庫備份恢復(fù)技術(shù)的平臺(tái)。通過對(duì)“快照”技術(shù)的剖析,以及對(duì)主流云數(shù)據(jù)庫服務(wù)實(shí)踐的探討,我們看到了數(shù)據(jù)保護(hù)領(lǐng)域正在發(fā)生的深刻變革。