*以下為演講主要內容
金融關鍵系統(tǒng)規(guī)?;娲c成本困境
自2019年起,金融行業(yè)逐步推進安全、穩(wěn)定、可靠的信息化系統(tǒng)升級。吳良智認為,發(fā)展至今,金融數據庫呈現(xiàn)出兩大顯著特征:其一,替換升級已邁入深水區(qū),除外圍和非核心系統(tǒng)外,關鍵業(yè)務系統(tǒng)替換升級的步伐明顯加快,對產品的可用性和性能提出更高要求;其二,規(guī)模化替代階段全面開啟,原有“試點”階段高成本投入的方式難以適應規(guī)?;枨?市場亟需在性能、高可用性、兼容性、可靠性及綜合成本方面具備顯著優(yōu)勢的解決方案。
在演講中,吳良智分享了對金融關鍵業(yè)務系統(tǒng)規(guī)?;娲夹g路徑的理解。他指出,當前的解決方案雖有積極探索,但與規(guī)?;瘡椭迫杂幸恍┎罹?當前有四大不可忽視的挑戰(zhàn)。
首先是遷移與兼容性成本高。金融業(yè)務系統(tǒng)普遍依賴 PL/SQL 存儲過程、自定義函數、包等高級特性,這些與業(yè)務邏輯深度綁定的功能,現(xiàn)有解決方案如無法在語法規(guī)則、功能實現(xiàn)上實現(xiàn)高度兼容,將迫使金融機構投入巨大人力進行代碼重構與適配,不僅增加技術對接難度,更導致項目周期延長、改造成本飆升。
其次是產品性能瓶頸。基于開源二次開發(fā)的數據庫產品其單機內核性能天花板顯著,難以與國際主流數據庫匹敵,同時復雜查詢依賴的優(yōu)化器能力不足,成為數據處理效率的瓶頸;在事務密集型場景(如核心交易系統(tǒng))下,面臨時延和抖動問題。分布式架構雖被視為破局方向,卻面臨新挑戰(zhàn),例如節(jié)點間網絡通信延遲影響響應速度,分布式事務為滿足 ACID特性會產生性能損耗,數據分布策略會直接影響查詢效率,其在高并發(fā)、低延遲的核心交易場景面臨天然挑戰(zhàn)。
最后是架構復雜度陡增。無論是分布式架構,還是交易和分析系統(tǒng)的拆分,均會導致復雜度變高。一方面,由于業(yè)務改造涉及數據拆分、路由配置等工作,增加了系統(tǒng)復雜度,對應用的設計和開發(fā)也造成非常大的挑戰(zhàn)。另一方面,由于產品能力瓶頸,導致在同一系統(tǒng)無法同時處理交易型業(yè)務、復雜查詢、跑批業(yè)務等,被迫通過系統(tǒng)拆分的方式來滿足多業(yè)務訴求。
總體而言,從總體擁有成本(TCO)角度,分布式數據庫的硬件、基礎設施資源和運維成本均高于集中式架構。硬件方面,以滿足省級金融單位要求為例,集中式架構災備僅需四到六臺機柜,而同等規(guī)模分布式需數十倍的服務器,也導致網絡設備、機房與電力成本激增;技能要求和人力成本方面,由于需要學習全新的技術棧,將會要求高技能團隊和持續(xù)的運維人力。
基于開源二次開發(fā)的產品雖能短期滿足外圍系統(tǒng)需求,但受限于內核能力,難以在金融等核心場景規(guī)模替代,并不是解決我國安全可控的可行技術路線。另一方面,國產數據庫寄希望于分布式技術路線彎道超車,而分布式架構也并非“銀彈”。
共享集群為金融關鍵系統(tǒng)提供規(guī)?;娲窂?/strong>
如何去比較好的解決上述提到的痛點呢?吳良智指出,我們是希望能夠通過“1:1平替Oracle”的方式去實現(xiàn)規(guī)模化復制。這里說的“平替”是指“平滑替換”,是兼容性、功能、性能、高可用、運維的全面平滑替換,而不僅僅是兼容和功能的平滑替換,更不是很多人理解的“平價替換”。這有根本的區(qū)別,因為后者很容易讓客戶先入為主產生低價替換的認知。
針對金融關鍵業(yè)務系統(tǒng)規(guī)?;娲耐袋c,崖山主要從三個方向考慮:一是架構、應用和運維層面提供對等的能力和體驗;二是面向關鍵業(yè)務系統(tǒng)的產品能力打磨,在性能和可用可靠性上滿足嚴苛要求;三是安全可靠能力做扎實。
首先是架構、應用、運維“三不變”。這直接決定能否實現(xiàn)規(guī)模化、低成本、無痛式的平滑替換。
在架構層面,崖山共享集群采用了自研的技術路線,除了自研事務引擎設計、MVCC、表索引存儲等內核技術,同時原創(chuàng)了聚合內存技術、集群文件系統(tǒng)、集群管理服務等共享集群關鍵技術,實現(xiàn)了與Oracle RAC的架構對等設計。
在應用層面,崖山共享集群產品提供面向應用無狀態(tài)的計算擴展能力,其透明多寫多讀特性讓用戶如同使用集中式系統(tǒng)般簡單便捷。此外,YashanDB的核心突破在于對PL/SQL存儲過程、自定義函數、包等高級特性的全面兼容。吳良智指出,僅實現(xiàn)語法兼容尚不足夠,語義兼容機制確保了結果正確性,而完善的PL/SQL支持則意味著極低的遷移代價。YashanDB通過全向深度兼容,確保替換過程中上層應用代碼基本無需改造,實現(xiàn)真正的業(yè)務無感式遷移。
最后是在運維層面,崖山數據庫提供從技術兼容、智能工具到知識賦能的完整解決方案,如DBA熟悉的Oracle運維利器如Hint/Outline、AWR報告、yasrman (類比RMAN)、exp/imp、FlashBack等均得到支持,Oracle DBA 技能實現(xiàn)平遷,大幅降低原有技術團隊學習曲線和運維切換成本。
其次是做到“性能、可用可靠性兩對等”。
性能決定了方案能否支撐核心業(yè)務,并直接影響替代成本。在性能方面,YashanDB原創(chuàng)性地采用細粒度多版本并發(fā)管理機制、自適應異步事務調度、全局資源運行時調度、去中心化事務管理等技術,突破分布式數據庫硬件依賴瓶頸,在TPC-C測試中,其4節(jié)點集群性能達618萬tpmC,單節(jié)點擴展比超70%,這意味著每秒可以承載數千筆交易,可滿足大多數金融機構關鍵系統(tǒng)的業(yè)務處理要求。
核心替換對業(yè)務連續(xù)性提出極致要求。崖山數據庫可用可靠性對標國際標準,依托“主備共享集群”及“兩地三中心”方案,在確保集群級高可用的前提下,實現(xiàn)機房級故障、區(qū)域級故障的無損容災,達成業(yè)務零中斷與數據零丟失,故障恢復時間(RTO)與數據恢復點(RPO)均達到行業(yè)頂尖水平。
最后是打造“安全性更優(yōu)”的自主可控方案。YashanDB選擇全棧自研技術路線,從零構建第一行代碼,保障技術的自主可控與可持續(xù)演進;產品取得網絡關鍵設備和網絡安全專用產品安全認證、商用密碼產品認證、IT產品信息安全認證EAL4增強級(EAL4+)、等保三級認證等安全認證,構建起包含100項以上安全防護機制的全方位防御體系。
吳良智認為,目前,關鍵業(yè)務系統(tǒng)替代更多還是國有大行等大企業(yè)先行嘗試,中小企業(yè)還不敢貿然在核心系統(tǒng)替換上邁出太大的步子。只有規(guī)模平替,才能讓中小企業(yè)在高端場景也用得起、用得上、用得好數據庫。崖山共享集群在綜合成本(TCO)方面的顯著優(yōu)勢,成為破解這一局面的關鍵突破口。以共享集群為核心的解決方案,憑借“1:1替代”技術路徑,打破了傳統(tǒng)國產化方案依賴“業(yè)務重構與高額改造成本”的困局,從應用改造、軟硬件投入、基礎設施資源消耗到服務支出實現(xiàn)全面降本,至少釋放50%以上的成本,讓更多的資源可以投入到業(yè)務創(chuàng)新。
在某城商行A類核心系統(tǒng)替換項目中,崖山共享集群實現(xiàn)了從Oracle RAC的零代碼遷移且性能不降級。遷移方面,兩個核心系統(tǒng)僅修改一行代碼,兩周內完成全量數據遷移與驗證;性能方面,上線后各業(yè)務模塊響應時間與Oracle環(huán)境完全持平,滿足實時支付與清算需求。
“金融關鍵業(yè)務系統(tǒng)的國產化替代,絕非簡單的‘換馬甲’,而是要在性能、生態(tài)、安全上實現(xiàn)對等替換甚至超越?!眳橇贾强偨Y道。深算院以打造中國原創(chuàng)的基礎軟件品牌為使命,投入數百人研發(fā)團隊,在共享集群這一數據庫技術皇冠上取得突破。YashanDB崖山共享集群的推出及應用,標志著國產數據庫正式跨越了“可用”階段,大步邁入“好用”時代。
隨著金融業(yè)進入關鍵業(yè)務系統(tǒng)規(guī)模化替代階段,崖山共享集群以其獨特的“三不變、兩對等、一更優(yōu)”能力和顯著的TCO優(yōu)勢,為行業(yè)提供了一條可復制、可驗證、可落地的規(guī)?;娲窂?。