數據庫技術應用分論壇出品人 劉松

在過去幾年,我們看到疫情加速了全球數字化的成長,數據技術也變成了一個熱門的賽道。數據技術本身在過去的兩三年里面,最重要的是受到了三種外部形態(tài):開源、云計算、人工智能地重塑。

開源數據技術在過去幾年快速興起,形成了很多細分賽道,而云計算由1.0的資源型現在走向了2.0,尤其進入了多元的型態(tài),如多云云原生數倉的出現;另外人工智能逐步加入到數據價值的發(fā)現中,與數據技術融合形成新的數據智能平臺。

分布式數據庫仍然是比較熱門技術,逐步走向了云源生,已經開始在多云環(huán)境提供全托管服務;此外,大數據技術還在不斷向前發(fā)展,尤其是在實時性技術方面不斷的向前演進。再有就是數據湖、數據倉庫兩種技術融合的趨勢,多模數據化也在不斷發(fā)展。

總之,數據技術已經成為了企業(yè)軟件最黃金的一個賽道,在此,我提醒大家特別關注“數據庫”這個賽道。

今天的數據庫已經不是單機版的,或者是第一代云數據庫RDS(關系型數據庫)形態(tài),而數據庫如今已經升華一個新的黃金時代,數據庫與分布式技術、云計算,尤其是云原生技術的融合,產生了一個新的物種。其與20年前應用于信息化時代的數據庫不同,此前的數據庫多用來做記錄和統計,是OLTP核心交易系統,如銀行的核心交易,電信營業(yè)系統、BOSS系統等,這些都是以記錄交易和統計業(yè)務為主的。

數字化時代,業(yè)務從穩(wěn)態(tài)進入到敏態(tài),數據需求就由被動存儲、統計進入到數據驅動,對于實時性、實效性的業(yè)務追求。此前,用戶大多采用各種ETL工具、Hadoop集群、消息隊列,以及分庫分表,如此,客戶往往會三個以上的數據庫類型,4個以上數據工具,技術應用非常復雜。

對此,新一代的數據庫應運而生,尤以分布式數據庫走向云原生為代表,如果說,此前的數據庫應用以OLTP為主,如今,新的數據庫就上升到處理OLAP為主;之前離線的速倉,第二天才能看到分析的結果,到現在,要以分鐘甚至以秒為單位得到結果,實時反饋,這些都使得數據庫技術進入到了一個新的以實時應用為主的簡化和融合的應用。

那么簡化的意思,就是要把交易系統、分析系統一體化,為此產生了融合的需求,最有代表性的就是HTAP(Hybrid Transaction / Analytical Processing,混合事務分析處理))技術,也就是在同一個數據庫里,能夠既處理交易(OLTP),又能夠做實時的分析(OLAP),對于所有的互聯網企業(yè),對于做數字化的企業(yè)都是一個必備的需求。在數字化的時代,它借助開源不斷迭代;借助云原生、新一代的技術資源的調度以及與人工智能的融合,已經變成了一個具備在PB級別處理的新產品。

我們今天的整個數據庫分論壇也是聚焦這個新的數據技術時代,分享一些關鍵技術的趨勢,我們也會有很多廠商在分布式數據庫,在云原生的數倉,以及在分析型數據庫、數據倉庫方面有更多的介紹。我們也很期待大家能從這些分享里面看到今天數據技術未來的發(fā)展趨勢,也能夠知道我們應該在哪一個賽道上面投入更多的時間。

劉松:

PingCAP 副總裁 阿里巴巴原副總裁,負責公共事務與產學研生態(tài)構建,是阿里巴巴云計算與大數 據生態(tài)體系的主要推動者。2022中國數據與存儲峰會,數據庫技術應用分論壇出品人。

分享到

songjy

相關推薦