接下來看一下數(shù)據(jù)庫(kù)發(fā)展歷史。
在1960年左右出現(xiàn)了數(shù)據(jù)庫(kù),緊接著在1970年左右出現(xiàn)了關(guān)系型數(shù)據(jù)庫(kù),典型代表如MySQL,1980年左右出現(xiàn)了數(shù)據(jù)庫(kù)倉(cāng)庫(kù)的理論,并且出現(xiàn)了MPV架構(gòu)的數(shù)據(jù)倉(cāng)庫(kù),1998年左右出現(xiàn)了NoSQL數(shù)據(jù)庫(kù),典型代表如MongoDB。
隨著2000年互聯(lián)網(wǎng)的快速發(fā)展,出現(xiàn)了大量的非結(jié)構(gòu)化數(shù)據(jù)處理的需求,緊接著在2006年~2009年出現(xiàn)了Hadoop Spark代表的大數(shù)據(jù)平臺(tái),同時(shí)在2006年AWS推出了云計(jì)算業(yè)務(wù),很多數(shù)據(jù)開始上云。在2010年左右出現(xiàn)了分布式流數(shù)據(jù)處理,典型代表如2010年出現(xiàn)的Storm平臺(tái),2013年出現(xiàn)的SparkStreaming,2014年出現(xiàn)的Flink產(chǎn)品,同時(shí)在2010年還出現(xiàn)了數(shù)據(jù)湖的概念,2017年~2019年出現(xiàn)了Delta Lake、Hudi、Iceberg等數(shù)據(jù)湖產(chǎn)品,2013年~2017年是云原生快速發(fā)展的幾年,出現(xiàn)了如Kubernetes這樣的技術(shù),很多數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)湖產(chǎn)品都基于云原生進(jìn)行構(gòu)建,在2020年左右出現(xiàn)了湖倉(cāng)一體化的數(shù)據(jù)平臺(tái)。
從以上可以看出,從1960年到2020年左右數(shù)據(jù)平臺(tái)一個(gè)大概的發(fā)展歷史,接下來分別看一下數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)湖包括湖倉(cāng)一體的產(chǎn)品。
數(shù)據(jù)庫(kù)是我們大家所熟知的,比如你去商場(chǎng)里購(gòu)買了一件產(chǎn)品,這個(gè)商品它會(huì)記錄進(jìn)入到數(shù)據(jù)庫(kù)中,是什么時(shí)間點(diǎn)購(gòu)買哪件產(chǎn)品,這個(gè)產(chǎn)品的價(jià)格是什么,這通常稱為事務(wù)性數(shù)據(jù)庫(kù),典型代表如MySQL、Sql Server、Oracle、PostgreSQL,特點(diǎn)在于要處理高并發(fā)、快速讀寫刪的能力,并且是低延遲的,通常采用行存數(shù)據(jù)庫(kù)方式。
還有一種數(shù)據(jù)庫(kù)是偏向于分析型的,它重點(diǎn)在于是哪類人購(gòu)買了哪類產(chǎn)品,它的用戶畫像是什么樣的,這類數(shù)據(jù)都是通過分析型數(shù)據(jù)庫(kù)進(jìn)行處理的,它的特點(diǎn)在于是海量數(shù)據(jù)的復(fù)雜查詢、快速查詢、通常采用列存。典型代表如ClickHouse、Presto、Greenplum、Snowflake、databend,都是屬于數(shù)倉(cāng)庫(kù)類似的產(chǎn)品。
還有一類需求,就是既有事務(wù)性數(shù)據(jù)庫(kù)的需求,也有混合型數(shù)據(jù)庫(kù)的需求,那就是出現(xiàn)了HTAP混合型數(shù)據(jù)庫(kù),典型代表如TiDB,它既可以做TP類的事務(wù)處理,也可以做AP的數(shù)據(jù)的處理,但是如果說特別大量的數(shù)據(jù)處理,建議還是用OLAP類數(shù)據(jù)庫(kù)進(jìn)行處理。
接下來看一下什么是大數(shù)據(jù)平臺(tái),大數(shù)據(jù)平臺(tái)主要有以下特點(diǎn):
第一是數(shù)據(jù)量大,通常是TP、PB甚至是EB級(jí)的數(shù)據(jù)。
第二是數(shù)據(jù)類型繁多,結(jié)構(gòu)化、非結(jié)構(gòu)化、日志、視頻、圖片、地理位置等等,這些數(shù)據(jù)都需要進(jìn)行處理。
第三,商業(yè)價(jià)值高,但是這種價(jià)值需要構(gòu)建在海量數(shù)據(jù)之上,通過數(shù)據(jù)分析、機(jī)器學(xué)習(xí)進(jìn)行挖掘出來,提供給前端的業(yè)務(wù)系統(tǒng)。
第四,處理實(shí)時(shí)性要求高,海量數(shù)據(jù)的處理要求不局限在離線中,而是推薦系統(tǒng),它的實(shí)時(shí)性要求非常高,不等看完短視頻,接下來就推薦其他的,看完戰(zhàn)爭(zhēng)片以后,給你推薦的愛情片,可能就不是他所喜歡的,就體現(xiàn)不了它的價(jià)值。
這是一個(gè)大數(shù)據(jù)平臺(tái)典型的架構(gòu),從下往上首先是數(shù)據(jù)采集,所采集數(shù)據(jù)源可以是多種多樣的,比如說是從其他的數(shù)據(jù)庫(kù)中,事務(wù)性數(shù)據(jù)庫(kù)或者其他的數(shù)據(jù)庫(kù)中進(jìn)行采集,可以是文件系統(tǒng),可以是日志等。
之后進(jìn)行數(shù)據(jù)的計(jì)算和存儲(chǔ),再往上是數(shù)據(jù)的應(yīng)用,比如說是通過OLAP的數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行分析。
接下來看一下數(shù)據(jù)湖與數(shù)據(jù)倉(cāng)庫(kù)之間的關(guān)系,數(shù)倉(cāng)主要是偏向事前的建模,數(shù)據(jù)湖主要偏向事后的建模。數(shù)據(jù)湖通常是把所有的數(shù)據(jù)結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)放到里面,都可以進(jìn)行存儲(chǔ),之后根據(jù)這些數(shù)據(jù)進(jìn)行建模處理,數(shù)倉(cāng)則不同,通常在建模之前就進(jìn)行數(shù)據(jù)的一些提取、抽取、分析,所以說它偏向于做事前的建模,而且它的存儲(chǔ)通常是結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)。
引擎方面也不太一樣,數(shù)據(jù)湖是多種引擎都可以用,有多種數(shù)據(jù)源進(jìn)行有限的優(yōu)化,數(shù)據(jù)倉(cāng)庫(kù)是特定的數(shù)據(jù)引擎,通常選用一種數(shù)據(jù)引擎,或者說是兩三種特定的數(shù)據(jù)引擎,根據(jù)它的數(shù)據(jù)特點(diǎn)或者業(yè)務(wù)系統(tǒng)的要求選擇特定的數(shù)據(jù)引擎,經(jīng)常對(duì)數(shù)據(jù)進(jìn)行高度優(yōu)化,甚至數(shù)據(jù)處理過程高度優(yōu)化。
項(xiàng)目啟動(dòng)方面也不太一樣,數(shù)據(jù)湖是易啟動(dòng)的,只要你有需求就可以快速的建立數(shù)據(jù)湖,把非結(jié)構(gòu)化數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)進(jìn)行存儲(chǔ),數(shù)據(jù)倉(cāng)庫(kù)是需要提前規(guī)劃、提前運(yùn)作的。
治理方面也不太一樣,數(shù)據(jù)治理方面,數(shù)據(jù)湖是偏向于數(shù)據(jù)量比較大,數(shù)據(jù)倉(cāng)庫(kù)也是數(shù)據(jù)量比較大,但是更強(qiáng)調(diào)數(shù)據(jù)質(zhì)量。數(shù)據(jù)湖通常是做一些數(shù)據(jù)機(jī)器學(xué)習(xí),做一些數(shù)據(jù)挖掘,數(shù)據(jù)倉(cāng)庫(kù)偏向于提供給前端的BI展示,可視化方面。
聊完了數(shù)據(jù)湖、數(shù)據(jù)倉(cāng)庫(kù)之后,我們來看一下2020年左右出現(xiàn)的湖倉(cāng)一體,湖倉(cāng)一體是一種將數(shù)據(jù)湖的靈活性和數(shù)倉(cāng)的易用性、規(guī)范性、高性能結(jié)合起來的一種新型架構(gòu),類似于在湖邊搭建的很多小倉(cāng)庫(kù),把數(shù)據(jù)湖中不同的數(shù)據(jù)進(jìn)行有效的分析,或者通過機(jī)器學(xué)習(xí)甚至來檢索音視頻信息等等處理。
說到了湖倉(cāng)一體,先看海外的兩個(gè)產(chǎn)品,第一個(gè)是Snowflake,它之前是一直做數(shù)倉(cāng)這個(gè)產(chǎn)品起家的,但是隨著業(yè)務(wù)量的逐漸發(fā)展,現(xiàn)在它提出了DataCloud理念,這是一個(gè)數(shù)據(jù)云平臺(tái)的概念,它也逐漸的往湖倉(cāng)一體方向發(fā)展。databricks是2013年由伯克利大學(xué)的研究人員成立的,偏向數(shù)據(jù)湖的概念,現(xiàn)在它也具有部分?jǐn)?shù)倉(cāng)的能力,所以說這兩個(gè)產(chǎn)品越來越靠近,他們的產(chǎn)品邊界越來越模糊,snowflake可以作為一部分湖的數(shù)據(jù)處理,databricks可以做一部分?jǐn)?shù)倉(cāng)的處理,他們逐漸都往湖倉(cāng)一體的架構(gòu)演進(jìn)。
接下來看一下什么是新一代云原生數(shù)倉(cāng)。
新一代云原生數(shù)倉(cāng)同傳統(tǒng)數(shù)倉(cāng)相比有以下特點(diǎn)。
第一,傳統(tǒng)數(shù)倉(cāng)是在云計(jì)算發(fā)展之前就已經(jīng)出現(xiàn)的,1982年左右出現(xiàn)了數(shù)據(jù)倉(cāng)庫(kù),當(dāng)時(shí)還沒有云計(jì)算,它通常是采用存算一體的架構(gòu),比如Greenplum、ClickHouse都是這樣的產(chǎn)品形態(tài)。隨著云計(jì)算的發(fā)展,開始把這些產(chǎn)品搬到云上,典型的代表如K8S推出的Redshift,阿里云推出的云ClickHouse等等,相對(duì)用戶來說不需要基于虛擬機(jī)或者物理機(jī),重新去搭整個(gè)數(shù)倉(cāng)平臺(tái),可以一鍵化部署出來,性能調(diào)優(yōu)云廠商也會(huì)做,升級(jí)管理也會(huì)做,但是這樣的產(chǎn)品形態(tài)還是存算一體的架構(gòu),只是省了整個(gè)的搭建過程,甚至是部分的運(yùn)維工作,但是還是需要運(yùn)維整個(gè)數(shù)倉(cāng)平臺(tái)的。
2012年出現(xiàn)了Snowflake產(chǎn)品,講究存算分離的架構(gòu),基于云計(jì)算進(jìn)行構(gòu)建的,底層基于對(duì)象存儲(chǔ),上層的計(jì)算節(jié)點(diǎn)是可以隨意擴(kuò)展的,所以說跟著業(yè)務(wù)量進(jìn)行擴(kuò)展,包括Databend也是存算分離的架構(gòu),基于云原生構(gòu)建的,底層基于對(duì)象存儲(chǔ),上層的計(jì)算節(jié)點(diǎn)可以跟業(yè)務(wù)量進(jìn)行隨意擴(kuò)展。相對(duì)于傳統(tǒng)數(shù)倉(cāng)來說,其靈活性非常高,業(yè)務(wù)量繁忙的時(shí)候可以增加計(jì)算節(jié)點(diǎn),底層存儲(chǔ)節(jié)點(diǎn),因?yàn)槎际谴嬖趯?duì)象存儲(chǔ)之上或者共享資源池,通常對(duì)象存儲(chǔ)是沒有容量限制的,這樣只需要增加上層的計(jì)算節(jié)點(diǎn)就可以了,所以說靈活性非常高。而傳統(tǒng)數(shù)倉(cāng)靈活性相對(duì)差一些。
講一下傳統(tǒng)數(shù)倉(cāng)和新一代數(shù)倉(cāng)的差異,左側(cè)是傳統(tǒng)數(shù)倉(cāng)和新一代數(shù)倉(cāng)的示意圖,傳統(tǒng)數(shù)倉(cāng)是基于Share-Nothing進(jìn)行構(gòu)建的,它的特點(diǎn)首先是計(jì)算單元和存儲(chǔ)單元是一體的,比如構(gòu)建在物理服務(wù)器或者虛擬機(jī)上的,如新增加一個(gè)結(jié)點(diǎn),需要將原有數(shù)據(jù)放到新的節(jié)點(diǎn)上來,這就需要保證原有數(shù)據(jù)安全,做一些備份操作,其次新節(jié)點(diǎn)還要校驗(yàn)整個(gè)數(shù)據(jù)的一致性,過程是非常復(fù)雜的。
左下圖可以看到新一代的數(shù)倉(cāng)通常是基于Share Storage架構(gòu)構(gòu)建的,底層是共享存儲(chǔ),可以是對(duì)象存儲(chǔ),可以是軟件定義存儲(chǔ),其上層的計(jì)算節(jié)點(diǎn)是無狀態(tài)的,而底層存儲(chǔ)系由對(duì)象存儲(chǔ)保證的。
右側(cè)列出了傳統(tǒng)數(shù)倉(cāng)和新一代數(shù)倉(cāng)的差異,首先從架構(gòu)地方面:傳統(tǒng)數(shù)倉(cāng)是存算一體架構(gòu)的,而新一代數(shù)倉(cāng)是基于可擴(kuò)展的存算分離架構(gòu)的,現(xiàn)在有部分傳統(tǒng)數(shù)倉(cāng)也會(huì)基于存算分離架構(gòu)進(jìn)行改造,可以支持對(duì)象存儲(chǔ),但是這種改造其實(shí)是半狀態(tài),就是一半的狀態(tài),它可以把數(shù)據(jù)存儲(chǔ)到對(duì)象存儲(chǔ)中來,它跟新一代數(shù)倉(cāng)還有差異的,傳統(tǒng)的新數(shù)倉(cāng)會(huì)基于對(duì)象存儲(chǔ)做各種優(yōu)化、調(diào)度,而傳統(tǒng)數(shù)倉(cāng)是不具備這些的,改造過來只是將數(shù)據(jù)可以存儲(chǔ)到對(duì)象存儲(chǔ)中來,但依然是傳統(tǒng)存算一體架構(gòu),需要指定分區(qū)、創(chuàng)建索引等,這些都是跟新一代數(shù)倉(cāng)有差異的地方。
存算一體架構(gòu)有助于實(shí)現(xiàn)Serverless架構(gòu),新一代數(shù)倉(cāng)是Serverless架構(gòu),而傳統(tǒng)數(shù)倉(cāng)不是。新一代數(shù)倉(cāng)可以支持Lakehouse(湖倉(cāng)一體),也可以支持?jǐn)?shù)據(jù)湖,可以基于HDFS文件進(jìn)行處理,而傳統(tǒng)數(shù)倉(cāng)不具備Lakehouse功能的。
擴(kuò)容能力方面,傳統(tǒng)數(shù)倉(cāng)是南北向的數(shù)據(jù),要保持一致性,它的擴(kuò)容復(fù)雜度是比較高的;而新一代數(shù)倉(cāng)是東西向擴(kuò)容,是比較容易一些的。
細(xì)膩度方面也不一樣,傳統(tǒng)數(shù)倉(cāng)通常基于KVM進(jìn)行調(diào)度,而新一代數(shù)倉(cāng)基于微服務(wù)化進(jìn)行調(diào)度,調(diào)度的更精細(xì)化一些,速度更快一些。傳統(tǒng)數(shù)倉(cāng)不具備多租戶概念,而新一代數(shù)倉(cāng)通常都會(huì)支持多租戶,可根據(jù)業(yè)務(wù)線進(jìn)行不同的數(shù)據(jù)處理,可以進(jìn)行不同業(yè)務(wù)單元業(yè)務(wù)結(jié)算。傳統(tǒng)數(shù)倉(cāng)使用起來要指定分區(qū),手動(dòng)創(chuàng)建索引,而新一代數(shù)倉(cāng)是無需指定分區(qū),自動(dòng)化創(chuàng)建索引。
什么是Databend?
Databend具有哪些產(chǎn)品功能特點(diǎn),能給用戶帶來哪些價(jià)值?
Databend公司團(tuán)隊(duì)主要來自于Clickhouse社區(qū),以及國(guó)內(nèi)和海外的大廠,團(tuán)隊(duì)人員在數(shù)據(jù)庫(kù)和云計(jì)算領(lǐng)域具有豐富的經(jīng)驗(yàn),貢獻(xiàn)過很多開源代碼和開源項(xiàng)目,比如Clickhouse、MySQL內(nèi)核(TokuDB)、RadonDB、NessDB等開源項(xiàng)目。
Databend成立于2021年3月,成立之初獲得了高瓴創(chuàng)投和華創(chuàng)資本、九合創(chuàng)投的融資,2022年6月首家通過了中國(guó)信通院組織的《可信云-云原生數(shù)據(jù)倉(cāng)庫(kù)通用技術(shù)能力》的評(píng)審,并獲得信通院頒發(fā)的《2022年云原生新銳企業(yè)》。
Databend是一個(gè)使用Rust研發(fā)、開源、完全面向于云架構(gòu)的新一代數(shù)倉(cāng),提供了極致的彈性能力,致力于打造按需、按量的Data Cloud產(chǎn)品體驗(yàn)。
具有以下的特點(diǎn),首先內(nèi)核Databend是完全開源的。第二,真正存算一體架構(gòu),計(jì)算節(jié)點(diǎn)無狀態(tài)。第三,底層基于對(duì)象存儲(chǔ)構(gòu)建。第四,可以做數(shù)據(jù)集市,做一個(gè)Data Marketing,可以產(chǎn)生更大數(shù)據(jù)價(jià)值。第五,操作運(yùn)維起來非常簡(jiǎn)便。
這是Databend的部署圖,左側(cè)是Databend的節(jié)點(diǎn),主要存儲(chǔ)一些源數(shù)據(jù)信息,中間是它的計(jì)算節(jié)點(diǎn),主要是做數(shù)據(jù)的查詢、分析、計(jì)算任務(wù),計(jì)算節(jié)點(diǎn)可以是隨意擴(kuò)展的,跟你的業(yè)務(wù)量進(jìn)行擴(kuò)展。它構(gòu)建在對(duì)象存儲(chǔ)之上,可以是AWS S3、阿里云OOS,甚至私有化部署的MINLO等。
目前Databend已經(jīng)支持的對(duì)象存儲(chǔ)包括AWS、Azure、阿里云、騰訊云、青云、金山云,包括社區(qū)里貢獻(xiàn)了谷歌GCP、谷歌的對(duì)象存儲(chǔ)和華為對(duì)象存儲(chǔ)。私有化支持Minlo、SeaveedFS、Ceph等等。
開源必然聊到開源社區(qū),Databend是在成立之初就進(jìn)行了代碼開源,也就是Day1就開源,隨著一年多的發(fā)展,目前已經(jīng)自然增長(zhǎng)到4700多個(gè)Stars,其中一半來自海外,有140多位代碼貢獻(xiàn)者,四成來自公司外的社區(qū),10位左右海外活躍貢獻(xiàn)者,包括Apache的頂級(jí)成員,包括SAP北美大數(shù)據(jù)工程團(tuán)隊(duì)負(fù)責(zé)人。
Databend是Rust上開源的第一個(gè)數(shù)據(jù)庫(kù)類項(xiàng)目,多次上了Rust榜單,同時(shí)也上過HackerNew首頁,它是世界程序員的一關(guān)注內(nèi)容的科技平臺(tái)。
右下角是海外著名的投資機(jī)構(gòu)做得世界上所有數(shù)據(jù)庫(kù)的排名,Databend大概排在世界所有數(shù)據(jù)庫(kù)當(dāng)中27位左右,也是這些數(shù)據(jù)庫(kù)當(dāng)中最年輕的一個(gè)。
接下來了解一下Databend的典型應(yīng)用場(chǎng)景舉例。
Databend可以做數(shù)據(jù)的歸檔,以多點(diǎn)為例,前有很多用戶商品相關(guān)的訂單信息,都存儲(chǔ)在MySQL數(shù)據(jù)庫(kù)當(dāng)中,隨著業(yè)務(wù)量逐漸增大,每一個(gè)月的數(shù)據(jù)都很大,都需要進(jìn)行歸檔的處理,大概它有20多臺(tái)歸檔的數(shù)據(jù)庫(kù),每臺(tái)服務(wù)器大概有500TB硬盤,所以說每年光用于數(shù)據(jù)歸檔的服務(wù)大概就有50萬人民幣左右,而且是構(gòu)建在云之上的。之后他們采用了Databend的產(chǎn)品,底層把所有的數(shù)據(jù)歸檔到對(duì)象存儲(chǔ)中,通過Databend。上層開兩到三個(gè)計(jì)算節(jié)點(diǎn),如此進(jìn)行處理以后,它既可以滿足查詢的需求,同時(shí)也滿足歸檔的需求,為用戶帶來價(jià)值就是節(jié)省大概90%的成本,這個(gè)成本也可以很好的算出來。
它的服務(wù)器從原有的20臺(tái)降到了2到3臺(tái),所以計(jì)算單元CPU內(nèi)存也是非常耗費(fèi)資金的,所以說通過歸檔的應(yīng)用,大概為多點(diǎn)節(jié)省了90%以上的成本。
接下來聊一下另一個(gè)產(chǎn)品,DatabendCloud,底層核心是構(gòu)建在開源的Databend內(nèi)核之上,為用戶提供了SaaS化的一站式服務(wù),中間DataWarehouse一核是由Databend驅(qū)動(dòng)的,之上有一個(gè)SaaS一體化平臺(tái),用戶只需要注冊(cè)用戶名密碼就可以使用整個(gè)數(shù)倉(cāng)平臺(tái)了,左側(cè)可以把各種數(shù)據(jù)源,比如說基于MySQL、基于SQLserver數(shù)據(jù)導(dǎo)入,甚至一些文件進(jìn)行導(dǎo)入。右側(cè)可以通過Databend loud進(jìn)行分析,分析完以后提給前端的BI和Machine Learning等等。
對(duì)于用戶來說,首先不需要維護(hù)整個(gè)平臺(tái)了,整個(gè)平臺(tái)都是由Databend維護(hù),用戶只需要注冊(cè)用戶名密碼,進(jìn)來以后直接進(jìn)行連接,就可以達(dá)到原有的數(shù)倉(cāng)能力,而且按需付費(fèi),需要計(jì)算的時(shí)候啟動(dòng)一個(gè)計(jì)算節(jié)點(diǎn),當(dāng)不需要處理的時(shí)候會(huì)自動(dòng)關(guān)掉,這個(gè)自動(dòng)關(guān)機(jī)也是由系統(tǒng)設(shè)定的,可以選擇一分鐘、五分鐘、十分鐘設(shè)定,可以自動(dòng)關(guān)掉,這樣對(duì)于用戶來說達(dá)到了一個(gè)按需使用、按量計(jì)費(fèi)的目的,節(jié)省了用戶的成本。
這個(gè)圖片是我們DatabendCloud申請(qǐng)頁面,可以通過申請(qǐng)平臺(tái)和網(wǎng)址進(jìn)入到DatabendCloud進(jìn)行申請(qǐng),注冊(cè)申請(qǐng)完就可以開通DatabendCloud,用戶就可以直接使用了。
Databend典型用戶中,多點(diǎn)是做數(shù)倉(cāng)歸檔處理的;快手是用到了Hive功能,它原有的數(shù)據(jù)都是存在Hive中,利用Databend進(jìn)行數(shù)據(jù)的分析處理;新加坡比特幣交易所主要用Databend進(jìn)行日志的處理,而且是海量日志PB級(jí)數(shù)據(jù)的處理;茄子快傳主要利用Databend具有數(shù)倉(cāng)的分析能力,作為它其中的一個(gè)分析平臺(tái),替換原有的Presto系統(tǒng);Voyance為非洲銀行提供類似于Snowflake產(chǎn)品形態(tài)的公司,它提供的是一個(gè)可視化的拓?fù)?、可以展示的DataCloud平臺(tái),內(nèi)核也是基于Databend構(gòu)建的。
(本文根據(jù)Databend 聯(lián)合創(chuàng)始人王吟演講速記整理而成,未經(jīng)過本人審閱。)