為了應(yīng)對(duì)新增的需求,用戶不得已的選擇是不斷疊加,先一個(gè)個(gè)疊加新的專用數(shù)據(jù)庫(kù)產(chǎn)品,再疊加運(yùn)維不同產(chǎn)品的專業(yè)化團(tuán)隊(duì)。最終造成的困境,杭州自動(dòng)化技術(shù)研究院院長(zhǎng)徐赤將其總結(jié)為“難、混、亂、散”:

每出現(xiàn)一個(gè)新需求,就要疊加一個(gè)新產(chǎn)品,從選型、試點(diǎn)到驗(yàn)證,少則一兩個(gè)月,多則半年甚至一年,堪比“煉獄”。由于目標(biāo)混沌、路徑混亂、缺少核心系統(tǒng),數(shù)據(jù)總是呈現(xiàn)散亂并難以整合的狀態(tài)。

最后導(dǎo)致的直接結(jié)果就是“用戶成本高“、”需求難以滿足、痛點(diǎn)永遠(yuǎn)存在”。

對(duì)此,徐赤在發(fā)布會(huì)上表示,在過(guò)去以專用類產(chǎn)品為主流的市場(chǎng)中,服務(wù)商忙著生產(chǎn)孤島、企業(yè)忙著購(gòu)買孤島,工程師們忙著打通孤島,循環(huán)往復(fù),永無(wú)止境。而且,這樣強(qiáng)行耦合的結(jié)構(gòu),牽一發(fā)動(dòng)全身,非常不穩(wěn)定。

YMatrix創(chuàng)始人姚延棟介紹,作為數(shù)據(jù)庫(kù)人,成立團(tuán)隊(duì)的初心,就是想從用戶需求出發(fā),做一款通用性強(qiáng)的產(chǎn)品,而不是和大多同行一樣,開(kāi)發(fā)專用數(shù)據(jù)庫(kù)產(chǎn)品,繼續(xù)一個(gè)問(wèn)題接一個(gè)問(wèn)題,只解決當(dāng)下問(wèn)題。

據(jù)了解,在國(guó)際市場(chǎng)上,類似YMatrix這樣具備 “超融合”特性的產(chǎn)品,已經(jīng)成為了近年的研發(fā)趨勢(shì)。

海外市場(chǎng),Snowflake 和 Databricks 曾先后提出 “one data platform”理念;傳統(tǒng)數(shù)據(jù)庫(kù)頭把交椅的Oracle也在走向融合方向;對(duì)復(fù)雜新興場(chǎng)景需求更加熟悉的時(shí)序數(shù)據(jù)庫(kù)大佬 InfluxDB 和 TimescaleDB,也先后啟動(dòng)了新一代融合型數(shù)據(jù)庫(kù)的研發(fā),對(duì)比大廠采取了更為激進(jìn)的策略。

國(guó)內(nèi)市場(chǎng)中,YMatrix率先提出超融合數(shù)據(jù)庫(kù)概念,在2020年完成了相應(yīng)產(chǎn)品的研發(fā);目前也有少數(shù)創(chuàng)業(yè)公司試水,從專用產(chǎn)品出發(fā),研發(fā)符合新一代融合理念的產(chǎn)品。

如何定義一款優(yōu)秀的“超融合”數(shù)據(jù)庫(kù)產(chǎn)品?

首先,回到用戶需求。

小米智能制造軟件產(chǎn)品部負(fù)責(zé)人封楊博士是這么定義的:以工業(yè)互聯(lián)網(wǎng)場(chǎng)景為例,其本質(zhì)是以“數(shù)據(jù)”為核心要素,企業(yè)實(shí)現(xiàn)全面連接。企業(yè)經(jīng)營(yíng)者的核心訴求,是如何最大化利用數(shù)據(jù)智能,為企業(yè)經(jīng)營(yíng)帶來(lái)看得見(jiàn)的價(jià)值。

再向上一層,則是跨過(guò)每個(gè)企業(yè)的微觀需求,在垂直產(chǎn)業(yè)或多個(gè)產(chǎn)業(yè)交叉的維度,構(gòu)建起全要素、全產(chǎn)業(yè)鏈、全價(jià)值鏈融合的新制造體系和新產(chǎn)業(yè)生態(tài)。

為了實(shí)現(xiàn)這個(gè)目標(biāo),需要搭建一個(gè)閉環(huán)的數(shù)據(jù)鏈條。在企業(yè)內(nèi)到企業(yè)外,從采集、診斷、預(yù)測(cè)到智能決策,實(shí)現(xiàn)全環(huán)節(jié)覆蓋。依賴優(yōu)化后的結(jié)果,可以更及時(shí)、更準(zhǔn)確的做商業(yè)決策,比如確定一個(gè)月后生產(chǎn)什么,需要提前備好多少原材料,技術(shù)工藝能怎么調(diào)優(yōu),等等。

封楊博士介紹,從企業(yè)級(jí)用戶的角度來(lái)看,代表最先進(jìn)生產(chǎn)力的產(chǎn)品,首先應(yīng)該是極致簡(jiǎn)單的,最好是一個(gè)頂N個(gè),能降低企業(yè)的財(cái)務(wù)、人力、學(xué)習(xí)成本;其次,要好用易用,因?yàn)橹圃靾?chǎng)景采集的數(shù)據(jù)類型五花八門(mén),不同數(shù)據(jù)類型的交叉分析、應(yīng)對(duì)業(yè)務(wù)訴求的復(fù)雜分析也是層出不窮。

對(duì)此,姚延棟進(jìn)一步解釋,“用戶并不關(guān)心什么TP、AP、湖倉(cāng)、批流,他們想要的就是一個(gè)強(qiáng)大的數(shù)據(jù)庫(kù),能接入所有數(shù)據(jù),做得了各種各樣的分析。有數(shù)據(jù)就可以往里寫(xiě),想用的時(shí)候隨時(shí)用,允許他們把精力放在數(shù)據(jù)價(jià)值上,而不是數(shù)據(jù)庫(kù)上。所以,行業(yè)內(nèi)曾熱烈討論的湖倉(cāng)之分、批流之分,只會(huì)是階段性產(chǎn)物”。

“使用YMatrix,用戶只需要做一次選型,運(yùn)維一個(gè)產(chǎn)品,就可以支持所有數(shù)據(jù)類型,滿足所有可能的需求。每次新需求出現(xiàn)時(shí),只需要考慮在YMatrix中怎么實(shí)現(xiàn)。這大大降低了選型成本和開(kāi)發(fā)運(yùn)維成本”,姚延棟介紹。

“企業(yè)內(nèi)很難有精通不同產(chǎn)品的通才,所以廠商應(yīng)該把復(fù)雜度處理掉,把簡(jiǎn)單應(yīng)用給到我們用戶,這樣既省錢,又省心省力”,封楊博士表示在應(yīng)用YMatrix的超融合產(chǎn)品后,相當(dāng)于實(shí)現(xiàn)了“無(wú)縫集成”,僅僅需要管理“1個(gè)極致輕松的數(shù)倉(cāng)建設(shè)團(tuán)隊(duì)+1個(gè)極致專注的工業(yè)算法團(tuán)隊(duì)”。

三一重工泵送研究院泵誦云平臺(tái)大數(shù)據(jù)負(fù)責(zé)人褚鳳天表示,“使用高效的產(chǎn)品,可以大量釋放出精力和創(chuàng)造力,讓團(tuán)隊(duì)聚焦工廠運(yùn)營(yíng)、設(shè)備管理、工藝調(diào)優(yōu)等更有價(jià)值的工作”。

“以常見(jiàn)的堵管故障為例,以前總是很難明確堵管的真實(shí)原因,現(xiàn)在可以在庫(kù)內(nèi)通過(guò)批量的算法,在采集到的工礦數(shù)據(jù)上,更好的定位原因,提升服務(wù)水平,降低客戶投訴率”,褚鳳天介紹,“在嘗試從制造企業(yè)向服務(wù)型企業(yè)升級(jí)的過(guò)程中,數(shù)據(jù)能力會(huì)是重點(diǎn)之一,直接決定了服務(wù)水平和盈利水平” 。

性能突破,是超融合價(jià)值放大的必要前提

在數(shù)據(jù)庫(kù)行業(yè),性能似乎是一個(gè)永遠(yuǎn)有吸引力的話題。

性能數(shù)據(jù)直觀,誰(shuí)高誰(shuí)低,誰(shuí)強(qiáng)誰(shuí)弱,一目了然。最近,很多數(shù)據(jù)庫(kù)廠商都開(kāi)始性能打榜打擂。姚延棟對(duì)此表示,“這是好事,說(shuō)明技術(shù)在進(jìn)步。但是,僅僅在某個(gè)場(chǎng)景下實(shí)現(xiàn)性能快20%-30%,甚至1倍,是很難贏得客戶的??蛻粜枰氖氰F人三項(xiàng),甚至是十項(xiàng)全能” 。

“在YMatrix團(tuán)隊(duì)內(nèi)部,我們關(guān)注全場(chǎng)景性能表現(xiàn),包括寫(xiě)入能力、時(shí)序查詢能力、單表OLAP分析、多表關(guān)聯(lián)OLAP分析、Machine Learning性能以及 OLTP 能力等諸多方面”,姚延棟介紹,“性能加持下的超融合,才是真正的超融合,才能給用戶提供價(jià)值” 。

目前,YMatrix在生產(chǎn)場(chǎng)景下的寫(xiě)入速度實(shí)現(xiàn)了1.52 億數(shù)據(jù)點(diǎn)/秒。通常一個(gè)工廠的數(shù)據(jù)點(diǎn)大概在10萬(wàn)點(diǎn)以內(nèi),1.52億是該場(chǎng)景規(guī)模的1500倍,哪怕是對(duì)寫(xiě)入能力要求最高的時(shí)序場(chǎng)景,也可以輕松滿足其高并發(fā)、低延遲的寫(xiě)入需求。

此外,對(duì)比時(shí)序數(shù)據(jù)庫(kù)獨(dú)角獸TimescaleDB,查詢耗時(shí)是YMatrix的5.1倍;對(duì)比知名OLAP數(shù)據(jù)庫(kù)產(chǎn)品Clickhouse,YMatrix在SSB基礎(chǔ)測(cè)試上快27%;對(duì)比MPP數(shù)據(jù)庫(kù)主流廠商Greenplum,YMatrix在多表關(guān)聯(lián)分析場(chǎng)景上實(shí)現(xiàn)了數(shù)倍的性能提升;對(duì)比全球流行的開(kāi)源大數(shù)據(jù)平臺(tái)Spark,YMatrix在機(jī)器學(xué)習(xí)場(chǎng)景上的性能是其8倍;在Intel實(shí)驗(yàn)室的TPC-B 國(guó)際標(biāo)準(zhǔn)測(cè)試中,YMatrix主鍵查詢tps高達(dá)160萬(wàn),數(shù)十倍于絕大多數(shù)產(chǎn)品。

對(duì)于性能優(yōu)化的重要性,三一重工褚鳳天表示,“最直接的體現(xiàn)就是提高運(yùn)行速度,我們可以更快速的反應(yīng),大大提高了運(yùn)維團(tuán)隊(duì)的效率”。

姚延棟介紹,此次發(fā)布的YMatrix 5.0版本,還包含了多至138項(xiàng)的性能優(yōu)化,特別是針對(duì)寫(xiě)入和分析等重點(diǎn)領(lǐng)域,進(jìn)行了深度的指令級(jí)優(yōu)化。

在易用性方面,YMatrix設(shè)計(jì)了用戶體驗(yàn)極佳的圖形化installer,只需10分鐘左右就可以完成數(shù)據(jù)庫(kù)集群的搭建。同時(shí),為了降低初學(xué)者的學(xué)習(xí)曲線,YMatrix提供了on boarding功能,用戶可以在3分鐘內(nèi)體驗(yàn)一個(gè)完整的IoT場(chǎng)景,包括數(shù)據(jù)寫(xiě)入和查詢分析。

目前,YMatrix已經(jīng)獲得了從創(chuàng)業(yè)公司到大型企業(yè)的認(rèn)可,其中有超過(guò)萬(wàn)億市值的行業(yè)龍頭企業(yè),包括寧德時(shí)代、比亞迪等,以及世界500強(qiáng)企業(yè),包括小米、三一重工等。

“后續(xù),YMatrix會(huì)在已經(jīng)存在海量需求的時(shí)序場(chǎng)景深耕,嘗試替代傳統(tǒng)數(shù)據(jù)庫(kù)和專用類產(chǎn)品”,創(chuàng)始人姚延棟介紹,“數(shù)據(jù)量大、指標(biāo)量多的車聯(lián)網(wǎng)、智能制造、智慧能源、智慧城市、智慧園區(qū)、智慧醫(yī)療等場(chǎng)景會(huì)是重要方向。這些場(chǎng)景所產(chǎn)生的業(yè)務(wù)需求,將最大化體現(xiàn)超融合產(chǎn)品的價(jià)值”。

收看發(fā)布會(huì)完整回放視頻請(qǐng)至“B站“ :bilibili.com/video/BV1b84y1B7ys

關(guān)于四維縱橫

北京四維縱橫數(shù)據(jù)技術(shù)有限公司(YMatrix) 成立于 2020 年 8 月,是一家創(chuàng)新型基礎(chǔ)軟 件公司,致力于物聯(lián)網(wǎng)時(shí)代新一代數(shù)據(jù)基礎(chǔ)設(shè)施軟件的研發(fā),并提供相關(guān)產(chǎn)品、解決方案及一站式商業(yè)服務(wù)。

公司創(chuàng)立伊始即獲得中科院系、清華系和民營(yíng)頭部投資機(jī)構(gòu)的投資,在政府政策和投資資 金的大力支持下,公司迅速進(jìn)入發(fā)展快車道。截止目前,公司已完成 4 輪融資,總計(jì)規(guī) 模超億元人民幣,主要投資人包括晨山資本、順義產(chǎn)業(yè)基金、東方富海、某頭部云廠商等 多家國(guó)內(nèi)知名機(jī)構(gòu)。

公司位于北京市中關(guān)村科創(chuàng)園,是國(guó)家高新及中關(guān)村高新技術(shù)企業(yè),曾獲得多項(xiàng)政府科創(chuàng)扶持基金支 持,并曾榮獲 2021 HICOOL 全球創(chuàng)業(yè)大賽三等獎(jiǎng)、 2021 中關(guān)村創(chuàng)業(yè)之星等多項(xiàng)榮 譽(yù)。

關(guān)于YMatrix 超融合數(shù)據(jù)庫(kù)

四維縱橫團(tuán)隊(duì)在業(yè)界率先提出超融合數(shù)據(jù)庫(kù)理念,并發(fā)布了 YMatrix 超融合數(shù)據(jù)庫(kù),基于獨(dú)創(chuàng)的多微內(nèi)核開(kāi)放架構(gòu),在單一數(shù)據(jù)庫(kù)之上,實(shí)現(xiàn)多模態(tài)數(shù)據(jù)的融通管理,及全場(chǎng)景 查詢分析的統(tǒng)一支持;同時(shí),YMatrix 兼顧高性能、高可靠及易用性,并大幅降低了數(shù)據(jù) 基礎(chǔ)設(shè)施的建設(shè)復(fù)雜度,為構(gòu)建物聯(lián)網(wǎng)時(shí)代的融合數(shù)據(jù)基座,開(kāi)拓一種全新的技術(shù)路徑。

YMatrix 內(nèi)置 4 種高性能微內(nèi)核數(shù)據(jù)引擎,支持包括關(guān)系數(shù)據(jù)、時(shí)序數(shù)據(jù)、GIS 數(shù)據(jù)、 JSON 數(shù)據(jù)、文本數(shù)據(jù)、圖片等多類型數(shù)據(jù)的融通管理;全面支持 SQL 1992-2016 標(biāo) 準(zhǔn),同時(shí)支持多種場(chǎng)景下的復(fù)雜查詢分析,包括高并發(fā)低延遲的增刪改查、點(diǎn)查、明細(xì)查 詢、聚合查詢、窗口查詢、關(guān)聯(lián)查詢、多維查詢、復(fù)雜 OLAP 查詢等;支持庫(kù)內(nèi)機(jī)器學(xué)習(xí)(In-database machine learning)和 AI,可實(shí)現(xiàn)庫(kù)內(nèi)高性能模型訓(xùn)練和推理計(jì)算等。

YMatrix 在多項(xiàng)性能測(cè)試中均展現(xiàn)出強(qiáng)大的性能表現(xiàn):基于 TPC- B 基準(zhǔn)的并發(fā)查詢 TPS 最高可達(dá) 163 萬(wàn), 時(shí)序數(shù)據(jù)寫(xiě)入性能可達(dá) 1.5 億點(diǎn)/秒。同時(shí),YMatrix 是目前唯一通 過(guò)中國(guó)信通院 “分布式分析型數(shù)據(jù)庫(kù)”及“時(shí)序數(shù)據(jù)庫(kù)”雙認(rèn)證的數(shù)據(jù)庫(kù)產(chǎn)品。

發(fā)布僅兩年,YMatrix 超融合數(shù)據(jù)庫(kù)已經(jīng)贏得包括寧德時(shí)代、三一重工、比亞迪、理想汽 車、小米等多家行業(yè)領(lǐng)軍企業(yè)的信賴,成功實(shí)現(xiàn)商業(yè)化落地,被應(yīng)用于工廠數(shù)據(jù)基座、大 型公司集團(tuán)數(shù)倉(cāng)、智能網(wǎng)聯(lián)汽車、物聯(lián)設(shè)備智能運(yùn)營(yíng)等真實(shí)生產(chǎn)場(chǎng)景中。

YMatrix 以極高的性能、穩(wěn)定性、數(shù)據(jù)安全性,以及融合極簡(jiǎn)的技術(shù)架構(gòu),助力用戶輕松 應(yīng)對(duì)數(shù)據(jù)管理挑戰(zhàn),大幅降低選型、采購(gòu)、使用及運(yùn)維時(shí)的技術(shù)門(mén)檻,使開(kāi)發(fā)更省力、迭代更省時(shí)、運(yùn)維更省心。

分享到

zhupb

相關(guān)推薦