一、三個  wu  ,走出一條新路

在開始研發(fā) KaiwuDB 前,我們曾向自己提出過一個問題:我們究竟“想要”做出一款怎樣的數(shù)據(jù)庫?又有多少人是真正“需要”這樣的數(shù)據(jù)庫呢?畢竟,面向傳統(tǒng)的關(guān)系數(shù)據(jù)庫應(yīng)用,已有 100 多家數(shù)據(jù)庫廠商在做。如果我們也做關(guān)系型數(shù)據(jù)庫,意義到底在哪?最終,我們得出的結(jié)論就是:不能一直重復(fù)造     。我們需要選定一個方向、行業(yè)或者領(lǐng)域,實(shí)現(xiàn)創(chuàng)新升級和行業(yè)引領(lǐng) 。

結(jié)合數(shù)智化轉(zhuǎn)型的背景,不難發(fā)現(xiàn):傳統(tǒng)的金融、保險、政務(wù)等是 IT 投入較大的行業(yè),他們確實(shí)在數(shù)字化道路上保持前沿,這也意味著在這些領(lǐng)域的創(chuàng)新機(jī)會相對有限。對比之下,如今中國經(jīng)濟(jì)結(jié)構(gòu)里,新三樣等行業(yè)催生了一列全新的數(shù)字化需求,同時,傳統(tǒng)制造業(yè)的數(shù)字化轉(zhuǎn)型需求還有待滿足,這些都成為了我們的機(jī)會點(diǎn)。

這也是我們KaiwuDB 名字的由來。Kaiwu (開務(wù)),取自易經(jīng)中的“開物成務(wù) ”,意為:通曉萬物之理。其中, wu  亦指  物聯(lián)網(wǎng)  。 物聯(lián)網(wǎng)有著龐大的數(shù)據(jù)量和爆炸式的數(shù)據(jù)增長,我們希望扎根物聯(lián)網(wǎng),為亟需轉(zhuǎn)型的傳統(tǒng)制造業(yè)以及新興的物聯(lián)網(wǎng)行業(yè)提供更貼合業(yè)務(wù)的數(shù)據(jù)庫產(chǎn)品與解決方案。 wu  又為  服務(wù)  ,我們希望通過吃透客戶的場景需求,為客戶提供更加優(yōu)質(zhì)到位的服務(wù),真正有效解決用戶的問題。最后,“wu“還為   ,我們希望借由 AI 等各種創(chuàng)新能力幫助用戶深層次挖掘數(shù)據(jù),悟出數(shù)據(jù)中的隱藏的價值。在這三”wu“之下,便有了我們KaiwuDB。

說到物聯(lián)網(wǎng),很多伙伴的第一反應(yīng)是,這不是時序數(shù)據(jù)庫的賽道么? 其實(shí)不盡然。在實(shí)際業(yè)務(wù)場景中,沒有任何一位客戶,即使是物聯(lián)網(wǎng)行業(yè)的客戶,單純依靠一套時序庫完成全部業(yè)務(wù)閉環(huán)。但凡用戶需要數(shù)字化轉(zhuǎn)型,就一定涉及到整個底層數(shù)據(jù)基座的煥新升級。在此過程中,除涉及到大部分的時序數(shù)據(jù),也不可避免的需要處理來自管理、業(yè)務(wù)等方面的流程數(shù)據(jù)。而只有將不同類型的數(shù)據(jù)融會貫通,并通過  AI  提供更好的數(shù)據(jù)分析能力,才能打通整個基座的  任督二脈  ,應(yīng)對用戶多維度的業(yè)務(wù)和數(shù)據(jù)處理的管理需求。這就是為什么我們首創(chuàng)提出了  分布式多模數(shù)據(jù)庫  這一概念 。

二、有效 / 高質(zhì)量的多模,裝備戰(zhàn)略缺一不可

如今,市面上不少廠商都圍繞”多?!霸谧鲆恍┦虑?。比如:將不同類型的數(shù)據(jù)模型處理能力通過簡單的”粘合“集中在一套數(shù)據(jù)庫中提供給客戶。但這樣是否真的可以滿足我們的客戶,還需要打個問號。

恰巧最近我也在回顧歷史書籍時看到“洋務(wù)運(yùn)動”,給我啟發(fā)很大。在印象中大家普遍認(rèn)為,當(dāng)時我們的武器裝備很落后。但事實(shí)是,我們購置了不少國際一流的武器裝備,卻還是輸了戰(zhàn)爭。究其原因,是因?yàn)槲覀儧]有一套系統(tǒng)的方法論,沒有明確的戰(zhàn)略來組織不用武器及兵種間的協(xié)調(diào)配合,這其中有很多地方,和多模是非常類似的。

比如,如果我們只是將不同的數(shù)據(jù)處理能力打包在一個庫里交付客戶,那結(jié)果可能和洋務(wù)運(yùn)動那場戰(zhàn)爭一樣,注定失敗。因?yàn)橥ㄟ^簡單的打包交付,我們的客戶依然不清楚如何更好的處理關(guān)系與時序數(shù)據(jù)、如何進(jìn)行更智能更有策略的數(shù)據(jù)分析等。所以我們在思考多模時,背后是有立體化戰(zhàn)略支撐,針對客戶的每一場戰(zhàn)役,我們都會給出最優(yōu)的武器裝備組合。我們想做的多模,絕不是單純給用戶一筐子武器自行發(fā)揮,而是幫助用戶有機(jī)地打包組合,并提供適合用戶場景的打法戰(zhàn)略,攻下數(shù)據(jù)價值挖掘的高地。

三、用多模實(shí)現(xiàn)對行業(yè)的  one size best fit

One size fits all 是一個業(yè)界頻繁探討的話題。首先,我個人并不是 One size fits all 的信徒?;仡檾?shù)據(jù)庫整體的發(fā)展歷程,從最開始的通用型數(shù)據(jù)庫,到后來逐漸細(xì)分出不同類型的專用數(shù)據(jù)庫,不難發(fā)現(xiàn)真正要實(shí)現(xiàn) “One size fits all” 并不容易 。而多模數(shù)據(jù)庫也不意味著就一定是籠統(tǒng)的“one size fits all”。

1 、  克制  地做多模

我們在做多模時,其實(shí)是很“克制”的。所謂克制,可以理解為行業(yè)不需要我們不給,客戶用著累贅我們不放 。比如,我們現(xiàn)在針對 AIoT 的用戶,重點(diǎn)開放了時序處理能力,關(guān)系處理能力(包括事務(wù)和分析能力)以及AI 的能力等。向量數(shù)據(jù)庫的能力我們也做了,但并沒有開放出來。因?yàn)槲覀冃枰仍趯?shí)際場景中去驗(yàn)證向量數(shù)據(jù)庫能力究竟能在物聯(lián)網(wǎng)場景為用戶做哪些有價值的事情。只有在充分驗(yàn)證有效的前提下,我們才會將這部分能力開放給用戶。我們的“克制”,是想要做到對用戶負(fù)責(zé)。

2 、  有機(jī)  地做多模

克制的同時,我們還在尋求如何讓多模實(shí)現(xiàn)有機(jī)的結(jié)合。融合是多模的核心,但我們清楚多模是一個相對較新的賽道,想要在一夜之間將所有模型的融合做到完美并非易事。所以,我們堅持選擇面向重點(diǎn)行業(yè),貼近場景去打磨我們的多模優(yōu)化器、多模執(zhí)行器、多模調(diào)度等。同時,我們非常清楚,就物聯(lián)網(wǎng)賽道而言,我們最關(guān)鍵的武器一定是時序引擎。所以針對時序能力,我們通過自有的就地計算、內(nèi)存映射等創(chuàng)新技術(shù),逐步開發(fā)我們的存儲引擎、計算引擎,以實(shí)現(xiàn)更優(yōu)的性能,更好的擴(kuò)展性等。

總結(jié)來說,KaiwuDB 面向行業(yè)的多模設(shè)計原則,與市場上的其他廠商還是有明顯的差異化的。雖然我并不覺得 One size fits all ,但是我們相信,通過捕捉特定業(yè)務(wù)場景和行業(yè)底層的共性,配合更多融合性、針對性的戰(zhàn)略打法,至少可以實(shí)現(xiàn)對行業(yè)的  best fit 。

四、堅信  AI ,但絕不上頭

我們始終認(rèn)為,在談 IoT 時, AI 應(yīng)該放在前頭,這也呼應(yīng)了我們 KaiwuDB 為什么要取自“開物成務(wù)”,即要通曉萬物之理。我們堅信,AI 和數(shù)據(jù)庫融合是非常有必要的。回看物聯(lián)網(wǎng)整體趨勢,特別是在過去的十幾年里,隨著數(shù)據(jù)量的激增,數(shù)據(jù)的單位價值在不斷下降。 數(shù)據(jù)庫的價值,取決于數(shù)據(jù)庫里數(shù)據(jù)的價值  ,這是我當(dāng)年剛?cè)胄械臅r候,我的首席架構(gòu)師分享給我一句記憶猶新的話。這也正是我們現(xiàn)在的思路——通過不斷激發(fā)出數(shù)據(jù)新價值,數(shù)據(jù)庫本身才會更具價值。AI 就是實(shí)現(xiàn)這個價值的一個很好的加持。

我從事 AI 和數(shù)據(jù)庫的融合研究近10年,過程中發(fā)現(xiàn)大家對 AI 和數(shù)據(jù)庫融合這塊可能會存在一些誤區(qū):

1、預(yù)期誤區(qū)——總覺得 AI 無所不能,但往往最終融合的結(jié)果可能不盡如人意。這導(dǎo)致最后對 AI 的看法非常兩極分化;

2、但凡有新熱點(diǎn),就一定要用上。在我看來,大模型也并非絕對的靈丹妙藥。即便是在AI領(lǐng)域,也應(yīng)該遵循 開什么鎖,用什么鑰匙  的原則。

看清 AI 背后的邏輯后,我們給自己定了一個原則:要務(wù)實(shí),不跟風(fēng)。在面對一些抉擇時,我們堅持  “ 用對的,不用貴的  。也就是說,但凡我們開放的功能,就是奔著實(shí)實(shí)在在解決客戶問題去的。如果  classic (經(jīng)典的)模型比大模型在某一問題上效果更佳,那我們就會尊重效果,選擇經(jīng)典。

比如我們之前在做自治能力時,有一個自治框架,我們會用到一些時間預(yù)測方法,而不是全然大模型。 當(dāng)然,如果在某些問題上大模型效果好且成本合適,我們也定然會去選擇。我們是擁躉創(chuàng)新的。但我們也要保持清醒的頭腦,做出理智的探索,“大而無當(dāng)”的方法也許不會出錯,但“小而得當(dāng)”的設(shè)計興許可以一招制敵。因此,我們的最終評判標(biāo)準(zhǔn),就是用戶收到的價值與效果。

五、擁抱開源 —— 開放、開拓、開創(chuàng)

從做 KaiwuDB 的第一天起,我們就在規(guī)劃開源。最前面有提到,我們其實(shí)是有一個非常強(qiáng)烈的初心——幫助有需要的用戶去做更有價值的事情。如果我們想把這件事做好,我認(rèn)為一定需要有開放的心態(tài),跟大家共創(chuàng)。

同時,我們也意識到每個行業(yè)都有很多新興的環(huán)節(jié)與參與方。比如物聯(lián)網(wǎng),或是傳統(tǒng)制造業(yè)的轉(zhuǎn)型,這其中有很多事情,包括智能終端、實(shí)時操作系統(tǒng)、以及上層應(yīng)用等,是一條很長的產(chǎn)業(yè)鏈。我們希望通過開源,能夠聯(lián)合產(chǎn)業(yè)鏈上各位友商、上下游的伙伴以及研究機(jī)構(gòu)等打造  朋友圈  ,共同協(xié)作把行業(yè)做起來,實(shí)現(xiàn)開拓共贏。

最后我們也希望通過開源去開創(chuàng)一個新的賽道 。我們有很多的構(gòu)想和規(guī)劃,比如時序引擎優(yōu)化、多模架構(gòu)的進(jìn)一步融合等,還等待著我們?nèi)?shí)現(xiàn)。未來我們希望與廣大開源伙伴以及數(shù)據(jù)庫的專家們一起共創(chuàng),碰撞出更多思維的火花,在這個賽道上去落地更多的創(chuàng)新與暢想。

分享到

zhupb

相關(guān)推薦