數(shù)巔科技創(chuàng)始人及CEO何昌華博士

從場(chǎng)景出發(fā)向下發(fā)力,拓展“大模型+工具”模式的進(jìn)化空間,也許恰是更有助于國(guó)內(nèi)企業(yè)突圍的數(shù)據(jù)智能“北坡”路線。數(shù)巔科技一路走來(lái),留下的每一步腳印都值得借鑒。

偉大的公司都是從“一個(gè)問(wèn)題”開(kāi)始

對(duì)何昌華博士來(lái)說(shuō),數(shù)據(jù)智能并非從天而降,創(chuàng)業(yè)的想法也不是心血來(lái)潮,最初的種子很早就在土壤中萌芽了。

在斯坦福大學(xué),“同學(xué)們都想找更好玩的企業(yè)或自己創(chuàng)業(yè)”,這種氛圍讓何博士感同身受。加入谷歌后,他發(fā)現(xiàn)“搜索引擎的商業(yè)模式就是收集全世界的數(shù)據(jù),并用數(shù)據(jù)解決問(wèn)題”,大數(shù)據(jù)、人工智能等技術(shù)創(chuàng)新也隨之產(chǎn)生,這正是數(shù)據(jù)智能賽道的根基。

后來(lái),何博士主導(dǎo)的咖啡因項(xiàng)目獲得谷歌公司最高的技術(shù)獎(jiǎng)項(xiàng),但他還是因?yàn)椤安桓视谄降倍x擇加入國(guó)內(nèi)頂尖的金融科技公司。金融行業(yè)數(shù)據(jù)規(guī)模大、質(zhì)量好,曾被何博士當(dāng)作實(shí)踐數(shù)據(jù)智能理想的最佳舞臺(tái)。

然而,他逐步發(fā)現(xiàn)金融行業(yè)也存在諸多碎片化場(chǎng)景,業(yè)務(wù)與技術(shù)的分割問(wèn)題屢見(jiàn)不鮮,很多AI應(yīng)用因投入產(chǎn)出比不高而被迫擱淺。

這讓何博士開(kāi)始反思:與其糾結(jié)于數(shù)據(jù)智能的宏大敘事,不如做些更實(shí)在的事情——“降低數(shù)據(jù)智能的使用門(mén)檻”,才是市場(chǎng)中最迫切需要解決的真問(wèn)題。

每一家偉大的公司,都是從“一個(gè)問(wèn)題”開(kāi)始的。2022年,何昌華博士著手組建創(chuàng)業(yè)團(tuán)隊(duì),數(shù)巔科技由此啟航。

大模型是數(shù)據(jù)智能全鏈路自動(dòng)化的終極答案

在創(chuàng)業(yè)初期,數(shù)巔科技的解題思路是“DataOPS+MLOPS”,將數(shù)據(jù)治理與模型訓(xùn)練、推理結(jié)合起來(lái),為客戶提供一攬子工具,使其更容易操作,進(jìn)而降低使用門(mén)檻。

從公司愿景的角度看,實(shí)現(xiàn)從數(shù)據(jù)到智能決策的全鏈路自動(dòng)化,是何昌華博士夢(mèng)寐以求的目標(biāo)。他以自動(dòng)駕駛進(jìn)行類(lèi)比:即使暫時(shí)做不到L4、L5,也至少可先做到L3,再通過(guò)“副駕”(工程師)輔助,讓用戶的感受接近L4甚至L5。

那時(shí),面對(duì)紛繁復(fù)雜的數(shù)據(jù)場(chǎng)景,大多數(shù)人工智能公司主要借助AI小模型解決痛點(diǎn)問(wèn)題。每個(gè)場(chǎng)景往往對(duì)應(yīng)不同的AI算法,要分別做調(diào)整和優(yōu)化。這意味著“副駕”的負(fù)擔(dān)很重,距離自動(dòng)化還比較遙遠(yuǎn)。

直到2022年11月,大模型橫空出世,何博士在親自試用并向業(yè)界朋友詳細(xì)了解“內(nèi)情”之后,又經(jīng)過(guò)了反復(fù)思考的過(guò)程,最終得出了自己的判斷:“大模型為數(shù)據(jù)智能全鏈路自動(dòng)化提供了真正可能”。

其實(shí),這個(gè)結(jié)論的形成并非一帆風(fēng)順。彼時(shí)盛行一種說(shuō)法——“大模型是人類(lèi)所有已知知識(shí)的壓縮”。如果大模型能回答一切問(wèn)題,那么數(shù)據(jù)處理和分析環(huán)節(jié)就可能失去獨(dú)立存在的價(jià)值。

擅長(zhǎng)獨(dú)立思考的何博士卻有不同的看法:根據(jù)大模型的基礎(chǔ)架構(gòu)和計(jì)算模式,還不能做到“包打天下”。擁有知識(shí)也不是大模型的必要條件,基于知識(shí)產(chǎn)生邏輯判斷才是其核心能力。因此,所有數(shù)據(jù)應(yīng)該通過(guò)企業(yè)數(shù)據(jù)和外掛的知識(shí)庫(kù)來(lái)解決,大模型則調(diào)用不同工具完成相關(guān)任務(wù)。

由此可見(jiàn),大模型非但不是數(shù)據(jù)公司的“終結(jié)者”,而且可能成為數(shù)據(jù)智能全鏈路自動(dòng)化的“拯救者”。與過(guò)去的AI小模型相比,大模型解決的最關(guān)鍵問(wèn)題是以通用的語(yǔ)言溝通能力和任務(wù)拆解能力,取代大部分需要定制化的服務(wù),為數(shù)據(jù)智能自動(dòng)化奠定堅(jiān)實(shí)基礎(chǔ)。

當(dāng)然,自動(dòng)化不可能一蹴而就,對(duì)于某些應(yīng)付不了的問(wèn)題,大模型還可調(diào)用工具加以解決。有人可能“抬杠”——以前定制小模型,現(xiàn)在定制工具,不是一樣的嗎?區(qū)別在于,工具可以做到標(biāo)準(zhǔn)化,且數(shù)量級(jí)規(guī)模比場(chǎng)景小很多,這對(duì)自動(dòng)化帶來(lái)的正面影響足以催生質(zhì)變。

打造驅(qū)動(dòng)數(shù)據(jù)智能真正落地的企業(yè)大模型

對(duì)數(shù)巔科技這樣的開(kāi)拓者而言,看清戰(zhàn)略方向之后,更重要的是打磨產(chǎn)品及方案,解決數(shù)據(jù)智能的落地難題。

第三方機(jī)構(gòu)的研究表明,在AI應(yīng)用落地進(jìn)程中,80%的問(wèn)題出在數(shù)據(jù)上,20%的問(wèn)題與算法有關(guān)。通常的情況是,做數(shù)據(jù)的公司缺乏AI基因,而做AI的公司多數(shù)也不精于數(shù)據(jù)。

數(shù)巔科技的核心團(tuán)隊(duì)來(lái)自數(shù)據(jù)、計(jì)算存儲(chǔ)、AI等多個(gè)領(lǐng)域,在技術(shù)創(chuàng)新、產(chǎn)品研發(fā)、商業(yè)化運(yùn)作等方面都擁有豐富經(jīng)驗(yàn),這為打破AI與數(shù)據(jù)之間的壁壘、構(gòu)建企業(yè)大模型創(chuàng)造了必要條件,openAI收購(gòu)Rockset也印證了這一內(nèi)在邏輯。

在大模型領(lǐng)域存在一個(gè)悖論——無(wú)法在同時(shí)滿足高準(zhǔn)確率、高通用性和低成本的情況下,確保項(xiàng)目落地實(shí)施。數(shù)巔科技在用戶可接受的范圍內(nèi)做了一些調(diào)整,將“高準(zhǔn)確率”定義為業(yè)務(wù)可用,即準(zhǔn)確率足夠高,出錯(cuò)的時(shí)候能被用戶識(shí)別,且可解釋產(chǎn)出的結(jié)果。

從降低客戶使用門(mén)檻的角度看,企業(yè)大模型的性價(jià)比也至關(guān)重要。因此,數(shù)巔科技將“低成本”定義為項(xiàng)目落地初期的成本一定要低,可以單機(jī)部署,且使用和維護(hù)零門(mén)檻;同時(shí)將“高通用性”定義為能夠工具化、自動(dòng)化。

據(jù)何昌華博士透露,在數(shù)巔企業(yè)大模型研發(fā)過(guò)程中,發(fā)現(xiàn)300億到500億參數(shù)產(chǎn)生的邏輯能力已經(jīng)足以解決給定場(chǎng)景的問(wèn)題,且調(diào)用相關(guān)知識(shí)和工具后通用程度也較高,這樣就能解決客戶做數(shù)據(jù)分析的實(shí)際問(wèn)題。

測(cè)試結(jié)果顯示,數(shù)巔百億大模型分析準(zhǔn)確度達(dá)95%以上,遠(yuǎn)超千億大模型 GPT4+NL2SQL70%左右的準(zhǔn)確度。在不拼參數(shù)規(guī)模也能取得好成績(jī)的背后,離不開(kāi)一件“秘密武器”的鼎力支撐。

數(shù)巔企業(yè)大模型

在數(shù)巔企業(yè)大模型的底座中,數(shù)據(jù)虛擬化引擎X-Engine發(fā)揮著舉足輕重的作用。它為數(shù)巔企業(yè)大模型提供多模態(tài)數(shù)據(jù)的統(tǒng)一接入、計(jì)算存儲(chǔ)、數(shù)據(jù)治理、數(shù)據(jù)加速等一站式能力,堪稱數(shù)據(jù)智能自動(dòng)化的最佳推進(jìn)器。

與傳統(tǒng)的數(shù)據(jù)治理ETL模式不同,X-Engine提供的是一張?zhí)摂M的表,生成這個(gè)表無(wú)需耗費(fèi)計(jì)算存儲(chǔ)資源,只有訪問(wèn)數(shù)據(jù)的時(shí)候才進(jìn)行計(jì)算。為了無(wú)限接近隨取隨算的理想狀態(tài),數(shù)巔科技一方面提升計(jì)算存儲(chǔ)性能,比業(yè)界同類(lèi)產(chǎn)品增強(qiáng)5至10倍;另一方面用智能引擎做預(yù)測(cè),基于預(yù)測(cè)提前自動(dòng)生成結(jié)果,并以系統(tǒng)自適應(yīng)的方式覆蓋超預(yù)期需求。在X-Engine的加持下,數(shù)據(jù)全鏈路自動(dòng)化的夢(mèng)想逐漸照進(jìn)現(xiàn)實(shí)。

以某頭部銀行信用卡業(yè)務(wù)財(cái)務(wù)中心進(jìn)行財(cái)務(wù)數(shù)據(jù)分析和洞察的場(chǎng)景為例:該行有近1萬(wàn)名員工負(fù)責(zé)各分行的損益分析,每到月底會(huì)面臨大量取數(shù)、制表、制圖、解讀等工作。在生成式智能分析應(yīng)用AskBI的助力下,員工通過(guò)自然語(yǔ)言交互,即可完成229條以上的財(cái)務(wù)指標(biāo)及數(shù)十個(gè)維度的自由組合分析,員工1分鐘內(nèi)即可快速獲取各財(cái)務(wù)數(shù)據(jù)分析和報(bào)表查詢,準(zhǔn)確率可達(dá)90%,顯著提升了員工的工作效率以及銀行的數(shù)字化管理能力。

雖然市面上也有類(lèi)似功能的產(chǎn)品,但大多與AskBI的定位和演進(jìn)方向不同。一些產(chǎn)品將自然語(yǔ)言直接生成代碼,主要為工程師服務(wù),而AskBI則定位于“大模型幫助企業(yè)基于數(shù)據(jù)做決策”,提供從數(shù)據(jù)提取到報(bào)表生成再到歸因洞察分析的完整鏈路,促進(jìn)數(shù)據(jù)智能全面落地。

據(jù)了解,數(shù)巔企業(yè)大模型解決方案已在金融、通訊和制造業(yè)等場(chǎng)景成功落地,朝著端到端地幫助企業(yè)解決從數(shù)據(jù)到?jīng)Q策的難題邁出關(guān)鍵一步。站在更長(zhǎng)遠(yuǎn)的視角,“讓數(shù)據(jù)智能像水電一樣簡(jiǎn)單”,讓每位員工都可以基于生成式智能分析做出數(shù)智化決策,真正實(shí)現(xiàn)數(shù)據(jù)智能決策全民化,是數(shù)巔科技的發(fā)展愿景。何昌華博士表示,如果大模型調(diào)用工具解決數(shù)據(jù)全鏈路自動(dòng)化這條路走得順利,能在三年內(nèi)集齊數(shù)據(jù)智能領(lǐng)域的主要工具,數(shù)巔科技有望讓夢(mèng)想盡快照進(jìn)現(xiàn)實(shí)。山頂還很遙遠(yuǎn),路上的風(fēng)景值得期待。

分享到

songjy

相關(guān)推薦