Deprest表示,MyGamePlan正在使用AI模型持續(xù)豐富數(shù)據(jù),并將這些數(shù)據(jù)用于洞察和分析,因此MongoDB非常適合這一用例。
兩年前,MyGamePlan啟動了開發(fā)項目,從那時起便開始采用MongoDB。數(shù)據(jù)涉及復(fù)雜的多向關(guān)系,需要將比賽與球員、事件和跟蹤相互關(guān)聯(lián)。為了更好地表示這種數(shù)據(jù)關(guān)系,MyGamePlan選擇在豐富的文檔結(jié)構(gòu)中使用嵌套元素。這種方法不僅能夠提高開發(fā)者的工作效率,還能夠提升程序運行效率。如果使用外鍵創(chuàng)建關(guān)系模型,再連接關(guān)系數(shù)據(jù)庫中的規(guī)范化表格,這樣極為緩慢且低效。
在開發(fā)方面,Deprest表示,使用PyMongo driver將MongoDB與托管在Sagemaker的Python ML數(shù)據(jù)管道和MongoDB Node.js driver集成在一起,隨后將其用于基于React、面向客戶端的網(wǎng)頁和移動應(yīng)用程序。
Deprest認(rèn)為,造成MongoDB與NoSQL數(shù)據(jù)之間差異的兩個關(guān)鍵因素在于: 首先,MongoDB更受開發(fā)者的青睞,采用率更高。這就意味著團(tuán)隊能夠快速熟悉它,并利用它來提高效率。其次,用戶可以直接在實時數(shù)據(jù)的基礎(chǔ)上構(gòu)建應(yīng)用內(nèi)部分析,無需花費時間和金錢將其移動到數(shù)據(jù)倉庫或數(shù)據(jù)湖中。借助MongoDB的聚合管道,用戶可以使用強大的滾動、變換和窗口函數(shù)來處理和分析數(shù)據(jù),以根據(jù)需求對數(shù)據(jù)進(jìn)行切片和切塊。
除了預(yù)測式AI,MyGamePlan團(tuán)隊正在評估如何利用GenAI來進(jìn)一步改善用戶體驗。
據(jù)Deprest介紹,MyGamePlan平臺擁有豐富的數(shù)據(jù)和分析,希望讓球員和教練能夠更加輕松地從中獲得洞見。為此,他們正在探索在數(shù)據(jù)之上進(jìn)行自然語言處理,并通過聊天和問答界面來實現(xiàn)這一目標(biāo)。借助GenAI,用戶可以輕松地可視化并總結(jié)數(shù)據(jù)。目前,團(tuán)隊正在評估將OpenAI旗下大型語言模型 (LLM )ChatGPT與復(fù)雜的提示工程方法相結(jié)合,同時利用LangChain進(jìn)行編排,配合使用LlamaIndex和MongoDB Atlas Vector Search來實現(xiàn)檢索增強生成 (RAG )的能力。
基于MongoDB Atlas來構(gòu)建應(yīng)用,使MyGamePlan團(tuán)隊能夠利用開發(fā)者數(shù)據(jù)平臺的豐富功能,為未來的幾乎所有應(yīng)用和AI需求提供支持。用Deprest的話來說,就是:“由于MyGamePlan的源數(shù)據(jù)保存在MongoDB Atlas數(shù)據(jù)庫中,將其與向量存儲及就地向量搜索結(jié)合使用為我們的開發(fā)者提供了一種非常高效且完美的解決方案?!?/p>
Ferret.ai: 通過AI和MongoDB Atlas生成智能,解析關(guān)系以創(chuàng)建信任,同時降低成本達(dá)30%
無論在現(xiàn)實世界還是在數(shù)學(xué)世界,我們都在不斷地與他人建立關(guān)系。不論是線上交易、廠商或?qū)I(yè)人士與潛在客戶,還是投資者與企業(yè)創(chuàng)始人或者其他方面,建立新的人際關(guān)系不可避免。在所有這些關(guān)系中,信任必不可少,然而建立信任卻是一件非常具有挑戰(zhàn)性的事情。Ferret.ai正是這樣一款旨在幫助消除猜疑、建立信任的工具。
Ferret是一個AI平臺,專注于為公司和個人提供實時、公正的情報,以識別風(fēng)險并把握機遇。借助先進(jìn)的預(yù)測式和生成式AI,結(jié)合成千上萬的全球數(shù)據(jù)源及數(shù)十億公開文件,Ferret.ai可提供精心策劃的關(guān)系情報和監(jiān)測服務(wù) (這些服務(wù)以往僅限于金融行業(yè)使用 ),幫助樹立透明度新標(biāo)準(zhǔn)。
Ferret首席技術(shù)官Al Basseri在談及Ferret的工作原理時表示,Ferret.ai從公共來源中獲取個人信息。這些來源包括社交網(wǎng)絡(luò)、交易記錄、法庭文件、新聞檔案、公司所有權(quán)和注冊商業(yè)利益等。相關(guān)數(shù)據(jù)通過Kafka管道傳輸?shù)焦镜腁nyscale/Ray MLops平臺,在這個平臺上,再使用spaCy提取和機器學(xué)習(xí)模型來進(jìn)行自然語言處理。Ferret.ai從數(shù)據(jù)源中獲得的所有元數(shù)據(jù) (接近30億個文檔 )及模型推斷均存儲在MongoDB Atlas中。用戶可通過頁面和移動客戶應(yīng)用程序,企業(yè)用戶可通過即將推出API來使用Atlas中的數(shù)據(jù)。
除了預(yù)測式AI之外,公司開發(fā)者目前正在嘗試在Ferret平臺上使用GenAI。Basseri表示,Ferret與英偉達(dá)的數(shù)據(jù)科學(xué)團(tuán)隊建立了緊密的合作關(guān)系,從而能夠?qū)λ峁┑臄?shù)據(jù)來源和分析進(jìn)行綜合,以幫助客戶更好地了解聯(lián)系人,并建立良好的關(guān)系。實驗表明,相比那些規(guī)模更大、更通用的大型語言模型,Mistral模型及其混合專家集成系統(tǒng)所需的資源開銷更少。
除了托管來自Ferret的預(yù)測式和生成式AI模型數(shù)據(jù)外,客戶數(shù)據(jù)和聯(lián)系人列表也存儲在MongoDB Atlas中。Ferret可對公共記錄源進(jìn)行持續(xù)監(jiān)測和評分,及時檢測個人身份信息的變化。
正如Basseri所介紹的,通過使用MongoDB Atlas Triggers,Ferret.ai可以監(jiān)測評分的更新,并立即向消費應(yīng)用程序發(fā)送警報,從而使客戶能夠?qū)崟r了解關(guān)系網(wǎng)絡(luò)動態(tài)。這是一種具有反應(yīng)式的、完全基于事件驅(qū)動的程序,開發(fā)者只需進(jìn)行設(shè)置即可輕松實現(xiàn)。
Basseri還介紹了MongoDB為其開發(fā)者帶來的其它一些優(yōu)勢,其中包括:
– 借助Atlas,該服務(wù)以完全托管的形式提供,并融入了最佳實踐。這使開發(fā)者和數(shù)據(jù)科學(xué)家可以從數(shù)據(jù)庫運行工作中解脫出來,將精力投入到應(yīng)用程序和AI創(chuàng)新上
– MongoDB Atlas是一種成熟的解決方案,已被廣泛應(yīng)用于許多高增長的企業(yè)
– 隨著團(tuán)隊的迅速擴(kuò)展,擁有了解MongoDB的工程師變得至關(guān)重要
除了數(shù)據(jù)庫之外,Ferret正將其對MongoDB Atlas平臺的應(yīng)用擴(kuò)展到文本搜索領(lǐng)域。隨著公司進(jìn)入谷歌云,其正在從現(xiàn)有的Amazon OpenSearch服務(wù)遷移到Atlas Search。
在談及遷移的驅(qū)動因素時,Basseri表示:“將數(shù)據(jù)庫和搜索統(tǒng)一在同一個API有助于減少開發(fā)者的認(rèn)知負(fù)荷,從而提高他們的工作效率,加快新功能的構(gòu)建。這樣可以消除了數(shù)據(jù)庫和搜索之間同步數(shù)據(jù)帶來的不便,從而縮短了工程周期。此外,這也意味著用戶可以獲得更好的體驗,因為之前的延遲瓶頸已經(jīng)消失,用戶在Ferret平臺上搜索聯(lián)系人和內(nèi)容時,可以得到最新的結(jié)果,而不是過時的數(shù)據(jù)。從OpenSearch遷移到Atlas Search還可以節(jié)省資金成本,并獲得更多的靈活性。通過消除數(shù)據(jù)庫和搜索引擎之間不必要的數(shù)據(jù)冗余,可將每月的總云成本減少30%。由于Atlas是支持多云的開發(fā)者數(shù)據(jù)平臺,因此可以根據(jù)需要在多個云提供商之間遷移?!?/p>
遷移完成后,Basseri及其團(tuán)隊將能夠使用Atlas Vector Search進(jìn)行開發(fā),并繼續(xù)構(gòu)建Ferret平臺的GenAI功能。
從以上兩個案例可以看出,無論企業(yè)目前處于AI發(fā)展的哪個階段,MongoDB均可提供支持。