英偉達(dá)的智能體應(yīng)用開發(fā)三層式架構(gòu)

英偉達(dá)在今年CES大會中提出了智能體應(yīng)用開發(fā)三層式架構(gòu)軟件堆疊,協(xié)助企業(yè)快速實現(xiàn)應(yīng)用落地,壯大智能體生態(tài)系。

英偉達(dá)的智能體架構(gòu)是以區(qū)塊為基礎(chǔ),最底層是模型預(yù)訓(xùn)練的AI微服務(wù)NIM。NIM將GenAI執(zhí)行所需的模型和軟件進(jìn)行優(yōu)化與封裝,并部署于任一環(huán)境中。這些微服務(wù)涵蓋多種AI模型,例如視覺模型、語言理解模型、語音模型(用于動畫)、數(shù)位生物學(xué)模型,以及最新的物理AI模型等。

再上一層是NeMo框架,類似數(shù)字員工養(yǎng)成的Pipeline,讓智能體能夠擔(dān)任多種工作角色,例如創(chuàng)作者、定制者、評價者、守護(hù)者,以及RAG檢索者,實現(xiàn)多樣化的應(yīng)用場景。

為了讓智能體具備特定領(lǐng)域的專業(yè)技能與知識,英偉達(dá)采用類似員工培訓(xùn)的方式,對智能體進(jìn)行數(shù)字勞動力優(yōu)化。經(jīng)過培訓(xùn)的智能體能代理多種工作角色,包括輔助研究助手、虛擬實驗室AI、軟件安全專家、影像分析師、AI銷售代表、客服人員、金融分析師、員工支援以及工廠運(yùn)維管理者等,滿足各行業(yè)的多元需求。

比如影像分析AI代理,是基于英偉達(dá)Metropolis藍(lán)圖,整合英偉達(dá)Cosmos、Nemotron視覺語言模型、Llama Nemotron LLM和MeMo Retriever等,能快速分析攝影機(jī)的數(shù)據(jù),每天生成高達(dá)10萬TB的影片內(nèi)容。Metropolis代理可以應(yīng)用到不同場景,例如在工業(yè)場域中,可以用來監(jiān)測作業(yè)流程并提供改善建議,同時從數(shù)據(jù)中偵測異常情況,調(diào)整工作者或機(jī)器的路線,協(xié)助避免意外事件的發(fā)生,提升生產(chǎn)效率與安全性。

英偉達(dá)提出智能體最后一層是數(shù)字AI代理人藍(lán)圖,英偉達(dá)提供多種開放原始碼藍(lán)圖,開發(fā)者可直接修改與擴(kuò)展,用于建構(gòu)特定領(lǐng)域的AI代理應(yīng)用。在該藍(lán)圖中提供開發(fā)人員各種代理AI構(gòu)建模組,包括CrewAI、Daily、LangChain、LlamaIndex和Weights & Biases等,協(xié)助其建立下一代智能體應(yīng)用。

黃仁勛表示,企業(yè)智能體將成為AI工廠的核心驅(qū)動力,這些工廠將通過生成Token,為各行各業(yè)帶來前所未有的智慧化與生產(chǎn)力提升。他特別看好智能體在軟件行業(yè)的應(yīng)用,并認(rèn)為下一個人工智能服務(wù)的重要時刻將聚焦于軟件,這是所有開發(fā)者都需要的基礎(chǔ)。甚至預(yù)測,智能體有潛力成為下一個機(jī)器人產(chǎn)業(yè)的關(guān)鍵應(yīng)用,創(chuàng)造兆億美元的商機(jī)。

不僅僅是應(yīng)用在軟件行業(yè),隨著智能體應(yīng)用逐漸成熟,也將影響企業(yè)內(nèi)部IT的運(yùn)作模式。黃仁勛表示:“企業(yè)IT部門將轉(zhuǎn)型為類似智能體的HR部門?!彼M(jìn)一步解釋,過去IT部門主要負(fù)責(zé)管理和維護(hù)大量來自IT行業(yè)的軟件,而未來的重點(diǎn)將轉(zhuǎn)向維護(hù)、培養(yǎng)和優(yōu)化數(shù)位代理,并將它們應(yīng)用于企業(yè)內(nèi)部,提升運(yùn)營效率。

分享到

崔歡歡

相關(guān)推薦