一、多模態(tài)生成式AI成為未來創(chuàng)新引擎

越來越多的生成式AI模型正在向客戶提供多模態(tài)內(nèi)容生成能力。多模態(tài)生成式AI是指AI工具能夠同時執(zhí)行多種任務(wù),如看、聽、說話、閱讀、創(chuàng)作。例如,Dall-E 3能夠生成高質(zhì)量圖像,而ChatGPT則能看、能聽、能說,能寫。

OpenAI是最早通過GPT-4向用戶提供多模態(tài)模型訪問的供應(yīng)商之一,谷歌的Gemini和Anthropic的Claude 3也緊隨其后。不過,到目前為止,大多數(shù)AI公司還沒有公開提供多模態(tài)模型。即使有也可能對輸入和輸出有大的限制。

而在不久的將來,多模態(tài)生成式AI可能會從獨特的賣點變成消費者對生成式AI模型的期望,至少在所有付費的大型語言模型(LLM)訂閱中是這樣。

此外,預(yù)計多模態(tài)建模本身的復(fù)雜性和準確性將有所增長,滿足消費者對一體化工具的需求。這可能表現(xiàn)為提高圖像和非文本輸出的質(zhì)量,或增加對視頻、文件附件(如Claude在做的)和互聯(lián)網(wǎng)搜索小部件(如Gemini在做的)的更好功能和特性。

ChatGPT目前允許用戶使用文本(包括代碼)、語音和圖像輸入和輸出,但ChatGPT沒有內(nèi)置的視頻輸入或輸出功能。目前OpenAI正在試驗其文本到視頻生成工具Sora,并可能會將其一些功能嵌入到ChatGPT中。

而谷歌的Gemini目前支持文本、代碼、圖像和語音輸入和輸出,但圖像生成有很大的限制,該工具目前無法生成包含人物的圖像。

二、AI服務(wù)得到更廣泛的應(yīng)用

AI服務(wù)在AI/ML商業(yè)案例中越來越受歡迎,但對生成式AI而言,一切才剛剛開始。而隨著生成式AI技術(shù)的采用率持續(xù)增加,行業(yè)內(nèi)更多需要競爭力的企業(yè)可能會轉(zhuǎn)向?qū)iT從事生成式AI并具有其行業(yè)或項目類型經(jīng)驗的咨詢公司和管理服務(wù)公司。

具體來說,隨著AI建模作為服務(wù)(AIMaaS)的市場份額增長,更多的AI公司將努力提供可定制的、輕量級的和/或開源模型,來擴大其對新受眾的覆蓋。生成式AI即服務(wù)計劃也可能關(guān)注企業(yè)做好生成式AI所需的支持框架。這自然會導(dǎo)致更多公司專業(yè)化,其他公司投資于AI治理和AI安全管理服務(wù)。

三、生成式AI加持的機器人來了

這將大大擴展機器人和AI能夠為我們完成的任務(wù)范圍。生成式人工智能可以自動化和增強認知和創(chuàng)造性任務(wù),包括醫(yī)生、設(shè)計師、音樂家、營銷人員等所做的任務(wù)。與機器人結(jié)合后,生成式人工智能可以應(yīng)用于工廠車間、建筑工地、零售商店和酒店等領(lǐng)域。

我們會慢慢意識到,生成式AI將顯著改變勞動力和工作場所的外觀,但專家們對人類員工本身的影響褒貶不一。在這種勞動力影響的早期階段,生成式AI主要通過自動化、AI驅(qū)動的內(nèi)容和建議、分析和其他資源來支持辦公室工作人員。

早期預(yù)測生成式AI將主要處理生產(chǎn)線、制造業(yè)等體力勞動工作,而目前為止,生成式AI已經(jīng)對其最直接和廣泛的影響產(chǎn)生了影響創(chuàng)意、文案和客戶服務(wù)任務(wù)和角色。

四、對安全性、隱私和治理更加重視

2024年3月,歐盟議會正式批準了歐盟AI法案。在未來的幾個月和幾年里,使用AI的組織或與歐盟公民數(shù)據(jù)相關(guān)的組織將受到這項新法規(guī)及其規(guī)定的約束。這是首個主要關(guān)注生成式AI及其對數(shù)據(jù)隱私影響的法規(guī),但絕不會是最后一個。

在全球范圍內(nèi),聯(lián)合國已經(jīng)開始討論AI治理的重要性,國際合作,以及通過建立的全球框架負責(zé)任地開發(fā)和部署AI。雖然不太可能變成可執(zhí)行的全球法規(guī),但這是一場重要的對話,可能會決定不同國家和地區(qū)對倫理AI和法規(guī)的方法。

一些企業(yè)將開始更大規(guī)模地使用專門的AI治理和安全平臺,人工智能模型和內(nèi)容審查中的人類將成為標(biāo)準,所有使用生成式AI的公司都將以某種方式運作AI政策,以防止重大責(zé)任和損害。

五、更關(guān)注數(shù)據(jù)質(zhì)量和幻覺管理

隨著政府、監(jiān)管機構(gòu)、企業(yè)和用戶在通過生成式AI創(chuàng)建的內(nèi)容中發(fā)現(xiàn)危險的、被盜的、不準確或否則糟糕的結(jié)果,他們將繼續(xù)向AI公司施壓,要求改進他們的數(shù)據(jù)來源和培訓(xùn)流程、輸出質(zhì)量和幻覺管理策略。

雖然對高質(zhì)量結(jié)果的關(guān)注是許多AI公司當(dāng)前戰(zhàn)略的一部分,但這種方法和對公眾的透明度只會擴大,來幫助AI企業(yè)保持競爭力。

在另一個方面,谷歌的Gemini已經(jīng)有了一個相當(dāng)全面的反饋管理系統(tǒng),用戶可以輕松地點贊或差評,并將額外的反饋發(fā)送給谷歌。他們還可以修改響應(yīng),報告法律問題,并只需一鍵點擊即可用互聯(lián)網(wǎng)來源雙重檢查生成的內(nèi)容。這些功能為用戶提供了他們的反饋很重要的保證。預(yù)計會看到更多的生成式AI公司采用這種方法,以更好地進行社區(qū)驅(qū)動的生成式AI質(zhì)量保證。

分享到

崔歡歡

相關(guān)推薦