谷歌2025年度I/O開發(fā)者大會的主題演講環(huán)節(jié)精彩紛呈,集中展示了谷歌在AI、多模態(tài)模型、跨設(shè)備整合以及開發(fā)者工具等領(lǐng)域的最新突破與成果。從升級版的Gemini 2.5 Pro模型,到智能眼鏡的XR應(yīng)用,再到AI賦能的搜索與網(wǎng)頁瀏覽新體驗,谷歌所呈現(xiàn)的,不僅是模型性能的顯著提升,更是AI從單純的“信息工具”向“通用智能體”跨越式的進(jìn)化。

文字編輯|宋雨涵

1

Gemini 2.5 Pro

通用AI模型的“深度思考”革命

作為大會的明星模型,Gemini 2.5 Pro憑借其“深度思考”(Deep Think)模式和多模態(tài)能力,重新定義了AI的認(rèn)知邊界。該模型支持100萬token的上下文窗口(計劃擴(kuò)展至200萬),能夠處理整本書籍或復(fù)雜代碼庫級別的信息,并通過分層推理解決高等數(shù)學(xué)、編程等專業(yè)問題。在權(quán)威測評中,其代碼生成能力超越Claude 3.7 Sonnet和GPT-4.1 Turbo,并在GPQA(全球問題解答評估)中位列榜首。

此外,Gemini 2.5 Pro實現(xiàn)了跨模態(tài)的統(tǒng)一處理框架,可無縫整合文本、圖像、音頻和視頻數(shù)據(jù),例如實時解析攝像頭畫面生成AR導(dǎo)航建議,或通過語音對話同步完成代碼調(diào)試。配套推出的Gemini 2.5 Flash則以更低成本和更高效率,為常規(guī)任務(wù)提供輕量化解決方案。

2

搜索升級

從信息檢索到任務(wù)執(zhí)行的躍遷

谷歌搜索的AI Mode功能成為全場焦點(diǎn)。這一由Gemini 2.5 Pro驅(qū)動的模式,徹底改變了傳統(tǒng)搜索邏輯:

谷歌在近期積極應(yīng)對新生代AI搜索應(yīng)用的沖擊,對其核心搜索業(yè)務(wù)進(jìn)行了多項升級。在I/O開發(fā)者大會上,谷歌宣布其搜索中的AI概覽功能已覆蓋200多個國家和地區(qū),支持40多種語言,并新增了對多種語言的支持,旨在改進(jìn)用戶搜索體驗,提供更快速、準(zhǔn)確的搜索結(jié)果。此外,谷歌還將在美國的AI概覽中引入Gemini 2.5的定制版本,以提升搜索解決復(fù)雜問題的能力。

同時,谷歌正式在美國推出無需注冊Labs的AI模式,該模式具備更先進(jìn)的推理和多模態(tài)分析能力,能夠通過后續(xù)問題和網(wǎng)絡(luò)鏈接進(jìn)行深入探索。AI模式采用查詢扇出技術(shù),能更深入地挖掘網(wǎng)絡(luò)內(nèi)容,幫助用戶發(fā)現(xiàn)更多相關(guān)資源。谷歌還宣布將深度研究功能引入AI模式,通過發(fā)起數(shù)百次搜索和推理,快速創(chuàng)建專家級引用報告,節(jié)省用戶研究時間。

谷歌還為搜索引入了實時功能,通過Project Astra的實時技術(shù),用戶可使用攝像頭與搜索實時交流所看到的內(nèi)容。此外,谷歌將Project Mariner的智能體功能融入AI模式,幫助用戶節(jié)省購票等任務(wù)的時間,通過跨網(wǎng)站分析門票選項并提供實時價格和庫存,簡化購買流程。

最后,谷歌還為搜索的AI模式引入了個人上下文與定制圖表等能力,以進(jìn)一步提升用戶體驗。

三、智能體模式:

跨平臺任務(wù)代理系統(tǒng)

谷歌CEO皮查伊正式宣布,谷歌將在Chrome瀏覽器、搜索服務(wù)以及Gemini應(yīng)用程序中引入智能體模式(Agent Mode)。這一模式下,智能體能夠與瀏覽器及其他軟件進(jìn)行高效交互與操作。目前,谷歌研發(fā)的AI智能體Mariner已具備同時處理多達(dá)10項任務(wù)的能力,用戶僅需向其展示一次任務(wù)流程,智能體便能迅速學(xué)習(xí),并將所學(xué)經(jīng)驗應(yīng)用于未來的類似場景。

智能體模式的實驗版本即將面向Gemini App的訂閱用戶開放。在現(xiàn)場演示環(huán)節(jié),皮查伊展示了Gemini App中智能體模式的強(qiáng)大功能,他要求智能體協(xié)助用戶尋找合適的公寓。接到指令后,Gemini迅速訪問房產(chǎn)網(wǎng)站Zillow,利用電腦自動調(diào)整篩選條件,并通過模型上下文協(xié)議(MCP)成功預(yù)約了看房時間。

皮查伊對此評價道:“我們正步入一個全新的時代。將研究成果轉(zhuǎn)化為實際應(yīng)用的最有效途徑,就是讓它們真正服務(wù)于人們的生活?!彼€透露,在獲得用戶許可的前提下,Gemini現(xiàn)已能夠在各類應(yīng)用程序中以“私密且安全”的方式使用用戶的個人信息。

4

硬件創(chuàng)新

XR眼鏡與3D通信重塑交互

Android XR平臺與AR眼鏡

谷歌工程主管Shahram Izadi透露,谷歌計劃在未來幾個月內(nèi)將Gemini AI功能的應(yīng)用范圍從手機(jī)擴(kuò)展至智能手表、汽車中控臺、電視乃至眼鏡等更多設(shè)備。

Izadi指出,谷歌推出的安卓XR平臺專為AI眼鏡設(shè)備設(shè)計,預(yù)示著未來用戶可能會擁有不止一副AI眼鏡。比如,在觀影或工作時,用戶可能更傾向于使用具備沉浸式體驗的頭戴式設(shè)備;而在出行購物時,輕便的眼鏡則能提供實時信息,滿足用戶的不同需求。

安卓XR平臺由谷歌、三星和高通聯(lián)合開發(fā),自去年項目公布以來,已有數(shù)百家軟件開發(fā)商為該平臺提供了適配支持。其中,三星的Project Moohan將成為首款安卓XR設(shè)備,并計劃于今年晚些時候上市銷售。

此外,谷歌還宣布與中國AR品牌Xreal達(dá)成戰(zhàn)略合作,雙方將以Project Aura為名義,共同推出第二款安卓XR設(shè)備。這款設(shè)備將是首款搭載安卓XR平臺的AR眼鏡,有望為用戶帶來全新的交互體驗。

Beam 3D通信系統(tǒng)

谷歌發(fā)布名為Google Beam的新產(chǎn)品。它是一個AI驅(qū)動的視頻通信平臺,讓人們的視頻感覺如同面對面聊天。它是谷歌3D視頻會議系統(tǒng)項目Starline技術(shù)的升級版。谷歌與惠普合作,將Google Beam系統(tǒng)商業(yè)化,今年晚些時候,惠普將推出首批Google Beam設(shè)備。Google Beam采用六個攝像頭陣列,從不同角度捕捉拍攝對象、比如人物。AI視頻模型將實時拼接這些視圖,渲染成類似3D的畫面,從而創(chuàng)建3D人物。谷歌表示,該系統(tǒng)擁有近乎完美的頭部追蹤技術(shù),精度可達(dá)毫米級,以視頻幀率每秒60 幀(fps)的實時渲染速度呈現(xiàn)。

谷歌I/O 2025:

AI智能體全面滲透

谷歌作為人工智能(AI)研究領(lǐng)域的先鋒,早在Transformer架構(gòu)與AlphaGo的輝煌時代,便已筑牢了堅實的技術(shù)基石。然而,在近年來AI應(yīng)用層面的激烈角逐中,谷歌略顯審慎,未能如競爭對手般在用戶體驗上實現(xiàn)同步飛躍。不過,在2025年的I/O大會上,谷歌憑借一系列重大發(fā)布,彰顯了其在AI應(yīng)用領(lǐng)域的強(qiáng)勢復(fù)興。

從AI Mode徹底革新搜索體驗,再到Gemini 2.5展現(xiàn)的深度推理能力以及Project Mariner的智能體功能,谷歌不僅成功追趕上了AI應(yīng)用的潮流,更在多個核心領(lǐng)域?qū)崿F(xiàn)了跨越式發(fā)展。此次大會,不僅是谷歌技術(shù)實力的集中展現(xiàn),更是其向未來發(fā)出的堅定宣言:在AI驅(qū)動的新紀(jì)元里,谷歌將持續(xù)引領(lǐng)潮流,致力于構(gòu)建一個更加智能、更加互聯(lián)的世界。

分享到

lixiangjing

算力豹主編

相關(guān)推薦