這一系列模型涵蓋了Micro、Lite、Pro、Premier四大版本的語(yǔ)言模型,每一款都各具特色,滿足不同場(chǎng)景下的應(yīng)用需求。此外,還有令人矚目的圖像生成模型Canvas以及視頻生成模型Reel驚艷亮相。特別是Reel,目前已能流暢生成6秒視頻,而未來(lái)不久,其生成時(shí)長(zhǎng)將拓展至2分鐘,為用戶帶來(lái)前所未有的視覺(jué)盛宴。

風(fēng)云變幻的生成式AI時(shí)代

在即將登臺(tái)發(fā)表演講之際,亞馬遜云科技新任首席執(zhí)行官M(fèi)att Garman提出了一個(gè)引人深思的見(jiàn)解:人工智能是一場(chǎng)永無(wú)止境的競(jìng)賽,它將會(huì)持續(xù)不斷地向前推進(jìn)。

目前,這場(chǎng)競(jìng)賽尚處于初期階段。在經(jīng)歷了“全力投入大模型”的狂熱之后,業(yè)界開(kāi)始深思:在這場(chǎng)持久戰(zhàn)中,接下來(lái)應(yīng)把重點(diǎn)放在“細(xì)水長(zhǎng)流”的穩(wěn)健發(fā)展上。

對(duì)于各行各業(yè)的用戶而言,可持續(xù)發(fā)展面臨的首要挑戰(zhàn)便是成本問(wèn)題。如果說(shuō)去年我們還在探索如何適應(yīng)新興的生成式AI技術(shù),那么到了2024年末,更為關(guān)鍵的是:如何不斷降低生成式AI的應(yīng)用成本,即提高生成式AI技術(shù)應(yīng)用的性價(jià)比。

在今日凌晨的主旨演講中,Matt Garman分享了亞馬遜云科技在人工智能和計(jì)算等領(lǐng)域取得的“新技術(shù)、新產(chǎn)品、新服務(wù)”成果,標(biāo)志著生成式AI技術(shù)棧的又一次革新。

我們見(jiàn)證了一系列前沿的技術(shù)能力發(fā)布,這些發(fā)布令人震撼且源源不斷。與此同時(shí),技術(shù)的落地成本降低到了令人難以置信的水平。

這一系列升級(jí),無(wú)疑堪稱“真正的革命性變革”。在變幻莫測(cè)的生成式AI時(shí)代,亞馬遜云科技再次展現(xiàn)了其“掌控全場(chǎng)”的實(shí)力。

將性價(jià)比做到極致

去年4月,亞馬遜云科技正式踏入生成式AI大模型的競(jìng)技舞臺(tái),其首發(fā)的Amazon Titan系列模型當(dāng)時(shí)專注于文本內(nèi)容的生成與高效搜索功能的打造。僅僅一年多時(shí)間,亞馬遜云科技已在基礎(chǔ)模型層面完成了全面布局,正朝著涵蓋文本、圖像、視頻及語(yǔ)音的全模態(tài)體系全力邁進(jìn),在與OpenAI、谷歌、Anthropic等業(yè)界巨頭的競(jìng)爭(zhēng)中,展現(xiàn)出了強(qiáng)勁的實(shí)力。

在今年的re:Invent大會(huì)上,亞馬遜云科技自主研發(fā)的生成式AI多模態(tài)Amazon Nova系列模型驚艷亮相。該系列模型不僅在多種任務(wù)中達(dá)到了業(yè)界領(lǐng)先的智能水平,更在性價(jià)比方面樹(shù)立了新的標(biāo)桿。

亞馬遜總裁兼CEO安迪·賈西(Andy Jassy)親自見(jiàn)證了這一重要時(shí)刻。此次發(fā)布的Amazon Nova系列模型共包含四個(gè)版本:

純文本模型Amazon Nova Micro,支持高達(dá)128k的上下文,能夠以極低的成本實(shí)現(xiàn)最低延遲的響應(yīng);

成本效益顯著的多模態(tài)模型Amazon Nova Lite,支持300k上下文或30分鐘視頻輸入,能夠迅速處理圖像、視頻及文本信息;

功能全面的多模態(tài)模型Amazon Nova Pro,同樣支持300k上下文或30分鐘視頻輸入,在準(zhǔn)確性、速度與成本之間實(shí)現(xiàn)了完美平衡,適用于各種復(fù)雜任務(wù);

以及性能最為強(qiáng)大的多模態(tài)模型Amazon Nova Premier,專為復(fù)雜推理任務(wù)設(shè)計(jì),同時(shí)可作為自定義蒸餾模型的最佳教師模型。

在基準(zhǔn)測(cè)試中,Amazon Nova系列模型展現(xiàn)出了非凡的實(shí)力。純文本模型Amazon Nova Micro在與LLaMa 3.1 8B、Gemini 1.5 Flash-8B等模型的對(duì)比中,表現(xiàn)相當(dāng)甚至更優(yōu)。其210 tokens/s的輸出速度更是業(yè)界領(lǐng)先,對(duì)于追求快速響應(yīng)的應(yīng)用場(chǎng)景而言,無(wú)疑是最佳選擇。而多模態(tài)模型Amazon Nova Lite與Amazon Nova Pro在與OpenAI、谷歌、Anthropic等主流廠商的模型中,也在絕大多數(shù)基準(zhǔn)測(cè)試中表現(xiàn)出色,尤其在處理輕量級(jí)任務(wù)時(shí),Lite更是以極低的成本提供了卓越的多模態(tài)處理能力。

目前,Amazon Nova Micro、Lite、Pro三款模型已正式推出,并集成至Amazon Bedrock平臺(tái),支持自定義微調(diào)和蒸餾。而Amazon Nova Premier則計(jì)劃于2025年第一季度面世。在性能全面提升的同時(shí),Amazon Nova系列模型中的Micro、Lite與Pro版本的價(jià)格相比Amazon Bedrock中同類別的最強(qiáng)模型,至少降低了75%。這對(duì)于那些需要大模型服務(wù)、預(yù)算有限但又追求模型效果的客戶來(lái)說(shuō),無(wú)疑是一個(gè)極具吸引力的選擇。

此外,在圖像與視頻生成模型競(jìng)爭(zhēng)日益激烈的當(dāng)下,亞馬遜云科技也展示了其強(qiáng)大的內(nèi)容創(chuàng)作實(shí)力。獨(dú)立的圖像生成模型Amazon Nova Canvas與視頻生成模型Amazon Nova Reel相繼亮相:Canvas支持圖像的生成與編輯,提供了豐富的配色方案與布局控件;而Reel則能根據(jù)關(guān)鍵提示詞和參考圖像生成6秒視頻,并支持用戶調(diào)整攝像頭運(yùn)動(dòng)以實(shí)現(xiàn)平移、360度旋轉(zhuǎn)和縮放等操作,未來(lái)還將支持2分鐘視頻的生成。

安迪·賈西還預(yù)告了另外兩款即將推出的Amazon Nova模型:Amazon Nova Speech-to-Speech與Amazon Nova Any-to-Any。前者旨在實(shí)現(xiàn)自然、類人的口頭交互體驗(yàn);后者則致力于用同一個(gè)模型解決多種任務(wù),包括多模態(tài)轉(zhuǎn)換、內(nèi)容編輯以及AI智能體操作等。這兩款模型預(yù)計(jì)將于2025年第一季度和中期分別面世。

從文本到視頻,Amazon Nova系列模型一次性全部上線,并直接對(duì)標(biāo)了最新的技術(shù)發(fā)展方向。亞馬遜云科技自研大模型的進(jìn)化速度之快,讓全場(chǎng)觀眾都為之震撼。

算力革命即將到來(lái)

過(guò)去十年,AI行業(yè)已達(dá)成共識(shí):模型參數(shù)量的增長(zhǎng)和計(jì)算復(fù)雜度的提升,離不開(kāi)強(qiáng)大算力的支持。這一結(jié)論可以從兩個(gè)簡(jiǎn)單維度來(lái)理解:一是向上擴(kuò)展,即使用更強(qiáng)大的計(jì)算機(jī);二是向外擴(kuò)展,即使用更多的計(jì)算機(jī)。

然而,在生成式AI時(shí)代,由于模型涉及數(shù)十億甚至上千億的參數(shù),設(shè)計(jì)、訓(xùn)練和部署這些模型都需要消耗巨大的計(jì)算資源。例如,每次訓(xùn)練都需要對(duì)海量數(shù)據(jù)進(jìn)行復(fù)雜的矩陣運(yùn)算和梯度計(jì)算,這對(duì)算力基礎(chǔ)設(shè)施的要求遠(yuǎn)超以往。

對(duì)于希望應(yīng)用生成式AI的企業(yè)而言,要追上OpenAI、谷歌等頂尖公司,就必須購(gòu)買越來(lái)越多的高端芯片和云服務(wù),這導(dǎo)致計(jì)算成本顯著上升。據(jù)Gartner分析,到2025年,隨著AI技術(shù)基礎(chǔ)設(shè)施的不斷升級(jí),各個(gè)云支出領(lǐng)域的增長(zhǎng)率都將達(dá)到兩位數(shù)。

當(dāng)前,核心問(wèn)題在于如何在算力資源短缺的環(huán)境下擴(kuò)大算力來(lái)源,并如何在高昂的計(jì)算成本壓力下高效利用算力。對(duì)此,亞馬遜云科技的自研AI芯片Trainium為企業(yè)用戶提供了一個(gè)速度快、能耗低的優(yōu)質(zhì)選擇。

Trainium是亞馬遜云科技自研的AI芯片,自2020年首次推出以來(lái),便因其高效的AI模型訓(xùn)練能力而備受矚目。在今年的re:Invent大會(huì)上,亞馬遜云科技宣布Trainium2芯片已全面正式可用,助力行業(yè)訓(xùn)練和部署大型語(yǔ)言模型。Trainium2的速度是其上一代產(chǎn)品的四倍,于一年前首次發(fā)布。

單個(gè)Trainium2驅(qū)動(dòng)的EC2實(shí)例配備16個(gè)Trainium2芯片,可提供高達(dá)20.8 PetaFLOPS的計(jì)算性能。在測(cè)試中,與其他云服務(wù)商的類似產(chǎn)品相比,使用Amazon Bedrock Trn2 EC2實(shí)例的Llama 3.1 405B模型在token生成吞吐量上提高了三倍以上。

此外,亞馬遜云科技與Anthropic正合作構(gòu)建一個(gè)名為Project Rainier的Trn2 UltraServer集群。生成式AI爆發(fā)后,Anthropic大量使用了亞馬遜云科技的算力設(shè)施,并一直緊追OpenAI。今年11月底,亞馬遜宣布向Anthropic追加40億美元投資,累計(jì)投資達(dá)80億美元。基于深厚的合作關(guān)系,Anthropic將使用亞馬遜云科技的Trainium AI芯片來(lái)訓(xùn)練和運(yùn)行其AI模型。

Project Rainier集群將包含數(shù)十萬(wàn)個(gè)Trainium2芯片,為Anthropic提供足夠的可擴(kuò)展分布式計(jì)算能力,以訓(xùn)練下一代大模型。與Anthropic用于訓(xùn)練當(dāng)前一代模型的集群相比,新集群的計(jì)算能力達(dá)到其五倍,并將成為全球最大的AI計(jì)算集群。

對(duì)于規(guī)模更大的萬(wàn)億級(jí)參數(shù)LLM,亞馬遜發(fā)布了第二層Trainium2實(shí)例——Trn2 UltraServer,同時(shí)提供64個(gè)Trainium2芯片用于AI模型訓(xùn)練或推理。它將允許用戶超越單個(gè)Trn2服務(wù)器的限制,提供高達(dá)83.2 PetaFLOPS的峰值計(jì)算能力。

同時(shí),亞馬遜云科技的下一代自研AI芯片Trainium3也在研發(fā)中。這是該公司首款采用3nm工藝制造的芯片,性能將是Trainium2的兩倍,能耗降低40%,性能可與英偉達(dá)的新一代AI芯片相媲美。

首批基于Trainium3的實(shí)例預(yù)計(jì)將于2025年上市。亞馬遜云科技表示,搭載Trainium3的UltraServer性能將比搭載Trainium2芯片的UltraServer高出四倍。

在生成式AI技術(shù)快速發(fā)展的背景下,不斷進(jìn)化的亞馬遜云科技為用戶提供了一個(gè)可靠的“算力”選擇。當(dāng)業(yè)界熱議“追逐Scaling Law是否還有意義”時(shí),亞馬遜云科技的Trainium系列和其一整套AI基礎(chǔ)設(shè)施,無(wú)疑為各行各業(yè)的用戶在這場(chǎng)技術(shù)浪潮中提供了堅(jiān)實(shí)的“船槳”。

Any-to-Any萬(wàn)能模型

亞馬遜云科技在大會(huì)上還推出了任意轉(zhuǎn)任意(Any-to-Any)萬(wàn)能模型的預(yù)覽。這一模型能夠接受文本、圖像、音頻和視頻作為輸入,并以任意模態(tài)生成輸出,將簡(jiǎn)化應(yīng)用開(kāi)發(fā),使同一模型能夠執(zhí)行多種任務(wù),如內(nèi)容模態(tài)轉(zhuǎn)換、內(nèi)容編輯,以及驅(qū)動(dòng)能夠理解和生成所有模態(tài)的AI代理。這一突破性的進(jìn)展無(wú)疑將徹底改變生成式AI的游戲規(guī)則。

結(jié)語(yǔ)

亞馬遜云科技在re:Invent大會(huì)上的連串發(fā)布,彰顯了其在云計(jì)算與AI領(lǐng)域的深厚底蘊(yùn)與不竭的創(chuàng)新動(dòng)力。這些嶄新的產(chǎn)品與技術(shù),無(wú)疑將為生成式AI的發(fā)展注入強(qiáng)勁動(dòng)力,加速其應(yīng)用的廣泛落地,為各行各業(yè)開(kāi)辟更為廣闊的創(chuàng)新空間與變革之路。(文/宋雨涵)

分享到

lixiangjing

算力豹主編

相關(guān)推薦