3月底,Claude3旗下最強的Opus模型在Chatbot Arena榜單上超越了原來一直排在第一位的GPT-4,標志著ChatGPT遇到了自發(fā)布以來真正意義上可以匹敵的對手。
或許是亞馬遜很滿意Claude3的表現(xiàn)。差不多同一時間,亞馬遜宣布向Anthropic追加27.5億美元投資,加上去年已經(jīng)投的12.5億美元,總投資達40億美元。
一直以來,盡管有一些專業(yè)的Benchmark方案,但用戶的實際體驗跟評分之間經(jīng)常有不小差距?;趯嶋H體驗,很多人都將ChatGPT視為最強的聊天機器人。
而Chatbot Arena榜單是一個用人的主觀判斷來給模型打分的網(wǎng)站,在評判前用戶不知道對面是哪個模型。用戶對模型產(chǎn)出的結(jié)果做出主觀判斷后才能看到具體用的是哪個模型。
在Chatbot Arena榜單上打敗GPT-4,一定程度上證明了Anthropic有著與OpenAI相近的實力。
而亞馬遜對Anthropic的40億美元投資,不僅戰(zhàn)略上讓亞馬遜在生成式AI技術領域拿到了更多籌碼,從實際發(fā)展來講,對于其云計算業(yè)務的發(fā)展有不少積極意義。
眼下,很多人都意識到,人工智能技術這么發(fā)展下去,對算力資源的需求似乎是無窮無盡的,對于能源的需求也帶來了很大挑戰(zhàn)。
此前,有媒體報道稱,OpenAI的CEO薩姆·奧特曼與一些投資者溝通,計劃籌集7萬億美元做芯片,提高全球芯片產(chǎn)量,從而推動人工智能發(fā)展。
最近,有媒體報道說微軟跟OpenAI要斥資1000億美元打造名為Stargate星際之門的AI超算,興建AI數(shù)據(jù)中心。
亞馬遜也沒閑著,計劃未來15年要投資1500億美元新建數(shù)據(jù)中心,以應對人工智能和其他數(shù)字服務需求的激增。
AI的發(fā)展也引發(fā)了科技公司對于能源問題的擔憂,因為用電量太大,包括亞馬遜、谷歌和微軟等科技公司,也將目光投向包括核能和地熱能在內(nèi)的清潔能源。
此前,OpenAI CEO薩姆·奧特曼也說過,AI需要更多能源,可能需要核聚變技術或者太陽能存儲技術上的突破。大型科技公司也投了很多能源創(chuàng)新企業(yè),都在尋找技術突破。
從目前來看,云計算服務商在解決算力和能源短缺方面有先天優(yōu)勢,是大模型最合適的基礎設施。
因為,云廠商不僅有數(shù)量龐大的數(shù)據(jù)中心資源,為了降低數(shù)據(jù)中心的運營成本,提高效率,云廠商在降低PUE和采用清潔能源上已經(jīng)有了非常多的探索。
想必OpenAI選擇與微軟的合作會有這一方面的考慮,而Anthropic與亞馬遜的合作也必然有同樣的考慮。
為了迎接生成式AI技術浪潮,亞馬遜做的準備遠不止投資Anthropic。
2023年的re:Invent大會上,亞馬遜云科技介紹了生成式AI相關的三層技術棧。
最底層是高性能基礎設施,可以提供包括最新的英偉達GH200芯片在內(nèi)的多種計算資源。同時,亞馬遜也自研了Amazon Trainium訓練芯片,為了提高訓練效率,亞馬遜云科技的UltralClusters集群支持讓10萬多個Amazon Trainium2芯片一起做并行訓練。
中間層,亞馬遜云科技通過Amazon Bedrock提供多種基礎模型,其中包括知名的開源模型,如Stable Diffusion XL、Llama、Mistral 7B和Mixtral 8*7B,也有如Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan等非開源模型。
Amazon Bedrock托管了這些模型,用戶可以直接通過API來調(diào)用,也可以在此基礎上做一些定制開發(fā)。用戶可以用它來創(chuàng)建知識庫,可以開發(fā)各種Agent代理,落地負責任的AI,同時,還能幫助企業(yè)保持數(shù)據(jù)的安全性和合規(guī)。
亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理 陳曉建表示,“從模型能力到真正的運營生產(chǎn)之間,企業(yè)還需要增加很多輔助能力。Amazon Bedrock提供一系列廣泛的能力,這些工程化的能力是企業(yè)在真正上生產(chǎn)環(huán)境時一定會需要的?!?/p>
第三層則是一些開箱即用的SaaS化的服務,最有代表性的是對標微軟Copilot的智能聊天機器人Amazon Q,這是一種專門為工作場景設計的ChatBot智能助手。此外,還有面向編程開發(fā)人員的平臺Amazon CodeWhisperer等。
Anthropic與亞馬遜的合作中,Anthropic將亞馬遜云科技作為首選云服務提供商,利用底層提供的Amazon Trainium及Amazon Inferentia芯片構建模型。同時,利用Amazon Bedrock來為提供Claude3基礎模型的長期訪問權限。
Claude3剛發(fā)布的時候就上線到了Amazon Bedrock平臺上,現(xiàn)在是Amazon Bedrock上最強的大模型。
Claude 3 包含Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus三個模型,Claude 3 Opus是最強大的,在各種評測指標上都表現(xiàn)出色,接近人類水平的理解和流暢度。Claude 3 Sonnet在能力和速度之間實現(xiàn)了一個平衡,Claude 3 Haiku最小,但速度最快。
Claude 3創(chuàng)造模型智能水平的新紀錄——在數(shù)學問題、編程練習和科學推理等標準評估中超越了所有現(xiàn)有模型。而且,它本身就具有多模態(tài)能力,支持圖像的輸入,支持更長的上下文處理能力。而且,Claude 3能夠降低幻覺,提升回答準確率。
彩蛋:本文的標題就是Claude 3的Sonnet生成的,略有調(diào)整。