從現(xiàn)在開始,用戶可以通過Amazon Bedrock提供的API來調(diào)用滿血版的DeepSeek-R1了。這既是DeepSeek-R1在亞馬遜云科技上的最佳打開方式,也是DeepSeek在企業(yè)以負(fù)責(zé)任的方式落地的最佳方式。
亞馬遜云科技CEO Matt Garman表示:“自DeepSeek-R1在亞馬遜云科技上線以來,我們看到了巨大的需求。而現(xiàn)在,用戶可通過無縫集成的強(qiáng)大AI能力,獲得所有核心功能:內(nèi)置安全防護(hù)、全面監(jiān)控能力、可定制護(hù)欄,以及對數(shù)據(jù)的完全掌控?!?/p>
Amazon Bedrock:DeepSeek-R1的云上最佳打開方式
個人用戶在日常工作生活中,如果不處理敏感信息,大可以使用各種互聯(lián)網(wǎng)上的免費(fèi)DeepSeek-R1服務(wù)。如果想在企業(yè)內(nèi)部部署,大致上有兩種方式,一種是采購硬件在本地進(jìn)行部署,另外一種是選擇可靠的公有云服務(wù)來部署。
最近,DeepSeek一體機(jī)的方式比較火熱,然而,想要一套能部署滿血版的一體機(jī)硬件,不僅初期采購成本會比較高。而且,如果想要在企業(yè)環(huán)境中穩(wěn)定使用,還需要一系列的優(yōu)化技術(shù),比如,要優(yōu)化輸出性能,并且要考慮并發(fā)性等問題。
云服務(wù)雖然省去了硬件維護(hù)上的麻煩,但優(yōu)勢也有限。比如,此前,用戶想在亞馬遜云科技上用DeepSeek-R1滿血版,先要通過Amazon Bedrock Markeplace創(chuàng)建一個有8張H200的EC2實例。哪怕你不跟DeepSeek聊上一句,也得先花上很多資金。
如果想用全托管的方式使用DeepSeek-R1,也可以使用Amazon Bedrock自定義模型導(dǎo)入功能。但是,這種方式目前只支持8B和70B的兩個蒸餾小模型,然而,大部分人想用的DeepSeek-R1其實是有6710億參數(shù)的滿血版,而不是蒸餾版!
官方博客中提到,自1月下旬該模型推出以來,已有數(shù)千名客戶使用Amazon Bedrock的自定義模型導(dǎo)入功能部署了DeepSeek-R1模型。這說明,有很多用戶還是希望用上全托管的方式來使用DeepSeek模型的。
現(xiàn)在,備受期待的全托管滿血版DeepSeek-R1模型來了,作為一款Serverless服務(wù),用戶不用管理硬件基礎(chǔ)設(shè)施、不用研究模型部署和優(yōu)化的各種技術(shù),可以直接調(diào)用API所消耗的方式來計費(fèi)使用,快速集成到自己的企業(yè)級應(yīng)用當(dāng)中。
當(dāng)然,部署和使用只是一個開始,為了能真正在企業(yè)環(huán)境中使用,Amazon Bedrock Guardrail還提供了多種關(guān)鍵能力,包括提高生成內(nèi)容的準(zhǔn)確性,減少生成不良內(nèi)容的能力,以及數(shù)據(jù)安全、隱私和合規(guī)管理方面的,讓企業(yè)落地負(fù)責(zé)任的AI。
Amazon Bedrock讓企業(yè)以負(fù)責(zé)任的方式用上DeepSeek
DeepSeek-R1作為一個推理模型,其表現(xiàn)出的智能水平達(dá)到了業(yè)內(nèi)一流水平。但經(jīng)常使用它的人會發(fā)現(xiàn),DeepSeek-R1生成內(nèi)容的幻覺問題也比較突出。有數(shù)據(jù)稱,R1的幻覺概率比DeepSeek-V3大約高14%。
Amazon Bedrock Guardrails有一個自動推理檢查功能,可以檢查因模型幻覺而導(dǎo)致的事實性錯誤。它運(yùn)用數(shù)學(xué)邏輯方法來驗證內(nèi)容。在那些主題廣泛且復(fù)雜、并有一套明確定義的業(yè)務(wù)規(guī)則或知識體系的領(lǐng)域,自動推理檢查功能表現(xiàn)尤為出色。
亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建表示:“以前大模型缺乏可證明事實的邏輯,導(dǎo)致出現(xiàn)幻覺時難以糾正。但有了自動推理技術(shù),我們能夠通過數(shù)學(xué)驗證方式嚴(yán)密證明事實性錯誤是否會發(fā)生,從而有效改善幻覺問題?!?/p>
Amazon Bedrock的Guardrails還支持進(jìn)行內(nèi)容過濾、主題限制、敏感詞屏蔽、個人信息保護(hù)等多重防護(hù)策略,最多可阻隔85%的不良和有害內(nèi)容,可以盡可能地確保生成式AI輸出內(nèi)容的合規(guī)性與安全性。
與此同時,Amazon Guardrails還集成了多項安全與合規(guī)服務(wù),包括數(shù)據(jù)加密、細(xì)粒度訪問控制、安全連接選項及國際合規(guī)認(rèn)證。同時,通過Amazon KMS、Amazon IAM、Amazon Network Firewall等保障數(shù)據(jù)安全,并借助Amazon CloudWatch與Amazon CloudTrail實現(xiàn)全面監(jiān)控與審計。
此外,亞馬遜云科技還能確保用戶在保障數(shù)據(jù)安全和隱私前提下,使用自有數(shù)據(jù)進(jìn)行基礎(chǔ)模型的微調(diào)和定制,用戶所有數(shù)據(jù)都會經(jīng)過加密,不會離開虛擬私有云(VPC)環(huán)境。并且,亞馬遜云科技也絕不會拿任何用戶數(shù)據(jù)來訓(xùn)練模型。
DeepSeek-R1的爆火,說明AI大模型技術(shù)仍在快速發(fā)展
DeepSeek-R1的爆火讓更多人意識到,大語言模型技術(shù)仍處于飛速發(fā)展的階段,這意味著,可能隨時都會有新的更強(qiáng)模型推出。而企業(yè)為了能更好地迎接大模型技術(shù)時代,都會盡早開始熟悉、部署和嘗試使用AI技術(shù)服務(wù)。
Amazon Bedrock提供了來自AI21 Labs、亞馬遜、Anthropic、Cohere、Luma AI、Meta、Mistral AI、Stability AI、DeepSeek等多家大語言模型,當(dāng)有新模型的出現(xiàn)時,用戶可以隨時切換到新模型。
Amazon Bedrock本身支持全托管的方式運(yùn)行大語言模型,就像現(xiàn)在DeepSeek-R1這樣。作為補(bǔ)充,亞馬遜云科技還推出了Amazon Bedrock Marketplace,讓用戶更快接觸到更多、更新的模型,從而找到適合自己的。
為了讓用戶更快找到適合自己的,Amazon Bedrock還提供了模型評估功能。該功能支持多種方式評價模型效果,它是企業(yè)快速分析和比較Amazon Bedrock上模型的最快方式,讓評估模型的時間從幾個星期縮短到幾個小時。
都說2025年是智能體(AI Agent)元年,Amazon Bedrock支持用戶基于大語言模型來創(chuàng)建智能體。2024年的re:Invent期間,Amazon Bedrock還新推出了多智能Agents協(xié)作功能,讓企業(yè)能夠輕松構(gòu)建和協(xié)調(diào)專業(yè)智能體來執(zhí)行更加復(fù)雜的工作流程。
小結(jié)
DeepSeek-R1的迅速爆火,清晰地表明大語言模型技術(shù)仍在高速迭代發(fā)展,企業(yè)盡早上手,才能更從容應(yīng)對未來技術(shù)的快速演進(jìn)。此次亞馬遜云科技與DeepSeek的結(jié)合,只是精彩的開始。未來,我們還能期待看到更多創(chuàng)新的功能與優(yōu)化的出現(xiàn)。