模型太多,變化太快,不知道怎么選?

與側重訓練的Amazon SageMaker不同,Amazon Bedrock主要是將訓練好的基礎模型進行推理,幫助開發(fā)人員構建和擴展生成式AI應用,由于更靠近應用創(chuàng)新的部分,因此受到了更多關注。

亞馬遜云科技人工智能與數(shù)據(jù)副總裁Dr. Swami Sivasubramanian將Amazon Bedrock的更新細分成了五個方面,如果非要挑選Amazon Bedrock現(xiàn)階段最大的價值或者賣點的話,就是它對于多個模型的支持。

當前,生成式AI大模型技術仍在快速發(fā)展當中,不同模型在不同應用場景中的表現(xiàn)會有很大差異。對于希望應用生成式AI大模型的企業(yè)而言,如何選擇合適的模型,如何在新模型出現(xiàn)時快速完成技術切換就顯得尤為重要。

亞馬遜云科技人工智能、機器學習與基礎設施服務副總裁Baskar Sridharan在采訪中表示,從原型到產品化的過程中,模型選擇是至關重要的關鍵因素之一。亞馬遜云科技通過整合來自領先供應商的廣泛模型,為用戶提供了極大的自由度。然而,今天可能模型A是最佳選擇,幾個月后模型B可能更適合,再過一段時間可能需要模型C。因此,用戶需要的是既能跟上模型進化步伐,又能保持技術堆棧穩(wěn)定的解決方案。

于是,亞馬遜云科技開始在這兩方面發(fā)力:一方面提供豐富的模型選擇,滿足用戶多樣化的需求;另一方面確保整個生態(tài)系統(tǒng)的穩(wěn)定性,為企業(yè)打造兼具靈活性與可靠性的生成式AI平臺。這種平衡無疑是推動技術落地的重要支撐點。

上圖展示了23家模型提供商

Amazon Bedrock給了用戶自由選擇模型的權利,平臺上不僅整合了來自Anthropic、Meta、Stability AI以及Amazon等23家開發(fā)商的模型,覆蓋文本生成、多模態(tài)理解、圖像與視頻生成等多個領域。

Marketplace上有122個模型

其中,新推出的Amazon Bedrock Marketplace使用戶能夠訪問另外120多個大模型。與原來最大的不同點在于,Marketplace都需要用戶自己創(chuàng)建推理模型的主機,而原來的都是Serverless這種高級的方式。不過,兩者都可以用統(tǒng)一的API調用。

看得出來,Amazon Bedrock在竭盡所能地提供更多模型可供選擇,用戶可以在這里評估模型的效果。當用戶面對N多模型不知如何選擇的時候,可以在這里做出選擇,哪怕模型并不是最理想的,也不用焦慮。

這是因為,Amazon Bedrock提供的是統(tǒng)一的API,這意味著可以簡化模型集成和切換的過程。當有新的更合適的模型出現(xiàn),開發(fā)者可以快速完成切換,無需進行大量代碼修改即可升級到最新的模型,真正克服大模型選擇困難癥。

除了推出更多模型,亞馬遜云科技還在將Amazon Bedrock打造成更適合大模型的云服務。

Amazon Bedrock優(yōu)化推理的成本、延遲和準確性

過去兩年以來,AI算力關注的絕對焦點就是訓練。然而,隨著文生視頻大模型越來越多,同時,專家發(fā)現(xiàn),依靠模型“慢思考”的模式可以提高模型的最終表現(xiàn),依靠推理算力提高模型表現(xiàn)的做法受到關注。于是,未來推理的負載會越來越多。

多步驟推理帶來新的Scaling Law

在re:Invent期間,亞馬遜云科技的Amazon Bedrock為優(yōu)化生成式AI推理效率推出了多項創(chuàng)新功能,幫助開發(fā)者在成本、延遲和模型準確性之間找到更好的平衡。

其中,新的模型蒸餾功能支持將大型模型的知識轉移到更小、更高效的模型上,可實現(xiàn)高達500%的速度提升和75%的成本降低。

此外,新增的延遲優(yōu)化推理選項讓開發(fā)者能夠利用最新的AI硬件和軟件優(yōu)化,進一步提升推理性能,滿足多樣化的業(yè)務需求。

Amazon Bedrock新推出的提示詞緩存功能能夠緩存重復使用的提示前綴,從而避免模型重復計算,延遲最多降低85%,成本最多降低90%,特別適合文檔問答、代碼助手、智能搜索或長對話等需要復雜提示的應用場景。

Amazon Bedrock新推出的智能提示詞路由功能,通過動態(tài)分配提示請求到模型家族中的不同基礎模型,實現(xiàn)高質量響應的同時降低成本,最多可節(jié)省30%。

它幫助開發(fā)者優(yōu)化任務的處理,用更高效的模型處理簡單任務,而復雜需求則交給更強大的模型,它提供了一種更高效、更經(jīng)濟的模型管理方式,加速開發(fā)并提升整體性能。

Amazon Bedrock讓用戶更高效地使用用戶自己的數(shù)據(jù)

用戶向通用模型發(fā)出提示詞,只會得到一個通用的答案,而如果模型能使用用戶自己的數(shù)據(jù),就可以得到有更多上下文的回復。

在過去兩年中,我們知道用戶可以對模型的微調和RAG(檢索增強生成)技術來使用自己的數(shù)據(jù),從而生成更符合上下文的答案。

RAG是一個相對技術化的語言,Amazon Bedrock把它包裝成了知識庫服務。在re:Invent期間,亞馬遜云科技對RAG技術能力,也就是知識庫相關的服務提供了四項增強的能力,其核心思想就是幫助用戶更方便地把自己的數(shù)據(jù)交給模型。

第一個叫GraphRAG。這里的Graph不是指圖像,而是知識圖譜。它用知識圖譜來幫助生成式AI更智能地整合和理解分散在多個數(shù)據(jù)源的信息。幸運的是,開發(fā)者不需要了解復雜的知識圖譜技術,GraphRAG會自動完成這些工作,最終讓模型給出更相關、更可信的答案。

上圖展示的是用三種方式創(chuàng)建知識庫
上圖展示的是從Redshift里提取數(shù)據(jù)的選項

知識庫結構化數(shù)據(jù)檢索功能:讓生成式AI能夠直接從Amazon Redshift中提取結構化數(shù)據(jù),并生成精準的自然語言響應。通過這一功能,開發(fā)者無需構建復雜的SQL查詢,系統(tǒng)會自動將自然語言請求轉換為SQL,查詢所需數(shù)據(jù)并整合到AI模型的響應中。該功能簡化了企業(yè)利用結構化數(shù)據(jù)開發(fā)生成式AI應用的過程。

Amazon Kendra GenAI Index是一款高精準的智能搜索工具,通過高精準的智能搜索和數(shù)據(jù)整合能力,快速接入和整合內容,無需開發(fā)復雜的自定義搜索機制或進行繁瑣的數(shù)據(jù)遷移,全面提升數(shù)據(jù)利用效率。它無縫集成Amazon Bedrock知識庫及相關功能,幫助企業(yè)輕松構建高級生成式AI應用。

Data Automation數(shù)據(jù)自動化功能:該功能通過一個簡單的API,將非結構化數(shù)據(jù)自動提取、轉換為結構化數(shù)據(jù),并生成符合生成式AI應用需求的自定義輸出,無需開發(fā)者編寫任何代碼。這項技術可大幅降低數(shù)據(jù)處理復雜度和成本,讓企業(yè)能夠充分利用多模態(tài)數(shù)據(jù),構建更智能、更高效的生成式AI應用。

構建具有安全性和負責任的AI

可以說,生成式AI在企業(yè)應用場景中落地最優(yōu)先考慮的就是安全性,Amazon Bedrock Guardrails可以為生成式AI應用實施定制的保護措施。

Automated reasoning checks自動推理檢查功能(預覽版):該功能通過數(shù)學驗證技術檢測大型語言模型(LLM)的幻覺現(xiàn)象,確保生成的答案準確,并提供可驗證的證據(jù),從而提升生成式AI在關鍵場景下的透明性和可信度。該功能允許領域專家創(chuàng)建規(guī)則化的推理政策,將復雜業(yè)務邏輯融入AI模型的驗證流程。

Amazon Bedrock Guardrails的多模態(tài)毒性檢測功能新增圖像內容的檢測與過濾能力,能夠識別并屏蔽包含仇恨、暴力、侮辱或不當行為的圖像內容。該功能適用于所有支持圖像數(shù)據(jù)的模型,包括微調模型,與文本過濾功能共同構建統(tǒng)一的安全保護層,幫助開發(fā)者確保生成內容的安全性與合規(guī)性,滿足多模態(tài)AI應用安全需求。

多智能體協(xié)作功能,解決更復雜的任務

智能體(Agent)是指能夠感知環(huán)境、進行決策并采取行動的系統(tǒng),它是AI系統(tǒng)中不可或缺的部分,其自主性和適應性使其在眾多場景中具備巨大價值,推動了AI的實際應用與發(fā)展。

Amazon Bedrock新增多智能體協(xié)作功能,支持多個專屬智能體共同協(xié)作,通過智能編排實現(xiàn)從語言理解到主動推理和執(zhí)行的全流程自動化。開發(fā)者可輕松構建和管理智能體系統(tǒng),將高級目標分解為可執(zhí)行的步驟,大幅提升解決復雜任務的能力。

小結

Amazon Bedrock在此次更新中全面提升了生成式AI的實用性,從模型選擇、推理優(yōu)化到數(shù)據(jù)整合、安全性保障,再到智能體的編排與應用,為開發(fā)者提供了更強大且靈活的工具組合。

這些功能降低了生成式AI的開發(fā)門檻,還加速了其在企業(yè)場景中的落地與價值釋放。在生成式AI蓬勃發(fā)展的當下,Amazon Bedrock無疑為企業(yè)提供了通向智能未來的重要橋梁,為推動整個行業(yè)邁向更高水平貢獻了強勁動力。

分享到

zhupb

相關推薦