2025年被視為AI Agent爆發之元年,AI Agent在標準化和短周期任務中展現出令人驚嘆的應用能力,市場中爆發多款備受矚目的AI Agent 產品。面向未來,AI Agent對于長周期、復雜化任務領域也有望取得飛速進展,這無疑將徹底重塑眾多行業的業務、流程和組織。
“為什么不?”--當亞馬遜云科技CEO Matt Garman在AWS re:Invent2025大會上喊出這一口號時,設想未來數十億AI Agent協同工作的壯觀場景,現場觀眾無不歡呼。
作為云計算領域的頂級盛會,AWS re:Invent大會一向是云計算、人工智能等前沿技術應用與探索的風向標。對于AI Agent帶來的變革性影響,亞馬遜云科技也在今年re:Invent大會上帶來全新的思考與洞察。
正如亞馬遜云科技 CEO Matt Garman所言,AI Agent就行云計算一樣具有變革性,而Agentic AI時代正加速到來。為此,亞馬遜云科技發布一系列新服務,將從AI基礎設施、推理平臺、數據和Agents 工具等方面推動Agent在行業中的深度應用。
![]()
亞馬遜云科技 CEO Matt Garman
AI工廠:將AI部署在本地
在AI 基礎設施方面,今年大會一項重要服務的發布無疑是:AWS AI Factory。亞馬遜云科技希望通過AWS AI Factory,將專用的全棧AI 基礎設施直接部署到客戶現有的數據中心內。
Matt Garman介紹,AWS AI Factory結合了NIVIDIA GPU、AWS Trainium 芯片、高速低延遲網絡以及Amazon Bedrock 和 Amazon SageMaker等核心AI 服務。
不同于過去Outposts等機架設備,AWS AI Factory是一個完整的全棧技術方案,包含了從芯片、基礎設施、AI模型、AI平臺等一系列產品。借助此服務,用戶可以利用自身的設施、電力和網絡連接,AWS 則負責部署、運維和生命周期管理,類似獲得私有AWS Region。
亞馬遜云科技此舉意義重大。AWS AI Factory的好處在于提供了一個經過驗證、產品成熟的全棧AI方案,更可以持續迭代,與亞馬遜云科技基礎設施保持同樣的水準。
眾所周知,有不少行業積極看重安全與合格性,又渴望能夠快速部署和應用AI。但大部分行業用戶并不缺乏基礎設施,卻唯獨缺少切實可行、可用于生產環境的大規模人工智能部署路徑 。例如,數據質量、模型部署、安全治理等方面挑戰極大,絕非簡單將眾多產品與工具拼湊就能夠解決的,而AWS AI Factory全棧方案的到來,意味著用戶可以屏蔽AI基礎設施等方面的復雜性,大幅縮短部署周期和降低運維管理的難度,借助AWS豐富的經驗實現AI在本地的部署與應用。
Trainium3 UltraServers,專為AI應用而來
隨著AI的火爆,AI芯片也成為當前市場最為熱門的話題。除了NVIDIA、Google之外,亞馬遜云科技也是AI芯片領域重要的玩家。其Trainium芯片經過多年的打磨迭代更新,正逐步展現出極其強大的能力。
在本次大會上,亞馬遜云科技正式發布了 Amazon EC2 Trn3 UltraServer,該超級服務器采用3nm Trainium3 AI 芯片。Trn3 系統可在單個 UltraServer 中最多擴展多達 144 個 Trainium3 芯片;與 Trainium2 相比,可提供高達 4.4 倍計算性能、4 倍能源效率和近 4 倍內存帶寬。
![]()
在大會上,亞馬遜云科技也展示了Trainium3 UltraServer在開源權重模型 GPT-OSS等系列測試的成績,無論是推理響應速度、單芯片吞吐,還是訓練與成本等均取得了業界領先的成績。
根據Matt Garman介紹,Trainium3 UltraServer專門為AI、混合專家模型和大規模強化學習等工作負載設計,并且針對訓練和企業在生產環境中日益繁重的推理負載都進行優化。
![]()
此外,亞馬遜云科技還預覽了Trainium 4芯片的情況。Trainium 4芯片將比Trainium 3的計算能力提升八倍,內存貸款也將大幅增加。
除了自家AI芯片之外,亞馬遜云科技還推出全新 P6e-GB300 UltraServers,該服務器采用GB300 NVL72平臺。GB300是目前NVIDIA最先進的AI芯片,主要針對生產環境中的萬億參數 AI 推理和高級推理模型。
Nova 系列模型服務上新
去年大會上,亞馬遜云科技發布了多模態基礎大模型Nova系列。經過一年的迭代與創新,亞馬遜云科技在今年大會上正式發布了下一代 Nova 2 Lite、Nova 2 Pro 和 Nova 2 Omni等系列模型。根據基準測試表明,Nova 2系列模型可以與 Claude 3.5、GPT-4.5 和 Gemini Flash 2.5等模型的能力媲美。
眾所周知,當前市場中擁有眾多大模型,并且模型能力也在持續迭代更新。但對于行業用戶而言,構建一個全新的模型需要付出昂貴的成本,而基于某個大模型+自身數據訓練出一個更符合自身業務環境的模型,正是當下眾多用戶的強烈需求。
不過,很多企業在訓練或者微調模型時會遇到不小瓶頸,即吸納專有數據越多,模型越容易“忘記”其原始訓練數據的情況,這種模型的“退化”實際上會對模型在實際生產環境中有所影響。
因此,亞馬遜云科技在今天大會上宣布了一項開創性的服務:AWS Nova Forge ,允許企業用戶基于Nova系列模型來訓練和構建自己的AI模型。該服務提供對 Nova 模型預訓練、中期訓練和后期訓練階段的檢查點的獨家訪問權限,用戶可以在訓練過程的早期階段(即 Nova 內部的檢查點)注入專有數據,并與亞馬遜云科技精心挑選的數據集進行協同訓練,實現模型的最佳訓練,并且確保模型不退化。
除了數據協同訓練之外,AWS Nova Forge還具備多項強大的功能和安全措施工具,以確保企業用戶以更低成本和安全地創建與訓練模型。
新工具,讓Agent更好服務生產環境
如果說Nova Forge聚焦的解決企業在訓練和微調大模型底層挑戰,那么 Amazon Bedrock AgentCore則是讓Agent更好在生產環境用起來。
眾所周知,AI Agent的運行、協作往往會涉及到眾多基礎模型(OpenAI、Google Gemini或者Nova等等)和一眾框架(LlamaIndex、Google ADK、OpenAI Agents SDK等等),加上A2A等協議和各種應用數據,其要在生產環境中真正用起來需要解決眾多底層問題。
而Amazon Bedrock AgentCore作為Agent 平臺,其核心目的就是幫助企業用戶大規模地安全構建、部署和運行高性能代理。利用Amazon Bedrock AgentCore,企業用戶可以實現Agent跨工具和數據執行炒作,且支持廣泛的基礎模型和框架,并確保安全性和可靠性。
在今天大會上,Amazon Bedrock AgentCore 的功能得到了進一步增強。亞馬遜云科技推出了Amazon Bedrock AgentCore Policy和Evaluations兩項新功能。
當前,Agent的安全性挑戰巨大,尤其是是身份策略、安全操作、數據訪問等方面。Amazon Bedrock AgentCore Policy核心在于通過Agent運行的實時、確定性控制措施,來確保組織未經授權的操作。無疑,AgentCore Policy就像是給Agent設定了清晰的邊界,可以有效遏制未經授權的數據訪問、不當交互和系統級錯誤等。
AgentCore Evaluations則是幫助企業了解Agent的行為和結果,該服務簡化了以往確保Agent質量所需的復雜流程和基礎設施,開發人員還可以使用自身偏好的大型語言模型和提示詞來編寫自定義評估器。
除此之外,亞馬遜云科技還推出了Kiro、DevOps Agent、Security Agent、Quick等一系列 Agent。
綜合觀察
綜合來看,亞馬遜云科技對于Agentic AI有著極為深刻的洞察和豐富的實踐。
隨著AI Agent的強勢爆發,AI Agent未來必然將徹底顛覆企業的組織架構、業務流程和用戶體驗。這意味著,讓更多Agent融入到生產環境,以及Agent之間更好協作,將成為企業接下來數智化轉型升級的一道必答題。而亞馬遜云科技此次提出AI Agent如何用起來和用好的清晰路徑,無疑對于Agent未來在企業中的持續落地帶來巨大的參考。
此外,亞馬遜云科技年收入達到1320億美元之際,其技術產品創新能力依然強悍,在本次大會上一口氣發布了25——核心服務更新,涵蓋從芯片、大模型到Agent 平臺、工具。面向未來,隨著AI Agent與與場景的深度融合,亞馬遜云科技以全棧AI創新,必然會推動用戶們全面擁抱Agent的變革時代。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.