網易首頁 > 網易號 > 正文申請入駐

唯快不破，Anthropic幾天搞定智能體生產

2026-04-09 18:13:31　來源: 鈦媒體APP

北京舉報

分享至

文 | 字母AI

凌晨，Anthropic 發布了Claude Managed Agents，一套用于構建和部署云端智能體的托管工具。

用最簡單的話來介紹，開發者不需要再處理安全、狀態管理和權限等基礎設施，能直接讓Agent運行在生產環境。

官方稱，一個原本需要數月才能上線的Agent，現在可以在幾天內投入生產。

01以10倍速度進入生產

在此之前，Agent開發真正的難點從來不在模型本身，而在工程。

我們可以很快用Claude或其他大模型做出一個看起來不錯的demo：能寫代碼、能分析文檔、甚至能自動調用工具。但一旦想把它變成一個能穩定運行的產品，問題就出現了。

明明它看起來什么都能做，可就是很難真正用在生產環境里。

demo做出來以后，開發者還需要自己搭一整套基礎設施：安全的代碼執行環境、長時間運行的狀態管理、不同工具之間的權限控制，以及在出錯時能夠恢復的機制。這些能力每一個都不算復雜，但組合在一起，就是一件非常耗時的大工程了。

更麻煩的是，這些工作幾乎無法復用。

模型一旦升級，harness里原本寫死的那些假設往往不再那么適配，不同Agent之間也很難共享一套穩定的運行框架。

Agent開發翻來覆去：每個團隊都在解決同一類問題，但很少有人真正把它做到穩定。

因此我們經常看到，Agent可以輕松做出demo，卻遲遲才能上線。

Claude Managed Agents試圖解決的正是這一問題：安全執行、狀態管理、權限控制、錯誤恢復……它把這些原本要自己搭的一整套東西全部打包，統一由Anthropic提供。

開發者不需要再關心Agent是怎么跑起來的，只要告訴它做什么、能用什么工具、有哪些限制，剩下的執行過程都由系統自動完成。

帶來的變化也很直接：原本要花幾個月搭出來的一整套系統，現在變成了一個可以快速嘗試、反復調用的接口。

它沒有讓Agent變得更聰明，但它狠狠縮短了demo和生產之間的距離。

除了加速上線的“工具包”，它還做了以下幾件事：

首先是對長時間運行任務的支持。Agent可以在后臺自主運行數小時，進度和輸出會被持續保存，即使發生中斷也不會丟失。

其次是多Agent之間的協作能力。Agent可以創建并調度其他Agent，以并行方式處理復雜工作。該能力目前以research preview形式提供，需要單獨申請訪問。

然后是對真實系統的訪問與治理機制。AgentAgent能夠訪問帶有范圍權限、身份管理和執行追蹤的真實系統，但能調用哪些工具、拿到哪些權限、使用哪些憑證，模型自己說了不算。

除此之外，系統還內置了一個用于任務執行的編排機制（a built-in orchestration harness），用于決定何時調用工具、如何管理上下文以及在出現錯誤時如何恢復。這意味著開發者無需手動編排Agent的執行流程，系統會在運行過程中自動進行調度。

這些能力本身并不新，但被放進同一個系統里之后，就省下了很多事情。

02不只是能用，而是已經在用

在發布中，Anthropic 也給出了一批已經落地的案例，基本覆蓋了協作工具、企業系統和開發工具這幾個典型場景。

例如Notion（一款將文檔、知識庫和項目管理整合在一起的協作工具）直接把Claude塞進了工作區里：工程師讓它寫代碼，內容團隊讓它做網站、做PPT，多個任務還能并行。

在企業側，Rakuten（日本大型互聯網與電商集團，業務涵蓋電商、金融和通信）已經在多個部門部署Agent，包括產品、銷售、市場、財務和人力資源。他們的做法很直接：把Agent接進Slack和Teams，讓員工像派活一樣分配任務，然后拿回表格、幻燈片甚至應用。官方說，一個Agent一周就能部署完成。

Asana（一家提供團隊任務管理和項目協作工具的軟件公司）的思路更激進一點。這家公司本來就是做項目管理的，現在干脆把Agent變成項目成員，直接參與任務推進和內容產出，起的名字也很直白：AI Teammates。

開發者這邊的代表是Sentry（提供錯誤監控和性能分析的開發者工具），它原本就是用來監控bug的，現在Agent可以自動生成修復代碼并創建Pull Request，把發現問題到提交修復的流程串起來。

還有Vibecode（一個通過自然語言生成并部署應用的AI開發工具平臺），這類AI原生工具走得更遠一點：用戶只需要寫一句需求，就可以從提示直接生成并部署一個應用，而Managed Agents成了它背后的默認基礎設施。

如此種種可以看出，不管是寫代碼、做內容還是處理企業流程，Agent已經開始直接接手任務了

某種意義上，當安全、狀態、權限和調度都變成默認能力之后，Agent不再需要被“包裝”成系統，它本身就可以作為系統運行。

Agent缺的從來不是能力，只是難以落地而已。

過去開發者需要先搭好一整套框架，才能讓Agent開始落地干活；現在這套框架已經提前存在，Agent可以直接被部署進去。

這就是Claude Managed Agents的意義所在。

03工具很好，但問題才剛開始

Claude Managed Agents一推出就引發了大量討論。

很多人對Anthropic的推進速度感到驚訝，心情就如同下面的meme：每天一起床就又看到一個Claude更新。

這不，泄露事件之后立馬更新了Claude Code 2.1.90，Claude Mythos Preview的熱度還沒過，Claude Managed Agents又馬上出來了。

Anthropic你盡管推出，我們一點也不苦一點也不累。

開個玩笑。在感嘆發布速度的同時，對新工具的質疑也幾乎同時出現。

最直接的問題，是它到底能不能真正跑好“長期任務”。

有開發者指出，Agent最大的挑戰從來不在短任務，而是那些需要持續運行、反復決策的場景。一旦時間拉長，錯誤會不斷累積，系統穩定性也會迅速下降。

能跑起來，不等于能跑得久。

更進一步，是“可靠性”的問題。

在小規模測試中，Agent往往表現不錯，但一旦進入真實生產環境，任務復雜度上升、調用鏈變長，各種邊界情況就會不斷出現。

這恰恰是大多數Agent平臺最容易失效的地方。

還有人把問題問得更實際一些：既然現在已經有多Agent能力，那它到底能不能直接替代現有的工作流工具？

還是說，像n8n這樣的系統，依然是必需的？

本質上關心的還是同一件事：n8n就是為了保證流程穩定、可控、可復現，要想替代它，這套多Agent協調的系統必須足夠穩定，足夠“可靠”。

值得注意的是，Anthropic在工程設計上也在嘗試解決這個問題。

在最新的技術文章中，他們將Agent系統拆成三個獨立的部分：模型與調度邏輯（“大腦”）、執行環境與工具（“手”），以及記錄全部過程的會話日志（session）。

三者通過接口連接，任何一層失敗都可以單獨恢復，而不會影響整體運行。

這套設計，把Agent從一次性執行的流程，變成了一個可以中斷、恢復甚至重啟的系統。

另外，對于那些需要長時間運行的任務，Anthropic沒有把所有信息都塞進模型的上下文里，而是記錄在外部日志中，需要時再取回來用，這樣就不會占滿上下文窗口。

同樣地，權限也不再交給模型保管，而是單獨隔離出去，這樣即使出錯，也不會直接暴露敏感信息。

不過工程設計只能解決結構問題，沒辦法保證結果。

可以說，大家并不懷疑Claude Managed Agents能做什么，懷疑的是它能不能穩定、可控地一直做下去。

這一點，就需要時間來驗證了。

Claude Managed Agents介紹：https://claude.com/blog/claude-managed-agents

工程博客：https://www.anthropic.com/engineering/managed-agents

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.