網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

從最頂級的30個AI Agent產(chǎn)品里，看懂了這三個趨勢

2026-02-27 19:21:51　來源: 硅基觀察Pro

北京舉報

分享至

進入2026 年，Agent 徹底火了。

Claude Code、ChatGPT Agent、Manus，再加上一堆大廠的企業(yè)級工作流平臺，動不動就喊“替代打工人”“創(chuàng)造萬億美元價值”。麥肯錫的報告也在推波助瀾：62% 的企業(yè)正在試水 Agent。

但把熱鬧先放一邊，真正的問題是——在真實工作場景里，Agent 到底走到哪一步了？

最近，MIT、哈佛、斯坦福等機構(gòu)的研究團隊發(fā)布了一份《2025 AI Agent Index》。

這幫學者干了一件很有價值的事：

他們把市面上最具代表性的30 個代理系統(tǒng)逐一拆開來看了一遍，并設計了45 個維度，仔細扒了扒這些產(chǎn)品的技術(shù)細節(jié)、部署情況、設計架構(gòu)、工具使用和安全機制等信息，得出了當下Agent最硬核的3個真相。

透過這部分報告，我們就能更清晰地了解當下Agent發(fā)展的真實情況。

產(chǎn)品形態(tài)收攏在這3個方向

大多數(shù)代理產(chǎn)品集中在2024–2025 年發(fā)布。

（藍色柱狀圖代表與代理型人工智能產(chǎn)品相關(guān)的谷歌新增搜索詞，紅線則代表谷歌學術(shù)中包含“人工智能代理”或“代理型人工智能”關(guān)鍵詞的論文發(fā)表數(shù)量）

從產(chǎn)品形態(tài)看，AI代理基本收攏在了三個方向：

聊天式代理（12個）：以對話為入口，掛載各種工具箱；

企業(yè)自動化平臺（13個）：主打B端工作流的自動化編排，已經(jīng)成為與聊天界面分庭抗禮的主流形態(tài)；

瀏覽器/GUI型Agent（5個）：直接接管屏幕，模擬人類點擊和輸入，類似于之前的豆包手機。

企業(yè)工作流平臺已成為與聊天界面并列的主流形態(tài)。其中，中國開發(fā)的GUI 型代理更傾向于整合電話與電腦操作能力（5個中有3個具備雙能力），功能整合度更高。

按應用場景來分，排名前三個的例子是：信息研究與集成（12個）、跨部門工作流自動化（11個）、以及表單填寫和預訂等瀏覽器操作（7個）。

在底層模型上，除了Anthropic、Google、OpenAI這幾家“前沿實驗室”以及部分中國廠商在使用自研模型外，大多數(shù)的代理都在高度依賴GPT、Claude或Gemini系列。

盡管“模型開源”已經(jīng)成為行業(yè)趨勢，但在Agent產(chǎn)品上則呈現(xiàn)了完全不同的局面。

30 個代理中，有 23 個選擇完全閉源。只有7 個開源了代理框架或工具層，包括阿里MobileAgent、Browser Use、TARS、Gemini CLI、n8n、OpenAI Codex、WRITER。

生態(tài)在變開放，商業(yè)產(chǎn)品卻仍以封閉為主。這是一種典型的“框架開放、產(chǎn)品閉源”結(jié)構(gòu)。

從行動空間到自主性，AI代理正在分化

雖然都叫“Agent”，但這30個產(chǎn)品的功能相差很大。

其中，一個核心區(qū)別在于，行動空間。

企業(yè)工作流代理，主要通過CRM、數(shù)據(jù)庫等系統(tǒng)連接器來執(zhí)行操作（8/30）。它們更像企業(yè)流程里的自動執(zhí)行節(jié)點。

命令行界面（CLI）代理則直接操作文件系統(tǒng)和終端命令（4/30），能力更偏工程環(huán)境。

瀏覽器代理的方式最直觀：點擊、輸入、導航網(wǎng)頁（5/30），它們直接“代替人類”操作界面。

值得注意的是，企業(yè)代理的行動空間通常被嚴格限制，并優(yōu)先設置工具權(quán)限與使用防護。換句話說，越貼近真實業(yè)務系統(tǒng)，控制就越嚴格。

在用戶界面上，Agent產(chǎn)品也出現(xiàn)了不同的選擇。

在企業(yè)場景中，畫布式編排界面已成為標準。8/13 的企業(yè)平臺采用可視化流程組合界面，讓用戶配置觸發(fā)器、動作與防護規(guī)則。

而在消費級場景里，聊天界面依然是主流入口（14/30）。這意味著，設計層強調(diào)流程構(gòu)建，使用層強調(diào)自然語言。

最重要的是，不同類型的代理，在“自主性”上也呈現(xiàn)出明顯分層。

最常見的仍然是“輪次式助手”。Claude、Gemini、ChatGPT 等產(chǎn)品采用的是低至中等自主性模式（L1–L3）：每執(zhí)行一組動作，便等待用戶下一條指令。

這種結(jié)構(gòu)本質(zhì)上仍以人類為中心，模型只是延長了操作鏈條。

但在同一產(chǎn)品內(nèi)部，自主性差異可能極大。例如“普通聊天”與“深度研究”功能之間，已接近兩個不同范式：前者只是響應式生成，后者則可在一定程度上自主規(guī)劃任務路徑。

瀏覽器代理則代表了另一端。它們通常達到L4–L5，自主性顯著更高。一旦接收指令，便獨立完成整個執(zhí)行流程，過程中幾乎沒有實時干預空間。用戶的控制權(quán)，在提交任務那一刻就已經(jīng)讓渡。

而在企業(yè)級代理上，則呈現(xiàn)出一種更復雜的結(jié)構(gòu)：設計階段低自主，運行階段高自主。

簡單來說，在設計階段，用戶通過可視化畫布配置觸發(fā)器、流程與防護規(guī)則，部分平臺提供AI 輔助（L1–L2）。

但部署完成后，代理通常由郵件、數(shù)據(jù)庫更新等事件自動觸發(fā)，運行時無需人工參與，進入 L3–L5 狀態(tài)。

這意味著，自主性并非線性增長，而是“階段性切換”。

自主性在變強，責任邊界也在模糊

從接口層看，MCP 已成為代理生態(tài)的主流標準。30 個系統(tǒng)中有 20 個支持這一協(xié)議，說明“如何接入工具”正在趨于統(tǒng)一。企業(yè)平臺中，還有一部分開始支持代理間協(xié)議（A2A），但整體仍處于早期階段。

盡管協(xié)議層在收斂，身份層卻在分化。

多數(shù)代理默認不向終端用戶或第三方披露自身的AI 身份。21/30 沒有記錄默認披露行為，只有極少數(shù)支持生成內(nèi)容水印。

也就是說，企業(yè)平臺往往將披露責任交給客戶，是否告知用戶“你正在與 AI 交互”，并不由平臺承擔。

在技術(shù)識別層面，情況更加復雜。

大部分瀏覽器代理通常無視robots.txt 文件，直接以“代表用戶”身份運行。

企業(yè)認為，代理不應被視為傳統(tǒng)爬蟲，但這一邏輯正在引發(fā)法律爭議。

代理繞過網(wǎng)絡限制的趨勢，正在改變控制權(quán)結(jié)構(gòu)——從內(nèi)容托管方轉(zhuǎn)移至代理運行方。

目前，ChatGPT Agent 是唯一采用加密請求簽名的系統(tǒng)。多數(shù)代理缺乏可驗證的身份機制。

隨著更多任務交由代理執(zhí)行，“誰在行動”將變得越來越重要。同時，將披露責任轉(zhuǎn)交給運營方，也帶來一個問題：終端用戶是否真正知道自己正在與AI互動？

同時，當構(gòu)建者將安全責任轉(zhuǎn)移給用戶時，責任邊界變得模糊。一個更現(xiàn)實的問題開始浮現(xiàn)：當代理開始執(zhí)行任務，人類還能在多大程度上掌控它？

在這30個代理產(chǎn)品里，大部分都設計了審批與監(jiān)督機制，但方式并不一致。

比如，開發(fā)者或CLI 類代理，在涉及文件修改、命令執(zhí)行等高敏感操作時，通常會要求明確確認；瀏覽器代理則把控制節(jié)點更多放在身份驗證與支付環(huán)節(jié)。

一部分產(chǎn)品甚至提供“實時監(jiān)控模式”，允許用戶在關(guān)鍵步驟中觀察執(zhí)行過程。

但如果你仔細觀察就會發(fā)現(xiàn)，不同產(chǎn)品之間的透明度差距很大。

少數(shù)代理會展示完整的行動軌跡和推理過程，讓用戶清楚看到它如何決策、調(diào)用了哪些工具；更多系統(tǒng)只提供概括性的說明，甚至在執(zhí)行過程中幾乎不留下可追蹤的痕跡。

而對于不少企業(yè)級平臺來說，外界甚至無法確認單次運行是否存在實時監(jiān)控。

這意味著，控制機制“存在”，但不均衡；監(jiān)督邏輯“可見”，但并不標準化。隨著代理能力提升，人類對執(zhí)行過程的可見度，并沒有同步提高。

/ 04 /

總結(jié)

這份指數(shù)在1350 個維度上記錄了 30 個代理系統(tǒng)，但更重要的，是它揭示了三個結(jié)構(gòu)趨勢：

第一，安全披露高度不均。

僅有極少數(shù)代理發(fā)布針對自身架構(gòu)的系統(tǒng)卡片。大多數(shù)系統(tǒng)要么只披露基礎模型信息，要么只強調(diào)合規(guī)認證。能力基準與安全評估之間存在明顯不對稱。

當代理風險越來越多地來自規(guī)劃能力與工具調(diào)用，而不僅是模型輸出時，僅依賴模型層面的文檔已不足夠。

第二，基礎模型高度集中。

幾乎所有代理都依賴GPT、Claude 或 Gemini。模型供應集中帶來效率與評估便利，但也意味著單點風險。定價調(diào)整、服務中斷或安全漏洞，都可能向下游系統(tǒng)擴散。

風險管理因此不能只停留在代理部署方，而必須延伸至上游模型提供商。

第三，責任鏈條分散。

代理系統(tǒng)往往形成一條多層依賴鏈：基礎模型、編排層、構(gòu)建平臺、部署方、最終用戶。沒有單一實體對完整行為負責。

在這種分布式架構(gòu)下，僅憑模型文檔做安全判斷，很容易形成虛假保障。

文/林白

PS：如果你對AI大模型領(lǐng)域有獨特的看法，歡迎掃碼加入我們的大模型交流群。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

GLM-5.1上線，編程表現(xiàn)貼Opus 4.6開大，Coding plan瞬間斷貨

量子位 2026-03-28 14:04:04
34 跟貼 34
黑客帝國在谷歌成真？絕密AI曝光: 服務器擠爆，布林狂肝代碼不停

新智元 2026-03-28 11:44:54
6 跟貼 6

從“養(yǎng)蝦”狂歡到落地“最后一公里”：騰訊智能體走向深水區(qū)

每日經(jīng)濟新聞 2026-03-28 16:13:14
0 跟貼 0

AI流量爆發(fā)之后，互聯(lián)網(wǎng)上的“大多數(shù)”可能已經(jīng)不是人了

DeepTech深科技 2026-03-27 18:20:53
0 跟貼 0
社會模擬邁入可控、可量化時代：為AI Agent加上「認知滑條」

機器之心Pro 2026-03-27 17:03:16
0 跟貼 0

大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0

趨境ATaaS平臺發(fā)布，打造日均萬億產(chǎn)能的“Token工廠”

量子位 2026-03-28 21:56:10
0 跟貼 0
當Anthropic的安全人設崩塌：一場被泄露戳穿的生存游戲

虎嗅APP 2026-03-29 01:18:14
0 跟貼 0

高通萬衛(wèi)星談終端大模型優(yōu)勢：個性化與數(shù)據(jù)推理

量子位 2025-12-11 03:38:41
0 跟貼 0
以人為本的AI對用戶而言才是最有用的AI

每日經(jīng)濟新聞 2026-03-14 13:16:04
0 跟貼 0
谷歌干掉「請再說一次」！Gemini 3.1毫秒級接話，實時Agent時代來了

新智元 2026-03-28 11:43:16
6 跟貼 6
霍爾木茲海峽"鎖死"全球能源五角大樓醞釀"致命一擊"

上游新聞 2026-03-27 22:22:04
8931 跟貼 8931
“龍蝦”出現(xiàn)后，大模型時代的共識被推翻了

虎嗅APP 2026-03-28 02:41:40
746 跟貼 746
深度｜華為 AI，迎來大變

新智元 2026-03-28 17:07:57
1 跟貼 1
國務院食安辦、市場監(jiān)管總局約談相關(guān)地方市級人民政府負責人督辦“3?15”晚會曝光問題整改

新京報 2026-03-28 19:17:17
16 跟貼 16
8.68萬新車普及車位到車位，世界模型不吃高算力！零跑夯爆了

量子位 2026-03-28 14:13:32
0 跟貼 0
特朗普真要對中國動手？美機密文件曾泄露：“主戰(zhàn)場”鎖定臺灣

一飲山河 2026-03-28 12:21:16
0 跟貼 0
游戲設計師把Excel玩成外掛：3個工具讓策劃效率翻5倍

Ping值焦慮 2026-03-27 17:20:02
0 跟貼 0
華為盤古大模型負責人王云鶴離職，被曝Agent創(chuàng)業(yè)

量子位 2026-03-28 13:58:40
1 跟貼 1
上班開糞車下班開奔馳的小伙今日大婚，當事人：吸糞車婚車隊，全球第一個

極目新聞 2026-03-28 08:51:05
6349 跟貼 6349
印度又官宣自研五代機！17年就憋出個模型，能趕超中美俄嗎？

浩然簡史 2026-03-28 16:39:42
0 跟貼 0
合肥野生動物園泉山新址“泡湯”？社區(qū)：去年7月已暫停，暫無新消息

極目新聞 2026-03-28 17:17:59
64 跟貼 64
真實體驗，15年油車用戶換電車，哪好哪差？

閆闖說車 2026-03-26 15:12:29
0 跟貼 0
廣州：下周一起，公立醫(yī)院掛號費調(diào)整

南方都市報 2026-03-28 11:52:00
1340 跟貼 1340
售樓處模型的煙霧，竟然是這樣制作的，多少年疑惑終于被解開！

木木星生活站 2026-03-27 15:48:52
0 跟貼 0
蘇格蘭4-2剛贏丹麥，BBC卻把直播鎖了3年沒人管

野生運營 2026-03-28 11:08:10
5 跟貼 5
三分10投0中！亞歷山大創(chuàng)造生涯單場三分最差紀錄

北青網(wǎng)-北京青年報 2026-03-28 15:41:02
122 跟貼 122
27噸凍牛頭牛蹄跨省運輸后部分發(fā)霉變質(zhì) 多部門已介入

紅星新聞 2026-03-28 19:53:39
264 跟貼 264
安東尼奧：朝鮮隊身體素質(zhì)像野獸；我熟悉球員所以能調(diào)節(jié)心理

懂球帝 2026-03-28 22:42:13
21 跟貼 21
龍蝦為啥越養(yǎng)越貴，越用越蠢？

鈦媒體APP 2026-03-28 19:53:33
9 跟貼 9
《死亡擱淺2》PC版1.1更新:性能穩(wěn)定性優(yōu)化巨大提升

游民星空 2026-03-28 15:06:16
3 跟貼 3
保定一小店售賣咸菜絲燒餅意外爆火，排隊人數(shù)太多店鋪宣布暫停營業(yè)，店主：流量太大了，我們承接不住，也擔心影響燒餅品質(zhì)

極目新聞 2026-03-26 22:43:02
2082 跟貼 2082
突然拉升！超8萬人爆倉

每日經(jīng)濟新聞 2026-03-28 23:37:23
1 跟貼 1
漲工資叉一次出現(xiàn)在文件里

彭彭師姐說情感 2026-03-28 08:30:00
0 跟貼 0
42歲男子長期被職場PUA抱住醫(yī)生大哭，稱一到公司門口就開始心慌，醫(yī)生：他把領(lǐng)導的評價，當成對自己全部價值的判斷

大風新聞 2026-03-28 21:28:03
63 跟貼 63
張雪峰醫(yī)療文件疑似泄露，官方回應介入調(diào)查：領(lǐng)導已關(guān)注到此事

娛樂呱呱噠 2026-03-26 13:55:06
0 跟貼 0
俄羅斯擬實行汽油出口臨時禁令

新華社 2026-03-28 15:23:02
1468 跟貼 1468
中國軍號海外賬號發(fā)布視頻“Battle Beats: True Epic” （來源

環(huán)球網(wǎng)資訊 2026-03-28 14:20:37
509 跟貼 509
3人走私1.7億美元AI芯片被起訴，聊天記錄曝光"找泰國公司當白

爬蟲飼養(yǎng)員 2026-03-27 17:23:16
0 跟貼 0
2年經(jīng)驗拿3倍工資： senior工程師的5個隱藏技能

碼上閑敘 2026-03-28 13:39:14
0 跟貼 0

硅基觀察Pro

人工智能新時代的商業(yè)智庫和價值燈塔

869文章數(shù) 65關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

游戲

旅游

公開課

軍事航空

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產(chǎn)30天

手機 / 數(shù)碼

房產(chǎn) / 家居

從最頂級的30個AI Agent產(chǎn)品里，看懂了這三個趨勢

華為盤古大模型負責人王云鶴確認離職

美媒：和歐盟"外長"發(fā)生激烈交鋒 魯比奧"顯然很惱火"

美媒：和歐盟"外長"發(fā)生激烈交鋒 魯比奧"顯然很惱火"

“我是全家最差勁的運動員”

陳牧馳陳冰官宣得子 曬一家三口握拳照

臥底"科技與狠活"培訓:化工調(diào)味劑泛濫

置換補貼價4.28萬起 第五代宏光MINIEV正式上市

態(tài)度原創(chuàng)

在濰坊待了三天，沒遇到一個“濰坊人”

《異替》現(xiàn)已登陸Steam

泰安市岱岳區(qū)：賞梨花 看村晚 萬畝梨園迎客來

美軍中東基地損失最新披露

美媒：和歐盟"外長"發(fā)生激烈交鋒魯比奧"顯然很惱火"

美媒：和歐盟"外長"發(fā)生激烈交鋒魯比奧"顯然很惱火"

陳牧馳陳冰官宣得子曬一家三口握拳照

置換補貼價4.28萬起第五代宏光MINIEV正式上市

泰安市岱岳區(qū)：賞梨花看村晚萬畝梨園迎客來