![]()
跨模態、全自動:創智學院開源AWCP,讓你的Agent擁有“專家團”
2025年,AI Agent學會了獨立工作——寫代碼、做研究、管項目,單個智能體的能力突飛猛進。
2026年,OpenClaw引爆了一切。兩周狂攬15萬GitHub Star,創始人直接被OpenAI招至麾下——這個現象級項目讓AI Agent從極客玩具變成人人可用的生產力工具。當每個人都擁有自己的智能體,當數以百萬計的專精Agent——代碼審計、視覺識別、合規蓋章、數據分析——在各個平臺涌現,一個必然的問題擺到了面前:你的Agent需要找專家Agent幫忙時,它們怎么協作?
Google推出A2A協議讓Agent之間交換任務,Anthropic的MCP成為工具調用事實標準,ANP試圖構建智能體互聯網的通信基礎設施——多智能體協作的基礎設施競賽全面打響。
但一個致命短板始終懸而未決:智能體之間只能”傳話”,卻無法”共事”。
想象一下:你的OpenClaw Agent接到一個復雜任務——需要一個視覺Agent幫忙整理數據集,需要一個安全審計Agent幫忙審查代碼。現有協議能做什么?讓它們互相發消息、傳JSON、來回倒騰文件。視覺Agent拿到的是壓縮打包后的扁平文件集合,審計Agent收到的是脫離了構建系統和版本歷史的代碼片段——跑不了項目級靜態分析,追不了跨文件依賴。
這就像讓三個建筑師隔著玻璃墻交流設計圖紙——低效、易錯、令人崩潰。
近日,上海創智學院的研究團隊提出了AWCP(Agent Workspace Collaboration Protocol)——首個在協議層面形式化工作區委派的智能體互操作標準,并同步開放了完整的參考實現。簡單來說:你的OpenClaw Agent可以把工作區直接委派給視覺專家、安全審計師、合規蓋章Agent,它們在同一個文件系統里協作,就像坐在同一張辦公桌前。
協作的媒介,從消息升級到了工作區。
論文:AWCP: A Workspace Delegation Protocol for Deep-Engagement Collaboration across Remote Agents
GitHub:github.com/SII-Holos/awcp
Demo視頻:https://www.bilibili.com/video/BV1iNfhB4EG2/?buvid=Y040AC07205334FD4753B82D9608978B6780
![]()
圖1:兩種協作范式的對比。左側是傳統消息傳遞——Agent之間交換序列化的任務描述和結果,接收方脫離原始執行環境處理孤立的工件,導致上下文丟失、信息不完整、環境不匹配。右側是AWCP的深度參與模型——Delegator將工作區投影給Executor,后者使用本地工具鏈直接操作原始文件,完整保留上下文,實現原位執行。
01
填補協議棧空白:工作區層在哪里?
先盤點一下2025-2026年主流Agent協議各自在解決什么問題:
![]()
發現問題了嗎?工具層有了,任務層有了,網絡層有了——但工作區層是空白的。
沒有任何一個協議解決”智能體如何在同一個文件系統里協作”這個問題。MCP能讓Agent逐個調用lint工具,但它沒法讓Agent在完整項目上下文里跑全局靜態分析。A2A能讓Agent交換任務消息和文件附件,但收到的是剝離了構建系統、版本歷史和測試基礎設施的平面快照。
2025年5月arXiv綜述論文《A Survey of Agent Interoperability Protocols》分析了MCP、A2A、ANP等協議后明確指出,現有協議均在消息層運作,尚未覆蓋環境級的互操作需求。AWCP論文進一步將這個缺口概括為上下文鴻溝(Context Gap)——它的代價體現在四個維度:
? 環境重建成本高昂:每次協作都需要重新描述目錄結構、文件內容、項目配置
? 狀態同步容易出錯:JSON消息無法準確表達文件系統的完整狀態
?工具鏈不兼容:Agent A的工具無法直接操作Agent B描述的”虛擬”文件
?迭代效率低下:每一輪修改都需要”打包→傳輸→解壓→執行→再打包”的完整流程
AWCP給出的回答是:把協作從消息層下沉到工作區層。
02
核心理念:直接把工作區委派出去
舉個具體的例子。
你讓Claude幫你重構一個React項目。Claude分析后認為需要:修改5個組件文件、更新package.json依賴、調整tsconfig.json配置、跑npm install和npm test驗證。
在傳統消息傳遞模式下,Claude只能告訴你該怎么改,或者把修改后的代碼貼給你。但它無法直接執行這些操作——因為它根本接觸不到你的文件系統。
AWCP的答案很直接:讓它接觸到。
AWCP借鑒了Unix經典的”萬物皆文件”哲學,提出了文件即接口(Files-as-Interface)的協作范式。這不是一個隨意的設計選擇——觀察現實中Agent的工作方式:編碼Agent讀文件、寫補丁、跑測試;視覺Agent遍歷圖片目錄;合規Agent審閱和蓋章PDF文檔。文件系統不只是協作的一種可能接口,它就是Agent與計算環境交互的原生媒介。
基于這個認知,AWCP定義了一套標準化的工作區委派協議:Delegator將自己的文件系統投影給遠程Executor,Executor用自己的工具鏈直接操作這些文件,修改實時或按需同步回來。
與現有協議的本質區別:
![]()
![]()
圖2:AWCP在Agentic協議生態中的位置。Delegator通過MCP工具服務器或Skill模塊接入AWCP。控制面使用標準HTTP和SSE進行信令交互。Executor通過可擴展適配層接入,支持A2A、ANP或直接HTTP。傳輸面提供可插拔的文件系統級訪問,與消息級協調形成互補。
03
技術架構:怎么把工作區安全地”借”出去?
解決了”要不要共享工作區”的理念問題后,接下來是工程問題:怎么把工作區安全、可靠地投影給遠程Agent?
從技術實現來看,AWCP采用了控制面-數據面分離架構。控制面(HTTP + SSE)負責協議握手和狀態同步,數據面通過可插拔傳輸適配器搬運文件。兩者分離的好處是:控制邏輯不變,只換傳輸適配器就能適應不同部署場景。
![]()
圖3:AWCP架構。控制層處理Delegator和Executor之間的信令與狀態同步,傳輸層通過可插拔適配器(SSHFS、Archive、Storage、Git)實現數據交換。兩端各運行專用AWCP服務,Agent使用各自原生工具鏈操作。
四階段握手:發邀請、談條件、交鑰匙、干活交付
整個協作生命周期分為四個階段:
① 發邀請(Negotiation):Delegator告訴Executor:“我有個任務,這是任務說明、這是你能用的文件目錄、你有1小時的操作時間。干不干?”
② 談條件(Accept):Executor可以直接接受,也可以還價——把TTL從1小時砍到30分鐘,把讀寫降級為只讀。這種協商式接受避免了”要么全接受、要么全拒絕”的剛性模式。
③ 交鑰匙(Provisioning):條件談妥,Delegator正式下發傳輸憑證(SSH證書、ZIP數據、預簽名URL或Git倉庫信息),激活數據面。
④ 干活交付(Execution & Completion):Executor配置好工作空間后執行任務,通過SSE實時推送進度。完成后雙方兩階段清理:先優雅斷開連接,再回收臨時資源。
![]()
圖4:Delegator與Executor之間的四階段消息序列。實線箭頭為同步HTTP請求,虛線箭頭為HTTP響應,藍色箭頭為異步SSE事件。
雙狀態機:各管各的,才更健壯
協議設計中一個值得注意的選擇是:Delegator和Executor兩側各運行一個獨立狀態機。Delegator側有9個狀態,覆蓋從創建到完成的全生命周期;Executor側只有4個狀態(pending → active → completed / error)。兩個狀態機通過ACCEPT、START、DONE三條消息同步,但不共享狀態存儲——在分布式系統中,這比維護一個全局一致的狀態要健壯得多。
![]()
圖5:AWCP雙狀態機設計。左側DelegationStateMachine追蹤Delegator側的9個狀態,右側AssignmentStateMachine追蹤Executor側的4個狀態。實線箭頭為正常路徑,紅色虛線表示任意非終態可轉入終態,藍色虛線標記跨狀態機的協議消息同步點。
四種可插拔傳輸
數據面支持四種傳輸適配器,覆蓋從本地開發到云端生產的全部場景:
![]()
傳輸層完全可插拔——未來擴展WebDAV、rsync、P2P都不需要改動核心協議,只需實現對應的適配器對。
對于非實時傳輸,Executor通過SSE定期發回工作空間快照,Delegator按策略處理:立即應用(auto)、排隊等人工審批(staged)、或忽略(discard)。
04
實戰驗證:兩個典型場景
論文給出了兩個演示場景,分別驗證AWCP在能力非對稱和信任非對稱兩個維度的有效性。這兩個場景恰好對應了當前Agent協作中最常見的兩類需求缺口。
完整的AWCP協作流程演示,展示智能體如何通過工作區委派實現深度協作
點擊觀看Demo視頻:https://www.youtube.com/watchv=IAMZa4zgGdI
場景一:跨模態數據集整理
![]()
圖6:跨模態數據集整理。純文本Delegator(Cline + DeepSeek V3.2)將混亂的圖片目錄委派給多模態Executor(Gemini 3 Pro)。Executor分類、過濾、重組文件,變更通過FUSE掛載雙向實時同步。
問題:用戶有一個混亂的圖片文件夾(超過100張圖片),需要按內容分類整理。但Delegator是純文本智能體(Cline + DeepSeek V3.2)——它看不懂圖片。
傳統方案:壓縮文件夾 → 上傳到多模態Agent → 等逐張識別返回JSON → 根據JSON決定分類 → 執行或再次傳輸。如果分類規則要調整,整個流程從頭再來。
AWCP方案:Delegator發起委派,Gemini 3 Pro通過SSHFS將圖片目錄直接掛載到本地。Executor遍歷圖片,用視覺能力識別內容,直接在掛載目錄里創建子文件夾(bear/、penguin/、panda/…)并移動文件。變更即時同步回Delegator,全程零手動傳輸。
純文本Agent通過一次工作區委派就獲得了視覺能力——這就是能力非對稱協作。
場景二:企業級多輪合規蓋章
![]()
圖7:多輪合規蓋章。Delegator(OpenClaw on Feishu)將合同委派給Compliance Auditor進行蓋章。第一輪因缺少身份驗證被拒,第二輪補充材料后成功。每輪是獨立的AWCP生命周期。
問題:用戶在飛書平臺通過OpenClaw提交合同文件,需要合規審核+身份驗證+電子蓋章。OpenClaw作為當下最火的AI Agent平臺,擁有強大的任務編排能力和豐富的技能生態——但它本身沒有蓋章權限。這恰好體現了AWCP的互補價值:OpenClaw負責用戶交互和任務編排,AWCP負責把工作區安全地委派給擁有特定權限的遠程Agent執行。
第一輪委派中,Executor檢查材料后發現缺少身份證件,返回明確提示:“請補充簽署人身份證正面照片”。用戶補充材料后,OpenClaw發起全新的第二輪委派。每輪是獨立的AWCP生命周期,協議天然支持這種迭代工作流。
蓋章操作在授權Executor上完成,數字印章始終不出Executor環境——這就是信任非對稱協作。
05
協議規范與參考實現
AWCP協議規范完全公開,參考實現以Apache 2.0協議開放源碼,可免費用于商業項目。
該TypeScript參考實現目前約9,200行源碼,2,500+行測試代碼(161個測試用例),拆分為7個npm包,模塊化設計,開發者可按需引入:
![]()
在Agent接入層面,AWCP提供了兩種官方接入方式,覆蓋IDE類和對話類兩大Agent陣營:
MCP Server(@awcp/mcp)面向IDE類Agent。任何支持MCP工具調用的Agent——Claude Code、Cursor、Cline、Trae、GitHub Copilot、OpenCode——都能通過標準MCP配置直接接入AWCP,無需額外開發。
Skill模塊(awcp-skill)面向對話式Agent平臺。OpenClaw等基于聊天交互的智能體可以通過Skill模塊獲得同樣的工作區委派能力。前面Demo2中OpenClaw發起合規蓋章,用的就是這個Skill。
對于需要深度集成的開發者,@awcp/sdk提供了完整的Delegator和Executor服務實現,支持自定義傳輸適配器和準入控制策略,一個最小化的Delegator集成只需十幾行TypeScript代碼。
06
未來方向
研究團隊對當前版本的局限并不回避。AWCP目前聚焦于可用的最小閉環:一對一委派、四種傳輸、完整生命周期管理,但離生產級的多智能體協作還有不少距離。
![]()
安全性是其中最關鍵的一環。論文明確將細粒度權限控制和沙箱執行列為未來工作,這在當前Agent安全事件頻發的大環境下,是AWCP走向生產部署前必須補齊的短板。
07
結語
回顧互聯網歷史,HTTP讓孤立的計算機連成了萬維網。今天的AI智能體正處在類似的轉折點——它們各自強大,卻無法真正協作。
工具連接有了(MCP),任務通信有了(A2A),智能體互聯有了(ANP),現在工作區協作也有了(AWCP)。
拼圖正在成形。
值得注意的是,AWCP并不與任何編排框架競爭。無論Agent跑在OpenClaw、Cline還是自研平臺上,AWCP提供的是一個標準化的工作區委派原語——帶有顯式的生命周期管理和傳輸無關的文件同步,任何編排系統都可以采用。
當Agent越來越專業化,一個標準化的工作區層將成為Agentic Web的必要基礎設施。AWCP能否成為這個層的事實標準,取決于社區的采納和生態的發展——但至少,這個位置第一次被正式定義出來了。
項目地址:https://github.com/SII-Holos/awcp
論文地址:https://arxiv.org/abs/2602.20493
演示視頻:https://youtu.be/IAMZa4zgGdI
項目團隊:AWCP主要由上海創智學院的多智能體團隊設計實現,包括導師張偉楠、高級工程師周元劍、博士生聶曉航、郭子晗。
引用
@article{nie2026awcp,
title={AWCP: A Workspace Delegation Protocol for Deep-Engagement Collaboration across Remote Agents},
author={Nie, Xiaohang and Guo, Zihan and Chen, Youliang and Zhou, Yuanjian and Zhang, Weinan},
journal={arXiv preprint arXiv:2602.20493},
year={2026} }
未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!
公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.