Anthropic "開源"了一份 Agent Infra 創(chuàng)業(yè)的工具書

2026-04-02 09:54:43　來源: 硅星人

北京舉報

分享至

這可能是 Anthropic 在工程能力上與外界最信息對稱的一次。它對 Anthropic 的傷害不大，對創(chuàng)業(yè)者的啟發(fā)不小。

2026年3月30日，Anthropic的工程師在發(fā)布npm包時犯了一個重復(fù)的錯誤：沒在.npmignore 中排除 source map 文件。于是，57MB的cli.js.map 指向了R2存儲桶，51.2萬行 TypeScript 源代碼，1906個未經(jīng)混淆的源文件，在數(shù)小時內(nèi)被鏡像至 GitHub。它們被 fork 了數(shù)萬次，永久擴(kuò)散。

這不是官方開源，但效果等同。Claude Code四年工程迭代的家底，一夜之間成了公共財產(chǎn)。

喜歡動手但不太愛動腦子的 AI builder 都摩拳擦掌，希望復(fù)刻一個 Claude Code，這基本是癡心妄想。而對方興未艾的 Agent Infra 賽道的創(chuàng)業(yè)者來說，這份被意外開源的代碼庫，則是一份工具書，一份創(chuàng)業(yè)指導(dǎo)白皮書。

它第一次讓外界看清 Anthropic 的工程邊界——做了什么，做到了什么程度；以及沒做什么，為創(chuàng)業(yè)者留了哪些白。

Claude Code 還是被低估了

Claude Code 已經(jīng)這么牛了。但泄露的代碼告訴我們：它還是被低估了。

許多人認(rèn)為 Claude Code 不過是“模型+提示詞+工具調(diào)用”的輕量級包裝，創(chuàng)業(yè)公司用幾個月就能搭出 MVP，進(jìn)軍 AI 編程賽道。

這次代碼泄露的一開始，很多開發(fā)者也躍躍欲試，意圖復(fù)制一個 Claude Code。但很快，當(dāng)他們仔細(xì)研究之后，發(fā)現(xiàn)泄露的代碼是一劑清醒劑。

Claude Code不是 Claude 的 CLI 工具，而是 Anthropic 的 Agent 操作系統(tǒng)底座。這么說吧，Claude Code 不是 Anthropic Agent 底座衍生出來的編程產(chǎn)品，它就是底座本身，只是直接以產(chǎn)品化的方式對外公開了。

AI Coding as an Infrastructure。

這與絕大多數(shù)做 AI 編程的創(chuàng)業(yè)公司甚至大廠的邏輯已經(jīng)完全不同了。

這次泄露的 Claude Code 源碼，query.ts是核心查詢循環(huán)，800多行的狀態(tài)機(jī)，處理7種消息類型。其中，有三個工程細(xì)節(jié)，可以說明這個系統(tǒng)的真實重量。

其一，四層上下文壓縮。呈遞進(jìn)機(jī)制，優(yōu)先保持粒度，必要時才犧牲細(xì)節(jié)，而不是對話太長就截斷——這是很多已經(jīng)很能打的國產(chǎn)模型/Agent 仍然存在的疏漏。這說明長任務(wù)、長對話是 Anthropic 押注的核心場景：Agent要連續(xù)工作數(shù)小時甚至數(shù)天，上下文管理就是命門。

其二，流式工具并行執(zhí)行。模型生成和工具調(diào)用真正并行，而不是排隊。它優(yōu)化的是 Agent 同時做很多事的吞吐量，而不是讓人等得更短的響應(yīng)速度。

其三，多模式運(yùn)行與遞歸計費。代碼中存在交互式、嵌入式、持久后臺三種運(yùn)行模式，嵌套調(diào)用有獨立的成本追蹤，計費精細(xì)到子調(diào)用級別。這是一個平臺級的復(fù)雜度，一個工具本身做不出這種復(fù)雜度，它體現(xiàn)了 Anthropic 商業(yè)模式的精確度。

最近“Harness”概念大行其道，越來越普遍的共識是：Harness是“最薄的包裝”，Anthropic自己也這么說。

但有沒有可能，Anthropic 之前一直在忽悠開發(fā)者和創(chuàng)業(yè)者？直到這次代碼被意外開源了？

泄露代碼顯示的是另一回事：數(shù)萬行代碼、數(shù)百個工程決策、復(fù)雜的狀態(tài)機(jī)管理、完整的容錯與恢復(fù)基礎(chǔ)設(shè)施。

生產(chǎn)級的 Harness 是系統(tǒng)工程，是 Agent Infrastructure，不是一兩個工具的組合。低估了這一點，與 Anthropic 比競爭壁壘，就是耗子給貓當(dāng)三陪。

但這里并非沒有創(chuàng)業(yè)者的機(jī)會。

兩個戰(zhàn)略信號

泄露的 Claude Code 代碼中，散落著17個 Feature Flag——實驗性功能開關(guān)。

其中大部分是產(chǎn)品探索，比如 BUDDY（電子寵物）、VOICE_MODE（語音交互）、BRIDGE_MODE（IDE橋接），它們方向各異，優(yōu)先級不高。

但有兩個代碼泄露的戰(zhàn)略信號不容忽視：

其一是 KAIROS。它是持久后臺代理，藏在隱藏模式里，已部分被實現(xiàn)。這意味著 Anthropic 認(rèn)為：Agent 的終局形態(tài)不是你坐在電腦前跟它對話——而是它在后臺自主運(yùn)行，你在不在場沒關(guān)系，它干它的活。它不是交互工具，而是后臺基礎(chǔ)設(shè)施。它決定了整個 Harness 的設(shè)計方向：狀態(tài)持久化、任務(wù)恢復(fù)、長時間運(yùn)行的資源管理，全都是為“無人值守”準(zhǔn)備的。

第二個是 PROACTIVE。即主動式 AI，它還在實驗階段。傳統(tǒng)的 Agent 模式是人下指令，AI執(zhí)行，即 Manus模式。而 PROACTIVE 要反過來：AI主動發(fā)起行動，人負(fù)責(zé)審批。這是交互范式的根本翻轉(zhuǎn)。

如果說 KAIROS定義了 Agent“在哪里跑”，而PROACTIVE定義了 Agent“誰說了算”。

這兩個方向疊加起來，是一幅清晰的圖景：Agent 不等你說話，自己決定干什么，在后臺持續(xù)執(zhí)行，你只需要偶爾看一眼、批準(zhǔn)或否決。

對創(chuàng)業(yè)者來說，這是一個時間窗口的信號。Anthropic 大抵是要沿著這個戰(zhàn)略方向進(jìn)化它的 Agent 的，但現(xiàn)在沒有成型的產(chǎn)品。在Anthropic 發(fā)大招之前，創(chuàng)業(yè)公司在垂直領(lǐng)域——如零售、保險、財務(wù)等領(lǐng)域建立先發(fā)優(yōu)勢的窗口還開著。只不過，這個窗口以月為計算，得抓緊。

邊界之外的創(chuàng)業(yè)機(jī)會

這份被泄露代碼最大的價值，不是告訴你 Anthropic 有多強(qiáng)——這你本來就該知道。它的價值是第一次讓你看清它的疆域——哪些是已經(jīng)筑好的內(nèi)核，哪些是尚未涉足的荒野。

已筑好的內(nèi)核，不要碰，那不是創(chuàng)業(yè)公司輕易能做的。

你看，它的通用編排有 query.ts 的800行狀態(tài)機(jī)撐著，基礎(chǔ)工具接入被 MCP 協(xié)議標(biāo)準(zhǔn)化了，它的上下文壓縮是四層工程護(hù)城河，而成本追蹤精細(xì)到遞歸子調(diào)用。這些層級的工程深度已經(jīng)極高。

在這些領(lǐng)域創(chuàng)業(yè)，等于正面撞 Anthropic 的操作系統(tǒng)底座，或者成為它的生態(tài)附庸，不，連附庸都當(dāng)不上。

而 Anthropic 還沒做的，是 Agent Infra 創(chuàng)業(yè)者的機(jī)會。

訓(xùn)練環(huán)境是確定性最高的方向（這也是之前林俊旸推文中預(yù)測的重要的創(chuàng)業(yè)賽道）。

泄露的代碼中，taskBudget 與 maxTurns 是任務(wù)限制系統(tǒng)的雛形，但僅此而已，它們沒有完善的沙箱，也沒有專業(yè)的 rollout 基礎(chǔ)設(shè)施。

那為什么 Anthropic 自己不做？因為它的核心利益在模型層，環(huán)境層不是它的優(yōu)先級，就像英偉達(dá)不會自己去建數(shù)據(jù)中心一樣。

而 Agentic RL 的最大瓶頸恰恰不是算法，是環(huán)境質(zhì)量。專業(yè)RL沙箱、代碼執(zhí)行環(huán)境、瀏覽器模擬器。當(dāng)下，在環(huán)境質(zhì)量的領(lǐng)域創(chuàng)業(yè)是對的：模型能力剛過 Agent 可用的門檻，但訓(xùn)練的基礎(chǔ)設(shè)施還停留在手工作坊階段，供需錯配最嚴(yán)重的窗口，就是現(xiàn)在。

垂直行業(yè)技能同樣是重要的方向。

Claude Code 的 commands.ts 提供了通用的技能加載框架，但框架和行業(yè)知識是兩層完全不同的工程。

Harvey 做法律 Agent，Abridge 做醫(yī)療 Agent，它們的壁壘不是調(diào)用能力，而是對行業(yè)工作流的深度理解：法律文書的引用格式、醫(yī)療記錄的合規(guī)要求、金融模型的風(fēng)控邏輯，這些東西不是通用框架能解決的。

還是那個問題，為什么 Anthropic 自己不做？顯然組織能力不匹配。Anthropic 的工程師懂怎么寫狀態(tài)機(jī)，但不懂醫(yī)療合規(guī)流程，這種知識不是招幾個行業(yè)顧問能補(bǔ)上的。而通用底座越成熟，垂直技能的價值反而越高。

這個創(chuàng)業(yè)賽道的本質(zhì)，其實是垂直領(lǐng)域的 Agent，它的核心能力是把垂直商業(yè)領(lǐng)域的專業(yè)知識 Skills 化，可以成為獨立的 Agent 公司，也可以把專業(yè)商業(yè)領(lǐng)域的數(shù)據(jù)層“打包”成 Skills，適配其它的 Agent。最近國內(nèi)很多互聯(lián)網(wǎng) O2O 垂直領(lǐng)域的巨頭似乎都在這么搞。

獨立評估是另一個可行的創(chuàng)業(yè)方向。

泄露的 Claude Code 代碼有 logEvent，Agent 每一步操作都會被記錄在案，哪個工具被調(diào)用了、花了多少 token、執(zhí)行結(jié)果是什么，全部寫進(jìn)日志。它像一個記錄問題的小黑本。

但銀行不會信任被審計方自己的工具做合規(guī)檢查，醫(yī)院也不會讓 AI 自己評估自己的診斷質(zhì)量。

第三方行為審計、跨模型成本歸因、合規(guī)檢查引擎：這些產(chǎn)品的價值不在技術(shù)難度，而在獨立性和垂直領(lǐng)域的專業(yè)性本身。Agent 越自主，韁繩（Harness）的價格越貴，但韁繩不能由被駕馭者自己打造，必須由第三方掌握。

這個方向天然指向大客戶、高客單價，商業(yè)模式適合獨立上市，不適合被收購——因為被收購意味著失去獨立性，而獨立性恰恰是產(chǎn)品的全部價值。

中國本土的 Harness 生態(tài)，也是一個方向。

這是一個非常“中國特色”的創(chuàng)業(yè)方向。Anthropic 的工程架構(gòu)與中國的 AI 生態(tài)無關(guān)，中國 Agent 創(chuàng)業(yè)公司與字節(jié)跳動、阿里巴巴的身位差距，遠(yuǎn)小于硅谷創(chuàng)業(yè)公司與 Anthropic 的差距——這意味著 Anthropic 做了的和沒做的，中國創(chuàng)業(yè)者都有機(jī)會。

但“復(fù)制一個中國版 Claude Code”是沒有意義的。

中國企業(yè)的工具鏈——飛書文檔、釘釘審批、企微客戶管理，跟美國 SaaS 生態(tài)在數(shù)據(jù)結(jié)構(gòu)和工作流層面完全不同。這意味著在工具定義層，中國創(chuàng)業(yè)者需要重新設(shè)計，適配已有的工具和商業(yè)模式。最近飛書和釘釘都開放了自己的 CLI 給整個生態(tài)，是一個不錯的啟發(fā)和信號。

在豆包、Qwen 和 Kimi 之上構(gòu)建本土 Harness層，集成中國原生的工具鏈，這是一個獨立的生態(tài)工程。Anthropic 的手掌心覆蓋不到，但也沒有任何模板可抄。

這可能是 Anthropic 在工程能力上與外界最信息對稱的一次。創(chuàng)業(yè)者第一次能看到 Agent操作系統(tǒng)底座的實際邊界，不用猜測，不用推演。

但看到邊界，和在邊界之外建出東西，是兩件完全不同的事。

它對 Anthropic 的傷害不大，對創(chuàng)業(yè)者的啟發(fā)不小。天底下竟還有這等好事。

文| 駱軼航 with 他自己解剖自己的 Claude Cowork

點個“愛心”，再走吧

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.