![]()
這可能是 Anthropic 在工程能力上與外界最信息對稱的一次。它對 Anthropic 的傷害不大,對創(chuàng)業(yè)者的啟發(fā)不小。
2026年3月30日,Anthropic的工程師在發(fā)布npm包時犯了一個重復(fù)的錯誤:沒在.npmignore 中排除 source map 文件。于是,57MB的cli.js.map 指向了R2存儲桶,51.2萬行 TypeScript 源代碼,1906個未經(jīng)混淆的源文件,在數(shù)小時內(nèi)被鏡像至 GitHub。它們被 fork 了數(shù)萬次,永久擴(kuò)散。
這不是官方開源,但效果等同。Claude Code四年工程迭代的家底,一夜之間成了公共財產(chǎn)。
喜歡動手但不太愛動腦子的 AI builder 都摩拳擦掌,希望復(fù)刻一個 Claude Code,這基本是癡心妄想。而對方興未艾的 Agent Infra 賽道的創(chuàng)業(yè)者來說,這份被意外開源的代碼庫,則是一份工具書,一份創(chuàng)業(yè)指導(dǎo)白皮書。
它第一次讓外界看清 Anthropic 的工程邊界——做了什么,做到了什么程度;以及沒做什么,為創(chuàng)業(yè)者留了哪些白。
Claude Code 還是被低估了
Claude Code 已經(jīng)這么牛了。但泄露的代碼告訴我們:它還是被低估了。
許多人認(rèn)為 Claude Code 不過是“模型+提示詞+工具調(diào)用”的輕量級包裝,創(chuàng)業(yè)公司用幾個月就能搭出 MVP,進(jìn)軍 AI 編程賽道。
這次代碼泄露的一開始,很多開發(fā)者也躍躍欲試,意圖復(fù)制一個 Claude Code。但很快,當(dāng)他們仔細(xì)研究之后,發(fā)現(xiàn)泄露的代碼是一劑清醒劑。
Claude Code不是 Claude 的 CLI 工具,而是 Anthropic 的 Agent 操作系統(tǒng)底座。這么說吧,Claude Code 不是 Anthropic Agent 底座衍生出來的編程產(chǎn)品,它就是底座本身,只是直接以產(chǎn)品化的方式對外公開了。
AI Coding as an Infrastructure。
這與絕大多數(shù)做 AI 編程的創(chuàng)業(yè)公司甚至大廠的邏輯已經(jīng)完全不同了。
這次泄露的 Claude Code 源碼,query.ts是核心查詢循環(huán),800多行的狀態(tài)機(jī),處理7種消息類型。其中,有三個工程細(xì)節(jié),可以說明這個系統(tǒng)的真實重量。
其一,四層上下文壓縮。呈遞進(jìn)機(jī)制,優(yōu)先保持粒度,必要時才犧牲細(xì)節(jié),而不是對話太長就截斷——這是很多已經(jīng)很能打的國產(chǎn)模型/Agent 仍然存在的疏漏。這說明長任務(wù)、長對話是 Anthropic 押注的核心場景:Agent要連續(xù)工作數(shù)小時甚至數(shù)天,上下文管理就是命門。
其二,流式工具并行執(zhí)行。模型生成和工具調(diào)用真正并行,而不是排隊。它優(yōu)化的是 Agent 同時做很多事的吞吐量,而不是讓人等得更短的響應(yīng)速度。
其三,多模式運(yùn)行與遞歸計費。代碼中存在交互式、嵌入式、持久后臺三種運(yùn)行模式,嵌套調(diào)用有獨立的成本追蹤,計費精細(xì)到子調(diào)用級別。這是一個平臺級的復(fù)雜度,一個工具本身做不出這種復(fù)雜度,它體現(xiàn)了 Anthropic 商業(yè)模式的精確度。
最近“Harness”概念大行其道,越來越普遍的共識是:Harness是“最薄的包裝”,Anthropic自己也這么說。
但有沒有可能,Anthropic 之前一直在忽悠開發(fā)者和創(chuàng)業(yè)者?直到這次代碼被意外開源了?
泄露代碼顯示的是另一回事:數(shù)萬行代碼、數(shù)百個工程決策、復(fù)雜的狀態(tài)機(jī)管理、完整的容錯與恢復(fù)基礎(chǔ)設(shè)施。
生產(chǎn)級的 Harness 是系統(tǒng)工程,是 Agent Infrastructure,不是一兩個工具的組合。低估了這一點,與 Anthropic 比競爭壁壘,就是耗子給貓當(dāng)三陪。
但這里并非沒有創(chuàng)業(yè)者的機(jī)會。
兩個戰(zhàn)略信號
泄露的 Claude Code 代碼中,散落著17個 Feature Flag——實驗性功能開關(guān)。
其中大部分是產(chǎn)品探索,比如 BUDDY(電子寵物)、VOICE_MODE(語音交互)、BRIDGE_MODE(IDE橋接),它們方向各異,優(yōu)先級不高。
但有兩個代碼泄露的戰(zhàn)略信號不容忽視:
其一是 KAIROS。它是持久后臺代理,藏在隱藏模式里,已部分被實現(xiàn)。這意味著 Anthropic 認(rèn)為:Agent 的終局形態(tài)不是你坐在電腦前跟它對話——而是它在后臺自主運(yùn)行,你在不在場沒關(guān)系,它干它的活。它不是交互工具,而是后臺基礎(chǔ)設(shè)施。它決定了整個 Harness 的設(shè)計方向:狀態(tài)持久化、任務(wù)恢復(fù)、長時間運(yùn)行的資源管理,全都是為“無人值守”準(zhǔn)備的。
第二個是 PROACTIVE。即主動式 AI,它還在實驗階段。傳統(tǒng)的 Agent 模式是人下指令,AI執(zhí)行,即 Manus模式。而 PROACTIVE 要反過來:AI主動發(fā)起行動,人負(fù)責(zé)審批。這是交互范式的根本翻轉(zhuǎn)。
如果說 KAIROS定義了 Agent“在哪里跑”,而PROACTIVE定義了 Agent“誰說了算”。
這兩個方向疊加起來,是一幅清晰的圖景:Agent 不等你說話,自己決定干什么,在后臺持續(xù)執(zhí)行,你只需要偶爾看一眼、批準(zhǔn)或否決。
對創(chuàng)業(yè)者來說,這是一個時間窗口的信號。Anthropic 大抵是要沿著這個戰(zhàn)略方向進(jìn)化它的 Agent 的,但現(xiàn)在沒有成型的產(chǎn)品。在Anthropic 發(fā)大招之前,創(chuàng)業(yè)公司在垂直領(lǐng)域——如零售、保險、財務(wù)等領(lǐng)域建立先發(fā)優(yōu)勢的窗口還開著。只不過,這個窗口以月為計算,得抓緊。
邊界之外的創(chuàng)業(yè)機(jī)會
這份被泄露代碼最大的價值,不是告訴你 Anthropic 有多強(qiáng)——這你本來就該知道。它的價值是第一次讓你看清它的疆域——哪些是已經(jīng)筑好的內(nèi)核,哪些是尚未涉足的荒野。
已筑好的內(nèi)核,不要碰,那不是創(chuàng)業(yè)公司輕易能做的。
你看,它的通用編排有 query.ts 的800行狀態(tài)機(jī)撐著,基礎(chǔ)工具接入被 MCP 協(xié)議標(biāo)準(zhǔn)化了,它的上下文壓縮是四層工程護(hù)城河,而成本追蹤精細(xì)到遞歸子調(diào)用。這些層級的工程深度已經(jīng)極高。
在這些領(lǐng)域創(chuàng)業(yè),等于正面撞 Anthropic 的操作系統(tǒng)底座,或者成為它的生態(tài)附庸,不,連附庸都當(dāng)不上。
而 Anthropic 還沒做的,是 Agent Infra 創(chuàng)業(yè)者的機(jī)會。
訓(xùn)練環(huán)境是確定性最高的方向(這也是之前林俊旸推文中預(yù)測的重要的創(chuàng)業(yè)賽道)。
泄露的代碼中,taskBudget 與 maxTurns 是任務(wù)限制系統(tǒng)的雛形,但僅此而已,它們沒有完善的沙箱,也沒有專業(yè)的 rollout 基礎(chǔ)設(shè)施。
那為什么 Anthropic 自己不做?因為它的核心利益在模型層,環(huán)境層不是它的優(yōu)先級,就像英偉達(dá)不會自己去建數(shù)據(jù)中心一樣。
而 Agentic RL 的最大瓶頸恰恰不是算法,是環(huán)境質(zhì)量。專業(yè)RL沙箱、代碼執(zhí)行環(huán)境、瀏覽器模擬器。當(dāng)下,在環(huán)境質(zhì)量的領(lǐng)域創(chuàng)業(yè)是對的:模型能力剛過 Agent 可用的門檻,但訓(xùn)練的基礎(chǔ)設(shè)施還停留在手工作坊階段,供需錯配最嚴(yán)重的窗口,就是現(xiàn)在。
垂直行業(yè)技能同樣是重要的方向。
Claude Code 的 commands.ts 提供了通用的技能加載框架,但框架和行業(yè)知識是兩層完全不同的工程。
Harvey 做法律 Agent,Abridge 做醫(yī)療 Agent,它們的壁壘不是調(diào)用能力,而是對行業(yè)工作流的深度理解:法律文書的引用格式、醫(yī)療記錄的合規(guī)要求、金融模型的風(fēng)控邏輯,這些東西不是通用框架能解決的。
還是那個問題,為什么 Anthropic 自己不做?顯然組織能力不匹配。Anthropic 的工程師懂怎么寫狀態(tài)機(jī),但不懂醫(yī)療合規(guī)流程,這種知識不是招幾個行業(yè)顧問能補(bǔ)上的。而通用底座越成熟,垂直技能的價值反而越高。
這個創(chuàng)業(yè)賽道的本質(zhì),其實是垂直領(lǐng)域的 Agent,它的核心能力是把垂直商業(yè)領(lǐng)域的專業(yè)知識 Skills 化,可以成為獨立的 Agent 公司,也可以把專業(yè)商業(yè)領(lǐng)域的數(shù)據(jù)層“打包”成 Skills,適配其它的 Agent。最近國內(nèi)很多互聯(lián)網(wǎng) O2O 垂直領(lǐng)域的巨頭似乎都在這么搞。
獨立評估是另一個可行的創(chuàng)業(yè)方向。
泄露的 Claude Code 代碼有 logEvent,Agent 每一步操作都會被記錄在案,哪個工具被調(diào)用了、花了多少 token、執(zhí)行結(jié)果是什么,全部寫進(jìn)日志。它像一個記錄問題的小黑本。
但銀行不會信任被審計方自己的工具做合規(guī)檢查,醫(yī)院也不會讓 AI 自己評估自己的診斷質(zhì)量。
第三方行為審計、跨模型成本歸因、合規(guī)檢查引擎:這些產(chǎn)品的價值不在技術(shù)難度,而在獨立性和垂直領(lǐng)域的專業(yè)性本身。Agent 越自主,韁繩(Harness)的價格越貴,但韁繩不能由被駕馭者自己打造,必須由第三方掌握。
這個方向天然指向大客戶、高客單價,商業(yè)模式適合獨立上市,不適合被收購——因為被收購意味著失去獨立性,而獨立性恰恰是產(chǎn)品的全部價值。
中國本土的 Harness 生態(tài),也是一個方向。
這是一個非常“中國特色”的創(chuàng)業(yè)方向。Anthropic 的工程架構(gòu)與中國的 AI 生態(tài)無關(guān),中國 Agent 創(chuàng)業(yè)公司與字節(jié)跳動、阿里巴巴的身位差距,遠(yuǎn)小于硅谷創(chuàng)業(yè)公司與 Anthropic 的差距——這意味著 Anthropic 做了的和沒做的,中國創(chuàng)業(yè)者都有機(jī)會。
但“復(fù)制一個中國版 Claude Code”是沒有意義的。
中國企業(yè)的工具鏈——飛書文檔、釘釘審批、企微客戶管理,跟美國 SaaS 生態(tài)在數(shù)據(jù)結(jié)構(gòu)和工作流層面完全不同。這意味著在工具定義層,中國創(chuàng)業(yè)者需要重新設(shè)計,適配已有的工具和商業(yè)模式。最近飛書和釘釘都開放了自己的 CLI 給整個生態(tài),是一個不錯的啟發(fā)和信號。
在豆包、Qwen 和 Kimi 之上構(gòu)建本土 Harness層,集成中國原生的工具鏈,這是一個獨立的生態(tài)工程。Anthropic 的手掌心覆蓋不到,但也沒有任何模板可抄。
這可能是 Anthropic 在工程能力上與外界最信息對稱的一次。創(chuàng)業(yè)者第一次能看到 Agent操作系統(tǒng)底座的實際邊界,不用猜測,不用推演。
但看到邊界,和在邊界之外建出東西,是兩件完全不同的事。
它對 Anthropic 的傷害不大,對創(chuàng)業(yè)者的啟發(fā)不小。天底下竟還有這等好事。
文| 駱軼航 with 他自己解剖自己的 Claude Cowork
點個“愛心”,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.