網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

52天75次發(fā)布，A司這場(chǎng)“產(chǎn)品大爆炸”太猛烈了

2026-03-26 19:50:22　來(lái)源: 鈦媒體APP

北京舉報(bào)

分享至

文 | 字母AI

最近兩個(gè)月我在刷手機(jī)的時(shí)候，感覺(jué)每天都有Anthropic的新聞。今天發(fā)布了個(gè)啥，明天又發(fā)布了個(gè)啥。

產(chǎn)品管理社區(qū)Product Compass創(chuàng)始人帕維爾·胡林（Pawe? Huryn）也有相同的感覺(jué)，于是他把這些新聞?wù)沓闪艘环萑諝v發(fā)在X上，從美東時(shí)間2月1日到3月23日，Anthropic在52天發(fā)布了73款產(chǎn)品。

這條X發(fā)出的當(dāng)天，Anthropic發(fā)布了Computer Use（電腦操控功能），以及Claude Code Channels for Teams + Enterprise。

所以應(yīng)該叫52天發(fā)布75個(gè)產(chǎn)品才對(duì)。

這篇X剛發(fā)出不到24小時(shí)，Anthropic又發(fā)布了Claude的Auto Mode。

Anthropic相當(dāng)于每0.7天就發(fā)布一個(gè)新產(chǎn)品，是OpenAI自稱“每3天一個(gè)新功能”速度的4倍以上，甚至說(shuō)我還沒(méi)寫(xiě)完一篇稿，下一個(gè)新產(chǎn)品就已經(jīng)發(fā)布了。

在之前字母AI的文章《150萬(wàn)AI agent社交狂歡背后，是一場(chǎng)“產(chǎn)品大爆炸”》中，我提出了“產(chǎn)品大爆炸”的概念，自從Claude Code 掀起編程革命之后，整個(gè)AI圈都投入了一場(chǎng)產(chǎn)品創(chuàng)新迭代的浪潮之中，“龍蝦”O(jiān)penClaw就是其中的代表。毫無(wú)疑問(wèn)，Anthropic既是“產(chǎn)品大爆炸”的引領(lǐng)者，同時(shí)也是最大的受益者和踐行者。

但是你有沒(méi)有想過(guò)，為什么Anthropic能做到？

誠(chéng)然，AI編程是至關(guān)重要的一環(huán)，用AI來(lái)開(kāi)發(fā)，事半功倍。

可是在全球最嚴(yán)格的編程測(cè)試集SWE-Bench Pro里，ChatGPT-5.4和Gemini 3 Pro的成績(jī)都比Claude Opus 4.6要高。

所以在我看來(lái)，AI編程只是第一步，它是目前所有AI公司都擁有的能力，Anthropic的成功并不只在于此。

而是在于他們形成了技術(shù)自舉的加速循環(huán)，用AI來(lái)完成整個(gè)閉環(huán)。人類開(kāi)發(fā)者在其中的作用，只是提供一個(gè)想法，唯一需要做的就是等AI跑出結(jié)果。

當(dāng)工具開(kāi)始制造工具本身時(shí)，我們可能正在目睹技術(shù)奇點(diǎn)的早期信號(hào)。

現(xiàn)在看是52天發(fā)布75款產(chǎn)品，過(guò)幾天可能就縮短到30天發(fā)布80款產(chǎn)品，15天發(fā)布100款產(chǎn)品……

Anthropic如今的成功，正在迫使行業(yè)老大OpenAI重新審視自己的戰(zhàn)略，開(kāi)始全面模仿Anthropic的路徑。

01 52 天的產(chǎn)品浪潮

引領(lǐng)這場(chǎng)產(chǎn)品浪潮的是Anthropic在1月中旬發(fā)布的Cowork。

這個(gè)產(chǎn)品開(kāi)發(fā)團(tuán)隊(duì)只有4個(gè)人，總工時(shí)10天，90%的代碼由AI編寫(xiě)。

可就是這么一個(gè)超短周期的產(chǎn)品，卻能根據(jù)你所描述的任務(wù)，自主實(shí)現(xiàn)規(guī)劃、執(zhí)行，以及交付結(jié)果。徹底改變了許多人的工作方式。

顯然，Cowork的成功給了Anthropic信心。于是到了2月初開(kāi)始，浪來(lái)了。

Claude上線了法律插件，它能夠?qū)彶榉晌募⒆粉櫤弦?guī)任務(wù)、自動(dòng)化合同審查，與Thomson Reuters等法律數(shù)據(jù)庫(kù)深度集成。

這個(gè)插件在單日引發(fā)全球軟件和服務(wù)類股票約2850億美元的拋售，6個(gè)交易日總共造成8300億美元的拋售。

Thomson Reuters、LegalZoom等法律科技公司股價(jià)當(dāng)場(chǎng)暴跌，軟件ETF基金IGV從2026年初至2月27日下跌22.8%。

2月17日，重磅炸彈Claude Sonnet 4.6來(lái)了。

這是Anthropic產(chǎn)品歷史上第一次，Sonnet級(jí)別的模型在編程測(cè)試中超越了上一代的Opus。

Sonnet 4.6的上下文窗口擴(kuò)展到了100萬(wàn)token，約75萬(wàn)個(gè)單詞，相當(dāng)于2500頁(yè)文檔，意味著AI可以一次性處理整個(gè)大型代碼庫(kù)。

過(guò)去企業(yè)在選擇AI服務(wù)時(shí)，成本和能力是蹺蹺板的兩端，性能高價(jià)格就高，價(jià)格低性能就低。

現(xiàn)在Anthropic把蹺蹺板拆了，Sonnet 4.6比Opus 4.6便宜了將近一半，加速了企業(yè)市場(chǎng)向Anthropic的遷移。

2月20日，Claude Code Security上線，使用基于推理的掃描來(lái)發(fā)現(xiàn)代碼庫(kù)中的零日漏洞。

傳統(tǒng)安全掃描工具需要不斷更新規(guī)則庫(kù)，就像是拿著通緝犯照片在街上找人。

而Claude Code Security可以發(fā)現(xiàn)從未見(jiàn)過(guò)的漏洞模式，它理解代碼編寫(xiě)的邏輯，所以能在很早的時(shí)候就判斷出哪些地方可能出問(wèn)題，即使這個(gè)問(wèn)題從沒(méi)有被記錄過(guò)。

2月24日，Anthropic開(kāi)始發(fā)布大體量的產(chǎn)品，這家公司在當(dāng)天連發(fā)了10個(gè)企業(yè)插件。

包括投資銀行插件能做交易審查、估值建模，財(cái)富管理插件能做投資組合分析，私募股權(quán)插件能做盡職調(diào)查，人力資源插件能處理入職材料、品牌規(guī)范，還有工程、設(shè)計(jì)、運(yùn)營(yíng)等插件。

Anthropic與FactSet、S&P、Thomson Reuters、RBC Wealth Management等行業(yè)巨頭深度合作。

市場(chǎng)再次出現(xiàn)拋售，但是與Anthropic合作的公司股票反而上漲。投資者的理由很簡(jiǎn)單，“與Anthropic合作”是生存之道，而非對(duì)手。

同期，私有插件市場(chǎng)上線。

Anthropic為企業(yè)客戶提供了一個(gè)“私有插件市場(chǎng)”，企業(yè)可以開(kāi)發(fā)自己的插件，將公司特有的工作流、合規(guī)要求、品牌規(guī)范編碼為agent，然后在組織內(nèi)部分發(fā)。

它把Anthropic的能力變成了一個(gè)平臺(tái)，企業(yè)不再是購(gòu)買一個(gè)工具，而是獲得了一個(gè)可以無(wú)限擴(kuò)展的基礎(chǔ)設(shè)施。

3月9日，Code Review上線。

當(dāng)AI開(kāi)始大量生成代碼，這時(shí)候人類就審查不過(guò)來(lái)了，只能交給AI自己來(lái)處理。

Code Review就是這樣一款專門審查代碼的多agent系統(tǒng)。它能自動(dòng)分析代碼邏輯、標(biāo)記錯(cuò)誤、識(shí)別安全漏洞，每次審查成本15到25美元。

同時(shí)這也是Anthropic實(shí)現(xiàn)AI開(kāi)發(fā)自舉循環(huán)的關(guān)鍵一環(huán)。

3月11日，Anthropic邁出了更大的一步，發(fā)布了微軟Excel和PowerPoint跨應(yīng)用協(xié)作功能。

Anthropic讓Claude可以在Excel和PowerPoint之間無(wú)縫工作。

舉個(gè)例子，你可以讓Claude從Excel中提取財(cái)務(wù)數(shù)據(jù)、構(gòu)建交易對(duì)比表，然后自動(dòng)將估值摘要放入演示文稿，最后起草發(fā)郵件。

整個(gè)過(guò)程信息、指令、任務(wù)歷史在不同應(yīng)用間流動(dòng)，用戶不需要重復(fù)說(shuō)明上下文。

這個(gè)功能雖然說(shuō)起來(lái)簡(jiǎn)單，然而它實(shí)際上解決了一個(gè)長(zhǎng)期存在的問(wèn)題：AI的記憶是孤立的。你在Excel里告訴AI的事情，到了PowerPoint里它就忘了。

3月17日，持久化agent線程發(fā)布。

用戶現(xiàn)在可以用Claude Apps來(lái)管理Cowork中的任務(wù)，agent可以跨會(huì)話保持上下文和任務(wù)狀態(tài)。你早上在手機(jī)上給AI布置任務(wù)，下午在電腦上打開(kāi)，AI還記得你要什么，進(jìn)展到哪里了。

根據(jù)Ramp的數(shù)據(jù)，僅僅10周。在首次購(gòu)買AI工具的企業(yè)中，Anthropic占據(jù)的份額從50%飆升至73%，OpenAI從50%跌至27%。在整體企業(yè)市場(chǎng)中，Anthropic的份額超過(guò)40%，OpenAI為27%。

OpenAI被打得有點(diǎn)懵圈了。

02 為什么是 Anthropic 引領(lǐng)了這場(chǎng)浪潮

前面咱們也說(shuō)過(guò)了，別人的AI編程能力比 Anthropic 還強(qiáng)，但是憑什么是Anthropic領(lǐng)先呢？

核心原因不在AI編程上，而是在于Anthropic使用的線束架構(gòu)（harness）。

線束架構(gòu)不是新鮮事物，OpenAI也在用。

線束架構(gòu)的本質(zhì)是一個(gè)讓agent能夠長(zhǎng)時(shí)間自主運(yùn)行、完成復(fù)雜任務(wù)的編排系統(tǒng)。

在Anthropic的官方blog中寫(xiě)到，如果把AI模型比作引擎，線束就是讓引擎持續(xù)運(yùn)轉(zhuǎn)的整套基礎(chǔ)設(shè)施。線束管理上下文、編排多個(gè)agent協(xié)作、處理任務(wù)分解、進(jìn)行狀態(tài)傳遞，確保AI能夠在數(shù)小時(shí)甚至更長(zhǎng)時(shí)間內(nèi)自主工作，而不需要人類持續(xù)介入。

Anthropic在構(gòu)建長(zhǎng)時(shí)間運(yùn)行的AI編程系統(tǒng)時(shí)，發(fā)現(xiàn)了兩個(gè)關(guān)鍵問(wèn)題。

第一個(gè)是上下文焦慮。當(dāng)任務(wù)變得復(fù)雜、對(duì)話歷史變長(zhǎng)時(shí)，模型會(huì)開(kāi)始失去連貫性。模型會(huì)出現(xiàn)“上下文焦慮”，當(dāng)它們認(rèn)為快要達(dá)到上下文限制時(shí)，會(huì)過(guò)早地結(jié)束工作。

就像一個(gè)打工人，眼看快下班了，可是他手頭的活還沒(méi)干完，他就只能匆匆收尾。

Anthropic的解決方案是上下文重置（Context Reset）。完全清空上下文窗口，啟動(dòng)一個(gè)全新的agent，但通過(guò)結(jié)構(gòu)化的“交接文檔”傳遞前一個(gè)agent的狀態(tài)和下一步計(jì)劃。

這給了agent一個(gè)干凈的起點(diǎn)，同時(shí)保持了工作的連續(xù)性。這與簡(jiǎn)單的“壓縮”不同。壓縮是把早期對(duì)話總結(jié)后保留在同一個(gè)會(huì)話中，但“上下文焦慮”依然存在。

重置則是徹底的新開(kāi)始，代價(jià)是需要精心設(shè)計(jì)交接文檔，確保下一個(gè)agent能無(wú)縫接手。

第二個(gè)問(wèn)題是自我評(píng)估失效。

當(dāng)要求AI評(píng)估自己生成的代碼或設(shè)計(jì)時(shí)，它們傾向于自信地稱贊自己的作品，即使在人類看來(lái)質(zhì)量明顯平庸。這個(gè)問(wèn)題在主觀任務(wù)上尤其嚴(yán)重，因?yàn)闆](méi)有像軟件測(cè)試那樣的二元驗(yàn)證標(biāo)準(zhǔn)。

你讓AI設(shè)計(jì)一個(gè)網(wǎng)頁(yè)，它做完了，你問(wèn)它做得怎么樣，它說(shuō)“非常好，符合現(xiàn)代設(shè)計(jì)美學(xué)”。你一看，又是紫色漸變配白色卡片，丑絕人寰，甲方看了想退單，產(chǎn)品看了想殺人。

Anthropic的解決方案是分離生成者和評(píng)估者。

讓一個(gè)agent負(fù)責(zé)生成，另一個(gè)agent負(fù)責(zé)評(píng)判。這種分離本身不會(huì)立即消除寬容傾向，可是一旦外部反饋輸入，生成者就有了具體的改進(jìn)目標(biāo)。

Anthropic目前采用了三agent的線束架構(gòu)，分別是Planner、Generator、Evaluator。

這個(gè)系統(tǒng)實(shí)現(xiàn)了完整的AI編程閉環(huán)。

Planner（規(guī)劃agent）的任務(wù)是把用戶的簡(jiǎn)單想法擴(kuò)展為完整的產(chǎn)品規(guī)格文檔。

用戶只需提供簡(jiǎn)單的想法，Planner就會(huì)將其擴(kuò)展為完整的產(chǎn)品規(guī)格文檔。

Anthropic特意讓Planner專注于產(chǎn)品背景和高層技術(shù)設(shè)計(jì)，而不是細(xì)節(jié)實(shí)現(xiàn)。因?yàn)槿绻鸓lanner在前期就指定了錯(cuò)誤的技術(shù)細(xì)節(jié)，這些錯(cuò)誤會(huì)級(jí)聯(lián)到后續(xù)實(shí)現(xiàn)中。所以才要約束最終交付物，讓agent在工作中自己找到路徑。

Generator（生成agent）采用“一次一個(gè)功能”的方式工作，從規(guī)格文檔中逐個(gè)挑選功能實(shí)現(xiàn)。

每個(gè)沖刺（sprint）結(jié)束后，Generator會(huì)先自我評(píng)估，然后將工作交給Evaluator進(jìn)行質(zhì)量檢查。它使用React、Vite、FastAPI、SQLite或PostgreSQL技術(shù)棧，并通過(guò)git進(jìn)行版本控制。

Generator就是真正干活的那個(gè)。它不會(huì)一口氣把所有功能都做完，而是一次只做一個(gè)功能。

做完一個(gè)功能后，它會(huì)先自己檢查一遍，然后把成果交給Evaluator去打分。它用的都是現(xiàn)成的主流技術(shù)，而且還會(huì)做版本管理，以便做壞的時(shí)候恢復(fù)到以前版本。

Evaluator（評(píng)估 agent）使用Playwright MCP工具，像真實(shí)用戶一樣點(diǎn)擊運(yùn)行中的應(yīng)用，測(cè)試UI功能、API端點(diǎn)和數(shù)據(jù)庫(kù)狀態(tài)。

然后根據(jù)一套標(biāo)準(zhǔn)對(duì)每個(gè)沖刺打分，比如產(chǎn)品深度、功能性、視覺(jué)設(shè)計(jì)、代碼質(zhì)量之類的。

每個(gè)標(biāo)準(zhǔn)都有硬性閾值，如果任何一項(xiàng)低于閾值，沖刺就會(huì)失敗，Generator會(huì)收到詳細(xì)的反饋說(shuō)明哪里出了問(wèn)題。

除此之外，在每個(gè)沖刺開(kāi)始前，Generator和Evaluator會(huì)協(xié)商一份“沖刺合約”。

在寫(xiě)任何代碼之前，需要先達(dá)成合約上規(guī)定的東西。

Generator提議要構(gòu)建什么、如何驗(yàn)證成功，Evaluator審查這個(gè)提議，確保Generator在構(gòu)建正確的東西。

雙方通過(guò)文件進(jìn)行溝通，一個(gè)agent寫(xiě)文件，另一個(gè)讀取并回復(fù)。這種機(jī)制確保工作忠于規(guī)格，同時(shí)不會(huì)過(guò)早地過(guò)度指定實(shí)現(xiàn)細(xì)節(jié)。

你可以這么理解，在每次開(kāi)始干活之前，Generator和Evaluator會(huì)先開(kāi)個(gè)會(huì)，碰一碰需求。用行話來(lái)講就是“對(duì)齊一下顆粒度”。

只有所有人都滿意這個(gè)方案的時(shí)候，才會(huì)開(kāi)工去執(zhí)行，并且每執(zhí)行一步，都要拿出這個(gè)方案來(lái)再瞅一眼。

Anthropic用同一個(gè)提示詞對(duì)單agent模式和三agent的線束模式進(jìn)行測(cè)試，題目為：創(chuàng)建一個(gè)2D復(fù)古游戲制作工具，包含關(guān)卡編輯器、精靈編輯器、實(shí)體行為和可玩測(cè)試模式。

單agent方式運(yùn)行20分鐘，成本9美元。生成的界面看起來(lái)符合預(yù)期，但實(shí)際使用時(shí)問(wèn)題不斷。

布局浪費(fèi)空間、工作流程僵硬、最關(guān)鍵的是游戲本身壞了，實(shí)體出現(xiàn)在屏幕上但不響應(yīng)輸入。

完整線束方式運(yùn)行6小時(shí)，成本200美元。

Planner將一句話提示擴(kuò)展為16個(gè)功能、10個(gè)沖刺的完整規(guī)格，遠(yuǎn)超單agent嘗試的范圍。除了核心編輯器和播放模式，還包括精靈動(dòng)畫(huà)系統(tǒng)、行為模板、音效和音樂(lè)、AI輔助的精靈生成器和關(guān)卡設(shè)計(jì)器，以及帶分享鏈接的游戲?qū)С龉δ堋?/p>

線束模式的成本是單agent的22倍，但產(chǎn)出的質(zhì)量差距不是22倍能形容的。單agent的產(chǎn)出是一個(gè)看起來(lái)能用、實(shí)際不能用的半成品。完整線束的產(chǎn)出是一個(gè)可以直接發(fā)布的產(chǎn)品。

這個(gè)架構(gòu)的真正價(jià)值不在于它能做什么，而在于它能持續(xù)做什么。單agent可以完成一個(gè)簡(jiǎn)單任務(wù)，但當(dāng)任務(wù)復(fù)雜到需要數(shù)小時(shí)甚至數(shù)天時(shí)，單agent就會(huì)迷失方向。

線束架構(gòu)通過(guò)分工、檢查、重置，讓AI能夠像一個(gè)小團(tuán)隊(duì)一樣工作。

線束架構(gòu)不是Anthropic的發(fā)明，Anthropic的優(yōu)勢(shì)在于，他們比別人更早、更系統(tǒng)地遇到這些問(wèn)題，然后把解決方案標(biāo)準(zhǔn)化、產(chǎn)品化。

03 Anthropic 幫助整個(gè)行業(yè)看清了方向

雖然Anthropic引領(lǐng)了這波產(chǎn)品浪潮，但是2026年初，整個(gè)AI行業(yè)最火的產(chǎn)品，卻不是Anthropic的產(chǎn)品，而是OpenClaw。

大街小巷都有各種“養(yǎng)龍蝦”攻略教程，這已經(jīng)無(wú)需多言。

可OpenClaw的成功，恰恰證明了Anthropic路線是正確的。

真正的護(hù)城河不在于模型性能，而是用AI來(lái)完成整個(gè)閉環(huán)。

OpenClaw能訪問(wèn)你的電腦文件系統(tǒng)、執(zhí)行終端命令、控制瀏覽器、接入社交軟件。更重要的是，它運(yùn)行在用戶自己的電腦上，擁有你給它的所有權(quán)限。

你發(fā)一句話給它，它就能自己去執(zhí)行，最后返回給你結(jié)果。

當(dāng)然它也會(huì)有失敗的時(shí)候，但是它絕大多數(shù)都能成功。

這才致使用戶寧愿冒著巨大的安全風(fēng)險(xiǎn)，給AI開(kāi)放底層電腦權(quán)限，讓它去幫自己訂票、發(fā)郵件、修Bug。

用戶不是不在乎安全，他們對(duì)“讓AI干活”的渴求已經(jīng)強(qiáng)烈到可以暫時(shí)壓過(guò)對(duì)風(fēng)險(xiǎn)的恐懼。

還有一家企業(yè)也被Anthropic的產(chǎn)品大爆炸所影響，它就是OpenAI。

2026年3月16日，在OpenAI的內(nèi)部會(huì)上，應(yīng)用業(yè)務(wù)CEO菲吉·西莫（Fidji Simo）直言：“Anthropic的進(jìn)展應(yīng)該成為警鐘。”

自此，OpenAI宣布從“do-it-all”策略轉(zhuǎn)向聚焦編程工具和企業(yè)客戶。

在產(chǎn)品層面，OpenAI計(jì)劃將ChatGPT、Codex、Atlas瀏覽器像 Claude 一樣合并為單一應(yīng)用。

在企業(yè)市場(chǎng)，OpenAI也準(zhǔn)備模仿Anthropic，推出類似的插件市場(chǎng)。

不過(guò)OpenAI現(xiàn)在面臨的問(wèn)題是，即使他們理解了Anthropic的策略、也懂得構(gòu)建類似的線束架構(gòu)，他們還需要時(shí)間來(lái)追趕。

可是在AI這個(gè)行業(yè)，時(shí)間就是一切。Anthropic可是每0.7天發(fā)布一個(gè)新產(chǎn)品，OpenAI哪怕耽誤一秒鐘都有可能會(huì)掉隊(duì)。

抓點(diǎn)緊吧！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.