北京時(shí)間 3 月 2 日晚 19:49,Claude 崩了。
截止到本文發(fā)出時(shí)(次日 16:24),網(wǎng)頁端仍然沒有完全恢復(fù)。
網(wǎng)頁版彈出“Claude is currently experiencing a temporary service disruption”,客戶端登錄失敗,Console 報(bào) 500 錯(cuò)誤。高峰時(shí)近 2000 名用戶同時(shí)報(bào)障。消息迅速傳開,社交媒體上一片哀嚎。
與此同時(shí),另一條新聞?wù)谒⑵粒?strong>伊朗無人機(jī)炸了 AWS 在阿聯(lián)酋的數(shù)據(jù)中心。
兩件事撞到一起,一個(gè)極具戲劇性的敘事立刻成型——“AWS 中東機(jī)房被炸,Claude 跟著一起掛了!”媒體爭(zhēng)相報(bào)道,連 Bloomberg 都出了快訊。全球程序員瑟瑟發(fā)抖,紛紛感嘆“第三次世界大戰(zhàn)先打掉了我的 AI 編程助手”。
![]()
但這個(gè)敘事,大概率是錯(cuò)的。
事實(shí)一:到底什么掛了,什么沒掛?
這是分析問題的起點(diǎn),也是絕大多數(shù)人沒搞清楚的關(guān)鍵。
Anthropic 在事故發(fā)生后明確確認(rèn):Claude API(api.anthropic.com)工作正常。出問題的是:
![]()
注意這個(gè)模式:后端模型推理沒掛,前端界面和認(rèn)證系統(tǒng)掛了。
Claude Code 的情況比較微妙——它本身走的是 API 通道,但在認(rèn)證、會(huì)話管理等環(huán)節(jié)依賴了前端基礎(chǔ)設(shè)施,所以出現(xiàn)了“錯(cuò)誤率升高”但并非完全不可用的癥狀。如果你在故障期間用的是直接調(diào) API 的方式,你甚至可能完全沒感知到這次事故。正好比老馮這篇文章,正是使用 Claude Code 進(jìn)行事實(shí)核查的。
這是一個(gè)非常重要的線索。這更像“認(rèn)證與流量入口先爆,再向后擴(kuò)散”,不是“核心推理集群被物理摧毀”。
事實(shí)二:AWS 中東被炸了什么?
我在另一篇分析中已經(jīng)詳細(xì)梳理過,這里簡(jiǎn)要回顧。
3 月 1 日,伊朗對(duì)阿聯(lián)酋和巴林發(fā)射無人機(jī)/導(dǎo)彈,AWS 在中東的數(shù)據(jù)中心遭遇直接打擊:
?UAE(me-central-1):3 個(gè)可用區(qū)中 2 個(gè)癱瘓(mec1-az2 被直接命中起火,mec1-az3 連鎖斷電)?Bahrain(me-south-1):3 個(gè)可用區(qū)中 1 個(gè)受損(mes1-az2 附近打擊造成物理損傷)?Israel(il-central-1):未受影響
![]()
中東 9 個(gè)運(yùn)營(yíng)可用區(qū)里掛了 3 個(gè),占比 33%。UAE 區(qū)域喪失 2/3 容量。這確實(shí)是 AWS 歷史上前所未有的物理災(zāi)難——人類第一次用導(dǎo)彈無人機(jī)打掉了云計(jì)算基礎(chǔ)設(shè)施。但問題來了:Anthropic 的服務(wù)跑在中東嗎?
事實(shí)三:Claude 不在中東
問題的關(guān)鍵在于,Anthropic 是一家總部位于舊金山的 AI 公司。Claude 的模型推理集群,需要的是大規(guī)模 GPU 算力——H100/H200 集群。這些資源部署在 AWS 的 us-east-1(弗吉尼亞)、us-west-2(俄勒岡)等美國(guó)本土核心區(qū)域,而不是中東。
AWS 中東區(qū)域(me-central-1、me-south-1)是面向中東本地客戶的區(qū)域服務(wù)節(jié)點(diǎn)。這些區(qū)域主要服務(wù)于中東地區(qū)的企業(yè)客戶,部署的是標(biāo)準(zhǔn)的云計(jì)算服務(wù)(EC2、S3、RDS 等),而非大規(guī)模 AI 推理集群。
AWS 官方故障隔離文檔寫得很直白:Region 之間相互隔離,單 Region 故障原則上不應(yīng)拖垮其他 Region。
如果 Claude 的核心推理引擎跑在中東,那 API 應(yīng)該也掛了。 但 API 完全正常——這直接否定了“導(dǎo)彈打掉 Claude 后端”的假說。有人可能會(huì)說:“也許 AWS 在全球做了流量重路由,導(dǎo)致其他區(qū)域過載?”理論上存在這種可能,但如果是后端過載,受影響的應(yīng)該是 API 響應(yīng)速度和可用性,而不是前端的登錄認(rèn)證系統(tǒng)。而實(shí)際表現(xiàn)恰恰相反——API 沒事,前端認(rèn)證掛了。
真正的原因:成功稅
那么,真正的原因可能是什么呢?
讓我們把時(shí)間線往前撥 48 小時(shí),看看 3 月 2 日之前發(fā)生了什么。
五角大樓風(fēng)波
2 月底,一場(chǎng)政治風(fēng)暴席卷了 AI 行業(yè):
1.五角大樓要求 Anthropic 開放模型用于軍事用途(包括自主武器和監(jiān)控系統(tǒng)),被 Dario Amodei 拒絕2.特朗普政府將 Anthropic 列為“激進(jìn)左翼 AI 公司”,下令聯(lián)邦機(jī)構(gòu) 6 個(gè)月內(nèi)停用3.國(guó)防部長(zhǎng) Hegseth 將 Anthropic 定性為“供應(yīng)鏈安全風(fēng)險(xiǎn)”4.OpenAI 隨即簽下 2 億美元五角大樓合同,接過了 Anthropic 拒絕的生意
這在普通消費(fèi)者中引發(fā)了劇烈反應(yīng)。
。戰(zhàn)爭(zhēng)部長(zhǎng)說這是 “企業(yè)道德作秀”,但不得不說這個(gè)秀的效果確實(shí)極好。
用腳投票
?2 月 28 日:ChatGPT 美國(guó)卸載量暴漲 295%(正常日環(huán)比僅 9%)?2 月 28 日:Claude 下載量環(huán)比增長(zhǎng) 51%?2 月 28 日:Claude 歷史上首次在美國(guó) App Store 下載量超過 ChatGPT,登頂?shù)谝?此前 Claude 在 App Store 排名第 42 位(超級(jí)碗廣告后)?2026 年以來,Claude 免費(fèi)活躍用戶增長(zhǎng) 60%,日注冊(cè)量 翻了四倍
Reddit 和 X 上掀起了 “ 運(yùn)動(dòng)。用戶自發(fā)撰寫從 ChatGPT 遷移到 Claude 的教程。一場(chǎng)史無前例的 AI 產(chǎn)品“用腳投票”正在發(fā)生。
![]()
然后 Claude 就掛了
從 App Store 第 42 名到第 1 名。日注冊(cè)量翻四倍。海量新用戶在同一個(gè)周末涌入。
任何系統(tǒng)工程師看到這組數(shù)字,都知道接下來會(huì)發(fā)生什么。
前端服務(wù)——Web 界面、認(rèn)證系統(tǒng)、會(huì)話管理——這些不是按照“突然涌入幾倍用戶”來設(shè)計(jì)容量的。后端 GPU 推理集群可以通過排隊(duì)和限流來扛住壓力,但前端的登錄、Session 管理、WebSocket 連接等服務(wù),面對(duì)的是瞬時(shí)并發(fā)的沖擊。
這完美解釋了為什么:
?API 沒掛(API 用戶量相對(duì)穩(wěn)定,且本來就有限流機(jī)制)?前端掛了(海量新用戶涌入 claude.ai 注冊(cè)/登錄)?Claude Code 部分受影響(依賴前端認(rèn)證鏈路,但核心推理走 API)?Claude for Government 沒事(獨(dú)立部署,用戶量不受消費(fèi)級(jí)市場(chǎng)波動(dòng)影響)
時(shí)間線對(duì)不上
再看時(shí)間線:
![]()
AWS 中東事件從 3 月 1 日凌晨就開始了。如果 Claude 的故障與之相關(guān),為什么延遲了 27 個(gè)小時(shí)才出現(xiàn)?而且出現(xiàn)的不是后端推理故障,而是前端認(rèn)證崩潰?
更合理的時(shí)間線是:經(jīng)過一個(gè)周末的病毒式傳播,周一(3 月 2 日)工作日開始,全球用戶密集上線,前端系統(tǒng)在北京時(shí)間周一晚(美東周一早晨)迎來峰值流量,然后——扛不住了。
11:49 UTC 恰好是美東早上 6:49——美國(guó)東海岸用戶開始新一天工作的時(shí)間。這不是巧合。
Anthropic 自己怎么說?
Anthropic 官方在事后表示,公司過去一周一直在應(yīng)對(duì) “unprecedented demand”(前所未有的需求)。
這句話本身就是答案。他們沒提 AWS 中東,沒提導(dǎo)彈,沒提區(qū)域故障。他們說的是——需求太大了。
這是一個(gè)好問題。甚至可以說,這是你能遇到的最好的問題之一。
在基礎(chǔ)設(shè)施運(yùn)維的世界里,有兩種宕機(jī):
1.需求不足導(dǎo)致的宕機(jī):沒人用你的服務(wù),但它還是掛了——這說明你的系統(tǒng)質(zhì)量有問題2.需求過載導(dǎo)致的宕機(jī):太多人想用你的服務(wù)——這說明你的產(chǎn)品太成功了
Claude 遇到的是第二種。這不是一個(gè)工程災(zāi)難,這是一個(gè) 成功稅(Success Tax)。
當(dāng)然,“成功稅”不代表可以不交。Anthropic 的前端基礎(chǔ)設(shè)施在面對(duì)用戶激增時(shí)的脆弱性暴露無遺。這也給所有 AI 公司上了一課:
?前端和認(rèn)證系統(tǒng)的彈性擴(kuò)展同樣關(guān)鍵——不是只有 GPU 集群需要彈性?消費(fèi)級(jí)產(chǎn)品的流量特征與 API 完全不同——API 增長(zhǎng)是線性的,消費(fèi)級(jí)產(chǎn)品可能是指數(shù)的?政治事件可以在 48 小時(shí)內(nèi)改變用戶規(guī)模的數(shù)量級(jí)——這是傳統(tǒng)容量規(guī)劃無法預(yù)見的
截至發(fā)稿:仍在波動(dòng)
截至北京時(shí)間 3 月 3 日,Claude 的狀態(tài)頁顯示仍有活躍事故:
?06:59 UTC:Claude Opus 4.6 出現(xiàn) elevated errors(正在調(diào)查)?03:15 - 04:43 UTC:claude.ai、cowork、platform、Claude Code 出現(xiàn) elevated errors
![]()
服務(wù)在恢復(fù)與波動(dòng)之間反復(fù)。這符合“容量不足逐步擴(kuò)容”的特征,而不是“物理設(shè)施被毀等待重建”的特征。如果是后者,恢復(fù)曲線不會(huì)是這種漸進(jìn)式的。
結(jié)論
AWS 中東數(shù)據(jù)中心被伊朗無人機(jī)炸了,這是事實(shí)。Claude 全球大宕機(jī),這也是事實(shí)。但把這兩件事畫等號(hào)——那是在偷懶。
證據(jù)鏈清晰地指向一個(gè)判斷:Claude 的故障本質(zhì)上是一次 容量過載事故,誘因是 OpenAI 五角大樓合同引發(fā)的大規(guī)模用戶遷移。從 App Store 第 42 名到第 1 名,日注冊(cè)量翻四倍——沒有幾個(gè)前端系統(tǒng)能在 48 小時(shí)內(nèi)毫無準(zhǔn)備地接住這種沖擊。
導(dǎo)彈炸的是機(jī)房,掛的是中東客戶的 EC2 和 S3。用戶洪流沖的是登錄頁面,掛的是 claude.ai 的認(rèn)證系統(tǒng)。
兩件事,兩個(gè)原因,兩條因果鏈。恰好撞在了同一個(gè)周末。
對(duì) Anthropic 來說,這反而是一個(gè)微妙的好消息:你的競(jìng)爭(zhēng)對(duì)手(OpenAI)幫你做了你自己花多少錢都買不來的用戶增長(zhǎng)。代價(jià)只是一次前端宕機(jī)和一個(gè)尷尬的周末。
這個(gè)故障,恐怕 Dario Amodei 做夢(mèng)都會(huì)笑醒。
聲明:本文碳基智力含量:約 20% References
[1] Anthropic confirms Claude is down in a worldwide outage - BleepingComputer:https://www.bleepingcomputer.com/news/artificial-intelligence/anthropic-confirms-claude-is-down-in-a-worldwide-outage/[2]Anthropic's Claude Chatbot Goes Down For Thousands of Users - Bloomberg:https://www.bloomberg.com/news/articles/2026-03-02/anthropic-s-claude-chatbot-goes-down-for-thousands-of-users[3]ChatGPT uninstalls surged by 295% after DoD deal - TechCrunch:https://techcrunch.com/2026/03/02/chatgpt-uninstalls-surged-by-295-after-dod-deal/?type=AI[4]Claude beats ChatGPT in U.S. app downloads - Axios:https://www.axios.com/2026/03/01/anthropic-claude-chatgpt-app-downloads-pentagon[5]Anthropic's Claude overtakes ChatGPT in App Store - Fortune:https://fortune.com/2026/03/02/anthropic-claude-dario-amodei-number-one-app-store-openai-chatgpt-sam-altman-department-war/[6]AWS says drones hit two of its datacenters in UAE - The Register:https://www.theregister.com/2026/03/02/amazon_outages_middle_east/[7]Claude Goes Down Globally as AWS Data Centers Burn - Awesome Agents:https://awesomeagents.ai/news/claude-outage-march-2026-aws-middle-east/[8]Claude Status Page:https://status.claude.com/[9]Why Is Claude Not Working? - Techloy:https://www.techloy.com/why-is-claude-not-working-everything-we-know-about-the-anthropic-outage/[10]AWS Global Infrastructure: https://aws.amazon.com/about-aws/global-infrastructure/regions_az/
專欄:云計(jì)算泥石流
云故障
云資源
下云記
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.