![]()
智東西
編譯 佳揚
編輯 云鵬
智東西4月13日消息,據(jù)華爾街日報報道,隨著全球AI熱潮持續(xù)升溫,算力供給正日益趨緊。
行業(yè)頭部的Anthropic,不僅陷入系統(tǒng)頻繁宕機、服務(wù)穩(wěn)定性大幅下滑的困境,還出現(xiàn)用戶投訴、部分企業(yè)客戶流失的問題。截至4月8日,Anthropic公司的Claude API在過去90天內(nèi)的正常運行時間為98.95%,低于軟件公司通常向客戶承諾的99.99%。
![]()
▲Claude API服務(wù)中斷時間(來源:華爾街日報)
華爾街日報3月29日的報道曾指出,OpenAI因算力緊張被迫收縮業(yè)務(wù)戰(zhàn)線,放棄此前備受市場關(guān)注的Sora視頻生成應(yīng)用,將有限算力集中投入至代號“Spud”的新AI模型研發(fā)中,優(yōu)先保障核心業(yè)務(wù)的穩(wěn)步推進。
與此同時,高端GPU租賃價格迎來驚人漲幅,租用英偉達最先進的Blackwell系列芯片,每小時費用已達4.08美元,較兩個月前的2.75美元上漲48%,短短兩個月內(nèi)漲幅接近五成。
一、AI巨頭紛紛約束算力
算力短缺已成為頭部AI企業(yè)發(fā)展的核心阻礙,多家巨頭不得不通過收縮業(yè)務(wù)、限制用戶資源等方式應(yīng)對危機。Anthropic首席財務(wù)官莎拉·弗萊爾在近期投資者訪談中直言,“我確實花了很多時間尋找任何可用的臨時計算資源。目前,由于計算資源不足,我們不得不做出一些非常艱難的取舍,放棄一些我們正在推進的項目。”
算力需求的爆發(fā)式增長是這場危機的直接推手。數(shù)據(jù)顯示,OpenAI API的token使用量從去年10月的每分鐘60億次,飆升至今年3月下旬的150億次,短短五個月內(nèi)增幅達150%。為應(yīng)對算力缺口,OpenAI已放棄此前備受市場關(guān)注的Sora視頻生成應(yīng)用,將有限的算力集中投入到代號為“Spud”的新AI模型及企業(yè)級產(chǎn)品開發(fā)中,優(yōu)先保障核心業(yè)務(wù)推進。
作為OpenAI的主要競爭對手,Anthropic也面臨著相似問題。Anthropic的營收預(yù)期一路飆升,從最初預(yù)計2025年底實現(xiàn)90億美元年化收入,到今年2月攀升至140億美元,兩個月后更是翻倍至300億美元。
但3月下旬,Anthropic被迫出臺限制措施,宣布在太平洋時間工作日早5點至11點的高峰時段,限制用戶可使用的token數(shù)量。這一舉措引發(fā)用戶廣泛不滿,多位用戶在X論壇上抱怨資源消耗過快,有用戶表示,此前數(shù)周都未用完的token上限,如今僅45分鐘就已耗盡。對此,Claude Code創(chuàng)始人兼負責人Boris Cherny在X上回應(yīng)稱,公司正全力應(yīng)對Claude持續(xù)增長的需求,產(chǎn)能作為核心資源需謹慎管理,未來將優(yōu)先保障核心用戶與API使用者的體驗。
二、越來越貴的算力
紐約數(shù)據(jù)提供商Ornn的數(shù)據(jù)顯示,近幾個月來,英偉達全系列GPU產(chǎn)品的現(xiàn)貨市場價格大幅上漲,尤其是數(shù)據(jù)中心云端訪問的GPU價格,漲幅尤為明顯。
算力需求的激增,直接推動行業(yè)定價機制調(diào)整與長期合同綁定。去年年底,全球最大上市AI云公司之一的CoreWeave將GPU租賃價格上調(diào)20%以上,同時將小型客戶的服務(wù)合同期限從1年延長至至少3年。上月底,美國銀行分析師恢復對CoreWeave的“買入”評級,并預(yù)測至少到2029年,該公司的算力服務(wù)需求仍將持續(xù)超過供給,算力緊張局面難以緩解。
具體來看,高端GPU的租賃價格漲幅驚人。根據(jù)Ornn計算的價格指數(shù),租用英偉達最先進的Blackwell系列芯片一小時的費用已達4.08美元,較兩個月前的2.75美元上漲48%,短短兩個月內(nèi)接近2倍漲幅,凸顯算力資源的稀缺性。
“我經(jīng)營這家公司五年多來,從未見過如此嚴重的容量短缺。”云基礎(chǔ)設(shè)施公司Vultr首席執(zhí)行官JJ Kardwell直言,算力短缺的核心癥結(jié)并非企業(yè)不愿部署更多設(shè)備,而是交付周期過長。數(shù)據(jù)中心建設(shè)耗時久,且截至2026年的可用電力已被全部預(yù)訂一空,短期內(nèi)無法通過新增設(shè)備緩解缺口。
三、算力短缺導致AI服務(wù)質(zhì)量低,客戶流失
算力短缺不僅推高成本,更直接影響AI服務(wù)的穩(wěn)定性,甚至導致企業(yè)客戶流失。自2月中旬以來,Anthropic的系統(tǒng)故障愈發(fā)頻繁,部分企業(yè)客戶已開始轉(zhuǎn)向其他AI模型提供商。軟件開發(fā)平臺Retool創(chuàng)始人兼首席執(zhí)行官David Hsu表示,他此前一直傾向于使用Anthropic的Opus 4.6模型驅(qū)動公司AI代理工具,認為其最適配企業(yè)級應(yīng)用,但近期因Anthropic服務(wù)器頻繁不穩(wěn)定,已轉(zhuǎn)而采用OpenAI的模型。
互聯(lián)網(wǎng)核心服務(wù)的可靠性通常以“9”為衡量標準,四個“9”(99.99%的正常運行時間)是軟件公司向客戶承諾的常規(guī)標準,但截至4月8日,Anthropic的Claude API在過去90天內(nèi)的正常運行時間僅為98.95%。
“這不正常。”人工智能推理初創(chuàng)公司Baseten聯(lián)合創(chuàng)始人兼首席技術(shù)官Amir Haghighat評價道,AWS、數(shù)據(jù)庫、RDS或Stripe等核心服務(wù),均需保障極高的彈性和正常運行時間,而當前AI行業(yè)的服務(wù)質(zhì)量與之相差甚遠,“沒有企業(yè)愿意為應(yīng)用程序的智能服務(wù),選擇穩(wěn)定性如此之差的提供商”。
結(jié)語:AI的算力競爭
當技術(shù)突破的速度超越基礎(chǔ)設(shè)施建設(shè)的步伐,最終考驗的不僅是企業(yè)的技術(shù)實力,更是整個產(chǎn)業(yè)鏈在算力供需失衡下的應(yīng)變能力。
對于押注AI的科技巨頭而言,如何在項目取舍、成本控制與服務(wù)質(zhì)量之間找到平衡,是下一步的關(guān)鍵問題。
來源:華爾街日報
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.