中國(guó)AI算力,真的不夠用了。
從每天1000億到180萬(wàn)億,中國(guó)大模型的Token消耗量在兩年內(nèi)暴漲1800倍。
這不是預(yù)測(cè),是正在發(fā)生的事。
![]()
數(shù)字不會(huì)說(shuō)謊:
Token黑洞正在吞噬一切
OpenRouter平臺(tái)的數(shù)據(jù)顯示,2026年2月全球前十AI模型的Token總消耗量突破27萬(wàn)億,其中中國(guó)大模型貢獻(xiàn)了14萬(wàn)億,占比超過(guò)50%。
更夸張的是增長(zhǎng)速度:
MiniMax M2.5,2月Token消耗5萬(wàn)億+,環(huán)比增幅197%。
Kimi K2.5,2月Token消耗4萬(wàn)億+ 持續(xù)高增。
GLM-5,2月Token消耗2萬(wàn)億+ 環(huán)比增幅158%。
MiniMax披露的數(shù)據(jù)更驚人:2026年2月,M2系列模型單日Token消耗量已達(dá)到2025年12月的6倍以上,其中編程場(chǎng)景的Token消耗增長(zhǎng)超過(guò)10倍。
中國(guó)日均Token消耗從2024年初的1000億,飆升至2026年2月的180萬(wàn)億。
1800倍的增長(zhǎng),意味著什么?
意味著每一秒都有海量推理請(qǐng)求在涌向數(shù)據(jù)中心,意味著GPU芯片正在以極限狀態(tài)運(yùn)轉(zhuǎn),意味著算力供給的缺口正在以肉眼可見(jiàn)的速度擴(kuò)大。
![]()
視頻生成
成了算力短缺的"照妖鏡"
如果你用過(guò)快手的可靈AI或字節(jié)的即夢(mèng)AI,你會(huì)發(fā)現(xiàn)一個(gè)奇怪的現(xiàn)象:功能很強(qiáng)大,但處處受限。
? 免費(fèi)用戶每天只有6次生成機(jī)會(huì)
? 高峰期排隊(duì)等待時(shí)間長(zhǎng)達(dá)幾十分鐘
? 高畫(huà)質(zhì)視頻必須付費(fèi),且價(jià)格不菲
為什么?因?yàn)橐曨l生成是名副其實(shí)的"算力黑洞"。
生成一條10秒的1080p視頻,消耗的算力相當(dāng)于處理數(shù)千張高清圖片。一位AI創(chuàng)作者算過(guò)賬:用OpenClaw跑一天視頻生成任務(wù),輕松燒掉5000萬(wàn)Token。
快手的可靈AI技術(shù)領(lǐng)先,但高峰期"排隊(duì)時(shí)間太長(zhǎng)"成了用戶吐槽最多的點(diǎn)。
字節(jié)的即夢(mèng)AI被迫在"畫(huà)質(zhì)"和"速度"之間做取舍——出圖快,但電影級(jí)質(zhì)感不足。
本質(zhì)上,這不是技術(shù)問(wèn)題,是算力不夠的問(wèn)題。
當(dāng)豆包在春晚期間因高頻互動(dòng)導(dǎo)致算力承壓,不得不暫停視頻通話功能時(shí);當(dāng)智譜AI因高并發(fā)請(qǐng)求被迫采取API限流措施時(shí),中國(guó)AI算力短缺的殘酷現(xiàn)實(shí),已經(jīng)藏不住了。
![]()
云廠商自己都不夠用
外賣(mài)怎么賣(mài)?
更嚴(yán)峻的問(wèn)題在云廠商端。
阿里云宣布三年投入3800億元建設(shè)AI基礎(chǔ)設(shè)施;字節(jié)跳動(dòng)2026年資本開(kāi)支傳聞高達(dá)1600億元;百度智能云在自研GPU云市場(chǎng)以40.4%份額占據(jù)第一。
這些天文數(shù)字背后,是一個(gè)尷尬的事實(shí):云廠商自己的算力都不夠用了。
高盛預(yù)測(cè),中國(guó)云服務(wù)提供商的資本支出在2026年Q3將同比增長(zhǎng)39%。為什么花這么多錢(qián)?因?yàn)榭蛻粜枨笸⒌焦┎粦?yīng)求。
? 阿里云AI服務(wù)已滲透中國(guó)500強(qiáng)企業(yè)的53%
? 字節(jié)、阿里、騰訊的AI應(yīng)用都在搶算力資源
? 自動(dòng)駕駛公司排隊(duì)等算力配額
? 金融、醫(yī)療、教育行業(yè)的AI部署需求爆發(fā)式增長(zhǎng)
Coreweave公開(kāi)表示:全球AI算力基礎(chǔ)設(shè)施產(chǎn)能僅能滿足約60%的需求。
當(dāng)云廠商自己的AI業(yè)務(wù)(豆包、通義千問(wèn)、混元)都在瘋狂吞噬算力時(shí),對(duì)外賣(mài)的算力還剩多少?
這就是為什么智譜AI在發(fā)布新模型的同時(shí),宣布API價(jià)格上調(diào)30%-100%——官方解釋很明確:"用戶規(guī)模與調(diào)用量快速提升,公司需同步加大算力投入。"
![]()
1800倍增長(zhǎng)背后
一場(chǎng)算力軍備競(jìng)賽
摩根大通預(yù)測(cè),中國(guó)AI推理Token消耗量將從2025年的超10千萬(wàn)億,增長(zhǎng)至2030年的約3900千萬(wàn)億——增幅接近369倍。
而這還只是保守估計(jì)。
隨著AI Agent的爆發(fā),Token消耗的模式正在發(fā)生根本變化:
? 傳統(tǒng)Chatbot一輪對(duì)話幾百Token
? AI Agent執(zhí)行一個(gè)任務(wù),可能消耗數(shù)百萬(wàn)甚至上千萬(wàn)Token
? 自主調(diào)用、多輪推理、工具鏈協(xié)作——每一步都在燒錢(qián)
MiniMax CEO閆俊杰說(shuō):
"這是一個(gè)長(zhǎng)期趨勢(shì)的開(kāi)端,而不是一次性的紅利。"
當(dāng)OpenClaw這類(lèi)Agent工具累計(jì)Token消耗達(dá)到8.99萬(wàn)億時(shí),當(dāng)中國(guó)大模型在全球Token消耗榜上霸榜前五時(shí),算力短缺已經(jīng)不是"會(huì)不會(huì)發(fā)生"的問(wèn)題,而是"正在發(fā)生且會(huì)越來(lái)越嚴(yán)重"的問(wèn)題。
![]()
結(jié)語(yǔ):算力即權(quán)力
中國(guó)AI產(chǎn)業(yè)正在經(jīng)歷一場(chǎng)殘酷的"算力洗牌"。
有算力的公司(字節(jié)、阿里、百度)可以繼續(xù)擴(kuò)張、迭代模型、搶占用戶;
沒(méi)算力的公司,要么被迫漲價(jià),要么限流,要么在競(jìng)爭(zhēng)中掉隊(duì)。
視頻生成受限、API價(jià)格上漲、服務(wù)頻繁限流——這些只是表象。
本質(zhì)是:當(dāng)需求增長(zhǎng)1800倍,而供給只能增長(zhǎng)幾十倍時(shí),算力就成了最硬的通貨。
誰(shuí)能搞定芯片、誰(shuí)能建數(shù)據(jù)中心、誰(shuí)能拿到電力資源,誰(shuí)就能在下一階段的AI競(jìng)賽中活下去。
這不是技術(shù)競(jìng)賽,這是資源戰(zhàn)爭(zhēng)。
你的AI應(yīng)用,今天排隊(duì)了嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.