![]()
今天,火山引擎公布了一個數(shù)據(jù),豆包大模型日均 Token 使用量突破 120 萬億。
三個月前,這個數(shù)字是 60 萬億。2024 年 5 月豆包大模型剛發(fā)布的時候,是現(xiàn)在的千分之一。
120 萬億 Token 是什么概念?
按 3 月國內(nèi)主流大模型約 2-4 元/百萬 Token 的輸入價格粗算,這意味著每天有 3 到 5 億元在 GPU 上燃燒。一年下來就是千億級支出,相當于燒掉網(wǎng)易一整年的營收(網(wǎng)易 2025 年全年凈收入 1126 億元)。而這只是一家公司、一個模型平臺、一天的量。
![]()
這個數(shù)字放在更大的盤子里看更有意思。
3 月 23 日,中國發(fā)展高層論壇 2026 年年會披露:今年 3 月,中國日均 Token 調用量突破 140 萬億,對比 2024 年初的 1000 億,兩年增長超千倍。同月,中國 AI 大模型周 Token 調用量連續(xù)三周超越美國。OpenRouter 數(shù)據(jù)顯示,3 月第三周全球 AI 大模型總調用量 20.4 萬億 Token,中國占了 7.359 萬億,全球份額 36%。
晚點 LatePost 此前報道過另一個細節(jié):全球日均 Token 消耗量超過 100 萬億的公司,只有三家。OpenAI,Google,字節(jié)跳動。
更值得琢磨的是,OpenAI 和 Google 的 Token 消耗來自全球市場,而字節(jié)跳動的主要來自中國。一個以國內(nèi)市場為主的平臺,Token 吞吐量已經(jīng)和兩個全球化巨頭平起平坐。海外部分還在爬坡。
火山引擎總裁譚待拆解了增長背后的兩個引擎:AI 視頻創(chuàng)作爆發(fā),AI 智能體加速普及。
這兩件事在過去三個月同時「人傳人」了。
![]()
▲ 火山引擎總裁 譚待
龍蝦來了,Token 的燒法變了
OpenClaw 爆火之后,所有人都在談 Agent。一只「龍蝦」讓整個行業(yè)意識到:Agent 時代的 Token 消耗邏輯跟聊天時代完全不同。
以前你跟大模型對話,一問一答,幾百個 Token 就夠。現(xiàn)在一個 Agent 要自己思考、規(guī)劃、調工具、檢查結果、出錯了還得自我糾正,一個復雜任務跑下來,Token 消耗是普通對話的幾十甚至上百倍。
火山引擎自己的 ArkClaw 就是個縮影。秒級配對飛書,微信、釘釘、微博也能接入,升級了網(wǎng)盤做端云協(xié)同。每一個「自動」的背后,都是 Token 在高速流轉。
譚待提了一個判斷:企業(yè)用好 Agent 的關鍵是三件事,模型、安全、技能(Skills)。
![]()
模型是 Agent 的大腦,今年 2 月發(fā)布的豆包大模型 2.0 在視覺理解上已經(jīng)躋身全球第一梯隊,國內(nèi)第一。安全是底線,火山引擎剛拿下信通院「智能助理智能體產(chǎn)品可信能力認證」和「安全防護產(chǎn)品有效性認證」雙認證,國內(nèi)唯一。
但光有聰明的腦子和安全的籠子還不夠,Agent 得有手有腳,能干活。Skills 生態(tài)的廣度直接決定了 Agent 能力的天花板。
這也是當天另一個重磅消息的背景:OpenClaw 創(chuàng)始人 Peter Steinberger 和火山引擎共同宣布,雙方共建的 ClawHub 中國鏡像站(mirror-cn.clawhub.com)正式啟動運營。
之前國內(nèi)開發(fā)者用 ClawHub 上的 Skills,經(jīng)常遇到訪問慢、不穩(wěn)定的問題。鏡像站解決的就是這個痛點:高頻訪問不再卡,Skills 更新能及時同步。Peter Steinberger 甚至在發(fā)布現(xiàn)場用「龍蝦」生成了一段視頻來宣布這個消息。
在火山引擎平臺上,累計 Token 使用量超過一萬億的企業(yè)客戶,已經(jīng)從去年底的 100 家增長到 140 家。三個月多了 40 家「萬億俱樂部」成員。
Seedance 2.0 開放公測:企業(yè)級視頻生成有了「安全底座」
同一天,火山引擎還宣布 Seedance 2.0 面向企業(yè)用戶正式開放 API 公測。
Seedance 2.0 是視頻生成領域的全球 SOTA 模型,但讓它對企業(yè)真正可用的,不只是生成質量。火山引擎為它建了一套覆蓋全流程的肖像與版權安全標準,從輸入素材的合規(guī)校驗,到生成過程中的肖像權保護,再到輸出內(nèi)容的版權風險攔截。Deepfake、侵權這些讓企業(yè)法務部夜不能寐的問題,在模型層就做了攔截。
這套安全機制覆蓋視頻生成涉及的各種模態(tài)和創(chuàng)作前后的全部環(huán)節(jié)。說白了,火山引擎選擇在模型最火的時候,先把安全門焊死,再把 API 鑰匙交給企業(yè)。
對企業(yè)來說,這解決的是一個很現(xiàn)實的問題:敢用。 品牌廣告、電商視頻、營銷物料,這些場景對版權和肖像的敏感度極高。沒有安全兜底,性能再強企業(yè)也不敢大規(guī)模接入。
譚待描述了企業(yè) Agent 建設的兩條路徑:敏態(tài)和穩(wěn)態(tài)。 敏態(tài) Agent 像 ArkClaw,是員工的「創(chuàng)新試驗場」,讓每個 HR 變成更好的 HR,讓每個分析師變成更好的分析師。穩(wěn)態(tài) Agent 則把驗證過的最佳實踐流程化、規(guī)模化,嵌進合同交易、生產(chǎn)管理這些容不得幻覺的場景。
兩條線不是二選一,是一個飛輪:個體創(chuàng)新在 ArkClaw 里激發(fā),沉淀到 HiAgent 變成組織能力,再通過 Skill 和 API 反哺給每個一線員工。
120 萬億背后, Token 工廠崛起
黃仁勛最近定了個調,到 2027 年,全球計算需求將突破 1 萬億美元。他說 Token 是新時代的基礎貨幣,數(shù)據(jù)中心不再是存儲文件的倉庫,而是生產(chǎn) Token 的工廠。
那接下來就必須追問一個問題:誰在為這些 Token 買單?
火山引擎平臺上 140 家企業(yè)的累計調用量破萬億,換個角度想,AI 的成本結構正在從「一次性買模型」變成「按呼吸計費」。而 Token 價格,正在暴漲。
過去一個月,漲價的消息像多米諾骨牌一樣接連倒下。
智譜一個月內(nèi)兩次調價,GLM-5-Turbo 漲 20%,GLM Coding Plan 中國區(qū)漲 30%、海外漲超 100%,一季度 API 整體定價較上一代提升 83%。智譜 CEO 張鵬在業(yè)績說明會上說了一句意味深長的話:漲了 83%,調用量還是增長了 400%,供不應求。
此外,3 月 18 日同一天,阿里云和百度智能云同時發(fā)布漲價公告,AI 算力產(chǎn)品上調 5%-30%,存儲漲 30%。騰訊云更早一步,3 月 13 日就調整了智能體開發(fā)平臺的計費策略,部分模型漲幅超過 4 倍。
![]()
再往前看,亞馬遜 AWS 1 月對機器學習容量塊漲價 15%,谷歌云也在同期悄悄調高了數(shù)據(jù)傳輸服務價格。
國內(nèi)三大云巨頭加上海外兩大巨頭,在同一個季度里集體漲價,不是偶然。 有人算過一筆賬:OpenClaw 用戶的單日人均 Token 消耗量是傳統(tǒng)聊天用戶的 20-50 倍。
當海量用戶同時把 Agent 跑起來,需求端的增速遠遠跑在了供給端前面——GPU 產(chǎn)能、電力、數(shù)據(jù)中心,都需要夯實基礎。黃仁勛說 Token 是基礎貨幣。但貨幣可以存,可以囤,可以等升值。Token 不行。Token 生產(chǎn)出來的那一刻就被消耗掉了,更像電力。
而電力這個詞,從來都不只是技術問題,誰控制了發(fā)電和輸電,誰就拿到了定價權。電網(wǎng)要受監(jiān)管,通信要發(fā)牌照。Token 呢?現(xiàn)在還沒有人回答這個問題,但每個廠商都想成為答案。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.