作者:高飛
大模型領域有兩個關于翻譯的段子。
一個是LLM。早期的模型經常把它翻譯成"法學碩士",所以AI博主們(比如我),經常調侃自己自帶研究生學歷。另一個是Token,圍繞它的翻譯版本更多,"令牌""代幣""標記",搞區塊鏈的、做網絡安全的、寫編譯器的各有各的叫法,而且聽起來都很合理。
這兩個問題現在都不存在了。把LLM叫法學碩士的模型越來越少了。Token也有了正式中文名:詞元。3月下旬,官方在中國發展高層論壇上給它蓋了章。
不過我猜大家還是會繼續叫Token。中文名本身不是重點,伴隨命名一起落地的那個定性才是:可計量、可定價、可交易。這是經濟學語言。當一個技術概念被官方賦予經濟計量屬性,它的身份就變了。同期公布的數字:中國日均Token調用量突破140萬億,兩年增長超千倍。
說到統計Token這件事,已經有公司在追蹤這個數字的變化了,而且追蹤了兩年,它就是火山引擎。4月2日武漢巡展上,火山引擎公布了豆包大模型最新的日均Token調用量:超過120萬億,三個月翻了一倍。兩年前這個數字是1200億,1000倍。
![]()
兩年一條曲線
1200億到120萬億,這條曲線的起點是2024年5月。火山引擎首次對外推出豆包大模型,同一時間做了一個決定:把MaaS,也就是按Token調用量計費的模型服務,放到戰略最高優先級,而且開始持續、公開地披露調用量數據。
當時沒有第二家云廠商這么干。別的廠商還在講GPU算力規模和IaaS營收,Token調用量這個指標連被正經看待的資格都沒拿到。2024年中國MaaS市場總規模7億出頭,整個公有云盤子3000億,MaaS連零頭都不算。
火山引擎總裁譚待的邏輯倒是簡單:模型只有被調用才能發揮價值,Token調用量是AI時代的DAU,比GPU數量更能反映產業的真實溫度。
后來的事大家都看到了。火山持續更新這條曲線:2024年5月日均1200億,2025年5月16.4萬億,12月50萬億,年底63萬億,到今天120萬億。創投圈專門跟蹤它,拿來當尺子量中國AI應用落地的進度。
![]()
當年只有火山一家在講Token調用量。今天呢?Kimi模型服務收入破億,智譜漲價83%,MiniMax模型服務營收占比升到三分之一。阿里3月成立了Alibaba Token Hub事業群,集團CEO直接帶隊。連官方也把Token計費定調為"正在加速演進的新型商業邏輯"了。圍繞Token,必然會出現一個更有看點的競技場。
IDC數據顯示,2025年上半年火山引擎在中國大模型公有云服務市場的調用量份額達到49.2%,第一名。
Agent的"蝦糧"和人類的"注意力"
位置拿到了,但120萬億日均Token到底怎么漲上來的?
我把Token的消耗按來源分成兩種形態:人類的注意力和Agent的蝦糧。人在用Token,Agent也在用Token。兩股力量幾乎同時起量,疊加出了這個數字。
人類消耗Token的驅動力是什么?我的判斷是多模態,不是聊天框。聊天框當然也在消耗Token,但真正把量級拉上來的,是語音和視頻對人類注意力的捕獲。
豆包是國內較早支持自然語音交流的AI應用。用戶跟它打交道的常見方式是說話,不打字。看起來只是體驗上的改善,但對Token消耗的影響是量級上的。語音交互要把每一秒的音頻切分成大量片段,音調、音量、音色分別向量化,再送進模型。一句話用文字可能十幾個Token就夠了,換成語音,同樣的意思消耗翻幾十倍。
語音帶來的不只是Token消耗的變化,還有一個沒預料到的東西:情感連接。豆包是全球唯一一個用真人臉做產品logo的AI應用,它的"小姐姐"形象和聲音已經變成了一種文化現象。用戶給它"捏崽"、做"豆包吃播"和"豆包換裝"短片,甚至有人做出了"豆包痛包"。痛包是二次元粉絲給喜歡的角色做的徽章掛件包,通常只給動漫角色和偶像做,給一個AI應用做痛包,說明它在用戶心里已經不是工具,而是一個有人格感的IP。這些二創內容本身又在消耗Token,AI的自我造血。
視頻更猛。這幾個月大家一定在短視頻平臺上刷到過"雪山救狐貍"的系列。俠客在雪山救了一只白狐,留下醬板鴨當食物,觀眾以為接下來是狐貍報恩的老套路,結果網友用Seedance 2.0接力改編,劇情拐向了"醬板鴨的復仇",文旅賬號、普法賬號紛紛入場,全網傳播量破50億。一個AI視頻生成模型催生了一場全民追更的武俠連續劇。火山引擎的Seedance 2.0是目前視頻生成領域全球排名第一的模型,剛在武漢巡展上宣布面向企業公測。生成一段一分鐘720P的視頻,Token消耗百萬以上。你跟AI打一句字才幾百Token,一分鐘視頻百萬Token,差三個數量級。
![]()
視頻Token的需求有多真實?講一個行業里流傳的段子。做AI漫劇和AI短劇的團隊,現在流行熬夜跑視頻。Seedance 2.0上線后,高峰時段排隊人數超過9萬,有的團隊把開工時間調到凌晨3點避開擁堵,個人創作者凌晨4點爬起來搶算力。一個視頻生成模型把創作者逼成了"賽博農民",按凌晨時段作息。Token的需求不是在PPT里畫出來的,是在產線上跑出來的。
這些消耗不是在燒錢玩。語音讓AI進入了不會打字或者懶得打字的人群,視頻生成讓創作者幾句話就能讓畫面動起來。火山在這個方向上的優勢清楚:豆包的語音交互、Seedream的圖像創作、Seedance的視頻生成,一條完整的多模態鏈,每一環都在拉Token的量。B端也一樣,企業客戶拿Seedream做營銷圖,拿Seedance做短視頻,拿豆包的視覺理解做巡檢和質檢。從火山官方披露的數據看,多模態已經是Token消耗的主力。
人類的注意力撐起了Token消耗的一面,另一面是Agent的"蝦糧"。增量更大。
去年12月上海Force原動力大會上,譚待講過一個判斷:Agent場景的Token調用必然是未來的趨勢。邏輯也簡單,AI正在從"能回答"走向"能規劃、能調用、能執行",每一次工具調用、每一輪推理循環都在消耗Token。兩三輪簡單調用幾千Token就夠了,但幾十上百輪的復雜任務,消耗到幾十萬。
這個判斷很快就有了驗證。龍蝦,也就是OpenClaw,春節前后在中國爆發。它引發的效應跟去年DeepSeek對大模型的普及有幾分相似。在它出現之前,絕大多數中國用戶對Agent沒有概念。企業里說"我們搞了Agent",打開一看就是一套提示詞。龍蝦讓所有人第一次直觀地看到Agent可以推理、循環、自主執行任務。這不是Demo,是能裝在電腦上實際干活的東西。
龍蝦還帶來了一個附帶效果:大量個人用戶第一次體驗了買模型API的過程。以前個人不會去買模型服務,現在各家Coding Plan都上了,199、499、1991,各種價位。Token第一次從開發者的術語變成了普通人花錢時看到的東西。火山的數據顯示,春節后Coding Plan相關調用漲了15倍以上。
我把這種因龍蝦和各類Agent產生的Token消耗增量叫做"蝦糧生意"。在龍蝦之前這個生意不存在。龍蝦充當了Token消費的中間層:人給Agent下任務,Agent調模型消耗Token。Agent越能干,Token消耗越大。
武漢巡展上,火山引擎和OpenClaw創始人Peter Steinberger共同宣布ClawHub中國鏡像站正式運營。Peter還用火山的ArkClaw龍蝦給自己生成了一段視頻,最后對著鏡頭說了句"請大家在武漢多吃龍蝦"。在中國,龍蝦和小龍蝦已經是同義詞了。
![]()
龍蝦只是Agent浪潮的一個切面。火山同時在推企業級Agent落地:ArkClaw做敏態場景的個人生產力工具,HiAgent做穩態場景的組織級Agent管理。譚待在武漢提了"養蝦三要素":模型、Skill、安全。火山剛通過信通院Agent類產品的兩項權威安全認證,國內唯一同時拿到兩項的廠商。
人類的注意力加Agent的蝦糧,兩股力量在不同時間點先后引爆、最終匯流。120萬億就是這么來的
比電復雜
Token有了中文名,官方給了它經濟計量單位的定位。這讓我想到一段更老的歷史。
1888年,西屋電氣有個叫Shallenberger的工程師在擺弄一盞弧光燈,一根彈簧掉在燈內擱板上。他注意到彈簧在轉。三周后,他根據旋轉磁場原理做出了第一個實用的交流電瓦時表。在那之前,愛迪生給客戶算電費的方式是數燈頭,你家幾個燈泡就收你多少錢。瓦時表讓電力第一次有了按量計費的商業模式。五年后的1893年芝加哥世博會,國際電氣大會把千瓦時確立為電能的商業計量標準。從"數燈頭"到"計千瓦時",電力產業的商業邏輯被重寫。定價、交易、輸配、監管,全圍繞這個計量單位長出來了。
Token正在經歷類似的時刻。兩年前還是NLP工程師的內部術語,今天官方已經在國新辦發布會上用"詞元"統計產業數據了。"日均詞元調用量140萬億"這種表述,聽起來已經和"日產粗鋼300萬噸"是同一種句式。
但Token比電復雜得多。
一度電就是一度電。照明、煉鋼、開電動車,物理屬性不變,計量方式不變,價格只跟時段和區域有關。電是一維的:數量乘以單價,就是賬單。
Token不一樣,武漢巡展上的幾個細節就能說明問題。
Seedance 2.0這次面向企業公測,火山引擎專門為它建了一套肖像與版權安全標準,覆蓋視頻生成涉及的各種模態和創作前后的全部流程,防侵權、防Deepfake。譚待在武漢的采訪中提到,Seedance 2.0的API之所以到現在才對外開放,就是為了等這套版權保護系統搭好。你買一度電不需要關心這度電會不會侵犯誰的肖像權,但你消耗一百萬Token生成一段視頻,這個問題就跑不掉。
同樣是消耗Token的Agent,管理方式也完全不同。譚待在武漢把企業Agent分成兩類:敏態Agent和穩態Agent。敏態Agent強調探索,讓員工拿ArkClaw這類工具去試新做法,是"創新試驗場";穩態Agent強調流程化,在合同交易、生產線這類場景中把AI的最佳實踐固定下來,用HiAgent做規模化管理。同樣都在消耗Token,但一個追求靈活,一個追求確定,對模型能力、安全標準、運營方式的要求截然不同。
安全問題就更具體了。隨著龍蝦的使用量上升,沙箱權限失控、提示詞注入、Skills插件投毒,這些威脅不斷冒出來。之前Meta的AI安全總監把OpenClaw接了自己的工作郵箱,結果郵件被瘋狂刪除。一度電不會自己去刪你的郵件,但一個Agent可能會。
電是一維的,數量乘以單價就是賬單。Token是多維的:性能、模態、安全、工程復雜度,每一個維度都在影響這個計量單位的實際價值。譚待在采訪中還講了一個角度:不能拋開模型能力談Token價格。seed 2.0 Lite比上一代的1.8 Pro能力更強,但定價更低,單個Token的"智力水平"在提升。同樣花一塊錢買Token,買到的東西和半年前已經不一樣了。這種復雜性是機遇。譚待說過:如果把AI發展看作一場馬拉松,現在才跑了500米,Token經濟也是。
其實,連大模型領域的翻譯工作都還沒結束。OpenClaw很快就有了中文名"龍蝦",但OpenClaw所屬的AI領域Agentic AI到現在還沒有一個讓人滿意的中文譯名。叫"代理式AI",總覺得奇奇怪怪的;叫"智能體AI",又丟了原文里agentic那個自主行動、主動出擊的勁兒。
不過,有時候,沒有名字,也是一件好事。名字只是一個符號,就像左手指月,左手不是月。這代表我們可以更自由的想象它,也代表這個行業跑的太快,有Token量表的指針為證。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.