![]()
一個多月前,全球開發者還在為一個神秘模型“Hunter Alpha”的真實身份猜得頭破血流。當小米揭曉答案的那一刻,人們才驚覺:中國大模型,已經悄悄坐上了全球調用量的頭把交椅。如今,這個衡量AI落地規模的“體溫計”有了中文名字——詞元。而2026年最新一周的數據,再次印證了一個事實:全球開發者正在“用腳投票”,涌向中國。
3月23日,全球最大AI模型API聚合平臺OpenRouter發布最新數據:上周(3月16日至3月22日),全球AI大模型總調用量為20.4萬億詞元,環比增長20.7%。
更炸裂的是——調用量排名前四的,全部來自中國。中國大模型周調用量飆升至7.359萬億詞元,較前一周暴漲56.9%;而美國陣營僅微漲7.3%。這是中國AI大模型周調用量連續第三周超越美國。
一、Token有了中文名:“詞元”
就在上周,隨著“詞元”這個官方譯名的確立,Token終于不再是技術圈的“黑話”。
“Token是大語言模型處理文本的基本單元,可理解為‘AI眼中的字塊’。”深圳理工大學算力微電子學院助理教授馬智恒解釋,中文通常每個字對應1至2個詞元,每次提問和AI的回答,都會消耗一定數量的詞元。
深圳計算科學研究院崖山LAB負責人歐偉杰打了個更形象的比方:“如果將‘算力’視為‘電力’,那么詞元就是消耗的‘電量’,是衡量AI活躍度與處理規模的核心指標。”
綜合開發研究院通證數字經濟研究中心執行主任馬朝良認為,詞元背后反映的是更大的趨勢——人類正在把世界“拆解”成可以被機器理解和處理的最小單位。
當這個詞有了中文名字,也意味著AI正在從“實驗室奇觀”變成“柴米油鹽”。
二、2026年調用量TOP5:中國大模型霸榜
根據OpenRouter最新數據,以下是2026年3月16日至3月22日期間,全球調用量排名前五的中國大模型:
排名
模型名稱
所屬公司
周調用量(萬億詞元)
1
MiMo-V2-Pro
小米
1.49
2
Step 3.5 Flash (free)
階躍星辰
1.48
3
MiniMax M2.5
MiniMax
1.30
4
DeepSeek-V3.2
深度求索
1.14
5
GLM-5 Turbo
智譜AI
未單獨披露
![]()
榜首:小米MiMo-V2-Pro
上周,小米MiMo-V2-Pro以1.49萬億詞元的周調用量登頂全球第一。這款模型此前曾以“Hunter Alpha”的代號匿名上線OpenRouter,連續多日霸榜,總使用量迅速突破1萬億詞元,連“龍蝦之父”Peter Steinberger都忍不住發帖追問身份。
![]()
榜眼:階躍星辰Step 3.5 Flash
以1.48萬億詞元的調用量緊隨其后,環比增長10%。其免費版本在開發者中極受歡迎,性價比優勢明顯。
![]()
探花:MiniMax M2.5
此前連續五周蟬聯榜首后,MiniMax M2.5本周跌至第三,但仍保持1.3萬億詞元的驚人調用量。MiniMax內部開發了名為Forge的原生Agent強化學習框架,實現了數十萬個真實Agent環境上的大規模強化學習。
![]()
第四:DeepSeek-V3.2
調用量達1.14萬億詞元,環比增長10%。DeepSeek一直以極致性價比著稱,被斯坦福大學報告列為“每美元可獲得模型智能”的領先者。
![]()
第五:智譜GLM-5 Turbo
雖然在最新周榜中未被單獨列出調用量,但GLM-5 Turbo仍是全球調用量前十的常客。
三、憑什么霸榜?兩大核武器
為什么中國大模型能集體霸榜?答案藏在兩個關鍵詞里:性價比和Agent場景。
第一,性價比碾壓:1/13的價格,吃掉增量市場
在Agent時代,詞元消耗從“按次”變成了“按流量”。一次編程任務可能經歷“寫代碼→運行→報錯→改→再跑”幾十個回合,消耗數十萬甚至數百萬詞元。
這種情況下,價格差距就是生死線。
對比一下當前主流模型的API定價(每百萬輸出詞元):Claude 4.6 Sonnet 15美元,GPT-5.2 14美元,而MiniMax M2.5僅1.1美元,智譜GLM-5約2.55美元。一個生產級Agent每天處理10億輸出詞元,掛Claude一天要花1.5萬美元,掛MiniMax只要1100美元,一個月下來差出40多萬美元。
一家歐洲開發工作室的實戰方案:80%日常推理用Kimi K2.5,只有20%硬骨頭才調用Claude。一天成本5-10美元,月預算150-300美元;如果全量用Claude,月成本要800-1500美元。
“80%能力,20%價格”的組合,在實際部署中是碾壓級的吸引力。
第二,Agent場景爆發:OpenClaw燒掉的海量詞元
今年1月,開源個人智能體框架OpenClaw(江湖人稱“小龍蝦”)引爆全球。它讓AI從“對話”進化到“執行”——幫你寫周報、訂餐廳、查網頁,甚至能自動修復程序bug。
一次OpenClaw任務,可能觸發5-10次API調用,每次都背著完整歷史上下文。有用戶實測,一個活躍會話的上下文很快膨脹到23萬詞元以上。一個配置不當的自動化任務,一天就能燒掉200美元API費-3。
OpenRouter數據顯示,編程任務的詞元占比從2025年初的11%飆升至50%以上,Agent驅動的工作流產生的輸出詞元已超過平臺總輸出的一半。而這波紅利,中國開源模型吃得最飽。
四、數據背后的真相:從“跟跑”到“領跑”
過去一年,中國大模型在全球市場的Token消耗占比增長了421%。
2025年初,全球推理市場還是典型的“美系雙寡頭”結構:Anthropic一家就占了42.2%,Google占25.8%,合計近68%。一年后,格局被徹底顛覆——Google降至18.8%,Anthropic降至14.7%,中國大模型份額逼近三成。
更值得注意的是,OpenRouter平臺上美國開發者占比高達47.17%,中國開發者僅占6.01%。這意味著,中國模型是在全球最挑剔的技術開發者市場中“用腳投票”勝出的。
摩根大通預測,中國AI推理詞元消耗量將從2025年的約10千萬億增長至2030年的約3900千萬億,五年增長約370倍。
五、下一個戰場:從“拼參數”到“拼詞元”
過去兩年,大模型競爭的核心敘事是“誰更聰明”——參數規模、推理深度、復雜任務完成率。到了2026年,核心敘事已切換為“誰更能完成任務”——在長流程、高頻調用、長上下文環境下,誰的單位成本更低、穩定性更強、推理曲線更平滑。
a16z合伙人Martin Casado去年底披露:在使用開源模型的AI初創企業中,約80%跑的是中國模型。OpenRouter COO Chris Clark說得更直接:中國開放權重模型在美國企業運行的Agent工作流中“占比異常高”。
英偉達CEO黃仁勛在GTC2026上提出“詞元經濟學”,將數據中心定義為生產AI智能詞元的工廠,強調“算力即收入”。阿里則直接成立了Alibaba Token Hub事業群,圍繞“創造詞元、輸送詞元、應用詞元”構建完整生態。
當詞元成為AI時代的“電量”,誰能以更低的成本、更高的效率生產詞元,誰就能成為這場競賽的最終贏家。而2026年的這份榜單證明:中國選手,已經站上了牌桌。
詞元的官方譯名定了,“電量”有了計量單位。而中國大模型用7.359萬億詞元的周調用量,向世界證明了一件事:從拼參數到拼落地,從堆算力到拼效率,中國AI正在完成一場深刻的“成年禮”。
這份榜單里,有你用過的模型嗎?歡迎在評論區留言討論。
#上頭條 聊熱點##token#
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.