網易首頁 > 網易號 > 正文申請入駐

詞元：Token的中文名字定了！這5家中國大模型霸榜

2026-03-25 00:00:42　來源: 冒泡泡的魚兒

廣東舉報

分享至

一個多月前，全球開發者還在為一個神秘模型“Hunter Alpha”的真實身份猜得頭破血流。當小米揭曉答案的那一刻，人們才驚覺：中國大模型，已經悄悄坐上了全球調用量的頭把交椅。如今，這個衡量AI落地規模的“體溫計”有了中文名字——詞元。而2026年最新一周的數據，再次印證了一個事實：全球開發者正在“用腳投票”，涌向中國。

3月23日，全球最大AI模型API聚合平臺OpenRouter發布最新數據：上周（3月16日至3月22日），全球AI大模型總調用量為20.4萬億詞元，環比增長20.7%。

更炸裂的是——調用量排名前四的，全部來自中國。中國大模型周調用量飆升至7.359萬億詞元，較前一周暴漲56.9%；而美國陣營僅微漲7.3%。這是中國AI大模型周調用量連續第三周超越美國。

一、Token有了中文名：“詞元”

就在上周，隨著“詞元”這個官方譯名的確立，Token終于不再是技術圈的“黑話”。

“Token是大語言模型處理文本的基本單元，可理解為‘AI眼中的字塊’。”深圳理工大學算力微電子學院助理教授馬智恒解釋，中文通常每個字對應1至2個詞元，每次提問和AI的回答，都會消耗一定數量的詞元。

深圳計算科學研究院崖山LAB負責人歐偉杰打了個更形象的比方：“如果將‘算力’視為‘電力’，那么詞元就是消耗的‘電量’，是衡量AI活躍度與處理規模的核心指標。”

綜合開發研究院通證數字經濟研究中心執行主任馬朝良認為，詞元背后反映的是更大的趨勢——人類正在把世界“拆解”成可以被機器理解和處理的最小單位。

當這個詞有了中文名字，也意味著AI正在從“實驗室奇觀”變成“柴米油鹽”。

二、2026年調用量TOP5：中國大模型霸榜

根據OpenRouter最新數據，以下是2026年3月16日至3月22日期間，全球調用量排名前五的中國大模型：

排名

模型名稱

所屬公司

周調用量（萬億詞元）

MiMo-V2-Pro

小米

1.49

Step 3.5 Flash (free)

階躍星辰

1.48

MiniMax M2.5

MiniMax

1.30

DeepSeek-V3.2

深度求索

1.14

GLM-5 Turbo

智譜AI

未單獨披露

榜首：小米MiMo-V2-Pro

上周，小米MiMo-V2-Pro以1.49萬億詞元的周調用量登頂全球第一。這款模型此前曾以“Hunter Alpha”的代號匿名上線OpenRouter，連續多日霸榜，總使用量迅速突破1萬億詞元，連“龍蝦之父”Peter Steinberger都忍不住發帖追問身份。

榜眼：階躍星辰Step 3.5 Flash

以1.48萬億詞元的調用量緊隨其后，環比增長10%。其免費版本在開發者中極受歡迎，性價比優勢明顯。

探花：MiniMax M2.5

此前連續五周蟬聯榜首后，MiniMax M2.5本周跌至第三，但仍保持1.3萬億詞元的驚人調用量。MiniMax內部開發了名為Forge的原生Agent強化學習框架，實現了數十萬個真實Agent環境上的大規模強化學習。

第四：DeepSeek-V3.2

調用量達1.14萬億詞元，環比增長10%。DeepSeek一直以極致性價比著稱，被斯坦福大學報告列為“每美元可獲得模型智能”的領先者。

第五：智譜GLM-5 Turbo

雖然在最新周榜中未被單獨列出調用量，但GLM-5 Turbo仍是全球調用量前十的常客。

三、憑什么霸榜？兩大核武器

為什么中國大模型能集體霸榜？答案藏在兩個關鍵詞里：性價比和Agent場景。

第一，性價比碾壓：1/13的價格，吃掉增量市場

在Agent時代，詞元消耗從“按次”變成了“按流量”。一次編程任務可能經歷“寫代碼→運行→報錯→改→再跑”幾十個回合，消耗數十萬甚至數百萬詞元。

這種情況下，價格差距就是生死線。

對比一下當前主流模型的API定價（每百萬輸出詞元）：Claude 4.6 Sonnet 15美元，GPT-5.2 14美元，而MiniMax M2.5僅1.1美元，智譜GLM-5約2.55美元。一個生產級Agent每天處理10億輸出詞元，掛Claude一天要花1.5萬美元，掛MiniMax只要1100美元，一個月下來差出40多萬美元。

一家歐洲開發工作室的實戰方案：80%日常推理用Kimi K2.5，只有20%硬骨頭才調用Claude。一天成本5-10美元，月預算150-300美元；如果全量用Claude，月成本要800-1500美元。

“80%能力，20%價格”的組合，在實際部署中是碾壓級的吸引力。

第二，Agent場景爆發：OpenClaw燒掉的海量詞元

今年1月，開源個人智能體框架OpenClaw（江湖人稱“小龍蝦”）引爆全球。它讓AI從“對話”進化到“執行”——幫你寫周報、訂餐廳、查網頁，甚至能自動修復程序bug。

一次OpenClaw任務，可能觸發5-10次API調用，每次都背著完整歷史上下文。有用戶實測，一個活躍會話的上下文很快膨脹到23萬詞元以上。一個配置不當的自動化任務，一天就能燒掉200美元API費-3。

OpenRouter數據顯示，編程任務的詞元占比從2025年初的11%飆升至50%以上，Agent驅動的工作流產生的輸出詞元已超過平臺總輸出的一半。而這波紅利，中國開源模型吃得最飽。

四、數據背后的真相：從“跟跑”到“領跑”

過去一年，中國大模型在全球市場的Token消耗占比增長了421%。

2025年初，全球推理市場還是典型的“美系雙寡頭”結構：Anthropic一家就占了42.2%，Google占25.8%，合計近68%。一年后，格局被徹底顛覆——Google降至18.8%，Anthropic降至14.7%，中國大模型份額逼近三成。

更值得注意的是，OpenRouter平臺上美國開發者占比高達47.17%，中國開發者僅占6.01%。這意味著，中國模型是在全球最挑剔的技術開發者市場中“用腳投票”勝出的。

摩根大通預測，中國AI推理詞元消耗量將從2025年的約10千萬億增長至2030年的約3900千萬億，五年增長約370倍。

五、下一個戰場：從“拼參數”到“拼詞元”

過去兩年，大模型競爭的核心敘事是“誰更聰明”——參數規模、推理深度、復雜任務完成率。到了2026年，核心敘事已切換為“誰更能完成任務”——在長流程、高頻調用、長上下文環境下，誰的單位成本更低、穩定性更強、推理曲線更平滑。

a16z合伙人Martin Casado去年底披露：在使用開源模型的AI初創企業中，約80%跑的是中國模型。OpenRouter COO Chris Clark說得更直接：中國開放權重模型在美國企業運行的Agent工作流中“占比異常高”。

英偉達CEO黃仁勛在GTC2026上提出“詞元經濟學”，將數據中心定義為生產AI智能詞元的工廠，強調“算力即收入”。阿里則直接成立了Alibaba Token Hub事業群，圍繞“創造詞元、輸送詞元、應用詞元”構建完整生態。

當詞元成為AI時代的“電量”，誰能以更低的成本、更高的效率生產詞元，誰就能成為這場競賽的最終贏家。而2026年的這份榜單證明：中國選手，已經站上了牌桌。

詞元的官方譯名定了，“電量”有了計量單位。而中國大模型用7.359萬億詞元的周調用量，向世界證明了一件事：從拼參數到拼落地，從堆算力到拼效率，中國AI正在完成一場深刻的“成年禮”。

這份榜單里，有你用過的模型嗎？歡迎在評論區留言討論。

#上頭條聊熱點##token#

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.