![]()
01
數據洪流:
7萬億Token背后的歷史回響
![]()
3月16日至22日,全球最大AI模型API聚合平臺OpenRouter記錄下一組令人側目的數據:全球AI大模型總調用量20.4萬億Token,其中超過三分之一流向了中國模型。
連續三周,中國AI大模型的周調用量碾壓美國同行——7.359萬億對3.536萬億,漲幅56.9%對7.35%。排行榜前四席,中國模型包攬全部:小米MiMo V2 Pro、階躍星辰Step 3.5 Flash、MiniMax M2.5、DeepSeek-V3.2。
但比排名更值得關注的是這個被頻繁提及卻鮮被理解的詞——Token(詞元)。
1000年前,北宋工匠畢昇在膠泥上刻下一個個反體字,用火焙硬,制成可以反復排列的"活字",改寫了人類知識傳播的歷史。今天,工程師們將文本切割成名為"Token"的最小單元,用向量和矩陣重新定義智能生產的邏輯。
從泥活字到數字Token,從物理排版到神經網絡計算,一場關于"最小單元"的革命,似乎正在以驚人的相似性重演。
但相似不等于相同。本文將借用活字印刷的歷史意象,同時嚴格劃定類比的邊界——因為技術史的精確性,比敘事的流暢性更重要。
02
Token是什么?AI的“文字食材”
——以及它和活字的“表親”關系
"Token是大語言模型處理文本的基本單元,可理解為'AI眼中的字塊'。"
深圳理工大學算力微電子學院助理教授馬智恒這樣解釋。在輸入模型前,文本會被切分成Token并轉換為向量。中文通常每個字對應1至2個Token,英文則約0.75個Token per word。
![]()
想象你向AI提問:"人工智能會取代人類嗎?"
在人類眼中,這是一句話。在AI眼中,這是若干Token的序列——可能是"人工"+"智能"+"會"+"取代"+"人類"+"嗎",或者更細粒度的切分。每個Token都被編碼成一個高維向量,在神經網絡的層間通過矩陣運算和注意力機制進行處理,最終生成回答。
深圳計算科學研究院崖山LAB負責人歐偉杰打了個比方:如果將"算力"視為"電力",那么Token就是消耗的"電量",是衡量AI活躍度與處理規模的核心指標。
綜合開發研究院通證數字經濟研究中心執行主任馬朝良看得更遠:"Token背后反映的是一個更大的趨勢——人類正在把世界'拆解'成可以被機器理解和處理的最小單位。"
![]()
至此,"Token=數字活字"的類比似乎成立。但這里必須插入一個關鍵的澄清——
活字印刷的"最小單元"(泥活字)是生產工具,可物理復用;Token的"最小單元"是計算過程中的臨時數據,每次調用都在消耗算力資源。 換句話說,活字越用越省(邊際成本遞減),Token越用越費(邊際成本基本線性增長)。二者在成本邏輯上是反向的。
![]()
那么,真正的類比對象是什么?
不是Token本身,而是預訓練模型的權重參數——那些在海量數據中訓練得到的、可以被無數應用共享調用的"知識結晶"。這些參數才是更接近"數字活字"概念的對象:刻制一次(訓練),復用無限(推理)。(注:這是本文提出的類比,非學術界標準術語)
而Token,更像是印刷過程中的"紙張和油墨"——是消耗品,而非生產工具。
但為何Token的調用量如此重要?因為它衡量的是"數字活字"被激活的頻率——是技術民主化的溫度計,而非技術本身。
03
歷史的回響:活字印刷的啟示與錯位
1040年代,北宋慶歷年間,布衣畢昇發明了膠泥活字印刷術。
![]()
這比古騰堡的鉛活字印刷機早了整整400年。沈括在《夢溪筆談》中詳細記錄了這項技術:用膠泥刻字,薄如錢唇,火燒令堅,然后密布字印,滿鐵范為一板。
但歷史開了一個殘酷的玩笑。
明清時期,活字印刷在中國未能完全取代雕版。原因復雜:漢字數量龐大,常用字就需數萬枚字模;泥活字易損,金屬活字成本高昂;科舉制度下的書籍需求結構,未能形成足夠的商業驅動力。直到19世紀西方鉛活字印刷機傳入,中國才真正進入活字印刷的大規模應用時代。
發明在先,規模化在后——這是中國古代技術史的常見敘事。
![]()
但今天,當Token成為智能生產的"消耗單元",中國似乎正在走出不同的軌跡。這里的關鍵差異在于:我們并非Token機制(Transformer架構、注意力機制均源于美國)的"原創發明者",但正在成為Token規模化流動的主導者。
這是一種不同的歷史角色——不是畢昇式的"技術首創者",也不是古騰堡式的"技術整合者",而是"技術采納者+規模化應用者"的新角色。
04
霸榜背后:中國Token經濟的三大支點
OpenRouter的數據揭示了一個清晰的格局:中國模型不僅調用量大,而且增長迅猛。這背后是三個相互強化的支點。
![]()
![]()
第一支點:
價格革命——讓"紙張油墨"便宜到可以揮霍
以DeepSeek、MiniMax M2.5為代表的國產模型,大幅降低了API使用成本。
"國產模型以較低的訓練成本將AI變為如同柴米油鹽一樣的生活必需品。"粵港灣控股有限公司執行董事羅介平如此評價。
這里需要再次厘清類比:如果說模型權重更接近"數字活字"(一次性投入,無限復用),那么推理成本就是"印刷耗材"(每次調用,持續消耗)。中國模型的真正突破,在于讓"耗材"便宜到可以大規模揮霍——這降低了技術應用的門檻,而非技術生產的門檻。
活字印刷的核心價值,是讓知識復制的邊際成本斷崖式下跌;今天中國AI的核心價值,是讓智能服務的邊際成本趨近于零。效果相似,機制不同。
![]()
第二支點:
開源生態——讓"字模"可以被自由復制
中國公司在開源模型領域占據主導地位,與全球頂尖閉源模型的技術代差已縮短至約三個月。
開源意味著什么?意味著"數字活字"(模型權重)可以被全球開發者自由獲取、改進、再分發。畢昇的活字技術受限于時代,未能形成持續迭代的社區;今天的開源模型生態,正在以互聯網的速度自我強化。
![]()
第三支點:
場景紅利——讓"印刷機"遍布每個角落
這是最具中國特色的變量。
![]()
微信月活13億,釘釘7億,飛書2億。這些超級應用構成了AI觸達用戶的"自來水管網"。
"我國開發者貢獻了大量的Token消耗,"羅介平指出,"這些用戶只需輕輕一點即可調用AI能力,這無疑帶來了海量的模型調用需求。"
歐偉杰稱之為"長尾效應":隨著國內大模型在推理成本、響應速度、API成本等方面的持續優化,大量中小企業和開發者開始將AI接入業務流程,觸發了調用量的指數級增長。
十億級用戶入口 + 極低調用成本 + 開源技術生態,這三者的乘積效應,構成了中國Token經濟的基本盤。
但請注意:這里的競爭優勢不在于Token本身,而在于Token的流動效率——是基礎設施、成本控制、場景滲透的綜合結果。
05
冷思考:Token洪流中的真問題
繁榮的表象下,需要保持清醒。
首先是"量"與"質"的落差。
馬智恒提醒:"我們也必須清醒認識到,美國在原始模型創新、高端芯片與算力基礎設施等領域,仍保持著顯著優勢。"
調用量領先不等于技術領先。中國模型在應用層的Token消耗上占據優勢,但在基礎層的模型架構創新、硬件層的算力自主性上,短板依然存在。
其次是"消耗"與"沉淀"的錯位。
歐偉杰指出了更隱蔽的挑戰:"海量Token的背后,是更大規模的數據吞吐與更復雜的數據治理挑戰。大模型的每一次調用,都依賴底層數據庫系統對實時數據、歷史知識、用戶交互的精準管理與毫秒級響應。"
這里有一個反諷:Token調用量越大,意味著"數字活字"(模型權重)被使用得越頻繁,但同時也意味著系統脆弱性越高——數據治理、實時響應、安全合規的壓力呈指數級增長。
活字印刷不僅要有字塊,還要有精良的排版工藝、優質的紙張墨水、高效的發行網絡。Token經濟同樣需要完整的"排版生態"。
![]()
最后是"薄利"與"溢價"的困境。
中國模型以價格優勢收獲全球開發者青睞,但這是否意味著我們只能做"薄利多銷"的生意?如何在Token調用量的基礎上,構建更高附加值的服務和品牌?
這是從"制造大國"到"品牌強國"的老命題,在AI時代的新投射。
06
未來誰將成為"智能排版大師"?
![]()
3月,阿里巴巴正式成立Alibaba Token Hub事業群,旨在圍繞"創造Token、輸送Token、應用Token"構建完整的AI生態體系。
幾乎同時,英偉達CEO黃仁勛在GTC 2026上提出"Token經濟學",將數據中心定義為生產AI智能Token的工廠,強調"算力即收入"。
兩種視角,兩種邏輯。
美國視角:數據中心是Token工廠,算力即收入,核心是生產能力的壟斷。
中國實踐:Token Hub是生態樞紐,創造-輸送-應用全鏈條打通,核心是網絡效應的捕獲。
哪種路徑更具可持續性?歷史或許能提供參照。
古騰堡的真正突破,不在于發明了活字(金屬活字早已存在),而在于整合了活字鑄造、印刷機、油墨配方、紙張供應、商業出版的全鏈條。技術的發明重要,但技術的"排版"——即如何將其嵌入社會經濟系統的復雜網絡——可能更重要。
今天,中國擁有最豐富的應用場景、最龐大的用戶基數、最活躍的開發生態。這些條件使得中國有機會成為AI時代的"排版大師"——不僅生產Token,更定義Token流動的方式、規則和價值分配機制。
尾聲:
劃定邊界后的回望
回到1000年前的開封府,畢昇在膠泥上刻下最后一個反體字,火光照亮了他布滿老繭的雙手。
![]()
他不知道,這項技術將在400年后才在異國他鄉真正綻放。他更不知道,1000年后,另一群工程師正在服務器機房中,以每秒萬億次的速度切割、編碼、重組著名為"Token"的數字單元。
從泥活字到數字Token,從物理排版到神經網絡,人類對技術民主化的追求從未停止。但本文必須以一個嚴格的限定作結:
Token不是數字活字。模型權重才是。Token只是這些"數字活字"被激活時產生的漣漪。
中國AI的7萬億Token周調用量,衡量的不是技術原創性,而是技術擴散的速度和廣度。這不是畢昇式的"發明者敘事",也不是古騰堡式的"整合者敘事",而是一種新的"規模化敘事"——同樣偉大,但性質不同。
這一次,歷史沒有完全重演。中國正在書寫新的劇本。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.