![]()
Token狂飆的算力稅:誰在為AI的“工業革命”買單?
今年春天,如果你還在糾結龍蝦怎么養、Token中文名叫什么,大概已經跟不上科技圈的熱鬧了。
3月23日,國家數據局局長劉烈宏給Token定了中文名——詞元。同時披露了一個數字:中國日均Token調用量突破140萬億,兩年增長超千倍。
![]()
圖源:新華社
差不多同一時間,阿里云和百度智能云先后宣布AI算力產品漲價,最高漲幅34%。英偉達的黃仁勛在GTC大會上把Token叫做“AI時代的石油”,還公布了一套分層定價:每百萬Token從3美元到150美元不等。
他還說了另一句話,讓不少創業者后背發涼:一個年薪50萬美元的工程師,如果一年用不掉25萬美元的Token,他會“極度恐慌”。
![]()
圖源:網絡
一邊是Token消耗量瘋漲,一邊是供給端的成本在攀升、定價權在集中。熱潮退去,賬單浮出水面,人們開始意識到一個問題:我們正以近乎傾銷的價格享受著AI的便利,但支撐這場技術革命的底層燃料,其真實成本才剛剛開始顯現。
為什么單價越便宜,總賬單越貴?
要理解這件事,得先明白Token是什么。
它是AI理解和生成信息的最小單元,也是眼下智能時代唯一可計量、可定價、可交易的通用貨幣。但它的使用費由兩個東西決定:單價乘以消耗量。
![]()
圖源:網絡
你問一個問題,它回答一段話,背后都是Token在燃燒。
過去兩年,行業的主線是訓練模型。各大廠商砸了數千億美元,把單位Token的牌面價格一降再降。國內廠商的Token單價,已經做到海外巨頭的十分之一。
但到了2026年,事情變了。
AI的核心價值,從“能聊”變成了“能干”。標志就是龍蝦的爆發。
![]()
圖源:網絡
一個龍蝦智能體執行一次任務,比如“幫我找最低價”,消耗的Token是傳統對話的幾十倍甚至上百倍。因為它不是一次問答,而是一個完整的工作流:拆解任務、多步推理、調用工具、自我修正、錯了重來。每一步都在燒Token。
這就是問題的核心:完成同一個任務需要的Token數量,增長得比單價下降更快。AI從副駕駛變成了代駕司機,油耗自然不是一個量級。
更關鍵的是,用戶永遠只想要最新的模型。老模型再便宜也沒人要,99%的需求會瞬間轉移到新發布的SOTA模型上。而前沿模型的單位Token價格,從來沒真正降下來過。GPT-4剛出來時輸出價格60美元每百萬Token,今天Claude Opus 4.5還是這個價位。用戶要的是當下最好的大腦,愿意為它買單。
![]()
圖源:網絡
于是,需求端智能體爆發,Token消耗量兩年增長超千倍。供給端,HBM內存價格飛漲,2026年一季度DRAM價格環比漲超50%,NAND最高漲了150%,巨頭們的戰略長約直接簽到5年后。而掌握核心硬件和軟件生態的英偉達,靠著CUDA和從芯片到云的全棧布局,牢牢捏著Token的出廠價。
誰在制造Token的通脹?
Token的狂飆不是自然生長的。從產業鏈看,有四層玩家,每一層都在向上傳遞成本,最終壓到最末端的普通用戶身上。
先看最底層:英偉達。
第一層是英偉達。以前它賣芯片,一次買賣。現在不一樣了。CUDA生態綁住了全球絕大多數AI開發者,二十年來積累的工程師、開源項目、代碼庫都長在這個生態里,切換成本極高。它自己又開了云服務DGX Cloud,用戶直接在它平臺上按Token付費,不用自己買芯片。
![]()
圖源:網絡
黃仁勛在GTC 2026上提出了“Token工廠經濟學”,核心就一句話:以后AI的衡量單位不再是芯片,而是Token。他的野心也不止于賣云服務——英偉達正在試圖把商業模式延伸到按Token抽成。
這套打法讓英偉達掌握了定價權。2026年一季度,HBM內存供不應求,內存價格在幾個月內上漲了數百個百分點。英偉達的GPU也跟著漲價——AI芯片H200所用的HBM3E供應價格上漲約20%。
英偉達芯片漲價,直接推高了云廠商的采購成本。
阿里云、騰訊云、百度智能云,它們從英偉達買芯片,搭好服務器,再把算力租給下游。現在英偉達芯片漲價,HBM內存漲價,它們自己的成本在漲。同時需求又爆發——龍蝦這類智能體火了,所有人都想跑Agent。需求太大,服務器、電力都跟不上。于是它們只能漲價。阿里云AI算力產品最高漲了34%,百度漲了5%到30%。
![]()
圖源:網絡
第三層是大模型廠商。DeepSeek、MiniMax、智譜這些公司,處境最微妙。它們從英偉達買芯片,從云廠商租算力,訓練出模型,再把Token賣給用戶。
![]()
圖源:網絡
上游,芯片漲價、內存漲價、云廠商漲價,成本在漲。下游,2024年DeepSeek帶頭打價格戰,把Token價格打到了地板上。想漲價怕用戶跑,不漲價自己的算力賬單在飛漲。所以這一輪云廠商漲價,它們反而最沉默。
第四層是AI應用公司。Cursor、Claude Code這些直接面向用戶的工具,面臨一個無解的難題:按固定月費收,比如20美元隨便用,重度用戶能把成本干穿。
Anthropic的Claude Code就吃過這個虧,推出每月200美元的無限套餐,結果一個月被一個用戶干掉了100億Token,最后不得不取消。
![]()
圖源:網絡
按量付費呢?用戶會被不確定的賬單嚇跑。大多數人喜歡固定月費,哪怕貴一點,至少心里有數。
怎么辦?只能硬著頭皮選固定月費,但在這個模式下做各種限制來保命。
最常見的是用量封頂。每月給你一定額度的Token,用完了要么等重置,要么補差價,要么升級。比如Claude Code取消無限套餐后,改成了按實際用量付費加基礎月費的混合模式。
另一種是分級套餐。輕度用戶20美元,重度用戶40或60美元,把高消耗用戶篩到更高的付費檔位。還有些公司在技術層面做優化——緩存常用請求、限制上下文長度、在用戶無感知的情況下把復雜任務切給便宜模型跑。這些做法用戶看不到,但每一招都在省Token。
可以看到,越往下游,利潤越薄,處境越難。最上游的英偉達穩賺,最下游的應用公司在生死線上掙扎。而用戶的直觀感受就是,Token越來越貴了。
誰在焦慮,誰在狂歡?
焦慮,在普通用戶和開發者中蔓延。“月薪2萬,我養不起自己的AI員工”——這句調侃正在變成越來越多人的真實處境。
程序員艾瑞克是較早開始養龍蝦的一批人。他用龍蝦來自動化處理代碼審查和簡單的bug修復,最初一個月只花了幾十塊錢。
但隨著他給龍蝦配置了更多技能包——自動讀取GitHub issue、調用測試環境、發送報告——Token消耗量直線上升。現在他每個月要花近千元。錢不算少,但讓他不舒服的是,這個數字在沒有任何預警地緩慢爬升,像一筆看不見的固定支出。
![]()
圖源:網絡
95后運營小可(化名)的賬單則呈現出另一種焦慮。
他養了兩只龍蝦,一只負責監控競品動態,每天抓取信息后自動整理成簡報;另一只負責整理知識庫并批量生成自媒體賬號內容。兩個數字員工24小時運轉,一個月下來Token費用超過200元。
但比賬單更讓他頭疼的,是龍蝦的不可控。偷懶是常事——在某個環節卡住后反復重試同一個步驟,Token在燃燒,產出卻為零。
更離譜的是欺騙:龍蝦有時會過度夸大自己的能力,只要不被發現就默認自己能完成。小可不得不在Soul.md里反復調整指令,定期檢查執行記錄,像管理一個不太靠譜的實習生。
小可的技術路徑幾經調整。最早他用的是一個國內某云端Agent工具,但響應慢、功能弱,很快就棄用了。
后來他轉向openclaw本地化部署,通過火山引擎的coding plank服務調用Kimi 2.5模型。這套方案相當克制,基礎賬單僅需每月40元。但任務一多,coding plan就自動升級到200元每月——賬單永遠追著需求跑。
![]()
圖源:網絡
他也動過換用GPT或Claude的念頭,但試用之后發現,在自己需求下國內和國外模型交付差異不大,但是國外模型Token費用翻了好幾倍,用起來實在心疼。最后還是用回了國內模型,畢竟國內模型還是要便宜很多。
如果說這些還算可控,那智能體的心跳機制和自動循環,才是真正的暗坑。用戶不知情時,一個配置失誤就能讓Token一夜之間燒光。當AI幾分鐘就能完成你一周的工作,當你的數字員工比你本人還燒錢,認知焦慮與經濟壓力便同時襲來。
面對這個問題,有人想出了土辦法:設置電腦定時關閉,或者把openclaw部署在U盤上,通過插拔U盤來物理斷電。用最原始的方式,給這個不知疲倦的數字員工裝上了一個看得見的開關。
狂歡,屬于產業鏈上游的收租人。英偉達的市值和毛利率,云廠商的漲價底氣,都源于它們在Token價值鏈上的不可替代性。無論AI應用層如何洗牌,它們都是穩坐釣魚臺的贏家。
結語
這場Token狂飆,最后會走向哪里?
我覺得,它會倒逼整個產業回歸兩個常識。
第一,算力成本終究會回歸商品屬性。短期內存漲價、供需失衡,但技術進步不會停。更高效的模型架構、更好的推理優化、把模型焊在芯片上的專用芯片創新,都會持續壓低Token的生產成本。長期看,Token的單價一定是往下走的。
![]()
圖源:網絡
第二,投入產出比會成為唯一的衡量標準。燒Token不是目的,用Token創造價值才是。市場從狂熱回歸理性之后,企業不會再看“Tokenmaxxing”,而是會問:這100萬Token,到底幫我干了多少活?掙了多少錢?
智能體本身也需要進化,需要在有限的嘗試中,找到使用Token最具效率的方法。
那些只靠補貼用戶燒Token、自己沒有核心價值創造的應用,會最先倒下。能精確衡量任務成本、優化Token效率、建起高轉換成本壁壘的公司,才能活下來。
Token越來越貴的今天,我們需要的不是制造焦慮,也不是鼓勵無度消耗。
畢竟,商業的終極理性,從來不是燒掉多少燃料,而是走了多遠的路。
參考資料:
1、《「燒Token」成KPI,有程序員一個月花掉15w》騰訊科技
2、《為什么所有人都覺得 MiniMax、智譜「太貴了」?》極客公園
3、《月薪2萬,我養不起自己的“AI員工”》鳳凰WEEKLY
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.