![]()
作者:趙元,編輯:何玥陽
2026年的春天,北美云計算巨頭的財報季變成了一場集體“受難日”。
微軟智能云部門季度營收首破500億美元,Azure同比增長39%,財報發出后股價卻暴跌近10%;亞馬遜AWS收入創下13個季度以來最快增速,次日股價重挫11%;谷歌云營收暴漲48%,股價依然在盤后由漲轉跌。
原因只有一個字:錢。或者說,正在失控的AI賬單。
翻開巨頭們的財報會發現,微軟單季資本支出375億美元,同比增長66%,雖未給出全年指引,但有分析稱,若按照單季資本支出趨勢,全年支出將超越千億美元量級;亞馬遜宣布2026年支出2000億美元;谷歌計劃投入1750-1850億美元,幾乎是2025年的兩倍。
三家巨頭合計支出突破5000億美元,相當于挪威2024全年GDP。
資本市場在焦慮什么?是云業務增長不夠好?顯然不是。大客戶用得越多,云廠商的賬單反而越容易“爆雷”。一場圍繞“怎么收錢”的暗戰,正在硅谷悄悄上演。輸贏將重塑整個AI產業鏈的價值分配。
一、Token模式開始懲罰深度用戶?
一個不容忽視的事實是,Token計費模式,成為AI普及的最大功臣之一。
2024年初,中國日均詞元(Token)調用量為1000億;至2025年底,躍升至100萬億;今年3月,已突破140萬億,兩年增長超千倍。
同時,隨著“小龍蝦”爆火,AI從“玩具”變成了“生產工具”,Token模式的弊端開始顯現。
以AI智能體為例,一個傳統的聊天機器人,回答一個問題消耗幾百到幾千個Token。但一個能獨立完成任務的AI智能體,每次執行需要多輪推理、反復調用工具、讀取大量上下文。業內人士測算,智能體的Token消耗動輒放大數十倍,復雜任務甚至是普通對話的百倍、千倍。
OpenAI在2026年3月關停了視頻生成工具Sora,其原因之一就是入不敷出。新京報援引分析機構SemiAnalysis的測算稱,Sora日均運營成本接近1500萬美元,年度成本高達54億美元。
OpenAI項目負責人曾直言:“目前的經濟模式完全不可持續。”視頻生成的算力消耗遠高于文字、圖像生成,一次視頻生成的GPU資源,足夠ChatGPT回答數十個問題,嚴重擠壓核心業務資源。
Token模式下,用AI越多,賬單越失控。英偉達CEO黃仁勛甚至說,未來英偉達工程師都會有自己的“年度Token預算”,如果一個高薪工程師一年下來沒消耗多少Token,反倒顯得奇怪。
一個行業走到“用量越大越恐懼”這一步,說明收費模式出了根本問題。
你用得越多,我賺得越多,聽起來很不錯。但大客戶面對上下大幅浮動的AI賬單,CFO根本不敢批準規模化預算。Token模式正在懲罰它最應該挽留的人:那些用量最大、場景最深的頭部客戶。這與云廠商做大蛋糕的長期利益背道而馳。
在此背景下,北美云廠商先后祭出的新武器叫PTU:預配吞吐量單位。
簡單說,客戶預先購買一定數量的算力容量,按月、按季或按年付固定費用,與實際Token消耗量無關。Token模式是“吃多少付多少”,PTU是“包月自助餐”。客戶獲得成本確定性,云廠商獲得客戶關系鎖定。
這背后的博弈邏輯就完全變了。
Token模式下,雙方是“零和博弈”,客戶省錢等于云廠少賺,客戶多花等于云廠多賺。但大客戶因恐懼成本失控而壓縮用量,導致云廠收入增長不及預期。
PTU模式下,博弈變成了“正和”,客戶鎖定預算后敢于擴大AI用量,云廠的收入增長更可持續。本質是將風險從客戶側轉移到云廠商側,換取客戶關系的深度綁定。
國信證券將中國移動互聯網資費變遷做了一個類比。
2G時代,流量按KB計費,0.01元/KB,用戶用流量像在滴血。3G時代,資費轉向MB,150元包3GB,用戶開始放開手腳。4G時代,“提速降費”推動無限流量套餐全面爆發,像2016年騰訊“大王卡”19元包月、騰訊系APP免流,用戶徹底從“購買流量”轉向“購買服務”。5G時代,計費進一步演變為“按速率分級”,流量多少不再是定價核心。
每一次計費模式變革,都是一次產業鏈話語權的重新分配。運營商放棄“按KB收費”的暴利模式,換來的是用戶月均流量從30M暴漲至10GB以上,蛋糕總量擴大了數百倍。
今天云廠商的選擇,與當年運營商如出一轍。他們寧愿犧牲短期毛利率,也要換取長期合約的確定性。國信證券研報指出,PTU轉型將使云業務毛利率結構從“高彈性波動”向“高韌性”轉變,即短期承壓,長期更健康、更穩定。
二、三巨頭打法差異化的陽謀
微軟、AWS、谷歌三家巨頭,表面上都在推PTU,骨子里的打法卻截然不同。
微軟靠的是生態捆綁。 微軟的武器是Windows、Office 365、GitHub構成的龐大生態系統。它推出“Azure AI承諾計劃”,鼓勵企業客戶簽訂1-3年消費承諾合同。本季度,微軟商業剩余履約義務飆升至6250億美元,同比增長一倍以上。其中45%來自OpenAI的2500億美元新協議。
微軟的算盤很精,最高級的定價權,是讓客戶無法單獨核算AI成本。當AI變成Word里的一個按鈕,預算自然并入軟件訂閱費中。但過度依賴單一客戶也引發市場擔憂,一旦OpenAI經營承壓,連鎖反應將直擊微軟。
AWS靠的是成本優勢。 AWS的底氣是自研Trainium和Inferentia芯片,以及全球最大的云基礎設施規模。它大力推廣“AI/ML節省計劃”,為客戶提供比按需付費顯著優惠的價格。
亞馬遜CEO安迪·賈西在財報會上的表態極為強硬:“在年化營收1420億美元基礎上實現24%同比增長,與競爭對手在明顯更小基數上實現更高百分比增長,是截然不同的。”
AWS用極致供應鏈效率構建護城河,它不怕價格戰,因為單位算力成本已是行業最低。在財報會上,高管多次強調“新增算力能快速變現”。言下之意是,它賭的是規模效應最終碾壓一切。
而谷歌則是靠性能溢價。 谷歌在AI技術積累上底蘊最深,自研TPU已迭代至第七代,Gemini模型月活用戶達7.5億。第四季度谷歌云營收增長48%,增速遠超競爭對手。
谷歌將“承諾使用折扣”擴展至AI平臺,吸引對性能有極致要求的客戶。它走的是技術奢侈品路線,不求客戶最多,但求最賺錢的高端客戶離不開它。
與蘋果的合作更是關鍵一步:谷歌已成為蘋果首選云服務商,兩家公司正合作開發基礎模型,這將確保谷歌AI技術通過蘋果設備觸達全球用戶。
三種策略代表三種不同的經濟護城河:微軟靠轉換成本,AWS靠規模效應,谷歌靠技術領先。要判斷哪家將從PTU轉型中獲益最多,核心是評估其護城河類型能否在長期合同鎖定期內持續有效。
不過,PTU轉型的影響不會止步于云廠商與大客戶之間,它將沿產業鏈向上游芯片商、下游應用商傳導。
上游芯片商最先受益。Token模式下,云廠商算力采購是“脈沖式”的——流量暴增時緊急加單,低谷時資源閑置。PTU模式下,長期合同讓云廠商敢于向上游下達更平滑、更可預測的訂單。
微軟計劃2026年內將AI算力提升超80%,未來兩年數據中心規模翻倍。英偉達等芯片商的產能規劃將更從容,供應鏈效率顯著提升。
下游AI應用商則加速洗牌,PTU模式下,大客戶鎖定資源后,中小客戶的資源池可能被擠壓。AI應用創業門檻正在抬高,過去靠Token按需付費就能啟動的項目,未來可能面臨更高起步成本。與此同時,能幫客戶優化PTU利用率的工具層公司——AI負載調度、成本管理SaaS——將迎來結構性機會。
國信證券研報指出,定價模式變革正處于拐點期,預計未來一年內變革影響消化完畢后,訂單長協化趨勢將帶來收入與利潤增長的確定性顯著提升。
三、結語
從Token到PTU的轉變,標志著AI產業從“野蠻生長”的試驗階段進入“精耕細作”的商業化成熟階段。
回望移動互聯網從按KB計費到無限流量的歷程,正是資費模式的成熟,才催生了短視頻、直播、云游戲等萬億級市場。今天AI計費的陣痛,是在為下一個“抖音級”AI原生應用鋪路。
當然,PTU不會是終點。隨著模型即服務(MaaS)的興起,AI計費可能進一步向“按業務結果付費”演進。定價權的博弈,始終是觀察AI產業演進的核心線索。
在這個過程中,真正的贏家將是那些把“鎖定客戶”做成“服務客戶”的玩家,當定價權從零和博弈走向正和共贏,AI商業化的成人禮才算真正完成。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.