文 | 象先志
2026年4月15日,黃仁勛在Dwarkesh Patel 的播客里經歷了一場他很久沒經歷過的尖銳追問。一個多小時的對話,他反復用來定義英偉達的那句話是:“必須有東西把電子變成token。”他把自家公司形容成“全球每瓦生產token 最多的架構”——不是每瓦算力最多,是每瓦 token 最多。
這是一家賣GPU的公司,在重新定義自己。
為什么要重新定義?因為他比任何人都更早地看見一件事——AI 時代的權力,正在被分成兩種不同的東西。一種是算力,在美國手里;另一種是 token,在中國手里。這兩種權力不在同一個平面上,誰都吃不掉誰。而英偉達夾在中間,它原來以為自己是最大的贏家,現在發現自己是這兩個結構里都沒有舒服位置的那個。
這才是他焦慮的真正原因。
算力的地主,token 的租客
先看美國那半邊。
4月14 日,EpochAI 發布最新數據——Amazon、Google、Meta、Microsoft、Oracle 五家美國 hyperscaler 合計持有全球 67% 的 AI 算力,按H100 等價口徑折算。2024 年 Q1 這個數字是 60%。十八個月里,全球 AI 算力的集中度又提高了七個百分點,而且上行趨勢看不到減速。
這五家公司有一個共同點:它們都不做前沿模型。
Google 算是一個例外,TPU 自研加 Gemini 自己做,但剩下四家的基本身位是“收租的”——Microsoft 靠 Azure 給 OpenAI 租算力,Amazon 靠 AWS 和自家 Trainium 芯片把 Anthropic 綁在身邊,Oracle 靠 Stargate 項目切進 OpenAI的基礎設施版圖,Meta 自己造芯片但主要內用,4 月 13 日剛與 Broadcom 簽了 1GW 自研芯片訂單。
那誰在用這些算力?前沿 AI lab 都是它們的租客。Anthropic 剛宣布擴大與Google 的TPU 合作,未來幾年要接入多GW 級算力。OpenAI 的骨干算力是Microsoft Azure 加 Oracle Stargate——OpenAI 在 2 月剛完成 1100 億美元融資,Amazon 投了 500 億,SoftBank 投了 300 億,Nvidia 追加了300 億(從原本承諾的1000 億縮水而來)。xAI 自建集群,但芯片仍然從英偉達買。
美國 AI 產業真實的權力結構,是這樣的:5 家算力地主 + 3 家前沿模型租客 + 一個 Nvidia。外界以為 OpenAI、Anthropic、xAI 是主角,實際上它們是交租的一方。它們每融一輪錢,都要把大頭交給那五家地主——這五家地主同時也是它們的投資人、它們的供應商、它們的談判對手。
Nvidia 在這個結構里,看上去是最大的贏家。它拿了 2026 財年大約 1150 億美元的數據中心收入,市值 3 萬億美元以上。但這個身位的脆弱性,黃仁勛自己看得最清楚。
他在3月的Morgan Stanley大會上宣布,Nvidia 投資 OpenAI 的 300億美元和投資Anthropic 的100億美元大概率都是最后一筆。兩個月前他剛把那100億美元押給Anthropic,Anthropic轉身就加大了 TPU合作——Nvidia投資的錢,流回去幫對手做非英偉達的算力。
這是商業層面的選擇:Anthropic 不能只依賴一家芯片供應商,它必須分散。Nvidia 的客戶結構本來就高度集中——全球算力版圖上,真正的大戶就是那五家美國公司。加上中國市場,那就是它過去兩年數據中心業務的全部核心收入池。2025 年 4 月之后,H20 禁令讓中國這一池水基本蒸發。剩下的五家客戶,每一家都比 Nvidia 更想往上游吃——Meta自研芯片、Amazon 有Trainium、Google有 TPU、Microsoft 和 Oracle在押 OpenAI 的自研 Titan。
一個賣鏟子的人,面對的客戶是五家正在自己造鏟子的人。這就是美國結構里英偉達的真實處境。
token 的工廠,沒有業主也沒有租客
再看中國那半邊。
中國前四大云廠商——阿里云、字節火山引擎、騰訊云、百度智能云——全部都同時在做兩件事:一邊賣算力,一邊做自己的大模型。阿里云的底下是千問(Qwen),火山引擎的底下是豆包和 Seedance,騰訊云的底下是混元,百度智能云的底下是文心。再加上對于對于 AI “新勢力”們錯綜復雜的投資,產業布局都很完備。
中國的云廠商只能同時做業主和租客——自己造算力、自己造模型、自己消化 token,最后把 token 作為商品賣給下游企業。算力、模型、應用三層被同一家公司吃掉,整條價值鏈上只剩下一種東西可以作為商品出貨——token。
阿里是這個鏈條的代表性企業, ATH大家都很熟悉了:CEO 吳泳銘在內部備忘錄里給它定下了核心使命:“創造 Token、輸送 Token、應用 Token。” ATH 成立后的一個月,阿里的動作密度是過去兩年之最。
3 月 30 日發布Qwen3.5-Omni——Qwen 系列近年來第一次從開源走向閉源。緊接著Qwen 3.6 Plus 在OpenRouter上以 4.6 萬億/周的調用量登頂全球大模型周調用量冠軍,同系列的Preview 版本拿下第三。今天,ATH 又掏出了最新的開放式世界模型產品Happy Oyster,研發效率堪稱恐怖。
吳泳銘在 3 月 19 日的財報電話會上說了一句話,分量比 ATH 成立本身更大。他說:企業在消耗 Token 時不再把它當作 IT 預算,而是當作生產資料。IT 預算是成本項,是被優化的對象;生產資料是投入項,是被擴張的對象。一家萬億美金市值的中國公司的 CEO 在財報電話會上告訴華爾街——token 已經從“支出”變成了“投入”,從“IT 科目”變成了“經濟活動本身”。他給出的具體數字是:未來五年,阿里云和 AI 商業化年收入要沖到1000 億美元。按新的 Token 消耗算法,這1000 億美元甚至可以包含電商業務產生的 AI 收入。
在企業的動作之前,監管則是更早給這場科技的盛宴定下了基調。3 月 23 日,國家數據局局長劉烈宏在中國發展高層論壇年會上正式把 token 的中文譯名定為“詞元”,并稱其為“智能時代的價值錨點”和“連接技術供給與商業需求的結算單位”。第二天國新辦發布會上,他公布了一組官方數字——中國日均詞元調用量突破140 萬億,對比2024 年初的1000 億,兩年增長超過一千倍。
這是把 token 從技術概念抬升為經濟統計指標的動作。“流量”之于互聯網時代,“詞元”之于 AI 時代。OpenRouter 平臺給了這套敘事最硬的數據支點——2 月 9 日至 15 日那一周,中國大模型的 Token 調用量首次超過美國,4.12 萬億對 2.94 萬億。到 4 月初,中國模型周調用量達到 12.96 萬億,美國模型 3.03 萬億,中國已經連續五周領先,全球調用量前六全部是中國模型。MiniMax M2.5 發布后七天調用量突破 3.07 萬億。Kimi K2.5 發布不到一個月,近 20 天累計收入超過了月之暗面 2025 全年總收入。智譜 GLM-5 在春節期間因為流量爆單,公開“尋找算力合伙人”——不是營銷噱頭,是真實訂單把產能撐爆了。
算一下結構差異。美國那半邊,算力是核心資產,token 是算力的副產品。中國這半邊反過來——token 是核心商品,算力是生產 token 的原料。定價邏輯、商業模型、公司估值、監管指標,全部圍繞兩種不同的東西展開。
大洋那邊充滿了算力,但 token 卻源源不斷從大洋這邊產生。
老黃為什么焦慮
回到 Dwarkesh 的播客。
黃仁勛在訪談里給出一個他反復使用的框架——“five-layer cake”,AI產業有五層:能源、芯片、系統、模型、應用。他說美國必須在五層里每一層都領先,否則就是敗局。他說中國是全世界開源軟件最大的貢獻者,說這話時連說兩次“Fact”——事實、事實。他說中國占全球 AI 研究員的一半,制造全球 60% 以上的主流芯片,有大量滿電空置的“幽靈數據中心”。他說 AI 的大部分進步來自算法進步,不是硬件本身。然后他拋出一句話——如果 DeepSeek 的下一個版本首發在華為芯片上,對美國來說是災難。
![]()
這些話串在一起讀,意思已經很清楚了。他的焦慮不是來自“中國追上來”這種宏觀敘事,而是來自一個明確的尷尬窘境——在美國那半邊,他正在失去議價權;在中國那半邊,他正在失去入場券。
在美國那半邊:5家hyperscaler 拿走了 67% 的全球算力,它們是他最大的客戶,也是他最強的對手。它們每一家都在做自研芯片——Meta 剛簽了 1GW的Broadcom 訂單,Amazon 的Trainium 拿下了 Anthropic,Google 的TPU 在吞噬Nvidia的份額。當你的客戶同時是你的對手,當你的市場集中到只剩 5 家買主,你的定價權就是一個慢慢被蠶食的過程。Anthropic 拿了 Nvidia100 億美元投資兩個月后反手加大 TPU 合作——這件事是趨勢,不是偶然。
在中國那半邊:token生態正在繞過英偉達。DeepSeek V4 的蓄勢待發,在華為 Ascend 950PR上跑訓練和推理,不走 Nvidia。阿里、字節、騰訊為此批量下單了幾十萬片華為芯片。Qwen、Kimi 、 MiniMax 們每周產出幾萬億 token 的模型,每多跑一天,華為芯片的裝機量就漲一天。更嚴重的是,這些模型的用戶正在全球擴張——OpenRouter 上中國模型連續五周超過美國,MiniMax 主打“1 美元跑一小時 AI 數字員工”,Kimi 的海外付費用戶正在反超國內。當世界開發者的默認技術棧開始從英偉達切換到華為,Nvidia 在這條鏈路上一個字都插不進去。
面對這兩個困境,英偉達過去半年做了兩件事,都可以在這個命題下被重新解讀。
第一件事,親自下場做自己本不該做的產品。3 月的 GTC 上,Nvidia 連發 Cosmos 3(世界基礎模型)、Isaac GR00T N1.7(機器人)、Alpamayo1.5(自動駕駛)、Nemotron(開源大模型家族)——一整套覆蓋物理 AI 和前沿模型的棧。4 月 14 日世界量子日,它發布 Ising——開源的量子 AI 模型家族,黃仁勛親自給它定性:“AI 成為控制面,成為量子機器的操作系統。”這些發布加在一起傳遞的信號非常明確:英偉達不再滿足于做芯片,它要做模型、做操作系統、做物理世界的模擬器、做量子計算的控制層。賣鏟子的人開始自己挖礦,不是因為貪心,是因為兩個結構都在擠壓他的原有位置。
第二件事,他把公司的核心指標從“算力”遷移到“產出”。“electrons to tokens” 這個比喻他在 Dwarkesh 訪談里用了不下五次。他把 Nvidia 形容成“全球每瓦生產 token 最多的架構”——不是每瓦算力最多,是每瓦 token 最多。一家把核心指標從“算力”改成“token”的公司,已經承認了這個時代的硬通貨在哪里。
但承認不等于解決。他手里的 GPU 本質上還是生產算力的機器,不是直接生產 token 的機器。他在兩個結構里都在做對的事——在美國擴張上游、在技術棧上鎖住開發者——但這些動作都沒法改變基本面:算力和 token 不在同一個平面上。一家只生產算力的公司,無論怎么重新定義自己,都沒法同時占據兩種權力。
只做賣鏟人,已經不能讓 Nvidia 高枕無虞了。
結語
AI 時代的權力結構,現在已經分成了兩半。
美國那半邊是地產——5 家 hyperscaler 坐在 67% 的全球算力上,前沿 lab 是它們的租客。這個結構里,算力是硬資產,估值邏輯是“地皮面積 × 租金”。中國這半邊是工廠——4 家云廠把算力、模型、應用壓成一條流水線,token 是唯一的出貨物。這個結構里,token 是硬通貨,估值邏輯是“產出量 × 單價”。
兩種結構互相不可吃掉。美國的算力地主沒法直接進入中國的 token 工廠——監管、生態、開發者習慣都攔著。中國的 token 工廠也沒法直接替代美國的算力地主——前沿訓練還是要最先進的硬件,華為 Ascend 追得再快,短期內補不上與頂級Nvidia 芯片的代際差距。兩種權力各自運轉,各自擴張,各自找各自的出口。
黃仁勛夾在中間。他本來以為自己是這個時代最大的贏家——算力是上游,模型是下游,他給上游和下游都供貨,他是唯一的瓶頸。但瓶頸的位置正在雙向松動。上游那半邊,5 家地主自己造芯片;下游那半邊,中國用國產芯片跑出了自己的 token 生態。向左擴張(投資OpenAI、Anthropic)沒守住下游,往右擴張還沒證明能守住技術棧。他一個人,兩條戰線,都面臨著增長的困境。
他在播客里說,“必須有東西把電子變成 token”。他是在替英偉達的未來辯護,但這句話本身已經承認了——這個時代的硬通貨不是電子,是 token。而生產token最密集的地方,目前不在美國。
他在兩種結構之間,Nvidia正在失去最舒服的位置。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.