網易首頁 > 網易號 > 正文申請入駐

老黃可能開始焦慮了

2026-04-17 09:40:45　來源: 鈦媒體APP

北京舉報

分享至

文 | 象先志

2026年4月15日，黃仁勛在Dwarkesh Patel 的播客里經歷了一場他很久沒經歷過的尖銳追問。一個多小時的對話，他反復用來定義英偉達的那句話是：“必須有東西把電子變成token。”他把自家公司形容成“全球每瓦生產token 最多的架構”——不是每瓦算力最多，是每瓦 token 最多。

這是一家賣GPU的公司，在重新定義自己。

為什么要重新定義？因為他比任何人都更早地看見一件事——AI 時代的權力，正在被分成兩種不同的東西。一種是算力，在美國手里；另一種是 token，在中國手里。這兩種權力不在同一個平面上，誰都吃不掉誰。而英偉達夾在中間，它原來以為自己是最大的贏家，現在發現自己是這兩個結構里都沒有舒服位置的那個。

這才是他焦慮的真正原因。

算力的地主，token 的租客

先看美國那半邊。

4月14 日，EpochAI 發布最新數據——Amazon、Google、Meta、Microsoft、Oracle 五家美國 hyperscaler 合計持有全球 67% 的 AI 算力，按H100 等價口徑折算。2024 年 Q1 這個數字是 60%。十八個月里，全球 AI 算力的集中度又提高了七個百分點，而且上行趨勢看不到減速。

這五家公司有一個共同點：它們都不做前沿模型。

Google 算是一個例外，TPU 自研加 Gemini 自己做，但剩下四家的基本身位是“收租的”——Microsoft 靠 Azure 給 OpenAI 租算力，Amazon 靠 AWS 和自家 Trainium 芯片把 Anthropic 綁在身邊，Oracle 靠 Stargate 項目切進 OpenAI的基礎設施版圖，Meta 自己造芯片但主要內用，4 月 13 日剛與 Broadcom 簽了 1GW 自研芯片訂單。

那誰在用這些算力？前沿 AI lab 都是它們的租客。Anthropic 剛宣布擴大與Google 的TPU 合作，未來幾年要接入多GW 級算力。OpenAI 的骨干算力是Microsoft Azure 加 Oracle Stargate——OpenAI 在 2 月剛完成 1100 億美元融資，Amazon 投了 500 億，SoftBank 投了 300 億，Nvidia 追加了300 億（從原本承諾的1000 億縮水而來）。xAI 自建集群，但芯片仍然從英偉達買。

美國 AI 產業真實的權力結構，是這樣的：5 家算力地主 + 3 家前沿模型租客 + 一個 Nvidia。外界以為 OpenAI、Anthropic、xAI 是主角，實際上它們是交租的一方。它們每融一輪錢，都要把大頭交給那五家地主——這五家地主同時也是它們的投資人、它們的供應商、它們的談判對手。

Nvidia 在這個結構里，看上去是最大的贏家。它拿了 2026 財年大約 1150 億美元的數據中心收入，市值 3 萬億美元以上。但這個身位的脆弱性，黃仁勛自己看得最清楚。

他在3月的Morgan Stanley大會上宣布，Nvidia 投資 OpenAI 的 300億美元和投資Anthropic 的100億美元大概率都是最后一筆。兩個月前他剛把那100億美元押給Anthropic，Anthropic轉身就加大了 TPU合作——Nvidia投資的錢，流回去幫對手做非英偉達的算力。

這是商業層面的選擇：Anthropic 不能只依賴一家芯片供應商，它必須分散。Nvidia 的客戶結構本來就高度集中——全球算力版圖上，真正的大戶就是那五家美國公司。加上中國市場，那就是它過去兩年數據中心業務的全部核心收入池。2025 年 4 月之后，H20 禁令讓中國這一池水基本蒸發。剩下的五家客戶，每一家都比 Nvidia 更想往上游吃——Meta自研芯片、Amazon 有Trainium、Google有 TPU、Microsoft 和 Oracle在押 OpenAI 的自研 Titan。

一個賣鏟子的人，面對的客戶是五家正在自己造鏟子的人。這就是美國結構里英偉達的真實處境。

token 的工廠，沒有業主也沒有租客

再看中國那半邊。

中國前四大云廠商——阿里云、字節火山引擎、騰訊云、百度智能云——全部都同時在做兩件事：一邊賣算力，一邊做自己的大模型。阿里云的底下是千問（Qwen），火山引擎的底下是豆包和 Seedance，騰訊云的底下是混元，百度智能云的底下是文心。再加上對于對于 AI “新勢力”們錯綜復雜的投資，產業布局都很完備。

中國的云廠商只能同時做業主和租客——自己造算力、自己造模型、自己消化 token，最后把 token 作為商品賣給下游企業。算力、模型、應用三層被同一家公司吃掉，整條價值鏈上只剩下一種東西可以作為商品出貨——token。

阿里是這個鏈條的代表性企業， ATH大家都很熟悉了：CEO 吳泳銘在內部備忘錄里給它定下了核心使命：“創造 Token、輸送 Token、應用 Token。” ATH 成立后的一個月，阿里的動作密度是過去兩年之最。

3 月 30 日發布Qwen3.5-Omni——Qwen 系列近年來第一次從開源走向閉源。緊接著Qwen 3.6 Plus 在OpenRouter上以 4.6 萬億/周的調用量登頂全球大模型周調用量冠軍，同系列的Preview 版本拿下第三。今天，ATH 又掏出了最新的開放式世界模型產品Happy Oyster，研發效率堪稱恐怖。

吳泳銘在 3 月 19 日的財報電話會上說了一句話，分量比 ATH 成立本身更大。他說：企業在消耗 Token 時不再把它當作 IT 預算，而是當作生產資料。IT 預算是成本項，是被優化的對象；生產資料是投入項，是被擴張的對象。一家萬億美金市值的中國公司的 CEO 在財報電話會上告訴華爾街——token 已經從“支出”變成了“投入”，從“IT 科目”變成了“經濟活動本身”。他給出的具體數字是：未來五年，阿里云和 AI 商業化年收入要沖到1000 億美元。按新的 Token 消耗算法，這1000 億美元甚至可以包含電商業務產生的 AI 收入。

在企業的動作之前，監管則是更早給這場科技的盛宴定下了基調。3 月 23 日，國家數據局局長劉烈宏在中國發展高層論壇年會上正式把 token 的中文譯名定為“詞元”，并稱其為“智能時代的價值錨點”和“連接技術供給與商業需求的結算單位”。第二天國新辦發布會上，他公布了一組官方數字——中國日均詞元調用量突破140 萬億，對比2024 年初的1000 億，兩年增長超過一千倍。

這是把 token 從技術概念抬升為經濟統計指標的動作。“流量”之于互聯網時代，“詞元”之于 AI 時代。OpenRouter 平臺給了這套敘事最硬的數據支點——2 月 9 日至 15 日那一周，中國大模型的 Token 調用量首次超過美國，4.12 萬億對 2.94 萬億。到 4 月初，中國模型周調用量達到 12.96 萬億，美國模型 3.03 萬億，中國已經連續五周領先，全球調用量前六全部是中國模型。MiniMax M2.5 發布后七天調用量突破 3.07 萬億。Kimi K2.5 發布不到一個月，近 20 天累計收入超過了月之暗面 2025 全年總收入。智譜 GLM-5 在春節期間因為流量爆單，公開“尋找算力合伙人”——不是營銷噱頭，是真實訂單把產能撐爆了。

算一下結構差異。美國那半邊，算力是核心資產，token 是算力的副產品。中國這半邊反過來——token 是核心商品，算力是生產 token 的原料。定價邏輯、商業模型、公司估值、監管指標，全部圍繞兩種不同的東西展開。

大洋那邊充滿了算力，但 token 卻源源不斷從大洋這邊產生。

老黃為什么焦慮

回到 Dwarkesh 的播客。

黃仁勛在訪談里給出一個他反復使用的框架——“five-layer cake”，AI產業有五層：能源、芯片、系統、模型、應用。他說美國必須在五層里每一層都領先，否則就是敗局。他說中國是全世界開源軟件最大的貢獻者，說這話時連說兩次“Fact”——事實、事實。他說中國占全球 AI 研究員的一半，制造全球 60% 以上的主流芯片，有大量滿電空置的“幽靈數據中心”。他說 AI 的大部分進步來自算法進步，不是硬件本身。然后他拋出一句話——如果 DeepSeek 的下一個版本首發在華為芯片上，對美國來說是災難。

這些話串在一起讀，意思已經很清楚了。他的焦慮不是來自“中國追上來”這種宏觀敘事，而是來自一個明確的尷尬窘境——在美國那半邊，他正在失去議價權；在中國那半邊，他正在失去入場券。

在美國那半邊：5家hyperscaler 拿走了 67% 的全球算力，它們是他最大的客戶，也是他最強的對手。它們每一家都在做自研芯片——Meta 剛簽了 1GW的Broadcom 訂單，Amazon 的Trainium 拿下了 Anthropic，Google 的TPU 在吞噬Nvidia的份額。當你的客戶同時是你的對手，當你的市場集中到只剩 5 家買主，你的定價權就是一個慢慢被蠶食的過程。Anthropic 拿了 Nvidia100 億美元投資兩個月后反手加大 TPU 合作——這件事是趨勢，不是偶然。

在中國那半邊：token生態正在繞過英偉達。DeepSeek V4 的蓄勢待發，在華為 Ascend 950PR上跑訓練和推理，不走 Nvidia。阿里、字節、騰訊為此批量下單了幾十萬片華為芯片。Qwen、Kimi 、 MiniMax 們每周產出幾萬億 token 的模型，每多跑一天，華為芯片的裝機量就漲一天。更嚴重的是，這些模型的用戶正在全球擴張——OpenRouter 上中國模型連續五周超過美國，MiniMax 主打“1 美元跑一小時 AI 數字員工”，Kimi 的海外付費用戶正在反超國內。當世界開發者的默認技術棧開始從英偉達切換到華為，Nvidia 在這條鏈路上一個字都插不進去。

面對這兩個困境，英偉達過去半年做了兩件事，都可以在這個命題下被重新解讀。

第一件事，親自下場做自己本不該做的產品。3 月的 GTC 上，Nvidia 連發 Cosmos 3（世界基礎模型）、Isaac GR00T N1.7（機器人）、Alpamayo1.5（自動駕駛）、Nemotron（開源大模型家族）——一整套覆蓋物理 AI 和前沿模型的棧。4 月 14 日世界量子日，它發布 Ising——開源的量子 AI 模型家族，黃仁勛親自給它定性：“AI 成為控制面，成為量子機器的操作系統。”這些發布加在一起傳遞的信號非常明確：英偉達不再滿足于做芯片，它要做模型、做操作系統、做物理世界的模擬器、做量子計算的控制層。賣鏟子的人開始自己挖礦，不是因為貪心，是因為兩個結構都在擠壓他的原有位置。

第二件事，他把公司的核心指標從“算力”遷移到“產出”。“electrons to tokens” 這個比喻他在 Dwarkesh 訪談里用了不下五次。他把 Nvidia 形容成“全球每瓦生產 token 最多的架構”——不是每瓦算力最多，是每瓦 token 最多。一家把核心指標從“算力”改成“token”的公司，已經承認了這個時代的硬通貨在哪里。

但承認不等于解決。他手里的 GPU 本質上還是生產算力的機器，不是直接生產 token 的機器。他在兩個結構里都在做對的事——在美國擴張上游、在技術棧上鎖住開發者——但這些動作都沒法改變基本面：算力和 token 不在同一個平面上。一家只生產算力的公司，無論怎么重新定義自己，都沒法同時占據兩種權力。

只做賣鏟人，已經不能讓 Nvidia 高枕無虞了。

結語

AI 時代的權力結構，現在已經分成了兩半。

美國那半邊是地產——5 家 hyperscaler 坐在 67% 的全球算力上，前沿 lab 是它們的租客。這個結構里，算力是硬資產，估值邏輯是“地皮面積 × 租金”。中國這半邊是工廠——4 家云廠把算力、模型、應用壓成一條流水線，token 是唯一的出貨物。這個結構里，token 是硬通貨，估值邏輯是“產出量 × 單價”。

兩種結構互相不可吃掉。美國的算力地主沒法直接進入中國的 token 工廠——監管、生態、開發者習慣都攔著。中國的 token 工廠也沒法直接替代美國的算力地主——前沿訓練還是要最先進的硬件，華為 Ascend 追得再快，短期內補不上與頂級Nvidia 芯片的代際差距。兩種權力各自運轉，各自擴張，各自找各自的出口。

黃仁勛夾在中間。他本來以為自己是這個時代最大的贏家——算力是上游，模型是下游，他給上游和下游都供貨，他是唯一的瓶頸。但瓶頸的位置正在雙向松動。上游那半邊，5 家地主自己造芯片；下游那半邊，中國用國產芯片跑出了自己的 token 生態。向左擴張（投資OpenAI、Anthropic）沒守住下游，往右擴張還沒證明能守住技術棧。他一個人，兩條戰線，都面臨著增長的困境。

他在播客里說，“必須有東西把電子變成 token”。他是在替英偉達的未來辯護，但這句話本身已經承認了——這個時代的硬通貨不是電子，是 token。而生產token最密集的地方，目前不在美國。

他在兩種結構之間，Nvidia正在失去最舒服的位置。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.