337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI算力的瓶頸已不是電,而是半導體供應鏈

0
分享至

2026 年,全球四大科技巨頭亞馬遜、Meta、谷歌和微軟的資本支出預測總額達到 6,000 億美元。換算成數(shù)據(jù)中心的年租賃價格,大約對應 50 GW(吉瓦)的算力容量。與此同時,OpenAI 剛剛完成 1,100 億美元融資,Anthropic 官宣了 300 億美元的新一輪募資。錢到位了,但這些錢到底能不能變成真正運轉(zhuǎn)的芯片和數(shù)據(jù)中心?

半導體研究機構(gòu) SemiAnalysis 創(chuàng)始人兼 CEO Dylan Patel 近日做客 Dwarkesh Patel 的播客節(jié)目,就 AI 算力擴展的核心瓶頸進行了一次信息量極高的深度對話。Dylan 長期追蹤全球半導體供應鏈和 AI 基礎設施建設,SemiAnalysis 的客戶涵蓋超級云廠商、AI 實驗室和對沖基金,其數(shù)據(jù)和預測在行業(yè)內(nèi)被廣泛引用。


圖丨 Dylan Patel(來源:Youtube)

對話核心要點如下:

?6,000 億美元資本支出的真相:四大科技巨頭今年的資本支出中,大量用于未來數(shù)年的前置投入(渦輪機定金、數(shù)據(jù)中心建設、電力協(xié)議),而非今年直接上線的算力。美國今年新增約 20 GW 數(shù)據(jù)中心容量。

?Anthropic 的算力困境:收入增速遠超預期(1 月 +40 億、2 月 +60 億 ARR),年底需要超過 5 GW 才能滿足推理和訓練需求,但因此前采購過于保守,不得不接受更高價格或更大比例的收入分成來獲取算力。OpenAI 因激進簽約獲得了顯著的算力先發(fā)優(yōu)勢。

?H100 今天比三年前更值錢:因為更強的模型(如 GPT-5.4)能從同一顆芯片中榨取更多價值,而芯片供給始終有限,其定價取決于芯片能產(chǎn)生的經(jīng)濟價值,而非替代品的比較價格。

?瓶頸已從電力轉(zhuǎn)向芯片制造:2026 年最大瓶頸不再是電力或數(shù)據(jù)中心,而是半導體供應鏈本身,邏輯晶圓、內(nèi)存和晶圓廠產(chǎn)能。

?ASML 是終極天花板:每 GW AI 算力需要約 3.5 臺 EUV 光刻機。ASML 目前年產(chǎn)約 70 臺,到 2030 年最多約 100 臺。全球存量加增量到 2030 年底約 700 臺,理論上限約 200 GW,12 億美元的光刻設備卡住了 500 億美元的數(shù)據(jù)中心投資。ASML 的供應鏈(蔡司透鏡、Cymer 光源等)極度復雜且手工化,無法快速擴產(chǎn)。

?內(nèi)存危機正在到來:內(nèi)存廠商過去數(shù)年未建新廠,新產(chǎn)能最早 2027 年底才能上線。HBM 每晶圓面積比特數(shù)僅為普通 DRAM 的 1/4,但帶寬高一個數(shù)量級,無法用 DDR 替代。內(nèi)存漲價將導致智能手機出貨量從 11 億部驟降至 5-6 億部,中低端機型首當其沖。

?回到 7 納米不現(xiàn)實:雖然舊制程有存量產(chǎn)能,但 Hopper 與 Blackwell 在實際推理場景中的性能差距達 20 倍(非 FLOPS 暗示的 2-3 倍),因為芯片內(nèi)通信帶寬、封裝密度、網(wǎng)絡架構(gòu)等優(yōu)勢層層疊加。

?電力不是主要瓶頸:除聯(lián)合循環(huán)燃氣輪機外,還有航改燃機、往復式發(fā)動機、船用發(fā)動機、燃料電池、太陽能 + 儲能等十余種技術路線,每種可貢獻數(shù)十 GW,合計可達數(shù)百 GW。釋放美國電網(wǎng) 20% 的峰值冗余容量即可獲得 200+ GW。

?太空數(shù)據(jù)中心這十年不可行:芯片是最稀缺資源,部署到太空額外延遲 6 個月以上;衛(wèi)星間通信帶寬遠不及地面 NVLink;散熱更困難;可靠性更差。唯有芯片不再是瓶頸且地面資源耗盡時,太空方案才有意義。

?快時間線美國贏,慢時間線中國贏:如果 AI 收入和能力快速起飛,美國的基礎設施和模型優(yōu)勢在擴大;如果到 2035 年 AGI 才成熟,中國有足夠時間建立完全自主的垂直整合半導體供應鏈。

以下是這期節(jié)目的完整編譯。

為什么 H100 現(xiàn)在的價值比三年前更高

Dwarkesh:如果把四大科技巨頭今年的資本支出加在一起是 6,000 億美元,按每 GW 數(shù)據(jù)中心年租金大約 130 億美元來算,接近 50 GW。但我們今年顯然不可能一下子部署 50 GW,那這些資本支出到底什么時候才能變成真正上線的算力?

另外,AI 實驗室也在瘋狂融資,OpenAI 融了 1,100 億,Anthropic 融了 300 億。如果看它們今年實際上線的算力,加上租賃成本,這些融資似乎單獨就夠覆蓋今年的算力支出了,還不算它們會賺到的收入。所以第一,大型科技公司的資本支出到底什么時候轉(zhuǎn)化為上線算力?第二,實驗室融這么多錢到底要干什么?

Dylan:6,000 億美元的超級云廠商資本支出,加上供應鏈其他環(huán)節(jié)的開支,總額接近 1 萬億美元。其中一部分確實直接用于今年上線的芯片和算力,但還有大量的前置性資本支出。我們今年在美國大約新增 20 GW 的增量數(shù)據(jù)中心容量,但其中不少資本支出其實是去年花出去的。

以谷歌 1,800 億美元為例,很大一塊花在了 2028、2029 年的渦輪機定金,還有 2027 年的數(shù)據(jù)中心建設、長期電力采購協(xié)議的預付款等等。微軟、亞馬遜和 Meta 也是類似的情況,它們花這些錢是為了后續(xù)幾年的超高速擴張鋪路。

而這些公司最大的客戶就是 Anthropic 和 OpenAI。OpenAI 目前大約有 2 到 2.5 GW 的算力,Anthropic 大約在 1.5 GW 左右,兩家都在拼命往上擴。

如果看 Anthropic 最近幾個月的收入走勢,1 月新增約 40 億美元 ARR(年化經(jīng)常性收入),2 月是短月,居然新增了大約 60 億美元。有人甚至會說這個線性外推還是偏保守的。按這個速度算,未來 10 個月 Anthropic 會新增大約 600 億美元的收入。

以目前媒體報道的毛利率推算,對應大約 400 億美元的算力支出。按每 GW 約 100 億美元的租賃成本計算,Anthropic 光是為了支撐推理收入增長就需要新增 4 GW。這還是假設它的研發(fā)訓練集群規(guī)模保持不變。所以 Anthropic 今年年底需要達到遠超 5 GW,才能滿足需求,但這對它來說將非常艱難。

Dwarkesh:所以如果 Anthropic 不可能在年底達到 5 GW,但收入的瘋狂增長和下一代模型訓練都需要這些算力,它該怎么辦?

Dylan:Dario 之前在你的播客上說過,他不會在算力上瘋狂下注,因為萬一收入拐點來得比預期晚,他不想公司破產(chǎn),要負責任地擴張。但實際上,他確實在算力采購上比 OpenAI 保守太多了。OpenAI 的策略一直是直接簽下那些看起來瘋狂的大合約。結(jié)果到年底,OpenAI 的算力獲取遠多于 Anthropic。

Anthropic 最優(yōu)質(zhì)的算力供應商歷來是谷歌和亞馬遜,也就是世界上最大的幾家公司。OpenAI 就激進得多,除了從微軟拿到大量算力,還拿了谷歌、亞馬遜的算力,同時跟 CoreWeave、Oracle 簽了巨量合約,甚至找到像 SoftBank Energy 這種從來沒建過數(shù)據(jù)中心的公司來給它建數(shù)據(jù)中心。還有 N Scale 等各種新興供應商。

所以 Anthropic 面臨一個困境。它太保守了,簽合同時故意低估自己的需求,以免破產(chǎn)。而 OpenAI 呢,去年下半年確實有一段時間整個金融市場都在恐慌:“OpenAI 簽了這么多合約,它根本沒錢付”,Oracle 的股票暴跌,CoreWeave 的股票暴跌,信用市場也跟著慌。結(jié)果現(xiàn)在好了,OpenAI 融到錢了,可以付了。

Dwarkesh:那我想理解的是,“臨時搶算力”到底意味著什么?是 Neo Cloud(新興云服務商)的硬件質(zhì)量更差?還是說你得給云服務商額外付高額利潤,因為你來得太晚了?如果 OpenAI 和 Anthropic 到 2027 年算力規(guī)模差不多,那 OpenAI 到底得到了什么具體好處?今年年底兩家各有多少 GW?

Dylan:要獲取額外算力,確實有一些存量可用。不是所有的算力合約都是五年長約,也有一年、兩年、六個月甚至按需的短期合約。當這些合約到期時,誰最愿意出高價?我們已經(jīng)看到 H100 的價格大幅上漲,有些 AI 實驗室,我就不點名了,他們在簽每小時 2.4 美元、為期兩到三年的 H100 合約。要知道 H100 的五年部署成本大約是每小時 1.4 美元,而現(xiàn)在兩年后你簽的合約已經(jīng)到了 2.4 美元,利潤率高得多。

所以你可以用高價格把其他供應商的客戶擠出去,不管是亞馬遜、CoreWeave、Together AI 還是 Nebius。這些 Neo Cloud 的特點是 Hopper 占比更高(因為它們更激進地采購了),而且很多簽的是短期合約。所以如果你想要 Hopper 算力,市面上確實還有一些。至于 Blackwell,基本上所有在本季度上線的算力都已經(jīng)賣掉了。而且有些供應商實際交付的量還達不到承諾的數(shù)字,因為數(shù)據(jù)中心建設有延誤。

但還有一種路徑,Anthropic 不必直接持有所有算力。亞馬遜可以通過 Bedrock 提供算力為 Anthropic 服務,谷歌可以通過 Vertex,微軟可以通過 Foundry,然后跟 Anthropic 做收入分成。

Dwarkesh:所以你是說,Anthropic 要么接受 50% 的收入分成抽成,要么就得去接受臨時加價的現(xiàn)貨算力,如果當初早點買,就不需要多付這些錢。

Dylan:對,而且這里面還有一個有趣的動態(tài)。過去有好幾個月,所有人都在說“OpenAI,我們不會跟你簽合同,聽起來太瘋狂了,你們根本沒錢”。現(xiàn)在呢,所有人都說“我們一直都相信你,隨便簽什么合同都行,因為你融到錢了”。從這個意義上說,Anthropic 是受限的,因為市場上目前的增量算力大買家并不多,Anthropic 是第一個命中能力拐點、收入開始飛漲的。

不過我認為 Anthropic 通過自己的直接采購,加上通過 Bedrock、Vertex 和 Foundry 服務其產(chǎn)品,今年年底大概能達到 5 到 6 GW。這遠超它最初的計劃。OpenAI 大致也在這個量級,可能稍高一些。

Dwarkesh:這也引出一個有趣的問題。有人一直在討論 GPU 的折舊周期。空頭們說折舊應該是兩年而不是四五年,因為技術進步太快了。但按你說的,如果 H100 在 2024 年價值 2 美元/小時,2026 年 Blackwell 大批量部署后就只值 1 美元了,到 2027 年 Rubin 出來又降到 0.7 美元,但問題是,你造不出無限量的最新芯片。供給是有限的。所以給芯片定價的不是“我今天能買到什么更好的替代品”,而是“這顆芯片今天能為我產(chǎn)生多少價值”。

Dylan:完全正確。拿 GPT-5.4 來舉例。GPT-5.4 比 GPT-4 便宜得多,活躍參數(shù)更少,模型更小,不是像 GPT-4 那樣的粗粒度 MoE(混合專家模型),再加上訓練方法、RL(強化學習)、模型架構(gòu)、數(shù)據(jù)質(zhì)量等各方面的進步,GPT-5.4 的質(zhì)量遠超 GPT-4。一顆 H100 跑 GPT-5.4 能產(chǎn)出更多的 token,而且每個 token 的質(zhì)量更高。

想想看,GPT-4 的 token 最大 TAM(總可尋址市場)也許是幾十億美元。GPT-5.4 的 TAM 可能超過 1,000 億美元,只是采用需要時間,而且有競爭。如果技術進步停在這里不動了,一顆 H100 的價值就不再由 GPT-4 能從它身上榨取多少價值決定,而是由 GPT-5.4 能榨取多少價值決定,而后者遠大于前者。

所以一顆 H100 今天的價值確實比三年前更高。

Dwarkesh:這太瘋狂了。如果再往前推,假設我們真的開發(fā)出了 AGI 模型,真正實現(xiàn)了“服務器上的人類”。一顆 H100 大約有 10^15 FLOPS,有人估算人腦大約也是這個量級。如果一個人類知識工作者一年能產(chǎn)出六位數(shù)的經(jīng)濟價值,一顆 H100 的價值就是在幾個月內(nèi)就能收回成本。

Dylan:在那種場景下,GPU 的價值只會隨著時間推移不斷上升。目前只有 OpenAI 和 Anthropic 真正持有這個信念。但隨著時間推移,即便是開源模型,所有人都會開始看到每顆 GPU 的價值在飛漲。從這個意義上說,你現(xiàn)在就應該鎖定算力。

Dwarkesh:這讓我想到一個經(jīng)濟學效應叫 Alchian-Allen 效應,如果你對兩種商品同時加上一個固定成本(比如關稅),其中一種質(zhì)量更高、一種更低,那消費者會更傾向于選擇高質(zhì)量的那種,因為相對價差縮小了。

拿一個具體例子:好蘋果 2 美元,差蘋果 1 美元,好蘋果是差蘋果的 2 倍價格。如果對兩種蘋果各加 1 美元關稅,變成 3 美元和 2 美元,好蘋果只貴 1.5 倍了。如果 GPU 越來越貴,所有人都在付這個固定成本,那人們就更愿意多花一點錢用最好的模型,因為反正算力已經(jīng)花了那么多錢了,不如多花一點用最強的模型。

Dylan:完全對。如果一顆 Hopper 從每小時 2 美元漲到 3 美元,而它能產(chǎn)出 100 萬個 Opus token 或 200 萬個 Sonnet token,那 Opus 和 Sonnet 之間的價差就縮小了,因為 GPU 本身貴了 1 美元。事實上我們今天已經(jīng)看到,所有的使用量和收入都集中在最好的模型上。

在算力受限的世界里,還有兩件事同時發(fā)生:第一,那些早早鎖定了五年長約的公司,也就是沒有“承諾恐懼癥”的公司,鎖定了巨大的成本優(yōu)勢,因為它們按三年前或兩年前的價格買的算力。第二,誰能攫取利潤?隨著模型越來越有價值,云服務商能不能提價?

如果看 CoreWeave,它 98% 以上的算力合約平均期限超過三年,所以它沒法靈活提價。但每年新增的算力遠多于存量,Meta 今年新增的算力相當于它 2022 年整個數(shù)據(jù)中心和計算基礎設施的總量。新增算力按新價格成交,所以只要我們處于起飛階段,OpenAI 從去年的 600 MW 到 2 GW,今年到 6 GW 以上,明年到 12 GW,真正的成本在增量部分,不在存量長期合約上。

那誰掌握定價權?往上游走,最終是英偉達。它們已經(jīng)簽了約 900 億美元的長期合約,正在跟內(nèi)存廠商談三年期協(xié)議。英偉達、亞馬遜、谷歌(通過博通)和 AMD 這些芯片公司掌握著主動權,因為它們鎖定了產(chǎn)能。臺積電沒怎么漲價,但內(nèi)存廠商在大幅漲價。至少今年,我們會看到模型廠商的利潤率大幅提升,因為它們產(chǎn)能受限嚴重,不得不通過提價來抑制需求。Anthropic 不可能按目前的節(jié)奏繼續(xù)增長而不抑制需求。

英偉達搶先鎖定了臺積電產(chǎn)能;谷歌正面臨擠壓

Dwarkesh:那我們來具體聊聊英偉達是怎么鎖定邏輯和內(nèi)存產(chǎn)能的。據(jù)你的數(shù)據(jù),到 2027 年英偉達將占據(jù) N3(3 納米)晶圓產(chǎn)能的 70% 以上。如果看 Neo Cloud 的商業(yè)模式,英偉達通過給各種小型 Neo Cloud 分配算力來分散互補產(chǎn)業(yè)、確保自己有最大的議價權。

同樣,Anthropic 和 OpenAI 與數(shù)據(jù)中心供應商合作時也會故意培養(yǎng)一大批供應商,不被任何一家鎖定。那為什么在 3 納米制程上,臺積電就這么把產(chǎn)能大量給了英偉達,而不是試圖分散市場?

Dylan:先看 3 納米的背景,去年 3 納米的絕大部分產(chǎn)能是蘋果。蘋果現(xiàn)在正向 2 納米遷移,2 納米目前只能做移動芯片,未來 AI 芯片也會遷過去。內(nèi)存價格上漲也在擠壓蘋果,要么自己吃掉成本,要么削減出貨量。

臺積電的算盤其實是這樣的:它們更愿意把產(chǎn)能分配給做 CPU 的公司。比如亞馬遜既有 Trainium(AI 芯片)又有 Graviton(CPU),兩者都在 3 納米上。臺積電對 Graviton 的分配更積極,因為它們認為 CPU 業(yè)務是更穩(wěn)定的長期增長。作為一家保守的公司,臺積電不想過度依賴高增長市場的周期波動,所以優(yōu)先分配給增長更穩(wěn)的市場。對 AMD 也一樣,臺積電更看重它的 CPU 而不是 GPU。

但英偉達比較特殊,它有 CPU、交換機、網(wǎng)絡設備、NVLink、以太網(wǎng),各種產(chǎn)品。到今年年底 Rubin 系列發(fā)布時,英偉達的大多數(shù)產(chǎn)品都會在 3 納米上。而且英偉達就是更早下手了。比谷歌早,比亞馬遜早。谷歌和亞馬遜還碰到了一些波折,某顆芯片(Trainium)延遲了幾個季度。

而英偉達一直在說“要更多、更多、更多”。它會去檢查整個供應鏈的每個環(huán)節(jié),去 PCB 供應商那里確認“有沒有足夠的 PCB 產(chǎn)能?”,去內(nèi)存廠商那里確認“誰有所有的內(nèi)存產(chǎn)能?”,答案是英偉達。

道理和 AI 實驗室鎖定算力一樣。誰足夠相信 AGI,誰就敢在看起來荒謬的時間尺度上鎖定大量產(chǎn)能、支付不錯的利潤率。英偉達在半導體供應鏈上做的是同樣的事。雖然我不認為英偉達像 Dario 或 Sam 那樣真正相信 AGI,Jensen 一直說的是“加速計算”,不是“AI 芯片”,但他比去年三季度的谷歌和亞馬遜 AGI 信念強得多,也看到了更多的需求。

Dwarkesh:等一下,谷歌不是賣了大約一百萬顆 V7(Ironwood)TPU 給 Anthropic 嗎?如果邏輯和內(nèi)存是最大瓶頸,谷歌又有 DeepMind 這個世界第三大 AI 實驗室,為什么不把芯片留給自己,而是賣給 Anthropic?

Dylan:這個問題確實讓 DeepMind 的人很崩潰,“我們?yōu)槭裁匆@樣做?”但谷歌云的人和谷歌高管看到的是另一套邏輯。據(jù)我們掌握的數(shù)據(jù),事情是這樣的:Anthropic 的算力采購團隊核心成員有兩位來自谷歌,他們看到了一個窗口期,快速談判了一筆交易,在谷歌自己反應過來之前就拿到了算力。

具體的時間線是,去年三季度初,我們在大約六周內(nèi)看到 TPU 的產(chǎn)能出現(xiàn)了顯著增長,而且是多次增加。谷歌甚至不得不向臺積電解釋為什么突然需要增加這么多產(chǎn)能,很大一部分就是因為要賣給 Anthropic。

然后事情發(fā)生了轉(zhuǎn)折。谷歌推出了 Nano Bono 和 Gemini 3,用戶指標暴漲。谷歌高層突然清醒了過來,開始說“我們必須每六個月把算力翻一倍”之類的話。然后他們?nèi)フ遗_積電說想要更多,但臺積電說:“抱歉,明年的產(chǎn)能已經(jīng)賣光了。我們可以在 2026 年多給 5% 到 10%,但真正能大幅增加得等到 2027 年。”

從供應鏈數(shù)據(jù)來看,比如晶圓訂單、數(shù)據(jù)中心合同、Anthropic 簽約的情況等,在我看來,很明顯谷歌搞砸了。從收入數(shù)據(jù)也能看出來:谷歌的 Gemini 收入在去年一季度和三季度幾乎為零,三季度才開始起量,四季度退出時大約到了 50 億美元 ARR。說明谷歌確實沒預見到收入會暴漲。Anthropic 在收入起飛之前就已經(jīng)有“承諾恐懼癥”了,谷歌當然會更保守,谷歌的 ARR 甚至還不如 Anthropic 高。

不過好消息是,從那以后谷歌已經(jīng)極度 AGI 化了。它們收購了能源公司,預付了渦輪機定金,購買了大量有電力的土地,跟公用事業(yè)公司談長期協(xié)議,在數(shù)據(jù)中心電力方面非常激進。谷歌大約在去年年底才真正醒過來,但確實花了一些時間。

到 2030 年,ASML 將成為 AI 算力擴展的最大瓶頸

Dwarkesh:過去幾年,每年的瓶頸都在變,前年是 CoWoS 封裝,去年是電力。今年的瓶頸是什么?五年后呢?

Dylan:今年最大的瓶頸是芯片本身。瓶頸已經(jīng)從電力和數(shù)據(jù)中心切換回了半導體供應鏈。在芯片供應鏈內(nèi)部,有多個瓶頸:內(nèi)存、臺積電的邏輯晶圓、晶圓廠本身。晶圓廠建設需要兩到三年,而數(shù)據(jù)中心不到一年,亞馬遜最快八個月就能建一個。差距非常大。

之前的瓶頸,包括 CoWoS 封裝、電力、數(shù)據(jù)中心,都是相對短交期的東西。CoWoS 是比較簡單的芯片封裝工藝,電力和數(shù)據(jù)中心雖然復雜但比芯片制造簡單得多。過去一段時間,移動和 PC 芯片的產(chǎn)能在向數(shù)據(jù)中心滑動,但這種騰挪空間已經(jīng)用盡了。英偉達現(xiàn)在是臺積電最大的客戶,也是 SK 海力士(最大的內(nèi)存制造商)最大的客戶。移動和 PC 行業(yè)已經(jīng)沒有更多資源可以轉(zhuǎn)給 AI 了。

Dwarkesh:基于 EUV 光刻機的產(chǎn)量。有沒有可能算出 2030 年的一個絕對 GW 天花板?

Dylan:完全可以。要進一步擴大算力,今年和明年有不同的瓶頸,但到 2028、2029 年,瓶頸最終會落到供應鏈的最底層——ASML。ASML 制造的是人類有史以來最復雜的機器:EUV(極紫外光刻機),單臺售價 3 到 4 億美元。目前它每年能造大約 70 臺,明年到 80 臺。即使在非常激進的供應鏈擴張假設下,到這個十年末它也只能到 100 臺出頭。

那 EUV 怎么跟 AI 算力掛鉤?我來算一筆賬。造一個 GW 的英偉達 Rubin 芯片數(shù)據(jù)中心容量,你需要大約 55,000 片 3 納米晶圓、6,000 片 5 納米晶圓和約 170,000 片 DRAM(內(nèi)存)晶圓。這三種晶圓各需要不同數(shù)量的 EUV 光刻步驟。一片先進的 3 納米邏輯晶圓大約有 70 層光刻,其中 20 層是最關鍵的 EUV 光刻。算下來,55,000 片晶圓乘以 20 次 EUV 曝光,就是 110 萬次 EUV 曝光。加上 5 納米和內(nèi)存的部分,一個 GW 總共需要大約 200 萬次 EUV 曝光。

一臺 EUV 光刻機大約每小時處理 75 片晶圓,開機率約 90%。算下來,大約需要 3.5 臺 EUV 光刻機才能滿足一個 GW 的需求。

想想這些數(shù)字的對比:一個 GW 的數(shù)據(jù)中心資本支出大約 500 億美元,而支撐它的 3.5 臺 EUV 光刻機成本只有 12 億美元。500 億美元甚至 1,000 億美元的 AI 價值鏈被 12 億美元的光刻設備卡住了,僅僅因為它的供應鏈無法快速擴張。

Dwarkesh:你前陣子寫過,臺積電過去三年花了 1,000 億美元的資本支出。英偉達只用了其中一小部分的 3 納米產(chǎn)能,就把它變成了每季度 400 億美元的收入,年化 1,600 億。然后再往下游看 ASML,12 億美元的光刻機就能支撐一個 GW。Sam Altman 說他想到 2030 年每周上線一個 GW,這跟 EUV 產(chǎn)能兼容嗎?

Dylan:完全兼容。臺積電和整個生態(tài)系統(tǒng)目前已經(jīng)擁有 250 到 300 臺 EUV 光刻機的存量。再加上今年 70 臺、明年 80 臺,逐步增長到 100 臺,到 2030 年底全球會有大約 700 臺 EUV 光刻機。700 臺除以 3.5 臺/GW,如果全部分配給 AI(當然不可能),就是 200 GW 的 AI 芯片產(chǎn)能。

Sam 想要 52 GW/年。如果全球 AI 用掉 200 GW 的芯片產(chǎn)能,他拿 25% 的份額。考慮到今年他可能就已經(jīng)獲取了約 25% 的 Blackwell GPU 部署量,這個數(shù)字其實是很合理的。

Dwarkesh:我很驚訝的是,ASML 大約從 2020 年才開始大批量出貨 EUV,到 2030 年人們還在用十年前的機器?

Dylan:工具確實不是原封不動的。ASML 在持續(xù)改進光刻機的幾項關鍵指標。第一是晶圓產(chǎn)出速度,一直在提升。第二是一個叫“overlay(套刻精度)”的規(guī)格,你做了第一層光刻和一堆沉積、蝕刻步驟之后,做第二層時,兩層圖案必須精確對齊在一起,允許的偏差只有 3 納米量級。這項指標也在快速改善。第三,工具的價格確實漲了,從最初的 1.5 億美元到現(xiàn)在的 4 億美元,但漲幅沒有性能提升幅度大。

順便說一句,ASML 可能是世界上最慷慨的壟斷公司了。它在 EUV 領域沒有任何競爭者,也許中國到本十年末會有一些,但 ASML 從來沒有像英偉達那樣瘋狂提價。它的價格漲幅始終沒超過性能提升幅度,一直在為客戶提供凈價值。

Dwarkesh:如果 ASML 直接把資本支出翻倍或翻三倍呢?為什么我們能如此有信心地預測,五年后它也只能造 100 臺左右?

Dylan:幾個原因。首先,ASML 沒有決定全力擴產(chǎn)。整個半導體供應鏈都沒有。它們經(jīng)歷過太多周期的繁榮與蕭條。沒有人真正相信每年 200 GW 的 AI 芯片需求或者每年數(shù)萬億美元的半導體支出。我們不斷被告知我們的數(shù)字太高了,然后當我們的預測被驗證時,他們又說“好吧,但你明年的數(shù)字肯定還是太高了”。

其次,一臺 EUV 光刻機有四個核心組件:光源(由位于圣地亞哥的 Cymer 制造)、掩膜臺(在康涅狄格州威爾明頓制造)、晶圓臺和光學系統(tǒng)(在歐洲制造)。每個組件都有極其復雜的供應鏈。

我來描述一下光源是怎么工作的。它每秒釋放數(shù)萬個錫液滴,然后用激光精準地三次擊中每個液滴,第一次命中使錫滴展開,第二次使它擴展成完美的形狀,第三次高功率轟擊使錫滴激發(fā)出 13.5 納米的 EUV 光。然后收集光線并導入透鏡組。

透鏡組由蔡司(Carl Zeiss)制造,這是最關鍵的部分。每臺光刻機大約有 18 面透鏡/反射鏡,它們是多層反射鏡,由鉬和釕(如果我沒記錯的話)的完美薄層交替堆疊而成。光線在這些鏡面上精確反射。任何沉積層的缺陷、任何曲率問題都會導致失敗。這個制造過程非常手工化,每年只造幾百到一千面這樣的透鏡。蔡司也沒有試圖大幅擴產(chǎn),因為它們也不認為需要從 60 臺增長到幾百臺。

然后是掩膜臺,這個東西運動時承受 9 個 G 的加速度。因為光刻過程中,掩膜臺和晶圓臺在反方向高速移動,掃描晶圓上 26×33 毫米的區(qū)域,然后停下來移到下一個區(qū)域,在幾秒內(nèi)完成。兩個方向各 9 個 G。

每個組件都是化學、制造工藝、機械工程、光學工程的奇跡。全部需要大量的計量測試,因為任何偏差都會導致良率歸零。而且這臺巨大的機器在荷蘭埃因霍溫的工廠組裝好之后,要拆開裝上多架飛機運到客戶現(xiàn)場,再重新組裝測試,這個過程又要好幾個月。

ASML 的供應鏈有超過一萬家供應商。整個系統(tǒng)中,每個物理運動部件的精度都必須小于 1 納米,因為各個環(huán)節(jié)的誤差會累加,而層間套刻精度要求在 3 納米量級。你不可能打個響指就擴大產(chǎn)量。

打個比方:美國從 0% 的電力增長轉(zhuǎn)向 2% 的電力增長,而中國已經(jīng)在 30% 了,光這一步對美國來說都極其困難。電力供應鏈相對簡單,從業(yè)人員可能有十萬人以上。而 ASML 員工數(shù)量有限,蔡司做這個的可能不到 1,000 人,每個人都是超級專業(yè)化的。你沒法在短時間內(nèi)培訓出這些人才,也沒法讓整個供應鏈立刻動員起來。

我們難道不能直接利用臺積電的舊晶圓廠嗎?

Dwarkesh:過去幾年,每次有人說“AI 算力被 X 卡住了”,你都能指出替代方案,電網(wǎng)不夠?那就用廠區(qū)自備發(fā)電、燃氣輪機。半導體供應鏈也能這樣繞過去嗎?如果 EUV 成為瓶頸,那我們回到 7 納米,用中國正在用的 DUV 多重曝光技術行不行?A100 是 7 納米,到 B100 大約只有 3 倍的 FP16 性能提升,而且其中一部分是架構(gòu)改進而非制程改進。7 納米有大量存量產(chǎn)能,即使打個 50% 的折扣,不是也能再增加 50 到 100 GW 嗎?

Dylan:理論上有可能走到那一步,但我認為不太可能。有幾個不太公平的對比需要澄清。

從 A100(312 TFLOPS FP16)到 Blackwell(約 1,000 TFLOPS FP16)到 Rubin(約 5,000 TFLOPS FP16),這些數(shù)字看起來只是幾倍的差距,但實際性能差距遠大于此。因為每代芯片的設計目標不同,A100 針對 FP16 優(yōu)化,Hopper 針對 FP8,Rubin 針對 FP4 和 FP6。所以單看 FLOPS 不是公平的比較。

更關鍵的是,這些模型不是跑在單顆芯片上的。DeepSeek 的生產(chǎn)部署跑在 160 顆 GPU 上。每次跨越芯片邊界就有效率損失,延遲、功耗、帶寬都受影響。芯片內(nèi)部的數(shù)據(jù)傳輸速度是每秒數(shù)十到數(shù)百 TB,芯片之間降到每秒 TB 量級,跨機架降到每秒數(shù)百 Gb。

所以當你比較 Hopper 和 Blackwell 在推理 DeepSeek 和 Kimi K2.5 等模型時的實際性能差距,在 100 tokens/秒的推理場景下,差距大約是 20 倍,不是 FLOPS 數(shù)字暗示的 2-3 倍。因為芯片更大了,每顆芯片的計算密度更高,單芯片內(nèi)的通信帶寬遠超跨芯片通信,所以很多通信瓶頸被消除了。

這個差距是累加的:每顆芯片的 FLOPS、芯片間網(wǎng)絡速度、單芯片上有多少 FLOPS 相對于系統(tǒng)、單芯片內(nèi)存帶寬和整個系統(tǒng)的內(nèi)存帶寬,所有這些因素疊加在一起。

Dwarkesh:今年 B200 已經(jīng)把兩個 die 做到一顆芯片上了,明年 Rubin Ultra 會是 4 個 die。為什么不繼續(xù)加?一顆芯片上能放多少個 die 還能保持這種高帶寬?

Dylan:即便在 Blackwell 內(nèi)部,同一個 package 里跨 die 通信也有性能損失,雖然比跨 package 小得多。英偉達的方案是 CoWoS 封裝。你可以回過頭看 Tesla 的 Dojo 芯片,它把 25 顆芯片做在一整片晶圓上。它到今天可能仍然是跑卷積神經(jīng)網(wǎng)絡最好的芯片,只是不擅長 Transformer,因為內(nèi)存和算力的形狀不適合。華為的 Ascend 910 也在做類似的事,從單 die 到雙 die,專注于擴展封裝。

但你在 7 納米上能做的,在 3 納米上也能做。先進封裝是兩個維度都在推進的。

中國半導體規(guī)模何時會超越西方?

Dwarkesh:如果到 2030 年西方有最先進的制程但產(chǎn)能沒拉滿,而中國雖然制程落后但瘋狂擴產(chǎn),而且整條供應鏈都在一個國家內(nèi),什么時候會出現(xiàn)交叉點?

Dylan:到目前為止,中國仍然沒有完全自主的半導體供應鏈。中國所有的 7 納米和 14 納米產(chǎn)能都用的是 ASML 的 DUV 光刻機,ASML 持續(xù)向中國出貨,但所有 EUV 收入都在中國之外。所以規(guī)模優(yōu)勢目前仍在西方加臺灣和日本這邊。

Dwarkesh:到 2030 年,中國會有完全自主的 DUV 和 EUV 嗎?

Dylan:DUV 我覺得肯定會有。EUV 嘛,我認為他們會有能工作的工具,但不一定能大量生產(chǎn)。就像 ASML 在 2010 年代初就讓 EUV 在實驗室里工作了,但精度不夠、產(chǎn)量不夠、可靠性不夠,又花了五到七年才進入大規(guī)模量產(chǎn)。中國的 DUV 國產(chǎn)化到 2030 年可能達到每年約 100 臺的產(chǎn)量,而 ASML 目前每年出貨數(shù)百臺 DUV。

Dwarkesh:我覺得有一個很有意思但討論不夠的問題:如果你認為 AI 的時間線是“長”的,比如 2035 年才達到某個關鍵能力,那時候中國在半導體上會不會已經(jīng)超過西方了?舊金山的人在以周為單位思考,舊金山以外的人根本不在想 AGI。如果 AGI 真的到 2035 年才來,而它會帶來數(shù)十萬億美元的經(jīng)濟增長,那到時候誰控制半導體就太重要了。

Dylan:這確實是個非常難的問題。時間尺度拉到 2035 年,誤差棒變得巨大。但我的基本判斷是:如果快速起飛,不一定要相信 AGI,只要 AI 收入以當前速度持續(xù)增長,那美國和西方正在拉開差距。

看看現(xiàn)在的情況:美國今年大約有接近 1 萬億美元的資本支出投入數(shù)據(jù)中心。Anthropic 一月新增 40 億收入,二月新增 60 億,而 Claude Code 的可靠性還因為算力不足而受限,如果去掉這個瓶頸,增速可能更快。這些資本支出的投資回報率極高。美國經(jīng)濟因此增長加速。

中國目前還沒有做到這一點,沒有建起同等規(guī)模的基礎設施,也沒有訓練出同等能力的模型來部署和產(chǎn)生收入。而且 Opus 4.6 和 GPT-5.4 已經(jīng)明顯拉開了與中國模型的差距。當 AI 實驗室從“賣 token 和推理鏈”轉(zhuǎn)向“賣自動化白領工作”時,從美國模型蒸餾到中國模型的難度會大幅增加,因為你買的不再是展示完整推理鏈的 token,而是結(jié)果。

如果起飛速度夠快,美國在發(fā)散。如果起飛速度慢,中國就有時間建立完全自主的垂直整合供應鏈。快時間線,美國贏;慢時間線,中國贏。

即將到來的巨大內(nèi)存瓶頸

Dwarkesh:HBM(高帶寬內(nèi)存)由 DRAM 制造,但每單位晶圓面積的比特數(shù)只有普通 DRAM 的三到四分之一。如果未來 AI 應用更多是 agent(智能代理),不需要同步聊天那種極低延遲,能不能用普通 DRAM 代替 HBM?

Dylan:理論上可以。Anthropic 甚至可以推出一個“慢模式”,大幅降低 Opus 4.6 的價格,可能降 4-5 倍,速度降 2 倍。但沒人想用慢模型。即使 agent 任務可以跑幾個小時,如果模型更快的話幾個小時就能變成一個小時。最有價值的任務往往也有時間敏感性。

更根本的問題在于帶寬。一塊 HBM4 芯片堆的帶寬大約是 2.5 TB/s,2,048 bit 寬、10 Giga transfers/秒。同樣的芯片邊緣面積放 DDR5 呢?大約 64 或 128 bit 寬,傳輸速率 6.4-8 GT/s,帶寬只有大約 64-128 GB/s。差一個數(shù)量級。而芯片的邊緣面積是有限的,die 的最大尺寸是 26×33 毫米,邊緣放內(nèi)存和 I/O,內(nèi)部放計算單元。你受限于帶寬。

推理性能受四個約束:FLOPS、網(wǎng)絡帶寬、內(nèi)存帶寬和內(nèi)存容量。如果換成 DDR,你確實得到了 4 倍的比特數(shù)/晶圓,但內(nèi)存帶寬暴跌,所有那些計算單元就只能干等著,算力被浪費了。

Dwarkesh:那回到宏觀層面,你在 newsletter 里說 2026 年大型科技公司資本支出的 30% 要花在內(nèi)存上?

Dylan:對,去掉英偉達的利潤率堆疊之后,大約三分之一的資本支出花在內(nèi)存上。

內(nèi)存價格還會繼續(xù)漲。這對市場不同部分的影響是不同的。一部 iPhone 有 12 GB 內(nèi)存,以前每 GB 大約 3-4 美元,所以內(nèi)存成本大約 50 美元。現(xiàn)在 DDR 漲到了約 12 美元/GB,變成 150 美元,多了 100 美元。蘋果不太會全部自己吃掉這個成本,所以最終消費者可能要為一部 iPhone 多付大約 250 美元。

但這只是高端市場,蘋果每年只賣兩三億部手機。大頭在中低端市場。之前全球每年賣 14 億部智能手機,現(xiàn)在降到 11 億。我們的預測是今年可能降到 8 億,明年 6 億甚至 5 億。我們在亞洲的分析師追蹤到小米和 OPPO 正在把中低端手機出貨量砍半。因為低端手機內(nèi)存占物料成本的比例更高,利潤更薄,根本吃不下這個成本上漲。

關鍵是,砍掉的主要是低端,每部手機內(nèi)存量小,釋放出來的內(nèi)存產(chǎn)能也少。消費端仍然占全球內(nèi)存需求的一半以上。釋放出來的 DRAM 會流向 AI 芯片,AI 客戶愿意簽更長的合約、付更高的價格。

NAND 閃存也在漲價。但手機和 PC 的 NAND 占比更高,所以當消費需求被擠壓時,釋放的 NAND 相對更多,DRAM 漲價幅度會大于 NAND。

這大概率會讓普通消費者更加厭惡 AI。你已經(jīng)能在 PC 論壇和 Twitter 上看到各種表情包了,“就是因為這些貓咪跳舞視頻(指 AI 訓練),內(nèi)存價格翻倍了,我買不起新顯卡了”。等內(nèi)存價格再翻一倍,情況只會更糟。

Dwarkesh:為什么不能多造一些內(nèi)存?

Dylan:限制內(nèi)存擴產(chǎn)的原因跟限制邏輯芯片擴產(chǎn)的原因驚人地相似。過去三四年,內(nèi)存廠商根本沒建新晶圓廠。2023 年內(nèi)存價格很低,廠商在虧錢,所以不建廠。市場慢慢恢復,但直到去年價格才真正起來。我們一年半前就一直在說:推理意味著長上下文,長上下文意味著大 KV Cache,大 KV Cache 意味著需要大量內(nèi)存,而 AI 加速器成本的一半就是內(nèi)存。

但從“顯然需要更多內(nèi)存”到內(nèi)存價格實際反映這個現(xiàn)實,花了整整一年。價格反映之后,又過了三到六個月內(nèi)存廠商才開始建新廠。而新廠建設需要兩年。所以有意義的新產(chǎn)能要到 2027 年底或 2028 年才能上線。

現(xiàn)在的情況是一些非常規(guī)操作,美光收購了臺灣一家做落后制程芯片的公司的晶圓廠,SK 海力士和三星也在想各種辦法在現(xiàn)有廠房里擠出產(chǎn)能。核心問題就是,沒有地方放設備。晶圓廠是人類建造的最復雜的建筑,建設需要兩年。

在美國擴展電力供應不會成為問題

Dwarkesh:聽起來你認為電力可以幾乎無限擴展?

Dylan:不是無限,但電力不會成為主要瓶頸。

目前今年我們大約部署 20 GW 的關鍵 IT 容量。需要注意,我說的 GW 是服務器插上電源的實際功耗,但還有傳輸損耗、變換損耗、冷卻功耗等,所以發(fā)電端要上浮 20-30%。而且渦輪機不是 100% 運行,PJM(美國最大的電網(wǎng)之一)在模型中假設渦輪機的開機率約 90%,外加 20% 的冗余容量。所以發(fā)電端的銘牌容量始終遠高于實際關鍵 IT 容量。

但電力來源不只是聯(lián)合循環(huán)燃氣輪機(CCGT)。雖然全球只有三家 CCGT 制造商,GE Vernova、三菱、西門子,但我們追蹤了 16 家不同的天然氣發(fā)電設備制造商。還有航改型燃氣輪機,把飛機引擎改成發(fā)電機,包括像 Boom Supersonic 這樣的新進入者在跟 Crusoe 合作。

還有中速往復式發(fā)動機,康明斯等十幾家廠商。以前柴油發(fā)動機主要用在卡車上,現(xiàn)在汽車產(chǎn)量在下降,這些廠商有產(chǎn)能可以轉(zhuǎn)做數(shù)據(jù)中心發(fā)電。船用發(fā)動機也可以,Nebius 在新澤西州就是用船用發(fā)動機為微軟的數(shù)據(jù)中心發(fā)電。Bloom Energy 在做燃料電池,我們對它很看好,已經(jīng)看好一年半了。還有太陽能加儲能、風電加儲能,成本曲線在持續(xù)下降。

還有一個很重要的維度:美國電網(wǎng)的容量是按用電高峰設計的,夏天最熱的那天。但那只是全年平均負荷的 10-15-20%。如果部署足夠多的公用事業(yè)級儲能或調(diào)峰電廠,可以是燃氣、工業(yè)燃氣輪機、電池、任何上述電源,你就能釋放出美國電網(wǎng) 20% 的容量給數(shù)據(jù)中心。因為大部分時間那些容量是閑置的,只在每年幾天的幾個小時會達到峰值。美國電網(wǎng)是太瓦級的,20% 就是 200 多 GW。

今天數(shù)據(jù)中心只占美國電網(wǎng)的 3-4%,到 2028 年會到 10%。而如果能像我說的這樣釋放電網(wǎng)容量,空間是非常充足的。這些事情不容易,涉及大量的硬件工程和風險,但供應鏈比芯片簡單太多了。

Dwarkesh:即使 CCGT 可能要 1500 美元/千瓦的資本支出,其他技術成本更高也沒關系?

Dylan:可以高到 3,500 美元/千瓦。電力成本翻倍意味著什么?一顆 Hopper 的部署成本從每小時 1.4 美元變成 1.5 美元。因為模型的邊際效用提升遠大于那一毛錢的能源成本增加。

我們追蹤的數(shù)據(jù)顯示,到這個十年末,大約一半的新增數(shù)據(jù)中心容量會是“behind the meter”(廠區(qū)自備發(fā)電)。Behind the meter 幾乎總是比電網(wǎng)接入貴,但電網(wǎng)有審批、互聯(lián)排隊等各種問題。Behind the meter 的技術路線非常多樣,往復式發(fā)動機、船用發(fā)動機、航改燃機、CCGT、Bloom Energy 燃料電池、太陽能加儲能,每一種技術單獨都能做到數(shù)十 GW,加起來就是數(shù)百 GW。

太空 GPU 在這十年內(nèi)不會實現(xiàn)

Dwarkesh:馬斯克非常看好太空數(shù)據(jù)中心。如果你說電力在地面不是瓶頸,那太空數(shù)據(jù)中心的理由是什么?馬斯克可能會說地面的審批太難了。

Dylan:用地方面,美國很大,數(shù)據(jù)中心占地不多。空氣排放許可是個挑戰(zhàn),但特朗普政府已經(jīng)降低了門檻,在得克薩斯州可以跳過很多這類繁文縟節(jié)。

太空確實能源免費,這是唯一的理由。但即便地面電力成本翻倍,它仍然只占 GPU 總成本的一小部分。

真正區(qū)分各個云服務商的,除了軟件之外,是它們部署和管理故障的能力。GPU 可靠性很差,Blackwell 大約 15% 部署后需要返修。你已經(jīng)在地面測試好了,然后要拆掉、裝上火箭、送進太空、再重新上線——這至少多花六個月。而在算力受限的世界里,前六個月是算力最有價值的時候,因為現(xiàn)在比未來更稀缺。你延遲了六個月的算力部署。地面上我們看到有的云服務商部署 GPU 需要六個月,有的快得多。太空不可能更快。

Dwarkesh:那通信怎么辦?Starlink 衛(wèi)星之間現(xiàn)在是 100 Gb/s 的激光鏈路,未來可以更高,接近 InfiniBand 的 400 Gb/s。

Dylan:但那是每顆 GPU 的帶寬,不是每個機架。而且還要乘以 72(一個 NVL72 里的 GPU 數(shù)量)。從 Hopper 到 Blackwell 到 Rubin 還分別翻倍。

更關鍵的是,隨著模型變得越來越稀疏(MoE 專家越來越多,領先模型已經(jīng)有數(shù)百甚至上千個專家),你需要在成百上千顆芯片之間做通信。你沒法把衛(wèi)星做到無限大,所以需要衛(wèi)星間的互聯(lián)。這些空間激光比地面的可插拔光收發(fā)器貴得多、可靠性更差,地面的光收發(fā)器是百萬級量產(chǎn)的,而且已經(jīng)很不可靠了,經(jīng)常需要拔出來擦一擦再插回去。

歸根結(jié)底,空間數(shù)據(jù)中心面臨的是同一個稀缺資源:我們到本十年末每年只能造 200 GW 的芯片。不管放在地面還是太空,都不重要。芯片是最大的瓶頸,所以你要做的是讓芯片在制造完成的那一刻就開始工作產(chǎn)出 token。為此,地面的人們在做各種事情來加速部署,數(shù)據(jù)中心模塊化、機架模塊化、甚至在數(shù)據(jù)中心現(xiàn)場才裝芯片(其他所有東西提前布好線)。這些在太空做不到。

太空數(shù)據(jù)中心終會有意義的那一天,但不會在這個十年,而是在更遠的未來。當能源真正成為大瓶頸、當土地和審批更加困難、當芯片不再是瓶頸的時候。馬斯克不靠 20% 的優(yōu)化贏,他靠的是 10 倍的顛覆,那是 SpaceX 和 Tesla 成功的模式。太空數(shù)據(jù)中心也許最終能提供 10 倍優(yōu)勢,但不是在地球資源還沒用完的時候。

為什么沒有更多對沖基金進行 AGI 交易?

Dwarkesh:你做 SemiAnalysis 這些數(shù)據(jù)表格,六個月前預測了內(nèi)存危機,現(xiàn)在在講清潔室(潔凈室)危機,未來是設備危機。為什么只有 Leopold Aschenbrenner(前 OpenAI 超級對齊團隊研究員,對沖基金 Situational Awareness LP 創(chuàng)始人,專注押注 AI 基礎設施供應鏈的公開市場股票。

該基金 2025 年上半年扣費后回報率達 47%,遠超同期標普 500 的 6%;截至 2025 年四季度,其公開持倉規(guī)模從創(chuàng)立時的 2.25 億美元增長至約 55 億美元)在用你的數(shù)據(jù)賺瘋了?其他人在干什么?

Dylan:很多人在賺錢,只是方式不同。Leopold 開玩笑說他是唯一一個告訴我“你的數(shù)字太低了”的客戶,其他所有人都說我的數(shù)字太高了。不管是超級云廠商還是 AI 實驗室,都說“那家公司不可能有那么多”,然后我們得費勁用事實說服他們。有時候他們要六個月到一年才接受現(xiàn)實。

我大約 60% 的業(yè)務來自產(chǎn)業(yè)客戶,AI 實驗室、數(shù)據(jù)中心公司、超級云廠商、半導體公司。另外 40% 來自對沖基金。很多基金也在用我們的數(shù)據(jù)交易。比如內(nèi)存交易,一年前如果你告訴別人內(nèi)存價格會翻四倍、智能手機出貨量下降 40%,所有人都會說你瘋了。但有一些人相信了,而且交易了內(nèi)存股票。Leopold 當然在持倉規(guī)模和倉位構(gòu)建上做得可能比大多數(shù)人好,但他絕不是唯一一個。

關鍵在于信念。你得真正相信 AI 會以這種方式爆發(fā),才會去做這些交易。而 Leopold 可能是所有人中對 AGI 起飛最有信念的。

臺積電會將蘋果踢出 N2 制程名單嗎?

Dwarkesh:如果英偉達、亞馬遜和谷歌都愿意為 N2 產(chǎn)能出高價,臺積電會不會把蘋果踢出去?

Dylan:不會直接踢出去。芯片設計周期很長,超過一年,所以更可能發(fā)生的是英偉達等預付產(chǎn)能擴張費用。臺積電不會完全驅(qū)逐蘋果,但當蘋果訂了 X 的量時,臺積電可能會說“我們預測你只需要 X-1”,然后只給 X-1。蘋果傳統(tǒng)上總是多訂 10%、然后在年中削減 10%。這個彈性空間蘋果以后可能就沒有了。

今年蘋果仍然占據(jù) N2 大部分產(chǎn)能,AMD 也在爭取一小部分來早期做 AI 芯片和 CPU——這對 AMD 來說是個很大的賭注,因為新制程有延遲風險。但隨著時間推移,蘋果占臺積電收入的比例會越來越小。

到 A16 節(jié)點時,第一個客戶已經(jīng)不是蘋果而是 AI。蘋果不再是臺積電最親密的伙伴了,它的業(yè)務沒在增長,而臺積電的資本支出在膨脹。加上內(nèi)存和封裝成本上漲擠壓蘋果的物料成本,蘋果的出貨量可能會下降,進一步變成一個不那么重要的客戶。

機器人與地緣風險

Dwarkesh:如果到 2030 年有數(shù)百萬臺人形機器人在運行,每臺都需要本地算力,這對半導體有什么影響?

Dylan:不需要把所有智能都放在機器人里。更高效的做法是把大部分規(guī)劃和高層任務交給云端更強大的模型來做,高批量推理、更大的模型。云端給出指令比如“拿起那個杯子”,然后機器人本地的小模型處理具體的力度、重量等實時反饋。每秒或每秒十次從云端更新指令就夠了。

如果把所有處理都放在設備端,一是更貴(無法做批量推理),二是智能不夠(云端模型更大更強),三是我們處于半導體短缺的世界,機器人需要先進制程芯片(因為功耗敏感),你每給一臺機器人裝一顆先進芯片,就少了一顆給 AI 數(shù)據(jù)中心的。

Dwarkesh:這其實暗示了一個關于未來的有趣事實,智能會高度集中在物理空間上。今天 80 億人的計算是分布在每個人的腦袋里的。未來即使有數(shù)百萬臺機器人散布在世界各地,實際的思考和計算仍然在集中式數(shù)據(jù)中心里完成。

Dylan:沒錯。我覺得馬斯克也意識到了這一點,所以他跟三星簽了大合同來造機器人芯片,一方面分散地緣風險,另一方面三星的 AI 芯片產(chǎn)能競爭沒臺積電那么激烈。他同時得到了地緣政治多元化和供應鏈多元化,而且不必跟那些愿意付“無限”價格的數(shù)據(jù)中心買家直接競爭。

參考資料:

1.https://www.youtube.com/watch?v=mDG_Hx3BSUE

運營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
美軍死傷5800人!五角大樓下令大舉增兵,伊朗:動員百萬人迎戰(zhàn)

美軍死傷5800人!五角大樓下令大舉增兵,伊朗:動員百萬人迎戰(zhàn)

大國之翼
2026-03-28 07:06:24
全球唯一雙座隱身戰(zhàn)機!殲-20S跨界作戰(zhàn)有多震撼?專家解析

全球唯一雙座隱身戰(zhàn)機!殲-20S跨界作戰(zhàn)有多震撼?專家解析

齊魯壹點
2026-03-27 06:56:45
NBA官方MVP榜:文班亞馬火速登頂!這波MVP爭奪戰(zhàn)太激烈了

NBA官方MVP榜:文班亞馬火速登頂!這波MVP爭奪戰(zhàn)太激烈了

仰臥撐FTUer
2026-03-27 22:41:07
女孩當小姐,一晚要提供4到5次上門服務,被親人點到不赴約

女孩當小姐,一晚要提供4到5次上門服務,被親人點到不赴約

情感藝術家
2026-02-26 10:48:00
全球僅3國能造,俄羅斯拒絕中方請求,我國一氣之下沖至世界領先

全球僅3國能造,俄羅斯拒絕中方請求,我國一氣之下沖至世界領先

史行途
2026-03-28 03:44:47
德國人日常三餐曝光!6個習慣讓人不去醫(yī)院,國人看完沉默了?

德國人日常三餐曝光!6個習慣讓人不去醫(yī)院,國人看完沉默了?

路醫(yī)生健康科普
2026-03-04 12:30:03
普通人接觸富人的生活有多震撼?網(wǎng)友:吸引力法則讓我刷到你!

普通人接觸富人的生活有多震撼?網(wǎng)友:吸引力法則讓我刷到你!

解讀熱點事件
2026-03-22 00:05:09
李楠談蘋果CEO庫克:他沒有活成第二個喬布斯 把庫存芯片當作盈利的籌碼

李楠談蘋果CEO庫克:他沒有活成第二個喬布斯 把庫存芯片當作盈利的籌碼

快科技
2026-03-27 22:17:35
鐵出天際,山東后衛(wèi)組合高詩巖&于德豪全場合計7中0合砍1分

鐵出天際,山東后衛(wèi)組合高詩巖&于德豪全場合計7中0合砍1分

懂球帝
2026-03-27 22:17:05
香港知名凍齡女星文頌嫻,時隔二十年復出拍戲,婚姻狀態(tài)耐人尋味

香港知名凍齡女星文頌嫻,時隔二十年復出拍戲,婚姻狀態(tài)耐人尋味

絢麗的畫卷
2026-03-27 23:44:30
放棄轟炸美航母?伊朗槍口大調(diào)轉(zhuǎn),這招反殺讓整個中東膽寒

放棄轟炸美航母?伊朗槍口大調(diào)轉(zhuǎn),這招反殺讓整個中東膽寒

音樂時光的娛樂
2026-03-28 04:06:03
內(nèi)斯塔:我承認自己也有過很多次假摔,絕不會去指責巴斯托尼

內(nèi)斯塔:我承認自己也有過很多次假摔,絕不會去指責巴斯托尼

懂球帝
2026-03-28 07:00:10
看了姚晨的舊照,才明白凌瀟肅曹郁為啥相繼淪陷了,嘴大不是缺陷

看了姚晨的舊照,才明白凌瀟肅曹郁為啥相繼淪陷了,嘴大不是缺陷

八斗小先生
2026-03-20 15:24:18
湖北6旬女子請屠夫殺豬時,因說了句豬腸沒處理干凈遭屠夫兒子砍殺,兇手被鑒定為精神病!家屬:沒收到任何道歉

湖北6旬女子請屠夫殺豬時,因說了句豬腸沒處理干凈遭屠夫兒子砍殺,兇手被鑒定為精神病!家屬:沒收到任何道歉

大風新聞
2026-03-27 22:04:08
前白宮經(jīng)濟學家:美國升級伊朗戰(zhàn)爭的概率超五成 料美聯(lián)儲別無選擇只能加息

前白宮經(jīng)濟學家:美國升級伊朗戰(zhàn)爭的概率超五成 料美聯(lián)儲別無選擇只能加息

財聯(lián)社
2026-03-27 23:14:53
美媒:若中國不償還百年前的債務,美國也將不承認欠華8600億美元

美媒:若中國不償還百年前的債務,美國也將不承認欠華8600億美元

文史達觀
2025-03-18 12:54:58
張雪峰二婚妻子履歷遭深扒,海量生活美照曝光,賬號緊急變私密

張雪峰二婚妻子履歷遭深扒,海量生活美照曝光,賬號緊急變私密

古希臘掌管松餅的神
2026-03-26 10:25:26
課本為何沒講“田忌賽馬”后續(xù)?愚蠢的勝利,讓他幾年后自食其果

課本為何沒講“田忌賽馬”后續(xù)?愚蠢的勝利,讓他幾年后自食其果

談史論天地
2026-03-24 15:45:06
字節(jié)跳動發(fā)布2026年首份紀律通報:65名員工觸碰紀律紅線被辭退,其中7人因涉嫌刑事犯罪被移交司法機關處理

字節(jié)跳動發(fā)布2026年首份紀律通報:65名員工觸碰紀律紅線被辭退,其中7人因涉嫌刑事犯罪被移交司法機關處理

每日經(jīng)濟新聞
2026-03-27 20:24:41
朝鮮戰(zhàn)場繳獲美軍火箭筒,拆解驚覺技術差距改寫陸軍征程

朝鮮戰(zhàn)場繳獲美軍火箭筒,拆解驚覺技術差距改寫陸軍征程

嘮叨說歷史
2026-03-18 13:40:57
2026-03-28 07:44:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16497文章數(shù) 514802關注度
往期回顧 全部

科技要聞

楊植麟張鵬夏立雪羅福莉,聊龍蝦、聊漲價

頭條要聞

特朗普稱暫停打擊伊能源設施不到1天 美以空襲伊核設施

頭條要聞

特朗普稱暫停打擊伊能源設施不到1天 美以空襲伊核設施

體育要聞

邵佳一:足球就像一場馬拉松

娛樂要聞

范瑋琪加盟,官宣《浪姐7》遭全網(wǎng)抵制

財經(jīng)要聞

我在小吃培訓機構(gòu)學習“科技與狠活”

汽車要聞

與眾08,金標大眾不能輸?shù)囊粦?zhàn)

態(tài)度原創(chuàng)

健康
數(shù)碼
時尚
旅游
軍事航空

干細胞抗衰4大誤區(qū),90%的人都中招

數(shù)碼要聞

三星電子公布消費級固態(tài)硬盤BM9K1,高性能PCIe Gen5 QLC產(chǎn)品

推廣中獎名單-更新至2026年3月11日推廣

旅游要聞

日照嵐山“打飛的”賞春成新時尚

軍事要聞

伊朗:已組織超100萬人為地面戰(zhàn)斗做準備

無障礙瀏覽 進入關懷版