![]()
前兩天,大摩發了一份挺有意思的報告,標題也很直接:《中國AI GPU——縮小與美國的差距》。
報告里有一個核心判斷,其實挺顛覆很多人的直覺:中國AI芯片和美國的差距,并沒有市場想象得那么大。
更關鍵的是,大摩還提出了一個時間判斷——2026年,可能會成為中國AI GPU產業的一個重要拐點。
為什么這么說?
原因不只是技術在進步,更重要的是,國內新一輪AI GPU公司正在走向資本市場。比如百度旗下的昆侖芯、阿里體系里的平頭哥,都將在未來一兩年進入IPO階段。
在這份報告里,大摩系統拆解了中國AI GPU產業,并試圖回答三個核心問題:
第一,中國是否能夠大規模供應具有競爭力的AI GPU?
第二,中國AI GPU市場到底有多大?
第三,投資人應該如何評估中國AI GPU公司的商業價值?
接下來,我們就沿著這三個問題,一起看看大摩是怎么說的。
差距沒有想象那么大
很多投資人在討論中國AI GPU時,往往只盯著晶圓工藝節點,然后很快得出一個結論:中國AI芯片在制程上落后一代甚至幾代,因此競爭力有限。
但大摩提出了一個相對不同的判斷:中國AI芯片與美國的差距,其實沒有市場想象得那么大。
原因很簡單。中國的電力成本相對更低,因此能效在整體算力經濟模型中的權重,并不像歐美那樣高。
如果從“每美元每瓦性能”(performance per watt per dollar)的框架來看,這種差距會明顯縮小。
要判斷中國AI GPU是否能夠真正實現規模化供應,關鍵還是要回到半導體產業鏈的供給側——尤其是晶圓廠產能。
在這一層面,產能擴張不僅取決于晶圓廠的名義產能,還取決于一系列關鍵上游投入的成熟度和可獲得性。而現實情況是,中國AI GPU產業鏈仍然受到多重供應瓶頸的制約。
這些瓶頸最明顯地體現在晶圓前端設備(WFE)上。
在部分設備領域,中國已經取得一定進展。例如外延設備和刻蝕設備等關鍵工具,已經可以由本土廠商提供,包括北方華創、中微公司以及SiCarrier等。
但在光刻設備和檢測設備方面,制約仍然非常明顯。
目前,中國晶圓廠仍大量依賴ASML的DUV光刻系統。同時,行業調研顯示,在SMIC的先進制程產線(尤其是南方廠區),KLA的檢測與計量設備供應受限,這迫使晶圓廠減少檢測步驟,將資源集中在最關鍵的層級。
這種做法可以提高設備利用率、維持產能,但往往以犧牲良率為代價,也加劇了先進制程制造的結構性挑戰。
除了設備,EDA(電子設計自動化)軟件同樣是關鍵瓶頸。
目前,中國最大的EDA公司華大九天在全球市場的份額僅約1–2%。更重要的是,其尚未提供完整的數字芯片設計工具鏈,很難支持先進節點GPU的復雜設計。
相比之下,Cadence、Synopsys和Siemens三家公司在全球EDA市場的份額合計超過80%。
與此同時,美國政府已經對先進EDA工具實施嚴格出口管制,尤其是用于GAA(全環繞柵極)晶體管架構的設計工具。這些限制的目標很明確:
阻止中國推進3nm和2nm節點,而這些節點正是未來高性能計算和AI芯片的關鍵基礎。
在設備與軟件雙重限制下,中國GPU設計公司在短期內很難向3nm或2nm制程遷移。
在這種背景下,中國AI芯片產業正在出現一個明顯變化:
瓶頸正在從設備獲取,轉移到晶圓代工產能本身。
目前,中國先進邏輯制造能力高度集中在SMIC,這使得SMIC成為國內AI GPU產能擴張的關鍵節點。
根據行業調研,多家國內AI芯片廠商已經開始將部分生產從海外遷回中國大陸,利用SMIC的N+1(約12nm)和N+2(約7nm)工藝節點來提升本土產能。
目前,SMIC已經通過DUV多重圖案化技術將工藝推進至N+2,并嘗試向N+3(約5nm)節點演進。
大摩預計,SMIC的N+2產能將在2025年達到約2.2萬片/月,2026年約4萬片/月,2027年約5.1萬片/月。
不過,這些產能并不會全部用于AI GPU,因為智能手機、汽車SoC等行業同樣需要先進節點。
在晶圓工藝難以快速追趕的情況下,中國AI芯片廠商正在逐漸改變競爭路徑——從單芯片性能轉向系統級架構設計。
目前主流的應對策略大致有三類。
第一,是多芯片集成。
如果單個芯片性能不足,就通過先進封裝技術,將多個計算芯片整合在一起,形成更大的計算單元。這種方式不依賴更先進的制程節點,也能夠在一定程度上提升整體算力。
第二,是擴大系統規模。
國內廠商正在借鑒NVIDIA NVL72的架構理念,通過更大的機架和集群來提升整體性能。例如華為的CloudMatrix 384、阿里巴巴的PPU架構,以及字節跳動的256加速器機架設計,本質上都是通過規模化架構來彌補單芯片性能差距。
第三,是擴大制造規模。
近年來,中國晶圓代工廠持續加大資本投入。SMIC的資本開支在2023年約75億美元,2024年約73億美元,2025年約81億美元。同時,中國也在加速采購ASML的DUV光刻機,以支撐未來先進節點產能擴張。
換句話說,在單芯片性能難以迅速追趕的情況下,中國廠商正在通過封裝、架構和規模三條路徑來彌補差距。
雖然單芯片性能仍然落后,但在大規模集群和推理場景中,這種系統級優化,已經能夠在一定程度上抵消硬件層面的劣勢。
國產AI GPU的需求有多大?
在討論中國AI GPU產業時,一個經常被忽視的問題是:需求到底有多大?
在大摩看來,需求側核心取決于兩個驅動力:技術自主化與商業回報。
先看技術自主化。隨著外部限制不斷加強,AI芯片已經被中國視為關乎國家安全與經濟安全的關鍵資源。這種壓力直接推動了中國建設本土AI芯片體系的決心。
在這一過程中,產業鏈內部形成了一種典型的共生關系。
一方面,本土AI芯片公司需要先進制程節點支持。GPU要具備競爭力,通常需要領先兩到三代的制程工藝。另一方面,本土晶圓廠也需要穩定的大客戶與訂單規模,才能證明先進制程投資的合理性。
在這種結構下,晶圓廠產能成為整個產業鏈最關鍵的瓶頸。
不過,大摩認為,自主可控更多是早期投資的驅動力。長期來看,AI芯片產業能否持續發展,最終仍要看商業回報。
隨著算力投資規模不斷擴大,資本開支與設備利用率遲早會成為約束條件。因此,中國AI產業的路徑正在發生變化:
從“政策驅動”,逐漸轉向成本效率與商業回報驅動。
目前,中國主要科技公司——騰訊、阿里巴巴、字節跳動、百度、美團和快手——都在明顯提高AI資本開支。
大摩預計,到2026年,中國科技公司的AI相關資本開支將達到5970億元人民幣,同比增長約38%。
這些投入主要集中在廣告推薦、消費應用(2C)和企業服務(2B)等場景,而這些場景已經逐漸證明具備清晰的商業化路徑。
從長期經濟模型來看,在扣除折舊、電力和服務器租賃成本之后,中國AI算力基礎設施預計將在2028年前后實現盈虧平衡,到2030年整體利潤率有望達到約50%。
從需求結構看,中國AI GPU的采購高度集中在少數大型買家。
大摩將其分為三類。
第一類是云服務商(CSP),包括字節跳動、阿里巴巴和騰訊。這些公司采購GPU既用于訓練自有模型,也用于向外部客戶提供AI云服務。
第二類是主權買家,包括電信運營商、地方政府和國有企業。這類需求主要來自數據主權、數字基礎設施和公共服務數字化。
第三類是創新企業,例如DeepSeek、MiniMax等AI創業公司,以及小鵬、小米等汽車廠商。不過目前來看,這類企業的采購規模仍明顯小于前兩類。
綜合這些需求,大摩預計中國AI GPU市場規模將持續快速增長。
到2030年,中國AI GPU市場規模(TAM)預計將達到670億美元,2024年至2030年的復合增長率約為23%。
這一測算主要基于中國云計算行業的資本開支結構。
大摩預計,到2030年,中國云計算行業整體資本開支將達到1300億美元,其中約51%將用于AI GPU相關設備。
這一預測基于幾個關鍵假設:
第一,中國云廠商海外數據中心投資比例將逐漸下降。2025年,中國云廠商約40%的算力投資用于海外數據中心,但這一比例預計將在2026年以后下降至約30%。
第二,服務器仍將占云計算資本開支的約90%。
第三,AI加速服務器占比將從2025年的75%提升至2030年的85%。
第四,在AI服務器中,加速器芯片的價值占比約為80%。
不過,隨著中國AI GPU市場規模不斷擴大,一個更關鍵的問題也隨之出現:這些需求最終會流向誰?
大摩的判斷是,在持續的地緣政治壓力下,中國AI算力需求正在快速本土化。
這意味著,本土芯片將不再只是出口管制下的替代方案,而會逐漸成為中國AI算力體系的結構性組成部分。
盡管中國在制程技術上仍落后美國數代,但系統級性能差距正在逐漸縮小。
未來四年,這一差距有望從目前的1.5—2倍,縮小至約1倍左右。
推動這一變化的,并不是制程節點本身,而是三個因素:
先進封裝技術(例如2.5D和3D封裝)、大規模系統架構(例如光互連網絡)、軟硬件協同優化。
與此同時,中國也在逐步降低對TSMC代工的依賴,更多轉向SMIC的N+2和N+3工藝。
當然,一些關鍵環節仍然依賴海外供應,例如韓國的HBM存儲、歐洲的DUV光刻設備,以及美國KLA的檢測設備。
不過,大摩的行業調研顯示,在部分環節,中國已經開始逐漸取得突破。
綜合供需兩側變化,大摩認為中國AI芯片產業正在形成一條清晰的自給路徑。
到2030年,中國AI芯片自給率預計將從2024年的33%提升至約76%。與此同時,本土AI芯片市場規模也將從2024年的60億美元增長至2030年的510億美元,復合增長率約為42%。
這一增長主要來自三個因素:先進節點產能擴張、制造良率持續提升和以及政策主導的資源配置。
例如,大摩預計中國先進節點晶圓廠的生產良率將從2025年的約20%,提升至2030年的約50%。
同時,由于先進節點產能仍然稀缺,政府在一定程度上會參與產能分配。
在大摩的判斷中,華為預計將獲得最大的先進節點產能份額,其次是寒武紀和海光,而第二梯隊AI芯片公司的產能份額可能各自低于10%。
誰能勝出?
市場的主流看法是,中國AI GPU的落地,主要還是靠政策推動下的國產替代。
在這種敘事框架里,很多廠商的估值邏輯其實很簡單:
第一,未來能從NVIDIA手里拿走多少市場份額;
第二,中國市場會不會長期維持一個分散競爭的格局。
但大摩的判斷并不完全一樣。
他們認為,中國AI GPU廠商的長期價值,最終還是要回到兩個問題:
第一,產品有沒有真正的商業競爭力;
第二,這種競爭力能不能轉化為穩定收入和品牌溢價。
政府支持、CSP定制采購當然重要,但如果拉長周期看,真正決定市場地位的,還是產品本身。
基于這個邏輯,大摩提出了一套“定性+定量”的評估框架。
定性層面看四件事:能不能拿到先進制程產能、和核心CSP客戶關系是否穩固、政策支持力度,以及技術路線是否符合未來需求。
定量層面,則重點看四個指標:TPS(每秒token輸出能力)、每瓦性能、每美元每瓦性能,以及最關鍵的每token成本。
從行業趨勢看,中國AI GPU市場大概率會逐步走向整合。
原因其實很簡單。一方面,隨著技術成熟,產品差異化會逐漸縮小;另一方面,規模效應會越來越重要。
到了后期,競爭不再只是拼參數,而是拼出貨量、客戶黏性、供應鏈能力以及成本控制。
換句話說,GPU最終會變成一個典型的規模行業。這也意味著一個結果:
利潤率壓力會越來越大。
因此,大摩認為接下來最值得關注的三個指標是:
第一,新一代芯片規格是否持續提升;
第二,向頭部CSP的出貨量能否快速增長;
第三,ASP和毛利率的變化趨勢。
如果這些指標走弱,當前市場給出的高估值很可能會面臨修正。
當然,這套判斷也有可能失效。
例如,如果國產GPU廠商始終拿不到足夠的晶圓廠產能,那么產品再好也很難兌現收入。
或者CSP對國產芯片的采用意愿低于預期,采購仍然傾向海外供應商。
更深層的風險,則是AI計算范式本身發生變化。比如模型架構或工作負載發生重大變化,導致當前基于TPS的性能比較不再有效。
從這個角度看,一個真正可能成為長期贏家的中國AI GPU廠商,至少需要同時具備四個條件:
第一,推理經濟性有競爭力;
第二,能夠穩定拿到先進節點產能;
第三,與核心CSP客戶形成深度綁定;
第四,在政策方向上處于有利位置。
缺任何一項,都很難長期維持市場份額,更難支撐高利潤率。
在具體分析方法上,大摩采用的是一個“雙層框架”。
第一層看定量指標,也就是推理經濟學。
對于CSP來說,決定是否大規模部署的,往往不是峰值性能,而是規模化后的總擁有成本。
真正關鍵的指標,不是芯片跑分有多高,而是推理場景下的每token成本、TPS、每瓦性能,以及每美元算力。
第二層看定性定位。
也就是廠商是否能把實驗室里的性能,真正轉化為商業市場的份額。這取決于三件事:是否能拿到先進節點產能、是否進入主流CSP采購體系,以及是否契合政策方向。
從需求結構看,中國AI GPU的主戰場,短期內更可能是推理,而不是訓練。
原因很現實。本土廠商在生態和制程上仍然受限制,要全面參與最前沿基礎模型訓練仍然有難度。
相比之下,推理需求正在快速增長。
像DeepSeek、豆包、Qwen這樣的模型,日均token消耗已經達到很高水平,持續拉動推理算力需求。
與此同時,大量NVIDIA A100以及部分H100、H800集群仍然主要用于訓練任務。
這意味著,中國新增的推理需求,很可能越來越多由國產加速器承接。
在推理場景的性能比較中,大摩更看重TPS,也就是每秒token輸出能力。
因為在真實部署中,TPS往往比理論峰值算力更接近商業價值。
它同時反映了計算吞吐量、內存帶寬、互連能力以及軟件棧優化水平。
從推理經濟學來看,國產芯片的優勢主要在成本結構。
整體來看,本土AI加速器的采購價格通常比中國市場可獲得的高端NVIDIA產品低30%到60%。
如果再把功耗、電費以及運維成本算進去,國產方案的總擁有成本通常更低。
這意味著,雖然NVIDIA H200在絕對性能上仍然領先,但在“每token成本”這個更貼近商業現實的指標上,頭部國產廠商已經可以做到接近H20和A100。
在部分配置下,甚至可能更優。
這一點非常關鍵。
因為對于CSP來說,真正決定是否部署的,不是芯片峰值性能,而是能不能用更低成本完成更多推理任務。
換句話說,國產GPU未必要在硅性能上全面領先,只要在規模化部署中具備更好的經濟性,就足以建立商業價值。
從TPS表現來看,最新一代國產加速器已經開始逼近甚至在某些場景下超過NVIDIA H20。
例如華為Ascend 950系列以及寒武紀MLU690,在部分推理場景中的表現已經具備一定競爭力。
當然,這種比較也有邊界。
TPS不僅受硬件參數影響,還與軟件優化、框架適配以及集群配置有關。
換句話說,參數接近并不等于實際部署效果完全相同。
更重要的是,這種比較必須放在中國可采購產品的范圍內理解。
如果把NVIDIA最新的GB300平臺納入比較,性能差距會再次被拉開。
也就是說,中國廠商確實在追趕,但當前追趕的主要是中國可獲得市場,而不是全球技術前沿。
除了性能,能效也是重要指標。
雖然中國整體能源約束不如美國嚴格,但能效仍然會影響部署密度和機房成本。
從每瓦性能來看,頭部國產芯片已經接近A100和H20,但與H100、H200仍存在差距。
不過,如果把采購價格納入考慮,國產芯片的性價比優勢會更加明顯。
因此,在推理密集型場景中,國產GPU的吸引力正在不斷增強。
市場最終獎勵的,很可能不是峰值性能最高的廠商,而是那些能夠持續壓低每token成本、并把這種優勢規模化復制的公司。
從更宏觀的角度看,美國AI GPU公司的估值邏輯已經比較成熟。
像NVIDIA和AMD,估值雖然不低,但核心支撐來自規模、盈利能力以及全球生態位。
相比之下,中國AI GPU廠商的估值明顯更激進。
很多公司收入規模仍然較小,盈利能力也還處于早期階段,但市場已經給出了很高的PS倍數。
本質上,市場交易的不是當前利潤,而是國產替代和未來市場集中度的預期。
因此,中國AI GPU板塊更像是在定價一張長期競爭格局,而不是確定性的盈利能力。
文/阿奇
PS:如果你也在尋找投資AI資產的機會,歡迎掃碼加入我們的交流群。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.