337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

這份中美AI競(jìng)爭(zhēng)最權(quán)威報(bào)告,并沒說出全部真相

0
分享至

【文/觀察者網(wǎng) 心智觀察所】

前幾天,斯坦福大學(xué)人本人工智能研究院(HAI)發(fā)布的《2026年AI指數(shù)年度報(bào)告》,是當(dāng)前全球范圍內(nèi)最具系統(tǒng)性和數(shù)據(jù)密度的AI領(lǐng)域綜合評(píng)估文獻(xiàn)之一。這份長(zhǎng)達(dá)數(shù)百頁的年度報(bào)告,覆蓋了從研發(fā)管線、技術(shù)性能到經(jīng)濟(jì)影響、公共政策的全景圖譜,其數(shù)據(jù)來源橫跨Epoch AI、OpenAlex、GitHub、Hugging Face、Cloudscene等多個(gè)獨(dú)立數(shù)據(jù)庫,分析框架嚴(yán)謹(jǐn)、引用鏈條完整,在學(xué)術(shù)圈和政策圈的影響力毋庸置疑。

然而,正因其權(quán)威性,對(duì)它的批判性閱讀才更為重要。

報(bào)告在中美AI競(jìng)爭(zhēng)這一核心議題上提出了一個(gè)標(biāo)志性判斷——“中美AI模型性能差距已實(shí)質(zhì)性閉合”(The U.S.-China AI model performance gap has effectively closed,如下圖)。簡(jiǎn)單說,就是差距已經(jīng)可以忽略了。

這個(gè)結(jié)論本身并無問題,甚至可以說是對(duì)當(dāng)下事實(shí)的準(zhǔn)確描述。但問題在于,報(bào)告圍繞這一結(jié)論所搭建的論證結(jié)構(gòu),存在若干邏輯上的不周延之處;而更關(guān)鍵的是,這份報(bào)告受限于其方法論框架和數(shù)據(jù)覆蓋范圍,對(duì)“中國AI模型為什么能追平,以及憑什么可能超越”這個(gè)問題,留下了大量未被講透的空間。


先看報(bào)告的核心論據(jù)。報(bào)告以LMArena的Elo評(píng)分體系作為中美模型性能比較的主要標(biāo)尺。數(shù)據(jù)顯示,2025年2月,DeepSeek-R1以1400分一度逼平美國頂尖模型o1的1405分,差距僅0.4%;截至2026年3月,Anthropic的Claude Opus 4.6以1503分領(lǐng)先中國最佳模型Dola-Seed-2.0 Preview的1464分,差距2.7%。報(bào)告據(jù)此得出“差距閉合”的判斷,邏輯上是站得住腳的。但這里存在一個(gè)方法論層面的深層問題:Arena排行榜本身的可靠性正在被質(zhì)疑。

報(bào)告自身也引用了Singh等人2025年的研究,指出Arena的排名可能部分反映的是對(duì)平臺(tái)本身的適應(yīng)性優(yōu)化,而非模型的通用能力。如果評(píng)價(jià)標(biāo)尺本身可能存在系統(tǒng)性偏差,那么基于該標(biāo)尺得出的“差距閉合”結(jié)論,其置信度就需要打一個(gè)折扣——但報(bào)告在表述上并未對(duì)此做出充分的限定。更深層的問題在于,Arena的Elo評(píng)分本質(zhì)上測(cè)量的是“用戶偏好”而非“客觀能力”。

用戶在盲測(cè)中選擇偏好的輸出,這種評(píng)價(jià)方式天然偏向流暢性、風(fēng)格化和指令遵從度,而非推理深度、專業(yè)準(zhǔn)確性或長(zhǎng)鏈條任務(wù)完成率。中國模型在這些軟性維度上的進(jìn)步是真實(shí)的,但如果我們關(guān)注的是AI在科學(xué)發(fā)現(xiàn)、工程實(shí)踐和復(fù)雜決策中的實(shí)際效用,Arena并不是最合適的衡量工具。

報(bào)告在專業(yè)領(lǐng)域基準(zhǔn)測(cè)試如SWE-bench、FrontierMath、CorpFin等上的數(shù)據(jù)呈現(xiàn),主要以模型名稱排列而非按國別分組,這使得讀者難以直觀地判斷中美模型在這些更硬核的評(píng)估維度上的相對(duì)位置。這不是一個(gè)疏忽,而是一種分析框架上的選擇,但這種選擇客觀上遮蔽了中國模型在多個(gè)專業(yè)領(lǐng)域已經(jīng)進(jìn)入第一梯隊(duì)這一事實(shí)。

還有一個(gè)容易被忽略的邏輯問題存在于報(bào)告對(duì)“透明度”的論述中。報(bào)告在第一章反復(fù)強(qiáng)調(diào),美國前沿實(shí)驗(yàn)室如OpenAI、Anthropic、Google正變得越來越不透明——訓(xùn)練代碼、參數(shù)量、數(shù)據(jù)集規(guī)模、訓(xùn)練時(shí)長(zhǎng)等關(guān)鍵信息不再公開披露。

報(bào)告將此視為阻礙外部研究者復(fù)現(xiàn)和審計(jì)的障礙,這一判斷完全正確。但報(bào)告沒有追問的是:這種不透明對(duì)中美比較本身意味著什么?當(dāng)美國模型的訓(xùn)練計(jì)算量只能通過間接方法估算,而中國模型如DeepSeek-V3反而公開了詳細(xì)的訓(xùn)練信息時(shí),報(bào)告圖表中“美國模型訓(xùn)練計(jì)算量遠(yuǎn)高于中國”的視覺印象,實(shí)際上可能部分來自估算方法對(duì)不透明模型的高估。

報(bào)告在腳注中提到Epoch AI對(duì)訓(xùn)練計(jì)算量的估算方法包括“基于硬件規(guī)格推算”和“基于基準(zhǔn)性能反推”,這些間接方法對(duì)于未披露信息的模型存在較大的不確定性區(qū)間。但在正文的圖表呈現(xiàn)中,美國模型和中國模型的數(shù)據(jù)點(diǎn)被放在同一坐標(biāo)系中,未做任何不確定性標(biāo)注,給讀者造成了一種精確對(duì)比的錯(cuò)覺。

接下來看報(bào)告在研發(fā)管線分析中的邏輯鏈條。

第一章詳細(xì)追蹤了“顯著AI模型”的國別分布,2025年美國發(fā)布50個(gè)、中國發(fā)布30個(gè)這個(gè)數(shù)據(jù)來自Epoch AI的人工遴選數(shù)據(jù)庫,篩選標(biāo)準(zhǔn)包括“前沿性突破”、“歷史意義”、或“高引用率”等。報(bào)告也承認(rèn)這并非所有AI模型的普查,而是一種基于專家判斷的策展。問題在于,Epoch AI作為一個(gè)主要由西方學(xué)術(shù)圈運(yùn)營(yíng)的數(shù)據(jù)庫,其對(duì)“顯著性”的判斷標(biāo)準(zhǔn)是否對(duì)中國模型存在系統(tǒng)性的低估?

中國的AI模型生態(tài)如魔搭社區(qū)、百度飛槳等活躍于國內(nèi)平臺(tái),而非Hugging Face或GitHub的項(xiàng)目,這些模型在Epoch AI的篩選網(wǎng)絡(luò)中天然處于低可見度的位置。報(bào)告在開源軟件部分也坦承,中國開發(fā)者大量使用Gitee和GitCode等國內(nèi)平臺(tái),而這些平臺(tái)的數(shù)據(jù)并未被納入分析——報(bào)告甚至在腳注中明確標(biāo)注了這一點(diǎn)。這意味著,“美國50個(gè)vs中國30個(gè)”這一看似清晰的數(shù)量對(duì)比,實(shí)際上可能建立在不對(duì)稱的數(shù)據(jù)采集基礎(chǔ)之上。報(bào)告的誠實(shí)之處在于它沒有掩飾這一局限,但其不足之處在于它沒有對(duì)這一局限的潛在影響做出定量或定性的修正。


中美主流模型序列發(fā)布時(shí)間線(截圖自該報(bào)告)

在算力和基礎(chǔ)設(shè)施維度上,報(bào)告提供了一個(gè)極具沖擊力的數(shù)據(jù)點(diǎn):美國擁有5427個(gè)數(shù)據(jù)中心,是排名第二的德國(529個(gè))的十倍以上,中國僅449個(gè)。但報(bào)告自己也提醒,數(shù)據(jù)中心的數(shù)量并不等于計(jì)算容量或利用率。

事實(shí)上,中國的數(shù)據(jù)中心建設(shè)采用了與美國截然不同的集約化模式——更少但更大、更集中、更面向AI訓(xùn)練優(yōu)化的超大規(guī)模設(shè)施。騰訊、阿里巴巴、字節(jié)跳動(dòng)的智算中心單體算力密度,在全球范圍內(nèi)處于領(lǐng)先水平。將“數(shù)據(jù)中心數(shù)量”作為AI基礎(chǔ)設(shè)施實(shí)力的代理指標(biāo),其實(shí)質(zhì)是用美國的基礎(chǔ)設(shè)施范式去度量中國的基礎(chǔ)設(shè)施投入,這在方法論上是有偏差的。

報(bào)告在論述中國AI發(fā)展時(shí),還遺漏了幾個(gè)關(guān)鍵的結(jié)構(gòu)性優(yōu)勢(shì)。第一是效率路徑的范式意義。DeepSeek-V3的訓(xùn)練碳排放僅597噸二氧化碳當(dāng)量,而同期美國模型Grok 4高達(dá)72816噸,兩者相差超過120倍。報(bào)告將此數(shù)據(jù)呈現(xiàn)在環(huán)境影響章節(jié)中,但并未將其與中美競(jìng)爭(zhēng)敘事打通。

事實(shí)上,DeepSeek-R1引入的GRPO訓(xùn)練方法,通過對(duì)比一組生成輸出而非依賴獨(dú)立評(píng)審模型來訓(xùn)練推理能力,所代表的不僅僅是一種技術(shù)創(chuàng)新,而是一種資源約束驅(qū)動(dòng)的效率范式。在芯片禁令的壓力下,中國模型被迫走向用更少資源做更多事的路徑,而這種路徑一旦走通,其可擴(kuò)展性反而可能超過美國式的暴力堆算力模式。報(bào)告承認(rèn)DeepSeek-R1的發(fā)布引發(fā)了美國科技股超過一萬億美元的市值波動(dòng),但對(duì)這種效率優(yōu)勢(shì)的長(zhǎng)期戰(zhàn)略意義缺乏深入分析。

在應(yīng)用落地的速度和規(guī)模方面,報(bào)告提到中國Apollo Go在2025年完成了1100萬次完全無人駕駛出行,同比增長(zhǎng)175%,而美國Waymo的周出行量約45萬次。簡(jiǎn)單換算,Apollo Go的年化出行量是Waymo的約四到五倍。但報(bào)告將這一數(shù)據(jù)點(diǎn)放在了自動(dòng)駕駛技術(shù)進(jìn)展的敘述中,而非中美競(jìng)爭(zhēng)分析的框架內(nèi)。類似的遺漏還出現(xiàn)在工業(yè)機(jī)器人安裝量(報(bào)告在摘要中提到中國領(lǐng)先但未在前兩章展開)、AI在制造業(yè)和供應(yīng)鏈中的滲透率等維度上。


中美AI模型的碳排放

中國AI的比較優(yōu)勢(shì),很大程度上不在于“模型能力的峰值”而在于“從模型到產(chǎn)品到大規(guī)模部署”的全鏈條速度,而這恰恰是當(dāng)前報(bào)告的分析框架——以基準(zhǔn)測(cè)試和論文計(jì)量為核心——難以捕捉的。

有關(guān)開源生態(tài)的戰(zhàn)略縱深,報(bào)告記錄了一個(gè)值得深思的數(shù)據(jù)趨勢(shì):在Hugging Face的模型下載份額中,美國開發(fā)者的占比從2020年的超過70%下降到2025年的不足25%,而中國開發(fā)者和“無國別標(biāo)注”用戶的份額持續(xù)上升。阿里巴巴的Qwen系列、DeepSeek系列、智譜的GLM系列,在全球開源社區(qū)中的影響力已經(jīng)與Meta的Llama形成了正面競(jìng)爭(zhēng)。

報(bào)告在組織維度的數(shù)據(jù)中顯示,2025年阿里巴巴發(fā)布了11個(gè)顯著模型,僅次于OpenAI的19個(gè)和Google的12個(gè),超過了Anthropic和Meta。但報(bào)告并未將這一趨勢(shì)放進(jìn)中美競(jìng)爭(zhēng)的分析框架中討論其戰(zhàn)略含義:中國企業(yè)正通過開源模型在全球范圍內(nèi)建立開發(fā)者生態(tài)和技術(shù)標(biāo)準(zhǔn)影響力,“模型數(shù)量”和“基準(zhǔn)評(píng)分”之外的一種全新競(jìng)爭(zhēng)維度正在形成。這種通過開源輸出技術(shù)影響力的路徑,與中國在5G標(biāo)準(zhǔn)制定中的經(jīng)驗(yàn)一脈相承,但報(bào)告對(duì)此完全沒有觸及。

除此之外,報(bào)告詳細(xì)記錄了一個(gè)引人注目的趨勢(shì):流入美國的AI研究人員自2017年以來下降了89%,僅過去一年就下降了80%。但報(bào)告在人才部分的數(shù)據(jù)來源Zeki并不覆蓋中國這意味著我們看到了美國人才吸引力的衰退,卻無法看到中國人才池的擴(kuò)張。中國每年培養(yǎng)的STEM博士數(shù)量已超過美國,且中國在全球高被引AI論文Top 100中的份額從2021年的33篇增長(zhǎng)到2024年的41篇,首次逼近美國的46篇。清華大學(xué)在Epoch AI的累計(jì)顯著模型榜中與斯坦福并列第一(各26個(gè))。

如果把這些散落在報(bào)告各處的數(shù)據(jù)點(diǎn)串聯(lián)起來,呈現(xiàn)的圖景遠(yuǎn)比“差距閉合”更具沖擊力,它指向的是一種可能的“交叉”(crossover),而非僅僅是“追平”。

報(bào)告在投資數(shù)據(jù)上的處理方式也有不小的問題。報(bào)告指出2025年美國AI私人投資達(dá)2859億美元,是中國124億美元的23倍以上。但報(bào)告自己也在腳注中承認(rèn),僅看私人投資“可能低估了中國的AI總支出,因?yàn)橹袊姓龑?dǎo)基金”。這種將核心修正條件放在腳注中的處理方式,在學(xué)術(shù)寫作中并不罕見,但對(duì)于一份面向政策制定者和媒體的報(bào)告而言,其效果是使正文中“23倍差距”的數(shù)字獲得了遠(yuǎn)大于其實(shí)際信息量的傳播力。

中國政府通過國家大基金、地方政府AI產(chǎn)業(yè)基金、國有企業(yè)研發(fā)投入等渠道注入AI領(lǐng)域的資本規(guī)模,目前缺乏可靠的公開估算,但多個(gè)獨(dú)立來源認(rèn)為其量級(jí)遠(yuǎn)超私人投資的口徑。報(bào)告對(duì)此的處理,稱不上是誤導(dǎo),但確實(shí)構(gòu)成了一種系統(tǒng)性的低估。

綜合來看,斯坦福AI指數(shù)報(bào)告的核心判斷“中美AI差距已經(jīng)閉合”是準(zhǔn)確的,但這份報(bào)告并沒有完整地解釋這個(gè)故事。

中國AI的競(jìng)爭(zhēng)力不僅來自模型性能本身的追趕,更來自效率范式的突破、應(yīng)用落地的加速、人才厚度的積累、以及國家戰(zhàn)略與產(chǎn)業(yè)生態(tài)的深度耦合。在一個(gè)Arena評(píng)分差距僅2.7%的世界里,決定下一階段競(jìng)爭(zhēng)格局的變量,很可能不是誰的模型在基準(zhǔn)測(cè)試上多得幾分,而是誰能更快地將模型能力轉(zhuǎn)化為產(chǎn)業(yè)價(jià)值和社會(huì)效用。在這些真正決定勝負(fù)的維度上,中國不僅不亞于美國,而且在多個(gè)關(guān)鍵方向上正在建立結(jié)構(gòu)性優(yōu)勢(shì)。遺憾的是,這些維度恰恰是斯坦福這份以基準(zhǔn)測(cè)試和學(xué)術(shù)計(jì)量為核心方法論的報(bào)告,最不擅長(zhǎng)捕捉的。


本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個(gè)人觀點(diǎn),不代表平臺(tái)觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
放假通知!2026中小學(xué)暑假時(shí)間確定了,家長(zhǎng)卻表示難以接受

放假通知!2026中小學(xué)暑假時(shí)間確定了,家長(zhǎng)卻表示難以接受

凱旋學(xué)長(zhǎng)
2026-04-19 15:04:39
氣質(zhì)美女(金松季步)

氣質(zhì)美女(金松季步)

藍(lán)色海洋009
2026-04-13 20:18:27
馮紹峰忙戀愛!趙麗穎上海親子游,想想坐行李箱萌態(tài)十足,畫面溫馨

馮紹峰忙戀愛!趙麗穎上海親子游,想想坐行李箱萌態(tài)十足,畫面溫馨

八卦王者
2026-04-18 16:27:16
弗格森也做不到!曼聯(lián)打破英超紀(jì)錄,切爾西有望掉出前十

弗格森也做不到!曼聯(lián)打破英超紀(jì)錄,切爾西有望掉出前十

嗨皮看球
2026-04-19 16:52:48
屬虎人的后半輩子:特別是1962年出生

屬虎人的后半輩子:特別是1962年出生

牛鍋巴小釩
2026-04-19 11:16:31
隨著北京險(xiǎn)勝、深圳落敗,CBA亂了!廣東四強(qiáng)不保,廣州仍有希望

隨著北京險(xiǎn)勝、深圳落敗,CBA亂了!廣東四強(qiáng)不保,廣州仍有希望

多特體育說
2026-04-19 22:51:50
柳州市中心一棟3層自建房拍賣,被人44萬元就競(jìng)得了

柳州市中心一棟3層自建房拍賣,被人44萬元就競(jìng)得了

天天話事
2026-04-19 21:39:45
本科爛大街,碩士遍地走,博士很尷尬?上海交大今年招5000博士!

本科爛大街,碩士遍地走,博士很尷尬?上海交大今年招5000博士!

驊駿老師張
2026-04-19 07:49:40
離婚后的黃圣依,已出國瑞士留學(xué)深造工商管理,最新發(fā)文曬留學(xué)生活

離婚后的黃圣依,已出國瑞士留學(xué)深造工商管理,最新發(fā)文曬留學(xué)生活

阿廢冷眼觀察所
2026-04-19 12:51:49
網(wǎng)友喊話讓何潤(rùn)東代言霸王茶姬,此前他已接到多個(gè)商務(wù)合作,最近30天抖音漲粉近200萬,品牌客服回應(yīng)

網(wǎng)友喊話讓何潤(rùn)東代言霸王茶姬,此前他已接到多個(gè)商務(wù)合作,最近30天抖音漲粉近200萬,品牌客服回應(yīng)

極目新聞
2026-04-19 17:19:41
全體車主注意!4月30日前辦完這幾件事,5月1日起上路就扣分罰款

全體車主注意!4月30日前辦完這幾件事,5月1日起上路就扣分罰款

華庭講美食
2026-04-19 22:09:30
國小而不處卑:日本挑釁中國,新加坡為什么站在日本一邊?

國小而不處卑:日本挑釁中國,新加坡為什么站在日本一邊?

阿胡
2025-12-02 18:42:14
張雪機(jī)車因性能太強(qiáng)遭限制:增重7公斤限5%動(dòng)力 張雪回應(yīng)

張雪機(jī)車因性能太強(qiáng)遭限制:增重7公斤限5%動(dòng)力 張雪回應(yīng)

快科技
2026-04-19 15:31:07
演員何潤(rùn)東回應(yīng)穿項(xiàng)羽鎧甲亮相蘇超:14年后受邀過來,內(nèi)心滿是感動(dòng),等下去逛項(xiàng)王故里

演員何潤(rùn)東回應(yīng)穿項(xiàng)羽鎧甲亮相蘇超:14年后受邀過來,內(nèi)心滿是感動(dòng),等下去逛項(xiàng)王故里

極目新聞
2026-04-19 10:17:37
多搶18前場(chǎng)板仍輸球,火箭這敗仗因果早已種下,杜蘭特成全村希望

多搶18前場(chǎng)板仍輸球,火箭這敗仗因果早已種下,杜蘭特成全村希望

大飛說籃球
2026-04-19 23:29:39
胡錫進(jìn)給沃爾沃汽車做廣告,評(píng)論區(qū)全翻車了……

胡錫進(jìn)給沃爾沃汽車做廣告,評(píng)論區(qū)全翻車了……

麥杰遜
2026-04-17 11:51:26
多家日本媒體表示:希望中國能夠放下仇恨

多家日本媒體表示:希望中國能夠放下仇恨

安安說
2026-04-19 14:57:46
破防!雷軍15小時(shí)京滬續(xù)航自證清白,懇求全網(wǎng)幫幫小米

破防!雷軍15小時(shí)京滬續(xù)航自證清白,懇求全網(wǎng)幫幫小米

雷科技
2026-04-18 12:38:28
張涵予新片《尋龍?jiān)E》上映僅1天,觀眾強(qiáng)烈要求下架,罵聲一片

張涵予新片《尋龍?jiān)E》上映僅1天,觀眾強(qiáng)烈要求下架,罵聲一片

秋姐居
2026-04-18 19:34:07
笑死,段永平這個(gè)誤操作,可能要變成泡泡瑪特第三大股東了

笑死,段永平這個(gè)誤操作,可能要變成泡泡瑪特第三大股東了

林氪
2026-04-15 09:51:53
2026-04-20 01:12:49
觀察者網(wǎng) incentive-icons
觀察者網(wǎng)
全球視野,中國關(guān)懷
139214文章數(shù) 1850454關(guān)注度
往期回顧 全部

科技要聞

50分26秒破人類紀(jì)錄!300臺(tái)機(jī)器人狂飆半馬

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒法住人

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒法住人

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂要聞

何潤(rùn)東漲粉百萬!內(nèi)娛隔空掀桌第一人

財(cái)經(jīng)要聞

華誼兄弟,8年虧光85億

汽車要聞

29分鐘大定破萬 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

手機(jī)
游戲
教育
旅游
親子

手機(jī)要聞

8.8英寸小鋼炮!REDMI K Pad 2核心配置揭曉

如何將ZH-1火力最大化?《戰(zhàn)艦世界》15.3版本造船廠加點(diǎn)攻略

教育要聞

27fall,申請(qǐng)最容易翻車的三所英國大學(xué)!

旅游要聞

寶藏小城之春|不去江南,來章丘!這里有泉、有詞、有烤肉

親子要聞

孩子總打噴嚏、起疹子,時(shí)過敏嗎?

無障礙瀏覽 進(jìn)入關(guān)懷版