網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

拐點(diǎn)出現(xiàn)，中國開源大模型下載量超越美國

2025-09-18 20:14:17　來源: 鯨選AI

北京舉報(bào)

分享至

最近，Interconnects.ai 的一份報(bào)告，像在科技圈丟下一枚炸彈：截至 2025 年 8 月，中國開源大模型在 HuggingFace 上的下載量正快速趕上美國，幾乎已經(jīng)超越了。

美國這2年在開源模型上的領(lǐng)先地位，似乎正在被反超。在鯨哥看來，這不只是一個(gè)數(shù)據(jù)酷炫，下載量說明大家真的在用，證明我們?cè)谀Ｐ唾|(zhì)量、生態(tài)建設(shè)等方面都實(shí)現(xiàn)了反超。

很多人不理解意義，簡答說在移動(dòng)互聯(lián)網(wǎng)時(shí)代，很多人都用的是安卓手機(jī)，開源的安卓統(tǒng)治了移動(dòng)操作系統(tǒng)的過半壁江山。AGI時(shí)代，Meta也高舉開源大模型的大旗，很多國外企業(yè)采用Llama作為AI 引擎，輸出AI的消費(fèi)級(jí)服務(wù)。

Llama差點(diǎn)成為新時(shí)代的安卓，現(xiàn)在 DeepSeek、Qwen等模型，改變了這一現(xiàn)狀。

國產(chǎn)大模型的高光時(shí)刻

具體說，是Interconnects.ai 在《ATOM Project》這份報(bào)告里，統(tǒng)計(jì)了 Meta、Google、Mistral AI、Microsoft、Alibaba Qwen 和 DeepSeek 等幾家主要大模型開放者，從它們?cè)?HuggingFace 上的下載量和派生（fine?tune／派生模型）的情況做了歸類。報(bào)告里幾個(gè)關(guān)鍵點(diǎn)：

到 2025 年 8 月，美國領(lǐng)先的開源模型（主要是 Llama / Meta 系列）與中國領(lǐng)先的開源模型下載總量都在約 3 億次（~300M 次下載）左右。兩邊差距已經(jīng)非常小。

中國模型下載量的增長速度明顯快于美國模型。每個(gè)月新下載量／新增派生模型的比例，中國那邊漲得更陡。

在派生／fine?tune 模型數(shù)量上，美國的留存領(lǐng)頭優(yōu)勢在減弱。以前美國模型（主要是 Llama 系列）派生模型占比非常高，但到現(xiàn)在，中國模型（比如 Qwen 系列）一個(gè)月的新派生模型中可能占到40% 以上。美國 Llama 系列的派生比例從巔峰時(shí)的近 50% 下滑到大約 15%。

再看國產(chǎn)模型的一些動(dòng)靜：

DeepSeek 的 V3 與 R1 模型，自從發(fā)布后震動(dòng)不小。DeepSeek?V3 發(fā)布在 2024 年底／2025 年初，其在數(shù)學(xué)、編碼任務(wù)上的表現(xiàn)被業(yè)界認(rèn)為“性價(jià)比高 + 推理 +成本比驚人”。

緊接著，阿里在 2025 年春節(jié)發(fā)布了Qwen 2.5?Max。幾個(gè)月后，阿里又發(fā)布了 Qwen 3 系列，帶 hybrid reasoning（混合推理）能力。

Qwen3包含235B和30B兩種MoE架構(gòu)及6個(gè)Dense模型，覆蓋6B-232B的多種尺寸的8款系列模型。阿里的Qwen系列更新速度和更新范圍在全球都無出其右。

不只是DeepSeek和Qwen在充當(dāng)主力軍，混元開放從 0.5B 到7B 的小尺寸模型，支持終端與低功耗場景落地。

Kimi K2 是一個(gè) 1T 參數(shù)總量、32B 激活參數(shù)的 MoE 模型，對(duì) Agent 與 coding 任務(wù)友好，支持 128K 上下文，開源且免費(fèi)商用。

GLM-4.5 融合了推理、代碼與智能體能力，是國產(chǎn)開源模型中的新標(biāo)桿，在多個(gè) benchmark 上為開源模型中表現(xiàn)最優(yōu)，參數(shù)效率與成本效益顯著提升。

所以「下載量幾乎趕上 + 新模型速度 +派生／fine?tune 模型數(shù)目增多」這些都指向了一個(gè)拐點(diǎn)：中國開源大模型生態(tài)不再是追隨者，而是正式進(jìn)入高速對(duì)抗＋超越可能的階段。

國外開源為何落后？

美國這邊落后的原因，不是因?yàn)槿宋锊慌Γ墙Y(jié)構(gòu) +生態(tài) +方向 +部署門檻幾個(gè)地方被拉開了差距。Llama 4 是一個(gè)重要節(jié)點(diǎn)，可以重點(diǎn)說下。

Meta 在 2025 年發(fā)布了 Llama 4 家族（包括 Maverick、Scout 等版本），這個(gè)趕工版本出現(xiàn)了很多問題：

1.過載現(xiàn)象嚴(yán)重，應(yīng)試的產(chǎn)物

有傳言Llama 4 在后訓(xùn)練階段中，將多個(gè)benchmark測試集混入訓(xùn)練數(shù)據(jù)。這讓模型的測試成績出眾，但在泛化任務(wù)中表現(xiàn)差強(qiáng)人意。實(shí)測很多任務(wù)的表現(xiàn)還不如GPT-4o。

2.派生 /開源自由度下降

雖然 Llama4 是開源權(quán)重模型（open?weight 模型家族），但在派生（fine?tune／第三方修改）社區(qū)里的活力相比之前有所下降。Interconnects 報(bào)告里提到，美國模型（Llama 系列）派生模型的比例從 2024 年底約 50% 高峰降到現(xiàn)在約 15%。意味著很多用戶／開發(fā)者在下載之后，不是“繼續(xù)改造／訓(xùn)練／fine?tune”的機(jī)會(huì)變少了。

3.成本與部署門檻太高

DeepSeek 和 Qwen 在“低成本推理”“輕量版本 /蒸餾版／distill／量化支持”上動(dòng)作快，用 GPU／硬件要求稍低的版本可用性更高。Llama4 在最強(qiáng)的版本可能需要更高算力／內(nèi)存／成本，這在很多中小企業(yè)／開發(fā)者里是門檻。

而GPT和Grok開源速度又很慢，難以扛起國外的開源大旗。

OpenAI 在 2025 年 8 月 6 日推出自 GPT-2 以來的首批開源權(quán)重語言模型 gpt-oss-120b 與 gpt-oss-20b，性能堪比 o4-mini 和 o3-mini，可在高端筆記本和手機(jī)上運(yùn)行。

不過，OpenAI 的主流模型如 GPT-4o、GPT-5 等仍然是閉源的。

8 月 24 日，xAI 開源了 Grok-2。Grok-2 在編碼、復(fù)雜問題和數(shù)學(xué)方面表現(xiàn)出色，還能生圖識(shí)圖，性能比肩當(dāng)時(shí)的 GPT-4o。不過，Grok-2 的開源協(xié)議較為嚴(yán)苛，xAI 允許非商業(yè)與合規(guī)商業(yè)使用，但禁止用其訓(xùn)練其他基礎(chǔ)模型，僅當(dāng)關(guān)聯(lián)公司年收入低于一百萬美元時(shí)，才可用于商業(yè)用途，超過此門檻的商業(yè)用途需獲得 xAI 的單獨(dú)許可。

xAI 表示 Grok-3 將在 Grok-2 開源大概 6 個(gè)月內(nèi)開源。

現(xiàn)在美國開源的大旗，已經(jīng)看不到一個(gè)實(shí)力選手了。

開源未來之路探索

最核心的原因，是Meta的Llama4 發(fā)布的口碑，確實(shí)影響了其行業(yè)認(rèn)可度。

尤其Llama4 雖然支持多模態(tài)，但在OCR／圖像 + 文本混合應(yīng)用等細(xì)節(jié)優(yōu)化，以及成本／延遲／部署資源要求上，用戶反饋并不是每個(gè)場景都能“拿來就用”。

最新消息傳言，新版本的Llama4X可能轉(zhuǎn)向閉源。

中國的 DeepSeek + Qwen 則多頻次推出新版本／升級(jí)，以及強(qiáng)勁的中國本土需求 +語言 +多模態(tài)場景，讓中國模型在下載量＋派生＋部署效率上增長非常快。

國產(chǎn)開源大模型每隔一段時(shí)間就有新版本／新變體／容量／多模態(tài)／OCR／混合模態(tài)之類的更新。這些頻率＋迭代讓用戶／社區(qū)“跟得上看到實(shí)際進(jìn)步”的那種信心很強(qiáng)。

比如，最新的 Qwen?3 系列／Qwen?Next（有的媒體稱之為下一代 Qwen，或者 Qwen3）被報(bào)道擁有混合推理能力（hybrid reasoning），更強(qiáng)的推理 + 對(duì)多模態(tài) /實(shí)際應(yīng)用場景的支持。

總結(jié)：這不是某一個(gè)模型的“反超”，而是生態(tài)拐點(diǎn)。
甚至a16z的合伙人Martin Casado說，預(yù)計(jì)80%的灣區(qū)初創(chuàng)公司，都在基于中國開源模型進(jìn)行開發(fā)。

未來幾個(gè)月／一年里，我們可以重點(diǎn)看三件事：

Qwen?Next / Qwen3 等下一代模型的正式 benchmark +開源程度如何；
DeepSeek 后續(xù)版本將帶來多大程度的升級(jí)，R2或者V4帶來驚喜可期；
HugginFace／ModelScope 等開源模型托管／派生生態(tài)是不是繼續(xù)給中國模型更大的空間增長。

總結(jié)來說，中國開源模型的優(yōu)勢不僅是“便宜”或“中文好”，而是“速度 +迭代 +社區(qū)生態(tài) +部署門檻低”，這些組合在一起，構(gòu)成了現(xiàn)在這個(gè)拐點(diǎn)。

參考資料：

https://www.interconnects.ai/p/on-chinas-open-source-ai-trajectory

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.