![]()
最近,Interconnects.ai 的一份報(bào)告,像在科技圈丟下一枚炸彈:截至 2025 年 8 月,中國開源大模型在 HuggingFace 上的下載量正快速趕上美國,幾乎已經(jīng)超越了。
![]()
美國這2年在開源模型上的領(lǐng)先地位,似乎正在被反超。在鯨哥看來,這不只是一個(gè)數(shù)據(jù)酷炫,下載量說明大家真的在用,證明我們?cè)谀P唾|(zhì)量、生態(tài)建設(shè)等方面都實(shí)現(xiàn)了反超。
很多人不理解意義,簡答說在移動(dòng)互聯(lián)網(wǎng)時(shí)代,很多人都用的是安卓手機(jī),開源的安卓統(tǒng)治了移動(dòng)操作系統(tǒng)的過半壁江山。AGI時(shí)代,Meta也高舉開源大模型的大旗,很多國外企業(yè)采用Llama作為AI 引擎,輸出AI的消費(fèi)級(jí)服務(wù)。
Llama差點(diǎn)成為新時(shí)代的安卓,現(xiàn)在 DeepSeek、Qwen等模型,改變了這一現(xiàn)狀。
國產(chǎn)大模型的高光時(shí)刻
具體說,是Interconnects.ai 在《ATOM Project》這份報(bào)告里,統(tǒng)計(jì)了 Meta、Google、Mistral AI、Microsoft、Alibaba Qwen 和 DeepSeek 等幾家主要大模型開放者,從它們?cè)?HuggingFace 上的下載量和派生(fine?tune/派生模型)的情況做了歸類。報(bào)告里幾個(gè)關(guān)鍵點(diǎn):
到 2025 年 8 月,美國領(lǐng)先的開源模型(主要是 Llama / Meta 系列)與中國領(lǐng)先的開源模型下載總量都在約 3 億次(~300M 次下載)左右。兩邊差距已經(jīng)非常小。
中國模型下載量的增長速度明顯快于美國模型。每個(gè)月新下載量/新增派生模型的比例,中國那邊漲得更陡。
在派生/fine?tune 模型數(shù)量上,美國的留存領(lǐng)頭優(yōu)勢在減弱。以前美國模型(主要是 Llama 系列)派生模型占比非常高,但到現(xiàn)在,中國模型(比如 Qwen 系列)一個(gè)月的新派生模型中可能占到40% 以上。美國 Llama 系列的派生比例從巔峰時(shí)的近 50% 下滑到大約 15%。
再看國產(chǎn)模型的一些動(dòng)靜:
DeepSeek 的 V3 與 R1 模型,自從發(fā)布后震動(dòng)不小。DeepSeek?V3 發(fā)布在 2024 年底/2025 年初,其在數(shù)學(xué)、編碼任務(wù)上的表現(xiàn)被業(yè)界認(rèn)為“性價(jià)比高 + 推理 +成本比驚人”。
緊接著,阿里在 2025 年春節(jié)發(fā)布了Qwen 2.5?Max。幾個(gè)月后,阿里又發(fā)布了 Qwen 3 系列,帶 hybrid reasoning(混合推理)能力。
Qwen3包含235B和30B兩種MoE架構(gòu)及6個(gè)Dense模型,覆蓋6B-232B的多種尺寸的8款系列模型。阿里的Qwen系列更新速度和更新范圍在全球都無出其右。
不只是DeepSeek和Qwen在充當(dāng)主力軍,混元開放從 0.5B 到7B 的小尺寸模型,支持終端與低功耗場景落地。
Kimi K2 是一個(gè) 1T 參數(shù)總量、32B 激活參數(shù)的 MoE 模型,對(duì) Agent 與 coding 任務(wù)友好,支持 128K 上下文,開源且免費(fèi)商用。
GLM-4.5 融合了推理、代碼與智能體能力,是國產(chǎn)開源模型中的新標(biāo)桿,在多個(gè) benchmark 上為開源模型中表現(xiàn)最優(yōu),參數(shù)效率與成本效益顯著提升。
所以「下載量幾乎趕上 + 新模型速度 +派生/fine?tune 模型數(shù)目增多」這些都指向了一個(gè)拐點(diǎn):中國開源大模型生態(tài)不再是追隨者,而是正式進(jìn)入高速對(duì)抗+超越可能的階段。
國外開源為何落后?
美國這邊落后的原因,不是因?yàn)槿宋锊慌Γ墙Y(jié)構(gòu) +生態(tài) +方向 +部署門檻幾個(gè)地方被拉開了差距。Llama 4 是一個(gè)重要節(jié)點(diǎn),可以重點(diǎn)說下。
Meta 在 2025 年發(fā)布了 Llama 4 家族(包括 Maverick、Scout 等版本),這個(gè)趕工版本出現(xiàn)了很多問題:
1.過載現(xiàn)象嚴(yán)重,應(yīng)試的產(chǎn)物
有傳言Llama 4 在后訓(xùn)練階段中,將多個(gè)benchmark測試集混入訓(xùn)練數(shù)據(jù)。這讓模型的測試成績出眾,但在泛化任務(wù)中表現(xiàn)差強(qiáng)人意。實(shí)測很多任務(wù)的表現(xiàn)還不如GPT-4o。
2.派生 /開源自由度下降
雖然 Llama4 是開源權(quán)重模型(open?weight 模型家族),但在派生(fine?tune/第三方修改)社區(qū)里的活力相比之前有所下降。Interconnects 報(bào)告里提到,美國模型(Llama 系列)派生模型的比例從 2024 年底約 50% 高峰降到現(xiàn)在約 15%。意味著很多用戶/開發(fā)者在下載之后,不是“繼續(xù)改造/訓(xùn)練/fine?tune”的機(jī)會(huì)變少了。
3.成本與部署門檻太高
DeepSeek 和 Qwen 在“低成本推理”“輕量版本 /蒸餾版/distill/量化支持”上動(dòng)作快,用 GPU/硬件要求稍低的版本可用性更高。Llama4 在最強(qiáng)的版本可能需要更高算力/內(nèi)存/成本,這在很多中小企業(yè)/開發(fā)者里是門檻。
而GPT和Grok開源速度又很慢,難以扛起國外的開源大旗。
OpenAI 在 2025 年 8 月 6 日推出自 GPT-2 以來的首批開源權(quán)重語言模型 gpt-oss-120b 與 gpt-oss-20b,性能堪比 o4-mini 和 o3-mini,可在高端筆記本和手機(jī)上運(yùn)行。
不過,OpenAI 的主流模型如 GPT-4o、GPT-5 等仍然是閉源的。
8 月 24 日,xAI 開源了 Grok-2。Grok-2 在編碼、復(fù)雜問題和數(shù)學(xué)方面表現(xiàn)出色,還能生圖識(shí)圖,性能比肩當(dāng)時(shí)的 GPT-4o。不過,Grok-2 的開源協(xié)議較為嚴(yán)苛,xAI 允許非商業(yè)與合規(guī)商業(yè)使用,但禁止用其訓(xùn)練其他基礎(chǔ)模型,僅當(dāng)關(guān)聯(lián)公司年收入低于一百萬美元時(shí),才可用于商業(yè)用途,超過此門檻的商業(yè)用途需獲得 xAI 的單獨(dú)許可。
xAI 表示 Grok-3 將在 Grok-2 開源大概 6 個(gè)月內(nèi)開源。
現(xiàn)在美國開源的大旗,已經(jīng)看不到一個(gè)實(shí)力選手了。
開源未來之路探索
最核心的原因,是Meta的Llama4 發(fā)布的口碑,確實(shí)影響了其行業(yè)認(rèn)可度。
尤其Llama4 雖然支持多模態(tài),但在OCR/圖像 + 文本混合應(yīng)用等細(xì)節(jié)優(yōu)化,以及成本/延遲/部署資源要求上,用戶反饋并不是每個(gè)場景都能“拿來就用”。
最新消息傳言,新版本的Llama4X可能轉(zhuǎn)向閉源。
中國的 DeepSeek + Qwen 則多頻次推出新版本/升級(jí),以及強(qiáng)勁的中國本土需求 +語言 +多模態(tài)場景,讓中國模型在下載量+派生+部署效率上增長非常快。
國產(chǎn)開源大模型每隔一段時(shí)間就有新版本/新變體/容量/多模態(tài)/OCR/混合模態(tài)之類的更新。這些頻率+迭代讓用戶/社區(qū)“跟得上看到實(shí)際進(jìn)步”的那種信心很強(qiáng)。
比如,最新的 Qwen?3 系列/Qwen?Next(有的媒體稱之為 下一代 Qwen,或者 Qwen3)被報(bào)道擁有混合推理能力(hybrid reasoning),更強(qiáng)的推理 + 對(duì)多模態(tài) /實(shí)際應(yīng)用場景的支持。
總結(jié):這不是某一個(gè)模型的“反超”,而是生態(tài)拐點(diǎn)。
甚至a16z的合伙人Martin Casado說,預(yù)計(jì)80%的灣區(qū)初創(chuàng)公司,都在基于中國開源模型進(jìn)行開發(fā)。
未來幾個(gè)月/一年里,我們可以重點(diǎn)看三件事:
Qwen?Next / Qwen3 等下一代模型的正式 benchmark +開源程度如何;
DeepSeek 后續(xù)版本將帶來多大程度的升級(jí),R2或者V4帶來驚喜可期;
HugginFace/ModelScope 等開源模型托管/派生生態(tài)是不是繼續(xù)給中國模型更大的空間增長。
總結(jié)來說,中國開源模型的優(yōu)勢不僅是“便宜”或“中文好”,而是“速度 +迭代 +社區(qū)生態(tài) +部署門檻低”,這些組合在一起,構(gòu)成了現(xiàn)在這個(gè)拐點(diǎn)。
參考資料:
https://www.interconnects.ai/p/on-chinas-open-source-ai-trajectory
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.