聽雨 發自 凹非寺量子位 | 公眾號 QbitAI
嚯,硅谷居然被中國開源模型占領了!
連Yann LeCun也點贊:說得對!
![]()
初代AI編程炸子雞Cursor和Devin,都被曝出號稱自研的模型,其實套殼的就是中國開源模型。
![]()
上個月,Cursor承認了旗下的Composer 2套殼Kimi K2.5。
當初首個推出“AI自動工程師”Devin的公司Cognition,其自研模型SWE-1.6,則疑似在GLM模型上進行后訓練。
其實不止這兩家,類似的例子越來越多,中國開源模型在硅谷的受歡迎程度與日俱增——
Shopify因切換至Qwen,每年節省500萬美元;愛彼迎聯創Brian Chesky也曾表示:Qwen又好又快又便宜,比GPT還好用!
而且智譜最新發布的GLM-5.1,是部分指標超Opus 4.6的開源模型,估計性價比放在硅谷也相當有競爭力了。
國產開源模型橫掃硅谷
國外模型選擇蒸餾中國開源模型,或是在此基礎上進行后訓練,這事兒已經不少見了。
上個月,Cursor的自研模型Composer 2在基準測試上反超了Opus 4.6,價格還腳踝斬。
![]()
結果沒得意兩天就被曝出其實套殼Kimi K2.5。
雖然事情以雙方握手言和告一段落,但讓人唏噓不已。
Cursor啊Cursor,你好歹是初代AI編程當紅炸子雞,這事兒干得也不太地道了!
![]()
除此之外,另一位炸子雞Cognition,其自研模型SWE-1.6也被曝疑似在GLM模型上進行后訓練。
而且這家伙是個老慣犯了,從前代SWE-1.5就開始偷梁換柱。
![]()
去年,SWE-1.5就被曝是在GLM-4.6上進行后訓練得到的。
當時的梗圖傳得滿天飛:
![]()
Cursor和Cognition最早集成的都是Claude和GPT的能力,但現在已經紛紛轉投中國開源模型的懷抱。
Cognition的開發者Shawn Wang還曾直言:
- 只要基礎模型足夠好,它的具體特性就越來越不重要了,因為強化學習和后訓練才是關鍵所在,也是區分彼此的關鍵所在。
不過嘛,初創獨角獸不成建制,出現套殼還拒不承認,大家就當個笑話看。
但連巨頭也這么干,或許背后還存在更深層次的原因。
去年12月,Meta的“牛油果”項目曾被曝出使用Qwen開源模型做了蒸餾訓練。
![]()
在此之前,Meta旗下的Llama模型曾長期主導開源領域,其衍生模型數量和下載量均保持領先地位。
扎克伯格還曾經公開呼吁,要構建以美國模型為核心的開源生態。
但現在,面對自身Llama系列增長乏力與東方模型的強勢崛起,Meta已經做出了選擇。
經過9個月的奮戰,Meta的最新模型Muse Spark已經交卷,不過也是妥妥的閉源了。
此外,愛彼迎的聯創兼CEO Brian Chesky,早就被Qwen的實力圈粉了。
他曾經公開表態:
- 我們很大程度上依賴阿里巴巴的Qwen模型。它非常好,速度也很快,而且很便宜。
我們也會用OpenAI的最新模型,但在實際生產中通常不會大量使用,因為有更快、更經濟的模型可供選擇。
![]()
小八卦,Brian Chesky和奧特曼還是摯友。不過涉及自家應用產品整合時,必須得“親兄弟,明算賬”…
Brian直言不諱,表示OpenAI提供的連接工具還“沒有完全準備好”。
愛彼迎的選擇,只是中國大模型技術實力的一個縮影。
在學術界,斯坦福大學李飛飛團隊、艾倫人工智能研究所等頂尖機構在研究中也采用了基于Qwen的技術方案。
去年年初,李飛飛團隊曾基于Qwen2.5-32B構建了一個頂級推理模型s1-32B,成本不到50美元。
該模型的數學和編碼能力,與OpenAI的o1和DeepSeek的R1等尖端推理模型不相上下。
艾倫人工智能研究所也基于Qwen2-72B,構建了其多模態系統。
還有Mira Murati創辦的獨角獸Thinking Machines Lab,也把Qwen作為默認的微調選項。
中國開源模型在硅谷的走紅,可見一斑。
![]()
性價比壓倒一切
為啥硅谷這么熱衷于中國開源模型?
當然是因為量大便宜
Peter Yang算了一筆賬:在許多基準測試中,中美同等質量的模型價格相差10-20倍
就拿最新發布的幾款國產模型來說:
- Kimi K2.5:每百萬token輸入4元/輸出21元;
- MiniMax M2.7:每百萬token輸入2.1元/輸出8.4元;
- GLM-5.1:每百萬token輸入6元/輸出24元;
- Qwen3.6-Plus:每百萬token輸入2元/輸出12元。
![]()
![]()
這幾款模型在基準測試上的表現,都接近甚至部分反超了Opus 4.6、GPT-5.4等頂尖閉源模型。
但Opus 4.6的價格是每百萬token輸入5美元/輸出25美元,GPT-5.4則是輸入2.5美元/輸出15美元。
這性價比,一目了然。
節省超10倍價格,拿到一個還不錯的模型表現,豈不是美滋滋??
![]()
而且開源模型也并非完全打不過閉源。
早在Kimi還只出了K2的時候,Vercel CEO Guillermo Rauch就曾提到:
在內部智能體真實場景基準測試中,Kimi K2在運行速度和準確率上優于GPT-5和Claude Sonnet 4.5。
其中準確率更是高出50%。
硅谷投資人Chamath也曾表示,Kimi K2性能夠強,且比OpenAI和Anthropic便宜太多。
而且自從艾倫人工智能研究所宣布削減開源模型研發資金,轉向AI應用后,美國開源AI的旗幟就真倒了。
![]()
開源模型,已經來到了中國時間。
[1]https://x.com/petergyang/status/2042248752157839793?s=20
[2]The All-You-Can-Use AI Subscription Won’t Last Forever
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.