AI編程工具Cursor高調(diào)發(fā)布自研模型Composer 2,宣稱性能超越Claude Opus 4.6且價格大幅壓低,卻在不到3小時內(nèi)遭開發(fā)者揭穿——其底層基座正是中國月之暗面的開源模型Kimi K2.5。
這場"自研"風波迅速席卷AI社區(qū),馬斯克親自下場認證,最終以Cursor聯(lián)合創(chuàng)始人公開致歉、Kimi官方發(fā)文祝賀收場。
3月21日,據(jù)硬AI消息,Cursor聯(lián)合創(chuàng)始人Aman Sanger在事件發(fā)酵后發(fā)文承認,"沒有在博客中從一開始就提及Kimi基礎模型是我們的疏漏,會在下一個模型中修正這一點。"
月之暗面官方賬號隨即回應:"恭喜Cursor推出Composer 2,很驕傲看到Kimi K2.5成為基礎模型,這就是我們喜歡的開源生態(tài)。"月之暗面同時澄清,Cursor系通過Fireworks AI托管的強化學習與推理平臺訪問Kimi K2.5,屬于授權(quán)商業(yè)合作
性能超越Opus 4.6,價格"腳踝斬"
Cursor本周五正式上線Composer 2,并在發(fā)布博客中宣稱,該模型在其衡量的所有基準測試上均取得大幅提升,包括Terminal-Bench 2.0和SWE-bench Multilingual。
![]()
在衡量智能體終端操作能力的Terminal-Bench 2.0上,Composer 2的表現(xiàn)位于GPT-5.4和Claude Opus 4.6之間,在CursorBench基準上的性價比表現(xiàn)則明顯超過上述兩款模型。
定價是Cursor此次發(fā)布的核心賣點。標準版Composer 2的輸入價格為0.5美元/百萬tokens、輸出價格為2.5美元/百萬tokens,與Claude Opus 4.6相比幾乎是"腳踝斬"級別的降幅。
Cursor同步推出速度更快的變體Composer 2 Fast,定價為每百萬輸入tokens 1.5美元、每百萬輸出tokens 7.5美元,在延續(xù)價格優(yōu)勢的同時主打響應速度。
Cursor將這一性價比突破歸因于一種新的強化學習方法,并強調(diào)這是"實實在在訓練出來的能力,而非推理技巧"。
發(fā)布不到3小時,底層基座遭曝光
然而,Composer 2的高光時刻極為短暫。發(fā)布后不到3小時,X平臺用戶@fynnso發(fā)現(xiàn)該模型的模型ID顯示為kimi-k2p5-rl-0317-s515-fast,隨即得出結(jié)論:"Composer 2其實就是經(jīng)過強化學習的Kimi K2.5。"
![]()
這一發(fā)現(xiàn)迅速在X和Hacker News等技術社區(qū)擴散,梗圖與討論齊飛。馬斯克亦在@fynnso的帖子下直接回復"Yeah, it's Kimi 2.5",進一步放大了話題熱度。
![]()
Reddit社區(qū)r/singularity的討論同樣熱烈。有用戶評論稱:
"最搞笑的是,大家還在夸Composer 2是巨大飛躍,結(jié)果全程用的是別人的模型。這讓人不禁想,有多少所謂'專有模型'其實只是套了個logo的開源微調(diào)版。"
也有觀點認為,Cursor的真正護城河在于其從大量開發(fā)者使用中積累的任務解決數(shù)據(jù),而非預訓練本身,"每個投資人都知道他們沒有在做自己的基礎模型,他們本應從一開始就坦誠說明。"
Cursor致歉,Kimi確認授權(quán)合作
面對輿論壓力,Cursor團隊做出正面回應。
Aman Sanger公開確認,團隊對多個基座模型進行了困惑度評測,Kimi K2.5"證明是最強的",隨后在此基礎上疊加了持續(xù)預訓練和4倍規(guī)模的高算力強化學習,并通過Fireworks AI的推理與RL采樣器進行部署。
![]()
Cursor開發(fā)者教育副總裁Lee Robinson補充披露了更多技術細節(jié):最終模型中來自基座的算力約占1/4,其余3/4來自Cursor自身訓練。
Robinson同時表示,雖然Composer 2基于開源模型開發(fā),但未來團隊也會進行完整的預訓練。
![]()
月之暗面官方隨后明確表態(tài),強調(diào)此次合作符合許可證要求,屬于授權(quán)商業(yè)合作,并對Cursor發(fā)布Composer 2表示祝賀。
![]()
至此,這場爭議的法律與授權(quán)層面基本厘清,但Cursor在發(fā)布時刻意回避底座信息的做法,在開發(fā)者社區(qū)仍留有余波。
"做筆記"強化學習:Cursor的技術自述
盡管底座來源引發(fā)爭議,Cursor在技術層面的工作仍有其獨立價值。
Cursor在博客中詳細介紹了其核心方法——一種名為"自我總結(jié)(self-summary)"的強化學習機制,旨在解決AI編程助手在處理超長復雜任務時因上下文窗口有限而"跑偏"的痛點。
![]()
具體而言,模型在執(zhí)行任務過程中,會在達到固定token長度觸發(fā)點時主動暫停,生成一段"階段總結(jié)",隨后基于壓縮后的上下文繼續(xù)推進任務。這種總結(jié)能力被納入強化學習的獎勵機制:總結(jié)質(zhì)量越高、后續(xù)任務成功率越高,模型獲得的獎勵越大,反之則受到懲罰。
Cursor披露的內(nèi)部測試數(shù)據(jù)顯示,與傳統(tǒng)摘要方法相比,該方法的token用量僅為傳統(tǒng)方法的1/5,而壓縮帶來的錯誤減少約50%
Cursor以"將Doom游戲跑在MIPS架構(gòu)上"這一高難度任務為例,Composer在經(jīng)過170輪交互后找到精確解法,并將10萬余tokens的上下文壓縮至約1000個。
![]()
開源生態(tài)與透明度之爭
此次事件的更深層討論,指向AI應用層與開源生態(tài)之間的互信問題。
Hugging Face聯(lián)合創(chuàng)始人兼CEO Clement Delangue從中看到了開源的價值,表示中國的開源模型如今已成為塑造全球AI技術棧的最大力量。
競爭對手Windsurf則迅速抓住時機,宣布未來一周將對用戶免費開放Kimi K2.5,借勢吸引Cursor用戶。
分析指出,對于Cursor而言,這場風波在融資關鍵節(jié)點上帶來了額外的輿論壓力。據(jù)報道,Cursor目前正以500億美元估值進行新一輪融資。
Cursor CEO Aman Sanger此前表示,Cursor是"既不是純粹的應用程序開發(fā)商,也不是模型提供商"的新型公司。
這次事件表明,當開源底座性能逐漸逼近頂尖閉源模型,下游應用廠商如何在商業(yè)包裝與技術透明度之間取得平衡,將成為行業(yè)無法回避的議題。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.