Cursor自研新模型反超 Opus 4.6，主打“價格打一折”，網(wǎng)友群嘲“Kimi 2.5套殼”，馬斯克認證

2026-03-21 13:35:08　來源: 華爾街見聞官方

上海舉報

分享至

AI編程工具Cursor高調(diào)發(fā)布自研模型Composer 2，宣稱性能超越Claude Opus 4.6且價格大幅壓低，卻在不到3小時內(nèi)遭開發(fā)者揭穿——其底層基座正是中國月之暗面的開源模型Kimi K2.5。

這場"自研"風波迅速席卷AI社區(qū)，馬斯克親自下場認證，最終以Cursor聯(lián)合創(chuàng)始人公開致歉、Kimi官方發(fā)文祝賀收場。

3月21日，據(jù)硬AI消息，Cursor聯(lián)合創(chuàng)始人Aman Sanger在事件發(fā)酵后發(fā)文承認，"沒有在博客中從一開始就提及Kimi基礎模型是我們的疏漏，會在下一個模型中修正這一點。"

月之暗面官方賬號隨即回應："恭喜Cursor推出Composer 2，很驕傲看到Kimi K2.5成為基礎模型，這就是我們喜歡的開源生態(tài)。"月之暗面同時澄清，Cursor系通過Fireworks AI托管的強化學習與推理平臺訪問Kimi K2.5，屬于授權(quán)商業(yè)合作

性能超越Opus 4.6，價格"腳踝斬"

Cursor本周五正式上線Composer 2，并在發(fā)布博客中宣稱，該模型在其衡量的所有基準測試上均取得大幅提升，包括Terminal-Bench 2.0和SWE-bench Multilingual。

在衡量智能體終端操作能力的Terminal-Bench 2.0上，Composer 2的表現(xiàn)位于GPT-5.4和Claude Opus 4.6之間，在CursorBench基準上的性價比表現(xiàn)則明顯超過上述兩款模型。

定價是Cursor此次發(fā)布的核心賣點。標準版Composer 2的輸入價格為0.5美元/百萬tokens、輸出價格為2.5美元/百萬tokens，與Claude Opus 4.6相比幾乎是"腳踝斬"級別的降幅。

Cursor同步推出速度更快的變體Composer 2 Fast，定價為每百萬輸入tokens 1.5美元、每百萬輸出tokens 7.5美元，在延續(xù)價格優(yōu)勢的同時主打響應速度。

Cursor將這一性價比突破歸因于一種新的強化學習方法，并強調(diào)這是"實實在在訓練出來的能力，而非推理技巧"。

發(fā)布不到3小時，底層基座遭曝光

然而，Composer 2的高光時刻極為短暫。發(fā)布后不到3小時，X平臺用戶@fynnso發(fā)現(xiàn)該模型的模型ID顯示為kimi-k2p5-rl-0317-s515-fast，隨即得出結(jié)論："Composer 2其實就是經(jīng)過強化學習的Kimi K2.5。"

這一發(fā)現(xiàn)迅速在X和Hacker News等技術社區(qū)擴散，梗圖與討論齊飛。馬斯克亦在@fynnso的帖子下直接回復"Yeah, it's Kimi 2.5"，進一步放大了話題熱度。

Reddit社區(qū)r/singularity的討論同樣熱烈。有用戶評論稱：

"最搞笑的是，大家還在夸Composer 2是巨大飛躍，結(jié)果全程用的是別人的模型。這讓人不禁想，有多少所謂'專有模型'其實只是套了個logo的開源微調(diào)版。"

也有觀點認為，Cursor的真正護城河在于其從大量開發(fā)者使用中積累的任務解決數(shù)據(jù)，而非預訓練本身，"每個投資人都知道他們沒有在做自己的基礎模型，他們本應從一開始就坦誠說明。"

Cursor致歉，Kimi確認授權(quán)合作

面對輿論壓力，Cursor團隊做出正面回應。

Aman Sanger公開確認，團隊對多個基座模型進行了困惑度評測，Kimi K2.5"證明是最強的"，隨后在此基礎上疊加了持續(xù)預訓練和4倍規(guī)模的高算力強化學習，并通過Fireworks AI的推理與RL采樣器進行部署。

Cursor開發(fā)者教育副總裁Lee Robinson補充披露了更多技術細節(jié)：最終模型中來自基座的算力約占1/4，其余3/4來自Cursor自身訓練。

Robinson同時表示，雖然Composer 2基于開源模型開發(fā)，但未來團隊也會進行完整的預訓練。

月之暗面官方隨后明確表態(tài)，強調(diào)此次合作符合許可證要求，屬于授權(quán)商業(yè)合作，并對Cursor發(fā)布Composer 2表示祝賀。

至此，這場爭議的法律與授權(quán)層面基本厘清，但Cursor在發(fā)布時刻意回避底座信息的做法，在開發(fā)者社區(qū)仍留有余波。

"做筆記"強化學習：Cursor的技術自述

盡管底座來源引發(fā)爭議，Cursor在技術層面的工作仍有其獨立價值。

Cursor在博客中詳細介紹了其核心方法——一種名為"自我總結(jié)（self-summary）"的強化學習機制，旨在解決AI編程助手在處理超長復雜任務時因上下文窗口有限而"跑偏"的痛點。

具體而言，模型在執(zhí)行任務過程中，會在達到固定token長度觸發(fā)點時主動暫停，生成一段"階段總結(jié)"，隨后基于壓縮后的上下文繼續(xù)推進任務。這種總結(jié)能力被納入強化學習的獎勵機制：總結(jié)質(zhì)量越高、后續(xù)任務成功率越高，模型獲得的獎勵越大，反之則受到懲罰。

Cursor披露的內(nèi)部測試數(shù)據(jù)顯示，與傳統(tǒng)摘要方法相比，該方法的token用量僅為傳統(tǒng)方法的1/5，而壓縮帶來的錯誤減少約50%

Cursor以"將Doom游戲跑在MIPS架構(gòu)上"這一高難度任務為例，Composer在經(jīng)過170輪交互后找到精確解法，并將10萬余tokens的上下文壓縮至約1000個。

開源生態(tài)與透明度之爭

此次事件的更深層討論，指向AI應用層與開源生態(tài)之間的互信問題。

Hugging Face聯(lián)合創(chuàng)始人兼CEO Clement Delangue從中看到了開源的價值，表示中國的開源模型如今已成為塑造全球AI技術棧的最大力量。

競爭對手Windsurf則迅速抓住時機，宣布未來一周將對用戶免費開放Kimi K2.5，借勢吸引Cursor用戶。

分析指出，對于Cursor而言，這場風波在融資關鍵節(jié)點上帶來了額外的輿論壓力。據(jù)報道，Cursor目前正以500億美元估值進行新一輪融資。

Cursor CEO Aman Sanger此前表示，Cursor是"既不是純粹的應用程序開發(fā)商，也不是模型提供商"的新型公司。

這次事件表明，當開源底座性能逐漸逼近頂尖閉源模型，下游應用廠商如何在商業(yè)包裝與技術透明度之間取得平衡，將成為行業(yè)無法回避的議題。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.