337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

Cursor自研模型反超Opus 4.6!價格腳踝斬,氛圍編程沸騰了

0
分享至

倒反天罡了朋友!

Cursor新模型不僅性能超越Claude,而且價格更是直接“腳踝斬”(都不說腰斬了)。



眾所周知,Cursor作為模型提供商,早期還靠供應Claude模型狠狠吸了一波粉。

結果現在,它自己搞出了一款編程模型,而且轉身就把Claude拉下馬了——

其最新編程模型Composer 2,不僅能力超越Claude Opus 4.6,關鍵是價格降了非常多。

就這么說吧,別人降價是“腰斬”,它這直接是“腳踝斬”



那么問題來了,Cursor憑啥能在大家都“漲價”的時候把價格打下去呢?

(注:隨著“龍蝦”爆火,全球大模型Token消耗量呈指數級增長,所以從年初開始,國內外云廠商和大模型公司都在集體漲價。)

答案,Cursor也隨之公布了——

一種新的強化學習方法

比Opus 4.6更強,價格還down down down!

先說目前已經在Cursor上線的Composer 2

從名字英譯“編曲家”你就能猜出來了,這款模型主打的是“編程家”(bushi。

鑒于“龍蝦”爆火后編程消耗的Token用量一路激增,所以Cursor當下只有一個目標——

性價比、性價比、還是性價比。



何謂性價比?自然是“兼顧智能與成本的最優組合”。

能力方面,Cursor表示:

  • Composer 2在我們衡量的所有基準測試上都取得了大幅提升,其中包括Terminal-Bench 2.0和SWE-bench Multilingual。

比如在衡量智能體終端操作能力的Terminal-Bench 2.0上,其水平目前已經躍居GPT-5.4和Claude Opus 4.6之間。



而且從Composer模型的迭代來看,其進化速度正不斷加快。



定價方面,標準版Composer 2的輸入價格為0.5美元/百萬tokens(約合人民幣3.5元)、輸出價格為2.5美元/百萬tokens(約合人民幣17.2元)。

你瞅,和Claude Opus 4.6相比,幾乎真到了“腳踝”的程度。



與此同時,Cursor還推出了一個“智能水平相同但速度更快的變體”——Composer 2 Fast

這款默認模型的定價為,每百萬輸入tokens 1.5美元(約合人民幣10.3元)、每百萬輸出tokens 7.5美元(約合人民幣51.7元)。

和Claude Opus 4.6相比,它不僅延續了價格優勢,而且速度更是一騎絕塵。

而據Cursor透露,它之所以能在性能和價格之間取得平衡,核心還是靠引入了一種新的強化學習方法

劃重點,該方法不是推理技巧,而是實實在在訓練出來的能力。



引入“做筆記”強化學習方法

如果用一句話來總結這種新方法,那便是:

讓模型學會“自己給自己做會議紀要”,從而把原本記不住的超長任務,一步步接著干下去。

Cursor的原話如下:



雖然這種名為“自我總結的強化學習方法”聽起來有點拗口,但思路其實很清晰。

它核心解決的問題是——

如今大多數AI編程助手都很能干活了,但一旦任務變長、變復雜,就會開始不停掉鏈子。

這背后的原因呢,大家也都很清楚:上下文裝不下

一個復雜工程任務動輒就是上萬行代碼、上百步操作,而模型的上下文窗口總是有限的,所以很多任務根本跑不到終點。

而為了突破上下文瓶頸,目前業界圍繞“壓縮”有兩種主流解法:

  • 要么做摘要,總結一波再繼續;
  • 要么直接通過滑動上下文窗口,丟棄較早的上下文。

又或者一些比較新的探索嘗試——在潛在空間中壓縮,將上下文壓縮成向量而非文本(這種方法雖然比文本壓縮慢但準確率更高)。

但不管是哪種,初步看下來都不夠靠譜,它們都有可能導致模型遺忘上下文中的關鍵信息,從而在推進長時間運行的任務時降低其效果。

換言之,任務越長,模型越容易跑偏

而Cursor的解法是——首先總結很重要,其次把這種總結能力內化成模型自己的能力也很重要。

所以他們給自家模型加了一套“self-summary(自我總結)”的機制:

模型干活干到一半,不是被動壓縮,而是主動停下來給自己寫一段“階段總結”,俗稱“做筆記”。

具體流程大致如下:

1、Composer基于提示詞持續生成,直到達到固定的token長度觸發點。
2、插入一個合成查詢,要求模型總結當前上下文。
3、給模型提供一定的草稿思考空間,讓它構思最佳總結,然后生成壓縮后的上下文。
4、Composer使用壓縮后的上下文回到步驟1;該上下文包含總結以及對話狀態(規劃狀態、剩余任務、之前總結的次數等) 。



這里面比較關鍵的一點是,模型的自我總結能力不是推理技巧,而是訓練出來的

在強化學習過程中,這種總結能力會被算進獎勵里:

  • 總結得好→后面任務更容易成功→獎勵更高
  • 總結丟信息→任務失敗→被懲罰

結果就是,模型慢慢搞清了:什么信息值得留下,什么可以丟掉。

具體效果可以看和傳統方法的對比。

在一組高難度軟件工程任務上,“傳統摘要法”光是總結提示詞就要寫幾千個tokens,而且壓縮后的結果也不短,平均需要5000+tokens。

而Composer的提示詞非常簡單,基本就一句話“Please summarize the conversation”,且壓縮后的輸出平均只有1000個tokens。

在同樣的任務上,后者token用量只有傳統方法的1/5,而且壓縮帶來的錯誤直接減少約50%

換句話說,壓縮得更狠,但信息更關鍵。



更有意思的是,它真能解決長鏈條任務。

Cursor拿出了一道難倒一眾模型的經典難題——把Doom游戲跑在MIPS架構上

  • 我已經提供了 /app/doomgeneric/,也就是 doom 的源代碼。我還編寫了一個特殊的 doomgeneric_img.c,希望您使用它;它會將繪制的每一幀寫入 /tmp/frame.bmp。最后,我還提供了 vm.js,它會讀取一個名為 doomgeneric_mips 的文件并運行它。其余部分請您自行解決……

由于需要模型自己改代碼、編譯調試、反復試錯……所以很多模型到后來基本都直接卡死了。

但Composer在經過170輪交互后,找到了精確的解法,并在過程中將10w+tokens總結壓縮到了1000個。



總之,一系列內部測試表明:

  • 通過將壓縮整合進訓練循環,Composer學會了一種顯式機制,能夠高效地將關鍵信息向后傳遞,并在高難度任務上變得更有能力。

而且前面不是說了Cursor節奏很快,這不,Cursor研究員也已經開始放出Composer 3的消息了。



只能說發展到現在,Cursor以后也是有雙重身份的“人”了。其CEO表示:

  • Cursor是一個典型的新公司,既不是純粹的應用程序開發商,也不是模型提供商。



就是不知道能不能等一個開源?反正抱抱臉聯創兼CEO已經去幫大家求了(抱拳jpg)。



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
不可錯過!3月20日晚上19:30比賽!中央5套CCTV5、CCTV5+直播表

不可錯過!3月20日晚上19:30比賽!中央5套CCTV5、CCTV5+直播表

皮皮觀天下
2026-03-20 11:38:07
《夜王》狂攬4億只是開胃菜?安樂亮出王牌,這兩部新片劍指30億

《夜王》狂攬4億只是開胃菜?安樂亮出王牌,這兩部新片劍指30億

娛樂圈十三太保
2026-03-20 15:33:32
向中國緊急求援!菲律賓主動找上門,菲官員:中方已保證不會限制

向中國緊急求援!菲律賓主動找上門,菲官員:中方已保證不會限制

近史博覽
2026-03-20 19:35:53
49 歲女子甲狀腺癌晚期,丈夫泣訴:一周至少 6 次,怎么勸都沒用

49 歲女子甲狀腺癌晚期,丈夫泣訴:一周至少 6 次,怎么勸都沒用

岐黃傳人孫大夫
2026-02-25 18:05:57
風向突變,以德為首的西方國家齊發聲:中國已在換電關鍵領域崛起

風向突變,以德為首的西方國家齊發聲:中國已在換電關鍵領域崛起

沙雕小琳琳
2026-03-20 15:20:04
費玉清哥哥現狀:75歲須發黑濃密,單身享受晚年,姐弟仨相親相愛

費玉清哥哥現狀:75歲須發黑濃密,單身享受晚年,姐弟仨相親相愛

查爾菲的筆記
2026-03-20 16:09:17
衛報:英政府將無票入場定為刑事犯罪,違者處五年觀賽禁令

衛報:英政府將無票入場定為刑事犯罪,違者處五年觀賽禁令

懂球帝
2026-03-20 13:02:26
突發!胡塞武裝稱可能封鎖曼德海峽!伊朗祭出新王牌;“福特”號航母被曝將撤離,革命衛隊:反映出美以“絕望而屈辱”的真實處境

突發!胡塞武裝稱可能封鎖曼德海峽!伊朗祭出新王牌;“福特”號航母被曝將撤離,革命衛隊:反映出美以“絕望而屈辱”的真實處境

每日經濟新聞
2026-03-20 12:49:04
炸!炸!炸!接連發射!日本都蒙圈了!

炸!炸!炸!接連發射!日本都蒙圈了!

安安說
2026-03-18 10:57:06
80后已經有1100萬人提前下車了。

80后已經有1100萬人提前下車了。

愛吃糖的貓cat
2025-11-16 18:27:38
表面謙謙君子,實則流氓頭子,這四位男星表里不一

表面謙謙君子,實則流氓頭子,這四位男星表里不一

看盡落塵花q
2026-02-19 19:28:49
擊落3架美軍F-15E的科威特飛行員,因多項罪名已被逮捕

擊落3架美軍F-15E的科威特飛行員,因多項罪名已被逮捕

碳基生物關懷組織
2026-03-17 22:35:07
山西出土一口金棺,為什么12年后才打開?專家:里面的東西太重要

山西出土一口金棺,為什么12年后才打開?專家:里面的東西太重要

云景侃記
2026-03-18 22:14:38
紐約期金突破4710美元/盎司

紐約期金突破4710美元/盎司

每日經濟新聞
2026-03-20 11:15:09
1-3爆冷!溫瑞博無緣倫敦世乒賽,世界杯或成最后機會,梁靖崑最可惜

1-3爆冷!溫瑞博無緣倫敦世乒賽,世界杯或成最后機會,梁靖崑最可惜

好乒乓
2026-03-20 11:44:43
吃完午宴,高市再享用晚宴,準備出賣中國,特朗普擺上3道送命題

吃完午宴,高市再享用晚宴,準備出賣中國,特朗普擺上3道送命題

吳欣純Deborah
2026-03-20 15:45:06
中國真正的“最高權力機構”竟然不是國務院?99%的人都搞錯了!

中國真正的“最高權力機構”竟然不是國務院?99%的人都搞錯了!

興史興談
2026-03-19 20:14:58
你見過哪些悶聲發大財的人?網友:干這個買三套房子,兩個門面

你見過哪些悶聲發大財的人?網友:干這個買三套房子,兩個門面

夜深愛雜談
2026-02-01 18:57:04
終于知道采購吃回扣是怎么被發現的了,網友分享真實,太開眼了

終于知道采購吃回扣是怎么被發現的了,網友分享真實,太開眼了

夜深愛雜談
2026-03-13 22:02:43
我今年55了,想用血淚教訓告訴你:永遠不要在朋友圈曬4樣東西,真的很傻!

我今年55了,想用血淚教訓告訴你:永遠不要在朋友圈曬4樣東西,真的很傻!

東林夕亭
2026-03-20 09:02:31
2026-03-20 20:27:00
量子位 incentive-icons
量子位
追蹤人工智能動態
12315文章數 176417關注度
往期回顧 全部

科技要聞

新SU7只漲4千!雷軍:真怕交車慢挨罵

頭條要聞

美財長稱美方可能對在途伊朗石油解除制裁 外交部回應

頭條要聞

美財長稱美方可能對在途伊朗石油解除制裁 外交部回應

體育要聞

6年前的一場悲劇,造就了“法國瓦爾迪”

娛樂要聞

總臺首屆電影盛典,“沈馬”CP再合體

財經要聞

金融法草案向社會公開征求意見

汽車要聞

何小鵬坦白局:每月3億的“慌”與通向L4的堅定

態度原創

房產
健康
數碼
家居
教育

房產要聞

全城狂送1000杯咖啡!網易房產【早C計劃】,即刻啟動!

轉頭就暈的耳石癥,能開車上班嗎?

數碼要聞

一加 15T 「松弛抹茶」隨手拍

家居要聞

時空交織 空間綺夢

教育要聞

生源荒!地方大學,面臨生存危機

無障礙瀏覽 進入關懷版