337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

6小時,200美元,0人類代碼:Anthropic把AI編程推過了臨界點

0
分享至


新智元報道

編輯:KingHZ

【新智元導(dǎo)讀】代碼沒有消失,但它不再是少數(shù)人特權(quán)。在「創(chuàng)造平權(quán)」的AI時代,真正稀缺的不再是編程能力,而是你是否有一個值得讓機(jī)器為你燃燒幾百美元算力的好想法。

真正讓人不安的,不是AI提高生產(chǎn)力,而是AI開始主導(dǎo)「生產(chǎn)關(guān)系」。

Anthropic最危險的進(jìn)步,不是AI會寫代碼,而AI開始獨自把項目做完。

一句話需求、6個小時、200美元。


沒有產(chǎn)品經(jīng)理、沒有程序員、沒有設(shè)計師,甚至全程人類補(bǔ)一行代碼。

Anthropic把Claude丟進(jìn)一個任務(wù)里:做一套完整的復(fù)古游戲編輯器。

結(jié)果,Claude沒有只交出一個像樣的頁面。

它自己拆需求,自己寫代碼,自己測試,自己返工,最后交出一個真的能跑起來的成品。






在Anthropic這次實驗里,AI已經(jīng)不只是生成代碼,而是在逼近交付。

過去我們聊AI編程,聊的是它寫得快不快。現(xiàn)在問題變成了:它能不能連續(xù)工作幾個小時,在第5輪、第10輪修改里不跑偏,最后把東西交出來。

Anthropic這次給出的答案是:能。

但前提不是把AI當(dāng)一個人使,而是把它組織成一個團(tuán)隊。


原文鏈接:https://www.anthropic.com/engineering/harness-design-long-running-apps

AI不是不聰明,而是不穩(wěn)定

過去的AI很像一個天賦很高的實習(xí)生。

第一版,沖得很猛。

第一個頁面,出得很快。

第一輪代碼,看上去也像那么回事。

但任務(wù)一拉長,它就開始亂:

邏輯散了,上下文丟了。

該修的沒修,該測的沒測。

最麻煩的是,它常常會提前進(jìn)入一種「看起來做完了」的狀態(tài)。

Anthropic點得很準(zhǔn):問題不一定出在智力上,而是出在長程執(zhí)行上。

Anthropic做了一個對照實驗,結(jié)果很殘酷。

單智能體模式下,AI用20分鐘、9美元,也做出了一個「像游戲編輯器」的東西。


問題是,一上手就露餡——

交互沒打通;實體沒正常響應(yīng);核心玩法直接失靈。



這說明一件事:

以前大家總以為AI不行,是因為還不夠聰明。

現(xiàn)在看,很多時候真正拖AI后腿的,不是智商,而是穩(wěn)定性

很多人一說AI記不住,第一反應(yīng)都是:那就給它更大的上下文窗口。

聽起來很合, 但Anthropic這次潑了一盆冷水。

窗口更大,不一定更強(qiáng)。很多時候,只是把混亂一起放大了。

東西越堆越多,但真正重要的主線,反而越容易被淹掉。這就是所謂的「上下文腐爛」。

更麻煩的是,模型還容易高估自己。

Anthropic發(fā)現(xiàn),程序明明一跑就崩,模型卻覺得自己做得不錯。

于是單智能體會掉進(jìn)兩個坑:一邊越寫越亂;一邊越亂越覺得自己沒問題。

這就是為什么,單純靠更大模型、更長窗口、更高token上限,AI并不能獨立完成項目交付。

為了取得突破,Anthropic Labs成員Prithvi Rajasekaran探索了一些新穎的AI工程方法。


這些方法在兩個截然不同的領(lǐng)域中均適用:一個由主觀品味定義,另一個則以可驗證的正確性和可用性為準(zhǔn)。

受對抗生成網(wǎng)絡(luò)(GANs)的啟發(fā),他設(shè)計了一種包含生成器和評估器的多智能體結(jié)構(gòu)。

沒造「超人」,但Anthropic造了神團(tuán)隊

這次最關(guān)鍵的變化,不是參數(shù)。不是窗口。也不是什么神秘提示詞。

真正的變化是,Anthropic不再逼一個AI單槍匹馬干完整個項目。

它開始讓AI分工。

這套結(jié)構(gòu)很像一個小型產(chǎn)品團(tuán)隊。

  • Planner,負(fù)責(zé)想清楚。它先把一句模糊需求,擴(kuò)成規(guī)格,定義產(chǎn)品到底要做什么。

  • Generator,負(fù)責(zé)動手。它下場寫代碼,搭前后端,接交互,做集成,一輪輪推進(jìn)。

  • Evaluator,負(fù)責(zé)挑錯。它不負(fù)責(zé)體面。它只負(fù)責(zé)驗收。點頁面、試按鈕、查數(shù)據(jù)庫、測接口,把問題一個個揪出來,再打回去重做。


最后一步特別關(guān)鍵,因為一邊寫,一邊給自己打分,最后AI很容易說服自己:差不多就行。

但把兩者拆開,很多本來會被糊弄過去的問題,就過不去了。

拿那套復(fù)古游戲編輯器來說,Planner最初拿到的只有一句話需求。

但最后擴(kuò)出來的,是一份包含16個功能、10個沖刺的規(guī)格書。

精靈動畫、音效系統(tǒng)、行為模板、AI精靈生成、關(guān)卡設(shè)計助手、導(dǎo)出分享,全部被拆進(jìn)流程里。

這已經(jīng)不是「AI寫代碼」了,AI開始學(xué)會像團(tuán)隊一樣做產(chǎn)品。

真正拉高質(zhì)量的,是高壓驗收

今天很多AI產(chǎn)品都有一種共同氣質(zhì)——看著完整,配色安全,布局規(guī)整。

挑不出大錯,但也沒什么靈魂。這種東西叫AISlop「AI泔水」。說白了,就是「像成品的樣子貨」。

顯然,Anthropic不滿足于這種結(jié)果。

所以它不只讓Evaluator查bug,還讓它盯四件事:

設(shè)計質(zhì)量、原創(chuàng)性、工藝感、功能性。

而且,它還故意把「原創(chuàng)性」和「設(shè)計質(zhì)量」的權(quán)重拉高。

譯成人話就是:別總交最安全的答案,做點真的像作品的東西出來。

這背后是一個很重要的信號:

很多人以為AI的創(chuàng)造力來自靈光一現(xiàn),但很多時候,AI的創(chuàng)造力,恰恰是被高標(biāo)準(zhǔn)一點點逼出來的。

所以,下一階段真正稀缺的能力,可能不是「誰更會生成」,而是「誰更會評價」。

你有多會挑錯,決定AI最終能走多遠(yuǎn)。

最可怕的是,AI真能改到第10輪

這次實驗最讓人不安的,是Claude開始形成很強(qiáng)的閉環(huán)感。

還是看RetroForge,也就是那套復(fù)古游戲編輯器。

同樣一句話需求。

單智能體版,20分鐘,9美元。很快,也很便宜,但更像一個空殼。


三智能體版本,6小時,200美元。貴得多,慢得多,但最后結(jié)果完全不是一個量級。

它真的把27條驗收標(biāo)準(zhǔn),一條一條啃過去了。

這里面暴露出來的,是實打?qū)嵉能浖こ虇栴}。比如:

函數(shù)寫了,但事件沒觸發(fā)。

接口有了,但路由順序錯了,參數(shù)被錯誤解析。

這說明它做的,已經(jīng)不只是拼頁面,開始進(jìn)入真正的工程地帶。

另一個例子更夸張。

Claude用了不到4小時、約124.7美元,做出一個能在瀏覽器里跑的DAW,也就是數(shù)字音頻工作站。

它有排列視圖、有混音器、有傳輸控制、有實時波形預(yù)覽。

還內(nèi)置了一個AI智能體,可以直接理解自然語言的音樂指令。

你告訴它節(jié)奏、調(diào)性、旋律、鼓軌、混響,它能繼續(xù)往下做。

更關(guān)鍵的是,Evaluator沒有放過它:


恰恰是這些被揪出來的問題,證明了這套系統(tǒng)真的形成了閉環(huán):

不止要做完,還要被打回去改。改到能過驗收,才算結(jié)束。

這才是軟件開發(fā)里最難、也最有價值的部分。

第一版從來不難,難的是第8版、第9版、第10版。

真正的分水嶺,

AI第一次反復(fù)改到交付

Anthropic這次最值得行業(yè)警惕的,不是讓Claude變成了一個更強(qiáng)的程序員。

而是讓它第一次表現(xiàn)得像一個真正的產(chǎn)品組織,分工明確,各司其職。

這就是為什么,這次突破看起來不像「生產(chǎn)力升級」,更像一次「生產(chǎn)關(guān)系升級」。

過去,AI最強(qiáng)的能力是「生成一個答案」。

現(xiàn)在,它開始逼近另一種更難的能力:

圍著一個目標(biāo),持續(xù)工作,持續(xù)修正,直到交付。

這才是真正的臨界點。

代碼沒有消失,它只是在失去作為少數(shù)人特權(quán)的地位。

在這個「創(chuàng)造平權(quán)」的時代,你是否真的有一個值得讓機(jī)器為你燃燒算力的好主意?

這才是最值得深思的問題。

參考資料:

https://www.anthropic.com/engineering/harness-design-long-running-apps

https://x.com/AnthropicAI/status/2036481033621623056

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
非法收受巨額財物,廣東省能源集團(tuán)有限公司原黨委副書記、紀(jì)委書記黎凱生被公訴

非法收受巨額財物,廣東省能源集團(tuán)有限公司原黨委副書記、紀(jì)委書記黎凱生被公訴

新浪財經(jīng)
2026-03-31 20:57:13
蘋果京東旗艦店將于4月1日開啟“Apple 50周年慶”直播活動

蘋果京東旗艦店將于4月1日開啟“Apple 50周年慶”直播活動

IT之家
2026-03-30 23:01:56
我做兇宅試睡員10年,我見過上百套兇宅,最終栽在了一套江景房里

我做兇宅試睡員10年,我見過上百套兇宅,最終栽在了一套江景房里

千秋文化
2026-03-28 21:31:38
正式退出常規(guī)賽!焦泊喬赴京開啟治療,原因曝光,杜鋒該醒醒了

正式退出常規(guī)賽!焦泊喬赴京開啟治療,原因曝光,杜鋒該醒醒了

萌蘭聊個球
2026-03-31 14:44:52
軍銜最高的12位開國女軍官,都是什么軍銜?

軍銜最高的12位開國女軍官,都是什么軍銜?

幽州校尉
2026-03-28 07:31:51
19歲女生被困柬埔寨,綁匪正臉照曝光,網(wǎng)友放話:你的下場會很慘

19歲女生被困柬埔寨,綁匪正臉照曝光,網(wǎng)友放話:你的下場會很慘

央小北
2026-04-01 02:35:51
合砍24分,再中6記三分!火箭隊雙射手撐起2陣,航天城短板變優(yōu)勢

合砍24分,再中6記三分!火箭隊雙射手撐起2陣,航天城短板變優(yōu)勢

熊哥愛籃球
2026-03-31 11:53:36
66歲大爺相親50歲大媽:兩人婚前同居一段時間,大媽:白日做夢

66歲大爺相親50歲大媽:兩人婚前同居一段時間,大媽:白日做夢

惟來
2026-03-30 17:56:49
國務(wù)院國資委黨委召開巡視工作會議暨2026年第一輪巡視動員部署會

國務(wù)院國資委黨委召開巡視工作會議暨2026年第一輪巡視動員部署會

國資小新
2026-03-31 21:36:36
宿遷市領(lǐng)導(dǎo)干部任職前公示

宿遷市領(lǐng)導(dǎo)干部任職前公示

速新聞
2026-03-31 20:55:27
雄鹿裁掉托馬斯內(nèi)幕?波蒂斯:這哥們純屬點背!

雄鹿裁掉托馬斯內(nèi)幕?波蒂斯:這哥們純屬點背!

仰臥撐FTUer
2026-03-31 12:16:17
2012年一伙歹徒劫機(jī),快得手時,有女乘客大吼一聲,結(jié)局意想不到

2012年一伙歹徒劫機(jī),快得手時,有女乘客大吼一聲,結(jié)局意想不到

阿胡
2025-04-07 16:04:09
鄭麗文來訪時間安排有巧思,她要去江蘇可以謁陵,她已經(jīng)56歲了

鄭麗文來訪時間安排有巧思,她要去江蘇可以謁陵,她已經(jīng)56歲了

領(lǐng)悟看世界
2026-04-01 00:23:25
終于定了!中國移動正式發(fā)通知:自4月30日起,全國統(tǒng)一執(zhí)行

終于定了!中國移動正式發(fā)通知:自4月30日起,全國統(tǒng)一執(zhí)行

大魚簡科
2026-03-31 19:29:10
高盛:若中東沖突升級并加劇西方財政擔(dān)憂,黃金將沖擊6100美元!

高盛:若中東沖突升級并加劇西方財政擔(dān)憂,黃金將沖擊6100美元!

華爾街見聞官方
2026-03-31 23:33:04
公園打花事件后續(xù):景區(qū)回應(yīng),保潔老人被開除,網(wǎng)友評論一針見血

公園打花事件后續(xù):景區(qū)回應(yīng),保潔老人被開除,網(wǎng)友評論一針見血

潮鹿逐夢
2026-03-31 10:44:17
一年虧損四千萬,全國陷“關(guān)停潮”,曾經(jīng)的金飯碗現(xiàn)今卻慘遭拋棄

一年虧損四千萬,全國陷“關(guān)停潮”,曾經(jīng)的金飯碗現(xiàn)今卻慘遭拋棄

老赳說歷史
2026-03-31 20:23:32
伊朗最大島嶼遭美以襲擊,致8人死亡,位于霍爾木茲海峽北側(cè)

伊朗最大島嶼遭美以襲擊,致8人死亡,位于霍爾木茲海峽北側(cè)

魯中晨報
2026-03-31 09:57:01
張雪峰公司新掌門直播翻車:只學(xué)皮毛,丟了最值錢的東西

張雪峰公司新掌門直播翻車:只學(xué)皮毛,丟了最值錢的東西

魔都姐姐雜談
2026-03-31 05:25:26
4月1日精選熱點:太空光伏再傳利好,這三大龍頭直接受益

4月1日精選熱點:太空光伏再傳利好,這三大龍頭直接受益

元芳說投資
2026-03-31 20:55:49
2026-04-01 06:11:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14861文章數(shù) 66731關(guān)注度
往期回顧 全部

科技要聞

華為2025年銷售收入8809億,凈利潤680億元

頭條要聞

美軍向中東部署第三艘航母 估計將用時兩至三周

頭條要聞

美軍向中東部署第三艘航母 估計將用時兩至三周

體育要聞

縣城修車工,用20年成為世界冠軍

娛樂要聞

《月鱗綺紀(jì)》空降 鞠婧祎卻被舉報偷稅

財經(jīng)要聞

油價暴漲 我們的生活成本會飆升多少?

汽車要聞

騰勢Z9GT到底GT在哪?

態(tài)度原創(chuàng)

手機(jī)
數(shù)碼
藝術(shù)
房產(chǎn)
親子

手機(jī)要聞

vivo X300s線下上手:體驗后,不吐不快!

數(shù)碼要聞

飛利浦“32M2N8900X“31.5英寸顯示器開售,6999元

藝術(shù)要聞

藍(lán)瑛『蘭竹石冊』

房產(chǎn)要聞

重磅!海南城市更新擬出新政!

親子要聞

為什么不建議孩子穿開襠褲?

無障礙瀏覽 進(jìn)入關(guān)懷版