大家好,我是程序員魚(yú)皮。
今天凌晨,AI 圈又雙叒炸了。Anthropic 和 OpenAI 幾乎同時(shí)發(fā)布了自家的最新大模型 —— Claude Opus 4.6 和 GPT-5.3-Codex,中門(mén)對(duì)狙,火藥味十足。
![]()
這次兩家是真往編程和實(shí)際工作能力上卷了,不是那種 “跑分升了 2 個(gè)點(diǎn)” 就發(fā)篇博客的敷衍更新。
下面我?guī)Т蠹铱焖倭私庖幌拢@兩個(gè)模型到底更新了什么?對(duì)我們程序員和 AI 玩家來(lái)說(shuō)有什么用?
Claude Opus 4.6:更聰明、更能干、更持久
先說(shuō) Anthropic 這邊。Claude Opus 4.6 是目前 Claude 家族最強(qiáng)的模型,之前用 Claude Opus 4.5 編程就已經(jīng)讓我感覺(jué) “AI 寫(xiě)代碼無(wú)所不能” 了,而這次的 Opus 4.6 在多項(xiàng)評(píng)估中均處于最先進(jìn)水平,包括智能編碼、多學(xué)科推理、知識(shí)工作和智能搜索等。
光看這個(gè)跑分我就賊激動(dòng)了!
![]()
實(shí)際上手后,我最直觀的感受就是:干活更靠譜了。
具體更新了這些:
1)編程能力大幅提升:Opus 4.6 能更好地在大型代碼庫(kù)中工作,調(diào)試和代碼審查能力增強(qiáng),寫(xiě)完代碼還能自己檢查錯(cuò)誤。
我實(shí)測(cè)了一波,讓之前的 Opus 4.5 和新出的 Opus 4.6 同時(shí)開(kāi)發(fā)一個(gè)「聚合搜索引擎」項(xiàng)目:
請(qǐng)你幫我開(kāi)發(fā)一個(gè)聚合搜索網(wǎng)站,包含完整的前端和后端,能夠同時(shí)從多個(gè)不同的搜索引擎搜索和聚合結(jié)果。
應(yīng)該先做 MVP 最小可行產(chǎn)品,整個(gè)過(guò)程不需要向我確認(rèn)、不需要我提供 API Key,你必須確保功能正常可用。
幾分鐘后,二者都完成了任務(wù):
![]()
但是對(duì)比一下實(shí)際搜索效果,Opus 4.5 完敗,看到這我就放心了,以后我用 AI 編程估計(jì) Bug 更少了~
![]()
2)100 萬(wàn) token 上下文窗口。Opus 系列第一次支持這么長(zhǎng)的上下文,簡(jiǎn)單來(lái)說(shuō)就是你可以一次性給它丟一大堆文件和代碼,它都能記住并理解,不會(huì)像以前那樣聊著聊著就失憶了。
這也是我最最最期待的特性,復(fù)雜的前后端項(xiàng)目也可以在同一對(duì)話框中一把梭了!不用來(lái)來(lái)回回總結(jié)上下文和新開(kāi)對(duì)話框。
贛,準(zhǔn)備嘎嘎燒 Tokens 了。
3)128k 輸出 token。輸出長(zhǎng)度翻倍,意味著 Claude 可以一次性生成更長(zhǎng)的代碼和文檔,不用再拆成好幾次請(qǐng)求了。
4)自適應(yīng)思考。以前開(kāi)發(fā)者只能手選開(kāi)啟或關(guān)閉深度推理,現(xiàn)在 Claude 會(huì)自動(dòng)判斷這個(gè)問(wèn)題需不需要深度思考。簡(jiǎn)單問(wèn)題秒回,復(fù)雜問(wèn)題慢慢想,智能調(diào)節(jié),省時(shí)省錢(qián)。
5)上下文壓縮。以前跑長(zhǎng)任務(wù)的時(shí)候,AI 經(jīng)常會(huì)撞到上下文長(zhǎng)度的天花板。現(xiàn)在 Claude 能自動(dòng)壓縮和總結(jié)之前的對(duì)話內(nèi)容,讓長(zhǎng)時(shí)間運(yùn)行的任務(wù)不會(huì)中途翻車(chē)。搭配 100 萬(wàn) token 上下文,不敢想象有多持久!
6)Claude Code 支持多智能體協(xié)作。你可以同時(shí)啟動(dòng)多個(gè) AI Agent 并行工作,比如讓幾個(gè) Agent 同時(shí)審查代碼庫(kù)的不同部分,效率直接翻倍。
7)Claude in Excel 大升級(jí)。現(xiàn)在能處理更復(fù)雜的長(zhǎng)時(shí)間任務(wù),支持?jǐn)?shù)據(jù)透視表、圖表修改、條件格式、數(shù)據(jù)驗(yàn)證等,還能一次性處理多步驟操作。
![]()
8)Claude in PowerPoint 上線。能讀取你已有的模板、字體和母版,保持品牌風(fēng)格一致,然后直接幫你生成完整的 PPT。
![]()
大家對(duì) Opus 4.6 也是一致好評(píng),不少早期測(cè)試的公司都表示 “用了回不去”,Cursor 官方說(shuō) Opus 4.6 是他們內(nèi)部長(zhǎng)任務(wù)測(cè)試中的最強(qiáng)模型,Replit 說(shuō)它的任務(wù)拆解和并行規(guī)劃能力有了巨大飛躍。
GPT-5.3-Codex:OpenAI 的編程殺手锏
再看 OpenAI 這邊。這次發(fā)布的 GPT-5.3-Codex,劍指 最強(qiáng)編程 Agent,而且不只是寫(xiě)代碼,還能像你的同事一樣邊干活邊和你溝通。
相比 Claude 官方連發(fā)好幾個(gè)帖子介紹自家新模型,OpenAI 官方這邊則低調(diào)不少。Sam Altman 親自在 X 上喊話:
![]()
來(lái)看看具體有什么:
1)編程跑分全面領(lǐng)先。SWE-Bench Pro 57% 和 TerminalBench 2.0 77%,編程相關(guān)基準(zhǔn)都創(chuàng)了新高。尤其是 OSWorld(測(cè)試 AI 在真實(shí)桌面環(huán)境中完成任務(wù)的能力)直接從上一代的 38.2% 飆到 64.7%,這個(gè)提升幅度相當(dāng)炸裂。
![]()
2)速度更快、更省錢(qián)。完成同樣的任務(wù),token 消耗量不到上一代(5.2-Codex)的一半,而且每個(gè) token 處理速度還快了 25%。又快又省,這才是實(shí)實(shí)在在的體驗(yàn)提升。
3)邊干活邊匯報(bào)。以前你丟一個(gè)任務(wù)給 AI,只能干等結(jié)果。現(xiàn)在 GPT-5.3-Codex 會(huì)在工作過(guò)程中實(shí)時(shí)告訴你它在做什么、做到哪了,你隨時(shí)可以插嘴調(diào)整方向,就像真的在和一個(gè)同事協(xié)作一樣。
4)超強(qiáng)的前端開(kāi)發(fā)能力。官方直接展示了讓它做賽車(chē)游戲和潛水游戲的效果,完整度高得離譜,有多個(gè)地圖、道具系統(tǒng)和完整的游戲邏輯。
![]()
生成普通網(wǎng)頁(yè)時(shí) AI 也更懂你的意圖了,默認(rèn)就能給你做出功能更豐富、設(shè)計(jì)更合理的頁(yè)面。
5)電腦操作能力增強(qiáng)。不只是寫(xiě)代碼,它還能像人一樣操作電腦完成各種任務(wù),比如做 PPT、分析數(shù)據(jù)、處理表格,把編程 Agent 的邊界擴(kuò)展到了全能打工 Agent。
6)自己訓(xùn)練自己。OpenAI 團(tuán)隊(duì)說(shuō) GPT-5.3-Codex 是第一個(gè) 參與了自身創(chuàng)造 的模型。團(tuán)隊(duì)用它的早期版本來(lái)調(diào)試訓(xùn)練過(guò)程、管理部署、分析測(cè)試結(jié)果。也就是說(shuō),AI 在加速 AI 自身的進(jìn)化,以后的進(jìn)化速度肯定會(huì)越來(lái)越快。
7)網(wǎng)絡(luò)安全能力大幅增強(qiáng)。這是第一個(gè)被 OpenAI 歸類(lèi)為高能力網(wǎng)絡(luò)安全模型的版本,能主動(dòng)發(fā)現(xiàn)代碼漏洞。OpenAI 同時(shí)承諾投入 1000 萬(wàn)美元 API 額度支持網(wǎng)絡(luò)防御研究。
我的看法
這次兩家巨頭同時(shí)發(fā)布新模型,互相貼臉開(kāi)大,對(duì)我們用戶(hù)來(lái)說(shuō)是好事。可以看到,這兩個(gè)模型都在往 實(shí)用方向 猛卷,是真的想讓你日常工作中用得上。
這兩個(gè)大模型應(yīng)該如何選擇呢?
簡(jiǎn)單對(duì)比一下:
Claude Opus 4.6 是六邊形戰(zhàn)士,編程、辦公、研究樣樣行,特別是在 Excel、PowerPoint 這些辦公場(chǎng)景里做了很深的整合。
GPT-5.3-Codex 把編程能力拉滿,在代碼生成、任務(wù)執(zhí)行和人機(jī)協(xié)作上打出了差異化優(yōu)勢(shì)。
不過(guò)我估計(jì)網(wǎng)絡(luò)和價(jià)格就已經(jīng)勸退一大波國(guó)內(nèi)用戶(hù)了,如果你只是日常學(xué)習(xí)、或者做做工具類(lèi)小項(xiàng)目,也不必盲目追求國(guó)外的大模型。很快 DeepSeek V4 等一系列國(guó)產(chǎn)大模型應(yīng)該就要出來(lái)了,期待一波~
點(diǎn)擊下方關(guān)注魚(yú)皮,獲取免費(fèi)編程學(xué)習(xí)路線、簡(jiǎn)歷模板、面試題解、AI 知識(shí)庫(kù)、項(xiàng)目教程、交流群。
一些對(duì)大家有用的資源:
100+ 編程學(xué)習(xí)路線 / 實(shí)戰(zhàn)項(xiàng)目 / 求職指導(dǎo)
100+ 簡(jiǎn)歷模板
300+ 企業(yè)面試題庫(kù) mianshiya.com
500+ AI 資源大全
1 對(duì) 1 模擬面試
動(dòng)畫(huà)學(xué)算法教程
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.