網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

剛剛，Claude Opus 4.6 和 GPT-5.3-Codex 同時(shí)炸場(chǎng)！AI 編程要變天了

2026-02-06 10:14:55　來(lái)源: 程序員魚(yú)皮

上海舉報(bào)

分享至

大家好，我是程序員魚(yú)皮。

今天凌晨，AI 圈又雙叒炸了。Anthropic 和 OpenAI 幾乎同時(shí)發(fā)布了自家的最新大模型 —— Claude Opus 4.6 和 GPT-5.3-Codex，中門(mén)對(duì)狙，火藥味十足。

這次兩家是真往編程和實(shí)際工作能力上卷了，不是那種 “跑分升了 2 個(gè)點(diǎn)” 就發(fā)篇博客的敷衍更新。

下面我?guī)Т蠹铱焖倭私庖幌拢@兩個(gè)模型到底更新了什么？對(duì)我們程序員和 AI 玩家來(lái)說(shuō)有什么用？

Claude Opus 4.6：更聰明、更能干、更持久

先說(shuō) Anthropic 這邊。Claude Opus 4.6 是目前 Claude 家族最強(qiáng)的模型，之前用 Claude Opus 4.5 編程就已經(jīng)讓我感覺(jué) “AI 寫(xiě)代碼無(wú)所不能” 了，而這次的 Opus 4.6 在多項(xiàng)評(píng)估中均處于最先進(jìn)水平，包括智能編碼、多學(xué)科推理、知識(shí)工作和智能搜索等。

光看這個(gè)跑分我就賊激動(dòng)了！

實(shí)際上手后，我最直觀的感受就是：干活更靠譜了。

具體更新了這些：

1）編程能力大幅提升：Opus 4.6 能更好地在大型代碼庫(kù)中工作，調(diào)試和代碼審查能力增強(qiáng)，寫(xiě)完代碼還能自己檢查錯(cuò)誤。

我實(shí)測(cè)了一波，讓之前的 Opus 4.5 和新出的 Opus 4.6 同時(shí)開(kāi)發(fā)一個(gè)「聚合搜索引擎」項(xiàng)目：

請(qǐng)你幫我開(kāi)發(fā)一個(gè)聚合搜索網(wǎng)站，包含完整的前端和后端，能夠同時(shí)從多個(gè)不同的搜索引擎搜索和聚合結(jié)果。
應(yīng)該先做 MVP 最小可行產(chǎn)品，整個(gè)過(guò)程不需要向我確認(rèn)、不需要我提供 API Key，你必須確保功能正常可用。

幾分鐘后，二者都完成了任務(wù)：

但是對(duì)比一下實(shí)際搜索效果，Opus 4.5 完敗，看到這我就放心了，以后我用 AI 編程估計(jì) Bug 更少了~

2）100 萬(wàn) token 上下文窗口。Opus 系列第一次支持這么長(zhǎng)的上下文，簡(jiǎn)單來(lái)說(shuō)就是你可以一次性給它丟一大堆文件和代碼，它都能記住并理解，不會(huì)像以前那樣聊著聊著就失憶了。

這也是我最最最期待的特性，復(fù)雜的前后端項(xiàng)目也可以在同一對(duì)話框中一把梭了！不用來(lái)來(lái)回回總結(jié)上下文和新開(kāi)對(duì)話框。

贛，準(zhǔn)備嘎嘎燒 Tokens 了。

3）128k 輸出 token。輸出長(zhǎng)度翻倍，意味著 Claude 可以一次性生成更長(zhǎng)的代碼和文檔，不用再拆成好幾次請(qǐng)求了。

4）自適應(yīng)思考。以前開(kāi)發(fā)者只能手選開(kāi)啟或關(guān)閉深度推理，現(xiàn)在 Claude 會(huì)自動(dòng)判斷這個(gè)問(wèn)題需不需要深度思考。簡(jiǎn)單問(wèn)題秒回，復(fù)雜問(wèn)題慢慢想，智能調(diào)節(jié)，省時(shí)省錢(qián)。

5）上下文壓縮。以前跑長(zhǎng)任務(wù)的時(shí)候，AI 經(jīng)常會(huì)撞到上下文長(zhǎng)度的天花板。現(xiàn)在 Claude 能自動(dòng)壓縮和總結(jié)之前的對(duì)話內(nèi)容，讓長(zhǎng)時(shí)間運(yùn)行的任務(wù)不會(huì)中途翻車(chē)。搭配 100 萬(wàn) token 上下文，不敢想象有多持久！

6）Claude Code 支持多智能體協(xié)作。你可以同時(shí)啟動(dòng)多個(gè) AI Agent 并行工作，比如讓幾個(gè) Agent 同時(shí)審查代碼庫(kù)的不同部分，效率直接翻倍。

7）Claude in Excel 大升級(jí)。現(xiàn)在能處理更復(fù)雜的長(zhǎng)時(shí)間任務(wù)，支持?jǐn)?shù)據(jù)透視表、圖表修改、條件格式、數(shù)據(jù)驗(yàn)證等，還能一次性處理多步驟操作。

8）Claude in PowerPoint 上線。能讀取你已有的模板、字體和母版，保持品牌風(fēng)格一致，然后直接幫你生成完整的 PPT。

大家對(duì) Opus 4.6 也是一致好評(píng)，不少早期測(cè)試的公司都表示 “用了回不去”，Cursor 官方說(shuō) Opus 4.6 是他們內(nèi)部長(zhǎng)任務(wù)測(cè)試中的最強(qiáng)模型，Replit 說(shuō)它的任務(wù)拆解和并行規(guī)劃能力有了巨大飛躍。

GPT-5.3-Codex：OpenAI 的編程殺手锏

再看 OpenAI 這邊。這次發(fā)布的 GPT-5.3-Codex，劍指 最強(qiáng)編程 Agent，而且不只是寫(xiě)代碼，還能像你的同事一樣邊干活邊和你溝通。

相比 Claude 官方連發(fā)好幾個(gè)帖子介紹自家新模型，OpenAI 官方這邊則低調(diào)不少。Sam Altman 親自在 X 上喊話：

來(lái)看看具體有什么：

1）編程跑分全面領(lǐng)先。SWE-Bench Pro 57% 和 TerminalBench 2.0 77%，編程相關(guān)基準(zhǔn)都創(chuàng)了新高。尤其是 OSWorld（測(cè)試 AI 在真實(shí)桌面環(huán)境中完成任務(wù)的能力）直接從上一代的 38.2% 飆到 64.7%，這個(gè)提升幅度相當(dāng)炸裂。

2）速度更快、更省錢(qián)。完成同樣的任務(wù)，token 消耗量不到上一代（5.2-Codex）的一半，而且每個(gè) token 處理速度還快了 25%。又快又省，這才是實(shí)實(shí)在在的體驗(yàn)提升。

3）邊干活邊匯報(bào)。以前你丟一個(gè)任務(wù)給 AI，只能干等結(jié)果。現(xiàn)在 GPT-5.3-Codex 會(huì)在工作過(guò)程中實(shí)時(shí)告訴你它在做什么、做到哪了，你隨時(shí)可以插嘴調(diào)整方向，就像真的在和一個(gè)同事協(xié)作一樣。

4）超強(qiáng)的前端開(kāi)發(fā)能力。官方直接展示了讓它做賽車(chē)游戲和潛水游戲的效果，完整度高得離譜，有多個(gè)地圖、道具系統(tǒng)和完整的游戲邏輯。

生成普通網(wǎng)頁(yè)時(shí) AI 也更懂你的意圖了，默認(rèn)就能給你做出功能更豐富、設(shè)計(jì)更合理的頁(yè)面。

5）電腦操作能力增強(qiáng)。不只是寫(xiě)代碼，它還能像人一樣操作電腦完成各種任務(wù)，比如做 PPT、分析數(shù)據(jù)、處理表格，把編程 Agent 的邊界擴(kuò)展到了全能打工 Agent。

6）自己訓(xùn)練自己。OpenAI 團(tuán)隊(duì)說(shuō) GPT-5.3-Codex 是第一個(gè) 參與了自身創(chuàng)造 的模型。團(tuán)隊(duì)用它的早期版本來(lái)調(diào)試訓(xùn)練過(guò)程、管理部署、分析測(cè)試結(jié)果。也就是說(shuō)，AI 在加速 AI 自身的進(jìn)化，以后的進(jìn)化速度肯定會(huì)越來(lái)越快。

7）網(wǎng)絡(luò)安全能力大幅增強(qiáng)。這是第一個(gè)被 OpenAI 歸類(lèi)為高能力網(wǎng)絡(luò)安全模型的版本，能主動(dòng)發(fā)現(xiàn)代碼漏洞。OpenAI 同時(shí)承諾投入 1000 萬(wàn)美元 API 額度支持網(wǎng)絡(luò)防御研究。

我的看法

這次兩家巨頭同時(shí)發(fā)布新模型，互相貼臉開(kāi)大，對(duì)我們用戶(hù)來(lái)說(shuō)是好事。可以看到，這兩個(gè)模型都在往 實(shí)用方向 猛卷，是真的想讓你日常工作中用得上。

這兩個(gè)大模型應(yīng)該如何選擇呢？

簡(jiǎn)單對(duì)比一下：

Claude Opus 4.6 是六邊形戰(zhàn)士，編程、辦公、研究樣樣行，特別是在 Excel、PowerPoint 這些辦公場(chǎng)景里做了很深的整合。
GPT-5.3-Codex 把編程能力拉滿，在代碼生成、任務(wù)執(zhí)行和人機(jī)協(xié)作上打出了差異化優(yōu)勢(shì)。

不過(guò)我估計(jì)網(wǎng)絡(luò)和價(jià)格就已經(jīng)勸退一大波國(guó)內(nèi)用戶(hù)了，如果你只是日常學(xué)習(xí)、或者做做工具類(lèi)小項(xiàng)目，也不必盲目追求國(guó)外的大模型。很快 DeepSeek V4 等一系列國(guó)產(chǎn)大模型應(yīng)該就要出來(lái)了，期待一波~

點(diǎn)擊下方關(guān)注魚(yú)皮，獲取免費(fèi)編程學(xué)習(xí)路線、簡(jiǎn)歷模板、面試題解、AI 知識(shí)庫(kù)、項(xiàng)目教程、交流群。

一些對(duì)大家有用的資源：
100+ 編程學(xué)習(xí)路線 / 實(shí)戰(zhàn)項(xiàng)目 / 求職指導(dǎo)
100+ 簡(jiǎn)歷模板
300+ 企業(yè)面試題庫(kù) mianshiya.com
500+ AI 資源大全
1 對(duì) 1 模擬面試
動(dòng)畫(huà)學(xué)算法教程

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.