337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

百萬Token白燒?Claude官方下場:5招治好上下文腐爛

0
分享至


新智元報道

編輯:元宇

【新智元導讀】給了100萬token,現在卻手把手教你怎么刪記錄!Anthropic官方承認:塞太多東西,Claude就會變蠢。面對失控的「上下文腐爛」,Anthropic連夜甩出5招救命指南。

Anthropic自己戳破了百萬上下文神話?


https://claude.com/blog/using-claude-code-session-management-and-1m-context

近日,Anthropic一篇關于「如何管理百萬上下文」的博客中再次提到了「上下文腐爛」(context rot)的問題,簡單說就是:

上下文越長,模型越蠢。

Anthropic解釋道,上下文窗口是指模型在生成下一條回復時能夠「看到」的全部內容,它包括你的系統提示、迄今為止的對話內容、每一次工具調用及其輸出,以及所有已讀取的文件。

目前,Claude Code的上下文窗口為一百萬個token。


但上下文并非越長越好。模型的注意力被分散到更多token上,更早的、已經不相關的內容會開始干擾當前任務,導致表現下降,這就是「上下文腐爛」。


這并非社區自造的概念,而是出自Anthropic官方博客。

早在今年2月Sonnet 4.6發布時,公告里就寫明了:Sonnet 4.6提供了測試版百萬token上下文窗口。

但百萬Token≠百萬有效Token。

你往對話里塞的每一條消息、每一次文件讀取、每一輪工具調用,都在稀釋模型的注意力。

早期那些已經不相關的內容不會自動消失,它們會像噪音一樣持續干擾當前任務。

提出問題后,Anthropic通過這篇博客給出了一套完整的管理方法。

先告訴你「你的對話在腐爛」,然后再手把手教你怎么治。

上下文越長

AI越蠢

先把「上下文腐爛」的機制拆開看。

100萬Token聽起來很多。

一個中型代碼庫,連文檔帶源碼,可能也就幾十萬Token。理論上你可以把整個項目塞進去,然后隨便問。

但模型的注意力是有限資源。

你兩小時前讀的那個配置文件、一小時前調試失敗的那段日志、半小時前探索的一條死胡同,全都還在窗口里,全都在搶模型的注意力。

這就是context rot的機制:模型被迫同時「記住」太多不相關的東西,沒法集中精力處理眼前的任務。

也許你會覺得,這不就和人類開會開久了走神是一個道理嘛。

的確如此。

信息過載導致注意力稀釋,這與能力無關,是帶寬問題。

更要命的是,當上下文快要撐到100萬Token上限時,系統會自動觸發「壓縮」(compaction):

即把整段對話總結成一個更短的摘要,然后在新窗口里繼續工作。

這聽起來很智能,但自動壓縮發生的那一刻,恰恰是上下文最長、模型表現最差的時候。

用最蠢的狀態去做最關鍵的總結,這事兒本身就很難靠譜。

每一輪對話都是岔路口

Anthropic在博客里把每一次對話交互定義為一個決策節點。

每一輪交互結束后,你其實站在一個岔路口,不是只有「繼續聊」這一條路。

第一條:Continue。在同一會話中發送另一條消息,直接繼續聊。上下文還相關,沒必要折騰。這是最自然的選擇,大多數時候也確實夠用。

第二條:/rewind。連按兩下Esc,跳回之前某條消息,從那里重新來。

官方博客里有一個很精準的判斷:與其糾正,不如回退。


回退(Rewind)通常是更佳的修正方式。

比如Claude讀了五個文件,試了一種方法沒成功,你的本能反應是說「這個不行,換個方法」。

但這樣做的問題是,那次失敗嘗試的全部中間過程還留在上下文里,繼續污染后續判斷。

更聰明的做法是rewind到讀完文件那個節點,帶著新信息重新發一條更精確的指令:別用方案A,foo模塊沒暴露那個接口,直接走B。

有用的文件讀取保留了,失敗的嘗試丟掉了。上下文干干凈凈。

你也可以讓Claude總結它學到的內容并創建一條交接信息。這有點像未來的Claude給過去的自己留了一封信:這條路我試過了,走不通。

第三條:/clear。開啟一個新會話,附帶一段簡要說明:之前做了什么、現在要干什么、哪些文件相關。

好處是零腐爛,上下文完全由你控制。壞處是費事,所有背景都得你自己寫。

第四條:/compact。讓模型總結當前對話,用摘要替換掉原來的歷史記錄。


省事,但有損。

你可以附上引導指令:/compact focus on the auth refactor, drop the test debugging(聚焦認證重構,刪掉測試調試。)

讓它知道什么該留什么該扔,而不是去猜。

/clear和/compact看起來相似,但行為截然不同:

/compact由模型決定什么重要,你省心但可能丟關鍵信息,而/clear由你自己寫下關鍵內容,費事但精確。


第五條,Subagents

把一塊工作交給一個擁有獨立上下文的子智能體,干完活只把結論帶回來。

當你知道接下來的任務會產生大量中間輸出,但你只需要最終結論時,subagent是最干凈的方案。

它拿到一個全新的獨立上下文窗口,在里面完成所有臟活,中間過程全部留在子窗口里,最后只有一份結論帶回主會話。

Subagents:你的一次性調查員

這五個動作里,最容易被誤解的就是subagents。

很多人一聽「子智能體」就往「多智能體協作」上聯想:團隊分工、并行處理、AI員工開會討論。

但Anthropic這篇博客里講的subagents,核心價值只有一個:上下文隔離。

官方文檔明確寫道:每個subagent都運行在自己的上下文窗口中。

它可以讀大量文件、做大量搜索、跑完整個調查流程。但最終,只有摘要和一小段元數據會回傳給主會話。

那些海量的中間過程,全部留在子智能體的一次性上下文里。你的主會話不會被這些噪聲污染。


Anthropic內部用的判斷標準也很簡單:

我之后還需要這些工具輸出本身嗎,還是只需要最終結論?

如果答案是后者,就交給subagent。

博客里給了三個典型場景:

讓subagent基于規格文件驗證工作結果;讓subagent去讀另一個代碼庫,總結它的認證流程,然后你自己來實現;讓subagent根據你的git改動去寫文檔。

這三個場景有一個共同點:過程很重,結論很輕

所以subagent的本質不是你的同事,和你在一塊干活,更像是你的「一次性調查員」。

它的工作簿在任務結束后就可以扔掉,你只需要拿走最后那頁報告。

雖然Claude Code會自動調用Subagents,但你也可以給它更明確的執行指令,比如:

啟動一個Subagents,根據以下規范文件驗證此項工作的結果;

派生一個Subagents去閱讀另一個代碼庫,并總結其身份驗證流程的實現方式,然后你自己以相同的方式實現它;

派生一個Subagents,根據我的Git變更來編寫此功能的文檔。

警惕自動壓縮的翻車時刻

Anthropic在博客里坦承了一個很多開發者已經踩過的坑:自動壓縮(compaction)翻車。

什么時候翻車?當模型無法預測你接下來要干什么的時候。

博客舉了一個例子:

你做了一次很長的調試會話,自動壓縮觸發了,模型把整個排查過程總結了一遍。然后你突然說:「現在修一下bar.ts里那個warning。」

但因為整個會話主要圍繞調試展開,那個warning只是中途順帶看到的一眼,壓縮的時候已經被丟掉了。

這事棘手在哪?觸發自動壓縮的那一刻,恰恰是上下文最長、模型表現最打折的時候

你讓一個已經「走神」的模型來決定什么信息重要、什么可以丟掉。

好在百萬Token窗口給了一個緩沖區。

你不用等到自動觸發,可以提前主動/compact,并附上說明:接下來要做什么、哪些信息必須保留。


用最清醒的時候做壓縮,而不是等到最糊涂的時候被動挨打。

說到底,自動壓縮不是不能用,是不能盲信。

五條路

一個急救包

雖然最自然的做法就是繼續下去,但另外四個選項可用于幫助你管理上下文。

這五條路拼在一起,本質上就是一套防治「上下文腐爛」的急救包。


Anthropic官方示意圖:五種上下文管理動作,從左到右保留的舊上下文越來越多

官方博客在文末放了一張決策表,按場景匹配工具:


每一次回車,都是一次上下文決策。

五種場景,五個工具,選對了上下文干凈,選錯了模型變蠢。

因此,每一輪交互之后,都該花一秒鐘想想:我的上下文還干凈嗎?接下來該走哪條路?

百萬上下文的另一面

是百萬token的賬單

除了管上下文質量,Anthropic這次還做了另一件事:

讓開發者看見自己的消耗。

博客開頭就說了,/usage這個新命令的推出,「來自我們和客戶進行的多次交流」。

/usage是干什么的?

根據Claude Code官方命令文檔,它的作用是「顯示套餐使用上限和速率限制狀態」。

注意,這不是一個上下文管理工具。

它不壓縮、不回退、不清理,只做一件事:讓你看見自己用了多少,還剩多少,有沒有撞上限流。

但這恰恰是開發者最焦慮的事。

100萬上下文聽起來很美,但token不是免費的。

一個長會話跑下來,你到底消耗了多少配額?自動壓縮會不會在你不知情的情況下觸發,丟掉關鍵信息?你離速率限制還有多遠?

以前這些問題沒有答案,現在Anthropic給了一個透明窗口。

這個功能很小,但表明Anthropic已經意識到,百萬上下文時代,「用得起」和「用得好」是兩個必須同時解決的問題。

光給能力不給可見性,開發者遲早會踩坑然后流失。

提示詞工程之后

是上下文工程

退一步看全局。

今年2月,Anthropic發布Sonnet 4.6,公告里確認了100萬token上下文窗口(beta)。


那篇公告解決的是「能不能」的問題:模型能不能撐住這么長的上下文。

用戶反饋也很正面:它在改代碼前更能有效讀取上下文了。

4月15日這篇博客,解決的是「怎么用」的問題。它直接承認了現實局限,然后給出一套系統化的管理方法。

兩步合在一起,構成了一個完整的閉環:先給你武器,再教你怎么用不傷到自己的錢包。

Prompt engineering這幾年被講爛了。但真正決定AI編程天花板的,可能是下一個詞:context engineering(上下文工程)。

怎么喂上下文、什么時候清理、哪些信息該隔離、哪些該保留,這些問題以前靠直覺,現在Anthropic開始給方法論了。

上下文工程,正在成為AI編程時代的必修課。

參考資料:

https://claude.com/blog/using-claude-code-session-management-and-1m-context

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
這和土匪有啥區別!虎跳峽1.9米限高桿火了,自駕交錢才能過

這和土匪有啥區別!虎跳峽1.9米限高桿火了,自駕交錢才能過

世界圈
2026-04-19 07:05:29
西伯利亞:吃不完的鹿肉,收不完的糧;砍不完的森林,挖不完的礦

西伯利亞:吃不完的鹿肉,收不完的糧;砍不完的森林,挖不完的礦

小莜讀史
2026-04-17 20:53:45
伊朗就美伊談判最新進展發布聲明

伊朗就美伊談判最新進展發布聲明

財聯社
2026-04-18 21:38:06
我在伊拉克開工廠,娶了4個老婆,雖然年入千萬,如今卻很焦慮!

我在伊拉克開工廠,娶了4個老婆,雖然年入千萬,如今卻很焦慮!

千秋文化
2026-04-16 20:12:45
遺憾!張雪車隊無緣3連冠:極限反超 第三被罰變第四 無緣領獎臺

遺憾!張雪車隊無緣3連冠:極限反超 第三被罰變第四 無緣領獎臺

念洲
2026-04-18 20:40:05
伊朗議長:對美不信任仍未完全化解 敦促美方對等履約

伊朗議長:對美不信任仍未完全化解 敦促美方對等履約

環球網資訊
2026-04-19 10:55:53
新代言人火爆全球,以色列慌了

新代言人火爆全球,以色列慌了

俠客棧
2026-04-18 13:14:53
沙特帶頭,阿聯酋緊跟,卡塔爾隨后,中東開始大變局

沙特帶頭,阿聯酋緊跟,卡塔爾隨后,中東開始大變局

明天見灌裝冰塊
2026-04-18 13:24:18
31歲女子找不到工作,每天假裝上班:其實她是躲到山上發呆

31歲女子找不到工作,每天假裝上班:其實她是躲到山上發呆

閱微札記
2026-04-19 11:30:46
何潤東:觀戰蘇超是我首次現場看球;來到項王故里彌補了當年遺憾

何潤東:觀戰蘇超是我首次現場看球;來到項王故里彌補了當年遺憾

懂球帝
2026-04-19 15:31:12
馬筱梅吐槽汪小菲脾氣差,臺北保姆幫證實,被網暴后相夫教子更好

馬筱梅吐槽汪小菲脾氣差,臺北保姆幫證實,被網暴后相夫教子更好

甜檸檬吖
2026-04-19 09:46:19
“磨膝大戶”被公布,是跑步的20倍,醫生:不想軟骨磨光,早扔掉

“磨膝大戶”被公布,是跑步的20倍,醫生:不想軟骨磨光,早扔掉

垚垚分享健康
2026-04-19 14:35:09
停止焦慮最好的辦法,不是讀書,不是運動,而是……

停止焦慮最好的辦法,不是讀書,不是運動,而是……

壹心理
2026-04-19 11:03:36
“長壽菜”不是紅薯而是它!3塊錢一大把,清腸通便,鮮嫩營養高

“長壽菜”不是紅薯而是它!3塊錢一大把,清腸通便,鮮嫩營養高

阿龍美食記
2026-04-17 14:01:05
亞錦賽中國女排選朱婷還是選李盈瑩,趙勇已給出了肯定答案

亞錦賽中國女排選朱婷還是選李盈瑩,趙勇已給出了肯定答案

體育快遞小哥哥
2026-04-19 16:59:40
明知道佩澤希齊揚和阿拉格齊“有問題”,革命衛隊為何不拿下他們

明知道佩澤希齊揚和阿拉格齊“有問題”,革命衛隊為何不拿下他們

民間胡扯老哥
2026-04-19 07:27:18
輸給湖人后,火箭揪出最大“水貨”!杰倫-格林離隊真的太冤了

輸給湖人后,火箭揪出最大“水貨”!杰倫-格林離隊真的太冤了

兵哥籃球故事
2026-04-19 15:21:32
從沒打過如此富裕的仗!4大核心+優秀第6人 哈登真有機會奪首冠了

從沒打過如此富裕的仗!4大核心+優秀第6人 哈登真有機會奪首冠了

錢說體育
2026-04-19 18:31:48
斯諾克世錦賽:丁俊暉連得191分!復仇戰3-1領先,或會師趙心童?

斯諾克世錦賽:丁俊暉連得191分!復仇戰3-1領先,或會師趙心童?

劉姚堯的文字城堡
2026-04-19 18:29:57
73歲天賜父親訴說太辛苦,大女兒來家里帶妹妹,太暖心了

73歲天賜父親訴說太辛苦,大女兒來家里帶妹妹,太暖心了

童叔不飆車
2026-04-19 11:09:23
2026-04-19 18:56:49
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15010文章數 66787關注度
往期回顧 全部

科技要聞

50分26秒破人類紀錄!300臺機器人狂飆半馬

頭條要聞

印度當晚召見伊朗大使抗議兩船只遭開火襲擊 伊朗回應

頭條要聞

印度當晚召見伊朗大使抗議兩船只遭開火襲擊 伊朗回應

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂要聞

張天愛評論區淪陷!被曝卷入小三風波

財經要聞

華誼兄弟,8年虧光85億

汽車要聞

29分鐘大定破萬 極氪8X為什么這么多人買?

態度原創

親子
藝術
數碼
健康
公開課

親子要聞

孩子模仿巔峰期:父母不光要教育孩子,也要“自我教育”

藝術要聞

慈禧墓被盜的明代草書,字字金字塔尖水準!

數碼要聞

馳為海外推出AuBox X迷你主機,搭載酷睿Ultra 7 256V

干細胞抗衰4大誤區,90%的人都中招

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版