網易首頁 > 網易號 > 正文申請入駐

OpenAI把提示詞壓縮了73%，程序員集體破防

2026-04-02 08:49:05　來源: 賽博蘭博

北京舉報

分享至

去年有個數據挺有意思：Claude處理代碼任務時，平均每次對話要燒掉18.7萬token。按當時API價格算，一個中型項目從0到1，光提示詞成本就能吃掉小幾千塊。更扎心的是，其中四成token根本沒必要——全是被"請逐步思考""讓我們拆解這個問題"這類廢話吃掉的。

這事讓我想到一個老梗：有人花兩萬塊買跑步機，最后變成晾衣架。AI編程工具現在差不多就這處境。大家瘋狂堆上下文、塞示例、寫超長系統提示，token賬單膨脹得比代碼復雜度還快，產出質量卻沒跟著漲。

progressive disclosure（漸進式披露）這個詞，UX設計師聽了會點頭，程序員大多沒當回事。簡單說就是：別一次性把家底亮完，按場景分層給信息。放到AI編程里，它直接決定你的token效率是1:3還是1:10。

第一層：先給骨架，別給血肉

我見過最典型的反面教材，是某團隊給Claude寫的"全知全能"系統提示。5000字，涵蓋編碼規范、測試策略、安全準則、性能要求，外加12個完整代碼示例。結果？模型在簡單CRUD任務上瘋狂過度設計，復雜算法反而因為上下文被稀釋，輸出質量跳水。

Clean Code領域有個說法：變量只聲明一次，且永不修改的，應該設為常量。提示詞設計同理——信息只出現一次，且當前步驟用不到的，應該延遲披露。

具體做法是把提示詞拆成三層。第一層給任務類型和輸出格式，控制在200token以內。比如"生成Python單元測試，使用pytest，只返回代碼塊"。這層讓模型快速建立預期框架，避免在錯誤方向上浪費算力。

第二層是動態注入的上下文。當前文件結構、相關函數簽名、最近三次git提交信息——這些用工具實時抓取，而非寫死在提示詞里。某開源項目實測，這種按需加載把平均token消耗從14萬壓到3.8萬，響應速度提升40%。

第三層才是深度推理指令。但有個前提：只有當第二層輸出觸發特定條件時才喚醒。比如檢測到"涉及并發"或"包含正則表達式"，再追加專項約束。這種條件分支設計，讓簡單任務保持輕量，復雜任務獲得針對性加強。

第二層：用工具鏈替代口頭描述

很多程序員有個執念：總覺得把需求說得越細，AI理解越準。于是提示詞里塞滿"使用工廠模式""遵循SOLID原則""確保線程安全"這類抽象指令。token燒了，模型卻經常在具體實現上跑偏。

《Clean Code Cookbook》的作者提過一組數據：他在重構咨詢中見過的問題代碼，67%源于"意圖與實現脫節"。AI編程現在正重蹈覆轍——我們用自然語言描述架構意圖，卻期待模型精準還原技術細節。

漸進式披露的解法是反向操作。能用代碼表達的，絕不廢話；能用工具傳遞的，絕不手寫。函數簽名、類型定義、接口契約，直接以結構化數據喂給模型，而非用文字轉述。某AI代碼助手的產品經理透露，他們內部把API schema以JSON格式注入后，生成代碼的接口匹配率從71%提升到94%。

更激進的玩法是"可執行規格"。不寫"請實現一個帶緩存的HTTP客戶端"，而是直接提供：緩存策略的偽代碼、HTTP中間件的接口定義、以及兩個失敗測試用例。讓模型從"理解需求"變成"補全實現"，token效率提升3倍以上。

測試驅動開發（TDD）的老炮們應該覺得眼熟——這本質上就是把AI當成配對程序員，先寫測試再補代碼。區別只是測試用例現在成了提示詞的一部分。

第三層：對話狀態機的隱性優化

多輪對話是token黑洞的重災區。每次模型回復后，完整歷史上下文都要重新提交，成本指數級累積。某團隊做代碼審查助手，10輪對話后token消耗突破50萬，其中80%是重復的歷史信息。

漸進式披露在這里需要一點狀態機思維。把對話切割成獨立階段，每階段只保留必要的狀態摘要，而非完整歷史。比如代碼生成階段結束后，只向審查階段傳遞"功能描述+關鍵決策點"，具體實現細節歸檔到外部存儲。

更精細的做法是引入"記憶分層"。短期記憶（當前輪次）、工作記憶（本輪對話主題）、長期記憶（項目級約束），分別用不同機制管理。短期記憶全量保留，工作記憶壓縮為要點列表，長期記憶只在觸發關鍵詞時檢索注入。

有個開源項目叫Aider，做多文件代碼編輯。它的做法值得參考：每次編輯前，先讓模型生成"變更計劃"摘要，后續輪次只圍繞這個摘要展開。實測把多輪對話的token增長曲線從指數壓到線性，20輪后仍控制在初始消耗的2倍以內。

這種設計還有個隱性收益——模型注意力更集中。Anthropic的研究顯示，當上下文超過10萬token，模型對中間位置信息的召回率會斷崖下跌。精簡后的狀態摘要，反而讓關鍵指令更容易被"記住"。

成本結構正在重塑工具選擇

Token效率不只是省錢問題，它正在改變AI編程工具的競爭格局。Cursor最近更新了上下文壓縮算法，官方宣稱"同等質量下token消耗降低60%"。Devin則走了另一條路：把長任務拆解為多個子代理，每個代理只加載必要上下文，用 orchestration（編排）層協調。

更底層的變量是模型本身的上下文窗口。Claude 3.5 Sonnet把窗口擴展到20萬token，Gemini 1.5 Pro更是標稱1000萬。窗口變大似乎緩解了焦慮，但邊際收益在遞減——某評測顯示，超過5萬token的有效上下文，模型利用率不足30%。

這時候漸進式披露的價值反而凸顯。它不是應對窗口限制的權宜之計，而是提升信息密度的根本策略。就像好的代碼注釋不寫"做了什么"，而寫"為什么這么做"——提示詞也該從"盡可能全"轉向"盡可能準"。

《Clean Code》里有個觀點：代碼是寫給人看的，順便給機器執行。AI編程的提示詞設計，現在需要反過來——先讓機器高效執行，再考慮人的可讀性。畢竟token賬單不會騙人。

最后留個數據點：那位寫了500+技術文章的Clean Code布道者，最近在嘗試一種極端做法——所有提示詞控制在50詞以內，復雜需求全部拆解為工具調用鏈。他說早期很痛苦，像從散文改寫詩，但三周后"回不去了"。

你的提示詞平均多長？有沒有算過，其中多少比例真正影響了模型輸出？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

實測阿里Qwen3.6-Plus：8分鐘做了個官網，被北京地鐵繞暈

智東西 2026-04-02 20:10:07
17 跟貼 17
Claude Code 源碼泄露了，有人用Python復刻了一個極簡版

機器之心Pro 2026-04-02 11:30:10
5 跟貼 5

剛剛，龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼

機器之心Pro 2026-04-02 16:37:52
0 跟貼 0

阿里Qwen3.6-Plus性能直逼Claude，中國最強編程模型來了！

量子位 2026-04-02 15:07:20
38 跟貼 38
美團LongCat-Next：把圖像、聲音、文字都變成Token，然后呢？

機器之心Pro 2026-04-02 14:03:47
0 跟貼 0

開卷視覺編程！GLM-5V-Turbo上線，一張草圖搞定前端

量子位 2026-04-02 14:23:34
0 跟貼 0

剛剛，AI用4小時攻破“世界最安全開源系統”

智東西 2026-04-02 17:08:07
6 跟貼 6
別學Claude Code了！OMC五大「臥槽」功能解析：自動化開發軍團來了

鈦媒體APP 2026-04-01 11:09:53
0 跟貼 0

40歲轉行程序員：André用18個月拆穿3個行業謊言

薛定諤的BUG 2026-04-01 09:47:26
0 跟貼 0
張雪師父發聲：奪冠后兩人通話泣不成聲；曾數十次借錢給張雪，建議他造車：是你成為世界冠軍的唯一可能

大風新聞 2026-04-02 14:31:06
3900 跟貼 3900
英國會計軟件被卡脖子7年，一個程序員用166行代碼破局

報錯免疫體 2026-04-02 08:37:32
0 跟貼 0
模型飛機試飛，鏡頭一轉發現事不簡單，美女膽子太大了

說說搞笑說 2026-03-30 17:29:13
1 跟貼 1
早報｜豆包大模型日均Token使用量破120萬億/廣電行業組織發布AI換臉嚴正聲明/任天堂前銷售負責人：Switch 2漲價幾乎不可避免

愛范兒 2026-04-03 08:34:32
0 跟貼 0
Codeforces難題不夠刷？謝賽寧等造了AI出題機，能生成原創編程題

機器之心Pro 2025-10-20 14:17:05
0 跟貼 0
快手廣告邁入生成式推薦時代！GR4AD：Token到Revenue全鏈路重構

機器之心Pro 2026-04-02 21:45:27
0 跟貼 0
程序員年薪百萬卻月光：7個讓代碼高手變窮鬼的財務陷阱

灰度測試中 2026-04-02 08:48:39
0 跟貼 0
美女玩老公的小玩具，結果一聽指令，自己才是那個玩具

哆啦愛搞笑 2026-04-01 15:12:43
1 跟貼 1
人民日報探訪江蘇、山東、河南、陜西等地：糾治亂作為，這樣靶向施策

上觀新聞 2026-04-03 07:20:03
108 跟貼 108
預測模型Echo面世：檢驗AI是“預言家”還是“悍跳狼”？

鈦媒體APP 2026-04-02 20:07:09
0 跟貼 0
30年從未贏過！AlphaGo之父：1997年輸棋，2026年輸命

新智元 2026-04-03 09:28:30
0 跟貼 0
程序員表白被拒絕，一怒之下敲代碼復仇，一會應該就被拉黑！

會玩的小娃娃 2026-04-02 13:36:46
1 跟貼 1
月薪2萬在中國處于什么水平？網友：在網上月薪五萬都剛脫貧

帶你感受人間冷暖 2026-04-03 00:15:03
0 跟貼 0
字節跳動的Token戰爭：從印鈔機到生態基建

鈦媒體APP 2026-04-03 09:54:20
0 跟貼 0
獨家專訪Feeling AI創始人戴勃：我想讓世界模型更有“活人感”｜甲子光年

甲子光年 2026-04-02 17:12:22
0 跟貼 0
知名連鎖餐飲門口宣傳板寫“3元自助早餐”，兩人買單45元被告知“僅粥飲自助”

新聞晨報隨申Hi 2026-04-02 18:36:05
152 跟貼 152
券商晨會精華：持續看好光纖光纜產業

財聯社 2026-04-03 07:44:04
1 跟貼 1
成都程序員手搓舉報系統上線，一鍵識別車牌位置違法信息

重慶熱點 2026-04-02 13:24:48
0 跟貼 0
人到50，不管多窮，都要主動給子女這兩樣東西，既是遠見又是財富

東林夕亭 2026-04-03 09:05:45
0 跟貼 0
惹誰都別惹程序員，這句話絕對不是說說而已！

劇坐家花花 2026-04-02 02:12:22
0 跟貼 0
小鵬澳洲經銷商資金鏈斷裂被接管拒絕履行454輛訂單

每日經濟新聞 2026-04-02 21:53:07
974 跟貼 974
平均壽命最長的五種職業！

游戲星GameStar 2026-04-03 06:08:38
0 跟貼 0
有線耳機被淘汰快10年突然翻紅，銷量暴漲20%，“有的上架三天被搶空”

環球網資訊 2026-04-02 08:50:30
1182 跟貼 1182
PDF轉Excel五大實用方法分享

深情小崽 2026-04-02 15:21:28
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
當Search Agent遇上不靠譜搜索結果，清華團隊祭出自動化紅隊框架

機器之心Pro 2025-10-16 16:00:02
0 跟貼 0
React大佬攻克前端難題，上線3天獲24K星

量子位 2026-04-01 15:57:20
0 跟貼 0
商務部回應 Meta收購Manus

每日經濟新聞 2026-04-02 15:34:28
22 跟貼 22
男子看朋友開了家檳榔店，結果他把門頭上，掛了一個超大模型！

胡子搞笑君 2026-04-01 16:45:17
1 跟貼 1
帶貨“優思益”產品，李若彤、明道等緊急致歉，“震驚、憤怒和自責”！“與輝同行”客服回應

每日經濟新聞 2026-04-02 16:15:12
1124 跟貼 1124
成都程序員手搓違章舉報系統今日上線，隨手一拍就能一鍵舉報，共建城市有序出行

柚子Video 2026-04-02 09:40:16
10 跟貼 10

賽博蘭博

專注搗鼓AI效率工具，試圖在這個時代留下數字分身的探索者。

742文章數 6關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

游戲

健康

親子

教育

手機 / 數碼

房產 / 家居

OpenAI把提示詞壓縮了73%，程序員集體破防

第一層：先給骨架，別給血肉

第二層：用工具鏈替代口頭描述

第三層：對話狀態機的隱性優化

成本結構正在重塑工具選擇

SpaceX沖刺2萬億美元估值，馬斯克野心太大

專家：伊朗導彈數量足夠維持反擊一到兩周

專家：伊朗導彈數量足夠維持反擊一到兩周

邵佳一的改革，從讓每個人踢舒服開始

《浪姐》人氣榜出爐！曾沛慈斷層第一

全球石油危機或將蔓延

軸距2米7/后排能蹺腿 試駕后驅小車QQ3 EV

態度原創

馬英九風波再引熱議，鄭麗文力挺蕭旭岑，書法作品遭吐槽！

《紅色沙漠》BOSS戰引玩家眾怒：設計的糟糕且無趣！

干細胞抗衰4大誤區,90%的人都中招

洗頭的舒適區，讓爸爸想出更多帶娃創意

五年級奧數，家長一臉懵，突破口在哪里

軸距2米7/后排能蹺腿試駕后驅小車QQ3 EV