337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司

<nav id="eee84"><sup id="eee84"></sup></nav>

<tfoot id="eee84"><noscript id="eee84"></noscript></tfoot>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

OpenAI工程師不寫代碼了：AI寫得太快，人類檢查跟不上，Agent直接包辦開發

2026-03-09 18:52:32　來源: AI前線

北京舉報

0

分享至

作者｜木子

OpenAI 最近在一篇 Blog 中說了件挺炸裂的事：他們自己的工程師，已經不怎么寫代碼了。

在一個內部項目里，短短五個月，就產出了 100 萬行代碼，而且沒一行手寫，全都是Codex寫的。

這些代碼并不是什么零散腳本，而是從零開始搭出來的一整套軟件產品內部 Beta 版：從應用邏輯、基礎設施，到工具、文檔和內部開發者工具，幾乎一應俱全。

這種變化，或許能從 OpenAI 內部一直以來的工程師文化中找到一些線索。

一位曾參與 Codex 項目的 OpenAI 工程師 Calvin French-Owen，在離職后寫過一篇博客，雖然他在其中吐槽說，過去一年里 OpenAI 員工規模迅速擴張，帶來了不少混亂。

不過他同時也提到，公司內部依然保留著很強的創業公司氛圍：團隊小、決策快，工程師擁有很高的自主權。

另外，很多科技巨頭是高層定路線、然后團隊執行，但在 OpenAI，通常沒有明確的長期 roadmap，研究員往往自己發現問題、提出想法，小團隊圍繞好點子自然形成并推進項目。

他表示，真正推動進展的好想法可能隨時從任何地方隨時，而不是來自某個宏大計劃。

“OpenAI 非常注重自下而上的方式，尤其是在研究方面。”

比如 Codex，最初其實誕生在 OpenAI 的一個只有十幾人的小團隊里。這個團隊在 7 周內幾乎不眠不休，把 Codex 從想法一路推到了上線。

而現在這個“OpenAI 工程師不寫代碼”一事，其實也要從公司一個團隊，在開發流程中發現的新瓶頸說起。

現在 AI Coding 這件事已經屢見不鮮。但當 Codex 開始大規模生成代碼后，OpenAI 的這研發團隊很快發現一個新問題：

代碼生成已經不慢了，慢的是讓人類來檢查這些代碼。

人的時間和注意力是有限的。在整個開發流程里，最容易卡住的環節反而變成了 QA（質量測試）。

為了解決這個問題，OpenAI 的工程師換了個思路：干脆讓 Codex 模仿工程師，自己去“看”和“用”應用。

那 OpenAI 的工程師現在不寫代碼了，他們到底在做什么？

——設計環境、搭反饋循環、定義架構約束，然后讓 agent 寫。

文章中強調一句話：“人類掌舵，智能體執行”。

他們管這叫Harness Engineering，直譯過來的話就是“AI 駕馭工程”。

工程師變成“能力架構師”

這個項目始于 2025 年 8 月下旬，從向一個完全空白的代碼倉庫提交第一行內容開始。

初始架構，包括代碼倉庫結構、CI 配置、格式化規則、包管理器設置和應用框架——都不是工程師手寫的，而是在一小套模板的指導下，由Codex CLI 調用 GPT-5 自動生成。

甚至連那份告訴 agent “該如何在這個倉庫里工作”的AGENTS.md，也是 Codex 自己寫出來的。

換句話說，這個系統從誕生那刻起，就幾乎沒有人工代碼。整個代碼倉庫，都是被 agent 一步一步搭起來的。

不過，一開始事情并沒有想象中那么順利：起初項目推進速度緩慢，但問題并不在 Codex 的能力，而在環境——規則不清晰、工具不完整、系統約束還沒建立起來。

有網友“一針見血”道：

“最扎心的一句：agent 反復犯錯，不是能力問題，是你腦子里的判斷力沒寫下來。你不寫，它第一百次還犯同樣的蠢。”

于是再遇到開發卡住時，團隊不再想著“再改一段代碼試試”，而是先問一個問題：agent 到底缺什么能力？

再把這種能力變成它能讀懂、能執行、還能被強制遵守的規則。

也就是說，面對當下 agent 自己就能測試、改 bug 的情形，工程師的工作重點從“寫代碼” 變成了另一件事：讓 Codex 更容易把事情做對，給 agent“補能力”。

從這個角度看，工程師的工作其實轉向了更高一層：用一句話來說，就是拆解任務、設計能力、搭建系統，讓 agent 可以穩定地產生正確的代碼。

具體來說，大致有這幾件事情：

第一件事，就是讓應用對 AI “可讀”。

正如上文提到的，需要人為把 agent 接入 Chrome DevTools 協議，讓它能“觸控”UI。

工程師要做的第二件事情，就是把“隱性知識”全部寫進代碼倉庫，變成機器可讀的知識。

對 agent 而言，無法在運行時訪問的內容就等于不存在。比如存儲在 Google Docs、聊天記錄或人們頭腦中的知識嗎，這些都無法被系統訪問。

不過，不可以把所有規則和說明一次性塞給 Codex，而是要先給它一個導航，再讓它自己去查細節。

研究研究團隊曾嘗試過直接給 agent 一個巨大的AGENTS.md文件，結果很快發現行不通。

主要原因是，上下文是稀缺資源，說明書越厚，真正重要的信息反而越容易被淹沒；而且這種大文檔很快就會過時，也很難驗證和維護。

他們把這段經驗總結成了一句：

“要給 Codex 的是一張地圖，而不是一本 1000 頁的說明書。”

該示意圖由 AI 生成

工程師要做的第三件事，是設計“AI 友好”的架構。

AI 在結構清晰、邊界明確的系統里效率最高。對人來說，這些規則可能顯得死板，但對 agent 來說，這是效率倍增器。

所以 OpenAI 的這個團隊設計了一套嚴格架構, 每個業務域必須按固定層級：Types→ Config→ Repo→ Service→ Runtime→ UI。

依賴方向是強制的。任何違反都會被自動阻止。

第四件事，是把“品味”變成規則。

“在 AI 時代，人類最重要的能力是 Taste。”隨著大模型越來越強，這樣的聲音不絕于耳。

這篇 Blog 中，有一個很有意思的概念：taste invariants（品味不變量）。

意思是，工程師的審美，比如：文件大小限制、命名規則、日志結構、API 規范等，都被寫成lint 規則。

這樣 AI 每次寫代碼都會自動遵守：“人類的品味一旦被捕捉，就可以應用到每一行代碼。”

在實際開發中，人類主要通過提示與系統交互：描述任務、啟動 agent，然后讓 Codex 自動生成 Pull Request。

接下來的一整套流程，包括代碼自檢、agent 評審、根據反饋修改、再次提交，基本都由 agent 自己完成，并不斷循環，直到所有評審通過。

第五件事，就是清理 AI 產生的“垃圾”。

文章指出，完全自主的智能體也引入了新的問題。

當代碼幾乎全部由 Codex 生成后，一個新問題也出現了：AI 會不斷復制代碼庫里已有的模式，包括那些不太好的寫法，時間一長代碼風格就會慢慢“漂移”。

一開始，團隊計劃每周抽一天時間手動清理這些“AI 殘渣”，但很快發現這種方式根本不具備可擴展性。

后來他們把工程師的經驗和偏好寫成一套“黃金原則”，比如優先使用共享工具庫、嚴格校驗數據結構而不是“猜著寫”。

然后將這套原則直接編碼進代碼倉庫，讓 Codex 自動掃描問題并發起重構 PR。

這樣就像給代碼庫加了一套“垃圾回收機制”：小問題可以隨時清理，技術債不會越滾越大。

這篇 Blog 在技術圈引起了的廣泛關注和討論，有人認為，這個 Harness Engineering 本質上是一種現代版的控制論：工程師不再直接寫代碼，而是設計系統、規則和反饋回路，讓 agent 自動完成工作。

他表示，這種模式，其實在歷史上已經出現過三次了。

從瓦特蒸汽機的調速器，到 Kubernetes 的控制器，再到今天的 AI agent；真正的變化不是“機器替代人”，而是人的角色，從執行者變成系統的設計者和校準者：

“你不再親自去擰閥門，而是開始掌舵。每當這種模式出現，背后通常都是因為有人構建出了足夠強大的傳感器和執行器，能夠在那個層級上把反饋回路真正閉合起來。”

Agent 都開始包辦開發流程了

為什么 OpenAI 的工程師可以不再寫代碼了？不妨來看看他們的agent 現在已經能干到什么程度。

前文提到，OpenAI 的工程師換了個思路：干脆讓 Codex 模仿工程師，自己去“看”和“用”應用。

第一，是讓 agent 能“看見”應用界面（UI）。

他們把 Chrome DevTools 協議接入到 agent 的運行環境里。這樣一來，Codex 就可以像開發者在瀏覽器里調試一樣操作頁面、讀取日志、抓取 DOM、截屏觀察界面......

這一步其實非常關鍵，因為LLM 本身是看不見 UI 的。

接入 DevTools 之后，Codex 就相當于有了“眼睛”和“手”：

可以通過截圖和 DOM 觀察頁面，通過 console 和 network 監聽運行狀態，還能自己點擊、輸入、導航。

該示意圖由 AI 生成

有了這些能力，agent 就可以自己復現 bug、自動跑 UI 測試、驗證修復是否生效。

這樣一來，Codex 就不只是寫代碼，還開始像一個自動化 QA 工程師一樣工作：自己測試自己寫的代碼，并反復修復，直到系統通過測試。

換句話說，原本需要人工完成的大量測試和調試工作，被自動化了。

就像下面這張圖里展示的那樣：最核心的一步是 “Loop Until Clean”——不斷測試、修復、再測試，直到系統沒有錯誤。

第二點，只能操作 UI 還不夠，還得讓 agent 看見系統內部發生了什么。

為此，OpenAI 給 Codex 接入了一整套可觀測系統（Observability）。

應用在運行時會產生三類關鍵數據，也是工程師排查問題時最常用的信號：

Logs（日志）
Metrics（性能指標）
Traces（調用鏈）

這些數據會先被一個叫Vector的組件統一收集，再送到本地的可觀測系統里。

這樣一來，Codex 就能像工程師一樣查系統狀態：哪個服務報錯了？哪個接口變慢了？請求卡在哪一層？

當發現問題后，Codex 會自己修改代碼、提交 Pull Request、重啟應用、重新運行任務，再觀察系統指標有沒有改善。

整個過程會形成一個自動反饋循環：發現問題 → 修改代碼 → 再運行 → 再觀察。

一直重復，直到問題消失。

換句話說，Codex 不只是看代碼，還能像運維一樣查日志、看性能數據，判斷系統哪里出了問題，再修改代碼驗證修復效果。

這篇博文中提到，給定一個提示，Codex 驅動的 agent 就可以：

agent 不再只是一個寫代碼的工具，而是開始承擔完整的軟件開發流程。

整個開發流程大致為：Codex 寫代碼 → 啟動應用 → 像用戶一樣操作頁面 → 檢查結果 → 如果不對就改代碼再跑。

不過需要說明的是，這套流程之所以能跑通，很大程度上依賴他們為這個代碼倉庫專門設計的結構和工具鏈。

如果沒有類似的工程投入，這種“全自動開發流程”目前還很難直接照搬。

目前來看，這套“agent 寫代碼、人類設計系統”的模式，在 OpenAI 內部運行得還不錯；但很多問題仍在探索階段：比如 AI 生成的代碼庫長期會不會失控，人類判斷力該如何嵌入系統。

不過可以預見的是，軟件工程的重點可能會逐漸從“寫代碼”，轉向設計環境、規則和反饋機制；讓像 Codex 這樣的 agent，可以更穩定地參與構建和維護復雜的軟件系統。

https://openai.com/zh-Hans-CN/index/harness-engineering/

https://x.com/odysseus0z/status/2030416758138634583

https://calv.info/openai-reflections

聲明：本文為 AI 前線整理，不代表平臺觀點，未經許可禁止轉載。

會議推薦

2026，AI 正在以更工程化的方式深度融入軟件生產，Agentic AI 的探索也將從局部試點邁向體系化工程建設！

QCon 北京 2026 已正式啟動，本屆大會以“Agentic AI 時代的軟件工程重塑”為核心主線，推動技術探索從「AI For What」真正落地到可持續的「Value From AI」。從前沿技術雷達、架構設計與數據底座、效能與成本、產品與交互、可信落地、研發組織進化六大維度，系統性展開深度探索。開往 2026 的 Agentic AI 專列即將啟程！匯聚頂尖專家實戰分享，把 AI 能力一次夯到位！

今日薦文

你也「在看」嗎？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

媒體：以高官警告"以軍瀕臨崩潰" 內塔尼亞胡仍難停手

新京報評論 2026-03-29 19:05:41
15271 跟貼 15271
交通運輸部檢查指導組在吉林檢查時發現“百噸王”多發頻發

界面新聞 2026-03-30 11:14:13
21 跟貼 21

日供29元，卷成這樣了？

中國新聞周刊 2026-03-29 19:17:09
1133 跟貼 1133

中方決定對日本國會眾議員古屋圭司采取反制措施

央視新聞客戶端 2026-03-30 10:43:13
1508 跟貼 1508
內存條價格出現斷崖式下跌，16G內存條1天跌了上百元，專家：未來將持續降價

極目新聞 2026-03-29 22:53:03
4450 跟貼 4450

中國將在長江水下開高鐵

環球網資訊 2026-03-30 09:38:29
536 跟貼 536

蔡磊透露身體近況：四個人同時攙扶也無法邁步

極目新聞 2026-03-29 22:40:10
1161 跟貼 1161
4月7日至12日鄭麗文將應邀率團訪問大陸

看看新聞Knews 2026-03-30 10:55:01
86 跟貼 86

保定一小店售賣咸菜絲燒餅意外爆火，排隊人數太多店鋪宣布暫停營業，店主：流量太大了，我們承接不住，也擔心影響燒餅品質

極目新聞 2026-03-26 22:43:02
1721 跟貼 1721
印度擬從俄羅斯采購250億美元軍事裝備

參考消息 2026-03-30 10:54:05
48 跟貼 48
深圳市雷雨大風黃色預警信號升級為橙色

界面新聞 2026-03-30 09:24:38
40 跟貼 40
很多廣東人跟風！緊急提醒：別亂挖，嚴重可致死

南方都市報 2026-03-30 07:49:58
250 跟貼 250
全球股債金三殺中東戰火下投資者"無處可躲"

財聯社 2026-03-30 08:49:06
60 跟貼 60
中國科學院院士：全固態電池或至少再等5年

財聯社 2026-03-29 22:12:28
313 跟貼 313
太心疼！全紅嬋談體重時哽咽：“我接受不了那么胖的自己”

上觀新聞 2026-03-30 13:07:07
0 跟貼 0
國航中朝航線恢復運行

財聯社 2026-03-30 08:14:40
799 跟貼 799
“全體員工享受三天帶薪春假”，大人和孩子都需要“春天”

學申論的談妹 2026-03-30 09:12:42
145 跟貼 145
大愛善舉全國累計器官捐獻志愿登記人數超733萬

人民資訊 2026-03-30 10:39:04
61 跟貼 61
河池巴馬發生一起挖掘機墜湖事件，事件原因仍在進一步調查中！

廣西活動 2026-03-30 17:59:36
0 跟貼 0
黑龍江海林坍塌事故9名被困人員已全部找到，7人遇難

揚子晚報 2026-03-30 18:00:20
0 跟貼 0
玉林：暖心一幕！一名女子被卷入車底，危急關頭，十余名路人合力抬車救人！

廣西活動 2026-03-30 17:59:10
0 跟貼 0

重磅！我國臺辦正式宣布，鄭麗文訪問大陸行程確定，盧秀燕不裝了

重磅！我國臺辦正式宣布，鄭麗文訪問大陸行程確定，盧秀燕不裝了

奇思妙想生活家

2026-03-30 13:48:00

俄羅斯4人團隊做的VPN，成了中國用戶的救命稻草

俄羅斯4人團隊做的VPN，成了中國用戶的救命稻草

薛定諤的BUG

2026-03-28 11:13:03

伊朗的地面戰，可能要開始了

夷門王生

2026-03-30 12:25:06

男子CT報告顯示“子宮形態密度正常”，山西長治醫學院附屬和平醫院發布情況說明

男子CT報告顯示“子宮形態密度正常”，山西長治醫學院附屬和平醫院發布情況說明

界面新聞

2026-03-30 17:14:36

兩“虎”任上被查，正部級老虎被開除黨籍！受賄6.13億，譚瑞松被判死緩

兩“虎”任上被查，正部級老虎被開除黨籍！受賄6.13億，譚瑞松被判死緩

上觀新聞

2026-03-30 15:17:05

小米汽車代言人翻車？舒淇竟無駕照！雷軍：我預判了你的預判！

小米汽車代言人翻車？舒淇竟無駕照！雷軍：我預判了你的預判！

品牌新

2026-03-30 12:08:31

歌手吳向飛喊話李榮浩道歉：未取得授權公開演唱其歌曲；李榮浩回應：并未在個人演唱會或音樂節晚會唱過，請列明場次，若侵權一定賠償道歉

歌手吳向飛喊話李榮浩道歉：未取得授權公開演唱其歌曲；李榮浩回應：并未在個人演唱會或音樂節晚會唱過，請列明場次，若侵權一定賠償道歉

極目新聞

2026-03-29 18:56:41

4-1大冷門，世界第85掀翻世界第55，新西蘭大爆發，大勝南美勁旅

4-1大冷門，世界第85掀翻世界第55，新西蘭大爆發，大勝南美勁旅

側身凌空斬

2026-03-30 16:06:06

新華社快訊：中國國航一架從北京飛往平壤的客機抵達平壤

新華社快訊：中國國航一架從北京飛往平壤的客機抵達平壤

新華社

2026-03-30 09:40:11

4月1日醫保新政：家有高血壓、糖尿病、心臟病的，抓緊辦

4月1日醫保新政：家有高血壓、糖尿病、心臟病的，抓緊辦

小談食刻美食

2026-03-30 08:26:34

跨國藥企密集發聲聚焦支付體系！鎂信健康加速創新藥價值落地

跨國藥企密集發聲聚焦支付體系！鎂信健康加速創新藥價值落地

智藥局

2026-03-30 17:16:19

事關中朝關系，金正恩做出一個前所未有的表態

事關中朝關系，金正恩做出一個前所未有的表態

近史博覽

2026-03-30 09:48:04

伊朗女足球員：澳方承諾給我們房子、車子和永居權，來說服我們留下

伊朗女足球員：澳方承諾給我們房子、車子和永居權，來說服我們留下

懂球帝

2026-03-30 13:45:07

兩種葬禮，兩種人生，張雪峰和李詠的后事安排，差距真是一目了然

兩種葬禮，兩種人生，張雪峰和李詠的后事安排，差距真是一目了然

離離言幾許

2026-03-28 16:40:22

驚訝！伊朗大捷！用一場標志性大勝，讓美軍創下戰后最大戰損記錄

驚訝！伊朗大捷！用一場標志性大勝，讓美軍創下戰后最大戰損記錄

軍機Talk

2026-03-30 11:02:14

哈佛大學研究顯示：每月性行為頻次≥21次，可以大幅降低患癌風險

哈佛大學研究顯示：每月性行為頻次≥21次，可以大幅降低患癌風險

黯泉

2026-03-29 12:00:55

楊瀚森復出6+4+1帽吃生涯首T！開拓者3人20+大勝奇才阿夫20+7

楊瀚森復出6+4+1帽吃生涯首T！開拓者3人20+大勝奇才阿夫20+7

醉臥浮生

2026-03-30 08:30:08

“讓公務員先獻血”的時候，就不談“自愿”了？

“讓公務員先獻血”的時候，就不談“自愿”了？

走讀新生

2026-03-30 15:41:47

1979年計劃生育，一家只準生一個，陳云：搞不好要被罵斷子絕孫

1979年計劃生育，一家只準生一個，陳云：搞不好要被罵斷子絕孫

觀史搜尋著

2026-03-19 06:44:44

心源性猝死的人越來越多？醫生強調：寧可打打牌，建議別做這7事

心源性猝死的人越來越多？醫生強調：寧可打打牌，建議別做這7事

醫學原創故事會

2026-03-29 23:50:13

面向AI愛好者、開發者和科學家，提供AI領域技術資訊。

1397文章數 143關注度

往期回顧全部

科技要聞

一句謊言引發的硅谷血案

頭條要聞

尹正發文恭喜張雪奪冠張雪:沒錢請您做代言人送臺車

頭條要聞

尹正發文恭喜張雪奪冠張雪:沒錢請您做代言人送臺車

體育要聞

想進世界杯，意大利還要過他這一關

娛樂要聞

單依純凌晨發長文道歉！李榮浩再回應

財經要聞

本輪地緣沖突，A股憑什么走出獨立行情

汽車要聞

理想i9要來了!外形似小號MEGA 能沖擊高端純電市場?

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

教育

時尚

旅游

藝術

親子要聞

兒科護士精準控場，孩子哭得收放自如

教育要聞

五年級狀元題，求面積，會的不多

來到1980的周也，好毛利蘭

旅游要聞

德州寶藏露營地！超市、外賣、公廁全配齊，周末就來這露營吧

藝術要聞

600 年前的「產亡孤魂」，藏著中國女性最痛的記憶

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<noscript id="ee8ee"></noscript>

<nav id="ee8ee"><sup id="ee8ee"></sup></nav>

<small id="ee8ee"></small>