兩年來,關于人工智能顛覆軟件工程的討論一直遵循著同樣的敘事模式:模型變得越來越智能,基準測試不斷提高。
但這個畫面,其實已經過時了。
![]()
過去兩個月發生的根本性轉變,核心并不在于智能的提升,而在于人工智能的“生存環境”——它能夠觸及和操作的邊界,發生了根本變化。
界面的遷移
到2025年12月為止,主流的AI編程工具還只是集成在IDE里的助手。它們安靜地待在你旁邊,時不時給點建議。你來決定運行什么,去看報錯信息,琢磨下一步怎么走。
雖然實用,但從根本上說,它是個被動的角色。AI根本不清楚整個系統跑起來是否正常。它既不能自己運行程序,也無法主動發現問題、更別說嘗試修復了。整個過程,人類依然是主導。
而像Codex CLI和Claude Code這類工具,徹底改變了這個局面。它們把AI從編輯器里請了出來,直接放到了終端里。現在,模型可以自己讀取代碼庫、執行命令、運行測試、分析失敗原因、動手修改代碼,然后再試一次——整個過程,基本不需要你中途插手。
![]()
聽起來好像只是換了個地方放工具,但事情遠沒有這么簡單。
真正的工作,從來不是寫代碼。
這可能是大多數人對軟件工程師工作的最大誤解。
把代碼敲出來,只是最后那個看得見的成果。真正耗神的工作,是圍繞代碼展開的一系列活動:理解現有系統,運行測試,定位問題,提出假設,然后驗證、再重試。
這個過程,本質上不是靠“想”就能解決的推理問題,而更像是一個不斷試錯的“搜索”問題。你需要一次次嘗試,直到找到可行的方案。實驗的節奏越快,找到正確答案的節奏也就越快。
普通人遇到難題,大概在嘗試三四個假設后,思路就開始跟不上了。而AI智能體呢?在你還沒讀完第一個報錯信息的時候,它可能已經跑完幾十個假設了。
一旦機器能以遠超人類的速度來跑這個“搜索-驗證”循環,整個結構就會發生變化。中間那些重復性高、創造性低的工作——樣板代碼、數據遷移、系統對接、日常調試——會迅速變得成本極低。真正的價值,開始向兩端轉移。
一端是頂層設計:系統架構、抽象模型、那些決定產品最終形態的關鍵決策。另一端是底層支撐:確保這些設計能準確落地的堅實基礎。
驗證的鴻溝
然而,這種轉變也暴露了一個大多數團隊還沒準備好的問題。
“測試”是檢查代碼有沒有按預期運行。“驗證”是檢查代碼的運行結果,是不是真的達成了你想要的效果。你寫在文檔里的需求,和你內心真正渴望解決的問題,這中間的差距,正是AI智能體最容易出問題的地方。有些智能體雖然能完美通過你寫的所有測試,但卻可能把你的系統搞得一團糟。
AI智能體非常擅長滿足那些明確寫出來的規則,但它們很難發現那些你沒寫出來、甚至沒想到的規則。它們能找到讓所有測試用例都變綠的那個解,但它們不知道測試本身可能漏掉了什么。
人類工程師腦子里裝著代碼庫里沒有的東西:團隊的歷史記憶,當初設計的深層意圖,還有兩年前某個沒來得及寫進文檔的關鍵決策背后的權衡。這些都是AI智能體沒有的。它只能看到代碼庫里的內容,以及你明確給它的優化目標。
所以,它一定會去優化,而且效率極高,但有時候,它會朝著一些你完全沒想到的方向去優化,結果讓你大吃一驚。
新的瓶頸
瓶頸已經轉移了:不再是從人到機器,也不再是從慢到快,而是從“生成”轉向了“驗證”。
現在,稀缺的不再是“產出”的能力——人人都能產出大量代碼。真正稀缺的,是那個在產出被正式接受之前,負責驗證它到底靠不靠譜的基礎設施。
比如,能模擬真實工作流程的評估工具;能在新代碼上線、性能下降之前就把它攔下來的部署門禁;基于“肯定會出問題”這個前提構建的回滾機制;記錄AI每一步操作、方便事后追溯的審計日志;還有能把潛在影響范圍控制住的權限設計。
最后能想明白這一點的團隊,未必是代碼生成速度最快的團隊,而是那些率先構建起底層架構,能有效約束和驗證AI產出的團隊:包括控制層、評估體系、信任機制——正是這些東西,讓AI可以在真實的、復雜的大規模系統中穩定可靠地運行。
這份工作的性質,升級了。
![]()
軟件工程師這個角色并沒有消失,只是職責發生了演化:從親手編寫代碼,轉變為管理一個能編寫代碼的系統;從親自跑通那個“假設-驗證”循環,轉變為去定義這個循環的目標和邊界。
最終能跑出來的公司,不會是那些押注于下一個更強模型的,而是那些押注于構建更可靠驗證機制的公司。
外面的大多數人,還沒意識到這一點。而在這里親手建設這一切的人,已經忙得顧不上等他們反應過來了。
via:Natasha Malpani
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.