![]()
2026年3月5日,OpenAI正式重磅發布GPT-5.4,這是該公司迄今為止推出的最強大、最高效的專業工作前沿模型,全方位刷新了行業對通用AI的性能認知。同時,OpenAI同步發布GPT-5.4 Pro版本,該版本專門面向需要在復雜任務中追求極致性能的專業用戶,進一步滿足高端場景需求。
GPT-5.4主要具有以下幾個方面的核心優勢:
一、在ChatGPT中的主要升級
GPT-5.4 Thinking新增提前思考規劃功能,用戶可在模型生成內容的過程中實時調整方向,無需多次反復交互,就能在單次對話中獲得更精準、更貼合預期的最終輸出。
該模式還大幅提升了深度網絡研究能力,尤其在處理高度特定化、精細化查詢時表現更為突出,同時能在長時思考任務中更穩定地維持上下文連貫性,避免信息斷層。這些改進共同作用,為用戶帶來更高質量、更快速且更貼合任務需求的交互體驗。
二、在Codex與API中方面的突破
GPT-5.4 是該公司首個原生具備世界領先級計算機使用能力的通用模型,可支持代理在真實計算機環境中自主操作,順暢執行跨應用、多步驟的復雜工作流,無需額外插件輔助。它支持高達100萬token的超長上下文長度,讓代理能夠在長周期、多環節的復雜任務中,完整完成規劃、執行、驗證的全流程,無需頻繁中斷或分段處理。
同時,該模型創新引入工具搜索機制,在大型工具生態中能大幅提升工具選擇的精準度與效率,且完全不犧牲模型本身的智能決策水平,實現效率與質量的兼顧。
![]()
三、知識工作能力大幅提升
在GDPval測試中(覆蓋美國GDP前九大行業、44個職業的真實知識工作任務),GPT-5.4 以83.0%的勝率或平局率,成功匹配或超越行業專業人士,這一成績遠超GPT-5.2的70.9%,優勢顯著。測試覆蓋的任務類型廣泛,包括銷售演示文稿制作、財務電子表格處理、急診排班表制定、制造圖紙解析等各類高頻專業場景。
![]()
四、計算機使用與視覺理解
作為首個原生支持計算機使用的通用模型,GPT-5.4 在OSWorld-Verified桌面環境基準測試中,達成75.0%的成功率,不僅超過人類平均水平(72.4%),更較GPT-5.2的47.3%實現跨越式提升。在視覺理解基準MMMU-Pro上,其無工具得分達81.2%(GPT-5.2為79.5%),在無需外部工具輔助的情況下,視覺識別與理解能力持續優化。
API中新增的圖像輸入細節級別,可支持最高1024萬像素的全保真感知,能精準捕捉圖像細微細節,大幅提升定位精度與點擊準確性,完美適配高精度視覺相關任務需求。
五、編程能力
GPT-5.4深度融合GPT-5.3-Codex的核心編程優勢,在SWE-Bench Pro編程基準測試中,不僅實現更高的代碼準確率,同時維持更低的響應延遲,兼顧編程效率與代碼質量。啟用/fast模式后,token生成速度可提升至1.5倍,大幅縮短編程、文本生成的等待時間,進一步提升開發工作流效率。
![]()
六、工具使用優化
引入工具搜索機制后,在MCP Atlas基準的250個任務中,token總消耗降低47%,而任務準確率始終保持不變,實現效率與質量的雙重優化。此外,代理式工具調用在Toolathlon基準測試中,實現準確率與效率的雙重提升,進一步優化復雜任務的處理體驗。
七、網絡搜索與瀏覽能力
在BrowseComp基準(硬核信息檢索場景)中,GPT-5.4得分達82.7%,Pro版更是高達89.3%,較GPT-5.2實現顯著提升,信息檢索的精準度與效率得到大幅優化,能更好地滿足深度信息查詢需求。
![]()
八、可控性與安全性
GPT-5.4 Thinking支持響應前置規劃功能,用戶可在模型生成響應的過程中中途干預、調整方向,實現更靈活的交互控制。目前該功能已正式上線chatgpt.com和Android應用,iOS版也將在近期推出。
安全層面,提供高網絡安全能力防護策略,同時新增CoT可控性評估機制,可有效確認模型不會故意隱藏推理鏈,便于后續監控與風險管控,進一步提升模型使用安全性。
九、可用性與定價
![]()
GPT-5.4(API名稱:gpt-5.4)及GPT-5.4 Pro(gpt-5.4-pro)已正式上線API,開發者可立即接入使用,快速體驗新一代模型的核心優勢。ChatGPT平臺中,GPT-5.4 Thinking自今日起向Plus、Team、Pro用戶全面開放,將逐步取代GPT-5.2 Thinking,后者將在模型選擇器“舊版模型”中保留至2026年6月5日,方便用戶過渡適應。
企業類、教育類用戶可通過管理員設置提前啟用該功能;Pro版用戶與企業計劃用戶則可直接使用性能更強勁的GPT-5.4 Pro。Codex平臺現已支持實驗性100萬token上下文功能,但需注意的是,超限請求將按2倍標準計費。
總的來看,此次GPT-5.4的發布,標志著通用人工智能在專業工作領域的應用邁入了一個全新的階段。它不僅是單純的性能迭代,更是對AI作為生產力工具的一次根本性重構。通過引入原生計算機使用能力、超長上下文記憶、前瞻性的思考規劃以及精準的工具搜索機制,GPT-5.4成功將AI從被動的信息提供者,轉變為一個能夠主動規劃、執行并驗證復雜任務的自主智能體。
無論是面向專業人士的極致性能追求,還是為普通用戶帶來的高效交互體驗,OpenAI再次證明了其在推動AI技術落地與商業化進程中的引領地位。隨著GPT-5.4系列產品的全面上線,我們正見證一個由AI深度賦能的工作新時代的到來。(完)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.