網易首頁 > 網易號 > 正文申請入駐

OpenAI發布GPT-5.4：支持100萬Token上下文，83%專業任務超越人類

2026-03-06 10:13:44　來源: 宗熙先生

湖北舉報

分享至

2026年3月5日，OpenAI正式重磅發布GPT-5.4，這是該公司迄今為止推出的最強大、最高效的專業工作前沿模型，全方位刷新了行業對通用AI的性能認知。同時，OpenAI同步發布GPT-5.4 Pro版本，該版本專門面向需要在復雜任務中追求極致性能的專業用戶，進一步滿足高端場景需求。

GPT-5.4主要具有以下幾個方面的核心優勢：

一、在ChatGPT中的主要升級

GPT-5.4 Thinking新增提前思考規劃功能，用戶可在模型生成內容的過程中實時調整方向，無需多次反復交互，就能在單次對話中獲得更精準、更貼合預期的最終輸出。

該模式還大幅提升了深度網絡研究能力，尤其在處理高度特定化、精細化查詢時表現更為突出，同時能在長時思考任務中更穩定地維持上下文連貫性，避免信息斷層。這些改進共同作用，為用戶帶來更高質量、更快速且更貼合任務需求的交互體驗。

二、在Codex與API中方面的突破

GPT-5.4 是該公司首個原生具備世界領先級計算機使用能力的通用模型，可支持代理在真實計算機環境中自主操作，順暢執行跨應用、多步驟的復雜工作流，無需額外插件輔助。它支持高達100萬token的超長上下文長度，讓代理能夠在長周期、多環節的復雜任務中，完整完成規劃、執行、驗證的全流程，無需頻繁中斷或分段處理。

同時，該模型創新引入工具搜索機制，在大型工具生態中能大幅提升工具選擇的精準度與效率，且完全不犧牲模型本身的智能決策水平，實現效率與質量的兼顧。

三、知識工作能力大幅提升

在GDPval測試中（覆蓋美國GDP前九大行業、44個職業的真實知識工作任務），GPT-5.4 以83.0%的勝率或平局率，成功匹配或超越行業專業人士，這一成績遠超GPT-5.2的70.9%，優勢顯著。測試覆蓋的任務類型廣泛，包括銷售演示文稿制作、財務電子表格處理、急診排班表制定、制造圖紙解析等各類高頻專業場景。

四、計算機使用與視覺理解

作為首個原生支持計算機使用的通用模型，GPT-5.4 在OSWorld-Verified桌面環境基準測試中，達成75.0%的成功率，不僅超過人類平均水平（72.4%），更較GPT-5.2的47.3%實現跨越式提升。在視覺理解基準MMMU-Pro上，其無工具得分達81.2%（GPT-5.2為79.5%），在無需外部工具輔助的情況下，視覺識別與理解能力持續優化。

API中新增的圖像輸入細節級別，可支持最高1024萬像素的全保真感知，能精準捕捉圖像細微細節，大幅提升定位精度與點擊準確性，完美適配高精度視覺相關任務需求。

五、編程能力

GPT-5.4深度融合GPT-5.3-Codex的核心編程優勢，在SWE-Bench Pro編程基準測試中，不僅實現更高的代碼準確率，同時維持更低的響應延遲，兼顧編程效率與代碼質量。啟用/fast模式后，token生成速度可提升至1.5倍，大幅縮短編程、文本生成的等待時間，進一步提升開發工作流效率。

六、工具使用優化

引入工具搜索機制后，在MCP Atlas基準的250個任務中，token總消耗降低47%，而任務準確率始終保持不變，實現效率與質量的雙重優化。此外，代理式工具調用在Toolathlon基準測試中，實現準確率與效率的雙重提升，進一步優化復雜任務的處理體驗。

七、網絡搜索與瀏覽能力

在BrowseComp基準（硬核信息檢索場景）中，GPT-5.4得分達82.7%，Pro版更是高達89.3%，較GPT-5.2實現顯著提升，信息檢索的精準度與效率得到大幅優化，能更好地滿足深度信息查詢需求。

八、可控性與安全性

GPT-5.4 Thinking支持響應前置規劃功能，用戶可在模型生成響應的過程中中途干預、調整方向，實現更靈活的交互控制。目前該功能已正式上線chatgpt.com和Android應用，iOS版也將在近期推出。

安全層面，提供高網絡安全能力防護策略，同時新增CoT可控性評估機制，可有效確認模型不會故意隱藏推理鏈，便于后續監控與風險管控，進一步提升模型使用安全性。

九、可用性與定價

GPT-5.4（API名稱：gpt-5.4）及GPT-5.4 Pro（gpt-5.4-pro）已正式上線API，開發者可立即接入使用，快速體驗新一代模型的核心優勢。ChatGPT平臺中，GPT-5.4 Thinking自今日起向Plus、Team、Pro用戶全面開放，將逐步取代GPT-5.2 Thinking，后者將在模型選擇器“舊版模型”中保留至2026年6月5日，方便用戶過渡適應。

企業類、教育類用戶可通過管理員設置提前啟用該功能；Pro版用戶與企業計劃用戶則可直接使用性能更強勁的GPT-5.4 Pro。Codex平臺現已支持實驗性100萬token上下文功能，但需注意的是，超限請求將按2倍標準計費。

總的來看，此次GPT-5.4的發布，標志著通用人工智能在專業工作領域的應用邁入了一個全新的階段。它不僅是單純的性能迭代，更是對AI作為生產力工具的一次根本性重構。通過引入原生計算機使用能力、超長上下文記憶、前瞻性的思考規劃以及精準的工具搜索機制，GPT-5.4成功將AI從被動的信息提供者，轉變為一個能夠主動規劃、執行并驗證復雜任務的自主智能體。

無論是面向專業人士的極致性能追求，還是為普通用戶帶來的高效交互體驗，OpenAI再次證明了其在推動AI技術落地與商業化進程中的引領地位。隨著GPT-5.4系列產品的全面上線，我們正見證一個由AI深度賦能的工作新時代的到來。（完）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.