337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

OpenAI發布GPT-5.4:支持100萬Token上下文,83%專業任務超越人類

0
分享至



2026年3月5日,OpenAI正式重磅發布GPT-5.4,這是該公司迄今為止推出的最強大、最高效的專業工作前沿模型,全方位刷新了行業對通用AI的性能認知。同時,OpenAI同步發布GPT-5.4 Pro版本,該版本專門面向需要在復雜任務中追求極致性能的專業用戶,進一步滿足高端場景需求。

GPT-5.4主要具有以下幾個方面的核心優勢:

一、在ChatGPT中的主要升級

GPT-5.4 Thinking新增提前思考規劃功能,用戶可在模型生成內容的過程中實時調整方向,無需多次反復交互,就能在單次對話中獲得更精準、更貼合預期的最終輸出。

該模式還大幅提升了深度網絡研究能力,尤其在處理高度特定化、精細化查詢時表現更為突出,同時能在長時思考任務中更穩定地維持上下文連貫性,避免信息斷層。這些改進共同作用,為用戶帶來更高質量、更快速且更貼合任務需求的交互體驗。

二、在Codex與API中方面的突破

GPT-5.4 是該公司首個原生具備世界領先級計算機使用能力的通用模型,可支持代理在真實計算機環境中自主操作,順暢執行跨應用、多步驟的復雜工作流,無需額外插件輔助。它支持高達100萬token的超長上下文長度,讓代理能夠在長周期、多環節的復雜任務中,完整完成規劃、執行、驗證的全流程,無需頻繁中斷或分段處理。

同時,該模型創新引入工具搜索機制,在大型工具生態中能大幅提升工具選擇的精準度與效率,且完全不犧牲模型本身的智能決策水平,實現效率與質量的兼顧。



三、知識工作能力大幅提升

在GDPval測試中(覆蓋美國GDP前九大行業、44個職業的真實知識工作任務),GPT-5.4 以83.0%的勝率或平局率,成功匹配或超越行業專業人士,這一成績遠超GPT-5.2的70.9%,優勢顯著。測試覆蓋的任務類型廣泛,包括銷售演示文稿制作、財務電子表格處理、急診排班表制定、制造圖紙解析等各類高頻專業場景。



四、計算機使用與視覺理解

作為首個原生支持計算機使用的通用模型,GPT-5.4 在OSWorld-Verified桌面環境基準測試中,達成75.0%的成功率,不僅超過人類平均水平(72.4%),更較GPT-5.2的47.3%實現跨越式提升。在視覺理解基準MMMU-Pro上,其無工具得分達81.2%(GPT-5.2為79.5%),在無需外部工具輔助的情況下,視覺識別與理解能力持續優化。

API中新增的圖像輸入細節級別,可支持最高1024萬像素的全保真感知,能精準捕捉圖像細微細節,大幅提升定位精度與點擊準確性,完美適配高精度視覺相關任務需求。

五、編程能力

GPT-5.4深度融合GPT-5.3-Codex的核心編程優勢,在SWE-Bench Pro編程基準測試中,不僅實現更高的代碼準確率,同時維持更低的響應延遲,兼顧編程效率與代碼質量。啟用/fast模式后,token生成速度可提升至1.5倍,大幅縮短編程、文本生成的等待時間,進一步提升開發工作流效率。



六、工具使用優化

引入工具搜索機制后,在MCP Atlas基準的250個任務中,token總消耗降低47%,而任務準確率始終保持不變,實現效率與質量的雙重優化。此外,代理式工具調用在Toolathlon基準測試中,實現準確率與效率的雙重提升,進一步優化復雜任務的處理體驗。

七、網絡搜索與瀏覽能力

在BrowseComp基準(硬核信息檢索場景)中,GPT-5.4得分達82.7%,Pro版更是高達89.3%,較GPT-5.2實現顯著提升,信息檢索的精準度與效率得到大幅優化,能更好地滿足深度信息查詢需求。



八、可控性與安全性

GPT-5.4 Thinking支持響應前置規劃功能,用戶可在模型生成響應的過程中中途干預、調整方向,實現更靈活的交互控制。目前該功能已正式上線chatgpt.com和Android應用,iOS版也將在近期推出。

安全層面,提供高網絡安全能力防護策略,同時新增CoT可控性評估機制,可有效確認模型不會故意隱藏推理鏈,便于后續監控與風險管控,進一步提升模型使用安全性。

九、可用性與定價



GPT-5.4(API名稱:gpt-5.4)及GPT-5.4 Pro(gpt-5.4-pro)已正式上線API,開發者可立即接入使用,快速體驗新一代模型的核心優勢。ChatGPT平臺中,GPT-5.4 Thinking自今日起向Plus、Team、Pro用戶全面開放,將逐步取代GPT-5.2 Thinking,后者將在模型選擇器“舊版模型”中保留至2026年6月5日,方便用戶過渡適應。

企業類、教育類用戶可通過管理員設置提前啟用該功能;Pro版用戶與企業計劃用戶則可直接使用性能更強勁的GPT-5.4 Pro。Codex平臺現已支持實驗性100萬token上下文功能,但需注意的是,超限請求將按2倍標準計費。

總的來看,此次GPT-5.4的發布,標志著通用人工智能在專業工作領域的應用邁入了一個全新的階段。它不僅是單純的性能迭代,更是對AI作為生產力工具的一次根本性重構。通過引入原生計算機使用能力、超長上下文記憶、前瞻性的思考規劃以及精準的工具搜索機制,GPT-5.4成功將AI從被動的信息提供者,轉變為一個能夠主動規劃、執行并驗證復雜任務的自主智能體。

無論是面向專業人士的極致性能追求,還是為普通用戶帶來的高效交互體驗,OpenAI再次證明了其在推動AI技術落地與商業化進程中的引領地位。隨著GPT-5.4系列產品的全面上線,我們正見證一個由AI深度賦能的工作新時代的到來。(完)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
歐美杯告吹!阿根廷拒戰真相:滿嘴謊言,就是不想踢!

歐美杯告吹!阿根廷拒戰真相:滿嘴謊言,就是不想踢!

仰臥撐FTUer
2026-03-22 07:48:02
30萬車主被坑慘!知名寶馬4S店突發爆雷

30萬車主被坑慘!知名寶馬4S店突發爆雷

蔣東文
2026-03-20 20:36:11
戰滿全部11局!吳宜澤5-6惜敗奧沙利文,無緣世界公開賽決賽

戰滿全部11局!吳宜澤5-6惜敗奧沙利文,無緣世界公開賽決賽

全景體育V
2026-03-21 17:24:08
長春路虎哥剛被刑拘,人民網出手!多人受牽連,更嚴重的還在后面

長春路虎哥剛被刑拘,人民網出手!多人受牽連,更嚴重的還在后面

觀察鑒娛
2026-03-21 12:25:26
出大事了,俄羅斯拉響警報后,扎哈羅娃攤牌,韓國一步錯步步錯

出大事了,俄羅斯拉響警報后,扎哈羅娃攤牌,韓國一步錯步步錯

云舟史策
2026-03-22 07:20:53
繼續獲得信任,TA:凱帕將首發出戰英聯杯決賽

繼續獲得信任,TA:凱帕將首發出戰英聯杯決賽

懂球帝
2026-03-22 05:53:18
緬北詐騙傳聞真相大白2月后,李湘近況曝光,估計和你想的不一樣

緬北詐騙傳聞真相大白2月后,李湘近況曝光,估計和你想的不一樣

阿褲趣聞君
2026-03-20 20:12:31
曾經走紅,如今卻“淪為笑柄”的4種數碼產品,還是別再買了

曾經走紅,如今卻“淪為笑柄”的4種數碼產品,還是別再買了

美家指南
2026-03-06 10:31:36
在韓國呆了小半年,才發現我們對韓國的誤解,實在太深了

在韓國呆了小半年,才發現我們對韓國的誤解,實在太深了

國外三兩事
2026-03-21 08:05:05
本科學歷進央國企越來越難了

本科學歷進央國企越來越難了

戶外阿毽
2026-03-21 14:53:12
巴薩第三代后腰貝爾納爾,比布斯克茨會射門,比德容懂選位

巴薩第三代后腰貝爾納爾,比布斯克茨會射門,比德容懂選位

米奇兔
2026-03-21 11:34:03
老人再婚后第一次圓房有何感想?67歲老人傾訴:她給了我很多驚喜

老人再婚后第一次圓房有何感想?67歲老人傾訴:她給了我很多驚喜

熱心柚子姐姐
2026-03-20 19:24:24
美以襲擊伊朗核設施!伊朗武裝部隊:正在霍爾木茲海峽采取重大行動,如果打擊伊朗的基礎設施,伊朗將攻擊美以更重要、更關鍵的基礎設施

美以襲擊伊朗核設施!伊朗武裝部隊:正在霍爾木茲海峽采取重大行動,如果打擊伊朗的基礎設施,伊朗將攻擊美以更重要、更關鍵的基礎設施

每日經濟新聞
2026-03-21 20:59:09
越南選舉產生第十六屆國會代表

越南選舉產生第十六屆國會代表

澎湃新聞
2026-03-21 23:30:05
楊振寧離世5個月,翁帆遠赴英國真相曝光,藏21年的秘密瞞不住了

楊振寧離世5個月,翁帆遠赴英國真相曝光,藏21年的秘密瞞不住了

離離言幾許
2026-03-13 22:38:05
白人女性與黑人女性的體味差異,網友真實分享引發熱議

白人女性與黑人女性的體味差異,網友真實分享引發熱議

特約前排觀眾
2025-12-22 00:20:06
金價連連下跌!有人“搶底撈金” 現在是上車好時機嗎?

金價連連下跌!有人“搶底撈金” 現在是上車好時機嗎?

新京報
2026-03-21 07:57:24
馬上停止吃這種瓜,有毒、傷肝腎!一盤上桌,全家遭殃!年年出事

馬上停止吃這種瓜,有毒、傷肝腎!一盤上桌,全家遭殃!年年出事

醫學科普匯
2026-03-21 21:10:04
四川開通首條至阿塞拜疆TIR國際公路運輸線路

四川開通首條至阿塞拜疆TIR國際公路運輸線路

北青網-北京青年報
2026-03-20 15:21:01
回顧:四川一大爺強娶自己兒媳卻因此喪命,兒媳:他就是禽獸

回顧:四川一大爺強娶自己兒媳卻因此喪命,兒媳:他就是禽獸

青青會講故事
2025-01-23 17:30:02
2026-03-22 08:24:49
宗熙先生
宗熙先生
分享科技、數碼、互聯網信息。
3042文章數 543關注度
往期回顧 全部

科技要聞

宇樹招股書拆解,人形機器人出貨量第一!

頭條要聞

男子沉迷"打鳥":改裝車輛買觀鳥裝備 一年花掉上百萬

頭條要聞

男子沉迷"打鳥":改裝車輛買觀鳥裝備 一年花掉上百萬

體育要聞

誰在決定字母哥未來?

娛樂要聞

田栩寧終于涼了?出軌風波影響惡劣

財經要聞

通脹警報拉響,加息潮要來了?

汽車要聞

小鵬汽車2025年Q4盈利凈賺3.8億 全年營收767億

態度原創

旅游
藝術
本地
公開課
軍事航空

旅游要聞

【花Young貴陽】春日限定!十里河灘海棠花盛開引客來

藝術要聞

你的母校在嗎?毛主席親筆題名的 20 所大學合集

本地新聞

春色滿城關不住|紹興春日頂流,這片櫻花海藏不住了

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊導彈擊中以核設施附近 爆炸視頻公布

無障礙瀏覽 進入關懷版