太炸了!經歷了多次“跳票”,OpenAI全新?代?語?模型GPT-5終于在北京時間8?8?凌晨正式發布。
在這場?達??時的直播發布會上,OpenAI各團隊輪流上臺,從多個角度展?了GPT-5的強?能?。
正如OpenAI?席執?官?姆·奧特曼(SamAltman)在發布會上所?,GPT-5是OpenAI迄今最聰明、最快速也最實?的模型,“每個?都能?上專家級的智能”。
![]()
01|能?全?提升,多項任務“屠榜”
GPT-5在多個領域實現了全?位的性能提升,在?本理解、?頁開發、視覺感知等任務上均排名第?,在復雜提?、編程、數學、創意?成和?對話等??也保持領先。
在代號為“Summit”的綜合評測中,GPT-5取得了迄今最?的總分,可謂“全?屠榜”。奧特曼形象地?喻道:“GPT-4就像?名?學?,?GPT-5則讓我第?次感覺是在和?位博?級的專家對話”。
![]()
他在發布會上甚?斷?:“這是世界上編碼能?最強的模型,也是寫作能?最強、醫療領域表現最強的模型”。
具體來看,GPT-5在?系列基準測試中刷新了紀錄。在復雜代碼修復任務SWE-benchVerified中,GPT-5正確率達到74.9%;在多語?代碼編輯測試AiderPolyglot中,正確率?達88%。
![]()
在視覺推理基準MMMU上,GPT-5也刷新了紀錄。在數學推理??,GPT-5在2025年AIME?中數學競賽題上的得分顯著超越了GPT-4o。
尤其是在OpenAI內部設計的?難度綜合考試“?類最后的考試”中,開啟?具和鏈式思考的GPT-5Pro模型以42%的準確率拔得頭籌,甚??于表現最好的ChatGPT智能體?案(41.6%)。
![]()
這些數據充分證明,GPT-5在代碼?成、數學推理、復雜問答等關鍵能?上均達到了當前最先進?平。
03|幻覺?幅減少,回答更可靠
除了能?提升,GPT-5在可靠性和安全性??也有顯著改進。
“幻覺”(hallucination,即模型憑空編造事實)?直是?戶詬病的問題,?OpenAI此次宣稱GPT-5在這??下?了功夫,“幻覺”發?概率顯著降低。
具體??,在聯?搜索場景下,GPT-5給出錯誤答案的概率?GPT-4o降低了45%;在獨?思考模式下,其出錯率?上?代模型OpenAIo3降低了80%。
![]()
此外,GPT-5變得更加“誠實”,不再輕易向??保證能完成超出??能?的任務,當遇到不可能完成或缺少必要?具的請求時,它會更坦誠地表明??的局限。
這些改進意味著GPT-5在提供信息時將更加準確可信,回答也更符合指令要求,不再像過去那樣經常出現答?所問或過度討好??的情況。
![]()
OpenAI還針對模型的有害輸出制定了新的安全策略。
對于?些可能被濫?的請求,GPT-5不再簡單地直接拒絕,?是采?所謂“安全補全”機制:在不違反安全準則的前提下,提供盡可能有幫助的回答。
例如,當有?詢問如何點燃某種易燃物時,模型會提供部分?般信息,但不會給出可能實際造成危害的具體指導。這種策略在確保安全的同時,盡量避免?硬的“??切”拒絕,提升了??體驗。
04|四?“?格”模式,對話體驗更個性化
為了讓ChatGPT的交互更加有趣和貼近??偏好,OpenAI這次為GPT-5引?了四種全新的“?格”模式,供???由選擇。這四種模式分別是:
·憤世嫉俗者(Cynic):語?略帶譏諷,喜歡挑刺
.機器?(Robot):語?理性冷靜,不帶感情?彩
.傾聽者(Listener):耐?傾聽,以?持和引導為主
.書呆?(Nerd):熱情且知識淵博,樂于深?探討細節
??可以根據??的喜好,設置ChatGPT與??對話和回答問題的風格。
例如,你希望模型和你爭論問題,還是希望它像?位耐?的朋友那樣傾聽?
現在這些都可以由你選擇。
ChatGPT產品負責?尼克·特利(NickTurley)表?:“這個模型真的‘感覺’很棒,我想?們會切實感受到這?點,尤其是平時不太研究模型的普通??”。
除了?格模式,OpenAI還允許??為單個聊天窗??定義配?主題,讓界?更具個性。這些改進使ChatGPT的對話體驗更加多樣化和?性化。
05|免費向所有?戶開放,多版本滿?不同需求
此次GPT-5的發布還有?個重?變化:所有ChatGPT?戶都可以?即免費體驗GPT-5。這是OpenAI?次將最前沿的模型免費開放給全體??。
當然,不同級別??的使?權限有所區別:
.免費?戶:可使?GPT-5,但有每?使?次數限制,以防?濫?。
.Plus訂閱?戶:在達到使?上限前可以調?更多次GPT-5。
.Pro訂閱?戶:可以解鎖GPT-5的“Pro”版本,該版本具備更強的推理能?。
當??達到GPT-5的調?上限后,ChatGPT會?動切換到性能稍低但更快的GPT-5“mini”版本繼續響應后續請求。
隨著GPT-5的推出,OpenAI也宣布正式退役?系列舊模型,包括GPT-4o、OpenAIo3、OpenAIo4-mini、GPT-4.1和GPT-4.5等,全?由GPT-5系列取?代之。
OpenAI此次提供了四個版本的GPT-5模型來滿?不同場景需求:
.GPT-5(標準版):旗艦模型,具備最強的綜合能?和400K上下?窗?,適合復雜任務。·GPT-5mini:輕量版本,速度更快、成本更低,適合?常對話和簡單任務。
.GPT-5nano:超輕量版本,針對極低延遲需求優化,適合實時交互場景。
·GPT-5chat:對話優化版本,提供更?然流暢的多模態對話體驗,甚?可以?來學習新語?。
在ChatGPT界?上,現在??看到的是統?的GPT-5選項,?不再區分普通版和推理增強版。
這背后是OpenAI開發的智能路由系統:對于較簡單的提問,系統會默認調?快速的mini/nano模型;遇到復雜問題或??明確要求“仔細想想”時,會?動切換到推理更強的標準版或Pro版來作答。
奧特曼坦?,過去讓???動選擇模型的界?“?常混亂”,如今這?體驗將?為簡化。
值得?提的是,OpenAI還在API中引?了新的“Minimal”參數,開發者可以通過調整推理強度,靈活地在不同性能模式下使?GPT-5。這使得GPT-5既能勝任?復雜度任務,?可以在資源受限的環境下以較低成本運?。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.