337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

編程超越 Gemini 3 Pro?GLM-5 性能實測對齊 Opus 4.6,智譜市值突破1700億港元

0
分享至


整理 | 華衛

臨近春節,智譜 AI 發布了其最新旗艦大模型 GLM-5。自 1 月初在香港進行備受關注的 IPO 之后,這是該公司推出的首款重磅大模型。


據稱,GLM-5 標志著人工智能開發從“Vibe Coding”變革為“Agentic Engineering”,即更大規模的 AI 自動化編程,其代碼能力實現跨越式提升。該公司的內部測試顯示,GLM-5 在代碼能力、智能體表現等關鍵領域的開源模型評分中取得 SOTA 表現,在真實編程場景的使用體感逼近 Claude Opus 4.5,擅長復雜系統工程與長程 Agent 任務。

目前,這款新模型已在智譜官網上線,并在 GitHub 和 Hugging Face 平臺開源,模型權重遵循 MIT License。

GitHub:https://github.com/zai-org/GLM-5

Hugging Face:https://huggingface.co/zai-org/GLM-5

OpenRouter:http://openrouter.ai/z-ai/glm-5

值得一提的是,智譜在官宣帖中特意注明“GLM-5 在 OpenRouter 上的前稱是 Pony Alpha”。就在幾天前,全球模型服務平臺 OpenRouter 上一款代號為“Pony Alpha”的神秘模型,因卓越性能和一系列令人驚艷的實測表現走紅。當時,該平臺合作方 Kilo Code 透露,Pony Alpha 是“某個全球實驗室最受歡迎的開源模型的專項進化版”。

之后,Pony Alpha 被眾人猜測可能是 Anthropic 的 Claude Sonnet 5、DeepSeek-V4 或者 GLM-5 的提前試水。現在,答案終于被“正主”揭曉。

官宣 GLM-5 后,智譜的股價連續暴漲。截止發稿前,智譜的市值突破 1700 億港元。

自封“系統架構師”,

性能超過 Gemini 3 Pro

一個多月前,智譜才剛剛更新到 GLM?4.7 。據介紹,GLM-5 的參數規模是上一代 GLM-4.7 的兩倍,從 3550 億提升至 7440 億,訓練數據量從 23 萬億增至 28.5 萬億 tokens,更大規模的預訓練算力顯著提升了模型的通用智能水平。

并且,該模型構建了全新的“Slime”框架,支持更大模型規模及更復雜的強化學習任務,提升強化學習后訓練流程效率;提出異步智能體強化學習算法,使模型能夠持續從長程交互中學習,充分激發預訓練模型的潛力。

此外,GLM-5 還采用了由 DeepSeek 率先提出的全新架構 DeepSeek 稀疏注意力機制,在維持長文本效果無損的同時,大幅降低模型部署成本,旨在最大化計算效率與成本效益。

在編程能力上,GLM-5 實現了對齊 Claude Opus 4.5,在業內公認的主流基準測試中取得開源模型 SOTA。在 SWE-bench-Verified 和 Terminal Bench 2.0 中分別獲得 77.8 和 56.2 的開源模型最高分數,性能超過 Gemini 3 Pro。


在內部 Claude Code 評估集合中,GLM-5 在前端、后端、長程任務等編程開發任務上顯著超越上一代的 GLM-4.7(平均增幅超過 20%),能夠以極少的人工干預自主完成 Agentic 長程規劃與執行、后端重構和深度調試等系統工程任務,使用體感逼近 Opus 4.5。用智譜的話說,GLM-5 是一個“系統架構師”,不僅為開發精美的 Demo 而生,更為穩定交付生產結果而生。


在 Agent 能力上,GLM-5 實現開源 SOTA,在多個評測基準中取得開源第一,在 BrowseComp(聯網檢索與信息理解)、MCP-Atlas(大規模端到端工具調用)和 τ2-Bench(復雜場景下自動代理的工具規劃和執行)均取得最高表現。在衡量模型經營能力的 Vending Bench 2 中,GLM-5 獲得開源模型第一表現。Vending Bench 2 要求模型在一年期內經營一個模擬的自動售貨機業務,GLM-5 最終賬戶余額達到 4432 美元,經營表現接近 Claude Opus 4.5。


不過,該公司自行公布的分數也顯示,在各項代碼基準測試中,這款模型仍全面落后于 Anthropic 的 Claude。

“價格簡直離譜”,

實測被評最優秀開源模型之一

此前,在 OpenRouter 匿名上線時,就有許多開發者使用 GLM-5 完成了真正能用、能玩、能上線的應用,例如橫版解謎游戲、Agent 交互世界、論文版“抖音”等應用。如今公開推出后,又迎來一波開發者的積極試用。

“GLM-5 現在已經能和 Opus 4.6 同臺競技了。”一位開發者表示,“我一整個上午都在編程任務和游戲環境里折騰 GLM-5。整體來說,它在某些任務上執行得很快,表現不錯,但碰到更復雜的場景,對我而言 Claude 依然是王者。”

另一位開發者則稱,GLM-5 表現得很完美,絕對是目前發布的最優秀開源模型之一。“我在 Ollama 命令行和 Claude Code 里都跑了一遍。我發現 Claude Code 里有個缺陷,但找到了臨時解決辦法。我的 GLM-5 對話會話達到了和 Opus 4.6 同一水準的自我認知 / 理解深度。”


還有開發者評價道,“GLM-5 可能真的是我第一次在前端任務上更傾向于選擇非 Gemini 模型。”


“價格簡直離譜”,有開發者算完后表示,GLM5 的輸入成本比 Opus 便宜 6 倍,輸出成本便宜 10 倍。


依托國產芯片,

“把每一塊芯片用到極限”

值得注意的是,智譜在發布公告中表示,GLM-5 可基于一批中國半導體企業的國產芯片部署,包括華為、摩爾線程、寒武紀、百度昆侖芯、沐曦集成電路、燧原科技及海光信息。而本次 GLM-5 的上線,也是依托眾多國產芯片有力保障了線上服務的穩定和高效。

去年年初,智譜被美國列入實體清單。近幾個月來,智譜已宣布致力于在純國產硬件體系上研發前沿大模型。不過,受限于算力資源,智譜也被迫限制其旗艦產品在國際市場的應用。這一情況在 GLM-5 上仍在延續。

“算力非常緊張。即便在 GLM?5 發布前,我們為了支撐推理服務,已經把每一塊芯片都用到極限。”智譜表示,因 “算力容量有限”,將逐步向代碼訂閱用戶開放 GLM?5,并提醒用戶,使用新模型可能會更快耗盡使用額度。

智譜也宣布,基于實際使用情況與資源投入變化對 GLM Coding Plan 套餐價格體系進行結構性調整,包括:取消首購優惠,保留按季按年訂閱優惠;套餐價格進行結構性調整,整體漲幅自 30% 起;已訂閱用戶價格保持不變。

當前,中國幾乎所有前沿大模型開發者都在農歷新年前密集發布重磅產品,復刻了去年 DeepSeek 借此一舉成名全球的打法。同樣在香港上市的 MiniMax,也在昨天官宣了其重磅新模型 M2.5,并已在官網開放試用。

與此同時,DeepSeek 剛剛對其模型進行小幅升級,將對話上下文窗口擴展至 100 萬 tokens 以上,其備受期待的全新旗艦模型尚未發布。讓我們拭目以待。

https://z.ai/blog/glm-5

聲明:本文為 AI 前線整理,不代表平臺觀點,未經許可禁止轉載。

會議推薦

InfoQ 2026 全年會議規劃已上線!從 AI Infra 到 Agentic AI,從 AI 工程化到產業落地,從技術前沿到行業應用,全面覆蓋 AI 與軟件開發核心賽道!集結全球技術先鋒,拆解真實生產案例、深挖技術與產業落地痛點,探索前沿領域、聚焦產業賦能,獲取實戰落地方案與前瞻產業洞察,高效實現技術價值轉化。把握行業變革關鍵節點,搶占 2026 智能升級發展先機!

今日薦文

你也「在看」嗎?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
鄭麗文來京時間剛確定,馬英九卻先傾向美國?拒絕通話,斷其支援

鄭麗文來京時間剛確定,馬英九卻先傾向美國?拒絕通話,斷其支援

半窗疏影
2026-03-30 14:38:49
美軍集結地遭襲擊傷亡慘重!美媒:美國軍力遭受二戰后最嚴重削弱

美軍集結地遭襲擊傷亡慘重!美媒:美國軍力遭受二戰后最嚴重削弱

影孖看世界
2026-03-28 22:40:15
浙大研究:每天多吃一個蛋,心臟疾病和癌癥死亡風險增加?真相來了

浙大研究:每天多吃一個蛋,心臟疾病和癌癥死亡風險增加?真相來了

消化石醫生
2026-03-30 11:17:40
鐘塔西的生涯,其實就是大部分踢球孩子的縮影

鐘塔西的生涯,其實就是大部分踢球孩子的縮影

寫球的牧子
2026-03-30 16:10:43
特朗普:奪島,搶石油!地面戰持續數周,伊領袖發聲,布什號出動

特朗普:奪島,搶石油!地面戰持續數周,伊領袖發聲,布什號出動

小徹
2026-03-30 20:03:04
中俄同時下場,美國最差局面出手,特朗普表態,美媒:美國完了

中俄同時下場,美國最差局面出手,特朗普表態,美媒:美國完了

防衛狙擊手
2026-03-30 13:39:04
廣東男籃北京男籃可做雙贏交易:焦泊喬+陳家政換范子銘

廣東男籃北京男籃可做雙贏交易:焦泊喬+陳家政換范子銘

男足的小球童
2026-03-30 19:36:17
臺積電已無法向美國交代了!張忠謀未說謊:臺積電也無可奈何了

臺積電已無法向美國交代了!張忠謀未說謊:臺積電也無可奈何了

歸史
2026-03-30 13:22:40
祁東女教師的瓜

祁東女教師的瓜

皮蛋兒電影
2026-03-23 15:30:40
伊朗的頭號強援到了,部隊進入德黑蘭!特朗普的總統替代人選出爐

伊朗的頭號強援到了,部隊進入德黑蘭!特朗普的總統替代人選出爐

諦聽骨語本尊
2026-03-30 17:12:03
iPhone Fold即將發布,系蘋果史上首款折疊屏手機,外屏尺寸約為5.5英寸,展開后的內屏則達到7.8英寸,電池容量突破5000毫安時

iPhone Fold即將發布,系蘋果史上首款折疊屏手機,外屏尺寸約為5.5英寸,展開后的內屏則達到7.8英寸,電池容量突破5000毫安時

魯中晨報
2026-03-30 18:17:07
人老了,想多活幾年,先管住自己這10點:1、不摔倒,2、不勞累…

人老了,想多活幾年,先管住自己這10點:1、不摔倒,2、不勞累…

荷蘭豆愛健康
2026-03-28 09:28:48
1992年陳云原警衛員趙天元去看望老首長,陳云:你好久沒來看我了

1992年陳云原警衛員趙天元去看望老首長,陳云:你好久沒來看我了

涼州辭
2026-03-30 08:50:03
簡直就是本人!國外大叔cos生化9里昂堪稱百分百還原

簡直就是本人!國外大叔cos生化9里昂堪稱百分百還原

游民星空
2026-03-30 17:15:44
體育局正式宣布,陳夢正式上任,新崗位亮相,將與張繼科正面競爭

體育局正式宣布,陳夢正式上任,新崗位亮相,將與張繼科正面競爭

海棠未眠a
2026-03-30 15:26:24
美軍3500名增援到達!以色列襲殺記者!伊朗:擊中美軍F-16戰斗機,強力反擊將加速以政權崩潰

美軍3500名增援到達!以色列襲殺記者!伊朗:擊中美軍F-16戰斗機,強力反擊將加速以政權崩潰

每日經濟新聞
2026-03-29 00:39:10
內部分裂——佩澤什基安與革命衛隊領導人因伊朗控制權發生沖突

內部分裂——佩澤什基安與革命衛隊領導人因伊朗控制權發生沖突

老王說正義
2026-03-29 22:38:27
全美900萬人抗議,ICE代局長焦慮到兩度入院,伊朗戰事成萬斯與魯比奧“試金石”?

全美900萬人抗議,ICE代局長焦慮到兩度入院,伊朗戰事成萬斯與魯比奧“試金石”?

紅星新聞
2026-03-30 17:15:13
4月即將上市的7款重磅新車,最后一款大概率涼涼?

4月即將上市的7款重磅新車,最后一款大概率涼涼?

汽車天涯
2026-03-29 10:51:42
上海電影院現場被捉奸,帶情夫當老公面出軌,狗血女主角真容曝光

上海電影院現場被捉奸,帶情夫當老公面出軌,狗血女主角真容曝光

靜若梨花
2026-03-01 16:25:46
2026-03-30 21:04:49
AI前線 incentive-icons
AI前線
面向AI愛好者、開發者和科學家,提供AI領域技術資訊。
1399文章數 143關注度
往期回顧 全部

科技要聞

一句謊言引發的硅谷血案

頭條要聞

中國向能源緊缺的東南亞國家出口柴油等燃料 官方回應

頭條要聞

中國向能源緊缺的東南亞國家出口柴油等燃料 官方回應

體育要聞

想進世界杯,意大利還要過他這一關

娛樂要聞

單依純凌晨發長文道歉!李榮浩再回應

財經要聞

本輪地緣沖突,A股憑什么走出獨立行情

汽車要聞

限時12.58萬起 銀河星耀8遠航家系列上市

態度原創

手機
本地
游戲
房產
公開課

手機要聞

vivo推出Y500s手機:驍龍4 Gen 2,1799元起

本地新聞

用Color Walk的方式解鎖城市春日

四月PS新會免游戲爆料!類魂與二次元雙大作領銜

房產要聞

重磅!番禺20宗涉宅地亮相,萬博CBD宅地將上新!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版