網易首頁 > 網易號 > 正文申請入駐

重磅！今年最好的開源9B/106B視覺模型，出現了

2025-12-08 21:36:54　來源: 袋鼠帝

云南舉報

分享至

大家好，我是袋鼠帝。

我發現智譜今年下半年是真滴猛。

從7月份那個超強的10B視覺小模型GLM-4.1V-Thinking，再到后來的GLM-4.5V，以及10月編程、Agent領域的GLM-4.6，每一款都打在了我的心巴上。

本來以為到了年底，大家都在忙著做年終總結，沒什么新東西了。

沒想到，智譜反手又卷起來了..

剛剛，智譜開源了他們最強的視覺模型：GLM-4.6V

讓我興奮的是，這次一口氣開源了兩個尺寸：一個是106B的GLM-4.6V，另一個是9B的GLM-4.6V-Flash（消費級顯卡就能本地部署）。

在同參數量級下，多模態交互、邏輯推理、長上下文能力都取得了SOTA（State Of The Art，目前最強）。

太卷了，貌似現在不是SOTA都不好意思發布..

GLM-4.6V支持128k上下文窗口，可以一次性處理約150頁PDF、200頁PPT、近一小時的關鍵幀序列。

不僅支持多模態輸入，還可以多模態輸出（圖文并茂）

除了視覺能力強，還有工具調用能力，在z.ai集成了四種工具

一圖勝千言（來自朋友：@甲木，真好用）

體驗下來，我的感覺是：如果你想在本地玩視覺模型，這就是目前的版本答案。

9B的GLM-4.6V-Flash，意味著你不需要那種動輒幾十萬的專業GPU，哪怕是你家里的游戲本，或者是公司配的消費級顯卡，都能隨便跑起來。

整體表現超過Qwen3-VL-8B

這對于很多注重數據隱私，或者需要在邊緣設備上部署AI的企業來說，還是比較香的。

我前段時間去杭州給一家國企做培訓，參觀了他們的生產車間。在那兒，我看到了一個特別接地氣的AI落地場景：

他們在產品流水線的末端，裝了個攝像頭和傳感器。

每當包裝好的紙箱傳送過來，攝像頭就會咔嚓拍一張，然后傳給旁邊的一臺普通電腦。電腦里跑著一個視覺模型，專門負責檢查這個紙箱有沒有破損，膠帶封沒封好。

大概是下面這種場景（網圖）

當時他們用的是阿里的一個小模型。我問了效果，負責人表示，雖然能用，但誤判率還是不低。一些好好的箱子，也被AI判成了破損，導致工人還得去復核，挺折騰的。

現在就可以換成GLM-4.6V-Flash試試。同參數量下的SOTA，意味著在同樣的硬件條件下，它的性能會更好，準確度也會提升。

106B的GLM-4.6V，說大不大，說小也不小。它不像DeepSeek R1那種671B的巨無霸，除了大廠，沒幾個企業能私有化部署得起。106B，屬于那種努努力，夠一夠，還是能玩得起的。

如果你對性能有要求，又必須把數據掌握在自己手里，那這個106B的版本，是一個現階段完美的平衡點。

上次我在成都遇到OneOneTalk的彭總，他就在用一臺2萬多的華碩本，本地跑了一個120B的開源模型：gpt?oss?120b

就是下面這臺性能猛獸

當然，如果你不在乎數據上云，直接調智譜的API，速度和體驗會更好。

目前GLM-4.6V可以在z.ai上使用，也能以MCP的形式接入Agent使用（做本地Agent的眼睛）

還能接入Claude Code當作基模使用。

比如我接入Claude Code之后，讓它執行了復雜的多平臺價格對比，條件篩選商品的任務。

完成得很好：

GLM-4.6V開源地址匯總，方便大家直達：

GitHub：

https://github.com/zai-org/GLM-V

Hugging Face：

https://huggingface.co/collections/zai-org/glm-46v

魔搭社區：

https://modelscope.cn/collections/GLM-46V-37fabc27818446

我也第一時間在z.ai上，測試了GLM-4.6V：

之前一直有個難題，就是在那種大合照里，識別出某個人的位置。我試過很多模型，甚至包括Gemini 3，效果都不咋地。

我明明在第一排，從左往右數的第三個。

我同樣把上次昆明Trae活動的大合照，加上一張我的自拍照，一起扔給了GLM-4.6V。

結果，GLM-4.6V居然準確的找到了我！這還讓我蠻驚訝的。

這對于以后做智能相冊管理，或者安防監控領域來說，太有用了。

z.ai里面還有一個Image Research功能，對我來說挺實用的。

我寫公眾號的時候，經常需要找各種配圖、或者封面圖。以前我都是去Google各種搜圖，有時候搜出來的圖很多都不是我想要的。

這次我讓它幫我搜幾張關于GEO（Generative Engine Optimization）生成式引擎優化的圖片。

它搜出來的圖，非常精準，質量高。

其中一張，正好就是我上一篇GEO的文章用到的封面圖。

以后我的封面圖工作流又要升級了（增加一個環節）。

用NanoBanana Pro生成創意圖的同時，用GLM-4.6V搜圖，最后我只負責選。

說到搜圖，這次的GLM-4.6V還能直接產出圖文并茂的文章

這得益于它的工具調用能力

比如我讓它生成北京旅游的推文

解讀GEO的PDF論文（論文PDF中的圖片也會被它插入到正確的位置）

上次不是寫了一篇飛書多維表格的教程嘛，在評論區看到，還是有一些朋友不清楚怎么調用的NanoBanana Pro API

我給大家演示一下，你只需要把不懂的部分截圖，丟給GLM-4.6V，它就能幫你把散落在5張圖的API請求，按照想要的形式組裝起來了。

然后我還把一直貼著我車頭停車（可能只差0.5cm就碰到了）的紅車丟給了它..

有高手能評論區教一下怎么才能停成這樣嗎？？我每次離別人車還有30cm就不敢繼續靠近了..

除了黑車品牌沒有猜對，其他都對了，挺強的。

上次車停在車位被剮蹭了，去調監控，花了幾個小時終于把逃逸者找到了..

我把最后的維修單丟給GLM-4.6V識別

經過我的逐字檢查，準確率非常高，大概是99.9%

它還能識別影帝的情緒～

渣渣輝封神片段：你知道我這五年怎么過的嗎？

劇情、情緒的變化都識別的相當nice。而且非常細節，角色濕潤的眼眶都識別到了。

除了在z.ai使用，GLM-4.6V還可以接入Claude Code

也可以把GLM-4.6V通過MCP的方式，接入Claude Code。

接入Claude Code，可以參考官方文檔：

https://docs.bigmodel.cn/cn/guide/develop/claude

或者直接修改Claude的settings.json配置文件：

配置好之后，重啟Claude，你就擁有了一個有手有眼的本地Agent啦～

既然有手有眼了，那就讓它干點實事兒。

我給這個本地Agent布置了一個較復雜的任務：使用playwright MCP，通過瀏覽器查找，進行產品的全網比價，提示詞如下：

Prompt：全程使用playwright MCP工具。先在淘寶上找一款半入耳式藍牙耳機，價格在500-1000元之間。找到銷量第一的那款。然后，拿著這款耳機的型號，去唯品會和京東比價，找到最便宜的那個平臺，并把它加到我的購物車里。

這個任務，涉及到了多平臺的網頁瀏覽、視覺識別（看價格、看型號）、邏輯判斷（比大小）和操作執行，對于現階段的所有視覺大模型來說，都是一個挑戰。

GLM-4.6V負責看網頁信息，Claude Code負責任務的調度。兩者配合，居然真的把這個復雜的流程給跑通了。

美中不足的是漏掉了篩選價格區間的操作，但其余的任務幾乎完美實現。

在淘寶找銷量第一的半入耳式藍牙耳機，以及跟唯品會、京東同款耳機比價，最后把價格最劃算的商品都加入了購物車

我覺得雖然GLM-4.6V可以寫代碼，但是它的代碼能力還是會比GLM-4.6差一些

所以我決定讓它在Claude Code里面做GLM-4.6的眼睛

也就是作為MCP-Server使用

claude mcp add -s user zai-mcp-server --env Z_AI_API_KEY=你的智譜apikey -- npx -y "@z_ai/mcp-server"

在settings.json里面把模型換回glm-4.6即可

既然有了眼睛，那復刻網頁就不用我費勁去描述了。

Prompt：使用zai-mcp-server分析當前目錄下的視頻，分析視頻中的網站的頁面、交互、動效，然后1:1復刻視頻中的網站

原網站效果

復刻后的效果

GLM-4.6V負責識別視頻，GLM-4.6負責生成高質量的前端代碼。

網頁復刻得還不錯，至少這個卡片飛來飛去的效果有了，整體交互和動效都有原視頻的影子。要想一次性百分百還原是很難的，畢竟原視頻的動效太棒了。

GLM-4.6V雖然在極致的視覺能力上，它可能還略遜于Gemini 3這種頂級模型。但別忘了，它只有106B。

對于想要私有化部署的企業來說，這是一個夠一夠就能得著的高性價比選項。

而對于個人開發者，9B的Flash版本夠我們在本地免費使用了。

不過，我心里也有個小疑問：為什么智譜不直接把視覺能力融合進GLM-4.6里，要分拆成兩個模型呢？有沒有懂的朋友在評論區給我科普一下？

我猜可能是為了更靈活的部署和更低的推理成本？

順便說一下，行業+AI，才能真正釋放AI的生產力。

懂業務的朋友，真的建議多學學怎么用好這些AI模型。

當你能把業務痛點和模型能力對接上的那一刻，效率的提升，絕對是指數級的。

補充：GLM-4.6和GLM-4.6V都在Coding Plan的使用范圍內

能看到這里的都是鳳毛麟角的存在！

如果覺得不錯，隨手點個贊、在看、轉發三連吧~

如果想第一時間收到推送，也可以給我個星標?

謝謝你耐心看完我的文章~

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

成本0.3美元，耗時26分鐘！CudaForge：顛覆性低成本CUDA優化框架

機器之心Pro 2025-11-17 18:45:03
0 跟貼 0
三層防御仍然不夠，一條PR標題就能偷走你的API密鑰：AI Agent安全裂痕再現

鈦媒體APP 2026-04-18 10:44:12
0 跟貼 0

推理新范式：動態效能算法讓算力資源實現最大化

智東西 2025-11-12 19:58:10
0 跟貼 0

OpenAI徹底重構Codex！長出獨立鼠標，自己排班狂卷打工人

新智元 2026-04-17 14:43:06
1 跟貼 1
編程智能體的隱藏bug，被上交IPADS團隊用數學邏輯給揪出來了

DeepTech深科技 2026-04-18 11:18:39
0 跟貼 0

Claude Opus 4.7深夜上線，評分碾壓

機器之心Pro 2026-04-17 10:08:00
2 跟貼 2

從越用越便宜到越用越貴，誰在為AI的“算力饑渴”買單？

鈦媒體APP 2026-04-17 13:32:25
0 跟貼 0
大模型最難的AI Infra，用Vibe Coding搞定

機器之心Pro 2026-01-07 15:33:06
0 跟貼 0

單任務狂飆16小時！模型+Harness雙輪驅動，金融Agent跑通了

新智元 2026-04-17 21:12:05
3 跟貼 3
讓兩個大模型在線吵架，跑通全網95%科研代碼｜深勢Deploy-Master

機器之心Pro 2026-01-09 14:22:47
0 跟貼 0
XYZ曲線丈量萬億市場：智元給具身智能的演進定了新路徑

雷科技 2026-04-17 21:34:55
10 跟貼 10
B站爆了！Hermes首度直播回應「抄襲」，MiniMax提前殺入Harness賽點

新智元 2026-04-18 18:17:20
0 跟貼 0
黑色的鐵網消失并不是不在，而是視覺錯覺

淺夢看世界 2026-04-16 12:49:09
1 跟貼 1
奧特曼預言與現實相差幾何？12個頂級模型“創業”一年，僅3個存活

鈦媒體APP 2026-04-03 17:11:08
1 跟貼 1
π0.7的泛化能力有多強？零樣本純靠口述就能用空氣炸鍋

DeepTech深科技 2026-04-17 21:34:56
0 跟貼 0
當老板與員工展開“蒸餾”對抗

經濟觀察報 2026-04-18 17:48:45
2 跟貼 2
龍蝦之戰進入深水區，產品完成度是下一個賽點

鈦媒體APP 2026-04-18 08:48:14
0 跟貼 0
上百皮筋遇高溫，悉數燙斷成碎段，視覺解壓超過癮

蛋蛋說笑 2026-04-17 16:22:44
3 跟貼 3
不卷AlphaFold，OpenAI首個生命科學模型殺出，單項超越95%專家

新智元 2026-04-18 15:33:16
5 跟貼 5
解放軍護衛艦與外艦纏斗20小時細節披露

上觀新聞 2026-04-18 12:26:59
9150 跟貼 9150
飛機引擎改造成迷你小屋

小耳朵愛搞笑 2026-04-14 15:16:25
1 跟貼 1
獨家專訪元戎啟行周光：一場關于信任、偏見與未來定義的對話

汽車公社 2026-04-17 20:32:29
0 跟貼 0
視覺模型既懂語義，又能還原細節，南洋理工&商湯提出棱鏡假說

機器之心Pro 2026-01-13 18:26:48
0 跟貼 0
川崎 H2R模型摩托

制造科技 2026-04-16 21:58:46
12 跟貼 12
日本游客暴漲中國游客暴跌！背后三大邏輯

春天來了啊 2026-04-18 09:06:26
0 跟貼 0
大S心聲揭秘：邏輯清晰背后的真實訴求

千山暮雪h 2026-04-18 00:59:01
4 跟貼 4
高清現場實拍，機務人員鉆進轟6K引擎檢查，這操作太硬核了！

阿酞侃生活 2026-04-17 15:14:56
0 跟貼 0
長安汽車獲得發明專利授權：“車輛的多模態融合感知方法、裝置、車輛及存儲介質”

證券之星 2026-04-18 03:27:39
0 跟貼 0
揭秘年銷10億的爆款宋柚汁：“宋柚”是商標，柚含量不到3%，主配料為糖水，品牌號稱全國銷量第一

藍鯨新聞 2026-04-15 09:44:24
3789 跟貼 3789
一夜之間，打工人都被“煉化”了？

悲了傷的白犀牛 2026-04-17 17:01:32
0 跟貼 0
東莞理工學院一學生因在學生社區送外賣被點名通報批評，校方回應

齊魯壹點 2026-04-17 22:11:29
1034 跟貼 1034
微軟是如何穿越30年周期的

鈦媒體APP 2026-04-18 20:29:35
0 跟貼 0
智元機器人，要做AI大模型平臺和開放生態

36氪 2026-04-18 10:05:08
1 跟貼 1
具身智能缺數據？覓蜂科技發布MEgo：無本體采集，隨走隨采

雷科技 2026-04-18 19:44:51
0 跟貼 0
倫理防線不可靠！分布偏移誘導，大模型進入暗黑模式

新智元 2026-04-18 18:17:38
0 跟貼 0
男子爬上泰山“五岳獨尊”石刻拍照，景區：將核查其身份進行處理

揚子晚報 2026-04-17 12:09:40
1410 跟貼 1410
中甲｜李瑋鋒首次替補席指揮寧波隊比賽被罰出場

北青網-北京青年報 2026-04-18 18:58:10
5 跟貼 5
首個沖線未必奪冠、四成選手扔掉遙控??2026人形機器人半馬賽前必看盤點！

每日經濟新聞 2026-04-18 19:34:13
0 跟貼 0
挖掘機突然挖不動？不是引擎差，是這里壞了

科學大搜索 2026-04-14 17:02:04
1 跟貼 1
π0.7發布，機器人迎來GPT-2時刻

智東西 2026-04-18 17:19:27
0 跟貼 0

恒大集團許家印被抓捕全過程

地產微資訊

2026-04-18 09:22:59

86版《西游記》風婆婆竟是15歲初中生

東方不敗然多多

2026-04-18 14:17:47

秦嵐首度公開父母過世，一個人辦追悼會不哭，和魏大勛不婚不育

椰黃娛樂

2026-04-18 13:41:46

嚴打來了！5月1日起8類行為會入刑，退休老人要注意

小談食刻美食

2026-04-18 09:44:44

任澤平退款730萬：價值4500萬的恒大花瓶

超先聲

2026-04-17 16:34:01

呂焯毅絕殺！大連英博2-1河南隊，4連勝沖到第3，河南隊4輪不勝

中超偽球迷

2026-04-18 21:01:03

趙心童沒讓眾星徹底嘆服！希金斯：他可能達到小特高度但無法更高

楊華評論

2026-04-18 18:39:32

特朗普又定下最后期限

大象新聞

2026-04-18 15:55:19

巴拿馬港口風波未平美國為何又盯上錢凱港？

看看新聞Knews

2026-04-18 17:04:26

巴基斯坦1.3萬中械部隊正式進駐沙特，新時代開啟

遠方青木

2026-04-18 00:46:29

揮淚斬馬謖！皇馬正式出售2.1億“頂星”！新主帥攜巨星空降加盟

頭狼追球

2026-04-18 17:53:28

申花夢幻開局！拉唐閃電破門，3場連入4球，6球領跑射手榜

奧拜爾

2026-04-18 20:14:20

普京時代進入倒計時，中國必須警惕俄羅斯政策突變

阿七說史

2026-04-18 15:47:09

16年生3娃不是親生，丈夫不養了，妻子：他太看重血緣，畜生不如

哄動一時啊

2026-04-15 22:07:49

血脂高不高，看頭就知道，血脂高的人會有這3個表現，看看有沒有

芹姐說生活

2026-04-18 15:44:42

只差0.071 秒！張雪機車WSBK荷蘭站憾失超級桿位賽榜首張雪回應53號車手末圈發力原因

快科技

2026-04-18 17:59:16

拉夫羅夫剛回國，普京在莫斯科會上罕見發火！特朗普意外送上助攻

書紀文譚

2026-04-17 18:16:26

舊書論斤賣，深圳“9元1斤”書店火了！有人一次性買走1噸，小朋友淘到心愛圖書開心到轉圈

封面新聞

2026-04-18 00:18:05

殲-10升空！防以色列襲擊，巴基斯坦出動20多架飛機護送伊朗談判代表

中新經緯

2026-04-18 14:28:23

王健林，被逼到崩潰邊緣...

鳴金網

2026-04-16 19:42:33

袋鼠帝

持續分享AI實踐干貨，走超級個體崛起之路

71文章數 71關注度

往期回顧全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

女子經介紹加入平臺搶紅包結果40萬沒了報警未獲受理

頭條要聞

女子經介紹加入平臺搶紅包結果40萬沒了報警未獲受理

體育要聞

時隔25年重返英超！沒有人再嘲笑他了

娛樂要聞

《穿普拉達的女王2》疑似辱華?

財經要聞

"影子萬科"2.0：管理層如何吸血萬物云？

汽車要聞

奇瑞威麟R08 PRO正式上市售價14.48萬元起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

藝術

家居

公開課

軍事航空

教育要聞

兵團二中：科學、高效的育人體系："1+X"多層階 | 新時代教育書摘

藝術要聞

耗資600億，貴陽人的“上海外灘”，現在去看，荒得嚇人

家居要聞

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

重磅！今年最好的開源9B/106B視覺模型，出現了

傳Meta下月擬裁8000 大舉清退人力為AI騰位

女子經介紹加入平臺搶紅包結果40萬沒了 報警未獲受理

女子經介紹加入平臺搶紅包結果40萬沒了 報警未獲受理

時隔25年重返英超！沒有人再嘲笑他了

《穿普拉達的女王2》疑似辱華?

"影子萬科"2.0：管理層如何吸血萬物云？

奇瑞威麟R08 PRO正式上市 售價14.48萬元起

態度原創

兵團二中：科學、高效的育人體系："1+X"多層階 | 新時代教育書摘

耗資600億，貴陽人的“上海外灘”，現在去看，荒得嚇人

法式線條 時光靜淌

解放軍護衛艦與外艦纏斗20小時 細節披露

女子經介紹加入平臺搶紅包結果40萬沒了報警未獲受理

女子經介紹加入平臺搶紅包結果40萬沒了報警未獲受理

奇瑞威麟R08 PRO正式上市售價14.48萬元起

法式線條時光靜淌

解放軍護衛艦與外艦纏斗20小時細節披露