337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

重磅!今年最好的開源9B/106B視覺模型,出現了

0
分享至

大家好,我是袋鼠帝。

我發現智譜今年下半年是真滴猛。

從7月份那個超強的10B視覺小模型GLM-4.1V-Thinking,再到后來的GLM-4.5V,以及10月編程、Agent領域的GLM-4.6,每一款都打在了我的心巴上。

本來以為到了年底,大家都在忙著做年終總結,沒什么新東西了。

沒想到,智譜反手又卷起來了..


剛剛,智譜開源了他們最強的視覺模型:GLM-4.6V

讓我興奮的是,這次一口氣開源了兩個尺寸:一個是106B的GLM-4.6V,另一個是9B的GLM-4.6V-Flash(消費級顯卡就能本地部署)。

在同參數量級下,多模態交互、邏輯推理、長上下文能力都取得了SOTA(State Of The Art,目前最強)。

太卷了,貌似現在不是SOTA都不好意思發布..


GLM-4.6V支持128k上下文窗口,可以一次性處理約150頁PDF、200頁PPT、近一小時的關鍵幀序列。

不僅支持多模態輸入,還可以多模態輸出(圖文并茂)

除了視覺能力強,還有工具調用能力,在z.ai集成了四種工具


一圖勝千言(來自朋友:@甲木,真好用)


體驗下來,我的感覺是:如果你想在本地玩視覺模型,這就是目前的版本答案。

9B的GLM-4.6V-Flash,意味著你不需要那種動輒幾十萬的專業GPU,哪怕是你家里的游戲本,或者是公司配的消費級顯卡,都能隨便跑起來。

整體表現超過Qwen3-VL-8B

這對于很多注重數據隱私,或者需要在邊緣設備上部署AI的企業來說,還是比較香的。

我前段時間去杭州給一家國企做培訓,參觀了他們的生產車間。在那兒,我看到了一個特別接地氣的AI落地場景

他們在產品流水線的末端,裝了個攝像頭和傳感器。

每當包裝好的紙箱傳送過來,攝像頭就會咔嚓拍一張,然后傳給旁邊的一臺普通電腦。電腦里跑著一個視覺模型,專門負責檢查這個紙箱有沒有破損,膠帶封沒封好。

大概是下面這種場景(網圖)


當時他們用的是阿里的一個小模型。我問了效果,負責人表示,雖然能用,但誤判率還是不低。一些好好的箱子,也被AI判成了破損,導致工人還得去復核,挺折騰的。

現在就可以換成GLM-4.6V-Flash試試。同參數量下的SOTA,意味著在同樣的硬件條件下,它的性能會更好,準確度也會提升。

106B的GLM-4.6V,說大不大,說小也不小。它不像DeepSeek R1那種671B的巨無霸,除了大廠,沒幾個企業能私有化部署得起。106B,屬于那種努努力,夠一夠,還是能玩得起的。

如果你對性能有要求,又必須把數據掌握在自己手里,那這個106B的版本,是一個現階段完美的平衡點。

上次我在成都遇到OneOneTalk的彭總,他就在用一臺2萬多的華碩本,本地跑了一個120B的開源模型:gpt?oss?120b

就是下面這臺性能猛獸


當然,如果你不在乎數據上云,直接調智譜的API,速度和體驗會更好。

目前GLM-4.6V可以在z.ai上使用,也能以MCP的形式接入Agent使用(做本地Agent的眼睛)

還能接入Claude Code當作基模使用。

比如我接入Claude Code之后,讓它執行了復雜的多平臺價格對比,條件篩選商品的任務。

完成得很好:

GLM-4.6V開源地址匯總,方便大家直達:

GitHub:

https://github.com/zai-org/GLM-V

Hugging Face:

https://huggingface.co/collections/zai-org/glm-46v

魔搭社區:

https://modelscope.cn/collections/GLM-46V-37fabc27818446

我也第一時間在z.ai上,測試了GLM-4.6V:

之前一直有個難題,就是在那種大合照里,識別出某個人的位置。我試過很多模型,甚至包括Gemini 3,效果都不咋地。


我明明在第一排,從左往右數的第三個。

我同樣把上次昆明Trae活動的大合照,加上一張我的自拍照,一起扔給了GLM-4.6V。


結果,GLM-4.6V居然準確的找到了我!這還讓我蠻驚訝的。

這對于以后做智能相冊管理,或者安防監控領域來說,太有用了。

z.ai里面還有一個Image Research功能,對我來說挺實用的。

我寫公眾號的時候,經常需要找各種配圖、或者封面圖。以前我都是去Google各種搜圖,有時候搜出來的圖很多都不是我想要的。

這次我讓它幫我搜幾張關于GEO(Generative Engine Optimization)生成式引擎優化的圖片。


它搜出來的圖,非常精準,質量高。

其中一張,正好就是我上一篇GEO的文章用到的封面圖。

以后我的封面圖工作流又要升級了(增加一個環節)。

用NanoBanana Pro生成創意圖的同時,用GLM-4.6V搜圖,最后我只負責選。

說到搜圖,這次的GLM-4.6V還能直接產出圖文并茂的文章

這得益于它的工具調用能力

比如我讓它生成北京旅游的推文

解讀GEO的PDF論文(論文PDF中的圖片也會被它插入到正確的位置)


上次不是寫了一篇飛書多維表格的教程嘛,在評論區看到,還是有一些朋友不清楚怎么調用的NanoBanana Pro API

我給大家演示一下, 你只需要把不懂的部分截圖,丟給GLM-4.6V,它就能幫你把散落在5張圖的API請求,按照想要的形式組裝起來了。



然后我還把一直貼著我車頭停車(可能只差0.5cm就碰到了)的紅車丟給了它..



有高手能評論區教一下怎么才能停成這樣嗎??我每次離別人車還有30cm就不敢繼續靠近了..

除了黑車品牌沒有猜對,其他都對了,挺強的。

上次車停在車位被剮蹭了,去調監控,花了幾個小時終于把逃逸者找到了..

我把最后的維修單丟給GLM-4.6V識別



經過我的逐字檢查,準確率非常高,大概是99.9%

它還能識別影帝的情緒~

渣渣輝封神片段:你知道我這五年怎么過的嗎?


劇情、情緒的變化都識別的相當nice。而且非常細節,角色濕潤的眼眶都識別到了。

除了在z.ai使用,GLM-4.6V還可以接入Claude Code

也可以把GLM-4.6V通過MCP的方式,接入Claude Code。

接入Claude Code,可以參考官方文檔:

https://docs.bigmodel.cn/cn/guide/develop/claude

或者直接修改Claude的settings.json配置文件:

}

配置好之后,重啟Claude,你就擁有了一個有手有眼的本地Agent啦~

既然有手有眼了,那就讓它干點實事兒。

我給這個本地Agent布置了一個較復雜的任務:使用playwright MCP,通過瀏覽器查找,進行產品的全網比價,提示詞如下:

Prompt:全程使用playwright MCP工具。先在淘寶上找一款半入耳式藍牙耳機,價格在500-1000元之間。找到銷量第一的那款。然后,拿著這款耳機的型號,去唯品會和京東比價,找到最便宜的那個平臺,并把它加到我的購物車里。

這個任務,涉及到了多平臺的網頁瀏覽、視覺識別(看價格、看型號)、邏輯判斷(比大小)和操作執行,對于現階段的所有視覺大模型來說,都是一個挑戰。

GLM-4.6V負責看網頁信息,Claude Code負責任務的調度。兩者配合,居然真的把這個復雜的流程給跑通了。

美中不足的是漏掉了篩選價格區間的操作,但其余的任務幾乎完美實現。

在淘寶找銷量第一的半入耳式藍牙耳機,以及跟唯品會、京東同款耳機比價,最后把價格最劃算的商品都加入了購物車



我覺得雖然GLM-4.6V可以寫代碼,但是它的代碼能力還是會比GLM-4.6差一些

所以我決定讓它在Claude Code里面做GLM-4.6的眼睛

也就是作為MCP-Server使用

claude mcp add -s user zai-mcp-server --env Z_AI_API_KEY=你的智譜apikey -- npx -y "@z_ai/mcp-server"

在settings.json里面把模型換回glm-4.6即可

既然有了眼睛,那復刻網頁就不用我費勁去描述了。

Prompt:使用zai-mcp-server分析當前目錄下的視頻,分析視頻中的網站的頁面、交互、動效,然后1:1復刻視頻中的網站

原網站效果

復刻后的效果

GLM-4.6V負責識別視頻,GLM-4.6負責生成高質量的前端代碼。

網頁復刻得還不錯,至少這個卡片飛來飛去的效果有了,整體交互和動效都有原視頻的影子。要想一次性百分百還原是很難的,畢竟原視頻的動效太棒了。

GLM-4.6V雖然在極致的視覺能力上,它可能還略遜于Gemini 3這種頂級模型。但別忘了,它只有106B。

對于想要私有化部署的企業來說,這是一個夠一夠就能得著的高性價比選項。

而對于個人開發者,9B的Flash版本夠我們在本地免費使用了。

不過,我心里也有個小疑問:為什么智譜不直接把視覺能力融合進GLM-4.6里,要分拆成兩個模型呢?有沒有懂的朋友在評論區給我科普一下?

我猜可能是為了更靈活的部署和更低的推理成本?

順便說一下,行業+AI,才能真正釋放AI的生產力。

懂業務的朋友,真的建議多學學怎么用好這些AI模型。

當你能把業務痛點和模型能力對接上的那一刻,效率的提升,絕對是指數級的。

補充:GLM-4.6和GLM-4.6V都在Coding Plan的使用范圍內

能看到這里的都是鳳毛麟角的存在!

如果覺得不錯,隨手點個贊、在看、轉發三連吧~

如果想第一時間收到推送,也可以給我個星標?

謝謝你耐心看完我的文章~

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
恒大集團許家印被抓捕全過程

恒大集團許家印被抓捕全過程

地產微資訊
2026-04-18 09:22:59
86版《西游記》風婆婆竟是15歲初中生

86版《西游記》風婆婆竟是15歲初中生

東方不敗然多多
2026-04-18 14:17:47
秦嵐首度公開父母過世,一個人辦追悼會不哭,和魏大勛不婚不育

秦嵐首度公開父母過世,一個人辦追悼會不哭,和魏大勛不婚不育

椰黃娛樂
2026-04-18 13:41:46
嚴打來了!5月1日起8類行為會入刑,退休老人要注意

嚴打來了!5月1日起8類行為會入刑,退休老人要注意

小談食刻美食
2026-04-18 09:44:44
任澤平退款730萬:價值4500萬的恒大花瓶

任澤平退款730萬:價值4500萬的恒大花瓶

超先聲
2026-04-17 16:34:01
呂焯毅絕殺!大連英博2-1河南隊,4連勝沖到第3,河南隊4輪不勝

呂焯毅絕殺!大連英博2-1河南隊,4連勝沖到第3,河南隊4輪不勝

中超偽球迷
2026-04-18 21:01:03
趙心童沒讓眾星徹底嘆服!希金斯:他可能達到小特高度但無法更高

趙心童沒讓眾星徹底嘆服!希金斯:他可能達到小特高度但無法更高

楊華評論
2026-04-18 18:39:32
特朗普又定下最后期限

特朗普又定下最后期限

大象新聞
2026-04-18 15:55:19
巴拿馬港口風波未平 美國為何又盯上錢凱港?

巴拿馬港口風波未平 美國為何又盯上錢凱港?

看看新聞Knews
2026-04-18 17:04:26
巴基斯坦1.3萬中械部隊正式進駐沙特,新時代開啟

巴基斯坦1.3萬中械部隊正式進駐沙特,新時代開啟

遠方青木
2026-04-18 00:46:29
揮淚斬馬謖!皇馬正式出售2.1億“頂星”!新主帥攜巨星空降加盟

揮淚斬馬謖!皇馬正式出售2.1億“頂星”!新主帥攜巨星空降加盟

頭狼追球
2026-04-18 17:53:28
申花夢幻開局!拉唐閃電破門,3場連入4球,6球領跑射手榜

申花夢幻開局!拉唐閃電破門,3場連入4球,6球領跑射手榜

奧拜爾
2026-04-18 20:14:20
普京時代進入倒計時,中國必須警惕俄羅斯政策突變

普京時代進入倒計時,中國必須警惕俄羅斯政策突變

阿七說史
2026-04-18 15:47:09
16年生3娃不是親生,丈夫不養了,妻子:他太看重血緣,畜生不如

16年生3娃不是親生,丈夫不養了,妻子:他太看重血緣,畜生不如

哄動一時啊
2026-04-15 22:07:49
血脂高不高,看頭就知道,血脂高的人會有這3個表現,看看有沒有

血脂高不高,看頭就知道,血脂高的人會有這3個表現,看看有沒有

芹姐說生活
2026-04-18 15:44:42
只差0.071 秒!張雪機車WSBK荷蘭站憾失超級桿位賽榜首 張雪回應53號車手末圈發力原因

只差0.071 秒!張雪機車WSBK荷蘭站憾失超級桿位賽榜首 張雪回應53號車手末圈發力原因

快科技
2026-04-18 17:59:16
拉夫羅夫剛回國,普京在莫斯科會上罕見發火!特朗普意外送上助攻

拉夫羅夫剛回國,普京在莫斯科會上罕見發火!特朗普意外送上助攻

書紀文譚
2026-04-17 18:16:26
舊書論斤賣,深圳“9元1斤”書店火了!有人一次性買走1噸,小朋友淘到心愛圖書開心到轉圈

舊書論斤賣,深圳“9元1斤”書店火了!有人一次性買走1噸,小朋友淘到心愛圖書開心到轉圈

封面新聞
2026-04-18 00:18:05
殲-10升空!防以色列襲擊,巴基斯坦出動20多架飛機護送伊朗談判代表

殲-10升空!防以色列襲擊,巴基斯坦出動20多架飛機護送伊朗談判代表

中新經緯
2026-04-18 14:28:23
王健林,被逼到崩潰邊緣...

王健林,被逼到崩潰邊緣...

鳴金網
2026-04-16 19:42:33
2026-04-18 21:35:00
袋鼠帝 incentive-icons
袋鼠帝
持續分享AI實踐干貨,走超級個體崛起之路
71文章數 71關注度
往期回顧 全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

女子經介紹加入平臺搶紅包結果40萬沒了 報警未獲受理

頭條要聞

女子經介紹加入平臺搶紅包結果40萬沒了 報警未獲受理

體育要聞

時隔25年重返英超!沒有人再嘲笑他了

娛樂要聞

《穿普拉達的女王2》疑似辱華?

財經要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價14.48萬元起

態度原創

教育
藝術
家居
公開課
軍事航空

教育要聞

兵團二中:科學、高效的育人體系:"1+X"多層階 | 新時代教育書摘

藝術要聞

耗資600億,貴陽人的“上海外灘”,現在去看,荒得嚇人

家居要聞

法式線條 時光靜淌

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

解放軍護衛艦與外艦纏斗20小時 細節披露

無障礙瀏覽 進入關懷版