網易首頁 > 網易號 > 正文申請入駐

ollama v0.20.0 更新：Gemma 4 全家桶發布，音頻、視覺、MoE、BPE 支持全面升級

2026-04-04 00:11:44　來源: moonfdd

北京舉報

分享至

2026年4月3日，ollama 發布了v0.20.0版本。
這次更新的核心非常明確：Gemma 4 正式加入支持，并且圍繞模型推理、音頻能力、Tokenizer、視覺測試、轉換器、OpenAI 音頻接口等多個方向進行了集中增強。

如果你關注本次更新，可以直接從兩個關鍵詞理解：

?Gemma 4
?音頻與推理能力升級

下面按照本次版本更新內容，逐項整理成一篇完整的技術更新說明。

一、Gemma 4 正式加入支持

本次 v0.20.0 最重要的變化，就是Gemma 4相關支持的加入。
更新中給出了多個可直接運行的模型規格：

1）Effective 2B（E2B）

運行命令：

ollama run gemma4:e2b

這是 Gemma 4 的有效 2B 版本，適合輕量場景使用。

2）Effective 4B（E4B）

運行命令：

ollama run gemma4:e4b

這是 Gemma 4 的有效 4B 版本，在能力和資源消耗之間做了更平衡的選擇。

3）26B（Mixture of Experts model with 4B active parameters）

運行命令：

ollama run gemma4:26b

這是一個MoE（Mixture of Experts）模型，描述中說明其4B active parameters。

4）31B（Dense）

運行命令：

ollama run gemma4:31b

這是 Gemma 4 的31B Dense版本，屬于更大規模的稠密模型。

從這次發布的信息來看，Gemma 4 已經形成了較完整的規格覆蓋，從輕量到大模型都提供了支持方式，用戶可以按資源和場景選擇對應版本。

二、What's Changed：本次更新涉及的關鍵內容

本次版本的更新記錄非常集中，主要圍繞 Gemma 4、音頻、Tokenizer、文檔、推理與測試展開。下面逐條梳理。

三、文檔更新

首先是文檔相關更新：

?docs: update pi docs

這說明本次版本中對 pi 相關文檔進行了更新。
雖然內容本身不多，但說明文檔層面同步跟進了新版本變化，方便用戶查閱和使用。

四、Tokenizer 增強：支持 SentencePiece-style BPE

本次更新中有一個非常關鍵的底層能力變化：

?tokenizer: add SentencePiece-style BPE support

這表示 Tokenizer 新增了SentencePiece 風格的 BPE 支持。
這一變化對于模型適配和分詞處理非常重要，尤其是在處理不同模型格式與分詞規則時，可以提升兼容性。

與此同時，后續也有與 tokenizer 相關的配套修復：

?mlx: respect tokenizer add_bos_token setting in pipeline

這個改動說明在 pipeline 中會尊重 tokenizer 的add_bos_token設置。
換句話說，Tokenizer 的行為會更貼合配置，避免在處理輸入時出現不一致情況。

五、Gemma 4 的模型支持與轉換器更新 1）Gemma 4 GGML 模型支持

更新中明確寫到：

?gemma4: add Gemma 4 GGML model support

這表示 Gemma 4 的 GGML 模型支持已經加入。

2）轉換器更新：適配新的 weight drop 命名

?gemma4: update converter for new weight drop naming

這說明 Gemma 4 相關轉換器已經根據新的 weight drop 命名進行了更新。
這是模型轉換流程中非常關鍵的一環，確保新版本模型文件命名和導入過程能夠順利對接。

六、音頻能力大幅增強

這次 v0.20.0 在音頻方向的變化非常密集，可以說是重點之一。

1）添加音頻支持，使用 USM conformer encoder

更新內容：

?gemma4: add audio support with USM conformer encoder

這表明 Gemma 4 新增了音頻支持，并且使用的是USM conformer encoder。

2）OpenAI 音頻 API 支持與能力檢測

更新內容：

?gemma4: add OpenAI audio API support and capability detection

這說明本次版本已經加入了OpenAI 音頻 API 支持，并且還包含capability detection，也就是能力檢測機制。

3）音頻輸入支持

更新內容：

?gemma4: add audio input support for run command

這意味著在 run 命令中已經支持音頻輸入。

4）新增轉寫命令

更新內容：

?gemma4: add transcribe command (ollama transcribe MODEL)

這次新增了一個轉寫命令：

ollama transcribe MODEL

這對于音頻轉文字場景非常直接，命令形式也很清晰。

5）增加 OpenAI 音頻轉寫 API 和 input_audio 支持

更新內容：

?gemma4: add OpenAI audio transcription API and input_audio support

這進一步完善了音頻能力，不僅是輸入和轉寫，還補充了與 OpenAI 音頻轉寫 API 相關的支持，以及 input_audio 能力。

6）音頻輸入改為 dropped file attachments

更新內容：

?cmd: simplify audio input to dropped file attachments

這說明音頻輸入在命令層面被簡化為dropped file attachments，使用方式更直接。

從這一組更新可以看出，v0.20.0 在音頻方向完成了從輸入、轉寫、API 到命令行體驗的一整套補強。

七、Gemma 4 解析、渲染與集成測試支持

本次更新還有一組圍繞 Gemma 4 的基礎設施改進：

?gemma4: add parser, renderer, and integration test plumbing

這說明已經加入了parser、renderer、integration test plumbing。
也就是說，Gemma 4 在解析、渲染以及集成測試方面的配套設施已經補上。

1）渲染器修復：輸出 BOS token

?gemma4: fix renderer to emit BOS token

這是一個非常具體的修復，說明 renderer 現在會正確輸出BOS token。

2）渲染器重寫：與 HF Jinja2 模板完全一致

?gemma4: rewrite renderer to match HF Jinja2 template exactly

這說明渲染器被重寫，以確保與 HF Jinja2 模板保持完全一致。

這個變化通常意味著模型輸入模板的行為會更加標準化，減少模板差異帶來的結果偏差。

八、MoE 相關增強與修復

Gemma 4 的 26B 版本是 MoE 模型，因此 MoE 相關改動非常關鍵。

1）為 MoE router 增加 per_expert_scale，并修復 moe_intermediate 問題

更新內容：

?gemma4: add per_expert_scale to MoE router and fix moe_intermediate_s…

雖然后半部分在記錄中被截斷，但已經明確看到兩個重點：

? 為 MoE router 增加per_expert_scale
? 修復moe_intermediate_s...相關問題

2）修復 MoE fused gate_up split 和 multiline tool-call arg parsing

更新內容：

?gemma4: fix MoE fused gate_up split and multiline tool-call arg parsing

這說明本次對 MoE 的 fused gate_up split 做了修復，同時還修復了multiline tool-call arg parsing。

3）MoE block 字段對齊格式調整

更新內容：

?Format Gemma4 MoE block field alignment

這是一個格式層面的整理，說明 Gemma4 MoE block 的字段對齊做了統一和規范化。

從這些信息可以看出，Gemma 4 的 MoE 版本在結構、解析、格式與計算路徑方面都做了較完整的修復和優化。

九、視覺測試與 thinking 測試增強

更新中還有測試相關增強：

?integration: improve vision test robustness and add thinking tests

這表示集成測試進一步增強了視覺測試的穩定性，同時新增了 thinking tests。
從結果上看，這類更新主要是為了提升整體驗證能力，讓新版本在視覺相關場景和推理相關場景下更加可靠。

十、Gemma 4 音頻測試與 OpenAI API 覆蓋

音頻相關不僅有能力支持，也同步加入了測試覆蓋：

?integration: add gemma4 audio tests including OpenAI API coverage

這說明本次版本已經加入了 Gemma 4 音頻測試，并且包括 OpenAI API 的覆蓋。
這和前面音頻能力的增強是相互呼應的，說明該版本并不是只做了功能接入，也同步補齊了對應驗證。

十一、Gemma 4 視覺模型注釋與字段格式調整

更新記錄中還有一些針對模型結構和代碼可讀性的整理：

?Remove redundant comments in gemma4 vision model
?Format Gemma4 MoE block field alignment

前者表示移除了 Gemma 4 視覺模型中的冗余注釋。
后者則對 Gemma4 MoE block 的字段對齊格式進行了調整。

這類更新雖然看起來偏細節，但對于代碼維護、結構統一和后續協作非常重要。

十二、內存緩存與推理緩存優化

本次更新里還有一項和緩存相關的改動：

?use 4096 kvcache.NewSWAMemCache
?gemma4: use full SWA memory for better cache reuse

這說明緩存機制做了調整：

? 使用了4096 kvcache.NewSWAMemCache
? 同時使用full SWA memory來獲得更好的 cache reuse

這類優化通常和推理效率、上下文緩存復用體驗有關，是底層能力增強的一部分。

十三、Gemma 4 clamps 初始化與后端加載修復

更新記錄中還有：

?gemma4: initialize clamps after backend load

這表示 clamps 的初始化時機調整到了 backend load 之后。
從描述來看，這是一個初始化順序上的修復，用于保證加載流程更穩定。

十四、Gemma 4 GGML 改進合并

更新記錄最后還有一個重要的合并信息：

?Merge pull request from gemma4-ggml-improvements

這說明本次版本把 Gemma 4 的 GGML 改進進行了合并，和前面提到的 GGML model support、converter 更新等內容形成閉環。

十五、本次 v0.20.0 更新總結

整體來看，ollama v0.20.0 這次更新可以概括為幾個核心方向：

1.Gemma 4 正式上線

? 提供了 E2B、E4B、26B、31B 多種規格
? 支持 GGML 模型

2.音頻能力全面增強

? 支持音頻輸入
? 新增轉寫命令
? 增加 OpenAI 音頻 API 與 transcription API 支持
? 支持 input_audio
? 簡化音頻輸入方式

3.Tokenizer 和模板能力增強

? 增加 SentencePiece-style BPE 支持
? pipeline 尊重 add_bos_token
? renderer 重寫并修復 BOS token 輸出

4.MoE 與推理路徑優化

? 增加 per_expert_scale
? 修復 MoE 相關問題
? 調整字段格式和分裂邏輯
? 改進緩存復用

5.測試與工程能力增強

? 視覺測試穩定性提升
? 新增 thinking tests
? 補充 Gemma 4 音頻測試與 OpenAI API 覆蓋

我們相信人工智能為普通人提供了一種“增強工具”，并致力于分享全方位的AI知識。在這里，您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業洞察。歡迎關注“福大大架構師每日一題”，發消息可獲得面試資料，讓AI助力您的未來發展。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

干貨！讓Claude Cowork真好用的17個神操作

智東西 2026-04-08 23:05:26
0 跟貼 0
微信文件一鍵總結？騰訊元寶大更新：這功能太贊了

雷科技 2026-04-08 19:05:32
0 跟貼 0

大六座SUV新選手：全系標配華為智能全家桶，華境S開啟盲訂

車快評 2026-04-07 23:11:35
2 跟貼 2

又是華為全家桶，華境S定價決定生死

汽車鵬友 2026-04-08 16:47:30
4 跟貼 4
華為全家桶標配！華境S這么能“裝”？

功夫AUTO 2026-04-07 21:50:00
0 跟貼 0

霍爾木茲海峽已再次關閉

央視新聞客戶端 2026-04-09 05:32:07
19990 跟貼 19990

新阿維塔12上市，29.39萬起配華為全家桶

潮畔汽車 2026-04-09 09:45:19
0 跟貼 0
電鉆頭燙孔織帶拆卸接口

鬧鐘電影 2026-04-08 14:57:32
1 跟貼 1

神秘“歡樂馬”空降屠榜，碾壓Seedance 2.0，視頻AI又變天了？

華爾街見聞官方 2026-04-08 20:23:49
3 跟貼 3
大6座還標配華為全家桶，華境S是否值得推薦？

冀老師選車 2026-04-08 09:52:50
3 跟貼 3
緊急情況！上海虹橋、浦東機場，接連有旅客被攔截！警察一句話，小伙當場嚇懵：這一去，就回不來了

上觀新聞 2026-04-08 14:19:19
542 跟貼 542
中俄聯手折斷美國黑手！安理會現場罵戰升級，美國真的要認輸嗎？

老颯觀世界 2026-04-08 17:29:47
0 跟貼 0
將同事「封裝」「煉化」，Skill到底在干什么？

豹變 2026-04-09 08:51:46
0 跟貼 0
中俄投下反對票！傅聰：不給使用武力開通行證

看看新聞Knews 2026-04-08 16:59:04
16797 跟貼 16797
“祖先給的特權”，河南網友稱祖墳在景區祭祖免票，景區回應：沒過檢票口，一般是附近住戶的祖墳

大風新聞 2026-04-06 15:06:12
2008 跟貼 2008
毛新宇攜家人到楊開慧烈士陵園祭掃

政知新媒體 2026-04-05 08:48:13
2612 跟貼 2612
趁著辦公室沒有人，女子竟做出這舉動，打印的什么機密文件

甜心萌物醬i 2026-04-05 14:06:32
0 跟貼 0
風箏-交通員叛變，竟帶著機密文件投誠，看鄭耀先如何應對

龍耀影視 2026-04-07 08:15:51
1 跟貼 1
廣州外賣騎手年均薪酬15萬主播20萬

南方都市報 2026-04-09 07:07:13
320 跟貼 320
英國74歲奶奶獨自游中國，各地網友接力搶著當導游，吉首大學學生：她在享受生活

瀟湘晨報 2026-04-08 18:04:41
554 跟貼 554
《植物大戰僵尸3》國際版進入搶先體驗階段僅兩個國家開放！

3DM游戲 2026-04-09 09:33:14
0 跟貼 0
常州某漢堡自助因顧客吃得多，老板報警

正觀新聞 2026-04-08 18:27:24
102 跟貼 102
廣西一初中生亂丟垃圾被全校大屏批評，教育局回應：有些矯枉過正，校領導已致歉

瀟湘晨報 2026-04-08 21:14:10
150 跟貼 150
曼聯官方：下賽季球場將有一系列升級改造，餐飲更豐富

懂球帝 2026-04-09 00:30:10
2 跟貼 2
廣東城際鐵路等負責人，被約談

南方都市報 2026-04-09 08:48:00
3 跟貼 3
不是所有人都適配假發，這個假發適配所有人，效果超絕 6

搞笑嘻哈哈 2026-04-06 09:18:30
2 跟貼 2
Windows部署OpenClaw教程！WSL2方案，官方推薦，兼容性拉滿！

知了3C 2026-04-08 22:39:00
0 跟貼 0
"科幻電影般的戰爭"來了：美兩場軍事行動讓世界驚訝

中國新聞周刊 2026-04-09 07:34:11
252 跟貼 252
女孩去送文件無意間看到董事長全家福竟是失散多年的爺爺

山雞看劇 2026-04-04 17:52:07
1 跟貼 1
違規購買使用劣質螺栓，承載能力大降

南方都市報 2026-04-09 07:07:14
19 跟貼 19
2026款仰望U7到店，內核全面升級了！

汽車公社 2026-04-08 14:50:44
0 跟貼 0
二十屆中央第七輪巡視對象公布

央視新聞客戶端 2026-04-08 19:08:56
32 跟貼 32
中國石化：公司原油探明儲量2074百萬桶，天然氣探明儲量10029十億立方英尺

每日經濟新聞 2026-04-08 18:14:24
750 跟貼 750
索尼推出“Playerbase”計劃：將真實玩家掃描植入PS第一方游戲

IT之家 2026-04-08 08:51:07
1 跟貼 1
女子曬太陽飛來一只猛禽，直接窩在懷里不走了，旁邊的貓一臉震驚

星視頻 2026-04-09 12:07:21
1 跟貼 1
風箏-地下黨交通員被捕，重要機密文件，鬼子六決定暴露身份救人

龍耀影視 2026-04-07 08:17:25
1 跟貼 1
黎巴嫩宣布全國哀悼

南方都市報 2026-04-09 09:24:03
13 跟貼 13
廣州公安出入境業務系統將于周六起暫停服務！設備升級改造

南方都市報 2026-04-09 09:55:51
0 跟貼 0
日產NX8攜天演架構2.0而來，全維進階純電/增程雙動力可選 20萬級家用新選擇！日產NX8攜天演架

座駕 2026-04-08 21:28:57
0 跟貼 0
《星空》新更新和DLC上線未來仍將持續擴展內容

3DM游戲 2026-04-09 06:21:05
0 跟貼 0

馬筱梅轉移資產！嘴硬男星證明自己腎不虛！

八卦瘋叔

2026-04-09 11:52:21

至少3版不同10點提案，特朗普怒斥美媒“抹黑和平進程參與者”

山河路口

2026-04-09 11:40:26

伊朗電力部門已部署3萬人待命保障供電

海外網

2026-04-08 07:11:04

16歲就是人間尤物，4年換19個男人，找老實人接盤后，變買菜媽媽

一盅情懷

2026-03-28 15:38:13

安徽女童遇害，兇手娘家村民再曝猛料！從小被父母嬌慣，爭強好勝

青橘罐頭

2026-04-09 07:50:17

歷史老師跌入“無人區”：某高中20人教研組，近一半無學生可教

聽心堂

2026-03-31 15:52:04

爆冷逆轉！騎士險勝老鷹藏3大意外，這人徹底淪為季后賽雞肋

錢說體育

2026-04-09 09:47:21

全國多地“老牌高速公路”收費期限屆滿，陸續進入“免費通行時代”

中國能源網

2026-04-08 11:05:04

中國造不出光刻機？中科大副院長：美國造不出，中國永遠都不可能

小蘭聊歷史

2026-03-21 18:17:07

評論｜如何看待樊振東“自愿放棄”背后的輿論喧嘩

澎湃新聞

2026-04-09 10:02:27

卡拉格：看利物浦踢巴黎簡直就像在看一支低級別球隊對陣豪門

懂球帝

2026-04-09 10:25:09

帥化民：我特別討厭解放軍的一個叫“遠火”的武器

安安說

2026-03-17 11:58:44

雷霆大勝快船，鎖定聯盟第一！小卡20分8籃板，快船守住西部第八

老梁體育漫談

2026-04-09 12:30:28

突然發現廣東人講話也很喜歡用倒裝句。廣東人：漏了什么后面補上

另子維愛讀史

2026-03-04 21:14:58

2026年廣東省高校高考分數排名情況如下

娛樂的宅急便

2026-04-09 05:27:58

白人女性與黑人女性的體味差異，網友真實分享引發熱議

特約前排觀眾

2025-12-22 00:20:06

都說女強人心里最軟的是家人，可陳麗華臨走前最惦記的

小光侃娛樂

2026-04-09 11:45:09

張雪峰妻子首度開口：別猜了，沒離沒再婚！

今古深日報

2026-04-09 10:18:26

上海某網約車司機上月收入

微微熱評

2026-04-08 20:52:23

中俄動作都很快，審判已開始，高市被催下臺，特朗普也問責日本

知法而形

2026-04-09 10:42:10

moonfdd

福大大架構師每日一題

1172文章數 63關注度

往期回顧全部

科技要聞

Meta凌晨首發閉源大模型扎克伯格又行了？

頭條要聞

達賴深度卷入愛潑斯坦權色網印媒再披露驚人新證據

頭條要聞

達賴深度卷入愛潑斯坦權色網印媒再披露驚人新證據

體育要聞

40歲，但實力倒退12年

娛樂要聞

具俊曄最新露面，又黑又瘦情緒低迷

財經要聞

談判基礎已被破壞！霍爾木茲海峽關閉

汽車要聞

8155芯片+L2智駕瑞虎5運動版上市置換補貼價6.79萬元起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

親子

數碼

教育

軍事航空

手機 / 數碼

房產 / 家居

ollama v0.20.0 更新：Gemma 4 全家桶發布，音頻、視覺、MoE、BPE 支持全面升級

Meta凌晨首發閉源大模型 扎克伯格又行了？

達賴深度卷入愛潑斯坦權色網 印媒再披露驚人新證據

達賴深度卷入愛潑斯坦權色網 印媒再披露驚人新證據

40歲，但實力倒退12年

具俊曄最新露面，又黑又瘦情緒低迷

談判基礎已被破壞！霍爾木茲海峽關閉

8155芯片+L2智駕 瑞虎5運動版上市 置換補貼價6.79萬元起

態度原創

干細胞抗衰4大誤區,90%的人都中招

福州兒童/青少年配眼鏡推薦：專業驗光+定制方案+售后無憂，家長關心的都在這

Krafton 推出全新 AI 品牌“Raon”，首批四款 AI 模型全部開源

這些聰明人都在報土木……

霍爾木茲海峽已再次關閉

Meta凌晨首發閉源大模型扎克伯格又行了？

達賴深度卷入愛潑斯坦權色網印媒再披露驚人新證據

達賴深度卷入愛潑斯坦權色網印媒再披露驚人新證據

8155芯片+L2智駕瑞虎5運動版上市置換補貼價6.79萬元起