337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

谷歌開源Gemma 4,干掉了13倍體量的Qwen3.5

0
分享至



編輯|冷貓、澤南

本周四晚,谷歌開源了當前開源世界最強的模型家族 Gemma 4 系列。

基于和 Gemini 3 相同的研究成果,新模型在 Arena AI 排行榜上拿到了全球第三的位置,而且超越了參數量比它大 20 倍的模型。更重要的是,這一代 Gemma 使用 Apache 2.0 開源許可證,可實現完全的商用自由。



Gemma 4 是 Google DeepMind 構建的最新開放模型系列,它們是多模態模型,用于處理文本和圖片輸入(小型模型支持音頻輸入)以及生成文本輸出。此版本包含預訓練和指令調優的開放權重模型。Gemma 4 的上下文窗口最多可容納 25.6 萬 token,并支持 140 多種語言。

谷歌表示,Gemma 4 同時采用密集型架構和混合專家 (MoE) 架構,非常適合文本生成、編碼和推理等任務。這些模型有四種不同的規模:E2B、E4B、26B A4B 和 31B。這些模型的大小各異,因此可部署在從高端手機到筆記本電腦和服務器的各種環境中,從而讓更多人能夠使用最先進的 AI。

其中,體量最大的 31B 版本使用一塊 80GB H100 就能實現完整精度推理,可見其能力水平已經與 Qwen 3.5 397B 相當了。



體量最小的 E4B 和 E2B 專為手機、平板等端側設備本地推理設計,谷歌也與高通、聯發科進行了聯合優化。



總的來說,Gemma 4 引入的功能和架構改進包括:

  • 推理 - 該系列中的所有模型都設計為高能力推理器,具有可配置的思考模式。
  • 擴展的多模態功能 - 處理文本、支持可變寬高比和分辨率的圖片(所有型號)、視頻和音頻(在 E2B 和 E4B 型號上原生支持)。
  • 多樣化且高效的架構 - 提供不同大小的密集型和混合專家 (MoE) 變體,以實現可伸縮的部署。
  • 針對設備端進行了優化 - 較小的模型專為在筆記本電腦和移動設備上高效本地執行而設計。
  • 更大的上下文窗口 - 小型模型的上下文窗口為 12.8 萬個 token,中型模型的上下文窗口為 25.6 萬個 token。
  • 增強的編碼和智能體功能 - 在編碼基準方面取得了顯著改進,同時支持原生函數調用,可打造功能強大的自主代理。
  • 原生系統提示支持 - Gemma 4 引入了對 system 角色的原生支持,從而實現更結構化和可控的對話。

模型概覽

Gemma 4 模型旨在在各種規模下提供前沿性能,目標部署場景涵蓋移動設備和邊緣設備 (E2B、E4B) 到消費類 GPU 和工作站 (26B A4B、31B)。它們非常適合推理、智能體工作流、編碼和多模態理解。

這些模型采用混合注意力機制,將局部滑動窗口注意力和全局注意力交織在一起,確保最后一層始終是全局的。這種混合設計可提供輕量級模型的處理速度和低內存占用空間,同時不會犧牲復雜長上下文任務所需的深度感知能力。為了優化長上下文的內存,全局層采用統一的鍵和值,并應用比例 RoPE (p-RoPE)。



E2B 和 E4B 中的「E」表示「有效」形參。較小的模型采用 Per-Layer Embeddings (PLE),以最大限度提高設備端部署中的參數效率。PLE 不會向模型添加更多層或參數,而是為每個詞法單元的每個解碼器層提供自己的小型嵌入。這些嵌入表很大,但僅用于快速查找,因此激活參數的數量遠小于總數。



26B A4B 中的「A」表示「有效參數」,與模型包含的參數總數相對。通過在推理期間僅激活 40 億個參數子集,混合專家模型運行速度比其 260 億個總參數所暗示的速度快得多。與密集型 310 億參數模型相比,該模型幾乎與 40 億參數模型一樣快,因此是快速推理的絕佳選擇。

谷歌展示了一些 Gemma 4 的模型能力,比如測試它檢測和指向 GUI 元素的能力:「圖像中查看配方元素的邊界框是什么?」



檢測日常物體:



如果要求 Gemma 4 編寫 HTML 代碼來重建用 Gemini 3 創建的頁面,Gemini 生成的網站是這樣的:



Gemma 4 重建的頁面:



參數大小和量化

Gemma 4 模型提供 4 種參數大小:E2B、E4B、31B 和 26B A4B。 這些模型可以采用默認精度(16 位),也可以通過量化采用較低的精度。不同的尺寸和精度代表著 AI 應用的一系列權衡。參數和位數(精度)較高的模型通常功能更強大,但在處理周期、內存成本和功耗方面運行成本更高。參數和位數(精度)較低的模型功能較少,但可能足以滿足您的 AI 任務的需求。

Gemma 4 推理內存要求

下表詳細列出了使用各種大小的 Gemma 4 模型版本運行推理所需的大致 GPU 或 TPU 內存。



表 1. 加載 Gemma 4 模型所需的大致 GPU 或 TPU 內存,具體取決于參數數量和量化級別。

內存規劃的行動要點

  • 高效架構(E2B 和 E4B): 「E」代表「有效」參數。較小的模型采用每層嵌入 (PLE) 技術,以最大限度地提高設備端部署中的參數效率。PLE 不會向模型添加更多層,而是為每個詞法單元的每個解碼器層提供自己的小型嵌入。這些嵌入表很大,但僅用于快速查找,因此加載靜態權重所需的總內存高于有效參數數量所暗示的內存。
  • MoE 架構(26B A4B): 26B 是混合專家模型。雖然在生成期間每個詞法單元僅激活 40 億個參數,但所有 260 億個參數 都必須加載到內存中,以保持快速路由和推理速度。因此,其基準內存要求比 4B 模型更接近于密集型 26B 模型。
  • 僅基準權重: 上表中的估算值 僅 考慮了加載靜態模型權重所需的內存。它們不包括支持軟件或上下文窗口所需的額外 VRAM。
  • 上下文窗口(KV 緩存): 內存消耗將根據提示和生成的響應中的詞法單元總數動態增加。除了基準模型權重之外,更大的上下文窗口還需要顯著更多的 VRAM。
  • 微調開銷: 微調 Gemma 模型的內存要求遠高于標準推理。您的確切占用空間將很大程度上取決于開發框架、批次大小,以及您是使用全精度調優還是使用參數高效微調 (PEFT) 方法(例如低秩適應 (LoRA))。

基準測試結果

我們針對大量不同的數據集和指標對這些模型進行了評估,以涵蓋文本生成的各個方面。表格中標記的評估結果適用于指令調優模型。



核心功能

Gemma 4 模型可處理文本、視覺和音頻方面的各種任務。主要功能包括:

  • 思考 - 內置推理模式,可讓模型在回答之前進行分步思考。
  • 長上下文 - 上下文窗口最多可容納 12.8 萬個 token (E2B/E4B) 和 25.6 萬個 token (26B A4B/31B)。
  • 圖片理解 - 對象檢測、文檔 / PDF 解析、屏幕和界面理解、圖表理解、OCR(包括多語言)、手寫識別和視覺定位。可以處理具有不同寬高比和分辨率的圖片。
  • 視頻理解 - 通過處理幀序列來分析視頻。
  • 交織的多模態輸入 - 在單個提示中,可以按任意順序自由混合文本和圖片。
  • 函數調用 - 原生支持結構化工具使用,可實現智能體工作流。
  • 編碼 - 代碼生成、補全和更正。
  • 多語言 - 開箱即用,支持 35 種以上的語言,預訓練了 140 種以上的語言。
  • 音頻(僅限 E2B 和 E4B)- 自動語音識別 (ASR) 和語音轉譯文翻譯(支持多種語言)。

訓練數據集

谷歌使用的預訓練數據集是一個大規模、多樣化的數據集合,涵蓋廣泛的領域和模態,包括網頁文檔、代碼、圖片、音頻,截止日期為 2025 年 1 月。以下是關鍵組成部分:

  • 網頁文檔:各種各樣的網頁文本可確保模型接觸到廣泛的語言風格、主題和詞匯。訓練數據集包含 140 多種語言的內容。
  • 代碼:讓模型接觸代碼有助于其學習編程語言的語法和模式,從而提高其生成代碼和理解代碼相關問題的能力。
  • 數學:通過數學文本訓練,模型可以學習邏輯推理、符號表示,并能夠回答數學問題。
  • 圖片:各種各樣的圖片可讓模型執行圖片分析和視覺數據提取任務。

這些多樣化數據源的組合對于訓練強大的模型至關重要,該模型能夠處理各種不同的任務和數據格式。

數據預處理

以下是應用于訓練數據的主要數據清理和過濾方法:

  • CSAM 過濾:在數據準備流程的多個階段應用了嚴格的 CSAM(兒童性虐待內容)過濾,以確保排除有害和非法內容。
  • 敏感數據過濾:為了確保 Gemma 預訓練模型的安全性和可靠性,谷歌使用了自動化技術來過濾掉訓練集中的某些個人信息和其他敏感數據。
  • 其他方法:根據內容質量和安全性進行過濾。

參考內容:

https://deepmind.google/models/gemma/gemma-4/

https://x.com/Google/status/2039736220834480233

https://huggingface.co/blog/gemma4

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
杜鋒終于正常!徐杰首發主控,胡明軒減少持球,各點用人恰到好處

杜鋒終于正常!徐杰首發主控,胡明軒減少持球,各點用人恰到好處

籃球資訊達人
2026-04-04 23:55:10
伊朗:在霍爾木茲海峽擊中以色列有關船只,引發大火!中國、日本、法國等船只已接連通過,特朗普再提“打通海峽搶石油”

伊朗:在霍爾木茲海峽擊中以色列有關船只,引發大火!中國、日本、法國等船只已接連通過,特朗普再提“打通海峽搶石油”

每日經濟新聞
2026-04-04 22:14:15
日本LNG船通過霍爾木茲海峽!特朗普宣布“贏了”,遭美情報部門“打臉”:伊朗還有大量導彈,海軍仍有5成實力,速勝是“異想天開”

日本LNG船通過霍爾木茲海峽!特朗普宣布“贏了”,遭美情報部門“打臉”:伊朗還有大量導彈,海軍仍有5成實力,速勝是“異想天開”

每日經濟新聞
2026-04-03 23:47:05
買萵筍時,看到這種碰都不碰,菜販自己從不吃,別說沒有提醒你

買萵筍時,看到這種碰都不碰,菜販自己從不吃,別說沒有提醒你

馬蹄燙嘴說美食
2026-03-19 14:35:45
伊朗稱美駐沙特大使館遭襲與伊無關 系以色列所為

伊朗稱美駐沙特大使館遭襲與伊無關 系以色列所為

財聯社
2026-04-04 14:40:08
“大尺度”女星的瓜!

“大尺度”女星的瓜!

文刀萬
2025-05-23 06:05:02
少跟孩子生氣,因為這一世的相遇,背后藏著你看不見的因果

少跟孩子生氣,因為這一世的相遇,背后藏著你看不見的因果

杏花煙雨江南的碧園
2026-04-03 15:15:03
曾國藩:真正拉開人與人差距的,從來不是能力,而是做好這三件事

曾國藩:真正拉開人與人差距的,從來不是能力,而是做好這三件事

千秋文化
2026-03-31 20:52:57
孫儷的《危險關系》看得我害怕!終于理解導演,為何會選他演男主

孫儷的《危險關系》看得我害怕!終于理解導演,為何會選他演男主

劇芒芒
2026-04-04 10:26:43
詹姆斯經紀人里奇-保羅不看好湖人:他們不可能沖出西部!

詹姆斯經紀人里奇-保羅不看好湖人:他們不可能沖出西部!

愛體育
2026-04-04 23:00:42
穆里奇:即使我們是主場作戰,也會預設從皇馬身上拿不到分

穆里奇:即使我們是主場作戰,也會預設從皇馬身上拿不到分

懂球帝
2026-04-05 01:00:48
祖墳到底管幾代?誰的墳影響最大?牢記原則祭祖不拜錯

祖墳到底管幾代?誰的墳影響最大?牢記原則祭祖不拜錯

復轉這些年
2026-04-02 12:12:54
李小萌王雷豪華住宅被曝光,誰能想到王雷的煙成了最大亮點!

李小萌王雷豪華住宅被曝光,誰能想到王雷的煙成了最大亮點!

動物奇奇怪怪
2026-04-04 02:24:52
偉大的10-4!特魯姆普創紀錄進決賽,靜候趙心童,羅伯遜3冠夢碎

偉大的10-4!特魯姆普創紀錄進決賽,靜候趙心童,羅伯遜3冠夢碎

劉姚堯的文字城堡
2026-04-04 08:14:36
李易峰沒人性!給未成年炮友上海買車房,付1500W封口費,嫖資超千萬

李易峰沒人性!給未成年炮友上海買車房,付1500W封口費,嫖資超千萬

八卦王者
2026-02-18 15:52:51
不裝了!訪陸行程剛曝光,鄭麗文突遭算計直飛美國?最狠反擊打響

不裝了!訪陸行程剛曝光,鄭麗文突遭算計直飛美國?最狠反擊打響

小嵩
2026-04-03 13:02:12
破鼓萬人錘!面對特朗普的言論,意大利總理:這一次,我們不同意

破鼓萬人錘!面對特朗普的言論,意大利總理:這一次,我們不同意

清沐執筆
2026-04-04 19:36:36
還認為茅臺酒送的小酒杯是用來喝酒的?行家:大錯特錯,別鬧笑話

還認為茅臺酒送的小酒杯是用來喝酒的?行家:大錯特錯,別鬧笑話

鄒小蘑菇
2026-03-31 12:18:15
1969年中蘇沖突,朝鮮企圖跨過鴨綠江,毛主席:一招搞定!

1969年中蘇沖突,朝鮮企圖跨過鴨綠江,毛主席:一招搞定!

小莜讀史
2026-04-04 21:56:55
發現一個現象:根據歷史規律,中國可能成地球上最后一個超級大國

發現一個現象:根據歷史規律,中國可能成地球上最后一個超級大國

尋跡追心
2026-04-04 08:21:53
2026-04-05 03:15:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12681文章數 142612關注度
往期回顧 全部

科技要聞

內存一年漲四倍!國產手機廠商集體漲價

頭條要聞

伊朗發動第七輪導彈襲擊 耶路撒冷攔截導彈升空

頭條要聞

伊朗發動第七輪導彈襲擊 耶路撒冷攔截導彈升空

體育要聞

剎不住的泰格·伍茲,口袋里的兩粒藥丸

娛樂要聞

Q女士反擊,否認逼宋寧峰張婉婷離婚

財經要聞

中微董事長,給半導體潑點冷水

汽車要聞

17萬級海豹07EV 不僅續航長還有9分鐘滿電的快樂

態度原創

教育
家居
數碼
手機
時尚

教育要聞

這些英國大學開始崩盤!

家居要聞

溫馨多元 愛的具象化

數碼要聞

今年新款AirPods Pro、Apple TV值得等嗎?升級方向曝光

手機要聞

華為新機再曝,旗艦、闊折疊、常規折疊都有!

別再穿大一碼了!遮肉根本不是靠寬松

無障礙瀏覽 進入關懷版