網易首頁 > 網易號 > 正文申請入駐

馬斯克大贊阿里 AI，9B 參數硬剛 120B，海外網友：這叫小模型？

2026-03-03 12:57:39　來源: AppSo

廣東舉報

分享至

馬斯克又雙叒叕下場點贊中國 AI 了。

昨天深夜，阿里通義千問團隊在 X 平臺正式發布了 Qwen3.5 小模型系列，覆蓋 0.8B、2B、4B 和 9B 四個參數規格。甫一發布，便在海外科技圈引發強烈反響。

馬斯克也在該推文下評論稱：「Impressive intelligence density」（令人印象深刻的智能密度）。這股熱度的背后，APPSO 也好奇，為什么這幾款小模型能夠激起如此大的波瀾？

又小又猛，憑什么

Qwen 官方在 X 平臺發帖宣布這批模型上線，言簡意賅地將其定位為「更強的智能，更少的算力」。

官方強調，四款小模型共享同一套 Qwen3.5 基礎架構，原生支持多模態，并經過架構層面的專項改良與大規模強化學習訓練。

Qwen 團隊表示，希望這批模型能更好地支撐學術研究、實驗探索與真實工業場景的創新落地，同時也宣布同步發布對應的 Base 基礎模型。

Qwen3.5 系列模型核心采用「門控增量網絡與稀疏混合專家」相結合的混合注意力架構，注意力層以 3:1 的比例排列，即 3 個 Gated DeltaNet 層搭配 1 個 Gated Attention 層。

這一設計的關鍵在于，模型在前向傳播時只激活對當前任務必要的網絡部分，而非全量計算，從而在極低延遲與算力開銷下實現高吞吐推理。

附上 HuggingFace 地址： https://huggingface.co/Qwen/Qwen3.5-2B

多模態這塊也有講究。Qwen3.5 采用「早期融合」訓練機制，文本、圖像、視頻在底層就一起處理，不是在文本模型上事后掛個視覺編碼器。

這個差異直接決定了小參數模型在視覺問答、OCR 文檔理解等任務上，能打出遠超同量級傳統輕量多模態模型的表現。

全系列同時支持長達 26 萬 Token 的上下文窗口，并引入「思考」與「非思考」雙模式，可在深度邏輯推理與快速響應之間靈活切換。

0.8B 與 2B 模型均為 24 層結構，隱藏維度分別為 1024 和 2048，專為物聯網設備等極端邊緣場景設計，也可直接在主流手機上原生運行。

盡管 0.8B 在語言基準 MMLU-Pro 上得分 29.7，表現平平，但受益于早期融合架構，其在視覺任務 MathVista 上達到 62.2，OCRBench 達到 74.5，展現出與參數量不相稱的視覺理解能力。2B 模型的 OCRBench 進一步提升至 84.5，表現亮眼。

上下滑動查看更多內容

4B 模型為 32 層結構，隱藏維度 2560，能夠流暢運行于消費級移動硬件。官方將其定性為「出乎意料強大的多模態輕量智能體底座」。

9B 則再進一步，同為 32 層結構，但隱藏維度提升至 4096，FFN 維度擴展至 12288，可以在 Mac 上流暢運行。

其 MMLU-Pro 得分達到 82.5，不僅超越了參數量為其三倍的上一代 Qwen3-30B，在視覺任務上更以兩位數優勢超過 GPT-5-Nano 與 Gemini 2.5 Flash Lite。

MMMU-Pro 得分高達 70.1，MathVision 達到 78.9，證明了其在復雜物理和數學圖像解析上的實力。官方將 9B 的目標明確為「縮小與前沿大模型的能力差距」，從基準數據來看，這一目標已初步實現。

海外開發者對這批模型的實際表現給出了高度正面的評價。

有開發者直言，稱其為「小模型」不過是低估了它，就好比把颶風叫做微風。

另有觀點認為，真正值得關注的指標是每十億參數所能釋放的智能密度。如今只需 3 萬美元的硬件，就能跑出一年前需要 20 萬美元 GPU 配置才有的推理能力。

已有開發者演示了在 iPhone 17 Pro 上通過針對 Apple Silicon 優化的 MLX 框架本地運行 Qwen3.5-2B 6-bit 版本，模型可實時完成視覺理解與問答任務。

網友在本地 Vision Agents 應用中實時識別手寫內容并即時回答問題，并感嘆這在幾個月前根本無法實現。

還有用戶這樣總結道，9B 模型性能與規模達 120B 的 ChatGPT 開源模型相當，體積卻只有其十三分之一，且完全免費，可在任何筆記本電腦乃至手機上運行。

知名開源推理工具 Ollama 也迅速跟進，官宣支持 Qwen3.5 全系四個尺寸，并配套提供原生工具調用、思維鏈推理與多模態功能，只需一行命令即可拉取運行。

附上地址：https://ollama.com/library/qwen3.5

跑分是起點，AI+硬件才是終局

在談及阿里為何堅持追求開源與發布全尺寸模型時，千問技術負責人林俊旸曾在清華 AGI-Next 峰會上轉述其師弟的觀點，給出了一個樸素的答案。

他表示，小模型起源于內部實驗需求，是為了讓資源有限的學生也能參與研究。他回憶道，7B 規模的模型已讓很多碩士博士生無力承擔實驗成本，若將 1.8B 的模型開源出去，很多同學就有機會順利畢業，「這是很好的初心」。

平心而論，Qwen 系列一路開源走下來，客觀上確實讓很多人用上了本來用不起的 AI 模型。而對于普通用戶而言，想親身體驗這批最新的小模型其實也不復雜。

目前，你可以通過 PocketPal AI 這款手機應用，直接下載并在本地運行 Qwen3.5 系列模型，無需任何 API，模型推理全程在設備端完成。如果不習慣英文界面，可以在設置 (Setting) 里找到語言 (Language) 選項，切換成中文。

（具體教程可參考 APPSO 此前的文章：。

不過有一個細節，比選哪個模型更重要：選對量化版本。

BF16 是接近原始精度的半精度權重，回答穩定性最好，推理細節與對齊效果最接近原版，但 2B 的 BF16 權重文件就要 4.45GB，運行時還需額外占用內存用于 KV cache 和運行緩沖區，極易觸發系統殺后臺或直接加載失敗。

因此手機端的選擇邏輯應該是：可用內存長期能剩 6GB 以上，優先選 IQ4_NL；可用內存常在 3GB 至 5GB 之間，優先選 Q3_K_M；可用內存更低，才考慮 Q3_K_S 等等。

說到底，一個無法獨立運行的模型，不過是一堆權重文件。真正有價值的，是與正確硬件深度綁定、以正確量化格式部署的小模型，那才能成為真正的產品。

智能手機時代本質上是「單向輸入」的范式，而即將到來的 AI 硬件浪潮，是要以更碎片化、更有粘性的方式接管人類的記憶與生活。小模型，正是給這些硬件注入靈魂的關鍵。

阿里已將 Qwen 小模型嵌入 AI 眼鏡等可穿戴硬件，實現毫秒級端側視覺解析。在真實物理場景中，向眼鏡詢問前方障礙物時哪怕延遲三秒也會失去全部意義，而這恰恰是云端大模型無法克服的物理瓶頸。

你向眼鏡詢問前方障礙物的時候，哪怕延遲三秒也會失去全部意義，遇到需要深度推理的復雜問題，再作為路由器把請求交給云端的大模型處理。是的，端云協同架構，才是接下來幾年計算平臺的基本形態。

包括在 iPhone 的「視覺智能」中，當用戶把攝像頭對準餐廳或商品，端側實時完成場景解析、文本提取，甚至直接喚起購買流程，全程在設備上完成。

此外有媒體報道稱，蘋果下一步還在開發帶攝像頭的 AirPods 和智能眼鏡，這些設備會變成用戶的「第二雙眼睛和耳朵」。

工業方面，IoT 設備、工廠傳感器、醫療監測終端，這些場景里數據隱私更敏感，本地推理同樣是硬需求。而端側小模型實時處理第一視角多模態數據，則是繞不過去的基礎設施。

就像今天沒有人會專門寫一篇文章夸手機能打電話一樣。AI 眼鏡、AI 手表、AI 耳機等可穿戴設備，現在聽起來還有點新鮮，但在未來，它們也會變得稀松平常。

而讓這件事成為可能的，恰恰是一批又一批看似沒什么存在感的小模型。它們很小，但如無意外，它們將無處不在。

附上 HuggingFace 地址：

https://huggingface.co/collections/Qwen/qwen35

歡迎加入 APPSO AI 社群，一起暢聊 AI 產品，獲取，解鎖更多 AI 新知

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標題「姓名+崗位名稱」（請隨簡歷附上項目/作品或相關鏈接）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

馬斯克：3年內機器人超越頂尖醫生

財聯社 2026-01-09 15:31:35
2 跟貼 2
馬斯克坦言智能密度被低估100倍

機器之心Pro 2026-01-07 18:40:30
15 跟貼 15

Cursor自研新模型反超 Opus 4.6，主打“價格打一折”，網友群嘲“Kimi 2.5套殼”，馬斯克認證

華爾街見聞官方 2026-03-21 13:35:08
27 跟貼 27

人活著的唯一理由是善良

葉檀財經 2026-02-01 17:07:04
0 跟貼 0
黃仁勛GTC直言：現在是OpenClaw的時代，SaaS都將變AgaaS

機器之心Pro 2026-03-17 17:22:21
0 跟貼 0

馬斯克用Grok替代X員工，裁員90%

量子位 2025-11-29 16:58:47
0 跟貼 0

馬斯克拿1萬億工資，為什么大家都覺得超值

雷科技 2025-11-08 14:17:34
5 跟貼 5
馬斯克官宣開建史上最大芯片廠，年產能目標為現有全球產能50倍；扎克伯格據悉正在打造一款CEO智能體丨全球科技早參

每日經濟新聞 2026-03-23 08:00:55
0 跟貼 0

馬斯克的小目標：星艦10000發/年，太空AI算力1太瓦/年

量子位 2026-02-08 23:37:12
10 跟貼 10
馬斯克宣布建造史上規模最大的芯片制造工廠

每日經濟新聞 2026-03-22 16:58:17
0 跟貼 0
別急著教AI開車，先讓它看懂世界

虎嗅APP 2026-03-21 17:36:05
0 跟貼 0
超越OpenClaw表象，這場閉門會直擊下一代智能體范式躍遷

機器之心Pro 2026-03-23 10:28:08
0 跟貼 0
貝佐斯創業，馬斯克嘲笑，兩人的恩怨糾葛20年

量子位 2025-11-22 12:44:22
0 跟貼 0
剛剛，馬斯克啟動TERAFAB項目：萬億瓦算力工廠，瞄準太空

機器之心Pro 2026-03-23 11:04:24
0 跟貼 0
從經歷到知識：UIUC、清華PlugMem如何重構Agent記憶

新智元 2026-03-21 19:19:12
0 跟貼 0
擴散語言模型總是均勻發力，華為諾亞教它「抓重點」

機器之心Pro 2026-03-22 18:56:22
0 跟貼 0
趨勢洞察：AI硬件算力、存力、運力三大核心賽道演進

每日經濟新聞 2026-03-23 10:35:06
0 跟貼 0
在四五年內，在太空運行大規模AI將比地面更劃算

每日經濟新聞 2026-01-22 12:48:26
0 跟貼 0
AI時代的營銷變局：品牌主如何爭奪信息話語權

經濟觀察報 2026-03-23 11:36:16
0 跟貼 0
馬斯克跳舞視頻流出，內容極其炸裂，果然大佬的品味不一般

樂呵指南 2026-03-21 13:10:09
1 跟貼 1
馬斯克4秒掙的錢相當于普通人一年的收入

每日經濟新聞 2026-01-21 00:05:31
1 跟貼 1
馬斯克乘坐特斯拉新車Cybercab，取消了方向盤、踏板和后視鏡

樂呵指南 2026-03-21 13:09:53
1 跟貼 1
高端獵手狩獵有招，竟以馬斯克形式現身，這玩法真夠騷氣

搞笑嘻哈哈 2026-03-21 00:00:00
0 跟貼 0
馬斯克：Grok 編碼能力落后！今年年中迎頭趕上并超越

知了3C 2026-03-21 21:47:10
0 跟貼 0
開三輪車去阿里，海拔5000米撿到一片土窯房，燉大骨頭補一下

思念幻化 2026-03-20 05:13:07
0 跟貼 0
首富馬斯克給后廚打雜，刷碗端菜不在話下，同事當場傻眼！

隆科看生活 2026-03-23 08:48:41
0 跟貼 0
馬斯克Terafab晶圓廠落地，機器人ETF華夏(562500)低位磨底蓄勢

每日經濟新聞 2026-03-23 11:29:03
0 跟貼 0
馬斯克下場搶人? xAI組建人才狙擊隊? 讓工程師做HR 馬斯克親自組建xAI“人才狙擊隊”：讓工程

量子位 2026-01-22 12:57:14
0 跟貼 0
馬斯克敗訴！他被判收購推特前故意誤導投資者

不看車bukanche 2026-03-21 08:00:14
0 跟貼 0
消息人士：馬斯克團隊采購光伏設備預計將在5月第一周發貨

財聯社 2026-03-21 07:37:46
0 跟貼 0
馬斯克神預言，到底說了什么？

財姐水晶 2026-03-21 03:18:19
5 跟貼 5
馬斯克被裁定因誤導言論讓推特股東“虧錢”

界面新聞 2026-03-22 09:33:06
0 跟貼 0
找伴侶和做投資，邏輯一模一樣

光輝視角 2026-03-19 14:03:44
1 跟貼 1
精準識別界門綱目科屬種！北大彭宇新團隊用細粒度樹先驗提升泛化

量子位 2026-03-21 17:46:20
0 跟貼 0
大山在老撾米米過來家里找弟媳婦玩，阿里老婆懷孕了！

上億新鮮事 2026-03-22 00:09:29
0 跟貼 0
阿里大規模招AI實習生，好高考作文材料

托塔老師 2026-03-20 14:18:02
0 跟貼 0
阿里或發布重磅芯片，人工智能ETF華夏（515070）持倉股奧比中光領漲

每日經濟新聞 2026-03-23 11:18:05
0 跟貼 0
太空光伏概念逆勢活躍華民股份漲超10%

財聯社 2026-03-23 09:47:13
0 跟貼 0
“媽，門口要錢，我們就不進去看你了”，游客在壺口瀑布外拍視頻被投訴侵權，山西壺口瀑布景區：事發地是陜西壺口瀑布，我們也是受害者

觀威海 2026-03-18 14:47:02
34645 跟貼 34645
馬斯克的兒子，出席巴黎街頭時裝秀拍攝，老馬看了會是什么感覺

大眼貓侃世界 2026-03-21 15:19:31
0 跟貼 0

AppSo

讓智能手機更好用的秘密

6212文章數 26797關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

藝術

房產

教育

數碼

手機 / 數碼

房產 / 家居

馬斯克大贊阿里 AI，9B 參數硬剛 120B，海外網友：這叫小模型？

雷軍、蔡崇信最新發聲，提到同一件事

山西省原省長金湘軍被公訴：任上被查 搞權色錢色交易

山西省原省長金湘軍被公訴：任上被查 搞權色錢色交易

46歲生日快樂！巴薩全隊穿10號致敬小羅

劉燁47歲生日，安娜曬全家福為其慶生

連續暴跌 亂世黃金失靈？

嵐圖汽車香江鳴鑼 一場關于"國家隊"的突圍實驗

態度原創

轉頭就暈的耳石癥，能開車上班嗎？

如此美妙的光影，安靜而溫暖，真令人折服！

全城狂送1000杯咖啡！網易房產【早C計劃】，即刻啟動！

學校中層干部千萬不要傻傻努力了！校長根本不在意你干了多少活，而在乎這6條

時隔四年磨一劍，小米全新筆記本媒體評價盤點

雷軍、蔡崇信最新發聲，提到同一件事

山西省原省長金湘軍被公訴：任上被查搞權色錢色交易

山西省原省長金湘軍被公訴：任上被查搞權色錢色交易

46歲生日快樂！巴薩全隊穿10號致敬小羅

劉燁47歲生日，安娜曬全家福為其慶生

連續暴跌亂世黃金失靈？

嵐圖汽車香江鳴鑼一場關于"國家隊"的突圍實驗

轉頭就暈的耳石癥，能開車上班嗎？

如此美妙的光影，安靜而溫暖，真令人折服！

全城狂送1000杯咖啡！網易房產【早C計劃】，即刻啟動！

學校中層干部千萬不要傻傻努力了！校長根本不在意你干了多少活，而在乎這6條