337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

馬斯克大贊阿里 AI,9B 參數硬剛 120B,海外網友:這叫小模型?

0
分享至

馬斯克又雙叒叕下場點贊中國 AI 了。

昨天深夜,阿里通義千問團隊在 X 平臺正式發布了 Qwen3.5 小模型系列,覆蓋 0.8B、2B、4B 和 9B 四個參數規格。甫一發布,便在海外科技圈引發強烈反響。


馬斯克也在該推文下評論稱:「Impressive intelligence density」(令人印象深刻的智能密度)。這股熱度的背后,APPSO 也好奇,為什么這幾款小模型能夠激起如此大的波瀾?


又小又猛,憑什么

Qwen 官方在 X 平臺發帖宣布這批模型上線,言簡意賅地將其定位為「更強的智能,更少的算力」。

官方強調,四款小模型共享同一套 Qwen3.5 基礎架構,原生支持多模態,并經過架構層面的專項改良與大規模強化學習訓練。

Qwen 團隊表示,希望這批模型能更好地支撐學術研究、實驗探索與真實工業場景的創新落地,同時也宣布同步發布對應的 Base 基礎模型。


Qwen3.5 系列模型核心采用「門控增量網絡與稀疏混合專家」相結合的混合注意力架構,注意力層以 3:1 的比例排列,即 3 個 Gated DeltaNet 層搭配 1 個 Gated Attention 層。

這一設計的關鍵在于,模型在前向傳播時只激活對當前任務必要的網絡部分,而非全量計算,從而在極低延遲與算力開銷下實現高吞吐推理。


附上 HuggingFace 地址: https://huggingface.co/Qwen/Qwen3.5-2B

多模態這塊也有講究。Qwen3.5 采用「早期融合」訓練機制,文本、圖像、視頻在底層就一起處理,不是在文本模型上事后掛個視覺編碼器。

這個差異直接決定了小參數模型在視覺問答、OCR 文檔理解等任務上,能打出遠超同量級傳統輕量多模態模型的表現。

全系列同時支持長達 26 萬 Token 的上下文窗口,并引入「思考」與「非思考」雙模式,可在深度邏輯推理與快速響應之間靈活切換。

0.8B 與 2B 模型均為 24 層結構,隱藏維度分別為 1024 和 2048,專為物聯網設備等極端邊緣場景設計,也可直接在主流手機上原生運行。


盡管 0.8B 在語言基準 MMLU-Pro 上得分 29.7,表現平平,但受益于早期融合架構,其在視覺任務 MathVista 上達到 62.2,OCRBench 達到 74.5,展現出與參數量不相稱的視覺理解能力。2B 模型的 OCRBench 進一步提升至 84.5,表現亮眼。


上下滑動查看更多內容

4B 模型為 32 層結構,隱藏維度 2560,能夠流暢運行于消費級移動硬件。官方將其定性為「出乎意料強大的多模態輕量智能體底座」。

9B 則再進一步,同為 32 層結構,但隱藏維度提升至 4096,FFN 維度擴展至 12288,可以在 Mac 上流暢運行。

其 MMLU-Pro 得分達到 82.5,不僅超越了參數量為其三倍的上一代 Qwen3-30B,在視覺任務上更以兩位數優勢超過 GPT-5-Nano 與 Gemini 2.5 Flash Lite。


MMMU-Pro 得分高達 70.1,MathVision 達到 78.9,證明了其在復雜物理和數學圖像解析上的實力。官方將 9B 的目標明確為「縮小與前沿大模型的能力差距」,從基準數據來看,這一目標已初步實現。

海外開發者對這批模型的實際表現給出了高度正面的評價。

有開發者直言,稱其為「小模型」不過是低估了它,就好比把颶風叫做微風。


另有觀點認為,真正值得關注的指標是每十億參數所能釋放的智能密度。如今只需 3 萬美元的硬件,就能跑出一年前需要 20 萬美元 GPU 配置才有的推理能力。

已有開發者演示了在 iPhone 17 Pro 上通過針對 Apple Silicon 優化的 MLX 框架本地運行 Qwen3.5-2B 6-bit 版本,模型可實時完成視覺理解與問答任務。


網友在本地 Vision Agents 應用中實時識別手寫內容并即時回答問題,并感嘆這在幾個月前根本無法實現。


還有用戶這樣總結道,9B 模型性能與規模達 120B 的 ChatGPT 開源模型相當,體積卻只有其十三分之一,且完全免費,可在任何筆記本電腦乃至手機上運行。

知名開源推理工具 Ollama 也迅速跟進,官宣支持 Qwen3.5 全系四個尺寸,并配套提供原生工具調用、思維鏈推理與多模態功能,只需一行命令即可拉取運行。


附上地址:https://ollama.com/library/qwen3.5

跑分是起點,AI+硬件才是終局

在談及阿里為何堅持追求開源與發布全尺寸模型時,千問技術負責人林俊旸曾在清華 AGI-Next 峰會上轉述其師弟的觀點,給出了一個樸素的答案。

他表示,小模型起源于內部實驗需求,是為了讓資源有限的學生也能參與研究。他回憶道,7B 規模的模型已讓很多碩士博士生無力承擔實驗成本,若將 1.8B 的模型開源出去,很多同學就有機會順利畢業,「這是很好的初心」。


平心而論,Qwen 系列一路開源走下來,客觀上確實讓很多人用上了本來用不起的 AI 模型。而對于普通用戶而言,想親身體驗這批最新的小模型其實也不復雜。

目前,你可以通過 PocketPal AI 這款手機應用,直接下載并在本地運行 Qwen3.5 系列模型,無需任何 API,模型推理全程在設備端完成。 如果不習慣英文界面,可以在設置 (Setting) 里找到語言 (Language) 選項,切換成中文。


(具體教程可參考 APPSO 此前的文章:。

不過有一個細節,比選哪個模型更重要:選對量化版本。

BF16 是接近原始精度的半精度權重,回答穩定性最好,推理細節與對齊效果最接近原版,但 2B 的 BF16 權重文件就要 4.45GB,運行時還需額外占用內存用于 KV cache 和運行緩沖區,極易觸發系統殺后臺或直接加載失敗。

因此手機端的選擇邏輯應該是:可用內存長期能剩 6GB 以上,優先選 IQ4_NL;可用內存常在 3GB 至 5GB 之間,優先選 Q3_K_M;可用內存更低,才考慮 Q3_K_S 等等。


說到底,一個無法獨立運行的模型,不過是一堆權重文件。真正有價值的,是與正確硬件深度綁定、以正確量化格式部署的小模型,那才能成為真正的產品。

智能手機時代本質上是「單向輸入」的范式,而即將到來的 AI 硬件浪潮,是要以更碎片化、更有粘性的方式接管人類的記憶與生活。小模型,正是給這些硬件注入靈魂的關鍵。

阿里已將 Qwen 小模型嵌入 AI 眼鏡等可穿戴硬件,實現毫秒級端側視覺解析。在真實物理場景中,向眼鏡詢問前方障礙物時哪怕延遲三秒也會失去全部意義,而這恰恰是云端大模型無法克服的物理瓶頸。


你向眼鏡詢問前方障礙物的時候,哪怕延遲三秒也會失去全部意義,遇到需要深度推理的復雜問題,再作為路由器把請求交給云端的大模型處理。是的,端云協同架構,才是接下來幾年計算平臺的基本形態。

包括在 iPhone 的「視覺智能」中,當用戶把攝像頭對準餐廳或商品,端側實時完成場景解析、文本提取,甚至直接喚起購買流程,全程在設備上完成。


此外有媒體報道稱,蘋果下一步還在開發帶攝像頭的 AirPods 和智能眼鏡,這些設備會變成用戶的「第二雙眼睛和耳朵」。

工業方面,IoT 設備、工廠傳感器、醫療監測終端,這些場景里數據隱私更敏感,本地推理同樣是硬需求。而端側小模型實時處理第一視角多模態數據,則是繞不過去的基礎設施。

就像今天沒有人會專門寫一篇文章夸手機能打電話一樣。AI 眼鏡、AI 手表、AI 耳機等可穿戴設備,現在聽起來還有點新鮮,但在未來,它們也會變得稀松平常。

而讓這件事成為可能的,恰恰是一批又一批看似沒什么存在感的小模型。它們很小,但如無意外,它們將無處不在。


附上 HuggingFace 地址:

https://huggingface.co/collections/Qwen/qwen35

歡迎加入 APPSO AI 社群,一起暢聊 AI 產品,獲取,解鎖更多 AI 新知

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
俄總統新聞秘書:暗殺伊朗領導人產生“極其嚴重后果”

俄總統新聞秘書:暗殺伊朗領導人產生“極其嚴重后果”

極目新聞
2026-03-22 21:51:49
英媒:美以若地面進攻伊朗有幾種可能?

英媒:美以若地面進攻伊朗有幾種可能?

參考消息
2026-03-23 10:04:09
315緊急曝光:致癌物超140倍!孩子天天摸的開學必需品,趕緊扔掉

315緊急曝光:致癌物超140倍!孩子天天摸的開學必需品,趕緊扔掉

現代小青青慕慕
2026-03-23 02:11:20
央視曝光:海鮮市場用“三無”麻醉劑甚至工業酒精麻醉活魚,為方便裝卸,防止在運輸過程中掉魚鱗

央視曝光:海鮮市場用“三無”麻醉劑甚至工業酒精麻醉活魚,為方便裝卸,防止在運輸過程中掉魚鱗

極目新聞
2026-03-22 21:08:49
森林狼末節發力終結凱爾特人4連勝,布朗29分7籃板塔圖姆16+11

森林狼末節發力終結凱爾特人4連勝,布朗29分7籃板塔圖姆16+11

湖人崛起
2026-03-23 10:26:22
梅姨終于落網!藏了二十年,真面目比想象中更陰狠!希望可以嚴判

梅姨終于落網!藏了二十年,真面目比想象中更陰狠!希望可以嚴判

鳥語花香的季節
2026-03-22 00:10:09
火燒靖國神社的劉強,回國后被單位開除,妻子離婚,后來怎樣了?

火燒靖國神社的劉強,回國后被單位開除,妻子離婚,后來怎樣了?

大魚簡科
2026-03-21 09:46:38
Model T,上天了

Model T,上天了

放毒
2026-03-22 23:28:37
泡沫破了!大批文旅項目開始批量倒閉

泡沫破了!大批文旅項目開始批量倒閉

新浪財經
2026-03-22 18:25:59
奧運冠軍夢碎!伊朗欺騙19歲摔跤冠軍將見家人 次日將他絞刑處決

奧運冠軍夢碎!伊朗欺騙19歲摔跤冠軍將見家人 次日將他絞刑處決

念洲
2026-03-22 09:56:28
“廣東人,尤其是順德人給我道歉”!官方回應:對不起,真的改不了

“廣東人,尤其是順德人給我道歉”!官方回應:對不起,真的改不了

深圳晚報
2026-03-23 08:15:26
軍事 | 荷蘭因何冒出頭來,駐日美軍調動大有玄機!

軍事 | 荷蘭因何冒出頭來,駐日美軍調動大有玄機!

新民周刊
2026-03-23 09:07:35
一票否決權的黃昏:歐爾班砸了桌子,才發現地板是玻璃做的

一票否決權的黃昏:歐爾班砸了桌子,才發現地板是玻璃做的

民間胡扯老哥
2026-03-22 20:27:01
被喀麥隆標示為“臺灣,中國一省”,臺當局“破大防”

被喀麥隆標示為“臺灣,中國一省”,臺當局“破大防”

環球網資訊
2026-03-23 06:43:09
霍爾木茲海峽,大消息!特朗普發聲!黃金、白銀,跳水!原油,突變!

霍爾木茲海峽,大消息!特朗普發聲!黃金、白銀,跳水!原油,突變!

證券時報e公司
2026-03-23 07:57:08
比特幣,玩完了!

比特幣,玩完了!

澳洲財經見聞
2026-03-23 03:32:55
重磅:日本考慮向霍爾木茲海峽派兵!伊朗允許日本船通過

重磅:日本考慮向霍爾木茲海峽派兵!伊朗允許日本船通過

項鵬飛
2026-03-22 20:49:49
全球首搭千問大模型!智己重磅發布AI超級智能體,智己LS8即將開啟預售

全球首搭千問大模型!智己重磅發布AI超級智能體,智己LS8即將開啟預售

AutoBusiness
2026-03-23 11:03:47
一個女子的生理期,照出了多少衣冠楚楚的禽獸?

一個女子的生理期,照出了多少衣冠楚楚的禽獸?

胖胖說他不胖
2026-03-22 16:05:14
上海一中介為吃26萬差價竟分飾兩角:和賣家簽“托底”,和買家簽“居間”

上海一中介為吃26萬差價竟分飾兩角:和賣家簽“托底”,和買家簽“居間”

上觀新聞
2026-03-23 06:53:05
2026-03-23 12:28:49
AppSo incentive-icons
AppSo
讓智能手機更好用的秘密
6212文章數 26797關注度
往期回顧 全部

科技要聞

雷軍、蔡崇信最新發聲,提到同一件事

頭條要聞

山西省原省長金湘軍被公訴:任上被查 搞權色錢色交易

頭條要聞

山西省原省長金湘軍被公訴:任上被查 搞權色錢色交易

體育要聞

46歲生日快樂!巴薩全隊穿10號致敬小羅

娛樂要聞

劉燁47歲生日,安娜曬全家福為其慶生

財經要聞

連續暴跌 亂世黃金失靈?

汽車要聞

嵐圖汽車香江鳴鑼 一場關于"國家隊"的突圍實驗

態度原創

健康
藝術
房產
教育
數碼

轉頭就暈的耳石癥,能開車上班嗎?

藝術要聞

如此美妙的光影,安靜而溫暖,真令人折服!

房產要聞

全城狂送1000杯咖啡!網易房產【早C計劃】,即刻啟動!

教育要聞

學校中層干部千萬不要傻傻努力了!校長根本不在意你干了多少活,而在乎這6條

數碼要聞

時隔四年磨一劍,小米全新筆記本媒體評價盤點

無障礙瀏覽 進入關懷版