337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

谷歌殺瘋了!Gemini 3 Flash 突襲:這個跑腿小弟差點打敗了 GPT-5.2

0
分享至

★ 設為星標 | 只講人話,帶你玩轉AIGC。

一個月前,谷歌發布了最新的 Gemini,從此我們進入了 Gemini 3 的時代。

那以后, Gemini 3 Pro 就成了我干活的主力。

但說實話,它反應是真慢,而且很多時候我只是問些簡單問題,完全沒必要深度思考。

所以,一直期待速度飛快的 Flash 系列重新回來。

終于,在今天,Gemini 3 Flash 來了!


圖:谷歌 CEO 宣布 Gemini 3 Flash 發布

谷歌這一波操作屬實把我驚到了。

官方號稱它“比快更快”,而且智商不減反增。

本來是一個“小弟”人設,但你看看它排名,居然僅次于OpenAI 最新的模型 GPT 5.2了。(就差 2 分)

真讓人情何以堪吶?


圖:第三方機構評測 Gemini 3 Flash 的綜合指標

廢話不多說,咱們趕緊來扒一扒,這個新出的 Flash 到底香不香。

01 到底是個啥?

簡單來說:把 Pro 的腦子,裝進了 Flash 的身體里。

以前我們對“Flash(輕量級)”模型的印象是什么?

跑得快,便宜,但是……有點“笨”。處理復雜任務時經常翻車。

但這次 Gemini 3 Flash 徹底打破了這個刻板印象。

遇到閑聊、簡單查詢: 它就輕裝上陣,秒回,省流又省錢;

遇到燒腦難題: 它能立馬調動深層算力,像老教授一樣深思熟慮。

它大腦似乎有個變速箱。

它甚至在性能、成本和速度方面突破了帕累托極限。(AI 界的性價比極限)


圖:Gemini 3 Flash 在性能、成本和速度方面突破了帕累托極限

官方數據顯示,它的 Token 消耗比 Gemini 2.5 Pro 少了 30%,但智商卻在線。

說人話就是:多快好省!


圖:Token 消耗率對比

這種“該省省,該花花”的 AI,誰不愛?

02 憑數據說話:這波“以下犯上”有點狠

咱們不整那些虛頭巴腦的形容詞,直接看跑分數據,谷歌這次是真的下了血本。

我看了一眼實測數據,甚至有點不敢相信:它在很多任務上接近自家最強的模型 3 Pro,甚至有些指標還干掉了Pro 版。(這樣禮貌嗎?)

特別是那個讓無數 AI 汗流浹背的 ARC-AGI-2 測試……

還讓人意想不到的是:Gemini 3 Flash 全面碾壓了上一代的旗艦版本 2.5 Pro。(前浪死在沙灘上)


圖: Gemini 3 Flash 的各項指標

先說說這個 ARC-AGI-2。

之前 GPT 5.2 發布讓大家印象深刻,其中有一個原因就是這個指標碾壓所有模型。

老粉都知道,ARC 評測集是 AI 圈最難啃的骨頭,甚至沒有之一, 主要測試模型到底有沒有腦子。

它是由 Keras 之父 Fran?ois Chollet 搞出來的,專門用來反死記硬背的。

比如這種題目:


圖:ARC-AGI 2 題目

以前的模型,MMLU 這種考試能拿 90 分,一碰到 ARC 這種需要“舉一反三”的智力題,立馬現原形,得分低得可憐。

這項指標 Flash 竟然超過了自己的 Pro 大哥,僅次于 GPT-5.2!

這個小弟,要造反了有點腦子!

在另一項指標: GPQA Diamond(研究生級別的專家推理測試)里,它拿了 90.4 分。

意思就是智商堪比博士。

看這個數字,它的推理能力已經和那些大塊頭的前沿模型(Pro 版)平起平坐了。

在著名的“Humanity's Last Exam(人類最后一場考試)”這種地獄級難度的測試里,Gemini 3 Flash 居然考出了 43.5% 的高分(Tools on 模式)。


圖:HLE 分數對比

它跟 GPT-5.2(45.5%)這種超級旗艦模型,只差了不到 2 分!

朋友們,別忘了,這可是一個 Flash 模型啊!

它的定位本來是“跑腿小弟”,結果一不小心把“業界大佬”們的飯碗給砸了。(面子?不存在的。)

這哪里是“輕量版”,這分明是“披著閃電俠外衣的超人”。

在多模態測試(MMMU Pro)中得分 81.2%,看圖、看視頻的能力基本和 Gemini 3 Pro 五五開。

也就是,眼神兒更好使。


圖:MMMU-Pro 指標對比

最讓我意外的是這個——在 SWE-bench Verified(代碼智能體測試)中,它得分 78%。

直接超越了 Gemini 2.5 全系,甚至在某些這就需要改代碼的任務上,比 Gemini 3 Pro 還要好用!

本來以為它動動嘴還行,沒想到寫代碼更溜!

一句話總結:它不是“丐版”,它是“精簡版戰神”。

03 為什么我建議你立馬換用 Flash?

作為這一年多幾乎天天都在用 AI 的人,我覺得 Gemini 3 Flash 帶來的改變是肉眼可見的:

1. 真的太快了!??

根據第三方測評(Artificial Analysis),它的速度是 2.5 Pro 的 3 倍。

以前問 AI 一個問題,你可能還得切出去回個消息等它寫完。

現在?你字剛打完,它答案就懟到你臉上了。

這種“跟手”的感覺,對于我們需要快速寫文案、改代碼的人來說,簡直是救命。

2. 價格那是相當感人


圖:Gemini 3 Flash 價格

輸入 100 萬 Token 只要 0.5 美刀,輸出只要 3 美刀。

想想看,它現在比 2.5 Pro 強太多了,但價格卻只有它的 30-40%。

這基本就是白菜價了,對于開發者來說,成本焦慮直接減半。

3. 智商不掉線

既有速度,又有 Pro 級的推理能力。

處理復雜的長文檔分析、視頻理解,它完全都在行。

04 怎么用?能干啥?

好消息是,這玩意兒現在就是 Gemini 的“默認配置”。

不管你是普通用戶還是開發者,現在就能上手玩。

普通玩家:直接打開 Gemini App 或者 Google 搜索,它已經在那里等你了(是的,免費用)。

我們打開 Gemini,會看到 Fast 和 Thinking 兩個新增的模型。

它們就是 Gemini 3 Flash!


圖:Gemini 3 Flash

開發者大佬:去 Google AI Studio 或者 Vertex AI 就能調 api。

因為它延遲極低,拿來做那種需要即時反饋的語音助手、視頻分析工具簡直完美。

05 寫在最后

至此,Gemini 3 家族算是真正“齊活”了。

  • Pro 是全能六邊形戰士;

  • Deep Think 是深思熟慮的掃地僧;

  • Flash 則是身手敏捷的急先鋒。

回顧這一年,不得不說谷歌是真聽勸,也是真拼。

以前總有人吐槽大廠喜歡“擠牙膏”,但這幾次發布,從 Pro 到 Deep Think 再到今天的 Flash(還有 Nano Banana Pro),每一次都是誠意滿滿的“硬菜”。

特別是今天的 Flash,說實話,雖然在谷歌家里它定位是“小弟”,但這性能、這智商,放在其他任何一家公司,高低得掛個“旗艦(Ultra/Pro)”的名號。

當然,神仙打架,受益的是咱們。你們打吧,我喜歡。

大家趕緊去試試,回來告訴我:這個“免費版戰神”,有沒有刷新你對 AI 速度的認知?

評論區聊聊:你覺得 GPT-6 還有多久到達戰場?

如果覺得這篇文章對你有所幫助,別忘記點贊、??并轉發給你的朋友。

我們下期再見~

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
爆大冷!曼城 3 次密會新帥,瓜迪奧拉恐被掃地出門

爆大冷!曼城 3 次密會新帥,瓜迪奧拉恐被掃地出門

瀾歸序
2026-04-03 05:00:08
雖然惜敗湖人二隊,但快船雙向合同后場新星的表現依然非常穩定?

雖然惜敗湖人二隊,但快船雙向合同后場新星的表現依然非常穩定?

稻谷與小麥
2026-04-03 11:07:57
今晚遼籃對陣浙江,三大看點不容錯過

今晚遼籃對陣浙江,三大看點不容錯過

生活新鮮市
2026-04-03 10:11:45
陜西女教師遭碾壓拖行致死后續!2年維權無果,只因對方身份特殊

陜西女教師遭碾壓拖行致死后續!2年維權無果,只因對方身份特殊

奇思妙想草葉君
2026-04-02 15:26:55
TA:安踏簽下步行者34歲后衛麥康奈爾,球員11年NBA生涯首份球鞋合同

TA:安踏簽下步行者34歲后衛麥康奈爾,球員11年NBA生涯首份球鞋合同

懂球帝
2026-04-03 09:14:18
陳亞男訂婚!未婚夫“底褲”被扒,正臉照曝光,年齡大長得矮

陳亞男訂婚!未婚夫“底褲”被扒,正臉照曝光,年齡大長得矮

阿策聊實事
2026-04-03 10:06:22
小叔子賭博欠債百萬,婆家跪求我抵押公司救他,我當場甩出離婚證

小叔子賭博欠債百萬,婆家跪求我抵押公司救他,我當場甩出離婚證

云端小院
2026-04-03 08:54:54
第84波打擊!特朗普準備最后一擊,伊朗向中國求援,中方斬釘截鐵

第84波打擊!特朗普準備最后一擊,伊朗向中國求援,中方斬釘截鐵

南宗歷史
2026-04-01 19:11:48
英國首相稱35國將開會討論恢復霍爾木茲海峽通航

英國首相稱35國將開會討論恢復霍爾木茲海峽通航

每日經濟新聞
2026-04-02 15:45:45
等等黨的勝利!32G內存價格爆跌30% 只因沒人買

等等黨的勝利!32G內存價格爆跌30% 只因沒人買

3DM游戲
2026-04-02 11:50:05
這個新瓜,把人惡心吐了!

這個新瓜,把人惡心吐了!

觀察鑒娛
2026-04-02 10:58:59
Opta世界杯奪冠概率:西班牙15.83%第一、法英阿葡巴2-6位

Opta世界杯奪冠概率:西班牙15.83%第一、法英阿葡巴2-6位

懂球帝
2026-04-03 09:25:08
張雪和陳光標杠上了!自曝太多資本找上門,讓他們支持造國產飛機

張雪和陳光標杠上了!自曝太多資本找上門,讓他們支持造國產飛機

萌神木木
2026-04-02 16:39:18
退休人員也要繳費了!4月起執行,每月扣多少、誰能免,一次說清

退休人員也要繳費了!4月起執行,每月扣多少、誰能免,一次說清

笑熬漿糊111
2026-04-03 00:05:12
色色是第一生產力!因絲襪效果爆火的作者制作相關模擬器

色色是第一生產力!因絲襪效果爆火的作者制作相關模擬器

3DM游戲
2026-04-02 15:00:47
特朗普“全國講話”:荒誕虛偽的政治鬧劇

特朗普“全國講話”:荒誕虛偽的政治鬧劇

烽火瞭望者
2026-04-03 06:13:34
公園打花事件后續:景區回應,保潔老人被開除,網友評論一針見血

公園打花事件后續:景區回應,保潔老人被開除,網友評論一針見血

潮鹿逐夢
2026-03-31 10:44:17
滬指跌破3900點 全市場超4500只個股下跌

滬指跌破3900點 全市場超4500只個股下跌

證券時報
2026-04-03 10:26:03
真敢說!王濛節目中吐槽浪姐:跟菜市場似的,我的天吶,太磨嘰了

真敢說!王濛節目中吐槽浪姐:跟菜市場似的,我的天吶,太磨嘰了

風過鄉
2026-04-03 07:03:04
伊朗有救了?一架專機降落中國,王毅表明態度,替美承擔部分責任

伊朗有救了?一架專機降落中國,王毅表明態度,替美承擔部分責任

起喜電影
2026-04-03 06:11:04
2026-04-03 11:47:00
AI范兒 incentive-icons
AI范兒
AI范兒是一個專注于人工智能領域的資訊和學習平臺,提供最新的人工智能資訊
705文章數 658關注度
往期回顧 全部

科技要聞

SpaceX沖刺2萬億美元估值,馬斯克野心太大

頭條要聞

牛彈琴:美國干了一件令人發指的事 全世界都無法接受

頭條要聞

牛彈琴:美國干了一件令人發指的事 全世界都無法接受

體育要聞

沖擊世界杯失敗,80歲老帥一氣之下病倒了

娛樂要聞

《浪姐7》最新人氣TOP 曾沛慈斷層第一

財經要聞

專家稱長期攝入“飄香劑”存在健康隱患

汽車要聞

你介意和遠房親戚長得很像嗎?

態度原創

本地
數碼
旅游
公開課
軍事航空

本地新聞

跟著歌聲游安徽,聽古村回響

數碼要聞

盧偉冰回應小米及REDMI部分在售產品調價:內存漲價力度遠超預期

旅游要聞

花漾泉城赴春約!濟南推出五大主題百余項春日文旅活動

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗自殺無人機突進 逼退林肯號航母

無障礙瀏覽 進入關懷版