337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Gemini 3 深夜發(fā)布:碾壓GPT-5.1、超越Claude 4.5,中文卻是短板?

0
分享至

從數(shù)學(xué)競(jìng)賽的 “地獄級(jí)” 突破到智能體開發(fā)平臺(tái)的生態(tài)革新,這場(chǎng)由 TPU 算力支撐的技術(shù)爆發(fā),標(biāo)志著 Google 在 AGI 賽道強(qiáng)勢(shì)回歸。但光鮮戰(zhàn)績(jī)背后,中文表現(xiàn)與寫作能力的明顯短板,也讓這場(chǎng) “最好 LLM” 之爭(zhēng)留下了更多懸念。

———— / BEGIN / ————

推特上喊了快 1個(gè)月的 Gemini 3「馬上發(fā)布」,昨晚狼真的來了!


沒有任何多余的廢話,打開 Model Card,滿眼寫著的只有兩個(gè)字:碾壓。連 Sam Altman 都久違地獻(xiàn)上了自己的點(diǎn)贊。


這一次,那個(gè)曾經(jīng)定義了 Transformer、如今「All in Gemini」的巨人,真的殺回來了。

全面霸榜的推理怪獸:SOTA 殺瘋了

事實(shí)證明,Google 沒有讓等待的人失望。Gemini 3 Pro 的發(fā)布再一次定義了 SOTA(State-Of-The-Art)。


根據(jù) Google 披露的數(shù)據(jù),Gemini 3 Pro 在推理、多模態(tài)、Agent 工具使用等關(guān)鍵基準(zhǔn)上,實(shí)現(xiàn)了全方位的霸榜。

  • 數(shù)學(xué)能力的「地獄級(jí)」碾壓:在數(shù)學(xué)競(jìng)賽的「地獄模式」MathArena Apex 里,當(dāng)包括 GPT-5.1 在內(nèi)的其他大模型還在1%上下掙扎時(shí),Gemini 3 Pro 直接干到了23.4%。這就像小學(xué)生還在掰手指算加減法,旁邊的 Gemini 3 已經(jīng)開始徒手搓火箭了。

  • 人類智力的天花板:在 Humanity’s Last Exam(人類最終大考)中,Gemini 3 Pro 轟出了37.5%的高分(GPT-5.1 為 26.5%)。在開啟工具使用后,更是達(dá)到了45.8%

  • 視覺智能的質(zhì)變:在衡量屏幕理解能力的 ScreenSpot-Pro 測(cè)試中,GPT-5.1 得分僅為 3.5%(基本是瞎子),而 Gemini 3 Pro 高達(dá)72.7%。這是近乎20 倍的能力碾壓!


但這還不是極限。

Google 還藏了一手Gemini 3 Deep Think(深度思考模式)

在不使用任何工具的情況下,Deep Think 模式在 Humanity's Last Exam 上的得分飆升至41.0%

在 ARC-AGI-2 上更是取得了前所未有的45.1%的得分。

這意味著模型在處理復(fù)雜學(xué)術(shù)問題時(shí),已經(jīng)具備了完全不同的理解深度。


顛覆性的交互體驗(yàn):生成式 UI 與 Vibe Coding

Gemini 3 的野心不止于跑分,它正在從 Chatbot 進(jìn)化為Generative App

首創(chuàng)「生成式界面」(GenUI):以前的 AI 給你文字或代碼,現(xiàn)在的 Gemini 3 能直接為你生成一個(gè)交互界面。比如搜索「RNA 聚合酶工作原理」,它不再扔給你一堆鏈接,而是利用強(qiáng)大的推理能力,即時(shí)生成(Generated on the fly)一個(gè)沉浸式的互動(dòng) 3D 分子模型。你不僅可以瀏覽,還能點(diǎn)進(jìn)去和里面的元素交互。

Vibe Coding:理解你的「直覺」Gemini 3 引入了「Vibe Coding」概念。你不需要清楚地描述開發(fā)要求,它能捕捉你的開發(fā)風(fēng)格和模糊意圖。只用一句話,Gemini 3 就能通過感知你的「編碼直覺」,直接生成全功能的應(yīng)用程序。

實(shí)測(cè)了幾個(gè)案例,前端能力簡(jiǎn)直炸裂

復(fù)刻 Web OS:僅僅輸入一段 Prompt,要求創(chuàng)建一個(gè)類似 Windows 的 Web OS。Gemini 3 Pro 寫了將近 2 分鐘,結(jié)果真的生造了一個(gè)系統(tǒng)!從終端、代碼編輯器到畫圖工具,大部分功能竟然都是可用的。

復(fù)古 3D 游戲:編寫一款具有豐富視覺效果的太空飛船游戲,一句話搞定(from 機(jī)器之心」


Google Antigravity:Agent 優(yōu)先的開發(fā)平臺(tái)

有了最強(qiáng)的模型,Google 直接在應(yīng)用層「掀桌子」,扔出了小王炸——Google Antigravity

這不僅僅是一個(gè) IDE,它是 Google 定義的Agent-first(智能體優(yōu)先)開發(fā)平臺(tái)。在這里,Gemini 3 化身為擁有編輯器、終端和瀏覽器完整權(quán)限的「執(zhí)行合伙人」。

Antigravity 配置了一個(gè)「模型軍團(tuán)」協(xié)同作戰(zhàn):

  • Gemini 3:大腦,負(fù)責(zé)推理和寫代碼。

  • Gemini 2.5 Computer Use:手眼,控制瀏覽器進(jìn)行 UI 驗(yàn)證。

  • Nano Banana:美工,生成圖像和 UI 素材。

這種打通底層模型到頂層交互的閉環(huán)體驗(yàn),對(duì)于 Cursor 等現(xiàn)有編輯器來說,無疑是一次降維打擊。Agent 可以代表你自主規(guī)劃并執(zhí)行復(fù)雜的端到端軟件任務(wù),甚至自己打開瀏覽器驗(yàn)證 UI,發(fā)現(xiàn)報(bào)錯(cuò)自己修。

致命短板:寫作能力慘遭 Claude 4.5 吊打

雖然代碼和推理能力強(qiáng)到讓人頭皮發(fā)麻,但在寫作能力上,Gemini 3 Pro 卻讓人大跌眼鏡。

實(shí)測(cè)顯示,在科普文章寫作方面,Gemini 3.0 的表現(xiàn)幾乎是在「御三家」里墊底

以「基于上下文工程技術(shù)文章寫科普文」為例:

  • Claude 4.5 Sonnet:寫了 3000 字,場(chǎng)景描述抓人,用咨詢顧問做類比把抽象概念講透,結(jié)尾還能升華認(rèn)知。

  • Gemini 3.0:輸出只有 1000 多字。雖然開頭用了「你有沒有過這樣的經(jīng)歷」的套路,但每個(gè)觀點(diǎn)點(diǎn)到為止,缺乏展開和讓人眼前一亮的類比。

更讓人抓狂的是,Gemini 3.0 依然保留了老毛病:喜歡在中文后面加括號(hào)注釋英文單詞(如「提示詞工程(Prompt Engineering)」),讀起來非常割裂,像是一份沒翻譯完的文檔。

相比之下,Claude 4.5 Sonnet 理解什么時(shí)候該鋪墊、什么時(shí)候該直給,這一點(diǎn)目前 Gemini 3 確實(shí)還做不到。

谷歌王者歸來

Gemini 3 的發(fā)布,釋放了一個(gè)強(qiáng)烈的信號(hào):算力霸權(quán)依然存在

Gemini 3 Pro 是使用 Google TPU 從頭開始訓(xùn)練的。當(dāng)全世界都在等英偉達(dá) GPU 時(shí),Google 坐在自家的 TPU 礦山上,擁有極高的帶寬內(nèi)存和算力冗余,這給了它肆意擴(kuò)張參數(shù)規(guī)模的底氣。

從底層的 TPU 硅基霸權(quán),到中間層的 Antigravity 開發(fā)生態(tài),再到頂層的生成式 UI,Google 展示了一個(gè)只有巨頭才能構(gòu)建的嚴(yán)絲合縫的未來。

雖然寫作能力略顯拉胯,但在代碼、推理和多模態(tài)交互上,Gemini 3 確實(shí)已經(jīng)殺瘋了

對(duì)于開發(fā)者而言,會(huì)不會(huì)寫前端、會(huì)不會(huì)調(diào)框架可能真的不重要了。重要的是你能不能把腦子里的東西,翻譯成精準(zhǔn)的 Prompt。

Gemini 3 現(xiàn)已全面開放,即日起可通過 Google AI Studio 體驗(yàn)。

至于它到底能不能終結(jié)「最好的 LLM」之爭(zhēng)?讓子彈(和服務(wù)器)再飛一會(huì)兒。

本文來自公眾號(hào):餅干哥哥AGI 作者:餅干哥哥AGI

2025AI產(chǎn)品大會(huì),將于12月20-21日在深圳開幕!

聚焦“AI+行業(yè)”的落地實(shí)踐,分享AI在物流、音視頻、內(nèi)容、數(shù)字化、工業(yè)制造、大數(shù)據(jù)、協(xié)同辦公、出海、具身智能、智能硬件等等領(lǐng)域的具體案例。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
原油飆漲!黃金、白銀下跌,美股突變!特朗普威脅!霍爾木茲海峽,最新消息!

原油飆漲!黃金、白銀下跌,美股突變!特朗普威脅!霍爾木茲海峽,最新消息!

證券時(shí)報(bào)e公司
2026-03-26 22:23:23
“兩物不送人,子孫人上人”:這2樣?xùn)|西別送人,關(guān)系再好也不行

“兩物不送人,子孫人上人”:這2樣?xùn)|西別送人,關(guān)系再好也不行

白淺娛樂聊
2026-03-17 17:13:11
演員朱珠疑似塌房?照片流出,驚呆網(wǎng)友!

演員朱珠疑似塌房?照片流出,驚呆網(wǎng)友!

大眼妹妹
2025-12-15 10:39:19
100只整裝待發(fā)!量產(chǎn)機(jī)器狼“-20℃極寒測(cè)試”現(xiàn)場(chǎng)曝光

100只整裝待發(fā)!量產(chǎn)機(jī)器狼“-20℃極寒測(cè)試”現(xiàn)場(chǎng)曝光

中國(guó)網(wǎng)
2026-03-26 15:55:11
6-2血洗歐冠德比!巴薩狂轟6球,皇馬孤將雙響難擋崩盤

6-2血洗歐冠德比!巴薩狂轟6球,皇馬孤將雙響難擋崩盤

林子說事
2026-03-26 09:42:20
德轉(zhuǎn)列世預(yù)賽附加賽球隊(duì)身價(jià)排行:意大利8.39億歐居首

德轉(zhuǎn)列世預(yù)賽附加賽球隊(duì)身價(jià)排行:意大利8.39億歐居首

懂球帝
2026-03-26 15:59:41
NBA正式擴(kuò)軍!狂砸100億啊,再見,森林狼or灰熊,東部見

NBA正式擴(kuò)軍!狂砸100億啊,再見,森林狼or灰熊,東部見

球童無忌
2026-03-26 11:34:27
5月起生效!俄羅斯關(guān)閘,8000噸黃金不賣了,全球金市變天

5月起生效!俄羅斯關(guān)閘,8000噸黃金不賣了,全球金市變天

瑛派兒老黃
2026-03-26 10:43:45
張靚穎“零透光”裙驚爆熱搜,性感曲線令全場(chǎng)屏息,時(shí)尚女王?

張靚穎“零透光”裙驚爆熱搜,性感曲線令全場(chǎng)屏息,時(shí)尚女王?

娛樂領(lǐng)航家
2025-10-28 22:00:07
美媒大膽預(yù)測(cè):快船季后賽4-3勝騎士隊(duì)

美媒大膽預(yù)測(cè):快船季后賽4-3勝騎士隊(duì)

劉笤說體壇
2026-03-27 00:09:38
1981年,彭真獄中見江青,江青出言不遜提出:我要見華國(guó)鋒鄧小平

1981年,彭真獄中見江青,江青出言不遜提出:我要見華國(guó)鋒鄧小平

微野談寫作
2026-01-27 06:00:03
以色列打不動(dòng)了想停火,伊朗說不,47年的賬,今天得好好算清

以色列打不動(dòng)了想停火,伊朗說不,47年的賬,今天得好好算清

花寒弦絮
2026-03-26 23:11:22
三分命中率64.1%,斷層全聯(lián)盟第一!郭士強(qiáng)該給他一個(gè)國(guó)家隊(duì)名額

三分命中率64.1%,斷層全聯(lián)盟第一!郭士強(qiáng)該給他一個(gè)國(guó)家隊(duì)名額

弄月公子
2026-03-26 11:03:13
德黑蘭街頭忽然空了:巴斯基帳篷被遺棄,民兵連夜跑了,為什么?

德黑蘭街頭忽然空了:巴斯基帳篷被遺棄,民兵連夜跑了,為什么?

老馬拉車莫少裝
2026-03-24 22:55:20
張雪峰遺產(chǎn)紛爭(zhēng)的內(nèi)幕!

張雪峰遺產(chǎn)紛爭(zhēng)的內(nèi)幕!

八卦瘋叔
2026-03-26 11:05:04
太陽報(bào):大量槍迷想搶票見證奪冠,西漢姆聯(lián)嚴(yán)查主隊(duì)看臺(tái)購(gòu)票

太陽報(bào):大量槍迷想搶票見證奪冠,西漢姆聯(lián)嚴(yán)查主隊(duì)看臺(tái)購(gòu)票

懂球帝
2026-03-26 13:21:13
玄學(xué)提醒:如果一個(gè)人還在穿著10年前的衣服,只說明3個(gè)問題

玄學(xué)提醒:如果一個(gè)人還在穿著10年前的衣服,只說明3個(gè)問題

洞讀君
2026-03-04 14:30:12
10萬億美債將要到期,早已資不抵債,美國(guó)財(cái)政部已經(jīng)宣布破產(chǎn)?

10萬億美債將要到期,早已資不抵債,美國(guó)財(cái)政部已經(jīng)宣布破產(chǎn)?

史行途
2026-03-26 14:06:29
101枚導(dǎo)彈砸向美國(guó)航母:伊朗打出了開戰(zhàn)以來最強(qiáng)一拳

101枚導(dǎo)彈砸向美國(guó)航母:伊朗打出了開戰(zhàn)以來最強(qiáng)一拳

聞識(shí)
2026-03-27 01:19:31
這就是錢學(xué)森后人真實(shí)的樣貌,女兒定居美國(guó),兒子長(zhǎng)孫精忠報(bào)國(guó)!

這就是錢學(xué)森后人真實(shí)的樣貌,女兒定居美國(guó),兒子長(zhǎng)孫精忠報(bào)國(guó)!

舊史新譚
2026-03-25 13:15:22
2026-03-27 02:00:49
人人都是產(chǎn)品經(jīng)理社區(qū) incentive-icons
人人都是產(chǎn)品經(jīng)理社區(qū)
想要成為大牛先從學(xué)做產(chǎn)品開始
64566文章數(shù) 311569關(guān)注度
往期回顧 全部

數(shù)碼要聞

8.8英寸天璣9500小鋼炮!REDMI K Pad 2入網(wǎng):下月見

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

科技要聞

美團(tuán)發(fā)布外賣大戰(zhàn)后成績(jī)單:虧損超200億

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

藝術(shù)
時(shí)尚
旅游
數(shù)碼
手機(jī)

藝術(shù)要聞

北京大興機(jī)場(chǎng)和青島膠東機(jī)場(chǎng)“撞臉”,長(zhǎng)得像就是抄襲?

400萬人愛過的女孩,被黃謠網(wǎng)暴180天后

旅游要聞

河南開封萬歲山武俠城,游客買300元門票:給妻子拍照被保安阻攔

數(shù)碼要聞

英特爾發(fā)Q1.26版Arc Pro專業(yè)顯卡驅(qū)動(dòng),支持B70 / B65顯卡

手機(jī)要聞

1499 iQOO Z11系列發(fā)布丨9020mAh電池 165Hz高刷

無障礙瀏覽 進(jìn)入關(guān)懷版