337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

谷歌數(shù)到3,這次輪到Gemini遙遙領(lǐng)先|Landing AI

0
分享至



現(xiàn)在輪到谷歌數(shù)到3了。

今天凌晨,谷歌正式公布了Gemini 3系列模型,并率先上線Gemini 3 Pro預(yù)覽版。按照介紹,開發(fā)者現(xiàn)可以在Google AI Studio直接調(diào)用API,Gemini應(yīng)用已同步切換到新模型,企業(yè)與開發(fā)平臺(tái)側(cè)的更新則也已經(jīng)納入近期計(jì)劃。

對(duì)外而言,這次發(fā)布看似沿襲了大模型迭代的慣常節(jié)奏,但從谷歌的表述方式到模型本身呈現(xiàn)出來的能力,都暗示著一個(gè)趨勢(shì):Gemini 3不再只是參數(shù)與跑分的躍遷,而是在嘗試重新定義“模型在系統(tǒng)中的位置”。

Gemini 3 Pro被谷歌歸納為三個(gè)核心變化:推理強(qiáng)度提升、事實(shí)一致性增強(qiáng)、多模態(tài)能力從設(shè)計(jì)之初就內(nèi)置而非附加。這意味著模型在對(duì)話中處理文本、圖像、音頻、視頻不再需要分階段切換,而是以統(tǒng)一的方式理解信息結(jié)構(gòu)。

官方給出的示例依舊貼近日常場(chǎng)景:把家里幾種語言混寫的手寫菜譜拍照丟給它,它能整理成一本統(tǒng)一格式的家庭菜譜;把一串長(zhǎng)視頻講座交給它,它會(huì)把關(guān)鍵知識(shí)點(diǎn)拆成交互式卡片,甚至生成簡(jiǎn)單的可視化工具來輔助記憶。在Gemini應(yīng)用中,Canvas工作區(qū)能夠支持更完整的“小項(xiàng)目”;在Gemini Labs里,它也能根據(jù)你的問題生成類似雜志排版的界面。

這些特性看上去像是一次體驗(yàn)層面的升級(jí),但真正讓Gemini 3 Pro與以往不同的,是它在各類評(píng)估中的表現(xiàn)出現(xiàn)了領(lǐng)先式的變化,而不僅是“略微更準(zhǔn)一點(diǎn)”。

過去一年,模型在各類基準(zhǔn)測(cè)試中的差距往往停留在小范圍波動(dòng)。現(xiàn)在,一些關(guān)鍵指標(biāo)第一次被明顯拉開。


最突出的表現(xiàn)落在高難度數(shù)學(xué)與復(fù)雜推理方向。Gemini 3 Pro在MathArena Apex中拿到23.4%的正確率,而上一代模型為0.5%、Claude為1.6%、GPT-5.1為1.0%——這是長(zhǎng)期停滯區(qū)間第一次被大幅突破。

在跨領(lǐng)域推理考試中,這種差距繼續(xù)擴(kuò)大。例如在Humanity’s Last Exam中,Gemini 3 Pro的無工具得分達(dá)到37.5%,工具模式則提升至45.8%,高于上一代的21.6%和GPT-5.1的26.5%。在GPQA Diamond中,它也以91.9%領(lǐng)先于同類模型的83%—88%區(qū)間。

多模態(tài)方面的變化則更集中體現(xiàn)在“界面理解”能力上。谷歌首次在技術(shù)資料中單列屏幕截圖理解,模型不僅能識(shí)別內(nèi)容,還能把握界面結(jié)構(gòu)、按鈕層級(jí)與可操作區(qū)域。

在ScreenSpot-Pro中,Gemini 3 Pro達(dá)到72.7%,而GPT-5.1僅為3.5%,Claude為36.2%,上一代Gemini為11.4%。這里的差距不只是識(shí)別率問題,而是決定了Agent是在“憑感覺點(diǎn)擊”,還是確實(shí)理解界面語境。

這種能力直接關(guān)系到Agent在操作電腦時(shí)是否能保持“情境意識(shí)”——能否基于界面判斷接下來會(huì)發(fā)生什么。對(duì)于任何期待AI“完成任務(wù)”的系統(tǒng)而言,這類能力遠(yuǎn)比單純的圖像識(shí)別更關(guān)鍵。

更廣泛的表現(xiàn)也與谷歌想強(qiáng)調(diào)的方向一致:Gemini 3 Pro在多學(xué)科理解、視頻推理和事實(shí)一致性上都拉開差距,并在工程類任務(wù)中顯現(xiàn)出更高的穩(wěn)定度。

例如在SimpleQA Verified中,Gemini 3 Pro達(dá)到72.1%,而同類模型普遍落在30%—35%區(qū)間;多語言綜合能力的MMLU中,它拿下91.8%,略高于GPT-5.1的91.0%,并領(lǐng)先Claude的89.1%。

在工程類任務(wù)上,它不僅能處理更復(fù)雜的代碼生成,還能在涉及實(shí)際環(huán)境的測(cè)試中穩(wěn)定執(zhí)行。例如在Terminal-Bench 2.0中,Gemini 3 Pro達(dá)到54.2%,而Claude為42.8%,GPT-5.1為47.6%;在長(zhǎng)鏈路任務(wù)Vending-Bench 2中,它的收益為5478美元,而其他模型普遍在1500—3800美元之間。

不過,Gemini 3真正有意義的部分,不在于單項(xiàng)能力的提升,而是谷歌圍繞它構(gòu)建的系統(tǒng)形態(tài)。伴隨此次更新推出的Antigravity,是一個(gè)以Agent為核心的開發(fā)環(huán)境。它并不是“補(bǔ)齊代碼空缺”的工具,而是讓模型能夠直接參與開發(fā)流程:理解需求、拆分任務(wù)、生成代碼、運(yùn)行測(cè)試、檢查界面效果,再回到代碼層面調(diào)整。

于此,谷歌通過把不同模型組合使用,讓Agent在編輯器、終端與瀏覽器之間自由切換,從而承接一段完整的執(zhí)行鏈。對(duì)于結(jié)構(gòu)不算復(fù)雜的項(xiàng)目,它已經(jīng)能承擔(dān)起實(shí)際工作。

面向普通用戶的變化,則更集中體現(xiàn)在Gemini應(yīng)用和Google搜索上。Gemini 3 Pro從第一天起就是默認(rèn)模型,而應(yīng)用內(nèi)的“Gemini Agent”可以處理多步?jīng)Q策任務(wù),例如歸檔郵件、安排行程或處理需要反復(fù)查找信息的事務(wù)。搜索端的AI Mode也開始呈現(xiàn)更動(dòng)態(tài)的信息布局,包括結(jié)構(gòu)化數(shù)據(jù)、圖片、時(shí)間軸甚至交互組件。這些變化來自于Gemini 3對(duì)查詢的拆分與重組,再由生成式界面組合展示,背后依賴的是更強(qiáng)的意圖理解能力。

此外,谷歌在這一代模型中主動(dòng)強(qiáng)調(diào)了一個(gè)方向:Gemini 3 Pro在回答時(shí)更少迎合用戶,而更傾向于提供有信息密度的反饋。“降低迎合性”既對(duì)應(yīng)今年的對(duì)話安全討論,也說明谷歌正在嘗試把“內(nèi)容質(zhì)量”變成產(chǎn)品特性,而不是語言風(fēng)格。

基于上述這些,不難發(fā)現(xiàn),Gemini 3的意義并不僅僅在于“跑分領(lǐng)先多少”,而更多的是,它把能力重新組織成一個(gè)能堅(jiān)持執(zhí)行任務(wù)、能跨模態(tài)整合、能在真實(shí)環(huán)境中保持結(jié)構(gòu)穩(wěn)定的系統(tǒng)。對(duì)谷歌來說,這提出了一個(gè)與GPT系列不同的回答:AI不僅要強(qiáng),更要穩(wěn);不僅要會(huì)生成,更要懂場(chǎng)景;不僅能理解界面,更要能在界面中持續(xù)行動(dòng)。

當(dāng)然,接下來,Gemini 3能夠走多遠(yuǎn),所依仗的遠(yuǎn)非這些看起來很漂亮的跑分和能力,而是在日常使用中,能有多少真正留得住的地方。

Landing AI

Landing AI是由動(dòng)點(diǎn)科技策劃的一檔聚焦人工智能領(lǐng)域的專題報(bào)道欄目。通過對(duì)AI落地前景以及幕后故事的發(fā)掘,我們將在這一專題中深入淺出地探討關(guān)于AI新浪潮下的一切可能。

本文為動(dòng)點(diǎn)科技記者原創(chuàng)文章,未經(jīng)授權(quán)不得轉(zhuǎn)載,如需轉(zhuǎn)載或開白請(qǐng)?jiān)诤笈_(tái)回復(fù)“轉(zhuǎn)載”。

- - - - - - - - END - - - - - - - -

*想要獲取行業(yè)資訊、和志同道合的科技愛好者們分享心得,那就趕快掃碼添加“動(dòng)點(diǎn)君”加入群聊吧!群里更有不定期福利發(fā)放!

精彩好文值得推薦

一鍵轉(zhuǎn)發(fā),戳個(gè)在看


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
女子冰壺世錦賽:中國(guó)7-8惜敗日本,5勝5負(fù)并列積分榜第六

女子冰壺世錦賽:中國(guó)7-8惜敗日本,5勝5負(fù)并列積分榜第六

懂球帝
2026-03-20 12:44:32
王毅同法國(guó)總統(tǒng)外事顧問博納通電話

王毅同法國(guó)總統(tǒng)外事顧問博納通電話

界面新聞
2026-03-20 21:26:30
這么多伊朗二代在美國(guó),拉里賈尼的女兒已回國(guó)!克宮強(qiáng)烈反對(duì)斬首

這么多伊朗二代在美國(guó),拉里賈尼的女兒已回國(guó)!克宮強(qiáng)烈反對(duì)斬首

鷹眼Defence
2026-03-20 18:13:40
難怪特朗普不想打了,五角大樓公開真實(shí)傷亡,美軍終付慘痛的代價(jià)

難怪特朗普不想打了,五角大樓公開真實(shí)傷亡,美軍終付慘痛的代價(jià)

興史興談
2026-03-20 14:33:17
山姆回應(yīng)三文魚標(biāo)注加熱卻被生食

山姆回應(yīng)三文魚標(biāo)注加熱卻被生食

馬俊哲律師
2026-03-20 16:40:09
葡萄牙大名單:C羅因傷缺席,B費(fèi)、維蒂尼亞領(lǐng)銜,B席、迪亞斯同樣缺席

葡萄牙大名單:C羅因傷缺席,B費(fèi)、維蒂尼亞領(lǐng)銜,B席、迪亞斯同樣缺席

懂球帝
2026-03-20 21:20:04
油價(jià)3月23日再調(diào)整,或漲到接近“10元時(shí)代”,大漲油價(jià)2000元/噸

油價(jià)3月23日再調(diào)整,或漲到接近“10元時(shí)代”,大漲油價(jià)2000元/噸

油價(jià)早知道
2026-03-20 09:17:33
37歲民警抓捕逃犯時(shí)中彈犧牲,老搭檔:“他是風(fēng)雪中最硬的脊梁,也是老百姓心里面最暖的一道光”

37歲民警抓捕逃犯時(shí)中彈犧牲,老搭檔:“他是風(fēng)雪中最硬的脊梁,也是老百姓心里面最暖的一道光”

紅星新聞
2026-03-20 11:46:09
武契奇炫耀中國(guó)給的導(dǎo)彈,中東的王爺們看了都眼饞

武契奇炫耀中國(guó)給的導(dǎo)彈,中東的王爺們看了都眼饞

阿芒娛樂說
2026-03-20 19:59:00
突發(fā)!上海大型國(guó)企,退出一汽奧迪經(jīng)銷商授權(quán)

突發(fā)!上海大型國(guó)企,退出一汽奧迪經(jīng)銷商授權(quán)

觀察者網(wǎng)
2026-03-20 20:14:23
78歲連路都走不穩(wěn)還開演唱會(huì),全網(wǎng)罵聲一片,她卻揚(yáng)言回饋粉絲

78歲連路都走不穩(wěn)還開演唱會(huì),全網(wǎng)罵聲一片,她卻揚(yáng)言回饋粉絲

洲洲影視娛評(píng)
2026-01-28 12:23:18
3月20日晚間重要公告一覽

3月20日晚間重要公告一覽

GPLP
2026-03-20 18:34:25
伊朗發(fā)起第67波打擊

伊朗發(fā)起第67波打擊

財(cái)聯(lián)社
2026-03-20 17:00:04
特斯拉官宣重磅新車來了,真的很猛!

特斯拉官宣重磅新車來了,真的很猛!

花果科技
2026-03-19 16:50:16
阿里巴巴“增收不增利”,港美股一起崩了!華爾街:AI業(yè)務(wù)潛力被低估

阿里巴巴“增收不增利”,港美股一起崩了!華爾街:AI業(yè)務(wù)潛力被低估

財(cái)通社
2026-03-20 14:56:16
新冠后遺癥對(duì)人體的最大影響,很多人深受其害,有些人還不自知

新冠后遺癥對(duì)人體的最大影響,很多人深受其害,有些人還不自知

呼吸科大夫胡洋
2026-02-22 11:39:12
確認(rèn)了!是68歲馮小剛!

確認(rèn)了!是68歲馮小剛!

江南晚報(bào)
2026-03-19 13:45:53
終于有了結(jié)果,曾醫(yī)生能保住醫(yī)院的工作,最應(yīng)該感謝的三位貴人!

終于有了結(jié)果,曾醫(yī)生能保住醫(yī)院的工作,最應(yīng)該感謝的三位貴人!

凌風(fēng)的世界觀
2025-11-14 08:38:31
哈佛研究實(shí)錘:抗老根本不用醫(yī)美!這6個(gè)行為堅(jiān)持半年,年輕10歲

哈佛研究實(shí)錘:抗老根本不用醫(yī)美!這6個(gè)行為堅(jiān)持半年,年輕10歲

白宸侃片
2026-03-12 19:17:17
CBA最新排名:北京沖第4失敗,遼寧坐9望6;差距僅3場(chǎng),7隊(duì)爭(zhēng)第12

CBA最新排名:北京沖第4失敗,遼寧坐9望6;差距僅3場(chǎng),7隊(duì)爭(zhēng)第12

兵哥籃球故事
2026-03-19 22:28:56
2026-03-20 21:52:49
動(dòng)點(diǎn)科技 incentive-icons
動(dòng)點(diǎn)科技
關(guān)注值得關(guān)注的科技創(chuàng)新
25539文章數(shù) 148795關(guān)注度
往期回顧 全部

科技要聞

新SU7只漲4千!雷軍:真怕交車慢挨罵

頭條要聞

頂樓從33層加蓋至35層 物業(yè):開發(fā)商稱樓頂屬業(yè)主私有

頭條要聞

頂樓從33層加蓋至35層 物業(yè):開發(fā)商稱樓頂屬業(yè)主私有

體育要聞

6年前的一場(chǎng)悲劇,造就了“法國(guó)瓦爾迪”

娛樂要聞

總臺(tái)首屆電影盛典,“沈馬”CP再合體

財(cái)經(jīng)要聞

金融法草案向社會(huì)公開征求意見

汽車要聞

何小鵬坦白局:每月3億的“慌”與通向L4的堅(jiān)定

態(tài)度原創(chuàng)

藝術(shù)
游戲
本地
旅游
家居

藝術(shù)要聞

吳昌碩『圓扇花卉』清新俊逸

PS+會(huì)員迎來超爽佳作!獲贊“長(zhǎng)久以來最佳”

本地新聞

春色滿城關(guān)不住|紹興春日頂流,這片櫻花海藏不住了

旅游要聞

泉水水位同比大幅上升,趵突泉、黑虎泉依然處于最佳賞泉期

家居要聞

時(shí)空交織 空間綺夢(mèng)

無障礙瀏覽 進(jìn)入關(guān)懷版