![]()
新智元報(bào)道
編輯:艾倫
【新智元導(dǎo)讀】Gemini 終于推出桌面客戶端了!除了能做網(wǎng)頁(yè)端的一切,它的殺手锏是能捕捉屏幕上所有窗口,突破瀏覽器限制,把一切都裝進(jìn)模型上下文,幫你解讀一切。
這兩年只要聊桌面 AI 助手,大家腦子里先跳出來(lái)的,基本都是 ChatGPT 和 Claude。
前者早早把客戶端鋪進(jìn) Mac,后者也早就把桌面入口做出來(lái)了。
結(jié)果谷歌這邊,Gemini 一直掛在網(wǎng)頁(yè)里,多少有點(diǎn)擰巴。
模型聲量很大,桌面存在感卻一直差口氣。
現(xiàn)在,這個(gè)坑終于補(bǔ)上了。
谷歌正式推出 Gemini 的 macOS 原生客戶端,支持全局快捷鍵拉起,也能直接共享當(dāng)前窗口。
![]()
https://gemini.google/mac/
這件事其實(shí)分量很重。
因?yàn)榫W(wǎng)頁(yè)端再?gòu)?qiáng),終究還是網(wǎng)頁(yè)端。
你得先開(kāi)瀏覽器,找到那個(gè)標(biāo)簽頁(yè),切進(jìn)去,問(wèn)完,再切出來(lái)。
整個(gè)過(guò)程是破碎的,像是臨時(shí)找人幫個(gè)忙。
客戶端不一樣,它會(huì)一直貼在桌面邊上,像一個(gè)隨時(shí)能被叫出來(lái)的桌寵。
只要這個(gè)入口真的常駐,Gemini 后面才有機(jī)會(huì)突破瀏覽器的殼,去碰文檔,碰表格,碰代碼窗口,碰你當(dāng)下正在處理的那堆東西。
很多朋友可能會(huì)覺(jué)得,不就是多了個(gè) App 嗎,有這么夸張嗎。
還真有。
因?yàn)榻裉齑蠹覡?zhēng)的早就不是誰(shuí)會(huì)聊天,誰(shuí)會(huì)寫(xiě)個(gè)郵件,誰(shuí)能做總結(jié)。
大家爭(zhēng)的是誰(shuí)能離工作流更近,誰(shuí)能更像一個(gè)一直在屏幕邊上待命的助手。
Gemini 現(xiàn)在終于也坐到這張桌子上了。
官方到底發(fā)了啥,亮點(diǎn)在哪
先看官方公告。
第一,Gemini Mac 版是原生客戶端,不是網(wǎng)頁(yè)殼套個(gè)桌面圖標(biāo)糊弄一下。
谷歌官方說(shuō),這是原生 macOS 體驗(yàn)。
Gemini 產(chǎn)品負(fù)責(zé)人 Josh Woodward 也在 X 上透露:一個(gè)小團(tuán)隊(duì),不到 100 天,做了 100 多個(gè)功能,還是 100% 原生 Swift。
![]()
https://x.com/joshwoodward/status/2044452201947627709
這個(gè)表態(tài)挺有意思,潛臺(tái)詞很明顯,谷歌知道大家對(duì)桌面端這件事已經(jīng)催很久了,所以這次要先把使用體驗(yàn)等基本盤給穩(wěn)住。
第二,Gemini 終于能從任何界面被叫出來(lái)了。
Option + Space,直接拉起迷你聊天窗口。
![]()
Option + Shift + Space,進(jìn)入完整聊天界面。
![]()
![]()
淺色主題挺漂亮的,深色主題也相比網(wǎng)頁(yè)端更驚艷了,背景從灰色變成純黑色。
![]()
客戶端
![]()
網(wǎng)頁(yè)端
這個(gè)設(shè)計(jì)有點(diǎn)像把 Gemini 塞進(jìn)了蘋(píng)果搜索 Spotlight 那個(gè)位置。
你在寫(xiě)方案也好,看財(cái)報(bào)也好,做表格也好,腦子里突然卡一下,想問(wèn)個(gè)日期、公式、思路、翻譯、靈感,手不用離開(kāi)當(dāng)前工作區(qū)太遠(yuǎn),Gemini 就彈出來(lái)了。
這種低摩擦感,往往比模型參數(shù)更能決定一個(gè)產(chǎn)品會(huì)不會(huì)被高頻使用。
第三,也是這次最關(guān)鍵的一點(diǎn),Gemini 可以直接看你正在看的東西了。
官方給了窗口共享功能。
![]()
需要先授予客戶端所需的兩個(gè)權(quán)限。
![]()
你可以把某個(gè)窗口分享給 Gemini,它就能基于眼前這塊內(nèi)容給反饋。
![]()
被分享的 ChatGPT 窗口
![]()
Gemini 對(duì)被分享的窗口的解讀
看一張復(fù)雜圖表,問(wèn)它這三個(gè)最大結(jié)論是什么。
盯著一段代碼,問(wèn)它這里可能哪里有坑。
開(kāi)著一個(gè)文檔,直接讓它提煉重點(diǎn)。
看一段視頻,讓它總結(jié)視頻要點(diǎn)。
![]()
這個(gè)動(dòng)作一旦成立,整個(gè)交互邏輯就變了。
過(guò)去是你把上下文搬給 AI,現(xiàn)在是 AI 開(kāi)始主動(dòng)觸及到上下文。
這個(gè)變化的影響很大。
再順著往下看,官方落地頁(yè)還提到幾個(gè)細(xì)節(jié)。
支持所有 Gemini 支持的語(yǔ)言和國(guó)家地區(qū);免費(fèi)提供;要求 macOS 15 及以上;只支持 Apple M 系列芯片;同賬號(hào)下的聊天記錄和記憶可以同步。
網(wǎng)頁(yè)端能做的,Gemini 客戶端統(tǒng)統(tǒng)能做。
這次不是單純給網(wǎng)頁(yè)端裝了個(gè)殼,更像是把 Gemini 整套能力重新嵌進(jìn) Mac 工作流。
回到普通用戶這邊,這些信息最后會(huì)落到一個(gè)特別樸素的體驗(yàn)上。
少切一次網(wǎng)頁(yè)、少找一次標(biāo)簽頁(yè)、少?gòu)?fù)制一次截圖和內(nèi)容、少打幾句前情提要。
你別小看這幾個(gè)「少」字,很多產(chǎn)品最后能不能留下來(lái),就差在這里。
看起來(lái)很美
但 Gemini 離真正的助手還差一點(diǎn)
當(dāng)然,聊到這里,得潑一點(diǎn)冷水。
這次 Gemini 上 Mac,肯定是好事,而且是遲早要發(fā)生的事。
可如果把它放進(jìn)今天這場(chǎng)桌面 AI 混戰(zhàn)里看,現(xiàn)在這版 Gemini,更像一個(gè)終于學(xué)會(huì)常駐桌面的聊天助手,一個(gè)更快、更順手、能看屏幕內(nèi)容的入口層。
它很重要,但還沒(méi)有進(jìn)化到 Claude 和 ChatGPT 那種讓人一拍大腿的程度。
差在哪?
差在 Computer Use(電腦操作)這口氣還沒(méi)續(xù)上。
Gemini 已經(jīng)嵌入 Chrome 瀏覽器并默認(rèn)開(kāi)啟,讀取網(wǎng)頁(yè)上下文沒(méi)有問(wèn)題了。
![]()
Gemini Mac 版現(xiàn)在能做的是從任何界面拉起、共享窗口、基于上下文回答問(wèn)題,但 Claude 和 ChatGPT 的 Mac 體驗(yàn)早就已經(jīng)在往更深的電腦操作能力走了。
Gemini 已經(jīng)從瀏覽器里走出來(lái)了,但離真正能幫你在電腦上連續(xù)干活,還差一段路。
這段路很關(guān)鍵。
因?yàn)樽烂?AI 走到最后,拼的絕對(duì)不只是懸浮窗做得漂不漂亮,快捷鍵順不順手。
拼的是它能不能真的讀懂你的屏幕,理解你在干嘛,然后跨多個(gè) App 去主動(dòng)接活,去執(zhí)行,去把一連串動(dòng)作串起來(lái)。
今天的 Gemini,已經(jīng)摸到了門把手。
Claude 和 ChatGPT,已經(jīng)把門推開(kāi)了一點(diǎn)。
Gemini 后面大概率也會(huì)補(bǔ)上這一塊的能力。
谷歌官方博客自己都說(shuō)了,首發(fā)版只是開(kāi)始,接下來(lái)幾個(gè)月還會(huì)有更多消息。
窗口共享是第一層,全局快捷鍵是第二層,跨 App 理解和執(zhí)行是第三層。
現(xiàn)在谷歌總算把前兩層搭起來(lái)了。
剩下那層最香的,估計(jì)還得等等。
總之,Gemini,總算住進(jìn) Mac 了。
參考資料:
https://blog.google/innovation-and-ai/products/gemini-app/gemini-app-now-on-mac-os/
https://gemini.google/mac/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.