![]()
新智元報道
編輯:艾倫
【新智元導讀】Gemini 終于推出桌面客戶端了!除了能做網頁端的一切,它的殺手锏是能捕捉屏幕上所有窗口,突破瀏覽器限制,把一切都裝進模型上下文,幫你解讀一切。
這兩年只要聊桌面 AI 助手,大家腦子里先跳出來的,基本都是 ChatGPT 和 Claude。
前者早早把客戶端鋪進 Mac,后者也早就把桌面入口做出來了。
結果谷歌這邊,Gemini 一直掛在網頁里,多少有點擰巴。
模型聲量很大,桌面存在感卻一直差口氣。
現在,這個坑終于補上了。
谷歌正式推出 Gemini 的 macOS 原生客戶端,支持全局快捷鍵拉起,也能直接共享當前窗口。
![]()
https://gemini.google/mac/
這件事其實分量很重。
因為網頁端再強,終究還是網頁端。
你得先開瀏覽器,找到那個標簽頁,切進去,問完,再切出來。
整個過程是破碎的,像是臨時找人幫個忙。
客戶端不一樣,它會一直貼在桌面邊上,像一個隨時能被叫出來的桌寵。
只要這個入口真的常駐,Gemini 后面才有機會突破瀏覽器的殼,去碰文檔,碰表格,碰代碼窗口,碰你當下正在處理的那堆東西。
很多朋友可能會覺得,不就是多了個 App 嗎,有這么夸張嗎。
還真有。
因為今天大家爭的早就不是誰會聊天,誰會寫個郵件,誰能做總結。
大家爭的是誰能離工作流更近,誰能更像一個一直在屏幕邊上待命的助手。
Gemini 現在終于也坐到這張桌子上了。
官方到底發了啥,亮點在哪
先看官方公告。
第一,Gemini Mac 版是原生客戶端,不是網頁殼套個桌面圖標糊弄一下。
谷歌官方說,這是原生 macOS 體驗。
Gemini 產品負責人 Josh Woodward 也在 X 上透露:一個小團隊,不到 100 天,做了 100 多個功能,還是 100% 原生 Swift。
![]()
https://x.com/joshwoodward/status/2044452201947627709
這個表態挺有意思,潛臺詞很明顯,谷歌知道大家對桌面端這件事已經催很久了,所以這次要先把使用體驗等基本盤給穩住。
第二,Gemini 終于能從任何界面被叫出來了。
Option + Space,直接拉起迷你聊天窗口。
![]()
Option + Shift + Space,進入完整聊天界面。
![]()
![]()
淺色主題挺漂亮的,深色主題也相比網頁端更驚艷了,背景從灰色變成純黑色。
![]()
客戶端
![]()
網頁端
這個設計有點像把 Gemini 塞進了蘋果搜索 Spotlight 那個位置。
你在寫方案也好,看財報也好,做表格也好,腦子里突然卡一下,想問個日期、公式、思路、翻譯、靈感,手不用離開當前工作區太遠,Gemini 就彈出來了。
這種低摩擦感,往往比模型參數更能決定一個產品會不會被高頻使用。
第三,也是這次最關鍵的一點,Gemini 可以直接看你正在看的東西了。
官方給了窗口共享功能。
![]()
需要先授予客戶端所需的兩個權限。
![]()
你可以把某個窗口分享給 Gemini,它就能基于眼前這塊內容給反饋。
![]()
被分享的 ChatGPT 窗口
![]()
Gemini 對被分享的窗口的解讀
看一張復雜圖表,問它這三個最大結論是什么。
盯著一段代碼,問它這里可能哪里有坑。
開著一個文檔,直接讓它提煉重點。
看一段視頻,讓它總結視頻要點。
![]()
這個動作一旦成立,整個交互邏輯就變了。
過去是你把上下文搬給 AI,現在是 AI 開始主動觸及到上下文。
這個變化的影響很大。
再順著往下看,官方落地頁還提到幾個細節。
支持所有 Gemini 支持的語言和國家地區;免費提供;要求 macOS 15 及以上;只支持 Apple M 系列芯片;同賬號下的聊天記錄和記憶可以同步。
網頁端能做的,Gemini 客戶端統統能做。
這次不是單純給網頁端裝了個殼,更像是把 Gemini 整套能力重新嵌進 Mac 工作流。
回到普通用戶這邊,這些信息最后會落到一個特別樸素的體驗上。
少切一次網頁、少找一次標簽頁、少復制一次截圖和內容、少打幾句前情提要。
你別小看這幾個「少」字,很多產品最后能不能留下來,就差在這里。
看起來很美
但 Gemini 離真正的助手還差一點
當然,聊到這里,得潑一點冷水。
這次 Gemini 上 Mac,肯定是好事,而且是遲早要發生的事。
可如果把它放進今天這場桌面 AI 混戰里看,現在這版 Gemini,更像一個終于學會常駐桌面的聊天助手,一個更快、更順手、能看屏幕內容的入口層。
它很重要,但還沒有進化到 Claude 和 ChatGPT 那種讓人一拍大腿的程度。
差在哪?
差在 Computer Use(電腦操作)這口氣還沒續上。
Gemini 已經嵌入 Chrome 瀏覽器并默認開啟,讀取網頁上下文沒有問題了。
![]()
Gemini Mac 版現在能做的是從任何界面拉起、共享窗口、基于上下文回答問題,但 Claude 和 ChatGPT 的 Mac 體驗早就已經在往更深的電腦操作能力走了。
Gemini 已經從瀏覽器里走出來了,但離真正能幫你在電腦上連續干活,還差一段路。
這段路很關鍵。
因為桌面 AI 走到最后,拼的絕對不只是懸浮窗做得漂不漂亮,快捷鍵順不順手。
拼的是它能不能真的讀懂你的屏幕,理解你在干嘛,然后跨多個 App 去主動接活,去執行,去把一連串動作串起來。
今天的 Gemini,已經摸到了門把手。
Claude 和 ChatGPT,已經把門推開了一點。
Gemini 后面大概率也會補上這一塊的能力。
谷歌官方博客自己都說了,首發版只是開始,接下來幾個月還會有更多消息。
窗口共享是第一層,全局快捷鍵是第二層,跨 App 理解和執行是第三層。
現在谷歌總算把前兩層搭起來了。
剩下那層最香的,估計還得等等。
總之,Gemini,總算住進 Mac 了。
參考資料:
https://blog.google/innovation-and-ai/products/gemini-app/gemini-app-now-on-mac-os/
https://gemini.google/mac/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.