網易首頁 > 網易號 > 正文申請入駐

谷歌 Nano Banana 2 一夜補齊短板，各種圖解都能畫，價格才是 OpenAI 一半

2026-02-27 11:01:01　來源: AI前線

北京舉報

分享至

作者 | 允毅

深夜炸場！文生圖圈又被谷歌“炸”了一次。Nano Banana 2 突然上線，直接登頂榜首。

這次，Nano Banana 2 主打“極速體驗”+“專業畫質”。但真正拉開差距的是一個新能力—“實時聯網”。

簡單來說，這不再是一個“只會畫畫”的模型。它背后接的是 Gemini 整套搜索能力，相當于給圖像模型裝上了一個能查資料的“大腦”。

當模型可以邊理解、邊檢索、邊生成，畫面就不只是“好看”，而是更貼合真實世界的信息結構。

比如，一句話生成的街景，細節多到能放大看招牌。遠處的廣告牌、路牌、櫥窗陳列都像是真實拍攝。

再比如，讓“劈柴哥”給你遞煙，人物神態、肢體邏輯、環境光影都到位。如果不說，很難一眼斷定是 AI 生成。

劈柴哥還親自站臺，Cue 了一下“靠窗座位”的玩法，只要一句話，無論是繁華都市夜景，還是荒野雪山木屋，你都能精準生成“窗口視角”的構圖，每一幀都基于真實的地理和氣象信息，清晰展現“實時聯網”能力有多強大。

不過，“畫得像”只是第一步。更重要的是，它打開了一個新方向“信息圖生成”，這可就非常實用了。

前段時間有個很火的模型梗：

我想洗車。洗車場離我 50 米。我應該走過去還是開車過去？

不少頂尖模型翻了車，給出“步行更環保”的答案。問題在哪？它們只分析了“50 米”，卻忽略了“洗車的目標”。

谷歌直接生成了一張圖，對比“走路”和“開車”的邏輯鏈，給出正確結論，既展現了 Gemini 的強大思考能力，還展現了 Banana2 的一流繪圖能力。網友表示“這是無聲的炫耀”。

在不少網友看來，圖像生成似乎又上了一個臺階，彌合了與真實世界之間的鴻溝。

不過也有網友對此表達了深刻擔憂，當圖像越來越難分真假，AI 造假會不會更泛濫？

對此，谷歌給出的方案是“溯源”。Nano Banana 2 生成的內容，會疊加 SynthID 水印，并結合 C2PA 內容憑證體系，方便平臺識別來源。

目前文生圖的追逐戰進入焦灼階段，在權威圖像模型測評 Artificial Analysis 榜單中，可以看到，前三名里兩個被 Nano Banana 系列包攬。其中，Nano Banana 2 位列第一，圖像編輯能力第三，價格卻只有第二名 OpenAI 的一半，堪稱“性價比之王”。

不過從分數看，頭部模型之間的差距其實非常小。行業已經進入貼身肉搏階段。

谷歌上個月披露，Gemini 應用月活躍用戶達到 6.5 億。官方高管也承認，Nano Banana 的“病毒式傳播”是增長的重要原因之一。

文生圖的競爭，已經不只是比畫面，而是比速度、比理解力、比生態整合。

網友玩嗨了，“實時聯網”

為文生圖帶來什么不同？

行或不行，上手再說。網友們從各種角度開始測評。

有人用來測試一張手鐲圖做視覺設計方案，結果令他震驚，直呼“設計已死”。

有人稱這是世界上最好的圖像模型，生成的圖片細節可以以假亂真。

有人驚呼，連圖片上每張卡片的文字都準確無誤。

有人干脆用來生成碑文，又快又好，效果震撼。

有網友認為，這次 Nanana2 的可控性太強了，人物細節貼合想要的效果，而且十分逼真。

而且人物無論怎么變化，都不會變形。

整體的視覺效果也更“去 AI 味”。

做繪本更是手到擒來。

人們似乎都被 Banana2 折服了。

在眾多測評中，大家還非常關心“實時聯網”這一新功能的升級，能“實時聯網”的圖到底和過去的生成圖有什么不同，強在哪里，又有多實用。

先來看官方案例。Banana 2 生成了一張頗具“手工風”的水循環示意圖：棉花做云、紙片當山、玻璃碗裝海水，質感細節到位。更關鍵的是，它不僅理解力在線，把蒸發、凝結、降水、匯集的完整鏈路講清楚了，而且文字標注也全部準確，對應關系清晰，沒有邏輯跳步。

還有網友拿它來制作食譜，效果同樣驚艷：排版、分區、步驟結構都像專業設計稿。她直言，大家低估了 Nano Banana 2 的“可視化能力”，這將顛覆信息圖表領域。

更詳細的食譜圖和科普圖也被陸續曬出。

甚至拿來做醫學解剖圖，也相當能打，手繪草圖秒變專業科普制圖。

這種將抽象概念可視化的能力，正在釋放文生圖更大的想象空間。它不再只是“生成好看的圖片”，而是開始承擔知識組織與表達的角色。

在教育里，抽象概念可以直接變成一張清晰的圖，學生不用啃厚書，一眼就能看懂邏輯。
在科研中，復雜的環境模型、氣候機制能快速變成示意圖，不同專業的人溝通更高效。
在政策匯報、企業報告和數據分析場景里，冗長材料也能被壓縮成重點明確的可視化內容，讓人迅速抓住核心......

它打開的就不僅是設計效率，而是表達效率。，讓復雜問題變得可被看見、被理解、被討論。

谷歌產品負責人 Logan Kilpatrick 也表示，實時聯網能力會催生大量新的應用場景。當模型不再只依賴訓練數據，而是可以調用最新信息進行理解與生成，圖像就不只是創作工具，而開始成為實時知識的表達界面。

Nano Banana 2 的全面升級

此次，Banana 2 除了“實時聯網”這個大升級外，還把文生圖多年來的幾個老痛點，集中補了一輪，功能全面升級。

比如在文本渲染和翻譯這塊，Banana2 解決了一個 AI 圖像的關鍵短板：畫面很好看，寫字就翻車。

這次 Nano Banana 2 明顯是下了狠功夫。生成的文字清晰、拼寫準確、排版自然，已經可以直接拿去做營銷海報、邀請函、賀卡，甚至產品宣傳圖，不用再手動修字。

它還支持圖中內容的翻譯和本地化。你可以直接把一張圖里的文字改成另一種語言，而畫面風格、排版結構依然保持一致。這對做全球化傳播的人來說，實用價值很高。

看官網案例中，無論是香水廣告中的品牌標識，還是櫥窗上的英文招牌，人身上的紋身，都幾乎看不出明顯 AI 痕跡。它不是“圖里帶點字”，而是“圖文一體生成”。

另一個大升級是主體一致性大幅提升。在一個工作流里，最多可以保持：

5 個角色的特征一致
14 個對象的高保真度穩定輸出

這意味著，比如你在做漫畫、品牌角色設定、系列海報，人物的臉不會一張一個樣，服裝不會莫名變化，場景里的物件不會反復“變形”。

看官方案例中不同動物角色，無論動作、神態如何變化，都能保持一致。

即使轉換視角，也依然保持穩定。

更有意思的是，它還可以自由換紋理、換材質，大膽“變色”。

比如一只“香蕉恐龍”。

松鼠餅干

水母跑車、拉面跑車。

做游戲頁面時，也能快速切換不同視覺風格。

Nano Banana 2 這次還在分辨率和畫幅上下了功夫。

從 512px 到 4K，多分辨率可選。值得注意的是，這次新增了 512px 檔位，專門針對低延遲和高負載場景優化。如果你需要批量快速生成、反復迭代草圖，這個分辨率就是效率檔

畫幅比例也更豐富，除了常規比例，還新增了 4:1、1:4、8:1、1:8...... 橫幅廣告、超長信息流卡片、豎屏長圖，都可以原生生成，不需要再后期裁切。

可以生成超長畫面。

Nano Banana 2 不再只是“創意玩具”，而更像一個可控的圖像渲染引擎。對普通用戶來說是更好用；對企業來說，是更可規模化。

而且在視覺效果上，畫面質量也全面升級，趨向可用級別。

光影更自然
材質更豐富
細節更銳利

目前，它已經在 Google 產品體系里完成替換。

Gemini 默認出圖能力更新
AI Mode 和 Lens 覆蓋 141 個新增國家和地區
支持額外 8 種語言
在 Google Ads 中成為廣告生成建議能力

不過也有網友表示，使用完體驗一般，要求換回 Pro 或一代版本。

感興趣的讀者，可以速速體驗一下。

https://gemini.google/tw/overview/image-generation/?hl=zh-TW

https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/

聲明：本文為 AI 前線整理，不代表平臺觀點，未經許可禁止轉載。

會議推薦

2026，AI 正在以更工程化的方式深度融入軟件生產，Agentic AI 的探索也將從局部試點邁向體系化工程建設！

QCon 北京 2026 已正式啟動，本屆大會以“Agentic AI 時代的軟件工程重塑”為核心主線，推動技術探索從「AI For What」真正落地到可持續的「Value From AI」。從前沿技術雷達、架構設計與數據底座、效能與成本、產品與交互、可信落地、研發組織進化六大維度，系統性展開深度探索。開往 2026 的 Agentic AI 專列即將啟程！匯聚頂尖專家實戰分享，把 AI 能力一次夯到位！

今日薦文

你也「在看」嗎？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.