![]()
作者 | 允毅
深夜炸場!文生圖圈又被谷歌“炸”了一次。Nano Banana 2 突然上線,直接登頂榜首。
這次,Nano Banana 2 主打“極速體驗”+“專業畫質”。但真正拉開差距的是一個新能力—“實時聯網”。
簡單來說,這不再是一個“只會畫畫”的模型。它背后接的是 Gemini 整套搜索能力,相當于給圖像模型裝上了一個能查資料的“大腦”。
當模型可以邊理解、邊檢索、邊生成,畫面就不只是“好看”,而是更貼合真實世界的信息結構。
![]()
比如,一句話生成的街景,細節多到能放大看招牌。遠處的廣告牌、路牌、櫥窗陳列都像是真實拍攝。
![]()
再比如,讓“劈柴哥”給你遞煙,人物神態、肢體邏輯、環境光影都到位。如果不說,很難一眼斷定是 AI 生成。
![]()
劈柴哥還親自站臺,Cue 了一下“靠窗座位”的玩法,只要一句話,無論是繁華都市夜景,還是荒野雪山木屋,你都能精準生成“窗口視角”的構圖,每一幀都基于真實的地理和氣象信息,清晰展現“實時聯網”能力有多強大。
![]()
不過,“畫得像”只是第一步。更重要的是,它打開了一個新方向“信息圖生成”,這可就非常實用了。
前段時間有個很火的模型梗:
我想洗車。洗車場離我 50 米。我應該走過去還是開車過去?
不少頂尖模型翻了車,給出“步行更環保”的答案。問題在哪?它們只分析了“50 米”,卻忽略了“洗車的目標”。
谷歌直接生成了一張圖,對比“走路”和“開車”的邏輯鏈,給出正確結論,既展現了 Gemini 的強大思考能力,還展現了 Banana2 的一流繪圖能力。網友表示“這是無聲的炫耀”。
![]()
在不少網友看來,圖像生成似乎又上了一個臺階,彌合了與真實世界之間的鴻溝。
![]()
![]()
不過也有網友對此表達了深刻擔憂,當圖像越來越難分真假,AI 造假會不會更泛濫?
對此,谷歌給出的方案是“溯源”。Nano Banana 2 生成的內容,會疊加 SynthID 水印,并結合 C2PA 內容憑證體系,方便平臺識別來源。
目前文生圖的追逐戰進入焦灼階段,在權威圖像模型測評 Artificial Analysis 榜單中,可以看到,前三名里兩個被 Nano Banana 系列包攬。其中,Nano Banana 2 位列第一,圖像編輯能力第三,價格卻只有第二名 OpenAI 的一半,堪稱“性價比之王”。
![]()
不過從分數看,頭部模型之間的差距其實非常小。行業已經進入貼身肉搏階段。
谷歌上個月披露,Gemini 應用月活躍用戶達到 6.5 億。官方高管也承認,Nano Banana 的“病毒式傳播”是增長的重要原因之一。
文生圖的競爭,已經不只是比畫面,而是比速度、比理解力、比生態整合。
網友玩嗨了,“實時聯網”
為文生圖帶來什么不同?
行或不行,上手再說。網友們從各種角度開始測評。
有人用來測試一張手鐲圖做視覺設計方案,結果令他震驚,直呼“設計已死”。
![]()
有人稱這是世界上最好的圖像模型,生成的圖片細節可以以假亂真。
![]()
有人驚呼,連圖片上每張卡片的文字都準確無誤。
![]()
有人干脆用來生成碑文,又快又好,效果震撼。
![]()
有網友認為,這次 Nanana2 的可控性太強了,人物細節貼合想要的效果,而且十分逼真。
![]()
而且人物無論怎么變化,都不會變形。
![]()
![]()
整體的視覺效果也更“去 AI 味”。
![]()
做繪本更是手到擒來。
![]()
人們似乎都被 Banana2 折服了。
在眾多測評中,大家還非常關心“實時聯網”這一新功能的升級,能“實時聯網”的圖到底和過去的生成圖有什么不同,強在哪里,又有多實用。
先來看官方案例。Banana 2 生成了一張頗具“手工風”的水循環示意圖:棉花做云、紙片當山、玻璃碗裝海水,質感細節到位。更關鍵的是,它不僅理解力在線,把蒸發、凝結、降水、匯集的完整鏈路講清楚了,而且文字標注也全部準確,對應關系清晰,沒有邏輯跳步。
![]()
還有網友拿它來制作食譜,效果同樣驚艷:排版、分區、步驟結構都像專業設計稿。她直言,大家低估了 Nano Banana 2 的“可視化能力”,這將顛覆信息圖表領域。
![]()
更詳細的食譜圖和科普圖也被陸續曬出。
![]()
![]()
甚至拿來做醫學解剖圖,也相當能打,手繪草圖秒變專業科普制圖。
![]()
這種將抽象概念可視化的能力,正在釋放文生圖更大的想象空間。它不再只是“生成好看的圖片”,而是開始承擔知識組織與表達的角色。
在教育里,抽象概念可以直接變成一張清晰的圖,學生不用啃厚書,一眼就能看懂邏輯。
在科研中,復雜的環境模型、氣候機制能快速變成示意圖,不同專業的人溝通更高效。
在政策匯報、企業報告和數據分析場景里,冗長材料也能被壓縮成重點明確的可視化內容,讓人迅速抓住核心......
它打開的就不僅是設計效率,而是表達效率。,讓復雜問題變得可被看見、被理解、被討論。
谷歌產品負責人 Logan Kilpatrick 也表示,實時聯網能力會催生大量新的應用場景。當模型不再只依賴訓練數據,而是可以調用最新信息進行理解與生成,圖像就不只是創作工具,而開始成為實時知識的表達界面。
![]()
Nano Banana 2 的全面升級
此次,Banana 2 除了“實時聯網”這個大升級外,還把文生圖多年來的幾個老痛點,集中補了一輪,功能全面升級。
![]()
比如在文本渲染和翻譯這塊,Banana2 解決了一個 AI 圖像的關鍵短板:畫面很好看,寫字就翻車。
這次 Nano Banana 2 明顯是下了狠功夫。生成的文字清晰、拼寫準確、排版自然,已經可以直接拿去做營銷海報、邀請函、賀卡,甚至產品宣傳圖,不用再手動修字。
它還支持圖中內容的翻譯和本地化。你可以直接把一張圖里的文字改成另一種語言,而畫面風格、排版結構依然保持一致。這對做全球化傳播的人來說,實用價值很高。
看官網案例中,無論是香水廣告中的品牌標識,還是櫥窗上的英文招牌,人身上的紋身,都幾乎看不出明顯 AI 痕跡。它不是“圖里帶點字”,而是“圖文一體生成”。
![]()
![]()
![]()
另一個大升級是主體一致性大幅提升。在一個工作流里,最多可以保持:
5 個角色的特征一致
14 個對象的高保真度穩定輸出
這意味著,比如你在做漫畫、品牌角色設定、系列海報,人物的臉不會一張一個樣,服裝不會莫名變化,場景里的物件不會反復“變形”。
看官方案例中不同動物角色,無論動作、神態如何變化,都能保持一致。
![]()
![]()
即使轉換視角,也依然保持穩定。
![]()
更有意思的是,它還可以自由換紋理、換材質,大膽“變色”。
比如一只“香蕉恐龍”。
![]()
松鼠餅干
![]()
水母跑車、拉面跑車。
![]()
做游戲頁面時,也能快速切換不同視覺風格。
![]()
Nano Banana 2 這次還在分辨率和畫幅上下了功夫。
從 512px 到 4K,多分辨率可選。值得注意的是,這次新增了 512px 檔位,專門針對低延遲和高負載場景優化。如果你需要批量快速生成、反復迭代草圖,這個分辨率就是效率檔
畫幅比例也更豐富,除了常規比例,還新增了 4:1、1:4、8:1、1:8...... 橫幅廣告、超長信息流卡片、豎屏長圖,都可以原生生成,不需要再后期裁切。
![]()
可以生成超長畫面。
![]()
![]()
Nano Banana 2 不再只是“創意玩具”,而更像一個可控的圖像渲染引擎。對普通用戶來說是更好用;對企業來說,是更可規模化。
而且在視覺效果上,畫面質量也全面升級,趨向可用級別。
光影更自然
材質更豐富
細節更銳利
![]()
![]()
目前,它已經在 Google 產品體系里完成替換。
Gemini 默認出圖能力更新
AI Mode 和 Lens 覆蓋 141 個新增國家和地區
支持額外 8 種語言
在 Google Ads 中成為廣告生成建議能力
不過也有網友表示,使用完體驗一般,要求換回 Pro 或一代版本。
![]()
感興趣的讀者,可以速速體驗一下。
https://gemini.google/tw/overview/image-generation/?hl=zh-TW
https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/
聲明:本文為 AI 前線整理,不代表平臺觀點,未經許可禁止轉載。
會議推薦
2026,AI 正在以更工程化的方式深度融入軟件生產,Agentic AI 的探索也將從局部試點邁向體系化工程建設!
QCon 北京 2026 已正式啟動,本屆大會以“Agentic AI 時代的軟件工程重塑”為核心主線,推動技術探索從「AI For What」真正落地到可持續的「Value From AI」。從前沿技術雷達、架構設計與數據底座、效能與成本、產品與交互、可信落地、研發組織進化六大維度,系統性展開深度探索。開往 2026 的 Agentic AI 專列即將啟程!匯聚頂尖專家實戰分享,把 AI 能力一次夯到位!
今日薦文
你也「在看」嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.