![]()
作者丨子墨
北京時(shí)間2026年2月27日凌晨,谷歌發(fā)布了最新圖像模型Nano Banana 2(以下簡稱NB 2),隨后立即在Artificial Analysis文生圖榜單上登頂,迅速引起行業(yè)熱議。
![]()
(2026.2.27 Artificial Analysis文生圖榜單排名情況)
Nano Banana自2025年8月上線至今,正好半年時(shí)間,已經(jīng)經(jīng)歷了3個(gè)版本,3個(gè)月更新一次,且每個(gè)版本都在之前的基礎(chǔ)上有了更強(qiáng)的AI屬性。
比如NB Pro版增加了思考模式;NB 2則在生成的速度與質(zhì)量上有了進(jìn)一步升級,更加突出“極速”和“一致性”概念,同時(shí)這也是Nano Banana首次在Flash極速系列模型中原生支持4K輸出(Pro系列雖然也支持4K,但其更注重于深度推理,生成速度通常比Flash慢)。
![]()
(Nano Banana系列模型全景圖,由Gemini生成)
生成速度與圖像畫質(zhì)一直是行業(yè)亟待突破的核心痛點(diǎn),NB 2究竟實(shí)現(xiàn)了哪些關(guān)鍵升級?又將為市場開辟出怎樣的新方向與新可能?
聯(lián)網(wǎng)搜索,還原“窗外”真實(shí)場景
首先,可以看到在NB 2的主頁面中增加了各種參考風(fēng)格模板,這是之前的版本中沒有的。而且這些圖并不是那種傳統(tǒng)的,像如二次元、像素風(fēng)、電影寫真一樣的分類,而是一種更具設(shè)計(jì)感、藝術(shù)感,帶有情感且更具象化的表述,比如哥特式粘土、超現(xiàn)實(shí)主義、老動畫片、神話戰(zhàn)士等等,在初始階段就為用戶提供了設(shè)計(jì)靈感。
![]()
(Nano Banana 2主頁參考模板圖)
這里,筆者選取了“Moody(憂郁情緒)”參考圖作為生成模板,以“少女坐在窗邊,側(cè)臉安靜憂郁,眼神放空,被日常瑣事困擾而情緒低落,柔和側(cè)光,簡約房間,安靜孤獨(dú)的氛圍,電影質(zhì)感,低飽和度,細(xì)膩唯美,治愈系插畫。”為提示詞,生成了下面這張圖。總耗時(shí)約20秒,速度比之前的Pro版本快了一些。
![]()
可以看出,整體畫面除了有較強(qiáng)的電影質(zhì)感外,“窗外”的風(fēng)景是非常寫實(shí)的,圖中的車輛、電線桿等元素,是符合女孩視角下“近大遠(yuǎn)小”邏輯的。這是NB 2在模型上相較于之前的一個(gè)細(xì)節(jié)方面的提升。它能夠通過網(wǎng)絡(luò)搜索來獲取圖像,以真實(shí)世界的景象作為參考,進(jìn)而創(chuàng)造出更加細(xì)節(jié)、寫實(shí)的視覺效果。
在谷歌的官方示例中,也對“窗邊座位”場景進(jìn)行了展示。NB 2能夠結(jié)合知識儲備與網(wǎng)絡(luò)檢索,根據(jù)全球各地的實(shí)時(shí)天氣數(shù)據(jù),生成更加逼真的窗外風(fēng)景。
![]()
(Nano Banana 2官方示例,圖源:谷歌)
一致性升級,連載創(chuàng)作不再“跑偏”?
其次,NB 2在“一致性”方面做了升級。在之前的版本中,同一個(gè)工作流內(nèi),對多角色或物體圖片進(jìn)行多次修改時(shí),一些物體變模糊或扭曲,角色面部會出現(xiàn)變形等情況,這也是大部分模型都面臨的痛點(diǎn)問題。
而在NB 2則能夠在同一個(gè)工作流中保持多達(dá)5個(gè)角色、14個(gè)物體的一致性。這意味著,用戶可以跨多場景、鏡頭展示內(nèi)容,十分適合于分鏡制作或連載創(chuàng)作。
而這種能力的提升也在于NB 2從Pro模型中引入的強(qiáng)推理能力和更嚴(yán)格的指令遵循。一方面,模型能夠通過初始的提示詞為每個(gè)角色定義獨(dú)特的物體特征,并在后續(xù)生成的圖片中識別并保留這些特定的內(nèi)容,避免在修改環(huán)境或動作時(shí),角色的形象發(fā)生改變。
另一方面,NB 2支持從512px到4K的多種分辨率和原生比例,在高精度的渲染下,確保了在復(fù)雜的視覺場景中,紋理、光照等細(xì)節(jié)在多次迭代中仍能保持穩(wěn)定。
筆者用“6只寵物在不同場景下旅行”作為案例,進(jìn)行了“一致性”測試。
初始提示詞為:3只貓、3只狗一起在熱帶海邊沙灘玩耍,藍(lán)天白云,清澈海水,夏日氛圍,每只寵物的品種有所差異,生動自然,高保真畫質(zhì)。生成圖片如下:
![]()
二次修改提示詞為:這些寵物一起漫步在彩色童話小鎮(zhèn),夢幻溫馨,可愛風(fēng)格,每只寵物外形與之前保持一致,位置和動作有所變化,細(xì)節(jié)豐富,光線柔和。生成圖片如下:
![]()
三次修改提示詞為:這些寵物們仰望星空,銀河璀璨,氛圍感拉滿,每只寵物外觀保持一致,動作和位置有所變化,史詩級畫面,超寫實(shí)。生成圖片如下:
![]()
可以發(fā)現(xiàn),在經(jīng)歷了2次場景、寵物動作及位置變化后,最初的6只寵物變成了5只,但保留的這5只雖然視角、動作、位置有所變化,但形象始終是保持一致的。不過,圖片中場景的AI感還是比較強(qiáng)的,寵物與場景的融合度還有待提升,目前還是存在類似影視劇中的“摳圖感”。
圖像中的本地化,設(shè)計(jì)中的多場景
除了上述在生成質(zhì)量和一致性方面的提升,NB 2還做了一些功能細(xì)節(jié)方面的優(yōu)化,為有專業(yè)設(shè)計(jì)需求的人提供服務(wù)。
比如模型支持了圖像內(nèi)容的本地化,即可直接在圖像中生成、翻譯多語言文字,同時(shí)模型也能理解并對畫面視覺內(nèi)容進(jìn)行本地化適配。這對于一些全球化的B端用戶來說,節(jié)省了不少重復(fù)修改的時(shí)間成本。
![]()
(Nano Banana 2多語言翻譯,圖源:谷歌)
此外,NB 2在原有生成圖像寬高比的基礎(chǔ)上,新增了4:1、1:4、8:1和1:8的比例,滿足更多元化的場景需求。比如4:1是非常典型的網(wǎng)頁橫幅尺寸,8:1則在地鐵、機(jī)場中極寬LED屏幕上較為常見。
百萬Token價(jià)格,直降50%
NB 2的多項(xiàng)升級或許需要更高頻使用才能深度感知,但價(jià)格卻是最直觀地顯現(xiàn)。它通過降低每百萬Token單價(jià)的方式,使生成成本相比之前的Pro版大幅降低。Pro版本的輸出單價(jià)為120美元/1M tokens,而NB 2僅為60美元,降幅達(dá)到50%。
且根據(jù)不同分辨率消耗不同的Token數(shù)量,相比于Pro版1K和2K統(tǒng)一價(jià)格,NB 2對低分辨率圖片的成本控制更優(yōu),特別是1K分辨率的圖片,價(jià)格相比之前降低了50%。
![]()
不同分辨率生成成本估算,圖表及數(shù)據(jù)均由Gemini生成
總的來說,NB 2的這次升級,核心在于提升了生成內(nèi)容的一致性與響應(yīng)速度。通過引入全網(wǎng)實(shí)時(shí)搜索,讓生成結(jié)果與現(xiàn)實(shí)世界的關(guān)聯(lián)更加緊密,并在本地化和多場景應(yīng)用上有了更明確的布局。
從上線首日的反饋來看,用戶最直觀的感受是“快”。雖然在圖像精細(xì)度上,人們可能還沒察覺到顯著變化,但這次迭代為市場帶來了新的思路:速度與質(zhì)量并非不可兼得。語義理解、推理能力以及實(shí)時(shí)搜索的加入,正在成為提升圖像質(zhì)量的關(guān)鍵要素。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.