★ 設(shè)為星標(biāo) | 只講人話,帶你玩轉(zhuǎn)AIGC。
就在今天,OpenAI 終于把它的 GPT Image 1.5 抬上來(lái)了!
說(shuō)實(shí)話,在 Nano Banana Pro(以下簡(jiǎn)稱 NBP)已經(jīng)強(qiáng)到“殺瘋了”的今天,我甚至是帶著一種“挑刺”的心態(tài)點(diǎn)開更新的:
OpenAI,你這次到底能不能行?
是能一舉奪回王座,還是像上次一樣“發(fā)布會(huì)猛如虎,實(shí)測(cè)二百五”?
話不多說(shuō),我肝了一個(gè)通宵,直接上號(hào),殘酷實(shí)測(cè)走起。
精準(zhǔn)修圖,誰(shuí)更聽話?
大家玩 AI 繪圖最頭疼的是什么?肯定是“一改就廢”。明明只想給小姐姐換個(gè)發(fā)型,結(jié)果圖一出來(lái),臉都給換了,這誰(shuí)受得了?
OpenAI 的宣傳片倒是吹得很神:指哪打哪,完美保留角色形象。但這畢竟是“買家秀”,實(shí)際上手效果如何?
為了不冤枉它,我特地隨機(jī)選了一個(gè)路人人物做測(cè)試。
![]()
圖:測(cè)試用素材圖
先來(lái)個(gè)最簡(jiǎn)單的:換發(fā)型
![]()
提示詞:基于這張圖片,將人物的發(fā)型改為齊肩的紅棕色波波頭(Bob頭)。請(qǐng)務(wù)必保留頭發(fā)被風(fēng)吹起的動(dòng)態(tài)效果和陽(yáng)光照射在頭發(fā)上的強(qiáng)烈高光。人物的面部表情、衣服、姿勢(shì)和背景需完全保持不變。
GPT 跑出來(lái)的第一張圖,乍一看還真不錯(cuò):人物沒變,衣服沒變,發(fā)型也確實(shí)換成了波波頭,看著挺自然。
但俗話說(shuō)得好,不怕不識(shí)貨,就怕貨比貨。
我們拉出隔壁的 NBP 來(lái)跑同樣的詞:
![]()
圖:對(duì)比圖
坦率講,把兩張圖放在我的 4K 大屏上一對(duì)比,差距瞬間就出來(lái)了:
GPT 這邊: 臉部光影明顯偏暗,甚至出現(xiàn)了肉眼可見的色斑(這是什么鬼?),皮膚質(zhì)感有點(diǎn)臟。
NBP 這邊: 皮膚通透,頭發(fā)上的高光處理得非常細(xì)膩,明顯贏麻了。
第一局結(jié)論: 雖然 GPT 聽懂了指令,但在畫質(zhì)和光影細(xì)節(jié)上,NBP 依然略勝一籌。
多圖一致性,二哈能拆家嗎?
再來(lái)試個(gè)更有難度的:換裝 + 多圖融合。
![]()
提示詞:將人物身上的藍(lán)色條紋襯衫替換為一件米白色的亞麻質(zhì)地休閑西裝外套,內(nèi)搭一件白色圓領(lǐng)T恤。保持她倚靠欄桿的姿勢(shì)不變。新的衣物上需要有符合當(dāng)前強(qiáng)烈側(cè)光照明的自然褶皺和陰影。人物頭部和背景保持不變。
我試著給人物換了套衣服,GPT 的表現(xiàn)依然穩(wěn)定,形象保持得很好。
但在光影邏輯上,還是老毛病——有點(diǎn)“平”。
不過(guò)這里 NBP把原圖的道具給搞丟了……
接著,我開始給它上點(diǎn)難度了:多圖融合。
我找了兩張女生圖和一張動(dòng)物圖,要求它們?nèi)诤显谝黄稹?/p>
![]()
圖:多圖融合示例
![]()
圖:多圖融合對(duì)比
不得不承認(rèn),這個(gè)環(huán)節(jié)我更喜歡 GPT。
它的融合能力簡(jiǎn)直驚艷,整張圖片的質(zhì)感非常像一張真實(shí)的電影劇照,那種“無(wú)聊和疲憊”的氛圍感拿捏得死死的。
而 NBP 這邊……怎么說(shuō)呢?
現(xiàn)在,加入調(diào)皮的二哈試試。
![]()
提示詞:保持這兩位女士和動(dòng)物的姿勢(shì)、表情完全不變。在背景中添加幾只正在瘋狂拆家的哈士奇,它們正在撕咬沙發(fā)靠墊和跑來(lái)跑去,讓場(chǎng)面看起來(lái)極其混亂。
這個(gè)部分我更喜歡 NBP了,GPT 加入的二哈過(guò)于瘋狂,感覺有點(diǎn)失真。
但他們?cè)诙噍喚庉嬛校己芎玫难永m(xù)了之前的形象和風(fēng)格。
既然融合能力不錯(cuò),那拿來(lái)做電影海報(bào)怎么樣?
我讓它設(shè)計(jì)一張 1950 年代好萊塢風(fēng)格的電影海報(bào),標(biāo)題叫《THE ALGORITHM》(算法)。
效果直接驚艷到我了:
![]()
圖:英文海報(bào)
利用這三張圖片(兩張女生和一張動(dòng)物),制作一張 1950 年代好萊塢黃金時(shí)期的電影海報(bào)。
電影標(biāo)題: 海報(bào)上方用復(fù)古的大寫襯線體展示電影名為 "THE ALGORITHM" (算法)。
角色設(shè)定: 將兩位女生設(shè)計(jì)為經(jīng)典的黑色電影(Film Noir)女主角,穿著優(yōu)雅的絲綢晚禮服,波浪卷發(fā)。將那只動(dòng)物設(shè)計(jì)為她們神秘的同伴,脖子上戴著鉆石項(xiàng)圈。
演職員表: 在底部添加演職員文字:
Starring: The Neural Sisters (左) & The Beast (右)
Directed by: Sam Altman
Produced by: OpenAI Studios
風(fēng)格: 手繪海報(bào)質(zhì)感,強(qiáng)烈的明暗對(duì)比(Chiaroscuro),略帶褪色的特藝彩色(Technicolor)色調(diào)。
不得不說(shuō),這海報(bào)挺有感覺的,但似乎人物形象已經(jīng)對(duì)不上了。而且,這個(gè)尺度怎么突然提升了。
用中文發(fā)現(xiàn),不僅尺度小了,字幾乎是災(zāi)難。。(這個(gè)后面具體講)
![]()
圖:GPT 的中文海報(bào)
變態(tài)指令遵循,誰(shuí)腦子更好使?
GPT Image 1.5 有很強(qiáng)的指令遵循能力。
來(lái)給它一點(diǎn)難度:6x6 網(wǎng)格挑戰(zhàn)。
這非常考驗(yàn) AI 的邏輯理解能力。我要求它嚴(yán)格按照 6 行 6 列的格式,每一個(gè)格子里畫出指定的東西(比如菠蘿、宇航員、Wi-Fi圖標(biāo)等)。
![]()
提示詞:畫一個(gè) 6x6 的網(wǎng)格 創(chuàng)建一個(gè) 6 列 x 6 行的網(wǎng)格,網(wǎng)格內(nèi)容如下:第一排:希臘字母Ω、一個(gè)熱氣球、菠蘿、宇航員、水晶球、變色龍 第二排:一只蜘蛛、老式懷表、淋浴噴頭、望遠(yuǎn)鏡、一只孔雀、一張藏寶圖 第三行:一枚紀(jì)念幣、一面圓鏡子、一杯冒熱氣的咖啡、“希望”一詞、滑板、字母K 第四排:洗衣機(jī)、游樂園代幣、Wi-Fi圖標(biāo)、一支口紅、螳螂、棒球帽 第五行:電源圖標(biāo)、數(shù)字8、紅色鉆石、樂高積木人、火烈鳥、維京頭盔 第6行:一只橘貓、滅火器、一個(gè)錨、游戲手柄、卷紙、數(shù)字88
除了中文,它做得的確完美。
看看 NBP,雖然中文對(duì)了。但這哪里是 6x6 宮格?
數(shù)學(xué)是體育老師教的嗎?格局完全亂了。
![]()
圖:NBP 生成的 6 宮格
這一局:GPT 險(xiǎn)勝,贏在邏輯,輸在中文。
真正的硬傷是文字
大家都知道,NBP 幾乎徹底的解決了文字難題,不論中英文。
OpenAI 也不甘示弱,給了一個(gè)非常復(fù)雜的多字的案例,但其實(shí) NBP 設(shè)置完整得更好。
![]()
圖:文字處理對(duì)比
而換成中文,GPT 就是個(gè)災(zāi)難,不過(guò)這點(diǎn)官方自己是承認(rèn)的。
![]()
圖:GPT Image 1.5 的中文處理
換成 NBP,那幾乎是吊打。
![]()
圖:NBP 的中文處理
即便是簡(jiǎn)單點(diǎn)的中文,GPT 也無(wú)法勝任。
![]()
圖:GPT Image 1.5 的中文處理
NBP 幾乎完美。
![]()
圖:NBP 的中文處理
NBP 讓信息圖流行了起來(lái),OpenAI 也提供了類似案例。
但不論從效果還是從文字處理,GPT 都是被按在地上摩擦的。
![]()
圖:信息圖對(duì)比
除了升級(jí)了圖片功能之外,OpenAI 還新增了一個(gè)類似于“模板”的功能,選擇某個(gè)模板,然后再選一張自己的圖片,就可以生成這個(gè)模板對(duì)應(yīng)的風(fēng)格。
![]()
圖:GPT 提供模板選擇
通過(guò)固定一些常用的風(fēng)格,很方便那些不想到處找提示詞或者不會(huì)寫提示詞的朋友。
最終結(jié)論:這就是一場(chǎng)單方面的“碾壓”
測(cè)到這,我不裝了,直接攤牌:GPT Image 1.5 目前全面落后于 Nano Banana Pro。
雖然在剛才的某些特定 Case 里(比如那個(gè)瘋狂的二哈),GPT 偶爾能靈光一閃,但這阻擋不了它整體被 NBP 甩在身后的事實(shí)。
為什么這么說(shuō)?除了前面看到的這些,NBP 還有很多讓創(chuàng)作者無(wú)法拒絕的“殺手锏”,比如:
畫質(zhì)硬傷: NBP 早就支持 2K、4K 直出了,而 GPT Image 1.5 居然還在 1K 分辨率里玩泥巴。這對(duì)于要干活的人來(lái)說(shuō),簡(jiǎn)直是致命傷。
信息差優(yōu)勢(shì): NBP 可以結(jié)合聯(lián)網(wǎng)搜索,直接生成帶實(shí)時(shí)數(shù)據(jù)的信息圖,這點(diǎn) GPT 目前完全做不到。
至于大家關(guān)心的速度……官方發(fā)布會(huì)吹噓說(shuō)“速度快了 4 倍”。
我實(shí)測(cè)跑了一個(gè)通宵,說(shuō)實(shí)話,完全沒感覺到。體感上甚至比 NBP 還要慢一點(diǎn)。
OpenAI 這波“畫餅”,我給負(fù)分。
當(dāng)然,它也不是一無(wú)是處。
它唯一讓我覺得“真香”的功能,是多任務(wù)并發(fā)——前一張圖還在轉(zhuǎn)圈圈,我可以立馬發(fā)下一條指令,不用干等著。
這一點(diǎn),NBP 確實(shí)該學(xué)學(xué)(NBP 目前只能單線程排隊(duì))。
現(xiàn)在的 GPT Image 1.5 給我的感覺,更像是一個(gè)氣喘吁吁跟在 NBP 屁股后面追趕的“優(yōu)等生”,早已不是那個(gè)曾經(jīng)引領(lǐng)時(shí)代的“神”了。
(其實(shí) GPT 5.2 追趕 Gemini 3 Pro 也類似)
所以,我的建議很直接:
如果你是普通玩家: 想嘗鮮,可以玩玩。
如果你要干活、出圖、接商單: 請(qǐng)老老實(shí)實(shí)續(xù)費(fèi) Nano Banana Pro,它依然是目前的最佳選擇。
OpenAI 這一波?還得回爐再練練。
你怎么看,歡迎在評(píng)論區(qū)留言。
如果覺得這篇文章對(duì)你有幫助,別忘了點(diǎn)贊、愛心??和轉(zhuǎn)發(fā)你的朋友,我們下期再見!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.