好家伙,千問春節前扔出圖片大模型王炸,不僅能吃下 1k token 指令,還能渲染中文書法。也就是說,從今天開始,文生圖大模型不再是玩具,而是生產力工具!
那么問題來了,Qwen-Image-2.0 到底強在哪呢?
今天小雷就帶大家伙見識一下Qwen-Image-2.0 的威力。
生活個人形象照太土,發給客戶看,客戶覺得不夠高大上?
別慌也別急!立馬給你手搓一張新的。
下面我們所看到的都是由千問生成的“高大上”形象照。它可以根據我們要求的不同風格、不同著裝,生成一組又一組的照片。
![]()
不光能手搓形象照,我們還可以這樣玩兒。
輸入提示詞:讓圖中的女孩穿上風衣坐在露營椅上,OOTD 拼圖輕松拿捏。
生成的圖片分辨率高達2k,非常有質感,我覺得可以直接拿來用了。
在生成后,我還可以持續編輯我的指令,直到得到理想的圖片為止。
![]()
體驗了一波后,我愿稱之為中文版 Nano Banana!
不信咱繼續看看實測!
小雷讓千問生成一張蘇東坡《念奴嬌·赤壁懷古》的意境圖,展示詞作的雄渾蒼涼,大氣磅礴,圖中還要有這首詞的關鍵文字。
提示詞:畫一張中國風的國畫。宏大的廣角鏡頭,詩人蘇軾(蘇東坡)身著宋代文士袍服,獨自佇立于赤壁懸崖之上,凝望腳下滾滾東流的長江。遠處云霧中,隱約浮現三國豪杰(如周瑜)的幻影。 畫面中需要楷書展示《念奴嬌·赤壁懷古》100 個字的全詞內容如下: “大江東去,浪淘盡,千古風流人物。故壘西邊,人道是,三國周郎赤壁。亂石穿空,驚濤拍岸,卷起千堆雪。江山如畫,一時多少豪杰。 遙想公瑾當年,小喬初嫁了,雄姿英發。羽扇綸巾,談笑間,檣櫓灰飛煙滅。故國神游,多情應笑我,早生華發。人生如夢,一尊還酹江月。”
不只是文字沒錯,而且字體蒼勁有力、人物形象傳神,細節要求都有落實。
![]()
但你知道嗎?在過去大模型生成圖片都很難渲染漢字。
我試了下即夢的 seedream,字體看上去挺好看,但文字卻是錯的,存在“畫漢字”的老毛病。
![]()
看到這,可能有人會問,之前的圖片生成王者 Nano Banana Pro 呢?
別急,小雷當然也試過啦,來看看效果。
整體還可以,但存在錯字、多字的情況。
![]()
但千問這波卻能準確渲染上百個漢字,且處理長文本指令是 Qwen-Image-2.0 最大的突破,它能一口氣吃下 1000token,業界最長,沒有之一。
除了處理長文本指令精準以外,“美”也是 Qwen-Image-2.0 文字渲染的一大特色,不信你看。
![]()
不過普通用戶可能不會輸入這么長的指令,但我們可以給它一大段的指令,提出非常具體、詳細的要求,讓它生成圖片、PPT、海報。
比如針對 xAI 近期的人物動蕩新聞,我讓它生成一張新聞海報,還真能用。
![]()
![]()
再比如針對數碼圈常見的“果粉梗”,我讓它畫了一組漫畫。
![]()
圖源:千問
如果你不想輸入長指令,哪怕你只輸入一句話,千問提示詞增強功能都會調用大模型,合理擴展提示詞(多達1000字),進而給到更好的生成效果。
![]()
這不是馬上臨近春節了嗎,有朋友要來廣州和我一起玩兒,我讓千問生成一個介紹廣州的創意3D圖片。要求是建筑大小比例正確,金桔、福字、醒獅、元寶、燈籠等細節逼真。
沒想到,千問背后的Qwen-Image-2.0對復雜指令的理解太強了,而且還通過聯網搜索自己去推理出廣州相關的畫面元素,廣州塔、東西塔,該有的地標它全都有。
![]()
我們再來看看微觀視角下,千問的表現如何。
輸入提示詞:微觀視角,一只好奇的小螞蟻探險家,正站在一片巨大的紅樹呼吸根(如秋茄樹的支柱根)森林前。根系如參天古木般巍峨聳立,表面布滿滄桑的紋理與濕潤的苔蘚。陽光從上方巨大的紅樹林樹冠縫隙中穿透,形成幾道神圣的丁達爾光柱,照亮空氣中漂浮的微塵。螞蟻前方,一滴露珠如同巨大的水晶球掛在草葉上,映出顛倒的微型世界。遠處是朦朧的深圳灣海面與城市天際線。風格為迪士尼或皮克斯動畫電影的高幀率場景,細節極度豐富,光影迷人,色彩清新明亮,充滿童話般的探險氛圍,2K分辨率。
微觀生成的效果更驚艷,這張圖除了小螞蟻的細節,露珠、樹根、光影、苔蘚等細節都很逼真,遠處的深圳地標建筑也呈現得很到位。
![]()
有了“準”、“多”、“美”的表現,那 Qwen-Image-2.0 不得來個“真”體驗。
輸入提示詞:《西游記》電視劇官方復古海報。畫面中央是師徒四人沿著一條蜿蜒的取經路前行:孫悟空手持金箍棒探路,唐僧騎馬,豬八戒扛著釘耙,沙僧挑著行李。背景融合了花果山、大雷音寺和火焰山等標志性場景。天空有祥云和佛光。頂部是“西游記”大字。整體氛圍奇幻、經典、充滿回憶。
瞧瞧,除了生物以外,人物形象的生成也不再話下,這是千問為我生成的《西游記》的海報。
還能改為迪士尼、梵高印象派、二次元、樂高、連環畫這樣的風格,展現出強大的編輯能力。
![]()
圖源:千問
要小雷說,千問這一波更新絕對稱得上是超級王炸。去年一騎絕塵的 Google Gemini Banana 成為現象級產品,如今中國終于有了一個能打的文生圖大模型了。
而且值得一提的是,在權威第三方評測 AI Arena 中,Qwen-Image-2.0 文生圖得分 1029,排名第三!圖像編輯得分 1034 分,全球第二,僅次于 Nano Banana Pro。強烈建議大家去體驗其強大的多場景創作能力,一定會發現超多驚喜~
話說,2026 年大模型的神仙斗法才剛剛開始。不知道在座各位平時有沒有用過千問呢?感覺如何?歡迎評論區一起嘮嘮~
實測戳視頻看:
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.