雞你太美,很絲滑??
上線不到兩周半,千問APP又進化了:多模態創作能力全面升級。
視頻方面,基于Wan 2.5的音視頻同出能力,一張圖+一段提示詞就能輸出各種唱跳、表演視頻。
生圖方面,全新升級了圖片生成與編輯模型Qwen-Image-Edit,有著超強的一致性,擅長生圖、修圖、多視角轉換、多圖融合和多模態推理。
省流:最新、最強的多模態模型,已上線千問APP。
Ps,千問APP需要升級至5.1.0版本以上,才能體驗。
![]()
實測體驗
我們,這就來實測體驗。
首先出場的,是我們四川文旅的當紅炸子雞:三星堆。
這是一張商青銅立人像,看起來就像在練著某種武功秘籍,有沒有?
![]()
我拍的時候,游客太多了,用千問把他們通通消掉。
把圖片背景里的人都去掉。
![]()
注意看,左下角那兩張掛在墻上的展圖和右后方的玻璃展柜,全部是由模型自己推理出來的,與原畫很貼合,非常牛逼。
把背景改為純黑色背景,用于藏品展示。
![]()
生成左視角圖片。
![]()
生成右視角圖片。
![]()
生成手辦。
![]()
Prompt:turn this photo into a character figure. Behind it, place a box with the character’s image printed on it, and a computer showing the Blender modeling process on its screen. In front of the box, add a round plastic base with the character figure standing on it. Make the PVC material look clear, and set the scene indoors if possible.
我把完整的對話截圖,放在這里了,大家可以看下整個生成過程。
(可上下滑動,查看全圖)
圖片有了,我們也可以讓它生成視頻,用這句提示詞:
幫我生成視頻,圖中的主體一邊練著武功,一邊說:松而不懈,緊而不僵,氣沉丹田,意守其中。
畫面、臺詞、字幕,全由千問直接生成。
哈哈,我就說他是在練武功吧,這回可算找著證據了(眾所周知視頻是不能P的)。
而且,千問還能存實況圖片,發朋友圈裝x的本事又學到了,hhh~
![]()
千問之所以能整活,主要是背后有兩個頂尖的模型。
一是全新升級的Qwen-Image-Edit,相較上一代版本,新Qwen-Image-Edit模型在多項性能上都有所增強:
圖片編輯,大幅減輕了主體偏移問題,生圖不模糊、更穩定;
提升主體一致性,多圖融合更穩定;
語義理解增強,既能看懂圖片,也能改好圖片。
尤其擅長改圖(顏色、場景、材質和局部修改)、多視角轉換、多圖融合和多模態推理(比如做幾何題)。
比如,可以讓圖1變換為圖2的姿勢。
或者,給圖1的角色穿上圖2的衣服。
二是最新的Wan2.5視頻模型。這是業界少有的具備音畫同出能力的視頻模型,可以生成和畫面匹配的人聲、音效和音樂BGM。
無論是真人照片、萌寵、二次元角色,還是文物、卡通形象,千問APP都支持“一張照片就能跳舞”的創意玩法,可以生成口型精準、動作絲滑的“邊唱邊跳”視頻。
最長,支持10S、1080P。
比如,可以跳孤身搖。
提示詞:幫我生成跳舞視頻,讓圖片中的人物跳孤身搖。
以及,橘貓和小狗主持的播客節目。
提示詞:一檔貓咩和小狗主持的播客節目,橘貓開心的說:“今天心情不錯,因為我剛成功偷襲了一只激光筆。”接著,小狗補充:“我也心情不錯,因為我幫你報了仇,把那支激光筆咬斷了,哈哈哈。”說完它們兩對視一眼,開心大笑。
也可以清唱:明月幾時有。
提示詞:圖中的人物一邊跳舞,一邊唱:明月幾時有,把酒問青天。
![]()
更多玩法
基于這些模型,千問APP其實有很多玩法。
1)生圖-生視頻
先讓千問幫我畫圖,然后再用畫的圖生成視頻,全在一個Chat框里搞定。
![]()
這是用第一張圖生成的視頻,很有宮崎駿的味道。
2)改圖-生視頻
也可以讓千問先改圖再生成視頻,比如我仿制的瑪麗蓮·夢露風格廣告大片。
![]()
這是用第二張圖生成的視頻。
以及,老黃和奧特曼合唱《中國話》。
![]()
3)連續性改圖
同時,千問也是支持連續性改圖的,這一致性保持得非常不錯。
![]()
如果你不會寫提示詞,還可以直接讓千問生成繪圖提示詞,然后讓千問用繪圖提示詞生成圖片,再基于生成的圖片生成視頻。
這鏈路,齊活了。
![]()
上線兩周半,千問的動作還是挺快的。
基本上,最新、最強的模型都會第一時間上千問。而且它是徹底的All in One——一個Chat窗口解決所有input問題,沒有單獨的入口,也無需點膠囊按鈕,直接一句指令,全都搞定。
比如,幫我生成視頻、幫我創建圖片、幫我改圖、幫我翻譯、幫我寫HTML、幫我寫PPT……
這次的千問,它真的把“復雜留給模型,簡單留給用戶”做到了極致。
上周四,我到阿里巴巴北京總部參加夸克AI眼鏡發布會,千問負責人吳嘉現場透露:千問公測僅一周,下載量已突破1000萬。
![]()
這速度,就很阿里,也很中國。
而這,或許只是這場智能革命的開始。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.