337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

告別抽卡!全能&高度可控|藏師傅教你用即夢數字人 1.5

0
分享至

前幾天即夢在 Web 端上線他們的數字人 Omnihuman 1.5 版本。

今天來做個測試,同時有個教程教大家怎么用圖像模型配合生成名人數字人視頻。

相較于之前的 Omnihuman 1.0,這次不只是上傳音頻和圖片他幫你生成帶有唇形同步的動態視頻,1.5 的控制能力大幅提升,你可以定義視頻中的人物表演和運動方式。

幾乎搞定了原來 AI 視頻不好做的人物表現部分內容。


可以看到在設置部分多了一個動作描述的提示詞輸入,極大的拓展了數字人的使用場景,基本上可以當一個自定義程度極高的 Veo3 來使用了,你可以控制畫面內容、人物、情緒、音色以及運動和運鏡方式。

昨天用這個做了一個比較搞的片子,最近不是模仿名人營銷很火嗎,我做了一個讓喬布斯賣破拖鞋的演講,這種具有熱門視覺標定和反差感的視頻非常容易火。

我們先用幾個基礎測試來看一下 Omnihuman 1.5 的能力。

然后我會教一下大家如何用即夢圖片 4.0 和數字人 1.5 配合生成這種連貫的數字人視頻。

這次更新最明顯的一個改動就是數字人不再死板,我們可以通過動作控制讓鏡頭和人物動起來,包括不只是主角也包括其他人物。

比如上面這個案例,我們就可以讓女子先抬頭,到一個合適可以看到嘴唇的角度,然后再開始說話,同時鏡頭也在旋轉到她的正臉,背后的其他人也在正常行走,這是純粹的唇形同步模型不能做到的。

另外這次的模型升級在多風格化以及非人形生物的唇形同步上效果也變得非常的自然。

這里這種平面插畫的眼睛、嘴部和面部運動都非常自然而且生動,同時依然可以搭配他的動作比如抬手走動等,鏡頭平移的時候新出現的畫面風格也跟原來的很好的保持一致。

這次更新的另一個優勢是對表情和表演的響應也更得加的好,上面的提示詞為:

女人先以平靜神情看向鏡頭,眼神柔和輕聲開口;隨即露出諷刺的表情,眉梢微挑、嘴角單側上揚;短促輕笑后肩部微松;轉為溫和講述,目光上揚,右手輕觸前景桌上的紙船;最后前傾半步以低語收束,食指輕抵唇邊作“噓”。

可以看到他響應的很好,先是面無表情的說話,然后變成諷刺的表情,之后非常順暢的在輕笑之后變得溫和,然后人物后撤開始看向紙船,最后噓的動作也做了。

整個視頻長達 16 秒,這個長度和提示詞詞遵循已經非常厲害了,市面上可以做到這么穩定的保持人像 ID 不變同時精準的提示詞遵循的幾乎沒有。

這次更新還有一個優勢就是可以控制同一場景多人的對話和表現,我們可以指定聲音是由哪個角色發出的,這個一下就讓模型的可用性拓展了很多。

比如這里我們就可以做兩人的對唱視頻,多人對話劇情也可以做了,搭配即夢 4 的改圖能力去調整鏡頭的重點很容易就可以最常見的對話劇情,比某些只會一個固定鏡頭的電視劇強多了。

從上面這幾個測試也可以看到,以往類似模型那種夸張的嘴型問題也一定程度上得到了解決,不再是所有角色說話嘴都張的很大了,模型現在會根據聲音內容和提示詞去調整,表現自然了非常多。

現在來看數字人教程的部分。

即夢的數字人 1.5 雖然可控和操作簡單是蹺蹺板的兩個部分,一般來說可控的模型操作就會相對復雜,所以還是需要一些門檻的。

我們可以看到數字人 1.5 做條視頻需要準備三部分內容,首先是首幀的圖片,然后就是音頻,最后就是對應的動作和情緒提示詞。

如果你需要這個視頻更加的生動,就必然不可能一直用一個視角和背景,所以我們需要更多的分鏡圖片和對音頻進行切分,這樣會讓畫面更生動。

這里我建議你先準備一個表格將每個分鏡的這三個部分寫好,然后我們看怎么去準備。


然后我們來講一下基礎的操作:

圖像這里沒啥問題你直接上傳首幀圖片就可以。


音頻這里說法比較多:

如果你自己沒有準備音頻的話,你需要直接選擇音頻部分,這時候即夢一般會根據你上傳的角色推薦一個音色,當然你也可以自己選擇,選擇完成后在說話內容這里直接打字寫上要說的話就行。

當然你也可以在音色選擇的彈窗「我的音色」這里去克隆你想用的音色,只需要 5 秒音頻就行。


如果你自己有音頻,這時候你需要點擊下面的「上傳音頻」按鈕,音頻就會回填,這時候角色說這部分就變成你上傳的音頻了不能打字。


另外還有一種情況是,你上傳的畫面里有多個角色,這時候即夢就會自動檢測到,你就可以選擇是圖片中的哪個角色在說話,可以選單個,也可以選全部。

比如他檢測到我這張圖片有兩個人,就會有三個選項,而且會有對應角色的切圖,很直觀。


最后是動作描述,這里可以用他們推薦的提示詞模板,盡量遵循清晰、不矛盾、少否定,多寫具體的內容,少用文學化和形容詞表達。

提示詞模板:

鏡頭運動 + 說話角色情緒 + 說話狀態(說話/哭泣/唱歌/...) + 具體動作 + (可選)背景事件/其他角色的動作


了解完基礎操作之后我們就需要開始準備素材了,首先我們克隆一下喬布斯的音色,你可以用即夢自帶的克隆功能,也可以自己用更大的數據量操作,我這里用的自己克隆的。


然后就是第一張圖片,我上面的分鏡表格這里顯示我們需要一張黑色背景的,提示詞:Black stage medium shot. Steve Jobs facing the camera,The background is a pure black PPT screen.


然后我們還需要一張拖鞋產品圖,哈哈,這里我用即夢生成的,提示詞寫像蘋果 PPT 就行。

蘋果風格發布會 PPT,一直非常破的破拖鞋,上面產品名字寫著“iFlip One”


只有這兩個畫面太單調了怎么辦,這個時候就得用即夢 4.0 的圖像編輯能力了。

我們直接將原來第一張圖的黑色 PPT 背景變成剛做的拖鞋 PPT。


當然第三個分鏡將會基于第二張圖去修改,直接給我們的拖鞋加上掛鉤,同時改掉 PPT 上的文字。


這樣三張非常模擬喬布斯發布會場景的圖片就做出來的,是不是已經有那個味了。

然后我們將所有臺詞分成三段生成,第一段是提出懸念,然后第二段展示拖鞋,第三段介紹掛鉤和發售。


然后按照剛才的介紹的基礎操作分別將圖片上傳,然后寫上表格里面的語音和對應的運鏡及動作就行。


等待視頻的完成,之后的事情你們應該都會了,用剪映之類的把三段合成一段視頻就行。

這種方式比單鏡頭的數字人效果要好非常多,同時通過切分鏡頭避免了超長鏡頭導致的長生成時間和 ID 保持不住的問題,再來看一下我們的結果:

近年來 AI 視頻模型飛速發展,一直以來視頻模型就是視頻模型,唇形同步模型就是唇形同步模型,這樣正常影視流程中最常見的動作運鏡以及人物表演,被區分成了兩個部分。

過去我們面對 AI 視頻模型,就像在跟一個才華橫溢但性格古怪的藝術家合作。你給出「一個悲傷的女人在雨中行走」這樣的提示詞,然后祈禱它能理解你心中的「悲傷」是克制的還是崩潰的,「行走」是踉蹌的還是決絕的。每一次生成都像開盲盒,創作者被迫成為賭徒去抽卡。

Omnihuman 1.5 呈現的狀態更像是一臺精密的導演監視器:首幀畫面 = 場景設定、音頻內容 = 臺詞劇本、動作提示 = 分鏡腳本、多角色控制 = 群戲調度。把創作從玄學變成了工程學。

當然 AI 指令精確之后,對于創作者的要求也變高了,那些更懂表演、調度具備「應該讓它執行什么指令」的導演思維的人更能發揮這個模型的價值。

據悉,新模型9月30日也將同步上線即夢手機端,屆時在軟件商店更新最新版本即夢app,就能體驗。

如果覺得藏師傅的內容對你有幫助的話,可以幫忙點個贊和喜歡,也可以??轉給你具有導演思維的朋友,謝謝各位

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
陳松伶跑5公里馬拉松,本人曬照和路人拍的差距大,看著差出20歲

陳松伶跑5公里馬拉松,本人曬照和路人拍的差距大,看著差出20歲

八怪娛
2026-03-27 13:32:01
3月開始,中國可能出現四大漲潮:除油價以外,這三類也要上調了

3月開始,中國可能出現四大漲潮:除油價以外,這三類也要上調了

有范又有料
2026-03-27 19:14:52
故事:湖南一母親對兒子太過嬌縱,竟答應其不合理的要求,犯下大錯

故事:湖南一母親對兒子太過嬌縱,竟答應其不合理的要求,犯下大錯

紅豆講堂
2025-02-14 10:36:50
教育部發布20條嚴禁清單,嚴禁宣傳炒作中高考狀元、名校率、升學率,整治陰陽課表違規補課等行為

教育部發布20條嚴禁清單,嚴禁宣傳炒作中高考狀元、名校率、升學率,整治陰陽課表違規補課等行為

每日經濟新聞
2026-03-27 11:33:29
我剛從印度回來,談談一些可能讓人不太舒服的真話,句句扎心

我剛從印度回來,談談一些可能讓人不太舒服的真話,句句扎心

千秋文化
2026-03-27 20:33:46
中國博士后遭美方盤問后自殺后續!知情人曝細節,外交部強硬發聲

中國博士后遭美方盤問后自殺后續!知情人曝細節,外交部強硬發聲

離離言幾許
2026-03-27 17:59:06
伊朗發動“真實承諾-4”行動第85波攻勢 聲稱擊中美國戰機

伊朗發動“真實承諾-4”行動第85波攻勢 聲稱擊中美國戰機

新華社
2026-03-28 23:21:03
大家要做好準備,若不出意外的話,下個月,樓市或將迎來4大轉變

大家要做好準備,若不出意外的話,下個月,樓市或將迎來4大轉變

平說財經
2026-03-28 14:39:10
比越南還要白眼狼!中國決定撤離援助后,該國家居然立即翻臉

比越南還要白眼狼!中國決定撤離援助后,該國家居然立即翻臉

落梅如雪亂飛
2026-01-03 21:52:21
張雪峰經典名言 100 條(完整版)

張雪峰經典名言 100 條(完整版)

新浪財經
2026-03-25 06:17:25
知名大學教授賄賂1000元,被判入獄!校方回應

知名大學教授賄賂1000元,被判入獄!校方回應

雙一流高校
2026-03-29 00:11:17
中國收到以色列警告,稱若協助伊朗發展核武器,將面臨災難性后果

中國收到以色列警告,稱若協助伊朗發展核武器,將面臨災難性后果

古事尋蹤記
2026-02-18 19:52:58
上帝之眼風暴現身美國近海,是外星人母艦登陸?分析:巨型溫帶氣旋

上帝之眼風暴現身美國近海,是外星人母艦登陸?分析:巨型溫帶氣旋

中國氣象愛好者
2026-03-27 10:00:07
北京被低估的3所大學,畢業就是“鐵飯碗”!完全不用愁就業!

北京被低估的3所大學,畢業就是“鐵飯碗”!完全不用愁就業!

高三倒計時
2026-03-25 18:09:46
1-1!中國隊點球逼平朝鮮,造點細節與判罰引爭議

1-1!中國隊點球逼平朝鮮,造點細節與判罰引爭議

體育一點就通
2026-03-28 23:28:43
中方拒絕出席G7峰會,法國威脅上了:中國面臨歐洲市場關閉的風險

中方拒絕出席G7峰會,法國威脅上了:中國面臨歐洲市場關閉的風險

阿天愛旅行
2026-03-27 18:57:41
父母離世我住三叔家,為12塊6毛錢的學費,三叔狠狠打了我一頓

父母離世我住三叔家,為12塊6毛錢的學費,三叔狠狠打了我一頓

人間百態大全
2026-03-28 07:20:03
胡塞武裝正式參戰!導彈打向特拉維夫!以色列三面受敵或走向崩潰

胡塞武裝正式參戰!導彈打向特拉維夫!以色列三面受敵或走向崩潰

健身狂人
2026-03-28 22:35:21
很多人只看到了"老頭樂起訴小米"的荒誕感,卻沒看到雷軍不敢戀戰背后的“惶恐”

很多人只看到了"老頭樂起訴小米"的荒誕感,卻沒看到雷軍不敢戀戰背后的“惶恐”

新浪財經
2026-03-28 00:31:15
韓先楚調蘭州任司令,軍區政委卻不服?毛主席急讓葉元帥出面調解

韓先楚調蘭州任司令,軍區政委卻不服?毛主席急讓葉元帥出面調解

兵鑒史
2026-03-29 01:46:43
2026-03-29 04:00:49
歸藏的AI工具箱 incentive-icons
歸藏的AI工具箱
關注人工智能、LLM 、 AI 圖像視頻和設計
280文章數 38關注度
往期回顧 全部

科技要聞

華為盤古大模型負責人王云鶴確認離職

頭條要聞

美媒:和歐盟"外長"發生激烈交鋒 魯比奧"顯然很惱火"

頭條要聞

美媒:和歐盟"外長"發生激烈交鋒 魯比奧"顯然很惱火"

體育要聞

“我是全家最差勁的運動員”

娛樂要聞

陳牧馳陳冰官宣得子 曬一家三口握拳照

財經要聞

臥底"科技與狠活"培訓:化工調味劑泛濫

汽車要聞

置換補貼價4.28萬起 第五代宏光MINIEV正式上市

態度原創

房產
手機
教育
親子
公開課

房產要聞

首日430組來訪,單日120組認籌!海口首個真四代,徹底爆了!

手機要聞

華為手機全面回歸!暢享90 Pro Max下周首銷:1699元起

教育要聞

嚴絲合縫的教材閱讀法?????

親子要聞

小孩子能口無遮攔到什么程度!網友:恨不得當場找個地縫鉆進去

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版