![]()
2月17日晚8點(diǎn),馬年春晚準(zhǔn)時(shí)開(kāi)場(chǎng),火山引擎數(shù)據(jù)中心進(jìn)入了最為緊張的時(shí)刻。
與往年不同,這一次服務(wù)器面臨的挑戰(zhàn)不僅僅是視頻流的分發(fā),根據(jù)春晚后公布的數(shù)據(jù),除夕當(dāng)天,豆包AI互動(dòng)總數(shù)高達(dá)19億次,直播的某一秒,當(dāng)舞臺(tái)上的水墨畫(huà)隨風(fēng)而動(dòng)時(shí),或許正有一個(gè)觀眾在豆包上輸入了生成一張賽博風(fēng)格全家福的指令。
算力服務(wù)器集群必須在毫秒級(jí)內(nèi)完成數(shù)千萬(wàn)億次浮點(diǎn)運(yùn)算,確保用戶手機(jī)上的圖片在數(shù)秒內(nèi)生成。
所以,在2026年馬年春晚的舞臺(tái)上,“豆包們”都在做什么?又是怎么做到的?
在節(jié)目《馭風(fēng)歌》中,導(dǎo)演組要求背景中的水墨畫(huà)必須動(dòng)態(tài)化,畫(huà)中的馬匹不僅要跑起來(lái),且數(shù)量、形態(tài)不能有任何偏差。
這創(chuàng)意難就難在審美,市面上的海外視頻生成模型大多基于寫(xiě)實(shí)風(fēng)格訓(xùn)練,無(wú)法理解中國(guó)水墨畫(huà)的留白與暈染邏輯。
直接生成的視頻往往像生硬的3D貼圖,破壞了原作的二維質(zhì)感。
豆包Seedance 2.0團(tuán)隊(duì)在訓(xùn)練階段輸入了大量中國(guó)傳統(tǒng)文化語(yǔ)料,模型因此建立了對(duì)水墨筆觸的理解。
最終呈現(xiàn)在舞臺(tái)背景上的畫(huà)面,馬匹在奔跑時(shí)保留了墨色暈染的動(dòng)態(tài)變化,畫(huà)面沒(méi)有出現(xiàn)常見(jiàn)的結(jié)構(gòu)崩壞。
![]()
在視頻生成之前,豆包圖像創(chuàng)作模型Seedream 5.0 Lite還承擔(dān)了關(guān)鍵幀的設(shè)計(jì)工作。
它根據(jù)導(dǎo)演的草圖布局,生成了兼具原畫(huà)神韻與新構(gòu)圖的靜態(tài)圖像,為后續(xù)的視頻生成提供了符合邏輯的藍(lán)本。
除了風(fēng)格遷移,視頻生成技術(shù)面臨的另一個(gè)通病是違反物理規(guī)律。在以往的AI視頻中,人物或動(dòng)物在運(yùn)動(dòng)時(shí)常出現(xiàn)滑步、肢體扭曲或穿模現(xiàn)象,而在《馭風(fēng)歌》的奔跑畫(huà)面中,馬匹的四肢關(guān)節(jié)運(yùn)動(dòng)、受力反饋十分符合生物學(xué)結(jié)構(gòu)。
![]()
這種對(duì)物理規(guī)律的控制力延續(xù)到了《快樂(lè)小馬》這一節(jié)目中。
這一節(jié)目把真人的街舞動(dòng)作安在四足卡通形象上,站在技術(shù)角度來(lái)看,核心難點(diǎn)在于兩者的拓?fù)浣Y(jié)構(gòu)截然不同,一個(gè)是雙足直立,一個(gè)是四足著地。
傳統(tǒng)的動(dòng)畫(huà)制作流程需要為每個(gè)舞蹈動(dòng)作進(jìn)行3D骨骼綁定和手動(dòng)K幀,工作量以周計(jì)算。Seedance 2.0通過(guò)對(duì)骨架結(jié)構(gòu)的智能匹配,理解了動(dòng)作背后的運(yùn)動(dòng)邏輯,直接讓四足卡通形象模仿了雙足真人的舞蹈動(dòng)作,且保持了卡通形象的材質(zhì)和外觀細(xì)節(jié)不發(fā)生劣化。
![]()
這種對(duì)動(dòng)作的理解力同樣體現(xiàn)在節(jié)目《賀花神》中。
在舞臺(tái)上,《賀花神》展現(xiàn)了植物緩慢綻放的微觀細(xì)節(jié),鏡頭伴隨復(fù)雜的光影變化,Seedance 2.0很好地執(zhí)行了這些復(fù)雜的視覺(jué)指令,畫(huà)面沒(méi)有出現(xiàn)噪點(diǎn)和抖動(dòng)。
![]()
在節(jié)目《夢(mèng)底》中,舞臺(tái)上出現(xiàn)了數(shù)個(gè)和主演一模一樣的數(shù)字分身。
這些分身?yè)碛姓鎸?shí)的立體結(jié)構(gòu),當(dāng)現(xiàn)場(chǎng)攝像機(jī)進(jìn)行推拉搖移時(shí),觀眾可以看到分身的側(cè)臉輪廓和光影變化符合透視規(guī)律。
![]()
為了實(shí)現(xiàn)多人同臺(tái)渲染的性能優(yōu)化,技術(shù)團(tuán)隊(duì)利用字節(jié)Seed3D模型提前生成了影子的幾何外殼,大幅降低了實(shí)時(shí)計(jì)算量,同時(shí),通過(guò)字節(jié)DA3模型提供的深度信息,系統(tǒng)實(shí)現(xiàn)了虛擬燈光與現(xiàn)場(chǎng)物理燈光的毫秒級(jí)同步,確保了數(shù)字分身的影子能隨現(xiàn)場(chǎng)燈光變化而變化。
![]()
如果說(shuō)舞臺(tái)背景的視頻生成是事前制作,那么直播期間的AI互動(dòng)則是對(duì)算力基礎(chǔ)設(shè)施的一場(chǎng)大考。
傳統(tǒng)的春晚互動(dòng),無(wú)論是搖一搖還是搶紅包,在技術(shù)上屬于IO密集型任務(wù),其本質(zhì)是數(shù)據(jù)庫(kù)的讀寫(xiě)操作,系統(tǒng)發(fā)放的是預(yù)設(shè)好的庫(kù)存金額。
今年的AI互動(dòng)形式發(fā)生了質(zhì)變。
數(shù)據(jù)顯示,僅在除夕當(dāng)天,豆包面向全國(guó)觀眾送出了10萬(wàn)份科技好禮,“豆包過(guò)年”活動(dòng)幫助用戶生成了超過(guò)5000萬(wàn)張新春主題頭像和超過(guò)1億條新春祝福。
用戶在豆包App中上傳圖片、生成拜年圖或祝福語(yǔ),屬于計(jì)算密集型任務(wù)。這是一條實(shí)時(shí)創(chuàng)作的鏈路,先感知用戶的開(kāi)放式指令,再規(guī)劃執(zhí)行鏈路,最后調(diào)用多個(gè)模型實(shí)時(shí)生成內(nèi)容。
面對(duì)這種級(jí)別的吞吐,火山引擎方舟平臺(tái)采用了集群聯(lián)邦技術(shù),將物理隔離的數(shù)十個(gè)機(jī)房打通,在調(diào)度系統(tǒng)中,不同機(jī)房的資源水位被實(shí)時(shí)監(jiān)控。系統(tǒng)感知底層異構(gòu)硬件的拓?fù)浣Y(jié)構(gòu),利用親和性裝箱算法,將任務(wù)分配給最合適的芯片,即便在流量波動(dòng)劇烈時(shí),聯(lián)邦調(diào)度器也能實(shí)現(xiàn)秒級(jí)跨機(jī)房資源平移。
即使模型生成了視頻,距離春晚大屏的播出標(biāo)準(zhǔn)仍有差距。目前Seedance 2.0的原生輸出規(guī)格為720P分辨率和24幀率,而春晚大屏的播出標(biāo)準(zhǔn)是8K分辨率和50幀率。
補(bǔ)齊這一規(guī)格差距的是火山引擎視頻云技術(shù),基于火山引擎 MIPP 多維度智能畫(huà)質(zhì)增強(qiáng)框架,技術(shù)團(tuán)隊(duì)利用超分算法,在不改變畫(huà)面內(nèi)容的情況下提升分辨率,通過(guò)插幀服務(wù),將視頻幀率提升至50幀。
具身智能是馬年春晚的絕對(duì)主角,相比起蛇年春晚,馬年舞臺(tái)上出現(xiàn)的機(jī)器人展示了更自然的交互能力,以往的機(jī)器人語(yǔ)音交互常帶有明顯的機(jī)械感,語(yǔ)氣平淡,缺乏情感起伏,而此次登臺(tái)的機(jī)器人接入了豆包語(yǔ)音合成模型2.0。
![]()
該模型具備深度語(yǔ)義理解能力,能夠根據(jù)文本內(nèi)容自動(dòng)調(diào)整語(yǔ)氣和停頓,機(jī)器人在講笑話和講故事時(shí),聲音的情緒表達(dá)截然不同,交互體驗(yàn)接近真實(shí)的人際溝通,結(jié)合豆包模型的視覺(jué)理解能力,馬年春晚上的機(jī)器人能夠?qū)崟r(shí)識(shí)別前方人員的衣著顏色并進(jìn)行避障決策,實(shí)現(xiàn)了眼、腦、口的協(xié)同。
![]()
在這個(gè)除夕夜,舞臺(tái)上的機(jī)器人在表演,它們遵循著既定的程序,為觀眾提供娛樂(lè),而在看不見(jiàn)的后臺(tái),豆包大模型在工作,它處理著數(shù)億萬(wàn)用戶實(shí)時(shí)的請(qǐng)求,支撐著創(chuàng)意的落地。
相比于臺(tái)前的表演,這種在幕后的實(shí)戰(zhàn),或許才是AI技術(shù)真正成熟的開(kāi)始。
免責(zé)聲明:本文觀點(diǎn)僅代表作者本人,供參考、交流,不構(gòu)成任何建議。
![]()
鄭晨燁
資深記者。關(guān)注新能源、半導(dǎo)體、智能汽車(chē)等新產(chǎn)業(yè)領(lǐng)域,有線索歡迎聯(lián)系:zhengchenye@eeo.com.cn,微信:zcy096x。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.