通信頭條消息 近日,中國電信人工智能研究院(TeleAI)發(fā)布了一項名為生成式視頻壓縮(GVC)的技術(shù),這項成果在視頻通信領(lǐng)域取得了重大技術(shù)性成果突破。
其核心指標——將視頻數(shù)據(jù)壓縮至驚人的0.02%——意味著原本占用1GB存儲空間的視頻,經(jīng)壓縮后僅需傳輸約200KB的數(shù)據(jù)即可實現(xiàn)高清還原觀看,徹底改寫了傳統(tǒng)視頻傳輸?shù)囊?guī)則。
![]()
GVC技術(shù)的根本性創(chuàng)新在于其顛覆了長久以來以HEVC(H.265)或VVC(H.266)為代表的“像素搬運”邏輯。傳統(tǒng)編碼技術(shù)致力于更高效地壓縮和傳輸原始像素信息,在帶寬受限時容易導(dǎo)致畫面質(zhì)量嚴重下降。
而GVC則另辟蹊徑,其核心理念是“用計算換帶寬”:它不再傳輸畫面像素本身,而是提取并傳輸高度濃縮的“壓縮Token”,這些Token主要包含描述場景與物體結(jié)構(gòu)的語義信息,以及記錄動態(tài)變化的運動信息。
在接收端,一個預(yù)置的生成式模型(如擴散模型)會扮演“AI畫師”的角色,根據(jù)接收到的這些指令,結(jié)合自身預(yù)訓(xùn)練的海量世界知識,實時“腦補”并重建出連貫、清晰的視頻畫面。
根據(jù)TeleAI發(fā)布的技術(shù)報告,GVC的性能表現(xiàn)令人震撼。在0.005至0.008 bpp(比特每像素)的極低碼率下,采用更符合人類視覺感知的LPIPS畫質(zhì)評價指標進行評估,GVC所生成的視頻畫質(zhì)顯著優(yōu)于傳統(tǒng)HEVC標準。
盡管生成式模型通常對算力要求很高,但TeleAI團隊通過模型小型化與知識蒸餾等優(yōu)化手段,成功讓GVC技術(shù)能夠在消費級硬件上運行。
GVC技術(shù)的突破性意義,在其于極端網(wǎng)絡(luò)條件下的應(yīng)用前景中得到了最生動的體現(xiàn)。
例如,在依賴昂貴且狹窄帶寬衛(wèi)星網(wǎng)絡(luò)的遠洋海事通信中,船員有望享受流暢的高清視頻通信乃至賽事直播,這對于海上遠程醫(yī)療、設(shè)備維修指導(dǎo)而言堪稱“救命”的技術(shù)。
在應(yīng)急救援場景下,當災(zāi)區(qū)基站損毀、網(wǎng)絡(luò)信號微弱時,救援無人機搭載GVC后,可將拍攝的現(xiàn)場高清畫面壓縮至極小體積傳回指揮中心,為決策提供實時、清晰的視覺依據(jù)。
此外,在深空探測、車載視頻回傳等傳輸成本極高或數(shù)據(jù)量巨大的領(lǐng)域,GVC技術(shù)都能帶來存儲和傳輸成本的指數(shù)級下降。
全球視野 / 深度有料 / 專注于TMT領(lǐng)域
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.