機(jī)器之心發(fā)布
隨著深度偽造技術(shù)的不斷進(jìn)步,演藝行業(yè)的明星們已成為換臉技術(shù)的最大受害者。近日,多起演員被換臉、克隆,甚至用于虛假宣傳的事件頻頻曝光,引發(fā)了社會(huì)的廣泛關(guān)注。
例如,網(wǎng)友發(fā)現(xiàn) AI 短劇《重生后,我成了娘親的守護(hù)神》第 14 集開頭疑似使用了演員楊紫的臉。某短劇平臺(tái)則在未經(jīng)許可的情況下,使用 AI 換臉技術(shù)偽造了易烊千璽的肖像與聲音。
![]()
網(wǎng)友稱AI短劇《重生后,我成了娘親的守護(hù)神》第14集開頭疑似使用了演員楊紫的臉。
![]()
某短劇平臺(tái)多部AI短劇在未經(jīng)許可的情況下使用AI換臉技術(shù),偽造星易烊千璽的肖像及聲音。
![]()
演員王勁松也曾就AI虛假代言發(fā)聲。
不僅演員們紛紛發(fā)聲,官方也開始出手。
中國廣播電視社會(huì)組織聯(lián)合會(huì)演員委員會(huì)于 4 月 2 日發(fā)布嚴(yán)正聲明,強(qiáng)烈譴責(zé) AI 換臉、素材濫用及違規(guī)訓(xùn)練 AI 模型等行為,發(fā)出行業(yè)警告:嚴(yán)守法律底線,捍衛(wèi)視聽真實(shí)。
![]()
隨著Nano BananaSeedanceKling等圖像和視頻生成模型的飛速迭代,人眼已經(jīng)難以分辨真實(shí)與偽造的界限。換臉技術(shù),只是這一技術(shù)濫用的冰山一角。
更為嚴(yán)重的是,深度偽造技術(shù)濫用的風(fēng)險(xiǎn)急劇上升——從庫里采訪的 AI 杜撰事件,到 AI 生成的假水果圖騙取退款,這些亂象正在嚴(yán)重挑戰(zhàn)社會(huì)信任和內(nèi)容平臺(tái)的生態(tài)。
![]()
如何讓 AI 練就火眼金睛?
在這個(gè)技術(shù)亂象叢生的時(shí)代,如何讓 AI 具備火眼金睛成了當(dāng)務(wù)之急。
最近,計(jì)算機(jī)視覺領(lǐng)域的頂級(jí)會(huì)議CVPR 2026 的 NTIRE 魯棒性 AIGC 圖像檢測挑戰(zhàn)賽( Robust AI-Generated Image Detection in the Wild Challenge )結(jié)果出爐。螞蟻集團(tuán) AI 安全實(shí)驗(yàn)室的隊(duì)伍MICV憑借在魯棒性測試樣本上 ROC AUC 達(dá)到了驚人的 0.9723,成功摘得「復(fù)雜真實(shí)場景魯棒性樣本測試」挑戰(zhàn)賽的冠軍。這場挑戰(zhàn)賽吸引了全球 500 多支隊(duì)伍的參與,是全球計(jì)算機(jī)視覺領(lǐng)域的三大頂級(jí)會(huì)議之一。
![]()
![]()
與此同時(shí),螞蟻團(tuán)隊(duì)還發(fā)布了業(yè)內(nèi)最全面的 AIGC 圖像視頻檢測資源倉庫。
這個(gè)倉庫整合了最新的熱點(diǎn)事件、前沿論文、基準(zhǔn)數(shù)據(jù)集及實(shí)用工具,為全球研究人員提供了一個(gè)技術(shù)參考的寶貴資源。團(tuán)隊(duì)將持續(xù)更新,確保資源的時(shí)效性與前沿性,以應(yīng)對(duì) AI 生成內(nèi)容帶來的挑戰(zhàn)。
![]()
開源倉庫:Awesome-AIGC-Image-Video-Detection
現(xiàn)實(shí)挑戰(zhàn):AIGC 鑒真面臨的雙重鴻溝
雖然現(xiàn)有的 AI 鑒真技術(shù)在標(biāo)準(zhǔn)高質(zhì)量基準(zhǔn)測試中表現(xiàn)不俗,但面對(duì)復(fù)雜多變的真實(shí)開放場景( In-the-wild )時(shí),檢測模型的準(zhǔn)確率往往會(huì)出現(xiàn)斷崖式下降。這一現(xiàn)象使得業(yè)內(nèi)急需解決兩個(gè)核心技術(shù)難題。
一個(gè)是跨域泛化能力不足。不同生成架構(gòu)(如擴(kuò)散模型、自回歸模型等)和閉源商業(yè)平臺(tái)的生成機(jī)制差異巨大,偽影特征也隨之變化。傳統(tǒng)檢測模型常常對(duì)單一訓(xùn)練數(shù)據(jù)過擬合,一旦遇到新的生成體系,便容易失效,難以識(shí)別新型偽造內(nèi)容。
另一個(gè)是真實(shí)世界的降質(zhì)干擾。圖像在互聯(lián)網(wǎng)傳播過程中,不可避免地經(jīng)歷壓縮、模糊、加噪等降質(zhì)處理,這些退化現(xiàn)象往往會(huì)掩蓋微弱的生成痕跡,極大增加了鑒偽的難度。
正是基于這些痛點(diǎn),本次 CVPR 挑戰(zhàn)賽特別聚焦于如何在「未知生成架構(gòu)」與「復(fù)雜退化干擾」雙重考驗(yàn)下,依然保持模型的高準(zhǔn)確率和高魯棒性。
解決方案:基于 DINOv3 的魯棒檢測框架
為了應(yīng)對(duì)上述挑戰(zhàn),螞蟻安全團(tuán)隊(duì)提出了一種基于DINOv3 視覺基礎(chǔ)模型的魯棒集成檢測框架。
這一框架充分發(fā)揮了 DINOv3 在高頻細(xì)節(jié)上的強(qiáng)大表征能力,并結(jié)合數(shù)據(jù)構(gòu)建、模型架構(gòu)和優(yōu)化策略的創(chuàng)新,成功實(shí)現(xiàn)了從實(shí)驗(yàn)室基準(zhǔn)到復(fù)雜真實(shí)場景的有效遷移。
![]()
分層級(jí)數(shù)據(jù)構(gòu)建:百萬級(jí)多源訓(xùn)練語料
高質(zhì)量且多維的數(shù)據(jù)集是打破過擬合的基石。團(tuán)隊(duì)依托深厚的數(shù)據(jù)積累,構(gòu)建了包含數(shù)百萬樣本的復(fù)雜訓(xùn)練語料庫,層次化覆蓋四類數(shù)據(jù)來源:開源學(xué)術(shù)基準(zhǔn)、主流開源生成模型定向合成、商業(yè)閉源 API 高保真樣本,以及比賽官方數(shù)據(jù),確保對(duì)當(dāng)前主流生成生態(tài)的全面覆蓋。
雙流特征融合的集成架構(gòu):充分挖掘表征潛力
為充分挖掘 DINOv3 在復(fù)雜高頻細(xì)節(jié)上的表征潛力,團(tuán)隊(duì)設(shè)計(jì)了雙流并行架構(gòu)。
架構(gòu)將多組不同配置的 DINOv3 主干網(wǎng)絡(luò)劃分為兩個(gè)獨(dú)立的網(wǎng)絡(luò)組,每組內(nèi)部通過多尺度特征融合機(jī)制聚合局部空間特征與全局語義信息,最終由 MLP 模塊輸出分支預(yù)測結(jié)果。
在決策層面,兩個(gè)網(wǎng)絡(luò)組獨(dú)立執(zhí)行特征提取與預(yù)測,最終通過加權(quán)平均完成后融合。這種設(shè)計(jì)既避免早期特征級(jí)聯(lián)的信息淹沒問題,又通過不同配置網(wǎng)絡(luò)的互補(bǔ)效應(yīng),提取出更加全局、立體的圖像表征。
難度感知的魯棒數(shù)據(jù)增強(qiáng):模擬真實(shí)傳播鏈路的階梯式退化
真實(shí)世界的圖像在互聯(lián)網(wǎng)傳播中會(huì)經(jīng)歷壓縮、模糊、加噪、截取等多級(jí)退化,掩蓋原有的微弱生成痕跡。為縮小實(shí)驗(yàn)室數(shù)據(jù)與真實(shí)場景的分布差異,團(tuán)隊(duì)構(gòu)建了階梯式的魯棒數(shù)據(jù)增強(qiáng)鏈路:
- 多類型退化的系統(tǒng)模擬:涵蓋模糊、噪聲、壓縮偽影、色彩偏移及幾何畸變等多種退化類型,通過分層強(qiáng)度配置,實(shí)現(xiàn)從單一擾動(dòng)到復(fù)雜復(fù)合擾動(dòng)的遞進(jìn)式模擬,深度還原互聯(lián)網(wǎng)傳播鏈路中的多級(jí)退化特征。
- 高保真感知增強(qiáng)機(jī)制:引入 HiFiC、ELIC 等神經(jīng)網(wǎng)絡(luò)壓縮模型模擬先進(jìn)編碼失真,同時(shí)補(bǔ)充社交平臺(tái)傳播壓縮、二次翻拍及截屏等非對(duì)稱退化樣本,填補(bǔ)算法模擬與真實(shí)邊緣場景的分布差異。
模型優(yōu)化:構(gòu)建平滑魯棒的參數(shù)空間
- Focal Loss:針對(duì)退化樣本檢測難易度不均的問題,動(dòng)態(tài)抑制易分類樣本權(quán)重,強(qiáng)制模型聚焦被嚴(yán)重降質(zhì)掩蓋的困難樣本。
- 隨機(jī)權(quán)重平均(SWA):在訓(xùn)練收斂后期對(duì)參數(shù)空間內(nèi)多個(gè)權(quán)重軌跡平滑平均,引導(dǎo)模型收斂至更平坦的極小值區(qū)域,降低過擬合風(fēng)險(xiǎn)。
- TTA 機(jī)制:推理階段聯(lián)合原始圖像及其水平翻轉(zhuǎn)版本進(jìn)行結(jié)果平均,有效提升推理穩(wěn)定性。
通過這一系列技術(shù)創(chuàng)新,螞蟻團(tuán)隊(duì)不僅解決了當(dāng)前 AIGC 檢測技術(shù)在面對(duì)多變場景時(shí)的諸多挑戰(zhàn),還為未來更高效、更精準(zhǔn)的深度偽造檢測奠定了基礎(chǔ),進(jìn)一步推動(dòng)了 AI 鑒真技術(shù)的發(fā)展。
產(chǎn)研并進(jìn):
打破黑盒瓶頸,拓寬 AIGC 鑒真技術(shù)邊界
螞蟻安全團(tuán)隊(duì)在 AI 鑒真技術(shù)的理論與方法上不斷創(chuàng)新,近期在CVPRICLR等國際頂級(jí)會(huì)議上發(fā)布了多項(xiàng)高水平研究成果。這些突破不僅為 AI 鑒真領(lǐng)域帶來了新的技術(shù)思路,也為破解現(xiàn)有技術(shù)瓶頸奠定了基礎(chǔ)。
團(tuán)隊(duì)的目標(biāo)是打破傳統(tǒng)鑒真模型的黑盒局限,未來的AI鑒真技術(shù)將不僅僅是簡單的二分類任務(wù),而是具備強(qiáng)大的泛化能力,并能像人類專家一樣進(jìn)行推理。
Veritas 框架便是這一努力的具體體現(xiàn)。通過結(jié)合多模態(tài)大語言模型( MLLM )和模式感知推理( Pattern-aware Reasoning )機(jī)制,團(tuán)隊(duì)突破了傳統(tǒng)大模型純文本思維鏈的限制,使得模型在面對(duì)未知生成器時(shí),能展現(xiàn)出更強(qiáng)的適應(yīng)性和推理能力。
Veritas 框架在跨域、跨操控類型的檢測場景中,超越了現(xiàn)有 SOTA 方法的性能,并且能夠輸出透明且令人信服的推理過程,展示了人工智能在應(yīng)對(duì)深度偽造問題時(shí)的巨大潛力。該研究成果被ICLR 2026錄用為口頭報(bào)告,進(jìn)一步證明了其在學(xué)術(shù)界的影響力。
![]()
與此同時(shí),團(tuán)隊(duì)還提出了另一項(xiàng)創(chuàng)新——Locate-Then-Examine。這一兩階段檢測新范式通過「先定位可疑區(qū)域,再進(jìn)行細(xì)節(jié)審查」的方法,極大提升了檢測精度,并有效解決了當(dāng)前模型普遍存在的幻覺問題。這一技術(shù)的推出,使得 AI 鑒真在實(shí)際應(yīng)用中更加準(zhǔn)確和可靠,標(biāo)志著 AIGC 檢測技術(shù)邁向了新的高度。
![]()
持續(xù)深耕:筑牢 AI 安全防線
多年來,螞蟻集團(tuán)在生物識(shí)別與安全檢測領(lǐng)域不斷積累技術(shù)優(yōu)勢(shì),參與并主導(dǎo)了多項(xiàng)國際安全標(biāo)準(zhǔn)的制定,積累了超過 50 項(xiàng)國際專利。這些成果為螞蟻 AI 安全實(shí)驗(yàn)室在全球頂級(jí)賽事中屢獲佳績提供了堅(jiān)實(shí)基礎(chǔ),至今已斬獲 10 余項(xiàng)世界冠軍。
隨著大模型時(shí)代的到來,安全威脅日益復(fù)雜,螞蟻團(tuán)隊(duì)始終保持高頻創(chuàng)新,自 2024 年以來,已在 AI 鑒真領(lǐng)域發(fā)表 8 篇高水平學(xué)術(shù)論文,開源 4 個(gè)具有行業(yè)影響力的基準(zhǔn)數(shù)據(jù)集(累計(jì)下載超 10 萬次),并在相關(guān)國際頂級(jí)賽事中獲得 3 次冠軍。
在技術(shù)落地方面,同樣取得了顯著成效。團(tuán)隊(duì)為螞蟻集團(tuán)旗下多個(gè)平臺(tái)(如短視頻、靈光、鯨探等)提供了強(qiáng)大且魯棒的 AIGC 檢測解決方案,服務(wù)了數(shù)億用戶。更值得一提的是,這些技術(shù)已通過 CNAS 認(rèn)證、iBeta 國際生物安全認(rèn)證等多項(xiàng)權(quán)威認(rèn)證,標(biāo)志著其在行業(yè)中的領(lǐng)先地位。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.