網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

庫里被「采訪」？別慌！螞蟻AI鑒真拿下CVPR 2026冠軍，專治黑產(chǎn)

2026-04-10 14:32:23　來源: 機(jī)器之心Pro

北京舉報(bào)

分享至

機(jī)器之心發(fā)布

隨著深度偽造技術(shù)的不斷進(jìn)步，演藝行業(yè)的明星們已成為換臉技術(shù)的最大受害者。近日，多起演員被換臉、克隆，甚至用于虛假宣傳的事件頻頻曝光，引發(fā)了社會(huì)的廣泛關(guān)注。

例如，網(wǎng)友發(fā)現(xiàn) AI 短劇《重生后，我成了娘親的守護(hù)神》第 14 集開頭疑似使用了演員楊紫的臉。某短劇平臺(tái)則在未經(jīng)許可的情況下，使用 AI 換臉技術(shù)偽造了易烊千璽的肖像與聲音。

網(wǎng)友稱AI短劇《重生后，我成了娘親的守護(hù)神》第14集開頭疑似使用了演員楊紫的臉。

某短劇平臺(tái)多部AI短劇在未經(jīng)許可的情況下使用AI換臉技術(shù)，偽造星易烊千璽的肖像及聲音。

演員王勁松也曾就AI虛假代言發(fā)聲。

不僅演員們紛紛發(fā)聲，官方也開始出手。

中國廣播電視社會(huì)組織聯(lián)合會(huì)演員委員會(huì)于 4 月 2 日發(fā)布嚴(yán)正聲明，強(qiáng)烈譴責(zé) AI 換臉、素材濫用及違規(guī)訓(xùn)練 AI 模型等行為，發(fā)出行業(yè)警告：嚴(yán)守法律底線，捍衛(wèi)視聽真實(shí)。

隨著Nano BananaSeedanceKling等圖像和視頻生成模型的飛速迭代，人眼已經(jīng)難以分辨真實(shí)與偽造的界限。換臉技術(shù)，只是這一技術(shù)濫用的冰山一角。

更為嚴(yán)重的是，深度偽造技術(shù)濫用的風(fēng)險(xiǎn)急劇上升——從庫里采訪的 AI 杜撰事件，到 AI 生成的假水果圖騙取退款，這些亂象正在嚴(yán)重挑戰(zhàn)社會(huì)信任和內(nèi)容平臺(tái)的生態(tài)。

如何讓 AI 練就火眼金睛？

在這個(gè)技術(shù)亂象叢生的時(shí)代，如何讓 AI 具備火眼金睛成了當(dāng)務(wù)之急。

最近，計(jì)算機(jī)視覺領(lǐng)域的頂級(jí)會(huì)議CVPR 2026 的 NTIRE 魯棒性 AIGC 圖像檢測挑戰(zhàn)賽（ Robust AI-Generated Image Detection in the Wild Challenge ）結(jié)果出爐。螞蟻集團(tuán) AI 安全實(shí)驗(yàn)室的隊(duì)伍MICV憑借在魯棒性測試樣本上 ROC AUC 達(dá)到了驚人的 0.9723，成功摘得「復(fù)雜真實(shí)場景魯棒性樣本測試」挑戰(zhàn)賽的冠軍。這場挑戰(zhàn)賽吸引了全球 500 多支隊(duì)伍的參與，是全球計(jì)算機(jī)視覺領(lǐng)域的三大頂級(jí)會(huì)議之一。

與此同時(shí)，螞蟻團(tuán)隊(duì)還發(fā)布了業(yè)內(nèi)最全面的 AIGC 圖像視頻檢測資源倉庫。

這個(gè)倉庫整合了最新的熱點(diǎn)事件、前沿論文、基準(zhǔn)數(shù)據(jù)集及實(shí)用工具，為全球研究人員提供了一個(gè)技術(shù)參考的寶貴資源。團(tuán)隊(duì)將持續(xù)更新，確保資源的時(shí)效性與前沿性，以應(yīng)對(duì) AI 生成內(nèi)容帶來的挑戰(zhàn)。

開源倉庫：Awesome-AIGC-Image-Video-Detection

現(xiàn)實(shí)挑戰(zhàn)：AIGC 鑒真面臨的雙重鴻溝

雖然現(xiàn)有的 AI 鑒真技術(shù)在標(biāo)準(zhǔn)高質(zhì)量基準(zhǔn)測試中表現(xiàn)不俗，但面對(duì)復(fù)雜多變的真實(shí)開放場景（ In-the-wild ）時(shí)，檢測模型的準(zhǔn)確率往往會(huì)出現(xiàn)斷崖式下降。這一現(xiàn)象使得業(yè)內(nèi)急需解決兩個(gè)核心技術(shù)難題。

一個(gè)是跨域泛化能力不足。不同生成架構(gòu)（如擴(kuò)散模型、自回歸模型等）和閉源商業(yè)平臺(tái)的生成機(jī)制差異巨大，偽影特征也隨之變化。傳統(tǒng)檢測模型常常對(duì)單一訓(xùn)練數(shù)據(jù)過擬合，一旦遇到新的生成體系，便容易失效，難以識(shí)別新型偽造內(nèi)容。

另一個(gè)是真實(shí)世界的降質(zhì)干擾。圖像在互聯(lián)網(wǎng)傳播過程中，不可避免地經(jīng)歷壓縮、模糊、加噪等降質(zhì)處理，這些退化現(xiàn)象往往會(huì)掩蓋微弱的生成痕跡，極大增加了鑒偽的難度。

正是基于這些痛點(diǎn)，本次 CVPR 挑戰(zhàn)賽特別聚焦于如何在「未知生成架構(gòu)」與「復(fù)雜退化干擾」雙重考驗(yàn)下，依然保持模型的高準(zhǔn)確率和高魯棒性。

解決方案：基于 DINOv3 的魯棒檢測框架

為了應(yīng)對(duì)上述挑戰(zhàn)，螞蟻安全團(tuán)隊(duì)提出了一種基于DINOv3 視覺基礎(chǔ)模型的魯棒集成檢測框架。

這一框架充分發(fā)揮了 DINOv3 在高頻細(xì)節(jié)上的強(qiáng)大表征能力，并結(jié)合數(shù)據(jù)構(gòu)建、模型架構(gòu)和優(yōu)化策略的創(chuàng)新，成功實(shí)現(xiàn)了從實(shí)驗(yàn)室基準(zhǔn)到復(fù)雜真實(shí)場景的有效遷移。

分層級(jí)數(shù)據(jù)構(gòu)建：百萬級(jí)多源訓(xùn)練語料

高質(zhì)量且多維的數(shù)據(jù)集是打破過擬合的基石。團(tuán)隊(duì)依托深厚的數(shù)據(jù)積累，構(gòu)建了包含數(shù)百萬樣本的復(fù)雜訓(xùn)練語料庫，層次化覆蓋四類數(shù)據(jù)來源：開源學(xué)術(shù)基準(zhǔn)、主流開源生成模型定向合成、商業(yè)閉源 API 高保真樣本，以及比賽官方數(shù)據(jù)，確保對(duì)當(dāng)前主流生成生態(tài)的全面覆蓋。

雙流特征融合的集成架構(gòu)：充分挖掘表征潛力

為充分挖掘 DINOv3 在復(fù)雜高頻細(xì)節(jié)上的表征潛力，團(tuán)隊(duì)設(shè)計(jì)了雙流并行架構(gòu)。

架構(gòu)將多組不同配置的 DINOv3 主干網(wǎng)絡(luò)劃分為兩個(gè)獨(dú)立的網(wǎng)絡(luò)組，每組內(nèi)部通過多尺度特征融合機(jī)制聚合局部空間特征與全局語義信息，最終由 MLP 模塊輸出分支預(yù)測結(jié)果。

在決策層面，兩個(gè)網(wǎng)絡(luò)組獨(dú)立執(zhí)行特征提取與預(yù)測，最終通過加權(quán)平均完成后融合。這種設(shè)計(jì)既避免早期特征級(jí)聯(lián)的信息淹沒問題，又通過不同配置網(wǎng)絡(luò)的互補(bǔ)效應(yīng)，提取出更加全局、立體的圖像表征。

難度感知的魯棒數(shù)據(jù)增強(qiáng)：模擬真實(shí)傳播鏈路的階梯式退化

真實(shí)世界的圖像在互聯(lián)網(wǎng)傳播中會(huì)經(jīng)歷壓縮、模糊、加噪、截取等多級(jí)退化，掩蓋原有的微弱生成痕跡。為縮小實(shí)驗(yàn)室數(shù)據(jù)與真實(shí)場景的分布差異，團(tuán)隊(duì)構(gòu)建了階梯式的魯棒數(shù)據(jù)增強(qiáng)鏈路：

多類型退化的系統(tǒng)模擬：涵蓋模糊、噪聲、壓縮偽影、色彩偏移及幾何畸變等多種退化類型，通過分層強(qiáng)度配置，實(shí)現(xiàn)從單一擾動(dòng)到復(fù)雜復(fù)合擾動(dòng)的遞進(jìn)式模擬，深度還原互聯(lián)網(wǎng)傳播鏈路中的多級(jí)退化特征。
高保真感知增強(qiáng)機(jī)制：引入 HiFiC、ELIC 等神經(jīng)網(wǎng)絡(luò)壓縮模型模擬先進(jìn)編碼失真，同時(shí)補(bǔ)充社交平臺(tái)傳播壓縮、二次翻拍及截屏等非對(duì)稱退化樣本，填補(bǔ)算法模擬與真實(shí)邊緣場景的分布差異。

模型優(yōu)化：構(gòu)建平滑魯棒的參數(shù)空間

Focal Loss：針對(duì)退化樣本檢測難易度不均的問題，動(dòng)態(tài)抑制易分類樣本權(quán)重，強(qiáng)制模型聚焦被嚴(yán)重降質(zhì)掩蓋的困難樣本。
隨機(jī)權(quán)重平均（SWA）：在訓(xùn)練收斂后期對(duì)參數(shù)空間內(nèi)多個(gè)權(quán)重軌跡平滑平均，引導(dǎo)模型收斂至更平坦的極小值區(qū)域，降低過擬合風(fēng)險(xiǎn)。
TTA 機(jī)制：推理階段聯(lián)合原始圖像及其水平翻轉(zhuǎn)版本進(jìn)行結(jié)果平均，有效提升推理穩(wěn)定性。

通過這一系列技術(shù)創(chuàng)新，螞蟻團(tuán)隊(duì)不僅解決了當(dāng)前 AIGC 檢測技術(shù)在面對(duì)多變場景時(shí)的諸多挑戰(zhàn)，還為未來更高效、更精準(zhǔn)的深度偽造檢測奠定了基礎(chǔ)，進(jìn)一步推動(dòng)了 AI 鑒真技術(shù)的發(fā)展。

產(chǎn)研并進(jìn)：

打破黑盒瓶頸，拓寬 AIGC 鑒真技術(shù)邊界

螞蟻安全團(tuán)隊(duì)在 AI 鑒真技術(shù)的理論與方法上不斷創(chuàng)新，近期在CVPRICLR等國際頂級(jí)會(huì)議上發(fā)布了多項(xiàng)高水平研究成果。這些突破不僅為 AI 鑒真領(lǐng)域帶來了新的技術(shù)思路，也為破解現(xiàn)有技術(shù)瓶頸奠定了基礎(chǔ)。

團(tuán)隊(duì)的目標(biāo)是打破傳統(tǒng)鑒真模型的黑盒局限，未來的AI鑒真技術(shù)將不僅僅是簡單的二分類任務(wù)，而是具備強(qiáng)大的泛化能力，并能像人類專家一樣進(jìn)行推理。

Veritas 框架便是這一努力的具體體現(xiàn)。通過結(jié)合多模態(tài)大語言模型（ MLLM ）和模式感知推理（ Pattern-aware Reasoning ）機(jī)制，團(tuán)隊(duì)突破了傳統(tǒng)大模型純文本思維鏈的限制，使得模型在面對(duì)未知生成器時(shí)，能展現(xiàn)出更強(qiáng)的適應(yīng)性和推理能力。

Veritas 框架在跨域、跨操控類型的檢測場景中，超越了現(xiàn)有 SOTA 方法的性能，并且能夠輸出透明且令人信服的推理過程，展示了人工智能在應(yīng)對(duì)深度偽造問題時(shí)的巨大潛力。該研究成果被ICLR 2026錄用為口頭報(bào)告，進(jìn)一步證明了其在學(xué)術(shù)界的影響力。

與此同時(shí)，團(tuán)隊(duì)還提出了另一項(xiàng)創(chuàng)新——Locate-Then-Examine。這一兩階段檢測新范式通過「先定位可疑區(qū)域，再進(jìn)行細(xì)節(jié)審查」的方法，極大提升了檢測精度，并有效解決了當(dāng)前模型普遍存在的幻覺問題。這一技術(shù)的推出，使得 AI 鑒真在實(shí)際應(yīng)用中更加準(zhǔn)確和可靠，標(biāo)志著 AIGC 檢測技術(shù)邁向了新的高度。

持續(xù)深耕：筑牢 AI 安全防線

多年來，螞蟻集團(tuán)在生物識(shí)別與安全檢測領(lǐng)域不斷積累技術(shù)優(yōu)勢(shì)，參與并主導(dǎo)了多項(xiàng)國際安全標(biāo)準(zhǔn)的制定，積累了超過 50 項(xiàng)國際專利。這些成果為螞蟻 AI 安全實(shí)驗(yàn)室在全球頂級(jí)賽事中屢獲佳績提供了堅(jiān)實(shí)基礎(chǔ)，至今已斬獲 10 余項(xiàng)世界冠軍。

隨著大模型時(shí)代的到來，安全威脅日益復(fù)雜，螞蟻團(tuán)隊(duì)始終保持高頻創(chuàng)新，自 2024 年以來，已在 AI 鑒真領(lǐng)域發(fā)表 8 篇高水平學(xué)術(shù)論文，開源 4 個(gè)具有行業(yè)影響力的基準(zhǔn)數(shù)據(jù)集（累計(jì)下載超 10 萬次），并在相關(guān)國際頂級(jí)賽事中獲得 3 次冠軍。

在技術(shù)落地方面，同樣取得了顯著成效。團(tuán)隊(duì)為螞蟻集團(tuán)旗下多個(gè)平臺(tái)（如短視頻、靈光、鯨探等）提供了強(qiáng)大且魯棒的 AIGC 檢測解決方案，服務(wù)了數(shù)億用戶。更值得一提的是，這些技術(shù)已通過 CNAS 認(rèn)證、iBeta 國際生物安全認(rèn)證等多項(xiàng)權(quán)威認(rèn)證，標(biāo)志著其在行業(yè)中的領(lǐng)先地位。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.