網易首頁 > 網易號 > 正文申請入駐

庫里被「采訪」？別慌！螞蟻AI鑒真拿下CVPR 2026冠軍，專治黑產

2026-04-10 14:32:23　來源: 機器之心Pro

北京舉報

分享至

機器之心發布

隨著深度偽造技術的不斷進步，演藝行業的明星們已成為換臉技術的最大受害者。近日，多起演員被換臉、克隆，甚至用于虛假宣傳的事件頻頻曝光，引發了社會的廣泛關注。

例如，網友發現 AI 短劇《重生后，我成了娘親的守護神》第 14 集開頭疑似使用了演員楊紫的臉。某短劇平臺則在未經許可的情況下，使用 AI 換臉技術偽造了易烊千璽的肖像與聲音。

網友稱AI短劇《重生后，我成了娘親的守護神》第14集開頭疑似使用了演員楊紫的臉。

某短劇平臺多部AI短劇在未經許可的情況下使用AI換臉技術，偽造星易烊千璽的肖像及聲音。

演員王勁松也曾就AI虛假代言發聲。

不僅演員們紛紛發聲，官方也開始出手。

中國廣播電視社會組織聯合會演員委員會于 4 月 2 日發布嚴正聲明，強烈譴責 AI 換臉、素材濫用及違規訓練 AI 模型等行為，發出行業警告：嚴守法律底線，捍衛視聽真實。

隨著Nano BananaSeedanceKling等圖像和視頻生成模型的飛速迭代，人眼已經難以分辨真實與偽造的界限。換臉技術，只是這一技術濫用的冰山一角。

更為嚴重的是，深度偽造技術濫用的風險急劇上升——從庫里采訪的 AI 杜撰事件，到 AI 生成的假水果圖騙取退款，這些亂象正在嚴重挑戰社會信任和內容平臺的生態。

如何讓 AI 練就火眼金睛？

在這個技術亂象叢生的時代，如何讓 AI 具備火眼金睛成了當務之急。

最近，計算機視覺領域的頂級會議CVPR 2026 的 NTIRE 魯棒性 AIGC 圖像檢測挑戰賽（ Robust AI-Generated Image Detection in the Wild Challenge ）結果出爐。螞蟻集團 AI 安全實驗室的隊伍MICV憑借在魯棒性測試樣本上 ROC AUC 達到了驚人的 0.9723，成功摘得「復雜真實場景魯棒性樣本測試」挑戰賽的冠軍。這場挑戰賽吸引了全球 500 多支隊伍的參與，是全球計算機視覺領域的三大頂級會議之一。

與此同時，螞蟻團隊還發布了業內最全面的 AIGC 圖像視頻檢測資源倉庫。

這個倉庫整合了最新的熱點事件、前沿論文、基準數據集及實用工具，為全球研究人員提供了一個技術參考的寶貴資源。團隊將持續更新，確保資源的時效性與前沿性，以應對 AI 生成內容帶來的挑戰。

開源倉庫：Awesome-AIGC-Image-Video-Detection

現實挑戰：AIGC 鑒真面臨的雙重鴻溝

雖然現有的 AI 鑒真技術在標準高質量基準測試中表現不俗，但面對復雜多變的真實開放場景（ In-the-wild ）時，檢測模型的準確率往往會出現斷崖式下降。這一現象使得業內急需解決兩個核心技術難題。

一個是跨域泛化能力不足。不同生成架構（如擴散模型、自回歸模型等）和閉源商業平臺的生成機制差異巨大，偽影特征也隨之變化。傳統檢測模型常常對單一訓練數據過擬合，一旦遇到新的生成體系，便容易失效，難以識別新型偽造內容。

另一個是真實世界的降質干擾。圖像在互聯網傳播過程中，不可避免地經歷壓縮、模糊、加噪等降質處理，這些退化現象往往會掩蓋微弱的生成痕跡，極大增加了鑒偽的難度。

正是基于這些痛點，本次 CVPR 挑戰賽特別聚焦于如何在「未知生成架構」與「復雜退化干擾」雙重考驗下，依然保持模型的高準確率和高魯棒性。

解決方案：基于 DINOv3 的魯棒檢測框架

為了應對上述挑戰，螞蟻安全團隊提出了一種基于DINOv3 視覺基礎模型的魯棒集成檢測框架。

這一框架充分發揮了 DINOv3 在高頻細節上的強大表征能力，并結合數據構建、模型架構和優化策略的創新，成功實現了從實驗室基準到復雜真實場景的有效遷移。

分層級數據構建：百萬級多源訓練語料

高質量且多維的數據集是打破過擬合的基石。團隊依托深厚的數據積累，構建了包含數百萬樣本的復雜訓練語料庫，層次化覆蓋四類數據來源：開源學術基準、主流開源生成模型定向合成、商業閉源 API 高保真樣本，以及比賽官方數據，確保對當前主流生成生態的全面覆蓋。

雙流特征融合的集成架構：充分挖掘表征潛力

為充分挖掘 DINOv3 在復雜高頻細節上的表征潛力，團隊設計了雙流并行架構。

架構將多組不同配置的 DINOv3 主干網絡劃分為兩個獨立的網絡組，每組內部通過多尺度特征融合機制聚合局部空間特征與全局語義信息，最終由 MLP 模塊輸出分支預測結果。

在決策層面，兩個網絡組獨立執行特征提取與預測，最終通過加權平均完成后融合。這種設計既避免早期特征級聯的信息淹沒問題，又通過不同配置網絡的互補效應，提取出更加全局、立體的圖像表征。

難度感知的魯棒數據增強：模擬真實傳播鏈路的階梯式退化

真實世界的圖像在互聯網傳播中會經歷壓縮、模糊、加噪、截取等多級退化，掩蓋原有的微弱生成痕跡。為縮小實驗室數據與真實場景的分布差異，團隊構建了階梯式的魯棒數據增強鏈路：

多類型退化的系統模擬：涵蓋模糊、噪聲、壓縮偽影、色彩偏移及幾何畸變等多種退化類型，通過分層強度配置，實現從單一擾動到復雜復合擾動的遞進式模擬，深度還原互聯網傳播鏈路中的多級退化特征。
高保真感知增強機制：引入 HiFiC、ELIC 等神經網絡壓縮模型模擬先進編碼失真，同時補充社交平臺傳播壓縮、二次翻拍及截屏等非對稱退化樣本，填補算法模擬與真實邊緣場景的分布差異。

模型優化：構建平滑魯棒的參數空間

Focal Loss：針對退化樣本檢測難易度不均的問題，動態抑制易分類樣本權重，強制模型聚焦被嚴重降質掩蓋的困難樣本。
隨機權重平均（SWA）：在訓練收斂后期對參數空間內多個權重軌跡平滑平均，引導模型收斂至更平坦的極小值區域，降低過擬合風險。
TTA 機制：推理階段聯合原始圖像及其水平翻轉版本進行結果平均，有效提升推理穩定性。

通過這一系列技術創新，螞蟻團隊不僅解決了當前 AIGC 檢測技術在面對多變場景時的諸多挑戰，還為未來更高效、更精準的深度偽造檢測奠定了基礎，進一步推動了 AI 鑒真技術的發展。

產研并進：

打破黑盒瓶頸，拓寬 AIGC 鑒真技術邊界

螞蟻安全團隊在 AI 鑒真技術的理論與方法上不斷創新，近期在CVPRICLR等國際頂級會議上發布了多項高水平研究成果。這些突破不僅為 AI 鑒真領域帶來了新的技術思路，也為破解現有技術瓶頸奠定了基礎。

團隊的目標是打破傳統鑒真模型的黑盒局限，未來的AI鑒真技術將不僅僅是簡單的二分類任務，而是具備強大的泛化能力，并能像人類專家一樣進行推理。

Veritas 框架便是這一努力的具體體現。通過結合多模態大語言模型（ MLLM ）和模式感知推理（ Pattern-aware Reasoning ）機制，團隊突破了傳統大模型純文本思維鏈的限制，使得模型在面對未知生成器時，能展現出更強的適應性和推理能力。

Veritas 框架在跨域、跨操控類型的檢測場景中，超越了現有 SOTA 方法的性能，并且能夠輸出透明且令人信服的推理過程，展示了人工智能在應對深度偽造問題時的巨大潛力。該研究成果被ICLR 2026錄用為口頭報告，進一步證明了其在學術界的影響力。

與此同時，團隊還提出了另一項創新——Locate-Then-Examine。這一兩階段檢測新范式通過「先定位可疑區域，再進行細節審查」的方法，極大提升了檢測精度，并有效解決了當前模型普遍存在的幻覺問題。這一技術的推出，使得 AI 鑒真在實際應用中更加準確和可靠，標志著 AIGC 檢測技術邁向了新的高度。

持續深耕：筑牢 AI 安全防線

多年來，螞蟻集團在生物識別與安全檢測領域不斷積累技術優勢，參與并主導了多項國際安全標準的制定，積累了超過 50 項國際專利。這些成果為螞蟻 AI 安全實驗室在全球頂級賽事中屢獲佳績提供了堅實基礎，至今已斬獲 10 余項世界冠軍。

隨著大模型時代的到來，安全威脅日益復雜，螞蟻團隊始終保持高頻創新，自 2024 年以來，已在 AI 鑒真領域發表 8 篇高水平學術論文，開源 4 個具有行業影響力的基準數據集（累計下載超 10 萬次），并在相關國際頂級賽事中獲得 3 次冠軍。

在技術落地方面，同樣取得了顯著成效。團隊為螞蟻集團旗下多個平臺（如短視頻、靈光、鯨探等）提供了強大且魯棒的 AIGC 檢測解決方案，服務了數億用戶。更值得一提的是，這些技術已通過 CNAS 認證、iBeta 國際生物安全認證等多項權威認證，標志著其在行業中的領先地位。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.