337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

北大團隊提出CPL++框架,實現視覺定位模型的自知之明和自我糾錯

0
分享至



本文是北京大學彭宇新教授團隊在視覺定位方向的最新研究成果,相關論文已被頂級國際期刊 IEEE TPAMI 接收。為視覺定位模型賦予「自知之明」能力 —— 通過自監督的關聯校正與驗證模塊,在訓練過程中動態識別、衰減并糾正錯誤的監督信號。大量實驗證明,讓模型學會「自我糾錯」,是突破弱監督視覺定位瓶頸的有效途徑。



  • 論文標題:Confidence-aware Pseudo-label Self-Correction for Weakly Supervised Visual Grounding
  • 論文鏈接:https://ieeexplore.ieee.org/document/11433810/
  • 開源代碼:https://github.com/oceanflowlab/CPL
  • 實驗室網址:http://mipl.pku.edu.cn

背景與動機

視覺定位(Visual Grounding)旨在根據自然語言查詢準確定位圖像中的目標區域。然而,全監督方法嚴重依賴密集的「圖像 - 文本 - 物體框」細粒度標注,這在處理大規模復雜場景時面臨巨大的標注成本挑戰。因此,僅利用「圖像 - 文本」進行訓練的弱監督視覺定位受到了廣泛關注。

現有弱監督方法通常將該任務視為一個目標檢索過程,依賴跨模態匹配分數或重構損失來挑選候選區域。但語言描述的高層抽象概念與圖像區域的像素級特征之間存在著巨大的「異構鴻溝」,這使得跨模態匹配往往極不可靠。模型在訓練中一旦學到了這些錯誤的「偽關聯」,就會陷入錯誤傳播和累積的死循環。此前的無監督方法嘗試用模板生成偽查詢,但生成的句子生硬且缺乏多樣性,同樣忽略了錯誤關聯對模型的嚴重影響。

針對這一難題,北京大學彭宇新教授團隊提出了置信度感知的偽標簽學習框架(CPL)及其進階版 CPL++,通過引入大模型生成多樣化描述,并結合「自監督關聯驗證」機制,讓模型在訓練過程中學會動態發現并糾正自己的錯誤,實現弱監督視覺定位性能的提升。

技術方案

本文提出的 CPL 框架不僅能過濾錯誤的區域 - 文本關聯,更能利用模型自身在訓練中不斷增強的定位能力,動態地「糾正」這些錯誤標簽。其核心亮點包含以下幾個方面:



圖 1. 置信度感知的偽標簽學習框架 CPL

1. 高質量偽查詢生成與單模態匹配

由于跨模態匹配的困難,本文轉換思路,利用單模態內的匹配構造偽標簽。如上圖所示,CPL 框架提出了三條互補的生成管線(啟發式增強 Heuristic+、以對象為中心描述 Object-Centric、以關系為中心描述 Relation-Aware),為圖像中的每個候選區域生成描述性強、真實且多樣化的偽查詢文本。隨后,模型在文本特征空間內計算真實查詢與偽查詢之間的單模態相似度,挑選最匹配的區域作為初始偽標簽,從而避開了跨模態對齊帶來的挑戰。

2. 靜態跨模態驗證模塊



雖然 CPL 取得了顯著效果,但其驗證模塊是孤立于定位模型之外的「靜態」評估,不僅無法在訓練中動態發揮作用,更缺乏對錯誤關聯的「糾正」機制。為此,研究團隊進一步擴展得到 CPL++ 框架,在以下核心方面進行了自監督升級。



圖 2. 置信度感知的偽標簽學習框架的進階版本 CPL++

3. 自監督關聯校正與動態偽標簽優化

為了糾正錯誤的「區域 - 查詢」關聯,CPL++ 進一步引入了自監督關聯校正模塊。首先,模型不僅僅依賴檢測器的置信度,而是結合了查詢文本中的類別、屬性和空間關系,構建了一個高質量的語義感知候選池。其綜合評分函數定義為:



該評估函數綜合性地結合了查詢文本和候選區域在類別、屬性、空間關系上的匹配程度,并結合檢測器的置信度,對「區域 - 查詢」偽標簽提供了全面、可靠的評估手段,用于發現可能錯誤的「區域 - 查詢」關聯,過濾得到高質量的偽查詢候選池,用于訓練模型。





4. 自監督關聯驗證





這種自監督驗證機制巧妙融合了強大的靜態預訓練模型的先驗知識與不斷動態進化的定位模型的能力,降低了誤差傳播的風險。

實驗結果

本文在弱監督視覺定位領域的五大數據集(RefCOCO、RefCOCO+、RefCOCOg、ReferItGame、Flickr30K Entities)上進行了全面評估。

CPL 基礎框架在這五個數據集的測試集上超越現有的弱監督與無監督方法。具備自糾錯能力的 CPL++ 框架在 CPL 的基礎上進一步實現了 2.78%、5.81%、1.08%、2.03% 和 2.55% 的絕對性能提升。CPL++ 框架將弱監督方法與全監督方法之間的性能差距縮小,展現了偽標簽自校正機制的巨大潛力。



表 1:RefCOCO、RefCOCO+、RefCOCOg 數據集結果



表 2:ReferItGame、Flickr30K Entities 數據集結果

為了進一步直觀展示模型生成偽標簽的實際效果,圖 3 中給出了偽標簽的可視化結果,可以看出,CPL 能夠為圖像候選區域生成描述準確、句式豐富且包含復雜交互關系的高質量偽查詢,提供了高度互補的多樣化監督信息。此外,圖 4 展示了自監督關聯校正模塊的動態糾錯全過程:從圖 4(a)中最初建立的初步偽查詢關聯,到圖 4(b)中經過單模態匹配后可能產生的偏差關聯,最終在校正模塊的干預下,圖 4(c)中模型的預測框被成功糾正并精準鎖定到了與圖 4(d)中的真實文本完全對應的正確目標區域上。這些案例證明了 CPL++ 框架在動態識別并修正錯誤監督信號方面的強大能力。



圖 3:CPL 框架偽標簽可視化



圖 4:CPL++ 框架自監督關聯校正可視化

總結

本文提出了一種弱監督視覺定位框架 CPL++ 。該框架不僅通過單模態匹配建立了更可靠的初始區域 - 文本關聯,更重要的是,它為模型賦予了「自知之明」能力 —— 通過自監督的關聯校正與驗證模塊,在訓練過程中動態識別、衰減并糾正錯誤的監督信號。大量實驗證明,讓模型學會「自我糾錯」,是突破弱監督視覺定位瓶頸的有效途徑。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
iPhone 18 Pro 基本確定:配色砍至3種,維持原價

iPhone 18 Pro 基本確定:配色砍至3種,維持原價

黑貓科技迷
2026-04-16 00:03:45
拉夫羅夫抵京:76歲外交老人的最后一程,世界也到了十字路口

拉夫羅夫抵京:76歲外交老人的最后一程,世界也到了十字路口

聞識
2026-04-16 12:29:54
云南一女童溺水,救人者疑不幸身亡,當地:情況屬實,具體情況在調查

云南一女童溺水,救人者疑不幸身亡,當地:情況屬實,具體情況在調查

大象新聞
2026-04-16 21:45:05
廣州將“禁重點班”后續:有學校開始“退票”、“走班制”陷爭議 | 雋言教育

廣州將“禁重點班”后續:有學校開始“退票”、“走班制”陷爭議 | 雋言教育

朗威談星座
2026-04-16 19:38:20
仰望U8為何“涼了”

仰望U8為何“涼了”

趣味萌寵的日常
2026-04-15 04:07:54
脫口秀演員曝王陽殺青宴被執行導演指著鼻子罵

脫口秀演員曝王陽殺青宴被執行導演指著鼻子罵

韓小娛
2026-04-15 07:55:25
廣東3消息!杜鋒病愈回歸帶隊,焦泊喬正式復出,深圳新小外到位

廣東3消息!杜鋒病愈回歸帶隊,焦泊喬正式復出,深圳新小外到位

多特體育說
2026-04-16 23:06:15
57歲男子不痛不癢卻查出胰腺晚期!提醒:忽視了4個身體早期暗示

57歲男子不痛不癢卻查出胰腺晚期!提醒:忽視了4個身體早期暗示

芹姐說生活
2026-04-16 23:26:47
突發,武漢一大型商超宣布閉店!

突發,武漢一大型商超宣布閉店!

藍色海邊
2026-04-16 01:35:05
10萬股民風中凌亂!股價大漲超4倍后,國際復材股東預再套現22億元

10萬股民風中凌亂!股價大漲超4倍后,國際復材股東預再套現22億元

華夏時報
2026-04-16 18:11:07
女神也老了,顏值再也不如從前了,不過還是好漂亮啊!

女神也老了,顏值再也不如從前了,不過還是好漂亮啊!

小椰的奶奶
2026-04-16 10:31:12
紅土大師賽決賽四勝納達爾,德約坐穩紅土第二人

紅土大師賽決賽四勝納達爾,德約坐穩紅土第二人

網球之家
2026-04-16 20:41:43
張蘭的底線:能容你、助你、寵你,但麻六記絕不讓你碰!

張蘭的底線:能容你、助你、寵你,但麻六記絕不讓你碰!

果子愛吃糖
2026-04-15 15:08:12
阿勒代斯:曼聯不用找別人了,買下打進20球的伊戈爾-蒂亞戈

阿勒代斯:曼聯不用找別人了,買下打進20球的伊戈爾-蒂亞戈

懂球帝
2026-04-16 12:43:15
特朗普已做好開戰準備?王毅曾警告:中美一旦沖突,結局只有1個

特朗普已做好開戰準備?王毅曾警告:中美一旦沖突,結局只有1個

史行途
2026-04-12 12:15:00
長江10年禁漁,江邊百姓無魚可食?十年禁漁后,長江會大魚滿江嗎

長江10年禁漁,江邊百姓無魚可食?十年禁漁后,長江會大魚滿江嗎

向航說
2026-04-16 00:05:08
馬克西31+6助76人戰勝魔術將對陣綠軍,喬治16+5貝恩34分

馬克西31+6助76人戰勝魔術將對陣綠軍,喬治16+5貝恩34分

湖人崛起
2026-04-16 10:15:16
任賢齊“齊跡2026”巡演成都站定檔

任賢齊“齊跡2026”巡演成都站定檔

紅星新聞
2026-04-15 17:00:34
二戰時,德國為何送中國40萬套裝備?要走了垂涎已久的三樣東西

二戰時,德國為何送中國40萬套裝備?要走了垂涎已久的三樣東西

抽象派大師
2026-04-03 14:30:57
恒大集團許家印庭審照片是假的

恒大集團許家印庭審照片是假的

地產微資訊
2026-04-16 19:10:14
2026-04-17 00:16:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12780文章數 142631關注度
往期回顧 全部

科技要聞

趙明:智駕之戰,看誰在大模型上更高效

頭條要聞

東北男子投訴公交提前發車丟工作 單位被施壓將其解雇

頭條要聞

東北男子投訴公交提前發車丟工作 單位被施壓將其解雇

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創始人王子杰去世,享年63歲

財經要聞

海爾與醫美女王互撕 換血抗衰生意迷霧

汽車要聞

空間大五個乘客都滿意?體驗嵐圖泰山X8

態度原創

家居
游戲
本地
房產
軍事航空

家居要聞

智能舒適 簡約風尚

T1選手被送花圈、網暴、堵大樓!官方怒發聲明

本地新聞

12噸巧克力有難,全網化身超級偵探添亂

房產要聞

人人人人!封關后首屆消博會,擠爆了!

軍事要聞

封鎖霍爾木茲海峽后 美釋放雙重信號

無障礙瀏覽 進入關懷版