337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

NeurIPS 2025 Spotlight | 條件表征學習:一步對齊表征與準則

0
分享至



本文第一作者為四川大學博士研究生劉泓麟,郵箱為tristanliuhl@gmail.com,通訊作者為四川大學李云帆博士后與四川大學彭璽教授。

一張圖片包含的信息是多維的。例如下面的圖 1,我們至少可以得到三個層面的信息:主體是大象,數量有兩頭,環境是熱帶稀樹草原(savanna)。然而,如果由傳統的表征學習方法來處理這張圖片,比方說就將其送入一個在 ImageNet 上訓練好的 ResNet 或者 Vision Transformer,往往得到的表征只會體現其主體信息,也就是會簡單地將該圖片歸為大象這一類別。這顯然是不合理的。



圖 1:傳統表征學習(上)與條件表征學習(下)的比較。傳統的表征學習方法只能學習到一種通用的表征,忽略了其他有意義的信息;文章提出的條件表征學習能夠基于指定準則,得到該準則下表現力更強的條件表征,適應多種下游任務。

此外,在各大電商平臺,用戶通常根據不同的標準(例如顏色、材質或場合)搜索商品。例如,用戶今天可能搜索 “紅色連衣裙”,明天搜索 “正裝”,后天搜索某個全新的關鍵詞。這對于擁有龐大規模商品的平臺來說,手動打標簽是不現實的,而傳統的表征學習也僅僅只能獲取到 “連衣裙” 這個層面的信息。

要獲取圖片中除了 “大象”、“連衣裙” 之外的信息,一個很容易想到的方法就是進行針對性的有監督訓練:基于不同的準則比如環境,進行額外的標注,再從頭訓練或者基于已有表征訓練一個額外的線性層。但是基于這種方式,顯然是 “治標不治本” 的。因為一旦有了新的需求,便又需要進行針對性的數據收集、標注和訓練,需要付出大量的時間和人力成本。

很幸運的,我們處在多模態大模型的時代,這個在以前可能會很困難的問題在今天是有很多解法的。我們可以直接通過詢問 LLaVA,它便會告訴我們圖片在指定準則下的信息。但這種方式也還不夠高效,至少在 2025 年的今天,多模態大模型的使用成本還是需要考慮的。如果需要處理 ImageNet 之類的大規模數據集或者電商平臺繁雜的商品,得到其在指定準則下的信息,這個開銷就比較大了。所以對大多數人來說,現如今要獲取圖片的多維信息,還是需要找到一個更加高效的方法。



  • 論文標題:Conditional Representation Learning for Customized Tasks
  • 論文鏈接:https://arxiv.org/abs/2510.04564
  • 代碼鏈接:https://github.com/XLearning-SCU/2025-NeurIPS-CRL

方法


我們知道,對于三維直角坐標系,一組基,比如 [(1, 0, 0), (0, 1, 0), (0, 0, 1)],其線性組合即可構建出該坐標系中的任何向量。類似的,對于顏色體系,只需要 “紅”、“綠”、“藍” 三原色即可調出所有的顏色。

受此啟發,我們想到,是否對于任意一個給定的準則,也存在著一個對應的 “概念空間” 及其基?如果能在這個空間中找到一組基,那么我們只需要將原始表征投影到該空間上,理論上就能獲得在該準則下更具表現力和判別性的特征。

找到給定準則對應的基,這聽起來有些困難。但沒關系,我們不需要很準確地找到,只需要接近它就好。

基于這個想法,論文提出了一種即插即用的條件表征學習方法。如圖 2 所示,給定準則(例如 “顏色”),CRL 首先讓大語言模型 LLM 生成該準則相關的描述文本(例如 “紅色”,“藍色” 和 “綠色” 等)。隨后,CRL 將由 VLM 得到的通用圖片表征,投影到由描述文本張成的空間中,得到該準則下的條件表征。該表征在指定的準則下表達更充分,并且具有更優的可解釋性,能有效適應下游定制化任務。



圖 2:所提出的條件表征學習(CRL)的總體框架。圖中以通用表征空間(準則為隱式的 “形狀”)轉換到 “顏色” 準則空間為例。

直白地說,只需要將對齊的圖片和文本表征,做個矩陣乘法就好了,甚至不需要訓練。復現難度約等于:



實驗


分類和檢索任務是衡量表征學習性能的兩個經典下游任務。論文在兩個分類任務(少樣本分類、聚類)和兩個檢索任務(相似度檢索、服裝檢索)上進行了充分的實驗驗證,部分實驗結果如下:



圖 3:分類任務



表 1:所提出的 CRL 在少樣本分類任務上的性能。



表 2:所提出的 CRL 在聚類任務上的性能。





圖 4:相似度檢索任務。上為 “Focus on an object”(Focus),下為 “Change an Object”(Change)。



表 3:所提出的 CRL 在相似度檢索任務上的性能。



圖 5:服裝檢索任務。



表 4:所提出的 CRL 在服裝檢索任務上的性能。

從上述結果中可以看出, CRL 可以作為一個即插即用的模塊,與現有多模態方法相結合,在不同準則下,其得到的條件表征在下游任務中都取得了比原表征更加優異的表現,性能甚至超過了對應領域的專用方法。更多實驗可參見論文。

總結

與傳統的表征學習只得到單一的通用表征不同,本文提出了條件表征學習,通過獲取指定準則下的文本基,并將圖像表征投影到該文本基張成的空間中,即可得到該準則下表現力更強的條件表征,以更好地適應各種下游任務。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
扎心!俄愛國軍事博主攤牌:再征40萬大軍也白搭,戰場早已變天!

扎心!俄愛國軍事博主攤牌:再征40萬大軍也白搭,戰場早已變天!

老馬拉車莫少裝
2026-03-25 07:41:30
1955 年饒漱石遭開除黨籍,歷多年關押服刑,晚年于農場度余生

1955 年饒漱石遭開除黨籍,歷多年關押服刑,晚年于農場度余生

嘮叨說歷史
2026-03-24 11:17:11
72歲林鳳嬌與成龍慶生舊照,景甜同框,歲月溫柔藏不住

72歲林鳳嬌與成龍慶生舊照,景甜同框,歲月溫柔藏不住

TVB的四小花
2026-03-25 01:29:59
德媒:安世半導體才值幾分錢?歐洲沒有搶對,真正值錢的是中國

德媒:安世半導體才值幾分錢?歐洲沒有搶對,真正值錢的是中國

小嵩
2026-03-25 04:53:17
狂飆!一線城市的二手房正在爆單

狂飆!一線城市的二手房正在爆單

魔都財觀
2026-03-25 08:03:21
風暴來臨前最后的寧靜,達利歐發出重磅預警

風暴來臨前最后的寧靜,達利歐發出重磅預警

楓冷慕詩
2026-03-24 11:21:56
小米汽車外觀被提無效!網友:保時捷出手了么?啥時候起訴Z7?

小米汽車外觀被提無效!網友:保時捷出手了么?啥時候起訴Z7?

大白聊IT
2026-03-25 08:24:21
335美元門票秒空!梅西主場告別引萬人追捧

335美元門票秒空!梅西主場告別引萬人追捧

小潌拍客在北漂
2026-03-25 11:48:39
心比天高命比紙薄!托馬斯從拒簽3000萬到直接失業,豪賭徹底崩盤

心比天高命比紙薄!托馬斯從拒簽3000萬到直接失業,豪賭徹底崩盤

田先生籃球
2026-03-24 11:22:12
張雪峰公司確認其猝死!最后露面臉色疲憊,剛被馬拉松取消名額

張雪峰公司確認其猝死!最后露面臉色疲憊,剛被馬拉松取消名額

萌神木木
2026-03-24 21:50:50
俄羅斯宣傳三天攻占愛沙尼亞!炮制公投,又是特別軍事行動?

俄羅斯宣傳三天攻占愛沙尼亞!炮制公投,又是特別軍事行動?

項鵬飛
2026-03-24 20:28:43
叔本華:性欲是一切欲望的焦點

叔本華:性欲是一切欲望的焦點

聽哲學
2026-03-24 21:42:04
《雍正王朝》演員現狀:有人住千萬豪宅,有人晚節不保,有人離世

《雍正王朝》演員現狀:有人住千萬豪宅,有人晚節不保,有人離世

小徐講八卦
2026-03-24 17:10:05
《鏢人》再破紀錄,打敗《飛馳人生3》,登頂中國冠軍

《鏢人》再破紀錄,打敗《飛馳人生3》,登頂中國冠軍

影視高原說
2026-03-24 19:32:39
德黑蘭街頭忽然空了:巴斯基帳篷被遺棄,民兵連夜跑了,為什么?

德黑蘭街頭忽然空了:巴斯基帳篷被遺棄,民兵連夜跑了,為什么?

老馬拉車莫少裝
2026-03-24 22:55:20
伊朗最高領袖死里逃生細節曝光: 最可怕的“內鬼”亮相了!

伊朗最高領袖死里逃生細節曝光: 最可怕的“內鬼”亮相了!

仕道
2026-03-23 10:34:55
伊朗伊斯蘭革命衛隊:將“毫不留情”對以軍予以猛烈打擊

伊朗伊斯蘭革命衛隊:將“毫不留情”對以軍予以猛烈打擊

新華社
2026-03-25 12:25:36
黃景瑜線下真實狀態,又高又帥和路人不是一個圖層

黃景瑜線下真實狀態,又高又帥和路人不是一個圖層

可樂談情感
2026-03-25 11:53:23
張雪峰一生摯愛國足:想當國腳奪世界杯 國足若進決賽愿死在現場

張雪峰一生摯愛國足:想當國腳奪世界杯 國足若進決賽愿死在現場

念洲
2026-03-25 06:43:05
眼睛是“腦梗”的放大鏡?醫生說:眼睛若有這6個異常,及時就醫

眼睛是“腦梗”的放大鏡?醫生說:眼睛若有這6個異常,及時就醫

健康之光
2026-03-23 22:15:04
2026-03-25 13:31:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12592文章數 142592關注度
往期回顧 全部

科技要聞

紅極一時卻草草收場,Sora宣布正式關停

頭條要聞

伊朗被指可"憑導彈再扛四個月" 美國想停戰以色列慌了

頭條要聞

伊朗被指可"憑導彈再扛四個月" 美國想停戰以色列慌了

體育要聞

NBA最強左手射手,是個右撇子

娛樂要聞

張雪峰經搶救無效不幸去世 年僅41歲

財經要聞

張雪峰:寒門講師的商業躍遷

汽車要聞

智己LS8放大招 30萬內8系旗艦+全線控底盤秀實力

態度原創

藝術
時尚
游戲
數碼
公開課

藝術要聞

《百花譜》,這個春天畫花不用愁!

當年輕女性,闖入電競圈

《GTA6》重大爆料:光NPC就有十萬多條對話!

數碼要聞

華為FreeClip 2耳夾耳機斬獲2026 iF設計獎:全世界都賣爆了 國內外供不應求

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版