337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

CVPR 2026 | 突破局部偏置與誤差累積!AlignVAR 重塑視覺自回歸超分的全局一致性

0
分享至

來源:市場資訊

(來源:小白學視覺)

在圖像超分辨率(ISR)領域,生成模型的發展一直備受關注——GAN雖能提升感知真實性,卻易出現訓練不穩定和視覺偽影;擴散模型雖能實現高保真重建,但其迭代去噪過程帶來的高計算成本,嚴重限制了實際應用。而視覺自回歸(VAR)模型憑借從粗到細的預測策略,本是ISR的理想選擇,卻因空間結構碎片化、跨尺度誤差累積等問題,難以保證重建圖像的全局一致性。

近期,一篇題為《AlignVAR: Towards Globally Consistent Visual Autoregression for Image Super-Resolution》的論文,針對VAR模型在ISR中的核心痛點,提出了全新的全局一致框架AlignVAR,不僅解決了空間和層次不一致的問題,還實現了10倍以上的推理加速、近50%的參數減少,同時保持了極具競爭力的感知質量和結構保真度。

論文信息

題目: AlignVAR: Towards Globally Consistent Visual Autoregression for Image Super-Resolution

面向全局一致的圖像超分辨率視覺自回歸模型

作者:Cencen Liu, Dongyang Zhang, Wen Yin, Jielei Wang, Tianyu Li, Ji Guo, Wenbo Jiang, Guoqing Wang, Guoming Lu

現有VAR模型的兩大“致命缺陷”

要理解AlignVAR的創新之處,首先得搞清楚傳統VAR模型在ISR中到底卡在哪。

1. 空間不一致:注意力只盯“眼前”,全局結構碎了

VAR模型的自注意力機制存在強烈的局部性偏向——注意力權重幾乎全集中在相鄰區域(如圖2),這就導致模型的感受野被嚴重限制,無法整合全局上下文信息。反映在重建效果上,就是圖像出現破碎的紋理、結構失真等問題(如圖3),比如原本連貫的邊緣變得斷斷續續,紋理細節雜亂無章。

2. 層次不一致:誤差越積越多,跨尺度全亂了

傳統VAR模型僅依賴殘差監督,粗尺度預測中哪怕是微小的偏差,都會在后續尺度的預測中不斷傳播、放大。研究人員通過向不同尺度注入隨機擾動發現,這些小擾動最終會導致重建圖像出現顏色偏移、結構錯位(如圖4),就像搭積木時第一塊歪了,后面所有積木都會跟著歪,最終整個結構徹底變形。

這兩個問題的核心,本質是VAR模型在尺度內(空間)和尺度間(層次)缺乏顯式的一致性約束,而AlignVAR的出現,正是為了補上這一關鍵短板。

AlignVAR:全局一致的視覺自回歸新框架

AlignVAR的核心目標是解決空間和層次不一致問題,其總體架構如圖5所示,主要包含兩個互補組件:空間一致性自回歸(SCA)和層次一致性約束(HCC)。前者聚焦尺度內的空間連貫性,后者瞄準尺度間的誤差累積,兩者協同實現全局一致的高質量圖像重建。


圖5:AlignVAR總體架構。SCA負責尺度內特征的自適應重加權,強化空間一致性;HCC通過聯合監督殘差和完整表示,校準尺度間依賴關系。

1. 空間一致性自回歸(SCA):讓注意力“盯準”全局結構

為了緩解VAR模型的局部注意力偏見,SCA引入了“結構感知重新加權”的思路,讓模型不再只盯著局部區域,而是關注結構相關的長程區域。

具體來說,SCA首先從低分辨率輸入圖像中提取結構感知引導圖——通過拉普拉斯算子捕捉圖像的邊緣、紋理等結構線索,再將其下采樣到對應尺度并歸一化,得到跨尺度可比的結構引導信號。隨后,一個輕量級的掩碼生成器結合自回歸標記和結構引導信號,生成空間調制場(也就是自適應掩碼):這個掩碼會給有清晰幾何線索的區域(比如邊緣、紋理)分配更高權重,讓模型優先關注這些穩定、關鍵的區域;同時軟抑制無紋理或不確定區域,減少局部噪聲的放大。

通過這種方式,SCA能引導模型聚合長程上下文信息,增強空間連貫性,從根源上解決局部注意力偏向導致的結構碎片化問題。

2. 層次一致性約束(HCC):從源頭遏制誤差累積

針對跨尺度誤差傳播的問題,HCC跳出了“僅監督殘差標記”的傳統思路,引入“全尺度潛在監督”。

傳統VAR模型只監督每個尺度的殘差預測,相當于只檢查“每一步補的細節對不對”,卻不管“補完后的整體是否符合真實情況”。而HCC會為每個尺度構建完整的潛在狀態真實值,將模型預測的累積潛在表示與這些真實值對齊——簡單來說,就是不僅檢查“每一步補得好不好”,還會在每個尺度都核對“當前完整的潛在表示是否和真實值匹配”。

這種全尺度的監督方式,能在誤差還沒來得及傳播放大時就及時糾正,穩定從粗到細的優化過程。如圖6所示,對比傳統VARSR,AlignVAR能有效減輕跨尺度誤差傳播,重建出更一致的結構和紋理細節。


圖6:多尺度重建效果對比。AlignVAR(右)相比VARSR(左),有效抑制了誤差累積,紋理和結構更連貫。

實驗結果:性能、效率雙突破

為了驗證AlignVAR的效果,研究團隊在合成數據集(DIV2K-Val)和真實世界數據集(DRealSR、RealSR)上開展了全面實驗,對比了基于GAN(BSRGAN、Real-ESRGAN等)、擴散(LDM、StableSR等)和自回歸(VARSR)的主流SOTA方法。

1. 感知質量與保真度:兼顧視覺體驗與重建精度

在定量評估中(如表1),AlignVAR在合成和真實世界基準上均表現亮眼:在DIV2K-Val數據集上,它在FID、LPIPS等感知指標上全面超越GAN和擴散方法,FID低至25.71,LPIPS達到0.2955;在RealSR數據集上,相比VARSR,AlignVAR的MUSIQ從66.65提升至68.53,CLIPIQA從0.5953提升至0.6784,充分證明其能生成更符合人類視覺感知的重建結果。

定性對比(如圖7)更直觀:基于GAN的模型易出現局部失真、鋸齒邊緣,擴散模型可能產生幻覺紋理、削弱結構對齊,而AlignVAR重建出的圖像邊緣銳利、紋理連貫、顏色過渡自然,即使低分辨率輸入中高頻細節丟失,也能保留可恢復的結構,并生成感知合理的紋理。


圖7:AlignVAR與主流ISR方法的視覺效果對比。AlignVAR能有效避免偽影,重建出更自然的細節。

2. 效率:速度與參數雙優化

在效率層面(如表2),AlignVAR展現出壓倒性優勢:重建一張512×512的圖像僅需0.43秒,相比基于擴散的PASD快10倍以上,比5步采樣的UPSR快5倍以上;同時,相比VARSR,AlignVAR移除了額外的擴散細化器,僅引入輕量級掩碼生成器,實現了近50%的參數縮減,在不損失性能的前提下大幅降低了計算成本。

消融實驗:拆解AlignVAR的核心價值

為了驗證各組件的有效性,研究團隊還開展了一系列消融實驗:

1. SCA:平衡保真度與感知質量

移除SCA雖能略微提升保真度指標,但感知得分明顯下降;若給掩碼生成器輸入隨機信號,會導致紋理不穩定、視覺連貫性減弱。這說明SCA能通過結構引導有效增強空間一致性,在保真度和感知質量間找到最優平衡。

2. HCC:校準層次依賴,提升魯棒性

引入HCC后,保真度和感知指標均有一致提升,且在潛在空間應用該約束時,感知連貫性遠優于像素空間。進一步分析發現,HCC能顯著降低各尺度的均方誤差(如圖10左),且面對隨機擾動時,MUSIQ得分退化程度最小(如圖10右),證明其能有效抑制誤差累積,提升模型魯棒性。


圖10:左圖為各尺度MSE對比,HCC顯著降低誤差;右圖為擾動魯棒性測試,AlignVAR抗干擾能力最強。

3. 自適應掩碼:精準聚焦關鍵結構

對SCA的自適應掩碼可視化(如圖9)發現,訓練后的掩碼會精準聚焦語義邊界(如風車葉片、漢字輪廓),同時抑制平滑背景的激活,讓特征圖能突出關鍵結構區域,進一步驗證了SCA增強空間一致性的作用。


圖9:結構引導、初始掩碼、學習后掩碼及重加權特征圖的可視化,掩碼能精準捕捉關鍵結構。

總結:為高效ISR開辟新范式

AlignVAR的提出,不僅系統解決了VAR模型在ISR中空間和層次不一致的核心問題,更通過SCA和HCC的協同設計,在感知質量、結構保真度和計算效率之間實現了極佳的平衡。相比現有主流方法,它既克服了GAN的不穩定性、擴散模型的高計算成本,又彌補了傳統VAR模型的一致性缺陷,為高效、高質量的生成式圖像超分辨率建立了新范式。

這一研究也為視覺自回歸模型在圖像處理領域的應用提供了新思路——通過顯式的一致性約束,讓模型既能捕捉細粒度細節,又能保持全局結構連貫,未來有望拓展到圖像修復、圖像生成等更多計算機視覺任務中。

下載1:OpenCV-Contrib擴展模塊中文版教程

在「小白學視覺」公眾號后臺回復:擴展模塊中文教程,即可下載全網第一份OpenCV擴展模塊教程中文版,涵蓋擴展模塊安裝、SFM算法、立體視覺、目標跟蹤、生物視覺、超分辨率處理等二十多章內容。

下載2:Python視覺實戰項目52講

在「小白學視覺」公眾號后臺回復:Python視覺實戰項目,即可下載包括圖像分割、口罩檢測、車道線檢測、車輛計數、添加眼線、車牌識別、字符識別、情緒檢測、文本內容提取、面部識別等31個視覺實戰項目,助力快速學校計算機視覺。

下載3:人工智能0基礎學習攻略手冊

交流群

歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動駕駛、計算攝影、檢測、分割、識別、醫學影像、GAN、算法競賽等微信群(以后會逐漸細分),請掃描下面微信號加群,備注:”昵稱+學校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會根據研究方向邀請進入相關微信群。請勿在群內發送廣告,否則會請出群,謝謝理解~

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
約基奇+穆雷聯手締造NBA歷史!掘金大勝森林狼拿下季后賽開門紅

約基奇+穆雷聯手締造NBA歷史!掘金大勝森林狼拿下季后賽開門紅

夜白侃球
2026-04-19 20:35:49
北京氣象局:延慶、昌平、門頭溝、房山已出現7級以上大風,并伴有沙塵

北京氣象局:延慶、昌平、門頭溝、房山已出現7級以上大風,并伴有沙塵

環球網資訊
2026-04-19 13:33:02
雷軍挑戰成功!小米新SU7行駛1313公里只充1次電,連續直播15個小時,多名車友一路跟隨

雷軍挑戰成功!小米新SU7行駛1313公里只充1次電,連續直播15個小時,多名車友一路跟隨

極目新聞
2026-04-17 22:41:31
斯諾克世錦賽:丁俊暉7-2領先吉爾伯特,將戰趙心童

斯諾克世錦賽:丁俊暉7-2領先吉爾伯特,將戰趙心童

老汆古裝影視解說
2026-04-19 21:07:14
有人說:男人二婚,就圖睡覺那點事;女人二婚,都是奔那兩個子!

有人說:男人二婚,就圖睡覺那點事;女人二婚,都是奔那兩個子!

游戲收藏指南
2026-04-19 18:55:34
再見了,杜鋒!廣東隊各大主力擺爛逼宮,徐杰崔永熙都不想打了?

再見了,杜鋒!廣東隊各大主力擺爛逼宮,徐杰崔永熙都不想打了?

緋雨兒
2026-04-19 11:27:25
反常!特朗普愿以更多妥協,盡快結束戰爭,到底發生了什么?

反常!特朗普愿以更多妥協,盡快結束戰爭,到底發生了什么?

張牧之
2026-04-18 19:53:47
斯諾克世錦賽:丁俊暉連得191分!復仇戰3-1領先,或會師趙心童?

斯諾克世錦賽:丁俊暉連得191分!復仇戰3-1領先,或會師趙心童?

劉姚堯的文字城堡
2026-04-19 18:29:57
悲劇還是發生了!近日,安徽一女子同房后,肚子很疼,黃體破裂!

悲劇還是發生了!近日,安徽一女子同房后,肚子很疼,黃體破裂!

川渝視覺
2026-04-18 21:37:48
金像獎五強提名,視帝成熱門,TVB前花旦恐陪跑

金像獎五強提名,視帝成熱門,TVB前花旦恐陪跑

你約電影
2026-04-19 20:36:05
藍營優勢僅剩1%!新北選情藍綠徹底易位,李四川支持率從62%暴跌

藍營優勢僅剩1%!新北選情藍綠徹底易位,李四川支持率從62%暴跌

米果說識
2026-04-18 11:51:38
周總理只是讓他去經商,為黨賺取經費,他卻給組織賺回個商業帝國

周總理只是讓他去經商,為黨賺取經費,他卻給組織賺回個商業帝國

鶴羽說個事
2026-04-02 23:00:01
雷軍直播勸:“大老板別買小米汽車”,盤點雷軍十大“槽點”

雷軍直播勸:“大老板別買小米汽車”,盤點雷軍十大“槽點”

歪歌社團
2026-04-18 23:56:33
每吃一次,血管就堵一截?醫生:這5種水果是腦梗“加速器”

每吃一次,血管就堵一截?醫生:這5種水果是腦梗“加速器”

荊醫生科普
2026-04-02 17:35:43
特朗普稱20日將在伊斯蘭堡舉行談判 美伊仍能達成協議

特朗普稱20日將在伊斯蘭堡舉行談判 美伊仍能達成協議

上游新聞
2026-04-19 20:32:17
最多再打3場?肖華一句話引爆全網,41歲詹皇生涯進入倒計時

最多再打3場?肖華一句話引爆全網,41歲詹皇生涯進入倒計時

茅塞盾開本尊
2026-04-19 19:24:28
哈登加盟直接質變!雙核合體碾壓,騎士季后賽完全體正式上線

哈登加盟直接質變!雙核合體碾壓,騎士季后賽完全體正式上線

夜白侃球
2026-04-19 20:50:01
姚晨、曹郁離婚后,首次共同現身

姚晨、曹郁離婚后,首次共同現身

魯中晨報
2026-04-19 09:16:02
1971年,宋子文在參加某宴會時,忽然打了一個飽嗝,隨后確認死亡

1971年,宋子文在參加某宴會時,忽然打了一個飽嗝,隨后確認死亡

云霄紀史觀
2026-04-19 17:38:09
新娘確實漂亮,但我更喜歡戴眼鏡那個。

新娘確實漂亮,但我更喜歡戴眼鏡那個。

動物奇奇怪怪
2026-04-12 12:44:36
2026-04-19 21:36:49
新浪財經 incentive-icons
新浪財經
新浪財經是一家創建于1999年8月的財經平臺
2918632文章數 6768關注度
往期回顧 全部

科技要聞

50分26秒破人類紀錄!300臺機器人狂飆半馬

頭條要聞

半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

頭條要聞

半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂要聞

張天愛評論區淪陷!被曝卷入小三風波

財經要聞

華誼兄弟,8年虧光85億

汽車要聞

29分鐘大定破萬 極氪8X為什么這么多人買?

態度原創

游戲
健康
家居
公開課
軍事航空

LCK第二階段:NS三局戰勝BRO,積分榜力壓對手

干細胞抗衰4大誤區,90%的人都中招

家居要聞

法式線條 時光靜淌

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗逼退美掃雷艇:美方求給15分鐘撤退

無障礙瀏覽 進入關懷版