網易首頁 > 網易號 > 正文申請入駐

「被動感知」到「理解接觸」！它石智航重磅發布OmniVTA視觸覺世界模型

2026-03-26 09:20:41　來源: 新智元

北京舉報

分享至

新智元報道

編輯：犀牛

【新智元導讀】從「被動感知」到「主動預測」，首個視觸覺世界模型讓機器人真正學會「理解接觸」。

想象這樣一個場景：你正在擦桌子、削水果，或者插拔一個精密零件。

這些動作對人類來說輕而易舉，然而對于機器人來說，這些看似簡單的操作卻是一道難以跨越的技術鴻溝。

近期，它石智航聯合新加坡國立大學、復旦大學、中科院自動化所、清華大學、中關村學院以及北京航空航天大學六大頂尖機構，推出OmniVTA視觸覺操作框架和OmniViTac大規模視觸覺數據集并發表相關論文，讓機器人實現從被動感知，到對觸覺進行主動預測和閉環精準控制，邁出靈巧操作的關鍵一步。

論文鏈接：https://arxiv.org/pdf/2603.19201

項目主頁：https://mrsecant.github.io/OmniVTA/

數據集鏈接：https://huggingface.co/datasets/tars-robotics/OmniVitac

當前，業內深陷于一個反直覺困境：即便觸覺傳感器在機器人領域已經廣泛應用，整個行業卻深陷「感知更多、做得更差」的困境。

機器人明明「摸得到」，卻依然「不會用」。

為什么給機器人提供額外的觸覺感知，反而可能讓它表現更差？

答案在于，當前主流方案對觸覺本質存在根本性誤解。

機器人操作領域長期缺乏對接觸動態的建模和對觸覺信息的有效利用。

當前主流方案僅將視覺與觸覺特征簡單拼接后輸入策略網絡。這種方式看似合理，實際上卻忽視了觸覺的核心特征。

相較于具備全局語義與連續觀測能力的視覺，觸覺信號高度局部且由接觸事件驅動，無法提供全局感知，難以支撐長時序規劃。

更關鍵的是，接觸本質上是一個隨時間演化的動態過程。

擦拭、削皮、插接、擰緊等操作，都是「接觸狀態隨時間不斷變化」的過程。

然而，現有方法通常僅利用當前或歷史幾幀觸覺觀測，缺乏對「接觸如何隨時間演化」的顯式建模。

結果是觸覺往往只被用于簡單的接觸檢測或視覺遮擋補償，而無法真正參與對接觸過程的預測與決策。

同時高頻觸覺數據缺失也讓模型難以學習真實接觸規律，操作穩定性與泛化性嚴重不足。

人類真實行為啟發

「預測+反饋」協同機制

如何破解這一困局？答案或許就藏在人類自身的神經機制中。

神經科學研究表明，人類在進行接觸操作時，依賴的是一套「預測+反饋」的協同機制：大腦一方面通過前向模型提前預測動作將帶來的感覺變化，另一方面通過實時感覺反饋進行快速修正，抵消誤差和擾動。

正是這種「先預測再修正」的機制，讓人類能夠在不確定的環境中，依然完成穩定而靈巧的接觸操作。

「預測 + 反饋」的協同機制。圖源：Motor prediction[1]

本次它石智航聯合六大頂尖機構，從數據底座與技術框架雙向攻堅。在數據層面上，團隊發布了OmniViTac大規模視觸覺數據集，如下圖所示，為后續模型訓練筑牢基礎。

這是迄今為止規模最大、質量最高的視觸覺操作數據集之一，目前已收錄2萬余條操作軌跡，覆蓋近百類任務和百余種物體，并將接觸模式系統性分為擦拭、削皮、切割、抓取、裝配以及手內調整六類，在數據采集過程中嚴格保證視覺、觸覺與動作的高精度同步，并保留了原始傳感器頻率。

該數據集也同步受到了業界認可，獲得由魔搭社區（ModelScope）主辦的「EAI-2025年度10大數據集」獎項。

OmniVitac數據集

依托 OmniViTac 的多模態數據支持，它石創新提出了 OmniVTA——一種以世界模型為核心的視觸覺操作框架。

該方法的核心思路在于從「被動感知觸覺」轉向「主動預測觸覺」：機器人不僅能夠感知當前觸覺信號，還實現了建模并預測未來觸覺的演化過程，并以此指導動作規劃與閉環調整。

在系統設計上，OmniVTA 采用慢–快分層控制結構，如下圖所示：慢系統基于視覺–觸覺世界模型預測未來觸覺表征并生成動作序列，快系統則利用預測觸覺與實時觸覺反饋進行反射式高頻控制，從而實現穩定、魯棒且精細的接觸操作。

OmniVTA系統圖

在此基礎上， OmniVTA通過四個關鍵模塊協同構建統一的閉環控制體系，使機器人具備「預測觸覺—理解接觸—修正動作」的能力，從而重塑其在復雜接觸場景中的操作表現：

TactileVAE：通過時空聯合編碼與隱式函數解碼，將高頻、稠密的觸覺3D形變壓縮為低維連續潛變量表示，如下圖所示。

該模塊不僅在空間上保留細粒度接觸結構（如剪切、法向形變等），還在時間上建模觸覺動態變化，從而有效刻畫接觸過程的演化軌跡。

在顯著降低數據維度與計算開銷的同時，為后續預測與控制提可泛化的觸覺表征，使機器人能夠高效理解當前接觸狀態并快速響應環境變化。

TactileVAE網絡結構圖

視觸覺世界模型（預測模塊）：基于雙流擴散生成架構，在共享條件約束下聯合建模視覺與觸覺的時序演化關系。

視覺分支提供全局語義與幾何先驗，觸覺分支聚焦局部接觸動態，兩者在潛空間中協同對齊，從而實現對未來觸覺信號的高質量預測。

通過顯式建模「接觸發生前—接觸發生中—接觸演化后」的動態過程，該模塊使機器人能夠提前預判接觸趨勢（如即將發生的接觸、接觸強度變化或滑動風險），為動作規劃提供前瞻性信息支撐。

自適應融合策略（決策模塊）：引入 Latent Tactile Differential（LTD）編碼器，對當前觸覺與預測觸覺之間的差異進行顯式建模，從而提取接觸動態變化的關鍵信號。

在此基礎上，結合門控（gating）機制對視覺與觸覺模態進行動態加權，使策略能夠根據接觸階段自適應調整感知依賴：在無接觸或遠接觸階段側重視覺全局信息，在接觸發生及演化階段增強觸覺主導作用。

該模塊有效避免了簡單特征拼接帶來的信息沖突問題，使動作決策更加精確且具備情境適應性。

OmniVTA慢策略：視觸覺世界模型+自適應融合策略

反射式觸覺控制器（執行模塊）：基于預測觸覺與實時觸覺反饋，在 60 Hz 高頻下輸出單步修正動作，對慢系統生成的動作序列進行連續閉環補償。

該控制器通過建模觸覺誤差（預測–觀測差異）實現快速響應，可在接觸擾動、物體偏移或摩擦變化等情況下即時修正執行軌跡，從而顯著提升操作穩定性與精度。

其引入使系統具備類似人類「觸覺反射」的能力，能夠有效彌補低頻規劃帶來的滯后性。

基于觸覺特征的反射式控制器

實操驗證

從「機械記憶」到「理解接觸」

實驗數據表明，OmniVTA視觸覺操作框架在不同物體、不同接觸模式下均取得了最優性能。在位置變化、工具變化和外界擾動等情境中，展現出了遠超傳統方法的魯棒性和泛化能力。

操作過程中實時擾動-恢復接觸

更具深遠意義的是，模型學習到了可遷移的接觸動態規律。

如下圖所示，模型能根據預測的接觸狀態自適應調整視覺與觸覺的權重，并在不同物體和工具下保持穩定表現。

這表明機器人正在從「執行動作」走向「理解物理接觸」，逐步具備類似人類的預測與反饋協同能力。

門控機制效果：觸覺和視覺權重隨操作過程的變化

可以看到，OmniVTA展示了一條清晰的技術路徑：以「世界模型」為核心，以預測為先導、反饋為保障，最終使機器人能夠真正勝任精密裝配、家居清潔與食材備制等工業生產與日常生活中不可或缺的接觸密集型（contact-rich）任務。

本次它石聯合多所頂尖科研機構發布的OmniVTA框架，不僅在學術研究方面有所突破，更具有深遠的產業應用落地價值，將具身智能「干活」的能力提升至可落地、可泛化、可規模化的全新高度。

參考資料：

[1] Wolpert, Daniel M., and J. Randall Flanagan. 「Motor prediction.」 Current biology 11.18 (2001): R729-R732.

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

從"看得見"到"能干活"，機器人的下一步是擁有觸覺

DeepTech深科技 2026-03-01 17:20:50
0 跟貼 0
宇樹科技王興興：給機器人行業多一點耐心

財聯社 2026-02-18 18:01:39
5 跟貼 5

美國開發六足機器人，跑起來堪比飛人博爾特

裝甲鏟史官 2026-01-03 11:19:04
843 跟貼 843

馬斯克：3年內機器人超越頂尖醫生

財聯社 2026-01-09 15:31:35
2 跟貼 2
新穎鰭足機器人，水陸兩棲行動自如，適應各種地形

裝甲鏟史官 2025-12-25 10:58:04
1 跟貼 1

港中深-跨維智能提出EVA框架，強化學習讓視頻世界模型“動”起來

機器之心Pro 2026-03-26 16:08:37
0 跟貼 0

浙大博士造出「機器人界的F1」：不卷腦子卷身體，要比博爾特跑得快

36氪 2026-03-26 22:37:08
4 跟貼 4
零樣本 Sim-to-Real ！2

機器之心Pro 2026-03-25 11:40:23
0 跟貼 0

行業最大規模具身數據集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0
北京人形發布開源開放生態計劃，打造具身智能生態標桿

智東西 2026-03-26 20:57:04
0 跟貼 0
行業最大規模具身數據集！出自簡智機器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0
五八智能四足機器人平臺Q20A，適用于千行百業

量子位 2025-09-30 15:35:41
0 跟貼 0
破解機器人「慢半拍」難題1

機器之心Pro 2026-02-10 14:06:54
0 跟貼 0
機器人打包運輸的正確方式

裝甲鏟史官 2026-02-22 10:41:15
0 跟貼 0
機器人管家Figure 03來了，承包一切家務！

量子位 2025-10-11 10:13:00
0 跟貼 0
全球頂尖大模型一夜慘遭血洗！最難測試人類拿滿分，AI第一名得0.2%分

新智元 2026-03-26 18:14:12
37 跟貼 37
在線等：如何優雅地分走鵝廠這600+萬？

量子位 2026-03-26 16:24:03
0 跟貼 0
陶哲軒：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟貼 0
機器人著力展示“打工”技能靈巧手廠商關注度提升｜2026中關村論壇年會觀察

每日經濟新聞 2026-03-26 22:16:09
0 跟貼 0
AI寫CUDA算子國產芯片不行？上交方法直線拉升，DeepSeek也適用

機器之心Pro 2026-03-26 15:59:24
0 跟貼 0
支持遠程操控和通用GUI操作3

機器之心Pro 2026-03-02 13:36:13
0 跟貼 0
小心！你的AI正在一本正經地忽悠你

財聯社 2026-02-05 16:35:01
0 跟貼 0
MIT研究生用NotebookLM兩天學完一學期課程

量子位 2026-03-22 10:50:49
0 跟貼 0
人活著的唯一理由是善良

葉檀財經 2026-02-01 17:07:04
0 跟貼 0
荒野求生（機器狗全自主版），2025ATEC挑戰真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
如何點亮小龍蝦的牛馬技能包?

量子位 2026-03-18 12:51:26
0 跟貼 0
博士生如何用龍蝦做知識管理？歡迎圍觀！

量子位 2026-03-26 23:23:30
0 跟貼 0
大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
高通萬衛星談終端大模型優勢：個性化與數據推理

量子位 2025-12-11 03:38:41
0 跟貼 0
陶哲軒：AI看似在推理，其實是在背答案

量子位 2026-01-05 09:20:21
0 跟貼 0
巔峰對話AI時代經濟增長：諾獎經濟學家彼得·豪伊特拋出增長七要素，中關村學者激辯人機共生新規則

每日經濟新聞 2026-03-27 00:36:03
0 跟貼 0
它石智航用“吉尼斯紀錄”交卷真干活的具身大腦

量子位 2026-03-26 10:54:37
0 跟貼 0
男人每天虐待自家的機器人

孖花聊電影 2026-03-23 20:21:29
22 跟貼 22
中關村論壇變賽博世界，機器人餐吧正式營業

究竟視頻 2026-03-26 14:22:40
0 跟貼 0
OpenAI關停Sora！25個月從封神到退場

量子位 2026-03-25 20:15:20
0 跟貼 0
美國一中餐館用機器人跳舞娛樂食客，結果機器人失控差點摁不住

王小東 2026-03-24 13:20:08
38 跟貼 38
【青年人關注十大熱詞快評，數智北京｜聚焦2026中關村論壇】關注半兩財經，帶你看懂中關村、讀懂新科技

北青網-北京青年報 2026-03-26 10:23:09
0 跟貼 0
千萬粉絲大V，微博賬號被禁止關注

第一財經資訊 2026-03-26 12:19:47
2095 跟貼 2095
剛剛開源了！

機器之心Pro 2026-03-25 15:18:26
0 跟貼 0
IP67加持+超強載重，這款四足機器人扛起工業新未來

Maxonor創意公元 2026-03-24 18:51:30
0 跟貼 0

新智元

AI產業主平臺領航智能+時代

14821文章數 66720關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

親子

家居

本地

軍事航空

手機 / 數碼

房產 / 家居

「被動感知」到「理解接觸」！它石智航重磅發布OmniVTA視觸覺世界模型

美團發布外賣大戰后成績單：虧損超200億

特朗普：對伊朗能源設施空襲再推遲10天

特朗普：對伊朗能源設施空襲再推遲10天

申京努力了，然而杜蘭特啊

劉曉慶妹妹發聲！稱姐姐受身邊人挑撥

油價"馴服"特朗普？一到100美元就TACO

一汽奧迪A6L e-tron開啟預售 CLTC最大續航815km

態度原創

河南開封萬歲山武俠城，游客買300元門票：給妻子拍照被保安阻攔

試工育兒嫂被查出傳染病，寶媽崩潰！家政服務“健康關”如何保障？

傍海而居 靜觀蝴蝶海

救命，這只醬板鴨已經在我手機復仇了一萬遍

擔心特朗普突然停戰 以總理下令48小時盡力摧毀伊設施

傍海而居靜觀蝴蝶海

擔心特朗普突然停戰以總理下令48小時盡力摧毀伊設施