網易首頁 > 網易號 > 正文申請入駐

具身導航：感知推理是上帝，還是執行控制是命門？| GAIR Live 023期預告

2026-01-29 22:22:43　來源: AI科技評論

廣東舉報

分享至

作為具身智能觸達物理世界的“第一步”，導航技術正處于從“幾何避障”向“空間智能”跨越的歷史性拐點。

如果說大語言模型賦予了 AI 思考的“靈魂”，那么具身智能則致力于為 AI 打造行動的“身體”。在這一進程中，導航不再是簡單的 A 到 B 的路徑規劃，而是演變為一個集視覺感知、空間推理、實時決策與精密執行于一體的系統性挑戰。

當前，具身導航領域正經歷著一場深刻的范式變革。一邊是學術界對“空間智能”的極致追求：通過三維重建（3DGS）、神經渲染與大模型推理，試圖賦予機器人上帝視角般的理解力；另一邊則是工業界對“端到端決策”的實戰演進：借助自動駕駛的成熟經驗，試圖在物理世界的不確定性中尋求最穩健的執行閉環。

感知推理與執行控制，究竟誰才是具身智能走向通用的“勝負手”？

是依靠高保真的空間建模構建“物理常識”，還是通過海量數據的端到端訓練實現“行動直覺”？當實驗室的算法模型遭遇真實世界里的物理邊界，具身導航的“上車”時刻還有多遠？

本周，GAIR Live 023期線上圓桌將聚焦具身智能導航的前沿進展與落地硬傷，邀請來自頂尖科研機構與自動駕駛前沿的兩位專家，分別站在“眼睛與大腦”和“雙腿與行動”的不同維度，共同拆解具身導航的底層邏輯。

核心議題

? 本質之爭：導航的內核是幾何意義上的“位姿解算”，還是認知層面的“空間推理”？

? 范式演進：“去地圖化”浪潮下，具身智能如何平衡實時感知與空間先驗？

? 數據博弈：空間感知力是靠視頻數據“看”出來的，還是在物理世界“撞”出來的？

? 安全終局：在黑盒化的端到端決策中，如何劃定具身導航的“魯棒性邊界”？

嘉賓陣容

彭思達博士 | 浙江大學百人計劃研究員

主要從事三維視覺、神經渲染與空間智能的研究。他在實時高保真場景重建、人體運動建模等領域有深厚積累，致力于為具身智能構建更精準、更具語義理解力的“眼睛”與“大腦”。

郝孝帥博士 | 自動駕駛前沿算法專家

具身多模態大模型研究員。專注于自動駕駛感知魯棒性與具身智能多模態大模型的深度研究。作為核心第一作者，成功研發了全球首個跨域具身智能大模型 MiMo-Embodied，在推動跨場景通用智能演進方面取得了突破性進展。他專注于將大規模數據驅動的決策能力轉化為物理世界的安全行動，是具身導航從算法原型向實機部署跨越的資深實戰派。

討論精華預覽

?感知升維：實時高保真渲染僅僅是為了“好看”，還是徹底改變了導航的輸入邏輯？

?能力涌現：既然大模型（LLM）已具備常識推理，高精度的 3D 空間重建是否正在失去其獨立價值？

?跨界遷移：自動駕駛在結構化道路上的成功經驗，能否無縫移植給非結構化環境下的通用機器人？

?物理鴻溝：當導航算法脫離動力學模型，我們離“跨本體”的通用導航系統還有多遠？

?Sim2Real：在“無限生成”的虛擬宇宙里學出來的導航策略，如何經受真實世界里“反光、摩擦與碰撞”的考驗？

直播時間：2026年1月30日 19:00（北京時間）

觀看平臺：視頻號“AI科技評論”直播間

掃碼預約，與頂尖專家共同透視具身智能導航的爆發前夜。

未經「AI科技評論」授權，嚴禁以任何方式在網頁、論壇、社區進行轉載！

公眾號轉載請先在「AI科技評論」后臺留言取得授權，轉載時需標注來源并插入本公眾號名片。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.