![]()
作為具身智能觸達物理世界的“第一步”,導航技術正處于從“幾何避障”向“空間智能”跨越的歷史性拐點。
![]()
如果說大語言模型賦予了 AI 思考的“靈魂”,那么具身智能則致力于為 AI 打造行動的“身體”。在這一進程中,導航不再是簡單的 A 到 B 的路徑規劃,而是演變為一個集視覺感知、空間推理、實時決策與精密執行于一體的系統性挑戰。
當前,具身導航領域正經歷著一場深刻的范式變革。一邊是學術界對“空間智能”的極致追求:通過三維重建(3DGS)、神經渲染與大模型推理,試圖賦予機器人上帝視角般的理解力;另一邊則是工業界對“端到端決策”的實戰演進:借助自動駕駛的成熟經驗,試圖在物理世界的不確定性中尋求最穩健的執行閉環。
感知推理與執行控制,究竟誰才是具身智能走向通用的“勝負手”?
是依靠高保真的空間建模構建“物理常識”,還是通過海量數據的端到端訓練實現“行動直覺”?當實驗室的算法模型遭遇真實世界里的物理邊界,具身導航的“上車”時刻還有多遠?
本周,GAIR Live 023期線上圓桌將聚焦具身智能導航的前沿進展與落地硬傷,邀請來自頂尖科研機構與自動駕駛前沿的兩位專家,分別站在“眼睛與大腦”和“雙腿與行動”的不同維度,共同拆解具身導航的底層邏輯。
01
核心議題
? 本質之爭:導航的內核是幾何意義上的“位姿解算”,還是認知層面的“空間推理”?
? 范式演進:“去地圖化”浪潮下,具身智能如何平衡實時感知與空間先驗?
? 數據博弈:空間感知力是靠視頻數據“看”出來的,還是在物理世界“撞”出來的?
? 安全終局:在黑盒化的端到端決策中,如何劃定具身導航的“魯棒性邊界”?
02
嘉賓陣容
![]()
彭思達 博士 | 浙江大學百人計劃研究員
主要從事三維視覺、神經渲染與空間智能的研究。他在實時高保真場景重建、人體運動建模等領域有深厚積累,致力于為具身智能構建更精準、更具語義理解力的“眼睛”與“大腦”。
![]()
郝孝帥 博士 | 自動駕駛前沿算法專家
具身多模態大模型研究員。專注于自動駕駛感知魯棒性與具身智能多模態大模型的深度研究。作為核心第一作者,成功研發了全球首個跨域具身智能大模型 MiMo-Embodied,在推動跨場景通用智能演進方面取得了突破性進展。 他專注于將大規模數據驅動的決策能力轉化為物理世界的安全行動,是具身導航從算法原型向實機部署跨越的資深實戰派。
03
討論精華預覽
?感知升維:實時高保真渲染僅僅是為了“好看”,還是徹底改變了導航的輸入邏輯?
?能力涌現:既然大模型(LLM)已具備常識推理,高精度的 3D 空間重建是否正在失去其獨立價值?
?跨界遷移:自動駕駛在結構化道路上的成功經驗,能否無縫移植給非結構化環境下的通用機器人?
?物理鴻溝:當導航算法脫離動力學模型,我們離“跨本體”的通用導航系統還有多遠?
?Sim2Real:在“無限生成”的虛擬宇宙里學出來的導航策略,如何經受真實世界里“反光、摩擦與碰撞”的考驗?
04
直播時間:2026年1月30日 19:00(北京時間)
觀看平臺:視頻號“AI科技評論”直播間
掃碼預約,與頂尖專家共同透視具身智能導航的爆發前夜。
![]()
未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!
公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.