網易首頁 > 網易號 > 正文申請入駐

清華叉院許華哲：回望2025年，具身智能的幾個“不協調”

2025-12-15 02:24:10　來源: 四木相對論

北京舉報

分享至

2025年行將結束，具身智能一定是今年的科技年度熱詞。

但與熱度并存的，是具身領域從未停止的爭論：Demo外機器人的真實干活水平如何？除了表演，它們還能做到什么？具身模型的進展如何？數據問題如何解決？...

站在2025年的尾巴上審視，這些問題的答案不算明朗。

在這個時點，清華大學姚班助理教授、伯克利歸國四子之一的許華哲，也在社交媒體上發表了他對具身領域的2025年回望。

*許華哲社媒

在這篇名為《具身智能，2025回望》的文章中，許華哲認為，當下具身領域或許存在三個“不協調”：

中國具身公司花更多力氣搞量產、美國公司展示AI技術上限。
在美國，Gen0 的精細操作，Sunday 的長程任務能力，pi 0.6 的持續工作能力讓人震感，中國則強調量產。量產和商業化固然重要，但機器人需要AI能力來領跑，如果由此引發“技術落后”，得不償失。

對很多場景來說，目前沒有自動化的事情，往往要么單價不高，要么重復度不高。
因此，具身智能相比于傳統的工業機器人更像是大模型。就像大模型不應該花時間在“情感理解”，“文章摘要”這樣的任務上一樣，具身智能不應該做這些簡單地任務，而應該去挑戰“強操作”、“高泛化”的事情。

足夠好的具身智能和世界模型不可能從已有的數據中訓練出來，機器人和模型需要“螺旋上升”，邊用邊訓。

以下是許華哲發布在個人社交媒體上的全文。

具身智能：2025回望

北京下雪了。

我在搜狐大廈星巴克剛送走朋友，目送他一段。我當然不是愛上了他，而是想看看他在剛落雪又融化的地面上如何保持平衡。我想結論很簡單：不如 G1 機器人，但好在他很聰明。

回想起幾年前，我們還在討論機器人什么時候能全地形走路，后來發現這個話題變成了“跑酷”、“跳舞”、“籃球”。這個變化速率讓我知道這個事兒已經成了，如果明年可以攀巖我并不吃驚。

但這極快的變化速率又顯得格外不協調，因為我沒在任何地方看到人形機器人真正服務人類。快遞分揀平均速率是1800件每小時，汽車工廠要萬分之一甚至十萬分之一的失誤率。達成的那一天似乎一直在一個不遠不近的地方招手——隔三差五有人宣稱任務已經解決，但和跳舞的同行不同，我們只能在視頻里見到它。

就像前面說的速率上的不協調，回望2025的具身智能，我發現了好幾個這樣不協調的相互映照的“對子”。當然我對它們也有個人的主觀臆斷，所以也請讀者擔待冒失的地方。

一. 兩個世界的機器人夢

從22年、23年同步出發，我們和大洋彼岸幾乎同步啟航了具身智能的事業。但是到了2025年，我們看到了一個比較明顯的分野，中國的公司花更多的力氣搞量產、美國公司則展示AI技術上限。

我看到 Generalist 的 Gen0 精細的操作，看到 Sunday 的長程任務能力，看到 pi 0.6 的持續工作能力，內心是有焦慮的。我有一個不好的直覺，我們要評估我們的技術是不是落后，但我想這里，我有責任，@李弘揚 @趙行 @王鶴 @高陽 @龐江森 @穆堯 @周博宇 @陳源培 @... 也都有責任。量產重不重要，非常重要，但是機器人不是汽車，需要AI能力來領跑。

我覺得我們要適應一件事，就是時代變了。在過往的技術上，我們采用跟隨策略；在大模型上我們已經產生了 DeepSeek 這樣的原始創新；在具身智能上，我們應該有信心也有概率，最大的那件事兒發生在中國。

我之前在破乎中也有討論過：“簡單說你用修長城的場，不管給多少人、多少機器、多少錢該干不出來還是干不出來，該攆不上就是攆不上”。我理解努力做確定性有收益的事情的那種爽感：我努力、我成長、我收獲。但是我想我們真正缺乏的還是：我努力、我失敗了99次、但我吸取教訓并且期待第100次也許會成功。在一些人“成功地”蒸餾別人的模型時，另一些人在“失敗地”研制新的算法。

我認為商業化很重要，也深知量產的嚴肅性，我只是怕我們錯過了最大的那個西瓜。

二. 落地簡單場景還是挑戰困難場景

這陣子也有看過一些場景，各種各樣的工廠。我有一個稍有一點悲觀的暫時性結論：高價值高重復的場景，總會出現一個深圳或者無錫的聰明人，造出一套自動化設備解決90%的問題。這個結論的反面是——目前沒有自動化的事情，往往要么單價不高，要么重復度不高。因此，我反而覺得具身智能相比于傳統的工業機器人更像是大模型。

讓我們沿著這一類比去想，就像大模型不應該花時間在“情感理解”，“文章摘要”這樣的任務上一樣，具身智能就不應該做這些簡單地任務，而是應該去挑戰“強操作”、“高泛化”的事情。這樣我們也更能期待一個高質量的模型，通用地解決許多事情。

當然我們不能否定現有落地的價值，因為很多向具體場景的落地，無論未來的智能模型有多強，都還是需要比較高的遷移成本的，這個路早趟過去也是好的。

三. “預訓練” 配合 “先驗學習”

具身智能的數據瓶頸天然存在，仿真數據不足、真機數據的缺乏，會逐漸解決但也會持續存在。因此，具身智能恐怕不能先窮盡預訓練數據，再走向模型探索，而是需要螺旋上升式地進行探索。

未來我們可能會看到，一個預訓練好的模型，用強化學習在一些任務上變得擁有超越人類的能力；而這個模型可能又會在未來更多的數據上——包括增采的和真機探索的——訓練得更好。

同樣的邏輯，也適用于世界模型，我從不相信我們能夠從人類采集好的數據里面訓練出一個足夠好的世界模型，相反，我們需要機器人真正地自主與世界交互，才能找到真正屬于自己的世界模型。我還一直有一個很感興趣的話題，用一套強化學習目標函數來完成預訓練和后訓練，但這是來年的事情了。

所有的成長，都是掙扎著向上。

具身智能的2025年，沒有一步登天，但是確實越來越強烈地感受到一種未來在召喚。突然想起了前陣子和小龍的一次閑聊。“但也沒感覺很遙遠了” “確實，不算太遠了” “It’s an exciting time. Just needs execution.” 是我們對話的結束。

最后想送給所有夢想著讓機器人幫助所有人的朋友，一句《馬大帥》里的話：“讓我們抓緊時間慢慢等吧”。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.