網易首頁 > 網易號 > 正文申請入駐

Generalist爆火背后：具身智能真正的競爭，已不在模型

2026-04-10 18:34:51　來源: 機器之心Pro

北京舉報

分享至

編輯｜Panda

前些天，Generalist AI 發布了 GEN-1 模型，引爆了具身智能領域。該公司 CEO Pete Florence 甚至認為，機器人技術正接近其「ChatGPT 時刻」。

據 Generalist 官方介紹，GEN-1 在多種任務上展現出了高達 99% 的成功率、比以往快 3 倍的執行速度，以及應對意外情況時強大的恢復能力。這些顯性的指標背后隱藏著一個更關鍵的趨勢：具身基礎模型第一次逼近了一個實質性門檻，它正從單純的「能演示」階段，穩步邁向具備商業可行性的「可部署」階段

這也讓人不禁發問：這樣新一代的物理 AI 模型，究竟是如何訓練出來的？

業內信息透露，這一輪能力躍遷的底層支撐，依賴于一套全新的數據與仿真基礎設施體系，其中光輪智能也作為基礎設施體系的關鍵參與者發揮了作用。

是的，GEN-1 的出現預示著：具身智能的競爭陣地，正逐步從模型層遷移至其背后的基礎設施層。

并且，這種底層體系的建立已經迫在眉睫。謝晨在訪談中透露了行業的真實溫度：「今年頭部大廠已經真正下場去卷機器人 VLA。國內的字節跳動、阿里，以及海外的 OpenAI、 DeepMind 和英偉達，推進速度絕對更加激進了。」巨頭們的加速入局，直接將競爭的焦點推向了能夠支撐模型快速迭代的基礎架構層。

不只是模型能力提升

行業競爭的重心也已改變

分析 GEN-1 帶來的影響，我們需要跳出常規的版本升級思維，思考其更深層的意義：GEN-1 第一次將具身基礎模型從「證明機器能學」的驗證期，切實推到了「接近可部署」的商業化門檻。

在這其中，有三項突破尤為關鍵：超高的成功率、快速的執行能力，以及面對意外情況時的自我恢復能力。

這意味著行業的關注焦點已經發生轉移：從業者現在關心的重點，變成了模型執行是否足夠穩定、動作是否足夠敏捷，以及在面對現實偏差時是否具備足夠的魯棒性。

順著這一邏輯推演，一旦模型跨越了初始的可用性門檻，行業面臨的最突出矛盾也將隨之轉化。

接下來的核心挑戰在于如何讓模型持續且穩定地變強。此時，真正關鍵的問題會變成：還能不能拿到更大規模、更高質量、更多樣的數據？能不能可靠地知道模型到底有沒有變好？能不能在更廣的場景、更復雜的任務里持續暴露失敗模式？最后，能不能形成「發現問題→補充數據→再次訓練→重新驗證」的反饋閉環？

基于此，我們可以得出一個清晰的判斷：現如今，行業真正稀缺的資源，已經超出了更強模型本身的范疇，支撐模型能夠持續進化的基礎設施能力成為了制勝關鍵。正因如此，具身智能的競爭正在全面向上游溯源，基礎設施層正在成為角逐的核心戰場。

這些判斷也在張小珺近日對光輪智能 CEO 謝晨的訪談《機器人數據的綜述：新時代的石油》中得到了印證，不僅如此，謝晨還在此次訪談中分享了更多有關具身智能數據基礎設施的洞見。

模型能力躍遷之后

行業開始追問能力從哪里來

如果說 GEN-1 昭示了能力形態上的顯著變化，那么張小珺與光輪智能 CEO 謝晨的那場深度對話，則為我們理解這種變化提供了一大關鍵視角。

在訪談中，謝晨提出了一個非常深刻的類比。他指出：「如果從第一性原理思考，我認為數據可能應該跟人的教育行業類比，就是數據對于模型或者數據對于智能，有點類似于教育行業對于人的學習。」這個判斷意味深長，它表明數據早已超越了單純的樣本集合屬性，轉變為了學習的信號、經驗的傳遞途徑以及能力的塑造方式。

沿著這個框架再去審視當今具身智能前沿，就會發現前沿模型的成功已經難以簡單歸結為數據量的堆砌；其核心在于：具身智能第一次開始形成一個真正的學習系統

在這個高度運轉的系統中，究竟什么樣的數據被采集、什么樣的行為被保留、什么樣的失敗被強化，以及什么樣的能力被持續優化，都不再僅僅是隨機發生的孤立事件，它們正被高度系統性地構建起來。

這也揭示了一個更為深層的產業演進：數據正在從「靜態數據集」加速演進為「動態教育系統」

謝晨將這一過程梳理得十分清晰，從早期機器視覺時代如同填鴨式教育的靜態數據集，到后來工業化的大規模數據生產，再到現在大模型時代需要的反饋驅動。他總結道：「數據可能更多地應該被定義為能夠幫助模型學習的信號以及相應的經驗。」

這種演進的本質，是數據正在朝著「有針對性的指導」方向發展。傳統的機器人訓練往往追求完美的正確軌跡，但在當前的具身模型訓練中，嚴格意義上的完美變得不再絕對。

謝晨在分享服務具體客戶的實踐經驗時，提到了一點反直覺的認知：「其實最有效的數據是先失敗再成功的數據。」在他看來，行云流水般的完美視頻未必最有價值，那些種包含糾錯過程的負樣本，恰恰能夠賦予模型在非結構化環境中隨機應變的能力。

正是在這樣一個全新的發展階段，行業內開始涌現出一類全新的能力體系。這類能力超越了單純的數據提供，致力于構造學習過程本身。業內信息顯示，在這一類不斷壯大的能力體系中，已經明確涵蓋了光輪智能這樣的關鍵參與者。他們正在為具身智能打造一整套完備的教育閉環，讓模型能夠在海量的仿真與現實交互中持續進化。

隱性的瓶頸

評測與仿真基礎設施

謝晨認為，當今具身智能的的底層邏輯早已超越了單一的模型算法，同時涵蓋了數據、評測以及反饋機制等能力。

這些核心要素共同構成了一套全新的能力體系，即學習基礎設施（learning infra）。當模型能力還比較弱的時候，這套系統往往處于隱性狀態；然而當模型開始變得強大，這套基礎設施系統就會成為制約行業發展的真正瓶頸。

在這套系統中，最為關鍵的環節無疑是評測

謝晨在訪談中明確指出了這一點：「如果是具身的話，可能現在最關鍵的問題是評測，尤其是規模化的評測。」

其中的原因非常簡單且致命：測不出來的問題，模型永遠學不會。

為什么評測如此困難？自動駕駛的評價幾乎是「免費」的，因為它有「影子模式」，可以拿司機的操作當老師進行實時對比反饋。但機器人在現實世界不具備這種大規模評價的基礎。缺乏規模化的評測，開發者就無法準確判斷模型是否真的取得了進步，無法系統性地發現模型存在的失敗模式，自然也無法形成有效的反饋閉環。正如謝晨所強調的：「如果這個解決不了，大家就很難去衡量具身智能的提升。這是一個核心。」

在仿真中建立一套類似自動駕駛的「影子模式」評價體系，是具身智能跨越預訓練時代的唯一路徑。

與此同時，數據本身的結構也在發生著深刻的變化。具身智能的發展路徑正在擺脫對單一硬件本體數量的依賴，走向一條全新的演進路線。

謝晨觀察到：「最多的具身數據一定不是本體商提供的。」這意味著，支撐通用具身智能最大規模的數據，一定會走向本體無關。只有構建本體無關的數據閉環，才能真正打破硬件采集的物理限制，為通用大模型的訓練提供海量且多樣的燃料。

在這樣的演進路線下，仿真的行業地位也隨之發生了根本性的改變。過去，仿真往往被視作模型與算法訓練的輔助手段；如今，仿真已然成為整個系統成立的前提條件

謝晨在定義仿真時給出了極其嚴格的標準：「需要在足夠物理準確的環境中，能夠可復現、可修正地去產生相應的行動，并且觀測到其結果。

對于機器人而言，仿真已經去除了「可選項」的標簽，成為了「必備條件」。謝晨非常篤定地表示：「我可以很肯定地說，仿真對于機器人是一個必備條件，沒有仿真這件事肯定做不成。」

他還進一步指出，如果要做大規模、可重復的評測，且同時在千百個不同場景中隨時驗證算法演進，「我認為唯一的方案只有通過仿真。」

缺乏了高精度的仿真環境，行業就無法建立起真正可規模化的評測與學習閉環。這促成了一個關鍵的產業認知轉變：優秀的模型本身已經很難成為單一的競爭壁壘，決定具身智能能力的核心要素，已經轉移到了模型背后那套提供數據、仿真與評測支撐的「數據引擎」上

真正稀缺的不是數據

而是「數據引擎」

在這樣的理論框架下，行業下一階段真正稀缺的能力，已經擺脫了單純對數據量或數據供給本身的依賴。目前的焦點在于：能否持續構造有效的學習信號，能否系統性暴露失敗模式，能否將現實問題轉化為評測問題，進而形成持續迭代的反饋閉環。

也正是在這個意義上，謝晨在訪談里對「data factory」和「data engine」的嚴格區分顯得越來越重要。

前者帶有流水線交付的特征，后者則作為一個反饋驅動、評測驅動的學習引擎存在。

謝晨明確表示：「我更希望把它定位成一個 data engine。」他進一步解釋道：「data factory 有點偏工廠，其運作模式仍停留在流水線層面，不僅缺少關鍵技術與系統化能力，也未構建起反饋驅動的迭代機制。data engine 則是一個反饋驅動的學習引擎。」行業下一階段真正渴望的，正是這種能夠持續生產學習信號的系統，僅僅負責生產樣本的工廠難以滿足未來的演進需求。

進一步說，終局的數據系統會高度類似于教育系統。謝晨推斷：「終局的數據公司可能跟教育公司長得很像。」他也直接指出量販式的 data factory 將會被淘汰：「data factory 還是偏量販式…… 我認為這個路徑可能很快就會不需要了。」真正的終極需求將聚焦于能夠自我進化的數據引擎、仿真環境和評測系統。

在這個意義上，像光輪智能這樣的公司，其生態位也隨之發生變化。它超越了傳統意義上的數據供應商角色，演變為以數據、仿真與評測為核心，驅動模型持續學習的基礎設施系統供應商

謝晨在定義自身企業時提到：「我們是一套以系統驅動的、以系統和評測為中心的…… 通過幫助客戶的模型發現問題，并且基于這些有效的反饋和經驗幫助他們提升的能力。」

從模型時代

進入基礎設施時代

GEN-1 顯然意味著一個新的起點，它尚未解決所有難題，也未能讓具身智能一夜之間跨入大規模商業化階段。

但它已經足夠說明一件事：具身智能正在經歷從「模型驅動」向「基礎設施驅動」的深刻轉型。在這個階段里，決定智能上限的關鍵要素已經轉變為那套讓學習持續發生的系統，單獨的一個更強模型無法支撐起行業的未來發展。

謝晨曾把仿真比作「時間機器」，認為它只是個加速器。但現在他認為，對于機器人而言，仿真是一個「先決條件」。這種認知的轉變，本質上也是整個行業從模型狂熱轉向基礎設施深耕的縮影。謝晨在總結這套基礎設施的核心地位時強調：「我覺得仿真是真正能夠解決具身數據問題的基石，或者說仿真是整個具身智能學習所需要的前提條件。」

面向未來，他描繪了一個更具科幻感卻也極為理性的終局形態：「智能越強，對于數據的饑渴程度反而會成倍增加。到了最后，AI 可能會像馬斯克設想的那樣，處在一個龐大的仿真環境中，基于既定的成功指標，不斷地自我博弈、修煉內功。」這也再次印證了一個結論：Generalist 的躍升只是結果，基礎設施的厚度構成了其背后的真正原因。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.