![]()
公司情報(bào)專家《財(cái)經(jīng)涂鴉》獲悉,近日,大曉機(jī)器人聯(lián)合上海交通大學(xué)、南洋理工大學(xué)、香港中文大學(xué)、香港大學(xué)等研究機(jī)構(gòu)共同推出以空間智能為底層框架、跨不同具身本體的通用基礎(chǔ)模型“ACE-Brain-0”, 正式面向全行業(yè)開源。
據(jù)悉,ACE-Brain-0 首次打破汽車、機(jī)器人、無人機(jī)等不同本體壁壘,貫穿空間認(rèn)知、自動(dòng)駕駛、低空感知、機(jī)器人交互,重新定義了物理世界智能的技術(shù)底層邏輯。
其性能表現(xiàn)在涵蓋空間認(rèn)知、自動(dòng)駕駛、低空感知、具身交互的24個(gè)核心 benchmark 中,有19 個(gè)取得當(dāng)前模型中的 SOTA(排名第一) 成績,主要對(duì)標(biāo)GPT-4o、Gemini 2.5-Pro、Qwen2.5-VL-7B-Inst、RoboBrain2.0-7B、MiMo-Embodied-7B等16個(gè)知名模型,將19個(gè)Benchmark具身模型最強(qiáng)基線準(zhǔn)確率相對(duì)提升5%-97.8%。在衡量三維認(rèn)知的MindCube中,以82.1%的成績,較最好的開源模型(InternVL3-8B)提升了97.8%。
在研究過程中,大曉機(jī)器人團(tuán)隊(duì)突破性發(fā)現(xiàn),無論是自動(dòng)駕駛車輛、低空無人機(jī)還是機(jī)器人,盡管形態(tài)差異巨大,但它們都依賴三大核心空間能力:三維空間結(jié)構(gòu)建模、幾何關(guān)系推理、場(chǎng)景演化預(yù)測(cè)。
基于此,大曉機(jī)器人首次提出以空間智能作為跨具身形態(tài)的 “通用語言”,成為連接不同物理域的統(tǒng)一認(rèn)知支架,為通用具身智能找到統(tǒng)一底座。
據(jù)悉, ACE-Brain-0首次在單一模型框架中實(shí)現(xiàn)四大核心具身能力的統(tǒng)一,包括空間認(rèn)知、自動(dòng)駕駛、低空感知、機(jī)器人交互。這一突破并非簡單的能力 “拼接”,而是基于空間智能的深度融合,其技術(shù)關(guān)鍵在于“共享認(rèn)知結(jié)構(gòu)”的構(gòu)建。
通過空間中心化建模,ACE-Brain-0讓不同具身場(chǎng)景的認(rèn)知邏輯實(shí)現(xiàn)統(tǒng)一。自動(dòng)駕駛中的“車距判斷”與機(jī)器人交互中的“抓取距離估算”,共享同一套空間距離推理機(jī)制;交通場(chǎng)景的“多視圖融合”與機(jī)器人的“多視角物體識(shí)別”,則依托相同的跨視角空間對(duì)齊技術(shù)。
同時(shí),大曉機(jī)器人還首創(chuàng)Scaffold-Specialize-Reconcile(SSR)三階段訓(xùn)練范式,通過“先建共識(shí)、再練專長、后融知識(shí)”的路徑,完美解決了傳統(tǒng)跨域訓(xùn)練面臨兩大困境,即聯(lián)合訓(xùn)練易引發(fā)梯度干擾,和序貫訓(xùn)練則會(huì)出現(xiàn)災(zāi)難性遺忘
這種“共享認(rèn)知結(jié)構(gòu)”使得模型能在不同觀察視角、運(yùn)動(dòng)尺度與任務(wù)語義之間自由切換,實(shí)現(xiàn)跨域理解與推理能力的自然遷移。
目前,上述模型已應(yīng)用于大曉機(jī)器人具身超級(jí)大腦模組A1,使搭載具身超級(jí)大腦A1的機(jī)器狗具備行業(yè)首創(chuàng)的端到端自主導(dǎo)航能力,并且基于VLA架構(gòu)實(shí)現(xiàn)云端智能交互,讓機(jī)器狗具備理解抽象指令、感知復(fù)雜環(huán)境、完成復(fù)雜任務(wù)的端到端閉環(huán)能力。
ACE-Brain 讓人看到另一種可能,真正的“通用”,或許不是任務(wù)列表越來越長,而是先找到這些任務(wù)背后的共享結(jié)構(gòu)。
這是一種新的具身智能世界觀——不同身體不一定要從頭學(xué)起,它們可以先共享一個(gè)關(guān)于世界的空間理解,再在這個(gè)基礎(chǔ)上長出各自的能力。未來的具身智能體,無需再為單一形態(tài)定制模型,只需基于 ACE-Brain的空間智能底座,就能快速適配新的物理本體與應(yīng)用場(chǎng)景。從自動(dòng)駕駛到低空經(jīng)濟(jì),從工業(yè)機(jī)器人到家庭服務(wù)設(shè)備,展現(xiàn)出面向真實(shí)物理世界多場(chǎng)景的平臺(tái)潛力。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.