337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

理想汽車發(fā)布下一代自動駕駛基礎(chǔ)模型MindVLA-o1

0
分享至

2026年3月17日,理想汽車基座模型負(fù)責(zé)人詹錕出席NVIDIA GTC 2026,發(fā)表主題演講《MindVLA-o1:開啟全能范式——下一代統(tǒng)一視覺-語言-動作自動駕駛大模型探索》,發(fā)布下一代自動駕駛基礎(chǔ)模型MindVLA-o1。MindVLA-o1通過五大技術(shù)創(chuàng)新,構(gòu)建了面向物理世界智能的自動駕駛基礎(chǔ)模型,讓自動駕駛看得更遠(yuǎn)、想得更深、行得更穩(wěn)、進(jìn)化更快、部署更高效。

詹錕表示:“當(dāng)我們把視覺、語言和行動統(tǒng)一到一個模型中時,它已不再只是自動駕駛模型,而是在逐漸演化為面向物理世界的通用智能體。基于同一套VLA模型,不僅可以控制車輛,也能夠擴(kuò)展到機(jī)器人。因此,自動駕駛只是物理AI的起點(diǎn),未來這類基礎(chǔ)模型將驅(qū)動新的具身智能范式。”

從規(guī)則時代到AI時代 理想輔助駕駛持續(xù)演進(jìn)

自2021年啟動輔助駕駛自研以來,理想輔助駕駛技術(shù)架構(gòu)經(jīng)歷了多輪關(guān)鍵迭代,持續(xù)的技術(shù)探索與工程實(shí)踐,為理想汽車在軟硬件一體化研發(fā)領(lǐng)域積累了深厚的基礎(chǔ)研究能力與研發(fā)實(shí)力。2024年是理想輔助駕駛的重要分水嶺,隨著端到端+VLM(視覺語言模型)雙系統(tǒng)架構(gòu)量產(chǎn)交付,輔助駕駛首次真正具備了跨場景、跨任務(wù)的統(tǒng)一理解能力。2025年,理想汽車進(jìn)一步將空間理解、語言理解與行動決策統(tǒng)一到同一模型框架,構(gòu)建了基于VLA、世界模型與強(qiáng)化學(xué)習(xí)三大技術(shù)棧的VLA司機(jī)大模型,并于8月隨理想i8交付正式推送,9月向AD Max用戶全量推送。

截至2025年底,VLA司機(jī)大模型月使用率達(dá)到80%,VLA指令累計使用1225.4萬次;春節(jié)期間理想輔助駕駛總里程達(dá)2.5億公里,VLA指令使用次數(shù)達(dá)130.3萬次。規(guī)模化的用戶驗(yàn)證與持續(xù)積累的真實(shí)場景數(shù)據(jù),為理想汽車推進(jìn)下一代自動駕駛技術(shù)演進(jìn)提供了堅實(shí)基礎(chǔ)。

MindVLA-o1五大技術(shù)創(chuàng)新:看得更遠(yuǎn)、想得更深、行得更穩(wěn)、進(jìn)化更快、部署更高效

理想汽車提出下一代統(tǒng)一架構(gòu)——MindVLA-o1。該架構(gòu)以原生多模態(tài)MoE Transformer為核心,通過五大技術(shù)創(chuàng)新——3D空間理解、多模態(tài)思考、統(tǒng)一行為生成、閉環(huán)強(qiáng)化學(xué)習(xí)(Closed-loop RL)和軟硬件協(xié)同設(shè)計(Hardware–Software Co-Design),構(gòu)建了面向物理世界智能的自動駕駛基礎(chǔ)模型。


在感知層面,理想汽車采用以視覺為核心的 3D ViT Encoder(3D視覺模型編碼器),并利用激光雷達(dá)點(diǎn)云作為三維幾何提示,引導(dǎo)模型理解真實(shí)空間結(jié)構(gòu),使其在單一表示中同時具備語義理解與三維感知能力。同時引入前饋式3DGS表示(Feedforward 3D Representation),將場景拆分為靜態(tài)環(huán)境與動態(tài)物體分別建模,并通過下一幀預(yù)測(Next-state prediction)作為自監(jiān)督信號,使模型同時學(xué)習(xí)深度信息、語義結(jié)構(gòu)與物體運(yùn)動,最終形成融合空間結(jié)構(gòu)與時間上下文的高質(zhì)量3D表示。具備3D空間理解能力,使模型看得更遠(yuǎn)。


在思考層面,自動駕駛既要理解當(dāng)前環(huán)境,也要預(yù)測未來幾秒的場景演化。在語言模型承擔(dān)語義理解、常識知識和交互能力的基礎(chǔ)上,理想汽車還引入了預(yù)測式隱世界模型,在隱空間中高效模擬未來。訓(xùn)練分三階段:第一,用海量視頻數(shù)據(jù)預(yù)訓(xùn)練Latent World Token(隱世界詞元),構(gòu)建未來表征;第二,在MindVLA-o1中持續(xù)世界模型的推演,形成隱空間的未來推理能力;第三,將世界模型、多模態(tài)推理能力及駕駛行為進(jìn)行聯(lián)合訓(xùn)練與對齊。由此,模型不僅能理解當(dāng)前場景并進(jìn)行邏輯判斷,還能在隱空間中提前“想象”未來畫面,將駕駛決策具象化。理想汽車將這種能力定義為多模態(tài)思考(Generative Multimodal Thinking)。擁有多模態(tài)思考能力,讓模型想得更深。


在行為層面,理想汽車構(gòu)建了統(tǒng)一行為生成(Unified Action Generation)機(jī)制。首先,MindVLA-o1使用VLA-MoE(混合專家模型)架構(gòu),并引入專門的Action Expert(動作專家),從3D場景特征、導(dǎo)航目標(biāo)、駕駛指令等多維輸入中提取信息,并結(jié)合多模態(tài)思考生成高精度駕駛軌跡。其次,為滿足實(shí)時性要求,系統(tǒng)采用并行解碼(Parallel Decoding),同時生成所有軌跡點(diǎn),大幅提升效率。最后,引入Discrete Diffusion(離散擴(kuò)散)進(jìn)行多輪迭代優(yōu)化,類似逐步去噪,確保軌跡空間連續(xù)、時間穩(wěn)定,并符合車輛動力學(xué)約束。形成統(tǒng)一行為生成機(jī)制,使模型行得更穩(wěn)。


在模型迭代層面,理想汽車構(gòu)建了閉環(huán)強(qiáng)化學(xué)習(xí)框架,讓模型不僅能從真實(shí)數(shù)據(jù)學(xué)習(xí),還能在世界模擬器(World Simulator)中持續(xù)探索和優(yōu)化策略。為此,理想汽車將傳統(tǒng)逐步優(yōu)化式重建升級為Feed-forward(前饋)場景重建,使系統(tǒng)能夠瞬時生成大規(guī)模、高保真駕駛場景,支持大規(guī)模并行訓(xùn)練。同時,結(jié)合生成式模型(Generative Models),模擬環(huán)境可擴(kuò)展、編輯并生成全新場景。為支持大規(guī)模模擬與訓(xùn)練,理想汽車開發(fā)了統(tǒng)一的3D Gaussian Splatting(3D高斯?jié)姙R)渲染引擎和分布式訓(xùn)練框架,渲染速度提升近2倍,整體訓(xùn)練成本降低約75%,實(shí)現(xiàn)低成本、高效率的強(qiáng)化學(xué)習(xí)閉環(huán)。在閉環(huán)強(qiáng)化學(xué)習(xí)框架下,模型實(shí)現(xiàn)更快進(jìn)化。


為解決傳統(tǒng)端側(cè)大模型部署耗時長、調(diào)試頻繁的問題,理想汽車提出面向端側(cè)大模型的軟硬件協(xié)同設(shè)計定律,將模型結(jié)構(gòu)與驗(yàn)證損失建模,并結(jié)合Roofline模型刻畫硬件計算能力與內(nèi)存帶寬限制,在模型性能與硬件約束之間建立統(tǒng)一的分析框架。理想汽車基座模型團(tuán)隊評估了近2000種模型架構(gòu)配置,在英偉達(dá)Orin與Thor平臺上完成驗(yàn)證,找到了模型精度與推理延遲之間的Pareto Front(帕累托前沿),將架構(gòu)探索時間從數(shù)月縮短至數(shù)天,大幅提升端側(cè)VLA模型的設(shè)計與部署效率。在軟硬件協(xié)同設(shè)計定律下,模型部署更高效。


自動駕駛只是起點(diǎn),為具身智能構(gòu)建“數(shù)字大腦”

MindVLA-o1是理想汽車面向物理世界智能核心AI框架的重要組成部分。這套AI框架由四大核心模塊組成:MindData,統(tǒng)一的VLA數(shù)據(jù)引擎,負(fù)責(zé)大規(guī)模數(shù)據(jù)的采集、清洗和自動標(biāo)注;MindVLA-o1,統(tǒng)一的原生多模態(tài)VLA模型,可以理解環(huán)境、進(jìn)行推理,并生成駕駛行為;MindSim,可控的多模態(tài)世界模型,用于生成復(fù)雜駕駛場景并支持大規(guī)模閉環(huán)訓(xùn)練;RL Infra(強(qiáng)化學(xué)習(xí)基礎(chǔ)設(shè)施),通過獎勵模型和策略學(xué)習(xí),使系統(tǒng)在仿真與真實(shí)環(huán)境中自我進(jìn)化。

四部分協(xié)同形成完整閉環(huán),使AI能夠感知、理解并在物理世界中自主行動,并持續(xù)學(xué)習(xí)。從結(jié)構(gòu)上看,這套系統(tǒng)如同一個“數(shù)字大腦”:感知層對應(yīng)視覺皮層,推理與規(guī)劃如前額葉,場景生成似運(yùn)動皮層,強(qiáng)化學(xué)習(xí)則類似多巴胺反饋,實(shí)現(xiàn)了感知、理解、行動和持續(xù)優(yōu)化的完整閉環(huán)。

該框架不僅服務(wù)于汽車,也可擴(kuò)展至機(jī)器人及各種物理系統(tǒng)。對理想汽車而言,車是最大號的機(jī)器人,其本質(zhì)是在構(gòu)建硅基生命體的軀干與大腦。


理想汽車在持續(xù)推進(jìn)技術(shù)創(chuàng)新的同時,在人工智能領(lǐng)域頂級學(xué)術(shù)會議和期刊發(fā)表了大量研究成果,其中MindVLA-o1相關(guān)的多篇論文已在CVPR、ICLR、ICRA、AAAI等國際頂會上發(fā)表。未來,理想汽車將繼續(xù)以用戶價值為導(dǎo)向,投入前沿研究以及核心技術(shù)自研,持續(xù)構(gòu)建面向物理世界智能的完整AI系統(tǒng),堅定邁向全球領(lǐng)先的具身智能企業(yè)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
商務(wù)有排面,遠(yuǎn)行無焦慮:第二代騰勢D9開啟預(yù)售,38.98萬起!

商務(wù)有排面,遠(yuǎn)行無焦慮:第二代騰勢D9開啟預(yù)售,38.98萬起!

夢白評車
2026-04-01 21:58:13
李榮浩風(fēng)波升級!官媒下場點(diǎn)評,言辭犀利,句句戳中了單依純心窩

李榮浩風(fēng)波升級!官媒下場點(diǎn)評,言辭犀利,句句戳中了單依純心窩

談史論天地
2026-03-31 06:39:26
連大學(xué)都沒上過的“學(xué)渣”,卻當(dāng)了央視30年名嘴,如今成女性榜樣

連大學(xué)都沒上過的“學(xué)渣”,卻當(dāng)了央視30年名嘴,如今成女性榜樣

珺瑤婉史
2026-03-30 00:30:03
中美剛在喀麥隆談完,特朗普隨即發(fā)聲:中方將翻倍購買美國大豆

中美剛在喀麥隆談完,特朗普隨即發(fā)聲:中方將翻倍購買美國大豆

興史興談
2026-03-31 12:22:18
吳亦凡二審維持原判13年,只能繼續(xù)當(dāng)班長,網(wǎng)友神評論笑死人

吳亦凡二審維持原判13年,只能繼續(xù)當(dāng)班長,網(wǎng)友神評論笑死人

呱呱請你吃瓜
2026-02-02 19:51:43
彭德懷破窯洞里請俘虜吃面條,對方一開口他愣住了:你是我20年前的兵?

彭德懷破窯洞里請俘虜吃面條,對方一開口他愣住了:你是我20年前的兵?

寄史言志
2026-03-31 23:53:18
清明還剩下3天,屬蛇、屬龍的人一定要注意了!別不當(dāng)回事

清明還剩下3天,屬蛇、屬龍的人一定要注意了!別不當(dāng)回事

混沌錄
2026-04-01 17:02:20
吳夢潔談主場吵鬧引爭議!江蘇女排0-3落敗,輸球真的怪觀眾嗎?

吳夢潔談主場吵鬧引爭議!江蘇女排0-3落敗,輸球真的怪觀眾嗎?

金毛愛女排
2026-04-01 10:03:13
杜鋒亮劍!廣東爭冠終極殺招浮出水面

杜鋒亮劍!廣東爭冠終極殺招浮出水面

格斗聯(lián)盟有話說
2026-04-01 09:36:59
癌細(xì)胞最愛的5大食物,很多人天天吃!醫(yī)生提醒:再饞也要管住嘴

癌細(xì)胞最愛的5大食物,很多人天天吃!醫(yī)生提醒:再饞也要管住嘴

孟大夫之家1
2026-02-23 18:33:03
張萬年傅全有等站兩邊,中間那位老人是誰?

張萬年傅全有等站兩邊,中間那位老人是誰?

文史茶館2020
2026-03-31 17:08:36
上海蘇州兩地政府迎來新領(lǐng)導(dǎo),均為金融老將

上海蘇州兩地政府迎來新領(lǐng)導(dǎo),均為金融老將

觀察者網(wǎng)
2026-04-01 11:28:03
還認(rèn)為茅臺酒送的小酒杯是用來喝酒的?行家:大錯特錯,別鬧笑話

還認(rèn)為茅臺酒送的小酒杯是用來喝酒的?行家:大錯特錯,別鬧笑話

鄒小蘑菇
2026-03-31 12:18:15
夫妻性生活:別再傻傻用力了!讓妻子上癮的三個技巧,男人必看!

夫妻性生活:別再傻傻用力了!讓妻子上癮的三個技巧,男人必看!

精彩分享快樂
2025-11-20 00:05:03
美媒:世界都被騙了,中國偷偷打造10艘航母,8艘做好了戰(zhàn)斗準(zhǔn)備

美媒:世界都被騙了,中國偷偷打造10艘航母,8艘做好了戰(zhàn)斗準(zhǔn)備

小嵩
2026-04-01 20:01:19
有孩子就有軟肋,馬筱梅停播半月不敢?guī)ж洠愫⒆酉硎芴靷愔畼?>
    </a>
        <h3>
      <a href=大眼妹妹
2026-04-01 22:06:38
川普英明啊,認(rèn)慫不就好了嗎?

川普英明啊,認(rèn)慫不就好了嗎?

楊風(fēng)
2026-04-01 21:53:08
小虎牙弟弟把爆料人腿打斷了

小虎牙弟弟把爆料人腿打斷了

毒舌扒姨太
2026-03-31 22:35:54
男人胡子長得快,說明了什么?刮胡子頻率與壽命有關(guān)?告訴你答案

男人胡子長得快,說明了什么?刮胡子頻率與壽命有關(guān)?告訴你答案

熊貓醫(yī)學(xué)社
2026-03-31 11:40:03
5分鐘開通國家免費(fèi)電視!不用機(jī)頂盒、不連網(wǎng),永久免費(fèi)

5分鐘開通國家免費(fèi)電視!不用機(jī)頂盒、不連網(wǎng),永久免費(fèi)

叮當(dāng)當(dāng)科技
2026-03-20 03:29:51
2026-04-01 22:39:00
旭車評 incentive-icons
旭車評
網(wǎng)絡(luò)飛速 放慢腳步做車評
766文章數(shù) 63關(guān)注度
往期回顧 全部

科技要聞

甲骨文血洗3萬人,47人團(tuán)隊僅留3人

頭條要聞

中國為何能在能源動亂中處變不驚 路透社公布一組數(shù)據(jù)

頭條要聞

中國為何能在能源動亂中處變不驚 路透社公布一組數(shù)據(jù)

體育要聞

NBA擴(kuò)軍,和籃球無關(guān)?

娛樂要聞

張婉婷已決定離婚 找律師討論婚變事宜

財經(jīng)要聞

電商售械三水光針 機(jī)構(gòu)倒貨or假貨猖獗?

汽車要聞

三電可靠 用料下本 百萬公里的蔚來ES6 拆開看

態(tài)度原創(chuàng)

家居
時尚
手機(jī)
教育
健康

家居要聞

經(jīng)典配色 晝色銀河

大牌必修課|| 為什么那些很會穿的人,都迷上了優(yōu)雅運(yùn)動風(fēng)?

手機(jī)要聞

OPPO K15 Pro+與K15 Pro:均正式發(fā)布,對比后有多少區(qū)別?

教育要聞

高考為什么要回收“草稿紙”?長知識了

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

無障礙瀏覽 進(jìn)入關(guān)懷版