賈浩楠 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
2026智能車最熱黑科技——世界模型,第一個(gè)把門檻打下來的玩家,意料之外,情理之中:
零跑汽車,創(chuàng)造了科技“普及平權(quán)”的新紀(jì)錄,四五十萬豪華車的世界模型智能輔助駕駛方案,將下放到10萬以內(nèi)的入門級(jí)車型。
![]()
而且放話不只是能用,依托世界模型技術(shù)體系,AI司機(jī)從能用變成了好用。
世界模型,本身是AI模型和真實(shí)物理世界直接鏈接、交互,具有AGI“終局”潛力的全新范式。
而上車之后,有巨大的潛力和價(jià)值,畢竟智能汽車是眼下直通物理AI最成熟的平臺(tái)——自由移動(dòng)、自由定義、自由進(jìn)化。
零跑入局,可能會(huì)徹底改變格局:
車端的世界模型,要從旗艦車型的零星嘗試,走向普惠大眾的“鋪天蓋地”了。
零跑世界模型上車,體驗(yàn)怎么樣?
零跑世界模型智能輔助駕駛系統(tǒng)的實(shí)測(cè),選在杭州浙二醫(yī)院附近的核心城區(qū),本地人一聽就知道附近路況的復(fù)雜程度:
![]()
這也是零跑世界模型實(shí)測(cè)的第一個(gè)厲害之處:人車混行的極窄路段,敢博弈,而且軌跡策略合理,高效通過。
既不魯莽危險(xiǎn),也不會(huì)讓用戶覺得過于“膽小”。
復(fù)雜環(huán)境的多目標(biāo)博弈通行,這一點(diǎn)是當(dāng)下絕大多數(shù)量產(chǎn)智能輔助駕駛系統(tǒng)不具備的能力。
除了博弈場(chǎng)景,零跑世界模型在不那么復(fù)雜的路段,也展現(xiàn)出比正常通行更高階的能力:
![]()
一個(gè)常規(guī)匝道并入的場(chǎng)景,仍然能看出零跑世界模型的“好用”之處:和人類司機(jī)一樣,平滑規(guī)劃變道時(shí)機(jī),兼顧安全和效率。
這樣無限貼近人類成熟司機(jī),以及安全駕駛習(xí)慣的風(fēng)格,還體現(xiàn)在和低速交通參與者的交互中:
![]()
整個(gè)過程沒有重剎沒有頓挫,也沒有停車等待,而是和人類司機(jī)一樣,緩慢蠕行等待行人通過。
還有一個(gè)令人印象深刻的場(chǎng)景:
![]()
路邊的臨停、違停指示牌,零跑世界模型不但看到了,還看懂了,聰明地選擇了繞行。
所以從這幾個(gè)場(chǎng)景體驗(yàn)可以看出,零跑世界模型所謂的“好用”,其實(shí)翻譯成具象的表達(dá),就是一個(gè)預(yù)期感,和你自己開車會(huì)采取的策略幾乎一致,不會(huì)讓你感到系統(tǒng)太蠢太膽小,更不會(huì)讓你感到害怕。
系統(tǒng)對(duì)場(chǎng)景,從感知到認(rèn)知;對(duì)決策,從模仿到思考。
就比如路邊的臨停、違停其實(shí)是對(duì)AI司機(jī)考驗(yàn)很大的科目,尤其是流行的端到端方案,大概率會(huì)把路邊臨停違停理解成正常等紅燈的車流,尾隨傻等。
反而是真正等紅燈的車流,容易被標(biāo)記成“慢車”,做出危險(xiǎn)、突兀的繞行動(dòng)作。
![]()
這是端到端的局限,本質(zhì)是模仿人類司機(jī)駕駛行為,但并不理解場(chǎng)景,容易出現(xiàn)不可控的危險(xiǎn)動(dòng)作。
再比如,前面說的匝道并入,目前多數(shù)量產(chǎn)系統(tǒng)都能完成,但往往從匝道匯入后,系統(tǒng)的規(guī)則會(huì)強(qiáng)制車輛線駛向最右車道,然后又在“靠左快速通行”的規(guī)則指導(dǎo)下再向左變道。
結(jié)果就是在高速路上“畫龍”,反倒增加了風(fēng)險(xiǎn)——這是古早規(guī)則主導(dǎo)自動(dòng)駕駛時(shí)代的“遺毒”,現(xiàn)在其實(shí)也不少見:
用巨量人力手寫規(guī)則代碼的智能輔助駕駛系統(tǒng),的確也能處理絕大部分路況。但規(guī)則就像“毒藥”,能快速解決難題,但寫了第一條就會(huì)有第一萬條,最后得到一套駕駛風(fēng)格“前倨后恭”、用戶體驗(yàn)“前俯后仰”的“屎山”算法。
![]()
所以量產(chǎn)高階智能輔助駕駛普及之后,在2026年出現(xiàn)了新的競(jìng)爭(zhēng)趨勢(shì):
各家都有車位到車位,但真正有價(jià)值的L2+產(chǎn)品體驗(yàn),是用戶“無感”的,和你的家人朋友開車一樣讓你安心。
或者說,好的AI司機(jī),不需要去刻意測(cè)評(píng)。
零跑的世界模型,到底是什么?
朱江明在世界模型實(shí)測(cè)中,說了一句話很有意思的話:
- 如果是規(guī)則(主導(dǎo)),那只會(huì)先選一條固定路線。
所以可以推測(cè),零跑世界模型目前為止是沒有任何一行“if else”規(guī)則代碼的。
但又和不依賴規(guī)則的端到端“黑盒”體系,有根本不同。
![]()
簡(jiǎn)單來說,“世界模型”首先是一個(gè)大模型,但是多模態(tài)輸入:不僅通過文字,更通過視覺、觸覺、聲音等多種感知來理解世界。
打個(gè)比方,你扔出一個(gè)玻璃杯,ChatGPT、DeepSeek、豆包等等語言模型知道“杯子會(huì)碎”,但它并不真正理解重力、硬度、動(dòng)量這些物理量是如何在時(shí)空中相互作用的。
但世界模型不一樣,AI建立了對(duì)三維空間、物理規(guī)律、物體持久性、因果關(guān)系的認(rèn)知,尤其是萬事萬物的因果關(guān)系理解。
一般世界模型架構(gòu)核心由三組件構(gòu)成:
- 視覺編碼器/壓縮器:將高維度的觀測(cè)數(shù)據(jù)(如攝像頭拍攝的圖像、視頻幀)壓縮成低維度的潛在向量。
- 序列預(yù)測(cè)器/動(dòng)態(tài)核心:使用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN) 或Transformer 架構(gòu)的“物理引擎”核心 ,它接收當(dāng)前狀態(tài)的潛在向量和智能體(或外界)采取的動(dòng)作,預(yù)測(cè)下一個(gè)狀態(tài)的潛在向量。實(shí)際上是在潛在空間里“模擬”世界。
- 渲染器/解碼器:當(dāng)需要人類觀察或評(píng)估模型推演的結(jié)果時(shí),將預(yù)測(cè)出的“潛在狀態(tài)”還原成可視的像素圖像,它相當(dāng)于“圖形顯卡”。
所以世界模型最大的價(jià)值,是允許“如果……會(huì)怎樣”的推理式交互,理解行為與后果之間的因果鏈條,而不是僅僅發(fā)現(xiàn)統(tǒng)計(jì)相關(guān)性。
![]()
說到這你可能馬上就明白了,爆火的Seedance視頻生成能力,其實(shí)本質(zhì)就是世界模型。
而自動(dòng)駕駛的本質(zhì),就是根據(jù)實(shí)時(shí)路況,不斷修正行車軌跡——世界模型完美適配需求,而且比端到端這樣的軌跡輸出“黑盒”更加可控。
只不過在汽車智能化浪潮中,關(guān)于世界模型存在爭(zhēng)議:有玩家認(rèn)為世界模型是單純后端的模擬器,用于數(shù)據(jù)生成仿真訓(xùn)練。
但是,也有另一派玩家把車端的系統(tǒng)直接叫世界模型——零跑顯然是這一派——車端世界模型的任務(wù),是進(jìn)行實(shí)時(shí)環(huán)境認(rèn)知與決策,強(qiáng)調(diào)的車端“平行世界推演”能力,相當(dāng)于“腦內(nèi)小劇場(chǎng)”。
其實(shí)兩派并沒有根本矛盾,屬于工程落地與宣傳上側(cè)重點(diǎn)不同,因?yàn)锳I行業(yè)對(duì)于世界模型是有階段性共識(shí)的:
- 從海量數(shù)據(jù)中自主提煉物理與社會(huì)規(guī)律,形成對(duì)世界運(yùn)作方式的抽象理解。
從這個(gè)共識(shí)出發(fā),零跑自研世界模型,首先是宏觀上的,即后端的數(shù)據(jù)驅(qū)動(dòng)體系,據(jù)透露目前已經(jīng)建成數(shù)千卡的算力基礎(chǔ)設(shè)施規(guī)模,并且跑通了真正的數(shù)據(jù)閉環(huán)體系。
![]()
意思是數(shù)據(jù)中的bug、問題,能自動(dòng)走完從“被發(fā)現(xiàn)”到“被解決并被驗(yàn)證”的路徑:自動(dòng)發(fā)現(xiàn)異常行為,然后將問題自動(dòng)歸類、建成數(shù)據(jù)集,再針對(duì)性自動(dòng)進(jìn)訓(xùn)練/仿真,出了解決方案后,系統(tǒng)還能自動(dòng)評(píng)估效果。
研發(fā)中“人”的作用,是定義和監(jiān)管、決策,而不是自己徒手標(biāo)注、調(diào)參、評(píng)估、部署……
“數(shù)據(jù)直接解決問題”是最關(guān)鍵的核心能力,尤其在AI大模型技術(shù)范式的革新中。
這一能力看似簡(jiǎn)單,實(shí)際對(duì)車企、自動(dòng)駕駛公司來說非常稀缺,因?yàn)闀?huì)直接影響泛化性、效率、成本。
而在用戶一側(cè),零跑世界模型還是能交付、能體驗(yàn)的產(chǎn)品方案。
云端的超大參數(shù)世界模型,通過知識(shí)蒸餾的手段,再對(duì)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),模型部署等環(huán)節(jié)做優(yōu)化,實(shí)現(xiàn)了車端部署。
蒸餾到啥程度呢?據(jù)透露,目前測(cè)試中的零跑世界模型,依托的是高通8797芯片平臺(tái),單顆稠密算力320TOPS。
![]()
但這還不是極限,零跑給出的承諾是,未來所有車型中只要是搭載高通8650芯片的配置(即搭載激光雷達(dá)),都能上車世界模型。
值得注意的是,盡管官方現(xiàn)在沒有直白說,但8.86萬版型A10,實(shí)際也是激光雷達(dá)+8650配置。
也就是說……
零跑創(chuàng)紀(jì)錄把世界模型門檻打到十萬元以下,背后是另外一個(gè)技術(shù)探索的新紀(jì)錄:
極致蒸餾,把世界模型部署在(稠密)算力100TOPS的算力平臺(tái)。
這是馬斯克也從未做到過的事,但零跑也并不是違反常識(shí)和技術(shù)發(fā)展規(guī)律,董事長(zhǎng)朱江明給出了詳細(xì)解釋:
- 純粹只是把智能輔助駕駛做到好用,類似于8650的算力其實(shí)就夠了。
- 但要說把車載AI作為大模型個(gè)人助手,就是另外一回事了。
零跑汽車,問鼎智能化?
盡管掌舵人朱江明對(duì)外曾說零跑的策略是“技術(shù)不成熟時(shí)觀望,成熟就跟進(jìn)”,但事實(shí)上如今的零跑在AI層面,已經(jīng)超脫了單純車企的視角和訴求。
畢竟如果只追求車位到車位的普及,一段式端到端足以勝任,而且成本會(huì)比自研世界模型更低。
另一個(gè)層面,回顧一下零跑近兩年的技術(shù)進(jìn)展,始終在智能化上快人一步,又不是無跡可循。
![]()
比如和高通合作量產(chǎn)了智能汽車最早的艙駕一體化落地方案,以及在中低算力平臺(tái)的強(qiáng)功能體驗(yàn),再到如今一段式端到端、VLA、世界模型多路線并進(jìn)的智能化方案等等,在“性價(jià)比”之外,外界正在越來越意外地認(rèn)識(shí)到一個(gè)全新的零跑。
但另一個(gè)方面,零跑又沒什么變化。
仍然是技術(shù)普惠第一,把最前沿的智能化技術(shù)、體驗(yàn),不設(shè)門檻普及。
事實(shí)上,在智能化普及上,零跑是車圈少見的“行勝于言”,真實(shí)交付的體驗(yàn)其實(shí)遠(yuǎn)超巨頭車企。
從去年B10率先把激光雷達(dá)普及到10萬級(jí),就能看出來。
而剛剛上市的A10,同樣是把車位到車位體驗(yàn)普及到8萬級(jí),行業(yè)唯一。
![]()
這背后,是在車企陣營(yíng)中,零跑率先洞察、抓住了AI浪潮的趨勢(shì)。
智能汽車、自動(dòng)駕駛行業(yè)的爭(zhēng)論,尤其是今年VLA陣營(yíng)和端到端陣營(yíng)的口水仗,零跑根本不站隊(duì)不下場(chǎng)。
而是用產(chǎn)品方案給出了自己的理解:
一段式端到端足夠成熟,給入門級(jí)產(chǎn)品帶來全場(chǎng)景無斷點(diǎn)體驗(yàn);
從大語言模型借鑒而來的VLA體系,零跑放在如今的旗艦車型,給出最領(lǐng)先的艙駕一體智能化體驗(yàn);
而跳出大語言模型范式的限制,回歸汽車、移動(dòng)機(jī)器人的本質(zhì)——和物理世界交互,零跑毫不遲疑地選擇去探索更底層的AI范式革新。
而世界模型一通百通,改變的又豈止是汽車?
零跑汽車2025年全年累計(jì)交付新車596,555輛,同比增長(zhǎng)103%,并憑借這一成績(jī)成為中國(guó)造車新勢(shì)力品牌的年度銷量冠軍。
而在銷量問鼎新勢(shì)力之后,現(xiàn)在的零跑,開始嘗試在智能化上問鼎了。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.