“領(lǐng)先5倍”之外,小鵬VLA真正讓我在意的是什么
何小鵬說(shuō)第二代VLA比行業(yè)第一梯隊(duì)領(lǐng)先接近5倍,這話(huà)乍一聽(tīng)挺像“王婆賣(mài)瓜”。
![]()
但看完官方發(fā)布的實(shí)測(cè)視頻和推送計(jì)劃,我覺(jué)得這次值得認(rèn)真聊聊——不是聊倍數(shù),是聊“這玩意兒到底怎么干活”的。
![]()
![]()
先說(shuō)那個(gè)土路實(shí)測(cè)。視頻里車(chē)在鄉(xiāng)村坑洼路上自己走,遇到坑會(huì)主動(dòng)繞開(kāi),挑相對(duì)平整的路面通過(guò)。
這跟以前那種“畫(huà)線(xiàn)跟著走”的邏輯完全不一樣——它不是識(shí)別車(chē)道線(xiàn)然后居中,而是識(shí)別“哪里能走”“哪里好走”,然后自己選路徑。
說(shuō)白了,以前是“聽(tīng)話(huà)的孩子”,現(xiàn)在是“有主見(jiàn)的老司機(jī)”。
![]()
技術(shù)上怎么實(shí)現(xiàn)的?第二代VLA的核心變化是“視覺(jué)直驅(qū)動(dòng)作”。之前那套邏輯是“看見(jiàn)→翻譯成語(yǔ)言→理解語(yǔ)言→做動(dòng)作”,中間有個(gè)語(yǔ)言轉(zhuǎn)譯的環(huán)節(jié),信息有損耗,反應(yīng)也慢。
這次直接把語(yǔ)言那層拆了,視覺(jué)信號(hào)進(jìn)來(lái),模型直接輸出角速度、加速度這些控制量。
用何小鵬的話(huà)說(shuō),這是“拆掉語(yǔ)言瓶頸”,讓車(chē)的反應(yīng)更接近人的本能。
![]()
數(shù)據(jù)上也挺能打:復(fù)雜小路平均接管里程提升13倍,夜間深色物體識(shí)別率提升72%,決策速度從幾百毫秒壓到80毫秒。
80毫秒是什么概念?人眨個(gè)眼都要100-150毫秒。這已經(jīng)比人反應(yīng)快了。
硬件層面,小鵬走的是“輕傳感器、重模型”的路子。
12顆攝像頭,沒(méi)主激光雷達(dá),算力2250TOPS來(lái)自三顆圖靈芯片。跟行業(yè)主流的多傳感器融合路線(xiàn)比,它更接近特斯拉的“視覺(jué)優(yōu)先”。
![]()
但區(qū)別在于,小鵬把VLA模型做成了“端到端”——輸入視覺(jué)信號(hào),輸出控制指令,中間沒(méi)有規(guī)則代碼,全讓模型自己學(xué)。
我關(guān)注到一個(gè)細(xì)節(jié):大眾將成為第二代VLA的首發(fā)客戶(hù)。這很有意思。
大眾這種傳統(tǒng)巨頭選小鵬的技術(shù)上車(chē),說(shuō)明這套東西已經(jīng)過(guò)了工程化驗(yàn)證,不是實(shí)驗(yàn)室demo。
![]()
推送節(jié)奏也定了:3月下旬開(kāi)始向P7、G7、X9的Ultra版全量推送,4月覆蓋G6、G9、P7+。換句話(huà)說(shuō),下個(gè)月你就能在路上見(jiàn)到真車(chē)跑這套系統(tǒng)。
最后說(shuō)點(diǎn)實(shí)在的。“領(lǐng)先5倍”這個(gè)數(shù)字,普通人很難驗(yàn)證。
![]()
但如果你看過(guò)那個(gè)土路視頻,會(huì)發(fā)現(xiàn)一個(gè)更本質(zhì)的變化:以前智駕是在“馴服路”,現(xiàn)在是在“適應(yīng)路”。那種“人開(kāi)車(chē)”的松弛感,才是真正的代際差。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.