![]()
這個(gè)善變的世界,從來(lái)都不曾兌現(xiàn)滄海桑田、海枯石爛的諾言。
2025年初,憑借極致語(yǔ)言智能與推理能力橫掃市場(chǎng)的DeepSeek,一度成為蹭熱點(diǎn)蹭習(xí)慣了的車企爭(zhēng)相擁抱的小甜甜。
不曾想,剛剛過(guò)了半年的時(shí)間,阿里巴巴的千問(wèn)系大模型、字節(jié)跳動(dòng)的豆包系大模型、騰訊的混元系大模型就開(kāi)始和DeepSeek搶飯吃,成為一票車企的座上賓了。
比亞迪、上汽、吉利、零跑等主流品牌,靜水深流一般,默默地完成了座艙主力大模型的更替。
從你儂我儂到陡生情變,本土智能汽車座艙的AI基座格局為何這么快就畫風(fēng)突變?
技術(shù)永不眠。
從依賴穿孔紙帶和字符命令的笨拙,到鼠標(biāo)與圖形界面帶來(lái)的革命性便利;
從語(yǔ)音識(shí)別與觸摸屏開(kāi)啟的直覺(jué)化操作,再到以多模態(tài)信息為輸入輸出、以Agent為交互界面的自然無(wú)感交互,人機(jī)交互技術(shù)已經(jīng)經(jīng)歷了四代躍遷。
智能座艙交互的終極形態(tài),同樣是自然與無(wú)感。
用戶一個(gè)疲憊的哈欠,一次望向窗外的眼神,一句含糊的“我有點(diǎn)熱”,甚至副駕與后排隨口的閑聊,都應(yīng)被系統(tǒng)精準(zhǔn)捕捉,并轉(zhuǎn)化為貼心的服務(wù)。
這要求座艙AI必須具備強(qiáng)大的多模態(tài)感知與融合理解能力。
![]()
這恰恰是強(qiáng)于語(yǔ)言、弱于感知的DeepSeek所欠缺的。
DeepSeek的崛起,根植于其在語(yǔ)言邏輯與推理上展現(xiàn)的超強(qiáng)能力。
但在智能座艙的場(chǎng)景下,人-車交互的核心卻不是單一的語(yǔ)言對(duì)話,而是多模態(tài)感知。
對(duì)此洞若觀火的小鵬汽車,一開(kāi)始就選擇死磕端側(cè)視覺(jué)語(yǔ)言模型VLM,而非跟進(jìn)DeepSeek熱潮。
個(gè)中關(guān)鍵就在于,自然的人機(jī)交互需要的多模態(tài)感知,和以語(yǔ)言能力為主的DeepSeek之間存在巨大的信息模態(tài)鴻溝。
在很多汽車產(chǎn)品的座艙場(chǎng)景里,DeepSeek的能力被鎖死在語(yǔ)音助手和閑聊上,背后的原因也在這里。
![]()
相比之下,阿里巴巴的通義千問(wèn)大模型、字節(jié)跳動(dòng)的豆包大模型、騰訊的混元大模型,從誕生之初就深植于阿里巴巴、字節(jié)、騰訊龐大的內(nèi)容生態(tài)與業(yè)務(wù)場(chǎng)景中。
它們需要處理抖音海量的短視頻,解析騰訊系豐富的音視頻與社交內(nèi)容,處理淘寶海量商品圖文、理解優(yōu)酷視頻內(nèi)容、解析高德地圖導(dǎo)航與生活服務(wù)請(qǐng)求。
這些日常任務(wù)迫使BAT(這里的B是字節(jié)ByteDance,而非百度Baidu)必須發(fā)展出融合視覺(jué)、語(yǔ)音、文本的多模態(tài)能力,才能從復(fù)雜、動(dòng)態(tài)的交互中推斷用戶的真實(shí)意圖與潛在需求。
![]()
在座艙場(chǎng)景下,多模態(tài)能力強(qiáng)大意味著能同時(shí)處理語(yǔ)音、視覺(jué)、文本,通過(guò)上下文融合進(jìn)行跨模態(tài)對(duì)齊,并具備結(jié)合物體識(shí)別與物理常識(shí)的動(dòng)態(tài)意圖解析能力。
這種結(jié)合通用常識(shí)的動(dòng)態(tài)意圖解析能力,正是座艙從L2級(jí)功能響應(yīng)邁向L3級(jí)主動(dòng)服務(wù)的核心突破點(diǎn)。
![]()
憑借著強(qiáng)大的原生多模態(tài)能力,豆包、千問(wèn)在一定程度上對(duì)DeepSeek形成了降維打擊,這只是車企冷落DeepSeek的原因之一。
更為重要的原因在于,隨著座艙智能等級(jí)的提升,座艙AI的競(jìng)爭(zhēng)焦點(diǎn)發(fā)生了轉(zhuǎn)移。
我們?cè)僖不夭蝗チ耍瑢?duì)不對(duì)?
今天的座艙AI競(jìng)爭(zhēng),已從單點(diǎn)模型的智商比拼升級(jí)為模型-平臺(tái)-生態(tài)三位一體的系統(tǒng)化戰(zhàn)爭(zhēng)。
L3級(jí)座艙不僅需要感知世界的多模態(tài)能力,更需要完成“感知-理解-決策-服務(wù)”閉環(huán)的能力。
而這種能力,取決于大模型及其背后的生態(tài)與Agent智能體體系。
![]()
在這方面,DeepSeek的短板同樣相當(dāng)明顯。
作為一個(gè)致力于AGI的初創(chuàng)模型公司,DeepSeek以其純粹、專注的模型研發(fā)路線贏得了大家的敬意。
但是,在汽車場(chǎng)景中,模型的價(jià)值最終要落地為具體的服務(wù)。
訂咖啡、會(huì)員續(xù)費(fèi)、規(guī)劃包含充電的復(fù)雜行程、與智能家居聯(lián)動(dòng)等等,這些任務(wù)的執(zhí)行依賴于與無(wú)數(shù)外部服務(wù)API的打通、對(duì)各類應(yīng)用邏輯的深度理解以及穩(wěn)定的生態(tài)協(xié)作關(guān)系。
這些,也正是DeepSeek的軟肋。
![]()
相較之下,阿里巴巴、字節(jié)跳動(dòng)、騰訊本身就是由無(wú)數(shù)超級(jí)App和復(fù)雜服務(wù)構(gòu)成的數(shù)字帝國(guó)。
豆包身后是抖音、今日頭條、飛書等構(gòu)成的龐大內(nèi)容與服務(wù)矩陣;
騰訊混元與微信、QQ、騰訊視頻、音樂(lè)、地圖等國(guó)民級(jí)應(yīng)用血脈相通;
阿里的通義大模型則與支付寶、淘寶、天貓、餓了么、高德地圖、菜鳥(niǎo)等同氣連枝。
![]()
BAT的這種生態(tài)積淀,讓它們能夠快速將大模型能力Agent化。
比如,騰訊TAI6.0智能座艙全場(chǎng)景AI智能體提供全能陪伴智能體、出行連接智能體、本地生活智能體、出行探索智能體、地圖導(dǎo)航智能體。
不僅支持自然語(yǔ)言交互和聊天,基于用戶偏好主動(dòng)推薦餐廳優(yōu)惠信息,還能直接調(diào)用微信接收到的好友聚餐地址,在車機(jī)端無(wú)縫流轉(zhuǎn)導(dǎo)航,通過(guò)騰訊地圖規(guī)劃路線,并協(xié)同小程序完成提前預(yù)訂餐廳、下單、支付的全流程操作。
![]()
不同的生活和使用場(chǎng)景需要配備專門的Agent,在駕乘人員的需求洞察和場(chǎng)景定義上,車企有著獨(dú)到的優(yōu)勢(shì)。
所以,阿里巴巴的打法稍有不同,它與斑馬智行聯(lián)合打造了“元神AI智能體”。
作為底層引擎,賦能各個(gè)合作車企打造面向特定使用場(chǎng)景的專用智能體。
比如,智己汽車聯(lián)合斑馬智行、餓了么打造了AI外賣智能體,聯(lián)合飛豬、淘票票打造了AI票務(wù)智能體,寶馬與阿里合作,推出了用車專家和出行伴侶兩大智能體。
還有最近上市的MG7(參數(shù)丨圖片),在交互、場(chǎng)景、地圖、AI、生態(tài)等多個(gè)層面的全方位升級(jí),都是元神AI智能體技術(shù)賦能車企的持續(xù)落地。
![]()
當(dāng)座艙的競(jìng)爭(zhēng)維度從單一的大模型躍遷至Agent智能體時(shí),系統(tǒng)生態(tài)的協(xié)同力就成了豆包、騰訊與阿里大模型大殺四方的核心邏輯。
因?yàn)椋鼈儙?lái)的不只是一個(gè)大模型,而是三支能隨時(shí)調(diào)用數(shù)字帝國(guó)資源、且有不同資源特長(zhǎng)的Agent軍團(tuán)。
隨著多模態(tài)能力、Agent技術(shù)的加速成熟,智能座艙正在快速進(jìn)化為承載多模態(tài)交互與場(chǎng)景化服務(wù)的智能空間。 這個(gè)空間,需要能夠進(jìn)行全場(chǎng)景感知、理解、并能驅(qū)動(dòng)全周期服務(wù)閉環(huán)的AI大腦。 這個(gè)戰(zhàn)場(chǎng),屬于那些既看得見(jiàn)、聽(tīng)得懂,更能調(diào)動(dòng)千軍萬(wàn)馬來(lái)服務(wù)的全能型AI。
所以,DeepSeek失寵,通義千問(wèn)、豆包與騰訊大模型加速上車,并非車企見(jiàn)異思遷,而是AI座艙發(fā)生了范式革命!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.