![]()
AI Agent只會剩下兩三家。
作者 | 柴旭晨 編輯 | 周智宇
阿里園區(qū),被AI點的奶茶包圍了。
1月15日,千問C端事業(yè)群總裁吳嘉在舞臺上,對著千問App講“幫我點40杯霸王茶姬的伯牙絕弦”,千問直接下單完成支付,不久后,淘寶閃購騎手就將奶茶送達(dá)現(xiàn)場。沒有App之間相互跳轉(zhuǎn),不用切換后臺,這一切都是在千問App上一口氣實現(xiàn)的。
這是一次自上而下的意志體現(xiàn)。阿里試圖通過AI這個抓手,將原先的“散裝阿里”重塑為一個高效協(xié)同的“新阿里王國”。
現(xiàn)場吳嘉宣布,千問App全面接入淘寶、支付寶、飛豬、高德、淘寶閃購等阿里核心生態(tài)業(yè)務(wù)。那個曾經(jīng)只能陪你聊天作畫的AI,突然擁有了點外賣、訂機票等一系列能力。
“千問是第一個真正能幫你辦事的AI”。吳嘉向華爾街見聞表示,AI辦事時代才剛剛開始,他要將千問App打造為最強大的人類AI助手,未來要覆蓋每一個人。
而這不僅是一個App的功能迭代,更像是阿里在AI時代的一次“自我重構(gòu)”。
阿里生態(tài)業(yè)務(wù)極廣,從購物、外賣、到地圖和旅行,但面向用戶,如何形成協(xié)同效應(yīng)卻是個難點,在移動互聯(lián)網(wǎng)時期,反而像是分散了入口。
倘若千問真的能成為“最強大的人類AI助手”,阿里將實現(xiàn)從“貨架電商”到“指令電商”的躍遷。這不僅能補上阿里在C端高頻流量入口的短板,更能構(gòu)建一個以自身為核心的封閉閉環(huán),用戶在千問里問路、打車、吃飯、購物,所有數(shù)據(jù)和交易都留在阿里體系內(nèi),不再依賴外部流量喂養(yǎng)。
但這不是個易事,“貨架電商”的邏輯是讓用戶逛,提供海量選擇,容忍度高;而“指令電商”的邏輯是幫用戶選,追求精準(zhǔn),容錯率極低。
讓AI“辦事”,本質(zhì)上是讓AI承擔(dān)決策責(zé)任。這對阿里大模型的推理能力、對服務(wù)供應(yīng)鏈的實時響應(yīng)能力,提出了更高的要求。
千問C端事業(yè)群一出生就面臨激烈競爭。在會后的訪談中,吳嘉也向華爾街見聞坦言,終局的玩家可能只會有兩三個。
不過,在他看來,原來互聯(lián)網(wǎng)那套燒錢、砸流量就能贏得市場的邏輯已失效。真正能把模型的智力水平做上來,并且有資源在生態(tài)上面這樣投入的公司才能進(jìn)入終局牌桌。有這個資格的大廠,鳳毛麟角。
就這樣,在吳嘉的帶領(lǐng)下,一場屬于阿里的“二次創(chuàng)業(yè)”,旋即如火如荼地展開了。而千問能否成為每一個中國人手機里的“賈維斯”?答案還未曾可知。
但可以確定的是,當(dāng)AI開始替你買單時,一個新的商業(yè)紀(jì)元已經(jīng)開啟。在這個紀(jì)元里,誰能最先讓AI“把事辦漂亮”,誰就是新的王者。
以下是與千問C端事業(yè)群總裁吳嘉的對話實錄(節(jié)選):
問:未來這半年泛智能以及千問迭代的核心方向會在哪里?
吳嘉:未來半年內(nèi)接入阿里生態(tài),擴(kuò)展辦事能力的邊界,把模型在生活場景的理解能力做強,這是我們非常重要的主線。
在生活場景,做到人人滿意還挺難的,辦公和學(xué)習(xí)場景一致性要好一些。我們還是想利用阿里生態(tài)的豐富的供給,加上我們模型的能力,再加上我們對用戶需求的理解,把生活場景打造成為一個全球領(lǐng)先的產(chǎn)品。
問:千問如何平衡效率與思考深度之間的沖突?
吳嘉:我們內(nèi)部有一個詞,叫恰當(dāng)。我覺得AI它不應(yīng)該等于極簡。比如我要寫一個調(diào)研報告,我不希望AI給我一個初稿而是和我共創(chuàng)。AI和人的溝通是必不可少,生活場景也一樣,有時候你也不知道自己的真實需求是什么,就需要AI跟我溝通,甚至需要AI主動來供建議。
我覺得AI它的關(guān)鍵在于智能,不是在于效率。只是因為今天在這個階段的智能,它可能更多體現(xiàn)在提升效率上。但是更高階的智能,它不一定就是完全是效率,AI要會像人一樣的思考。
我們現(xiàn)在更多的是用一個模型提升它的智力,在不同的需求上去提升滿意度。
問:千問已經(jīng)是阿里生態(tài)的統(tǒng)一的智能入口了,現(xiàn)在它跟阿里集團(tuán)各部門之間的協(xié)作架構(gòu),資源分配和協(xié)同挑戰(zhàn)?
吳嘉:在AI時代我們不會專門因為要接某一個服務(wù)去做特別多獨立的事情。它其實是一個模型接這么多服務(wù),然后各個BU只要上來把我的工具能力注冊給AI就好了。在這個過程中我們需要調(diào)試,現(xiàn)在的這個方法就是,我們來跟集團(tuán)所有的二方,我們會有一個共同的虛擬團(tuán)隊。
這是一個雙贏的事,千萬做的越大創(chuàng)造的是生活服務(wù)的增量。我們將來在AI上產(chǎn)生了大量的新的服務(wù)還是增量,他不會是存量的。
問:千問會只打通阿里的生態(tài)嗎?
吳嘉:不會,我們會在春節(jié)后開放官方的合作。但我們會選一個時間點,因為大家可以看到,無論是國際還是國內(nèi),有非常多公司用的方法不盡相同,怎么做到一套好的技術(shù)?因為也要跟中國國內(nèi)的生態(tài)相結(jié)合,因為國際上的生態(tài)跟國內(nèi)的互聯(lián)網(wǎng)生態(tài)也不一樣。所以我們用什么樣的方法來做,這個我們需要做一下。另外是模型的易用性、便捷性,我們通過打通阿里生態(tài)也能總結(jié)出一些更好的方法。但是方向上我們肯定會開放。
問:在能力側(cè),比如千問從嘗鮮到日常剛需的跨越大概需要多久的周期?
吳嘉:我們現(xiàn)在看到留存率還是蠻好的,我覺得AI我們今天發(fā)布的功能還都是用戶的剛需,我們沒有在偏娛樂等等創(chuàng)意方向,我們也做,但沒有投入那么大的精力。我們更多投入的精力還是在剛需,因為辦公是持續(xù)的,學(xué)習(xí)是持續(xù)的,點外賣也是持續(xù)的,我們是在這些方面。所以我看到的留存還可以,如果有人流失,那我們應(yīng)該做得更好。
問:你們選擇做與不做什么的時候邏輯是什么?
吳嘉:我們從需求層面來講,我們今天還是做高頻剛需的需求,這是肯定的。第二,我們還是聚焦今天AI可以交付的能力,尤其是toC,我覺得AI的能力范圍也是可以的,也不是所有的事情都能做。
但我們今天還是處在中國市場領(lǐng)先的位置,所以相對而言在選擇方面來看,我們沒有明確說哪個都不做。我覺得今天大家很多問題還是聚焦在做AI產(chǎn)品和做傳統(tǒng)產(chǎn)品,其實還真的有區(qū)別。以前傳統(tǒng)產(chǎn)品我們做一個東西,我們把它分解成了幾十個項目,這個多少、那個多少。但現(xiàn)在不是,我們是模型在那兒,90%的產(chǎn)品可能已經(jīng)是80%的滿意度了,這個我們花了70%的精力,都在做這個。我們不是特定在優(yōu)化這個,但我就是在提升coding能力、執(zhí)行能力、規(guī)劃能力等,我統(tǒng)統(tǒng)都做。
所以我們有一個很重要的東西,就是從高頻、剛需、模型能力、阿里巴巴生態(tài),我們?nèi)コ橄笥脩舻男枨螅橄蟪鰜恚覀儼阉g成模型要迭代的方向、Agent要迭代的方向,然后我們?nèi)プ觥H绻貏e長尾的,有一些東西確實挺難的,人也搞不定的,我們就等下一階段。
問:我們怎么進(jìn)一步利用好生態(tài)優(yōu)勢,精細(xì)化地深耕?
吳嘉:我們現(xiàn)在是三條線,一條線的主線,長期線還是模型和Agent,這是補短板,是長期的。我們今天從市面上來看,不看AI產(chǎn)品,就是現(xiàn)階段所有的產(chǎn)品,對于這類用戶需求的滿意度我們會有一個排序。我們這兩條線結(jié)合就會分層次迭代,基本上每個季度會有一個模型大的迭代,這個版本我們會跟通義一起來做,這是一個非常重要的線。
基于這上面,Agent能力的提升,我們需要做一些后續(xù)的工作,這也是一條線。然后我們再來看三條線。所以這三條線會相對有節(jié)奏地來推。
所以一般來看,我覺得今天還是技術(shù)數(shù)據(jù)+生態(tài)驅(qū)動的核心,它不是一個bad case fix的迭代模式,因為現(xiàn)在還在能力增速的快速階段。所以從這個角度來看,還是希望我們下一個版本,比如希望我們下一個版本的生活助理,更多還是能夠在個性化運作。
但是把這句話翻譯一下,它就會有模型的問題。但我們可能不會說下一個版本會把點外賣做得特別好,我們肯定會做,但它的一些能力我們會抽象出來單做。外賣有一些開發(fā)性的功能,比如剛剛大家講的,能不能把取件碼顯示在訂單上等等,這種是體驗層面的東西。
問:那么阿里怎么評估千問對已經(jīng)有的這種零售或者電商業(yè)務(wù)的影響?
吳嘉:我們現(xiàn)在還沒有看到說打開千問就不打開淘寶,我覺得我們會創(chuàng)造增量,因為方便了,因為門檻低了,因為習(xí)慣會創(chuàng)造增量。
但是,我覺得我們也不能排除說,有一部分人他就將來會習(xí)慣了在千問點外賣,而不是在傳統(tǒng)的平臺點外賣,他就有了一個習(xí)慣。
大家沒那么糾結(jié),而是看這個人過來頻率有沒有更高,時長有沒有變好。
問:千問現(xiàn)在對模型的迭代目標(biāo)跟基模那邊是完全不一樣嗎?
吳嘉:我們迭代的目標(biāo)是基模迭代目標(biāo)的一部分,它包含了我們,因為我們要在基模之上構(gòu)建我們自己的業(yè)務(wù)。當(dāng)然,對于一些應(yīng)用側(cè)的,我們也會對這個模型進(jìn)行一些后訓(xùn)練,但是我們也是在它模型之上的。
我們的那個大版本,我說3個月大版本,基本上也會把3個月看到的一些需求提給基模,基模也會幫我們更新一個版本,所以我們是他們迭代目標(biāo)的一個子級,因為基模是為整個阿里生態(tài)服務(wù)的。
問:如果說現(xiàn)在做AI通用助手這個應(yīng)用,它所涉及到工程上面是一方面,然后基模是一方面,現(xiàn)在是哪一方面去做工作可以得到的效率會更高呢?
吳嘉:現(xiàn)在網(wǎng)上好多人都在說這個話題,什么這個模型更多的數(shù)據(jù)會更好,還是說C端不需要那么多的智能。我覺得今天至少我的范圍內(nèi),今天中國的業(yè)務(wù)都過了那個階段了,就是我們都是一個模型,沒那么多模型。
不是說你智力低的地方就有個小模型,智力高的地方就有一個大模型。都是大模型,不是小尺寸的大模型和大尺寸的大模型。而是模型聰明到它知道簡單問題它要簡單推理說明問題,聰明的問題要聰明模型回答。所以模型數(shù)降下來之后,我們跟基模的迭代的界面就就會更清晰。
第二個是數(shù)據(jù)的能力重不重要?當(dāng)然重要,額外數(shù)據(jù)非常重要,尤其是在生活場景。因為模型的訓(xùn)練是在某一個時間段的這樣一個數(shù)據(jù),中國的供給又那么豐富,數(shù)據(jù)變化又很快,當(dāng)然需要解決它的時效性問題,它是能力的核心構(gòu)建。
所以,長期效益肯定還是基模發(fā)展帶來的,如果我們看效率、看一年、看兩年,那肯定是基模最重要。那你說短期效率,迭代效率,實現(xiàn)功能,那可能后訓(xùn)練會更明顯一些。
問:現(xiàn)在阿里的這個AI to C入口里面,千問跟夸克的差異化會是怎么樣的?
吳嘉:我覺得還是不一樣的,夸克是AI瀏覽器,是AI搜索,有的人會剛需于用AI瀏覽器,千問是AI助理,它更像一個人,那有人剛需于用AI助理。
這里面的共同點,所有的AI功能都是千問里的功能,夸克里的AI功能也是千問里的功能。我覺得這是一個路徑問題,不管隨著時間怎么發(fā)展,將來AI瀏覽器、AI搜索不會消失,但是它的占比可能在AI時代沒有對話這么大,但是它也是用戶習(xí)慣,從AI瀏覽器里喚起千問從搜索里喚起千問。
我覺得這是兩個不同面向用戶的界面,但所有的AI都是千問的。所以我們今天看到,在PC端用戶就是一半一半的,一半人喜歡千問,還有一半人喜歡在AI瀏覽器里打開千問,那也是千問,我覺得我們不糾結(jié)這個。但是在移動端,但是會有越來越多的人用千問。
問:現(xiàn)在關(guān)于AI入口之爭非常多,面向C端這個入口我們這塊戰(zhàn)略布局是什么?
吳嘉:今天的現(xiàn)狀確實是這樣的,你會看到很多端上都會有這樣的問題。但是我覺得終局不會有這么多家,因為真的能把模型的智力水平做上來,并且有資源在生態(tài)上面這樣投入的公司是沒有幾家的。我覺得最終能夠提供這個能力的是其中的幾家吧,可能一兩家、兩三家。但是,你說前臺界面會不會消失了變成一兩家?我覺得不好說。
今天在AI發(fā)展的初級階段,所以所有人都會覺得它有機會。因為在這個階段下面,大家去做一個風(fēng)格不同的AI助手還是容易的。大家覺得好像我是這樣風(fēng)格的AI助手,你是那樣風(fēng)格的AI助手,我們好像還是不一樣的。
但是其實我是覺得從今年上半年開始,就不會這樣的,我是說2026年上半年。因為我們現(xiàn)在線上做大量的測試,其實是不同的Agent不同的風(fēng)格。我們可能用了一個主風(fēng)格,但是未來我們會變。這就跟現(xiàn)實生活中一樣,我跟你能成為朋友,我跟他不一定能成為朋友。你喜歡我的表達(dá),你不一定喜歡他的表達(dá),雖然我們講的是類似的事情。
所以,我覺得到了真正的個性化、擬人化的這個階段,我覺得會有很多公司就不會再做AI了。我覺得市面上就只會有幾家做。
問:這次打通集團(tuán)這些API,是不是也是因為看到了接下來3個月到半年,不管是模型能力還是Agent能力,它可能會有一個非常重大的提升?
吳嘉:一直以來我們都認(rèn)為這個方向是我們做AI產(chǎn)品的核心中的核心,這不是我們突然意識到我們要做這個,這是第一。第二個是我們看到Agent在生活方面的趨勢是在去年的7月份,就是在思考模型出來之后這段時間,包括VRL的進(jìn)展。我們就已經(jīng)看到這個趨勢了。從那個時候開始,我們就是持續(xù)在加大投入了。
問:現(xiàn)在各家大公司的Chat工具競爭還挺激烈的,有一家已經(jīng)DAU超過1個億了。從DAU數(shù)據(jù)或者M(jìn)AU這個數(shù)據(jù)的角度來看,千問會很在意它嗎?
吳嘉:我即便在傳統(tǒng)互聯(lián)網(wǎng),8000萬跟1個億,區(qū)別也不是那么大。我非常深信一個觀點的,我覺得在智力時代,這個產(chǎn)品過沒過智能門檻,它是不是真的能像人一樣去服務(wù)、去執(zhí)行,能不能在數(shù)字世界有很高的準(zhǔn)確率、滿意度,才是關(guān)鍵。過智力門檻,它跟你給它灌多少流量相關(guān),但不像傳統(tǒng)互聯(lián)網(wǎng)那么強相關(guān)。它還是AI的模型能力的訓(xùn)練范式等等一系列的起決定性作用。所以,我覺得對阿里巴巴我們一家非常專心、投入巨大精力在做模型的公司,我們看的是否過智力門檻,我們看的還是全球在AGI上面的進(jìn)步。
問:先考慮用戶體驗是嗎?
吳嘉:全世界從來沒用過這個東西,就像大家第一次去用iPhone。iPhone1出來的時候,大家的體驗沒有那么好,到iPhone4的時候就完全變了,今天AI可能還在一個iPhone1的時代。
AI做好決策,我們現(xiàn)在也在做,會有一系列的方法,不會像現(xiàn)在AI就精準(zhǔn)到一個商品,我覺得AI代替?zhèn)鹘y(tǒng)“刷”的那個動作還是非常有機會,這個可以再給我們一點時間。
問:現(xiàn)在AI就是對現(xiàn)有傳統(tǒng)流量模式的顛覆,包括現(xiàn)在手機操作系統(tǒng),以及APP的商業(yè)生態(tài),隨著未來越來越多AI的出現(xiàn)、使用,對APP生態(tài)會怎么演變?包括未來千問和淘寶的界限是不是越來越模糊?
吳嘉:我覺得走到那一步可能還需要一段時間,首先第一就是我不覺得未來大的能夠成為入口型的AI Agent會有那么多。隨著技術(shù)的發(fā)展,今天來看綜合Agent的競爭力還是非常強的,Agent越來越被證明是一個階段性的產(chǎn)品,區(qū)別于接入綜合Agent,類似于小程序和微信的關(guān)系,商家和淘寶的關(guān)系。我覺得獨立作為入口,Agent不會演變很多,它會是一個綜合性的東西。從需求的角度來看,All-in-One是一個趨勢。
問:或者我們預(yù)測一下2026年最可能發(fā)生的一些變化?
吳嘉:AI這方面我覺得會越來越像人,它的思考方式、做事方式會讓你覺得你越來越在使用跟人一樣的需求。
*本文為全天候科技原創(chuàng)作品,未經(jīng)授權(quán)不得轉(zhuǎn)載,如需轉(zhuǎn)載,請在后臺回復(fù)“轉(zhuǎn)載”二字,獲取轉(zhuǎn)載格式要求。
![]()
![]()
點“在看”,變好看哦。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.