![]()
微信是“Agent革命”的最佳試驗場
文/林書
編輯/劉宇翔
2025年的最后一個月,一則消息在科技圈引起了不小的震動——27歲的OpenAI前研究員姚順雨正式出任騰訊"CEO/總裁辦公室"首席AI科學(xué)家,同時兼任新成立的AI Infra部負(fù)責(zé)人。
這不僅是一位頂尖AI人才的回歸,更是騰訊AI戰(zhàn)略的重大轉(zhuǎn)向信號。
作為OpenAI前研究員,姚順雨為智能體方向的發(fā)展做出了突出貢獻。他提出了ReAct 方法,并首次引入"推理一行動"結(jié)合的智能體范式,這一思路不但增強了模型的可控性,也極大拓展了其在各類實際領(lǐng)域中的適用能力。
這樣的頂尖人才加入,意味著騰訊這次真的想好好做大模型了。
![]()
在這個節(jié)點上審視騰訊的AI布局,會發(fā)現(xiàn)一個有趣的時間悖論:身為BAT三巨頭之一,騰訊直到2025年末才真正開始認(rèn)真布局大模型,這與其他互聯(lián)網(wǎng)巨頭的節(jié)奏,形成了鮮明對比。
據(jù)IDC 2025年Q3數(shù)據(jù)顯示,中國大模型市場份額中,百度文心占31%、阿里通義24%、字節(jié)估算18%,騰訊混元未躋身前三。百度在2025年11月的百度世界大會上正式發(fā)布文心大模型5.0,以2.4萬億參數(shù)規(guī)模開創(chuàng)全球首個原生全模態(tài)大模型;而字節(jié)跳動旗下的豆包大模型更是增速驚人,截至2025年12月,其日均token使用量已突破50萬億,位居全球第三、中國第一。
當(dāng)然,不同統(tǒng)計口徑得出的結(jié)論并不相同,但不可否認(rèn)的是,混元大模型的份額,確實與騰訊在互聯(lián)網(wǎng)的地位是不匹配的。除了要抹平數(shù)據(jù)上的差距外,還有一件意外的動因,潛在地加速了騰訊的AI布局。
01
騰訊為何現(xiàn)在才認(rèn)真做大模型?
騰訊禮聘姚順雨當(dāng)然并非一朝一夕的事,招攬這一層級的頂尖人才,應(yīng)該很早就接觸,并經(jīng)過多輪面談,雙方在待遇、級別乃至發(fā)展方向都達成了共識才行。
但在姚順雨入職騰訊前,有一個事件特別值得關(guān)注——豆包手機助手的問世。12月初,字節(jié)跳動與中興合作的豆包手機因AI代理功能引發(fā)行業(yè)地震,這款手機能夠跨應(yīng)用自動操作,實現(xiàn)端到端的服務(wù)閉環(huán)。更重要的是,它使用了安卓系統(tǒng)中的INJECT_EVENTS高危權(quán)限,可以模擬用戶操作,實現(xiàn)真正的"手機自己干活"。
這一創(chuàng)新對微信構(gòu)成了潛在挑戰(zhàn)。豆包助手可以通過AI代理完成跨應(yīng)用服務(wù),從點外賣到預(yù)訂酒店,無需用戶在多個App間跳轉(zhuǎn)。這種端到端的用戶體驗,對微信這種封閉生態(tài)構(gòu)成了實質(zhì)性沖擊。
面對這樣的沖擊,騰訊終于坐不住了。12月17日,騰訊宣布升級大模型研發(fā)架構(gòu),新成立AI Infra部、AI Data部和數(shù)據(jù)計算平臺部,全面強化其大模型的研發(fā)體系。
實際上,騰訊過去的AI戰(zhàn)略有“重應(yīng)用輕基礎(chǔ)”的嫌疑。長期以來,騰訊AI聚焦應(yīng)用層優(yōu)化——廣告算法、游戲AI、內(nèi)容審核等,這些大體上是對應(yīng)用層的投入,似乎缺乏對大模型作為”新操作系統(tǒng)內(nèi)核”的重視,或者說從外界的感知來看,其重視程度是不足的。
騰訊早期的AI負(fù)責(zé)人多是工程或管理背景,以技術(shù)工程事業(yè)群總裁盧山、副總裁蔣杰為代表的團隊,長期以來在廣告算法優(yōu)化和業(yè)務(wù)落地方面表現(xiàn)出色,但在前沿大模型研究方面,相對缺乏具有深度學(xué)術(shù)背景的頂尖人才。
此外,大語言模型部副總經(jīng)理王迪,雖在大模型工程化方面有豐富經(jīng)驗,但同樣缺乏在基礎(chǔ)研究層面的突破性貢獻。
這種戰(zhàn)略錯位在技術(shù)競爭中已經(jīng)顯現(xiàn)。盡管騰訊在2025年發(fā)布了混元2.0,采用406B參數(shù)的混合專家架構(gòu),在推理能力上有所提升,但在全球大模型競技場LMArena的排名中,混元模型長期不在第一梯隊。直到2025年10月,混元視覺模型才躋身全球前三、國內(nèi)第一的位置,這已經(jīng)是相對較晚的突破了。
在C端應(yīng)用方面,根據(jù)QuestMobile數(shù)據(jù),截至2025年3月初,騰訊元寶日活用戶約為200-300萬水平,而同期豆包日活已接近3000萬。截至2025年8月,騰訊元寶月活用戶規(guī)模約275萬,在綜合類AI原生APP中排名第八。
或許一系列的變化,加速了姚順雨的加入,這也標(biāo)志著騰訊開始更重視基礎(chǔ)研究層面的突破。作為OpenAI首批智能體產(chǎn)品Operator 與Deep Research 的核心貢獻者,他不僅帶來技術(shù)能力,更重要的是帶來了對AI發(fā)展方向的深刻理解——這正是騰訊過去缺乏的"頂層研究領(lǐng)袖"。
02
姚順雨為何可能改變騰訊?
要理解姚順雨對騰訊的意義,首先需要深入了解他的學(xué)術(shù)與工程背景。姚順雨的經(jīng)歷堪稱傳奇——1998年出生于安徽合肥,2015年以704分的高考成績考入清華大學(xué)計算機系姚班,成為當(dāng)年安徽省的探花。
2019年本科畢業(yè)后,姚順雨直接進入普林斯頓大學(xué)攻讀計算機科學(xué)博士學(xué)位,師從知名學(xué)者Karthik Narasimhan教授。在這里,他開始專攻自然語言處理與強化學(xué)習(xí),并提出了一個具有里程碑意義的概念——"Language Agents"。
其博士研究聚焦于解決一個核心問題:如何讓AI像人一樣邊思考邊行動。他在2020年提出的ReAct(Reasoning+Acting)框架,緊接著在2022年提出了思維樹(Tree of Thoughts,ToT)方法,這是對大模型推理能力的進一步突破。
在ReAct和ToT出現(xiàn)之前,大多數(shù)AI(包括早期Agent)的"思考"其實是單線程、不能回頭、不能試錯的。例如:
用戶問:"怎么快速從北京去上海?"
普通AI往往會這么操作:
"第一步:打開12306;第二步:查高鐵票;第三步:買票……"
這就像一個人閉著眼睛按攻略走路,從不調(diào)整方向,走到死胡同就卡住,很多公司說的"Agent會思考",其實只是把普通思維鏈包裝成多步指令(比如"先查天氣,再查餐廳"),但一旦中間出錯,就徹底失敗。
![]()
而ReAct和ToT的AI,具備"韌性"和"靈活性"——這才是姚順雨工作的真正價值。
在ReAct框架中,AI不再是"閉門思考"然后"執(zhí)行行動",而是像人類一樣,將推理與行動結(jié)合在一起,每一步推理都伴隨著行動與驗證。
同樣地,ToT允許AI在解決復(fù)雜問題時探索多條推理路徑,每條路徑都是一個"思維分支",AI可以在這些分支間比較、評估和回溯。這不僅提高了AI解決復(fù)雜問題的能力,更重要的是為AI的"深度思考"提供了機制基礎(chǔ)。
根據(jù)Google Scholar統(tǒng)計,ReAct和思維樹的引用次數(shù)已超過4000次,姚順雨的個人總引用次數(shù)超過1.5萬次。更重要的是,這些方法成為了后續(xù)AI Agent研究的重要基石。
2024年博士畢業(yè)后,姚順雨加入OpenAI,成為研究科學(xué)家。在那里,他深度參與了智能體產(chǎn)品Operator與Deep Research的開發(fā)。這兩個項目是OpenAI在Agent方面,真正面向?qū)嶋H應(yīng)用的產(chǎn)品化嘗試。
這兩個項目,讓姚順雨得以真正踐行了能自主探索、驗證、規(guī)劃、協(xié)作的AI代理——在他來看,這才是下一代AI的真正形態(tài)。
在OpenAI期間,姚順雨還在2025年4月發(fā)布了一篇重要的博文《AI的下半場》,提出了他對AI發(fā)展的深刻見解。他指出:"上半場的AI主要關(guān)注解決問題的方法炫技,而下半場的AI將專注于定義真正有價值的問題。"
姚順雨認(rèn)為,AI的下半場將是從"技術(shù)競賽"轉(zhuǎn)向"應(yīng)用落地"的關(guān)鍵時期,Agent如何嵌入人類生活、工作與關(guān)系網(wǎng)絡(luò)將成為核心議題——而這正是騰訊這種身為"基礎(chǔ)設(shè)施"的巨頭想要的。
03
找到"打敗微信的那個東西"
說到底,騰訊不缺工程能力,也不缺商業(yè)化經(jīng)驗,更不缺錢,但卻缺乏對AI發(fā)展中最重要的基座能力——大模型的掌控力。
姚順雨不僅帶來了技術(shù)方法論,更重要的是,是帶來了對"未來大模型該是怎樣的"這一關(guān)鍵問題的回答。
盡管騰訊作為"國民基礎(chǔ)設(shè)施"企業(yè),業(yè)務(wù)版圖已經(jīng)遍布各個領(lǐng)域——社交、游戲、支付、云計算等,但實際上,騰訊一直缺乏比較強力的大模型能夠從最底層將生態(tài)中的各個版圖徹底打通。
混元模型雖然在2025年發(fā)布了2.0版本,參數(shù)規(guī)模達到406B,支持256K上下文窗口,但在應(yīng)用層面,其使用量遠(yuǎn)低于預(yù)期。這反映了騰訊在大模型商業(yè)化應(yīng)用上的滯后。
更關(guān)鍵的是,在姚順雨看來,微信面臨著被"很不一樣的東西"顛覆的風(fēng)險。2025年9月,在一次深度訪談中,姚順雨提到:"真正的危險,不是說一個類似于微信的東西打敗了微信,而是一個很不一樣的東西打敗了微信。"
這個"很不一樣的東西",很可能正是一種具備復(fù)雜推理、長期記憶、多目標(biāo)權(quán)衡能力的AI Agent。
為什么微信是“Agent革命”的最佳試驗場?
因為微信不是單純的聊天工具,而是中國用戶完成2C、2B及混合場景的核心平臺——從訂餐轉(zhuǎn)賬到辦公社群,從小程序服務(wù)到社交互動。
這些場景看似簡單,但組合起來構(gòu)成了極復(fù)雜的意圖網(wǎng)絡(luò)。用戶發(fā)一條消息,可能意味著外賣訂餐需求、工作協(xié)作請求、社交互動、或者情緒表達。Agent需要具備跨上下文理解能力、風(fēng)險與偏好權(quán)衡能力、關(guān)系動態(tài)維護能力。
2025年第三季度財報電話會上,騰訊總裁劉熾平首次系統(tǒng)披露微信AI化戰(zhàn)略藍圖,明確表示"微信最終會推出一個AI智能體",讓用戶在微信生態(tài)內(nèi)即可完成各類事務(wù)。
這句話看似輕描描寫,實則信息量巨大——它意味著微信將從"被動響應(yīng)消息"的工具,進化為主動編織服務(wù)與關(guān)系的"意圖操作系統(tǒng)"。
姚順雨的目標(biāo)不是讓AI幫用戶自動點外賣,而是構(gòu)建一個能夠理解用戶深層意圖,并在微信生態(tài)中無縫執(zhí)行復(fù)雜任務(wù)的智能系統(tǒng)。這包括:理解對話中的隱含需求,預(yù)測用戶的長期偏好,協(xié)調(diào)多維度權(quán)衡(價格、速度、服務(wù)質(zhì)量),以及維護社交關(guān)系的動態(tài)平衡(自動回復(fù)但不顯得生硬)。
從"消息鏈"到"意圖鏈"的轉(zhuǎn)變,或許正是將來“微信新革命”的核心。
傳統(tǒng)的聊天工具處理的是"文本消息",而意圖操作系統(tǒng)處理的是"用戶意圖"。前者是被動響應(yīng),后者是主動理解。這種轉(zhuǎn)變需要Agent具備復(fù)雜推理能力——不僅理解"用戶說什么",更要理解"用戶真正想要什么",以及"如何以最優(yōu)方式滿足這個需求"。
04
結(jié)語
站在2025年末這個節(jié)點回望全年,各類Agent所展現(xiàn)出的自動點外賣、比價功能,確實讓行業(yè)眼前一亮。但客觀而言,這些功能目前仍停留在相對初級的"雜活"層面——它們展示的是AI能夠跨應(yīng)用操作的能力,但尚未觸及更復(fù)雜的認(rèn)知與決策場景。
隨著Agent技術(shù)的持續(xù)演進,用戶的需求場景也會越來越復(fù)雜,Agent之間的技術(shù)差距才會真正顯現(xiàn)。誰能在復(fù)雜推理、多目標(biāo)權(quán)衡、長期記憶等方面建立優(yōu)勢,誰才能在下一代AI競爭中占據(jù)制高點。
姚順雨這樣的頂尖人才加入騰訊,顯然不是為了做"只會點外賣"的Agent。殺雞用牛刀,非不能也,乃不為也。
他和團隊要尋找的,是那個真正能夠”顛覆微信"的東西——或許,那是一個全新的交互范式,一種重新定義人與服務(wù)、人與信息關(guān)系的方式。在AI進入下半場的關(guān)鍵時刻,這種探索的價值,遠(yuǎn)比任何單點功能的突破更加深遠(yuǎn)。
這也是騰訊眼下最緊迫、最想要的東西。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.