剛剛過去的 AGI-Next 2026 信息密度極高,也極具 Visionary。
唐杰、楊植麟、林俊旸、姚順雨...... 這場活動聚集了一大半國內大模型的核心主力人物。
毫無疑問,華人在 AGI 牌桌上,已經是核心玩家了。中國團隊開發的開源模型,是當之無愧的全球 Tier 1。
「海外獨角獸」對這場活動所有主題發言、對談討論中的核心觀點進行了總結,得出了 40 條重要判斷。
模型分化已經是一個顯性趨勢,分化背后的原因很多元,有 To B 和 To C 場景需求差異,是對模型競爭格局慎重思考之后的 bet,也有不同 AI labs 自然而然的戰略選擇;
To B 領域會出現強模型和弱模型之間的分化,而且會越來越大,模型在 To C 場景的任務瓶頸往往不是模型不夠大,而是 Context 和 Environment 的缺失;
自主學習是共識性極強的新范式,是 2026 年幾乎所有人都會投入到這個方向;
Scaling 仍然會繼續,是技術、數據與 taste 共進的結果,探索前沿智能不會因潛在風險而停止;
模型即 Agent,Agent 即產品;
中美 AI 之間算力差異不只是絕對量級上的,還是結構性的,美國的算力不僅比中國多 1-2 個數量級,更關鍵的是這其中有相當一部分被投入到了下一代關鍵技術的探索中。
活動的全文實錄詳見:
??關注 Founder Park,最及時最干貨的創業分享
超 19000 人的「AI 產品市集」社群!不錯過每一款有價值的 AI 應用。
邀請從業者、開發人員和創業者,飛書掃碼加群:
進群后,你有機會得到:
最新、最值得關注的 AI 新品資訊;
不定期贈送熱門新品的邀請碼、會員碼;
最精準的AI產品曝光渠道
01關鍵詞:分化
1. 結合中美兩地的觀察,姚順雨認為今天 AI 領域分化有兩個角度,1)To C 和 To B 之間發生分化,2)「垂直整合」和「模型和應用分層」兩條路線之間也開始分化。
2. 對于 To C 來說,大多數用戶在大多數時候并不需要很強的智能,他們對模型智能的提升的體驗并不強烈。To C 的瓶頸往往不是模型不夠大,而是 Context 和 Environment 的缺失。
姚順雨舉了一個例子,比如問「今天吃什么」,再強的模型可能也很難給出最準確的回應,這里的瓶頸在它不知道用戶當下的感受、所處的天氣環境等帶來的需求。
3.這個問題的解法在于真正的個性化數據,比如相比于盲目追求更強的預訓練模型,在合規前提下能把微信聊天記錄等 Context 用好,反而能給用戶帶來更大的價值。
4. To B 邏輯下,用戶(企業)愿意為「最強模型」付出溢價,因此,在 To B 市場內部,也會出現分化,即強模型與弱模型的分化會越來越明顯。
比如 Opus 4.5 這種能力很強的模型做 10 個任務能對 8-9 個,而能力較弱的模型只能對 5-6 個,即便后者更便宜,但在不知道「哪 5 個錯了」的情況下企業還需要花費巨大的精力去做監控,所以更有動力從一開始就選擇強模型。
5. To C 場景中,模型做 All-in-one 的垂直整合是成立的,模型和產品之間可以非常強耦合去緊密迭代,但 To B(生產力應用)因為涉及到很多生產環節,因此給了應用公司足夠多的機會空間圍繞環境、任務做優化,反向來看,應用公司很難自主訓模型、同時任務交付又依賴于模型預訓練能力的提升,所以就出現了模型公司和應用之間的分層。
6.Qwen 林俊旸的觀察是,模型的分化并并非預設的 road-map,更多是自然演化的結果,這種自然演化通常源于跟客戶的高頻交流,比如 Anthropic 做 Finance 就是在與客戶的高頻交流中發現的機會。
拾象注:ChatGPT 和 Claud 先后推出的 Healthcare 的垂直解決方案上的差異也完全印證了這兩家公司 to C 和 to B 的基因,前者面向 C 端用戶提供健康數據解讀,而 Claud health 走的是鏈接醫療系統的路線。OpenAI 長期來看會是下一個 Google,而 Claud 很明顯會成為 AI 時代的微軟。
7.「分化」同樣和模型競爭的 timing 相關。智譜之所以 bet coding 也是基于 對當時模型競爭格局的判斷,唐杰教授提到在,DeepSeek 出來后,團隊判斷「Chatbot 取代搜索這一仗」已經基本結束,智譜團隊經過內部討論后,最終選擇押注在 coding 上。
02關鍵詞:新范式
自主學習
8.首先,Scaling 仍然會繼續,但在 Scaling 的投入上,唐杰教授認為需要區分兩種不同方向。
?Scaling 已知路徑,通過不斷增加數據和算力,持續探索能力上限,但本質上也是一種「偷懶」的辦法,
?Scaling 未知路徑,也就是尋找尚未明確的新范式。讓 AI 系統自己來定義獎勵函數、交互方法、甚至訓練任務來做 Scaling。
拾象注:當下 AI 社區對于新范式還沒有一個統一的概念定義,自主學習、 active learning、continual learning 以及 self-learning 等本質上都在表達同一個預期,即模型自主學習能力提升,可以在人類不介入的情況下不斷提升智能。
9. 楊植麟把 Scaling Law 總結一種把能源轉化為智能的視角,它的核心在于高效逼近智能上限。模型承載的是價值觀與品味,Scaling 是技術、數據與審美的共進,探索前沿智能不會因潛在風險而停止。
10. 自主學習的目標是讓模型具備自反思與自學習能力。通過持續的自我評估與自我批判,模型能夠逐步分辨哪些行為是有效的,哪些路徑還有優化空間。
11. 姚順雨認為新范式的發生并不是某個未來的「突變點」,而是一個正在發生的「漸變」過程,甚至在 2025 年他已經看到了一些信號。
比如 Cursor 的 Auto-complete 模型每幾小時就用最新用戶數據學習,ChatGPT 利用用戶數據擬合聊天風格,也是一種自我學習,Claude Code 甚至寫了自己項目 95% 的代碼,從某種角度看,AI 已經開始有自己幫助自己變好的跡象。
12. 新范式的最大的 bottleneck 其實是想象力。更具象來說,如果 2027 年宣布實現了新范式,我們要用什么任務去證明這個范式已經實現了?是變成一個賺錢的交易系統?還是解決人類未解的科學問題?也就是說,對于當下我們去思考新范式的時候要先能想象到它長什么樣。
13. 林俊旸認為從更實際的角度,RL 的潛力還沒有做到足夠充分,很多潛力還值得被挖掘,對于下一代范式則存在兩個維度,首先是自主學習,其次是 AI 具備更強的主動性。今天是人類幫助 AI 啟動,而未來模型可能不再需要人類 Prompt,而是環境本身就能 Prompt 它。
14. Active learning 會帶來很嚴重的安全挑戰,風險不在于「講不該講的話」,而在于「做不該做的事」。主動學習一定是重要范式,但必須給它注入正確的方向。
15. 自主學習能夠體現到 personalization 上,但衡量它是否「變好了」會變得很難。推薦系統可以看點擊率,但當 AI 覆蓋生活方方面面后,evaluation 指標變得極其模糊。
16. 持續學習這個問題中包含了一個時間概念,也就是模型出于在持續地不斷地學的過程當中,但如果對于多 Agent 串聯的長程任務,一旦 Agent 的能力沒有做到 100%,那么越往后能力往往呈指數級下降,而在人類的學習機制中,是通過睡眠來「清理噪音」,可能在 AI 也需要探索類似的清噪與新計算模式。
17. 唐杰教授則提出了「Intelligence Efficiency」的概念,即智能效率,未來的范式不應只是單純的 Scaling,而應關注「投入多少資源能獲得多少智能增量」,這才是解決成本瓶頸的關鍵,而新范式的意義也在于,如何能用更少的范式獲得同樣、甚至更多的智能的提升。
18. 大模型的發展路徑一直在借鑒人腦認知的學習過程,逐步進入知識壓縮、推理、數學、Coding 等抽象演繹等任務而在 1)多模態、2)Memory 和 Continual Learning,以及 3)反思與自我認知這幾類能力,人類顯著領先于當前模型,而這幾個點可能是新的突破方向。
19. 智譜在 2020 年畫過一張參考人類認知的 AI 系統結構圖,有三個模塊:系統一、系統二,自學習。引入自學習主要基于以下幾個原因,對應有 3 類 Scaling:
![]()
原生多模態
20. 原生多模態模型和人的「感統」很相似,人的感統是這邊收集到一些視覺信息,同時還能收集到聲音、觸覺信息,而大腦會把這些感統信息匯集在一起來感知一個東西,今天的模型感統能力并不充分。
21.多模態感統是智譜今年的重點方向之一。模型具備這種能力之后,AI 才能在真實工作環境中執行長鏈路、長時效任務,例如在手機、電腦等設備上持續協作。
22. 多模態同樣也是 Qwen 接下來持續要做的事情。林俊旸認為如果要想做出一個真正智能的東西,天然應該是 Multimodal,但這里也存在一個 debate,即多模態能不能驅動智能。
23. 從更第一性地模型提供更多生產力、更好的幫助人類這一角度出發,做視覺、語音等多模態能力是自然而然的選擇。
24. 視頻是更廣義的表達,圖片可以理解為是單幀的視頻,理解很長的視頻是很有意思的一個事情。
03關鍵詞:Agent
25. Coding 是通往 Agent 的必經之路。智譜的實踐中發現,GLM-4.5 雖然跑分高,但寫不出「植物大戰僵尸」游戲。通過引入 RLVR 和大量真實編程環境訓練,GLM-4.7 才解決了這個問題。
26. 模型即產品。Agent 要實現復雜任務對模型的要求是相當高,模型就是這是 Agent 本身,Agent 就是產品本身,如果它們都是一體化的話,今天做基礎模型本身,其實也就是在做產品。
27. 模型 To B 和 To C 的分化同樣體現在 Agent 上:
?To C 產品的指標有的時候和模型智能并不相關,甚至相反,
?To B 的 Agent 甚至不需要做太多創新,模型智能提升、解決真實世界任務的能力提高、創造更多的價值。
28. 生產力場景的 Agent 才剛開始,除了模型進步之外之外,環境和 deployment 同樣重要,是 Agnet 創造價值的關鍵:即使今天模型不再變好,只要把現有模型部署到各公司,也能帶來 10 倍甚至 100 倍的收益,但今天 AI 對 GDP 的影響還遠不到 1%。
29. 教育非常重要。現在人和人的差距在拉大,并不是說 AI 要替代人的工作,而是說會使用這些工具的人,在替代那些不會使用工具的人。
30. Qwen 林俊旸認為未來的 Agent 將變成 「托管式」。用戶不再需要像現在這樣頻繁地一來一回交互,而是設定一個通用目標,Agent 就會在后臺長時間獨立運行,直到完成任務。
31. Agent 要做到這一點同樣也離不開前面跟提到的 Self-evolution 以及 Active Learning,因為這件事對模型的要求其實相當高,在這個邏輯下,我們可以說「模型即 Agent,Agent 即產品」。
32. 做通用 Agent 過程中長尾任務反而是更值得關注,對于用戶來說感受到 AI 的價值與魅力也是因為某個長尾任務被得到解決。今天的所謂 AGI 本質上也在解決長尾的問題。
33. 做通用的 Agent 是個見仁見智的問題。如果對于自己是一個「套殼高手」足夠有自信就可以做,但作為 wrapper 并沒有比模型公司做得更好的信息,那么通用 agent 就是「模型即產品」的機會,因為對于模型公司來說,很多工程問題也許只是「燒一燒卡」就可解決的。
34. 楊強教授將 Agent 的發展劃分為四個象限,從兩個維度來看:
?目標定義:是由人為定義的還是自動定義;
?任務規劃:即中間的 Action,是由人來定義,還是 AI 自動定義。
今天我們還處于一個很初級的狀態:即目標由人定義,規劃也由人做,但未來會出現一個大模型觀察人的工作,尤其是把人的 Process Data 給使用起來。最后目標也可以是大模型來定義,規劃也可以由大模型定義。所以,Agent 應該是由大模型內生的一個 Native 的系統。
35. 決定 Agent 未來的走勢的幾個重要問題:
?Agent 是否能真正解決人類任務?這個事情能夠創造價值嗎?價值有多大?
?Agent Cost 有多大?一方面如果 Cost 特別大,那也是一個問題。另一方面,如果調用一個 API 就能解決,那么模型廠商意識到這件事價值很大的時候,就會自然而然把它做進去。這是基座模型和應用之間永遠的矛盾。
?應用公司的迭代速度。如果 Agent 團隊有能力拉開半年時間窗口通過 Agent 應用滿足用戶需求,就有機會持續往前走。
04關鍵詞:全球 AI 競賽
36. 對于中國 AI 在 3-5 年內進入全球第一梯隊這件事,姚順雨的態度很樂觀。因為從制造業、電動車領域的經歷來看,中國最大的優勢在于一旦證明某件事可行,就有能力以極高的效率復現、甚至做到局部更好。
37. 但長期視角中更核心的問題在于「敢突破新范式、敢冒險的人不夠多」這樣的文化差異,此外,還需要面對的兩個現實瓶頸:
?算力瓶頸: 和美國相比,電力能源側不太會成為中國的算力瓶頸,更核心的還是在于光刻機是否有突破;
?是否能誕生更成熟的 To B 市場,更進一步在國際市場上做競爭。過分看重刷榜數字并不是健康可持續的,應像 Anthropic 或 DeepSeek 那樣更關注「正確的事」和用戶體驗。
38. 林俊旸則相對冷靜,認為最樂觀的情況中國 AI 超過美國的概率為 20%。中美 AI 之間算力差異不只是絕對量級上的,還是結構性的:美國算力比中國大 1-2 個數量級,但最關鍵的差異在于,他們的算力有相當一部分投入到了 下一代的研究中,而中國今天還在解決任務交付爆發帶來的算力瓶頸。
39. 但從歷史經驗來看,「窮則生變」,作為「算力窮人」,中國團隊更有緊迫感和動力去思考算法與 Infra 的聯合優化,而這個出發點是可以倒逼創新發生。
40. 面對光刻機的現實瓶頸,是否有可能我們在下一代的模型結構和芯片上就可以從軟硬結合的角度 End-to-End 地實現。
轉載原創文章請添加微信:founderparker
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.