337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

林俊旸離職后首發長文,智能體式思考將成主流

林俊旸從阿里離職后首發長文

0
分享至

3月26日晚間,前千問大模型技術負責人林俊旸在社交平臺發文,在從阿里離職后,他首度發布長文詳談自己對大模型發展路線的理解及對AI下一階段的預判。

林俊旸表示,過去兩年重塑了行業對大模型的評估方式與核心期待。OpenAI的o1表明,"思考"可以成為一種被訓練出來的能力。DeepSeek-R1緊隨其后,證明推理式的后訓練可以在原始實驗室之外被復現、被擴展。這一階段至關重要。但2025年上半年,行業焦點主要停留在"推理式思考"本身:如何讓模型在推理的時候多想一會兒。現在該問下一步了。他的判斷是智能體式思考:為了行動而思考,在與環境交互的過程中,并根據來自世界的反饋持續更新計劃。


前千問大模型技術負責人林俊旸

他提到,2025年初,千問團隊有一個很大的野心:做一個統一的系統,讓思考模式和指令模式合二為一,支持可調節的推理努力程度(類似于低/中/高推理設置),甚至能根據提示詞和上下文自動推斷合適的推理量,讓模型自主決定何時直接回答、何時稍作思考、何時為真正困難的問題投入大量計算。概念上,這是正確的方向。但"合并"說起來容易,做好卻極難。

真正的難點在于數據。當人們談論合并思考與指令時,往往首先想到模型側的兼容性,更深層的問題是,兩種模式的數據分布和行為目標存在顯著差異。在嘗試平衡模型合并與提升后訓練數據質量和多樣性的過程中,團隊并未把所有事情都做對,結果往往是在兩個方向上都表現平庸:"思考"行為變得嘈雜、冗余或不夠果斷,而"指令"行為則變得不夠清晰、不夠可靠,且比商業用戶實際想要的成本更高。

分開做在實踐中仍然有吸引力。2025年下半年,Qwen 的2507版本就發了獨立的 Instruct 和 Thinking 版本,30B 和235B 各一套。而他的最終思考是,真正成功的合并需要一個平滑的推理力度光譜,模型能自己判斷該花多少力氣去想。

推理鏈更長,不等于模型更聰明。很多時候,推理鏈越長,反而說明模型在亂花算力。”林俊旸在文中表示,他提到,千問團隊意識到,行業正在從訓練模型的時代,走向訓練智能體的時代,它的定義特征是跟真實世界的閉環交互。

智能體式思考和推理式思考,意味著不同的優化目標,推理式思考通常以最終答案前的內部思辨質量來評判:模型能否解出定理、寫出證明、生成正確代碼或通過基準測試。而智能體思維關注的是:模型能否在與環境交互的過程中持續取得進展。

這意味著,核心問題從“模型能否思考得足夠久?”轉變為“模型能不能用一種撐得起有效行動的方式來思考?”模型訓練的核心對象也隨之變了,變成了模型加環境的整個系統。

在這之中,模型架構和訓練數據當然還重要,但環境設計、rollout 基礎設施、評估器的穩健程度、多個 Agent 之間怎么協調,這些都進了核心圈。“好的思考”的定義也變了:在真實約束下最能撐起行動的那條軌跡,而非最長或最顯眼的那條。

林俊旸預測,智能體式思考會成為主流。

責任編輯:李超_NB12814

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
伊朗發動“真實承諾-4”行動第83波攻勢

伊朗發動“真實承諾-4”行動第83波攻勢

新華社
2026-03-27 09:23:02
中國可能在等,把三大主要問題解決了,再徹底解決臺灣問題

中國可能在等,把三大主要問題解決了,再徹底解決臺灣問題

論事的老樞
2026-03-21 17:28:10
52年岳飛后人找毛主席求安排工作,主席聽完沉默片刻,說了句話讓他當場愣住

52年岳飛后人找毛主席求安排工作,主席聽完沉默片刻,說了句話讓他當場愣住

老杉說歷史
2026-03-13 23:00:06
上海一商圈景觀水池被誤認作長凳,商圈回應:夜晚不排除可能讓人誤認的情況

上海一商圈景觀水池被誤認作長凳,商圈回應:夜晚不排除可能讓人誤認的情況

新浪財經
2026-03-27 10:53:12
勇敢發聲!科威特記者聯合國痛批“反以儀式”

勇敢發聲!科威特記者聯合國痛批“反以儀式”

Nee看
2026-03-26 14:15:21
法拉利發布F1日本大獎賽海報,畫風帥氣但“鈴鹿”拼錯了

法拉利發布F1日本大獎賽海報,畫風帥氣但“鈴鹿”拼錯了

懂球帝
2026-03-26 16:09:08
1:0!韋世豪破門,國足半場領先庫拉索,邵佳一沖擊執教開門紅

1:0!韋世豪破門,國足半場領先庫拉索,邵佳一沖擊執教開門紅

格斗社
2026-03-27 15:07:20
惡心到家了!《逐玉》大結局,是我今年看過“最離譜的大結局”!

惡心到家了!《逐玉》大結局,是我今年看過“最離譜的大結局”!

觀察鑒娛
2026-03-27 09:49:53
見證歷史,中國讓Open AI絕望了!

見證歷史,中國讓Open AI絕望了!

君臨財富
2026-03-25 23:36:26
加拿大宣布對伊朗實施新制裁

加拿大宣布對伊朗實施新制裁

每日經濟新聞
2026-03-27 08:32:12
“林肯”號航母頻繁彈射艦載戰斗機 對伊朗境內目標進行持續空襲

“林肯”號航母頻繁彈射艦載戰斗機 對伊朗境內目標進行持續空襲

hawk26講武堂
2026-03-26 13:46:05
老公肺癌腦轉移那天,我哭了整夜,第二天卻收到臨床治愈通知

老公肺癌腦轉移那天,我哭了整夜,第二天卻收到臨床治愈通知

王曉愛體彩
2026-03-26 17:57:33
香港馬拉松:阿Sa臉饅化,黃曉明白又嫩 林志玲被嘲做作

香港馬拉松:阿Sa臉饅化,黃曉明白又嫩 林志玲被嘲做作

白面書誏
2026-03-26 18:12:50
林依輪妻子西華罕見露面,一頭白發搶鏡,皮膚狀態卻好到不像54歲

林依輪妻子西華罕見露面,一頭白發搶鏡,皮膚狀態卻好到不像54歲

老吳教育課堂
2026-03-27 12:24:51
瓦良格號送到中國后有多震撼?專家刮掉表面的銹跡:鋼材品質極佳

瓦良格號送到中國后有多震撼?專家刮掉表面的銹跡:鋼材品質極佳

古書記史
2026-01-06 16:31:56
不能錯過!3月27日晚上19:30比賽!中央5套CCTV5、CCTV5+直播表

不能錯過!3月27日晚上19:30比賽!中央5套CCTV5、CCTV5+直播表

皮皮觀天下
2026-03-27 12:01:10
游客稱因拍照設備太專業被景區驅趕,萬歲山武俠城致歉:無意限制游客正常拍照留念等非商業拍攝,部分工作人員落實要求時溝通方式不周全

游客稱因拍照設備太專業被景區驅趕,萬歲山武俠城致歉:無意限制游客正常拍照留念等非商業拍攝,部分工作人員落實要求時溝通方式不周全

大風新聞
2026-03-27 13:30:15
油價漲了個寂寞!燃油車司機集體偷著樂,連夜囤油白忙活了!

油價漲了個寂寞!燃油車司機集體偷著樂,連夜囤油白忙活了!

趣味萌寵的日常
2026-03-27 12:40:22
《人民的名義》演員徐光宇幫朋友免費商演后獲贈10%股權,公司欠36萬余元工程款,他被債權人起訴要求賠償

《人民的名義》演員徐光宇幫朋友免費商演后獲贈10%股權,公司欠36萬余元工程款,他被債權人起訴要求賠償

大風新聞
2026-03-26 22:39:05
張雪峰離世后,老對手杜子建含淚解釋:節目上的對抗是為了收視率

張雪峰離世后,老對手杜子建含淚解釋:節目上的對抗是為了收視率

云景侃記
2026-03-26 15:13:16
2026-03-27 15:59:00
第一財經資訊 incentive-icons
第一財經資訊
第一財經官方賬號
248368文章數 621916關注度
往期回顧 全部

科技要聞

楊植麟張鵬夏立雪羅福莉,聊龍蝦、聊漲價

頭條要聞

空房倆月用水2000噸 水務公司:馬桶漏水 水表計量有效

頭條要聞

空房倆月用水2000噸 水務公司:馬桶漏水 水表計量有效

體育要聞

邵佳一:足球就像一場馬拉松

娛樂要聞

張雪峰靈堂內景曝光,四周擺滿了鮮花

財經要聞

我在小吃培訓機構學習“科技與狠活”

汽車要聞

與眾08,金標大眾不能輸的一戰

態度原創

藝術
家居
親子
健康
游戲

藝術要聞

張大千:形成于未畫之先,神留于既畫之后

家居要聞

曲線華爾茲 現代簡約

親子要聞

手足口病進入高發季 中疾控專家:6月齡以上兒童盡早接種EV71疫苗防重癥

轉頭就暈的耳石癥,能開車上班嗎?

Xbox發布會新游細節曝光:有戀愛玩法 包含成人要素!

無障礙瀏覽 進入關懷版