337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

林俊旸離職后首發長文,智能體式思考將成主流

林俊旸從阿里離職后首發長文

0
分享至

3月26日晚間,前千問大模型技術負責人林俊旸在社交平臺發文,在從阿里離職后,他首度發布長文詳談自己對大模型發展路線的理解及對AI下一階段的預判。

林俊旸表示,過去兩年重塑了行業對大模型的評估方式與核心期待。OpenAI的o1表明,"思考"可以成為一種被訓練出來的能力。DeepSeek-R1緊隨其后,證明推理式的后訓練可以在原始實驗室之外被復現、被擴展。這一階段至關重要。但2025年上半年,行業焦點主要停留在"推理式思考"本身:如何讓模型在推理的時候多想一會兒。現在該問下一步了。他的判斷是智能體式思考:為了行動而思考,在與環境交互的過程中,并根據來自世界的反饋持續更新計劃。


前千問大模型技術負責人林俊旸

他提到,2025年初,千問團隊有一個很大的野心:做一個統一的系統,讓思考模式和指令模式合二為一,支持可調節的推理努力程度(類似于低/中/高推理設置),甚至能根據提示詞和上下文自動推斷合適的推理量,讓模型自主決定何時直接回答、何時稍作思考、何時為真正困難的問題投入大量計算。概念上,這是正確的方向。但"合并"說起來容易,做好卻極難。

真正的難點在于數據。當人們談論合并思考與指令時,往往首先想到模型側的兼容性,更深層的問題是,兩種模式的數據分布和行為目標存在顯著差異。在嘗試平衡模型合并與提升后訓練數據質量和多樣性的過程中,團隊并未把所有事情都做對,結果往往是在兩個方向上都表現平庸:"思考"行為變得嘈雜、冗余或不夠果斷,而"指令"行為則變得不夠清晰、不夠可靠,且比商業用戶實際想要的成本更高。

分開做在實踐中仍然有吸引力。2025年下半年,Qwen 的2507版本就發了獨立的 Instruct 和 Thinking 版本,30B 和235B 各一套。而他的最終思考是,真正成功的合并需要一個平滑的推理力度光譜,模型能自己判斷該花多少力氣去想。

推理鏈更長,不等于模型更聰明。很多時候,推理鏈越長,反而說明模型在亂花算力。”林俊旸在文中表示,他提到,千問團隊意識到,行業正在從訓練模型的時代,走向訓練智能體的時代,它的定義特征是跟真實世界的閉環交互。

智能體式思考和推理式思考,意味著不同的優化目標,推理式思考通常以最終答案前的內部思辨質量來評判:模型能否解出定理、寫出證明、生成正確代碼或通過基準測試。而智能體思維關注的是:模型能否在與環境交互的過程中持續取得進展。

這意味著,核心問題從“模型能否思考得足夠久?”轉變為“模型能不能用一種撐得起有效行動的方式來思考?”模型訓練的核心對象也隨之變了,變成了模型加環境的整個系統。

在這之中,模型架構和訓練數據當然還重要,但環境設計、rollout 基礎設施、評估器的穩健程度、多個 Agent 之間怎么協調,這些都進了核心圈。“好的思考”的定義也變了:在真實約束下最能撐起行動的那條軌跡,而非最長或最顯眼的那條。

林俊旸預測,智能體式思考會成為主流。

責任編輯:李超_NB12814

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
資源白喂?王藝迪雙殺陳熠王勵勤遭調侃 滬上公主?這綽號太飯圈

資源白喂?王藝迪雙殺陳熠王勵勤遭調侃 滬上公主?這綽號太飯圈

勁爆體壇
2026-03-27 07:22:19
法拉利發布F1日本大獎賽海報,畫風帥氣但“鈴鹿”拼錯了

法拉利發布F1日本大獎賽海報,畫風帥氣但“鈴鹿”拼錯了

懂球帝
2026-03-26 16:09:08
比賭博還可怕!這5個“有去無回”的燒錢行業,普通人千萬別碰

比賭博還可怕!這5個“有去無回”的燒錢行業,普通人千萬別碰

鯨探所長
2026-03-17 17:12:45
遺憾!3次活命機會都沒抓住!張雪峰去世前,倒地30分鐘才被發現

遺憾!3次活命機會都沒抓住!張雪峰去世前,倒地30分鐘才被發現

奇思妙想草葉君
2026-03-26 02:36:58
《逐玉》火了,卻不識辛棄疾?臺網友嘲“刪古文的后果”

《逐玉》火了,卻不識辛棄疾?臺網友嘲“刪古文的后果”

樞密院十號
2026-03-25 20:24:47
太離譜!農村老師相親帶娃,張口要28萬彩禮,要求多到能逼瘋人

太離譜!農村老師相親帶娃,張口要28萬彩禮,要求多到能逼瘋人

潮鹿逐夢
2026-03-24 12:11:55
張雪峰11歲女兒發文!27字表心意惹淚目,驕傲稱我爸爸很偉大

張雪峰11歲女兒發文!27字表心意惹淚目,驕傲稱我爸爸很偉大

娛樂圈圈圓
2026-03-27 09:20:59
懷孕傳聞真相大白后,翁帆突傳“喜訊”,楊振寧終于可以放心了!

懷孕傳聞真相大白后,翁帆突傳“喜訊”,楊振寧終于可以放心了!

丁丁鯉史紀
2026-03-25 16:35:13
上海房價大漲的輿論,有點吹過頭了

上海房價大漲的輿論,有點吹過頭了

魔都財觀
2026-03-27 07:42:15
羅杰斯再拋驚人預言:2026年將出現史上最嚴重的金融動蕩

羅杰斯再拋驚人預言:2026年將出現史上最嚴重的金融動蕩

東風寄的千愁
2026-03-19 08:31:17
猝死三件套:熬夜、咖啡、跑步——人生最后一課

猝死三件套:熬夜、咖啡、跑步——人生最后一課

水滴的聲音
2026-03-25 08:36:43
臺積電:防了大陸幾十年,沒想到副總是美國間諜,核心機密被卷走

臺積電:防了大陸幾十年,沒想到副總是美國間諜,核心機密被卷走

掉了顆大白兔糖
2026-03-22 06:49:32
森林狼逆火箭:申京努力了,然而杜蘭特啊

森林狼逆火箭:申京努力了,然而杜蘭特啊

張佳瑋寫字的地方
2026-03-26 13:03:18
為什么中國要發射東風-41,必須要提前告知俄羅斯,這是咋回事?

為什么中國要發射東風-41,必須要提前告知俄羅斯,這是咋回事?

阿器談史
2026-03-19 18:11:39
俄羅斯主帥:FIFA把我們禁賽了,就算加入亞足聯頂多踢亞洲杯

俄羅斯主帥:FIFA把我們禁賽了,就算加入亞足聯頂多踢亞洲杯

懂球帝
2026-03-26 16:30:07
伊朗換上了一個“極端狠人”

伊朗換上了一個“極端狠人”

兩岸觀點
2026-03-27 08:41:07
聊聊獄中“貪吃”的尹錫悅

聊聊獄中“貪吃”的尹錫悅

天真無牙
2026-03-26 17:38:48
四川宜賓一佳人,好漂亮,仙姿玉色,貌美如花,絕世佳人不過如此

四川宜賓一佳人,好漂亮,仙姿玉色,貌美如花,絕世佳人不過如此

小椰的奶奶
2026-03-10 21:01:12
醫生:心臟病最危險信號,不是嘴唇發紫,而是頻繁出現這幾種異常

醫生:心臟病最危險信號,不是嘴唇發紫,而是頻繁出現這幾種異常

健康科普365
2026-03-27 09:20:57
恒大劉永灼,他揮霍敗家的瘋狂超許家印,從足壇功臣到身陷囹圄

恒大劉永灼,他揮霍敗家的瘋狂超許家印,從足壇功臣到身陷囹圄

羅納爾說個球
2026-03-27 02:15:28
2026-03-27 10:04:49
第一財經資訊 incentive-icons
第一財經資訊
第一財經官方賬號
248338文章數 621905關注度
往期回顧 全部

科技要聞

OpenAI果斷砍掉"成人模式",死磕生產力

頭條要聞

65歲上海老伯相信"33歲女老師"給自己生兒子 被騙16萬

頭條要聞

65歲上海老伯相信"33歲女老師"給自己生兒子 被騙16萬

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發聲!稱姐姐受身邊人挑撥

財經要聞

很反常!油價向上,黃金向下

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續航815km

態度原創

藝術
數碼
手機
家居
公開課

藝術要聞

江青的書法秘訣!只練草書真的能提升書法水平嗎?

數碼要聞

中國耳機市場6年來首次下滑:銷量跌回2億 2026還要降

手機要聞

消息稱蘋果iOS 27拓展“液態玻璃”,要求所有App跟進

家居要聞

傍海而居 靜觀蝴蝶海

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版