337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

智能體式思考,AI大模型的旦用難回

0
分享至

OpenClaw(龍蝦)帶來的「颶風」還在繼續刮,而且看起來更是一場 AI 的范式轉移。

上周五舉辦的 2026 中關村論壇人工智能主題日上,月之暗面創始人楊植、智譜 AI CEO 張鵬、無問芯穹 CEO 夏立雪、小米 MiMo 大模型負責人羅福莉、香港大學 nanobot 負責人黃超教授,共同參與了一場聚焦「OpenClaw 與 AI 開源」的圓桌對話。

這里就不介紹對話詳情,只提一點就是:Harness 和 Skill 在影響 Agent 框架的方向,Agent 框架也在影響大模型的方向。說簡單點,他們都認為接下來大模型要更加適應 Agent 的進化方向。

事實上就在前一天,一度引起 AI 圈和阿里股價「震蕩」的前阿里千問技術負責人林俊旸,在離職后首次公開發布了一篇長文,全文分成六個部分,包括對 OpenAI o1、DeepSeek R1 推理范式的溯源,還有對 Qwen 路線的反思等。

但其中最重要的一部分,還是對「Agentic Thinking」(智能體式思考)的提出與判斷。不同于 DeepSeek R1 那種推理式思考,他認為智能體式思考必須能夠:

- 決定何時停止思考并采取行動
- 選擇調用哪個工具以及以什么順序
- 整合來自環境的嘈雜或部分觀察
- 在失敗后修訂計劃
- 在許多輪次和許多工具調用中保持連貫性



林俊旸原文第四部分,圖片來源:X

這么說,聽起來可能還是有點抽象,但如果你最近用過 OpenClaw 或者 Claude Code,可能已經隱約感受到這種變化。它們不再像傳統模型那樣,在封閉環境下進行純推理式的思考:

而更像一個真正干活的人,一邊思考,一邊結合各種工具和技能動起來,出錯了再思考,再嘗試,最終輸出回答或者執行結果。

對比之下,以 OpenAI o1、DeepSeek R1 為代表的推理模型,更多還是在「顱內推演」,最后直接輸出一個回答。不是說純推理式思考沒有價值,但更適用于數學等封閉世界的問題,而現實世界往往目標不明確、反饋不穩定,需要多步決策。

所以也能看到,幾乎沒有人會推薦在 OpenClaw 或者類似產品使用 DeepSeek R1,更多今年發布的新模型,也都在適應 OpenClaw。

智能體要干活,AI 不能埋頭思考答題

上周末,雷科技受邀在亞洲重量級當代藝術博覽會 Art Central 2026 體驗了一款頗具特色的視覺 AI 應用,可參看《帶著Chance AI勇闖藝術展:拍照即解讀,視覺AI真能看懂當代藝術?》。

簡單來說,Chance AI 更本質的核心是一個 Visual Agent(視覺智能體)。而我核心想說的,是實際體驗中 Chance AI 的「思考方式」。

不同于 DeepSeek 思考模式(R1)下純推理,基本依賴獲取到的文本信息繼續搜索,并在此基礎上進行推理。Chance AI 在識別圖片內容后,則會廣泛地通過搜索引擎、社交平臺搜索圖片、文本信息,甚至是位置信息(地點)。

更重要的是,Chance AI 作為智能體不是依靠一次推理,而會基于圖片、文本、地點等信息的反饋,反復調整、多次嘗試。

就拿我在 Art Central 2026 看到的一副作品來說,Chance AI 首先會識別圖片內容,再通過 Instagram 等社交媒體以及專業的藝術品平臺進行搜索,盡可能先找到「作品」。

然后才會繼續思考。不管沒找到,還是信息太少,都會使用不同工具查找藝術品、地點、圖片,進一步鎖定作品和作家等更多信息,再繼續思考需求,比如作家的風格和更多作品。



圖片來源:雷科技

這種 Agent loop(智能體循環)的工作方式,也在一定程度上決定了同一張啤酒桶的局部照片,能被 Chance AI 認出,豆包、Gemini 等主流 AI 大模型卻認不出。這當然不是在大模型層面超越了 AI 巨頭,核心還是將 Harness Engineering 的工程架構第一次帶到視覺領域。

將 Harness 和 Skill 機制發揚光大的 OpenClaw 更是同理。

盡管它的干活能力超出了無數人的預想,但 OpenClaw 之父 Steinberger 并沒有自主訓練大模型,在大模型之上打造了一個相對可靠的 Agent 框架,或者就像黃超教授說的「腳手架」「輕量級操作系統」。

這也是今年以來被頻繁討論的技術趨勢。

Harness 中文直譯為「馬具」,Harness Engineering 簡單理解就是「駕馭大模型」的工程,包括但不限于上下文工程、長記憶管理、工具調用等。而 Skill 可能更為大眾熟知,比如支付寶今天(3 月 31 日)剛剛推出的支付寶支付集成 Skill,就能讓智能體 AI 直接集成支付寶的支付能力。



圖片來源:支付寶

但在技術變化之下,更底層的變化則是林俊旸口中的「智能體式思考」。

事實上,智能體 AI 更離不開「思考」,但它的思考被嵌進了不同的操作和流程之中。這就是智能體式思考本質的變化:不是先完全想清楚再動手,而是在動手的過程中不斷修正自己的想法。

你會發現,OpenClaw 和過去的大模型,完全不是一種「工作方式」。它們不會一上來就給你結果(非推理模型),也不會搜集一輪信息后埋頭思考后答題(純推理模型),而是更多調用工具與進行交互,多輪搜索、驗證、決策和調整。所以在大模型不變的前提下,OpenClaw 這類智能體產品反而能夠更好地解決現實問題。



圖片來源:雷科技

又比如一個看似簡單的需求:修一個項目里的 bug。你并不知道問題在哪,也不知道改哪一行代碼,更不確定一次修改能不能解決問題。在這種情況下,單純拉長「推理鏈」并沒有太大意義。因為真正關鍵的不是「想得更全面」,而是不斷測試、調整思路。

正如羅福莉說的,「(OpenClaw)保證了下限,同時也拉升了上限。」

智能體式思考,旦用難回?

把時間撥回到 2024 年,大模型行業最明確的一條主線,其實就是讓模型更會「推理」。以 OpenAI o1、DeepSeek R1 為代表,這一代大模型開始系統性地拉長推理鏈,通過更長的思考鏈換取更高的正確率。

在數學、代碼等相對封閉的問題中,這種方法幾乎是立竿見影的,模型不再只是「猜答案」,而是開始「做題」。這也是為什么,當年大模型都在卷「推理」。

但 DeepSeek R1 這類純推理模型暗含了一個前提:問題都是可以被「思考」出來的。也就是說,信息是相對完整的,目標是明確的,路徑是可以通過推導得到的。



圖片來源:DeepSeek

可現實世界并不是一張問卷。當任務從「解一道題」變成「把一件事做完」,信息不再完整,目標也不總是清晰,過程更不是一次推導就能結束的。AI 需要不斷嘗試、修正路徑,甚至在過程中重新理解問題本身。

就算是寫報告這種「案頭工作」,現實世界中也需要多輪的信息搜集、思考推理、工具調用和評估決策。這也是為什么,當 OpenClaw、Claude Code 以及更多這類產品出現后,很多人第一次意識到「會推理」,和「能干活」,其實是兩種能力。

它們的關鍵變化,并不在模型本身,而在于引入了一整套圍繞執行過程的機制。

Harness 不負責思考本身,但決定了思考如何被組織。什么時候繼續推理,什么時候該去執行,失敗之后是回退還是換路徑。它把原本一次性的推理過程,拆成了一個可以反復運行的循環。Skill 則把各種能力變成了 AI 隨時能調用的模塊,明確的操作選項。模型需要做的,也不再是直接給出答案,而是選擇在什么時刻調用哪一種能力。

看起來只是流程上的變化,但帶來的結果卻是讓模型具備處理「不確定問題」的能力。所以同樣的大模型底座,放在不同的系統中,表現會有明顯差異。像 OpenClaw 或 Claude Code,在面對復雜任務時,并不是因為「更聰明」,而是因為它們可以不斷試錯、修正路徑、利用工具,直到把問題推進到一個可行的結果。

不過真正驅動這種變化的,核心還不是技術本身,而是需求。



比如調研小紅書,圖片來源:雷科技

當用戶第一次使用大模型時,期待的是一個能回答問題的工具。當推理能力提升之后,期待變成了「回答得更準確」。但到了今天,這種期待已經進一步轉變為「真正的代理」,直接作為「AI 同事」幫我們干活。

沒人會滿足于一個只會回答問題的 AI。寫代碼也好,查信息也好,處理任務也好,真正有價值的,從來不是「告訴我該怎么做」,而是「幫我做」。

在這樣的需求之下,大模型就不再只是一個推理機器,而必須成為一個可以參與執行的系統。也正因為如此,從推理式思考走向智能體式思考,甚至都談不上一次技術路線的選擇,而會是一種幾乎不可避免的遷移。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
斬首失敗,54名雇傭兵被全殲:伊朗不費一槍一彈,讓美企提心吊膽

斬首失敗,54名雇傭兵被全殲:伊朗不費一槍一彈,讓美企提心吊膽

起喜電影
2026-04-01 19:13:39
贏麻了!東契奇達成15000分里程碑比科比更年輕,僅次于詹杜

贏麻了!東契奇達成15000分里程碑比科比更年輕,僅次于詹杜

仰臥撐FTUer
2026-04-01 20:19:09
理想汽車2026年3月交付量為4.11萬輛,理想i6貢獻近六成

理想汽車2026年3月交付量為4.11萬輛,理想i6貢獻近六成

識礁Farsight
2026-04-01 17:35:45
高市最擔心的事發生了!中方“截胡”日本,大批美國能源運往中國

高市最擔心的事發生了!中方“截胡”日本,大批美國能源運往中國

嫹筆牂牂
2026-04-01 09:47:11
出獄后的雷政富滄桑感襲面而來,前后對比引人唏噓

出獄后的雷政富滄桑感襲面而來,前后對比引人唏噓

霹靂炮
2026-03-14 22:49:47
以色列會是什么結局?猶太人的命運,早已寫在《圣經》里

以色列會是什么結局?猶太人的命運,早已寫在《圣經》里

李茗傳
2026-03-31 17:05:20
當了三年油販子,印度終于把自己賣斷貨了

當了三年油販子,印度終于把自己賣斷貨了

李榮茂
2026-03-31 18:31:38
小孩子的嘴果然是口無遮攔啥都往外說!爸媽:以后還怎么見人

小孩子的嘴果然是口無遮攔啥都往外說!爸媽:以后還怎么見人

另子維愛讀史
2026-04-01 19:28:39
全線大漲!霍爾木茲海峽大消息

全線大漲!霍爾木茲海峽大消息

新浪財經
2026-04-01 15:10:17
金價徹底爆了!中東傳來大消息

金價徹底爆了!中東傳來大消息

晉江電視臺
2026-04-01 15:51:40
曼聯清洗名單中一人不走了!重返歐冠愿留隊打替補,稱夢劇場特別

曼聯清洗名單中一人不走了!重返歐冠愿留隊打替補,稱夢劇場特別

羅米的曼聯博客
2026-04-01 11:43:52
頂級軍事天才有多恐怖?1萬8千宋軍殘兵,硬撼20萬金軍精銳

頂級軍事天才有多恐怖?1萬8千宋軍殘兵,硬撼20萬金軍精銳

鶴羽說個事
2026-03-30 22:45:02
張檬曬廣州新家,11個月兒子能吃一大碗輔食,被仨人照顧白白胖胖

張檬曬廣州新家,11個月兒子能吃一大碗輔食,被仨人照顧白白胖胖

八怪娛
2026-03-30 09:07:22
超1800名數學家聯合抵制在美舉辦國際數學家大會:美軍事行動破壞世界穩定,去那里不安全,且與數學家之間的國際團結意識目標相悖

超1800名數學家聯合抵制在美舉辦國際數學家大會:美軍事行動破壞世界穩定,去那里不安全,且與數學家之間的國際團結意識目標相悖

極目新聞
2026-04-01 10:59:30
鄭欽文直接入圍,世界第一薩巴再次開啟衛冕之旅!

鄭欽文直接入圍,世界第一薩巴再次開啟衛冕之旅!

網球之家
2026-03-31 22:23:21
他是全軍唯一一個沒有軍銜的野戰軍副司令員,只因身份特殊

他是全軍唯一一個沒有軍銜的野戰軍副司令員,只因身份特殊

鶴羽說個事
2026-03-31 22:37:54
天龍八部,到底是哪八部?

天龍八部,到底是哪八部?

混知
2026-03-31 17:08:17
美國要是倒下了,最受傷的還是中國。

美國要是倒下了,最受傷的還是中國。

阿七說史
2026-03-30 15:36:14
乒乓球世界杯大冷門,世界亞軍1-3出局,國乒全勝,伊藤美誠復仇

乒乓球世界杯大冷門,世界亞軍1-3出局,國乒全勝,伊藤美誠復仇

寶哥精彩賽事
2026-04-01 18:58:16
歷時超2年,成都主城最長地鐵區間貫通!全市最深地鐵站啟動鋪軌

歷時超2年,成都主城最長地鐵區間貫通!全市最深地鐵站啟動鋪軌

寶哥精彩賽事
2026-04-01 18:04:35
2026-04-01 21:56:49
雷科技 incentive-icons
雷科技
專注AI硬科技
36680文章數 811974關注度
往期回顧 全部

科技要聞

甲骨文血洗3萬人,47人團隊僅留3人

頭條要聞

凱越機車疑內涵張雪機車奪冠:在你來之前我們就是冠軍

頭條要聞

凱越機車疑內涵張雪機車奪冠:在你來之前我們就是冠軍

體育要聞

NBA擴軍,和籃球無關?

娛樂要聞

宋寧峰人設崩塌!帶娃偷情+反向索賠

財經要聞

電商售械三水光針 機構倒貨or假貨猖獗?

汽車要聞

三電可靠 用料下本 百萬公里的蔚來ES6 拆開看

態度原創

家居
親子
教育
手機
公開課

家居要聞

經典配色 晝色銀河

親子要聞

孩子大點就“臭了”,難怪說是“臭小子”!

教育要聞

復試殘酷真相!淘汰率最高 91.7%!

手機要聞

華為49元的「龍蝦」不算貴,用戶認不認才真難

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版