337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

大模型競爭的下半場開啟了?

0
分享至



文 | 智能相對論

作者 | 陳泊丞

今年整個AI圈最熱鬧的事件莫過于全民“養龍蝦”——OpenClaw的走紅,讓大家終于看到了AGI落地的具象化可能。

然而,當業界為Agent“手腳”的日益靈活而歡呼時,一個更根本的問題卻被暫時掩蓋了——真正決定OpenClaw行動價值的“大腦”,也就是它背后的大模型底座,似乎正走在一條不可持續的道路上。

過去兩年,大模型行業奉行的是典型的“暴力美學”,即參數越多代表智能越高,思維鏈越長代表推理越深。萬億參數模型接連登場,長思維鏈成為技術先進性的標配。但在這股狂熱之下,一個尷尬的事實逐漸浮出水面——大量參數只是“吃算力”的擺設,超過70%的Token消耗發生在模型“已經答對、仍在反思”的無效階段。



推理Token消耗分布示意

因此,當OpenClaw這樣的執行端已經準備好進入工廠、倉庫、辦公室,我們才發現,驅動它的“大腦”要么昂貴到企業用不起,要么為了省錢而被迫“降智”。這或許是2026年AI產業化最核心的悖論——手腳已經就位,大腦卻還在“算力通脹”的泥潭中掙扎。

這一困局如何打破?就在前不久,YuanLab.ai團隊開源了Yuan 3.0 Ultra萬億參數模型,以一套截然不同的、更務實的技術路線,也在試圖解答當前行業的這一根本性問題:當模型規模的擴張已觸及收益遞減的臨界點,大模型的下一場競賽,究竟應該比什么?



Yuan3.0 Ultra在面向企業應用的表現

如果OpenClaw的大腦困于“昂貴”與“降智”的兩難,那么,整個行業就必須重新審視那個曾被奉為圭臬的增長邏輯。

算力通脹時代,市場渴望一場“價值回歸”

過去兩年,行業經歷了一場深刻的認知撕裂。

撕裂的一邊是技術供給側的狂歡。萬億參數模型接連登場,推理模型追逐越來越長的思維鏈,仿佛“想得越多”就等于“想得越對”。在國際AI頂會上,論文的核心賣點往往是“我們的模型又大了多少億”“我們的思維鏈又長了多少步”。

撕裂的另一邊是企業需求側的清醒。當技術營銷的喧囂褪去,企業客戶在采購時開始用最樸素也最殘酷的ROI邏輯發問:每一次API調用支付的Token費用,究竟有多少轉化為真正的業務價值?

事實上,研究顯示,在復雜推理任務中,模型超過70%的Token消耗發生在“已經答對”后的自我驗證階段。這意味著,企業每為模型智能支付10元錢,有7元是在為它的“過度思考”買單。

與此同時,更隱蔽的浪費還藏在模型結構本身。MoE(混合專家)架構在預訓練中會自發形成專家分化,負載最高的專家與最低的專家差距可達500倍。這意味著,大量長期閑置的“僵尸專家”成了模型參數虛高的主要推手——它們幾乎不干活,卻依然在每一次推理中被加載、被維護、被計費。



MoE模型訓練過程中存在專家訓練不均衡問題

由此,“算力通脹”問題就不得不重視起來。參數規模在膨脹,推理鏈條在拉長,但單位算力產出的真實智能卻在稀釋。當OpenClaw這樣的執行端開始規模化部署,這種“通脹”帶來的成本壓力被成倍放大——每一次物理動作背后,都是大量的Token在燃燒。

今天,YuanLab.ai團隊已經敏銳地捕捉到這一趨勢的不可持續性。在此前發布的Yuan 3.0 Flash中,他們就首次驗證了“反過度思考”的技術可行性,通過RIRM(Reflection Inhibition Reward Mechanism,反思抑制獎勵)機制讓模型學會在恰當的時候停下來。直到Yuan 3.0 Ultra的開源,這一理念進一步從“效率優化”升維為“范式定義”——當行業還在比拼誰能堆出更大模型時,真正的競爭已悄然轉向誰能用更少的算力提煉出更有效的智能。



是時候對“萬億參數”祛魅了

客觀而言,Yuan 3.0 Ultra的突破性,不在于它邁入了萬億俱樂部,而在于它對“萬億參數”這一概念本身完成了一次徹底的“祛魅”。

其一,對“參數規?!钡撵铟龋篖AEP算法讓模型學會“精簡”。

行業長期存在一個思維定式:參數越多,模型越強。這一認知如此根深蒂固,以至于每當有廠商發布更大參數的模型,資本市場都會給出積極反饋。

Yuan 3.0 Ultra用自適應專家裁剪算法(Layer-Adaptive Expert Pruning,LAEP)戳破了這一神話。研究團隊發現,MoE模型在預訓練中會自然形成專家功能分化,但分化不等于優化——大量低貢獻專家長期閑置,卻依然消耗著寶貴的算力資源。LAEP算法的精妙之處,就在于它像一位清醒的“組織優化顧問”,在訓練過程中動態識別冗余專家并予以裁剪,將初始1515B參數優化至1010B,參數規模減小33.3%,預訓練算力效率反而提升49%。



Yuan3.0 Ultra采用LAEP顯著提升預訓練效率

對于企業而言,這意味著可以用更低的硬件門檻、更少的GPU租賃開支,獲得與1515B參數模型同等的旗艦級智能支撐。那么,當別人還在為參數規模競賽買單時,Yuan 3.0 Ultra的用戶就已經在享受“減重”后的成本紅利了。

二、對“思維鏈長度”的祛魅:RIRM機制讓模型懂得“停”的智慧。

當全行業沉迷于“讓模型想得更久”,一個根本性問題卻被忽略了:什么時候該停下來?——這不僅是效率問題,更是安全問題。

試想一下,一個由OpenClaw驅動的工業機器人,如果它的“大腦”在識別到安全隱患后還要反復思考、再三確認,哪怕只是幾秒鐘的延遲,都可能釀成事故。在真實世界中,“想太多”和“想錯”一樣危險。

對此,Yuan 3.0 Ultra引入的反思抑制獎勵機制(RIRM),恰恰是對“長思維鏈崇拜”的一次精準糾偏。它不是簡單粗暴地截斷輸出,而是通過強化學習訓練,讓模型學會區分兩種狀態:什么時候需要繼續推理,什么時候已經可以停止。研究團隊將最大可接受反思步數設為3,理想狀態下鼓勵直接響應,復雜問題允許適度反思,但一旦超過閾值,獎勵機制就會啟動抑制。



RIRM工作流程示意

由此,訓練準確率提升16.33%,同時平均響應長度縮短14.38%。在MATH-500基準上,反思階段的Token消耗顯著降低。這種“該停就?!钡哪芰?,在企業高頻調用場景中產生的價值,遠大于在單一benchmark上刷出0.1%的提升。當每一次API調用都在為企業省錢,而不是為模型的“內心戲”買單,規?;瘧貌耪嬲蔀榭赡?。



RIRM訓練前后Token消耗對比

三、對“多模態”的祛魅:LFA機制讓模型專注“有效關聯”。

多模態是AI行業長期以來的另一大熱詞。但多模態不是簡單的圖文拼接,更不是把圖片和文字扔進同一個模型就萬事大吉。企業在真實業務場景中的多模態,往往是財報里圖文混排的復雜表格,是合同中穿插的掃描件和手寫批注,是技術文檔里跨頁面關聯的圖表和數據。因此,處理這些信息,需要的不是“什么都能看”的泛泛能力,而是“能看懂重點”的精準穿透力。

Yuan 3.0 Ultra引入的局部過濾注意力機制(Localized Filtering-based Attention,LFA),正是為此而生。它通過強化對核心語義的聚焦,精準過濾無效注意力干擾,使模型在處理復雜文檔時,不再被噪聲信息誤導。這種對“有效信息”的聚焦能力,讓OpenClaw這樣的Agent在執行具體任務時,能夠真正理解“該看什么”“該忽略什么”,從而實現“眼睛”與“大腦”的協同進化。

總的來說,這三重“祛魅”共同指向的,正是Yuan 3.0 Ultra的核心主張:有效智能。站在企業的視角,“有效智能”不是一句口號,而是可以量化的ROI,接下來可以用更低的成本投入來獲取更好的AI智能服務。這意味著,企業不再需要為“聽起來很?!钡膮蒂I單,而是為“用得上”的智能付費。

大模型競爭的下半場已經開啟了

隨著市場對“有效智能”的聚焦,就意味著大模型競爭的下半場已經拉開序幕。那么,當頭部廠商紛紛收緊模型權限、構建封閉生態時,YuanLab.ai團隊卻選擇以開放姿態貢獻出萬億級核心模型,其背后的本質則是在參與定義大模型競爭的下半場。

回顧上半場,核心是“參數競賽”——誰先達到千億、萬億,誰就是技術領先者。誰在榜單上刷出更高分數,誰就能獲得資本和市場的追捧。

這一階段的邏輯簡單直接,但也迅速觸及天花板——參數堆砌的邊際收益遞減,而邊際成本(算力、能耗、部署難度)卻在指數級上升。2025年底開始,越來越多的從業者意識到,單純比拼參數規模,已經難以為繼。

展望下半場,核心則是“效率競賽”——誰能用更少的算力實現同等的智能,誰能用更可控的成本支撐復雜的Agent任務,誰才是真正的產業賦能者。這場競賽不再有簡單的量化指標,而是考驗對模型架構的深刻理解、對算法效率的系統優化、對企業場景的精準適配。



Yuan 3.0整體架構和基于MoE的語言主干

在下半場,智能的純度,遠比參數的個數更重要;思考的效率,遠比思考的長度更值錢。由此,Yuan 3.0 Ultra通過LAEP、RIRM、LFA等創新,系統性地解答了“智能的效率”這一核心命題,為行業樹立了有效智能的新標桿。

更深層看,Yuan 3.0 Ultra開源的戰略價值還在于,為中小企業、研究機構和行業開發者提供了一個旗艦級、可定制、不鎖死的模型底座選擇?,F如今,開發者們已經可以在github項目開源地址https://github.com/Yuan-lab-LLM/Yuan3.0獲取相應的能力。

當OpenClaw這樣的Agent框架日益成熟,企業最需要的恰恰是一個能夠深度適配自身業務且成本可控的“大腦”。Yuan 3.0 Ultra的開源,本質上是在為下一波Agent應用大爆發鋪設基礎設施——讓所有想要“養龍蝦”的企業甚至是個人,都能負擔得起一個聰明的大腦。

結語

2026年,當“養龍蝦”成為全民話題,當Agent開始真正進入千行百業,我們比任何時候都更需要回答那個根本問題:什么樣的智能,才是值得企業付費的智能?

答案是,有效的智能。當行業終于意識到,真正的智能,不是無限燃燒算力的能力,而是善用算力的智慧——這時候,大模型的下半場就算真正開始了。新的增長邏輯,正在被重新定義,并主導下半場的競爭。

*本文圖片均來源于網絡

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
2026-04-02 21:52:49
智能相對論 incentive-icons
智能相對論
智能和車,邊評邊測;未來和家,且品且鑒
2489文章數 2411關注度
往期回顧 全部

科技要聞

三年虧20億,最新估值58億,Xreal沖刺港股

頭條要聞

張雪妻子:近兩年才還清所有私人欠款 我不是好命的人

頭條要聞

張雪妻子:近兩年才還清所有私人欠款 我不是好命的人

體育要聞

邵佳一的改革,從讓每個人踢舒服開始

娛樂要聞

宋寧峰帶女兒出軌,張婉婷找董璇哭訴

財經要聞

市場被特朗普一句話打醒 滯脹交易回歸

汽車要聞

軸距2米7/后排能蹺腿 試駕后驅小車QQ3 EV

態度原創

藝術
手機
數碼
健康
教育

藝術要聞

故人西辭黃鶴樓,煙花三月下揚州

手機要聞

首銷即爆單!華為暢享90系全渠道開售,8500mAh巨鯨電池 +國補低價

數碼要聞

京東京造推出“黃金氣囊手機磁吸支架”,1199元

干細胞抗衰4大誤區,90%的人都中招

教育要聞

熱門片區門檻提高!成都家長們,請留意今年這些入學政策變化

無障礙瀏覽 進入關懷版