網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

“龍蝦”出現(xiàn)后，大模型時(shí)代的共識(shí)被推翻了

2026-03-28 02:41:40　來(lái)源: 虎嗅APP

北京舉報(bào)

分享至

出品｜虎嗅科技組

作者｜宋思杭

編輯｜苗正卿

頭圖｜中關(guān)村論壇現(xiàn)場(chǎng)

上一次智譜AI與月之暗面同臺(tái)，還是在1月10日。那天是智譜通過(guò)港交所聆訊后的第三天，一個(gè)周六，在中關(guān)村國(guó)際創(chuàng)新中心舉行了一場(chǎng)名為AGI-Next的前言峰會(huì)。

兩個(gè)半月后，故事推進(jìn)得更快了。

市場(chǎng)消息顯示，月之暗面正考慮在香港進(jìn)行首次公司募股（IPO），目前已與中金公司及高盛展開(kāi)磋商，相關(guān)事件仍處于初期階段，具體時(shí)間尚未確定。對(duì)此，虎嗅向月之暗面方面求證，對(duì)方不予置評(píng)。

幾乎在同一時(shí)間，兩家公司再次同臺(tái)，還是中關(guān)村國(guó)際創(chuàng)新中心，在中關(guān)村論壇的現(xiàn)場(chǎng)。

臺(tái)上坐著的，是這一輪大模型浪潮中最核心的一批玩家：月之暗面創(chuàng)始人楊植麟、智譜CEO張鵬、無(wú)問(wèn)芯穹創(chuàng)始人夏立雪、小米MiMo負(fù)責(zé)人羅福莉，以及香港大學(xué)助理教授黃超。

他們討論的，是最近一個(gè)月，讓整個(gè)行業(yè)“重新忙起來(lái)”的那只龍蝦OpenClaw。

過(guò)去一個(gè)月，這只“龍蝦”幾乎把大模型的調(diào)用曲線重新拉了一遍。包括智譜、Kimi，以及小米MiMo在內(nèi)的多家模型廠商，都在這一波中吃到了最直接的紅利。

3月下旬，在全球最大的模型API聚合平臺(tái)OpenRouter上，一款代號(hào)為 Hunter Alpha 的模型調(diào)用量迅速?zèng)_上榜首。隨后小米認(rèn)領(lǐng)，這一模型正是MiMo-V2-Pro。

更重要的是，龍蝦帶來(lái)的，并不只是調(diào)用量的暴漲。它讓行業(yè)清晰地看到：大模型開(kāi)始“干活”之后，一整套新的技術(shù)與商業(yè)邏輯，正在被同時(shí)改寫(xiě)。

這場(chǎng)討論，指向的是推理階段正在出現(xiàn)的幾條新分水嶺。

1、模型開(kāi)始承擔(dān)“完整任務(wù)鏈路”

首先，在這場(chǎng)對(duì)話中，點(diǎn)出了這只龍蝦的價(jià)值，首先是幾位模型玩家對(duì)它的定義，以及它能帶來(lái)什么。

過(guò)去，用戶是給大模型提問(wèn)題，大模型還無(wú)法幫用戶做任務(wù)，或者說(shuō)過(guò)去的那條鏈路是斷的。

而現(xiàn)在，OpenClaw帶來(lái)的最大變化，是把模型拉進(jìn)了任務(wù)執(zhí)行環(huán)節(jié)。用戶給出的不再是問(wèn)題，而是目標(biāo)；系統(tǒng)需要完成拆解、嘗試、修正和交付。

在張鵬的定義里，它更像一個(gè)“腳手架”——普通人可以在其上調(diào)用頂級(jí)模型，完成完整任務(wù)鏈路。用戶與模型的關(guān)系，也從“提問(wèn)—回答”，轉(zhuǎn)向“目標(biāo)—執(zhí)行—迭代”。

這直接改變了評(píng)價(jià)方式。單輪回答已經(jīng)不重要，關(guān)鍵在于復(fù)雜任務(wù)能否穩(wěn)定收斂。模型第一次被放進(jìn)交付結(jié)果的語(yǔ)境里。隨之出現(xiàn)的，是“慢”的感知。系統(tǒng)在做規(guī)劃、調(diào)度和試錯(cuò)，這些都在消耗時(shí)間，也在堆疊能力。

2、繼“水電煤”之后，Token開(kāi)始具備生產(chǎn)力屬性

一個(gè)被反復(fù)提及的信號(hào)是：Token正在失控式增長(zhǎng)。

夏立雪提到，公司Token用量從1月底開(kāi)始，每?jī)芍芊槐叮欢贏gent場(chǎng)景下，單個(gè)任務(wù)的Token消耗，是傳統(tǒng)問(wèn)答的10倍甚至100倍。

過(guò)去，在大模型對(duì)話問(wèn)答時(shí)代，Token消耗量低，普通用戶免費(fèi)就能用得AI。但龍蝦出現(xiàn)之后，這個(gè)共識(shí)被推翻了。Token用量在短時(shí)間內(nèi)呈指數(shù)增長(zhǎng)，已經(jīng)成為新的共識(shí)。Agent任務(wù)的消耗量，遠(yuǎn)高于傳統(tǒng)對(duì)話。

但Token不再只是成本指標(biāo)。它對(duì)應(yīng)的是規(guī)劃、執(zhí)行、調(diào)用工具的全過(guò)程，接近一種“機(jī)器工時(shí)”。這會(huì)重塑價(jià)格體系。成本上升不再是單純壓力，而是和任務(wù)價(jià)值綁定，成為新的定價(jià)基礎(chǔ)。

3、從訓(xùn)練時(shí)代，快進(jìn)到推理時(shí)代

簡(jiǎn)單來(lái)說(shuō)，在智譜、MiniMax等大模型公司還未上市的時(shí)間段里，“訓(xùn)練”依然是主流。但龍蝦的出現(xiàn)，一下加速了推理時(shí)代的到來(lái)。

而具體來(lái)解釋，隨著任務(wù)復(fù)雜度上升，Context長(zhǎng)度正在迅速拉長(zhǎng)到1M甚至10M級(jí)別。這迫使廠商開(kāi)始在推理側(cè)做結(jié)構(gòu)創(chuàng)新，例如：Hybrid架構(gòu)、Linear Attention、Long Context Efficient設(shè)計(jì)。

這些創(chuàng)新架構(gòu)的核心目的只有一個(gè)，就是如何在更長(zhǎng)Context下，把成本打下來(lái)、把穩(wěn)定性提上去。

這也意味著競(jìng)爭(zhēng)維度在下沉：從模型參數(shù)規(guī)模，轉(zhuǎn)向推理效率、系統(tǒng)調(diào)度，甚至能源成本。

4、系統(tǒng)能力開(kāi)始抵消模型差距

在Agent框架下，模型之間的能力差距被部分壓縮。通過(guò)Skill和工具組合，次頂級(jí)模型也能完成復(fù)雜任務(wù)。

在這個(gè)時(shí)候，用戶關(guān)注點(diǎn)隨之變化，更看重任務(wù)結(jié)果，而非模型本身的指標(biāo)。

參與門檻也在降低。構(gòu)建能力逐漸向系統(tǒng)工程傾斜，而不再局限于算法本身。

以下是月之暗面創(chuàng)始人楊植麟、智譜CEO張鵬、無(wú)問(wèn)芯穹創(chuàng)始人夏立雪、小米MiMo負(fù)責(zé)人羅福莉，以及香港大學(xué)助理教授黃超的精選部分對(duì)話：

楊植麟：現(xiàn)在最火的無(wú)疑就是openclaw，大家在日常使用或者類似產(chǎn)品時(shí)，覺(jué)得什么最有想象力或印象深刻？我們從技術(shù)角度，先請(qǐng)張鵬談?wù)剬?duì)openclaw和相關(guān)Agent的看法。

張鵬：我把它稱作一個(gè)“腳手架”。它提供了在模型基礎(chǔ)上搭建非常牢固、方便且靈活的可能性。普通人可以極低門檻地使用頂尖模型，尤其是編程和整體能力。以前想法受限于不會(huì)編程等技能，現(xiàn)在通過(guò)簡(jiǎn)單交流就能完成，這是一個(gè)非常大的突破。

夏立雪：我最開(kāi)始用不太適應(yīng)，習(xí)慣了聊天式交互，感覺(jué)openclaw很慢。后來(lái)發(fā)現(xiàn)它其實(shí)是能幫我完成大型任務(wù)的。從按Token聊天到現(xiàn)在能完成任務(wù)的Agent，想象力空間提升了，但對(duì)系統(tǒng)能力要求也變大了，這就是為什么一開(kāi)始會(huì)覺(jué)得卡。

作為基礎(chǔ)設(shè)施廠商，我看到的是機(jī)遇和挑戰(zhàn)。我們的資源要支撐起這個(gè)快速增長(zhǎng)的時(shí)代。比如我們公司從1月底開(kāi)始，每?jī)芍躎oken量翻一番。現(xiàn)在的Token用量就像當(dāng)年100兆手機(jī)流量的時(shí)代。我們需要更好的優(yōu)化和整合，讓每一個(gè)鮮活的人都能用起來(lái)。這對(duì)整個(gè)社區(qū)是巨大的優(yōu)化空間。

羅福莉：我認(rèn)為openclaw是一個(gè)非常革命性和顛覆性的事件。雖然深度Coding的人首選可能還是Code，但用過(guò)openclaw的人會(huì)感受到它在Agent框架設(shè)計(jì)上是領(lǐng)先于Code的，Code的最新更新其實(shí)都在向openclaw靠近。

它給我的最大價(jià)值在于“開(kāi)源”：這有利于社區(qū)深入?yún)⑴c。它把國(guó)內(nèi)次頂級(jí)閉源模型的上限拉得非常高，在絕大部分場(chǎng)景下任務(wù)完成度已非常接近最新模型，同時(shí)又靠Skill體系保證了下限。

此外，它點(diǎn)燃了大家的想象力。大家發(fā)現(xiàn)大模型外的Agent層有巨大空間，更多人，不僅是研究員，開(kāi)始參與AGI變革，這在一定程度上替代了重復(fù)工作，釋放了時(shí)間去做更有想象力的事。

黃超：首先是從交互模式上，openclaw給了大家一種“更有活人感”的體驗(yàn)。之前的Agent工具感更強(qiáng)，而openclaw以“軟件切入”的方式，更接近大家想象中的個(gè)人賈維斯（J.A.R.V.I.S.）。

其次，它證明了架構(gòu)Agent的框架可以既簡(jiǎn)單又高效。它讓我們重新思考：是否需要一個(gè)All in one的超級(jí)智能體，還是需要一個(gè)輕量級(jí)操作系統(tǒng)或腳手架式的小管家？它讓大家更有“玩起來(lái)”的心態(tài)，撬動(dòng)生態(tài)里的所有工具，通過(guò)Skills或Tool的設(shè)計(jì)，賦能各行各業(yè)。

楊植麟：順著剛才大家一直在討論 OpenClaw，我也想接著問(wèn)張鵬一個(gè)問(wèn)題。智譜最近發(fā)布了新的GLM Turbo模型，這個(gè)模型在相關(guān)能力上也做了很大的增強(qiáng)。能否介紹一下新舊模型的不同？以及觀察到的提價(jià)策略反映了什么市場(chǎng)情況？

張鵬：發(fā)布Turbo主要是為了從“簡(jiǎn)單的對(duì)話”轉(zhuǎn)向“干活”。openclaw讓大家看到大模型能干活，但干活背后的Token消耗非常高，需要規(guī)劃、嘗試、Debug、處理模糊需求。Turbo在這些方面做了優(yōu)化，本質(zhì)上是多智能體協(xié)同架構(gòu)，但在能力上有偏向性加強(qiáng)。

關(guān)于提價(jià)，因?yàn)楦苫钕牡腡oken量是簡(jiǎn)單問(wèn)答的10倍甚至100倍，成本大幅提高。長(zhǎng)期低價(jià)競(jìng)爭(zhēng)不利于行業(yè)發(fā)展，調(diào)整價(jià)格是為了回歸正常的商業(yè)價(jià)值，讓我們能持續(xù)優(yōu)化模型，提供更好的服務(wù)。

楊植麟：小米最近通過(guò)發(fā)布新模型和開(kāi)源技術(shù)對(duì)社區(qū)做出了貢獻(xiàn)，小米做大模型有什么獨(dú)特優(yōu)勢(shì)？

羅福莉：我想先不談小米的獨(dú)特優(yōu)勢(shì)，而是談?wù)勚袊?guó)大模型團(tuán)隊(duì)的優(yōu)勢(shì)。

兩年前，中國(guó)團(tuán)隊(duì)在算力受限，尤其是互聯(lián)帶寬受限的情況下，做出了突破：在低端算力限制下，通過(guò)模型結(jié)構(gòu)創(chuàng)新（如DPCV3、M1、MA等）去追求最高效率。這給了我們勇氣和信心。

雖然現(xiàn)在國(guó)產(chǎn)芯片不再受限，但這種對(duì)高效率、低推理成本的探索依然重要。例如，現(xiàn)在的Hybrid、SPA、Linear attention結(jié)構(gòu)等。

為什么結(jié)構(gòu)創(chuàng)新重要？因?yàn)閛penclaw越用越聰明的前提是推理Context。現(xiàn)在的難題是：怎么在1M或10M的長(zhǎng)上下文下，做到成本夠低、速度夠快？只有這樣，才能激發(fā)高生產(chǎn)力任務(wù)，實(shí)現(xiàn)模型自迭代，在復(fù)雜環(huán)境中依靠超長(zhǎng)Context完成自我進(jìn)化。

我們現(xiàn)在正在探索Long Context Efficient架構(gòu)，以及如何在真實(shí)長(zhǎng)距離任務(wù)上做到穩(wěn)定和高上限。

更長(zhǎng)期看，隨著推理需求爆發(fā)，今年可能增長(zhǎng)100倍，競(jìng)爭(zhēng)維度將下探到算力、推理芯片甚至能源層面。

本文來(lái)自虎嗅，原文鏈接：https://www.huxiu.com/article/4846022.html?f=wyxwapp

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.