![]()
出品|虎嗅科技組
作者|宋思杭
編輯|苗正卿
頭圖|中關(guān)村論壇現(xiàn)場(chǎng)
上一次智譜AI與月之暗面同臺(tái),還是在1月10日。那天是智譜通過(guò)港交所聆訊后的第三天,一個(gè)周六,在中關(guān)村國(guó)際創(chuàng)新中心舉行了一場(chǎng)名為AGI-Next的前言峰會(huì)。
兩個(gè)半月后,故事推進(jìn)得更快了。
市場(chǎng)消息顯示,月之暗面正考慮在香港進(jìn)行首次公司募股(IPO),目前已與中金公司及高盛展開(kāi)磋商,相關(guān)事件仍處于初期階段,具體時(shí)間尚未確定。對(duì)此,虎嗅向月之暗面方面求證,對(duì)方不予置評(píng)。
幾乎在同一時(shí)間,兩家公司再次同臺(tái),還是中關(guān)村國(guó)際創(chuàng)新中心,在中關(guān)村論壇的現(xiàn)場(chǎng)。
![]()
臺(tái)上坐著的,是這一輪大模型浪潮中最核心的一批玩家:月之暗面創(chuàng)始人楊植麟、智譜CEO張鵬、無(wú)問(wèn)芯穹創(chuàng)始人夏立雪、小米MiMo負(fù)責(zé)人羅福莉,以及香港大學(xué)助理教授黃超。
他們討論的,是最近一個(gè)月,讓整個(gè)行業(yè)“重新忙起來(lái)”的那只龍蝦OpenClaw。
過(guò)去一個(gè)月,這只“龍蝦”幾乎把大模型的調(diào)用曲線重新拉了一遍。包括智譜、Kimi,以及小米MiMo在內(nèi)的多家模型廠商,都在這一波中吃到了最直接的紅利。
3月下旬,在全球最大的模型API聚合平臺(tái)OpenRouter上,一款代號(hào)為 Hunter Alpha 的模型調(diào)用量迅速?zèng)_上榜首。隨后小米認(rèn)領(lǐng),這一模型正是MiMo-V2-Pro。
更重要的是,龍蝦帶來(lái)的,并不只是調(diào)用量的暴漲。它讓行業(yè)清晰地看到:大模型開(kāi)始“干活”之后,一整套新的技術(shù)與商業(yè)邏輯,正在被同時(shí)改寫(xiě)。
這場(chǎng)討論,指向的是推理階段正在出現(xiàn)的幾條新分水嶺。
1、模型開(kāi)始承擔(dān)“完整任務(wù)鏈路”
首先,在這場(chǎng)對(duì)話中,點(diǎn)出了這只龍蝦的價(jià)值,首先是幾位模型玩家對(duì)它的定義,以及它能帶來(lái)什么。
過(guò)去,用戶是給大模型提問(wèn)題,大模型還無(wú)法幫用戶做任務(wù),或者說(shuō)過(guò)去的那條鏈路是斷的。
而現(xiàn)在,OpenClaw帶來(lái)的最大變化,是把模型拉進(jìn)了任務(wù)執(zhí)行環(huán)節(jié)。用戶給出的不再是問(wèn)題,而是目標(biāo);系統(tǒng)需要完成拆解、嘗試、修正和交付。
在張鵬的定義里,它更像一個(gè)“腳手架”——普通人可以在其上調(diào)用頂級(jí)模型,完成完整任務(wù)鏈路。用戶與模型的關(guān)系,也從“提問(wèn)—回答”,轉(zhuǎn)向“目標(biāo)—執(zhí)行—迭代”。
這直接改變了評(píng)價(jià)方式。單輪回答已經(jīng)不重要,關(guān)鍵在于復(fù)雜任務(wù)能否穩(wěn)定收斂。模型第一次被放進(jìn)交付結(jié)果的語(yǔ)境里。隨之出現(xiàn)的,是“慢”的感知。系統(tǒng)在做規(guī)劃、調(diào)度和試錯(cuò),這些都在消耗時(shí)間,也在堆疊能力。
2、繼“水電煤”之后,Token開(kāi)始具備生產(chǎn)力屬性
一個(gè)被反復(fù)提及的信號(hào)是:Token正在失控式增長(zhǎng)。
夏立雪提到,公司Token用量從1月底開(kāi)始,每?jī)芍芊槐叮欢贏gent場(chǎng)景下,單個(gè)任務(wù)的Token消耗,是傳統(tǒng)問(wèn)答的10倍甚至100倍。
過(guò)去,在大模型對(duì)話問(wèn)答時(shí)代,Token消耗量低,普通用戶免費(fèi)就能用得AI。但龍蝦出現(xiàn)之后,這個(gè)共識(shí)被推翻了。Token用量在短時(shí)間內(nèi)呈指數(shù)增長(zhǎng),已經(jīng)成為新的共識(shí)。Agent任務(wù)的消耗量,遠(yuǎn)高于傳統(tǒng)對(duì)話。
但Token不再只是成本指標(biāo)。它對(duì)應(yīng)的是規(guī)劃、執(zhí)行、調(diào)用工具的全過(guò)程,接近一種“機(jī)器工時(shí)”。這會(huì)重塑價(jià)格體系。成本上升不再是單純壓力,而是和任務(wù)價(jià)值綁定,成為新的定價(jià)基礎(chǔ)。
3、從訓(xùn)練時(shí)代,快進(jìn)到推理時(shí)代
簡(jiǎn)單來(lái)說(shuō),在智譜、MiniMax等大模型公司還未上市的時(shí)間段里,“訓(xùn)練”依然是主流。但龍蝦的出現(xiàn),一下加速了推理時(shí)代的到來(lái)。
而具體來(lái)解釋,隨著任務(wù)復(fù)雜度上升,Context長(zhǎng)度正在迅速拉長(zhǎng)到1M甚至10M級(jí)別。這迫使廠商開(kāi)始在推理側(cè)做結(jié)構(gòu)創(chuàng)新,例如:Hybrid架構(gòu)、Linear Attention、Long Context Efficient設(shè)計(jì)。
這些創(chuàng)新架構(gòu)的核心目的只有一個(gè),就是如何在更長(zhǎng)Context下,把成本打下來(lái)、把穩(wěn)定性提上去。
這也意味著競(jìng)爭(zhēng)維度在下沉:從模型參數(shù)規(guī)模,轉(zhuǎn)向推理效率、系統(tǒng)調(diào)度,甚至能源成本。
4、系統(tǒng)能力開(kāi)始抵消模型差距
在Agent框架下,模型之間的能力差距被部分壓縮。通過(guò)Skill和工具組合,次頂級(jí)模型也能完成復(fù)雜任務(wù)。
在這個(gè)時(shí)候,用戶關(guān)注點(diǎn)隨之變化,更看重任務(wù)結(jié)果,而非模型本身的指標(biāo)。
參與門檻也在降低。構(gòu)建能力逐漸向系統(tǒng)工程傾斜,而不再局限于算法本身。
以下是月之暗面創(chuàng)始人楊植麟、智譜CEO張鵬、無(wú)問(wèn)芯穹創(chuàng)始人夏立雪、小米MiMo負(fù)責(zé)人羅福莉,以及香港大學(xué)助理教授黃超的精選部分對(duì)話:
楊植麟:現(xiàn)在最火的無(wú)疑就是openclaw,大家在日常使用或者類似產(chǎn)品時(shí),覺(jué)得什么最有想象力或印象深刻?我們從技術(shù)角度,先請(qǐng)張鵬談?wù)剬?duì)openclaw和相關(guān)Agent的看法。
張鵬:我把它稱作一個(gè)“腳手架”。它提供了在模型基礎(chǔ)上搭建非常牢固、方便且靈活的可能性。普通人可以極低門檻地使用頂尖模型,尤其是編程和整體能力。以前想法受限于不會(huì)編程等技能,現(xiàn)在通過(guò)簡(jiǎn)單交流就能完成,這是一個(gè)非常大的突破。
夏立雪:我最開(kāi)始用不太適應(yīng),習(xí)慣了聊天式交互,感覺(jué)openclaw很慢。后來(lái)發(fā)現(xiàn)它其實(shí)是能幫我完成大型任務(wù)的。從按Token聊天到現(xiàn)在能完成任務(wù)的Agent,想象力空間提升了,但對(duì)系統(tǒng)能力要求也變大了,這就是為什么一開(kāi)始會(huì)覺(jué)得卡。
作為基礎(chǔ)設(shè)施廠商,我看到的是機(jī)遇和挑戰(zhàn)。我們的資源要支撐起這個(gè)快速增長(zhǎng)的時(shí)代。比如我們公司從1月底開(kāi)始,每?jī)芍躎oken量翻一番。現(xiàn)在的Token用量就像當(dāng)年100兆手機(jī)流量的時(shí)代。我們需要更好的優(yōu)化和整合,讓每一個(gè)鮮活的人都能用起來(lái)。這對(duì)整個(gè)社區(qū)是巨大的優(yōu)化空間。
羅福莉:我認(rèn)為openclaw是一個(gè)非常革命性和顛覆性的事件。雖然深度Coding的人首選可能還是Code,但用過(guò)openclaw的人會(huì)感受到它在Agent框架設(shè)計(jì)上是領(lǐng)先于Code的,Code的最新更新其實(shí)都在向openclaw靠近。
它給我的最大價(jià)值在于“開(kāi)源”:這有利于社區(qū)深入?yún)⑴c。它把國(guó)內(nèi)次頂級(jí)閉源模型的上限拉得非常高,在絕大部分場(chǎng)景下任務(wù)完成度已非常接近最新模型,同時(shí)又靠Skill體系保證了下限。
此外,它點(diǎn)燃了大家的想象力。大家發(fā)現(xiàn)大模型外的Agent層有巨大空間,更多人,不僅是研究員,開(kāi)始參與AGI變革,這在一定程度上替代了重復(fù)工作,釋放了時(shí)間去做更有想象力的事。
黃超:首先是從交互模式上,openclaw給了大家一種“更有活人感”的體驗(yàn)。之前的Agent工具感更強(qiáng),而openclaw以“軟件切入”的方式,更接近大家想象中的個(gè)人賈維斯(J.A.R.V.I.S.)。
其次,它證明了架構(gòu)Agent的框架可以既簡(jiǎn)單又高效。它讓我們重新思考:是否需要一個(gè)All in one的超級(jí)智能體,還是需要一個(gè)輕量級(jí)操作系統(tǒng)或腳手架式的小管家?它讓大家更有“玩起來(lái)”的心態(tài),撬動(dòng)生態(tài)里的所有工具,通過(guò)Skills或Tool的設(shè)計(jì),賦能各行各業(yè)。
楊植麟:順著剛才大家一直在討論 OpenClaw,我也想接著問(wèn)張鵬一個(gè)問(wèn)題。智譜最近發(fā)布了新的GLM Turbo模型,這個(gè)模型在相關(guān)能力上也做了很大的增強(qiáng)。能否介紹一下新舊模型的不同?以及觀察到的提價(jià)策略反映了什么市場(chǎng)情況?
張鵬:發(fā)布Turbo主要是為了從“簡(jiǎn)單的對(duì)話”轉(zhuǎn)向“干活”。openclaw讓大家看到大模型能干活,但干活背后的Token消耗非常高,需要規(guī)劃、嘗試、Debug、處理模糊需求。Turbo在這些方面做了優(yōu)化,本質(zhì)上是多智能體協(xié)同架構(gòu),但在能力上有偏向性加強(qiáng)。
關(guān)于提價(jià),因?yàn)楦苫钕牡腡oken量是簡(jiǎn)單問(wèn)答的10倍甚至100倍,成本大幅提高。長(zhǎng)期低價(jià)競(jìng)爭(zhēng)不利于行業(yè)發(fā)展,調(diào)整價(jià)格是為了回歸正常的商業(yè)價(jià)值,讓我們能持續(xù)優(yōu)化模型,提供更好的服務(wù)。
![]()
楊植麟:小米最近通過(guò)發(fā)布新模型和開(kāi)源技術(shù)對(duì)社區(qū)做出了貢獻(xiàn),小米做大模型有什么獨(dú)特優(yōu)勢(shì)?
羅福莉:我想先不談小米的獨(dú)特優(yōu)勢(shì),而是談?wù)勚袊?guó)大模型團(tuán)隊(duì)的優(yōu)勢(shì)。
兩年前,中國(guó)團(tuán)隊(duì)在算力受限,尤其是互聯(lián)帶寬受限的情況下,做出了突破:在低端算力限制下,通過(guò)模型結(jié)構(gòu)創(chuàng)新(如DPCV3、M1、MA等)去追求最高效率。這給了我們勇氣和信心。
雖然現(xiàn)在國(guó)產(chǎn)芯片不再受限,但這種對(duì)高效率、低推理成本的探索依然重要。例如,現(xiàn)在的Hybrid、SPA、Linear attention結(jié)構(gòu)等。
為什么結(jié)構(gòu)創(chuàng)新重要?因?yàn)閛penclaw越用越聰明的前提是推理Context。現(xiàn)在的難題是:怎么在1M或10M的長(zhǎng)上下文下,做到成本夠低、速度夠快?只有這樣,才能激發(fā)高生產(chǎn)力任務(wù),實(shí)現(xiàn)模型自迭代,在復(fù)雜環(huán)境中依靠超長(zhǎng)Context完成自我進(jìn)化。
我們現(xiàn)在正在探索Long Context Efficient架構(gòu),以及如何在真實(shí)長(zhǎng)距離任務(wù)上做到穩(wěn)定和高上限。
更長(zhǎng)期看,隨著推理需求爆發(fā),今年可能增長(zhǎng)100倍,競(jìng)爭(zhēng)維度將下探到算力、推理芯片甚至能源層面。
本文來(lái)自虎嗅,原文鏈接:https://www.huxiu.com/article/4846022.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.