![]()
一個(gè)尚未盈利的AI公司,連續(xù)發(fā)布三個(gè)模型后,不到三個(gè)月,中國前十大互聯(lián)網(wǎng)公司中有九家爭相接入了它。
4月8日,智譜AI在廣州發(fā)布開源大模型GLM-5.1,這是繼2月12日GLM-5、3月16日GLM-5-Turbo之后的第三款模型。三款模型發(fā)布后,一個(gè)有趣的現(xiàn)象反復(fù)出現(xiàn):大量國內(nèi)企業(yè)密集在社交媒體、官網(wǎng)官宣“已接入”,涵蓋互聯(lián)網(wǎng)公司、云服務(wù)商、軟件廠商、芯片企業(yè),大中小皆有。
據(jù)公開信息可查證,GLM-5系列已獲得至少18家企業(yè)的公開接入或適配官宣,覆蓋四個(gè)層級(jí):
互聯(lián)網(wǎng)頭部廠商中,字節(jié)跳動(dòng)(TRAE編程助手)、阿里巴巴(Qoder)、騰訊(CodeBuddy/WorkBuddy全系)、百度(智能云千帆平臺(tái))、美團(tuán)(CatPaw)、快手(萬擎)均已集成。智譜在上市后首份財(cái)報(bào)(3月31日)中明確表示,“GLM-5發(fā)布后24小時(shí)內(nèi)即獲得字節(jié)跳動(dòng)TRAE/扣子Coze、阿里巴巴Qoder、騰訊CodeBuddy、美團(tuán)CatPaw、快手萬擎、百度智能云及WPS Office等頭部平臺(tái)產(chǎn)品的官方接入”,并稱“中國前10大互聯(lián)網(wǎng)公司中已有9家深度集成GLM”。GLM-5.1發(fā)布當(dāng)天,騰訊將CodeBuddy與WorkBuddy全線產(chǎn)品升級(jí)至GLM-5.1,百度宣布完成“Day0全棧適配”,字節(jié)跳動(dòng)TRAE實(shí)現(xiàn)Day0同步首發(fā)。
云服務(wù)商方面,華為云在發(fā)布日當(dāng)天即上線碼道(CodeArts)代碼智能體,用戶激增引發(fā)排隊(duì);金山云于4月10日上線星流平臺(tái);優(yōu)刻得早在GLM-5階段即完成接入。
軟件與硬件廠商中,金山辦公(WPS靈犀)、字節(jié)跳動(dòng)旗下扣子Coze、模型路由平臺(tái)OpenRouter、軟通動(dòng)力(機(jī)械革命“龍蝦盒子”終端首發(fā)搭載GLM-5-Turbo)分別以深度集成、API接入、硬件搭載等方式接入。值得注意的是,WPS靈犀實(shí)際接入時(shí)間(2月12日)早于其官方公告時(shí)間(2月14日),說明部分企業(yè)在正式官宣前已完成技術(shù)對(duì)接。
![]()
最值得關(guān)注的是國產(chǎn)算力芯片的集體“Day0適配”——壁仞科技(壁礪166系列)、海光信息(DCU)、沐曦股份(曦云C系列)、清微智能(TX81 RPU)均在GLM-5.1發(fā)布當(dāng)日宣布完成全量適配,加上全鏈路訓(xùn)練底座華為昇騰910B,構(gòu)成了一條完整的國產(chǎn)算力適配鏈條。
這種景象并不陌生——每當(dāng)國內(nèi)頭部大模型發(fā)布,接入官宣便如約而至。但這一次,官宣的密度和速度明顯高于以往,值得追問:這是模型真的足夠好,還是一場(chǎng)集體營銷?
答案可能兩者都有,但背后折射的是更深層的行業(yè)現(xiàn)實(shí)。GLM-5系列模型的接入潮,恰好是理解“中國大模型走到哪兒了”的一個(gè)切口。
為什么這么多企業(yè)選擇“官宣”接入?
有三條邏輯可以解釋這一現(xiàn)象。
第一,MIT開源協(xié)議大幅降低了接入成本和風(fēng)險(xiǎn)。 從GLM-4.5到GLM-5再到GLM-5.1,智譜的旗艦?zāi)P腿坎捎肕IT協(xié)議開源——可商用、可私有化部署、無使用限制。對(duì)大量中小企業(yè)和政務(wù)機(jī)構(gòu)來說,這是商業(yè)閉源API不可替代的門檻優(yōu)勢(shì):數(shù)據(jù)不必出內(nèi)網(wǎng),合規(guī)風(fēng)險(xiǎn)可控,采購審批更容易過。官宣接入的成本極低,理由卻足夠充分。
第二,編程能力的真實(shí)突破,給了部分企業(yè)接入的產(chǎn)品價(jià)值支撐。 GLM-5.1在SWE-Bench Pro編程測(cè)試中拿到58.4分,超過Claude Opus 4.6(57.3分)和GPT-5.4(57.7分),并首次在該基準(zhǔn)上以國產(chǎn)開源模型身份實(shí)現(xiàn)對(duì)頂級(jí)閉源產(chǎn)品的超越。對(duì)軟件開發(fā)類企業(yè)而言,編程場(chǎng)景的能力提升是看得見的。接入不只是噱頭,至少在編程這一條線上有實(shí)際使用場(chǎng)景。
第三,“接入國產(chǎn)旗艦?zāi)P汀北旧砭哂袪I銷價(jià)值。 在政企采購、融資路演、媒體曝光的語境下,官宣接入頭部大模型是一張門檻不高但信號(hào)價(jià)值明顯的牌。這與模型本身厲不厲害關(guān)系不大——而是中國AI生態(tài)中特有的宣發(fā)慣例。
這三條邏輯,分別對(duì)應(yīng)著技術(shù)、商業(yè)和生態(tài)三個(gè)層面的現(xiàn)實(shí)。要真正理解它們,需要從三個(gè)維度拆開來看:GLM-5.1的技術(shù)到底走到了哪里,開源與閉源的路線之爭走到了哪里,智譜的商業(yè)化走到了哪里。
突破是真實(shí)的,但“偏科”代價(jià)不小
先說真實(shí)的進(jìn)展。
GLM-5.1延續(xù)了GLM-5的MoE架構(gòu):744B總參數(shù)、256專家混合、約44B激活參數(shù),在全鏈路華為昇騰910B上完成訓(xùn)練。嚴(yán)格來說,這不是一次架構(gòu)迭代,而是后訓(xùn)練階段的定向優(yōu)化——在編程和Agent場(chǎng)景加大了強(qiáng)化學(xué)習(xí)權(quán)重。從GLM-5到GLM-5.1,間隔不到八周,迭代速度本身值得肯定。
核心突破集中在兩個(gè)方向。
其一,編程基準(zhǔn)的數(shù)字躍升。 SWE-Bench Pro 58.4分,超越Claude Opus 4.6(57.3分)和GPT-5.4(57.7分),是國產(chǎn)開源模型在這一基準(zhǔn)上的歷史最高分。在Terminal-Bench和NL2Repo兩項(xiàng)代碼評(píng)測(cè)的綜合平均中,GLM-5.1取得全球第三、國產(chǎn)第一、開源第一的排名。
其二,“長程任務(wù)”能力的首次量化驗(yàn)證。 智譜將其定義為模型接收一項(xiàng)任務(wù)后持續(xù)工作數(shù)小時(shí)乃至更久的能力,官方展示了若干案例:模型在無監(jiān)督下完成655輪迭代、超過6000次工具調(diào)用,將向量數(shù)據(jù)庫QPS從3,547提升至21,500;14小時(shí)內(nèi)將GPU計(jì)算內(nèi)核加速35.7倍;8小時(shí)內(nèi)自主搭建出包含窗口管理器、終端模擬器、文件瀏覽器的完整Linux桌面環(huán)境。這種行為模式更接近一個(gè)初級(jí)工程師,而非高級(jí)搜索引擎。
但這里有兩個(gè)必須標(biāo)注的折扣。
折扣一:評(píng)測(cè)體系本身的可信度存疑。 今年3月,AI安全研究機(jī)構(gòu)METR發(fā)布研究指出,SWE-bench系列中被自動(dòng)判定為“通過”的AI代碼方案,約有一半會(huì)被真實(shí)項(xiàng)目維護(hù)者拒絕,自動(dòng)評(píng)測(cè)可能將AI編程能力高估達(dá)7倍。幾乎同期,OpenAI宣布棄用SWE-bench Verified作為評(píng)估標(biāo)準(zhǔn),理由是自動(dòng)評(píng)測(cè)與實(shí)際開發(fā)效能的偏差已不可忽視。GLM-5.1與Claude Opus 4.6之間不到1分的差距,在METR揭示的誤差范圍內(nèi),“全球最強(qiáng)開源模型”的標(biāo)簽需要審慎看待。
折扣二:能力分布極不均勻。 Text Arena第三方競(jìng)技場(chǎng)的細(xì)分排名清楚呈現(xiàn)了代價(jià):編程較前代躍升28名,但醫(yī)療掉24名,法律掉6名,數(shù)學(xué)掉2名。NL2Repo(從零構(gòu)建代碼倉庫)上落后Claude Opus 4.6達(dá)7分(42.7對(duì)49.8)。知乎開發(fā)者“晴天”用閱讀理解、SVG代碼生成等場(chǎng)景做橫向測(cè)試,結(jié)論是GLM-5.1連基本閱讀理解都未達(dá)標(biāo);另一位通過Ollama本地部署的開發(fā)者評(píng)價(jià)“整體不如Qwen3.6-Plus”。這些個(gè)體測(cè)試不代表全貌,但共同指向一個(gè)事實(shí):GLM-5.1是一個(gè)在編程和Agent方向刻意訓(xùn)練、其他領(lǐng)域有所犧牲的“偏科生”。
偏科并不是貶義詞,關(guān)鍵在于“偏的那個(gè)科”值不值得偏。
編程和自主執(zhí)行,目前確實(shí)是AI行業(yè)競(jìng)爭最密集的賽道。但需要清醒認(rèn)識(shí)到,就在GLM-5.1發(fā)布的同一天,Anthropic推出了Mythos Preview——SWE-Bench Pro拿到77.8分,領(lǐng)先GLM-5.1近20分。Mythos暫不公開,但它標(biāo)定了行業(yè)能力的當(dāng)前天花板,也說明競(jìng)爭對(duì)手的儲(chǔ)備遠(yuǎn)比已發(fā)布的產(chǎn)品更深厚。
開源換信任,閉源換安全
GLM-5.1發(fā)布當(dāng)天,發(fā)生了一個(gè)對(duì)比鮮明的時(shí)間巧合。
太平洋彼岸,Anthropic官宣了新一代模型Claude Mythos Preview——但沒有向公眾開放,而是定向提供給蘋果、微軟、谷歌、英偉達(dá)等12家合作伙伴和40余家基礎(chǔ)設(shè)施組織,用于一個(gè)名為“Project Glasswing”的網(wǎng)絡(luò)安全計(jì)劃。
同一天,兩家公司各出一手牌,方向截然相反:一家將模型權(quán)重全量上傳Hugging Face任人下載,另一家主動(dòng)把最強(qiáng)模型鎖進(jìn)了圍墻。
這個(gè)巧合,是當(dāng)前AI行業(yè)最核心路線分歧的縮影。
智譜的開源邏輯,已經(jīng)形成了清晰的商業(yè)飛輪設(shè)計(jì):以MIT協(xié)議開源建立開發(fā)者信任→信任轉(zhuǎn)化為企業(yè)采購時(shí)的優(yōu)先考量→通過API調(diào)用和Agent執(zhí)行收費(fèi)實(shí)現(xiàn)變現(xiàn)。這條路在中國政企市場(chǎng)有結(jié)構(gòu)性優(yōu)勢(shì),數(shù)據(jù)合規(guī)要求高的行業(yè)(金融、政務(wù)、醫(yī)療)對(duì)“數(shù)據(jù)不出內(nèi)網(wǎng)”有剛性需求,閉源API天然無法滿足。
Anthropic的閉源邏輯,則是另一套完全不同的證明路徑:以安全為品牌核心,以能力背書商業(yè)化,通過已驗(yàn)證的企業(yè)服務(wù)口碑拉高定價(jià)。2025年,Anthropic ARR突破300億美元,首次超越OpenAI同期的250億美元——市場(chǎng)在用真金白銀認(rèn)可這套邏輯的合理性。
兩條路哪條更對(duì)?這個(gè)問題可能本身就問錯(cuò)了。更準(zhǔn)確的表述是:兩條路在各自的目標(biāo)市場(chǎng)里,目前都找到了需求錨點(diǎn)。
但兩條路也各有各的真實(shí)風(fēng)險(xiǎn)。
智譜開源路線的隱患在于:開源能贏口碑,未必能贏市場(chǎng)定價(jià)權(quán)。 MIT協(xié)議意味著任何人可以免費(fèi)使用模型權(quán)重,智譜的商業(yè)回報(bào)只能來自服務(wù)層的API和Agent——在一個(gè)主要競(jìng)爭對(duì)手把Token定價(jià)壓到國際競(jìng)品十分之一的市場(chǎng)里,提價(jià)的空間天然受限。另外,GLM-5.1的全鏈路訓(xùn)練深度綁定華為昇騰910B,供應(yīng)鏈集中化風(fēng)險(xiǎn)真實(shí)存在,壁仞科技、海光DCU等廠商雖已完成Day-0適配,但“適配完成”與“好用”之間的距離,仍待真實(shí)業(yè)務(wù)驗(yàn)證。
Anthropic閉源路線的隱患在于:安全約束與實(shí)用能力之間的張力正在顯現(xiàn)。 近期Claude Code陷入“思考深度驟降67%”的爭議——AMD AI總監(jiān)Stella Laurenzo基于6852條會(huì)話日志公開指控其思考深度驟降,暴露了安全護(hù)欄對(duì)模型能力的實(shí)質(zhì)性壓制。閉源路線的代價(jià)是:你為安全交的每一分學(xué)費(fèi),都會(huì)被用戶感知到。
提價(jià)是信號(hào),但盈利拐點(diǎn)仍在遠(yuǎn)處
3月31日,智譜披露上市后首份年報(bào),數(shù)字非常矛盾。
好的一面:2025年收入7.24億元,同比增長132%,在國內(nèi)獨(dú)立大模型廠商中排名第一。API收入暴增292.6%,Agent收入增長248.8%,MaaS平臺(tái)年度經(jīng)常性收入達(dá)17億元,同比飆升60倍。平臺(tái)化轉(zhuǎn)型方向清晰。
難看的一面:凈虧損擴(kuò)大至47.18億元,毛利率從56.3%下滑至41.0%,研發(fā)開支31.80億元是收入的4.4倍,四年累計(jì)虧損約85億元。以約4100億港元市值計(jì)算,市銷率接近500倍——市場(chǎng)幾乎完全在為未來定價(jià),而非為當(dāng)下定價(jià)。對(duì)比參考:騰訊當(dāng)前市銷率約為5倍。
這份年報(bào)發(fā)布后第二天,CEO張鵬在業(yè)績會(huì)上明確將Anthropic列為對(duì)標(biāo)方向,原話是“當(dāng)模型足夠強(qiáng),API本身就是最好的商業(yè)模式”。當(dāng)天股價(jià)大漲31.94%。市場(chǎng)接受了這個(gè)新敘事。
但“中國版Anthropic”的標(biāo)簽,有一道繞不過去的數(shù)字鴻溝需要正視。
Anthropic的ARR是智譜全年總收入的約285倍。千余家年消費(fèi)超百萬美元的企業(yè)客戶,構(gòu)成了Anthropic營收的基本盤——每一家背后是真實(shí)的合同、真實(shí)的工程師使用量和真實(shí)的續(xù)簽率。智譜目前的MaaS ARR 17億元折合約2.3億美元,與Anthropic的體量不在同一量級(jí),這說明“對(duì)標(biāo)”和“追趕到”之間,還有相當(dāng)長的路程。
更值得關(guān)注的是GLM-5.1發(fā)布當(dāng)天的一個(gè)定價(jià)動(dòng)作:智譜逆勢(shì)將API價(jià)格上調(diào)10%,這是年內(nèi)第三次提價(jià)——2026年一季度Token價(jià)格累計(jì)上調(diào)83%,但調(diào)用量反而增長了400%。這組數(shù)字是目前最有力的商業(yè)信號(hào):價(jià)格敏感度不如想象中高,用戶對(duì)能力溢價(jià)有一定接受度。
但提價(jià)的持續(xù)性依賴三個(gè)假設(shè),每個(gè)都有不確定性:
- 能力溢價(jià)是否可持續(xù)? 領(lǐng)先優(yōu)勢(shì)高度集中在編程方向,對(duì)非編程場(chǎng)景并無顯著溢價(jià)支撐。
- 成本能否壓下來? 41%的毛利率意味著盈利拐點(diǎn)仍然很遠(yuǎn)。
- 增速能否維持? 7.24億的基數(shù)放大后,維持130%以上增速的難度將顯著上升。
調(diào)價(jià)后,GLM-5.1在Coding場(chǎng)景緩存命中Token價(jià)格已接近Claude Sonnet 4.6水平——注意,是Sonnet,不是Opus。Claude Opus 4.6的API定價(jià)仍顯著高于智譜。對(duì)企業(yè)用戶而言,同樣的價(jià)格,面臨的是“生態(tài)更成熟的Claude”與“性能接近但確定性存疑的GLM-5.1”之間的權(quán)衡。
從“追趕”進(jìn)入“攻堅(jiān)”階段
回到最初的問題:為什么這么多企業(yè)爭著官宣接入GLM-5.1?
部分原因是這個(gè)模型真的值得評(píng)估,特別是在編程自動(dòng)化場(chǎng)景;部分原因是MIT開源協(xié)議提供了接入的低成本理由;還有一部分,坦率說,是慣例使然。
但從企業(yè)接入潮這個(gè)切口望進(jìn)去,能看到的比一款模型發(fā)布更多:中國大模型行業(yè)正在從粗放的“追趕期”進(jìn)入精細(xì)的“攻堅(jiān)期”。
追趕期的標(biāo)志是,國產(chǎn)模型在關(guān)鍵基準(zhǔn)上與全球頂尖水平的差距從“代際差”縮小到“個(gè)位數(shù)差”——這一步,GLM-5.1在編程方向上已經(jīng)走到了。
攻堅(jiān)期的難題是,技術(shù)領(lǐng)先能否轉(zhuǎn)化成商業(yè)壁壘、開源信任能否轉(zhuǎn)化成定價(jià)能力、巨額研發(fā)投入何時(shí)能在利潤表上留下正向的印記。這三個(gè)問題,智譜沒有回答,整個(gè)國產(chǎn)大模型行業(yè)都還沒有回答。
GLM-5.1的發(fā)布,證明了中國大模型在特定領(lǐng)域已經(jīng)能和全球最頂尖的產(chǎn)品同臺(tái)競(jìng)技。但“同臺(tái)競(jìng)技”和“贏下市場(chǎng)”之間,仍然是一段沒有路標(biāo)的旅程。(本文首發(fā)鈦媒體APP,作者 | 硅谷Tech_news,編輯 | 焦燕)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.