337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

匿名模型“大象”攪局OpenRouter:100B參數(shù)沖到熱榜第一,實測結(jié)果如何

0
分享至


智東西
作者 陳駿達(dá)
編輯 漠影

智東西4月16日報道,這兩天,一款名為Elephant(大象)的匿名模型,在OpenRouter上悄然亮相。上線不到48小時,這一模型已經(jīng)沖到OpenRouter熱榜(Trending)第一,目前調(diào)用量超過1850億個token。


在調(diào)用量日榜上,Elephant排名全球第八。


根據(jù)OpenRouter對其介紹,Elephant是一個100B參數(shù)量的純文本模型,主打高token效率,支持256k上下文和32k輸出,適合的任務(wù)包括代碼補全、調(diào)試、快速文檔處理和輕量級Agent交互等等。


目前,Elephant在網(wǎng)友反復(fù)的“拷打”下,暫時還沒供出自己是哪家的模型。有網(wǎng)友猜測這可能是國產(chǎn)最新模型的Flash版本,或海外全新實驗室搗鼓出來的新品。

有不少開發(fā)者已經(jīng)曬出他們對Elephant的使用體驗,Hermes Agent的作者拿它跑了個基準(zhǔn)測試,發(fā)現(xiàn)這一模型在大部分工具調(diào)用任務(wù)中表現(xiàn)還行,不過偶爾會出現(xiàn)幻覺和對環(huán)境的錯誤理解,這對一個100B的模型來說其實也正常。


輸出速度是這一模型的一大亮點,其在OpenRouter上的平均速度就達(dá)到了67 token/s,首token延遲為0.89秒,在即時交互場景展現(xiàn)出了潛力。有網(wǎng)友感嘆,雖然質(zhì)量還不確定,但這是他用過最快的模型,讓他想起了Grok Fast 1的體驗。


不過,光看別人的評價終究隔了一層。接下來,我們將親自上手,從編程、文檔處理到Agent交互,逐個任務(wù)實測一遍。

一、編程、長文本、Agent實測:前端編程響應(yīng)快,支持多輪工具調(diào)用

在OpenRouter上,Elephant的編程能力排名在同尺寸模型中靠前,于是我們先嘗試了幾個編程的小項目,看看它能否快速完成。

首先是一個網(wǎng)站,這主要考察模型的前端能力。拿到開發(fā)任務(wù)后,Elephant對網(wǎng)站的幾個核心組件進行了規(guī)劃,并主動為這一網(wǎng)站加入了明暗模式切換、移動端響應(yīng)式設(shè)計等我們并未要求的功能,最終耗時1分鐘左右完成開發(fā)。


當(dāng)我們要求它將網(wǎng)站的主色調(diào)改成綠色后,Elephant用不到10秒鐘就完成了修改。相信使用過其他模型的用戶都知道,大部分模型在處理修改任務(wù)時往往需要通讀上下文,逐一修改,一些細(xì)枝末節(jié)的修改可能要花上幾分鐘。

而Elephant基本做到了指哪兒打哪兒,這對于一些快速、高頻的網(wǎng)站調(diào)試需求是很實用的。


我們也試了試Elephant有沒有打造項目級任務(wù)的能力,讓它根據(jù)自己的內(nèi)部知識,復(fù)刻一個支付軟件。我們是在Kilo Code插件中體驗的模型編程,由Elephant驅(qū)動的多個子Agent并行工作,進一步放大了它的輸出速度優(yōu)勢,但是其最終打造的結(jié)果僅能算是一個原型。這種表現(xiàn)可能與其較小的參數(shù)量有關(guān)。


再來看看Elephant在長文本場景的表現(xiàn)。我們向模型發(fā)送了一份幾百頁的招股書,并給出十分詳細(xì)的IPO解讀要求,讓Elephant輸出對這家公司基本面的總結(jié)。這種復(fù)雜的提示詞,對模型的指令遵循能力是一種挑戰(zhàn)。


在執(zhí)行過程中,Elephant可以快速調(diào)用多個文件讀取工具,以極快的速度輸出解讀。它用12萬token完成了對這份復(fù)雜文件的梳理,耗時卻僅有幾十秒。

細(xì)讀它的解讀可以發(fā)現(xiàn),模型完全按照我們的要求梳理出了核心信息,沒有遺漏,數(shù)據(jù)、結(jié)論都基本準(zhǔn)確。


我們還嘗試了讓Elephant完成Agent類型的任務(wù):將其接入一個OpenClaw類的產(chǎn)品,并要求它規(guī)劃一次去泰國的7日游,搜索景點注意事項、定位等關(guān)鍵信息,最終打造一個攻略網(wǎng)站。

Elephant可以充分利用Agent框架為其提供的工具,調(diào)用搜索等工具,獲取和泰國旅行相關(guān)的信息。


最終,Elephant在這種開放式Agent任務(wù)上做得不錯,旅程規(guī)劃合理,覆蓋了重要的景點。它還在高德上為我們查找了對應(yīng)地點的定位,點擊后即可跳轉(zhuǎn)到相應(yīng)界面。


幾個任務(wù)跑下來,我們發(fā)現(xiàn)Elephant在執(zhí)行任務(wù)中展現(xiàn)了優(yōu)秀的速度與指令響應(yīng)能力,前端原型開發(fā)和長文件處理效率不錯,但在打造完整項目級應(yīng)用時仍然有些力不從心。其Agent規(guī)劃與工具調(diào)用能力可圈可點,能自主完成旅行攻略到網(wǎng)站落地。總體而言,這是一款在輕量級、高頻任務(wù)中具有優(yōu)勢的高效模型。

二、第三方評估:指令遵循滿分,token效率比肩GPT-5.4 Mini

Elephant在更全面的第三方基準(zhǔn)測試上的表現(xiàn)如何?AI Benchy上對這一模型的評估值得參考。

AI Benchy是一個“擠水分”的民間AI測謊儀。如果你是一名開發(fā)者,或者你需要用 AI 來做自動化工作流,相比于各家大廠的官方跑分,AI Benchy提供的“指令遵循度”和“真實性價比”數(shù)據(jù)往往具有更高的參考價值。

從絕對實力來看,Elephant在AI Benchy上并未進入第一梯隊,但這可能本來就不是它的目標(biāo)。在同參數(shù)量級的模型中,Elephant真正主打的是高效率與高性價比。

在token消耗維度,同樣的邏輯推理或代碼審計任務(wù)交給Elephant,其token用量要遠(yuǎn)少于其他廠商的模型,基本和GPT-5.4 Mini處在同一水平線上。這種高token效率,尤其適合大規(guī)模的to-C場景或是重復(fù)性的日常任務(wù)。


這種高效率在Agent場景尤為重要。因為Agent工作流本質(zhì)上是多輪串行或并行的循環(huán)過程,模型需要反復(fù)規(guī)劃、調(diào)用工具、觀察結(jié)果、再規(guī)劃,每一輪都會消耗token并引入延遲。高token效率意味著模型在有限的上下文窗口和預(yù)算內(nèi)可以執(zhí)行更多輪操作,能用更少的計算資源跑完更長的Agent鏈路。

而在響應(yīng)時間方面,Elephant能做到基本在1秒左右給出回答,提供幾乎無延遲感的交互體驗,這一定程度上緩解了用戶在等待生成結(jié)果時的焦躁感,提升用戶體驗。


這種低時延效果是不少廠商追逐的重點。前段時間,谷歌CEO Sundar Pichai就分享了一個觀點:“延遲是優(yōu)秀產(chǎn)品的核心特征之一,低延遲往往意味著產(chǎn)品的底層技術(shù)架構(gòu)足夠優(yōu)秀,…,這也是我們打造Gemini的核心思路,即在前沿性能與速度之間找到平衡。

換句話說,低延遲不只是“快”這么簡單,它背后往往代表著一套更扎實、更成熟的技術(shù)體系和更好的用戶體驗,最終會轉(zhuǎn)化為真實的商業(yè)價值。

最后,在指令遵循方面,Elephant拿到了一致性的滿分成績和100%的通過率,也就是說這個模型比較“聽話”。這能夠降低任務(wù)執(zhí)行過程中與模型反復(fù)交互、理清需求帶來的時間和算力浪費。


結(jié)語:不拿大炮打蚊子,輕量模型也有價值

其實,在最初測試Elephant模型時,我們并未被它的基礎(chǔ)能力驚艷,甚至一度有所懷疑。但隨著深入真實任務(wù)場景,它的實用價值才真正顯現(xiàn)出來。

當(dāng)前,前沿模型的規(guī)模正不斷擴大,生成的答案也越來越長。然而在真實的業(yè)務(wù)流水線中,用萬億參數(shù)模型去處理基礎(chǔ)文本分類或信息抽取,無異于“大炮打蚊子”:既浪費算力,又導(dǎo)致token無意義消耗和時延飆升。

正因如此,剝離對龐大體量的迷信,根據(jù)任務(wù)復(fù)雜度精準(zhǔn)匹配模型尺寸,讓每一個token都用在刀刃上,已經(jīng)成為大模型規(guī)模化落地過程中,開發(fā)者和企業(yè)的共識。

在能反映真實調(diào)用量的OpenRouter平臺上,曾由超大規(guī)模模型壟斷的榜單,正被一批講究“token效率”的精銳小模型打破。這并非是對旗艦?zāi)P湍芰Φ姆穸ǎ枪こ汤硇曰貧w的信號。相較于那些參數(shù)量最大、最“智能”的模型,那些能以最低成本、最快響應(yīng)速度完成任務(wù)的模型,正展現(xiàn)出成為Agent操作系統(tǒng)的成長潛力。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
普通家庭能給孩子最好的托舉是什么?網(wǎng)友:真的說到點上了

普通家庭能給孩子最好的托舉是什么?網(wǎng)友:真的說到點上了

夜深愛雜談
2025-11-21 20:20:12
許家印昔日辦公室內(nèi)景曝光,房間一個接著一個很奢華,像迷宮一樣

許家印昔日辦公室內(nèi)景曝光,房間一個接著一個很奢華,像迷宮一樣

娛樂團長
2026-04-16 20:26:02
山東省淄博市人大常委會原副主任王樹槐接受審查調(diào)查

山東省淄博市人大常委會原副主任王樹槐接受審查調(diào)查

界面新聞
2026-04-16 11:05:48
許家印大兒的加拿大生活:無錢但自由、每天抽中華、二弟前途未卜

許家印大兒的加拿大生活:無錢但自由、每天抽中華、二弟前途未卜

茶喝多了睡不著
2026-04-15 22:15:05
交警提醒:新交規(guī)落地,高速143km/h不扣分,龜速行車直接扣3分!

交警提醒:新交規(guī)落地,高速143km/h不扣分,龜速行車直接扣3分!

復(fù)轉(zhuǎn)這些年
2026-04-14 12:14:50
我媽被姑姑扇了6耳光,我爸靜了2秒,轉(zhuǎn)身把427萬的拆遷款給我媽

我媽被姑姑扇了6耳光,我爸靜了2秒,轉(zhuǎn)身把427萬的拆遷款給我媽

楓紅染山徑
2026-04-11 12:25:56
普京敲定訪華,特朗普緊急下命令,中國通告全球,無懼美國威脅

普京敲定訪華,特朗普緊急下命令,中國通告全球,無懼美國威脅

書紀(jì)文譚
2026-04-16 18:08:02
維拉失點仍轟7-1!雙殺意甲勁旅+9連勝創(chuàng)紀(jì)錄 埃梅里沖歐聯(lián)第5冠

維拉失點仍轟7-1!雙殺意甲勁旅+9連勝創(chuàng)紀(jì)錄 埃梅里沖歐聯(lián)第5冠

我愛英超
2026-04-17 06:39:10
保姆帶著十歲的兒子,住進了雇主家,這樣的結(jié)局讓人很糾結(jié)

保姆帶著十歲的兒子,住進了雇主家,這樣的結(jié)局讓人很糾結(jié)

李蘇章
2026-04-16 08:03:07
李在明認(rèn)清了大勢,承認(rèn)有中俄做靠山,朝鮮的苦日子已經(jīng)熬出頭了

李在明認(rèn)清了大勢,承認(rèn)有中俄做靠山,朝鮮的苦日子已經(jīng)熬出頭了

藍(lán)色海邊
2026-04-17 08:23:58
震驚!20名中國學(xué)者赴美參加學(xué)術(shù)會議,竟被集體遣返

震驚!20名中國學(xué)者赴美參加學(xué)術(shù)會議,竟被集體遣返

大洛杉磯LA
2026-04-17 06:41:14
來個胸透,專治各種嘴硬的

來個胸透,專治各種嘴硬的

飛娛日記
2026-04-17 08:49:47
許家印認(rèn)罪后老家的功德碑還在,村民:一定會永久保留

許家印認(rèn)罪后老家的功德碑還在,村民:一定會永久保留

映射生活的身影
2026-04-16 19:18:33
樂極生悲?奪冠僅1周,王楚欽傳來“噩耗”

樂極生悲?奪冠僅1周,王楚欽傳來“噩耗”

籃球看比賽
2026-04-16 09:55:21
復(fù)活節(jié)的鮮血與教皇的沉默:為何對川普憤怒,卻對屠殺失聲?

復(fù)活節(jié)的鮮血與教皇的沉默:為何對川普憤怒,卻對屠殺失聲?

斌聞天下
2026-04-16 07:25:03
深度解析歐冠潰敗:皇馬巴薩雙雙出局,兩大豪門命運卻已天差地別

深度解析歐冠潰敗:皇馬巴薩雙雙出局,兩大豪門命運卻已天差地別

夜白侃球
2026-04-17 09:15:25
參考封面|伊朗戰(zhàn)爭加速美國霸權(quán)衰落

參考封面|伊朗戰(zhàn)爭加速美國霸權(quán)衰落

參考消息
2026-04-16 16:49:03
湖火能打幾場?“東里”何時歸隊是關(guān)鍵!火箭要將籃板優(yōu)勢最大化

湖火能打幾場?“東里”何時歸隊是關(guān)鍵!火箭要將籃板優(yōu)勢最大化

小七說籃球
2026-04-17 10:18:17
吳昕鄭凱戀情曝光,兩人疑已相戀7年,女方曾談婚戀觀:戀愛可以談,結(jié)婚得慎重

吳昕鄭凱戀情曝光,兩人疑已相戀7年,女方曾談婚戀觀:戀愛可以談,結(jié)婚得慎重

魯中晨報
2026-04-16 18:08:04
奇怪!飛機改成硬座、高鐵也在降速,交通工具為何集體降級?

奇怪!飛機改成硬座、高鐵也在降速,交通工具為何集體降級?

丁丁鯉史紀(jì)
2026-04-16 14:07:38
2026-04-17 10:48:49
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)變革。
11613文章數(shù) 117031關(guān)注度
往期回顧 全部

科技要聞

Anthropic推出Opus 4.7,坦言依不及Mythos

頭條要聞

男子快遞被人力資源女同事私自拆開 幾天后反被開除

頭條要聞

男子快遞被人力資源女同事私自拆開 幾天后反被開除

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰的生意?

汽車要聞

埃安N60預(yù)售11.58萬起 標(biāo)配激光雷達(dá)/零重力座椅

態(tài)度原創(chuàng)

手機
親子
家居
教育
軍事航空

手機要聞

安卓Pixel Glow曝光,暗示谷歌Pixel 11系列手機配燈帶

親子要聞

產(chǎn)后性冷淡:重繪“身體地圖”,喚醒愛的愉悅記憶

家居要聞

法式線條 時光靜淌

教育要聞

從“陪練”到“引路”:我們是如何陪孩子跳出冠軍與學(xué)霸雙軌的——王亮家教好故事

軍事要聞

美宣布黎以停火10天 以方稱不會撤軍

無障礙瀏覽 進入關(guān)懷版