337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

家家都有DeepSeek服務,如何謊稱速度快?

0
分享至

不是人人都有“鈔能力”,我們的故事,

從用單節點方案部署DeepSeek-R1開始。

為什么是單節點呢?

因為H200單卡有140GB顯存,可用單節點(8卡)方案部署。

而H800和HI00顯存80GB,需要雙節點方案。

有卡了,就可以來玩DeepSeek。

世界是場游戲,是游戲就有作弊的玩家。

怎么作弊呢?等下說,

先看看芯片廠商AMD的官網技術博客。



網址在此:https://rocm.blogs.amd.com/artificial-intelligence/DeepSeekR1_Perf/README.html

時間是25年2月21日。

我相信哪怕是這幾天的時間,AMD的性能指標也還在增長。

沒辦法,AI就是這么卷。

換個角度,這篇可以說是,

從AMD官網博客中學習大模型推理性能知識點。

下圖是兩種芯片,英偉達H200和AMD MI300X,

用一個節點(8卡)跑出來的性能。







為什么要學這些知識點呢?

答案很簡單,以防被忽悠。

話說,性能指標是一個非常關鍵的數值,

背后都是技術實力,

甚至可以說性能是技術實力的終極體現。

是騾子是馬,你拉出來溜溜。

不過,現在是技術向上震蕩期,

很多人對大模型性能指標不熟悉,

會有人借機在這個指標上面作弊。

別著急知道作弊手法,

在看懂作弊之前我們先了解如何公平,

對,公平比較兩種芯片性能。

我們先看懂圖上的“已知條件”

圖上都有什么信息呢?

我們都知道,

大模型推理分為兩個關鍵任務,

有各自的生成時間:

一個是輸入(Prefill任務)所用時間,

另一個是輸出(Decode任務)所用時間。

其實所有的性能幾乎都可以分這兩個階段來觀察。

大模型推理中有兩個關鍵指標,

兩個關鍵指標是:

吞吐量(Throughput)和延遲(Latency)

吞吐量通常指每秒生成的token數量,

而延遲是從輸入到輸出的時間。

時間非常關鍵,

每秒吞吐量越高,意味著計算機系統能在單位時間內處理更多的請求。

就是單位時間干的活越多越好。

當然,牛馬也一樣。

這張圖告訴我們:

圖中有兩種芯片,

英偉達H200型號和AMD的MI300X型號,

為了公平比較兩種芯片的性能,要統一測試,

為什么要統一測試?

這樣才能看出處理相同工作量時,

哪個芯片速度更快、效果更好。

我們要用相同的“題目量”和“回答量”來進行測試,

也就是,統一處理4000個token(題目和回答加在一起)。

圖中原話是:輸入3200個token和輸出800個token。

這樣,兩個系統都各自處理4000個token的信息量,

而且圖中已知,每個推理請求中,平均向系統問出500個問題。

這樣,測試“系統處理token數量”統一了。

這張圖還想告訴我們幾個技術概念,

吞吐量(單位:token/秒)

延遲(單位:毫秒)

下面,我們會把毫秒換算成秒。

而最大并發數(Max Concurrency)是什么呢?

就是衡量系統在同一時刻能同時服務多少個請求,

能讓我們了解AI 系統在真實環境下對大量請求的抗壓能力,

就像考場里同一時間安排多少考生一起考試的道理一樣。

最大并發數,用Batch Size表示:

我們要根據不同的請求數量,觀察系統性能分別是多少。

因為是測試,所以非常細致,

能讓我們了解 AI 系統在真實環境下對大量請求的適應能力,

就像考場里同一時間安排多少考生一起考試的道理一樣。

當推理請求數量(Batch Size),

分別是是1,2,4……128,

Batch Size1是只有1個請求,

Batch Size2,同時處理2個請求,

Batch Size4,同時處理4個請求,

以此類推,直到Batch Size128,

就是同時處理128個請求。

打個比方,當我們說Batch Size1,

代表只有1個人在考試,1個人用考試系統;

Batch Size2,代表有2個人一起考試;

以此類推,Batch Size128 ,

就意味著128個人同時在考試。

如果只有1 個人在考試(Batch Size1),

系統專心為一個考生服務,一般來說,速度慢不了;

如果有128 個考生一起考試(Batch Size128),

系統就要同時對128 個人的題目進行閱讀、思考、回答,負擔變大,

可能會增加等待時間。

我們再來看圖,

在圖上左下方讀到的第一個數字是170,

單位tokens/s。

意味著:

已知總共4000個token的信息量,

當BatchSize1的時候,每秒處理170個token,

以這種速度來處理,

那需要的時間就是4000除以170等于23.5秒。

就是用23.5秒就能把這4000個token算完。

23.5秒在時間軸橫軸上處于2萬毫秒右邊一點的位置。

沒有明確寫出來,但我們讀圖能讀出來。







圖片試圖說明AMD芯片性能很好,

然而,我對AMD的這種廣告沒有什么興趣。

我感興趣的是:AMD這個廠商很良心,

他們的性能數據很清楚地告訴我們,

輸入和輸出的字數是多少(輸入3200個token和輸出800個token),

3200+800就是系統總處理的token數,

4000除以170等于23.5秒,

也就是說,decode任務時間是23秒,

也是恒定的塞進去的信息量就這么多。

好比,東西放進大模型里面多長時間能“出鍋”,

需要測量一個客觀的時間,

也就是,系統跑出來是幾秒就是幾秒。

生成速度,也就是多少秒生成多少token是一個硬指標,

是用總吞吐量除以測量出得時間得出來的。

這里要稍微計算一下了:

用圖上的已知信息倒著推理兩個信息。

當我們跑8張卡的H200的系統(單節點),

在Batch Size1的時候,情況如下:

情況一:輸入3200,輸出800,4000=3200+800

4000tokens除以170tokens/s等于23.53秒

估計decode時間大約為23秒,

再看decode的信息處理量是800token,

decode800tokens除以23秒等于35tokens/s。

看好了,這時候我要來“作弊”了,把輸入和輸出的數據互換一下。

情況二:輸入800,輸出3200,4000=800+3200

3200tokens除以34.78tokens/s,

就是每秒跑出來34.78個token,

雖然同樣還是處理總共4000個token,

但是,用3200除以35okens/s等于91秒,

decode時間就會變得很長,91秒。

都是處理同樣的信息量,調整輸入和輸出,

decode的時間從23秒變成了91秒。

這個技術細節非常重要。



有時候,廠商提供的測試數據是prefill和decode加在一起的,

當然,也可以說混在一起。

既然“混了”,“摸魚”的機會就來了,

好比兩個長跑運動員,

一個叫prefill,一個叫decode,

prefill跑得快,decode跑得慢,

至于為什么decode慢,

這個你的去問“注意力機制”這個家伙了,

都是它干的好事,這里不展開。

同樣的一段長跑運動,

prefill和decode的速度應該分別記錄,

假如想作弊,就把盡量長的路程給prefill跑,

它速度快,時間肯定就縮短了。

要是不懂,猛一看性能,覺得還挺快嘞。

還是那句話,性能是和采購決策相關的關鍵指標。

廠商AMD很客觀,告訴你比例了(輸入3200,輸出800),

有人會把prefill的比例調高點,數值就更好看了,

因為decode跑得慢,讓decode少跑,也就是少干點活。

請注意,有些性能指標旁邊標著“僅輸出”(decode only)

這不是不可以,而是,拿“僅輸出”的指標和整個推理的吞吐指標對比,

不講武德。

總結一下:寫性能,請把prefill和decode處理的工作量標清楚,謝謝。

最后預告下,過幾天發的文章,

我會把圖上所有的指標都算出來,會有新結論。

上一篇回顧:

《DeepSeek:為了這口醋,包了這頓餃子,為了數據,我造了模型》







聲明:個人原創,僅供參考

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
美飛行員36小時極限逃生: 藏身海拔2000米巖縫發求救信號 伊朗:發現一美兵遺體

美飛行員36小時極限逃生: 藏身海拔2000米巖縫發求救信號 伊朗:發現一美兵遺體

紅星新聞
2026-04-06 13:44:12
伊朗發布美軍士兵遺體照:在一架墜毀運輸機殘骸中發現,這是特朗普“可恥失敗的又一證據”

伊朗發布美軍士兵遺體照:在一架墜毀運輸機殘骸中發現,這是特朗普“可恥失敗的又一證據”

都市快報橙柿互動
2026-04-06 14:32:22
上海市委統戰部副部長張峰,任市工商聯黨組書記

上海市委統戰部副部長張峰,任市工商聯黨組書記

黃河新聞網呂梁
2026-04-06 17:13:31
鎖定季后賽!北京狂轟22-0逆轉同曦 陳盈駿26+10郭昊文30分

鎖定季后賽!北京狂轟22-0逆轉同曦 陳盈駿26+10郭昊文30分

醉臥浮生
2026-04-06 21:38:33
跨越一萬公里的清算:48小時逐客令,阿根廷一刀切斷伊朗南美命脈

跨越一萬公里的清算:48小時逐客令,阿根廷一刀切斷伊朗南美命脈

環球格局觀
2026-04-04 20:52:35
伊朗繳獲美軍飛行員的私人物品,有牙膏,內褲,牛肉干,壓縮食品

伊朗繳獲美軍飛行員的私人物品,有牙膏,內褲,牛肉干,壓縮食品

魔都姐姐雜談
2026-04-06 13:11:53
伊朗稱正審閱最新停火提案!外媒:美副總統萬斯和伊朗外長等徹夜交流,停火協議或將立即生效,霍爾木茲海峽重新開放

伊朗稱正審閱最新停火提案!外媒:美副總統萬斯和伊朗外長等徹夜交流,停火協議或將立即生效,霍爾木茲海峽重新開放

每日經濟新聞
2026-04-06 15:51:15
買一贈一也清不掉庫存,中國人的牛奶喝到“天花板”了嗎?

買一贈一也清不掉庫存,中國人的牛奶喝到“天花板”了嗎?

臨云史策
2026-04-06 12:05:24
4月“斷網”風暴:“翻墻”時代迎來終局?

4月“斷網”風暴:“翻墻”時代迎來終局?

虔青
2026-04-06 13:32:04
伊朗:打擊了駐科威特美軍;伊外交部發言人:美方營救飛行員,可能是為了竊取濃縮鈾!以色列遭導彈襲擊,4人死亡

伊朗:打擊了駐科威特美軍;伊外交部發言人:美方營救飛行員,可能是為了竊取濃縮鈾!以色列遭導彈襲擊,4人死亡

每日經濟新聞
2026-04-06 19:49:04
剛剛,利好!停火協議來了,突然拉升

剛剛,利好!停火協議來了,突然拉升

中國基金報
2026-04-06 16:50:17
5萬贊助張雪?東鵬特飲獨家回應

5萬贊助張雪?東鵬特飲獨家回應

中國新聞周刊
2026-04-06 17:14:54
尊重歷史,青海馬家軍在陜西山西河南跟日軍血戰八年,是真的嗎?

尊重歷史,青海馬家軍在陜西山西河南跟日軍血戰八年,是真的嗎?

史之銘
2026-04-06 17:12:29
2020年,長沙女子癌癥晚期,爭奪女兒40萬學費,直言:我只想活著

2020年,長沙女子癌癥晚期,爭奪女兒40萬學費,直言:我只想活著

大魚簡科
2026-04-06 11:33:07
澳大利亞等5國外長發表聯合聲明:襲擊聯合國維和人員不可接受

澳大利亞等5國外長發表聯合聲明:襲擊聯合國維和人員不可接受

環球網資訊
2026-04-06 11:51:14
無罪!無罪!無罪!這才是老百姓要的正義!

無罪!無罪!無罪!這才是老百姓要的正義!

胖胖說他不胖
2026-04-06 09:00:47
美以伊戰爭若持續打下去,全球經濟將難逃一個可怕的局面!

美以伊戰爭若持續打下去,全球經濟將難逃一個可怕的局面!

識局Insight
2026-04-05 22:52:43
衛星圖披露美軍營救飛行員行動細節:行動區域布滿彈坑

衛星圖披露美軍營救飛行員行動細節:行動區域布滿彈坑

環球網資訊
2026-04-06 17:54:07
心梗與散步脫不開關系?醫生建議:55歲以后,散步時多注意這3點

心梗與散步脫不開關系?醫生建議:55歲以后,散步時多注意這3點

白話電影院
2026-04-06 19:42:47
法國冠軍車手銳評張雪機車奪冠,7字一針見血,字字直戳國人心窩

法國冠軍車手銳評張雪機車奪冠,7字一針見血,字字直戳國人心窩

以茶帶書
2026-04-06 14:11:13
2026-04-06 22:52:49
親愛的數據 incentive-icons
親愛的數據
《我看見了風暴:人工智能基建革命》一書作者
693文章數 219913關注度
往期回顧 全部

數碼要聞

REDMI新品明天公布,或為K90至尊版

頭條要聞

安徽6歲失聯女童確認遇害 嫌犯已被抓獲歸案

頭條要聞

安徽6歲失聯女童確認遇害 嫌犯已被抓獲歸案

體育要聞

官方:中國女足球員邵子欽加盟本菲卡

娛樂要聞

唐嫣羅晉新加坡遛娃,6歲女兒身高搶鏡

財經要聞

史詩級暴跌"一周年" A股接下來如何走?

科技要聞

折疊屏iPhone要來了,富士康已在試產!

汽車要聞

阿維塔06T快上市了 旅行車還能這么玩?

態度原創

教育
數碼
親子
游戲
家居

教育要聞

老師們平時上課根本不采用公開課模式,為什么專家還力挺公開課?

數碼要聞

微星泰坦18 Ultra 2026游戲本上市,頂配售價47999元

親子要聞

中泰小萌娃的快樂日常,簡單又治愈~

空歡喜!艾達王配音“暗示回歸”實為粉絲定制視頻

家居要聞

溫馨多元 愛的具象化

無障礙瀏覽 進入關懷版