網易首頁 > 網易號 > 正文申請入駐

這家中國公司，讓GPU利用率飆升！全球AI圈熱議

2025-11-20 15:21:24　來源: 技術領導力

浙江舉報

分享至

最近，我遇到一個十分頭疼的問題，K哥團隊有一組集群機器，配了4張GPU顯卡，平時主要用來測評大模型、開發AI應用。本來應該是夠用了，但是在使用GPU的時候經常是獨占式的，一個任務占了整張卡，利用率卻只有30%，別的任務就要排隊。

一邊是GPU大把閑置，一邊是開發人員排隊等資源。就像餐廳里明明有空位，但因為每桌只坐了一個人，后面的客人還得等位。造成了算力資源的浪費，很多企業應該都面臨類似的困境。

GPU資源管理困局

關于GPU資源管理的問題，其實遠不止利用率不高這一點，在使用過程中普遍會遇到以下四個問題：

1、資源顆粒度太粗。如前面說的場景，一張16GB的T4卡，只能整卡分配，利用率只有30%，白白浪費11G多。

2、調度機制不夠智能。K8s原生調度只知道“有卡”或“沒卡”，不知道卡上還剩多少顯存、算力，就好比一個停車場雖然車位滿了，但是還能夠塞進很多輛摩托車。

3、資源隔離難。開發、測試、生產環境混在一起，沒法給不同團隊單獨的工作區間，避免相互干擾。

4、管理成本高。傳統的資源申請要走人工審批，出了問題也要排查很久，導致管理成本很高。

如何才能更高效地管理GPU資源，難道以上問題就沒有更好的解決方案嗎？

OrionX社區版，初體驗

一次偶然的機會，我了解到OrionX社區版。這是由趨動科技開發的，OrionX的輕量級部署版本，幫助用戶構建數據中心級AI算力資源池、降本增效。它的核心理念是：用軟件定義AI算力，讓GPU資源像云計算一樣靈活。

原理也不復雜，就是把顯卡、算力按很小的粒度進行切分，然后根據用戶實際需要進行組合。傳統的GPU管理就像飯店的包間，你一個人也得開一間，而OrionX社區版把包間改成拼桌，來幾個人就坐幾個位子，靈活調整，絕不浪費。

OrionX社區版究竟能不能解決GPU管理的困境呢？我上手做了個測評，下面跟隨我一起來體驗吧。

首先，從官網上提交申請，掃碼填寫信息：

審核通過后，會收到一封確認郵件，獲取授權碼、下載地址。

下載安裝文件，上傳到服務器，準備開始安裝。

安裝的過程很簡單，主要是基于K8S環境進行部署。開始部署前需要對安裝環境做基礎檢查，包括：

GPU驅動檢查：nvidia-smi

Kubernetes環境檢查：get node -owide

Nvidia Container Toolkit檢查：

docker info | grep 'Default Runtime'

狀態正常，就可以開始部署了。

1）部署文件上傳

上傳OrionX部署文件yaml.tar.gz至K8S管理節點任意位置，并解壓.

2）K8S節點標記

編輯部署文件tools/label.sh腳本，按資源規劃修改如下內容，然后對執行K8S集群節點進行標記：

3）創建命名空間和配置信息對象

執行如下操作，創建名為orionx的命名空間，創建OrionX配置信息ConfigMap對象，命令如下：

kubectl apply -f base/

4）部署orionx-ocenter-all-in-one組件

執行如下操作，部署orionx-ocenter-all-in-one組件，命令如下：

kubectl apply -f deploy/orionx-ocenter-all-in-one.yaml

5）導入License

通過瀏覽器訪問http://，打開OrionX GUI管理頁面，通過激活頁面，添加激活文件按鈕導入License，導入后會顯示證書信息，如下圖所示：

:30125

6）部署orionx-k8s-scheduler組件

執行如下操作，部署orionx-k8s-scheduler組件，命令如下：

kubectl apply -f deploy/orionx-k8s-scheduler-extender.yaml

7）部署orionx-server組件

部署orionx-server組件，修改配置文件如下，并執行命令：

kubectl apply -f deploy/orionx-gpu-server.yaml

8）部署orionx-k8s-device-plugin組件

執行如下操作，部署orionx-k8s-device-plugin組件，命令行：

kubectl apply -f deploy/orionx-k8s-device-plugin.yaml

9）部署orionx-gpu-exporter組件

執行如下操作，部署orionx-gpu-exporter組件，會部署于所有OrionX GPU計算節點：

kubectl apply -f deploy/orionx-gpu-exporter.yam

10）部署orionx-k8s-admission-webhooks組件

執行如下命令，部署orionx-k8s-admission-webhooks組件：

kubectl apply -f deploy/orionx-k8s-admission-webhooks.yaml

11）部署orionx-container-runtime組件

執行如下操作，部署orionx-container-runtime組件：

kubectl apply -f deploy/orionx-container-runtime.yaml

現在就可以開始使用Orion社區版了，整體安裝過程很絲滑，下面就可以到后臺去操作了。瀏覽器訪問http://地址，打開OrionX GUI，進行登錄，初始用戶名密碼見安裝手冊。

:30125

進入節點詳情頁面可以查看該節點GPU資源使用率監控統計圖。

還可以進行節點管理。在OrionX GUI左側導航欄選擇“節點”，在節點信息頁面可以禁用或啟用節點。

整個安裝過程很順滑，只要具備基本的Linux使用能力，就可以輕松完成。

輕松管理你的GPU資源池

下面談談我對OrionX社區版的總體使用感受，主要有四點體會：

1、資源分配靈活，告別“大鍋飯”。更細粒度地分配GPU資源，提高資源利用率，這就解決了我們團隊遇到的GPU獨占的問題，而且申請資源無須再等待，提升了日常管理效率。

2、智能調度，讓資源分配更合理。GPU的調度是智能化的，可以做到節點均勻，設備緊湊，節點優先，這就解決了一些節點負載高、一些負載低的問題，并且策略是可配置的。

3、超分，榨干GPU每一滴性能。很多任務不是一直滿負荷用GPU，推理任務經常是突發式的，通過統一內存管理和算力復用，可以分配出更多vGPU，合理使用超分功能可以進一步提升GPU效能。

4、可視化管理，一目了然。Orion社區版的GUI界面做得很不錯，資源監控很直觀，點進某個節點，可以看到詳細的監控曲線、GPU利用率曲線（最近24小時）、顯存使用趨勢。

立刻開啟GPU資源池化時代

OrionX社區版通過構建算力資源池，將粗放的管理轉變為精細化運營，這是中國科技企業在AI基礎設施領域的突破。正如凱文·凱利在《必然》中所說：“技術的真正力量，不在于它能做什么，而在于它讓更多人能做什么。”AI算力池化技術的價值，恰恰在于讓研發團隊也能用得起、用得好AI算力，打破算力壟斷的壁壘。

如果你的團隊也面臨GPU資源管理困境，立即掃碼申請使用OrionX社區版。

有興趣的朋友提交上面表單信息后，也可以添加下方小助手微信進行交流。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

男子打球超帥瞬間，離了很遠直接把球打進了球筐

南陽日報 2026-04-05 19:53:53
136 跟貼 136
美方已救出被擊落F-15E戰機上的第二名飛行員

央視新聞客戶端 2026-04-05 12:17:39
95680 跟貼 95680

媒體：4億美元橋梁被炸F-15墜毀沖突代價已遠超預估

中國新聞周刊 2026-04-05 18:06:30
29157 跟貼 29157

小區樓棟加裝電梯只到1個樓層！這家住戶有實力？真相出人意料，網友：是個省錢思路

重慶晨報 2026-04-05 08:10:00
85 跟貼 85
超“粵”意義非凡！高速男籃6日晚對陣廣東，收尾戰可否開好頭？

齊魯壹點 2026-04-06 09:36:16
2 跟貼 2

重慶銅梁龍繼續不敗！客場1：0擊敗浙江綠城，李鎮全遭惡意犯規

上游新聞 2026-04-05 18:27:09
125 跟貼 125

毛新宇攜家人到楊開慧烈士陵園祭掃

政知新媒體 2026-04-05 08:48:13
2610 跟貼 2610
知名連鎖餐飲門口宣傳板寫“3元自助早餐”，兩人買單45元被告知“僅粥飲自助”

新聞晨報隨申Hi 2026-04-02 18:36:05
886 跟貼 886

確定了！江蘇又有新假期！

泰州微視聽 2026-04-05 19:41:00
209 跟貼 209
從航母到繞月飛船：美國今年為何總栽在馬桶上

國是直通車 2026-04-05 16:26:05
301 跟貼 301
徐州“公廁版瑞幸”火出圈，景區工作人員回應：曾是游客服務點而非公廁

現代快報 2026-04-04 15:00:11
1209 跟貼 1209
郴州小伙清明爬多座山祭祀16位先祖，花了一天時間：根在這里，祈求祖先保佑

瀟湘晨報 2026-04-05 19:55:19
224 跟貼 224
從“手打”到“1桶半”，“心機商標”的路該到頭了

南方都市報 2026-04-06 01:08:20
117 跟貼 117
祝賀！趙心童奪得2026斯諾克巡回錦標賽冠軍

環球網資訊 2026-04-06 06:54:09
93 跟貼 93
扎哈羅娃：俄羅斯目前在三條戰線上同時作戰

環球網資訊 2026-04-05 11:48:11
1745 跟貼 1745
被擠爆的高中，擴容200萬個學位

中國新聞周刊 2026-04-06 07:33:07
6 跟貼 6
8個產油國決定自5月起將原油日產量上調20.6萬桶

國際在線 2026-04-06 06:53:02
1 跟貼 1
男子挪吧臺碰倒酒壇損失120斤白酒愣住：想扶扶不住了

星視頻 2026-04-05 13:30:00
465 跟貼 465
過去24小時15艘船只獲準通過霍爾木茲海峽

國際在線 2026-04-06 07:05:04
57 跟貼 57
山東濟南一工廠爆炸起火

靠山屯閑話 2026-04-06 10:58:55
0 跟貼 0
支持狗上座的燒烤店遭抵制，爆料者曾多次曝光該亂象

映射生活的身影 2026-04-06 10:57:08
0 跟貼 0
記者調查：寵物進商場，政策趨于收緊？

看看新聞Knews 2026-04-06 10:42:06
0 跟貼 0

技術領導力

Mr.K，出過書，做過CTO

77文章數 587關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

家居

親子

旅游

教育

手機 / 數碼

房產 / 家居

這家中國公司，讓GPU利用率飆升！全球AI圈熱議

前同事被蒸餾成Token，AI能否偷走職場經驗

牛彈琴：特朗普兩個舉動很反常 美國上下都很震驚

牛彈琴：特朗普兩個舉動很反常 美國上下都很震驚

CBA最老球員，身價7500萬美元

王燦兮否認婆媳不和 曬與杜淳媽合影

118噸！這家央行，大幅拋售黃金！

家用SUV沒駕駛樂趣?極氪8X第一個不同意

態度原創

江青年輕時罕見照片曝光，書信竟是寫給華國鋒！

溫馨多元 愛的具象化

40+媽媽產后，不焦慮不內卷、真實做法

全民“追花地圖”！原來有這么多“花樣”玩法

新工科專業開始洗牌，報考的新思路決定孩子未來就業出路！

牛彈琴：特朗普兩個舉動很反常美國上下都很震驚

牛彈琴：特朗普兩個舉動很反常美國上下都很震驚

王燦兮否認婆媳不和曬與杜淳媽合影

溫馨多元愛的具象化