337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

如何在Kubernetes上運(yùn)行AI/ML?

0
分享至

  在機(jī)器學(xué)習(xí)(ML)領(lǐng)域,訓(xùn)練出高性能模型只是第一步,真正的挑戰(zhàn)在于如何將模型快速、可靠且經(jīng)濟(jì)、高效地部署到生產(chǎn)環(huán)境中進(jìn)行推理。特別是在大規(guī)模場(chǎng)景下,GPU資源管理、延遲優(yōu)化、批處理策略、模型版本控制、可觀測(cè)性以及輔助服務(wù)(如預(yù)處理器、特征存儲(chǔ)庫(kù)和向量數(shù)據(jù)庫(kù))的編排,都是亟待解決的難題。Kubernetes作為容器編排領(lǐng)域的佼佼者,為AI/ML應(yīng)用提供了一個(gè)可擴(kuò)展、可移植的平臺(tái),不僅能夠有效管理GPU等計(jì)算資源,還能自動(dòng)調(diào)整工作負(fù)載規(guī)模,以應(yīng)對(duì)批處理任務(wù)以及實(shí)時(shí)推理的不同需求。

  Kubernetes,一個(gè)為AI/ML高效分配資源的理想平臺(tái)

  Kubernetes通過其強(qiáng)大的調(diào)度能力,能夠高效分配GPU和其他計(jì)算資源,實(shí)現(xiàn)工作負(fù)載的緊密打包和自動(dòng)伸縮。同時(shí),還能協(xié)調(diào)包含模型服務(wù)器、預(yù)處理器、向量數(shù)據(jù)庫(kù)和特征存儲(chǔ)在內(nèi)的復(fù)雜系統(tǒng),確保低延遲端點(diǎn)的穩(wěn)定運(yùn)行。容器化技術(shù)為模型環(huán)境提供了可重復(fù)性和一致性,使得模型的持續(xù)集成與持續(xù)部署(CI/CD)成為可能。Kubernetes內(nèi)置的滾動(dòng)更新、流量分割以及指標(biāo)追蹤功能,進(jìn)一步增強(qiáng)了生產(chǎn)環(huán)境的安全性和可靠性。

  對(duì)于追求操作簡(jiǎn)便性的團(tuán)隊(duì),托管端點(diǎn)服務(wù)或許是一個(gè)選擇,但在需要高度控制、可移植性、高級(jí)編排以及實(shí)時(shí)服務(wù)能力的場(chǎng)景下,Kubernetes無疑是首選。

  典型ML推理設(shè)置,KServe在Kubernetes上的應(yīng)用

  使用KServe在Kubernetes上進(jìn)行機(jī)器學(xué)習(xí)推理,有一個(gè)典型架構(gòu),那就是客戶端(如數(shù)據(jù)科學(xué)家、應(yīng)用程序或批處理作業(yè))通過Ingress向KServe的InferenceService發(fā)送請(qǐng)求。內(nèi)部,通過可選的Transformer組件負(fù)責(zé)預(yù)處理輸入數(shù)據(jù),預(yù)測(cè)器用來加載模型并提供預(yù)測(cè)功能,而可選的解釋器則提供模型洞察。模型工件從模型存儲(chǔ)中提取,并通過TensorFlow、PyTorch、scikit-learn、ONNX或Triton等運(yùn)行時(shí)進(jìn)行處理。整個(gè)系統(tǒng)運(yùn)行在Knative/Kubernetes之上,支持CPU和GPU計(jì)算層,并可與AWS、Azure、Google Cloud等云服務(wù)提供商集成。


  至于,MLFlow與KServe的集成如何操作?MLFlow是一個(gè)開源的機(jī)器學(xué)習(xí)框架,旨在解決模型從實(shí)驗(yàn)到生產(chǎn)過程中遇到的常見問題,如實(shí)驗(yàn)數(shù)據(jù)丟失、結(jié)果重現(xiàn)困難以及模型版本管理混亂。它通過跟蹤運(yùn)行情況、保存環(huán)境代碼和管理模型版本,為模型部署提供了有序的流程。MLFlow還支持將模型打包為Docker鏡像,便于分發(fā)到Kubernetes等服務(wù)平臺(tái)。

  MLFlow與Kubernetes的集成,有一個(gè)關(guān)鍵點(diǎn)需要注意,雖然MLFlow提供了基于FastAPI的推理服務(wù)器,并通過mlflow models build-docker命令支持容器化部署,但這種方法在大規(guī)模生產(chǎn)環(huán)境中可能不夠高效。FastAPI的輕量級(jí)特性使其難以應(yīng)對(duì)極端并發(fā)或復(fù)雜的自動(dòng)伸縮模式。相比之下,KServe(前身為KFServing)為TensorFlow、XGBoost、scikit-learn和PyTorch等主流機(jī)器學(xué)習(xí)庫(kù)提供了高性能、可擴(kuò)展且與框架無關(guān)的推理平臺(tái)。

  更好地托管AutoML,把Azure ML轉(zhuǎn)為AKS

  首先,Azure ML與AKS進(jìn)行集成。Azure ML是一個(gè)全面的機(jī)器學(xué)習(xí)生命周期管理平臺(tái),支持實(shí)驗(yàn)跟蹤、模型注冊(cè)表、訓(xùn)練、部署和監(jiān)控。對(duì)于需要高度控制運(yùn)行時(shí)、擴(kuò)展和網(wǎng)絡(luò)的場(chǎng)景,Azure Kubernetes Service(AKS)是一個(gè)理想的選擇。它允許自定義運(yùn)行時(shí)、進(jìn)行嚴(yán)格的性能調(diào)整,并與現(xiàn)有Kubernetes基礎(chǔ)設(shè)施集成。

  其次,進(jìn)行分步操作,在AKS上部署Azure ML AutoML模型。

  讓Kubernetes上的LLM服務(wù)更好地運(yùn)行,還需要vLLM與KServe的集成。接下來的問題是,如何把LLM與Kubernetes進(jìn)行結(jié)合?在Kubernetes上運(yùn)行大型語(yǔ)言模型(LLM)可以實(shí)現(xiàn)可靠、可擴(kuò)展且可重復(fù)的推理。Kubernetes提供了GPU調(diào)度、自動(dòng)伸縮和基本功能編排,而vLLM等優(yōu)化運(yùn)行時(shí)則提供了高通量、高內(nèi)存效率的推理能力。通過結(jié)合請(qǐng)求批處理和可觀測(cè)性(指標(biāo)、日志記錄和健康檢查),可以提供低延遲的API服務(wù)。

  使用vLLM和KServe部署LLM的步驟如下:

  1.準(zhǔn)備集群和KServe。配置Kubernetes集群(AKS/GKE/EKS或本地),并安裝KServe。

  2.獲取vLLM。克隆vLLM倉(cāng)庫(kù),安裝vLLM,并在本地測(cè)試vllm serve命令。

  3.創(chuàng)建vLLM服務(wù)運(yùn)行時(shí)/容器。構(gòu)建容器鏡像,或使用KServe支持的vLLM服務(wù)時(shí)間配置。

  4.部署InferenceService。應(yīng)用KServe InferenceService YAML文件,引用vLLM服務(wù)的運(yùn)行時(shí)和模型存儲(chǔ)。

  5.驗(yàn)證和調(diào)諧。通過Ingress/負(fù)載均衡器調(diào)用端點(diǎn),測(cè)量延遲/吞吐量,并調(diào)整vLLM批處理/令牌緩存設(shè)置和KServe自動(dòng)伸縮規(guī)則。

  另外, vLLM、KServe,還要與BentoML進(jìn)行集成。vLLM,作為高通量、GPU高效的推理引擎,負(fù)責(zé)實(shí)際執(zhí)行LLM;BentoML,封裝模型加載、自定義預(yù)處理/后處理以及穩(wěn)定的REST/gRPC API,構(gòu)建可重復(fù)的Docker鏡像或工件;KServe,作為Kubernetes控制平面,部署B(yǎng)ento鏡像或vLLM鏡像,并處理自動(dòng)伸縮、路由、健康檢查和生命周期管理。最終,通過BentoML打包模型和請(qǐng)求邏輯,KServe將該容器以InferenceService的形式運(yùn)行,提供自動(dòng)伸縮、流量控制和可觀測(cè)性。

  值得一提的是,不同的技術(shù)路線選擇,都有自己的優(yōu)缺點(diǎn)。KServe作為Kubernetes-原生機(jī)器學(xué)習(xí)服務(wù)與編排框架,提供了豐富的路由、內(nèi)置遙測(cè)和解釋器集成以及多運(yùn)行時(shí)支持,但學(xué)習(xí)曲線較陡,操作面較大。BentoML以Python為中心,提供了出色的開發(fā)者人體工學(xué)設(shè)計(jì)和可重復(fù)的圖像,但集群原生控件較少。NVIDIA Triton推理服務(wù)器則以其出色的GPU吞吐量和混合幀支持著稱,但同樣需要額外的設(shè)置來實(shí)現(xiàn)自動(dòng)伸縮和高級(jí)Kubernetes操作。

  結(jié)論

  在生產(chǎn)環(huán)境中運(yùn)行可靠、低延遲的AI/ML應(yīng)用,同時(shí)控制成本、性能和可重復(fù)性,是每個(gè)ML團(tuán)隊(duì)的目標(biāo)。Kubernetes通過其強(qiáng)大的編排能力,為模型及其支持服務(wù)提供了所需的資源管理和自動(dòng)伸縮功能。結(jié)合優(yōu)化的運(yùn)行時(shí)、服務(wù)層和推理引擎,我們可以在保持高輸入性能的同時(shí),獲得生產(chǎn)級(jí)操作控制。從小處著手,使用單個(gè)模型進(jìn)行驗(yàn)證,然后根據(jù)清晰的SLO選擇符合性能和操作需求的服務(wù)棧,最終迭代出彈性且可擴(kuò)展的服務(wù)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
特斯拉車主:Model 3 + HW4.0 買完 FSD 秒推送!

特斯拉車主:Model 3 + HW4.0 買完 FSD 秒推送!

新浪財(cái)經(jīng)
2026-03-29 13:56:50
春天買魚,這3種魚全是野生海魚,不能人工養(yǎng)殖,肉質(zhì)鮮嫩營(yíng)養(yǎng)高

春天買魚,這3種魚全是野生海魚,不能人工養(yǎng)殖,肉質(zhì)鮮嫩營(yíng)養(yǎng)高

阿龍美食記
2026-03-27 16:09:42
人民日?qǐng)?bào)也發(fā)了粉底液將軍,居然有粉絲去沖人民日?qǐng)?bào),勸都勸不住

人民日?qǐng)?bào)也發(fā)了粉底液將軍,居然有粉絲去沖人民日?qǐng)?bào),勸都勸不住

芊手若
2026-03-29 04:06:34
崩得最徹底的專業(yè),網(wǎng)友哭訴:孩子600多分進(jìn)的,如今找不到工作

崩得最徹底的專業(yè),網(wǎng)友哭訴:孩子600多分進(jìn)的,如今找不到工作

黯泉
2026-03-28 20:41:06
現(xiàn)場(chǎng)照片曝光,E3“哨兵”預(yù)警機(jī)遭到重創(chuàng),機(jī)體中部被炸斷

現(xiàn)場(chǎng)照片曝光,E3“哨兵”預(yù)警機(jī)遭到重創(chuàng),機(jī)體中部被炸斷

三叔的裝備空間
2026-03-29 11:15:19
“只要愿意賣,啥電腦都收”,二手舊電腦回收行情大漲,回收商:漲幅遠(yuǎn)超手機(jī)價(jià)格,翻了5倍,16G內(nèi)存條幾十塊錢,漲到了五六百

“只要愿意賣,啥電腦都收”,二手舊電腦回收行情大漲,回收商:漲幅遠(yuǎn)超手機(jī)價(jià)格,翻了5倍,16G內(nèi)存條幾十塊錢,漲到了五六百

觀威海
2026-03-28 18:47:03
沙特油輪繞開霍爾木茲抵達(dá)日本:世界油閥,被一腳踹開了!

沙特油輪繞開霍爾木茲抵達(dá)日本:世界油閥,被一腳踹開了!

老馬拉車莫少裝
2026-03-29 11:19:25
19歲大學(xué)生熬夜后頭暈?zāi)X出血致癱,此前常熬夜直播和備貨 康復(fù)訓(xùn)練后已能走幾步

19歲大學(xué)生熬夜后頭暈?zāi)X出血致癱,此前常熬夜直播和備貨 康復(fù)訓(xùn)練后已能走幾步

紅星新聞
2026-03-28 20:15:13
第一批受害者已出現(xiàn)!多人跟風(fēng)!緊急提醒:千萬(wàn)別碰、別吃!

第一批受害者已出現(xiàn)!多人跟風(fēng)!緊急提醒:千萬(wàn)別碰、別吃!

林子說事
2026-03-29 14:53:01
伊朗自己都沒想到,摸了這么大個(gè)獎(jiǎng)!美軍出現(xiàn)大戰(zhàn)損,E3G被毀?

伊朗自己都沒想到,摸了這么大個(gè)獎(jiǎng)!美軍出現(xiàn)大戰(zhàn)損,E3G被毀?

共工之錨
2026-03-29 14:26:08
臺(tái)中市長(zhǎng)盧秀燕發(fā)布聲明

臺(tái)中市長(zhǎng)盧秀燕發(fā)布聲明

果媽聊娛樂
2026-03-29 10:00:45
一句顧客像狗,羅技兩天蒸發(fā)5.7億:毀掉深耕30年的中國(guó)市場(chǎng)!

一句顧客像狗,羅技兩天蒸發(fā)5.7億:毀掉深耕30年的中國(guó)市場(chǎng)!

有范又有料
2026-03-28 18:38:15
張雪峰追悼會(huì)現(xiàn)場(chǎng)畫面流出:前妻和現(xiàn)任均現(xiàn)身,11女兒哭倒在現(xiàn)場(chǎng)

張雪峰追悼會(huì)現(xiàn)場(chǎng)畫面流出:前妻和現(xiàn)任均現(xiàn)身,11女兒哭倒在現(xiàn)場(chǎng)

博士觀察
2026-03-28 10:31:10
特朗普透露卸任后去向,想當(dāng)幾個(gè)國(guó)的領(lǐng)導(dǎo)人?霍爾木茲海峽變“特朗普海峽”?

特朗普透露卸任后去向,想當(dāng)幾個(gè)國(guó)的領(lǐng)導(dǎo)人?霍爾木茲海峽變“特朗普海峽”?

新民周刊
2026-03-29 08:55:09
為啥越來越多人開始懷疑學(xué)歷?上世紀(jì)70年代的諾獎(jiǎng)?wù)撐脑缇驼f清了

為啥越來越多人開始懷疑學(xué)歷?上世紀(jì)70年代的諾獎(jiǎng)?wù)撐脑缇驼f清了

知識(shí)圈
2026-03-29 13:10:14
體檢都出毛病了,連馬拉松參賽資格都被取消,當(dāng)事人硬是不信邪。

體檢都出毛病了,連馬拉松參賽資格都被取消,當(dāng)事人硬是不信邪。

歲月有情1314
2026-03-29 08:19:26
麻將、關(guān)系、性生活是縣城的底色!

麻將、關(guān)系、性生活是縣城的底色!

黯泉
2026-03-28 15:09:09
以色列最擔(dān)心的事發(fā)生:伊朗送出“大禮”,特朗普的反應(yīng)出人意料

以色列最擔(dān)心的事發(fā)生:伊朗送出“大禮”,特朗普的反應(yīng)出人意料

空天力量
2026-03-28 17:14:31
155億賠償落地!澳洲認(rèn)賠止損,巴拿馬震動(dòng),全球投資規(guī)則再警示

155億賠償落地!澳洲認(rèn)賠止損,巴拿馬震動(dòng),全球投資規(guī)則再警示

世界圈
2026-03-29 02:40:03
終于有了結(jié)果,曾醫(yī)生能保住醫(yī)院的工作,最應(yīng)該感謝的三位貴人!

終于有了結(jié)果,曾醫(yī)生能保住醫(yī)院的工作,最應(yīng)該感謝的三位貴人!

凌風(fēng)的世界觀
2025-11-14 08:38:31
2026-03-29 16:27:00
ITPUB學(xué)院
ITPUB學(xué)院
分享技術(shù)干貨,了解最新動(dòng)態(tài)
1190文章數(shù) 629關(guān)注度
往期回顧 全部

科技要聞

馬斯克承認(rèn)xAI"建錯(cuò)了",11位創(chuàng)始人均離職

頭條要聞

美軍地面戰(zhàn)"數(shù)周速?zèng)Q"方案披露 欲復(fù)刻"42天滅伊"神話

頭條要聞

美軍地面戰(zhàn)"數(shù)周速?zèng)Q"方案披露 欲復(fù)刻"42天滅伊"神話

體育要聞

絕殺衛(wèi)冕冠軍后,他單手指天把勝利獻(xiàn)給父親

娛樂要聞

張凌赫事件持續(xù)升級(jí)!官方點(diǎn)名怒批

財(cái)經(jīng)要聞

Kimi、Minimax 們的算力荒

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達(dá)/華為新一代座艙

態(tài)度原創(chuàng)

親子
本地
教育
家居
房產(chǎn)

親子要聞

我們的爸爸看到安集哥哥呀...

本地新聞

在濰坊待了三天,沒遇到一個(gè)“濰坊人”

教育要聞

對(duì)于青春期的孩子,家長(zhǎng)一定要進(jìn)行嚴(yán)肅的防欺凌和隱私保護(hù)教育

家居要聞

曲線華爾茲 現(xiàn)代簡(jiǎn)約

房產(chǎn)要聞

首日430組來訪,單日120組認(rèn)籌!??谑讉€(gè)真四代,徹底爆了!

無障礙瀏覽 進(jìn)入關(guān)懷版