快科技3月10日消息,嵌入式,一個極為廣闊的市場。從ATM取款機到超市零售終端,從醫院工廠到最新機器人,可以說嵌入式無處不在,與每個人的生活都息息相關。
眾多行業廠商對于嵌入式領域也是非常投入,從處理器、顯卡到存儲,產品不斷日新月異。
年初,AMD發布了新一代嵌入式處理器"銳龍AI嵌入式P100系列",首次將銳龍嵌入式產品帶入AI時代。
![]()
銳龍AI嵌入式P100系列又分為兩個不同的子系列,之前發布的面向沉浸式體驗的,比如下一代數字座艙、智能工廠、嵌入式顯示等等,最多6核心。
這次登場的更高端,主打工業自動化、汽車自動駕駛、物理AI(具身智能)等等領域,規格也高得多,核心數量8個起步,最高達到12個。
現如今,智能工業與邊緣計算已經進入了全新的時代,各種新的應用層出不窮,無論是智能自動化,還是AI融合終端,抑或大規模物理AI,都在蓬勃發展。
而在幕后默默貢獻的,除了各種AI大模型、算法和應用,更離不開底層AI硬件的高效支持,這正是銳龍AI嵌入式P100系列處理器大展神威的地方,應用領域也是極為廣闊的。
諸如智能工廠里的工業PC、PLC、HMI(人機交互界面)、工業機械臂,物理AI領域的機器人、機器狗,以及醫療健康、影視廣播、半導體制造與測試,銳龍AI嵌入式P100系列都能如魚得水。
順帶預告一下,今年下半年,AMD還將再接再厲繼續推出"銳龍AI嵌入式X100系列",最多達16個核心,主要用于自動化系統物理AI等尖端領域,驅動AI技術與應用的全新飛躍。
![]()
無論6核心還是12核心,銳龍AI嵌入式P100系列處理器的底層架構是相通的,都源于移動端的Strix Point,也就是銳龍AI 300/400系列。
它采用了異構架構的單芯片設計,一顆芯片內,就集成了Zen 5架構的CPU x86計算引擎、RDNA 3.5架構的GPU AI與圖形引擎、XDNA 2架構的NPU AI引擎,提供性能強大、能效極高的AI計算平臺。
![]()
對比之前的4-6核心版本,這次的8-12核心版本架構不變,但規格、性能更加強大,無論CPU、GPU還是擴展連接性都得到了顯著的增強,比如CPU核心數量增加最多2倍、GPU能力增加最多8倍、系統算力增加最多36%,等等。
其中,CPU部分自然是核心數量更多,最高可提供12核心24線程,加上二級緩存從最多6MB增至最多12MB,三級緩存從最多8MB增至最多24MB,可以更從容地處理更高負載,執行更多并發任務。當然也少不了AVX-512、VNNI指令的強力輔助。
GPU部分從2個WGP工作組(4單元)大幅增至8個WGP工作組(16單元),可以更輕松地應對多屏、大屏、高清屏顯示,以及4K、8K高畫質游戲,當然還有更多的AI圖形類任務。
NPU部分倒是沒變,依舊最高50 TOPS的算力。
擴展連接性方面,可提供多達16條PCIe 4.0通道,用于連接NVMe存儲、攝像頭、協處理器等各種擴展設備,按照需要靈活配置。
內存支持一方面保持DDR5-5600不變,另一方面從LPDDR5X-7500提高到LPDDR5X-8533,從而在空間受限設備中提供更高帶寬,這對于AI類應用是至關重要的。
如果對比上一代的銳龍嵌入式8000系列,新品可以帶來最多39%的多線程性能提升,系統級算力更是提升了最多2.1倍。
![]()
驚喜的是,規格大幅增強的同時,BGA封裝尺寸依然非常迷你的40×25毫米,熱設計功耗范圍也依然是15-54W(標準28W)。
如此對于寸土寸金的嵌入式設備無疑是極為友好的,而且兼容性、通用性極佳,不同平臺的設計可以互通,從而大大降低開發難度和成本。
![]()
如前所述,整個銳龍AI嵌入式P100系列家族,無論是4-6個核心,還是8-12個核心,差別只在于規格和性能高低不同,架構、封裝、BIOS、功耗、兼容性等等都是完全相通的,因此具備極強的靈活性。
客戶無論打造什么樣的產品,從緊湊型工業PC到高端工業視覺再到大型單板系統,只需要根據規格、性能方面的要求,功耗、發熱方面的限制等等因素,選擇最合適的型號即可。
而在發展的過程中有新的需求了,再升級到更高型號也是順理成章的,毫不費力,可以大大縮短產品開發與上市周期。
![]()
這是全系列詳細的SKU型號與規格,此次新增的一共只有三款:
P164i:8核心16線程,8MB二級緩存,16MB三級緩存,5.0GHz加速頻率,12單元GPU,2.8GHz頻率。
P174i:10核心20線程,10MB二級緩存,24MB三級緩存,5.0GHz加速頻率,12單元GPU,2.8GHz頻率。
P185i:12核心24線程,12MB二級緩存,24MB三級緩存,5.1GHz加速頻率,16單元GPU,2.9GHz頻率。
三者其他規格都是一致的,包括:四屏4K120或雙屏8K120視頻輸出、兩個USB4、一個USB 3.2、一個USB 3.1、三個USB 2.0和一個安全BIOS USB、-40℃到105℃工業級溫度范圍等等。
作為嵌入式產品,它們同樣享受2.5年標準生命周期支持,擴展最長可達10年。
![]()
CPU+GPU+NPU三劍客組合,整個平臺的總算力高達80 TOPS。
它們可以單獨或組合滿足各種AI負載,無論是爆發式的還是持續式的,無論是需求高算力還是低時延,都不在話下。
官方稱,新系列可以支持接近2倍數量的虛擬機、更大規模的大語言模型,例如Llama 3.2-Vision 11B,從而推動更先進的AI與混合型工作負載。
![]()
![]()
當然,對于這種異構計算和異構AI,軟件層面的優化至關重要,尤其是NPU、GPU。
得益于AMD ROCm開放軟件生態系統的支持,銳龍嵌入式處理器所運行的嵌入式應用,已經有了一整套經過廣泛驗證的開源AI軟件棧,覆蓋視覺、多模態與語言、動作與控制等各個層面。
開發人員可以在依賴開源編譯器、運行時、庫的同時,運行標準AI框架,并且不需要重新編寫代碼,就可以即時訪問適用于嵌入式的模型。
在編程層面,AMD ROCm軟件采用了開源的HIP(異構計算可移植接口),可以將GPU編程從硬件中解耦釋放出來,也就是使其不再依賴特定廠商的GPU,從而消除軟件棧和硬件之間的供應商鎖定,無論開發還是移植都更加便捷。
當然不能少了CPU,AMD Zen 5核心提供了隔離能力和充足的性能裕量,可以在單個平臺上,以確定性的多任務方式整合多個關鍵工作負載。
銳龍嵌入式處理器這種緊密集成、統一的CPU、GPU、NPU異構架構,一方面可以在任何混合工作負載下,實現高效的工作負載分配,運行在最合適的引擎上,同時確保可預測的低時延,再搭配熟悉的框架和軟件棧,更能在廣泛的不同場景中,大大精簡開發與部署工作。
另一方面,多個高性能引擎的集成,可以不需要任何外部擴展硬件,就能實現先進的計算與圖形性能,廠商能夠更輕松地設計可擴展的強大平臺。
![]()
值得一提的是,AMD還為工業領域的混合關鍵型應用,提供了一個封裝式、垂直整合的虛擬參考堆棧。
它基于Xen虛擬管理程序構建,可在隔離域中運行Linux、Windows、Ubuntu、RTOS系統環境,從而實現安全性、實時性能、靈活性,最終形成可擴展的開放架構,加速下一代嵌入式系統簡化設計。
![]()
![]()
![]()
針對不同的應用場景,銳龍AI嵌入式P100系列處理器和開發軟件棧都做了深度的優化支持,這里簡單舉幾個例子。
用于工業PC的智能機器視覺:
銳龍AI嵌入式P100系列能夠將PLC、HMI整合到同一臺工業PC之中。
強大的CPU性能可滿足實時監測、處理優化的需要,GPU和NPU則可以為多路攝像頭視覺、豐富的HMI儀表板提供支撐。
還支持利用DeepSORT、RAFT-Stereo、CenterPoint、GDR-Net、PaDiM、Llama 3.2-Vision等模型的低時延異常檢測。
用于自主運行的物理AI:
針對移動機器人,銳龍AI嵌入式P100系列可以在CPU上管理導航、運動控制與路徑規劃,GPU則處理多路攝像頭數據,實現空間感知、視覺SLAM、視覺-語言-動作(VLA)等高級AI工作負載。
CPU與GPU之間的統一內存也至關重要,保證了低時延、快速響應。
NPU也沒閑著,可以支持始終在線的低功耗推理,支持基于YOLOv12、MobileSAM等模型的目標檢測與場景理解。
3D醫學成像與臨床智能:
利用U-Net、nnU-Net、MONAI 等模型,銳龍AI嵌入式P100系列可以在邊緣端支持超聲、內窺鏡、組織分類、腫瘤檢測等的3D成像。
借助MedSigLIP加速從成像到報告的工作流程,支持通過Med-PaLM2實現臨床推理與問答能力,以及成像、AI分析、報告功能的整合。
![]()
8-12核心的銳龍AI嵌入式P100系列處理器已經在試產,將在第三季度投入大規模量產,同時配套的開發文檔和工具已經準備就緒。
下半年,AMD還會提供相應的客戶參考開發板,擁有完整的配置和豐富的接口,搭配相應的文檔和工具即可用于嵌入式開發評估,加速產品開發、原型迭代、平臺軟硬件驗證。
![]()
目前,全球多家ODM合作伙伴已經推出基于AMD銳龍AI嵌入式P100系列處理器的解決方案,并均已量產。
包括凌華科技(ADLink)、研華科技(Advantech)、華擎、艾訊(Axiomtek)、康佳特(congatec)、E.E.P.D.、廣積科技(iBASE)、控創(Kontron)、瑞傳科技(Portwell)、藍寶石、SolidRun等等。
4-6核心平臺方案均已上市,8-12核算新版本即將陸續到來。
![]()
銳龍AI嵌入式P100系列處理器8-12核心版本,主要用來打造向工業自動化應用、可全天候運行的AI驅動型系統。
它基于x86 SoC片上系統的可擴展邊緣計算,可提供強大靈活的計算、圖形與AI性能。
可覆蓋從感知到推理全流程的AI加速,異構架構搭配開放軟件棧。
提供全天候的運行能力與工業級的可靠性,完美適合實時運行與長期部署。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.