在嵌入式世界里,微控制器很重要,卻常常被忽視,以至于很少出現(xiàn)在任何技術(shù)浪潮的宏大討論中。但正是這些數(shù)以千萬計的芯片,支撐著工業(yè)系統(tǒng)的穩(wěn)定運(yùn)行、家電設(shè)備的日常響應(yīng),以及無數(shù)傳感器與執(zhí)行器之間的基本邏輯。
即便是AI來臨時,MCU也只負(fù)責(zé)確定性控制,把復(fù)雜計算和智能留給了應(yīng)用處理器及云端,這種分層不僅清晰,而且更加的經(jīng)濟(jì)高效。
如今,這種穩(wěn)定正在被打破。
以Agent AI為代表,證明邊緣端也可以有一定的AI能力,這時既不需要也不能夠把所有AI能力都交給云端。同樣,對于更邊緣的產(chǎn)品而言,AI能力也變得重要,比如語音喚醒不能等待網(wǎng)絡(luò)返回,工業(yè)異常檢測不能依賴遠(yuǎn)程決策,可穿戴設(shè)備更無法承受持續(xù)的數(shù)據(jù)上傳。
德州儀器(TI)將邊緣AI趨勢歸結(jié)為四個維度:響應(yīng)速度、功耗、隱私與可靠性。這些因素最終指向同一個方向,計算必須回到數(shù)據(jù)誕生的地方。
MCU能否承載AI?
當(dāng)計算位置發(fā)生變化,MCU的角色也被迫改變。它不再只是執(zhí)行預(yù)設(shè)邏輯,而開始面對原始數(shù)據(jù),這意味著它需要具備一定的理解能力。
但問題在于,MCU是否承載得起AI?
長期以來,答案是否定的。MCU的資源約束決定了它難以運(yùn)行復(fù)雜模型,而一旦引入AI計算,又會直接影響實(shí)時控制的確定性。
也正因?yàn)槿绱耍吘堿I在過去幾年主要停留在高性能處理器、SoC或者至少是高端MCU上,比如最起碼也要意法的STMN6,或者英飛凌PSoC Edge等MCU中,這些MCU的性能甚至達(dá)到了SoC的水平,以至于被視為正在跨界SoC的產(chǎn)品。
但是,并不一定所有AI MCU都需要更高級的處理器以及更大的存儲空間,比如TI選擇了一條更具挑戰(zhàn)性的路徑:不是讓MCU變成處理器,而是讓AI適應(yīng)MCU。
讓AI與控制并行存在
德州儀器 MSP 微控制器產(chǎn)品線經(jīng)理羅一丁提出了一句高度概括性的判斷:“AI不應(yīng)該只存在于云端,而應(yīng)該無處不在地運(yùn)行在每一個嵌入式設(shè)備中。”AI的普適性給了MCU更多的發(fā)展空間。
但是也如德州儀器 ASM 微控制器工業(yè)業(yè)務(wù)負(fù)責(zé)人吳健鴻所述:“如果用CPU去跑AI模型,它就無法同時做好電機(jī)控制。”
也就是說MCU很難承載AI的根本原因——資源沖突。
TI的解決方式,是在MCU內(nèi)部引入TinyEngine NPU,并通過硬件層面的任務(wù)劃分,讓兩種本質(zhì)不同的計算同時存在:
CPU負(fù)責(zé)實(shí)時控制,NPU負(fù)責(zé)AI推理
吳健鴻給出了清晰的總結(jié):“我們加入NPU的核心原因,就是為了讓AI運(yùn)算和實(shí)時控制可以并行,而不是互相干擾。”
這并不是一次簡單的性能升級,而是一次架構(gòu)上的解耦。它讓中低性能的MCU第一次可以在不破壞確定性及低延遲的前提下,引入非確定性的智能計算。
![]()
TinyEngine NPU非常適配功耗、成本均受限的AI場景中
TinyEngine NPU 核心優(yōu)勢
![]()
根據(jù)TI的官方闡述,TinyEngine NPU 突破了長期以來制約嵌入式人工智能廣泛普及的關(guān)鍵設(shè)計瓶頸,具備以下優(yōu)勢:
1.相較于純軟件實(shí)現(xiàn)的人工智能方案,單次推理能耗降低至 1/120,延遲降低至 1/90
2.算力達(dá) 2.56 GOPS,可支撐深度學(xué)習(xí)模型的實(shí)時邊緣 AI 推理。
3.支持 8 比特、4 比特、2 比特量化及混合精度配置,支持原位運(yùn)算,有效解決存儲容量受限問題。
4.兼容多種神經(jīng)網(wǎng)絡(luò)層類型,包括卷積層(常規(guī)卷積、深度卷積、逐點(diǎn)卷積、轉(zhuǎn)置卷積)、全連接層、池化層(平均池化、最大池化),并支持批歸一化。
5.簡化工具鏈降低開發(fā)復(fù)雜度,開發(fā)周期從數(shù)周縮短至數(shù)小時。
可以看出,TinyEngine并不試圖對標(biāo)高端SoC,但它的目標(biāo)更明確——在超低功耗和低成本下,完成足夠好的AI推理。
![]()
![]()
比如在TI的一個演示中,使用Arm CPU處理手寫識別模型時延達(dá)到了91ms,而使用NPU時,處理速度僅為6ms,提升了15倍之多。
一美元的AI:邊緣AI的分水嶺
TI正在把AI能力推向更低成本區(qū)間。
MSPM0G5187的定價頗具象征意義。這顆基于Cortex-M0+的MCU,在集成2.56 GOPS NPU的同時,將價格壓低至1美元以內(nèi),使AI第一次進(jìn)入大規(guī)模成本敏感市場。
![]()
MSPM0G5187產(chǎn)品框圖
羅一丁在發(fā)布中提到:“很多邊緣AI應(yīng)用過去無法落地,并不是沒有需求,而是受限于功耗、成本和尺寸。”
當(dāng)這些約束被打破時,AI可以以更低成本進(jìn)入此前的智能設(shè)備中。例如在MSPM0G5187的AI示例展示中,可應(yīng)用于包括智能家居設(shè)備中的喚醒詞檢測、可穿戴健康監(jiān)測設(shè)備中的手勢與活動監(jiān)測甚至工業(yè)電機(jī)中的電機(jī)振動檢測等等,這些AI應(yīng)用不再依賴云端,而是在本地完成。
這種變化的關(guān)鍵不在于更強(qiáng),而在于更普及。
從執(zhí)行控制到參與決策
相比MSPM0系列在低功耗場景中的擴(kuò)展,AM13Ex系列則體現(xiàn)了另一種方向:AI正在深入控制系統(tǒng)內(nèi)部。
AM13Ex的重點(diǎn)不止是NPU,而是NPU真正結(jié)合了實(shí)時控制能力。實(shí)際上,此前TI已經(jīng)在C2000中集成了NPU。如今,在TI Arm實(shí)時控制MCU體系中,也同樣集成了NPU,使得產(chǎn)品體系更為廣泛。
無論是20多年間的C2000系列,還是TI如今的Arm實(shí)時控制產(chǎn)品線,始終圍繞一個核心目標(biāo)展開:如何在復(fù)雜系統(tǒng)中保持確定性與高精度控制。而AI的加入,并不是替代這一體系,而是增強(qiáng)它。
![]()
AM13Ex產(chǎn)品框圖,以及應(yīng)用于洗衣機(jī)中的示例
吳健鴻舉例道:“在光伏系統(tǒng)的電弧檢測中,傳統(tǒng)方法大約85%的準(zhǔn)確率,而通過TI的NPU,AI可以將準(zhǔn)確率提升到超過99%。”
這種提升并不僅僅意味著更好,而是在很多場景中意味著從不可用變?yōu)榭捎谩@缭陔姍C(jī)的軸承的故障檢測、洗衣機(jī)負(fù)載平衡、電池健康檢測、風(fēng)機(jī)負(fù)載失衡檢測,空調(diào)系統(tǒng)優(yōu)化,控制算法優(yōu)化等等更多功能。
![]()
NPU在電機(jī)控制中的應(yīng)用舉例
更關(guān)鍵的是,這一切并沒有打破原有控制架構(gòu)。吳健鴻特別強(qiáng)調(diào):“CPU還是專注做控制,NPU去做判斷,兩者是分工協(xié)作的關(guān)系。”
在這種架構(gòu)下,MCU不再只是執(zhí)行控制算法,而是開始參與決策過程本身。這標(biāo)志著其角色從控制器向系統(tǒng)節(jié)點(diǎn)的轉(zhuǎn)變。
值得一提的是,在電機(jī)控制領(lǐng)域,TI提供了兩大選擇,既有傳統(tǒng)的C2000產(chǎn)品線,同時也有基于Arm的產(chǎn)品線。“客戶已經(jīng)在Arm生態(tài)中積累了大量代碼,我們必須讓他們在不改變體系的前提下,也能用上C2000的各種實(shí)時控制與外設(shè)的能力。”吳健鴻說道。
MCU競爭正在發(fā)生轉(zhuǎn)移
當(dāng)MCU開始具備AI能力,其競爭維度也隨之改變。但競爭已經(jīng)不再局限于參數(shù)或價格,而是延伸到系統(tǒng)能力與開發(fā)效率。與此同時,SoC廠商與新興AI芯片公司也在向下滲透,試圖以更強(qiáng)算力覆蓋MCU場景。
在這樣的多重競爭中,TI的策略并不是單點(diǎn)突破,而是構(gòu)建完整的系統(tǒng)AI能力,包括C7 NPU(已應(yīng)用于TDA54-Q1 與 TDA4VEQ1 SoC中),以及TinyEngine。另外值得一提的是,TI更是從模擬信號鏈到控制,再到AI推理,其能力覆蓋了一整條技術(shù)路徑。
TI始終強(qiáng)調(diào)其從傳感到AI的整體能力,這種整合,使MCU不再是孤立器件,而成為系統(tǒng)架構(gòu)中的關(guān)鍵節(jié)點(diǎn)。
羅一丁強(qiáng)調(diào),在邊緣 AI 領(lǐng)域,大家很容易陷入單純的跑分競賽,但真正的商業(yè)落地看重的是綜合效能——如何提供更好的算力與能耗比,而非單純依賴云端 AI。
AI需要可擴(kuò)展性
為了迎接邊緣AI萬物時代的到來,產(chǎn)品需要考慮演進(jìn)與擴(kuò)展。工程師們不愿花費(fèi)數(shù)月時間基于某款微處理器開發(fā)解決方案,卻在產(chǎn)品升級至更高性能處理器時不得不從頭再來。也正因此,芯片廠商需要打造在功能、性能和成本上均具備可擴(kuò)展性的產(chǎn)品系列。這一思路有助于確保其各類人工智能嵌入式處理器之間實(shí)現(xiàn)無縫遷移,讓開發(fā)者能夠盡可能簡便地在不同器件間復(fù)用已有開發(fā)成果。邊緣AI同樣遵循這一規(guī)律。例如,設(shè)計家用機(jī)器人的開發(fā)者可能希望同時推出兩款產(chǎn)品:一款配備三個攝像頭、具備環(huán)視視覺功能的高端版本,以及一款僅搭載單個前置攝像頭的入門級版本。
具備可擴(kuò)展性的邊緣 AI 加速器件產(chǎn)品系列,能夠支持軟件從高端機(jī)型移植到入門級機(jī)型,最大限度減少兩款產(chǎn)品的開發(fā)資源投入。可擴(kuò)展性還能讓開發(fā)者在產(chǎn)品迭代過程中,將研發(fā)投入從一個平臺延續(xù)至下一個平臺。
TinyEngine NPU就是一個最好的例子。
正如上文所述,搭載 TinyEngine NPU 的德州儀器微控制器目前包括以下三款已發(fā)布的產(chǎn)品。
TMS320F28P550SJ該芯片屬于 C2000 系列 TMS320F28P55x 微控制器,其內(nèi)置 NPU 可分擔(dān)主 CPU 的 AI 推理任務(wù)。
AM13E230x該系列基于 Arm CortexM33 內(nèi)核,通過集成 NPU 與先進(jìn)實(shí)時控制架構(gòu),在家電、機(jī)器人及工業(yè)系統(tǒng)中實(shí)現(xiàn)自適應(yīng)控制與預(yù)測性維護(hù)。
MSPM0G5187該系列為 80MHz Arm CortexM0+ 內(nèi)核微控制器,隸屬于 TI MSPM0 產(chǎn)品家族,借助 NPU 在高性價比、低功耗電子設(shè)備中實(shí)現(xiàn)邊緣 AI 能力。
另外,TI還開發(fā)了C7 NPU,這是一款高性能、低功耗的人工智能加速器,集成于 TDA54-Q1 與 TDA4VEQ1 系統(tǒng)級芯片(SoC)中,以滿足視覺類應(yīng)用的算力需求。
![]()
軟件成為關(guān)鍵開發(fā)體驗(yàn)
除了硬件架構(gòu),軟件正在成為另一個決定性因素。
羅一丁表示,開發(fā)者對工具鏈的重視程度往往超乎硬件本身。TI 提供的工具能讓傳統(tǒng)的嵌入式工程師在幾天內(nèi)跑通 AI 模型,而不是幾周,這種易用性是TI的核心軟實(shí)力。
吳健鴻表示,目前TI提供了兩套IDE,一是傳統(tǒng)的 CCStudio 集成開發(fā)環(huán)境,內(nèi)置 TI 專屬編譯器,同時增加 AI 輔助功能,大幅降低軟件開發(fā)門檻。二是 CCStudio Edge AI Studio,這款工具面向客戶免費(fèi)開放,覆蓋 AI 設(shè)計全流程——不僅可快速搭建適配模型,還能完成數(shù)據(jù)采集、神經(jīng)網(wǎng)絡(luò)選型與優(yōu)化、模型訓(xùn)練及跨 MCU 部署等工作。
目前,TI的Edge AI Studio提供了已提供超過 60 種模型和應(yīng)用示例,工程師可直接導(dǎo)入評估。
![]()
如圖所示,Edge AI Studio支持各類分類、檢測、時序等等AI應(yīng)用。
TI的CCS開始支持生成式AI
隨著大語言模型的普及,vibe coding正在擴(kuò)展至各類編程工具中,嵌入式同樣如此。在2026 Embedded World上,德州儀器展示了CCStudio生態(tài)系統(tǒng)中集成的生成式 AI,通過集成 Claude Code 接口,設(shè)計人員能結(jié)合 TI 豐富的示例庫加快代碼開發(fā)與系統(tǒng)配置。
羅一丁提到:“工程師可以用自然語言生成代碼,在幾分鐘內(nèi)完成部署。”這不僅降低了門檻,也在改變嵌入式開發(fā)邏輯本身。
![]()
TI已經(jīng)展示了一系列利用生成式AI加速嵌入式開發(fā)的示例。
![]()
如圖所示,CCS接入了Claude Code,自然語言描述如下:我擁有一塊MSPM0G3507 LaunchPad開發(fā)板和一塊BOOSTXL-EDUMKII擴(kuò)展板。請利用L-C 搖桿與按鍵實(shí)現(xiàn)一個打磚塊游戲,并使用蜂鳴器播放音效。游戲開始前,需加入搖桿校準(zhǔn)步驟。
用戶輸入這些自然語言之后,CCS便會自動進(jìn)行執(zhí)行系統(tǒng)配置,代碼編寫等等功能。
羅一丁說道:“未來會看到更多的工程師利用 AI 的代碼生成功能,實(shí)現(xiàn)研發(fā)周期的縮短,我非常鼓勵大家自己去下載并嘗試這些AI強(qiáng)大的功能。”
MCU重新成為系統(tǒng)的核心節(jié)點(diǎn)
從更宏觀的角度來看,MCU當(dāng)然并沒有被AI時代淘汰,反而因?yàn)锳I的引入獲得了新的生命力。只是這種變化,不再體現(xiàn)在單一性能指標(biāo)上,而體現(xiàn)在其在系統(tǒng)中的位置變化。
它正在成為最靠近物理世界的數(shù)據(jù)處理與決策節(jié)點(diǎn)。
這也解釋了為什么像TI這樣的公司,既有TDA5這樣更強(qiáng)大1200 TOPS算力的處理器,同時也有集成MOPS或者GOPS算力的MCU。
正如吳健鴻在談到MCU在人形機(jī)器人應(yīng)用時所指出的:“如果所有數(shù)據(jù)都回到大腦再做決策,就一定會有延遲。”
這句話實(shí)際上給出了邊緣AI最本質(zhì)的邏輯:AI必須以分布式存在。而MCU,正是這種分布式智能中最基礎(chǔ)、也最關(guān)鍵的節(jié)點(diǎn)。
當(dāng)系統(tǒng)復(fù)雜度不斷提升時,那些在底層穩(wěn)定運(yùn)行的組件,則會成為決定系統(tǒng)下限的關(guān)鍵。
MCU不會消失,但它正在完成一次角色轉(zhuǎn)變——從單純的執(zhí)行走向AI系統(tǒng)的邊緣。
1978 年 TI 發(fā)明了數(shù)字信號處理技術(shù),為未來的人工智能發(fā)展鋪平了道路。四十年過去,如今的這場變化,也才剛剛開始。
來源:電子工程世界(EEWorld) 作者:冀凱
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.