電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 89|回復(fù): 0
收起左側(cè)

2024年MCU大變局:NPU和64位

[復(fù)制鏈接]

418

主題

418

帖子

4293

積分

四級會員

Rank: 4

積分
4293
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-12-3 11:47:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
關(guān)注+星標(biāo)公眾,不錯過精彩內(nèi)容
作者 | 付斌
出品 | 電子工程世界
今年非常流行一句話,叫做“無AI,不終端”。在MCU領(lǐng)域,也正在進(jìn)行著邊緣AI和TinyML的革命。對于MCU來說,跑AI也是非常重點(diǎn)的應(yīng)用之一。前兩天,就連實(shí)時控制派系的MCU TI C2000都開始搭載NPU和64位化。可見,MCU正在加速向AI進(jìn)化。
帶NPU的C2000:能干什么


TI在最近推出的兩款MCU,第一款是業(yè)界首款具有集成神經(jīng)處理單元(NPU)的實(shí)時微控制器產(chǎn)品組合TMS320F28P55x系列(簡稱F28P55x系列),可實(shí)現(xiàn)高精度和低延遲的故障檢測。F28P55x系列中的NPU從主CPU卸載了神經(jīng)網(wǎng)絡(luò)模型的執(zhí)行,與軟件實(shí)現(xiàn)相比,延遲降低了5~10倍,從而實(shí)現(xiàn)更快、更準(zhǔn)確的決策。此外,在集成NPU上運(yùn)行的模型通過訓(xùn)練學(xué)習(xí)并適應(yīng)不同環(huán)境,可以幫助系統(tǒng)實(shí)現(xiàn)超過99%的故障檢測準(zhǔn)確率,從而在邊緣做出更明智的決策。從官方的Datasheet來看,F(xiàn)28P55x的實(shí)時內(nèi)核采用C28x系列的32位150MHz DSP MCU,通過浮點(diǎn)單元(FPU)、三角函數(shù)數(shù)學(xué)單元(TMU)和VCRC(循環(huán)冗余檢查)擴(kuò)展指令集得到進(jìn)一步增強(qiáng),加快了實(shí)時控制系統(tǒng)中關(guān)鍵的通用算法的速度;擁有獨(dú)立的32位浮點(diǎn)加速器150MHZ CLA,其擁有專用內(nèi)存資源,可以直接訪問典型控制系統(tǒng)中所需的鍵外圍設(shè)備;NPU具有600~1200MOPS(每秒百萬操作)的能力(600MOPS at75MHz on 8bWx8bD,1200MOPS at 75MHz on 4bWx8bD),與僅基于軟件的實(shí)現(xiàn)相比,NP最多可提供10倍的NN推理周期改進(jìn)。

帶NPU有什么用?根據(jù)TI官方的介紹,工程師面臨的挑戰(zhàn)是設(shè)計能夠?qū)崟r做出準(zhǔn)確、智能決策的系統(tǒng),以執(zhí)行太陽能和儲能系統(tǒng)中的電弧故障檢測以及用于預(yù)測性維護(hù)的電機(jī)軸承故障檢測等功能。而TI新型的F28P55x系列通過確保實(shí)時處理的一致性能來應(yīng)對這兩個挑戰(zhàn)。
若要維持電機(jī)驅(qū)動和太陽能系統(tǒng)的可靠運(yùn)作,需要快速且可預(yù)測的系統(tǒng)故障偵測,以協(xié)助減少誤報,同時也需監(jiān)控電機(jī)軸承異常和實(shí)際故障。支持邊緣AI的MCU可監(jiān)控兩種類型的故障:當(dāng)電機(jī)軸承出現(xiàn)異常狀況或劣化時,就會發(fā)生電機(jī)軸承故障。檢測這些故障對于防止意外故障、減少停機(jī)時間和降低維護(hù)成本十分重要。太陽能電弧故障是指當(dāng)電流流經(jīng)非預(yù)期路徑(如空氣) 時發(fā)生的電弧放電。太陽能電弧故障通常是由太陽能系統(tǒng)中出現(xiàn)絕緣崩潰、連接松動或其他故障所引起。放電會產(chǎn)生強(qiáng)烈的熱量,導(dǎo)致火災(zāi)或損壞電氣系統(tǒng)。監(jiān)控與偵測太陽能電弧故障有助于預(yù)防危險事件的發(fā)生,并確保太陽能系統(tǒng)的安全性與可靠性。上述兩種故障,傳統(tǒng)人工判讀或者分析頻域電流信號再套用閾值式規(guī)則來檢測電弧故障信號需要大量系統(tǒng)專業(yè)只是,在適應(yīng)性和靈敏度等方面存在限制。適用于馬達(dá)軸承和電弧故障檢測的CNN模型可從振動信號等原始傳感器數(shù)據(jù)中學(xué)習(xí)復(fù)雜的模式,然后檢測指示軸承故障的微妙變化。通過在MCU執(zhí)行CNN模型,可能有助于提高故障偵測率,進(jìn)而協(xié)助避免誤報,同時提供更佳的預(yù)測性維護(hù)。透過邊緣AI,這些系統(tǒng)可以學(xué)習(xí)并適應(yīng)其環(huán) 境,以便優(yōu)化實(shí)時控制,提高整體系統(tǒng)可靠性、安全性和效率,同時減少停機(jī)時間。對于馬達(dá)驅(qū)動,CNN可以根據(jù)振動或電流信號識別故障模式,例如軸承磨損或轉(zhuǎn)子不平衡。在太陽能系統(tǒng)中,CNN可檢測 DC 電流波形的異常,以進(jìn)行電弧故障檢測。在電池管理應(yīng)用中,CNN 模型可以分析電池充電曲線 壽命、電池健康狀況監(jiān)控和電池充電狀態(tài)評估。其適應(yīng)性可確保在動態(tài)條件下準(zhǔn)確偵測故障,同時實(shí)時處理則能優(yōu)化效率。

64位C2000:比32位C28強(qiáng)2~5倍


第二款產(chǎn)品為F29H85x系列,它基于TI的新型64位C29 DSP CPU內(nèi)核構(gòu)建,提供具有集成功能安全和信息安全功能的高級架構(gòu)。官方介紹,基于C29內(nèi)核的MCU,性能是以前TI C28內(nèi)核產(chǎn)品和市場上其MCU的2~5倍。官方Datasheet顯示,F(xiàn)29H85x系列實(shí)時控制子系統(tǒng)具有多達(dá)三個200MHz C29x DSP內(nèi)核。C29x支持從片上閃存或RAM運(yùn)行的32位和64位浮點(diǎn)和定點(diǎn)信號處理。器件包含許多功能,以支持系統(tǒng)級ASIL-D功能安全解決方案。C29x CPU1和CPU2內(nèi)核可以鎖步,用于檢測永久和瞬態(tài)故障。C29核心的創(chuàng)新包括:重新設(shè)計的平臺:采用VLIW架構(gòu)并配備完全保護(hù)的流水線,能夠?qū)崿F(xiàn)多達(dá)8條指令的并行執(zhí)行。新的編譯器:通過基于LLVM/Clang的編譯器提高性能,無需自定義編碼或匯編即可實(shí)現(xiàn)性能提升。重新設(shè)計的中斷性能:硬件支持快速的自動上下文保存和恢復(fù),以應(yīng)對實(shí)時中斷。新的中斷控制器允許完全用戶配置中斷優(yōu)先級和閾值。增強(qiáng)的平臺性能:具備低延遲的內(nèi)存和外設(shè)互連設(shè)計,內(nèi)置安全和保護(hù)功能,增強(qiáng)保護(hù)的同時保持最大實(shí)時性能。

F29H85x系列MCU的應(yīng)用主要瞄準(zhǔn)電動汽車實(shí)時控制方面。
根據(jù)官方文檔,使用F29H85x系列MCU,設(shè)計人員可以同步分配MCU三個內(nèi)核中的兩個,以處理主機(jī)MCU所需的關(guān)鍵功能,例如AUTOSAR和ASIL-D完整性級別的關(guān)鍵安全和安保任務(wù),而其余內(nèi)核則處理系統(tǒng)中的控制功能。C29核心與安全與防護(hù)單元(SSU)的集成,實(shí)現(xiàn)了在同一核心上無縫執(zhí)行多個控制功能,同時防止各功能之間相互干擾。F29H85x 系列 MCU 通過增強(qiáng)的 EPWM 功能,進(jìn)一步提升了汽車系統(tǒng)的性能,使得新型控制拓?fù)浜退惴ǖ膽?yīng)用成為可能,例如矩陣變換器拓?fù)。這些功能包括復(fù)雜的比較方案,并集成了安全檢查,如保證最小死區(qū)和非法組合邏輯。此外,這些 MCU 中集成的 ADC 幫助實(shí)現(xiàn)精確的傳感功能,具備硬件過采樣和結(jié)果安全檢查等特性,從而減少了執(zhí)行常見任務(wù)所需的軟開銷。
邊緣NPU火了,但有些廠商更為保守


過去MCU中一直都存在的DSP和FPU,一定程度上都能對AI進(jìn)行、加速。但AI模型愈發(fā)復(fù)雜化,僅依靠DPS和FPU算力無疑是不足的。所以廠商都開始向MCU中塞入NPU,像手機(jī)SoC、AI PC那樣,大幅度降低MCU在AI上的功耗。恩智浦在上個月推出了擁有NPU的跨界MCU i.MX RT700,至此,恩智浦MCU、跨界MCU、應(yīng)用處理器三大系列均擁有了NPU。也就是說,恩智浦整個產(chǎn)品線都內(nèi)置了AI/ML加速器功能,算力覆蓋從10G到幾T TOPS。R700相比于前代產(chǎn)品,提升幅度非常之大,可以說是“降維打擊”,早在發(fā)布之前就引發(fā)了工程師群體的討論。相比上一代產(chǎn)品,其在邊緣提供高達(dá)172倍的速度提升和119倍的節(jié)能,同時功耗比上一代產(chǎn)品降低了30~70%。

今年4月,英飛凌發(fā)布新一代PSOC Edge產(chǎn)品組合。從具體產(chǎn)品來看,有用Arm NPU的,也有自家神經(jīng)網(wǎng)絡(luò)加速器:PSOC Edge E83和E84內(nèi)置Arm Ethos -U55 NPU處理器,E81采用Arm Helium DSP技術(shù)和英飛凌NNLite神經(jīng)網(wǎng)絡(luò)(NN)加速器。

瑞薩一直也布局AI,其曾在去年發(fā)布內(nèi)置瑞薩電子獨(dú)家硬件加速器 “DRP,動態(tài)可配置處理器-AI”的RZ/V2MA系列產(chǎn)品,實(shí)現(xiàn)了精確圖像識別和多攝像頭圖像支持功能。據(jù)了解,DRP-AI專為嵌入式機(jī)器視覺類AI/ML應(yīng)用優(yōu)化設(shè)計,可提供實(shí)時AI推理和圖像處理功能,兼具高AI推理性能和低功耗特性,家族化產(chǎn)品支持0.4~80TOPS不等的可擴(kuò)展AI算力,為資源有限的嵌入式端側(cè)AI應(yīng)用提供差異化有競爭力的解決方案。

ADI也在自己的產(chǎn)品中加入了卷積神經(jīng)網(wǎng)絡(luò)(CNN)加速器,其推出的邊緣AI解決方案MAX7800X系列MCU,由兩個微控制器內(nèi)核(ARM Cortex M4F和RISC-V)加上一個卷積神經(jīng)網(wǎng)絡(luò)(CNN)加速器構(gòu)成。

ST也看好NPU在MCU或者M(jìn)PU中的表現(xiàn),但是不知道為什么產(chǎn)品姍姍來遲。2022年,報道稱ST將推出其首款配備完整神經(jīng)處理單元 (NPU) 的微控制器STM32N6。而后,又在Embedded World 2023上搶先展示了STM32N6。筆者猜測,可能ST對于NPU的態(tài)度上比較保守。目前來說,市場上MCU都在陸續(xù)利用NPU或是自己研發(fā)的神經(jīng)處理加速器布局邊緣AI,Arm、Cadence、Synopsys、Verisilicon、Ceva等IP廠商的NPU IP也在逐漸滲透至MCU中。但總體來說,MCU廠商走得并沒有其他領(lǐng)域那么快。因為市面上跑的邊緣AI,其實(shí)絕大多數(shù)情況下,無論是Arm核,還是用DSP、FPU,不帶NPU的通用MCU已經(jīng)能夠滿足基本要求。與AI PC或者AI手機(jī)不同,MCU領(lǐng)域給產(chǎn)品中增加NPU需要實(shí)打?qū)嵉膽?yīng)用,否則容易缺乏市場。AI PC或者AI手機(jī)就不一樣了,因為這些領(lǐng)域可以隨時增加一些AI軟件之類的,消費(fèi)者可以提前買單?v觀幾家加入NPU的廠商,都在市場上擁有了應(yīng)用的驗證,初步形成了良好的循環(huán)。等到下游的所有產(chǎn)品都加入了AI功能,并且滲入到了生活,相信邊緣AI和NPU MCU會發(fā)展的比現(xiàn)在更加迅速。
也許是真正意義的64位MCU


事實(shí)上,在過去多年,似乎還沒有真正意義上的64位MCU。雖然有些搭載RISC-V CPU的產(chǎn)品,偶爾還叫MCU,但也可以算作SoC。而TI的C2000,作為一款DSP MCU,跨越64位很明顯可以快速拉升性能。64位MCU主要解決的問題是4GB物理尋址的瓶頸,顯然,目前MCU領(lǐng)域使用64位還并不具備很強(qiáng)的意義。因為,現(xiàn)在32位的性能足夠了,64位在絕大的場景下沒有必要。一位工程師表示,歷史上也出現(xiàn)過一些所謂的64位產(chǎn)品,比如K210是64位的,而且是雙核64位的,但是絕大多數(shù)場合下64位沒有必要,一些特殊場合會出現(xiàn)64位,比如AI。也許,邊緣AI如果能繼續(xù)火下去,而且模型變得更大時,也許64位MCU就會逐漸流行起來。
參考文獻(xiàn)
[1]https://www.ti.com/about-ti/newsroom/news-releases/2024/2024-11-11-new-ti-mcus-enable-edge-ai-and-industry-leading-real-time-control-to-advance-system-efficiency--safety-and-sustainability.html[2]https://www.ti.com/lit/ds/symlink/f29h850tu.pdf?ts=1731401489469&ref_url=https%253A%252F%252Fwww.ti.com%252Fproduct%252FF29H850TU[3]https://www.ti.com/lit/ab/spradn6/spradn6.pdf?hqs=epd-asm-cd-rtc_f29xxx-pr-ta-electronicanews-wwe&ts=1731478773238&ref_url=https%253A%252F%252Fwww.ti.com%252Fabout-ti%252Fnewsroom%252Fnews-releases%252F2024%252F2024-11-11-new-ti-mcus-enable-edge-ai-and-industry-leading-real-time-control-to-advance-system-efficiency--safety-and-sustainability.html[4]https://www.ti.com/lit/ta/nest132/nest132.pdf?ts=1731459244792&ref_url=https%253A%252F%252Fwww.ti.com%252Fproduct%252FTMS320F28P550SJ[5]https://www.ti.com/lit/ds/symlink/tms320f28p550sj.pdf?ts=1731463855496&ref_url=https%253A%252F%252Fwww.ti.com%252Ftool%252FTIDA-010933[6]https://blog.st.com/stm32n6/

------------ END ------------



●專欄《嵌入式工具
●專欄《嵌入式開發(fā)》
●專欄《Keil教程》
●嵌入式專欄精選教程

關(guān)注公眾號回復(fù)“加群”按規(guī)則加入技術(shù)交流群,回復(fù)“1024”查看更多內(nèi)容。
點(diǎn)擊“閱讀原文”查看更多分享。
回復(fù)

使用道具 舉報

發(fā)表回復(fù)

您需要登錄后才可以回帖 登錄 | 立即注冊

本版積分規(guī)則


聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表