2020-11-23 18:29:58聖天使

AI時代的MCU,將走向何方?




[來源:內容來自半導體行業觀察原創,作者:李飛]

今年上半年, ARM發布了針對MCU場景的首款microNPU Ethos U55系列。該microNPU主打超低功耗,根據用戶需求可以搭載32-256個MAC(乘法累加器)單元,最高可以提供0.5TOPS的算力。ARM給Ethos U55搭配的處理器是高端Cortex M系列處理器(例如Cortex M55),可見在當時Ethos U55設計的初衷就是賦能中高端MCU市場。




在過了半年多時間之後,ARM在最近又發布了Ethos U65系列,作為Ethos U55的升級版本。Ethos U65是ARM和主要合作方NXP一起定義和設計,相對於Ethos U55的主要區別在於Ethos U65中的MAC單元數量從原來的最多256增加到了512,從而將最大的算力從0.5TOPS提升到了1TOPS。此外,在NXP的系統設計中,整體系統中除了Ethos U65除了搭配Cortex M之外,還配上了一個Cortex A系列處理器。




我們認為,ARM在一年中連續發布兩代針對MCU的microNPU,一方面說明了MCU市場對於AI和AI加速器確實有很強的需求,而另一方面,我們也看到了隨着智能家居等新品類的出現和流行,MCU和APU之間的間隔正在縮小,這也將為未來的智能MCU生態帶來新的變化。


MCU搭配AI加速器正在成為主流

在2017年之後,智能MCU慢慢進入了大眾的視野。例如,在2017年意法發布了Project Orlando作為實驗性質的MCU超低功耗AI加速器單元,而瑞薩也在2018年發布了針對MCU的可編程可重構協處理器DRP。在經過了三年發展之後,我們認為在MCU中加入AI加速器正在變得越來越主流,而且在需要AI相關算力的應用中,使用專用AI加速器的收益往往大於加強處理器性能。


從應用的角度來說,AI加速器搭配MCU更加主流的主要原因是需要AI的場景越來越普遍,而且從具體的算法和模型來看正在收斂到少數幾個模型,例如機器視覺(人臉識別,物體識別)和語音喚醒詞中需要的卷積神經網絡,以及在一些較為先進的語音識別中需要的循環神經網絡(RNN)。


如果說在三年前,未來AI算法和應用生態前景還不夠明確,因此會出現走專用化(AI加速器)和通用化(加強處理器性能以及可編程協處理器)兩條道路的話,那麼在應用和相關算法都已經很集中的今天,AI加速器已經成為較為明確的選擇了,因為一方面使用專用化的AI加速器可以提供最佳的性能和能效比,而且另一方面在芯片設計門檻上事實上也並不太高,事實上更考驗設計能力的反而是編譯器和相關的軟件/模型優化。因此,我們認為在未來會有更多智能MCU相關的產品和解決方案出現。


amd7nm锐龙apu内核玉照首次公开 cpu八核心 gpu八核心 amd,renoir,apu,内核,zen,vega,锐龙, win10之家中文网



MCU與APU的融合

我們觀察到的另一個趨勢是MCU和APU,至少在一些熱門的場景中(例如智能家電),正在走向融合以組成新的系統。

在過去的家用電器中,MCU是常見的元件,它主要用於家用電器的控制,並且能執行一些簡單的預定義程序。上一代家用電器中,需要用到計算的場景幾乎沒有,所以MCU除了控制之外,並不需要負責計算。而在上一代的MCU和APU的分工定位中,MCU通常意味着低功耗,低成本,低處理能力;而APU則代表着高性能,高成本以及高功耗。在對於成本需求較高的家電領域,使用高成本APU的機會很少。


而在這一代的智能家電中,隨着AI的普及,對於計算的要求越來越高,這也是MCU越來越多搭配AI加速器的原因。除此之外,「智能化」的另一個涵義通常是能和人做交互,因此在這些智能家電中,往往還需要跑一個操作系統,這樣的需求就會需要一個類似APU的核來完成。在這樣的需求下,使用APU搭配能處理AI算力的MCU就是一個合理的選擇。


這裡的MCU不再是傳統上用於watchdog的APU周邊設備,而是一個能以高能效比處理大量實際任務的重要模塊。舉例來說,在需要聲控喚醒的智能設備中,就可以採用這樣的方案:高功耗的APU絕大多數時候處於深度睡眠狀態,同時帶有AI處理能力的低功耗MCU則處於監聽狀態,當MCU上以低功耗運行的AI加速器檢測到喚醒詞時,MCU負責喚醒APU,同時APU則執行更複雜的語音識別算法並且完成相應的操作,例如播放音樂,或者語音通話等等。


在這樣的一個系統中,智能MCU和APU各負其責,由於絕大多數時間APU處於深度睡眠狀態,因此整體功耗可以控制到較低的水準;同時,我們看到MCU需要監聽環境,執行AI算法並且在需要的時候準備喚醒APU,因此MCU中的高能效比AI處理能力就成了關鍵。


此外,另一個推動APU+智能MCU方案的因素是智能家居對於成本的需求不再那麼苛刻。一方面,不少消費者願意為智能家居中的AI能力付相應的溢價;另一方面,許多智能家居的背後有着互聯網巨頭的加持,智能家居更多是一個使用互聯網巨頭相應服務的一個入口,因此相對於成本互聯網公司更關心的是智能家居能實現的功能特性。因此,智能家居對於成本的要求不再像上一代家用電器那麼苛刻,從而APU+智能MCU的方案也會得到更多的應用。


2020中国智能家居生态发展白皮书



市場生態將如何發展?

智能MCU未來的市場生態,我們認為可以從多個維度去分析。

首先是RISC-V和ARM之間的競爭格局。從智能MCU的技術生態方面做分析,我們認為RISC-V在這個智能領域並沒有特別的優勢。如前所述,智能MCU的主流技術路徑是MCU搭配AI加速器,而AI加速器的設計通常和處理器指令集(即使用ARM還是RISC-V)關係不大。另一方面,AI加速器中事實上軟件編譯器是一個重要難點,而這一方面擁有較大團隊和時間投入的ARM顯然更有優勢一些。


另一方面,RISC-V在這個領域的使用往往是考慮到可定製性和可控知識產權,因此我們認為更有可能是一些對於深度定製產品的大公司有更大的動力去使用RISC-V來實現芯片-軟件-產品協同設計。一個典型的例子就是阿里巴巴對於RISC-V的大力投入,我們認為未來中國基於RISC-V的智能MCU很可能會首先在阿里巴巴的物聯網和智能家居產品中成為主力。


其次,我們還可以分析智能MCU中AI加速器方案的生態。目前,除了以ARM的microNPU為代表的AI加速器之外,還有以Cadence HiFi系列為代表的的DSP也在積極布局這個市場。DSP在這個市場的主要優勢在於語音相關的AI應用,因為DSP技術在音頻相關應用已經有了幾十年的積累,因此在加入神經網絡支持後就可以覆蓋語音相關的AI場景,而目前我們看到的是智能語音占領了智能MCU中很大的一塊市場需求,這也為DSP方案提供了很強的支撐。而在以機器視覺為主的方案中,一個專門為卷積神經網絡做優化的AI加速模塊目前來從性能和能效比還是會更強一些。


人工智能 发动机 让芯片发挥ai的真正潜力



最後,我們還看到了許多以低功耗為主打的AI芯片公司也在積極布局這個市場,例如能實現微瓦級別機器視覺任務加速的識時科技等。以傳統公司立足MCU並加入AI加速模塊賦予MCU以智能不同,AI芯片公司對於這個市場的打法是基於自己的AI處理器方案,搭配一個MCU來實現智能MCU。這樣的方案更適合對於人工智能處理有極致需求的場景(比如需要超低功耗超高能效比的AI處理能力,類似智能門鎖等),因此隨着未來AI應用場景進一步下沉,我們預計會看到會有越來越多的AI芯片公司進入這個市場。---(半導體行業觀察)


我要回應(本篇僅限會員/好友回應,請先登入)