MCU與DSP的聚合,驅動科技新應用 智慧應用 影音
工研院
Event

MCU與DSP的聚合,驅動科技新應用

  • DIGITIMES企劃

美普思科技 亞太區?大中華區技術總監許丁堅
美普思科技 亞太區?大中華區技術總監許丁堅

MCU與DSP以往總是涇渭分明,前者以強調低成本、整合多元週邊且即時控制為主,而後者則高效能高單價,以處理混合訊號、整數?浮點數參雜的海量運算資料,單指令多重資料操作的設計特質。以往MCU與DSP效能級距相差甚大,彼此各自擁有一片天地,隨著32位元MCU的普及,MCU有逐漸追上DSP的效能級距,甚至開始有融合MCU與DSP的嶄新架構的出現…

MCU與DSP的歷史發展與聚合化趨勢

美商美普思科技(MIPS Technologies, Inc)亞太區?大中華區技術總監許丁堅(James Syu)指出,MIPS是全球領先的RISC精簡指令架構的處理器核心供應商,總部設於美國加州,全球員工數160位且半數為研發人員。MIPS處理器架構由現任史丹佛大學校長John Hennessy在20多年前所開發,具備600項專利,並採取IP智財授權的商業模式,授權像是博通(Broadcomm)、Cavium Network、大陸的北方君正、Microchip、新力、東芝等業者SoC採用MIPS技術,在數位家庭、機上盒、網通裝置、導航裝置等廣泛被應用到,近10年全球累積出貨數量超過36億顆,光最近一年出貨的MIPS SoC達6.56億顆。

在MIPS發展歷史上,遠自1991年MIPS就發表產業第一顆64位元的微處理器,1999年正式有MIPS32與MIPS64指令集架構的分野。2001年首度採取高效能、可合成的32位元MIPS32核心授權;2002年推出微控制器(Microcontroller)導向的M14Kc核心,2005年推出DSP延伸應用,2006年多執行緒(Multi-threading)技術的導入,2007年提供超純量效能(Superscalar Performance),2008年對稱協調式多核心?多重處理(Coherent multiprocessing)架構,在2010年推出先進的可壓縮microMIPS指令碼架構,到最近2012年6月正式推出Aptiv微核心架構。

他提到關於MCU與DSP的發展沿革,在MCU部份,從1970年代德州儀器(TI)推出第一顆4bit MCU—TMS1000,而1980年8051 8位元MCU,至今仍舊存活,1990年代PIC16 MCU率先內建8bit EEPROM記憶體,隨後Atmel推出第一顆整合8bit Flash記憶體的MCU;2000年率先出現具備16bit MCU與DSP的DsPIC晶片,而稍後德儀也推出TI MSP430 MCU,到2010年Microchip推出32位元的PIC32 MCU。

DSP部份,首推1976年德儀推出第一顆DSP—TMS5100,隨後1982年德儀推出uPD7720獨立 DSP晶片,隨後德儀TMS3201採用16位元固定浮點的哈佛架構的DSP設計,80年代末期DSP560015率先使用多重記憶體硬體加速技術;1990年代德儀推出雙ALU/MAC單元的TMS320C55x晶片,90年代末期提出VLIW指令集架構的TMS320C6x 晶片,到2000年代提出Blackfin結合 16/32位元MCU/DSP功能的混合晶片。

許丁堅指出MCU與DSP功能特性上互補,像MCU強調控制功能、哈佛程式碼?資料分離架構、低延遲即時效能與支援多種記憶體型態,但是採取通用型指令、暫存器為主且單指令單操作的特性;DSP則強調數值運算功能、同樣是哈佛架構、需要低延遲即時效能的設計、支援多種記憶體型態,但是以累加器為主,採多重指令多重操作、特定的指令集並採用全面性乘法器的架構設計。

過去MCU仍為8/16bit設計,跟DSP動輒32/64bit、VLIW/SIMD強調單指令多重操作的運算架構無法匹配,當MCU逐步邁向32位元時代,與DSP效能逐漸拉近,此時業界開始有MCU與DSP朝向聚合的聲浪。許丁堅認為各自分離獨立的MCU與DSP設計,優點在於可以各自沿用既有的設計,選擇最佳化的IP或零組件,但缺點則是MCU與DSP是不同指令?資料型態與運算模式,自然會有不同開發工具、開發環境與程式撰寫模式,同時必須在較慢的MCU與較快速的DSP之間搭配協調平均負載的邏輯電路晶片,附加成本與功耗,也延長了產品開發上市的時間。

MCU與DSP聚合的優點在於有共同的硬體?軟體開發工具,以單一編譯器產生緊湊有效率程式碼,達到高效能低耗能,同時使用共通的C/C++程式碼平台下,具備最大的應用程式基礎,同時可以因應成本縮減的衝擊,具備較高彈性支援廣範圍的設計應用並因應未來需求。他指出目前也已經有相當多的MCU工程師投入,以加速這種MCU/DSP的聚合效應。而MCU與DSP融合的唯一缺點,是目前產業似乎更關注於MCU即時運算處理,如何做得更好。

因應MCU與DSP聚合下的核心解決方案

許丁堅指出,microAptiv架構可說是是針對MCU與DSP各自的特點,所融合且最佳化的MCU架構。為了達成這樣的目的,microAptiv MCU核心架構上,從ALU算術邏輯單元、位元位移單元(Shifter)、乘法?除法單元(MDU)以及控制暫存器(Control Registers)都做過特別修改,整合了具備強大運算效能的DSP處理器功能。在MCU部份,具備5階段執行管線,10週期中斷延遲時間,32組32bit通用暫存器(GPRs)、microMIPS微指令集架構,提供SRAM快取選項,單一指令?單一操作的特性,以及簡化的記憶體定址;至於DSP功能部份,則採取專屬DSP執行管線的設計,具備8/16bit SIMD引擎,並且在多出來的159道DSP指令群中,有70道為SIMD指令群,38組乘法?累加乘法指令,具備單週期指令執行輸出率,以及支援最多達四個累加器的架構。

在64位元MIPS64核心具備MIPS 3D ASE與Multi-Threading ASE多線緒指令集,而32位元MIPS32則具備MIPS16e ASE、MIPS DSP ASE指令集架構。microMIPS核心架構就是採用源自於MIPS32核心的MIPS DSP ASE,以及MIPS MCU ASE指令模塊,提供了最低成本、最小矽晶片電路面積與最低功耗設計。 MIPS DSP ASE提供了DSP為主的指令集,支援8/16/32位元整數與浮點小數資料,以累加器或暫存器為運算目標,並涵蓋累乘累加(Multiply and Accumulate;MAC)指令,飽和運算或捨棄小數進位的選項。MCU以既有的ALU、MDU與位元位移器線路IP重複使用,並且設計專屬執行管線,核心內的指令可以平行化作業,強化的32x32乘除法單元(MDU),包含四個64位元的累加器的設計;在DSP ASE指令集部份,則提供多達159道DSP專屬指令,涵蓋8、16、32位元資料運算元,從算術、資料變形、載入、分歧、餘數定址(Modulo Addressing Instructions)的操作模式。

以低晶片面積?成本 提供更高效能

microAptiv所具備的38個全面強化乘法(Multiply)指令集,可以單一執行週期輸出結果,從(32 x 32)、(16 x 16),雙(16 x 16)、雙(16 x 8)到雙(8 x 8)資料運算元寬度的乘法組合,支援8/16位元不帶正負符號的整數與浮點數運算,同時橫跨所有micrpoAptive產品、飽和運算(Saturation)與位元防護(guard bits)。其SIMD指令集在設計上,可以單一指令進行兩道16位元或四個8位元整數?浮點數運算,飽和與進位選項,同時各自有專屬的MCU與DSP執行管線,不會影響指令平行化作業下效能,同時MIPS也提供DSP過濾(Filter)、變形(Transform)與向量(Vector)操作的程式碼函式庫,供軟體開發者應用。

許丁堅以實際測試數據長條圖,列舉出具備DSP ASE指令架構的microAptiv,與不具備DSP ASE的M14K處理器的實際效能差異。像是在16組向量暫存器進行的256位元傅立葉轉換(FFT16,256)運算,M14K花費1個指令週期,而microAptiv僅需0.6個指令週期;32組向量暫存器進行的256位元傅立葉轉換(FFT32,256)運算下,microAptiv只須0.8個指令週期;另外像FIR16(K=32)、IIR(B=8)、LMS(K=32)、16組向量乘法(VEC_MUL16)、32組向量乘法(VEC_MUL32)與H.264_IQT項目,microAptiv平均執行週期分別縮減成0.25、0.3、0.5、0.45、0.7與0.4個週期,加入DSP ASE指令架構,最高可以達成75%的指令週期縮減,使得執行效能平均提昇1.5~3.7倍不等。

MCU/DSP共通化的軟硬體開發工具

許丁堅指出,MIPS針對 microAptiv微控制器架構,提供了各個環節的硬體、軟體與評估的開發工具套件,像是藉由GNU軟體工具鏈、ELF與Linux版本的整合開發環境,提供SoC開發評估工程板SEAD3,結合第三方開發工具與軟硬體I智財電路?函式庫,搭配像是CASim、IASim等Simulators模擬軟體,以及除錯偵測裝置,如System Navigator、Navigator Console。

microAptiv微控制器,可以針對當紅的數位智能裝置(Digital Smart Client;DSC)市場,如標準嵌入式裝置的MCU應用、物聯網(Internet of Things;IoT)方面的應用,工業控制、智能電錶,行動裝置、無線網通裝置、門禁安全裝置,以及NAS、RAID、SSD、HDD等儲存裝置;至於在車用電子應用上,可以做為駕駛艙控制面板,汽車被動?主動式安全配備、動力總成(Powertrain),以及資訊娛樂裝置(Infotainment)等設計應用。

他總結MCU與DSP的聚合浪潮下,結合兩個世界的最佳組合,提供高效能控制與數學運算處理,即時且確定性的行為模式下的控制,並連結數位與類比訊號的世界;兩大陣營的開發工具?供應鏈可以趨於同質共同化,同時融入單一指令集架構,充分利用現有的MCU和DSP軟體,具備彈性化、可擴充性,可以成為兼顧低成本與效能不妥協的優質解決方案。


關鍵字