Smart TV、STB帶動嵌入式處理器朝多核心架構重點升級 智慧應用 影音
EVmember
member

Smart TV、STB帶動嵌入式處理器朝多核心架構重點升級

  • DIGITIMES企劃

3D影音的大螢幕播放應用,大幅考驗智慧電視、高階平板電腦、數位機上盒的應用效能。Asus
3D影音的大螢幕播放應用,大幅考驗智慧電視、高階平板電腦、數位機上盒的應用效能。Asus

嵌入式應用已不再是以往僅強調低功耗、低成本的產品開發方向,尤其是平面電視大舉導入Smart TV智慧電視應用後,對於嵌入式系統硬體的要求已呈現跳躍性成長,嵌入式系統不只要應付高度整合的高解析度數位內容處理,還必須能滿足3D GUI、3D電玩、1080p甚至未來4K x 2K的超高解析度運算應用需求...

早期資訊家電的應用需求,嵌入式系統扮演的角色僅為讓單純的家電多了電腦運算、儲存與處理的能力,系統運算應用屬於附加的輔助性質,最多也只是讓家電具備簡單的自動控制功能。

Tegra 3嵌入式方案的SoC雖以性能提升為主,提供4個可Variable SMP架構運行高效能核心,但也同時提供1組低省電低功耗核心,因應一般低運算需求的工作。NVIDIA

Tegra 3嵌入式方案的SoC雖以性能提升為主,提供4個可Variable SMP架構運行高效能核心,但也同時提供1組低省電低功耗核心,因應一般低運算需求的工作。NVIDIA

Tegra 3嵌入式方案所開發的microITX單板電腦方案,具備高效能、極低運行功耗優勢,適合需大量影音娛樂處理的IA產品導入使用。kontron

Tegra 3嵌入式方案所開發的microITX單板電腦方案,具備高效能、極低運行功耗優勢,適合需大量影音娛樂處理的IA產品導入使用。kontron

3D影音支援,也需要系統的加速處理支援來強化應用體驗。Google

3D影音支援,也需要系統的加速處理支援來強化應用體驗。Google

Tegra3 SoC本身即整合CPU、GPU與特殊應用DSP與影音處理硬體加速等核心設計,讓整體可達到功耗與效能的極佳平衡。NVIDIA

Tegra3 SoC本身即整合CPU、GPU與特殊應用DSP與影音處理硬體加速等核心設計,讓整體可達到功耗與效能的極佳平衡。NVIDIA

圖為晶片的核心電子顯微鏡檢視照片,可以發現運算核心佔用SoC最大面積,其餘為I/O、GPU與部分硬體加速器。NVIDIA

圖為晶片的核心電子顯微鏡檢視照片,可以發現運算核心佔用SoC最大面積,其餘為I/O、GPU與部分硬體加速器。NVIDIA

但IA(Information Appliances)應用在結合影音視聽的跳躍性發展下,原本僅可勉強處理標準解析度視聽內容的嵌入式系統電算平台,還算能應付需求,但若要因應現有主流的720p、1080p視訊與互動應用,低於800MHz的單核處理平台在性能表現已遇到瓶頸,現有的主流因應設計方案多採用提高單核處理單元的外頻,或是先用雙核心1GHz的解決方案,應付產品的效能需求。

因應未來高清影音應用 嵌入式系統需在效能再升級

但即便是現有的主流嵌入式處理器方案,短期內因應1080p、3D影音的TV或機上盒應用,還能勉強支撐其絕大多數的設計要求,但若需要進階到高清錄影、3D互動GUI(Graphical User Interface)、3D互動影音應用時,現有的單核或雙核嵌入式系統平台,效能表現就顯得差強人意,而現有矽晶片的製程改善也有其物理極限,短時間無法獲得具效益的性能提升方案,反而利用多核SoC的設計方案,可以快速達到提升性能、低成本的性能升級目標。

針對此發展趨勢,即便x86架構的嵌入式應用也期待能在TV與Set-top-box等視聽娛樂應用方面,搶得原有嵌入式應用平台的市場佔有率,但實際上即使Intel與AMD等x86處理器業者相繼推出針對低功耗應用場合開發的解決方案,對嵌入式處理平台的影響仍微乎其微。

x86雖有多核方案 但功耗表現仍較ARM應用表現遜色

因為x86架構雖在效能與開發資源可具較彈性的應用條件,但實際上其性能提升也必須面對功耗與元件散熱等問題需處理,不僅在料件成本會較嵌入式應用平台高許多,設計方案與現有廣泛使用的嵌入式應用資源,要切入應用供應鏈也不似PC產業的產品應用導入這麼簡單。

嵌入式處理器產品業者,如ARM已針對未來視聽應用可能需要的高效能運算應用需求,逐步布局多核處理器、多核GPU的SoC整合方案,尤其以ARM本身的處理器IP即具備亮眼的低功耗表現,透過IP授權,可以讓需求業者利用IP整合方式,滿足需要應用效能的運算核心產品,以開發越來越多的多核心終端應用需求。

尤其是影音娛樂裝置持續導入高畫質影音內容,甚至可在TV或機上盒應用高負載的3D遊戲娛樂內容,隨著這些數位內容數量提升,內容改變的不僅只有螢幕解析度的持續增加,更大的影響是面對巨量視聽內容需求的處理數據激增,對高效能的處理器與GPU的性能要求會越來越高,利用多核心的處理單元搭配多核GPU可有效紓解影像處理的運算瓶頸。

ARM Mali GPU多核設計 因應需求至多可選8核方案

例如ARM積極推出Mali系列的GPU IP產品線,除低階面對行動電話應用的單核、雙核GPU IP在此先不討論外,ARM以Mali 450MP多GPU圖像處理器核心技術,來鎖定智慧電視與高階智慧型行動電話市場。

觀察Mali新舊版本規格差異,Mali 450MP GPU相較於上一代Mali 400的效能檢視,Mali 450MP GPU在Vertex Processing可負荷的影像資料處理量,新版產品IP可獲得前代產品的兩倍提升,Mali 450MP GPU IP視產品規劃需求,可提供用戶最高多達8核心的IP組合方案,Mali 450MP GPU不只在運行效能、元件功耗等多方表現超越前代Mali 400產品,同時新的GPU IP系統架構同步優化,已能將繪圖處理的系統資源應用效能提升,同時利用新架構改善元件功耗和運算頻寬降到最低。

為了讓已使用ARM解決方案的開發商,能夠快速延伸應用進階版本的Mali 450MP GPU多核矽智財,Mali 450MP在性能提升的同時,維持與前代Mali 400架構設計預留可回溯支援的應用彈性,這對已經使用原有Mali 400 IP的硬體開發商,可以維持原有的IP架構快速升級至最多可達8核心的Mali 450MP GPU應用層次,輕鬆開發足以因應未來應用需求的SoC或硬體產品。

此外,為讓Mali 450MP GPU IP充分發揮性能升級效益、縮短產品上市與最佳化效能的工程投入,ARM也針對Mali 450MP GPU提供針對最新Open GL ES 2.0的最佳化架構設計,加速應用的程式介面(Application programming interface;API)設計與Open GL ES 2.0相容,降低新產品開發的技術門檻,同時也能強化實機的3D應用效能表現。

Qualcomm 4核Krait方案來勢洶洶

此外,在嵌入式系統的多核處理器競爭下,通訊晶片商Qualcomm也選擇採多核型態來快速提升產品效能,因應未來嵌入式系統的繁重多媒體處理要求!例如,近來發表的4核心Krait(原為Qualcomm的Snapdragon產品線,4核心設計方案研發代號Krait,為採行28nm製程、最高2.5GHz外頻)。

與Krait搭配的Adreno 320也是效能提升的一大關鍵,因為此款GPU在Qualcomm宣稱,相較前代新版本設計具15倍效能提升、功耗卻表現接近!至於新款Krait 4核設計方案,性能約為前代產品的1.5倍,但整體運行功耗僅有往常的65%,代表省電性能更勝以往版本。從現有公布的資料可以了解,最新的參考設計雖是由LG的實作手機樣品,但實際上這款參考設計硬體規格已有1280 x 768顯示螢幕、晶片採28nm製程,並搭配Adreno 320 GPU等,至於處理器的外頻為一般主流的1.5GHz設計,性能表現已經略具發展高階智能電視、機上盒的效能水準。

目前應用最熱門的NVIDIA Tegra 3嵌入式方案,基本上也是採取4核心的設計型態,相較前代的Tegra 2僅有雙核方案比較,4核設計的Tegra 3號稱網頁瀏覽效能可以較以往提升2倍,同時Tegra 3整合硬體加速Flash播放設計,對目前大量的Flash網頁應用更具有提速的效果,同時,為了滿足效能提升、功耗壓低的設計目標,Tegra 3也整合了第五代的省電設計。

Tegra 3除SoC裡頭搭載了整合式超低功耗(ULP) GeForce GPU外,原有的Tegra 3 四核心設計還追加一組第5顆省電CPU,作用在當高運算需求時,Tegra 3可以採可變對稱式多重處理(Variable SMP)架構提供最大運算能力,視工作量動態調整4組核心配合運行組合,當處理低運算需求的工作時,則關閉高效能核心,僅以第5顆省電CPU來完成基本運算處理,達到最佳化電源管理的設計目標。

NovaThor U85XX 利用製造技術強化晶片性能與功耗表現

未來多核心Soc將會是一個趨勢,但對基礎的矽製程也受到時脈提高的應用挑戰,例如ARM的多核心運用需朝高效能、降低耗能量來維持與x86方案的競爭差距,目前主流ARM器件已大量導入32nm甚至28nm製程量產、以SoC產品型態出貨,而更進一步已有ARM產品開始採20nm試產、測試,更精密的製程預計會在2013年投入產品量產,緊接著還有低於14nm的製程測試計畫,試圖利用製程直接改善SoC的運算體質。

除ARM提供的多核應用IP外,在現有多個嵌入式處理器應用方案,同樣嘗試運用矽晶片製程強化運行效能,例如,整合LTE通訊應用的NovaThor U85XX解決方案,即號稱可運用FD-SOI製程來讓矽晶片本身運行時脈大幅提升,同時功耗也可壓低。

在NovaThor U8540解決方案中,以FD-SOI製作技術可讓外頻運作時脈提高至2.5GHz,業者號稱可達到以往近似設計的2倍效能!甚至在維持高效能運行的同時,驅動晶片電壓也僅需0.6V就能驅動,而在最高效能運行模式所消耗的電能,也比同性能水準產品有超過30%的節能效果。