處理器多核化 強化行動裝置運算效能設計捷徑 智慧應用 影音
hotspot
ST Microsite

處理器多核化 強化行動裝置運算效能設計捷徑

  • DIGITIMES企劃

Snapdragon S4系列處理器全產品線產品差異,高效能產品可多達2.5GHz 4核心整合於單一晶片。Qualcomm
Snapdragon S4系列處理器全產品線產品差異,高效能產品可多達2.5GHz 4核心整合於單一晶片。Qualcomm

隨著使用者對行動裝置的效能要求越來高,原先在伺服器、工作站才看得到的多核心處理器技術,在面對行動裝置的效能提升需求、與在最小載板面積的設計限制下,導入多核心處理器形成快速提升裝置效能的最佳捷徑,但行動裝置不是大型設備,多核心處理器整合必須考量更多散熱、效能、功耗等多項應用條件,才能滿足行動裝置的運算需求...

以往在大型主機或工作站等級電腦,才能看到的多核心處理器技術,礙於多核心處理單元的整合技術較複雜,處理器載板面積會相對較大,在進行多核產品整合的彈性也相對較大,但隨著3D IC技術成熟,使得單晶尺寸持續壓縮,多核心處理器技術也愈趨成熟。

NVIDIA針對TEGRA 3釋出的參考設計載板。NVIDIA

NVIDIA針對TEGRA 3釋出的參考設計載板。NVIDIA

TEGRA 3已用於Audi概念車的車上娛樂系統中,以滿足未來大量的車上娛樂運算需求。Audi

TEGRA 3已用於Audi概念車的車上娛樂系統中,以滿足未來大量的車上娛樂運算需求。Audi

TEGRA 3元件採vSMP架構設計,可因應運算內容動態調整核心運行狀態,達到降低功耗目的。

TEGRA 3元件採vSMP架構設計,可因應運算內容動態調整核心運行狀態,達到降低功耗目的。

TEGRA 3整合處理器晶片體積相當小,僅與耳機尺寸相當。NVIDIA

TEGRA 3整合處理器晶片體積相當小,僅與耳機尺寸相當。NVIDIA

多核心處理器架構,將會是2012年行動裝置效能提升關鍵。(TI).jpg

多核心處理器架構,將會是2012年行動裝置效能提升關鍵。(TI).jpg

車用導航大量使用3D技術,隨著處理地圖資訊與3D圖形演算工作大增,對嵌入式處理器的效能要求漸增。

車用導航大量使用3D技術,隨著處理地圖資訊與3D圖形演算工作大增,對嵌入式處理器的效能要求漸增。

新一代高效能多核處理器,可令平板裝置達到即時3D運算與滿足多元行動應用。Qualcomm

新一代高效能多核處理器,可令平板裝置達到即時3D運算與滿足多元行動應用。Qualcomm

尤其是在因應行動裝置的設計應用,在Apple以ARM為基礎開發的iOS行動裝置平台,讓硬體製造商重新檢視ARM處理平台搭配嵌入式系統的應用潛力,使ARM平台的應用,漸成為行動裝置核心處理器的整合設計首選。

由於ARM本身即具備多處理器整合設計彈性,在核心通用處理器的多核整合方面,也形成更具彈性的整合優勢,加上單核效能持續飆高與多核整合產品的技術精進,讓目前行動裝置產品更能滿足多樣化的產品整合需求,尤其在效能、多工應用與更多近似桌上型電腦的應用設計。

觀察行動裝置產品設計趨勢,單核心產品會朝向核心晶片效能持續提升目標努力,目前主流單核心ARM產品在外部運行時脈以1~1.5GHz為主,單核心處理器主要會用於中?低階產品設計需求。

雙核心甚至多核心整合產品則以高端設計產品為主,尤其是主流產品已趨向採用雙核心處理器,2012年重點產品則會逐漸出現4核心產品處理器應用,多核心處理器技術已形成在有限開發條件下,令產品效能倍增的設計手段。

4核心應用產品將躍居重點高端應用設計方案

2011年的平板電腦、智慧型手機的設計主流多以雙核心應用為主,但在2012年的行動處理器應用趨勢,目前確定已朝4核心發展,例如Apple A6處理器,即有傳言採行4核心設計方案,而NVIDIA、Qualcomm、Texas Instruments都將推出4核心行動處理器解決方案。

在終端產品方面,目前一線競爭品牌如Apple iPad 2、Samsung、HTC等,主流產品均已導入雙核心行動處理器設計,而在2012年的世界行動通訊大會(Mobile World Congress;MWC),HTC將展出採行4核心設計方案的Supreme智慧型手機產品,此外如LG、Samsung、ASUS等都會有對應產品展出,這代表著4核心設計方案將是2012年的高端產品設計方案,藉由多核心處理器整合,把產品級距明顯拉大。

目前除Apple A6行動處理器的設計方案,相對情況較不明外,在非蘋果產品陣營的NVIDIA、Qualcomm、Texas Instruments等行動處理器大廠,對於因應多核心化的處理器設計方案,大多已有明確的產品發展藍圖。例如NVIDIA TEGRA 3、Qualcomm Snapdragon S4、TI OMAP 5均是目前多核應用需求下,硬體業者亟欲整合的處理器設計方案。

早期CISC處理器架構不利發展行動應用

早期處理器設計應用,多以Intel、AMD或x86架構產品為設計主流,因為x86架構下有豐沛的開發資源、參考設計與工業標準,甚至支援的作業系統、應用軟體也相對具更豐富的資源,但x86架構屬CISC(complex instruction set),早期設計方案為求加速運算不斷在現有設計追加更多指令集,藉以加速對應之運算效能,而不同效能產品則藉由外頻提升來獲得大幅改善,但此種設計方案會令產品雖具效能顯著提升效果,但在處理器本身卻會出現功耗大幅增加與散熱問題必須改善的問題,也相對較不利於行動裝置整合應用。

近年採RISC(Reduced instruction set computing)設計方案的ARM架構產品,逐漸成為行動裝置的主流設計方案,因為採RISC的ARM相較x86可在元件功耗表現更滿足行動設計方案的應用需求,而在嵌入式系統平台整合下,相關應用資源逐漸達到發展規模,讓硬體廠商可以更輕易的整合設計方案,應用相關開發資源進行產品整合。在效能表現方面,2006年的TI OMAP1運行時脈約200MHz上下,發展迄今2011年主流單核心ARM產品外部時脈都已達到1GHz水準。

2011年高階產品以導入雙核心處理器為產品的重要賣點,其中包括Apple的A5雙核心處理器方案、TI OMAP4、NVIDIA TEGRA 2、Qualcomm Snapdragon Scorpion等系列產品,都是2011年的雙核心處理器代表產品。甚至有業者宣示2012年將發展4核心、2.5GHz外頻的處理晶片,行動處理器的效能發展可以說是突飛猛進。

TEGRA 2雙核心行動處理器代表

NVIDIA以3D顯示晶片技術著稱,2010-2011投入大量資源開發面向智慧型手機應用的TEGRA 2雙核心處理器,除被Google選用於Android新一代作業系統的參考設計平台外,也獲得ASUS、acer、Motorola及LG主流品牌大量採用。TEGRA 2雙核心處理器,為達到簡化行動裝置設計、縮小載板佔用面積目的,元件採行SoC(System on a chip)單晶片架構設計,在單一晶片元件上整合雙核心ARM處理器、圖形?影像處理器、音效處理器、High Definition影像解碼器與1組處理系統基本維運功能的ARM7處理器。

繼TEGRA 2雙核心SoC處理器受市場大量採用後,NVIDIA再推出開發代號Project Kal-El之TEGRA 3 4核心處理器,TEGRA 3採ARM Cortex-A9架構組成的4核心運算環境,甚至在其規劃藍圖中,還可搭配12核心的NVIDIA GeForce圖形加速晶片GPU(Graphic Processing Unit),來架構需要更高效3D運算的設計應用。

NVIDIA TEGRA 3最早商品化的四核解決方案

多核心ARM的設計優勢相當明顯,以行動裝置的關鍵元件應用處理器(Application Processor)來說,元件的耗能可以說是能否整合於行動裝置的關鍵,在新的晶片技術下,製程不斷微縮,雖令晶片體積持續縮小,但卻仍有物理極限無法克服,必須採行多核新協同運算的應用架構,突破元件的物理限制,以NVIDIA TEGRA 3多核心處理器的設計架構觀察,在SoC(System on a chip)晶片內,基本上即利用4個相同的主運算核心,來因應需高效能運算的處理任務作業。

為因應行動裝置使用限制與功耗要求條件較高,TEGRA 3還利用特殊vSMP(Variable Symmetrical Multi-Processing)核心架構、搭配第五核心協同CPU(Companion Core),來負責低功耗模式下的相關運算作業,利用Companion Core核心來處理如音樂、影片播放或是基本低效能需求的操作應用任務運算。

當設備僅需要基本操作或是非高效應用時,TEGRA 3處理器會關閉較耗能的4個高效核心,改以協同處理器維持基本運作,當設備因應需高效能解碼、運算的作業需求時,例如3D電玩場景計算、瀏覽網頁、多工處理時,TEGRA 3處理器隨即開啟高效能4核心、關閉協同處理核心,維持高效運算所需的豐沛運算資源。全新的vSMP運算架構使得TEGRA 3 4核心處理器在運行功耗可以達到低於前代TEGRA 2雙核處理器產品,運算效能甚至可以提高超過30~50%。

Qualcomm、TI以Cortex-A15架構發展4核心產品

相較NVIDIA以TEGRA 2、TEGRA 3持續漸進搶攻市場,Qualcomm與TI則採取跳過Cortex-A9架構,計畫在2012年第二季推出採Cortex-A15 ARM架構的4核心行動處理器。Qualcomm以基於Krait微架構的Snapdragon S4系列處理器,Snapdragon S4系列處理器每一核心號稱可以在高達2.5GHz的時脈速度下運行,整體性能超越現有ARM架構CPU核心高達150%、同時耗電可減少65%。

Snapdragon S4系列處理器將會推出單核心、雙核心與4核心多種版本因應市場需求,其中還包含支援多達4組3D核心的全新Adreno系列GPU與整合多模LTE的整合產品。Snapdragon系列晶片將包括單核的MSM8930、雙核MSM8960及4核APQ8064。Snapdragon S4系列晶片均整合4種Wi-Fi、GPS、Bluetooth與FM解決方案,同時支援NFC(Near Field Communication)。

Snapdragon S4系列處理器預計將採28nm製程生產,晶片整合最新Adreno GPU,而高階Adreno 320 4核心GPU可提供較舊款Adreno高出15倍影像重繪性能,影像處理效能可因應高解析度畫面輸出與3D即時演算運行,亦可因應輸出Full-HD影片設計需求。與其他處理器競爭對手較不同的是,Qualcomm所推出的是基頻處理器加上應用處理器的完整設計解決方案,供智慧型手機、平板電腦廠商快速開發產品的設計方案,不僅可令產品減省元件採購成本,同時又可大幅縮短研發時程。

尤其是在Qualcomm在智慧型手機市場為主流供應商,其Snapdragon平台亦為主流產品的首選設計方案之一,甚至為搶下2012年多核心處理器應用市場,Qualcomm計畫在新產品線全面提升3D GPU性能,同時宣布將在Android Market官方軟體線上商城推出超過100個以上Snapdragon Game Command遊戲APP,提供用戶Snapdragon處理器最佳化遊戲應用資源,積極搶攻市場,其後勢發展仍必須持續關注。

Apple A6極可能採行Cortex-A15多核心架構

Apple在2011年推出的iPad 2中,即採行自行研發的A5雙核心處理器,A5為1GHz雙核心架構,該款雙核心處理器的最大升級,即採行全新1GHz Cortex-A9 ARM架構雙核處理器,由2組1GHz Cortex-A9 ARM晶片組成(A4為單核心Cortex-A9 ARM晶片)。

另針對3D繪圖強化設計方面,iPad 2將圖形顯示核心升級為PowerVR SGX543,若以相同的運行條件來看,PowerVR SGX543在相同時脈下可達到處理每秒3,500萬個多邊形、像素填充率多達10億,同時支援Apple所支持的OpenCL 3D繪圖標準,A5雙核心處理器搭配新款圖形顯示晶片奧援,整體演算效能強化足足因雙核心與顯示加速,令效能較前代產品提升100%以上,而單就圖形處理能力則有9倍提升表現。

在4核心產品方面,因應Apple iPad 3推出計畫,核心處理器預料也會將有4核心產品改版升級,依Apple慣例處理器代號應為A6。一般市場預料,Apple iPad 3最大的改變應將原有IPS LCD解析度大幅提升300%,而解析度提升後要維持相同、甚至更快的圖形處理能力,是必需要通用處理器與圖形加速效能同步升級,才能滿足新的硬體需求,市場多方評估,Apple若要因應新面板設計,A6處理器至少要具備4核心,同時圖形顯示也必須達數倍效能提升才行。

目前Apple開發團隊已完成代號J2的iPad 3研發,DisplaySearch分析師Richard Shim評論iPad 3將採行10吋2,048x1,536螢幕解析度,若此設計方案屬實,4核心處理器與圖形顯示效能雙方面規格提升,將成iPad 3能否順暢運行的關鍵。目前確認的是Apple A6處理器依舊採行ARM架構,同時極可能採行ARM最新Cortex-A15 MPCore(multicore processor Core)架構。

Cortex-A15架構為基於ARMv7-A Cortex微架構,可在單個晶片內進行1至4個SMP(Symmetrical Multi-Processing)處理核心整合。尤其是Cortex-A15架構約較為上一代Cortex-A9具100%性能提升幅度,甚至可在相同的功耗基礎上達到5倍左右的性能提升,因此新產品導入4核心解決方案應勢在必行。