嵌入式處理器性能持續升級 搶攻高性能運算應用領域 智慧應用 影音
EVmember
member

嵌入式處理器性能持續升級 搶攻高性能運算應用領域

  • DIGITIMES企劃

C2-270防撞系統是一款採用MIPS-Based EyeQ2視覺晶片解決方案的產品,能在撞擊發生前關鍵幾秒內提醒駕駛者。mobileye
C2-270防撞系統是一款採用MIPS-Based EyeQ2視覺晶片解決方案的產品,能在撞擊發生前關鍵幾秒內提醒駕駛者。mobileye

以往高性能運算(HPC)應用,由於需仰賴高效處理器處理龐雜且密集的資料量,處理器性能要求使得多數應用朝向採大型電腦處理,但隨著嵌入式處理器運作時脈持續攀高、多核心或異質核心整合的處理器設計,令嵌入式系統平台已略具跨足高性能運算應用領域,甚至在多數應用場合可作為終端資料處理節點的數據運算預處理,減低高性能運算應用建置的投入成本...

高性能運算(high-performancecomputing;HPC),原本是指執行大型運算密集型的系統應用,HPC運算通常多用於大量繪圖處理、數據演算、參數模擬等應用領域,而系統多半需處理相當複雜、龐大的數值演算法。

Car-to-Car-Communication-Consortium(C2CCC)可利用嵌入式系統簡化系統設計,同時提高系統穩定性與滿足即時反應需求。Car to Car Communication Consortium

Car-to-Car-Communication-Consortium(C2CCC)可利用嵌入式系統簡化系統設計,同時提高系統穩定性與滿足即時反應需求。Car to Car Communication Consortium

M2M(Machine-to-Machine)系統可用嵌入式晶片降低開發成本。Infineon

M2M(Machine-to-Machine)系統可用嵌入式晶片降低開發成本。Infineon

Unmanned Aerial Vehicle無人駕駛飛機,可應用嵌入式系統建構感測與自動控制應用。gpjt

Unmanned Aerial Vehicle無人駕駛飛機,可應用嵌入式系統建構感測與自動控制應用。gpjt

基於智能視頻分析處理的汽車防撞預警系統,由於車載系統需面對高溫、高濕、震動嚴苛環境,僅有嵌入式系統能滿足應用設計。

基於智能視頻分析處理的汽車防撞預警系統,由於車載系統需面對高溫、高濕、震動嚴苛環境,僅有嵌入式系統能滿足應用設計。

嵌入式系統可用極小體積達到整合應用需求,相當適合作為端點感測與環境資料擷取、處理相關應用。XILINX

嵌入式系統可用極小體積達到整合應用需求,相當適合作為端點感測與環境資料擷取、處理相關應用。XILINX

預警煞車防撞系統(collision mitigation system)大量應用嵌入式系統,來達到高性能運算應用目的。Mercedes-Benz

預警煞車防撞系統(collision mitigation system)大量應用嵌入式系統,來達到高性能運算應用目的。Mercedes-Benz

常見高性能運算領域有天氣模擬?建模、流體力學實驗室的風洞實驗的數據擷取?分析、電子電路?積體電路模擬計算等,利用強大的電腦系統來模擬實驗或參考結果,處理這類高性能運算的設備為達到高效能、極短時間產出結果的目的,設備多採超級電腦或是大量工作站平行運作,設備龐大到要擺在中央機房運作,而設備還必須搭配冷卻系統維護運算順暢運行。

小巧體積、超低功耗特性 嵌入式系統應用優勢

以小巧體積、低功耗特性為見長的嵌入式系統,也在運算單元、多核心整合,甚至異質核心SoC整合趨勢下,漸漸達到具處理高性能運算應用的設計要求,甚至由於嵌入式系統可以達到極度小巧的系統設計,以往採中央集中運算的HPC系統架構,還可以將龐雜運算部分由負責擷取資料的終端感測器整合嵌入式系統,讓擷取感測參數的同時即時解析出具價值的數據,進一步減輕以往高性能運算核心處理系統架構的設備成本。

有趣的是,嵌入式系統的運算核心升級趨勢,並非在元件持續提升單位外部時脈,嵌入系統在單核心的效能強化方面,2012年期間已有業者預計推出單核心2.5GHz外部時脈的產品。

一般評估以目前的積體電路製作技術,雖然再利用更精密的製程、新材料科技等前端科技,也可提升單核外部時脈來令效能倍增,但實際上業者評估再強化外部時脈會令嵌入式系統需增添主?被動散熱系統輔助,或是影響系統穩定性,目前主流開發機制並不傾向持續提升單位元件外頻來增加效能。

多核心整合技術為嵌入式系統效能倍增關鍵

嵌入式系統性能的倍增關鍵,目前多數業者傾向採取多核心SMP(symmetric multiprocessing)來強化元件效能,透過同質多核心晶片的多工運行,強化運作效率,甚至利用SoC(System on a chip)技術來將處理關鍵運算的DSP(Digital signal processing)進行異質核心整合,來減低元件內的通運處理器的效能瓶頸,讓核心晶片與DSP甚至是GPU(Graphics processing unit)在晶片內以interconnection network的形式在IC內處理大量、龐雜的數據傳輸,一方面令資料傳輸更具效能,而晶片內傳輸也更具可靠性,與嵌入式系統的設計理念不謀而合。

對比目前常見的商用處理器,動輒4核心、8核心,其實嵌入式處理器也不遑多讓,雖然目前主流為雙核心產品,但2012年上半年已有4核心量產產品堆出,越來越多的高效能異質核心整合產品,也將在各種嵌入式應用相繼出現,即便目前嵌入式系統主流外頻仍為1~2GHz之間,但因為嵌入式核心極為小巧,也易於與其他異質核心、矽智財進行整合,為特定應用或系統進行客製整合。

而嵌入式系統應用於高性能運算例子相當多,例如,汽車電子應用方面已有業者利用嵌入式系統發展主動防碰撞預警系統的關鍵感測系統建模,與狀態回饋反應系統建構,處理類似在車輛行駛中持續感測周遭車輛動態位置、與前後車距離測距分析、行車警示即時運算於車輛預警系統的煞車系統、燈號系統即時驅動反饋應用整合方面。

軍事、航太領域 持續增加嵌入式系統應用

甚至美國軍方,也開始利用嵌入式系統來建構無人駕駛飛機的高性能運算應用需求,例如,應用飛機的速度、方向、陀螺儀等多元感測元件,建構操駕飛機所需的相關參數建模,再透過系統化的即時數據運算來整合人工智能駕駛系統,達到無人飛機基本的操控應用需求,而由於嵌入式系統的低功耗、高穩定與易於整合於系統的應用特性,用於發展小型高性能運算系統更具發展優勢。

相同的,越來越多以往需仰賴中、大型電腦才能整合的應用系統,在成本與系統佈建考量下,也有越來越多應用朝向採行嵌入式系統來進行系統建構。例如,M2M(Machine to Machine)應用環境必須在每個感測端點處理大量環境參數、同時將這些參數預處理或送至對應的系統進行整合。

若採集中式的高性能運算系統建置,將會在系統所需的資料傳輸介面開發上大傷腦筋,因為大量數據若採無線傳遞勢必會造成感測端點的單位成本,甚至容易被環境因素干擾,較實際的作法是直接在資料擷取端點即針對大量數據透過嵌入式系統預先處理、解析,僅傳遞關鍵訊息,讓M2M應用系統在應用網路技術方面,因為大幅降低端點的數據傳輸量,也能讓系統的網路建構成本降低,網路反應與系統穩定性也可同步提升。而M2M應用相當廣泛,例如生物科技、智慧醫療與環境輔助應用方面,都可以藉由嵌入式系統的效能持續提升,而讓這些整合應用服務在反應上、應用效果更趨實用化。

嵌入式系統對環境耐受性強 用於M2M系統應用更具優勢

尤其是M2M應用環境,大多處於相對較惡劣的應用場合,例如車載系統,或是與終端感測元件整合的設計,通常是在高溫?低溫?大溫差反應的環境,甚至可能是潮溼狀況下運行,這時面對惡劣環境的運行要求,也考驗著M2M系統的實用性,若因為極端應用環境狀態而造成設備故障、誤動作,即無法符合M2M的應用低標。

若以同樣是具無線通訊功能的設備或終端相比,消費者對智慧型手機的壽命要求或許能忍受1至2年,但若M2M終端或應用系統,使用壽命至少需5到10年以上,才能滿足應用需求,若是以水、電基礎建設使用的M2M無線電表所使用的嵌入式系統,設備壽命要求甚至會被要求需要超過15年。

在硬體的發展下,也讓原本面向輕薄短小設備應用需求的嵌入式系統,能打入高效能運算的應用領域。因為,現今在軍事、航太應用領域中,對於處理器的要求極高,必須具極高的穩定性,與易於整合開發的應用目標,尤其是整合的系統、產品,必須在量產成本上取得較佳條件,甚至在大量客製要求下也能達到對等的低成本要求,而著在標榜架構單純、易於整合異質核心的嵌入式ARM架構,則可用來產製特殊應用所需的系統單晶片。而在軍事、航太應用方面,採嵌入式系統可快速整合於現有方案,甚至透過客製SoC也能達到避免核心技術外流或降低逆向工程解析的風險。

多核心、異質核心整合技術已有多種開發解決方案

目前Intel、Freescale、NVIDIA、Xilinx、TI,甚至通訊晶片公司Qualcomm都有對應整合型嵌入式處理器推出,準備迎接即將因HPC應用而起的新一波嵌入式系統應用風潮。例如,Intel即推出研發代號為「Knights Corner」的多核心產品,Knights Corner晶片基於Intel MIC架構,製造採用22nm 3-D Tra-geta技術方案,整合多達50個x86核心,而其雙精度浮點能力達到1TFlops。

Freescale推出的新一代高階多核心Power PC晶片「QorIQ AMP」系列產品,QorIQ AMP晶片應用改良後的AltiVec向量處理加速器,新的QorIQ架構可令每組晶片支援多達24個虛擬核心協同運行。另外,如Xilinx、Altera發展FPGA的公司,亦嘗試透過導入FPGA架構、多核心CPU產品來搶食高效能運算應用市場。例如,Xilinx的Zynq-7000應用方案,即在產品內整合了雙核心ARM A9嵌入式處理器、Neon向量加速器,搭配FPGA整合架構,可以讓系統開發人員因應不同的高效能應用需求自行架構或是客製化硬體運算環境。

選擇應用的嵌入式硬體方案 必須考量開發與移植成本

多核心的SoC應用解決方案已經出現多種整合樣貌產品,解決方案供應商可以提供如DSP(Digital signal processing)或搭配GP-GPU(General-Purpose computation on Graphics Processing Units)應用架構,再搭配異質混和核心應用方案,整合如FPGA、多個單核CPU等應用方式,雖然新穎的解決方案提供了更易於架構、開發的系統條件、但元件本身的高複雜性,也必須更了解方案的架構才能有效掌握嵌入式系統的開發成效,將整合的優勢有效發揮。

針對特定方案開發的系統或產品,也可能因開發成本較集中在該解決方案,若該應用方案未來再核心架構因應市場技術改變的升級開發速度不夠快,也可能因此影響未來應用的開發速度,尤其是採行這類整合方案的應用系統,由於每種技術方案的架構差異相當大,將致使開發團隊無法有效移植現有的開發成果至新應用平台,會導致未來移植平台會產生更多成本。

畢竟導入異質核心SoC或是其他嵌入式運算解決方案,是目前開發產品的常態,對產品未來系統的延伸或是移植設計,也必須納入開發規劃中予以整體規劃,而要滿足開發成果可以在不同應用平台上順利移轉,必須考量兩個關鍵問題,首先,硬體與系統開發必須有較好的溝通介面設計,此處指的介面不是硬體上的連接介面,而是軟體傳輸資料的應用介面,實際的應用可以搭配特定硬體或採取以低階的lib形式架構,而透過lib進行系統移植前的最佳化調校,可讓特定處理器的效能可盡可能的發揮其效用。但光透過低階的lib來進行整合或系統移植,可能還會造成較繁瑣的開發過程,在多數應用場合開發過程仍須搭配高階、功能抽象的語言來與低階的lib進行整合,藉以加速、簡化整合的開發工作。