下一代家用存取點與閘道器 智慧應用 影音
工研院
Event

下一代家用存取點與閘道器

  • DIGITIMES企劃

美商應用微電路(Applied Micro Circuits Corporation;APM)產品行銷經理Pravin Bathija
美商應用微電路(Applied Micro Circuits Corporation;APM)產品行銷經理Pravin Bathija

當今家用閘道器架構,在對外連接網際網路,對內連接平板電腦、智慧型手機、筆記型電腦、桌上型電腦、遊戲機、連網電視等眾多連網裝置,以及造成爆量頻寬的社群網路與多媒體應用下,已經出現效能瓶頸。因此,SoC廠商以雲端運算與伺服器平台規劃的經驗,以雙核心處理器搭配卸除負載(Offloads)引擎的設計思維,輔以封包分級轉派、應用程式特性的優先權?流量控管機制,以及讀寫加速機制,提出新一代的家用閘道器平台架構…

家用閘道器面臨多連網裝置與多媒體?社群網路的應用挑戰

美商應用微電路(Applied Micro Circuits Corporation;APM)產品行銷經理Pravin Bathija,以為何需要下一代家用閘道器開場,深入探究下一代家用閘道器技術、應用,以及產業基礎的模塊建立,及如何選擇正確的SoC晶片解決方案等,做為這場演講的討論議題。

首先他以一張動態示意圖,呈現當今無線家用閘道器所扮演的角色:不僅對外連接網際網路,同時要傳輸大量的多媒體視訊?音訊?封包資料,藉由有線或無線方式連接到平板電腦、筆記型電腦,以及連接大螢幕電視的遊戲機(如XBOX Live),連接你的智慧型手機以Wi-Fi方式提供Skype網路通話服務,以及連接智慧連網電視以觀看NETFLIX網路頻道商提供的影片內容。無線閘道器扮演著這些連網裝置與網路儲存裝置(Network Attach Storage;NAS)的中介角色,藉由無線閘道器來對NSA進行擷取或儲存大量資料。

Pravin Bathija提到,當前家用閘道器架構已經出現瓶頸,無法因應社群網路、多媒體應用、連接NAS儲存裝置與其他應用所帶來的爆量頻寬的需求,很少或根本沒注意到在頻寬與資料傳輸延遲的問題;許多主要閘道器內CPU設計封包處理,沒有充足的運算餘裕空間應付新興應用,自然也無法針對當前爆量頻寬與未來應用增添延展性。

他認為下一代家用閘道器,必須要具備Gbps(Gigabit)等級的Wi-Fi無線與有線連網能力,以因應多用戶端裝置高速存取需要;同時要具備高速網際網路與網路儲存裝置,具備流量整形(Traffic Shaping)且符合QoS服務質量的優先權流程管控機制,以及以應用程式類型為優先權的流程管控機制,深度的封包防駭檢測,可延展的應用機制,具備網路位址轉譯(Network Address Translation)、內容過濾機制,以及跨接支援USB 3.0的高速網路儲存裝置來儲存、串流化傳輸與對外共享資料。

建構Gbps高速網路應用的規格區塊

Pravin Bathija指出,為了達到Gigabit(Gbps)等級IP的封包轉發能力,以往的閘道器僅設計單一GE(Gigabit Ethernet)介面埠輸入?輸出,藉由1.2GHz等級CPU做封包過濾的頻寬管控功能,在一般以僅64Bytes大小的網路封包流,裡面參雜許多無優先權、QoS管控的資料封包,即便以1.2GHz CPU來做封包處理,仍有可能因為需要一個一個封包的循序處理,造成處理器被龐大的Gbps封包流嗆住(Processor Chokes),而出現斷斷續續的延遲現象。

APM設計的入門閘道器SoC架構,採用四埠輸入?輸出設計Gbps Ethernet乙太網路介面,後端以雙通道連接2組封包分類硬體加速器(Classfier),以關閉負載(off load)方式即時過濾封包並切換其流向,即便閘道器SoC為600MHz的APM86791 Keelback單核心CPU架構,處理Gbps爆量封包資料仍然游刃有餘。

他列出一個以IPv4做512、256與64Bytes封包下的比較數據,分別以Linux OS線上負載,以及Linux OS搭off load關閉負載方式進行效能測試,在512Bytes大封包的情況下,CPU耗用率從26%降到4%;以256Bytes中型封包傳輸時,CPU耗用率從100%降為7%;當切換至64Bytes最小封包傳輸時,CPU耗用率從居高不下的100%降到84%。

高階APM閘道器SoC像是APM86290 PacketPro處理器,具備雙核心PowerPC與250MHz ARM架構的SLIMPro輔助處理器設計,當從NAS或電腦DDR3傳輸不同優先權的封包時,藉由前端GE介面內置的IPSec、MACsec對低優先權但需低延遲的封包流量進行切割、線上檢核;中段級別判斷線路(Classfier)則識別封包流向、具備可程式化、動態切換、MAC固定網或虛擬區網,以及支援IPv4與IPv6、TCP與OoS要求;在後面的PQ0~PQn可程式化優先權過濾器,則可依照優先權設定進一步判斷封包走向,依照優先權設定給予快速通關或者暫候,以協助做流量整形;最後端四埠GE介面再進行即時IP編碼、MAC安全編碼與檢核碼產生,完成最後封包重組傳出。

Pravin Bathija指出,APM設計以應用程式為基準的QoS與DPI服務質量與資料速率控管機制,可以針對Skype、NETFLIX、Xbox Live與Bit Torrent(P2P)軟體,分別設定不同的傳輸速率與封包優先權,例如針對Skype把封包序列優先權設為1、資料頻寬10Mbps;NETFLIX網路電影設優先權為2、頻寬20Mbps;Xbox Live優先權3、頻寬40Mbps;BT設為優先權4、頻寬2Mbps;如此在這四種應用下,都能享有最適合各種應用程式的QoS服務質量與頻寬流量。

而APM設計的內容過濾與安全防護機制,從封包進入閘道器前端就即時針對無效封包、惡意分享?下封包、轉譯埠封包、DDoS延遲反應?阻斷式封包即時過濾剃除,不會增加閘道器分配流量的負擔。

他也提到,APM的家用閘道器內建USB 3.0介面,可以直接連接支援USB 3.0高速介面的NAS網路儲存設備,享有5Gbps的介面傳輸速度;同時若搭配閘道器內Linux核心建置的最佳化的檔案系統與SATA驅動程式,即便存取大型檔案也能夠最佳化處理。同時在讀取過程啟動大型封包接收關閉負載(Large Receive Offload;LRO)模式,以及寫入資料過程啟用TCP封包分段卸載(TCP Segmentation Offload;TSO)模式下,均能夠有效的加速大型檔案的讀寫速度,並降低CPU耗用率。

他列舉一個測試示意圖,以一個單一檔案長度為4GB的檔案,以單線緒(Single Thread)進行讀寫測試,在未開啟LRO模式下讀取速度為100MB/s,CPU耗用率100%,開啟LRO讀取速度提升為120MB/s,CPU耗用率降為70%;未開啟TSO模式下寫入速度為65MB/s,CPU耗用率100%,開啟TSO模式下寫入速度加速到120MB/s,CPU耗用率降至82%。

Pravin Bathija接著表示,APM閘道器SoC所規劃的內建NAT網路位置轉譯機制,可以使各連接到閘道器的各連網裝置的真實IP,跟透過閘道器NAT轉譯後對外的真實IP有所隔絕,外頭無法探索得知連網裝置的真實IP與MAC網路位址,杜絕被植入木馬或成為殭屍代理裝置,而成為駭客遠端遙控的跳板。

選擇正確的閘道器SoC晶片解決方案

Pravin Bathija認為,傳統閘道器平台架構或SoC,只是一昧的追求多核心CPU的設計,沒有協助CPU卸除負載(Offload)的設計思維;而美商應用微電路設計的一系列APM86xxx閘道器SoC,除了導入多核心CPU,並加入Offloads卸除負載、封包級別派發電路(Classfier)、資料流量控管(DPI)、IP轉發、流量整形、TCP SAR、TCP/UDP CSUM、Security安全機制與NAT位址轉譯功能的加入。

由APM開發的APM86290 PacketPro閘道器SoC晶片的架構方塊圖,內建雙核1.4GHz 32位元460 PowerPC CPU,搭配SLIMpro ARM 250MHz客製化卸除負載引擎架構,提供1組PCIe x4、1組PCIe x1匯流排控制器,SATA 2.0與USB 3.0介面,足以用來規劃、設計出下一世代家用無線閘道器平台。

Pravin Bathija最後總結,單純以CPU運算能力,已不足因應目前與下一代閘道器運算處理與低延遲的封包分派需求,設計專屬且以應用程式為導向的負載卸除引擎,能符合經濟且有效率的延展閘道器平台效能,減少CPU工作頻率與整體功耗;負載卸除(Offloads)引擎在主要應用情境,以及經常使用的應用程式下,可以釋放更多CPU耗用率給其他應用程式使用,而精心設計的SoC晶片能大幅改善應用程式的反應時間,增進用戶的連網使用體驗。