中文简体版   English   星期四 ,11月 15日, 2018 (台北)
登入  申請試用  MY DIGITIMES153
 
ITRI
訂報優惠

KingTiger與浪潮合作 提供iMS記憶體檢測修復技術

  • 林仁鈞

 「浪潮在伺服器上的業績在過去幾年連續高速成長,增速位居世界第一,這是建基於我們對效率的認真追求和對品質的絕對堅持。KingTiger的iMS專利技術剛好滿足了浪潮對這兩方面的需求,使記憶體老化問題所引起的偶發性不穩定現象在根源上取得有效控制。」—— Inspur浪潮/副總裁孔亮

隨著伺服器進入Purley平台的時代,系統運行的速度大幅提升;同時記憶體生產製程的不斷壓縮、容量的持續增大、單元密度增加、生產製程的複雜,客觀上增加了記憶體缺陷檢查和測試的難度;再加上新的軟體應用情境的變化,使得記憶體衍生出各種無法預測的新的錯誤模式,從而造成整機系統報錯的頻率也隨之明顯升高,各種ECC、UCE報錯甚至當機,給使用者造成不良體驗,影響產品口碑,連帶影響廠商品牌的價值與知名度。

Kingtiger technology COO 張黎明

浪潮測試驗證部副總經理范志超

KingTiger Technology,作為DRAM記憶體測試設備的領先設計製造者,運用30多年來所累積的獨家記憶體測試與修復技術,與BIOS業者相結合,共同推出「智慧記憶體巡檢系統」(intelligent Memory Surveillance;iMS)的軟體解決方案。

在2018年COMPUTEX台北國際電腦展上,KingTiger COO張黎明(Sunny Chang)與浪潮電子資訊產業股份有限公司測試驗證部範志超副總經理,連袂接受了本報記者的訪問。

KingTiger的首席運營官張黎明表示,建基於BIOS之上的iMS專利技術,將記憶體的測試、掃描與修復巧妙地融入系統中, 在產品出貨後的整個生命週期發揮保護作用。iMS一旦偵測與確認出記憶體出現故障區段,就對該區段進行適合的修復,以確保同一位置不會重複出現同樣錯誤,確保系統持續的正常運作,為記憶體系統提供長效的保護。

這一套解決方案,具備記憶體檢測、失效隔離和預警等完整的記憶體管理功能,在幾乎不佔用系統資源的前提下,提高記憶體穩定性與效能,猶如人體的免疫系統一樣,默默地守護著電腦裡的記憶系統。

作為大陸伺服器出貨量最大、最先應用iMS技術的伺服器廠商,浪潮的範志超副總經理就iMS為浪潮伺服器所帶來的價值發表了以下看法:

對於伺服器產品來說,系統的可靠性是Inspur浪潮所極力追求的。浪潮深知DRAM記憶體的品質是影響伺服器整體可靠性最重要的因素之一,特別是在大規模的核心應用上,所以浪潮與KingTiger從2016年就開始進行iMS相關技術的應用合作。iMS技術,對提高浪潮伺服器系統的可靠性和可用性起到了很大的作用。

iMS技術除了運用處理器處於閒置(Idle Time)的時間來做記憶體巡檢外, 亦能夠配合ECC記憶體, 對一些在應用場景下的問題進行修復和防護,當ECC發出錯誤訊息時, iMS對該記憶體位址進行即時檢測和有需要時進行失效隔離,為客戶帶來更加穩定可靠的客戶體驗。解決了記憶體故障無法修復導致停機、故障難於定位、個別錯誤導致大規模記憶體浪費等記憶體錯誤和故障處理難題。

浪潮和KingTiger在Brickland四路平台上和Grantley雙路平台上已經成功使用了iMS技術。通過我們的實驗資料和客戶的應用體驗,iMS技術能夠為終端使用者帶來更加穩定可靠的運行。在Purley平台上浪潮與KingTiger及BIOS廠商進行密切的合作,並率先在全球完成了基於Purley平台的iMS技術導入。目前浪潮正在積極地將iMS技術推廣應用,為浪潮的終端客戶實現價值,帶來更大的市場收益。

2018年初,浪潮發表天梭M13伺服器,是專為超大規模即時交易處理而設計的大型關鍵計算系統,面向總部級別的銀行存儲款、電信產業計費系統、跨國企業ERP等關鍵應用場景。M13支援處理器核心數量超過1000個,具有強大的線上交易處理能力,同時採用了複雜的高可用技術系統,滿足業務7*24小時穩定運行需求。天梭M13的關鍵技術之一就是使用KingTiger –iMS記憶體檢測修復技術。

iMS--記憶體錯誤減少95%以上

根據浪潮的實際數據研究, iMS系統能夠在浪潮伺服器運行過程中,有效減少失效記憶體進入系統的機會。開機前的可選Diagnostic診斷功能類似工廠專用記憶體測試ATE,但又優於ATE,可以讓使用者方便的進行全面記憶體檢查。隨著服役時間的延長,記憶體的電氣性能會不斷衰減,從而產生記憶體失效,Diagnostic診斷功能讓用戶有效避免這一隱患。

在系統運行時,IMS可以對故障記憶體進行即時自我修復,也很好的防止記憶體老化帶來的運作錯誤,提高系統可靠性。而且IMS對於記憶體錯誤的定位和處理更為精細和及時,某些本應作RMA處理的記憶體,可以在系統不關機的前提下,持續對外提供服務的情況下做出無縫自我修復,大幅減少用戶的負面體驗。在使用IMS後,ECC log報錯日誌內容隨時間推移成收斂狀態,效果顯著。浪潮統計資料表明,IMS可以有效減少記憶體錯誤的發生,提高記憶體可用性。

面向超大規模資料中心的雲、大數據、深度學習等多種應用場景的浪潮旗艦英信NF5280M5伺服器,在這次COMPUTEX 2018台北國際電腦展中,提供現場iMS展示,攤位號碼是南港展覽館L1332,恭候各位貴賓蒞臨現場,實地感受其優異的效能與產品魅力。

Inspur浪潮,是大陸領先的雲端運算、大數據服務商,大陸伺服器出貨量第一,世界排名第三,增速全球第一。在AI伺服器市場佔有率第一,且超過第2至第5名的總和。已經形成涵蓋IaaS、PaaS、SaaS三個層面的整體解決方案服務能力。憑藉浪潮高階伺服器、海量存儲、雲作業系統、資訊安全技術為客戶打造領先的雲端運算基礎架構平台,基於浪潮政務、企業、產業資訊化軟體、終端產品和解決方案,全面支撐智慧政府、企業雲、垂直產業雲建設。

浪潮集團擁有浪潮資訊、浪潮軟體、浪潮國際、華光光電4家上市公司,業務涵蓋雲資料中心、雲服務大數據、智慧城市、智慧企業四大產業群組,為全球100多個國家和地區提供IT產品和服務,全方位滿足政府與企業資訊化需求。

KingTiger Technology,是記憶體半導體產業測試設備的領先設計者。 基於革命性的新測試技術,KingTiger Technology的測試設備為所有不同階段和級別的記憶體測試提供了附加價值。 從DRAM半導體製造到記憶體模組生產,KingTiger提供的產品和服務將以前所未有的水準降低測試成本並增加與目標應用程式的相關性。(本文內容由Inspur浪潮與KingTiger提供,DIGITIMES整理)