DForum
斷鏈之後
 

運用基礎設施管理平台 掌握資料中心動態

艾默生網路能源 技術顧問 張志銘

由於機房內的基礎設施組成項目眾多,事件發生種類及數量繁雜,如不及時回應,往往會對公司系統及營運產生重大的影響,因此現在企業無不希望能透過資料中心基礎設施管理(Data Center Infrastructure Management, DCIM)平台的協助,即時收集各項設施完整環境資訊,並依據其變化及需求表現,在滿足成本、容積、彈性、風險、法規、安全性和可用性等多樣化條件限制下,自動進行快速調整,以便讓機房運作得以保持在最佳狀態。

艾默生網路能源技術顧問張志銘表示,由於基礎設施故障、資料中心資源不足,近24個月內有95%的公司曾遇上非計畫性停機,而一次停機平均的損失即可高達505,502美金─但這其中有80%可因為對基礎設施實行有效管理而避免,由此可知DCIM對企業的重要性。

張志銘說,依照傳統的作業流程方式,機房內有關空間配置/電力傳輸/空調設計等基礎設施項目,與網路/伺服器/儲存設備/應用系統等資訊系統項目,通常是兩組彼此獨立的人員在負責管理及維護。中間的資訊傳遞,基本上是要靠人和人之間不斷的往返溝通,不僅在內容上非常不精確,過程也是十分冗長。這使得當企業資訊系統的需求成長時,底層支援的基礎設施擴增速度時常無法跟上。

為了解決此一問題,過去的做法是參考其他業者資源消耗的經驗,亦或是根據其自身負載尖鋒時的資源用量,在規劃與建置新的基礎設施時,就先預留好更多資源空間/容量備用,以避免因上述原因而導致IT服務中斷,讓公司蒙受重大的損失。

不過這種對應方式在機房開始邁入虛擬化、雲端化的時代,顯然已難以再適用。由於現在機房的設備密度更高,服務用戶數更多,資料處理量更龐大,事件發生次數更加頻繁,IT服務中斷發生時,自然對企業營運的影響衝擊更大。如果再加上IT資源虛擬化之後,IT應用程式、IT網路/伺服器/儲存設備,以及機房電力/空調等基礎架構設施不再是以往單純一對一的關係,過去即存在的斷層更加明顯。

張志銘指出,當某個基礎架構設施故障時,所會波及到的應用系統根本無法確定,難以做到即時反應。這使得企業必須大幅增加其機房基礎設施的備用數量,以降低發生問題的機率及影響衝擊的程度。對於IT預算普遍被縮減,企業越來越講究投資效率的今天,將大量資源投注在備用的基礎設施上,似乎顯得相當不划算。

張志銘建議,比較好的做法是要建立由上往下的「機房生態系統」,藉由企業對應用層系統的規劃及預測,決定所需要的IT網路/伺服器/儲存設備等硬體設備數量,再據此建構支援其運作的機房電力/空調等基礎架構設施。這表示企業需要一套可支援人們執行環境訊息收集、分析資料以決定基礎設施、採用具體行動並加以驗證,最後再回過頭蒐集行動對原環境所造成影響等一連串步驟的閉環控制平台,以做為IT人員在資源有限的條件下,持續改進企業機房關鍵基礎設施性能的作業框架。

張志銘認為,這也正是長期投入通信網路、資料中心和工業設施等專業領域的艾默生網路能源,之所以會推出其DCIM解決方案平台的主要原因。

不同於一般直接將流程、資產、報表、監控、容積規劃、變動管理、存取控制等個別不同產品進行整合的方式,艾默生網路能源的DCIM解決方案平台是透過一共用的動態平台為基礎,將機房內各項常見的基礎設施,如電力、製冷、監控、環境、機櫃、電纜、能源、空間規劃與遠端操作等所需之管理功能納入其範圍。

張志銘指出,如將各別產品以一對一進行整合的方式,不僅效率很低,其伴隨產生的複雜架構,也容易使企業在反應速度及未來擴充性方面遇到很大的問題。而艾默生網路能源的DCIM解決方案平台由於是軟硬體一同開發,收集資料點、總結流程/應用規則、找出模式、進行調整及檢視結果…等步驟都可以單一整合平台上透過視覺化管理介面進行操作,使得企業機房人員真正能做到以毫秒為單位,即時處理並解決所遇到的問題。

舉例來說,其DCIM解決方案平台中的Universal Management Gateway可收集與監控來自基礎設施設備、伺服器、環境感應器中的資料,並將其傳送到後端的Trellis應用平台,而Trellis除了會將這些機房資產訊息統整在單一的儲存器上存放,以便讓企業能夠更為簡易地管理IT/設施資產與資源之間的關係外,標準化的資料中心流程和資源分配追蹤策略,也能夠讓以往疏離的IT設備與機房基礎設施更緊密的協同互動,以降低資源調整及變化時的風險。

張志銘表示,追蹤各虛擬機器在資料中心內實際所在位置的能力,更使得過去難以管理及規劃的虛擬資源消耗狀況,獲得良好的管控,減少MTTR的時間。這些機制除了可協助IT人員從單一來源進行規劃和管理變化,減少不必要的IT基礎設施投資外,更重要是能夠大幅降低機房非計畫停機的風險。

  •     按讚加入DIGITIMES智慧應用粉絲團