從可共同維護性看機房設計實務 智慧應用 影音
Microchip Computex
ST Microsite

從可共同維護性看機房設計實務

  • DIGITIMES企劃

廣知工程科技股份有限公司 總經理 吳滄榮
廣知工程科技股份有限公司 總經理 吳滄榮

機房在早期建立之際,其實並沒有任何國際規範或認證,因此往往在施工完成後,許多問題浮上檯面時,善後事宜可能會衍生許多不必要的成本及時間,所造成的損失更是不計其數。

廣知工程科技技師總經理吳滄榮指出,其實所有部件的表現、所有管線的設計、可能會出現的衝擊點,都應該要在設計階段時就要先做好或找出來,在施工前就能夠完全掌握,如在高架地板裡面要如何配置等,最後才能達到第III級「可共同維護性(Concurrently Maintainable)」的要求。

吳滄榮指出,雖然初版的TIA942「資料中心通信基礎架構標準」早在2005年即已頒布,但在台灣仍算是很新的概念,真正深入了解的人有限。吳滄榮強調,許多機房所碰到的問題,如空調設備故障時,機房在60秒內,可能就會因為過熱產生故障,其實問題出在設計,參考TIA942,就可以得到解答。

資料中心基礎設施分級認證標章(Tier Certification)的申請,是由Uptime針對基礎設施的可用性,定義出四種不同等級,分別對應可用性及年平均故障時間。第I級的可用性為99.671%,年平均故障時間28.8小時;第II級的可用性為99.741%,年平均故障時間22小時;第III級的可用性為99.982%,年平均故障時間1.6小時;第IV級的可用性為99.995%,年平均故障時間0.4小時。

第I級的設計只要做到基礎建設要求,如現場的伺服器需要多少製冷設備來維持合理的運作環境即可;第II級就會要求冗餘容量(Redundant Capacity)設計,一旦主機故障時,會有另一台主機啟動接手,但管線本身仍然沒有做冗餘設計。

吳滄榮指出,第III級要求的「可共同維護性」,是指有設備故障時,可以因為有備載容量及雙迴路設計等,而能在現有系統保持正常運作的情況下,完成維修工作。

由於第II級及第III級的成本價差不大,而第II級及第III級兩者之間的年平均故障時間差距卻高達20.4小時,吳滄榮因此鼓勵業者,應該要直接鎖定第III級認證。但要達到第IV級的要求,必須要做到連續冷卻、實體區隔等設計,而且系統必須能夠自動偵測錯誤,自行回復正常執行的狀況,全自動化所要付出的成本,可能是第III級的一倍,但兩者的年平均故障時間差距,僅有1.2小時,因此業者要做好評估,那種等級最符合需求。

至於分級認證程序,Uptime Institute主要是以階段性認證方式進行,第一階段為設計規劃認證,認證範圍包括設計圖、系統架構、操作性能、維護性能及擴充性能檢討,經審查認可後,Uptime Institute會頒發設計等級認證書;第二階段為建物現場勘查認證,範圍包括整體機電設施的功能認證及測試與檢討。第三階段為經審驗認可後,Uptime Institute頒發設計等級認證書及牌誌。

吳滄榮指出,其實機房運作一直潛在著風險,如果沒有事先設法避免,如接頭、電線、電纜、電池或電容器的生命週期維護,或是預留維修空間,甚至可能只要有一個小小的風扇故障,都可能導致機房運作發生問題。

此外,如果機房設計兩條通訊路徑,但如果兩條線路經過同一個空間,卻因為這個空間發生事故而同時故障,一樣不符合第III級的要求。吳滄榮因此指出,要符合第III級的要求,就一定要做好實體區隔。

但台灣很多機房建置案,基礎建設僅佔預算30%左右,建築師不了解實體區隔的重要性,又沒有足夠的預算施工,機房設計也就難以達到認證要求。吳滄榮指出,其實正確的實體區隔,初期的建置成本並沒有很大的差距,但對於後續的維護成本,卻會產生重大的影響,是機房設計實務,必須努力推廣的方向。