智慧應用 影音

引入維運無縫接軌理念 預先消弭機房營運風險

2019/02/21 - 闞大成

持平而論,若將台灣的資訊機房比喻為跑車,其實問題不在跑車品質好壞,而在於這些跑車出廠後隨即交給賽車手進行比賽,在上賽道之前,多半未做足軟胎、引擎點火、電腦控制等調校,容易導致後續出狀況。

「機房一蓋好,便急著搬入設備營運,SOP未經驗證演練,對營運人員的教育訓練也不到位,」日昇意定科技顧問公司總經理朱國權認為,機房疏於進行測試驗證,可能衍生致命危機,相關悲劇不管在國內外都時有所聞。

2018年初,某半導體廠進行電氣室的歲修維護,因施工不慎而導致配電盤短路爆炸,使3名外包工人慘遭電擊,嚴重燒燙傷;以及多年前某大型公用事業在測試新增變壓系統時,因測試電纜掉落而造成短路,有1.1萬伏特超高壓電流竄出,6名工人遭瞬間高熱燒得皮開肉綻的案例。

不需停電停水,仍可執行計劃性維護

這些怵目驚心的意外事件,其實都可以避免;只因按照國際標準,即使執行計劃性維護工作,設備仍可停電保養,不影響系統運轉。意謂任何機房只要照著標準走,確保機房不管在設計規劃、施工、維運等不同階段,皆能一路符合未來營運需求,就不會把自己逼到「礙於系統架構限制、無法在停電下作業」的僵局,更不會讓維護工人在活電危機下涉險。

朱國權指出,現在業界有一個新觀念「Operations & Maintenance Ready」(簡稱「OM Ready」),內含「維運無縫接軌」的意思,意指機房之建置從設計規劃時,便需要導入「永續維運的規劃設計理念」(Design for Operational Sustainability),並在施工時導入「全生命週期功能驗證」(LiBCx),如此即可確保於設計規劃、施工、維運階段均可符合未來營運需求,讓機房開張的第一天就可運轉到位;他個人非常堅持前述理念,也致力推廣至整個機房產業。

以Uptime Institute Tier III認證而論,指明機房在執行計劃性或週期性保養時,系統不需停機,連帶不會產生不必要工安意外,單憑這點,便已充分道盡了「維運無縫接軌」的價值。事實上,機房設備保養時不但不需停電,甚至也不需停水,如此才可避免維修工作人員在巨大水壓下作業,也能防止水噴電盤而釀成觸電。

但要實現這些目標,在期初設計規劃時就得顧慮到許多細節。比方說,考量維修工人需要鎖緊匯流母線,就必須在事前設計上,預留足夠工作空間,避免工人連辛苦側身縮著手都無法鎖緊匯流排,連帶確保工人有空間可以上磅數,避免因為停電後復電導致匯流排「熱脹冷縮」而爆裂,另外也需要確保設備本身具備可共同維護性架構。

朱國權提醒,莫要忽視「上磅數」這件事,一旦長期漠視它,可能因而種下日後災難伏筆。例如有些大型閥類未預留空間,以致無法上磅數,易形成漏水,久而久之恐導致爆管,若因而滲出有危險的氣體或液體,可想而知將對人體造成傷害。考量及此,某家遵照Uptime Institute標準興建機房的電信營運商,在設計規劃階段,便高度留意閥類的預留空間,並透過紮實的演練程序,確保在進行維護操作時,可以順利開閥與關閥;同時也透過SOP嚴格要求高架地板的編號,務必清清楚楚,萬一哪天出了狀況,就能很快確知事發地點,並藉由高架地板編號回推到對應的閥類,精準地針對這些閥類執行維修,而非像無頭蒼蠅般舉手無措。

設計階段,需逐圖、逐字進行規格確認

前面提到,設備本身需要具備可共同維護性架構,此話牽涉到幾個層次:在設計階段,需根據所涉及的性能測試,去制定詳細和全面性的性能測試規格、及設計評斷,箇中含括了預施工、施工的可共同維護性檢討過程;至於施工安裝階段,需經由設備及系統的觀測和說明文件,來檢查與配合測試計畫的應用,並根據系統設備、目標和所有合約文件,確保遵守應有功能。

為產生可共同維護性的「實體基準」(Concurrently Maintainable),「Kick-off Meeting」顯得十分重要,且應當與會的人士,不僅涵蓋甲方的決策高層,亦需納進負責於現場施工的工頭工班、設計單位,甚至設備商代表,一場開下來100~200人跑不掉。且這群人並非純粹聽講,亦需在追蹤管制表的基礎上,邀交各自負責產生的文件(如編碼表、管理規則...等等),以接受監造單位控管、驗證文件正確性。

換句話說,透過Kick-off Meeting,可確保3D建模、現場、功能驗證等大大小小事項,都成為全體的一致共識;在此過程中,在Concurrently Maintainable當中堪稱關鍵要素的標示計畫(含所有線路或閥件)、色彩管理準則,也都會拍板定案。

朱國權進一步說明,所謂「維運無縫接軌」概念,內含非常嚴謹紮實的基本功,一招一式都不容許偏廢。在設計階段,設計單位需與業主密切配合,「逐圖、逐字」完成所有書圖的性能與規格符合業主需求(OPR),接著導入風險管理與對策、流場模擬分析(CFD)、建築資訊模型(BIM)建置、PUE耗能分析。

為了善盡此事,日昇意定科技顧問公司斥資購置兩項精密儀器,一是全站儀,做為放樣之用,意在確保設計圖與現場的精準一致性;另一是雷射掃描儀,旨在透過3D成像掃描、捕捉現場的限制條件,再藉此進行3D模型套匯。如此便可保證模型與現場完全1:1對應,達到最高的可施工性。

5G商轉在即,機房升級為當務之急

進入施工階段,首先需建立專案管理平台(PMIS),據此展開細膩的工作分解結構,不僅詳列各項工作名稱,也蘊含排程進度管理、文件管制等機能;其次藉由BIM模型進行多次套匯,避免潛在施工衝突;爾後建立風險里程碑管理系統(RMS),妥善執行施工品質管理,要求廠驗(FAT)、單機測試(SAT)、功能測試(FPT)、整體性能測試(IST)及確效驗證(VMP)、全黑全關(Power Outage)、維運驗證(MMP)悉數到位,並演練所有操作程序、防範機制、資安管制、維運流程,確保整體工程性能達維運所需。

到了維運階段,業主在機房營運啟動的第一天,就能完整獲致機房永續維運管理手冊——等於機房營運的「聖經」,讓維運人員懂得如何使用各種文件、查閱使用說明書,也深知如何進行資產管理,舉凡人員進出、設備盤點、上架管理、清潔、用電管理、變更管理、異常通告、故障確認、災害應變、消防演練、供油、供水...等等所有處理程序,盡在高度掌握之中,立即就能上手營運,後續即便面臨計畫性或週期性維護保養需求,其間也不需中斷營運,順勢打造至少20年運轉無虞的永續維運綠色機房。

值得一提的,2020年隨著5G商轉,預期物聯網、車聯網、區塊鏈、智慧電網、智慧醫療...等等智慧服務都將更趨成熟普及,屆時資料中心必須承載更龐大的資料量體,假使承襲舊架構,恐因強度不足而導致服務中斷,危及民眾食衣住行育樂,損失之大、後果之嚴重,實在不堪設想,為避免這般慘劇,趕緊提升資訊機房水平,實為當務之急。


圖說:日昇意定科技顧問公司總經理朱國權強調,不論機房設計規劃、施工、維運階段,皆應一貫符合維運無縫接軌概念,以確保符合未來營運需求,讓機房第一天就可運轉到位。


圖說:所有機房設施都應具備可共同維護性架構。以匯流母線為例,需確保維護工人有足夠空間可以鎖緊匯流排與上磅數,以避免管路因漏水而產生爆裂、造成工安意外。


圖說:針對管線、頭尾端、閥件做好顏色分類及命名編號標示,可謂建造永續維運綠色機房的關鍵基本功。