儲存虛擬化門派眾多 值得逐一研習
前言:
簡言之,儲存虛擬化的最大特色,無非就是統合企業內部所有異質儲存資源,使之能被集中控管;其基本運作原理,就是將實體、邏輯兩個層次區隔開來,因此前端應用伺服器只需要與邏輯層打交道,無須理會其資料是擺放在哪個儲存實體。儘管如此,儲存虛擬化方案有不同型態,仍值得企業逐一釐清與比較。
本文:
事實上,假使以最廣義的格局來詮釋「儲存虛擬化」,牽涉的範圍著實不小,甚至一些已經讓企業習以為常的技術應用,其實骨子裡或多或少都涵蓋了儲存虛擬化的因子。
以過去甚受企業所倚重的磁帶為例,可以模擬為磁碟空間,繼而搭配HSM( Hierarchical Storage Management)階層式儲存管理技術,作為磁碟之外的第二或三階儲存架構,在此情況下,一些讀取頻率逐漸減低的資料,即可從第一階的磁碟移轉到磁帶,移轉過後原磁碟只會保留索引,因而騰出儲存空間。
上述頗適用於大量資料歸檔的應用,可被歸類為一種儲存虛擬化模式。此後,因SATA磁碟陣列成本下滑,硬碟的價位不再高不可攀,於是反過頭來發展出虛擬磁帶櫃(Virtual Tape Library;VTL)技術,將磁碟陣列硬碟空間模擬為磁帶,藉以改善資料備份效率,也算是另一種型式的儲存虛擬化。
當然,前面所提到與磁帶或VTL相關之技術,與企業認知的「儲存虛擬化」定義,著實不盡相同,也並非當下亟欲統合儲存資源、提升儲存空間的重點所在;真正的菁華,仍在於植基檔案系統或儲存系統的儲存虛擬化解決方案。
全域命名空間 共享磁碟路徑
論及以檔案系統為基礎的儲存虛擬化方案,一般分為兩大類型,一是作業系統層次的虛擬化,另一則是奠基於「全域命名空間(Global Name Space)」的檔案分享虛擬化。針對作業系統層次的檔案系統虛擬化部分,早期做法是,將檔案系統建立在固定的磁碟分區(Partition)之上,相當缺乏彈性,有鑑於此,業界遂發展出LVM(Logical Volume Manager)技術,使得檔案系統能夠跨越於多個實體硬碟(Physical Disk Volume),正因如此,檔案系統即可拜磁碟資源的擴充能力所賜,得以執行線上擴增,至於LVM所依附的主要作業系統,則包括了AIX、HP-UX、Oracle Solaris或Linux作業系統,而在Windows Server方面,自Windows 2000 Server開始,用戶已可經由「磁碟管理」的MMC管理工具,把本機磁碟機掛載(Mount)在本機NTFS磁碟區的任何白空資料夾之上,某種程度來看,也可算是實現了LVM功能。
在全域命名空間部分,則更是當前備受重視的檔案層級虛擬化技術。回顧過去,意欲在網路上傳輸或分享檔案,用戶端電腦與檔案伺服器、NAS儲存設備或伺服器內建硬碟之間,透過「通用命名約定(UNC)」來認定存取路徑,意即由UNC負責提供目錄與路徑,使得用戶端電腦存取網路上的檔案;只不過,這般做法存在一大致命傷,以一個跨國型的龐大應用環境而論,用戶端電腦、檔案伺服器、NAS儲存設備、主機分享目錄等四者之間的存取連結關係極其複雜,不僅導致IT管理者負荷吃重,也衍生了「牽一髮即動全身」的缺憾,企業如果要更新任何一項設備,抑或更改任何一條連結關係,都算是茲事體大,將迫使其餘眾多存取路徑,必須跟著修改。
由此觀之,傳統的UNC路徑存取模式,顯然不是很理想的選擇;反觀Global Name Space技術,則是可將多台NAS、檔案伺服器、主機分享目錄,加以統整成為單一目錄,接著在用戶端電腦與這個單一目錄之間,安插一個虛擬層,由該虛擬層為不同來源賦予虛擬位置,以利使用者連結到他所需要的檔案,不必深究這些檔案源自哪些儲存載體,操作過程大為簡化。
而為了營造資料存取的高可用性,全域命名空間伺服器在為使用者提供存取路徑的同時,也會在其餘路徑留存一份拷貝,一方面避免檔案因故損毀,二方面亦可在原始路徑I/O滿載時,隨即導向另一條負擔較輕的路徑,以收到負載平均效果,藉此確保企業網路內的所有資料存取效率,得以維持在較高的水平。
植基儲存系統之虛擬化 呈現百花齊放局面
有關植基於儲存系統的虛擬化解決方案,在眾廠精銳盡出的狀態下,呈現出多元化樣貌,在在都值得企業予以鑽研。首先談到「磁碟容量虛擬化」,係以精簡自動配置(Thin Provisioning)技術為主體,顧名思義,就是要解決傳統SAN磁碟陣列完成LUN配置後,其OS層級的檔案系統無法再行擴充之難題,畢竟這個缺憾,可能迫使企業在儲存空間滿載時必須施作資料轉移,徒然衍生Downtime風險,即便在平時,亦有閒置資源的缺點;透過磁碟容量虛擬化功能,就算檔案系統的實際需求超出實體容量,亦可利用虛擬磁碟繼續運作,不僅省卻了資料轉移的麻煩,且應用系統全無更改必要,可謂好處多多。
其次是「磁碟陣列虛擬化」。儘管以當前的磁碟陣列來看,功能已經相當豐富,然就算功能再怎麼強大,也只能框限在單一廠牌或階級的產品,倘若企業擁有多個屬性互異的磁碟陣列,不但徒增管理負擔,亦阻礙了彼此資源調度與汰換的空間,於是業界開始祭出磁碟陣列虛擬化方案,以化解此一僵局;其運作原理是,利用SAN閘道器或磁碟陣列內建功能,來提供虛擬化應用,把所有外掛的陣列通通視為可接受指揮調度的Dumb Disk,由磁碟陣列虛擬化集中納管,並由虛擬層統一提供磁碟陣列鏡像、Volume資料快照等應用功能;如此一來,不管各個磁碟陣列的廠牌為何、階級是高或低,用戶皆可透過單一管理環境予以控制,且無論在其間進行任何資源調度或汰換,都不會影響前端應用伺服器。
再來是從網格運算原理繁衍而成的網格儲存(Grid Storage)技術,其是以「內容(Content)」為儲存單元,把資料儲存在由多個Cell組成的資源池,其中每一個Cell全都具備容錯能力,且不同Cell之間彼此可互通,以滿足整體儲存環境所需之空間管理、負載平衡與容錯等功效;由於網格儲存技術的延展性甚大,也內含豐富的內容管理機能,因此適用於巨量資料的儲存與歸檔等應用場域。
至於另一項亦因Big Data開始受到關注的磁碟陣列橫向擴充(Scale-Out)架構,旨在顛覆過往磁碟機櫃縱向擴充(Scale-Up)在於I/O效能不佳的缺陷,透過磁碟陣列的平行擴充,由其中一個掌握主控權的陣列專司運籌帷幄,讓資料及I/O負載均攤至所有陣列;表面看來,其與網格儲存的精神頗為雷同,但網格儲存係將資料打散至不同Cell、且已預留備份,即使任一Cell損毀亦不影響大局,然磁碟陣列Scale-Out架構在於容錯的設計略顯不足,仍可能因單一陣列失效而導致資料存取活動全告停擺,更有甚者,單一陣列內的資料若是損毀,則整體資料頓時付之一炬,因此HA功能相形失色。
最後談到統合儲存(Unified Storage),則堪稱是立基於儲存系統的虛擬化方案當中之亮點。它是以磁碟陣列的控制器為虛擬化核心,將SAN與NAS同時整在單一磁碟陣列控制器、單一作業系統的環境內,如此一來,即可讓企業儲存架構徹底簡化,巧妙化解了SAN與NAS並行、或SAN陣列外掛NAS閘道器等傳統架構,所衍生之管理複雜化難題;早先也有另一種型式的統合儲存方案,由系統內建多個插槽支援NAS、iSCSI、SAN等不同協定,並針對不同協定分設控制器,但由於不論在備份與還原效率、擴充性、乃至於軟體相容性等方面,明顯相形見絀,因此在市場上的吃香程度,不及以單一控制器為核心的統合儲存方案。




_bigbutton.gif)



