立捷速能力推Weka高速儲存系統 終結AI運算瓶頸 智慧應用 影音
TERADYNE
ST Microsite

立捷速能力推Weka高速儲存系統 終結AI運算瓶頸

  • 侯冠宇台北

立捷速能專業服務團隊擁有Weka原廠認證技術專家(Weka Certified Technical Expert),提供客戶售前產品諮詢及售後專業服務。DIGITIMES攝
立捷速能專業服務團隊擁有Weka原廠認證技術專家(Weka Certified Technical Expert),提供客戶售前產品諮詢及售後專業服務。DIGITIMES攝

毫無疑問,人工智慧(AI)是當今最具影響力的科技,綜觀各行各業的數位轉型旅程,乃至元宇宙、自駕車等關鍵新技術,皆與AI息息相關。因此越來越多企業積極投資AI,但大多側重於高速GPU佈局,至於網路、儲存仍沿襲舊有架構,導致數據輸送不夠快,因而衍生AI運算瓶頸。

鑒於此,向來以「資料前進的藝術家」自居的立捷速能,於去年(2021)成為Weka台灣總代理商,期望將全球最快的平行檔案系統WekaFS推廣至國內高科技、製造、金融、醫療…等任何具有AI運算需求的垂直領域。立捷速能銷售支援經理朱善文說,以2019年IO500評測數據而論,針對Bandwidth指標,WekaFS展現27.05GiB/s佳績,反觀當時「最強超級電腦」所採用的他牌平行檔案系統,僅有9.84GiB/s表現;WekaFS的資料交換效率之高、由此可見一斑。

新架構 X 新技術,為AI加速供應數據養分

朱善文強調,Weka是2014年成立的年輕企業,沒有歷史包袱,易於為WekaFS注入許多獨特優勢。首先它是針對AI/ML、HPC需求而全新設計的高速儲存系統,採用自創的POSIX Driver通訊協定,自創的儲存控制軟體,不會出現NFS或SMB等傳統架構經常可見的瓶頸。其次它是軟體定義儲存系統,並未綑綁硬體,用戶可利用標準x86伺服器、超融合系統甚或雲端虛擬機來建立儲存節點。

再來更重要的是,Weka聚焦支援當前最先進的技術,包括最快的儲存媒體NVMe Flash,最快的網路架構200Gb/s InfiniBand(另可支援100GbE乙太網路),以及大幅提升儲存與計算節點之間資料傳輸速度的NVIDIA GPUDirect Storage。事實上,已有不少儲存系統同樣支援NVMe或GPUDirect,但差別在WekaFS奠基於專為新技術而優化設計的新架構,並非舊瓶裝新酒,故能100%發揮尖端技術應有的頻寬與效能;反觀一般儲存系統、甚至其他平行檔案系統,都礙於舊架構限制,無法順利展現NVMe該有的速度感。

三大利基助陣,讓企業輕易增強AI戰力

朱善文歸納,大致上來說WekaFS擁有三大利基。一是「簡單」,原廠Weka針對WekaFS產品設計,採取友善的包裝方式,也提供參考架構做為指引,讓用戶輕易透過x86伺服器加以安裝與操作,不需借助資深技術專家。

二是「快速」,這部份的能力承自於前述提到的最佳化架構,與NVMe或GPUDirect等先進科技相互輝映;據悉某半導體大廠為發展3奈米和5奈米製程,須力求加快大量資料的處理速度,因而曾嘗試導入多個不同儲存系統,但都無法避免GPU運算瓶頸,直到引進WekaFS,才讓種種難題迎刃而解。

第三點則是「擴充能力」。WekaFS以6個節點為最基本的架構,用戶可透過橫向擴展方式增加節點,加到上千個、無限多都不成問題;且因各節點都有自己的網路、自己的控制器,所以每新增一個節點,無論容量、效能皆會同步提升。

朱善文重申,隨著各產業AI運算需求水漲船高,因此敢於投資諸如NVIDIA DGX A100等高速運算平台的企業,確實越來越多;與此同時,企業亦應一併佈局高速網路、高速儲存,才能全面滿足AI工作負載的運作需求,有效避免讀資料慢、運算慢、回寫資料也慢的盲點,讓寶貴的GPU資源發揮應有的AI生產力。


關鍵字