佰維發佈CXL 2.0 DRAM 賦能高性能計算
CXL是一種開放式全新互聯技術標準,可在主機處理器與加速器、記憶體緩衝區、智慧I/O設備等設備之間提供高頻寬、低延遲連接,從而滿足高性能異構計算的要求,並且其維護CPU/GPU記憶體空間和連接設備記憶體之間的一致性,突破記憶體牆瓶頸,縮減整體回應時間。
此外,CXL支援部署新的記憶體層,可以彌合主記憶體和SSD存儲之間的延遲差距。隨著AI應用爆發,「記憶體牆」成為制約計算系統性能的主要因素之一。CXL建立在PCIe的物理和電氣介面之上,CXL記憶體擴展功能可在伺服器中的直連DIMM插槽之外實現額外的記憶體容量和頻寬,支援記憶體池化和共用,滿足高性能CPU/GPU的算力需求。
近日,佰維成功研發並發布了支援CXL 2.0規範的CXL DRAM記憶體擴展模組。佰維CXL 2.0 DRAM採用EDSFF(E3.S)外形規格,記憶體容量高達96GB,同時支援PCIe 5.0×8介面,理論頻寬高達32GB/s,可與支援CXL規範及E3.S介面的背板和伺服器主機板直連,擴展伺服器記憶體容量和頻寬。同時,佰維可針對無E3.S介面的伺服器背板提供CXL AIC轉接卡。
佰維CXL 2.0 DRAM的特點和優勢
1.搭載高性能記憶體擴展控制器,遵循CXL2.0 Type3標準,支援PCIe5.0x8介面,理論頻寬高達32GB/s。
2.嚴選優質DDR5記憶體顆粒,容量高達96GB。
3.支援On-Die ECC、Side-Band ECC、SDDC、SECDED等功能。
4.允許多達16台主機同時瀏覽記憶體的不同部分,支援記憶體池化共用。
5.同步開源發布CXL DRAM軟體工具包,以確保用戶無障礙部署CXL擴充記憶體。工具包特點:可提供CXL的顯示,隱式API,客戶可根據不同應用場景進行使用;可提供應用層級的CXL的numa工具使用方法,建立應用層級對CXL的直觀感受。
Latency性能方面,在實際測試中,佰維CXL 2.0 DRAM掛載於node 2節點,與掛載於node 0節點的CPU存取Latency為247.1ns,頻寬超過21GB/s,Latency性能優異,賦能資料高速處理。
人工智慧(AI)和機器學習(ML)對高速資料處理的需求持續成長,佰維CXL 2.0 DRAM兼具支援記憶體容量和頻寬擴展、記憶體池化共用、高頻寬、低延遲、高可靠性等特點,賦能AI高性能計算。目前,佰維可為客戶和合作夥伴提供32GB~96GB CXL 2.0 DRAM的功能樣機,進行聯合評估和測試。未來,佰維將持續關注CXL技術,賦能高性能計算需求。