VMware與NVIDIA為企業開啟生成式AI時代 智慧應用 影音
TERADYNE
ST Microsite

VMware與NVIDIA為企業開啟生成式AI時代

  • 吳冠儀台北

VMware與NVIDIA宣布擴展雙方的戰略合作夥伴關係,幫助使用VMware雲端基礎架構的企業做好準備,迎接AI時代的到來。

VMware Private AI Foundation with NVIDIA將使企業能夠自訂模型並運行各種生成式AI應用,如智慧聊天機器人、助理、搜尋和摘要等。該平台是全整合式解決方案,採用NVIDIA提供的生成式AI軟體和加速運算,基於VMware Cloud Foundation構建,並針對AI進行了優化。

VMware執行長Raghu Raghuram表示,生成式AI與多雲兩者是完美的搭配。客戶的資料無處不在,遍佈其資料中心、邊緣、雲端等多處。將與NVIDIA一同協助企業放心地在資料附近運行生成式AI工作負載,並解決其在企業資料隱私、安全和控制方面的問題。

NVIDIA創辦人暨執行長黃仁勳表示,世界各地的企業都在競相將生成式AI整合到自身業務中。透過與 VMware擴大合作,將能夠為金融服務、醫療、製造等領域的成千上萬客戶提供其所需的全棧式軟體和運算,使其能夠使用基於自身資料定制的應用,充分挖掘生成式AI的潛力。

為更快實現業務效益,企業希望簡化並提高生成式AI應用的開發、測試和部署效率。根據麥肯錫的預測,生成式AI每年可為全球經濟帶來多達4.4兆美元的成長。

VMware Private AI Foundation with NVIDIA將協助企業充分利用其效能,定制大語言模型,創建供內部使用的更加安全的私有模型,將生成式AI作為一項服務提供給使用者,並更加安全地大規模運行推論工作負載。

該平台將採用的NVIDIA NeMo是NVIDIA AI Enterprise中包含的端到端雲原生架構,可協助企業在幾乎任何地點構建、自訂和部署生成式AI模型。NeMo集自訂架構、護欄工具包、資料整理工具和預先訓練模型於一身,使企業能夠以一種簡單、經濟且快速的方式來採用生成式AI。

為將生成式AI部署到生產中,NeMo使用TensorRT for Large Language Models(TRT-LLM),以加速並優化NVIDIA GPU上最新LLM的推論效能。透過NeMo,VMware Private AI Foundation with NVIDIA將使企業能夠導入自己的資料,並在VMware混合雲基礎架構上構建和運行自訂生成式AI模型。

在VMware Explore 2023大會上,NVIDIA與VMware重點介紹企業內部的開發人員如何使用全新 NVIDIA AI Workbench提取社群模型(例如 Hugging Face 上提供的 Llama 2),對這些模型進行遠端自訂並在VMware環境中部署生產級生成式AI。

VMware Private AI Foundation with NVIDIA建立在兩家公司長達十年的合作基礎之上。雙方的聯合研發成果強化VMware的雲基礎架構,使其能夠以媲美裸機的效能運行NVIDIA AI Enterprise。VMware Cloud Foundation所提供的資源及基礎架構管理與靈活性將進一步惠及雙方共同的客戶。 


關鍵字