NVIDIA生成式人工智慧研究在一秒內製作出3D形狀
NVIDIA的研究人員在最新的文字轉3D生成式人工智慧(AI)模型中注入了雙倍的加速力量,該模型被稱為LATTE3D。就像一台虛擬的3D列印機,LATTE3D能在一秒內將文字提示轉換為物體和動物的3D表示形式。
採用了廣泛使用於標準渲染應用程式的格式,生成的形狀可以輕鬆地在虛擬環境中使用,用於開發電玩遊戲、廣告活動、設計項目或機器人的虛擬訓練場域。
NVIDIA AI研究副總裁Sanja Fidler所屬位於多倫多的AI實驗室團隊開發了LATTE3D,她表示:「一年前,AI模型生成這種質量的3D視覺效果需要一個小時,而目前的最新技術只需約10~12秒。我們現在能以數量級更快的速度產生結果,使各產業的創作者能夠實現近乎即時的文字到3D生成。」
這項進步意味著當在單個GPU上運行推論時,像NVIDIA RTX A6000這樣的GPU,LATTE3D能夠幾乎立即生成3D形狀。
構思、生成、迭代:縮短週期
創作者無需從頭開始設計或在3D資源庫內進行搜尋,而是可以使用LATTE3D在想法突然出現時,立即產生詳細的物件。
該模型基於每個文字提示生成幾種不同的3D形狀選項,供創作者選擇。選定的物體可以在幾分鐘內進行最佳化,達到更高的品質。然後,使用者可以將形狀匯出到圖形軟體應用程式或平台,如NVIDIA Omniverse,該平台支持基於通用場景描述(OpenUSD)的3D工作流程和應用程式。
雖然研究人員在動物和日常物體這兩個特定資料集上訓練LATTE3D,但開發人員可以使用相同的模型架構在其他資料類型上訓練AI。
例如,如果在3D植物資料集上進行訓練,LATTE3D的一個版本可以幫助景觀設計師在與客戶進行腦力激盪時使用樹木、開花灌木和多肉植物快速填充花園渲染圖。如果在家庭物品資料集上進行訓練,該模型可以產生填充家庭3D模擬的物品,開發人員可以使用這些物品來訓練個人助理機器人,然後再於現實世界中進行測試和部署。
LATTE3D使用NVIDIA A100 Tensor核心GPU進行訓練。除了3D形狀外,該模型還接受了使用ChatGPT 生成的各種文字提示的訓練,以提高模型處理使用者可能想出描述特定3D物件的各種短語的能力,例如,理解具有各種犬類物種的提示都應該產生像狗一樣的形狀。
NVIDIA研究中心由全球數百名科學家和工程師組成,團隊專注於AI、電腦圖形、電腦視覺、自動駕駛汽車和機器人等主題。研究人員2024年在NVIDIA GTC大會上分享了研究成果,推動了擴散模型訓練技術的發展。歡迎至NVIDIA技術部落格以了解更多資訊,並閱讀GTC大會上的NVIDIA研究會議完整列表。
如欲了解最新的NVIDIA AI相關消息,請觀看NVIDIA創辦人暨執行長黃仁勳在GTC上主題演講的重播。
- 小螺絲到大數據:Bossard緊固件在AI伺服器的應用
- AMAX引領生成式 AI 與即時運動數據革命
- 思想科技助企業加速落實 AI 應用,完整顧問服務突破創新挑戰
- 首款AI心肺篩檢在國際亮相!展現台灣醫學影像創新實力
- 迎接後雙軸轉型時代 Google AI助攻台灣製造業邁向綠色企業
- 慧榮科技突破資料與功耗瓶頸 全新儲存技術加速AI應用發展
- 臺師大與麗臺攜手成立深度學習共同實驗室 推動AI技術在教育與產業的應用
- 精誠軟體獲國科會GenAI Stars生成式AI企業應用競賽「優質創新獎」
- 運用科技力守護民眾生命財產安全 精誠集團協力宜蘭縣政府部署AIoT智慧防災
- 晶睿通訊AI安防解決方案 導入全新AI功能RealSight Engine
- 西門子推出下一代AI加強型電子系統設計軟體
- F5與NetApp加速並簡化大型語言模型AI部署
- 新思科技與台積電攜手 為AI與多晶粒設計加速創新
- 友訊代理A10 Networks人工智慧新藍圖 驅動可靠安全環境
- 邊緣 AI:即時資料處理與自動化的革命
- 迎接AI時代:數產署與資策會運用AWS技術
攜手伊雲谷為企業打造黃金級競爭力 - 技嘉發表開創性的Z890主機板 展現真AI 制霸效能無極限
- 昕力資訊與iKala攜手拓展東南亞市場 首站支援越南製造業和金融業上雲
- AI視覺釋放LLM完整潛力,重塑智造管理
- Hitachi Vantara推出Virtual Storage Platform One為混合雲儲存提供基礎