Physical AI驅動實體智慧革命 多模態機器人產業邁入關鍵時代
AI技術正快速推動機器人產業邁向自主化與高度協作的新階段,多模態感知、邊緣推論以及Physical AI的落地,使機器的感知、決策與行動邏輯發生根本性改變。為協助產業掌握這股技術變革脈動,益登科技於12月3日舉辦「AI × Robotics多模態機器人開啟產業智慧新時代」論壇匯聚各領域專家,共同剖析AI如何在真實場域中重塑機器人架構,並推動產業進入新一輪智慧化競爭。
益登科技執行長于俊潔在致詞時指出,益登自1998年起與NVIDIA合作,完整見證運算能力從資料中心躍升至邊緣端的變革。他強調,AI邊緣運算能力將使機器人從過去的目標辨識,進階至具備環境理解、決策判斷與動作控制的自主行為。
隨著大型模型訓練逐步下沉至邊緣推論,各式機器人都將在未來十年快速普及,並成為產業智慧化的重要基礎。這次論壇可見到業界正迎向多模態AI與自主運算深度融合,並反映企業對下一階段智慧機器系統的高度期待。
Physical AI落地架構成形 平台、控制與教育應用同步推進
AI正從純數位運算走向能夠作用於真實世界的Physical AI。為加速產業落地,NVIDIA建構了涵蓋模型訓練、模擬驗證到實體部署的完整技術架構,形成機器人智慧化的基礎設施。從資料中心級的NVIDIA GB200 NVL72訓練叢集,到以NVIDIA Omniverse與NVIDIA Cosmos世界模型生成具真實物理特性的合成資料,NVIDIA正逐步克服機器人開發最根本的「資料不足」問題,使模型能在虛擬場景內大量學習並安全迭代。
最終部署階段則由NVIDIA Jetson AGX Thor接棒,這款搭載 NVIDIA Blackwell GPU、具備2070 TFLOPS運算效能的邊緣平台,專為下一代類人機器人與自主系統設計。NVIDIA同時推出涵蓋視覺感知、世界模型與類人機器人的預訓練模型家族,例如已於Hugging Face開源的NVIDIA Isaac GR00T,可跨不同機器人平台快速移植。
在應用面,NVIDIA以「內向外AI」(機器人視角)與「外向內AI」(環境視角)構成完整場域智慧架構,前者透過NVIDIA Isaac系列實現自主導航、操作與決策,後者則由NVIDIA Metropolis的視覺AI代理負責產線監控、巡檢與倉儲管理,形成從環境到機器人的全鏈結智慧化解決方案。
全球人形機器人市場發展潛力雄厚,控制器架構將面臨從未有過的技術門檻。NexCOBOT總經理沈倩怡提到,傳統控制器多著重於運動控制,僅相當於機器人的「小腦」,但當AI驅動決策、自主行為逐漸成為主流,產業急需能同時整合視覺感知、推論決策與即時控制的「大腦級」架構,以支撐高自主度、高安全性的下一代機器人。
NexCOBOT推出的MARS400 Physical AI控制器基於此需求設計,以NVIDIA Jetson Thor為核心,結合AI邊緣推論與SIL3等級的功能安全控制。MARS400負責感測融合、AI推論、軌跡規劃與多協定通訊,並與ESC210安全控制器協作,執行人員偵測、安全運動控制與失效診斷。
其Multi-Master架構將任務分散至多核心處理器,兼具低延遲與高穩定性,同時簡化布線。軟體層則整合ROS2、即時Linux、NVIDIA Isaac Manipulator與EtherCAT Safety,支援從AI Agent到VLA等新一代機器人框架。在應用面,VLA讓機器人能自主生成包裝軌跡並因應環境干擾即時重規劃,而安全控制器則動態監控人員位置與物體移動,確保協作安全。
AI正逐漸從教育現場的概念示範走向真實工程挑戰。安康高中蘇鼎欽老師表示,在被譽為「高中生的F1」的FIRST Robotics Competition(FRC)中,全球3,900支隊伍必須在短短六週內打造一台54公斤競賽機器人,從機械、電控到程式與行銷皆需跨領域整合。
在這近乎真實工業場景的環境裡,傳統定位方式常受里程計誤差、陀螺儀漂移、場地碰撞與光線變化影響,使機器人無法穩定掌握自身位置,也凸顯能「看見世界」的AI視覺定位系統的重要性。
NVIDIA Jetson Orin Nano以40 TOPS運算效能成為核心平台,透過相機擷取AprilTag,並在30毫秒內完成GPU加速辨識、PnP座標求解與里程計融合,輸出穩定的定位結果。系統同時整合Single-Tag與Multi-Tag演算法,再利用WPILib擴展卡爾曼濾波器融合視覺、IMU與編碼器訊號,有效抑制誤差累積。
面對光源變化、Multi-Tag飄移與感測器時序差等挑戰,團隊建立偏移校正、Z軸濾波與時序插值等完整補償機制;未來將導入自適應濾波器,並擴展至物件辨識、路徑規劃與多機協作應用。
邊緣端成Physical AI落地關鍵點 企業級運算架構全面成形
機器人從工廠與物流場域走向醫藥與精密製程,邊緣端AI的效能瓶頸成為能否落地的關鍵。Avalanche Computing執行長陳俊傑指出,Physical AI要在即時推論、低延遲決策與多感測器融合間取得平衡,必須同時滿足「最大運算量、最低功耗、最低延遲」三大條件。
隨著AMR、機械手臂到類人機器人的需求快速擴張,如何讓單一邊緣平台整合IMU、力覺、RGB-D、LiDAR等多模態輸入並穩定運作,逐漸成為新世代機器人系統的核心議題。
Avalanche以NVIDIA Jetson Thor為基礎打造邊緣端Physical AI解決方案,採用System 1與System 2的雙系統架構,對應VLM理解場景與擴散模型或Transformer動作模型的實際需求。
為克服標準LLM在邊緣端因Python GIL、記憶體瓶頸等問題,導致推論僅2–3 tokens/s,Avalanche將Isaac ROS GEMs、VPI、CV-CUDA與Pipeline並行化深度整合,在立體視覺、AprilTag、姿態估測等任務上取得最高13倍效能提升。
系統並引入動態資源調度,在LLM思考階段降低視覺解析度,在機器人運動時優先視覺運算,同時搭配邊緣版RAG確保資料不離場域。透過矽晶原生優化與模組化設計,視覺與LLM推論可彈性切換,整體效能提升可達20%至10倍。相關案例包括LLM×RL的精密操控與藥品作業場景,展現邊緣端GenAI在企業級機器人落地的實質能力。
AI從雲端轉向邊緣,企業面臨的挑戰不再只是選擇單一硬體,而是如何打造具備訓練、模擬到部署能力的完整AI基礎建設。益登科技資深技術經理廖宜芳與蕭明達在演講中提到,益登以NVIDIA「3 Computers」為核心策略:訓練端採Supermicro HGX、搭載NVIDIA H100或NVIDIA B100用於大型模型與機器人模型訓練;模擬端使用Supermicro OVX與NVIDIA Omniverse建立數位分身與合成資料;部署端則以NVIDIA Jetson Thor作為邊緣推論與類人機器人的AI控制中心,三者形成從建模到落地的閉環架構。
在軟體層面,NVIDIA AI Enterprise被定位為企業級「AI作業系統」,提供模型訓練、調校、部署、GPU管理與安全維運工具,並透過NVIDIA NIM支援語音、影像與對話模型的快速上線。益登以文字情感分析案例展示資料載入、訓練、評估與容器化部署流程,證實NVAIE作為「AI工廠」的可複製效益。
垂直應用則由NVIDIA Metropolis與NVIDIA Isaac兩大平台支撐,前者涵蓋智慧城市、工廠安全與異常行為偵測,後者整合模擬、視覺、操控與強化學習,並與NVIDIA OVX協助產生合成資料以加速開發。
廖宜芳與蕭明達強調,AI落地絕非依賴單一模型或硬體,而是必須以NVIDIA HGX、OVX、Jetson Thor與NVAIE構築企業級AI Factory,串接資料中心、模擬平台與邊緣運算,為台灣產業進入Physical AI、邊緣智慧與自主機器人時代奠定真正的底層能力。
建構多模態機器人生態 Physical AI邁向實務部署的關鍵基礎
除了精彩演講,會中也邀請多位專家,針對「多模態機器人新生態:技術、應用與合作展望」議題進行對談。VLA目前仍停留在研究與POC階段,尚未有量產部署案例,關鍵瓶頸在於機器人資料取得困難,後段資料整備涉及標註、時序對齊與軌跡重建等繁瑣流程,即使投入大量人力也難以快速累積可訓練資料,因此「資料生成」已成產業關鍵。
為此,NVIDIA近年在NVIDIA Isaac GR00T與多項SDK中強化資料生成能力,並以GPU進行加速處理。此外,目前機器人多採System 1(快控制)與System 2(慢決策)架構,無論是VLM或VLA,其底層皆以轉換器模型為核心,用於整合影像、語言與動作等多模態訊號。
機器人王國CAVEDU創辦人曾吉弘表示,NVIDIA的SDK與技術資源龐雜,初學者容易被資訊量淹沒,因此建議善用NVIDIA DLI(深度學習學院)規劃的學習路徑,循序補足基礎再進階至VLM等高階應用,才能避免跟不上進度。他也指出,台灣近年在科技教育上的投入逐步深化,AI與機器人具高度跨域特性,從工程、電機到心理與語言學皆可切入,憑藉扎實的學術能量與人才基礎,台灣具備持續推進AI與機器人發展的良好條件。
Holon Robotics共同創辦人楊宜哲指出,新創必須在「快速落地」與「持續研發」間取得平衡。加入NVIDIA Inception Program後,團隊透過DLI與RGOS等技術培訓,將AI、機器人與視覺感測實際導入製造現場,解決如拋光研磨「調機時間過長」的痛點。他也強調新創交流的重要性,不同領域團隊雖任務各異,卻共享技術挑戰,NVIDIA平台成為重要後盾;加上近年政府從競賽、培育到資金的多元支持,使台灣逐步形塑友善的新創發展環境。
Taiwan ROS Community創辦人簡文昱則表示,他同時經營「ROS Taiwan」與2023年成立的「Taiwan Robotics Meetup」,後者專為補足工程師缺乏深度技術交流空間而設。活動從不到十人逐步成長,2025年ROSCon已突破150人,並與多家企業與協會合作。他強調,實體聚會有助工程師交流實務經驗、共同除錯,也能為企業降低開發成本,並期待更多企業提供場地,推動巡迴式技術交流,促進台灣機器人社群持續成長。
從雲端模型訓練到邊緣端即時推論,從模擬世界到真實場域落地,「AI × Robotics多模態機器人開啟產業智慧新時代」論壇完整呈現了Physical AI與機器人技術的關鍵進展與產業挑戰。隨著運算平台、資料生成與軟硬整合能力持續成熟,AI正加速走出虛擬空間,走向可規模化部署的實體智慧階段,也為台灣機器人與智慧製造產業開啟新一輪競逐舞台。




_bigbutton.gif)



