Google釋出RoboCat AI大模型 機器人部署大業見曙光?
看好全球勞動力短缺,機器人產業發展前景呼聲相當大,但為何即使機器人話題熱度高,實際落地應用卻不成正比,尤其在商用和服務領域,機器人的滲透率更是低迷。機器人業者認為,且拋開價格因素,當前機器人應用落地少的瓶頸主要在於,現有機器人應用軟體無法充分發揮完整機能。
近期大型語言模型(LLM)話題延燒,Google旗下DeepMind在不久前對外展示了名為「RoboCat」的基礎AI模型。DeepMind聲稱,該模型是第一個能夠解決和適應多種任務的機器人AI模型。此次DeepMind取得的突破性進展,也使得機器人在軟體層面的發展終於看見曙光。
大模型的出現,對機器人產業發展的意義為何?機器人業者坦言,過去機器人產業雖然常高喊以AI賦能,但實際上傳統AI並沒有那麼智慧化,主要是因爲訓練成本高、泛用能力弱,除了在機器人視覺領域上有較多應用外,在一些具連續性且複雜的操作、或有較多物理相互作用的領域,落地情況並不樂觀。
機器人是典型機電軟一體化的產品,軟體與硬體之間相輔相成。從硬體層面來看,機械動力、自動控制等機能方面的提升帶來更好的效能,而更好的效能可以支持更強大的軟體,有強大的軟體才得以支持更多應用,應用市場的擴大最終會使產業走向良性循環發展。
但業者認為,機器人並非新技術,在工業製造領域,實際上已成熟應用數十年,以目前來看,就硬體方面所表現的機能已可達到穩定水準。但機器人若要具備多元應用場景落地的可用性,關鍵還是在軟體。然業者也坦言,現有機器人應用軟體,仍無法充分發揮機器人的性能。
業者指出,在大模型之前,AI模型多是根據特定領域單獨訓練,新場景通常需要從數據收集、標注、訓練、優化、部署等走完一遍流程,即使經驗豐富的AI工程師,也需要幾天甚至幾週來完成。然訓練完所得出的模型,通用性不高,快速部署能力很弱,因在很多要求時效的場合,例如頻繁轉換產線的製造場景,或動態需求高的服務場景,幾乎很難被應用。
但大模型的出現,可讓過往需要高成本的垂直領域AI開發模式,走向預訓練大模型結合特定任務微調的形式。業者認為,此種方式一方面可提高模型泛用能力,另一方面則可提升開發速度,而在一些對精度要求不高的場景下,可具備一定程度的通用智慧。
受到近期大模型、通用人工智慧(AGI)的啟發,DeepMind在6月發表的機器人基礎AI模型「RoboCat」,最大的特色就是具有「通用性」,能夠解決和適應多種任務,並可搭配不同的真實機器人來完成工作。
從DeepMind所展示的內容來看,RoboCat可以學會操控機器手臂完成堆積木、抓水果等任務,並驗證了完成一項新任務的成功率,已從初期的36%提升到74%。
DeepMind表示,RoboCat是基於團隊的另一個多模態模型Gato,學習速度比其他模型快得多,據悉只需100次演示,即可解決任務,然後再自我生成新的訓練數據,從中進行改進。
DeepMind指出,這種快速學習能力,將有助於加速機器人研究,減少對人類監督訓練的需求,並強調,這是創建通用機器人相當重要的一步。
DeepMind也強調,RoboCat證明單一大模型可以在多個不同機器人實體上解決不同任務,並且可以快速地適應新任務與新實體。業界也寄望於大模型的出現,可補足機器人產業發展的技術基礎。
責任編輯:毛履兆



_bigbutton.gif)



