Physical AI:從Feature Robot到Smart Robot

徐宏民
2026-06-18
AI語音摘要
00:52

過去十年,全球投入實體AI(Physical AI)與機器人新創的年度創投金額,從幾億美元的規模成長到接近250億美元,是10倍以上的成長曲線,集中在最近這幾年。

這個數字背後,隱含著一個更早就存在的剛需:主要經濟體的工作年齡人口持續下滑,如日本到2050年代將只剩2000年的6成左右。但「Physical AI」這個詞底下,到底蘊含怎樣的機會,是否真的對得上那條人口曲線所描述的缺口,值得拆開來看。

機器人產業並不是第一次站上資本聚光燈下。Bay Area Robotics Association執行董事Terence Bennett在東京Humanoids Summit 2026把美國機器人產業的發展分成3波:

第一波在1960到80年代的底特律,靠的是汽車產業的資本支出,技術堆疊是機械手臂、焊接、塗裝、圍欄工作站;

第二波在2005到2024年的波士頓,協作機器人與移動底盤從DARPA的早期投入走向倉儲物流的商業應用;

第三波從2024年開始在矽谷展開,資本來源從純軟體的創投,開始大量流入需要與實體世界互動的公司,技術堆疊變成基礎模型與VLA,操作被當成一個學習問題,而不是程式設計問題。

Bennett用一句話概括這個轉折:「The model, not the mechanism」;前兩波靠的是把機械做得更好,第三波靠的是把模型做得更通用。

前兩波對生產力的提升,其實是扎實且持續的。第一波的機械手臂解決的是一個被嚴格限定的問題:在固定場景、預設路徑、封閉圍欄裡,把單一任務做到極致,速度快、精度高、正確率極高,至今仍是全球工廠的骨幹。第二波的協作機器人與移動平台把能力範圍擴大一截,機器人開始可以在人的旁邊工作,也開始可以自己移動,但移動的前提仍是預先規劃好的場域:固定路徑、格狀地板、不允許外物進入。

這兩波做出來的,本質上都是「feature robot」:功能集合不同、精密程度不同,但共同特徵是在一個被定義好的框架內,把功能做到接近完美,就像feature phone把通話品質與待機時間做到極致。

第三波想做的是「smart robot」。本文暫且將smart robot定義為:能在未完全預先定義的環境中,自主感知、規劃與執行任務,並具備持續運作能力;若以商業部署標準衡量,連續運作10小時以上是一個可觀察指標。

feature robot的成果,現在仍在持續發生,而且規模比多數人想像得大。服務場域裡,已經有不少高階餐飲業者讓送餐機器人負責外場的搬運與行進路線,把服務人員的時間釋放到桌邊互動與品質把關上,機器人做的是「移動加搬運」這個被切得很乾淨的子任務,人做的是需要判斷與溫度的部分。物流場域的規模更大:某全球電商在超過100個倉儲中部署逾100萬台自主移動機器人,搭配相當規模的人力協作,每天出貨超過1,000萬個包裹。這些機器人跑的是預先鋪設的格狀地板與固定路徑,不是在開放場域中即時感知與決策,但這套組合已經支撐全球規模最大的物流網路之一。feature robot這條路徑沒有過時,它仍在創造實際的生產力。

那麼,第三波到底想往哪裡去?

要回答這個問題,與其直接猜測時間表,不如透過幾組對照,看清楚哪些系統設計、哪些技術重心,是真正屬於第三波、而不是前兩波的延伸。

第一組對照是機器人與電動車,兩者在供應鏈結構上有明顯的重疊,致動器、磁鐵、電池材料的供應路徑高度相似,電動車產業10年來建立的製造能力,正在直接轉用到機器人零組件上。但硬體基礎齊備,不代表問題已經解決。電動車本質上是換了動力系統的交通工具,駕駛這件事人類已經做了上百年,技術積累可以直接沿用;機器人面對的問題更底層——「什麼是正確的動作」本身就需要重新定義,這是一個泛化問題,難度比電動車高了一個量級。

電動車的感知目的是避障,機器人的感知目的卻是接觸與操作,必須碰得精準。前兩波是靠縮小場景範疇解決「碰得精準」的問題;第三波要在開放場域中做到同樣的精度,硬體已經不是瓶頸,瓶頸轉移到模型能否泛化這一層。這個差異也解釋為什麼電動車的商業轉折點已經發生,而機器人即使資本大量投入,距離大規模商業轉折點仍有一段距離。

過去60年機器人的成功,建立在同一套技術邏輯:儘量拿掉場景的不確定性,讓機器人在規劃過的環境裡,把固定任務做到接近完美,重複定位精度早已解決到亞毫米級。第二組對照正是Physical AI與第一波的工業機器人:Physical AI想打破的正是這個前提,在開放場域、動態環境、沒有預先定義的結構下仍能完成任務。

這也是為什麼今天大多數所謂「自主機器人」的成功部署,骨子裡仍是工業機器人的邏輯:先把問題範疇縮小,再宣稱已經自主。

把這幾組對照放在一起看,會發現一個熟悉的歷史節奏。在smartphone出現之前,有線電話、大哥大、feature phone已經把通訊這件事做得相當好,通話清晰、待機時間長,把一個被定義好的功能做到極致。

2007年smartphone的出現,並不是讓通話變得更好,而是打開了一個原本不存在的維度:應用生態、隨時連網、裝置成為平台。feature robot這十幾年的成果,如同feature phone的那段歷史:扎實、有效,但運作在一個被定義好的框架裡。smart robot現在仍處於那個框架被打開之前的階段,資本市場湧入的250億美元,期待的正是這個打開的時刻。

第三波若真的成立,價值重心可能逐漸從機構件移向感知、運算與模型能力——這個分岔對台灣供應鏈不是抽象問題。延續Bennett「the model, not the mechanism」的框架:當機器人的價值重心真的從機構轉向模型,台灣過去在精密機械組裝、馬達齒輪上的優勢,會如何轉化?智慧型手機時代給過一個參考答案:當產業價值逐漸向作業系統、生態系與平台集中時,價值未必留在製造規模最大的地方,而是留在最能定義產業規則的位置。

國立台灣大學資訊工程學系教授,曾任鴻海集團與Stellantis合資車用科技公司技術長暨副總經理,推動ADAS及智慧座艙系統產品進入全球車用市場。紐約哥倫比亞大學電機博士,專精於機器學習、電腦視覺、自駕車、機器人等領域。為訊連科技研發團隊創始成員,慧景科技(thingnario)共同創辦人,NVIDIA AI Lab計畫主持人;曾任IBM華生研究中心及美國微軟研究院客座研究員。擔任多家科技公司AI策略顧問,習慣從學術與產業雙重視角檢驗技術發展的機會與挑戰。<br>
智慧應用 影音