多元化應用驅動手勢操作介面技術增溫 智慧應用 影音
DForum0522
Event

多元化應用驅動手勢操作介面技術增溫

  • DIGITIMES企劃

HP Envy 17 Ultrabook是首款整合Leap Motion手勢感測器的筆記型電腦,使用者可用雙手凌空操控電腦。HP
HP Envy 17 Ultrabook是首款整合Leap Motion手勢感測器的筆記型電腦,使用者可用雙手凌空操控電腦。HP

智慧型行動裝置發展快速,針對行動應用而言,傳統鍵盤、滑鼠與螢幕組構的HCI人機交互機制,在鍵盤與滑鼠使用上會有許多應用環境條件限制,其滑鼠應用已大部分轉由行動裝置螢幕觸控感測取代,但在不適合以觸控操作的使用情境下,仍需找尋可替代的人機交互應用方案…

在眾多HCI(Human Computer Interaction)人機交互設計方案中,雖然行動裝置導入螢幕觸控方案,已可解決絕大部分的操作應用需求,但實際上在消費性電子或非消費電子的設計應用中,觸控的人機交互設計方案也會碰到不少限制,例如具備防水功能的行動裝置若在水中使用屏幕的電容觸控功能可能會遭遇無法進行操作,或是使用者在利用平板電腦檢視食譜同時進行料理時,就不適宜透過沾染食材的雙手進行屏幕觸控操作行為。

g-speak空間操作系統為感測操控者雙手手勢動作進行對應操作指令轉換,亦可支援多人協同操作互動。Oblong Industries

g-speak空間操作系統為感測操控者雙手手勢動作進行對應操作指令轉換,亦可支援多人協同操作互動。Oblong Industries

擴展觸控HCI先天限制 手勢操作應用加溫

而當觸控可能在不同應用情境出現使用障礙,對產品開發商而言,也必須另闢蹊徑提供使用者更多HCI型式的應用可能,而在多種成熟的HCI選項中,目前已有聲控、手勢指令、搭載感測器的穿戴配件等搭配,建構觸控人機互動技術以外的人機操作選項。

以聲控人機介面來說,聲控操作在一般社交環境中並不適合,因為發出聲控指令只會讓操作者在群眾中顯得古怪,另操作內容也會涉及隱私相關問題,反而是手勢指令的HCI人機互動機制,在現在絕大部分的行動裝置都有搭載高解析度前鏡頭(front camera),甚至可透過多鏡頭與輔助設計改善單鏡頭無影像深度分析的缺陷,透過影像分析技術方案,也可透過手勢影像分析擷取必要的手勢指令。

手勢操作概念前衛 實用價值高

尤其是手勢指令的HCI應用架構,在Microsoft的Kinect動作感測架構應用,已經證實商用化的實用價值,而後又有LEAP推出簡化版的手勢感測技術方案,可以預期利用一個或是多組影像感測器搭配強化影像深度分析的硬體架構、整合可產生描述3D空間數據的影像分析技術,可讓人機互動的操作應用方案多了更多應用可能,建構如同電影《鋼鐵人》主人公Tony Stark利用雙手手勢、甚至語言指令操作電腦應用的場景,成為未來電腦、行動裝置的主流操作體驗。

先前提到,手勢指令的人機互動設計方案,須建構在一個基本的硬體應用環境條件之下,為利用機器視覺影像分析自實際動作擷取解讀操作指令,同樣是發展手勢操作人機互動應用方案,另一派業者反而傾向利用感測器、陀螺儀或是加速度計的精密整合,建構更精密的手勢指令擷取機制,例如由Oblong Industries為Boeing在其Virtual Warfare Center開發的g-speak技術與空間性操作系統,就能讓操作者透過穿戴特製手套進行相對複雜手勢指令操作,也有開發商透過配戴於手臂或手腕的高精度感測器感測手部肌肉動作分析對影手勢指令,雖然手勢動作的擷取方式不同,但基本概念均是圍繞在利用手勢動作產生對應操作指令的設計型態。

手勢操作應用彈性大

面對聲控人機互動可能會有社交與隱私問題,手勢指令操作可以在相對不干擾社交的狀態下悄悄進行,加上影像感測器、影像分析相關技術持續精進,讓手勢操作人機互動的使用條件改善,這也是為什麼手勢指令近來發展快速、熱門的重要關鍵。手勢操作也可以在不接觸裝置的前提下讓人與機器進行互動,進而減少操作者依賴滑鼠、鍵盤、實體按鈕操作,而手勢操作基本上與語音辨識/語音指令或其他新穎的人機介面整合並不會產生衝突,甚至可以透過不同操作機制共同建構更完善的人機操作體驗。

除了透過攝影機搭配影像追蹤方案組構的手勢指令解讀、分析外,在一般行動裝置、智慧型手機使用相當普遍的加速度計、陀螺儀等MEMS(Micro Electro Mechanical Systems)微機電系統元件,也可透過手部的揮動動作、角度、力道感測進行動作指令解析,若採行相對感測精度更高的多軸陀螺儀方案,將可較機器視覺的影像動態辨識提供更準確的手勢動作解析資料,尤其在穿戴式運算產品來說,若整合成智能手環、戒指等穿戴設備,可以進行的手勢辨識動作也會較透過機器視覺辨識的人機介面更不受感測環境限制,提供更高自由度的感測採集資料條件。

消費性電子產品整合手勢操作  提供新穎設備操控體驗

新一代的手勢指令辨識應用,其實不光使用在消費性電子產品,若辨識用的機器視覺攝影裝置基礎條件更好(如辨識度更高、解析度更高),也可進一步發展可搭配臉部辨識功能的加值應用,例如在筆記型電腦產品中,Intel就有針對Ultrabok產品加入多種加值臉部辨識功能,對於大多定點使用的筆記型電腦產品也具備極佳的整合優勢。由於攝影元件在解析能力與採樣速度已經達到足夠解析操作動態指令的條件,善用Camera-Inclusive Systems的優勢也不光僅在筆記型電腦應用,像是多家主流電視製造商也嘗試在新一代智能電視產品導入機器視覺應用,利用高效能的攝影機搭配嵌入式系統進行手勢或是身體動作辨識,達到不需要遙控器就能控制電視選台或音量調整功能,相關應用已在中/高階產品中導入量產。

而手勢指令的應用情境,特別適合必須避免分心的操作環境中,例如在智能汽車應用發展中,駕駛者操控多種電控設備,就相當適合導入「手勢」來取代原有的電控裝置人機互動操作型式,例如原本需要駕駛者進行尋找實體按鈕、進行開關或選取設定程序,就可以利用特殊的手勢指令在感測區塊中做完操控手勢動作,由於少了駕駛需低頭搜尋按鈕位置與進行對應設定的過程,也能讓駕駛更專注於原有的車輛操控工作上。

手勢HCI應用多元

手勢操作的便利性與優勢在於,操控者不須與設備直接接觸即可進行相關應用,這在於特殊的操作情境中是相當實用的設計,例如,無法精確進行按鈕或是設定功能時,若操控者基於衛生、安全或是操作限制不能接觸設備,利用手勢辨識進行操控就能解決設備應用難題。

在近距離與行動裝置或是穿戴式設備互動,手勢指令可以取代HCI輸入設備設置困難的問題,若是對應中長距離的操控應用,例如對應智能電視、娛樂電玩、工業設備等,手勢指令可以擴展到感測更大的體態動作,非接觸式的操控優勢可以在這類應用場景發揮其設計優勢。

發展手勢HCI指令可能困境

發展手勢指令在技術上目前並無技術瓶頸需要克服,基本上手勢HCI主要是透過嵌入式機器視覺(embedded vision)來實現,但目前從視訊擷取部分技術方案多元,如擷取訊框的解析度從基礎的QVGA到1080p都有,訊框自24~60fps不等,硬體與開發資源目前處於較多元的發展狀況,在選擇對應的技術方案反而較難就已有的技術方案快速擷取所需資源進行整合,另手勢發展小尺寸應用可以利用高精密的動作分解操作指令,指令的設計也可以相當直觀易理解,但若發展中長距離的大動作指令時,反而是各廠設計各行其事,也會令使用者在不同產品間較難延續慣用的使用體驗。

手勢指令處理為利用影像擷取、影像演算法處理視訊訊框,輸出電腦能理解的控制指令,若要讓整個HCI架構能順暢運行且提供較佳的使用經驗,即必須在擷取、分析電腦能使用的指令間的時間差縮短,免得使用者已經做完動作還得等個數秒鐘等待電腦出現動作反饋,甚至在嵌入式系統資源有限的限制下還能維持高效率的系統反饋,尤其在擷取的影像品質、運算資源極其有限的條件下,仍需維持系統基本的互動反映效能,在整合設計上仍有極大的挑戰仍需克服。

隨著分析手勢動作準確度的關鍵,在於擷取視訊品質與演算法效能,而機器視覺也是手勢指令演算的基本核心,反而需要在系統底層提供更多運算支援,搭配可跨平台、跨系統的開發資源讓相關產品可更便於整合對應操作功能,簡化開發程序,甚至慣用的操作功能若能於業界倡議共用的手勢操作,讓不同產品可採行近似手勢進行相同的控制要求,亦可讓「手勢」操作能更具實用價值,也能便於使用者輕鬆在不同設備沿用慣用的手勢完成操作行為。