Advantech
event
 

AI邊緣運算加持 提升個人化AR體驗

科技巨頭正致力探索AI和AR技術的整合,並應用於各種使用案例。法新社

機器學習(ML)是推動擴增實境(AR)產業前進的關鍵決定因素,在AR世界中,開發人員利用ML找出問題。Google、微軟(Microsoft)、Facebook和亞馬遜(Amazon)等大型科技公司正致力探索人工智慧(AI)和AR技術的整合,並應用於各種使用案例中。

根據Analytics India Magazine報導,新世代AR可透過運算環境連結真實世界與數位物體,創建更多個人化和親密的體驗。過去幾年已有數十億人在Facebook、Snapchat等社群媒體平台上使用Spark AR等特效軟體,還有使用ML推論近似3D表面幾何構造以產生視覺效果,而且只需單顆鏡頭輸入,不需要專用的深度感測器。

其他使用案例還包括汽車保險公司,只要用手機對著汽車,程式就會辨識汽車的製造商和型號並連接公司的API,告知適用的費率和每月付款金額。

在AR應用程式中導入ML,可使用數個經過預先訓練的機器學習模型。如ResNet,為針對電腦視覺任務的物體偵測進行優化的AI模型,主要用來追蹤物體的類型,而非某種特定物體。

用於AR影像處理的ML基本上可以分為三級,一是影像分類,辨識影像中的內容,其次是物體偵測,在影像周圍繪製邊框,最後則是透過影像遮罩取得物體的精確輪廓。

Android和iOS平台已有推論3D空間物體定位的原生解決方案,影像遮罩或物體偵測方面,則只能獲得2D空間的資訊。為了加入AR技術以及AI模型,開發人員正在建立能與影像物體實體互動以及3D空間的應用程式。

如果想將手機執行機器學習模型的效能最大化,可以使用TensorFlow Lite之類的開源深度學習架構,對於建立AR應用程式非常有用。或是利用開發工具ML Kit提供的OCR、人臉偵測等預建API功能來建立應用程式,省去自行開發ML模型的麻煩。

此外還有Google開發的ARCore平台,可用來執行運動追蹤和場景構建等任務。Sceneform則是方便開發人員利用ARCore建立AR環境的SDK,且無須學習OpenGL技術。


  •     按讚加入DIGITIMES智慧應用粉絲團
更多關鍵字報導: AR 人工智慧