研華
活動+

智慧音箱透過AI與硬體擴展優化產品使用體驗

  • 魏淑芳
Baidu智能音箱「小度在家」硬體整合6麥克風環狀排列,建構可360度拾音、10m內進行語音指令智能辨識人機介面。Baidu

結合AI人工智慧分析與各種智能居家應用場景的智慧音箱,在2017-18年交出不錯的成績單,Canalys即於2017年10月發布智慧音箱市場分析預測指出,2018年底智慧音箱全球出貨量將達到5,630萬部,相關產品的競爭將更趨劇烈…

自Amazon推出的Echo智能語音服務與系列智慧音箱(Smart Speaker)結合,提供用戶使用語音擴展其電商服務的加值應用場景後,Apple也推出自家智慧音箱、藉由結合原有智慧手機生態系的獨家Siri智能語音助理服務,透過智慧音箱的介接,讓蘋果智能服務生態系可以更輕易進入家庭應用場景。

 點擊圖片放大觀看

Google發布支援Raspberry Pi的Voice Kit(AIY-Projects),套件將包含Google Assistant SDK與發展基於語音的智能服務。Google

Amazon推出帶屏幕Echo Show智能音箱,除可透過語音指令取用電商服務,還附帶打視訊電話、影音食譜等加值功能。Amazon

2017智慧音箱產品發展快速

而從電商、智能產品世界大廠的積極投入,2017年的大小品牌也紛紛推出標榜整合AI人工智慧的智慧音箱產品,不僅智慧音箱實現與設計方式多元,導入的AI人工智慧對應不同應用機制、輔助服務所提供的加值應用也多有不同,甚至在CES 2018也將形成繼智能手機後百家爭鳴的智慧音箱大戰景象,除參與競爭的IT廠商、網路服務廠商眾多,不同的核心技術、應用場景生態系整合條件與實用價值也將出現極大差距。

從智慧音箱的規模觀察,2017年的全球智慧音箱出貨量即達達到3,000萬台,2018年在大廠相繼投入更多行銷資源、更多中/大型業者參與新品競爭,2018年將會是智慧音箱最重要的發展契機,不僅是比拚各廠的「智能」整合優勢,也比智慧音箱結合各種應用場景、海量加值內容的資源競爭,至於硬體端、智能系統、生態系等各種面向的技術、資源角力,也讓這場智慧音箱大戰更值得持續關注。

 

智慧音箱產業鏈日趨成熟

 

先從產業鏈的角度檢視智慧音箱市場,若用智慧音箱大爆發前哨戰的2017年做重點檢視,會發現2017年之前的產品仍處於AI智能服務模組仍需驗證與提升、關鍵系統晶片解決方案仍未完善、市場仍需深入教育耕耘等,而觀察2017年之後的產業狀態會發現,智慧音箱的關鍵晶片、語音辨識 / 人臉辨識等AI模組,已陸續達到產品應用的實質水準,從機構、用戶體驗、關鍵晶片、整合技術成熟度等,各產業環節已日趨成熟,產品成敗關鍵反而會在不同智慧音箱設定的應用場景、與待解決改善的用戶痛點。

 

實際上,在2017年推展智慧音箱應用仍會遭遇幾個較大的非技術門檻待突破,首先是智慧音箱的系統整合未盡完善,在晶片良率、服務整合等仍需時間打磨。

另在基於大量語音、辨識、決策的人機互動體驗尚未完善,用戶仍需一段時間熟悉新一代的產品,導致智慧音箱在市場的認知度有限、市場開發成本偏高。然而在2017—18年開始有大型網路 / 雲端服務商、智能硬體開發者等大舉搶進智慧音箱市場,相繼已有超過10款結合智能應用的音箱產品推出,在CES等展會儼然已經成為未來智能產品的新潮流。

 

功能有限的獨立產品存活不易  應用場景為決勝場域

 

先檢視2017年智慧音箱的發展動態,多數仍以獨立型產品為主,由廠家自行整合多元網路智能應用為主,如串流音樂、串流視頻、網路資訊服務等。

隨著大型網路商、硬體商加入智慧音箱戰局,智慧音箱在「智能化」應用也大幅跨大了競爭門檻,例如整合陣列抗噪麥克風,追加如AI語音辨識、AI應用場景分析與自動化應用等,甚至如Apple、Google、Amazon大型硬體、網路服務商,也推出銜接自身企業資源與優勢的智慧音箱產品,產業觀察紛紛提出2018年極可能因為競爭白熱化,在大型業者祭出補貼、促銷或是更先進的智能應用,創造智慧音箱更大幅的市場成長。

有了大型業者的加入參與競爭,很明顯地2017-18年相繼問世的智慧音箱在產品性能、應用也逐漸趨於成熟,例如,網際網路服務大型業者如Baidu、京東、Alibaba等,與家電或3C硬體製造商如Haier、Lenovo、小米等陸續加入戰局。

國際家電大廠如Sony、音響設備商sonos等硬體廠商,也推出自家智慧音箱;而從智能硬體端切入的Rokid、出門問問也推出新一代智慧音箱搶市,甚至線上內容網路服務商喜馬拉雅也推出了自有品牌的智慧音箱。

智慧音箱的智能化設計挑戰日趨嚴苛

音箱智能化後,其實可以使用的場景相當多元,早期智慧音箱為透過智慧手機與音箱整合協同運作,例如透過藍牙或其他網路介面進行智慧設備連結,由手機端App操控音箱進行多媒體播放或進階智能應用。但這類初期產品在使用體驗太接近藍牙喇叭,智能化的程度也因為成本限制相對受限,整合的音箱功能實用度有限。

新一代的智慧音箱產品則朝向獨立智能運作,透過自行系統聯網而擴展如AI語音辨識、智能家電控制、線上串流節目 / 音樂播放等進階應用,甚至可以達到如真人應答的人機互動體驗,則是智慧音箱在系統、智能、硬體三方面大幅跳躍性升級的新產品。

基本上近期的智慧音箱產品,主要會由三個面向進行整合,一是硬體上的優化與整合,如影響聲控品質的陣列麥克風拾音與降噪技術、小體積音箱的音腔結構音質優化設計方案、整合智能運算中樞的嵌入式系統 / 硬體等。

在軟體或網路服務端的智能化整合,例如Apple的Siri語音助理、Google Assistant、Amazon alexa的語音辨識、Baidu Ai在智慧音箱產品與雲服務方面的進階整合等;最後是各種綜合應用場景的加值應用,例如,語音結合EC服務、語音控制選歌 / 播歌、語音網路服務調用 / 查詢等,三的面向中尤以不同應用場景的服務優化最為重要。

智慧音箱人機介面設計  為操控體驗關鍵

尤其在人機介面的發展,在智慧音箱使用體驗方面,更決定了智慧音箱能否擴展應用市場的關鍵。因為智慧音箱體積多數不大,礙於屏幕較小甚至無設置螢幕的設計方案,與產品體積限制在硬體控制按鍵有限,也讓新一代語音互動的人機介面成為智慧音箱的重要操作機制。

如小米的小愛同學、Apple的Siri、Amazon的alexa等,影響硬體產品運作體驗除了是硬體本身的穩定性外,當終端使用者透過語音指令或是其他人機介面操作能否順暢,就直接判決了智慧音箱的實用價值。

智慧音箱的另一派發展即為導入屏幕設計,多數礙於成本的產品並不會設置顯示屏,但無屏化的用戶體驗會因為使用者不理解「智能」分析下回傳的系統反饋或是語音反饋,往往會因為語音對話指令一來一回降低操作設備效率,影響設備操作流暢度。

而設置顯示屏幕是最簡單提升用戶體驗的方案,甚至透過設置更大的屏幕,賦予智慧音箱更多擴展應用的可能性。例如Amazon Echo Show或是Baidu的小度在家等智慧音箱產品,因為搭載了大型屏幕則擴展了智慧音箱的遠端視訊通訊功能,或是語音查找影音食譜、查找線上影片的新利器。

更多關鍵字報導: 人工智慧(AI) 智慧音響