活動+
 

語音對話塑造下一代人機介面 生活體驗為創新最佳催化劑

台灣AI實驗室創辦人杜奕瑾出席科技部建立AI語音數據資料集記者會。廖家宜

走過PC時代的鍵盤、滑鼠,再到手機時代的觸控式螢幕,進展到AIoT時代,語音對話被視為下一代人機互動最直覺、人性化的體驗方式。而台灣人工智慧實驗室AI Lab創辦人杜奕瑾也指出,未來語音介面取代的機會以後將會越來越多,即便目前仍無法達到效果非常好的語意理解,但在開發過程中仍是激發創新最好的催化劑,敏銳洞悉生活周遭體驗哪裡可以再進化才是重點。

杜奕瑾指出,全球走過PC時代一路進展到手機與網路世代,現在第三階段轉型則是聚焦如何把人工智慧與物聯網融入生活中,而其中「體驗」就是關鍵。杜奕瑾2017年成立台灣AI實驗室與科技部展開密切合作,研究如何在體驗上創新,杜奕瑾指出,從PC時代的滑鼠與鍵盤、手機時代的觸控式螢幕,人機互動介面不斷在演進,而他則是認為更直覺、人性化的語音介面取代的機會以後會越來越多,而Alexa與Google Home也不盡然是語音對話的最終介面呈現,新的時代新的體驗一切都還在定義中。因此目前在AI Labs所聚焦的三大領域中就包含人機介面,而其餘則有智慧醫療與智慧城市等領域。

語音對話被視為下一代人機互動最直覺、最人性化的體驗方式,在技術上包括語音辨識、語意理解等都是基本功,但中文自然語言理解與語音辨識都是一種高度在地化的技術,對於當地所使用的文字、用語習慣與語調等必須深入理解,甚至必須要在地人自己做才能符合當地需求。

其中最基礎也是最重要的第一步就是累積數據進行語音辨識訓練,雖同以中文為母語,但中國大陸挾人口優勢,在AI語音辨識與理解技術上相對發展更早也更好,而兩地文化仍有異,台灣又缺少人口優勢,要發展AI語音就必須得下一番苦功。據了解目前業界對於AI學習「台灣味」語音辨識不甚理想,其主要係因無資料來源從而無法取得語音內容以及進行語音內容標記。

科技部在推動AI發展策略下,現也透過科技大擂台推出「與AI對話」競賽,並攜手廣播電台建立AI語音數據資料集,邀請台科大副教授廖元甫協助語音資料的標註,藉此縮短資料標註的人力和時間。但該競賽首屆並無人取得最高額獎金,顯見中文語音辨識與語意理解仍是一項挑戰。

而杜奕瑾則認為,即便目前無法達到效果非常好的語意理解,但在開發過程中仍是激發創新最好的催化劑,敏銳洞悉生活周遭體驗哪裡可以再進化才是重點。他舉例,像是看準「鄉民經濟」AI Lab過去也曾計畫開發鄉民聊天機器人,讓使用者與ChatBot的互動宛如PTT版,點子有了、創新有了,但實際開發過程除了得要有資料基礎外,也必須先在網路上理解相關文章,但最後仍無法將理想具體實現,但奠基於先前的經驗與技術,AI Lab卻開發出能夠即時將語音轉文字的「雅婷逐字稿」,協助聽障人士溝通,也能記錄訪談或是會議內容,甚至在App Store下載量拿下第一名。

  •     按讚加入DIGITIMES智慧應用粉絲團