賽微語音技術助各產業打造高值化產品服務 智慧應用 影音
工研院
ADI

賽微語音技術助各產業打造高值化產品服務

  • 陳毅斌台北

賽微科技業務經理陳柏沅表示,其提供高度客製化的語音辨識與合成引擎,便於客戶執行二次開發,根據產品特色量身打造不同指令、介面,為產品賦予獨特應用功能。
賽微科技業務經理陳柏沅表示,其提供高度客製化的語音辨識與合成引擎,便於客戶執行二次開發,根據產品特色量身打造不同指令、介面,為產品賦予獨特應用功能。

2014年上半,「生活行VoiceGO!」獲Google Play選為最佳生活品味App,其可讓消費者透過自然語意查詢天氣、股票、電影等豐富資訊,實用價值甚高,故而每月不重複用戶多達85萬人;此App幕後推手,便是深具語音辨識與合成技術根基的賽微科技。

事實上,無論玩具IC、手機、車機,乃至環繞人們生活週遭的機上盒、智慧家電、穿載式裝置,諸多類型設備,都可結合聲控功能,大幅提升附加價值,導致產業界對語音辨識(Voice Recognition)與語音合成(TTS)技術需求若渴,也讓創始於2000年的賽微科技(Cyberon),不管歷經資訊應用趨勢如何改朝換代,皆持續擁有莫大發展空間。

賽微業務經理陳柏沅表示,該公司成立至今,始終專注語音辦識與合成技術,且技術含量不斷深化。以Voice Recognition而論,即從早期的指令式辨識,一路演進至連續語音辨識、語意理解辨識,截至目前,語音辨識技術已支援32種語言;至於TTS,也從早期的Lite版本進展到近期的高品質版本,韻律處理能力迭有精進,亦使擬真效果愈來愈佳。目前高品質版已可達到近似真人發音效果,支援語系達20餘種,並持續依市場需求以每年3~5種語言的速度擴充支援語系。

陳柏沅指出,賽微的競爭優勢,除源自於對多國語言的支援外,高度客製化和高彈性的配合度也是獲得客戶青睞的主因;他進一步解釋,儘管現今不管iOS或Android平台,都已針對語音辨識釋出免費API,看似可能對賽微等專業語音技術廠商構成巨大威脅,然而此類API偏向通用型接口,欲與特定應用深度綑綁,難度極高。

高度客製化  使客戶易於創造獨特價值

反觀賽微,客戶即便運用同一套Cyberon引擎作為核心,仍擁有莫大彈性空間,可根據產品特色打造不同的功能指令、使用者介面;舉例來說,同樣是智慧型手機的聲控拍照功能,有的可支援聲控自拍功能,有的則支援聲控美顏拍照,其間差異,完全取決於個別客戶的創意發想。

賽微科技具備完整語音解決方案,語音技術適用範圍廣闊,若以運算資源大小做為區分,最小可從運算資源有限的IC或MCU(少量而特定的指令辨識),一直到雲端伺服器(已涉及連續語音辨識或理解處理)皆可支援。其中,若以裝置屬性進行區別,則以玩具、手機、車機佔有較大比重。

但外界或許不知,近年智慧型手機的盛行,對於賽微反而是利空、而非利多。陳柏沅解釋,從2003年開始,賽微積極跨足Feature Phone且大有斬獲,接著進入Windows Mobile,仍維持競爭利基,但後來iOS或Android智慧型手機崛起,廠商鼓勵消費者隨需購置App,因而大幅縮減預裝軟體,使賽微頓失發揮空間,所幸趁此空檔轉而加強耕耘聲控導航、車用電子,成功開疆闢土,得以找到另一項驅動營運增長的引擎。

時至今日,行動裝置廠開始亟思透過諸如聲控拍照等舉措,強化自身應用特色,而此目標又無法仰賴單獨App來實現,因此紛紛與賽微洽談合作,使得一度沈寂的手機業務,開始止跌勁揚。

穿戴裝置與智慧家庭  深具未來爆發性

然而除了車機或手機外,賽微已將觸角延伸到更多元的場域。比方說,其與有線電視系統業者合作,讓收視戶能以語音輸入查詢電子節目表單。由於表單內容具時效性會時常更新,且為滿足業主自然口語查詢的期望,賽微針對此類行業需求以雲端架構解決方案對應,以網路高效與即時之特性滿足業者期望。

另外,賽微也積極與IC設計合作,藉以產出具語音控制功能的IC,進而應用於一些無作業系統的裝置;陳柏沅認為,綜觀此類型裝置,最具未來爆發潛力者,即包括兩大類,其一是如同智慧手錶、眼鏡、手環或衣服等穿戴式裝置,另一則是智慧家庭,意即未來閘道器一旦嵌入語音控制IC,輔以遠距麥克風、抗噪音等收音機制到位,便能讓居家使用者藉由語言遙控家電的定時、開關等功能。

值得一提的,雖然賽微具備多國語音識別能力,但現有客戶結構主要仍以台廠外銷為主。今年首度參與COMPUTEX TAIPEI(2015)展示,希望能將累積十餘年來成功案例,藉由手機、車用主機、IC等設備嶄露其語音辨識與語音合成技術能量,並針對未來富含潛力的智慧家庭應用主題加強展示,為參展的海內外人士打造豐富的語音技術饗宴。