科勝訊推出長距離語音輸入晶片 鎖定智慧型電視 智慧應用 影音
computextaipei
DForum0620

科勝訊推出長距離語音輸入晶片 鎖定智慧型電視

  • 李佳玲台北

影像處理、音訊、嵌入式數據機以及視訊監控應用創新半導體解決方案領導廠商科勝訊系統公司,為智慧型電視產品推出長距離語音(Far-Field Voice)輸入晶片CX20865。CX20865是第一個專門為長距離語音解決方案並配合了自動語音識別(Automatic Speech Recognition;ASR)引擎,為遠距離語音控制應用進行優化解決方案的晶片。

科勝訊新型的低功耗DSP配合第三方自動語音識別ASR引擎可支援智慧型電視電源關閉狀態下語音喚醒的功能。科勝訊獨有的長距離(Far-Field Pickup)語音處理演算法,並配合高性能24位元立體聲ADCs的結合,增加了一個特有的視頻直播對談(Talk)體驗與VoIP應用程序的結合(例如Skype電視)。即使電視在高音量輸出狀態下,仍可提供準確的語音控制功能。新的選擇性來源截取技術SSP(Selective Source Pickup),使在零售環境中和展示會場隨機周圍環境的干擾下仍然有良好的語音識別。

作為客廳的核心,智慧型電視正在成為客廳新的主控樞紐其他數位設備和雲端設備的人機界面。在消費者與電視間,語音是一個自然與理想的人機界面。從基本的語音控制,先進的語音搜索,應用程序的交互,社交網絡,到聊天和遊戲等。然而,為了提供智慧型電視語音體驗,用戶的指令,環境的噪音,電視播放的音量和距離,都必須考慮。在長距離的語音處理技術的先驅,科勝訊與領先的電視OEM廠商密切合作,克服了這些技術挑戰。

新的CX20865硬體採用雙核及高性能的32位元DSP,多工處理語音數據和第三方自動語音識別ASR引擎。晶片內建的DC to DC硬體,更提供了先進的電源管理功能。介面控制上CX20865提供full-speed USB及I2S I/O的語音數據及I2C和UART接口。四個麥克風輸入路徑已升級為具有高性能前置放大器和24位元ADCs,並提供106dB動態範圍的錄音功能。此外,每個麥克風通道均有獨立的專用麥克風偏壓,以防止串音。

當電視以高音量播放聲音時,CX20865的增強語音處理技術可提供>97%的語音識別率(ASR)。新的迴聲消除AEC處理技術,可支援立體聲、2.1聲道、2+2聲道內置揚聲器配置。改進後的去混音和寬頻處理輸入技術,從根本上提高了感知的語音清晰度。為此,科勝訊還與領先的自動語音識別ASR引擎廠商合作,優化產品端及雲端的語音識別率和降低錯誤率。

視頻直播對談功能,提供了一個融合語音通話和電視娛樂同時的新經驗,讓雙方共享時刻看相同或不同的電視節目時能同時分享對話。此語音聊天與對話也適用於多方電視遊戲,而不再需要用到耳機與麥克風(headset)。

選擇性來源截取技術(Selective Source Pickup – SSP),是在嘈雜的環境中隨時間變化長距離噪音抑制的一大突破。SSP可區分眾多的目標來源,分離及過濾隨機的語音/噪聲干擾。該技術(SSP)優化了ASR的應用程序,它超越了傳統有限的模擬人類聽覺系統的聽力限制。科勝訊行銷總監Jonathan Chien指出,語音的低識別率和誤檢知的情形,在大的、擁擠的、嘈雜的零售展示區內,一直困擾著電視業者,我們已經採取了一種獨特的方法(SSP)來解決這種情況,其結果顯著的改善電視OEM零售展示區內語音交互干擾的情況。

科勝訊的副總裁兼總經理Saleel Awsare指出,我們提供的全方位(turnkey)解決方案和必要的專業知識支援,並提供最佳的經驗給我們的電視OEM/ODM合作夥伴,使他們能夠跟上進步的人類語音介面,並運用於智慧型電視。

CX20865支持以下3種主要的語音模式,1.對話模式:在一個大的房間,可通過Skype的電視認證。提供清晰自然的語音對談結果。2.指令與控制模式:優化產品端ASR的語音識別率及對聲音的噪聲和迴聲抑制的喚醒功能。3.語音聽寫模式:基於雲端運算的自然語言ASR語音識別率優化於房間/場景環境。