Cadence推出AI語音及音頻處理最佳化DSP 智慧應用 影音
工研院
ADI

Cadence推出AI語音及音頻處理最佳化DSP

  • 吳冠儀台北

益華電腦(Cadence Design Systems, Inc.)宣布推出Cadence Tensilica HiFi 5 DSP,針對高效能遠場(far-field)及AI語音辨識處理的音頻及語音IP核心。與HiFi 4 DSP相比,新推出的第五代HiFi DSP,提高兩倍的音頻處理能力,及高達四倍的神經網路(NN)處理效能,讓數位家庭助理及汽車訊息娛樂的語音控制應用,提供理想的使用者界面。

Cadence Tensilica音頻/語音IP事業群行銷總監Larry Przywara表示,引人注目的使用者界面體驗,使得數位家庭助理語音迅速普及,也讓遠場處理演算及類神經網路語音識別,引發了新一波的創新。HiFi 5 DSP通過改良的浮點及定點功能,並支援新數據類型,可節省記憶體及功耗,解決高性能運算問題。HiFi 5 DSP保持與現有HiFi DSP產品的高互通性,這表示龐大的音頻軟體生態鏈已然形成。

隨著數位家庭助理的普及,對追求開發創新的消費性產品業者而言,語音控制的使用者界面日益重要。為了增進對語音的理解程度,先進DSP演算法正迅速進化,除了消除噪音及隔離揚聲器聲音,還需要更強的處理能力及更好的能源效率。此外,由於人們對於連線的延遲、隱私性及網路取得等種種考量,越來越多類神經網路語音辨識演算開始在本地執行,而非在雲端。

Ambiq Micro行銷副總裁Aaron Grassian表示,為了支援功耗敏感的設備,我們採用更具運算密集能力的神經網路為基礎的遠場處理及語音辨識演算。因應這些極度困難的挑戰,Ambiq Micro選擇成為Cadence HiFi 5 DSP的第一個授權商,將HiFi 5 DSP連接到Ambiq Micro的亞閾值功率優化技術(SPOT)平台,使產品研發、ODM及OEM能夠在不犧牲品質或電池壽命的情況下,透過在可攜式行動產品上整合語音助手、命令及控制,以及對話使用者界面(UI),充分發揮DSP Concepts及Sensory等語音軟體領導者技術,獲得最大的優勢。

HiFi 5 DSP的主要功能包括:五個超長指令字(VLIW)時隙架構可於每個週期發出兩個128位元負載;相較HiFi 4 DSP,提供優於2倍的預處理,以及後處理MAC功能;比HiFi 4 DSP高出4倍的類神經網路處理功能;新HiFi類神經資料庫,可提供一組通常用於類神經網路處理(尤其是語音)的高度優化庫函數。此資料庫可被輕鬆收集到流行的機器學習框架中及軟體相容性,可與總計超過300個HiFi優化音頻、語音編解碼器,以及音頻增強軟體等完整的HiFi產品線相容。

Linley Group資深分析師Mike Demler表示,運用AI處理是當今數位家電市場的優勢,由於消費者對延遲、隱私的要求提升,並渴望以自然語音在使用者介面上交流,裝置/元件上的處理工作負荷亦正在迅速增加。HiFi 5 DSP提供前端處理所需的性能,包括迴聲消除及降噪等任務,而其新的32-MAC/cycle類神經網路,可支援較小的任務,為複雜的語音辨識演算提供了有效的解決方案。

DSP Concepts技術長Paul Beckmann提到,隨著開發時程越來越緊縮,採用新的DSP密集型音頻功能的需求,對OEM來說是一項挑戰。為了滿足這兩種需求,製造商可以選擇如HiFi 5 DSP這款浮點性能提升2倍、具有強大功能的處理核心,然後通過Audio Weaver Designer等圖形配置工具,快速構建其音頻功能;如果缺少現代晶片及開發工具兩項功能,將很難與時俱進。