AI語音應用大爆發 語音轉文字、聊天機器人、降噪成三大主流 智慧應用 影音
EVmember
member

AI語音應用大爆發 語音轉文字、聊天機器人、降噪成三大主流

  • 林佩瑩台北

迪威智能推出的AI降噪服務 Noise Eraser。迪威智能
迪威智能推出的AI降噪服務 Noise Eraser。迪威智能

受惠於晶片運算持續進化,加上AI演算法的進步,也廣泛應用各種領域之中。AI技術早期應用主要是以影像辨識為主,應用於語音文字方面的時間較慢,不過近幾年也有相當突出的成果出現,其中又以2022年爆紅的ChatGPT最廣為人知,也堪稱AI語音的里程碑。

現今AI在語音領域運用大致上可分成三部分,首先是屬於聊天機器人,主打可透過文字或語音與消費者互動,目前已被廣泛應用在客服系統中。其次,則是語音轉文字,將錄音檔或用戶口說的聲音,轉成相對應的文字,能大幅減少人工整理的時間,非常適合應用於會議記錄或媒體工作者。

迪威智能執行長林智源。迪威智能

迪威智能執行長林智源。迪威智能

迪威智能營運長葉松瓚。迪威智能

迪威智能營運長葉松瓚。迪威智能

迪威智能(DeepWave)營運長葉松瓚說,現今AI在語音領域的第三種應用,則是用來作人聲與背景聲分離、降噪等運用。傳統語音要優化,通常需要仰賴專業人士一秒一秒處理,不僅處理過程非常冗長、成本也相當昂貴,只有高預算製作的影片才有可能使用。相較之下,經費低的個人Youtuber或線上教學的老師,僅能仰賴前期製作時的抗噪錄音設備,後期製作部分根本沒有足夠預算聘請專業人士處理。因此,在Youtuber、線上教學等盛行的今日,不少廠商開始投入AI技術,運用於降噪或人聲、背景聲分離的領域之中。

AI 智能降噪獨步市場 成為最佳幫手

由台灣大學資訊工程系教授張智星與技術長葉子雋、執行長林智源攜手,於2019年9月成立的迪威智能,是經由國科會價創計畫輔導獨立的新創公司。該公司致力於提供創新可負擔的AI聲學辨識技術,協助需要聲音辨識的各產業減輕人力負擔、提升人均產值以及產業價值。目前迪威智能在聲學的AI辨識與處理技術上,可提供超過20種API服務,目前密切合作產業涵蓋數位音樂後製、音樂教育、一般企業面試、機械異音辨識等。

以該公司推出的Noise Eraser為例,即是主打AI 智能降噪的產品,透過近萬筆人聲、噪音素材進行訓練,學習專業音效師的降噪手法,讓消費者以最簡單方式獲得專業音效師的服務,享有消除影片雜音,使人聲更清晰。工具主打僅需簡單三步驟輕鬆達到錄音師的專業降噪等級,且平均處理一個5分鐘片段只需1分鐘即可完成,讓Youtuber、老師在錄製影片時,能免去風聲、雨聲、車聲、狗叫聲等干擾,大幅提升影片品質。

葉松瓚指出,傳統僅單純去除所有背景音的做法,往往會讓影片音訊聽起來不真實,市面上很多免費工具都是屬於此類。為此,迪威智能以AI技術為基礎,再根據多次實驗、使用者測試,調配出最佳應用比例,符合多種應用情境,且使用者也可根據自身需求,調整人聲/噪音比。我們在AI聲學辨識領域深耕超過二十年,更是數屆國際語音和音樂分析比賽常勝軍,希望將這些具高度潛力的技術轉化成可以幫助企業數位轉型的墊腳石,為台灣的數位轉型貢獻一份心力。

參與TTA活動 接觸投資人與潛在客戶

迪威智能Noise Eraser目前有免費版與付費版本,其中免費版每次僅能處理5分鐘的檔案,若使用付費的訂閱制服務,則沒有影片處理時間上限的限制。由於Noise Eraser的降噪功能非常強大,加上每月支付費用合理,所以有高達70%營收來自海外市場。而在強大技術能力加持下,迪威智能創業至今也獲得多個獎項肯定,如經濟部工業局「次世代技術應用人才淬煉計畫」之「2021數位科技解決方案競賽」、Startup Taipei、長庚大學、聯合創新加速器的「20X22初心決心天使選秀活動」、數位發展部數位產業署的AIGO AI產業實戰應用人才淬煉計畫優勝等。

迪威智能執行長林智源說,迪威智能在成長過程中,受到許多法人及政府單位的協助,除國科會的價創計畫外,我們也在TTA協助下參與很多活動。除獲得很多品牌與產品的曝光機會之外,也接觸到不少國外投資人、客戶等,對公司長遠發展帶來不少幫助。

隨著Noise Eraser在市場上大受歡迎,2023年迪威智能規劃進一步推出會議記錄、語音轉文字等服務。其中,會議記錄主打可辨識不同的人聲,且能分能別將會議過程中的語音記錄下來,目前已經在不少政府單位試用中,並獲得極高的評價。


關鍵字