DIGITIMES醫療月
活動+
 

台灣可作亞洲醫療AI大數據領頭羊 黃彥男看好語音AI與NLP

黃彥男認為台灣有很多利基切入點,各界可以積極嘗試。蔡騰輝

即便台灣的醫學電子數位化已經做了20多年,中央研究院資訊創新研究中心(CITI)主任及特聘研究員黃彥男認為,台灣醫學研究單位要收集醫學病歷資料還是不太容易。不過臺北醫學大學醫學科技學院院長李友專說,健保資料從1995年開始全數落實,所以1995年後出生的人,基本上已可以稱為「全健康數位人」,透過這23年的資料累積,幾乎能說全方位的數據都能收集。

台灣可發展利基醫療AI大數據

雖然台灣的醫療巨量資料取用有限制,但再加上臺灣人體生物資料庫(Taiwan Bio Bank)從2012年11月8日至2019年5月31日止,已經收集了11萬4千多人次的生物資料,因此黃彥男認為,台灣在發展生技醫療大數據與人工智慧上,還是有相當大的優勢。

美國IBM推出Watson For Oncology,但主要內容是收集以白種人為主的癌症醫學文獻資料,再利用專家系統(Expert System)推論,提供醫師不同治療建議,也因為這樣,黃彥男說,台灣更應該切入亞洲黃種人的醫學治療文獻整合系統,不僅在資料收集上能更快速,在創新技術導入研發也能快速實證。

語言AI醫療應用

在語言轉譯方面,黃彥男認為深度學習(Deep Learning)在語音辨識和影像辨識上,是相當適用且好用的技術。針對提升醫病關係的語言創新系統,黃彥男說,當醫師看診時,口說中文但病歷卻能夠以英文輸入,將來一定是可行的。

同時也觀察到Google與Amazon的翻譯系統,雖然尚無盡善盡美,但對話和翻譯的準確度越來越高,黃彥男看好未來語音AI的發展和應用。不過語言數據還是會有地區性的差別,也因此客製化與在地化的語音AI應用,也會是未來較能快速落地的關鍵。

提升資訊安全:NLP追蹤假消息

針對日益增多的網路抹黑文章、假消息、資訊安全漏洞、訊息過濾、洗腦資訊的不當傳遞,黃彥男說,為了防止網路成為這些惡意資訊傳遞的濫用媒介,中心2019下半年也會以研究的角度切入,透過自然語言處理(NLP)找尋消息「來源」,藉由網路爬蟲、網路機器人、人工智慧追蹤新聞來源、相關性、因果關係。

黃彥男表示,計畫的宗旨就是要在假消息(Disinformation)影響民眾之前,就要偵測出來可能的單位、內容、目標,才能達到預防甚於治療的資訊安全預防效用。

  •     按讚加入DIGITIMES智慧醫療粉絲團
更多關鍵字報導: 中央研究院 黃彥男 自然語言處理