AWS
Advantechline
 

醫療電子病歷應用的機會與挑戰 台大AI專家:縮寫還原與母體不足

臺灣大學資訊工程學系暨研究所助理教授陳縕儂希望透過NLP,協助醫療人員降低負擔的同時,也拓展醫療資訊更多的落地應用。蔡騰輝攝

人工智慧目前在醫療的應用包括了影像分析、語意分析、生理數值警示分析等等。其中,國際大廠、台灣資通訊廠商、新創團隊紛紛切入數位病理與電腦輔助判讀系統的研發與應用,而臺灣大學資訊工程學系暨研究所助理教授陳縕儂與團隊則藉由自然語言處理(Natural Language Processing;NLP)的方式,提升病歷分析與國際疾病分類(ICD10)的高效能應用。

機器學習快速,讓病歷編碼加速有了曙光。在自然語言處理的應用上,陳縕儂從包括國際疾病傷害及死因分類標準 (International Statistical Classification of Diseases and Related Health Problems;ICD)、病歷分析等與文字相關的醫療應用,開始結合機器學習和深度學習的技術。

縮寫歧異性與母體數稀少的項目 都有進一步突破

在醫療結合人工智慧的發展領域中,目前醫療影像輔助判讀系統的技術服務供應商較多,主要有幾個原因,包括影像收集的技術成熟、GPU升級快速、影像內容客觀,比較不會有人為因素等等。然而,NLP的分析之所以比較少人做,也比較困難的地方在於,除了因為ICD代碼有上千個,有一部分很常出現,然而另一部分出現次數則超級少,數量也成為訓練智慧系統上的限制,然而,陳縕儂的目標就是罕見的疾病代碼,也可以在少量資料下訓練出好的效果。

由於「病歷會有每位醫師的撰寫風格」,因此希望根據醫師寫的診斷書,能預測對應的ICD代碼,進而降低醫院病歷編碼師(coder)的工作負擔。舉例來說,醫師時常在病歷當中以疾病縮寫的方式記錄,然而,每個科別的縮寫習慣不同、歧異性(ambiguity)很大。如何「把縮寫還原」成了最重要的目標之一。「1個縮寫單字,也許有5個可能的還原結果」,陳縕儂說,也因為這樣,訓練過程中,一定要有上下文(context)來協助學習。

「學術論文」也是提供機器學習相當好的材料。比方說,工程師可以將文獻當中沒有縮寫的部分,改成縮寫的內容,再透過上下文整體學習的過程,讓系統嘗試還原,如此一來,就能夠提供機器不同的語料,進而達成「把縮寫還原」的目標。除此之外,在類似領域的學習共享能力應用上,因為ICD有階層結構,所以如果都是心臟類的疾病編碼,訓練且提升A類別的判別能力的同時,部分B類別的產出效率與正確率也會有顯著提升。

  •     按讚加入DIGITIMES智慧醫療粉絲團
更多關鍵字報導: 電子病歷 演算法 醫療AI演算法