AWS
活動+
 

醫療人工智慧四大區塊 李友專:文字與編碼讓AI更有依據

臺北醫學大學醫學科技學院院長李友專表示,現在醫療產業當中許多專注研發人工智慧的團隊,都致力於影像分析的研究,也因此人工智慧輔助醫療影像判讀的技術突破得很快。相較於這波影像判別熱潮,李友專則說,台灣醫療人工智慧創新研究中心(AIMHI)定位不同,因此關注焦點是放在另外3大類別,分別是文字描述、生理數據訊號、編碼資料。

醫療文字敘述讓AI更聰明

 點擊圖片放大觀看

李友專認為,編碼資料將會是台灣人工智慧發展很有利基的資源。AIMHI提供

李友專說,在文字敘述當中,資料又分成兩大類。第一大類包含了門診的SOAP資料和病歷,以及入、住、出院的行政內容與急診的敘述文字。第二大類則包括了美國國家醫學圖書館(National Library of Medicine;NLM)的MEDLINE資料庫,以及PubMed等資料庫平台當中、2,000多篇以上的文獻摘要內容。其中在台灣又以萬芳醫院有使用的IBM Watson for Oncology系統為第二大類中最好的例子。

李友專認為,文字敘述所影響的科別也是最多的。在醫院的文字敘述當中,所謂的SOAP資料,指的是:

.S (Subjective data):主觀自覺徵候,包括病人主訴、症狀、發病時間、現在、過去、個人病史。

.O (Objective data):醫療人員的客觀檢查結果,包含了診察發現與各種檢查報告。

.A ( Assessment ):醫療人員的診斷評估,也就是診斷(diagnosis)或臆斷(impression)。

.P ( Plan ):治療計劃,像是處置、醫令、處方。

李友專說,這些資料就涵括超過10萬個變項。此外他也提醒,抽血等「檢查」與「檢查科」是不相同的領域。檢查科當中包含了放射科學、病理學、核子醫學等等面向,這都匯聚了許多自由文字(Free Text)。

生理數據訊號餵養人工智慧

由於現代軟硬體科技進步,能夠收集到的樣本數,已經不僅幾百萬筆而已,而是往往都數以億計。而這些偶爾反而過於「豐富」的數據,很容易讓研究人員難以判斷。在臨床判斷上來說,其實不是很實用。該如何在去蕪存菁的過程中,可以有效掌握關鍵數據,將是未來各界智慧醫療發展可以切入的角度。

此外,心電圖(ECG)、肌電圖(EMG)、由呼吸器所收集到的數據、心跳、血壓這些生理數值,都是連續性的紀錄。透過收集長時間的數據,也就可以找出動態變化。李友專也分享,過往一般心電圖量測時間,大約只有5-15分鐘,現在透過一些改良過的霍特式行動心電圖機器(Holter),已經可以達到24小時的量測功效。

除了台灣以外,李友專提到,包括了麻省理工學院(MIT)、哈佛、波士頓貝斯以色列女執事醫療中心(Beth Israel Deaconess Medical Center;BIDMC)都有在收集與分析大數據庫。其中,各大加護病房當中的心電圖數據,就已有超過20萬人的資料可供研究。

編碼資料讓人工智慧有標準依據

醫療資訊編碼很重要,但李友專提醒,擁有良好編碼系統的國家其實並不多。台灣或許可以積極利用累積了23年的健保資料,進而在文字敘述統計、預測死亡率、輔助醫師診斷等方向,提供更多應用內容。

李友專說,與影像的分析概念也相當類似,數據也要用多維和多面向的方式來檢驗與分析。舉例來說,2000x2000這樣400萬個點的X光片,也就等於有400萬個變數需要分析。也因此系統性的編碼資料在未來的智慧醫療產業應用上,變得十分關鍵。

現職

臺北醫學大學醫學科技學院院長

臺北醫學大學醫學資訊研究所特聘教授

臺北醫學大學市立萬芳醫院皮膚科主任

社團法人台灣遠距照護服務產業聯盟理事

國際SCI期刊全球總編輯

《International Journal for Quality in Health Care》

《Journal of Computer Methods and Programs in Biomedicine》

學歷

1994年-美國猶他大學醫學資訊博士

1991年-臺北醫學大學醫學士

榮譽

2017國際健康資訊學院(IAHSI)創始院士

2015中華民國資訊產業最高桂冠-傑出資訊人才獎

2010美國醫學資訊學院(ACMI)院士

2010澳洲醫學資訊學院(ACHI)院士

2001中華民國十大傑出青年

經歷

台灣醫學資訊學會榮譽理事長

臺北醫學大學副校長

國立陽明大學生物醫學資訊研究所教授兼所長

亞太醫學資訊學會(APAMI)主席

臺北市立萬芳醫院醫療資訊副院長

臺北醫學大學醫學資訊研究所教授兼所長

  •     按讚加入DIGITIMES智慧醫療粉絲團