Advantech
Energy Taiwan

AI深度學習效率最佳化 首要任務為清除暗黑數據

  • 蔡騰輝
史丹佛大學博士後研究員Leon Bergen。蔡騰輝

想要將某個領域的發展繼續推進,有時候必須停下來看看現有的狀況,進行策略性整理和分析,才能訂出未來發展的大方向。醫療領域的發展也是如此。醫療院所收集了數十億筆醫療資訊,包括CT圖、病理圖、X光圖等電子化醫療紀錄。為了要發展精準醫療,近幾年科學家無不希望透過人工智慧(AI)在這些數據當中找出核心關鍵。

透過電腦建模和實驗方法來研究語言學的史丹佛大學(Stanford University)博士後研究員Leon Bergen在TRANS Conference 2018論壇上表示,醫療機構現有的數據將會是未來數位醫療發展的重要基礎資料庫。就如同語言分析必須清除不相關的資料,醫療數據要變得有意義,就必須先清理醫療暗黑資料,才能進一步分析,提供決策者方向。

包括護理流程圖、醫師診斷紀錄、放射科報告、肺部疾病諮詢報告的電子化醫療數據都可以透過AI分析。在進行數據分析之前,Bergen提醒,整理雜亂且無法直接使用的暗數據(Dark Data)是相當重要的一點。技術人員提供整理過的數據給AI系統進行深度學習,深度學習的步驟包括,收集大量數據、整理暗數據、訓練神經網路、透過網路內容進行分析。

Bergen點出訓練AI系統的深度學習,研發人員必須不怕出錯,在不斷試錯的過程當中,神經網路會依循每一次的結果改進,給予不同以往的產出。人員也必須評估神經網路產出的結果,並且調整神經網路的學習數據。

舉例來說,當系統判斷病患有67%的死亡率,數據人員就必須依照最終病患實際的存活狀況來調整系統數據設定。透過真實的結果與事先預測之間差異的反饋,才能不斷提高之後的預測精準度。

以往數據似乎就是片段的資訊,然而,現在圖形數據已經可以透過強大的圖形處理器(GPU),提供既快速又系統化的分析。不過,在電腦斷層掃描(CT)的分析上,有時候還會出現AI分析的結果與醫師的判斷有出入的狀況。此時,就必須比對迴旋神經網路、醫師判斷、CT圖當中的各種差異。

對於AI是否會取代人類,Bergen表示,許多評論都認為在未來幾十年之內,AI很有機會在很多領域的分析都勝過人類,但要完全取代人類還是有困難。