解決方案&服務內容
數冠科技是一家數據運算公司,開發智慧型演化學習平台,從事大數據人工智慧AI建模分析的研究服務公司。深度學習是目前人工智慧最受關注的領域,在語音識別、圖像識別和圍棋三個領域表現傑出,但不是人工智慧的全部。深度學習的成功依賴數量充足且多樣性完整的大數據,並且是標註確定的訓練資料,更重要的是要給于完全的資訊。深度學習的實作是基於多層的神經網路,可不必使用專家知識,除了演算法和大數據外,對於高維度數據尚須計算力強大的專門電腦。對於從事智慧醫療且擁有生醫數據的研究人員如何迎接AI的浪潮呢?如何利用深度學習解決機器學習的問題呢?通常一般研究人員和事業單位擁有的生醫數據具有一些特性,例如高維度數據、數量不夠充足、標註不確定性和資訊不夠完全等,另外黑盒學習也妨礙了生醫數據重視的可解釋性(白盒)要求,凸顯深度學習處理生醫數據的罩門缺失。
人工智慧用於精準醫療和精準保健預防是大家引頸期盼的研究亮點,生物標記(biomarker)的發現和預測模型的建立是提供個人化預防、早期發現和醫療的基礎。生醫統計技術關心因果推理,常用於個別生物標記的發現;機器學習則強調預測結果,適用於辨識一組生物標記並建立數學預測模型。欲從高維度(n)訓練樣本辨識出一組最少量(m)的生物標記來建立數學預測模型,並達到最佳的預測正確率,是一個極富挑戰的雙目標組合最佳化C(n,m)問題,而演化計算是解決組合最佳化問題的首選。當訓練樣本數量不充足時,會造成不唯一解的欠定(Underdetermined)問題。若是標註不確定性發生,例如標註健康樣本有可能是偽陰性的病患,會降低預測正確率。面臨數據資訊涵蓋面不夠完全時,生物學家和醫師等可以提供專家知識來彌補。
數冠科技的智慧型演化學習平台可以將專家知識導入演化學習,考量樣本標註的不確定性問題,辨識一組穩健的生物標記(稱為特徵signature)並建立數學預測模型。善用資料集不斷增長的回饋機制,演化學習平台可以逐漸優化預測模型,辨識較正確的一組生物標記特徵,並提供依照預測貢獻度的排序分析生物標記,以及設計最佳化的輸入參數與模擬結果。舉例說明,我們的演化學習使用智慧型演化是演算法[1]的divide and conquer技術解決高維度的組合最佳化問題,以繼承式雙目標基因演算法[2]來找尋辨識一組生物標記特徵,以辨識最佳對照組的半監督學習方法[3]克服標註不確定性問題,以嵌入領域知識和演化計算技術來克服資料量不充分的欠定問題[4]。
數冠科技的演化學習平台,包含分析生醫影像、基因表現和生醫、金融等數據,提供客戶數據建模分析和系統聯合開發的客製化服務。生醫影像包含X光、電腦斷層、核磁造影、病理切片……等電腦輔助分析。基因表現資料包含次世代定序和微陣列晶片資料,及美國癌症基因體圖譜計畫TCGA資料庫等。生醫數據包含各種醫學臨床資料、腸道菌相、腦波、質譜儀頻譜……等。演化學習平台發展獨特的特徵擷取程式,易於嵌入專家的領域知識。客戶準備數據檔案及需求,數冠科技研究服務公司提供顧問諮詢,並以嚴謹學術倫理的態度從事大數據的加值研究服務,提供最佳化的數學預測模型和因素分析,聯合開發建立輔助決策系統,例如AI血液透析、尿液檢測等。
參考文獻
[1] S.-Y. Ho*, L.-S. Shu, and J.-H. Chen (2004, Dec). Intelligent Evolutionary Algorithms for Large Parameter Optimization Problems. IEEE Trans. Evolutionary Computation, Vol. 8, No. 6, p.522-p.541.
[2] S.-Y. Ho*, J.-H. Chen, and M.-H. Huang (2004, Feb). Inheritable Genetic Algorithm for Biobjective 0/1 Combinatorial Optimization Problems and its Applications. IEEE Trans. Systems, Man, and Cybernetics—Part B: Cybernetics, Vol 34. No.1 609-620.
[3] J.-R. Wang, W.-L. Huang, M.-J. Tsai, K.-T. Hsu, H.-L. Huang, S.-Y. Ho* (2016, Nov). ESA-UbiSite: accurate prediction of human ubiquitination sites by identifying a set of effective negatives. Bioinformatics, Volume 33, Issue 5, 1 March 2017, Pages 661–668.
[4] Y. Sathipati Srinivasulu, S.-Y. Ho* (2018, Oct). Identifying a miRNA signature for predicting the stage of breast cancer. Scientific Reports 8, Article number: 16138.