借助超級電腦運算能量中研院奈米孔定序技術強化抗疫能力

SARS-CoV-2 奈米孔定序流程。(中研院生醫所研)
在技術精進與價格逐漸親民兩大因素下,基因定序的應用逐漸寬廣,尤其是在新興傳染疾病篩檢,近年更有亮眼成效,由中研院生醫所研究員暨新興傳染病專題中心執行長林宜玲博士帶領的團隊,近期透過病毒基因體快速累積的變異分析,來追蹤病毒表徵變化,由於此研究中的資料量極為龐大,需耗費鉅量電腦運算資源,林宜玲博士的團隊利用國研院國網中心TWCC臺灣AI雲與「科技抗疫2.0」專案,大幅縮短數據運算時間,成功建立奈米孔定序技術,協助執行新冠病毒研究工作。
林宜玲博士表示,該團隊建立奈米孔定序技術(Nanopore Sequencing),協助實驗室P3團隊的新冠病毒(SARS-CoV-2)基因定序,以即時掌控新冠病毒培養過程中的基因變化情形。並利用此技術,收集SARS-CoV-2基因層次的資訊,瞭解病毒的複製過程和與宿主之間的交互作用,期許未來在病毒檢測/演化、以及研發疫苗/藥物等重要議題上,提供防疫參考。
林宜玲博士團隊選擇第三代高通量定序(third generation sequencing)的奈米孔技術,相較於第二代,第三代具有攜帶方便、定序速度快、可讀取較長的單一序列、擁有直接讀取RNA的技術、可直接觀察原始DNA和RNA鹼基上的修飾作用等優勢。不過這些優勢同時也伴隨一定程度的困難,例如奈米孔技術的錯誤率較高,必須透過定序深度的增加克服此問題;另外也需耗費時間及精力建立後端分析資料處理流程,而這些數據的分析都仰賴大量的運算資源。
為解決此問題,該團隊借助了國網中心的力量。林宜玲博士表示,國網中心服務平台帶來的最大效益是節省時間成本,由於奈米孔定序技術在機器運行時,是藉由紀錄不同鹼基分子通過奈米孔洞時,產生之電訊號來判讀其基因序列。需將格式為電訊號的檔案,轉換至研究者可理解之基因序列格式,這過程非常耗費運算資源,以往需要長達10天以上的資料處理時間,在國網中心的資源幫助下,可壓縮至5小時之內,這不僅省去大量的等待時間,也同時加快了實驗進程與後端分析時程。
林宜玲博士舉例,100G奈米孔技術所得到的定序電訊號,如果用一般桌上型工作電腦,需耗費10天以上的運算時間,國網中心的運算資源則僅需16小時,若進一步使用國網中心的GPU運算資源,更可再縮短到5小時,時間成本效益相當驚人。
林宜玲博士與其團隊非常感謝國網中心的「科技抗疫2.0」專案,透過TWCC臺灣AI雲運算資源,病毒序列資料被快速且即時的產生,這將有利於掌握SARS-CoV-2的序列變化以及基因轉錄圖譜,對於COVID-19的相關工作助益良多。
放眼未來的防疫工作,這種快速且便於攜帶的第三代定序技術,將可協助生醫研究進行大規模的病毒序列監測調查,以便追蹤感染源瞭解傳播鍊、加強隔離/清消等感控措施、並監測病毒抗原性以及毒性潛在的變化。在學術研究方面,奈米孔定序技術也提供探索未知領域的可能性,這些資訊也有助於瞭解致病機制以及藥物、疫苗的開發等。除了目前的SARS-CoV-2外,也可以建立登革、茲卡與流感等其他重要病毒的定序系統,以因應下一波可能發生的全球傳染病大流行。