智慧應用 影音
電子時報行動版服務
event

DeepMind發布35萬種全新蛋白質結構圖譜

DeepMind發布對20種不同生物體約35萬種蛋白質結構的預測。法新社

人工智慧(AI)研究實驗室DeepMind創造了迄今為止最全面的人類蛋白質圖譜。DeepMind是Google母公司Alphabet的子公司,目前其人類基因計劃正在為繪製人類基因而努力。

蛋白質是個長且複雜不規則形狀的分子,像摺紙一樣折疊複雜,在體內執行許多任務,從構建組織到對抗疾病。科學家為了瞭解蛋白質對身體的運作,因此開始積極研究蛋白質折疊的結構,希望能從中設計新的藥物和找出新的治療方法。 以前,若要確定蛋白質的結構需依賴昂貴且耗時的實驗才能知道。但2020年DeepMind表示,可以使用名為AlphaFold的AI軟體對蛋白質的結構進行準確預測。現在,DeepMind正向大眾發布軟體做出的數十萬個預測。

DeepMind的首席執行長兼聯合創辦人Demis Hassabis表示,這是DeepMind十年以來的巔峰。DeepMind從一開始就打算這在AI方面取得突破,並且應用於現實世界的問題,看看科學是否可以加速造福人類。 目前在公共領域有大約180,000種蛋白質結構可用,每一種都已經透過實驗方法發現與產生,可透過蛋白質數據庫訪問。

DeepMind發布對20種不同生物體約35萬種蛋白質結構的預測,包括老鼠、果蠅甚至是大腸桿菌。最重要的是,該版本已包括對98%人類蛋白質的預測,約有2萬種不同結構,統稱為人類蛋白質組,雖然不是人類蛋白質的第一個公共數據集,但是是目前最全面和準確的。

在發布第一批數據後,DeepMind仍計劃繼續增加蛋白質資料,資料庫將由歐洲生命科學生物分子實驗室(EMBL)維護。EMBL總幹事Edith Heard表示,到2021年底,DeepMind希望發布1億種蛋白質結構的預測,並且期待數據集能夠改變目前人類對生命運作方式的理解。瞭解蛋白質的結構對各領域的科學家都很有用。這些資料可以應用在設計新藥、合成分解新型?創造對病毒或極端天氣有抵抗力的農作物。DeepMind的蛋白質預測已被用於醫學研究,包括研究SARS-CoV-2。

不過值得注意的是,DeepMind的軟體蛋白質結構預測,不是一個已經確定的模型,這意味需要進一步驗證結構。不過,由於實驗確定蛋白質的結構既昂貴又耗時,且需要仰賴大量反複試驗。因此即使是低信度的預測也可以為科學家指明正確的研究方向,節省他們大量的工作。

過去,由於蛋白質太小無法用顯微鏡檢查,因此科學家不得不使用昂貴且複雜的方法,例如核磁共振和或是X射線確定結構。然而,近年來,因為AI,能在已知的蛋白質結構數據集上進行深度訓練,使用這些資料進行預測。DeepMind深厚的AI技術和計算資源使計畫能夠加快進展。2020年,DeepMind參加了CASP國際蛋白質折疊比賽,並擊敗了其他隊伍。而如今,DeepMind的AlphaFold程式自2020年的CASP競賽以來也已經升級,現在分析計算速度已經提高16倍。

Demis Hassabis表示,現在是發展AI的大好時機,在接下來的十年裡,DeepMind希望在AI領域能夠取得驚人的突破,加速解決在地球上遇到的問題。

  •     按讚加入DIGITIMES智慧醫療粉絲團
更多關鍵字報導: AI DeepMind