當前位置:首頁 > 科普 > 列表 > 正文

大難題告破,蛋白質3D結構可用AI解析
2020-12-02

  生物學界最大的挑戰(zhàn)之一——蛋白質三維結構解析如今有望被破解。借由深度學習程序AlphaFold,谷歌旗下人工智能公司DeepMind能夠精確預測其三維形狀。

  如果把生物體比作工地,那么蛋白質就是工地上的磚頭。人體內有成千上萬種不同的蛋白質,每種蛋白質包括數十上百個氨基酸,這些氨基酸的順序決定著蛋白質的形狀和功能?!敖Y構即功能”是分子生物學的定理,若能根據根據蛋白質的氨基酸序列推出其結構,有助于人們加速了解細胞的組成和運作規(guī)律,一些新藥物的研發(fā)也能更快推進。

  長久以來,人們需要借助實驗確定完整的蛋白質結構,比如X射線晶體學和冷凍電鏡,這些方法往往需要數月甚至數年時間,目前人類已發(fā)現的2億蛋白質中,只有不到20萬的結構被解析。

  而現在,人工智能也有能力給出精確預測的計算方法,甚至只要幾天甚至半個小時。近日,在蛋白質預測結構挑戰(zhàn)賽CASP上,DeepMind推出的AlphaFold程序在百余支隊伍中脫穎而出。CASP的比賽規(guī)則之一是參賽者預測的蛋白質結構必須已經通過實驗驗證但未公開發(fā)表。預測出的結果會通過實驗方法進行匿名檢驗,二者相似度越高,得分也就越高。

  比賽中,DeepMind的AlphaFold將深度學習與張力控制算法結合,并應用于結構和遺傳數據,該深度學習網絡利用目前已知的170,000種解析完畢的蛋白質進行了訓練。結合蛋白質折疊的物理結構和幾何約束信息,AlphaFold可以預測出目標蛋白質的序列結構——甚至還包括楔入細胞膜的蛋白質,這是理解許多人類疾病的關鍵。

  但AlphaFold也不是十全十美,比賽中,在預測一個由52個小重復片段組成的蛋白質結構時,AlphaFold拿到的分數并不高。目前,DeepMind已經公布了AlphaFold首個版本的詳細信息,以便其他研究者復制使用。DeepMind有關研發(fā)團隊表示,還將繼續(xù)對AlphaFold展開訓練,以便更好地解析更復雜的蛋白質結構。

開通會員,享受整站包年服務立即開通 >