半個世紀以來,科學家一直在尋找解決“蛋白質折疊問題”的方法。這是生物學領域的一項重大挑戰,難倒了幾代科學家。但現在,人工智能(AI)解決了這一問題。據《自然》雜志1日發表的論文,包括美國華盛頓大學、倫斯勒理工學院和哈佛大學的研究人員在內的研究小組描述了一種升級的阿爾法折疊系統,該系統由深度思維(DeepMind)公司開發,會“構想”出具有穩定結構的新蛋白質。
研究人員表示,這是AI網絡在解決生物學領域最大的挑戰之一——根據氨基酸序列確定蛋白質三維(3D)結構方面取得的巨大飛躍,是生命科學和醫學的福音,極大地促進了人們對細胞基本結構的理解,并將推動更快、更先進的藥物制造進程。
蛋白質存在于每個細胞中,是一種線狀分子,會自發折疊成復雜的3D形狀,其形狀與功能密切相關。例如,抗體蛋白折疊的形狀能使它們精確識別和瞄準特定的異物,就像一把鑰匙插入鎖中一樣。在細胞發育、DNA修復和新陳代謝等幾乎所有生物學過程中,這種折疊非常關鍵。因此,了解蛋白質折疊結構對于了解生物體的功能以及最終生命的運作方式至關重要。
然而,蛋白質根據其氨基酸序列可能折疊成的不同構型的數量是個天文數字。在阿爾法折疊出現之前,科學家只知道人體大約2萬種蛋白質中約17%的3D結構。已知的蛋白質結構是幾十年來科學家在實驗室里通過X射線結晶學和核磁共振等方法煞費苦心計算出來的,這些方法需要數百萬美元的設備和數月乃至數年的反復試驗。近年來,神經網絡和深度學習等AI技術使這項工作的準確性發生了革命性變化。
利用阿爾法折疊,科學家獲得了幾乎所有(98.5%)人類蛋白質組的3D結構。其中36%的預測準確率非常高,另外22%的預測準確率較高。
此次,研究人員向AI提供了完全隨機的蛋白質結構的氨基酸序列,并向其中引入一些突變,直到AI神經網絡預測到它們能將其折疊成穩定的結構為止,最終共產生了2000種全新的蛋白質序列。
研究論文共同作者、美國華盛頓大學醫學院蛋白質設計研究所貝克實驗室的博士后學者伊萬·阿尼先科表示:“任何時候,我們都沒有引導AI得出特定結果,這些新的蛋白質結構完全是計算機‘構想’出來的。”
研究人員表示,AI深度學習網絡極大簡化了蛋白質的設計。未來,希望利用AI設計具有功能的新蛋白質,包括基于蛋白質的藥物、酶等。
(實習記者張佳欣)