2023-02-09
这家成立三年的小初创公司,首次利用深度学习语言模型合成出了自然界中不存在的全新蛋白质,引爆蛋白质设计革命。
人工智能的应用,已经极大地加速了蛋白质工程的研究。
最近,加州伯克利的一家初出茅庐的初创公司再次取得了惊人的进步。
科学家们采用类似ChatGPT的蛋白质工程深度学习语言模型——Progen,首次实现了AI预测蛋白质的合成。
这些蛋白质不仅与已知的完全不同,相似度最低的甚至只有31.4%,但和天然蛋白一样有效。
现在,这项工作已经正式发表于nature biotechnology,题为“Large language models generate functional protein sequences across diverse families”。这个实验也表明,自然语言处理虽然是为读写语言文本而开发的,但它也可以学习生物学的一些基本原理。
论文地址:nature.com/articles/s41587-022-01618-2
比肩诺奖的技术
「它将通过加快开发可用于从治疗剂到降解塑料等几乎所有用途的新蛋白质,为有50年历史的蛋白质工程领域注入活力。」
这家公司名叫Profluent,由前Salesforce AI研究负责人创立,已获得900万美元的启动资金,用于建立一个集成的湿实验室,并招募机器学习科学家和生物学家。
他们做到了。
Profluent创始人兼CEO Ali Madani
而最终设计出的蛋白质,是通常需要数百年才能进化出来的高活性蛋白质。
基于语言模型的ProGen
具体来说,基于Transformer架构的ProGen通过自注意机制来模拟残基的相互作用,并且可以根据输入控制标签生成不同的跨蛋白质家族的人工蛋白质序列。
用条件语言模型生成人工蛋白质
也就是说,这些由AI生成的新蛋白质也可以杀死细菌。
生成的人工蛋白是多样化的,且在实验系统中表达良好
尽管人工酶的氨基酸序列与现有的蛋白质有高达30%的差异,二者之间也只有18%是相同的,但它们的形状却与自然界的蛋白质相差无几,而且功能也可以与之媲美。
条件语言建模对其他蛋白质系统的适用性
但研究人员在另一轮筛选中发现,在AI生成的酶中,即使只有31.4%的序列与已知蛋白质相同,也能表现出相当的活性以及类似的结构。
蛋白质设计,进入新时代
「人工设计蛋白质的性能比受进化过程启发的蛋白质要好得多,」论文作者之一、加州大学旧金山分校药学院生物工程和治疗科学教授James Fraser说。
从之前的工作中,研究者们了解到,人工智能系统可以自学语法和单词的含义,以及其他使写作井井有条的基本规则。
考虑到这近乎无限的可能性,Progen能够如此轻松地设计出有效的酶,确实很了不起。
Profluent Bio创始人、Salesforce Research前研究科学家Ali Madani博士说:「开箱即用地从头开始生成功能性蛋白质的能力,表明我们正在进入蛋白质设计的新时代。」
值得注意的是,还有一些初创公司也在尝试相似的技术,比如Cradle,以及自生物技术孵化器Flagship Pioneering的Generate Biomedicines,不过这些研究都还未经过同行评审。
百度浏览 来源 : 新智元等
版权声明:本网站所有注明来源“医微客”的文字、图片和音视频资料,版权均属于医微客所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源:”医微客”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,转载仅作观点分享,版权归原作者所有。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 本站拥有对此声明的最终解释权。
发表评论
注册或登后即可发表评论
登录注册
全部评论(0)