当前位置: 首页 > 新闻 > 国际新闻
国际新闻
颠覆蛋白药物研发,AI技术掀起新一轮投资热潮
发布时间: 2023-03-13     来源: 医药魔方

AlphaFold2的出现给结构蛋白领域带来巨大冲击的同时,也带来了大量机遇,近年来多家AI制药公司进军蛋白质领域。近日,Nature Biotechnology的一篇报告讨论了AI在蛋白质设计、生成中的技术更新和应用。

“AI+蛋白质”领域资本火热

2023年1月26日,Profluent宣布完成900万美元的种子轮融资。Profluent是一家使用深度生成模型学习生物学语言,以设计新的功能性蛋白质的新锐公司。同日,创始人Ali Madani在Nature Biotechnology发表论文,介绍了一种新型人工智能(AI)系统ProGen,它能从头开始生成人工酶。

2022年1月,Generate Biomedicines与安进宣布达成一项研究合作协议,两家公司将利用Generate开发的AI药物发现技术平台,针对5个临床靶标开发蛋白疗法,预付款5000万美元,合作潜在总金额超过19亿美元。

2022年4月,Arzeda宣布完成3300万美元的B轮融资,以支持其正在进行的蛋白质设计项目。
其他初创公司也开始涌入这一领域,如在2022年11月获得550万欧元的种子轮融资的Cradle,以及在2022年8月获得2500万美元种子融资的Monod Bio。

强大的新算法

机器学习(ML)和其他基于AI的计算工具拥有预测真实世界蛋白质结构方面的实力。AlphaFold2是由DeepMind开发的算法,可以根据氨基酸序列预测蛋白质结构,自2021年2月推出以来,已成为家喻户晓的名字。这个ML工具箱也可以生成定制的蛋白质,包括那些在自然界中不存在的功能蛋白。未来,科学家可以利用计算分析来推断蛋白质结构和功能的基本原理,并应用这些原理构建具有特定功能的定制蛋白质。

Cyrus Biotechnology公司的首席执行官兼联合创始人Lucas Nivon认为,计算机设计蛋白质的影响将是巨大的,他将这一领域比作20世纪80年代刚刚起步的生物技术行业:“我认为在30年内,有30%-50%的药物将是由计算机设计的蛋白质。”

迄今为止,从事蛋白质设计领域的公司主要专注于对现有蛋白质进行重组以实现特定功能、增强特定特性,而不是从头开始真正的设计。例如,Generate的科学家利用SARS-CoV-2刺突蛋白与受体蛋白ACE2的相互作用,设计出了一种能够持续阻断不同变异株病毒进入体内的合成蛋白。AI辅助蛋白质设计领域正在蓬勃发展,该领域的根源可以追溯到20多年前的David Baker团队,从1990年代后期开始,Baker在该领域共同创立了包括Cyrus,Monod和Arzeda在内的公司。随着机器学习算法的快速发展,他们开发了许多用于蛋白质设计的强大工具。例如,2022年9月,Baker团队发布了他们的深度学习ProteinMPNN平台,输入想要的结构,算法就能输出一个可能产生新骨架结构的氨基酸序列,并实现了>50%的成功率。

理解蛋白质序列和结构的一个有效策略是把它们当作“文本”,使用遵循生物学“语法”和“句法”规则的语言建模算法。前Salesforce研究公司的计算机科学家Ali Madani最近创立了Profluent。在最近发表的一篇论文中,Madani和他的同事描述了一种语言建模算法,这种算法可以产生计算机设计的新型蛋白质,这种蛋白质可以在实验室中成功生产,其催化活性与天然酶相当。

据Arzeda的联合创始人兼首席执行官Alexandre Zanghellini说,语言建模也是Arzeda工具箱的关键部分,公司使用了多轮算法设计和优化,以改进抗降解的稳定性。他说:“最开始,蛋白质活性在4周后完全消失,经过3轮迭代,现在4周后还能保留95%活性。”

Generate的研究人员最近的一份预印本描述了一种新的基于生成模型的设计算法Chroma,Chroma能设计出更高精准度的全新蛋白质结构。为了展示Chroma能够按照研究者的要求生成蛋白结构,该公司研发团队通过Chroma平台生成了模拟26个英文字母和10个阿拉伯数字形态的全新蛋白结构(如下图)。

数据资源助力飞跃

除了新算法的强大,生物学家获得的大量结构数据也让蛋白质设计领域得以腾飞。蛋白质数据库是蛋白质设计者的重要资源,现在包含了20多万个实验解决的结构。在为设计算法提供训练材料和指导方面,AlphaFold2算法也发挥着重要作用。

对于AI引导的设计,训练数据越多越好。但是现有的基因和蛋白质数据库受限。Basecamp Research正在建立一个超多样化的生物信息存储库,这些信息是从17个国家的生物群落中收集的样本中获得的。Basecamp Research首席技术官Philipp Lorenz说,一旦对这些样本的基因组数据进行分析和注释,他们就可以组成一个知识图谱,揭示不同蛋白质之间的功能关系,而这些关系仅靠测序分析是不太明显的。

一些公司也在寻求用自己的数据来增加公共结构生物学资源。Generate正在建造一个多仪器的冷冻电子显微镜设备,他们可以用相对高的通量生成接近原子分辨率的结构。与来自公开资源的数据相比,这种内部生成的结构数据更有可能包含相关单个蛋白质的数据。

内部湿实验室设施是设计过程的另一个关键组成部分,因为实验结果要反过来应用于重新训练算法,以便在未来几轮中获得更好的结果。巴黎综合理工学院的计算生物学家Bruno Correia说,蛋白质设计工作的成功取决于算法专家和有经验的湿实验室专家之间的密切配合。

AI助力蛋白质疗法蓬勃发展

Hummingbird Ventures的Tess van Stekelenburg说,对于这个领域的投资者来说,生物验证是一个极其重要的考虑因素。她说:“如果你从头开始,真正的黄金标准不是你使用的是哪种架构,而是你设计的蛋白质中有多少比例具有最终想要的属性。如果不能证明这一点,那就没有意义。”因此,大多数从事计算设计的公司仍然专注于调整蛋白质的功能,而不是彻底改变它。

对于Cradle来说,主要目标是通过优化稳定性等性质来改善蛋白质疗法,其创始人兼首席执行官Stef van Grieken说:“我们已经根据实证研究对模型进行了基准测试,这样就可以知道在实验环境下这种方法的效果如何。”

Arzeda的重点是工业应用的酶工程,他们已经成功地创造了具有新型催化功能的蛋白质,用于农业、材料和食品科学。

Generate的第一代工程项目专注于优化,另外,新算法Chroma可以根据用户指定的结构和功能特性开始构建真正的从头设计。

参考资料:
https://www.nature.com/articles/s41587-023-01705-y

代理服务