爱游戏登录

中文|English

010-51581369/82113221

产品信息

爱游戏大厅app下载

北京总部

电话:010-51581369

上海办事处

电话:13917930412

广州办事处

电话:18911603738

青岛办事处

电话:18669721765

天津办事处

电话:18920376175

武汉办事处

电话:13476191662

成都办事处

电话:17313116388

南京办事处

电话:13641800054

西安办事处

电话:13201540808

石家庄办事处

电话:13693073503

合肥办事处

电话:18905696823

杭州办事处

电话:18106759709

重庆办事处

电话:15340558405

  • Nature:AlphaFold和AI蛋白质折叠的

  • 发布时间:2024-02-18 11:45:01
    来源:爱游戏登录入口 作者:爱游戏大厅app下载

      这样的筛选只是一个起点。它们在预测一些蛋白质配对方面做得很好,特别是那些稳定的蛋白质配对,但在识别更多的瞬时相互作用方面却很困难。

      人类核孔复合物在收缩和扩张状态之间变化的Alphafold和cyro-EM模型的俯视图。它是人类细胞中最大的分子机器这1000块拼图来自于30多个蛋白质组件,它们以无数种方式交错排列。让这块拼图更难的是,实验确定的这些组件的三维结构是来自许多物种的结构的大杂烩,所以并不总是能很好地拼在一起。而且,拼图盒上的图片--核孔复合物的低分辨率三维视图--缺乏足够的细节,无法知道其中有多少块能精确地拼在一起。

      2016年,位于德国法兰克福的马克斯-普朗克生物物理研究所(MPIB)的Beck领导的团队报告了一个模型,该模型涵盖了核孔复合物的约30%和30个组件的约一半,称为Nup蛋白。

      然后,去年7月,总部位于伦敦的DeepMind公司(隶属于谷歌母公司Alphabet)公开了一个名为AlphaFold2的人工智能工具。该软件可以从蛋白质的基因序列中预测其三维结构,而且大部分情况下是精确的。这改变了Beck的任务,以及成千上万的其他生物学家的研究。

      AlphaFold狂热:柱状图显示了自Alphafold发布以来引用它的研究论文和预印本的数量AlphaFold 改变了游戏规则,Beck说。这就像一场地震。你可以到处看到它。以色列耶路撒冷希伯来大学的计算结构生物学家 Ora Schueler-Furman 说,他正在使用AlphaFold为蛋白质相互作用建模,以七月为界。使用 AlphaFold,Beck 和 MPIB 的其他人--分子生物学家 Agnieszka Obarska-Kosinska 和生物化学家 Gerhard Hummer 领导的小组--以及德国汉堡欧洲分子生物学实验室 (EMBL) 的结构建模师 Jan Kosinski 领导的小组,可以更准确地预测人类版本的Nup蛋白的结构。通过调整一个帮助 AlphaFold 建立蛋白质相互作用模型,他们在去年10月成功地发表了一个模型,该模型涵盖了该复合物的60%。它揭示了复合物如何稳定细胞核中的孔,暗示了复合物如何控制什么东西进入和离开。

      在过去的半年里,AlphaFold 的狂热已经笼罩了整个生命科学界。伦敦大学学院的计算生物学家 Christine Orengo 说:我参加的每次会议,人们都在说为什么不使用 AlphaFold。

      在某些情况下,人工智能为科学家们节省了时间;在其他情况下,它使以前无法想象或极不现实的研究成为可能。不过它也有局限性,一些科学家发现它的预测对他们的工作来说太不可靠。但是,实验的步伐是狂热的。

      甚至那些开发该软件的人也在努力跟上它在从药物发现和蛋白质设计到复杂生命起源等领域的应用。DeepMind 的 AlphaFold 团队负责人 John Jumper 说:我一觉醒来就在Twitter上输入 AlphaFold。看到所有的东西,这是一种相当不错的体验。

      AlphaFold 在2020年12月引起了轰动,当时它在一个名为CASP的比赛中占了上风。该竞赛每两年举行一次,衡量生物学最伟大的挑战之一的进展:仅从氨基酸序列确定蛋白质的三维结构。计算机软件参赛作品与使用X射线晶体学或低温电子显微镜等实验方法确定的相同蛋白质结构进行评判,这些方法向蛋白质发射X射线或电子束,以建立其结构图。

      2020年版本的 AlphaFold 是该软件的第二版。Jumper 说,它还赢得了2018年的CASP,但其早期的努力大多不够好,无法替代实验确定的结构。然而,AlphaFold2 的预测结果平均来说与经验结构相当。当时并不清楚 DeepMind 何时会广泛提供该软件或其预测结果,因此研究人员利用 Jumper公开演讲中的信息,以及他们自己的见解,开发了自己的人工智能工具,称为RoseTTAFold。

      然后在2021年7月15日,描述 RoseTTAFold 和 AlphaFold2 的论文出现了,以及免费提供的开源代码和专家运行自己版本的工具所需的其他信息。一周后,DeepMind 宣布它已经用 AlphaFold 预测了人类制造的几乎所有蛋白质的结构,以及其他20种被广泛研究的生物体的整个蛋白质组,如小鼠和大肠杆菌--总共有超过365,000个结构。DeepMind 还将这些数据公开发布到由位于英国欣克斯顿的EMBL欧洲生物信息学研究所 (EMBL-EBI) 维护的数据库中。这个数据库后来已经增加到了近一百万个结构。

      今年,DeepMind 计划发布总数超过1亿的预测结构。这几乎是所有已知蛋白质的一半--比蛋白质数据库 (PDB) 结构库中实验确定的蛋白质数量多出数百倍。

      AlphaFold 部署了深度学习神经网络:计算架构的灵感来自于大脑的神经线路,以辨别数据中的模式。它已经在 PDB 和其他数据库中的数十万个实验确定的蛋白质结构和序列上进行了训练。面对一个新的序列,它首先寻找数据库中的相关序列,这可以识别倾向于一起进化的氨基酸,表明它们在三维空间中很接近。现有相关蛋白质的结构提供了另一种方法来估计新序列中氨基酸对之间的距离。

      AlphaFold 在尝试对氨基酸进行三维建模时来回迭代来自这些平行轨迹的线索,并不断更新其估计值。专家们说,该软件在机器学习研究中的新思路的应用似乎是 AlphaFold 如此出色的原因--特别是它使用了一种被称为注意力的人工智能机制,以确定哪些氨基酸连接在任何时候对其任务来说是最突出的。

      该网络对相关蛋白质序列信息的依赖意味着 AlphaFold 有一些限制。它不是被设计来预测突变的影响,比如那些导致疾病的突变,对蛋白质的结构。它也没有被训练来确定蛋白质在存在其他相互作用的蛋白质或分子 (如药物) 的情况下如何改变结构。但是它的模型带有分数,可以衡量网络在预测蛋白质的每个氨基酸单元方面的信心--而且研究人员正在调整 AlphaFold 的代码以扩大其能力。

      据 DeepMind 称,到目前为止,已经有40多万人使用了 EMBL-EBI 的 AlphaFold 数据库。还有一些 AlphaFold 的超级用户:研究人员在自己的服务器上设置了该软件,或者转向基于云的 AlphaFold 版本,以预测 EMBL-EBI 数据库中没有的结构,或者为该工具设想新的用途。

      生物学家们已经对 AlphaFold 解决结构的能力印象深刻。丹麦奥胡斯大学的结构生物学家 Thomas Boesen 说:根据我到目前为止所看到的,我非常信任 AlphaFold。该软件已经成功地预测了Boesen中心已经确定但尚未公布的蛋白质的结构,他说,这对我来说是一个很大的验证。他和奥胡斯微生物生态学家 Tina Šantl-Temkiv 正在使用 AlphaFold 对促进冰的形成的细菌蛋白质的结构进行建模--这可能有助于云中冰的冷却效应--因为生物学家还不能通过实验完全确定这些结构。

      斯德哥尔摩大学的蛋白质生物信息学家 Arne Elofsson 说,只要一个蛋白质蜷缩成一个定义明确的三维结构--而不是所有的--AlphaFold 的预测就很难被打败。这是一个一键式解决方案,可能是你要得到的最好的模型。

      在 AlphaFold 不太自信的地方,它非常善于告诉你什么时候它不起作用,Elofsson 说。在这种情况下,预测的结构可能类似于漂浮的意大利面条。这通常对应于蛋白质中缺乏确定结构的区域,至少在孤立的情况下是如此。这种本质上无序的区域--约占人类蛋白质组的三分之一--可能只有在另一个分子 (如信号伙伴) 出现时才变得明确。

      伦敦癌症研究所的计算生物学家 Norman Davey 说,AlphaFold 识别无序状态的能力对他研究这些区域的特性的工作来说是一个游戏规则的改变,他说,我们的预测质量立即有了巨大的提高,而我们没有付出任何努力。

      AlphaFold 将蛋白质结构转储到 EMBL-EBI 数据库中的做法也立即被投入使用。Orengo 的团队正在搜索它,以确定新的蛋白质种类 (不需要通过实验验证) ,并且已经发现了数百个,也许是数千个潜在的新蛋白质家族,扩大了科学家对蛋白质外观和功能的认识。在另一项工作中,该团队正在搜索从海洋和废水中获取的DNA序列数据库,以尝试识别新的消化塑料的酶。研究人员利用 AlphaFold 快速估算出数千种蛋白质的结构,希望更好地了解酶如何进化以分解塑料,并如何改进它们。

      马萨诸塞州剑桥市哈佛大学的进化生物学家 Sergey Ovchinnikov 说,将任何蛋白质编码基因序列转化为可靠结构的能力应该对进化研究特别有力。研究人员通过比较基因序列来确定生物体及其基因在不同物种间的关系。对于远距离相关的基因,比较可能无法找到进化的亲属,因为序列已经发生了很大的变化。但是通过比较蛋白质结构--其变化往往没有基因序列那么快--研究人员也许能够发现被忽视的古老关系。苏黎世瑞士联邦理工学院的计算生物学家 Pedro Beltrao 说:这为研究蛋白质的进化和生命的起源提供了一个惊人的机会。

      为了测试这个想法,由首尔国立大学计算生物学家 Martin Steinegger 领导的一个团队和他的同事使用他们开发的一个工具,称为 Foldseek,在 EMBL-EBI 的 AlphaFold 数据库中寻找 SARS-CoV-2 的 RNA 复制酶的亲属。这次搜索发现了以前未被发现的可能的古代亲属,包括粘菌在内的所有真核生物的蛋白质,这些蛋白质在其三维结构上类似于被称为逆转录酶的酶,艾滋病毒等病毒利用这些酶将 RNA 复制到 DNA 中,尽管在遗传序列水平上几乎没有相似之处。

      对于想要确定一个特定蛋白质的详细结构的科学家来说,AlphaFold预测不一定是一个直接的解决方案。相反,它提供了一个初步的近似值,可以通过实验来验证或完善--它本身也有助于理解实验数据。例如,来自X射线晶体学的原始数据以X射线衍射的模式出现。通常情况下,科学家需要对蛋白质的结构有一个初步的猜测,以解释这些图案。英国剑桥大学的结构生物学家 Randy Read 说,以前,他们经常从 PDB 中的相关蛋白质中拼凑信息,或者使用实验方法,他的实验室专门研究这些方法中的一些。Read 说,现在,AlphaFold 的预测已经使这些方法对于大多数X射线模式来说变得没有必要,他的实验室正在努力在实验模型中更好地利用 AlphaFold。我们已经完全重新确定了我们的研究重点。

      他和其他研究人员已经使用 AlphaFold 从X射线数据中确定了晶体结构,而这些数据如果没有一个适当的起始模型是无法解释的。Read 实验室的前博士后 Claudia Millán Nebot 说:人们正在解决那些多年来未被解决的结构,她现在在剑桥的分析公司 SciBite 工作。她预计会有大量的新蛋白质结构提交给 PDB,这在很大程度上是 AlphaFold 的结果。

      专门从事低温电镜的实验室也是如此,低温电镜可以捕捉到闪冻蛋白质的照片。北卡罗来纳大学教堂山分校的结构生物学家和药理学家 Bryan Roth 说,在某些情况下,AlphaFold 的模型准确地预测了称为G-蛋白偶联受体(GPCRs)的蛋白质的独特特征,而其他计算工具却搞错了。他说:它似乎真的很适合生成第一个模型,然后我们用一些实验数据对其进行完善。这为我们节省了一些时间。

      但 Roth 补充说,AlphaFold 并不总是那么准确。他。

      这样的筛选只是一个起点。它们在预测一些蛋白质配对方面做得很好,特别是那些稳定的蛋白质配对,但在识别更多的瞬时相互作用方面却很困难。

      人类核孔复合物在收缩和扩张状态之间变化的Alphafold和cyro-EM模型的俯视图。它是人类细胞中最大的分子机器这1000块拼图来自于30多个蛋白质组件,它们以无数种方式交错排列。让这块拼图更难的是,实验确定的这些组件的三维结构是来自许多物种的结构的大杂烩,所以并不总是能很好地拼在一起。而且,拼图盒上的图片--核孔复合物的低分辨率三维视图--缺乏足够的细节,无法知道其中有多少块能精确地拼在一起。

      2016年,位于德国法兰克福的马克斯-普朗克生物物理研究所(MPIB)的Beck领导的团队报告了一个模型,该模型涵盖了核孔复合物的约30%和30个组件的约一半,称为Nup蛋白。

      然后,去年7月,总部位于伦敦的DeepMind公司(隶属于谷歌母公司Alphabet)公开了一个名为AlphaFold2的人工智能工具。该软件可以从蛋白质的基因序列中预测其三维结构,而且大部分情况下是精确的。这改变了Beck的任务,以及成千上万的其他生物学家的研究。

      AlphaFold狂热:柱状图显示了自Alphafold发布以来引用它的研究论文和预印本的数量AlphaFold 改变了游戏规则,Beck说。这就像一场地震。你可以到处看到它。以色列耶路撒冷希伯来大学的计算结构生物学家 Ora Schueler-Furman 说,他正在使用AlphaFold为蛋白质相互作用建模,以七月为界。使用 AlphaFold,Beck 和 MPIB 的其他人--分子生物学家 Agnieszka Obarska-Kosinska 和生物化学家 Gerhard Hummer 领导的小组--以及德国汉堡欧洲分子生物学实验室 (EMBL) 的结构建模师 Jan Kosinski 领导的小组,可以更准确地预测人类版本的Nup蛋白的结构。通过调整一个帮助 AlphaFold 建立蛋白质相互作用模型,他们在去年10月成功地发表了一个模型,该模型涵盖了该复合物的60%。它揭示了复合物如何稳定细胞核中的孔,暗示了复合物如何控制什么东西进入和离开。

      在过去的半年里,AlphaFold 的狂热已经笼罩了整个生命科学界。伦敦大学学院的计算生物学家 Christine Orengo 说:我参加的每次会议,人们都在说为什么不使用 AlphaFold。

      在某些情况下,人工智能为科学家们节省了时间;在其他情况下,它使以前无法想象或极不现实的研究成为可能。不过它也有局限性,一些科学家发现它的预测对他们的工作来说太不可靠。但是,实验的步伐是狂热的。

      甚至那些开发该软件的人也在努力跟上它在从药物发现和蛋白质设计到复杂生命起源等领域的应用。DeepMind 的 AlphaFold 团队负责人 John Jumper 说:我一觉醒来就在Twitter上输入 AlphaFold。看到所有的东西,这是一种相当不错的体验。

      AlphaFold 在2020年12月引起了轰动,当时它在一个名为CASP的比赛中占了上风。该竞赛每两年举行一次,衡量生物学最伟大的挑战之一的进展:仅从氨基酸序列确定蛋白质的三维结构。计算机软件参赛作品与使用X射线晶体学或低温电子显微镜等实验方法确定的相同蛋白质结构进行评判,这些方法向蛋白质发射X射线或电子束,以建立其结构图。

      2020年版本的 AlphaFold 是该软件的第二版。Jumper 说,它还赢得了2018年的CASP,但其早期的努力大多不够好,无法替代实验确定的结构。然而,AlphaFold2 的预测结果平均来说与经验结构相当。当时并不清楚 DeepMind 何时会广泛提供该软件或其预测结果,因此研究人员利用 Jumper公开演讲中的信息,以及他们自己的见解,开发了自己的人工智能工具,称为RoseTTAFold。

      然后在2021年7月15日,描述 RoseTTAFold 和 AlphaFold2 的论文出现了,以及免费提供的开源代码和专家运行自己版本的工具所需的其他信息。一周后,DeepMind 宣布它已经用 AlphaFold 预测了人类制造的几乎所有蛋白质的结构,以及其他20种被广泛研究的生物体的整个蛋白质组,如小鼠和大肠杆菌--总共有超过365,000个结构。DeepMind 还将这些数据公开发布到由位于英国欣克斯顿的EMBL欧洲生物信息学研究所 (EMBL-EBI) 维护的数据库中。这个数据库后来已经增加到了近一百万个结构。

      今年,DeepMind 计划发布总数超过1亿的预测结构。这几乎是所有已知蛋白质的一半--比蛋白质数据库 (PDB) 结构库中实验确定的蛋白质数量多出数百倍。

      AlphaFold 部署了深度学习神经网络:计算架构的灵感来自于大脑的神经线路,以辨别数据中的模式。它已经在 PDB 和其他数据库中的数十万个实验确定的蛋白质结构和序列上进行了训练。面对一个新的序列,它首先寻找数据库中的相关序列,这可以识别倾向于一起进化的氨基酸,表明它们在三维空间中很接近。现有相关蛋白质的结构提供了另一种方法来估计新序列中氨基酸对之间的距离。

      AlphaFold 在尝试对氨基酸进行三维建模时来回迭代来自这些平行轨迹的线索,并不断更新其估计值。专家们说,该软件在机器学习研究中的新思路的应用似乎是 AlphaFold 如此出色的原因--特别是它使用了一种被称为注意力的人工智能机制,以确定哪些氨基酸连接在任何时候对其任务来说是最突出的。

      该网络对相关蛋白质序列信息的依赖意味着 AlphaFold 有一些限制。它不是被设计来预测突变的影响,比如那些导致疾病的突变,对蛋白质的结构。它也没有被训练来确定蛋白质在存在其他相互作用的蛋白质或分子 (如药物) 的情况下如何改变结构。但是它的模型带有分数,可以衡量网络在预测蛋白质的每个氨基酸单元方面的信心--而且研究人员正在调整 AlphaFold 的代码以扩大其能力。

      据 DeepMind 称,到目前为止,已经有40多万人使用了 EMBL-EBI 的 AlphaFold 数据库。还有一些 AlphaFold 的超级用户:研究人员在自己的服务器上设置了该软件,或者转向基于云的 AlphaFold 版本,以预测 EMBL-EBI 数据库中没有的结构,或者为该工具设想新的用途。

      生物学家们已经对 AlphaFold 解决结构的能力印象深刻。丹麦奥胡斯大学的结构生物学家 Thomas Boesen 说:根据我到目前为止所看到的,我非常信任 AlphaFold。该软件已经成功地预测了Boesen中心已经确定但尚未公布的蛋白质的结构,他说,这对我来说是一个很大的验证。他和奥胡斯微生物生态学家 Tina Šantl-Temkiv 正在使用 AlphaFold 对促进冰的形成的细菌蛋白质的结构进行建模--这可能有助于云中冰的冷却效应--因为生物学家还不能通过实验完全确定这些结构。

      斯德哥尔摩大学的蛋白质生物信息学家 Arne Elofsson 说,只要一个蛋白质蜷缩成一个定义明确的三维结构--而不是所有的--AlphaFold 的预测就很难被打败。这是一个一键式解决方案,可能是你要得到的最好的模型。

      在 AlphaFold 不太自信的地方,它非常善于告诉你什么时候它不起作用,Elofsson 说。在这种情况下,预测的结构可能类似于漂浮的意大利面条。这通常对应于蛋白质中缺乏确定结构的区域,至少在孤立的情况下是如此。这种本质上无序的区域--约占人类蛋白质组的三分之一--可能只有在另一个分子 (如信号伙伴) 出现时才变得明确。

      伦敦癌症研究所的计算生物学家 Norman Davey 说,AlphaFold 识别无序状态的能力对他研究这些区域的特性的工作来说是一个游戏规则的改变,他说,我们的预测质量立即有了巨大的提高,而我们没有付出任何努力。

      AlphaFold 将蛋白质结构转储到 EMBL-EBI 数据库中的做法也立即被投入使用。Orengo 的团队正在搜索它,以确定新的蛋白质种类 (不需要通过实验验证) ,并且已经发现了数百个,也许是数千个潜在的新蛋白质家族,扩大了科学家对蛋白质外观和功能的认识。在另一项工作中,该团队正在搜索从海洋和废水中获取的DNA序列数据库,以尝试识别新的消化塑料的酶。研究人员利用 AlphaFold 快速估算出数千种蛋白质的结构,希望更好地了解酶如何进化以分解塑料,并如何改进它们。

      马萨诸塞州剑桥市哈佛大学的进化生物学家 Sergey Ovchinnikov 说,将任何蛋白质编码基因序列转化为可靠结构的能力应该对进化研究特别有力。研究人员通过比较基因序列来确定生物体及其基因在不同物种间的关系。对于远距离相关的基因,比较可能无法找到进化的亲属,因为序列已经发生了很大的变化。但是通过比较蛋白质结构--其变化往往没有基因序列那么快--研究人员也许能够发现被忽视的古老关系。苏黎世瑞士联邦理工学院的计算生物学家 Pedro Beltrao 说:这为研究蛋白质的进化和生命的起源提供了一个惊人的机会。

      为了测试这个想法,由首尔国立大学计算生物学家 Martin Steinegger 领导的一个团队和他的同事使用他们开发的一个工具,称为 Foldseek,在 EMBL-EBI 的 AlphaFold 数据库中寻找 SARS-CoV-2 的 RNA 复制酶的亲属。这次搜索发现了以前未被发现的可能的古代亲属,包括粘菌在内的所有真核生物的蛋白质,这些蛋白质在其三维结构上类似于被称为逆转录酶的酶,艾滋病毒等病毒利用这些酶将 RNA 复制到 DNA 中,尽管在遗传序列水平上几乎没有相似之处。

      对于想要确定一个特定蛋白质的详细结构的科学家来说,AlphaFold预测不一定是一个直接的解决方案。相反,它提供了一个初步的近似值,可以通过实验来验证或完善--它本身也有助于理解实验数据。例如,来自X射线晶体学的原始数据以X射线衍射的模式出现。通常情况下,科学家需要对蛋白质的结构有一个初步的猜测,以解释这些图案。英国剑桥大学的结构生物学家 Randy Read 说,以前,他们经常从 PDB 中的相关蛋白质中拼凑信息,或者使用实验方法,他的实验室专门研究这些方法中的一些。Read 说,现在,AlphaFold 的预测已经使这些方法对于大多数X射线模式来说变得没有必要,他的实验室正在努力在实验模型中更好地利用 AlphaFold。我们已经完全重新确定了我们的研究重点。

      他和其他研究人员已经使用 AlphaFold 从X射线数据中确定了晶体结构,而这些数据如果没有一个适当的起始模型是无法解释的。Read 实验室的前博士后 Claudia Millán Nebot 说:人们正在解决那些多年来未被解决的结构,她现在在剑桥的分析公司 SciBite 工作。她预计会有大量的新蛋白质结构提交给 PDB,这在很大程度上是 AlphaFold 的结果。

      专门从事低温电镜的实验室也是如此,低温电镜可以捕捉到闪冻蛋白质的照片。北卡罗来纳大学教堂山分校的结构生物学家和药理学家 Bryan Roth 说,在某些情况下,AlphaFold 的模型准确地预测了称为G-蛋白偶联受体(GPCRs)的蛋白质的独特特征,而其他计算工具却搞错了。他说:它似乎真的很适合生成第一个模型,然后我们用一些实验数据对其进行完善。这为我们节省了一些时间。

      但 Roth 补充说,AlphaFold 并不总是那么准确。他。


    爱游戏登录
    上一篇:NanoString技术方法
    下一篇:PCR实验室的44个风险监测点!

地址:北京市海淀区北三环西路32号恒润中心1201     电话:010-51581369/82113221    传真:     爱游戏登录入口-游戏大厅app下载    备案/许可证编号为:京ICP备14000724号-25