英国“深度思维”公司今年8月曾宣布,其开发的人工智能(AI)程序“阿尔法折叠”已预测出约100万个物种的超过2亿种蛋白质的结构,涵盖科学界已编录的几乎每一种。现在,元宇宙平台公司(Meta)研究人员利用人工智能ESMFold预测了来自细菌、病毒和其他尚未被表征微生物的6亿多种蛋白质的结构。相关研究已经提交生物预印本网站。
在最新研究中,Meta AI蛋白质团队使用“大型语言模型”预测了这些蛋白质的结构。要构建能通过几个字母或单词预测文本的工具,离不开大型语言模型的基础。语言模型通常需要大量文本进行训练,为将其应用于蛋白质,研究团队用已知的蛋白质序列训练它们,这些已知蛋白质可由20个不同氨基酸组成的链来表达,每个氨基酸由一个字母表示。然后,ESMFold学会了用模糊的氨基酸比例“自动完成”蛋白质。
团队负责人亚历山大·里维斯表示,这些训练让ESMFold对包含蛋白质形状信息的蛋白质序列有了直观了解。而且,与“阿尔法折叠”一样,这一网络能将这些了解到的信息与已知蛋白质结构和序列之间关系的信息结合,生成预测结构。
随后,他们在一个数据库上运用这一模型,该数据库由来自土壤、海水、人类肠道、皮肤和其他微生物栖息地的“宏基因组”DNA组成,其中绝大多数DNA条目编码潜在蛋白质,来自从未被培养过也不为人所知的生物体。总体而言,ESMFold预测了超6.17亿种蛋白质的结构,且只花了两周时间。而“阿尔法折叠”预测一种结构可能需要几分钟。
团队指出,ESMFold虽然不像“阿尔法折叠”那么准确,但在预测结构方面的速度要快60倍,这意味着他们可将结构预测扩展到更大的数据库。
里维斯表示:“这些来自土壤、海水和人体的微生物分子是我们了解最少的结构,最新研究有助于我们更进一步洞悉生物学。”
总编辑圈点:
人们形容蛋白质时,常说它乃生命之基石。但蛋白质的意义其实与其结构密切相关,因此如果能更深入的了解其结构,就可以更好地明确其工作原理,从而加速几乎所有生物学领域的研究,譬如为疾病设计新的疗法或疫苗。这也是目前多家团队致力于预测蛋白质结构的主要目的。现在,这一预测已涵盖了整个蛋白质世界,包括动物、植物、细菌、真菌和其他生物体的预测结构,可以预见,这些成果除了帮助攻克生命科学瓶颈外,也将在解决可持续性、粮食安全等重要问题上开辟新机。(科技日报记者 刘霞)
英国深度思维公司今年8月曾宣布,其开发的人工智能(AI)程序阿尔法折叠已预测出约100万个物种的超过2亿种蛋白质的结构,涵盖科学界已编录的
英国深度思维公司今年8月曾宣布,其开发的人工智能(AI)程序阿尔法折叠已预测出约100万个物种的超过2亿种蛋白质的结构,涵盖科学界已编录的
近日,欧洲科研团队成功开发出一种观察偶极量子气体中涡旋的新方法,并在奥地利因斯布鲁克大学首次进行了实验验证。相关成果发表在近日的《
澳大利亚科学家绘制出世界首张能显示从出生前到成年后不同时期人脑细胞基因活动变化的图谱。通过这张脑细胞发育图,科学家能更准确地识别神
英国莱斯大学和美国普林斯顿大学科学家借助金纳米颗粒,仅需一个步骤,就将石化炼油厂产生的臭气熏天的副产品硫化氢转化成了氢气。新工艺效
衰老涉及复杂又多样的特征,例如炎症、压力、新陈代谢变化等等。现在,由美国索尔克生物研究所和加州大学圣地亚哥分校的科学家组成的团队揭
根据发表在《美国国家科学院院刊》上的一项研究,美国西北大学医学研究人员使用独特的高通量方法,解决了具有挑战性的蛋白质设计难题。这种
美国西奈山伊坎医学院研究人员对大脑中的数千个位点进行了编目,在这些位点中,RNA在整个人类生命周期中被修饰,这个过程被称为腺苷到肌苷(
据杜克—新加坡国立大学医学院科学家领导的一项新研究,新冠mRNA疫苗和灭活疫苗诱导的T细胞反应的总规模是相似的,然而,灭活疫苗使免疫系
据中国载人航天工程办公室消息,空间站梦天实验舱发射入轨后,于北京时间2022年11月1日4时27分,成功对接于天和核心舱前向端口,整个交会对
旗袍,中国和世界华人女性的传统服装,被誉为中国国粹和女性国服。虽然其定义和产生的时间至今还存有诸多争议,但它仍然是中国悠久服饰文化
7月21日,北京市政府发布《北京市电影局关于在疫情防控常态化条件下有序推进电影院恢复开放的通知》,宣布全市低风险地区影院,可于7月24日
武汉7·16渡江节组委会14日发布公告,由于长江武汉关水位超警戒水位,按照规定取消2020年第46届武汉7·16渡江节。受近期持续强降雨影响,
过去一段时间,国家级非遗项目灰塑传承人邵成村,多次在陈家祠等工作现场,向身边那些带着好奇目光的人们讲解灰塑的种种技术细节:草根灰、
7月13日,位于璧山区南门唐城夜市街区的璧山冷酒夜市开街。这是璧山区打造夜间经济消费载体、培育夜间经济活动品牌的举措之一。璧山市民一