无限的可能性 NVIDIA生成式AI模型加速合成蛋白质原创

作者：李祥敬

近日，初创企业Evozyne使用NVIDIA提供的预训练AI模型，创造了两种在医疗和清洁能源领域具有重大潜力的蛋白质。其中一种蛋白质用于治疗一种先天性疾病，另一种用于消耗二氧化碳以减少全球变暖。

过去两年，机器学习彻底改变了蛋白质结构预测。而现在，人工智能又在蛋白质设计领域引发了新一轮革命。

自从AI问世以来，众多科学家们就加入了利用它来进行蛋白质研究的赛道。生物学家发现，使用机器学习，可以在几秒钟内创建出蛋白质分子。而在以前，这个时间也许是几个月。

无限的可能性 NVIDIA生成式AI模型加速合成蛋白质

这样科学家使用NVIDIA BioNeMo创建出能够生成高质量蛋白质的大型语言模型，以此加快药物研发并助力创造更具可持续性的环境。

加速药物研发的新方法

Evozyne联合创始人、论文共同作者Andrew Ferguson表示： “令人欣喜的是，这个AI模型第一轮产出的合成蛋白质就像自然生成的蛋白质一样，表示该模型已经学会了自然界的设计规则。”

Evozyne使用了NVIDIA的ProtT5。ProtT5是一个Transformer模型，是用于创建医疗AI模型的软件框架和服务——NVIDIA BioNeMo的一部分。

分子工程师Ferguson的研究领域涵盖化学和机器学习领域，他表示：“BioNeMo非常强大，让我们能够训练模型，然后以非常低的成本使用该模型来运行工作任务，在几秒钟内就能生成数百万个序列。该模型预测了如何组装出能够满足Evozyne需求的新蛋白质。”

该模型是Evovyne ProT-VAE流程的核心。Evozyne的ProT-VAE流程将NVIDIA BioNeMo中强大的Transformer模型与变分自编码器（VAE）相结合。

他表示：“几年前，还没有人注意到可以使用大型语言模型与变分自编码器相结合的方式来设计蛋白质。”

相比之下，Evozyne的方法只通过一轮，就能改变一个蛋白质中半数乃至以上的氨基酸。这相当于进行了数百次的突变。

Evozyne数据科学家Joshua Moller表示： “他们通过将工作扩展到多个GPU来加快训练速度。

这将训练大型 AI 模型的时间从几个月缩短到一个星期。Ferguson表示：“所以我们能够训练出原本不可能训练出的模型，比如一些有数十亿可训练参数的模型。”

革命性的AI模型

传统的蛋白质工程设计方法，即定向进化，采用的是一种缓慢、无计划的方法，通常一次只改变几个氨基酸的序列。而机器学习有助于研究海量可能的氨基酸组合，然后有效地识别最有用的序列。

BioNeMo是一款基于NVIDIA NeMo Megatron构建的AI赋能药物研发云服务和框架，用于在超级计算规模下训练和部署大型生物分子Transformer AI模型。服务包括预训练LLM、对蛋白质、DNA、RNA和化学的通用文件格式的原生支持，还提供可供SMILES（用于分子结构）和FASTA（用于氨基酸和核苷酸序列）使用的数据加载器。

借助BioNeMo，科学家可以开始为UniRef50和ZINC数据库轻松使用预训练模型、自动下载器和预处理器。借助无监督式结构化学习者，各种模型、嵌入和输出得以结合，将多模态数据组合在一起。无监督式预训练还消除了对已标记数据的需求，从而快速生成已学习的嵌入，预测蛋白质结构、功能、细胞位置、水溶性、膜结合性、保存区域和可变区域等。

其中，MegaMolBART是一种使用14亿个分子（SMILES字符串）进行训练的生成化学模型，可用于多种化学信息学应用。而且BioNeMo提供了ProtT5和ESM1-85M等基于 Transformer 的蛋白质语言模型。

BioNeMo还提供OpenFold，这是一种用于预测新型蛋白质序列 3D 结构的深度学习模型。

NVIDIA的Transformer模型会读取数百万种蛋白质中的氨基酸序列。该模型运用神经网络用来理解文本的技术，学会了大自然如何构建蛋白质氨基酸序列。

展望未来，使用AI加速蛋白质工程的前景十分广阔。人工设计出来的蛋白质相对于自然界中原本就存在的蛋白质而言，更加稳定，在没有能量或高温等极端情况下，也能实现它的某项功能。

此外，也可以用人工智能来设计氨基酸序列，使其与主干相符，用于改善酶、抗体等特定蛋白的稳定性。人工智能技术对于不同大小、不同构象的蛋白质设计起到了非常重要的作用，未来还可帮助设计更多、更有用的蛋白质，包括可用于减少污染、改善环境的新的生物材料。

来源：至顶网计算频道

0赞

好文章，需要你的鼓励

无限的可能性 NVIDIA生成式AI模型加速合成蛋白质 原创

来源：至顶网计算频道

2023

01/13

13:27

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

Commvault赋能医疗和生命科学领域领导者保护关键数据

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

思科在Cisco Live阿姆斯特丹大会上展示简洁、安全和AI就绪的创新技术

区分“模型”和“应用”是对AI最大的误解

终端侧AI，如何从DeepSeek的连锁反应中受益？

Gartner发布2025年及未来中国企业实现AI价值的重要预测

NVIDIA Blackwell 现已在云端全面可用

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

无限的可能性 NVIDIA生成式AI模型加速合成蛋白质原创

打造Token极致性价比新华三震撼亮相2026世界人工智能大会