ChatGPT火出圈已是不争的事实,其代表的生成式AI和大型语言模型正在给各行各业带来前所未有的变革,其中生命科学研发便是典型。
NVIDIA医疗业务副总裁Kimberly Powell表示,生成式AI的革命性力量为生命科学和制药行业开辟了巨大的前景。全球医疗企业正在与NVIDIA一起推动AI加速的解决方案,实现从医疗影像中及早发现疾病、为治疗团队提供关键洞察并彻底改变药物研发流程。
人工智能和生物技术的研究正处于黄金时期。2021年AI发现了蛋白质结构,2022年AI生成了蛋白质结构,由此AIGC入选了《Science》2022年度科学十大突破。
在GTC 2023上,NVIDIA推出一整套用于自定义AI基础模型的生成式AI云服务。这些服务将加速新蛋白质和治疗方法的创建以及基因组学、化学、生物学和分子动力学等领域的研究。
作为NVIDIA AI Foundations的一部分,用于AI模型训练和推理的全新BioNeMo云服务产品能够加速药物研发过程中最耗时、费用最高的阶段。研究人员能够依靠它在自己的专有数据上对生成式AI应用进行微调,并可以直接通过网络浏览器或者全新云应用编程接口(API)运行AI模型推理,并轻松集成到现有应用中。
Kimberly Powell说,NVIDIA与生命科学和制药行业的先锋企业长期合作,推动了BioNeMo云服务的发展。这项服务现在已经被当作一个AI药物研发实验室,它可提供预训练模型,并使用专有数据自定义服务于药物研发流程各阶段的模型。这能够帮助研究人员识别正确的靶向目标、设计分子和蛋白质并预测它们在人体内的相互作用,从而研发出最佳的候选药物。
BioNeMo云服务更新带来更多价值
BioNeMo云服务包含预训练的AI模型,以帮助研究人员建立AI药物研发流程。该服务已被包括Evozyne和Insilico Medicine在内的药物研发企业用于支持数据驱动的新候选治疗药物的设计。
生成式AI模型能够快速识别潜在的药物分子,在某些情况下可从零开始设计出化合物或基于蛋白质的治疗药物。这些模型在小分子、蛋白质、DNA和RNA序列的大型数据集上进行训练后,可以预测蛋白质的3D结构和分子与目标蛋白质对接的程度。
除了之前公布的MegaMolBART生成式化学模型、ESM1nv蛋白质语言模型和OpenFold蛋白质结构预测模型之外,BioNeMo现在又加入了6个经过优化的全新开源模型,包括:
AlphaFold2:DeepMind开发的一个深度学习模型,其能够将确定蛋白质结构所需的时间从几年缩短到几分钟甚至几秒,仅需要使用蛋白质的氨基酸序列。该模型已经被100多万研究人员使用。
DiffDock:为了帮助研究人员了解药物分子如何与目标蛋白结合,该模型以高精度和高计算效率预测小分子的3D方位和锚定反应。
ESMFold:这个蛋白质结构预测模型使用Meta AI的ESM2蛋白质语言模型,可以基于单个氨基酸序列来预测蛋白质的3D结构,而不需要类似序列的样本。
ESM2:该蛋白质语言模型用于推理蛋白质的机器表示,对蛋白质结构预测、属性预测和分子对接等下游任务很有用处。
MoFlow:用于分子优化和小分子生成,这个生成化学模型重新创建分子,提出潜在治疗药物的各种化学结构。
ProtGPT-2:这个语言模型生成新的蛋白质序列,帮助研究人员设计具有独特结构、属性和功能的蛋白质。
BioNeMo服务使用户可以通过一个浏览器界面轻松访问这些生成式AI模型,进行互动推理并实现蛋白质结构的可视化。研究人员将BioNeMo与NVIDIA DGX Cloud上的超级计算资源组合后,就可以在使用NVIDIA Base Command平台和NVIDIA AI Enterprise软件套件的全托管软件服务上自定义他们的模型。
利用BioNeMo优化AI工作流程
制药公司和药物研发初创企业正在使用BioNeMo并且多次取得显著的成果。
日本最大的商业财团之一三井物产株式会社正在与NVIDIA合作开展“Tokyo-1”项目。Tokyo-1用户可以通过NVIDIA BioNeMo药物研发软件和服务,利用大型语言模型来处理化学、蛋白质、DNA和RNA数据格式。
世界领先的生物技术公司安进(Amgen)已经在使用BioNeMo服务推进其研发工作。安进使用其专有的抗体专利数据对BioNeMo的ESM模型架构进行了预训练和微调,使他们能够探索和研发出新一代药物中的治疗性蛋白质来帮助治疗患者。
芝加哥生物技术公司兼NVIDIA初创加速计划成员Evozyne的研究人员与NVIDIA联合开发了一个基于BioNeMo的深度学习模型——Protein Transformer Variational AutoEncoder。这个生成式AI模型在Evozyne专有的蛋白质数据上进行了微调,研究人员用它可设计出性能明显高于自然界中的酶的合成变体。
NVIDIA初创加速计划高级成员Insilico Medicine正在使用BioNeMo加速早期药物研发流程。该流程在过去需要花费四年多的时间,成本约5亿美元。Insilico使用了端到端的生成式AI,只用了三分之一的时间和十分之一的成本就能识别出一种临床前候选药物。该药物预计很快将进入二期患者临床试验阶段。
德勤公司正在将BioNeMo上的AI模型ESM和OpenFold用于其AI药物研发平台的3D蛋白质结构预测、模型等级分类和可靶向区域预测。
NVIDIA初创加速计划成员Innophore在其产品Cavitomix中使用了BioNeMo,使用户能够分析任何输入结构中的蛋白空穴。基于PyTorch的AI模型OpenFold在BioNeMo上实现了6倍加速,能够瞬间对线性氨基酸进行三维蛋白质结构预测。
大量的新技术正在与数字医疗整合,提升效率、甚至带来全新的产品。生成式模型是当前AI发展的最前沿课题,被认为可能带来“AI新纪元”。
对于科学家和生物技术公司来说,生成式人工智能工具有很大潜力,在生物医学的各个领域将大显身手。
携手打造医疗设备AI平台
Kimberly Powell表示,AI是一个强大的工具,可以提高全球卫生系统速度、效率和有效性。为了改善临床决策、降低医疗变数和提高治疗效果,NVIDIA正在与美敦力合作,通过软件定义业务模式来加速AI创新。
两家公司将把NVIDIA的医疗和边缘AI技术集成至美敦力GI Genius智能内窥镜模块中,该模块由Cosmo Pharmaceuticals开发和生产。GI Genius是首个通过FDA认证的AI辅助结肠镜检查工具,可帮助内科医生检测可能会发展成结肠直肠癌的息肉。
GI Genius内置一套AI算法并集成了NVIDIA Clara医疗平台,这使美敦力能够加速实时医疗程序算法的开发,从而加速AI创新,改善患者护理。
NVIDIA Clara是一套驱动AI医疗解决方案的软件和服务,它正在为整个医疗行业的转型提供支持。Clara系统包括用于药物研发的BioNeMo、用于医疗设备的Holoscan、用于基因组学的Parabricks以及用于医学影像的MONAI。
美敦力计划将用于医疗设备的实时AI计算软件平台NVIDIA Holoscan和工业级边缘AI硬件平台NVIDIA IGX整合到一起并与其GI Genius AI辅助结肠镜检查系统一起运行,为医生提供AI增强的诊断图像。Holoscan通过在边缘提供可扩展、软件定义的流媒体数据处理所需的全栈式基础设施,助力将新的AI应用引入临床环境。
凭借NVIDIA Holoscan和IGX平台,开发者能够在Cosmo创新中心内高效训练和验证AI模型,然后将AI赋能的应用托管于美敦力的软件即医疗设备(SaMD)应用市场——GI Genius AI Access平台上,使软件定义医疗设备成为了可能。
随着AI在医疗领域的应用和影响力日益广泛,医疗研究人员和企业最近使用NVIDIA Clara取得了一些里程碑式的成果,包括使用BioNeMo生成两种新型蛋白质的蓝图、使用Holoscan进行开创性的手术以及在放射科部署MONAI驱动的解决方案。
结语
随着人工智能医疗市场的不断发展,热度不断提升。AI在医疗中的应用越来越广泛,越发多的企业进入该行业进行布局。NVIDIA也不例外,其持续加大对医疗的布局,让AI加速落地。
好文章,需要你的鼓励
Captions公司研究团队开发的Mirage模型实现了从音频直接生成说话视频的突破。该技术能准确生成与声音匹配的面部表情、唇型同步、手势动作和环境背景,甚至可仅从音频推测说话者外貌特征。基于统一的Diffusion Transformer架构,Mirage避免了传统方法的复杂专用模块设计,展现出卓越的情感表达和细节还原能力,为内容创作、教育培训和无障碍技术等领域开辟了新的应用可能。
牛津大学研究发现,尽管大语言模型在医学考试中表现出色,但在实际应用中效果大打折扣。研究显示,LLM直接测试时能94.9%准确识别病症,但人类使用LLM诊断时准确率仅34.5%,甚至低于不使用AI的对照组。问题源于用户提供信息不完整、LLM理解偏差等人机交互问题。专家指出,仅凭非交互式基准测试评估LLM存在误导性,需要真实的人机交互测试才能准确评估AI系统的实际性能。
NAVER和KAIST研究团队发现,先进AI模型在数学题自我修正方面存在严重缺陷。他们创建的MMRefine基准测试揭示,即使是GPT-4O等顶级模型也只能成功修正约23%的错误答案,而且经常将正确答案改错。研究发现不同模型在处理六种错误类型时表现差异巨大,特别是小型模型在空间推理修正上竟然超越了大型模型,颠覆了"越大越好"的认知。