引言:NVIDIA将通过《NVIDIA 加速计算,百万倍加速行业应用》系列文章,为您详解NVIDIA如何通过数据中心规模的全栈加速计算,助力包括多个行业实现百万倍计算性能飞跃,高效解决人类挑战。
在日前举办的全球顶级超算大会SC22上,有着HPC领域诺贝尔奖之称的戈登贝尔奖揭晓,来自NVIDIA与芝加哥大学等机构的研究员凭借共同开发的一个处理基因组规模数据的先进模型,获得旨在表彰基于高性能计算的COVID-19研究的“戈登贝尔特别奖”。
身为加速计算先驱的NVIDIA何以在医疗方面取得如此瞩目的成就?凭借全球领先的AI计算平台和对多个行业的深耕打造的AI全栈解决方案,在过去的几年,NVIDIA对包括医疗健康在内的多个行业的AI应用带来了百万倍的加速。
过去十年,全球迎来一场AI革命,人工智能在各行各业引发了颠覆性的变革。在机器学习、深度学习、大规模语言模型等AI能力的加持下,药物研发等领域正迎来百万倍的效率飞跃。而这一切的背后,离不开加速计算。
加速计算引领行业新方向
半个多世纪前,尚在仙童半导体公司任职的戈登·摩尔预测,硅基芯片中的晶体管数量每18-24个月左右会实现翻番,性能因此获得成倍提升,成本则成倍下降。之后数十年间,这一预测成为推动半导体产业发展的准则。时至今日,硅基半导体接近尺寸维度的物理极限,继续研发先进制程工艺的成本不断递增,曾被奉为圭臬的摩尔定律正走向消亡。
另一方面,AI在加速计算的推动下飞速发展。据《经济学人》统计,仅仅从2012年到2018年,用于训练大型模型的计算能力就增长了30万倍,并且约每三个半月翻一番。
作为加速计算的主导者,NVIDIA 的GPU是掀起这场行业变革浪潮不可或缺的重要推力。AI应用的工作负载以重复密集型计算为主,而GPU擅长并行计算,可以让AI计算的速度获得几何倍数的提升。NVIDIA不断针对AI场景优化产品,让以GPU为核心的“全栈加速计算”成为AI计算不可或缺的一部分。加速计算与机器学习相结合,在全球包括药物研发在内的科学计算相关的多个行业掀起一场百万倍加速的革命,并超越摩尔定律成为半导体行业新的风向标。
三大驱动力助推百万性能飞跃
今年 GTC大会上,NVIDIA创始人兼CEO黄仁勋在主题演讲中指出,过去十年中,NVIDIA加速计算在 AI 领域中实现了百万倍的加速,并引发现代 AI 革命。未来十年,将力争在再实现百万倍的提速,以应对药物研发等人类面临的重大挑战。
利用 AI 的大规模加速计算可实现指数级加速
过去的十年,在计算能力的构建,和对应用程序的计算性能的提升上,发生了跨越式发展。
首先,加速计算和异构计算已经成为业界共识,围绕着GPU芯片,NVIDIA建立了丰富的加速计算软件生态;第二,数据中心,因其具有强大的扩展能力,能够支撑起超大规模的计算任务,成为新的计算单元;第三,也是最具变革性的驱动力是 AI的广泛应用,将很多科学计算过程,用神经网络进行模拟代替,从而进一步简化计算,提高速度。
加速计算、数据中心大规模扩展,和 AI 的结合正在推动科学计算和工业计算的高速发展,实现百万倍的性能飞跃,从而解决 气候变化、药物研发、数字孪生,等等以往最具计算挑战的问题。
目前,NVIDIA已建立了一个从计算架构、硬件、算法和软件以及应用框架多角度协同,并且覆盖CPU 、GPU 、DPU三芯的全栈数据中心级加速计算平台,这种全栈式加速计算技术能力,使得NVIDIA成为全球“加速计算专家”。
NVIDIA 的 CUDA 库和 NVIDIA SDK 是加速计算的核心,伴随着每一个新的 SDK,新的科学领域、新的应用和行业都可以利用到 NVIDIA 强大的计算能力,这些 SDK 解决了计算、算法和科学交叉领域中极其复杂的问题,NVIDIA 的全栈方法产生的复合效应,实现了百万倍的加速。NVIDIA SDK 现已服务于医疗健康、能源、交通、零售、金融、媒体和娱乐等多个行业,并且每年都保持着高速的更新和扩展。通过在全栈和数据中心级实现加速,多个行业将在AI 的推动下受益并实现百万倍飞跃。
NVIDIA加速药物研发突破瓶颈
得益于NVIDIA数据中心级全栈加速计算能力和人工智能技术的进步,药物研发领域也将迎来效率升级。
研发时间一直是药物研发领域的一大痛点。一款新药从研发到上市,平均需要10年之久。对药企而言,缩短新药研发的时间就意味着更早获得回报;而对于一些身患重症甚至绝症的病人来说,新药更早问世,则意味着他们有更大的机会重获新生。
为助力药物研发领域加快速度,NVIDIA专门打造了一套名为NVIDIA Clara Discovery的AI加速计算软件平台。该解决方案集GPU加速及优化框架、工具、应用和预训练模型于一体,整合了人工智能、数据分析、模拟仿真和可视化能力,可支持化学信息学研究、蛋白质结构预测、候选药物虚拟筛选以及分子动力学模拟等药物开发过程中的跨学科工作流程。通过加速计算,研究人员可以一次模拟数以百万的分子,同时筛选出数百种潜在药物,从而降低成本、提高效率。
此外, NVIDIA 推出的基因测序分析加速软件 NVIDIA Clara Parabricks可以大幅提升基因组学分析的速度和准确性,大型语言模型(LLM)框架NVIDIA BioNeMo则可用于训练和部署超算规模的大型生物分子语言模型,帮助科学家更好地了解疾病,并为患者找到治疗方法。
全球医药企业研发效率实现指数级提升
在NVIDIA针对医疗行业的全栈加速计算平台的赋能下,来自全球的药物研发企业,正在跨越曾经的计算鸿沟,实现研发效率的指数级提升:
凭借数据中心级别的全栈能力,NVIDIA针对医疗健康领域也拥有丰富的的全栈加速计算方案,除了Clara Discovery,NVIDIA还有针对医疗设备、医学影像、基因组学和患者看护需求的Clara Holoscan、Clara Parabricks以及Clara Guardian等针对不同医疗应用场景的解决方案。
从传统医药巨头到初创企业,越来越多的全球医疗企业选择NVIDIA加速计算平台来提升AI生产力,降低研发成本。Million-X百万倍计算性能飞跃的愿景,已经在医疗健康以及更多关乎人类未来褔祉的领域落地生根。未来,只要人类探索科技,发现未知的脚步还在继续,加速计算的梦想就永远不会停息。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。