GROMACS凭借英特尔oneAPI开放的编程和多架构工具进行加速,并在基于英特尔Xe架构的GPU上运行,展现卓越性能。
英特尔致力于培育一个开放的生态系统,包括为许多开源项目做出技术贡献,这些项目都对现实世界产生了直接影响。GROMACS就是其中的一个例子,它是一个分子动力学软件包,用于模拟设计新药物的蛋白质、脂质和核酸。最近发布的GROMACS 2022使用SYCL和oneAPI进行开发,在多种架构上运行展现出卓越的性能,包括基于英特尔Xe架构的GPU。
英特尔并行软件工程师Roland Schulz表示:“GROMACS是世界上使用最广泛的开源分子动力学应用之一。原因很简单,借助该应用进行的模拟,能帮助我们更好地了解小到体内的蛋白质,大到宇宙星系的分子动态。值得注意的是,我们与GROMACS的合作,即使用oneAPI进行开发和优化,让英特尔参与到药物研发的重大进展中,并扩展了GROMACS跨多个计算架构的开放式开发。这一切都是在与我们非常珍视的开源社区合作时实现的。”
GROMACS的分子动力学模拟由oneAPI提供技术支持,与国际分布式计算项目Folding@home等项目一起,为确定针对乳腺癌、新型冠状肺炎、2型糖尿病等疾病关键药物的解决方案做出了贡献。在现代药物研发中,分子动力学模拟得到了广泛而成功地应用。这些模拟为研究人员提供了所需的生物大分子结构信息,以了解结构与功能关系,用于指导药物研发和设计过程。像GROMACS这样的计算工具,在药物研发方面的应用,有助于研究人员更有效地设计和评估新药的同时,节省资源。
斯德哥尔摩大学和瑞典皇家理工学院的GROMACS研发团队在生物物理学教授Erik Lindahl的带领下,引领着GROMACS分子动力学工具包的开发,这是世界上使用最广泛的高性能计算应用之一。分子动力学以计算为中心,并且频繁迭代,这让它成为最耗时的高性能计算应用之一。数十亿次的计算会涉及数百万行的代码。
oneAPI作为一种开放、统一的编程模型,用于CPU和加速器,并支持多个厂商的计算机架构,这帮助Lindahl教授和他的团队扩展了GROMACS对异构硬件的支持。这得益于使用跨架构、跨厂商的开放标准从而提高了生产力。基于这些标准,oneAPI编程简化了软件的开发流程,无需特定的编程语言或供应商,就能提供加速计算的性能,同时允许集成现有代码,包括OpenMP。
作为oneAPI优化工作的一部分,Lindahl的团队通过使用英特尔® DPC++兼容性工具(英特尔® oneAPI基础工具包的一部分),将GROMACS中只能在Nvidia硬件上运行的CUDA代码,迁移到SYCL,该工具通常能自动执行90至95%的代码迁移工作1,2。这允许其团队创建一个新的、独立可迁移的跨架构代码库。这极大简化了开发工作,并为多架构环境的部署提供灵活性。
Lindahl表示:“凭借GROMACS 2022对SYCL和oneAPI的全面支持,我们扩展了GROMACS,使其可以在新型硬件上运行。通过英特尔® DevCloud,我们已经在当前基于英特尔Xe架构的GPU,以及即将推出基于英特尔Xe架构的GPU开发平台Ponte Vecchio上,运行了生产模拟。这一阶段取得的性能结果令人印象深刻,证明了英特尔软硬件协同合作的力量。总而言之,这些优化实现了硬件的多样性,提供了高端性能,并推动了竞争和创新,让我们能更快地开展科学研究,并降低下游产业的成本。”
通过使用英特尔oneAPI跨架构工具进行优化,例如oneAPI DPC++/C++编译器、oneAPI库以及高性能计算分析和集群工具,GROMACS实现了加速计算,oneAPI工具可在英特尔® DevCloud中获取。英特尔® DevCloud是一个免费环境,可以在各种英特尔架构如CPU, GPU, FPGA上,开发和测试代码。
关于GROMACS:GROMACS是一个通用的软件包,用于对具有数百万个粒子的系统,进行基于牛顿运动方程式的分子动力学模拟。GROMACS主要用于生物化学分子,如蛋白质、脂质和核酸等,这些分子具有多种复杂的键合相互作用。由于GROMACS在计算典型的模拟应用,如计算非键合相互作用方面具有非常快的速度,因此许多科研人员将其用于非生物系统的研究,例如聚合物。
关于oneAPI:oneAPI提供一个开放、统一的跨架构编程模型,旨在简化跨多架构的开发(如CPU、GPU、FPGA和其它加速器)。oneAPI让开发者在一个开放、基于标准的编程环境中,打破基于单个厂商的封闭式编程模型的限制,为加速计算提供出色性能,并且允许代码持续迭代。
关于英特尔与Folding@home的合作:GROMACS是Folding@home分布式计算项目的基石,旨在通过模拟蛋白质的动力学,帮助科学家为各种疾病开发新的诊疗方法。进行这些具有挑战性的分子动力学模拟,需要一种称为强扩展的流程,在药物研发过程中成功地模拟原子。英特尔能通过先进的软件技术工具和代码优化支持GROMACS,进而支持Folding@home,帮助提供高效、高性能的异构编程。通过提供必要的计算能力,这最终将助力开发者和科学家完成强大的缩放。虽然该项目尚未采用GROMACS 2022,但已开始计划转换代码,为即将推出的英特尔Xe架构GPU做好跨架构的准备。
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。