GROMACS凭借英特尔oneAPI开放的编程和多架构工具进行加速,并在基于英特尔Xe架构的GPU上运行,展现卓越性能。
英特尔致力于培育一个开放的生态系统,包括为许多开源项目做出技术贡献,这些项目都对现实世界产生了直接影响。GROMACS就是其中的一个例子,它是一个分子动力学软件包,用于模拟设计新药物的蛋白质、脂质和核酸。最近发布的GROMACS 2022使用SYCL和oneAPI进行开发,在多种架构上运行展现出卓越的性能,包括基于英特尔Xe架构的GPU。
英特尔并行软件工程师Roland Schulz表示:“GROMACS是世界上使用最广泛的开源分子动力学应用之一。原因很简单,借助该应用进行的模拟,能帮助我们更好地了解小到体内的蛋白质,大到宇宙星系的分子动态。值得注意的是,我们与GROMACS的合作,即使用oneAPI进行开发和优化,让英特尔参与到药物研发的重大进展中,并扩展了GROMACS跨多个计算架构的开放式开发。这一切都是在与我们非常珍视的开源社区合作时实现的。”
GROMACS的分子动力学模拟由oneAPI提供技术支持,与国际分布式计算项目Folding@home等项目一起,为确定针对乳腺癌、新型冠状肺炎、2型糖尿病等疾病关键药物的解决方案做出了贡献。在现代药物研发中,分子动力学模拟得到了广泛而成功地应用。这些模拟为研究人员提供了所需的生物大分子结构信息,以了解结构与功能关系,用于指导药物研发和设计过程。像GROMACS这样的计算工具,在药物研发方面的应用,有助于研究人员更有效地设计和评估新药的同时,节省资源。
斯德哥尔摩大学和瑞典皇家理工学院的GROMACS研发团队在生物物理学教授Erik Lindahl的带领下,引领着GROMACS分子动力学工具包的开发,这是世界上使用最广泛的高性能计算应用之一。分子动力学以计算为中心,并且频繁迭代,这让它成为最耗时的高性能计算应用之一。数十亿次的计算会涉及数百万行的代码。
oneAPI作为一种开放、统一的编程模型,用于CPU和加速器,并支持多个厂商的计算机架构,这帮助Lindahl教授和他的团队扩展了GROMACS对异构硬件的支持。这得益于使用跨架构、跨厂商的开放标准从而提高了生产力。基于这些标准,oneAPI编程简化了软件的开发流程,无需特定的编程语言或供应商,就能提供加速计算的性能,同时允许集成现有代码,包括OpenMP。
作为oneAPI优化工作的一部分,Lindahl的团队通过使用英特尔® DPC++兼容性工具(英特尔® oneAPI基础工具包的一部分),将GROMACS中只能在Nvidia硬件上运行的CUDA代码,迁移到SYCL,该工具通常能自动执行90至95%的代码迁移工作1,2。这允许其团队创建一个新的、独立可迁移的跨架构代码库。这极大简化了开发工作,并为多架构环境的部署提供灵活性。
Lindahl表示:“凭借GROMACS 2022对SYCL和oneAPI的全面支持,我们扩展了GROMACS,使其可以在新型硬件上运行。通过英特尔® DevCloud,我们已经在当前基于英特尔Xe架构的GPU,以及即将推出基于英特尔Xe架构的GPU开发平台Ponte Vecchio上,运行了生产模拟。这一阶段取得的性能结果令人印象深刻,证明了英特尔软硬件协同合作的力量。总而言之,这些优化实现了硬件的多样性,提供了高端性能,并推动了竞争和创新,让我们能更快地开展科学研究,并降低下游产业的成本。”
通过使用英特尔oneAPI跨架构工具进行优化,例如oneAPI DPC++/C++编译器、oneAPI库以及高性能计算分析和集群工具,GROMACS实现了加速计算,oneAPI工具可在英特尔® DevCloud中获取。英特尔® DevCloud是一个免费环境,可以在各种英特尔架构如CPU, GPU, FPGA上,开发和测试代码。
关于GROMACS:GROMACS是一个通用的软件包,用于对具有数百万个粒子的系统,进行基于牛顿运动方程式的分子动力学模拟。GROMACS主要用于生物化学分子,如蛋白质、脂质和核酸等,这些分子具有多种复杂的键合相互作用。由于GROMACS在计算典型的模拟应用,如计算非键合相互作用方面具有非常快的速度,因此许多科研人员将其用于非生物系统的研究,例如聚合物。
关于oneAPI:oneAPI提供一个开放、统一的跨架构编程模型,旨在简化跨多架构的开发(如CPU、GPU、FPGA和其它加速器)。oneAPI让开发者在一个开放、基于标准的编程环境中,打破基于单个厂商的封闭式编程模型的限制,为加速计算提供出色性能,并且允许代码持续迭代。
关于英特尔与Folding@home的合作:GROMACS是Folding@home分布式计算项目的基石,旨在通过模拟蛋白质的动力学,帮助科学家为各种疾病开发新的诊疗方法。进行这些具有挑战性的分子动力学模拟,需要一种称为强扩展的流程,在药物研发过程中成功地模拟原子。英特尔能通过先进的软件技术工具和代码优化支持GROMACS,进而支持Folding@home,帮助提供高效、高性能的异构编程。通过提供必要的计算能力,这最终将助力开发者和科学家完成强大的缩放。虽然该项目尚未采用GROMACS 2022,但已开始计划转换代码,为即将推出的英特尔Xe架构GPU做好跨架构的准备。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。