IBM技术和NVIDIA技术共同助力识别可引导研究人员开发出有效治疗方案的化合物
作者:IBM认知系统事业部技术计算副总裁DaveTurek
数十年来,技术一直是科学进步的核心所在。就在16年前,IBM的Blue Gene超级计算机作为首个突破千万亿次级计算的超级计算机闪亮登场,并在人类基因组测序中持续发挥关键作用。该突破为新药和新疗法的研发打开了大门,并且,Blue Gene通过持续模拟人类大脑皮层的约1%,大约包含16亿个神经元和大约9万亿个突触连接,使人们对人脑这一有史以来最复杂的计算机有了更深入的了解。
但是,在面对某些问题时,我们往往需要作出更即时的响应。正因如此,美国能源部宣布在对抗COVID-19传染病的战役中引入一个强大的新助手—IBM推出的Summit超级计算机。据美国疾病控制与预防中心(CDC)最新摘要所述,COVID-19传染病已经蔓延至84个国家以及除南极洲以外的每一个大洲。
病毒对细胞的感染方式为:首先与细胞结合,然后通过“刺突(spike)”将自身遗传物质注入宿主细胞。在试图了解诸如病毒之类的新型生物化合物时,实验室的研究人员往往会培养微生物、并观察微生物在现实中如何对新引入的新型化合物作出反应。但是,如果不借助计算机数字模拟缩小潜在变量范围,该过程可能会特别漫长。即使是使用了计算机数字模拟,某些挑战依然存在,比如,计算机模拟可以检查不同的变量如何对不同的病毒作出反应,但是当这些变量中的每一个单个变量都包含数百万乃至数十亿个独一无二的数据段、从而需要运行多次模拟时,标准硬件就难以承载这样巨大的工作量,从而变成一个极度耗时的时间密集型过程。
而使用Summit之后,研究人员仅在数日之内便能够模拟8000种化合物,通过将这些化合物与病毒刺突结合、对可能影响感染过程的因素进行建模,已能识别出77种小分子化合物,例如药物和天然化合物。这些小分子化合物经证明有可能削弱COVID-19与宿主细胞对接并感染宿主细胞的能力。
“我们需要通过Summit来迅速获得我们所需的模拟结果,这会花费我们一两天的时间。然而,使用普通计算机则可能花费数月时间,”兼具多重身份(田纳西大学理事会主席、田纳西大学/美国橡树岭国家实验室分子生物物理学中心主任以及该项研究的主要研究人员)的Jeremy Smith说,“得出模拟结果并不意味着我们已经找到治疗COVID-19的方法。但是,我们非常希望我们的计算结果能够为将来的研究提供参考,并为实验人员提供一个框架,用于进一步研究该等化合物。只有到那时,我们才能知晓该等化合物是否真正具有减轻COVID-19所需的特性。”
Summit为研究人员带来了海量数据处理能力。它由4608个IBM Power Systems AC922服务器节点组成,而每个节点又配备两个IBM POWER 9 CPU和六个NVIDIA Tensor core V100 GPU。在该等配置支持下,Summit的峰值性能达到每秒20万兆次浮点运算,在功能上甚至比一百万台高端笔记本电脑还要强大。自2018年作为世界上功能最强大的超级计算机首次亮相以来,Summit不断地通过支持开创性研究来巩固自己的头衔,该等研究包括:了解宇宙起源、了解鸦片类药物危机以及探索人类成功登陆火星的方式。Summit及劳伦斯利物莫国家实验室的同类型超级计算机Sierra由IBM在同一时间交付,此举堪称无与伦比。这映证了IBM员工和我们的合作伙伴在提供开创性技术以增进人类福祉方面付出的心血和汗水。我们深切期盼Summit在此次最新的疫情对抗中能继续发挥应有的力量。
好文章,需要你的鼓励
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
微软正式确认配置管理器将转为年度发布模式,并将Intune作为主要创新重点。该变化将于2026年秋季生效,在此之前还有几个版本发布。微软表示此举是为了与Windows客户端安全和稳定性节奏保持一致,优先确保安全可靠的用户体验。配置管理器将专注于安全性、稳定性和长期支持,而所有新功能创新都将在云端的Intune中进行。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。