美国将为全球研究人员提供16台超级计算机用于找出与新型冠状病毒有关的疗法和疫苗。超级计算机可以处理庞大的数据集,能够比其他硬件系统更快地对分子行为进行复杂的模拟,因此美国此举有望加强抗击新冠病毒的能力。今天美国白宫科学技术政策办公室今天宣布了这个消息,并成立COVID-19 High Performance Computing Consortium联盟,联盟成员将使用这16台超级计算机,其中包括了目前全球性能最高的Summit系统。
该联盟成员包括美国能源部的几个国家实验室,例如劳伦斯·利弗莫尔(Lawrence Livermore)国家实验室、桑迪亚(Sandia)国家实验室和橡树岭(Oak Ridge)国家实验室,以及麻省理工学院和伦斯勒理工学院、美国国家航空航天局和美国国家科学基金会。此外,Google Cloud、AWS和微软也是联盟成员,将提供基于云的服务以加速研究工作。
来自学术界、政府和企业界的研究人员可以通过网站向该联盟提交建议,高性能计算、生物学和其他领域的专家将对这些内容进行审核,并从中选择出最价值的建议。曾创建了多个超级计算机系统的IBM,将负责该联盟的协调工作。
美国首席技术官Michael Kratsios在宣布该联盟成立的声明中表示:“美国正在集中力量对抗COVID-19,这意味着我们将释放全球一流超级计算机的全部能力,以迅速推进治疗和疫苗的科学研究。”
高性能:这16台超级计算机的综合处理能力高达330 petaflops,也就是每秒执行3.3亿亿次计算,其中仅Summit就能交付200 petaflops。这相当于地球上所有人全天每秒不停歇地计算大约305天。这16台计算机总共拥有775000个CPU,34000个GPU。
背景:已经有迹象表明,这些超级计算机可以变成抗击COVID-19的重要工具。在有关该联盟的博客文章中,IBM研究总监Dario Gil提到了橡树岭国家实验室和美国田纳西大学的团队已经在使用Summit开展研究工作了。他们使用Summit筛选了8000种化合物,并鉴定出77种有希望的化合物,可能与冠状病毒的“尖峰”蛋白结合,从而阻碍感染宿主细胞的能力。
计算也在以其他方式加紧应对。一些研究人员通过众包计算能力试图更好地了解蛋白质的动力学,那些利用人工智能和其他方法抗击病毒的研究人员,将可以使用来自29000份研究论文的数据集。IBM发起的一项全球编码挑战中就包括了抗击COVID-19,亚马逊表示将投资2000万美元以帮助加速检测新冠病毒。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。