El Capitan 超级计算机由 HPE 制造,使用 AMD Instinct MI300A 加速处理单元(APU)。El Capitan在最新 Top500 榜单上的高性能 Linpack(HPL)分数为 1.742 exaflops。
劳伦斯利弗莫尔国家实验室将这台超级计算机用于核安全方面的应用。El Capitan 是美国国家核安全局(NNSA)的第一台超级(每秒一百亿亿次浮点运算级)计算机,将用于推动科学发现和国家安全,提供 AMD 所称的“必要计算能力,在无需进行试验的情况下确保国家核威慑力量的安全、安保和可靠性”。
El Capitan的建模和模拟能力将用于支持美国国家核安全局的库存管理计划,该计划负责认证老化的核库存以及其他关键的核安全任务,例如防扩散和反恐。
LLNL 高级模拟与计算项目主任 Rob Neely 表示,“El Capitan 对国家核安全局的核心任务至关重要,显著增强了我们执行大型高保真三维模拟的能力,解决核心任务所面临的复杂科学挑战。”
LLNL以及洛斯阿拉莫斯和桑迪亚国家实验室的其他NNSA也在也在使用 El Capitan 及其配套系统 Tuolumne,推动人工智能和机器学习辅助数据分析。El Capitan 可以应用于各种高能量密度问题,例如惯性约束聚变研究,而 Tuolumne 则将可以用于一些非保密的开放科学应用,包括气候建模、生物安全/药物发现和地震建模等应用。
LLNL首席技术官 Bronis R de Supinski 表示,“人工智能现在在我们领域日益普及,El Capitan 使我们能够将人工智能与我们传统的模拟和建模工作负载整合在一起,为各科学学科的探索开辟新的途径。”
AMD表示,AMD Instinct MI300X和MI325X加速器可提供人工智能性能和内存功能,而AMD Instinct MI300A APU则是将中央处理器(CPU)和图形处理器(GPU)内核以及堆叠内存整合到一个单一封装中,可以为高性能计算和人工智能工作负载实现“新的效率和性能水平”。
AMD的EPYC处理器和Instinct加速器也被用于推动许多新的超级计算和人工智能项目和部署,包括意大利能源公司 Eni,Eni 的 HPC 6超级计算机采用了AMD EPYC处理器和AMD Instinct GPU。德国帕德博恩大学也将收到一台采用最新第五代 AMD EPYC 技术的新型超级计算机。
另据悉,IBM 和 AMD 宣布了一项合作,将在 IBM 云上部署 AMD Instinct MI300X 加速器即服务。这项新服务将于2025年上半年推出,目标是提升生成式人工智能模型的性能和能效。通过这项合作,IBM 的 Watsonx AI 和数据平台以及 Red Hat Enterprise Linux AI 推理平台将提供对 AMD Instinct MI300X 加速器的支持。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。