El Capitan 超级计算机由 HPE 制造,使用 AMD Instinct MI300A 加速处理单元(APU)。El Capitan在最新 Top500 榜单上的高性能 Linpack(HPL)分数为 1.742 exaflops。
劳伦斯利弗莫尔国家实验室将这台超级计算机用于核安全方面的应用。El Capitan 是美国国家核安全局(NNSA)的第一台超级(每秒一百亿亿次浮点运算级)计算机,将用于推动科学发现和国家安全,提供 AMD 所称的“必要计算能力,在无需进行试验的情况下确保国家核威慑力量的安全、安保和可靠性”。
El Capitan的建模和模拟能力将用于支持美国国家核安全局的库存管理计划,该计划负责认证老化的核库存以及其他关键的核安全任务,例如防扩散和反恐。
LLNL 高级模拟与计算项目主任 Rob Neely 表示,“El Capitan 对国家核安全局的核心任务至关重要,显著增强了我们执行大型高保真三维模拟的能力,解决核心任务所面临的复杂科学挑战。”
LLNL以及洛斯阿拉莫斯和桑迪亚国家实验室的其他NNSA也在也在使用 El Capitan 及其配套系统 Tuolumne,推动人工智能和机器学习辅助数据分析。El Capitan 可以应用于各种高能量密度问题,例如惯性约束聚变研究,而 Tuolumne 则将可以用于一些非保密的开放科学应用,包括气候建模、生物安全/药物发现和地震建模等应用。
LLNL首席技术官 Bronis R de Supinski 表示,“人工智能现在在我们领域日益普及,El Capitan 使我们能够将人工智能与我们传统的模拟和建模工作负载整合在一起,为各科学学科的探索开辟新的途径。”
AMD表示,AMD Instinct MI300X和MI325X加速器可提供人工智能性能和内存功能,而AMD Instinct MI300A APU则是将中央处理器(CPU)和图形处理器(GPU)内核以及堆叠内存整合到一个单一封装中,可以为高性能计算和人工智能工作负载实现“新的效率和性能水平”。
AMD的EPYC处理器和Instinct加速器也被用于推动许多新的超级计算和人工智能项目和部署,包括意大利能源公司 Eni,Eni 的 HPC 6超级计算机采用了AMD EPYC处理器和AMD Instinct GPU。德国帕德博恩大学也将收到一台采用最新第五代 AMD EPYC 技术的新型超级计算机。
另据悉,IBM 和 AMD 宣布了一项合作,将在 IBM 云上部署 AMD Instinct MI300X 加速器即服务。这项新服务将于2025年上半年推出,目标是提升生成式人工智能模型的性能和能效。通过这项合作,IBM 的 Watsonx AI 和数据平台以及 Red Hat Enterprise Linux AI 推理平台将提供对 AMD Instinct MI300X 加速器的支持。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。