凭借200petaflops的峰值性能,美国能源部的Summit超级计算机稳居全球TOP500超级计算机第一的位置。今天美国能源部透露计划打造一套新的系统,其计算能力是Summit系统的7倍。
美国能源部已经将这个项目价值6亿美元的合同授予了超级计算机厂商Cray以及芯片制造商AMD,预计两家厂商将在2021年完成该项目的建设。
这套代号“Frontier”的超级计算最高速度将超过1.5exaflops,相当于每秒150万亿次计算操作,包含100多个服务器机柜,预计占用两个篮球场大的面积。该系统将采用基于Cray最新的Shasta架构,配备由Cray设计的服务器。
Frontier机柜内的计算节点全部采用AMD芯片,每个服务器将以4:1的比例配置Radeon Instinct GPU和Epyc CPU,也就是1个处理器搭配4个GPU。
AMD并不是为Frontier提供任何现成的芯片,相反,AMD称CPU和GPU都是为美国能源部的计算要求量身定制的。这些芯片采用与AMD商用产品不同的架构,软件也是专门针对Frontier开发的。
美国能源部决定选择AMD而不是英特尔完成该项目着实令人感到意外。Moor Insights&Strategy总裁兼首席分析师Patrick Moorhead表示:“AMD芯片被位列全球第一的超级计算机采用已经是很多年前的事情了,还得追溯到Opteron时代”,也就是AMD在2003年推出的处理器系列。
美国能源部为这套未来全球最快的超级计算选用AMD芯片,可以说对AMD一次宝贵的信任投票,特别是考虑到英特尔也参与了美国政府对百亿亿次超级计算机的推进计划中。
Moorhead补充说:“我认为美国能源部之所以选择AMD是出于三个原因:CPU的性能和GPU的性能,通过Infinity Fabric和半定制芯片实现的CPU和GPU综合平台的性能,”后者主要是通过微软与索尼的合作得到了验证:索尼在最新的视频游戏机中采用了AMD的定制芯片。
基于AMD芯片的Frontier超级计算机将服务美国能源部的橡树岭国家实验室,当前最快的超级计算机Summit正是在该实验室运行的。参与该计划的科学家们将利用这一平台执行从医学研究制造相关的各项任务。
橡树岭国家实验室的工作人员已经开始为现有Summit硬件之上的系统开发科研应用, 为此,AMD和Cray也在为Frontier开发一套定制的软件工具,包括主流机器学习工具的优化版本。
好文章,需要你的鼓励
这项研究介绍了Ankh3,一种创新的蛋白质语言模型,通过多任务预训练策略显著提升了模型性能。研究者采用两种互补任务:多掩码概率的掩码语言建模和蛋白质序列补全,使模型仅从蛋白质序列就能学到更丰富的表示。实验表明,Ankh3在二级结构预测、荧光预测等下游任务中表现优异,尤其在模型未曾训练过的任务上展现出强大泛化能力,为蛋白质设计和分析开辟了新路径。
法国波尔多大学研究团队开发了一个突破性框架,用于神经退行性痴呆症的差异化诊断。该框架将3D脑部MRI转换为文本报告,并利用强化学习优化的大语言模型进行详细诊断推理。不同于传统"黑箱"方法,这一系统能生成透明、有因果关系的解释,同时保持高诊断准确率。研究显示,通过群组相对策略优化(GRPO)训练的轻量级模型能展现复杂推理行为,包括假设检验和非线性思考,提供与临床决策流程一致的排序诊断结果。
这项研究提出了CLUE框架,首次能够生成自然语言解释来揭示AI事实核查系统不确定性的来源。与现有方法不同,CLUE能识别文本片段间的冲突与一致关系,并解释它们如何影响模型的预测不确定性。实验表明,CLUE生成的解释在三种语言模型和两个事实核查数据集上都更忠实于模型不确定性,用户评价其更有帮助、信息更丰富、冗余更少且逻辑更一致。CLUE不需要微调或架构更改,适用于任何白盒语言模型,为事实核查提供了实用支持。
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。