凭借200petaflops的峰值性能,美国能源部的Summit超级计算机稳居全球TOP500超级计算机第一的位置。今天美国能源部透露计划打造一套新的系统,其计算能力是Summit系统的7倍。
美国能源部已经将这个项目价值6亿美元的合同授予了超级计算机厂商Cray以及芯片制造商AMD,预计两家厂商将在2021年完成该项目的建设。
这套代号“Frontier”的超级计算最高速度将超过1.5exaflops,相当于每秒150万亿次计算操作,包含100多个服务器机柜,预计占用两个篮球场大的面积。该系统将采用基于Cray最新的Shasta架构,配备由Cray设计的服务器。
Frontier机柜内的计算节点全部采用AMD芯片,每个服务器将以4:1的比例配置Radeon Instinct GPU和Epyc CPU,也就是1个处理器搭配4个GPU。
AMD并不是为Frontier提供任何现成的芯片,相反,AMD称CPU和GPU都是为美国能源部的计算要求量身定制的。这些芯片采用与AMD商用产品不同的架构,软件也是专门针对Frontier开发的。
美国能源部决定选择AMD而不是英特尔完成该项目着实令人感到意外。Moor Insights&Strategy总裁兼首席分析师Patrick Moorhead表示:“AMD芯片被位列全球第一的超级计算机采用已经是很多年前的事情了,还得追溯到Opteron时代”,也就是AMD在2003年推出的处理器系列。
美国能源部为这套未来全球最快的超级计算选用AMD芯片,可以说对AMD一次宝贵的信任投票,特别是考虑到英特尔也参与了美国政府对百亿亿次超级计算机的推进计划中。
Moorhead补充说:“我认为美国能源部之所以选择AMD是出于三个原因:CPU的性能和GPU的性能,通过Infinity Fabric和半定制芯片实现的CPU和GPU综合平台的性能,”后者主要是通过微软与索尼的合作得到了验证:索尼在最新的视频游戏机中采用了AMD的定制芯片。
基于AMD芯片的Frontier超级计算机将服务美国能源部的橡树岭国家实验室,当前最快的超级计算机Summit正是在该实验室运行的。参与该计划的科学家们将利用这一平台执行从医学研究制造相关的各项任务。
橡树岭国家实验室的工作人员已经开始为现有Summit硬件之上的系统开发科研应用, 为此,AMD和Cray也在为Frontier开发一套定制的软件工具,包括主流机器学习工具的优化版本。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。