达拉斯—SC18—2018年11月12日—NVIDIA是全球超算领域最大的动力,这一点在今日新发布的全球最快超算TOP500排行榜中得到了印证。
这一备受关注的榜单在SC18年度高性能计算大会开幕之初发布,榜单显示采用NVIDIA GPU加速器的系统数量在一年内增长了48%。总数由一年前的86个增加至127个,是五年前的三倍。
此外,全球最快的两台超级计算机——美国能源部橡树岭国家实验室的Summit,以及劳伦斯利弗莫尔国家实验室的Sierra,也都采用了NVIDIA GPU作为其算力核心。这两大系统共计采用了超过40000个NVIDIA V100 Tensor Core GPU,助力全球领先的研究人员开展开创性的研究,SC18大会期间,获本年度戈登贝尔奖决赛的六项研究中,有五个项目都得益于这两大系统。
NVIDIA GPU也为欧洲和日本最快的超级计算机提供了加速支持。
同样于今日发布的Green 500榜单是针对全球最快系统的能效测试榜,榜单显示前25个“最环保”系统中有22个都是由NVIDIA有力支持的。
这一最新榜单标志着超算领域又一里程碑——首次,近半的算力(每秒1417 千万亿次浮点计算中的702千万亿次)都来自于加速系统。而在10年前,还不曾有过加速系统出现在这一榜单上。
NVIDIA创始人兼首席执行官黄仁勋表示:“这是NVIDIA在超算领域取得突破性进展的一年。随着摩尔定律的终结,新的人工智能和机器学习工作负载推动了全新HPC市场的出现。这些都前所未有地有赖于我们高性能、高效率的GPU平台在解决最具挑战性的科学和社会难题时提供的算力需求。”
最新榜单显示,在TOP500榜单中,首次上榜的153个系统中有52个(约三分之一)为GPU加速的,而一年前该榜单中新的GPU加速系统只有33个。
今年的新系统中包括排在第61位的NVIDIA DGX-2 POD。作为首款上榜的DGX-2集群,它结合了36个DGX-2系统,可提供超过每秒3千万亿次浮点计算的双精度性能。根据此结果,仅需一个由11个该系统构成的集群就能在Top500榜单中取得一席之地。
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。