达拉斯—SC18—2018年11月12日—NVIDIA是全球超算领域最大的动力,这一点在今日新发布的全球最快超算TOP500排行榜中得到了印证。
这一备受关注的榜单在SC18年度高性能计算大会开幕之初发布,榜单显示采用NVIDIA GPU加速器的系统数量在一年内增长了48%。总数由一年前的86个增加至127个,是五年前的三倍。
此外,全球最快的两台超级计算机——美国能源部橡树岭国家实验室的Summit,以及劳伦斯利弗莫尔国家实验室的Sierra,也都采用了NVIDIA GPU作为其算力核心。这两大系统共计采用了超过40000个NVIDIA V100 Tensor Core GPU,助力全球领先的研究人员开展开创性的研究,SC18大会期间,获本年度戈登贝尔奖决赛的六项研究中,有五个项目都得益于这两大系统。
NVIDIA GPU也为欧洲和日本最快的超级计算机提供了加速支持。
同样于今日发布的Green 500榜单是针对全球最快系统的能效测试榜,榜单显示前25个“最环保”系统中有22个都是由NVIDIA有力支持的。
这一最新榜单标志着超算领域又一里程碑——首次,近半的算力(每秒1417 千万亿次浮点计算中的702千万亿次)都来自于加速系统。而在10年前,还不曾有过加速系统出现在这一榜单上。
NVIDIA创始人兼首席执行官黄仁勋表示:“这是NVIDIA在超算领域取得突破性进展的一年。随着摩尔定律的终结,新的人工智能和机器学习工作负载推动了全新HPC市场的出现。这些都前所未有地有赖于我们高性能、高效率的GPU平台在解决最具挑战性的科学和社会难题时提供的算力需求。”
最新榜单显示,在TOP500榜单中,首次上榜的153个系统中有52个(约三分之一)为GPU加速的,而一年前该榜单中新的GPU加速系统只有33个。
今年的新系统中包括排在第61位的NVIDIA DGX-2 POD。作为首款上榜的DGX-2集群,它结合了36个DGX-2系统,可提供超过每秒3千万亿次浮点计算的双精度性能。根据此结果,仅需一个由11个该系统构成的集群就能在Top500榜单中取得一席之地。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。