至顶网服务器频道 09月14日 新闻消息: 9月12日,在北京举行的2018人工智能计算大会AICC上,浪潮发布AI计算性能高达每秒2千万亿次的AI超级服务器AGX-5,这是目前全球最强大的AI计算主机之一。
浪潮AGX-5单机配置16颗目前性能最强的NVIDIA Tesla? V100 Tensor Core 32GB GPUs,会支持下一代更强大的GPU加速器,提供2 PFlops的非常强大的单机AI计算性能,与之前同类GPU服务器相比,AGX-5可支持4倍超大规模深度神经网络模型且训练速度提高10倍。浪潮AGX-5采用业界最先进的NVIDIA NVSwitch?互联结构,基于NVIDIA最新的HGX-2平台,可实现48通道、2.4TB/s的全芯片群高速互联以及512GB HBM2 全局共享超高速图形缓存,提供近乎线性的AI计算性能比。此外,浪潮AGX-5配置2颗28核心的强大CPU,提供顶级通用计算性能,6 TB持久内存可提供超大数据高速访问,采用对称式均衡设计还可支持升级双物理分区。
浪潮集团副总裁彭震表示:“人工智能是全球面临的巨大的产业机会,而如何实现更加快速高效的AI业务创新是所有智慧化企业追求的核心竞争力。浪潮创新研发设计的AGX-5 AI计算主机,可在单机内支持16颗高速NVSwitch无阻塞互联的Tesla V100 Tensor Core GPUs和新一代GPU加速器,在计算性能、芯片互联、数据吞吐等多方面实现了极大提升,由此带来AI计算能力的革命性的进步,必将为全球致力于领先AI科技的商业公司、科研创新机构提供前所未见的AI创新加速体验。”
浪潮是全球专业的AI计算力厂商,从计算平台、管理套件、框架优化、应用加速等四个层次致力于打造敏捷、高效、优化的AI基础设施。浪潮已成为百度、阿里和腾讯的最主要的AI服务器供应商,并与科大讯飞、商汤、旷视、今日头条、滴滴等人工智能领先科技公司保持在系统与应用方面的深入紧密合作,帮助AI客户在语音、图像、视频、搜索、网络等方面取得数量级的应用性能提升。据IDC《2017年中国AI基础架构市场调查报告》显示,浪潮AI服务器市场份额达57%高居第一。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。