至顶网服务器频道 06月20日 新闻消息:在法兰克福举行的国际超算大会ISC17上,浪潮发布了新型AI加速计算产品GX4,实现CPU与GPU、Xeon Phi以及FPGA等协处理加速资源解耦并可随需扩展计算性能,为多样化的AI应用提供极具弹性的加速计算支撑。这是浪潮在AI计算方面继上月在美国GTC 2017发布超高密度AI超算AGX-2后又一重要创新产品。
AI加速计算产品GX4发布现场
GX4率先实现了协处理器与CPU计算资源的解耦和重构,可支持GPU、Xeon Phi和FPGA等不同架构的协处理器,满足AI云、深度学习模型训练和线上推理等各种AI应用场景对计算架构性能、功耗的不同需求。更重要的是,GX4通过标准机架服务器链接协处理器计算扩展模块的形式完成计算性能扩展,消除了需要改变系统和主板设计才能调整计算拓扑的弊端,4这种独立的加速计算模块设计极大提升了系统部署弹性,既能轻松实现2到16卡的高扩展性,也能通过改变服务器与扩展模块的链接方式实现快速灵活的拓扑转换,,使计算架构与上层应用更匹配,发挥出AI计算集群的最大性能。
GX4产品图片
GX4突破了常规AI计算设备的8卡扩展限制,实现了更高的单机计算性能。每个GX4可在2U空间内支持4块加速卡,而单台服务器最高可扩展链接4台GX4从而实现单机16卡的加速计算池。
浪潮集团海外事业部副总经理Jay Zhang
浪潮集团海外事业部副总经理Jay Zhang表示,GX4充分考虑了AI深度学习训练样本量的显著差异,以灵活的扩展形式敏捷支持不同级别的AI模型训练,有效降低了能耗与延迟,将为全球从事人工智能研究的商业公司与研究机构提供一种灵活创新的AI计算解决方案。
目前,浪潮正在全力推动智慧计算业务的开展,该项业务被浪潮视为未来最核心的业务之一,包含了云计算、大数据与深度学习。值得关注的是,浪潮已成为中国AI领域最大的计算平台供应商,其AI解决方案在中国占有率达到60%,其中在BAT的AI解决方案占有率已达到80%,在科大讯飞、Face++等智能语音、智能图像领域也已实现广泛应用。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。