至顶网服务器频道 06月20日 新闻消息:在法兰克福举行的国际超算大会ISC17上,浪潮发布了新型AI加速计算产品GX4,实现CPU与GPU、Xeon Phi以及FPGA等协处理加速资源解耦并可随需扩展计算性能,为多样化的AI应用提供极具弹性的加速计算支撑。这是浪潮在AI计算方面继上月在美国GTC 2017发布超高密度AI超算AGX-2后又一重要创新产品。
AI加速计算产品GX4发布现场
GX4率先实现了协处理器与CPU计算资源的解耦和重构,可支持GPU、Xeon Phi和FPGA等不同架构的协处理器,满足AI云、深度学习模型训练和线上推理等各种AI应用场景对计算架构性能、功耗的不同需求。更重要的是,GX4通过标准机架服务器链接协处理器计算扩展模块的形式完成计算性能扩展,消除了需要改变系统和主板设计才能调整计算拓扑的弊端,4这种独立的加速计算模块设计极大提升了系统部署弹性,既能轻松实现2到16卡的高扩展性,也能通过改变服务器与扩展模块的链接方式实现快速灵活的拓扑转换,,使计算架构与上层应用更匹配,发挥出AI计算集群的最大性能。
GX4产品图片
GX4突破了常规AI计算设备的8卡扩展限制,实现了更高的单机计算性能。每个GX4可在2U空间内支持4块加速卡,而单台服务器最高可扩展链接4台GX4从而实现单机16卡的加速计算池。
浪潮集团海外事业部副总经理Jay Zhang
浪潮集团海外事业部副总经理Jay Zhang表示,GX4充分考虑了AI深度学习训练样本量的显著差异,以灵活的扩展形式敏捷支持不同级别的AI模型训练,有效降低了能耗与延迟,将为全球从事人工智能研究的商业公司与研究机构提供一种灵活创新的AI计算解决方案。
目前,浪潮正在全力推动智慧计算业务的开展,该项业务被浪潮视为未来最核心的业务之一,包含了云计算、大数据与深度学习。值得关注的是,浪潮已成为中国AI领域最大的计算平台供应商,其AI解决方案在中国占有率达到60%,其中在BAT的AI解决方案占有率已达到80%,在科大讯飞、Face++等智能语音、智能图像领域也已实现广泛应用。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。