至顶网服务器频道 05月11日 新闻消息: 5月9-11日,2017 GPU技术大会(GTC17)将在美国圣何塞举行。本届大会设置深度学习与人工智能、自动驾驶与无人车、VR与AR、计算机与机器视觉等12大核心议题,开设654场小型研讨会,有799位嘉宾将分享他们在GPU各个应用领域的心得与经验。

大会现场
据悉GTC17大会期间,浪潮将联合NVIDIA发布最新一代强大的的AI超级计算机,并将是本届大会在人工智能领域最具看点的新品之一。同时,作为铂金赞助商,浪潮还将现场展示SR-AI整机柜、NX5460M4、NF5280M5等多款面向人工智能应用的服务器,以及AI Station深度学习管理系统、T-Eye训练调优工具和并行深度学习框架Caffe-MPI等融工具、管理与框架于一体的强大AI软件平台。

浪潮为GTC17的铂金赞助商
GPU密度最高的SR-AI整机柜
浪潮在4月26日的IPF2017上与百度联合发布的SR-AI整机柜,是目前业界集成度最高的GPU Box。该产品是全球首个采用PCIe Fabric互联架构设计的AI方案,通过PCI-E交换机和I/O BOX两个模块的配合,GPU和CPU物理解耦池化,二者灵活配置,可实现支持16个GPU的超大扩展性节点,最大支持64块GPU,比一般的GPU服务器方案性能提高5-10倍,可支持千亿样本、万亿参数级别的模型训练。

在IPF2017上发布的SR-AI整机柜服务器
企业级AI刀片服务器NX5460M4
NX5460M4是一款面向企业级AI设计的GPU刀片节点,单节点可支持2块GPU卡,单系统可根据实际需求部署8-24个节点,具备极高的可扩展性并支持多种外形、散热和电源设计方案,单一I/O通道交换速率高达100Gbps,而集中管理和无电缆设计则可以有效降低OPEX(运营成本)。

在IPF2017上发布的SR-AI整机柜服务器
通用高扩展性AI服务器NF5280M5
NF5280M5是浪潮新一代旗舰双路服务器,将支持2U4卡的GPU异构方案,采用新一代CPU平台,性能提升得到大幅提升。同时,NF5280M5拥有目前业界最高的可扩展性设计,可支持24块2.5"硬盘和24条DDR4内存,并凭借优化的散热系统和模块化设计,在有限的空间内展现了高效可靠、智能高扩展特性。
提供更高效生产力的AI平台软件
AI Station是浪潮自主研发的人工智能深度学习管理系统,面向深度学习训练集群,可以支持多种深度学习框架,能够快速部署深度学习训练环境,全面管理深度学习训练任务,为深度学习用户提供高效易用的平台。
T-eye是浪潮自主研发的应用特征分析软件,主要用于分析AI应用程序在GPU集群上运行时对硬件及系统资源占用的情况,反映出应用程序的运行特征、热点及瓶颈,从而帮助用户对应用程序算法作出针对性的调整优化。
Caffe-MPI是浪潮开发的全球首款高性能MPI集群版的Caffe深度学习计算框架,在伯克利caffe架构的基础上,采用MPI技术对Caffe予以数据并行的优化,实现了多机多卡的并行计算,可部署到大规模训练平台上完成对大规模数据样本的训练。新版本的Caffe-MPI充分发挥了Nvidia最新的CUDNN性能并实现高性能扩展。

GPU17大会现场
此外,在大会期间,浪潮集团副总裁胡雷钧将做"浪潮AI端到端解决方案"的主题报告,并举行"SR-AI整机柜在深度学习上的应用与示范"、"浪潮Caffe-MPI的优化"等现场报告。
好文章,需要你的鼓励
这份由MIT NANDA项目团队完成的研究报告揭示了企业AI应用的真实现状。报告基于对52家企业的深度访谈、300多个公开AI项目的分析以及153位高管的问卷反馈,发现尽管企业在生成式AI上投入了300-400亿美元,但95%的组织没有看到任何投资回报。只有5%的企业成功跨越了"GenAI鸿沟",创造了实际价值。
这项研究开发了CaptionQA系统,通过测试AI生成的图片描述能否支持实际任务来评估其真正价值。研究发现即使最先进的AI模型在图片描述实用性方面也存在显著不足,描述质量比直接看图时下降9%-40%。研究涵盖自然、文档、电商、机器人四个领域,为AI技术的实用性评估提供了新标准。
以色列理工学院研究团队提出了一种将专家混合模型融入YOLOv9目标检测的创新方法。该方法让多个专门化的YOLOv9-T专家分工协作,通过智能路由器动态选择最适合的专家处理不同类型图像。实验显示,在COCO数据集上平均精度提升超过10%,在VisDrone数据集上提升近30%,证明了"分工合作"比单一模型更有效,为AI视觉系统提供了新思路。