至顶网服务器频道 05月11日 新闻消息(文/刘新萍): 美国时间5月10日, 浪潮携手NVIDIA在GTC大会期间发布了加速人工智能计算的超高密度服务器AGX-2,它将是全球首款在2U空间内高速互联集成8颗最高性能GPU加速器的服务器,将全面加速人工智能和科学工程计算等领域的研究应用效率。
AGX-2在2U空间内支持部署8块NVLink或PCI-E 接口的NVIDIA? Tesla? P100 GPU,并在业界率先支持NVLink 2.0和最新发布的NVIDIA? Tesla?V100, GPU间互联带宽高达150GB/s. AGX-2具备良好的I/O扩展能力,提供8块NVMe/SAS/SATA热插拔硬盘,可支持最多4块100Gbps的EDR InfiniBand接口卡的高速集群互联;AGX-2不仅支持通常的风冷散热方式,还可支持片上水冷以提供更高的计算能效比。

浪潮AGX-2超高密度AI超级计算机
与浪潮支持2U4卡的NF5288M4对比测试,AGX-2采用P100的Linpack浮点运算性能达29.33TFLOPS,是同样采用P100 NF5288M4的2.47倍;在AI深度学习模型训练上,当采用TensorFlow框架和GoogLeNet模型,AGX-2处理速度为每秒1165幅图片,是搭配4片Tesla? M40的NF5288M4性能的2.49倍。
浪潮集团副总裁胡雷钧表示,NVIDIA是目前全球人工智能加速计算的领导者,浪潮此次携手NVDIA发布AGX-2,大幅提升了GPU计算密度,是浪潮在人工智能计算服务器上的成功创新,希望为全球客户提供更高效的计算力资源。

浪潮集团副总裁胡雷钧
NVIDIA解决方案工程架构副总裁Marc Hamilton表示:"浪潮拥有多年的深度学习计算系统的研发与实践经验,与NVIDIA有着长期合作。此次发布超高密度服务器AGX-2,应用到全球性能最强大的NVIDIA Tesla P100 GPU和NVLink高速互联技术,将在性能和能耗等方面,全面提升人工智能和科学工程计算等领域的研究应用效率,为中外企业提供更卓越领先的高性能计算能力。"

NVIDIA解决方案工程架构副总裁Marc Hamilton
深度学习是浪潮"智慧计算"最重要的业务之一,浪潮通过打造多样化的创新硬件平台、管理调度与分析平台和深度学习框架的"平台组合",实现前端承接多源数据、后端支撑智能应用,致力于为人工智能提供领先计算力,促进技术普惠。目前,浪潮已为百度、阿里巴巴、腾讯等全球领先的人工智能与云计算公司提供完整的计算平台产品,并正在通过创新设计为美国公司提供领先的计算设备。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。