浪潮全新发布5款AI服务器,全面支持全新NVIDIA Ampere架构。全新服务器可支持8到16颗NVIDIA A100 Tensor Core GPU,能够提供高达每秒4亿亿次的AI计算性能, 以及高达600GB/S的GPU间P2P带宽。
5月14日,全球领先的AI计算基础架构厂商浪潮宣布全新发布5款AI服务器,全面支持全新的NVIDIA A100 Tensor Core GPU。
浪潮此次发布的5款AI服务器将应对多种人工智能计算场景,可支持8到16颗最新NVIDIA A100 Tensor Core GPU。A100 GPU中的第三代Tensor Core核心速度更快、灵活性更高,同时也更易于使用,使这些服务器的最高性能可达每秒4亿亿次,同时通过新一代NVIDIA NVSwitch技术实现GPU间P2P通信性能翻倍提升最高达600GB/S。更强计算性能与更高的GPU间互联带宽可带来更高的AI计算效率,支撑用户进行更大数据规模、更复杂模型的AI训练。此外,NVIDIA A100 GPU拥有40GB的HBM2内存,内存带宽提高70%,达到1.6TB/sec,可以承载更大的深度学习模型训练。
浪潮此次发布的5款AI服务器都将为多种应用场景提供硬件设计,包括:
浪潮还同时宣布,其领先的AI计算资源平台AIStation和自动机器学习平台AutoML Suite也将同步支持最新的A100 GPU,提供灵活的AI计算系统资源调度和强大的AI模型算法开发支持。
此外,浪潮还计划将全新EGX A100添加到其边缘服务器产品组合中,在边缘提供更强的安全性和前所未有的性能。EGX A100聚合加速器结合了Mellanox SmartNIC和由全新NVIDIA Ampere架构赋能的GPU,因此企业可以更安全地在边缘运行AI。
浪潮集团AI&HPC总经理刘军表示:“浪潮在第一时间全面推出基于NVIDIA Ampere架构的全线AI服务器产品,为全球AI客户提供专为应用场景极致创新优化设计的新一代AI计算平台,进一步增强浪潮在业界最丰富的AI服务器产品阵列,可以更好地应对当前海量数据爆发与复杂模型所带来的巨大的计算挑战。这也是业内最强大的AI算力机组,将有力地推动智算中心建设和产业AI化落地。”
NVIDIA加速计算产品管理总监Paresh Kharya表示,“NVIDIA A100 Tensor Core GPU能够为用户在AI、数据分析和HPC等各个领域都提供无与伦比的加速。以NVIDIA A100 GPU为动力的浪潮AI服务器将帮助全球用户消除计算瓶颈,显著降低成本、能耗和对数据中心的空间需求。”
浪潮是全球领先的AI服务器厂商,拥有丰富的AI产品阵列,并和AI客户紧密合作帮助在语音、语义、图像、视频、搜索等各方面取得数量级的AI应用性能提升。据IDC数据报告显示,浪潮AI服务器在中国AI基础架构设施领域已连续三年保持50%以上市场份额。
好文章,需要你的鼓励
施耐德电气以“新质服务+产业向‘新’行”为主题,第六次参会,展示全新升级的“新质服务体系”,围绕创新驱动、生态协同和行业赋能三大核心领域,以全新升级的“新质服务体系”,助力中国产业向高端化、智能化、绿色化迈进。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
甲骨文正在成为大规模基础设施供应商的可靠选择。该公司通过AI技术推动应用开发,构建GenAI模型并将智能代理集成到应用套件中。CEO萨弗拉·卡茨透露,公司剩余履约义务达4553亿美元,同比增长4.6倍,并预测OCI收入将从2026财年的180亿美元增长至2030财年的1440亿美元。甲骨文正积极布局AI推理市场,凭借其作为全球最大企业私有数据托管方的优势地位,有望在云计算领域实现重大突破。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。