10月22日,AI基准性能评测平台MLPerf官网显示,宁畅信息产业(北京)有限公司(以下简称“宁畅”)搭载NVIDIA T4_/A100 GPU卡的Nettrix X640 G30 AI服务器,在ResNet、BERT、DLRM等基准测试中取得30项世界第一成绩。
据报道,MLPerf是用于衡量AI、边缘计算等设备性能的基准测试平台,由云服务厂商、OEM厂商、大学、软件公司等超14个组织、50余家知名IT企业共同驱动。该基准测试包括可代表生产级别的测试用例,测试结果在行业内具有较高权威性。
同配置测试获16项世界第一
宁畅工程师介绍,参加MLPerf Inference(推理)基准测试的X640 G30 AI服务器,最高可支持10张NVIDIA A100 PCIe卡或21张NVIDIA T4 PCIe卡,堪称“性能猛兽”。
图说:宁畅人工智能服务器X640 G30
对比行业同配置AI服务器,X640 G30搭载四张A100 GPU卡的情况下,在Resnet50、SSD、RNN-T、BERT、DLRM等10项测试中分数值取得世界第一;搭载16张T4 GPU卡配置的情况下,X640 G30打破六项世界纪录,性能一骑绝尘。
图说:16卡配置X640 G30部分测试分数对比图
相同配置下取得第一的MLPerf分数,意味着X640 G30 在图像分类、目标检测、医学影像、翻译、推荐、自然语言处理等AI应用场景中有更好性能表现,可为用户带来多高价值。
将多卡性能发挥到极致
AI服务器所能支持异构计算GPU卡数量,是决定其AI吞吐量的首要因素。依托团队10余年行业经验,宁畅率先在4U标准机箱中实现21张GPU卡配置,将多GPU卡性能优势发挥到极致。
搭配21张T4 GPU卡的X640 G30,在图像分类、语义识别等众多AI基准测试中,超越搭配20张T4 GPU卡配置的服务器,测试分数斩获14项世界第一。
图说:21卡配置X640 G30 MLPerf测试成绩表
不仅多GPU卡的性能优越,在单GPU卡平均性能方面(单卡平均性能=整机测试结果/搭载GPU卡个数),横向比较13家服务器厂商提交MLPerf 的53个配置测试结果显示,X640 G30服务器平均单卡性能获得11项第一。
图说:X640 G30平均单卡测试分数对比
宁畅工程师表示,宁畅服务器不仅在MLPerf平台取得多项世界第一成绩,今年早先时候宁畅双路服务器R620 G30,曾在反映服务器性能的SPEC CPU2017测试中,刷新24项世界纪录。
世界纪录的背后,是宁畅工程师为用户提供更优性价比产品,将CPU、GPU等服务器核心部件性能发挥到极致,所做的不懈努力。通过提供硬件、软件等定制化服务,宁畅服务器将有效降低用户TCO(总体拥有成本)。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
上海交通大学研究团队发布了突破性的科学推理数据集MegaScience,包含125万高质量实例,首次从12000本大学教科书中大规模提取科学推理训练数据。该数据集显著提升了AI模型在物理、化学、生物等七个学科的推理能力,训练的模型在多项基准测试中超越官方版本,且具有更高的训练效率。研究团队完全开源了数据集、处理流程和评估系统。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。