全场景超强异构计算能力大幅降低功耗和总体拥有成本
2019年11月20日,2019国际超算大会(SC2019)在美国丹佛举行,今年SC的主题是“超算正当时”(HPC is now)。随着计算能力的提升,超算不仅是科学研究的利器,也已经深入到我们的生活当中。从宇宙探索、气象预报到精准医疗、自动驾驶,超算的身影随处可见,影响力不断提升,新一轮变革正在发生。面向E级超算和人工智能两大前沿方向,业界专家、学者及厂商纷纷展示了最新超算应用成果。
浪潮商用机器应邀亮相本次大会(展位号:#1553),发布了全自研的首款超强异构计算服务器FP5468G2,以全场景超强异构计算能力支持AI云平台建设、深度学习训练和推理等应用。
浪潮商用机器FP5468G2超强异构计算服务器,针对异构计算复杂而多样化的应用需求和大数据、人工智能等新兴应用场景,以其超强的异构计算能力,适用于互联网AI公有云、企业级AI云平台建设、深度学习训练和推理等应用业务需求。
计算性能大幅提升。FP5468G2拥有超强计算能力,支持8块V100或者16块T4 GPU,提供全场景超强异构计算能力;支持2颗POWER9 Sforza处理器,具有多达44个核心、176线程超强调度能力,针对特定深度学习模型调优,性能相较同等、x86平台可提升多达20%,并全面兼容FPGA/AISC,提供特定应用加速。
超高计算密度,大幅节省TCO。FP5468G2相比普通2U服务器,计算密度提升1倍,在支持相同数量GPU条件下,相较低密度GPU服务器集群,空间可节省一半,电力节省23%,实测算力提升8%,而价格降低34%,500台规模集群可节省采购成本过亿元。以某互联网客户1年需求400台GPU服务器(根据算力需求,按照单机支持16块T4推算)为例,假设工业用电计1元/kW·h,3年节省电费可达1261.5万元。
此外,FP5468G2还具有灵活的异构拓扑配置,支持balance、common、cascade三种拓扑,可根据应用场景/训练模型,进行灵活拓扑切换;FP5468G2还支持高效大容量本地存储和高速IO拓展,最大支持24块3.5英寸大容量硬盘,其中6个硬盘槽位可支持U.2 NVMe SSD,提供高效的数据读取和落盘速度。后置支持4个标准PCIe x16插槽,可支持4个100Gb可远程直接内存访问(RDMA)高速网络。
在经历了“数字化、互联网化、移动互联网化”的洗礼之后,“人工智能化”的海量计算需求、算法迭代让传统的通用CPU“难堪重任”,异构计算成为支撑先进和更复杂AIoT应用的必然选择。全新POWER9处理器在性能和稳定性持续提升之外,也在积极拥抱异构计算,支持NVLink 2.0、CAPI 2.0和New CAPI等。面向加速器件、异构综合器件开放,大幅提升加速效率,深度学习框架性能超x86近4倍。基于此,浪潮商用机器也在不断丰富完善在HPC/AI领域的产品组合
中国异构计算的黄金时代也已临近。据统计,中国异构计算服务器市场2019年市场规模预计达到18.5亿美元,同比增长25.6%,预计到2023年将达到44.5亿美元。目前市场上,GPU加速计算服务器市场销售额在异构计算服务器市场整体销售额的占比达到98%以上,而8卡和16卡的机型在中国GPU加速计算服务器市场规模最大且增长率较高。浪潮商用机器此次推出的FP5468G2正是瞄准的这一细分市场的服务器机型,为市场提供更多选择。
而从行业分布来看,8卡/16卡GPU加速服务器广泛应用于互联网、政府和教育等行业。浪潮商用机器FP5468G2通过支持高效大容量本地存储和全场景超强异构计算能力,满足互联网行业用户行为分析、精准营销等需求,满足政府行业智慧交通、车辆识别等需求,满足金融行业智能客服、风险评估、智能投顾等应用需求。
作为业界领先的服务器提供商,浪潮商用机器通过创新的产品、应用和服务延伸了HPC和AI应用融合的边界。未来,浪潮商用机器将继续以独特的技术优势和JDM模式为依托,在软硬件和生态系统上继续创新,满足企业不断发展变化的高性能计算的需求。
好文章,需要你的鼓励
Warp成立于2021年,致力于通过技术赋能的物流网络优化企业供应链。该公司现计划使用机器人自动化其仓储网络,进一步提升供应链效率。公司在洛杉矶测试仓库安装摄像头,利用计算机视觉技术创建数字孪生环境进行实验。经过测试,Warp成功部署改装后的现成机器人处理货物装卸和存储。公司刚完成1000万美元A轮融资,计划今年开始在核心网络城市部署机器人技术。
德州农工大学等多所知名高校联合Meta公司推出的SAFEFLOW框架,为AI智能体首次提供完整安全保障体系。该系统通过信息流控制、事务日志和动态信任评估,解决了当前AI助手易受欺骗、缺乏协调的关键问题,在专门构建的测试平台上实现了接近完美的安全表现。
Continuity Software研究发现,企业存储和数据保护设备在信息安全方面存在严重盲点,使公司数据面临危险暴露。调查涵盖300个环境中超过1万台设备,发现平均每台设备存在10个漏洞,其中一半为高风险。最常见漏洞涉及身份认证管理和未修复的CVE。许多设备仍使用出厂默认密码,缺乏多因素认证。研究还发现勒索软件防护功能未启用或配置错误的情况。
这项由加州大学圣克鲁兹分校和eBay联合完成的研究首次揭示了先进AI模型的"睁眼瞎"问题:它们虽然具备强大的感知和推理能力,却无法识别表面合理实际有缺陷的指令。研究发现,即使是最先进的AI系统,在面对物体缺失、指代模糊、事实矛盾和目标不可行等隐性问题时,正确识别率不到40%。更令人意外的是,这些AI系统其实内心已经察觉到问题,但因过度训练的服从性而不敢表达。当被允许提出澄清性问题时,它们的表现瞬间飙升至94%以上,表明简单的交互设计改进就能大幅提升AI系统的可靠性。