全场景超强异构计算能力大幅降低功耗和总体拥有成本
2019年11月20日,2019国际超算大会(SC2019)在美国丹佛举行,今年SC的主题是“超算正当时”(HPC is now)。随着计算能力的提升,超算不仅是科学研究的利器,也已经深入到我们的生活当中。从宇宙探索、气象预报到精准医疗、自动驾驶,超算的身影随处可见,影响力不断提升,新一轮变革正在发生。面向E级超算和人工智能两大前沿方向,业界专家、学者及厂商纷纷展示了最新超算应用成果。
浪潮商用机器应邀亮相本次大会(展位号:#1553),发布了全自研的首款超强异构计算服务器FP5468G2,以全场景超强异构计算能力支持AI云平台建设、深度学习训练和推理等应用。
浪潮商用机器FP5468G2超强异构计算服务器,针对异构计算复杂而多样化的应用需求和大数据、人工智能等新兴应用场景,以其超强的异构计算能力,适用于互联网AI公有云、企业级AI云平台建设、深度学习训练和推理等应用业务需求。
计算性能大幅提升。FP5468G2拥有超强计算能力,支持8块V100或者16块T4 GPU,提供全场景超强异构计算能力;支持2颗POWER9 Sforza处理器,具有多达44个核心、176线程超强调度能力,针对特定深度学习模型调优,性能相较同等、x86平台可提升多达20%,并全面兼容FPGA/AISC,提供特定应用加速。
超高计算密度,大幅节省TCO。FP5468G2相比普通2U服务器,计算密度提升1倍,在支持相同数量GPU条件下,相较低密度GPU服务器集群,空间可节省一半,电力节省23%,实测算力提升8%,而价格降低34%,500台规模集群可节省采购成本过亿元。以某互联网客户1年需求400台GPU服务器(根据算力需求,按照单机支持16块T4推算)为例,假设工业用电计1元/kW·h,3年节省电费可达1261.5万元。
此外,FP5468G2还具有灵活的异构拓扑配置,支持balance、common、cascade三种拓扑,可根据应用场景/训练模型,进行灵活拓扑切换;FP5468G2还支持高效大容量本地存储和高速IO拓展,最大支持24块3.5英寸大容量硬盘,其中6个硬盘槽位可支持U.2 NVMe SSD,提供高效的数据读取和落盘速度。后置支持4个标准PCIe x16插槽,可支持4个100Gb可远程直接内存访问(RDMA)高速网络。
在经历了“数字化、互联网化、移动互联网化”的洗礼之后,“人工智能化”的海量计算需求、算法迭代让传统的通用CPU“难堪重任”,异构计算成为支撑先进和更复杂AIoT应用的必然选择。全新POWER9处理器在性能和稳定性持续提升之外,也在积极拥抱异构计算,支持NVLink 2.0、CAPI 2.0和New CAPI等。面向加速器件、异构综合器件开放,大幅提升加速效率,深度学习框架性能超x86近4倍。基于此,浪潮商用机器也在不断丰富完善在HPC/AI领域的产品组合
中国异构计算的黄金时代也已临近。据统计,中国异构计算服务器市场2019年市场规模预计达到18.5亿美元,同比增长25.6%,预计到2023年将达到44.5亿美元。目前市场上,GPU加速计算服务器市场销售额在异构计算服务器市场整体销售额的占比达到98%以上,而8卡和16卡的机型在中国GPU加速计算服务器市场规模最大且增长率较高。浪潮商用机器此次推出的FP5468G2正是瞄准的这一细分市场的服务器机型,为市场提供更多选择。
而从行业分布来看,8卡/16卡GPU加速服务器广泛应用于互联网、政府和教育等行业。浪潮商用机器FP5468G2通过支持高效大容量本地存储和全场景超强异构计算能力,满足互联网行业用户行为分析、精准营销等需求,满足政府行业智慧交通、车辆识别等需求,满足金融行业智能客服、风险评估、智能投顾等应用需求。
作为业界领先的服务器提供商,浪潮商用机器通过创新的产品、应用和服务延伸了HPC和AI应用融合的边界。未来,浪潮商用机器将继续以独特的技术优势和JDM模式为依托,在软硬件和生态系统上继续创新,满足企业不断发展变化的高性能计算的需求。
好文章,需要你的鼓励
超过140家金融、支付及科技公司,包括Visa、Stripe和贝莱德,联合支持推出名为Open USD(OUSD)的新稳定币,直接挑战市场领导者Tether和Circle。OUSD由独立机构Open Standard LLC运营,主打零费用、无限额铸造与赎回,且储备收益大部分归合作伙伴所有,而非由发行方独占。Mastercard、美国运通、谷歌、Shopify、Coinbase等巨头均已加入。Circle股价在消息公布后下跌约13%。
这项研究系统比较了四种AI图像分词策略在640000张星系图像上的表现,发现重建质量与物理属性预测能力之间存在根本性解耦,为天文基础模型的分词器选择提供了实验依据。
Anthropic正式推出中端大语言模型Claude Sonnet 5,其编程能力在SWE-Bench Pro和Terminal-Bench 2.1两项基准测试中分别提升5.1%和13.4%。该模型具备更强自主性,能主动核查输出结果,并在抵御恶意请求和提示注入攻击方面表现更优。Sonnet 5将成为Claude免费版和Pro版的默认模型,定价为每百万输入token 3美元。此外,此前因美国出口管制而暂停推出的Mythos 5和Fable 5模型,管制已解除,将于近期恢复访问。
阿里Qwen团队研究如何将大模型的规模化训练思路迁移到机器人操作领域,通过统一多机器人表示与38100小时数据预训练,让机器人在陌生场景和陌生机型上也能完成复杂操作任务。