2018国际超算大会(ISC18)上,浪潮重磅发布创新设计服务器i48,该产品面向以数据为中心的应用场景进行了优化设计,既可作为新型的高密度计算模块完成整体系统的一致性、高密度和快速部署,同时也能根据应用数据容量和处理性能要求灵活配置计算节点与存储节点,能够更好的支持AI、HPC、NFV等业务所需的IT基础设施的构建。
浪潮创新设计服务器i48
i48采用了创新设计,兼具刀片服务器与机架式服务器的优势特点,其在4U标准机箱内可支持8个高密度计算节点、4个均衡计算节点和2个大容量存储节点,相比传统机架服务器集群部署方式,部署效率提高8倍,并且通过统一供电散热降低功耗达18%以上。i48所采用的微机柜式设计和部件优化,可使单节点成本相比刀片服务器方式降低8%,相比普通机架服务器方式降低15%。
i48具备整机一致性高密度部署大规模计算系统能力,这将有助于解决海量科学数据处理与AI数据训练所面对的性能挑战。i48单机柜支持80个基于Intel Xeon的高性能计算节点,每节点拥有超过3.5Tflops的高性能,单机柜整体性能超过280TFlops,4机柜即可完成近千万亿次通用浮点计算性能的HPC集群构建。而在高速互联方面,i48可以支持所有节点,基于100G高速低延时网络连接核心交换机,或者单机柜内支持2个48口100G的TOR高速交换机通过级联构成大规模系统,采用现代化数据中心的前后可维护方式,提升大规模系统运行维护效率。
i48具备出色的灵活性,可根据应用数据容量和处理性能要求灵活配置计算节点与存储节点。以第三代基因测序应用场景为例,i48单机柜可配置384TB的数据存储性能,以及200颗以上的处理器核心,可将人和类似哺乳动物的全基因组组装时间缩短到2天以内,数据处理能力是业界平均水平的4倍;同时i48的高密度刀片计算节点可支持同时配置浪潮研发的F10A FPGA加速卡,使GATK性能加速3.4倍以上。
i48丰富的数据通道也为新兴业务的扩展提供了保证。5G技术将让运营商有机会参与到商业模式的创新中,如IOT、车联网、边缘计算、人工智能等,这将为运营商带来更为广阔的发展机遇。但5G的超大数据通信和低延迟特性要求运营商网络进行虚拟化。NFV将是5G时代的新兴业务的基础架构,i48面向NFV应用深入优化,每节点支持4块PCIe和1张OCP/PHY网络扩展卡,最大提供16个万兆网络通信接口,支持NUMA Blanced优化,在不额外占用CPU利用率的前提下,可使通信性能最大提升20%。
此外, i48的每个高密计算节点可支持4个热插拔的NVMe硬盘,容量高达32TB,适合于构建高速的Burst Buffer数据缓存,配合集群文件系统,提供高速的数据分层吞吐方案,整体性能可提升10倍,实现对大规模HPC集群的高速IO缓存文件系统的支持。
浪潮集团副总裁彭震表示:"i48融合了刀片服务器与机架式服务器的优势,既有机架服务器的部署便捷和灵活扩展性、以及超大存储能力和高性价比,又具备刀片服务器的高密度、易于管理和更高的性能功耗比,提供了一种新型的数据中心模块,并支持最新的英特尔Skylake处理器和Omni-Path高速互联技术,让全球数据中心用户能够更加灵活、快速的部署高性能的IT基础设施,更好的应对AI、HPC、NFV等业务场景所面临的海量数据存储与处理的挑战。"
好文章,需要你的鼓励
Lumen Technologies对美国网络的数据中心和云连接进行重大升级,在16个高连接城市的70多个第三方数据中心提供高达400Gbps以太网和IP服务。该光纤网络支持客户按需开通服务,几分钟内完成带宽配置,最高可扩展至400Gbps且按使用量付费。升级后的网络能够轻松连接数据中心和云接入点,扩展企业应用,并应对AI和数据密集型需求波动。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。