云计算变革正在加速企业数据中心的发展,在数字化转型过程中,企业均面临着数据指数级增长和业务场景多样化的问题,导致数据中心IT架构越来越复杂,对硬件基础架构按需扩展、快速响应的需求越来越迫切。
浪潮基于新一代Intel可扩展计算平台的M5服务器提出了场景化极致设计理念,对服务器形态、密度、能耗、可管理性等部署特性面向云数据中心进行全面优化。这一设计原则的实现策略则是平台化与模块化的有效结合,双路旗舰产品NF5280M5正是这一设计思想的集中体现。
极致性能优化,刷新SPECjbb2015测试记录
NF5280M5是一款高度为2U的双路服务器,这是目前出货量最大的主流品类。这款产品支持2颗Intel最新的可扩展全系列处理器,单CPU最高拥有28个内核及56线程,CPU之间采用2条10.4 GT/s UPI互连链路,可支持M.2和全闪,实现超高的存储吞吐量,将I/O延时从秒、毫秒级直接降低至微秒级,在数据库、ERP、大数据分析等应用场景可以体现极致的实际应用性能。据实测数据显示,NF5280M5综合性能可以达到上一代的1.3 倍。
近日,全球两大性能评测组织发布了最新一期的SPECjbb2015测试结果,测试结果显示,NF5280M5的系统最大处理性能指标max-jOPS为181507,即在Java业务处理不失败情况下系统最大可完成每秒181507次Java事务处理。
SPECjbb2015目的是衡量应用服务器端Java应用性能的权威基准测试,Java仍是企业应用领域的通用语言,出色的Java性能则意味在每一个企业应用场景中都可以提供出色的实际应用性能。除SPEC jbb外,浪潮NF5280在其他SPEC基准测试中同样成绩优异,在SPEC CPU,SPEC Power等测试中累计打破26次世界记录。
百变配置,面向场景按需优化
传统2U双路服务器已经具备了一定扩展性和适用性,但很难再进一步突破。NF5280M5作为浪潮双路机架产品的旗舰机型,可以通过组件升级实现弹性配置。
NF5280M5采用浪潮独有的空间分层技术,打破传统服务器设计边界,将系统分为基础组件和可变组件两部分:在存储模块部分,构建了1套标准,3种组合,在实现全闪存配置的基础上,实现了31块普通硬盘的扩展,最大支持20块大盘扩展,相比上一代提升了67%;在IO部分,引入了标准OCP模块,通过灵活配置可以实现4个GPU的扩展,以及存储模块和IO模块的融合,大大提升系统应用场景的多样性。此外,通过系统资源调配技术将标准组件进行深度整合和灵活调配,可以满足 "通用计算,大容量存储,全闪存,IO密集,异构加速"五大应用场景30种以上的配置需求,灵活应对不同应用场景。
通过独特的IO扩展模块,NF5280可以支持4个全宽的GPU或者8个半宽的GPU,成为一套超高密度的AI线下训练方案,是业内通用产品的最高规格,可满足更多AI应用场景。目前已广泛应用于百度,网易,科大讯飞等企业的深度学习、线下训练、语音识别等。
高可用,更高可信
NF5280M5采用了不同层次的高可用技术,例如丰富的硬盘RAID机制,内存的热备、镜像、纠错,以及电源风扇的冗余热插拔设计,具备了完善的软硬件错误容忍能力。以内存智能管理技术为例,在系统启动前,就会对内存进行诊断,错误或者有隐患单元会被移出可用区域,在系统运行过程中实时对内存进行监控,处理错误或隐患,内存错误检测处理精度可达到Bit级别,内存错误引发的故障降低90%以上。
这款产品采用更多安全性设计,在不同层次集成了80多项安全技术,集成了可信计算模块,支持国产商用密码算法,迄今为止,中国电力科学研究院信息安全实验室等第三方机构和行业用户已经对NF5280M5进行了100多项安全测试,测试结果显示全面合格。
智慧计算下的产业机会
浪潮NF5280M5在有限空间内完美展现了高效、可靠、智能、高扩展特性,适应智慧时代下各种应用场景需求,特别是对服务器有苛刻要求的电信、金融、大型企业等用户。
IDC 2018年Q1数据显示,浪潮服务器出货量位居中国第一,全球前三。凭借持续不断地创新发力,2018年,浪潮将继续聚焦智慧计算业务,为客户提供面向应用优化产品和服务,帮助用户抓住新一代信息技术带来的发展机遇。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。