兼传承并创新 浪潮商用机器K1 Power是如何炼成的? 原创

浪潮商用机器有限公司副总经理黄家明表示,从研发的角度看,Power其实不再是一个封闭的系统,浪潮商用机器基于已有的小型机开发实践对K1 Power服务器进行了全新的设计,Power的整个生态系统正在从封闭走向开放。

至顶网计算频道 11月08日 新闻消息(文/李祥敬):随着数字经济的蓬勃发展以及企业数字化转型的深入,特别是人工智能、云计算等新一代IT技术的驱动,新的工作负载和应用场景对算力等提出了更高要求,企业亟需面向未来的扩展灵活、性能强大的系统环境和IT基础设施。

浪潮K1作为国内高端服务器的典型代表,备受市场接纳与认可。而Power也以高可用、高可靠、高品质和安全等特性,是业界备受青睐的IT基础架构。而在浪潮商用机器的积极推动下,打造的K1 Power服务器产品为市场提供了多样化的选择。从设计、加工、测试、生产交付等环节,贯穿整个使用寿命周期的K1 Power服务器凭借强大的性能以及开放、融合的多云架构,正在成为企业应对数字化挑战和驱动业务转型的重要抓手。

兼传承并创新 浪潮商用机器K1 Power是如何炼成的?

浪潮商用机器有限公司副总经理黄家明

浪潮商用机器有限公司副总经理黄家明表示,从研发的角度看,Power其实不再是一个封闭的系统,浪潮商用机器基于已有的小型机开发实践对K1 Power服务器进行了全新的设计,从固件的开发、KUX操作系统到Linux、AIX(Advanced Interactive eXecutive)的兼容,Power的整个生态系统正在从封闭走向开放。

技术路线切换下的传承与创新

在小型机方面,浪潮一直引领潮流。1993年,浪潮成功研制出中国首台小型机服务器;2007年,高效能服务器和存储技术国家重点实验室落户浪潮,招募精英研发团队在高端服务器和存储领域进行全面研究;2010年,400多位浪潮工程师耗费4年研制成功K1小型机,突破多项小型机核心技术,使得中国成为除美国、日本之外全球第三个具备关键应用主机研制能力的国家,浪潮成为全球第五家具备关键应用主机研制能力的企业;2015年,K1系列小型机荣获国家科技进步一等奖;2018年,基于POWER处理器的K1 Power产品线成功上市,在2019年上半年中国UNIX市场的市占率超64%。

这一系列的亮丽成绩来源于浪潮强大的研发团队以及成功突破小型机核心技术。黄家明说,浪潮在小型机方面有着悠久历史,进行了很多创新性的技术研发。比如高端服务器的最大困难是处理器的互联以及内存一致性协议的技术。浪潮突破了这个技术,通过具有良好扩展性和容错性的双翼可扩展紧耦合体系架构,实现互连网络单跳步32路扩展,可有效降低高端容错计算机系统互连延迟,提高系统高可用能力。这样成为我国首个获得PCT国际专利授权的关键应用主机体系结构设计发明专利。

此外,在高速互连芯片方面,浪潮也实现了技术突破,成功研制出处理器协同芯片,使得中国成为继美、日之后全球第三个掌握此核心技术的国家。在操作系统方面,KUX操作系统成为全球第五款,国内首款通过UNIX03标准认证的操作系统,国内唯一通过国家信息系统安全等级保护三级认证的Unix系统。K1荣获2015年国家科技进步一等奖,标志着中国的关键数据从此可以运行在自主平台上,成为我国信息化建设自主可控战略的重要布局。

黄家明表示,正是这些创新研发技术为浪潮商用机器围绕Power处理器进行K1 Power服务器的研发打下了坚实的基础。现在浪潮商用机器研发团队骨干精英全部拥有10年以上高端服务器设计经验,全程参与了浪潮K1、M13、4/8路x86等高端服务器产品的研发,是目前国内高端服务器研发领域最优秀的团队。

同时,浪潮商用机器在北京、济南两大研发实验室投资上千万元配备PCIe 4.0误码仪、59GHz高速示波器、矢量网络分析仪等顶级硬件研发测试设备,进行业界领先的高速信号真和测试。实验室配备专业的电子设计自动化工具(EDA),研发专家团队具有从系统原理到主板PCB设计的全流程设计能力,可对结构、电源、信号、散热等服务器核心模块进行快速研发。而且专业测试设备能快速诊断定位设计故障,打造可靠性高于99.9994%的高品质高端服务器产品。

在黄家明看来,从基于安腾的K1到现在的K1 Power,最大的区别是技术路线、技术架构不一样。一个是Power处理器,一个是安腾处理器。得益于Power处理器的强大性能和一致性结构设计,系统架构更加精简,这也省了开发方面的工作量。在整个系统拓扑方面,K1 Power并没有改变,这样保持了对上层系统和应用的最大兼容性。

浪潮商用机器在进行K1 Power设计的时候,会把原来在x86上面的一些在大规模环境下验证过的设计导入进来,包括新的工艺、新的材料,这样原来的Power在信号质量方面有一个很大的提升的,包括性能测试。黄家明还以功耗设计为例介绍说,通过把x86平台上的电源控制和热管理的系统移植到Power平台,让Power成功运行在了客户指定的功耗水平上面。“通过整合浪潮和IBM的供应链,Power产品品质、性能、可靠性方面变得更好。无论是在经济性还是在客户需求满足方面,K1 Power都表现更加出色。”

具备先进性的K1 Power是如何炼成的?

K1 Power最显著的特点就是单机性能,强调纵向扩展。但是当落实到设计层面,包括处理器的主频和I/O扩展能力,它都是一个更高的数量级,这些对设计会有新的要求和挑战。在性能、可靠性、可扩展性,包括安全方面和管理方面,浪潮商用机器进行了诸多思考。

浪潮商用机器有限公司产品研发部副总经理尹宏伟表示,从最早的安腾处理器技术路线转到Power技术路线。浪潮商用机器把K1 Power打造成了一款高可用、高品质、高可靠和安全的服务器。“性能卓越、安全可靠、自主可控是K1 Power的显著特点,在可管理性、能耗管理、安全性、可靠性、可扩展性、高性能等方面达到了一个新高度,并且通过部件品质、系统设计、制造工艺、生产过程、质量控制、流程管理等保证了K1 Power先进性。”

在系统高性能的维度,尹宏伟说,Power服务器最核心的应用还是核心数据库应用,这就要求性能承载方面表现得足够强大。POWER9处理器性能、内存与I/O带宽优势,让K1 Power服务器在承载核心数据库和开源数据库方面性能优势明显。借助PowerVM,K1 Power服务器高度整合核心业务负载。

尹宏伟表示,K1 Power服务器不但要保证强大的性能,更看重整个系统的高度可靠,这是它设计上的一个很大的诉求。在高可靠性方面,K1 Power服务器秉持高RAS设计理念,通过卓越的设计有效避免出现错误和降低故障可能,包括最高品质的部件、最低数量和功耗的部件、严苛的单个部件测试、高效创新的散热设计、装配和集成测试。比如服务处理器FSP侦测及诊断任何潜在错误的发生,通过硬件设计保证系统持续运行确保可用性,最大程度保证非停机修复故障实现可服务性。

此外,K1 Power服务器关键部件全部冗余设计,包括冗余DRAM芯片 、冗余Fabric Bus、冗余内存总线、冗余I/O控制器、I/O柜、I/O柜链路、VIOS等实现可靠的系统设计。在系统时钟冗余方面,每个系统控制单元中有两个冗余的时钟卡,通过线缆对系统提供冗余的时钟。当任意一个时钟卡出现故障时,另一组时钟 可以无缝切换保持系统稳定运行。电源时序控制信号冗余设计实现更加可靠的电源开关控制。

K1 Power服务器多达16万个故障检查器实时监测系统运行状态,遍布全系统的错误检查器及故障隔离寄存器,实时监测系统的运行,预测、报告故障的发生,自动触发冗余机制修复故障,首错数据捕获FFDC(First Failure Data Capture)、校验与重试、隔离与修复。

尹宏伟说,K1 Power服务器坚持系统可靠性设计理念:Reliability + FSP + Availability + Serviceability,在物理可靠性、软错误修复等方面实现系统全堆栈可靠性设计。

高品质实际上就是高质量或者是高可靠性。通过冗余实现故障的处理、隔离修复,这些是属于设计层面的。高品质是属于实现层面的,K1 Power服务器的纵向扩展服务器的主板层数多达40层,确保良好的信号完整性,从而保证整体系统的可靠性。尹宏伟解释说,高达40层主板设计为了保证高速信号在CPU、内存、I/O以及加速器之间传递的稳定性,所有与高速信号走线层相邻的平面层都是地平面,以此更好地隔绝电子噪音造成的信号串扰。

K1 Power服务器还采用了高效散热设计,包括选用低功耗器件,提升系统局部及整体可靠性;使用铟金属片导热材质,提升导热效率近10倍;采用动态分区散热控制技术,各发热区域独立风扇转速控制,提高散热利用率,保障CPU等元器件性能稳定发挥;通过合理的元器件布局,降低高温对元器件可靠性影响。此外,K1 Power服务器采用长寿命元器件及部件,提升部件结构化寿命。比如使用寿命22年的高可靠性风扇、远超7年设计寿命的抗硫化电阻。

另外,浪潮商用机器借助高精度仿真技术,降低设计风险,提升Power服务器整体设计品质和可靠性,涵盖结构仿真分析包括结构应力静态分析,振动及冲击结构动态分析,有效控制结构可靠性设计风险,提高设计质量;建立精度更高,粒度更细的散热仿真模型,提高散热仿真的效率,降低服务器的散热与能耗,提升整机可靠性;建立高精度信号仿真,保障Power产品信号传输速率,确保信号传输质量和抗干扰能力。

K1 POWER产品生产测试功能覆盖率100%、自动化的测试系统,并对每台产品都进行高强度的可靠性测试。自研部件在开发过程中进行严格的阶段测试和整机测试,确保质量和性能达到业界最高水准;浪潮商用机器自认证部件结合IBM部件合格标准进行认证测试,确保引入部件的品质。

在安全性方面,K1 Power服务器进行了增强的系统安全设计,支持多种国际标准和中国政府认证,符合商用密码证书的外置硬件安全模块(HSM)。开发国产可信计算模块(TPM),实现符合国家可信计算标准,AIX操作系统安全加固模块(K1 Power SSR)。SSR(Server Security Reinforcement)是浪潮具有自主知识 产权的“操作系统安全增强系统”,是构建国家三级安全操作系统的内核模块技术的解决方案产品,从根本上免疫现有的各种针对操作系统的攻击行为,如:病毒,蠕虫,黑客攻击等。

黄家明说,K1 Power服务器本地化开发固件Secure Boot功能,通过对PNOR代码的签名及验签过程,保障代码不被恶意篡改;自主构建系统微码,源码级安全检测。另外,多家本地安全可信操作系统厂商认证了Power服务器平台,并取得产品兼容性认证证书,为企业客户提供系统多样性选择,包括KUX安全操作系统证书、凝思安全操作系统证书、红旗操作系统证书、中标麒麟操作系统证书。

尹宏伟表示,Power服务器会从多个维度保证系统的安全、可靠和高性能。这种高标准只有在产品运行很长时间之后,我们才能发现这种高可靠的服务器和普通服务器的差距。“K1 Power服务器对于可靠性和性能的要求是很高的,这也是用户长期对它品牌的认可。高性能高效率的K1 Power服务器也要遗传这些基因,保证满足核心用户的核心应用安全、稳定、可靠地运行。”

加速落地 K1 Power深耕行业市场

K1 Power服务器在行业市场表现不俗,在金融、政府传统优势市场获得广泛认可。浪潮商用机器有限公司产品营销部总经理江豫京表示,省级或者市级的城商行或者是农信和全国股份制银行都采购了K1 Power服务器,用于银行最核心的数据库资源池平台。而且K1 Power服务器跟旧版Power机器的资源可以进行平滑迁移。

同时,K1 Power服务器支持关键业务云架构,客户可以根据需求进行动态调整。“我们去年在政府客户这边有了大幅度增长,整体翻了一番。税务、公安、财政的客户通过购买新的Power服务器来替换旧版UINX小型机环境,承载关键应用。”江豫京说,“除了面向关键业务的纵向扩展服务器,浪潮商用机器还推出了面向横向扩展的基于POWER处理器的Linux服务器。这些服务器主要是承载新型工作负载,比如大数据、人工智能等。”

比如在AI方面,全新POWER9芯片具备NVLink 2.0、CAPI 2.0和New CAPI三位一体的领先硬件加速优势,面向加速器件、异构综合器件开放,大幅提升加速效率,深度学习框架性能超x86近4倍。大数据应用场景中,POWER9处理器内置的GZip硬件加速模块不仅能够极大地提高大数据分析平台的数据传输效能,也使得数据压缩和解压缩性能提高了440~740倍。广告推送算法加速引擎的性能评估中,利用PCIe上的FPGA加速卡,可获得4.8倍的性能提升。

为了满足客户需求,浪潮商用机器采用JDM模式进行个性化定制,即实现面向客户的联合设计,在OpenPOWER和Power领域围绕着客户的需求进一步走向深化。

目前,浪潮商用机器以全新POWER9芯片为核心的纵向扩展系列和横向扩展系列的产品矩阵不断完善,能够契合更多、更新的应用场景。同时,2019年浪潮商用机器将在既有的渠道体系基础上进行升级,构建更加完整的合作伙伴体系。

“面对复杂的市场竞争形势,浪潮商用机器致力于围绕开源技术、开放技术的解决方案建设融合生态,通过合作打造更贴近客户需求的产品和解决方案。我们很有信心利用Power技术,给客户在关键场景和新应用场景下面带来更多的价值。”江豫京说。

来源:至顶网计算频道

0赞

好文章,需要你的鼓励

2019

11/08

20:34

分享

点赞

邮件订阅
白皮书