有预测称作为x86的替代品——Power9的销售额将呈现上涨趋势,在这个背景下,有十家系统制造商展示了他们采用IBM Power 9处理器的服务器系统。他们只会在由英特尔主导的市场中占很小一部分,但却是最盈利的细分市场之一——数据中心内运行的机器学习任务。
作为IBM Open Power计划的早期合作伙伴,Google宣布它将扩大对Power 9系统的测试。一位负责该项目的工程师表示,考虑到Google对该架构的投入,预计今年至少会将一些Power系统投入生产环境中使用。
中国的阿里巴巴和腾讯也在测试Power 9。腾讯表示,Power 9的性能比x86高30%,同时服务器和机架的使用量也更少。
预计今年至少会有一家网络巨头宣布在生产环境中使用Power 9系统。另外,至少会有一家顶级服务器制造商将Power系统交付到一个数据中心,负责管理IBM Open Open项目的Ken Big这样表示。
King说,IBM的目标是在四年内赢得至少20%(价格为5000美元或更高)的Linux服务器。IBM的Power路线图要求在2019年之前处理器升级到14纳米,2020年之后某个时候推出Power 10——给2020年推出7纳米芯片留下一定空间,这在两年前就计划好了。
鉴于其成本、带宽和移植的便利性,Power 9应该比上一代处理器有更好的表现。IBM合作伙伴表示,IBM在Power 9中首次使用标准DIMM,为其他标准组件敞开了一扇大门,与Power 8相比,使用这种组件的系统成本降低了20%到50%。
Google正在Power 9 Zaius服务器上测试越来越多的应用
专有的NVLink 2.0可以将Power 9连接到多个Nvidia Volta GPU,提供了超过x86的带宽优势。许多新的Power 9系统旨在利用Nvidia GPU在训练神经网络方面的主导地位,以赢得大型数据中心运营商针对人工智能任务采用Power9系统。
事实上,Google认为Power9有发展前景的三个领域之一,就是与TPU等加速器联手打造性能卓越的服务器主机。负责Open Power Foundation的Google系统工程师Maire Mahony说,Power 9还支持许多核心和线程,这些因素与Google搜索任务的性能密切相关。
在另一场活动中,IBM宣布将把使用Nvidia GPU的Power 9服务器面向深度学习的一项云服务提供给客户。IBM声称,在一个TB级的人工智能广告基准测试中,这种配置的4台服务器击败了89台Google Cloud服务器,并高出39倍。
从Power 8向这种类似x86、小端结构的转变,需要该架构在软件上有显著的提升。开发人员表示,Linux x86应用现在可以经过重新编译运行在Power上,有时不需要其他更改。
IBM最新的Power路线图没有显示两年前提到的10nm和7nm部件。来源:IBM。
在近日举行的Open Power Summit峰会上,Atos、浪潮、超微和Wistron等二级三级服务器厂商都展示了自己的Power 9系统。Cavium、Mellanox等公司展示了插入其OpenCAPI总线的卡,而Broadcom等公司展示了PCI Express Gen 4互连卡。
作为IBM最看好的OEM厂商之一,浪潮认为,今年可能会在中国销售500台Power 9系统,明年可能会达到2000台,主要面向互联网巨头。Wistron是台湾宏碁的非品牌设计子公司,自Power 5以来一直是IBM的合作伙伴。Wistron认为,Power 9将推动Power业务实现两位数增长,占Wistron业务总收入的5%左右。
日立主要是面向日本国家研究机构推动Power9的采用,这些机构是IBM Power系统的长期客户。日立为Power 9提供了一个Fortran编译器,可以优化并行能力,并将这些系统销往海外。
Raptor Computing Systems展示了Power 9台式机、工作站和服务器,利用Power9芯片开放式固件规格增强了安全性。系统设计延迟迫使Raptor和数据中心厂商Rackspace取消了Power 8计划,但两家公司都看好他们新的Power 9产品。
目前一些第三方系统已经上市,其他第三方系统将在七月份发布。IBM方面将于12月份发布首款Power 9服务器,并计划在本月底之前发布六款服务器。
在Oracle终止了Sparc处理器开发之后,IBM和ARM是替代架构仅存的主要提供商。然而,去年AMD携Zen x86处理器的回归和崛起,让很多对其他选择的需求变得更少了。
嵌入式系统工程师Timothy Pearson帮助编写了Raptor Talos II系统的安全固件,他演示了在Power 9和AMD Polaris GPU上运行《虚幻竞技场4》游戏
五年前IBM推出Open Power intuitive的时候,IBM认为客户主要是芯片设计师。现在IBM相信,它的客户完全都是OEM厂商了。
兼容Power的芯片“仍然有发展空间,但[由于芯片设计成本高,]它不会有很大的差异化......现在I/O是有差异化的,而内核和缓存已经成为标配,”IBM负责Power系统开发的研究员Brad McCredie这样说道。
今天,中国苏州PowerCore仍然是唯一宣布兼容Power的芯片制造商。King表示,其他芯片交易正在进行中,主要针对为政府用户服务的组织,其中包括欧洲的一个亿亿次级超级计算机项目。
浪潮的一位经理表示,中国的微处理器克隆一般没有强大的市场吸引力。来自中国电子集团的(基于ARM的)Phytium与PowerCorp芯片一样,主要服务中国政府用户。他说,上海兆芯兼容x86的设计尽管赢得了联想的认可,尽管在联想取得了设计胜利,但没有什么吸引力。
在美国,IBM正在打造Summit,一个提供给美国橡树岭国家实验室的200-peraflops Power 9系统。这个系统有4608个节点,每个节点有2个Power 9 CPU和6个Nvidia V100 GPU,今年晚些时候上线。
美国橡树岭国家实验室科学总监Jack Wells说:“新的超级计算机不一定更快,但它们一定是更宽的”,这里他指出是13兆瓦系统的高带宽。
Uber有望成为Summit的早期用户之一,它将使用这个巨型系统来运行Horovod分布式深度学习框架库。Uber研究人员Alex Sergeev将其称为“首个亿亿次级深度学习工作负载”,运行在3亿亿次级的系统上,实现16位浮点运算的峰值性能。
好文章,需要你的鼓励
Xbox 部门推出了名为 Muse 的生成式 AI 模型,旨在为游戏创造视觉效果和玩法。这一举措反映了微软全面拥抱 AI 技术的战略,尽管游戏开发者对 AI 持谨慎态度。Muse 不仅可能提高游戏开发效率,还有望实现老游戏的现代化改造,但其实际效果和对行业的影响仍有待观察。
Sonar收购AutoCodeRover,旨在通过自主AI代理增强其代码质量工具。这项收购将使Sonar客户能够自动化调试和问题修复等任务,让开发者将更多时间用于改进应用程序而非修复bug。AutoCodeRover的AI代理能够自主修复有问题的代码,将与Sonar的工具集成,提高开发效率并降低成本。
人工智能正在推动数据中心的变革。为满足 AI workload 的需求,数据中心面临前所未有的电力消耗增长、散热压力和设备重量挑战。应对这些挑战需要创新的解决方案,包括 AI 专用硬件、可再生能源、液冷技术等。同时,数据中心还需平衡监管压力和社区关切。未来数据中心的发展将决定 AI 技术能否实现其变革性潜力。