有预测称作为x86的替代品——Power9的销售额将呈现上涨趋势,在这个背景下,有十家系统制造商展示了他们采用IBM Power 9处理器的服务器系统。他们只会在由英特尔主导的市场中占很小一部分,但却是最盈利的细分市场之一——数据中心内运行的机器学习任务。
作为IBM Open Power计划的早期合作伙伴,Google宣布它将扩大对Power 9系统的测试。一位负责该项目的工程师表示,考虑到Google对该架构的投入,预计今年至少会将一些Power系统投入生产环境中使用。
中国的阿里巴巴和腾讯也在测试Power 9。腾讯表示,Power 9的性能比x86高30%,同时服务器和机架的使用量也更少。
预计今年至少会有一家网络巨头宣布在生产环境中使用Power 9系统。另外,至少会有一家顶级服务器制造商将Power系统交付到一个数据中心,负责管理IBM Open Open项目的Ken Big这样表示。
King说,IBM的目标是在四年内赢得至少20%(价格为5000美元或更高)的Linux服务器。IBM的Power路线图要求在2019年之前处理器升级到14纳米,2020年之后某个时候推出Power 10——给2020年推出7纳米芯片留下一定空间,这在两年前就计划好了。
鉴于其成本、带宽和移植的便利性,Power 9应该比上一代处理器有更好的表现。IBM合作伙伴表示,IBM在Power 9中首次使用标准DIMM,为其他标准组件敞开了一扇大门,与Power 8相比,使用这种组件的系统成本降低了20%到50%。
Google正在Power 9 Zaius服务器上测试越来越多的应用
专有的NVLink 2.0可以将Power 9连接到多个Nvidia Volta GPU,提供了超过x86的带宽优势。许多新的Power 9系统旨在利用Nvidia GPU在训练神经网络方面的主导地位,以赢得大型数据中心运营商针对人工智能任务采用Power9系统。
事实上,Google认为Power9有发展前景的三个领域之一,就是与TPU等加速器联手打造性能卓越的服务器主机。负责Open Power Foundation的Google系统工程师Maire Mahony说,Power 9还支持许多核心和线程,这些因素与Google搜索任务的性能密切相关。
在另一场活动中,IBM宣布将把使用Nvidia GPU的Power 9服务器面向深度学习的一项云服务提供给客户。IBM声称,在一个TB级的人工智能广告基准测试中,这种配置的4台服务器击败了89台Google Cloud服务器,并高出39倍。
从Power 8向这种类似x86、小端结构的转变,需要该架构在软件上有显著的提升。开发人员表示,Linux x86应用现在可以经过重新编译运行在Power上,有时不需要其他更改。
IBM最新的Power路线图没有显示两年前提到的10nm和7nm部件。来源:IBM。
在近日举行的Open Power Summit峰会上,Atos、浪潮、超微和Wistron等二级三级服务器厂商都展示了自己的Power 9系统。Cavium、Mellanox等公司展示了插入其OpenCAPI总线的卡,而Broadcom等公司展示了PCI Express Gen 4互连卡。
作为IBM最看好的OEM厂商之一,浪潮认为,今年可能会在中国销售500台Power 9系统,明年可能会达到2000台,主要面向互联网巨头。Wistron是台湾宏碁的非品牌设计子公司,自Power 5以来一直是IBM的合作伙伴。Wistron认为,Power 9将推动Power业务实现两位数增长,占Wistron业务总收入的5%左右。
日立主要是面向日本国家研究机构推动Power9的采用,这些机构是IBM Power系统的长期客户。日立为Power 9提供了一个Fortran编译器,可以优化并行能力,并将这些系统销往海外。
Raptor Computing Systems展示了Power 9台式机、工作站和服务器,利用Power9芯片开放式固件规格增强了安全性。系统设计延迟迫使Raptor和数据中心厂商Rackspace取消了Power 8计划,但两家公司都看好他们新的Power 9产品。
目前一些第三方系统已经上市,其他第三方系统将在七月份发布。IBM方面将于12月份发布首款Power 9服务器,并计划在本月底之前发布六款服务器。
在Oracle终止了Sparc处理器开发之后,IBM和ARM是替代架构仅存的主要提供商。然而,去年AMD携Zen x86处理器的回归和崛起,让很多对其他选择的需求变得更少了。
嵌入式系统工程师Timothy Pearson帮助编写了Raptor Talos II系统的安全固件,他演示了在Power 9和AMD Polaris GPU上运行《虚幻竞技场4》游戏
五年前IBM推出Open Power intuitive的时候,IBM认为客户主要是芯片设计师。现在IBM相信,它的客户完全都是OEM厂商了。
兼容Power的芯片“仍然有发展空间,但[由于芯片设计成本高,]它不会有很大的差异化......现在I/O是有差异化的,而内核和缓存已经成为标配,”IBM负责Power系统开发的研究员Brad McCredie这样说道。
今天,中国苏州PowerCore仍然是唯一宣布兼容Power的芯片制造商。King表示,其他芯片交易正在进行中,主要针对为政府用户服务的组织,其中包括欧洲的一个亿亿次级超级计算机项目。
浪潮的一位经理表示,中国的微处理器克隆一般没有强大的市场吸引力。来自中国电子集团的(基于ARM的)Phytium与PowerCorp芯片一样,主要服务中国政府用户。他说,上海兆芯兼容x86的设计尽管赢得了联想的认可,尽管在联想取得了设计胜利,但没有什么吸引力。
在美国,IBM正在打造Summit,一个提供给美国橡树岭国家实验室的200-peraflops Power 9系统。这个系统有4608个节点,每个节点有2个Power 9 CPU和6个Nvidia V100 GPU,今年晚些时候上线。
美国橡树岭国家实验室科学总监Jack Wells说:“新的超级计算机不一定更快,但它们一定是更宽的”,这里他指出是13兆瓦系统的高带宽。
Uber有望成为Summit的早期用户之一,它将使用这个巨型系统来运行Horovod分布式深度学习框架库。Uber研究人员Alex Sergeev将其称为“首个亿亿次级深度学习工作负载”,运行在3亿亿次级的系统上,实现16位浮点运算的峰值性能。
好文章,需要你的鼓励
多伦多大学研究团队提出Squeeze3D压缩框架,巧妙利用3D生成模型的隐含压缩能力,通过训练映射网络桥接编码器与生成器的潜在空间,实现了极致的3D数据压缩。该技术对纹理网格、点云和辐射场分别达到2187倍、55倍和619倍的压缩比,同时保持高视觉质量,且无需针对特定对象训练网络,为3D内容传输和存储提供了革命性解决方案。
浙江大学与腾讯联合研究团队提出MoA异构适配器混合方法,通过整合不同类型的参数高效微调技术,解决了传统同质化专家混合方法中的表征坍塌和负载不均衡问题。该方法在数学和常识推理任务上显著优于现有方法,同时大幅降低训练参数和计算成本,为大模型高效微调提供了新的技术路径。
耶鲁、哥大等四校联合研发的RKEFino1模型,通过在Fino1基础上注入XBRL、CDM、MOF三大监管框架知识,显著提升了AI在数字监管报告任务中的表现。该模型在知识问答准确率提升超过一倍,数学推理能力从56.87%提升至70.69%,并在新颖的数值实体识别任务中展现良好潜力,为金融AI合规应用开辟新路径。
加州大学圣巴巴拉分校研究团队开发出能够自我进化的AI智能体,通过《卡坦岛拓荒者》桌游测试,这些AI能在游戏过程中自主修改策略和代码。实验显示,具备自我进化能力的AI显著超越静态版本,其中Claude 3.7模型性能提升达95%。研究验证了AI从被动工具向主动伙伴转变的可能性,为复杂决策场景中的AI应用开辟新路径。