IBM系统部的差异化价值之PowerSystems
IBM系统部的PowerSystems业务,在2015年第一季度获得了1%的同比增长,虽然只有1%,但要知道这是11个季度以来第一次正向增长,难能可贵。
对于这个成绩,Tom Rosamilia认为,这验证了IBM在两年前作出战略转型的一个结果,这个转型就是OpenPOWER生态系统,这其中尤为重要的是,OpenPOWER进一步丰富了POWER架构横向扩展的产品。如果说,System z13代表了IBM在Scale-Up架构中的极致能力,那么OpenPOWER也将为业界展示IBM极致的Scale-Out的能力。对于OpenPOWER的发展,Tom Rosamilia很有信心,“两年前,我们创建OpenPOWER联盟时,最初创始成员是5家,18个月前我们成立OpenPOWER基金会时,当谷歌是主席地位。今天我们OpenPOWER基金会已经发展到129家成员,其中有19家来自中国。我这次来北京,就准备会见其中一家,探讨业务的发展计划,而在6月上旬,我们还要在北京举办中国本地的OpenPOWER峰会,届时将会有更多的新成果展现。”
而在Scale-Up方面,POWER架构的传统优势仍然继续保持,5月份IBM发布了新的E850与E880服务器,前者为4插槽配置,后者为16插槽,进一步补齐了POWER8服务器的产品线,也让新一代POWER服务器家族终于覆盖了所有传统业务平台,这毕竟是IBM系统的根基。
不过,谈到POWER就不能不谈到它的主要竞争对手x86,更确切的说则是英特尔的x86平台。对此,Tom Rosamilia并不回避,直接表示,“我们一直在与英特尔的x86平台进行竞争,但我们觉得POWER处理器与PowerSystems是一个非常强有力的工具,随着产品线的日益丰富,将会为用户带来更有竞争力的选择。”
综合而论,PowerSystems的传统在于Scale-Up平台,这也就是现在的E系列的所继承的。当市场的主流需求向Scale-Out架构转移时,PowerSystems推出了所谓的低端产品S系列,而配合OpenPOWER与OpenStack,IBM希望能从Linux应用环境以及开源云平台层面,为POWER架构带来更强大的生态体系。当然,从根本上讲,就纯粹的处理器性能而言,POWER仍然有优势,尤其是具备缓存一致性的CAPI接口,为用户提供了外围组件直连CPU的能力,比如FPGA、GPU以及网络控制器,可以共享CPU主内存,提供了可观的平台加速能力。Tom Rosamilia就此强调POWER已经比英特尔的x86更开放,从芯片设计到平台集成,为合作伙伴提供了更大的可发挥空间,而且最重要的是,POWER9也已经在路上。
IBM与NVIDIA联手,将基于POWER9处理器和NVIDIA的GPGPU,为美国橡树岭国家试验室和劳伦斯·利弗莫尔国家实验室打造两款超级计算机,IBM获得的订单金额达到了3.25亿美元
在不久前,IBM与NVIDIA联合宣布,将结合各自的POWER9通用处理器与VOLTA GPGPU,联手为美国橡树岭国家试验室(ORNL,Oak Ridge National Laboratory),以及是劳伦斯·利弗莫尔国家实验室(LLNL,Lawrence Livemore National Laboratory)分别打造两台超级计算机:SUMMIT与SIERRA,前者计算节点超过3400个,峰值性能达150-300PFLOPS,后者性能大于100PFLOPS,主攻分子动力学,宇宙学,计算流体动力学,燃烧模拟等领域,其中更高性能的SUMMIT预计2017年上线,2018年正式投入使用。
Tom Rosamilia相信,随着业界对于POWER架构和OpenPOWER产品的认知不断加深,以及新品的陆续跟进,PowerSystems的业绩将会更有起色。
好文章,需要你的鼓励
在2025年格勒诺布尔Leti创新日大会上,能耗问题成为焦点。随着AI驱动计算需求激增,数据中心规模和能耗急剧膨胀,部分数据中心功耗将达500兆瓦。CEA-Leti启动Resolve计划,目标到2032年实现能效提升1000倍。大会展示了3D集成、光子互连等节能技术,以及无PFAS芯片制造方法。业界呼吁通过先进封装、宽禁带功率器件等实用技术,平衡AI发展与可持续性需求。
清华大学团队开发了CAMS智能框架,这是首个将城市知识大模型与智能体技术结合的人类移动模拟系统。该系统仅需用户基本信息就能在真实城市中生成逼真的日常轨迹,通过三个核心模块实现了个体行为模式提取、城市空间知识生成和轨迹优化。实验表明CAMS在多项指标上显著优于现有方法,为城市规划、交通管理等领域提供了强大工具。
联想集团推出专为人工智能工作负载优化的数据中心系统产品组合。主打产品ThinkSystem SR680a V4计算设备集成近二十个处理器,推理工作负载运行速度比上一代硬件快11倍。该系统配备8块英伟达Blackwell B200显卡、6个英特尔至强6处理器,以及8个英伟达SuperNIC和BlueField-3 DPU。同时发布基于SR675服务器的两个系统和四个混合AI优势产品包,涵盖制造、酒店、安全和零售等应用场景。
MIT研究团队发现了一个颠覆性的AI训练方法:那些通常被丢弃的模糊、失真的"垃圾"图片,竟然能够训练出比传统方法更优秀的AI模型。他们开发的Ambient Diffusion Omni框架通过智能识别何时使用何种质量的数据,不仅在ImageNet等权威测试中创造新纪录,还为解决AI发展的数据瓶颈问题开辟了全新道路。