ZD至顶网服务器频道 04月08日 新闻消息:IBM公司公布了其Power9处理器,预计将于明年下半年正式推出,将拥有24个计算核心——这一数量达到现有Power8芯片的两倍。
与此同时,谷歌方面亦透露了其Power相关项目——证实其将把大部分知名Web服务移植至该架构,这意味着面向非英特尔设备进行堆栈重构已经势在必行。
日前于圣何塞召开的OpenPower峰会上可谓新消息连连,下面一起来看其中重点:
又是一轮芯片对抗:英特尔公司于上周发布了22核心至强E5 v4处理器系列,而IBM如今则拿出了自己的拳头产品——24核心Power9。
蓝色巨人在今天透露了一部分与该处理器相关的信息(上一次公布Power家族发展路线图还是在去年8月)。Power9将由Global Foundries负责生产,并属于14纳米高性能FinFET产品。其直接附加DDR4内存,可通过第四代PCIe及NVLink 2.0与外设及英伟达GPU进行交互,且数据块传输速度可达25 Gbps。
IBM方面表示,这一设计针对双插槽向外扩展服务器做出了优化(因此被称为Power9 SO),同时包含内置加速机制以处理压缩与加密负载。
这款芯片主要面向大型企业与超级计算机场景,负责处理分析、大数据、机器学习以及其它各类高强度任务。请别误会:英特尔仍然在数据中心计算市场上占有压倒性优势;Power则仅仅属于一套利基架构。Power9计划于2017年推出,而其也正是美国能源部Summit and Sierra超级计算机的大脑。
另外也别忘了IBM的OpenPower基金会,其负责为该CPU架构、服务器硬件以及软件提供授权。中国各技术巨头已经准备好在2018到2020年期间利用OpenPower设计蓝图推出自己的Power8与9芯片——此类产品被称为“合作芯片”,其制程工艺将在7纳米到10纳米之间。
换言之,美国将于明年拥有自己的Power9超级计算机,而中国则要晚上一年才能利用Power8或者9处理器支撑起自己的超算设备。虽然目前美国已经发布禁令,要求英特尔得将其至强处理器出售给中国的超级计算机制造商,但其中并未限定CPU设计蓝图出口——或者美国政府认为蓝色巨人的技术成果被掌握在外国手中并不会对国家安全造成威胁。
Summit的峰值性能应为每秒300千万亿次,远高于目前中国天河二号的55千万亿次,不过这套美国系统的性能主要由英特尔的Volta GPU贡献——而非Power9。
谷歌公司一直希望保持自身对供应商的选择权,而且与其它财力雄厚的超大规模云服务供应商一样,他们也有能力实验各类非英特尔x86架构方案。
此前谷歌一直在鼓捣64位ARMv8核心,如今又是Power芯片。但这些举措其实并不会让人意外,因为谷歌方面正是OpenPower基金会的初始成员之一。
谷歌公司指出,其已经将相当一部分知名Web服务移植到Power系统当中;其工具链也已经更新以输出x64、ARM或者Power架构代码。可以想见,谷歌公司的内部源代码应该同样具备可移植性,且能够在程序员的控制范围内实现跨越性编译。事实上,谷歌公司高级主管Gordon MacKean曾于2015年指出,这家云巨头一直在努力保持其软件平台的中立性。至少面向多种架构能够避免过分深入单一运行环境所引发的代码错误。
考虑到谷歌服务的增长速度相当可观,这家广告巨头很清楚自己需要尝试各类竞争性技术以确保其始终使用最符合实际需求的硬件与软件组合——即通过测试与实验确保拥有最佳性价比的解决方案。
“自从九年前加入谷歌以来,很多事物都发生了变化,”谷歌公司工程技术经理兼OpenPower基金会主管Maire Mahony表示。
“搜索服务能够找到上万亿个Web地址,而目前的Web地址问题更是高达60万亿个。Gmail的活动用户超过10亿,这一数量达到2012年的两倍。YouTube原先每分钟的平均视频上传长度达7小时,如今这一长度则提升到了400小时。对于计算资源的需求可谓永无止境,而且丝毫没有放缓的迹象。”
规模伸缩难题……Mahony在OpenPower峰会上的演示文稿
“计算技术的发展正处于十字路口上。制造更小的晶体管会带来高昂成本,而这种开销也让每TCO美元交付性能水平的保障工作变得更具挑战性。我们需要选择其它解决思路。谷歌公司加入OpenPower基金会的理由也正在于此。”
“这一发展愿景希望立足于OpenPower构建向外扩展服务器解决方案。我们也期待着这套平台的未来实际表现。”
可以想见,英特尔一定是在愤怒地咆哮。
“我们已经将自己的基础设施移植到Power架构当中。这意味着我们的工具链能够支持Power;而对于谷歌开发者,将自有软件应用运行在Power上只需要简单修改配置文件并重启即可,”她补充称。
“每个人都需要多个选择,”当谷歌对高通公司的ARM服务器级芯片进行测试时,英特尔员工如是说道。好了,现在是多两个选择了。不过必须承认,尽管谷歌在测试Power架构方面投入了大量精力,但目前其绝大多数系统仍然由英特尔芯片所驱动。
这不禁让我们想到之前发布的一条消息:谷歌与Rackspace正协力为开放计算项目研究Power9服务器蓝图。这些设计方案可兼容目前谷歌与Facebook正在使用的48V开放计算机架。
这些蓝图可帮助硬件制造商以相当低廉的方式生产设备,而这也正是开放计算项目的核心所在:拉低成本并为超大规模需求设计硬件。Rackspace公司将利用这些系统在云环境下运行Power9工作负载。
该系统本身的代号为Zaius:这是一台双插槽Power9 SO服务器,配备32个DDR4内存插槽、2个NVlink插槽、3个PCIe第四代x16插槽以及总计算核心数量为44个。CPU与英伟达GPU加速器之间通过高速NVLink互连机制对接,而谷歌希望将其深度学习AI代码运行在其上。
Rackspace公司还公布了自家Power8 Barreleye服务器。
OpenPower基金会已经为Power系统推出了“OpenPower Ready”品牌,这意味着买家可以据此采购相关产品。这不禁让我们想到了当年风靡一时的“Intel Inside”。
如果某家厂商要求在设备上贴标,则需要保证其能够满足全部必需要求、在技术会议上公布这一结论或者接受外部审查。如果审查通过,那么他们就能够被纳入基金会名录并有权声称自己的产品为“OpenPower Ready”。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。