随着云计算与大数据时代的到来,数据中心正在寻求一种能够以较低功耗,有效处理大量并行化且轻量化负载的方式,这类负载或许对单个服务器节点的计算力要求不高,但对I/O和并行度却更为偏重。
很多用户都曾经尝试用在一台物理服务器上运行多个虚拟机的方式来支持这类应用负载,无奈目前的硬件平台,在虚拟化后多多少少都有一些影响这类负载运行效果的额外开销,并不能很理想地满足它们的需求,因此业界就专门针对这些需求,开发了多以物理节点形式出现的,并拥有高密度、低功耗特点,且能提供“适用”性能的微型服务器。
目前,微服务器市场主要有两大阵营:英特尔与ARM生态系统。英特尔的主力是Atom芯片,优势是有充沛的性能表现,且可以被用于打造不同的SoC,而且早在2012年就发布了支持64位技术的型号。ARM的优势在于开放了芯片的IP授权,Applied Micro、Marvell与AMD等“ARM系”厂商可以在此基础上自行研发和设计芯片与微型服务器,更具定制化优势。
虽然ARM进军微型服务器市场,挑战英特尔的消息让人感到兴奋,可在经过了近两年的等待和酝酿后,无论是在技术上还是在战略上,它仍给人“慢一拍”、“在路上”的感觉。例如英特尔的芯片工艺仍领先ARM阵营,64位产品的发布也领先ARM阵营。接下来就有了第一代惠普MoonShot服务器搭载Atom芯片而非ARM架构芯片的事实,又有了ARM架构服务器阵营大将Calxeda出师未捷身先死的消息,有分析师就认为Calxeda失败的原因就是花了太多钱研发32位ARM处理器,以致无法跟上用户的需求与市场竞争步伐。
进行路上总有坎坷,与硬件产品和技术迟迟不能就绪相比,更严重的情况来自软件环节——目前多数数据中心软件都是构建在英特尔的x86架构上,用户如果想转投ARM的怀抱,就必须要重新编写或替换现有的软件堆栈,可能还得重新培训员工,不论这些事情会是怎样的麻烦,背后都离不开一个钱字。
微软Windows Azure部门总经理Mike Neil在接受媒体采访时曾表示,微软不太可能在自己的数据中心内部广泛使用ARM处理器。“除非非x86芯片的软件生态系统能够迎来显著转变,”他说,“ARM一大挑战在于用户到底会利用它运行哪些工作负载。”此外,微软等技术巨头也不希望将大量资源当成赌注投入到一种新型芯片架构身上。
Mike Neil担心的,恐怕就是向ARM平台投了钱,却没法回本,这折射出了一些用户对于ARM架构不够成熟,无法为他们带来真正收益的担心。有业内资深人士这样说:“对普通企业用户而言,他们只会选择市场上成熟的产品和解决方案,ARM服务器不仅不成熟,甚至市场上还很罕见。”
即便如此,仍然有一些用户对ARM充满期待,希望ARM的产品在能效上拥有更出色的表现,能够借此节省更多的成本,以抵销软件开发和迁移上的支出。可是,现实又一次开了个玩笑。大家千呼万唤始出来的首款64位ARM架构服务器处理器——由AMD在今年年初推出的Opteron A1100在与英特尔Atom对抗时,表现并不理想。
同样是八核心,AMD代号为西雅图的64位ARM处理器Opteron A1100的性能,据AMD自已公布的“预估”数据,是SPECint_rate得分为80左右,平均每核心得分为10,而Atom C2750的SPECint_rate的峰值可达101,Base值也有97.9,平均每核12.23。
考虑到Atom C2750时钟频率比Opteron A1100略高,以及ARM处理器更重视节能而非性能的传统,这个结果倒还可以接受。但如果再结合功耗上的对比,AMD这个首款64位ARM架构服务器处理器的表现就有点让人上火了,AMD自己给出的预估数据是25W,而Atom C2750只有20W。
虽然不排除AMD还会披露更多“真实”,而非“预估”的性能或功耗数据,但无论如何,只要这些数据体现出来的性能,功耗,或者是两者的比值——性能功耗比无法领先、甚至是大幅领先英特尔的产品的话,客户就难有足够的动力从x86向它迁移。毕竟,软件迁移是需要成本的,而且真咬牙做了迁移,又只迁移了一部分应用的话,用户还会面临同时开发、维护两个架构的麻烦,所有这都是需要大笔投入的,如果今天投出的这些资金不能在未来节省回来,或者是赚回来的话,CEO和投资者可能就要拍桌子了,而原本以为ARM带来的系统价格、空间和电能节省不但能抵销应用迁移成本,之后还能有得赚的用户们,在看到这样的对比后,恐怕也要三思而后行了。
当然,看中ARM架构处理器可定制特性的用户,还是有足够的理由去尝试它的,但这些用户就相当于数据中心领域的极客们,相信他们对总拥有成本和投资回报的计算方式,将很难被需求与之不同的普通用户所复制和引用的。
所以,ARM和他的小伙伴们,接下来最根本的任务依然是继续赶路,提升自己微型服务器产品的性能功耗比优势。这个任务可并不容易完成,因为英特尔从不像其他强者那样轻视自己的对手,也没有坐等别人追上来的习惯。就在AMD放出消息说要在二季度Q2提供64位ARM芯片样品,并在第四季度大规模上市时,英特尔已经在准备于年内推出下一代Atom服务器SoC芯片“Denverton”了,这可是款14纳米制程的芯片。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。