随着云计算与大数据时代的到来,数据中心正在寻求一种能够以较低功耗,有效处理大量并行化且轻量化负载的方式,这类负载或许对单个服务器节点的计算力要求不高,但对I/O和并行度却更为偏重。
很多用户都曾经尝试用在一台物理服务器上运行多个虚拟机的方式来支持这类应用负载,无奈目前的硬件平台,在虚拟化后多多少少都有一些影响这类负载运行效果的额外开销,并不能很理想地满足它们的需求,因此业界就专门针对这些需求,开发了多以物理节点形式出现的,并拥有高密度、低功耗特点,且能提供“适用”性能的微型服务器。
目前,微服务器市场主要有两大阵营:英特尔与ARM生态系统。英特尔的主力是Atom芯片,优势是有充沛的性能表现,且可以被用于打造不同的SoC,而且早在2012年就发布了支持64位技术的型号。ARM的优势在于开放了芯片的IP授权,Applied Micro、Marvell与AMD等“ARM系”厂商可以在此基础上自行研发和设计芯片与微型服务器,更具定制化优势。
虽然ARM进军微型服务器市场,挑战英特尔的消息让人感到兴奋,可在经过了近两年的等待和酝酿后,无论是在技术上还是在战略上,它仍给人“慢一拍”、“在路上”的感觉。例如英特尔的芯片工艺仍领先ARM阵营,64位产品的发布也领先ARM阵营。接下来就有了第一代惠普MoonShot服务器搭载Atom芯片而非ARM架构芯片的事实,又有了ARM架构服务器阵营大将Calxeda出师未捷身先死的消息,有分析师就认为Calxeda失败的原因就是花了太多钱研发32位ARM处理器,以致无法跟上用户的需求与市场竞争步伐。
进行路上总有坎坷,与硬件产品和技术迟迟不能就绪相比,更严重的情况来自软件环节——目前多数数据中心软件都是构建在英特尔的x86架构上,用户如果想转投ARM的怀抱,就必须要重新编写或替换现有的软件堆栈,可能还得重新培训员工,不论这些事情会是怎样的麻烦,背后都离不开一个钱字。
微软Windows Azure部门总经理Mike Neil在接受媒体采访时曾表示,微软不太可能在自己的数据中心内部广泛使用ARM处理器。“除非非x86芯片的软件生态系统能够迎来显著转变,”他说,“ARM一大挑战在于用户到底会利用它运行哪些工作负载。”此外,微软等技术巨头也不希望将大量资源当成赌注投入到一种新型芯片架构身上。
Mike Neil担心的,恐怕就是向ARM平台投了钱,却没法回本,这折射出了一些用户对于ARM架构不够成熟,无法为他们带来真正收益的担心。有业内资深人士这样说:“对普通企业用户而言,他们只会选择市场上成熟的产品和解决方案,ARM服务器不仅不成熟,甚至市场上还很罕见。”
即便如此,仍然有一些用户对ARM充满期待,希望ARM的产品在能效上拥有更出色的表现,能够借此节省更多的成本,以抵销软件开发和迁移上的支出。可是,现实又一次开了个玩笑。大家千呼万唤始出来的首款64位ARM架构服务器处理器——由AMD在今年年初推出的Opteron A1100在与英特尔Atom对抗时,表现并不理想。
同样是八核心,AMD代号为西雅图的64位ARM处理器Opteron A1100的性能,据AMD自已公布的“预估”数据,是SPECint_rate得分为80左右,平均每核心得分为10,而Atom C2750的SPECint_rate的峰值可达101,Base值也有97.9,平均每核12.23。
考虑到Atom C2750时钟频率比Opteron A1100略高,以及ARM处理器更重视节能而非性能的传统,这个结果倒还可以接受。但如果再结合功耗上的对比,AMD这个首款64位ARM架构服务器处理器的表现就有点让人上火了,AMD自己给出的预估数据是25W,而Atom C2750只有20W。
虽然不排除AMD还会披露更多“真实”,而非“预估”的性能或功耗数据,但无论如何,只要这些数据体现出来的性能,功耗,或者是两者的比值——性能功耗比无法领先、甚至是大幅领先英特尔的产品的话,客户就难有足够的动力从x86向它迁移。毕竟,软件迁移是需要成本的,而且真咬牙做了迁移,又只迁移了一部分应用的话,用户还会面临同时开发、维护两个架构的麻烦,所有这都是需要大笔投入的,如果今天投出的这些资金不能在未来节省回来,或者是赚回来的话,CEO和投资者可能就要拍桌子了,而原本以为ARM带来的系统价格、空间和电能节省不但能抵销应用迁移成本,之后还能有得赚的用户们,在看到这样的对比后,恐怕也要三思而后行了。
当然,看中ARM架构处理器可定制特性的用户,还是有足够的理由去尝试它的,但这些用户就相当于数据中心领域的极客们,相信他们对总拥有成本和投资回报的计算方式,将很难被需求与之不同的普通用户所复制和引用的。
所以,ARM和他的小伙伴们,接下来最根本的任务依然是继续赶路,提升自己微型服务器产品的性能功耗比优势。这个任务可并不容易完成,因为英特尔从不像其他强者那样轻视自己的对手,也没有坐等别人追上来的习惯。就在AMD放出消息说要在二季度Q2提供64位ARM芯片样品,并在第四季度大规模上市时,英特尔已经在准备于年内推出下一代Atom服务器SoC芯片“Denverton”了,这可是款14纳米制程的芯片。
好文章,需要你的鼓励
卡内基梅隆大学发布了他们的一项最新研究,他们对20多个开源推理模型进行了后训练,涵盖数学推理、科学问答、代码生成、指令遵循等多个维度,最终发现,数学能力优异的模型,在其他任务上表现平平,甚至还不如未加强数学推理能力的原始模型
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
Meta正在建设名为Hyperion的数据中心,预计提供5千兆瓦算力支持其AI实验室。该项目占地面积足以覆盖曼哈顿大部分区域,位于路易斯安那州东北部,将在数年内扩展至5GW规模。此外,Meta还计划在2026年启用1GW的Prometheus超级集群。这些项目旨在提升Meta在AI竞赛中对抗OpenAI和谷歌的竞争力,但也将消耗大量电力和水资源。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。