案例研究:性能价格比对于服务器芯片仍然至关重要
AMD公司宣称,其Epyc CPU在去年的F1大奖赛中发挥重要作用、一举助力梅赛德斯-AMG车队拿下总冠军。

梅赛德斯车队依靠第二代Epyc服务器处理器运行流体力学(CFD)计算软件,成功对车队的F1赛车开展空气动力学建模与测试。准确可靠的测试结果也助力AMG赛车在赛场上一骑绝尘、领先对手。
在AMD新近发布的案例研究中,梅赛德斯车队表示,与原有服务器相比、基于Epyc芯片的服务器将流体力学负载运行速度提高了20%。但很遗憾,车队并没有披露此前服务器中搭载的是哪款CPU,希望未来能有更多细节信息供我们评估比较。
无论如何,这项研究确实给我们带来启发,解释了AMD如何凭借更出色的性能价格比压倒英特尔芯片,在F1赛车等约束条件严格、由工程技术驱动的运动赛事中占据优势。
事实上,考虑到流体力学计算对于F1赛车的重要影响,赛事管理机构国际汽车联合会(FIA)对于服务器资金投入做出了严格限制,希望借此平衡各支车队间的竞争力差异。具体来讲,算力配额会按比例划定,成绩较差的车队反而能比顶级车队多拿到25%配额。
这意味着在2021赛季中名列前茅的梅赛德斯车队,比其他车队更需要关注同等资金投入换来的流体力学计算性能。否则,他们在给定时间内所能运行的几何模型模拟任务量将逊色于其他车队,甚至根本无法按时完成动力学计算任务。
梅赛德斯车队空气动力学软件开发负责人Simon Williams表示,他们之所以选择了第二代Epyc CPU,就是因为这款处理器能更快完成流体力学计算、从而缩短确定最佳空气动力学条件的必要周期。
他解释道,“AMD Epyc服务器帮助我们并发运行更多计算任务。空气动力学专家们可以在早晨上班时拿到最新分析结果,在工作期间完成新设计、并在夜间进行第二轮分析。这样次日早上回来时,新一轮结果就再次摆在面前——迭代迅速、效率极高。”
Williams还提到,单块Epyc CPU带来的更强性能,也让梅赛德斯车队得以削减数据中心的占地空间——这项指标同样受到国际汽联的严格约束。
凭借着Epyc处理器的性价比优势,AMD公司已经在过去几年中不断从英特尔手上夺回服务器CPU市场份额。我们期待看到AMD Epyc最终能不能顺利超越英特尔引以为傲的至强服务器处理器。当然,随着近来英特尔Alder Lake PC芯片获得的高度评价、特别是即将推出的新一代Sapphire Rapids CPU,也许AMD并不一定能笑到最后。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。