ZD至顶网服务器频道 03月12日 新闻消息: 首先,微软表示将与Cavium公司合作,在Cavium的ARM服务器处理器上运行微软Azure云工作负载。其次,微软将与高通公司合作,开发一款ARM版的Windows Server平台。
这次公布表明微软正在向ARM处理器迈出重要一步,目前ARM处理器还无法在由英特尔x86服务器主导的数据中心领域内取得任何进展。
Cavium表示,与微软的合作涉及到“评估和实现”Azure云工作负载在基于ARM的ThunderX2数据中心处理器上的运行。关于这次合作,本周举行的Open Summit峰会也也展示了在开源版Windows Server运行Web服务,而以前这是内部在ThunderX2上运行云工作负载的。
Cavium的芯片是第二代64位ARMv8偏上系统设计,针对云、数据中心和高性能计算工作负载。第一代ARM芯片基本上都无法在数据中心取得任何进展,但是很多人认为,第二代设计有潜力做得更好,特别是现在得到了很多像微软这些知名公司的背书。
Cavium的高管认为,少量的第一代ARM处理器数据中心部署有助于开始将那些对该设计感兴趣的合作伙伴集合起来构建一个生态系统。现在,第二代ARM芯片是时候取得更大的进展了。
Cavium数据中心处理器部门总经理Gopal Hedge在声明中表示:“我们看到第二代产品让ARM服务器部署覆盖主流卷应用出现了转折点。”
Cavium表示,与微软的合作源于开发了一个支持64位架构的内部版Windows Server。两家公司还合作开发了一个基于微软Project Olympus的服务器平台,Project Olympus是微软的下一代超大规模云硬件设计,被视为OCP社区的开源硬件开发新模型。该平台在一个双路配置中集成了2个ThunderX2处理器。芯片自身集成了多个定制的ARMv8-A核心,外加向微软Azure的IO接入。
而且微软在Open Compute Project Summit峰会上表示,微软正在与智能手机芯片制造商高通合作,开发基于ARM的Windows Server。此外,高通表示,第二代ARM处理器Centriq 2400将与Project Olympus数据中心设计集成。
Project Olympus“采用了开源协同的模式,虽然已经被软件接受,但是与开发硬件的物理需求是不一致的,”微软Azure硬件基础设施总经理Kushagra Vaid在一篇关于该项目的博客文章中这样写道。“我们正在通过采取一种截然不同的方法,贡献我们的下一代云硬件设计,现在大约完成了50%。”
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。