随着企业数字化转型进程的加速及新兴技术的大规模应用,业界对多元化、高质量和绿色算力的需求与日俱增。近期,英特尔发布的英特尔® 至强® 6性能核处理器,凭借创新的微架构、显著提升的核心数量、双倍内存带宽,以及对PCIe 5.0和CXL 2.0等最新技术的支持等领先特性,实现了整体性能的显著提升,能够应对边缘、数据中心、云环境的严苛挑战,是数据中心的理想选择。
在云计算领域,相比上一代处理器,至强6性能核处理器能够提供多达2倍的每路核心数,并实现平均单核性能提升1.2倍、每瓦性能提升1.6倍,且帮助云服务提供商(CSP)在同等性能水平下实现平均30% TCO的显著下降。在科学计算中,至强6性能核处理器则凭借MRDIMM实现更强存力,并通过英特尔® AVX-512输出更高算力,从而实现2.31倍NEMO geomean代际性能提升、2.43倍OpenFOAM geomean代际性能提升,以及2.5倍HPCG代际性能提升。
现阶段,以深度学习、机器学习等算法为代表的AI技术正步入高速发展时期,对计算资源的需求急剧增加。而得益于内置的AI加速功能——英特尔® 高级矩阵扩展 (AMX) 和专门面向AI优化的英特尔® AVX-512提高性能与效率,至强6性能核处理器凭借在运行AI工作负载上展现出的卓越性能,已成为数据中心和CSP的优选机头。
值得注意的是,在软件优化的加持下,至强6性能核处理器能够在运行多元化AI工作负载时展现出最佳性能。如在运行7亿参数的Llama2 INT4推理任务时,至强6性能核处理器提供了比AMD Turin 128核处理器更高的吞吐量。而在诸如文本摘要、聊天机器人和翻译这类生成式AI应用中,至强6性能核处理器分别展现出了约2.1倍、5.4倍及1.17倍的性能提升。
此外,在最新的MLPerf推理v4.1基准测试中,至强6性能核处理器与第五代至强处理器相比,实现了AI性能约1.9倍的几何平均值提升。特别是在自然语言处理任务BERT上,其相比第三代至强处理器性能提升高达17倍,而在计算机视觉任务ResNet50上,性能提升也高达15倍。而这主要得益于至强6性能核处理器的先进架构,包括对英特尔AMX的支持,以及优化的内存带宽等创新。
现阶段,以至强6900P系列处理器为代表的至强6性能核处理器已上市,并被诸多CSP广泛应用至实践中。面对AI时代对算力多元、高效的需求,英特尔通过持续加速创新,打造包括至强6处理器在内的领先硬件,以及开发者首选的软件工具、开发套件和优化库,从而助力生态伙伴以提升的性能拓展新商机,并实现关键业务成果。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。