英特尔 IPU 能够提高数据中心效率与可管理性,是目前唯一与超大规模云合作伙伴共同构建的 IPU产品。
新闻:在今日举行的Six Five峰会上,英特尔公布了其对基础设施处理器 (IPU) 的愿景。IPU是一种可编程网络设备,旨在使云和通信服务提供商减少在中央处理器 (CPU) 方面的开销,并充分释放性能价值。利用 IPU,客户能够部署安全稳定且可编程的解决方案,从而更好地利用资源,平衡数据处理与存储的工作负载。
Guido Appenzeller,英特尔数据平台事业部首席技术官表示:“IPU 是一种全新的技术类别,是英特尔云战略的重要支柱之一。它扩展了我们的智能网卡功能,旨在应对当下复杂的数据中心,并提升效率。在英特尔,我们致力于携手客户及合作伙伴构建解决方案、创造新型技术,而IPU 就是这种合作的典范。”
工作原理:IPU是一个可编程的网络设备,能够对数据中心内的基础设施功能进行安全加速,从而使系统级资源的管理更加智能。
通过IPU,云运营商可以转向完全虚拟化的存储和网络架构,同时保持超高的性能、以及强大的可预测性与可控性。
通过特定功能,IPU 可对数据中心中基于微服务架构的现代应用程序进行加速。 谷歌和 Facebook 的研究表明,微服务通信开销可消耗 22%[i]到 80%[ii]的CPU性能。
借助IPU,云提供商可以安全地管理基础设施功能,同时为客户提供对CPU和系统内存功能的全面控制力。
IPU可以提供的能力包括:
• 通过专用协议加速器来加速基础设施功能,包括存储虚拟化、网络虚拟化和安全。
• 通过把软件中的存储和网络虚拟化功能从CPU转移到IPU,从而释放CPU核心。
• 允许灵活的工作负载分配,提高数据中心利用率。
• 允许云服务提供商根据软件速度对基础设施功能进行定制化部署
Patty Kummrow,英特尔公司数据中心事业部副总裁兼以太网产品部总经理表示:“英特尔与绝大多数超大规模云服务提供商建立了紧密的合作关系。通过至强D、FPGA和以太网组件的广泛部署,英特尔已在IPU市场出货量上位于领先地位。英特尔首个基于 FPGA 的 IPU 平台已为多个云服务提供商完成部署,我们的首款 ASIC IPU 也正在测试中。”
百度主任系统架构师王雁鹏表示:“百度和英特尔在IPU领域展开全面合作,基于英特尔的IPU解决方案,百度自研智能网卡实现裸金属、虚机、容器多种算力在网络和存储功能的全面卸载和统一,极大地赋能了百度云主机产品。”
下一步:英特尔将推出更多基于FPGA的IPU平台和专用 ASIC,这些解决方案建立在强大的软件基础之上,使客户能够构建领先的云编排软件。
重要意义:不断演进的数据中心将需要一个全新的智能架构。这一架构内,大规模分布式异构计算能够协同工作,无缝连接,形成一个独立的计算平台。这种新架构将有助于解决当今资源搁浅、数据流拥堵和平台安全不兼容的挑战。 这种智能数据中心架构将拥有三类计算单元——用于通用计算的 CPU、用于特定应用或特定工作负载加速的 XPU 以及用于基础设施加速的 IPU——它们将通过可编程网络相互连接,从而有效利用数据中心资源。
好文章,需要你的鼓励
谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。
武汉大学研究团队提出DITING网络小说翻译评估框架,首次系统评估大型语言模型在网络小说翻译方面的表现。该研究构建了六维评估体系和AgentEval多智能体评估方法,发现中国训练的模型在文化理解方面具有优势,DeepSeek-V3表现最佳。研究揭示了AI翻译在文化适应和创意表达方面的挑战,为未来发展指明方向。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
参数实验室等机构联合发布的Dr.LLM技术,通过为大型语言模型配备智能路由器,让AI能根据问题复杂度动态选择计算路径。该系统仅用4000个训练样本和极少参数,就实现了准确率提升3.4%同时节省计算资源的突破,在多个任务上表现出色且具有强泛化能力,为AI效率优化开辟新方向。