英特尔 IPU 能够提高数据中心效率与可管理性,是目前唯一与超大规模云合作伙伴共同构建的 IPU产品。
新闻:在今日举行的Six Five峰会上,英特尔公布了其对基础设施处理器 (IPU) 的愿景。IPU是一种可编程网络设备,旨在使云和通信服务提供商减少在中央处理器 (CPU) 方面的开销,并充分释放性能价值。利用 IPU,客户能够部署安全稳定且可编程的解决方案,从而更好地利用资源,平衡数据处理与存储的工作负载。
Guido Appenzeller,英特尔数据平台事业部首席技术官表示:“IPU 是一种全新的技术类别,是英特尔云战略的重要支柱之一。它扩展了我们的智能网卡功能,旨在应对当下复杂的数据中心,并提升效率。在英特尔,我们致力于携手客户及合作伙伴构建解决方案、创造新型技术,而IPU 就是这种合作的典范。”
工作原理:IPU是一个可编程的网络设备,能够对数据中心内的基础设施功能进行安全加速,从而使系统级资源的管理更加智能。
通过IPU,云运营商可以转向完全虚拟化的存储和网络架构,同时保持超高的性能、以及强大的可预测性与可控性。
通过特定功能,IPU 可对数据中心中基于微服务架构的现代应用程序进行加速。 谷歌和 Facebook 的研究表明,微服务通信开销可消耗 22%[i]到 80%[ii]的CPU性能。
借助IPU,云提供商可以安全地管理基础设施功能,同时为客户提供对CPU和系统内存功能的全面控制力。
IPU可以提供的能力包括:
• 通过专用协议加速器来加速基础设施功能,包括存储虚拟化、网络虚拟化和安全。
• 通过把软件中的存储和网络虚拟化功能从CPU转移到IPU,从而释放CPU核心。
• 允许灵活的工作负载分配,提高数据中心利用率。
• 允许云服务提供商根据软件速度对基础设施功能进行定制化部署
Patty Kummrow,英特尔公司数据中心事业部副总裁兼以太网产品部总经理表示:“英特尔与绝大多数超大规模云服务提供商建立了紧密的合作关系。通过至强D、FPGA和以太网组件的广泛部署,英特尔已在IPU市场出货量上位于领先地位。英特尔首个基于 FPGA 的 IPU 平台已为多个云服务提供商完成部署,我们的首款 ASIC IPU 也正在测试中。”
百度主任系统架构师王雁鹏表示:“百度和英特尔在IPU领域展开全面合作,基于英特尔的IPU解决方案,百度自研智能网卡实现裸金属、虚机、容器多种算力在网络和存储功能的全面卸载和统一,极大地赋能了百度云主机产品。”
下一步:英特尔将推出更多基于FPGA的IPU平台和专用 ASIC,这些解决方案建立在强大的软件基础之上,使客户能够构建领先的云编排软件。
重要意义:不断演进的数据中心将需要一个全新的智能架构。这一架构内,大规模分布式异构计算能够协同工作,无缝连接,形成一个独立的计算平台。这种新架构将有助于解决当今资源搁浅、数据流拥堵和平台安全不兼容的挑战。 这种智能数据中心架构将拥有三类计算单元——用于通用计算的 CPU、用于特定应用或特定工作负载加速的 XPU 以及用于基础设施加速的 IPU——它们将通过可编程网络相互连接,从而有效利用数据中心资源。
好文章,需要你的鼓励
NVIDIA团队开发的SANA-Sprint技术实现了AI图像生成的重大突破,将传统需要20步的生成过程压缩至1步,在H100上仅需0.1秒即可生成1024×1024高清图像,速度比现有最快模型提升10倍以上。该技术通过创新的混合蒸馏策略,在大幅提升速度的同时保持了图像质量,并支持实时交互应用,为AI绘画从专业工具向大众应用的转变奠定了基础。
初创公司Positron获得5160万美元A轮融资,推出专门针对AI推理的Atlas芯片。该公司声称其芯片在性能功耗比和成本效益方面比英伟达H100高出2-5倍,并已获得Cloudflare等企业客户采用。Positron专注于内存优化设计,无需液体冷却,可直接部署在现有数据中心。公司计划2026年推出支持16万亿参数模型的下一代Titan平台。
北京人工智能研究院团队开发的DiagNote模型通过模仿人类做笔记的习惯,解决了AI在多轮视觉对话中容易"失忆"的问题。该研究构建了专门的MMDiag数据集,设计了双模块协作的AI架构,让机器学会像人类一样通过标记重点区域来保持专注力,为更自然的人机视觉交流奠定了基础。