英特尔 IPU 能够提高数据中心效率与可管理性,是目前唯一与超大规模云合作伙伴共同构建的 IPU产品。
新闻:在今日举行的Six Five峰会上,英特尔公布了其对基础设施处理器 (IPU) 的愿景。IPU是一种可编程网络设备,旨在使云和通信服务提供商减少在中央处理器 (CPU) 方面的开销,并充分释放性能价值。利用 IPU,客户能够部署安全稳定且可编程的解决方案,从而更好地利用资源,平衡数据处理与存储的工作负载。
Guido Appenzeller,英特尔数据平台事业部首席技术官表示:“IPU 是一种全新的技术类别,是英特尔云战略的重要支柱之一。它扩展了我们的智能网卡功能,旨在应对当下复杂的数据中心,并提升效率。在英特尔,我们致力于携手客户及合作伙伴构建解决方案、创造新型技术,而IPU 就是这种合作的典范。”
工作原理:IPU是一个可编程的网络设备,能够对数据中心内的基础设施功能进行安全加速,从而使系统级资源的管理更加智能。
通过IPU,云运营商可以转向完全虚拟化的存储和网络架构,同时保持超高的性能、以及强大的可预测性与可控性。
通过特定功能,IPU 可对数据中心中基于微服务架构的现代应用程序进行加速。 谷歌和 Facebook 的研究表明,微服务通信开销可消耗 22%[i]到 80%[ii]的CPU性能。
借助IPU,云提供商可以安全地管理基础设施功能,同时为客户提供对CPU和系统内存功能的全面控制力。
IPU可以提供的能力包括:
• 通过专用协议加速器来加速基础设施功能,包括存储虚拟化、网络虚拟化和安全。
• 通过把软件中的存储和网络虚拟化功能从CPU转移到IPU,从而释放CPU核心。
• 允许灵活的工作负载分配,提高数据中心利用率。
• 允许云服务提供商根据软件速度对基础设施功能进行定制化部署
Patty Kummrow,英特尔公司数据中心事业部副总裁兼以太网产品部总经理表示:“英特尔与绝大多数超大规模云服务提供商建立了紧密的合作关系。通过至强D、FPGA和以太网组件的广泛部署,英特尔已在IPU市场出货量上位于领先地位。英特尔首个基于 FPGA 的 IPU 平台已为多个云服务提供商完成部署,我们的首款 ASIC IPU 也正在测试中。”
百度主任系统架构师王雁鹏表示:“百度和英特尔在IPU领域展开全面合作,基于英特尔的IPU解决方案,百度自研智能网卡实现裸金属、虚机、容器多种算力在网络和存储功能的全面卸载和统一,极大地赋能了百度云主机产品。”
下一步:英特尔将推出更多基于FPGA的IPU平台和专用 ASIC,这些解决方案建立在强大的软件基础之上,使客户能够构建领先的云编排软件。
重要意义:不断演进的数据中心将需要一个全新的智能架构。这一架构内,大规模分布式异构计算能够协同工作,无缝连接,形成一个独立的计算平台。这种新架构将有助于解决当今资源搁浅、数据流拥堵和平台安全不兼容的挑战。 这种智能数据中心架构将拥有三类计算单元——用于通用计算的 CPU、用于特定应用或特定工作负载加速的 XPU 以及用于基础设施加速的 IPU——它们将通过可编程网络相互连接,从而有效利用数据中心资源。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。