英特尔今天推出了一项新的互连技术,旨在让服务器能够更好地利用图形卡、现场可编程门阵列和其他针对特定工作负载优化的加速器芯片。
Compute Express Link(CXL)旨在成为一项行业标准,可与多家硬件制造商的产品配合使用。为此,英特尔已将该技术贡献给一个新成立的联盟,有兴趣使用该技术的公司都可以成为联盟成员。联盟在成立时有六家支持者,包括思科和谷歌等知名企业。
CXL旨在将服务器CPU与设备附加的辅助加速器芯片连接起来。企业正在迅速采用加速器,特别是图形卡以加速人工智能软件等专有工作负载。
CXL基于广泛使用的PCIe标准来连接服务器组件,使用最新的第五代标准(今年早些时候正式发布),能够在某些配置下实现每秒128GB的传输性能。
英特尔已经做了大量自定义来利用这一速度优势进行芯片间的通信。CXL的主要特点之一是使CPU能够与加速器共享内存的机制,这是处理工作流程的重要组成部分。英特尔表示,该功能取代了任务通常所需的专用硬件,从而提高了系统效率。
英特尔数据中心集团负责人Navin Shenoy在博客文章中写道:“CXL保持了设备之间的内存一致性,允许资源共享以获得更高的性能,降低软件堆栈复杂性并降低整体系统成本。人工智能、媒体、图像和语言处理、加密等新兴数据处理应用将从CXL中获益匪浅。”
这次发布正值英特尔加大力度抢占加速器市场份额的时候。仅在过去一个月,英特尔就推出了一款用于处理网络流量的现场可编程门阵列,和一款旨在提高服务器安全性的三芯片PCIe卡。
更重要的是,英特尔计划明年推出第一批独立图形卡。英特尔将借助CXL应对Nvidia的NVLink互连技术,后者的芯片在该领域占据主导地位。
好文章,需要你的鼓励
Snap 推出 Lens Studio 的 iOS 应用和网页工具,让所有技能层次的用户都能通过文字提示和简单编辑,轻松创建 AR 镜头,包括生成 AI 效果和集成 Bitmoji,从而普及 AR 创作,并持续为专业应用提供支持。
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。