英特尔今天推出了一项新的互连技术,旨在让服务器能够更好地利用图形卡、现场可编程门阵列和其他针对特定工作负载优化的加速器芯片。
Compute Express Link(CXL)旨在成为一项行业标准,可与多家硬件制造商的产品配合使用。为此,英特尔已将该技术贡献给一个新成立的联盟,有兴趣使用该技术的公司都可以成为联盟成员。联盟在成立时有六家支持者,包括思科和谷歌等知名企业。
CXL旨在将服务器CPU与设备附加的辅助加速器芯片连接起来。企业正在迅速采用加速器,特别是图形卡以加速人工智能软件等专有工作负载。
CXL基于广泛使用的PCIe标准来连接服务器组件,使用最新的第五代标准(今年早些时候正式发布),能够在某些配置下实现每秒128GB的传输性能。
英特尔已经做了大量自定义来利用这一速度优势进行芯片间的通信。CXL的主要特点之一是使CPU能够与加速器共享内存的机制,这是处理工作流程的重要组成部分。英特尔表示,该功能取代了任务通常所需的专用硬件,从而提高了系统效率。
英特尔数据中心集团负责人Navin Shenoy在博客文章中写道:“CXL保持了设备之间的内存一致性,允许资源共享以获得更高的性能,降低软件堆栈复杂性并降低整体系统成本。人工智能、媒体、图像和语言处理、加密等新兴数据处理应用将从CXL中获益匪浅。”
这次发布正值英特尔加大力度抢占加速器市场份额的时候。仅在过去一个月,英特尔就推出了一款用于处理网络流量的现场可编程门阵列,和一款旨在提高服务器安全性的三芯片PCIe卡。
更重要的是,英特尔计划明年推出第一批独立图形卡。英特尔将借助CXL应对Nvidia的NVLink互连技术,后者的芯片在该领域占据主导地位。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。