OpenCAPI(Open Coherent Accelerator Processor Interface)联盟已经成立,承诺制订一个新的、开放的规范,可以提高数据中心服务器性能10倍之多,通过使用新的CPU-内存-IO适配卡的互连机制——但是英特尔并不是联盟成员。
OpenCAPI联盟称,一种以数据为核心的方法,“为不同类型的技术提供了一种开放的、高速的路径,包括高级内存、加速器、网络和存储,以更紧密地在服务器内进行集成”。
该联盟称这“是让计算能力更靠近数据,消除传统系统架构中的低效率,帮助打消系统瓶颈,可以大幅度提升服务器性能”。
该设计规范旨在“最大限度降低高性能加速器设计的复杂性。OpenCAPI可以实现每秒25Gbits的数据速率,性能超出了现有的PCIe规范,后者最高可以达到每秒16Gbits的数据传输速率”。
该联盟在公告中称:“很多技术公司已经开发了创新的解决方案,当前的数据中心因为传统接口的局限性而无法有效地利用这些方案。支持新型工作负载的存储级内存和加速器这样的新技术,无法与现有接口很好地匹配,封闭的、专有的方法不能让整个行业完全参与进行,或者进行有效地创新。”
OpenCAPI是由AMD、Google、IBM、Mellanox以及Micron创建的,其他成员还包括Dell EMC、HPE、Nvidia以及Xilinx
很多成员即将推出的产品/技术包括:
所以目前主要还是Power9来推动OpenCAPI的。
OpenCAPI联盟计划在今年年底前免费向公众全面提供OpenCAPI规范。你可以在opencapi.org网站上找到这方面的信息,以及成员信息。
对了,另外绝大多数服务器CPU的提供商英特尔目前并不是该联盟的成员,但该联盟表示,欢迎英特尔的加入。
背景
背景信息包括,英特尔在2015年12月以167亿美元收购了FPGA提供商Altera,而且英特尔现在有自己的QPI(Quick Path Interconnect)技术,更不用说硅光子了。
在我们看来,似乎OpenCAPI与Gen-Z Consortium开放内存架构项目有重叠的地方。两个组织都是未来解决内存/存储级内存互连的问题。
Gen-Z旨在提供一种直连的、交换或者架构技术——一种灵活的、高性能内存语义架构——以互连计算(SoC内存)、FPGA以及GPU加速器、池化内存、网络/存储IO链接。
OpenCAPI目的是允许任何微处理器能够连接到一致的用户级加速器和I/O设备,高级内存通过读写或者用户级DMA语义是可访问的。
然后,由AMD、ARM、华为、IBM、Mellanox、高通、Xillinx在5月创建的CCIX(Cache Coherent Interconnect for Accelerators)组织(没有Nvidia和英特尔)将设计和制造一种缓存一致的互联架构,连接多个提供商的CPU、加速器——FPGA和GPU以及网络适配器,这样它们就可以交换数据和共享主内存。
为什么会有这三个有重叠的项目?答案很简单,这些联盟的成员都不希望让英特尔独占CPU-内存-加速器-网络接口技术,从而从更多客户那里得到在服务器上的开支。
他们都认为,PCI接口速度太慢,需要一种高速低延迟的互连机制,让处理器能够更快速地与更高速的加速器、DRAM、各种存储级内存(例如XPoint)以及RDMA访问的外部阵列进行通信。
Gen-Z联盟成员包括AMD、ARM、博通、Cavium、Cray、Dell EMC、HPE、华为、IBM、IDT、联想、Mellanox、Micron、Microsemi、Red Hat、三星、希捷、SK Hynix、西数和Xillinx。
Google和Nvidia只是OpenCAPI联盟的成员,但不是Gen-Z的成员。
对OpenCAPI的支持
OpenCAPI称:“这三个联盟总共得到了超过30家领先技术公司的支持,并欢迎每一家的公告作为整个行业合作努力的一部分,为未来打造一个开放的数据中心架构。”
其中,Micron公司副总裁、计算及网络业务总经理Tom Eby表示:“因为开放标准是快速创新的最佳机会,因此OpenCAPI、Gen-Z以及CCIX联盟是一个重要步骤,确保这些架构的开发可以快速专注新型内存技术所带来的巨大优势。”
CCIX主席Gaurav Singh表示:“CCIX企业联盟相信,需要促进行业的创新。我们欢迎各种创新努力,期待与Gen-Z和OpenCAPI联盟合作,将进一步推动定义未来数据中心的关键技术的开发。”
Gen-ZL联盟总裁Kurtis Bowman表示:“Gen-Z联盟致力于创建一个生态系统,让成员、更广泛的行业、客户一同携手提供强大的、高质量的、能够实现新型数据中心架构的规范。这三个新联盟的创新,得到了超过30家行业领先的全球公司的支持,未来的数据中心需要开放的标准,我们期待与CCIX和OpenCAPI合作让这种新的生态系统逐步形成。”
评论
任何替代英特尔架构互连技术的非专有技术的重要客户包括:
粗略来看,这三个联盟代表着重叠的反英特尔联盟,希望约束和限制英特尔获取更多的服务器芯片组件市场份额。对他们来说,如果他们可以结合起来成为单一的CCIX、OpenCAPI和Gen-Z组织的话,那么会更有希望一些,但是独立成员的担忧和技术倾向性可能会阻碍这种尝试,难以成功做到。尽管如此,他们还是会尝试的。
可以肯定的是,英特尔将会面对三个部分重叠的组织,这些都会给购买互连技术的客户带来困扰,与三个组织让人困惑的信息和自己的时间表,他们更应该传递一个更清晰、更简单的信息。CPU-内存-网络互连的技术大战正在上演。
好文章,需要你的鼓励
Anthropic发布SCONE-bench智能合约漏洞利用基准测试,评估AI代理发现和利用区块链智能合约缺陷的能力。研究显示Claude Opus 4.5等模型可从漏洞中获得460万美元收益。测试2849个合约仅需3476美元成本,发现两个零日漏洞并创造3694美元利润。研究表明AI代理利用安全漏洞的能力快速提升,每1.3个月翻倍增长,强调需要主动采用AI防御技术应对AI攻击威胁。
NVIDIA联合多所高校开发的SpaceTools系统通过双重交互强化学习方法,让AI学会协调使用多种视觉工具进行复杂空间推理。该系统在空间理解基准测试中达到最先进性能,并在真实机器人操作中实现86%成功率,代表了AI从单一功能向工具协调专家的重要转变,为未来更智能实用的AI助手奠定基础。
Spotify年度总结功能回归,在去年AI播客功能遭遇批评后,今年重新专注于用户数据深度分析。新版本引入近十项新功能,包括首个实时多人互动体验"Wrapped Party",最多可邀请9位好友比较听歌数据。此外还新增热门歌曲播放次数显示、互动歌曲测验、听歌年龄分析和听歌俱乐部等功能,让年度总结更具互动性和个性化体验。
这项研究解决了现代智能机器人面临的"行动不稳定"问题,开发出名为TACO的决策优化系统。该系统让机器人在执行任务前生成多个候选方案,然后通过伪计数估计器选择最可靠的行动,就像为机器人配备智能顾问。实验显示,真实环境中机器人成功率平均提升16%,且系统可即插即用无需重新训练,为机器人智能化发展提供了新思路。