PCI特殊兴趣小组(PCI-SIG)刚刚发布了PCIe 7.0的官方规范,再次将高性能设备(如网卡)的带宽翻倍,同时暗示PCIe 8.0可能无法实现同样的提升幅度。
本次发布的重点数据是带宽翻倍,原始比特率达到128 GTps(千兆传输每秒)。在x16通道配置下,这意味着双向传输速度可达512 GBps。
2022年确定规范的PCIe 6.0支持64 GTps,在16通道配置下最大带宽为256 GBps。
这种容量增长对于800 Gbps以太网适配器等高吞吐量设备以及高性能计算(HPC)和机器学习等数据密集型应用来说是必需的。但与之前的版本一样,从最终规范发布到产品上市通常会有至少12-18个月的滞后期。
例如,目前市场上PCIe 6.0设备还很少见。美光去年宣布推出业界首款PCIe Gen6 SSD,声称在测试中顺序读取速度可超过26 GBps。虽然在贸易展会上已有展示,但仅作为演示产品。
作为监管该标准的行业组织,PCI-SIG现已向其成员组织分发PCIe 7.0规范。大部分细节在过去一年左右发布的草案版本中已经公布。
PCI-SIG主席Al Yanes表示:"PCIe技术二十多年来一直是高带宽、低延迟IO互连的首选,我们很高兴宣布PCIe 7.0规范的发布,这延续了我们每三年将IO带宽翻倍的长期传统。"
PCI-SIG还宣布了首次使用光纤链路实现PCIe的行业标准规范。
这通过光感知中继器工程变更通知(ECN)实现,该通知修订了PCIe 6.4规范和新的PCIe 7.0规范,加入了PCIe中继器组件,该组件可以重新生成和重新定时数据信号,避免在跨机架等相对长距离扩展链路时出现信号劣化。
Yanes说:"我们看到了对基于PCIe技术的行业标准光互连的需求,光感知中继器ECN是添加模块化光学解决方案的第一步。"
他补充说,该技术的初期应用可能主要在AI/ML和云计算等数据中心应用中,但随着时间推移变得更加普及,在许多市场领域都会有众多应用场景。
为了继续满足数据中心带宽需求的持续增长,PCIe 8.0规范的探索工作已经开始。
然而,在圣克拉拉PCI-SIG开发者大会上宣布7.0规范的新闻发布会上,Yanes表示PCI-SIG无法保证下一版本会延续每代带宽翻倍的传统。
他说:"我们希望再次翻倍,但目前不想做出任何确定的承诺。"
如果可能实现,PCIe 8.0在使用16通道时的带宽有望达到每秒1TB。
在回答问题时,Yanes表示他不认为PCIe 8.0最终会实现为纯光学接口。
他声明:"我们相信可以同时支持电气和光学。我们不认为只会是光学接口。"
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。