PCIe 4.0迈向代工阶段，5.0则仍身处实验室环境

尽管到明年年初之前，每秒16G传输规格仍然不会过时，但目前已经有一系列芯片产品开始引入PCIe 4.0技术。一旦得到全面铺开，PCI利益集团（简称PCI SIG）将着手研发下一代5.0方案，其运行标准将达到每秒25 Gbits甚至32 Gbits。

ZD至顶网服务器频道 06月30日新闻消息：尽管到明年年初之前，每秒16G传输规格仍然不会过时，但目前已经有一系列芯片产品开始引入PCIe 4.0技术。一旦得到全面铺开，PCI利益集团（简称PCI SIG）将着手研发下一代5.0方案，其运行标准将达到每秒25 Gbits甚至32 Gbits。

Cadence、PLDA与Synopsys等厂商已经在PCI SIG的年度开发者大会上分别展示了其PCIe 4.0物理层控制器、交换机与其它IP模块。各厂商同时拿出了可工作芯片、电路板与基板，其中皆包含有利用PCIe 4.0实现的每秒100 Gbit Infiniband交换芯片。

自上一次大规模标准——即每秒8 Gbits PCIe 3.0——更新以来，PCI SIG已经有六年时间没有发布新的技术方案。这一次，其推出的4.0版本可能将成为最后一款基于铜质材料的芯片到芯片互连机制。不过在此之后，以太网与光纤通道仍将发布铜质网络方案，速度分别为每秒25 Gbits与32 Gbits。

“可以肯定的是，PCIe还将迎来下一代升级方案，我们只需要对其细节进行敲定，”PCI SIG总裁Al Yanes在其年度开发者大会的一场新闻发布会上指出。

Cadence公司展示一块利用PCIe 4.0接入其控制器（右侧红色电路板）的Mellanox 100G Infiniband交换机芯片（左侧）。

不过关于5.0版本的疑问仍然很多，其中包括其是否向下兼容以及是否仍然作为当前全部PCIe标准所采取的芯片到芯片链接定位。

“我们无法再从编码方面实现改进，”Yanes指出，3.0版本则针对上代的8b/10b水平提升至128b/130b。“但使用256编码无法带来更理想的提升，因此我们面临可能只剩下提升频率这一条道路了，”他进一步补充称。

市场需求则源自当前各类常见用例。由于网卡传输速度已经达到每秒100 Gbit，必然要求有速度更快的芯片链接。另外，下一代图形处理器与固态驱动器的陆续推出也将在性能层面向厂商提出要求。

面向732家企业客户创造出一套同时适用于从智能手机到超级计算机的广泛应用场景的技术标准显然不那么容易。随着数据传输速率的不断提升与信号频段的收窄，PCIe新版本的研发周期已经由过去的3年延长至如今的7年。

PLDA（来自法国普罗旺斯地区的艾克斯）在FPGA上使用交换芯片，旨在打造一套面向PCIe 4.0的测试板。

PCIe 4.0标准的0.7版本目前正在进行审核，预计将在下个月得到批准。在此之后，工程师们将把该规范引入一系列实验室测试，旨在验证其功能与参数，并最终将其审定为0.9版本。再经过最终阶段的调试与检测，其1.0标准版本预计将在明年4月推出。

该集团曾于一年前表示，其希望能够在去年年内完成0.7版本草案，即在2015年年末前敲定一切需要加入最新版本的功能。“不过将各类新特性纳入方案的工作，显然需要耗费超出预期的时间，”Yanes表示。

新功能的引入过程显然并不顺利，特别是其中的信道建模机制——其允许系统工程师以目测方式检查互连体系中的每条通道，并查看其拥有多大的设计余量。

“4.0规范的制定已经耗费了相当长的时间。我们的很多客户都在迫切要求其推出，因为他们发现目前的0.7版本草案并不够理想，”Synopsys公司IP部门高级产品营销经理Scott Knowlton指出。

Cadence（在上）与Synopsys两家公司展示了运行在其IP模块上的PCIe 4.0信道建模功能。

“我们的一家客户强调称，新规范的出台实在太过迟缓。为了不错过市场营销周期，他们会很快推出相关设备，并随后再考虑合规方面的工作，”Cadence公司IP部门PCIe专家Arif Khan表示。

今年早些时候，IBM公司曾为其下一代服务器处理器Power9公布了一系列规范，其中就包括对PCIe 4.0的支持能力。

4.0规范为了实现更高数据传输速率而在传输距离方面稍做牺牲，其目前传输有效范围为12至14英寸。因此，在3.0版本中就比较常见的转接定时器与转接驱动器可能会在未来得到更为广泛的应用。

在此次大会上，Cadence与Synopsys两家公司都展示了该信道建模功能在其IP模块芯片上的运行效果。其中Cadence公司的芯片采用16纳米FinFET制程，而Synopsys方面表示其模块能够较上代PCIe模块在延迟与面积方面分别降低20%与15%。

Pericom公司展示了面向PCIe的每秒12 Gbit转接驱动模块，并表示其成本仅为完整转接定时器的四分之一。不过未来一到两年内，我们恐怕还无法买到能够完整实现每秒16 Gbit标准的转换驱动器。

来源：ZD至顶网服务器频道

PCIe
芯片

0赞

好文章，需要你的鼓励

推荐文章

OpenAI CEO阿尔特曼承认当前处于AI泡沫期

人工智能

大语言模型

市场泡沫

2025-08-19

OpenAI CEO阿尔特曼承认当前处于AI泡沫期

OpenAI首席执行官Sam Altman表示，鉴于投资者的AI炒作和大量资本支出，我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋，但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户，是全球第五大网站。由于服务器容量不足，OpenAI无法发布已开发的更好模型，计划在不久的将来投资万亿美元建设数据中心。

阿里巴巴突破AI说话人视频生成技术壁垒：首次实现动作自然度、唇同步准确性和视觉质量的完美平衡

人工智能

音频驱动动画

多目标优化

2025-08-19

阿里巴巴突破AI说话人视频生成技术壁垒：首次实现动作自然度、唇同步准确性和视觉质量的完美平衡

阿里巴巴团队提出FantasyTalking2，通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集，训练三个专业模块分别优化不同维度，再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术，用户评价提升超12%。

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

人工智能

自然语言处理

混合架构优化

2025-08-19

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

英伟达推出新的小型语言模型Nemotron-Nano-9B-v2，拥有90亿参数，在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构，支持多语言处理和代码生成，可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程，并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练，采用企业友好的开源许可协议，支持商业化使用。

UC Berkeley团队突破AI内存瓶颈：让大模型推理快7倍的神奇方法

人工智能

内存优化

算法创新

2025-08-19

UC Berkeley团队突破AI内存瓶颈：让大模型推理快7倍的神奇方法

UC Berkeley团队提出XQUANT技术，通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7，升级版XQUANT-CL更可实现12.5倍节省，同时几乎不影响模型性能。研究针对现代AI模型特点进行优化，为在有限硬件资源下运行更强大AI模型提供了新思路。

2016

06/30

11:55

分享

点赞

最新文章

相关文章

邮件订阅

白皮书

更多

数字化转型方略

更多

AI启示录

更多

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

业界热点:

数字化转型

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号京网文(2025) 0096-033号京字第20868号

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　公开举报受理处置规则

网上有害信息举报专区：https://www.12377.cn

安全联盟认证