ZD至顶网服务器频道 06月30日 新闻消息:尽管到明年年初之前,每秒16G传输规格仍然不会过时,但目前已经有一系列芯片产品开始引入PCIe 4.0技术。一旦得到全面铺开,PCI利益集团(简称PCI SIG)将着手研发下一代5.0方案,其运行标准将达到每秒25 Gbits甚至32 Gbits。
Cadence、PLDA与Synopsys等厂商已经在PCI SIG的年度开发者大会上分别展示了其PCIe 4.0物理层控制器、交换机与其它IP模块。各厂商同时拿出了可工作芯片、电路板与基板,其中皆包含有利用PCIe 4.0实现的每秒100 Gbit Infiniband交换芯片。
自上一次大规模标准——即每秒8 Gbits PCIe 3.0——更新以来,PCI SIG已经有六年时间没有发布新的技术方案。这一次,其推出的4.0版本可能将成为最后一款基于铜质材料的芯片到芯片互连机制。不过在此之后,以太网与光纤通道仍将发布铜质网络方案,速度分别为每秒25 Gbits与32 Gbits。
“可以肯定的是,PCIe还将迎来下一代升级方案,我们只需要对其细节进行敲定,”PCI SIG总裁Al Yanes在其年度开发者大会的一场新闻发布会上指出。
Cadence公司展示一块利用PCIe 4.0接入其控制器(右侧红色电路板)的Mellanox 100G Infiniband交换机芯片(左侧)。
不过关于5.0版本的疑问仍然很多,其中包括其是否向下兼容以及是否仍然作为当前全部PCIe标准所采取的芯片到芯片链接定位。
“我们无法再从编码方面实现改进,”Yanes指出,3.0版本则针对上代的8b/10b水平提升至128b/130b。“但使用256编码无法带来更理想的提升,因此我们面临可能只剩下提升频率这一条道路了,”他进一步补充称。
市场需求则源自当前各类常见用例。由于网卡传输速度已经达到每秒100 Gbit,必然要求有速度更快的芯片链接。另外,下一代图形处理器与固态驱动器的陆续推出也将在性能层面向厂商提出要求。
面向732家企业客户创造出一套同时适用于从智能手机到超级计算机的广泛应用场景的技术标准显然不那么容易。随着数据传输速率的不断提升与信号频段的收窄,PCIe新版本的研发周期已经由过去的3年延长至如今的7年。
PLDA(来自法国普罗旺斯地区的艾克斯)在FPGA上使用交换芯片,旨在打造一套面向PCIe 4.0的测试板。
PCIe 4.0标准的0.7版本目前正在进行审核,预计将在下个月得到批准。在此之后,工程师们将把该规范引入一系列实验室测试,旨在验证其功能与参数,并最终将其审定为0.9版本。再经过最终阶段的调试与检测,其1.0标准版本预计将在明年4月推出。
该集团曾于一年前表示,其希望能够在去年年内完成0.7版本草案,即在2015年年末前敲定一切需要加入最新版本的功能。“不过将各类新特性纳入方案的工作,显然需要耗费超出预期的时间,”Yanes表示。
新功能的引入过程显然并不顺利,特别是其中的信道建模机制——其允许系统工程师以目测方式检查互连体系中的每条通道,并查看其拥有多大的设计余量。
“4.0规范的制定已经耗费了相当长的时间。我们的很多客户都在迫切要求其推出,因为他们发现目前的0.7版本草案并不够理想,”Synopsys公司IP部门高级产品营销经理Scott Knowlton指出。
Cadence(在上)与Synopsys两家公司展示了运行在其IP模块上的PCIe 4.0信道建模功能。
“我们的一家客户强调称,新规范的出台实在太过迟缓。为了不错过市场营销周期,他们会很快推出相关设备,并随后再考虑合规方面的工作,”Cadence公司IP部门PCIe专家Arif Khan表示。
今年早些时候,IBM公司曾为其下一代服务器处理器Power9公布了一系列规范,其中就包括对PCIe 4.0的支持能力。
4.0规范为了实现更高数据传输速率而在传输距离方面稍做牺牲,其目前传输有效范围为12至14英寸。因此,在3.0版本中就比较常见的转接定时器与转接驱动器可能会在未来得到更为广泛的应用。
在此次大会上,Cadence与Synopsys两家公司都展示了该信道建模功能在其IP模块芯片上的运行效果。其中Cadence公司的芯片采用16纳米FinFET制程,而Synopsys方面表示其模块能够较上代PCIe模块在延迟与面积方面分别降低20%与15%。
Pericom公司展示了面向PCIe的每秒12 Gbit转接驱动模块,并表示其成本仅为完整转接定时器的四分之一。不过未来一到两年内,我们恐怕还无法买到能够完整实现每秒16 Gbit标准的转换驱动器。
好文章,需要你的鼓励
三星与AI搜索引擎Perplexity合作,将其应用引入智能电视。2025年三星电视用户可立即使用,2024和2023年款设备将通过系统更新获得支持。用户可通过打字或语音提问,Perplexity还为用户提供12个月免费Pro订阅。尽管面临版权争议,这一合作仍引发关注。
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
苹果M5 MacBook Pro评测显示这是一次相对较小的升级。最大变化是M5芯片,CPU性能比M4提升约9%,多核性能比M4 MacBook Air快19%,GPU性能提升37%。功耗可能有所增加但电池续航保持24小时。评测者认为该产品不适合M4用户升级,但对使用older型号用户仍是强有力选择。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。