ZD至顶网服务器频道 06月30日 新闻消息:尽管到明年年初之前,每秒16G传输规格仍然不会过时,但目前已经有一系列芯片产品开始引入PCIe 4.0技术。一旦得到全面铺开,PCI利益集团(简称PCI SIG)将着手研发下一代5.0方案,其运行标准将达到每秒25 Gbits甚至32 Gbits。
Cadence、PLDA与Synopsys等厂商已经在PCI SIG的年度开发者大会上分别展示了其PCIe 4.0物理层控制器、交换机与其它IP模块。各厂商同时拿出了可工作芯片、电路板与基板,其中皆包含有利用PCIe 4.0实现的每秒100 Gbit Infiniband交换芯片。
自上一次大规模标准——即每秒8 Gbits PCIe 3.0——更新以来,PCI SIG已经有六年时间没有发布新的技术方案。这一次,其推出的4.0版本可能将成为最后一款基于铜质材料的芯片到芯片互连机制。不过在此之后,以太网与光纤通道仍将发布铜质网络方案,速度分别为每秒25 Gbits与32 Gbits。
“可以肯定的是,PCIe还将迎来下一代升级方案,我们只需要对其细节进行敲定,”PCI SIG总裁Al Yanes在其年度开发者大会的一场新闻发布会上指出。
Cadence公司展示一块利用PCIe 4.0接入其控制器(右侧红色电路板)的Mellanox 100G Infiniband交换机芯片(左侧)。
不过关于5.0版本的疑问仍然很多,其中包括其是否向下兼容以及是否仍然作为当前全部PCIe标准所采取的芯片到芯片链接定位。
“我们无法再从编码方面实现改进,”Yanes指出,3.0版本则针对上代的8b/10b水平提升至128b/130b。“但使用256编码无法带来更理想的提升,因此我们面临可能只剩下提升频率这一条道路了,”他进一步补充称。
市场需求则源自当前各类常见用例。由于网卡传输速度已经达到每秒100 Gbit,必然要求有速度更快的芯片链接。另外,下一代图形处理器与固态驱动器的陆续推出也将在性能层面向厂商提出要求。
面向732家企业客户创造出一套同时适用于从智能手机到超级计算机的广泛应用场景的技术标准显然不那么容易。随着数据传输速率的不断提升与信号频段的收窄,PCIe新版本的研发周期已经由过去的3年延长至如今的7年。
PLDA(来自法国普罗旺斯地区的艾克斯)在FPGA上使用交换芯片,旨在打造一套面向PCIe 4.0的测试板。
PCIe 4.0标准的0.7版本目前正在进行审核,预计将在下个月得到批准。在此之后,工程师们将把该规范引入一系列实验室测试,旨在验证其功能与参数,并最终将其审定为0.9版本。再经过最终阶段的调试与检测,其1.0标准版本预计将在明年4月推出。
该集团曾于一年前表示,其希望能够在去年年内完成0.7版本草案,即在2015年年末前敲定一切需要加入最新版本的功能。“不过将各类新特性纳入方案的工作,显然需要耗费超出预期的时间,”Yanes表示。
新功能的引入过程显然并不顺利,特别是其中的信道建模机制——其允许系统工程师以目测方式检查互连体系中的每条通道,并查看其拥有多大的设计余量。
“4.0规范的制定已经耗费了相当长的时间。我们的很多客户都在迫切要求其推出,因为他们发现目前的0.7版本草案并不够理想,”Synopsys公司IP部门高级产品营销经理Scott Knowlton指出。
Cadence(在上)与Synopsys两家公司展示了运行在其IP模块上的PCIe 4.0信道建模功能。
“我们的一家客户强调称,新规范的出台实在太过迟缓。为了不错过市场营销周期,他们会很快推出相关设备,并随后再考虑合规方面的工作,”Cadence公司IP部门PCIe专家Arif Khan表示。
今年早些时候,IBM公司曾为其下一代服务器处理器Power9公布了一系列规范,其中就包括对PCIe 4.0的支持能力。
4.0规范为了实现更高数据传输速率而在传输距离方面稍做牺牲,其目前传输有效范围为12至14英寸。因此,在3.0版本中就比较常见的转接定时器与转接驱动器可能会在未来得到更为广泛的应用。
在此次大会上,Cadence与Synopsys两家公司都展示了该信道建模功能在其IP模块芯片上的运行效果。其中Cadence公司的芯片采用16纳米FinFET制程,而Synopsys方面表示其模块能够较上代PCIe模块在延迟与面积方面分别降低20%与15%。
Pericom公司展示了面向PCIe的每秒12 Gbit转接驱动模块,并表示其成本仅为完整转接定时器的四分之一。不过未来一到两年内,我们恐怕还无法买到能够完整实现每秒16 Gbit标准的转换驱动器。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。