英特尔帮助客户通过无缝集成和高带宽处理器接口加速工作负载
英特尔可编程解决方案事业部今日宣布,符合量产要求的英特尔Agilex® 7 R-tile正在批量交付。该设备是首款具备PCIe 5.0和CXL功能的FPGA,同时这款FPGA亦是唯一一款拥有支持上述接口所需的硬化知识产权(IP)的产品。
英特尔公司副总裁兼可编程解决方案事业部总经理Shannon Poulin表示:"客户需要尖端技术提供所需的可扩展性和定制化服务,这不仅可以有效地管理当前的工作负载,同时能够随着其需求变化来调整功能。英特尔Agilex产品以客户所需的速度、功耗和功能支持可编程创新,同时为其未来发展提供灵活性和弹性。例如,客户正在使用具有PCIe 5.0和CXL功能的R-Tile来加速软件及数据分析,将处理时间从几小时缩短至几分钟。"
面对时间、预算和功耗所带来的限制,包括数据中心、电信和金融服务在内的各行业组织都将FPGA视为灵活、可编程的,以及高效的解决方案。使用Agilex 7 R-Tile,客户可以将FPGA与诸如第四代英特尔至强可扩展处理器等进行无缝衔接,并通过具备最高带宽的处理器接口来加速目标数据中心和科学计算工作负载。Agilex 7的可配置和可扩展架构使客户能够快速部署定制化技术,即根据他们的具体需求,以硬件加速规模化部署,降低总体设计成本,缩短开发过程并加快执行速度,从而实现最佳的数据中心性能。
Agilex 7 R-Tile FPGA具备领先的技术能力。相比于其他FPGA产品,其每个端口的 PCIe 5.0带宽速度提高了2倍,CXL带宽提高了4倍。根据Meta和密歇根大学发布的白皮书显示,将带有CXL内存的FPGA添加到基于第四代英特尔至强可扩展处理器的服务器中,同时通过透明页面放置(TPP)的高效内存页管理技术,可将Linux性能提高18%。此外,UnifabriX在多个性能基准测试中展示了其支持CXL的智能内存节点,而其中一项测试显示,在处理科学计算工作负载时将可利用的第四代至强可扩展处理器核心数量提升至两倍,HPCG(高性能共轭梯度)基准得分增加了28%。
好文章,需要你的鼓励
UniR(Universal Reasoner)是一种创新的推理增强方法,可为冻结的大语言模型提供即插即用的推理能力。由韩国科学技术院研究团队开发,该方法将推理能力分解为独立的轻量级模块,无需改变主模型结构。UniR的核心优势在于高效训练(仅更新小型推理模块)、出色的模型间迁移能力(小模型可指导大模型)以及模块组合能力(多个专用模块可通过logits相加组合使用)。在数学推理和翻译测试中,UniR显著超越现有微调方法,展示了轻量级模块如何有效增强大语言模型的推理能力。
Nebius团队开发了SWE-rebench,一个自动化管道用于从GitHub收集软件工程任务并进行去污染评估。该系统解决了两大挑战:高质量训练数据稀缺和评估基准容易被污染。通过四阶段处理(初步收集、自动安装配置、执行验证和质量评估),SWE-rebench构建了包含超过21,000个Python交互式任务的数据集,并提供持续更新的评估基准。研究发现部分语言模型在传统基准上的表现可能被污染效应夸大,而DeepSeek模型在开源模型中表现最为稳健。
这项研究提出了JQL(发音为"Jackal"),一种通过多语言方法提升大型语言模型预训练数据质量的创新系统。研究团队从拉马尔研究所等机构通过四阶段方法解决了多语言数据筛选的难题:先由人类评估内容教育价值创建基准数据,然后评估大型语言模型作为"评判者"的能力,接着将这些能力提炼到轻量级评估器中,最后应用于大规模数据筛选。实验表明,JQL在35种语言上显著优于现有方法,甚至能泛化到未见过的语言如阿拉伯语和中文,为多语言AI发展提供了高效可靠的数据筛选方案。
浙江大学和西湖大学研究团队开发的Styl3R实现了艺术风格化3D重建的重大突破,能在不到一秒内从少量未标定照片和任意风格图像创建具有多视角一致性的3D艺术场景。通过创新的双分支网络架构将结构建模与外观着色分离,系统不仅保持了原始场景结构,还准确捕捉了参考风格特征。与现有方法相比,Styl3R在处理速度和视觉质量上均显著领先,为创意内容制作开辟了全新可能。