英特尔今天宣布推出了PAC D5005加速卡,可使数据中心服务器更快速地运行分析和人工智能软件等工作负载。
加速卡是一种可以插入服务器对内置处理器形成补充的设备,例如,Habana Labs最近推出的Gaudi卡专为机器学习模型提供额外的计算能力。
D5005的不同之处在于,它不是为加速特定工作负载类型(例如人工智能)而开发的。相反,它是可编程的,这意味着企业可以将它用于一系列应用。
英特尔也考虑到了一些特定的用例。英特尔可编程解决方案集团负责人Patrick Dorsey表示, D5005特别适合流分析、媒体转码和人工智能工作负载,此外这款加速卡也适合于加速网络安全和财务软件工作负载。
D5005是对英特尔上一代可编程加速卡的一个重大改进。它内存容量是上一代的4倍,总共32GB,工作负载定制的可编程电路数量增加了2倍,此外还有2个100Gb以太网端口(以前只有1个40Gb端口),使得加速卡能够更快地接收数据。
D5005采用了1个至强服务器CPU和Stratix 10 SX FPGA,后者是该加速卡的可配置电路核心,而前者能够帮助它处理更多通用任务。
D5005最初将用于HPE的ProLiant DL380 Gen10服务器,此外还有多家服务器制造商正在认证系统以使用该加速卡。
英特尔正在投入大量资源吸引可编程芯片市场。今年早些时候英特尔推出了另一款加速卡旨在提升运营商网络的性能;4月,英特尔收购了一家名为Omnitech的英国公司,该公司开发了用于视频和人工智能应用的FPGA技术。
好文章,需要你的鼓励
DDN推出Infinia对象存储系统,采用键值存储架构和Beta Epsilon树数据结构,实现读写性能平衡。系统在对象列表性能上比AWS快100倍,延迟降至毫秒级,支持多租户和SLA管理。通过与英伟达合作优化RAG管道,在AWS上实现22倍性能提升并降低60%成本。
大连理工大学和浙江大学研究团队提出MoR(Mixture of Reasoning)方法,通过将多种推理策略嵌入AI模型参数中,让AI能自主选择最适合的思考方式,无需人工设计专门提示词。该方法包含思维生成和数据集构建两阶段,实验显示MoR150模型性能显著提升,比基线模型提高2.2%-13.5%,为AI推理能力发展开辟新路径。
Alpine Linux核心开发者Ariadne Conill推出了Wayback项目,这是一个实验性的X兼容层,允许使用Wayland组件运行完整的X桌面环境。该项目本质上是一个提供足够Wayland功能来托管rootful Xwayland服务器的存根合成器。与现有的XWayland不同,Wayback旨在创建一个类似X11风格的基于Wayland的显示服务器,让用户能够继续使用传统的X11窗口管理器和桌面环境,而无需重写或替换这些熟悉的工具。
剑桥大学研究团队开发了FreNBRDF技术,通过引入频率修正机制显著提升了计算机材质建模的精度。该技术采用球面谐波分析提取材质频率信息,结合自动编码器架构实现高质量材质重建与编辑。实验表明,FreNBRDF在多项指标上超越现有方法,特别在频率一致性方面改善近30倍,为游戏开发、影视制作、电商预览等领域提供了重要技术支撑。