英特尔今天宣布推出了PAC D5005加速卡,可使数据中心服务器更快速地运行分析和人工智能软件等工作负载。
加速卡是一种可以插入服务器对内置处理器形成补充的设备,例如,Habana Labs最近推出的Gaudi卡专为机器学习模型提供额外的计算能力。
D5005的不同之处在于,它不是为加速特定工作负载类型(例如人工智能)而开发的。相反,它是可编程的,这意味着企业可以将它用于一系列应用。
英特尔也考虑到了一些特定的用例。英特尔可编程解决方案集团负责人Patrick Dorsey表示, D5005特别适合流分析、媒体转码和人工智能工作负载,此外这款加速卡也适合于加速网络安全和财务软件工作负载。
D5005是对英特尔上一代可编程加速卡的一个重大改进。它内存容量是上一代的4倍,总共32GB,工作负载定制的可编程电路数量增加了2倍,此外还有2个100Gb以太网端口(以前只有1个40Gb端口),使得加速卡能够更快地接收数据。
D5005采用了1个至强服务器CPU和Stratix 10 SX FPGA,后者是该加速卡的可配置电路核心,而前者能够帮助它处理更多通用任务。
D5005最初将用于HPE的ProLiant DL380 Gen10服务器,此外还有多家服务器制造商正在认证系统以使用该加速卡。
英特尔正在投入大量资源吸引可编程芯片市场。今年早些时候英特尔推出了另一款加速卡旨在提升运营商网络的性能;4月,英特尔收购了一家名为Omnitech的英国公司,该公司开发了用于视频和人工智能应用的FPGA技术。
好文章,需要你的鼓励
Intermedia 推出业内首个将统一通信和客户体验功能完全嵌入微软 Teams 的服务。这项创新不仅提升了 Teams 用户的生产力,还改善了客户体验。新功能支持多渠道通信、企业级通话功能和 AI 分析,为企业提供了一个强大的通信和客户体验平台。
Komprise 推出了 AI 驱动的数据管道,可自动检测和保护个人隐私信息 (PII)。这项新功能旨在帮助企业防止 PII 和其他敏感数据泄露,应对非结构化数据增长和生成式 AI 带来的风险。通过系统化方法减少敏感数据风险,提升网络安全和 AI 数据治理能力。
Oumi PBC公司宣布推出全球首个"无条件开放的AI平台",旨在通过提供开放访问基础模型、数据集和开发工具,创建协作式AI研发生态系统。该平台支持从1000万到4050亿参数的模型训练,适用于文本和多模态模型,并集成了多种流行的推理引擎。Oumi致力于打破当前AI研究领域的创新壁垒,加速AI领域的进展和发现。
阿里云发布最新大语言模型 Qwen 2.5-Max,声称性能超越当前最强 AI 模型。该模型采用专家混合架构,经过 20 万亿 token 预训练和后续强化学习,在多项基准测试中超越 DeepSeek-V3 等模型。Qwen 2.5-Max 目前通过阿里云 API 提供服务,但尚未开源。