英特尔今天宣布推出了PAC D5005加速卡,可使数据中心服务器更快速地运行分析和人工智能软件等工作负载。
加速卡是一种可以插入服务器对内置处理器形成补充的设备,例如,Habana Labs最近推出的Gaudi卡专为机器学习模型提供额外的计算能力。
D5005的不同之处在于,它不是为加速特定工作负载类型(例如人工智能)而开发的。相反,它是可编程的,这意味着企业可以将它用于一系列应用。
英特尔也考虑到了一些特定的用例。英特尔可编程解决方案集团负责人Patrick Dorsey表示, D5005特别适合流分析、媒体转码和人工智能工作负载,此外这款加速卡也适合于加速网络安全和财务软件工作负载。
D5005是对英特尔上一代可编程加速卡的一个重大改进。它内存容量是上一代的4倍,总共32GB,工作负载定制的可编程电路数量增加了2倍,此外还有2个100Gb以太网端口(以前只有1个40Gb端口),使得加速卡能够更快地接收数据。
D5005采用了1个至强服务器CPU和Stratix 10 SX FPGA,后者是该加速卡的可配置电路核心,而前者能够帮助它处理更多通用任务。
D5005最初将用于HPE的ProLiant DL380 Gen10服务器,此外还有多家服务器制造商正在认证系统以使用该加速卡。
英特尔正在投入大量资源吸引可编程芯片市场。今年早些时候英特尔推出了另一款加速卡旨在提升运营商网络的性能;4月,英特尔收购了一家名为Omnitech的英国公司,该公司开发了用于视频和人工智能应用的FPGA技术。
好文章,需要你的鼓励
香港大学联合多家顶尖机构开发出推测性雅可比降噪解码技术,巧妙融合扩散模型降噪与自回归并行处理,将AI图像生成速度提升2-5倍。该方法通过训练模型处理噪声输入并预测干净标记,实现多位置同时生成,在保持图像质量的同时大幅缩短等待时间,为AI创作应用带来革命性改善。
谷歌推出类似苹果私有云计算的新平台,让用户在享受先进AI功能的同时保护数据隐私。该平台将复杂AI请求转移到云端处理,确保敏感数据仅用户可见,连谷歌也无法访问。随着AI工具需要更强计算能力,这一方案平衡了隐私保护与性能需求。Pixel 10手机将获得更智能的Magic Cue建议和更多语言的录音转录功能。
韩国大学等机构研究团队提出TAG方法,解决AI绘画中的"幻觉"问题。该方法通过放大扩散过程中的切线分量来引导AI生成更真实图像,无需重训练模型且计算成本极低。实验显示TAG能显著改善图像质量,减少不合理细节如多指手等,同时可与现有引导技术结合使用,为AI绘画领域提供了简单有效的优化方案。