英特尔今天宣布推出了PAC D5005加速卡,可使数据中心服务器更快速地运行分析和人工智能软件等工作负载。
加速卡是一种可以插入服务器对内置处理器形成补充的设备,例如,Habana Labs最近推出的Gaudi卡专为机器学习模型提供额外的计算能力。
D5005的不同之处在于,它不是为加速特定工作负载类型(例如人工智能)而开发的。相反,它是可编程的,这意味着企业可以将它用于一系列应用。
英特尔也考虑到了一些特定的用例。英特尔可编程解决方案集团负责人Patrick Dorsey表示, D5005特别适合流分析、媒体转码和人工智能工作负载,此外这款加速卡也适合于加速网络安全和财务软件工作负载。
D5005是对英特尔上一代可编程加速卡的一个重大改进。它内存容量是上一代的4倍,总共32GB,工作负载定制的可编程电路数量增加了2倍,此外还有2个100Gb以太网端口(以前只有1个40Gb端口),使得加速卡能够更快地接收数据。
D5005采用了1个至强服务器CPU和Stratix 10 SX FPGA,后者是该加速卡的可配置电路核心,而前者能够帮助它处理更多通用任务。
D5005最初将用于HPE的ProLiant DL380 Gen10服务器,此外还有多家服务器制造商正在认证系统以使用该加速卡。
英特尔正在投入大量资源吸引可编程芯片市场。今年早些时候英特尔推出了另一款加速卡旨在提升运营商网络的性能;4月,英特尔收购了一家名为Omnitech的英国公司,该公司开发了用于视频和人工智能应用的FPGA技术。
好文章,需要你的鼓励
Google联合创始人谢尔盖·布林重返公司,呼吁员工每周工作60小时,以赢得人工智能竞赛。他认为Google有望实现通用人工智能(AGI)突破,但需要员工全身心投入。这一呼吁引发了对工作效率和AI发展前景的讨论,同时也反映了科技巨头在AI竞争中的紧迫感。
随着新一波大型语言模型的出现,AI 竞争日益激烈。OpenAI、Anthropic 等公司推出的新模型不仅重塑了我们的工作和交流方式,还影响着全球权力格局。在这场竞争中,一个新问题浮现:AI 模型能否同时变得更智能、更快速、更经济?未来的 AI 可能不再依赖海量数据,而是通过创新机器学习方法来提高数据效率,实现更智能、更高效的发展。
OpenAI推出的GPT-4.5企业版引发了争议,其高昂价格让许多人质疑其性价比。然而,作为OpenAI最大且最强大的非推理模型,GPT-4.5在知识储备、文档处理、任务规划等方面表现出色。尽管成本高昂,但随着推理成本的下降和未来潜在的强化学习训练,GPT-4.5仍有望成为企业应用的有力工具。
Red Hat 积极把握开放式无线接入网络和人工智能无线接入网络规范日益普及的机遇,宣布与多家电信供应商建立新的合作伙伴关系。该公司将在巴塞罗那举行的世界移动通信大会上发布一系列相关公告,涵盖开放式无线接入网络部署、云转型、人工智能驱动的网络以及太空数据中心等多个领域。Red Hat 强调其在开放混合云、人工智能和自动化方面在电信行业中发挥的重要作用正日益增强。