英特尔今天宣布推出了PAC D5005加速卡,可使数据中心服务器更快速地运行分析和人工智能软件等工作负载。
加速卡是一种可以插入服务器对内置处理器形成补充的设备,例如,Habana Labs最近推出的Gaudi卡专为机器学习模型提供额外的计算能力。
D5005的不同之处在于,它不是为加速特定工作负载类型(例如人工智能)而开发的。相反,它是可编程的,这意味着企业可以将它用于一系列应用。
英特尔也考虑到了一些特定的用例。英特尔可编程解决方案集团负责人Patrick Dorsey表示, D5005特别适合流分析、媒体转码和人工智能工作负载,此外这款加速卡也适合于加速网络安全和财务软件工作负载。
D5005是对英特尔上一代可编程加速卡的一个重大改进。它内存容量是上一代的4倍,总共32GB,工作负载定制的可编程电路数量增加了2倍,此外还有2个100Gb以太网端口(以前只有1个40Gb端口),使得加速卡能够更快地接收数据。
D5005采用了1个至强服务器CPU和Stratix 10 SX FPGA,后者是该加速卡的可配置电路核心,而前者能够帮助它处理更多通用任务。
D5005最初将用于HPE的ProLiant DL380 Gen10服务器,此外还有多家服务器制造商正在认证系统以使用该加速卡。
英特尔正在投入大量资源吸引可编程芯片市场。今年早些时候英特尔推出了另一款加速卡旨在提升运营商网络的性能;4月,英特尔收购了一家名为Omnitech的英国公司,该公司开发了用于视频和人工智能应用的FPGA技术。
好文章,需要你的鼓励
阿里纳德数据中心与Calibrant Energy合作开发首创电池储能系统,通过绕过传统电网升级时间线,使俄勒冈州希尔斯伯勒在建数据中心园区提前数年上线。该31兆瓦、62兆瓦时储能系统计划2026年投运,将作为响应电网的动态资产,在需求高峰期放电,增强区域电网可靠性。这标志着美国首次使用专用电池系统加速大型数据中心并网。
威斯康星大学研究团队开发了LUMINA系统,专门检测AI在回答问题时的"撒谎"行为。该系统发现AI有时会忽视提供的参考资料,固执地依赖内部知识生成不准确回答。LUMINA通过监测AI对外部文档和内部知识的依赖程度来识别这种行为,在多个测试中达到90%以上的准确率,比以往方法提升13%,为构建更可信的AI系统提供了重要工具。
微软在Edge浏览器中推出增强版Copilot模式,提供更强大的AI代理功能,目前在美国进行限量预览。该模式包含Actions和Journeys两大功能:Actions让浏览器能代表用户执行任务,如语音控制打开网页或查找文章特定内容;Journeys则记住用户浏览历史,帮助用户继续之前的研究任务。此举正值AI浏览器竞争加剧,OpenAI推出ChatGPT Atlas、Perplexity发布Comet、谷歌集成Gemini到Chrome。目前Chrome占据71%市场份额,Edge仅占4.67%。
这项由法国CentraleSupélec大学领导的研究通过严格控制的实验,系统比较了AI的推理训练与传统训练方式。研究发现推理训练在数学、开放式任务中效果显著,但需要70亿参数以上模型才能充分发挥优势,且成本增加明显。研究为AI开发者提供了明确的应用指导,有助于根据具体场景选择最优训练策略。