GPU制造商Nvidia(英伟达)日前在数据中心业务出人意料放缓的情况下推出一项新的合作伙伴网络计划。新计划可以令企业更容易地利用Nvidia的DGX系统。可用DGX的新数据中心计划已准备就绪(https://www.nvidia.com/en-us/data-center/colocation-partners/),企业可以通过新的Nvidia托管合作伙伴资格网络访问数据中心服务。
GPU加速计算对于那些想要部署AI(人工智能)工作负载的企业是非常有用的。Nvidia在声明里指出,各行各业都有些机构(从医疗保健到石油和天然气业务)成功部署了自己的基于DGX系统的AI数据中心。但也有许多机构并不拥有可以支持加速计算操作的现代数据中心设施。
现在这些机构可以去找一个Nvidia托管合作伙伴,而无需自己折腾自身设施的升级。他们可以通过新计划部署DGX系统或最近发布的DDN、IBM Storage、NetApp和Pure Storage的DGX参考架构解决方案。
Nvidia前一阵披露了第四季度的业绩未达预期的消息,几天后就推出了旗下数据中心新计划。 Nvidia表示,“客户趋向于更加谨慎,Nvidia之前预测的一些交易在本季度的最后一个月未能完成。”另外,游戏需求低于预期, 导致了Nvidia下调公司第四季度指引。
Nvidia新计划的合作伙伴网络目前含九家北美数据中心运营商,包括Aligned Energy、Colovore、Core Scientific、CyrusOne、Digital Reality、EdgeConneX、Flexential、Scale Matrix和Switch。 Nvidia正评估北美的其他的计划合作伙伴,并计划在今年晚些时候在全球推广该计划。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。