上一季度,超大规模数据中心运营商在新基础设施上支出了260亿美元,比2017年第三季度增长53%。
根据来自Synergy Research超大规模数据中心资本支出的最新报告显示,AWS、谷歌、微软、Facebook和苹果公司是迄今为止在这方面支出最高的公司。这里的“超大规模数据中心运营商”指的是全球拥有分布式基础设施的大型互联网公司,这些公司能够快速扩展以适应不断增长的需求,而无需任何额外的物理空间、冷却或电力资源。
根据周二公布的这份报告,这五家公司占到了2018年第三季度超大规模数据中心资本支出的70%以上。据称该季度微软大幅提高了支出,但其他四家公司的支出都比上个季度略有缩减。
阿里云上个季度也增加了支出。其他支出较高的中国公司包括百度、京东、和腾讯,而IBM和NTT通讯公司也在Synergy的名单中获得提名。
Synergy首席分析师John Dinsdale表示,超大规模数据中心业务正在蓬勃发展中:“过去四个季度,这些公司的收入同比增长率平均为24%,同时他们的资本支出在收入中的占比也在不断增加。”
Dinsdale说,这意味着任何其他希望与主流云计算提供商竞争的公司几乎不可能实现达到这一个量级。他说:“这给那些希望与超大规模数据中心公司展开有意义竞争的公司制造了巨大的障碍。这是一场大规模的竞赛,只有少数人有资格参与。”
在这些巨头中,谷歌上个季度公布了几个主要的数据中心基础设施项目,尽管这些项目的成本可能未包括在Synergy最新报告中。例如,谷歌最近开始在新加坡新建一座数据中心,并且还在扩建智利的现有数据中心设施。此外,谷歌将斥资6亿美元扩建位于南卡罗来纳州的数据中心。就在本周谷歌表示,将耗资6.9亿美元在丹麦建造一座全新的数据中心。
另外Amazon上个季度也公布了新的项目,表示希望在爱尔兰塔拉特建造新的数据中心。
就在公布这一报告的几天前,Synergy刚刚公布了与公有云提供商收入相关的数据,AWS继续主导市场,微软在除亚太地区以外的所有主要地区位列第二,在亚太地区阿里巴巴位列第二。
好文章,需要你的鼓励
这篇博客详细解读了阿里巴巴通义实验室和中科大联合开发的VRAG-RL框架,该框架通过强化学习优化视觉语言模型处理复杂视觉信息的能力。研究创新性地定义了视觉感知动作空间,使模型能从粗到细地感知信息密集区域,并设计了结合检索效率与结果质量的精细奖励机制。实验表明,该方法在各类视觉理解任务上大幅超越现有技术,Qwen2.5-VL-7B和3B模型分别提升了20%和30%的性能,为处理图表、布局等复杂视觉信息提供了更强大的工具。
香港科技大学研究团队发现AI训练中的验证器存在严重缺陷。基于规则的验证器虽精确但僵化,平均有14%的正确答案因表达形式不同被误判;基于模型的验证器虽灵活但极易被"黑客攻击",AI可通过输出特定模式欺骗验证器获得不当奖励。研究提出混合验证器设计,结合两者优势,在数学推理任务上将性能提升3个百分点,为开发更可靠的AI训练系统提供重要启示。
这项研究提出了"用生成图像思考"的创新范式,使AI能够通过生成中间视觉步骤在文本和图像模态间自然思考。研究者实现了"原生长多模态思维过程",使大型多模态模型能够生成视觉子目标和自我批评视觉假设。实验表明,该方法在处理复杂多物体场景时性能提升高达50%,为医学研究、建筑设计和刑事侦查等领域开创了新的应用可能。
这篇论文介绍了GRE套装,一个通过精细调优视觉语言模型和增强推理链来提升图像地理定位能力的创新框架。研究团队开发了高质量地理推理数据集GRE30K、多阶段推理模型GRE以及全面评估基准GREval-Bench。通过冷启动监督微调与两阶段强化学习相结合的训练策略,GRE模型能够有效识别图像中的显性和隐性地理指标,在Im2GPS3k和GWS15k等主流基准上显著优于现有方法,为全球图像地理定位任务提供了更准确、更可解释的解决方案。