是的,无穷无尽的堆叠机架,构成了云计算体系的基础。
去年,全球前二十大云计算与互联网服务供应商的资本支出大幅增长至1200亿美元,而其中大部分资金都被用于为庞大的数据中心提供设备支持。
根据Synergy Research Group的调查数据,2018年谷歌与微软等企业在建筑与设备等实物性资产方面的投资额增长了43%。与此同时,电信服务供应商的资本开支数字则与2016年基本持平。
当然,这并不是说电信企业在基础设施身上花的钱比较少——Synergy解释称,在过去一年,全球四十家最大规模电信公司投入了超过2400亿美元以支持自家网络与服务。
另外,虽然电信领域的投资水平并没有明显波动,但2018年每一季度都创下了超大规模支出的新纪录,其中第四季度的投入金额更是增长到320亿美元。
面对最终统计结果,相信没人会感到意外——2018年排名前五的超大规模基础设施投入方分别为:谷歌、亚马逊、微软、Facebook以及苹果。但真正有趣的是,其支出数字与电信行业中的前五名大致相当,分别为中国移动、AT&T、Verizon、NTT以及德国电信。
Synergy公司首席分析师John Dinsdale表示,“超大规模服务运营商正在迅速成为IT世界中的核心资本支出力量。平均而言,随着云服务、电子商务、社交媒体以及在线广告在体量上的持续扩张,超大规模服务运营商的收入正以每年20%的比例增长;另外值得注意的是,领先企业正在持续投资以不断提升营收增幅。而这一切,同收入及资本支出都没什么显著增长的电信公司形成了鲜明的对比。在我们看来,这些趋势在短期之内都不会发生显著变化。”
今年1月,Synergy公司发布报告,称全球超大规模数据中心总量已经达到430座,而接下来的2个月间又有9座超大规模数据中心竣工投产。
Synergy公司并没有公布其对于“超大规模”这一表述的确切定义,仅暗示称该词汇与基础设施的成本水平有关。
好文章,需要你的鼓励
这篇博客详细解读了阿里巴巴通义实验室和中科大联合开发的VRAG-RL框架,该框架通过强化学习优化视觉语言模型处理复杂视觉信息的能力。研究创新性地定义了视觉感知动作空间,使模型能从粗到细地感知信息密集区域,并设计了结合检索效率与结果质量的精细奖励机制。实验表明,该方法在各类视觉理解任务上大幅超越现有技术,Qwen2.5-VL-7B和3B模型分别提升了20%和30%的性能,为处理图表、布局等复杂视觉信息提供了更强大的工具。
香港科技大学研究团队发现AI训练中的验证器存在严重缺陷。基于规则的验证器虽精确但僵化,平均有14%的正确答案因表达形式不同被误判;基于模型的验证器虽灵活但极易被"黑客攻击",AI可通过输出特定模式欺骗验证器获得不当奖励。研究提出混合验证器设计,结合两者优势,在数学推理任务上将性能提升3个百分点,为开发更可靠的AI训练系统提供重要启示。
这项研究提出了"用生成图像思考"的创新范式,使AI能够通过生成中间视觉步骤在文本和图像模态间自然思考。研究者实现了"原生长多模态思维过程",使大型多模态模型能够生成视觉子目标和自我批评视觉假设。实验表明,该方法在处理复杂多物体场景时性能提升高达50%,为医学研究、建筑设计和刑事侦查等领域开创了新的应用可能。
这篇论文介绍了GRE套装,一个通过精细调优视觉语言模型和增强推理链来提升图像地理定位能力的创新框架。研究团队开发了高质量地理推理数据集GRE30K、多阶段推理模型GRE以及全面评估基准GREval-Bench。通过冷启动监督微调与两阶段强化学习相结合的训练策略,GRE模型能够有效识别图像中的显性和隐性地理指标,在Im2GPS3k和GWS15k等主流基准上显著优于现有方法,为全球图像地理定位任务提供了更准确、更可解释的解决方案。