谷歌今天表示,作为实现增长战略的一个组成部分,谷歌计划在2019年投入130亿美元用于建设新的数据中心和扩建基础设施。
尽管谷歌有打算减少整体资本支出,但这一数字远远超过了谷歌在2018年在这方面投资的90亿美元。谷歌母公司Alphabet首席财务官Ruth Porat上周在财报电话会议上表示,她预计2019年的资本支出增长将“大幅放缓”。
即便如此,谷歌仍然制定了雄心勃勃的扩张路线图。谷歌计划在美国俄亥俄州、内布拉斯加州、内华达州和德克萨斯州建设新的数据中心,并扩大现有在美国俄克拉荷马州和南卡罗来纳州的设施。伴随这些建设项目的是新能源方面的投资:最近谷歌购买了160万块太阳能电池板的未来产能。
谷歌需要更多的数据中心,不仅是为了支持其核心服务,还要跟上云市场中竞争对手的崛起。谷歌的两大主要竞争对手,市场领导者AWS和微软都在积极投资扩大其基础设施规模。
除了建设更多数据中心之外,谷歌还计划开设更多的分公司。谷歌表示,位于美国佐治亚州和弗吉尼亚州的员工人数将增加一倍,还将建立一个新的德克萨斯分公司。当地媒体上周报道说,谷歌已经在奥斯汀悄悄租赁了一栋可容纳5000名员工的35层办公大楼。
此外该计划还包括谷歌此前宣布投资10亿美元建设新的曼哈顿园区。Porat表示,此举目标是将谷歌目前在纽约的7000名员工人数增加一倍。
谷歌首席执行官Sundar Pichai在今天的公告中表示:“这些新增投资将使我们有能力聘用数万名员工,并在内布拉斯加州、内华达州、俄亥俄州、德克萨斯州、俄克拉荷马州、南卡罗来纳州和弗吉尼亚州创造超过10000个新工作岗位。2019年将是我们连续第二年实现在湾区外的增长速度超过湾区内的增长速度。”
其他科技巨头也准备在今年掀起大规模招聘热潮。苹果公司正在建设一个价值10亿美元的奥斯汀中心,而亚马逊也已经宣布计划在弗吉尼亚州和纽约州建立园区,每个园区将雇佣25000名员工。
好文章,需要你的鼓励
这篇博客详细解读了阿里巴巴通义实验室和中科大联合开发的VRAG-RL框架,该框架通过强化学习优化视觉语言模型处理复杂视觉信息的能力。研究创新性地定义了视觉感知动作空间,使模型能从粗到细地感知信息密集区域,并设计了结合检索效率与结果质量的精细奖励机制。实验表明,该方法在各类视觉理解任务上大幅超越现有技术,Qwen2.5-VL-7B和3B模型分别提升了20%和30%的性能,为处理图表、布局等复杂视觉信息提供了更强大的工具。
香港科技大学研究团队发现AI训练中的验证器存在严重缺陷。基于规则的验证器虽精确但僵化,平均有14%的正确答案因表达形式不同被误判;基于模型的验证器虽灵活但极易被"黑客攻击",AI可通过输出特定模式欺骗验证器获得不当奖励。研究提出混合验证器设计,结合两者优势,在数学推理任务上将性能提升3个百分点,为开发更可靠的AI训练系统提供重要启示。
这项研究提出了"用生成图像思考"的创新范式,使AI能够通过生成中间视觉步骤在文本和图像模态间自然思考。研究者实现了"原生长多模态思维过程",使大型多模态模型能够生成视觉子目标和自我批评视觉假设。实验表明,该方法在处理复杂多物体场景时性能提升高达50%,为医学研究、建筑设计和刑事侦查等领域开创了新的应用可能。
这篇论文介绍了GRE套装,一个通过精细调优视觉语言模型和增强推理链来提升图像地理定位能力的创新框架。研究团队开发了高质量地理推理数据集GRE30K、多阶段推理模型GRE以及全面评估基准GREval-Bench。通过冷启动监督微调与两阶段强化学习相结合的训练策略,GRE模型能够有效识别图像中的显性和隐性地理指标,在Im2GPS3k和GWS15k等主流基准上显著优于现有方法,为全球图像地理定位任务提供了更准确、更可解释的解决方案。