是的,无穷无尽的堆叠机架,构成了云计算体系的基础。
去年,全球前二十大云计算与互联网服务供应商的资本支出大幅增长至1200亿美元,而其中大部分资金都被用于为庞大的数据中心提供设备支持。
根据Synergy Research Group的调查数据,2018年谷歌与微软等企业在建筑与设备等实物性资产方面的投资额增长了43%。与此同时,电信服务供应商的资本开支数字则与2016年基本持平。
当然,这并不是说电信企业在基础设施身上花的钱比较少——Synergy解释称,在过去一年,全球四十家最大规模电信公司投入了超过2400亿美元以支持自家网络与服务。
另外,虽然电信领域的投资水平并没有明显波动,但2018年每一季度都创下了超大规模支出的新纪录,其中第四季度的投入金额更是增长到320亿美元。
面对最终统计结果,相信没人会感到意外——2018年排名前五的超大规模基础设施投入方分别为:谷歌、亚马逊、微软、Facebook以及苹果。但真正有趣的是,其支出数字与电信行业中的前五名大致相当,分别为中国移动、AT&T、Verizon、NTT以及德国电信。
Synergy公司首席分析师John Dinsdale表示,“超大规模服务运营商正在迅速成为IT世界中的核心资本支出力量。平均而言,随着云服务、电子商务、社交媒体以及在线广告在体量上的持续扩张,超大规模服务运营商的收入正以每年20%的比例增长;另外值得注意的是,领先企业正在持续投资以不断提升营收增幅。而这一切,同收入及资本支出都没什么显著增长的电信公司形成了鲜明的对比。在我们看来,这些趋势在短期之内都不会发生显著变化。”
今年1月,Synergy公司发布报告,称全球超大规模数据中心总量已经达到430座,而接下来的2个月间又有9座超大规模数据中心竣工投产。
Synergy公司并没有公布其对于“超大规模”这一表述的确切定义,仅暗示称该词汇与基础设施的成本水平有关。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。