这对相互矛盾的反馈数据,令2023年的走势更加难以预测。
研究机构Omdia表示,企业和云服务商间的优先关注方向有所区别,进而掀起两股相互冲突的显著趋势。首先,市场对于计算资源的需求仍然很高,ChatGPT的爆红也激发了人们对于AI训练的兴趣;但与此同时,服务器出货量却有所下降。
Omdia发布的《云与数据中心市场更新》报告预计,今年的服务器出货量将出现自2007-2008全球金融危机以来的首次萎缩。报告同时警告称,这对相互矛盾的反馈和数据点将使得2023年成为难以预测的一年。
报告认为,这种割裂源自企业买家和大型云服务商在优先关注方向上的差异。从目前的趋势来看,随着近期ChatGPT掀起的生成式AI模型的热潮,为AI模型训练用例配备昂贵服务器成为普遍共识,且优先度高于常规的服务器更新周期。
Omdia指出,2023年第一季度全球市场共售出280万台服务器,远远低于此前预期、特别是服务器OEM厂商的估计。报告提到,2022年第四季度到2023年第一季度服务器的出货量降幅,也已经创下历史新纪录。
根据OEM厂商给出的反馈,不少企业现在不愿投入大型项目,甚至选择缩减IT支出。这一点在北美各金融服务和制造企业中体现得尤其明显。
但与此同时,第一季度云服务商的服务器采购量据称表现良好。只是第二季度的销售额急剧下降,迫使Omdia调整了全年预测,目前估计全年云服务巨头的总体服务器采购量将缩水2%。
Omdia在报告中提到,微软、谷歌和Meta在今年第一季度还在采购新服务器,但AWS的新服务器装机量则开始收缩。到第二季度,AWS和Meta双双选择削减支出。
影响市场的另一个因素,就是服务器的生命周期有所延长。Omdia在报告中指出,目前所有大型云服务商均已为服务器套件设下6年的正常使用寿命,而二级服务商的服务器套件使用寿命则延长至9到10年。
预计云服务市场的这种割裂态势将很快成为常态。一方面,云服务商采购高端服务器硬件用以支持AI用例,另一方面则尽可能延长旧服务器生命周期以充分发挥其价值。Omdia表示这种趋势并不新鲜,但整体模式似乎有蔓延之势。
欧洲云服务商OVHcloud近期也表示,他们正在考虑采取这种策略,因为相当一部分客户并不需要过高的性能,反而更倾向于选择优惠力度更大的6年、7年、8年甚至10年前的服务器硬件。
Omdia表示,自疫情爆发以来,翻新二手服务器的部署量激增,这主要是为了解决半导体供应短缺导致的交付时间过长问题。
OVH还运营一条“逆向供应链”,即将旧服务器返回自家工厂(OVHcloud拥有自己的服务器组装厂)进行拆卸和分组件测试,看看能否继续使用或通过经纪人出售至回收市场。
这也与Omdia观察到的趋势相符。报告指出,某些组件的使用寿命要比整体服务器的生命周期更长,而对这部分组件的回收和再利用已经成为云服务商的关注重点。其中重复使用率最高的内存模块,其次是电源和以太网适配器。
展望未来,Omdia预计在这种服务器更新周期的推动下,服务器安装基数的增幅将有所放缓,而高端新服务器的出货量则将保持加速。
但Omdia也总结称,数据中心行业的总体健康状况良好,超大规模企业的资本支出仍处于较高水平。目前,数据中心建设(单位为平方英尺/平方米)继续以年均10%的速度保持增长。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。