根据来自IDC一项新的预测,2016年全球x86和ARM服务器级微处理器收入将增长 1.3%达到139亿美元,而服务器微处理器市场出货量将增长3.5%达到2290万部。这份题为《2016年到2020年全球x86和ARM服务器级微 处理器预测》还预期,在2015年到2020年期间x86和c级微处理器收入的复合年增长率为2.2%,到2020年规模将达到153亿美元。
该报告认为,2016年服务器级微处理器增长的推动力是主要云服务提供商十分可观的直接 采购,包括Google和Amazon,以及在服务器之外的系统中采用服务器微处理器,例如存储系统和网络系统。IDC预计2016年第一季度出货的 x86和ARM服务器级处理器——主要是至强处理器——中有17.3%是面向存储、网络和嵌入式系统的,相比之下2013年第一季度这个数字为8.8%。
该报告还提到了即将来临的竞争力转变。在经过多年的生态系统开发,以及处理器设计无法赢 得数据中心的关注,ARM处理器厂商例如Applied Micro和Cavium已经赢得了不少设计成就,赢得了来自通信服务提供商(CSP)的合作伙伴,系统厂商代表了广泛的最终客户和工作负载。IDC预计 2017年,ARM厂商将开始凭借他们最新一代的设计赢得市场关注。
“随着现有系统市场总量、工作负载基础的不断扩大,竞争日益激烈,未来5年服务器级微处理器市场将看到越来越多系统专有和工作负载专有的设计,价格适度调整,以及市场份额的温和变化,”IDC计算半导体研究副总裁Shane Rau表示。
来自IDC预测的其他重要发现包括:
IDC预计,从2010年到2015年由服务器级微处理器客户支付的平均全球合同价格将增长25%。2010年英特尔的单位份额为93%,2015年份额为99.2%。
较高的市场平均销售价格(ASP)正在吸引新的微处理器厂商进入服务器级微处理器市场。这些厂商收到大量需求的鼓舞,例如中国很多主要的云服务提供商和系统制造商看到了英特尔的替代者。
从2016年年底到2017年,多家处理器厂商将发布新产品,拥有挑战英特尔主流产品线 至强E5-26xx系列的潜力。这些产品线包括AMD的x86 Zen、高通基于ARM的Hydra、Applied Micro基于ARM的X-Gen 3、Cavium基于ARM的ThunderX 2,还可能包括博通基于ARM的Vulcan。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。