至顶网服务器频道 07月16日 新闻消息: 华为日前宣布推出旗下的FusionServer产品系列将改用至强可扩展处理器(Xeon Scalable Processor),旗下刀片服务器将打头阵。

FusionServers跨入第五代,用的是英特尔强大的最新至强可扩展处理器(至强SP)。华为的服务器产品组合包括:
• lRH模块化机架式服务器
• lX系列高密度服务器
• lE系列刀片服务器和E9000机箱
• lG系列异构计算平台
华为另有一个名为昆仑的关键任务服务器独立产品线。
在华盛顿特区召开的Microsoft Inspire会上展示的一个幻灯片显示,该系列由传统的机架优化服务器基准产品和三个模块化服务器(G系列,X系列和E系列)组成。不过该幻灯片不是太清晰,也找不到更清晰的版本,幻灯片里的信息尚未出现在华为网站的服务器区。
我们可以从幻灯片的第一行看出是G5500和G500(4U机箱)。华为网站上没有有关G5500和G500的信息。12U E9000刀片服务器机箱最多可以容纳8个全宽刀片或16个半角刀片。华为目前列出了9个v3刀片服务器,其中一个是CH121,是v5系统,上述幻灯片里有该系统,但幻灯片没有CH242 4插槽V5系统。该系列似乎跳过了第四代v4。
CH121 v5是一个2插槽半宽度刀片,支持所有至强 SP处理器,最多含28颗顶级CPU内核。CH121 v5设有24个x DDR4 DIMM插槽,3TB的 DDR4内存,而且支持4个 M.2 SSD的存储。
华为表示,CH121 v5针对虚拟化、云计算、HPC和网络功能虚拟化(NFV)进行了优化。可以预计,华为的x86服务器产品组合里成批的产品将换用至强及Xeon SP。网上可以找到完整的CH121 V5刀片服务器规格的信息。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。