至顶网服务器频道 05月05日 编译:目前,英特尔公司正对旗下至强CPU产品实施改造,全部面向数据中心的英特尔产品都已经被纳入“至强可扩展家族”当中。
全新“至强可扩展家族”
关于该芯片架构的强化调整细节预计会在今年6月公布,届时采用14纳米制程工艺的Skylake至强处理器可能将同步推出。另外,Kaby Lake芯片及其后续产品Cannon Lake则至少要到2017年下半年才会放出消息。
根据目前掌握的情况,新的至强家族将包含一套“全新核心、缓存、芯片上互连以及内存控制器等”设计。另外,新的CPU产品还将提供“针对计算、存储与网络的优化能力”。
在具体细节公布之前,英特尔还透露了一项品牌调整说明,即至强E5与E7将成为新的“至强可扩展家族”中的组成部分。至强可扩展家族将“成为可扩展性的全新实现基础“,同时涵盖各类面向多插槽服务器的CPU产品。
该家族还将为每款CPU成员赋予一个以金属命名的型号名称,包括青铜、白银、黄金与白金,金属越稀有即代表其性能越强大。英特尔方面的这一品牌设置告诉我们,未来我们可能会迎来“Xeon Platinum Inside”之类的新型宣传表述。芯片巨头还希望通过这样的品牌设定明确云应用中适合使用的服务器型号,以帮助用户更轻松地了解不同云虚拟机所能提供的性能表现。
同样被列入“可扩展家族”的还有英特尔推出的固态磁盘产品,包括Optane。芯片巨头的以太网产品亦纳入其中,外加Omni-Path互连架构、至强Phi协处理器、硅光子传输、Nervana系列以及搭配现场可编程门阵列的至强产品。
值得注意的是,英特尔并没有提到至强E3与至强D。之所以没能成为家族中的一员,是因为二者只适用于单插槽设备,而这与英特尔公司的可扩展性思路不符。也正因为如此,这两款产品也正在被从至强开发及发布流程当中剥离出来。
为什么英特尔公司要突然强调可扩展性这一因素?
相信很多人都已经听说,AMD公司将利用其Naples芯片重返服务器CPU市场。而且ARM架构的服务器芯片正在悄然推广,甚至劝说微软利用其运行Azure云。英特尔公司当然需要更积极的去应对这一竞争局面。
英特尔同时提醒用户,无论书面数据看起来如何令人印象深刻,生态系统都需要大量时间来培养以提供能够真正处理大规模工作负载的设备方案。而英特尔正好拥有这样一套生态系统,并以“Builders”项目为载体将计算带入规模化场景。
据悉,数据中心产品单在上个季度中即为英特尔公司贡献了40亿美元。正因为如此,“可扩展家族”成为英特尔手中所掌握的少数仍在持续扩展且拥有巨额营收的市场区间之一。英特尔非常清楚,PC市场已经无法为其带来更大的增长空间,而其也已经基本错过了年销数百万块CPU并成为互联网中另一股中坚力量的移动市场。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。