ZD至顶网服务器频道 06月22日 新闻消息(文/邹大斌):继4月1日英特尔在全球同步发布至强处理器E5 v4之后,近日英特尔再次发力,在全球同步发布了至强处理器E7 v4家族,这也是首批采用14纳米制程技术的E7处理器,其中最先发布的是E7-8800/4800 v4产品家族。相比上一代产品,英特尔至强处理器E7 v4产品家族在性能与内存容量支持方面均有提升。英特尔表示,新一代的E7将能够帮助众多行业用户加速获取业务洞察,推进企业业务转型。
英特尔数据数据中心事业部企业应用总经理Patrick Buddenbaum
面向关键业务和分析性应用
在英特尔的产品规划中,至强处理器家族包含E5和E7两个系列。其中,E5主要面向Scale Out应用,英特尔称其为是云环境下总拥有成本最佳的一个产品系列,而E7在计算性能上E7比E5更高,主要面向Scale Up应用,侧重于关键任务。
“我们认为,中国企业所面临的挑战——这也是IT部门的机遇,主要体现在以下三个领域:一是混合云,二是数据分析,三是关键业务计算。英特尔E5系列就是面向混合云的性价比最优化的产品;而E7就是针对数据分析和关键业务应用的最佳解决方案。”英特尔数据数据中心事业部企业应用总经理Patrick Buddenbaum告诉记者。
在数据分析领域,最有代表性的应用平台之一就是SAP HANA,这也是被英特尔认为E7的一个典型应用场景。作为一种内存计算平台,HANA能大幅提升数据分析性能,但其对CPU的处理能力有着很高要求,而E7以其高性能和其更大的支持可扩展的内存插槽而被作为HANA的最佳搭档。
而在关键业务领域,Patrick Buddenbaum举了三个典型代表:华为新推出的32路KUNLUN服务器,其主打的正是传统的小型机市场,高可靠、稳定也是基本诉求;SGI的高性能计算(也是和SAP HANA合作); HPE的Superdome X服务——具有传统基于安腾芯片的Superdome的高可靠性同时兼具x86平台的开放性。这三个合作案例使用的都是E7,面向的也都是关键性任务。
英特尔公司数据中心事业部副总裁兼数据中心平台应用工程部门总经理Donald D. Parker表示,归结起来,E7所面向的应用都有三个典型特征,即实时的大容量内存、高可扩展性以及先进的可靠性。E7在这三个方面都有非常优异的表现。比如,最多可以支持24TB的内存,与E7 v3相比增加了一倍(这对于实时分析型应用至关重要);借助第三方节点控制器,最多可以支持256插槽;可靠性可实现99.999%,保证能够7x24小时正常运转。
值得一提的是,在可靠性方面E7 还有已经采用多年的可靠运行技术,不仅能够检测到平台中的一些错误,同时还能够纠错,来保证平台的长期稳定运行。实际上,E7 v4产品家族集成了包括英特尔可靠运行技术在内的超过70项硬件增强的RAS的特性以保障IT平台的稳定性及可管理性。
目前,在中高端服务器市场,以IBM Power为代表的Unix占据不少的市场份额。随着英特尔E7计算性能和可靠性的不断提升,在市场上势必与Power服务器产生直接的竞争关系。 而实际上,E7也往往被外界视为英特尔挑战IBM Power的真正利器。
在E7 v4的产品发布会上,与Power的对比也成为一项重要的内容。根据英特尔提供的资料,相比基于IBM Power8的解决方案,基于英特尔至强E7 v4处理器的解决方案可提供高达1.4倍的性能,拥有高达10倍的性价比以及仅一半的系统功耗。
“这就意味着E7在运营成本上是大大低于了Power的这些系统。在采购成本上,E7的优势也很明显。比如,英特尔的8插槽E7 v4系统市场价格20万美元左右,同等具有可比性的IBM Power系统,起价可能超过100万美元。”Patrick Buddenbaum谈到这些资料时表示。
他说,其实无论是纵向扩展还是横向扩展,无论是性能还是经济性,E系列平台都是非常好的选择。“我们能够给OEM以及合作伙伴带来很好的选择,让客户也能够在整个x86架构的环境下选择他们所需要的。”
实际上,有不少企业也正是看中了E7的可靠性和经济性,开始着手从RISC平台向x86平台迁移。北京飞机维修工程有限公司就是这样的一个企业,它把原来跑在RISC平台上的SAP ECC和航空维修系统全部迁移到基于E7的x86平台上。迁移完成后,两套系统响应时间提高了3.5倍,备份时间缩短为原来的1/2。总体上,硬件的投资成本大幅下降,硬件购置成本节省超过50%,5年内总体拥有成本下降了46%。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。