在数字经济快速发展的今天,数据呈现爆炸式增长,如何从海量数据中获取洞察,进而推动业务的创新,成为当下企业的重要课题。
所有这些都需要一个强有力的IT基础设施进行支撑,特别是CPU处理器起到了核心推动作用。对于英特尔而言,至强可扩展处理器家族可以说是“十年磨一剑”的产品。它不仅仅是速度更快的Xeon或具有更多内核的Xeon,更是围绕计算,网络和存储功能之间的协同作用设计的一系列处理器。
就在近日,笔者收到了即将于2019年4月3日举行的英特尔创新产品发布会,在本次大会上,Cascade Lake(第二代英特尔至强可扩展处理器)的神秘面纱即将被解开。
虽然我们对于此次发布的细节并不是知道太多,但是在发布会之前,我们不妨大胆猜想一番,Cascade Lake将会带来哪些激动人心的特性。
架构升级
从网上获悉的信息,Cascade Lake在制程方面并没有更新,还是采用14nm,这或许令很多人失望。但是对于CPU而言,制程虽然很关键,但是架构也很重要。
从英特尔公布的六大战略支柱,我们也看到架构是一个重要的方面。在Skylake中,全新的Mesh互联架构被引入。在即将发布的Cascade Lake上面,英特尔是否会有架构上的更新,这是非常值得期待的。
笔者获得消息是Cascade Lake仍旧是基于Purely Platform,接口与Skylake完全兼容。规格方面,互联架构、最高28核56线程、48条PCIe通道、6通道DDR4内存等都保持一致。
所以,Cascade Lake在架构上的更新是本次产品发布的一个重点。
指令集更新
针对工作负载优化的指令集是CPU发挥自身潜质的重要基础。在Skylake中,英特尔引入了AVX-512指令集。
在当今工作负载和计算多样化的趋势下,Cascade Lake会增加哪些新的指令集帮助企业应对挑战是我们需要格外关注的。
在已经披露的信息中,AVX-512会更新增加针对AI工作负载的内容,这就是AVX512_VNNI(英特尔深度学习加速)。英特尔称,VNNI指令集可让Cascade Lake处理器的机器学习性能相比Skylake-SP提升11倍。
除此以外,Cascade Lake搭载的其它更新特性也是值得关注的。因为在Skylake中,Intel QAT(英特尔Quick Assist)技术、英特尔卷管理设备(英特尔VMD) 等技术从多个维度不断提升CPU处理应用的性能表现。相信在Cascade Lake中,我们也会看到很多新的Intel技术,将CPU的价值最大化。
SKU扩展
在Skylake中,英特尔提供了四个级别的性能与功能,以及大量客户所需的集成和加速器配置选项;并采用以金属命名的全新分级模型,分为铜牌、银牌、金牌和铂金几个级别,并且直接体现在产品型号中。
如果比照面向消费市场的酷睿系列CPU,Skylake的SKU是不是需要增加,从而丰富客户的产品选择?我想这是一个问题。毕竟英特尔的处理器产品线非常广,从面向边缘的FPGA到云端数据中心的至强处理器,之所以如此扩充产品线,无非是为了满足客户的多样化需求。
具体到数据中心的至强处理器,英特尔是不是会扩充现有的产品?或者与其它产品线比如FPGA进行打通?这些因为需要即将举行的发布会来回答。
你心动了吗?想看大会直播,先玩拼图再说!
以数据为中心
如果一直关注英特尔的话,以数据为中心这个说法应该不会陌生。
面对数据大爆炸,英特尔为此提出了数据为中心的IT基础设施的策略,在计算、网络、存储等领域进行拓展,帮助客户打造一个端到端的解决方案。用英特尔的话说,那就是加快数据传输、存储更多数据、处理一切数据。
在这样的一个策略下,英特尔除了在至强处理器上进行持续投入外,还在存储、网络等领域积极投资。比如我们熟知的英特尔Optane技术。针对数据中心市场,英特尔也推出了傲腾数据中心级持久内存。
据悉,Cascade Lake将支持英特尔傲腾数据中心级持久内存,从而让数据更加靠近计算,加速数据的价值实现。
除了存储,英特尔在网络上也大力投资。我们看到英特尔站在一个更为广阔的视野来看数据中心市场,所以即将举行的发布会发布的也将不只是处理器产品,还会有存储、网络等一系列产品。
生态伙伴站台
每年的英特尔新品发布会,除了产品是一大看点,英特尔与众多合作伙伴联手打造的英特尔精选解决方案与案例也是不容错过的。
对于英特尔而言,生态伙伴是其保持市场竞争力的重要支撑。通常,英特尔的合作伙伴会在新品发布前已经在进行测试。这对于Cascade Lake也不例外,合作伙伴对于新品是有发言权的。
据了解,本次发布会上,英特尔将携手众多行业用户和合作伙伴全方位展示云计算、5G技术、高性能计算、人工智能和高级分析技术等领域中丰富的解决方案与应用落地案例。
结语
作为近年来数据中心领域最大的技术进步,英特尔至强可扩展处理器在承载下一代IT基础设施方面发挥了重要的作用,帮助企业实现数据中心现代化以及业务转型。英特尔保持对至强可扩展处理器的持续更新迭代,以适应不断变化的IT环境。同时,英特尔以数据为中心,为企业构建一个端到端的解决方案,释放数据的价值。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。