人工智能浪潮下,数据中心市场的变化也非常大,比如现在各地在积极推动智算中心建设。但是这样区别看待,通常智算中心需要大量的GPU,但是现有数据中心在CPU下也可以承载人工智能类工作负载。例如英特尔至强可扩展处理器是数据中心领域非常全能的CPU,可以运行各种工作负载,包括AI,也包括大模型推理。
虽然现在芯片的异构化趋势非常明显,英特尔也在根据市场动态在通用算力和专用算力之间取得一个平衡,比如推出Gaudi和GPU Max。在英特尔技术专家看来,计算需求最开始出来往往是一个专用算力,但是当使用越来越广泛之后,就会变成一个通用。以AI为例,随着AI应用越来越广泛,英特尔至强并不完全是一个纯专用的CPU,CPU加入AVX、AMX等加速器。
持续迭代的至强
英特尔数据中心与人工智能集团兼副总裁兼中国区总经理陈葆立表示,2024年是至强产品路线图升级的重要一年,现在英特尔正处于“四年五个制程节点”的飞速进程中。特别是英特尔至强第一次采用了“双轨并进”的产品路线图设计,同时推出性能核和能效核处理器,以更好地满足不同数据中心需求。我们非常有信心,整个至强处理器的路线图发展能够更好地全方位覆盖客户需求。
英特尔技术专家补充说,2024年,英特尔将发布两个不同的微架构内核,分别是性能核(P-core)和能效核(E-core),对应的就是Granite Rapids和Sierra Forest这两个产品。这两款产品在英特尔内部的执行、测试、样品方面都进展的非常顺利。国内包括OEM等厂商的通用渠道产品,以及一些大型CSP也都已经开始做定制化产品,而且也陆续有平台开始应用,同时还有一些工程测试都在进行当中。
对于数据中心市场而言,算力需求始终在增加,我们需要去解决不同的问题。除了芯片本身之外,英特尔不只关注自己的产品,而是推动整个数据中心硬件和软件生态的发展。
在数据中心发展过程当中,软硬件的协同发展越来越重要。现在CPU的核数越来越多,如果客户购买一个核心数密度很高的服务器,但是利用率无法提高,其实对它的成本收益也是不利的。
英特尔试图在CPU的功能当中增加能够提高用户利用率,减少多应用同时部署时相互的串扰问题。硬件功能推出之后,在操作系统层面或者是应用程序部署层面能够把这个功能用起来,真真实实地帮助用户。
比如针对绿色数据中心,不管是是液冷方案还是智能调度,英特尔一直在投入。从第四代英特尔至强可扩展处理器开始,英特尔对频率和功耗算法进行改进,缩短其整体频率变化与退出时间,同时也具备更为智能的算法,使其只在运行高通量向量或是矩阵指令时才对频率进行调整,而对其他能耗不是特别高的向量指令,执行时并不会影响其频率。通过这一系列的算法优化,一方面用户可以更好地享受到向量或是矩阵指令带来的性能提升,另一方面亦不会因为维持系统稳定性而折损其他性能,这是英特尔做的技术层面的优化。
数据中心服务器装机量越来越多,从原来单纯满足业务需求到现在有了更多的精细化运营,开始关注产品的稳定性、产品的故障率。目前来说,数据中心故障率最大的来源与内存有关,所以英特尔也从客户处了解到痛点,和客户一起进行关于内存故障预测方面的技术创新。
完整的AI生态体验
从目前趋势来看,AI在未来计算当中的重要性越来越高。
为了满足客户在AI类工作负载的应用需求,英特尔做了两方面的工作:一个是平台适配,一个是上层数据适配。英特尔技术专家介绍说,在平台方面,英特尔提供通用的计算平台,为需要使用譬如英特尔oneAPI的中间层进行底层硬件适配,帮助其在新的至强平台上运行。
另外针对数据工程师,他们考虑一些应用场景是不是有数据精度的变化,比如说以前是16位精度的浮点,基于性能和延迟考虑,是否需要做INT8或者其他不同精度的变化,英特尔提供了量化工具,可以更好地进行精度调整,调整完成后,其仍可以利用原来PyTorch的模型开发各种AI应用。
此外,在HBM高带宽内存、多卡网络互连等方面,英特尔也在多方面进行技术投入,提供最好的整体数据中心方案。
除了数据中心AI,英特尔与合作伙伴推出了AI PC,这一全新概念让所有的IT设备都能够运行大语言模型。而在终端运行AI可以解决数据隐私性与网络持续性的难题。
“从PC到数据中心,英特尔面向开发者提供基于x86软件生态系统的完整体验。我们希望所有的AI软件工具栈可以无缝运行在不管是至强还是未来的产品上面,这是我们的愿景。”陈葆立说。
英特尔在中国的战略是“在中国,为中国”,与中国生态合作伙伴进行全方面的合作。这一生态链条也非常广泛,比如OEM厂商、互联网用户、IDC等。
陈葆立说,现在产品迭代非常快,在每次新产品发布之前,英特尔会提前一年甚至是一年半的时间介入和中国的合作伙伴合作,让他们知道英特尔的技术方向,他们也能够在自己的产品上做出及早的投入和验证。
例如英特尔与互联网客户开展了紧密合作,比如美团采用英特尔第四代至强可扩展处理器进行包括目标识别(Object recognition)或者是计算机视觉(Computer vision)等AI推理工作负载,取得了不错的成绩。其他的互联网公司亦是如此。
陈葆立表示,英特尔与互联网公司的合作成果能否推广到其他行业也是英特尔努力的方向。“算力不是单维度而是多维度的,竞争没有结束。我们一直在思考、创新更好的产品,帮助用户在未来构建更好的推理或是训练的数据中心集群。”
好文章,需要你的鼓励
开源向量数据库供应商 Qdrant 宣布利用 GPU 计算向量索引,速度比 x86 CPU 快 10 倍。最新版本支持 AMD、Intel 和 NVIDIA GPU,可大幅提升索引构建效率,降低成本。此外还引入了严格模式、图压缩等新功能,为 AI 应用提供更好的实时性能和扩展能力。
人工智能正在改变房地产行业的运作方式。从辅助卖家定价到为物业管理者提供自动化工具,AI 正在优化各个环节的运营效率,提升客户体验。AI 能快速分析大量数据,帮助人们做出更明智的决策,同时自动化某些任务,使人们能专注于更高价值的工作。
DigitalOcean在其年度用户大会上发布了GenAI平台,旨在让生成式AI更易于企业使用。该平台提供创建自定义AI代理、集成知识库和执行高级功能调用的工具,为构建AI驱动应用提供了简单途径。DigitalOcean强调易用性,致力于让更多开发者和初创企业能够轻松接入AI技术。
国泰航空与航空运输业 IT 提供商 SITA 签署协议,通过 SITA Connect Go 产品在 51 个全球机场提升网络带宽。该合作旨在将当前网络容量提高至原来的五倍,同时保持成本效率。这将帮助国泰航空提升运营效率、实现云应用过渡,并优化乘客体验。