英特尔承诺,Gaudi 3芯片打造的AI系统其成本效益要高于使用Nvidia GPU的系统,上个月戴尔和超微都发布了配置Gaudi 3的服务器系统,HPE预计将在12月推出自己的Gaudi 3系统。英特尔尚未透露联想等其他厂商的服务器产品何时上市。
本月刚刚成为英特尔新北美合作伙伴规模集团负责人的Michael Green承认,Gaudi 3的推广部署是一个“缓慢的过程”,因为上一代芯片仅由超微一家OEM厂商提供支持,而现在英特尔将扩大产品线的OEM支持范围。因此,英特尔的渠道合作伙伴要等到明年才能开始销售Gaudi 3系统。
“显然,我们已经与戴尔和Supermicro,实际上是戴尔和HPE等厂商展开合作,以确保这款芯片能够交到合作伙伴手中。但说实话:这是一个缓慢的过程,对吧?这是一款我们正在大力推广的全新产品。我们计划在2025年让它成为一款渠道可用产品。”
“在我们把Gaudi 3推向给大众群体的过程中,渠道发挥着重要作用,我们从Gaudi 2开始只有一个OEM合作伙伴,但现在有四个,这是一个巨大的进步。那么我们如何利用这一点,让它更适用于渠道合作伙伴呢?在我们的战略中,这只需要一点点时间。”
除了英特尔宣传Gaudi 3在AI系统中具有“性价比优势”之外,由于英特尔在硬件基础设施、软件平台和应用方面的开放生态系统策略,Gaudi 3芯片也将受到企业的青睐。
据英特尔称,从软件方面来看,这种开放的方法意味着合作伙伴和客户可以从不同厂商的各种工具中进行选择,以满足AI系统的每个软件需求。这种方法的一个关键方面是Open Platform for Enterprise AI,这是一个Linux基金会组织,可作为来自不同厂商、用于此类系统的微服务的基础。
Green表示,英特尔将在帮助渠道合作伙伴与ISV建立联系,以构建Gaudi 3系统所需的软件堆栈方面发挥“关键作用”。
“我们需要成为所有这些ISV合作伙伴的领军人物和主要聚合者,从成本优化的角度来看,我们将真正看到提供给最终用户的改进,以及他们可以做些什么。”
合作伙伴欢迎Gaudi 3渠道计划——但也有些疑虑
有解决方案提供商高管在接受媒体采访时表示,英特尔计划在渠道大力推广Gaudi 3,尤其是在市场对AI基础设施的需求和对Nvidia GPU替代品的需求仍然很高的情况下。但他们对Gaudi 3能给英特尔带来多大机会,看法并不一致。
Future Tech Enterprise是一家总部位于美国佛罗里达州劳德代尔堡的解决方案提供商,该公司首席执行官Bob Venero表示:“归根结底,渠道是一种了不起的工具,不仅可以推广产品,还可以让产品嵌入并启动起来,如果历史能够证明这一点,我们将能够通过产品为他们带来巨大的影响。”
Venero认为,如果英特尔能够展示自己如何以低于Nvidia GPU的运营成本(例如能源)实现AI数据中心,那么英特尔的Gaudi 3芯片可能会在企业中取得进展。
“你看看那些试图做AI农场之类的公司,他们没有足够的电力或冷却来做这件事,这是一件大事。所以如果我是英特尔,我会在价格和运营价格上传达这一信息,”他说。
他认为,英特尔也可以从自己在企业级市场的现有关系中受益,但这一切都取决于英特尔能否制定一个让合作伙伴能够销售Gaudi 3系统的计划。
“如果把英特尔放进你的环境中,你不会被解雇,对吧?所以我认为他们会有很多机会和增长,尤其是一旦合作伙伴能够推动的话,英特尔就会帮助建立一个计划,让合作伙伴帮助推动起来,”Venero说。
International Computer Concepts是一家总部位于美国伊利诺伊州诺斯布鲁克的系统集成商,该公司首席技术官Alexey Stolyar表示,他相信,市场上有一个产品能够替代基于Nvidia的AI系统,这会引发人们的兴趣,但他不确定这代表着多大的机会。
Stolyar表示,虽然他正在致力于针对某家客户的Gaudi 3项目,但很多客户仍然主要谈论的是Nvidia最新的GPU,包括即将推出的Blackwell芯片及其相关平台如GB200 NVL72机架级系统。
“现在两者还是不成比例的,”他说。
Stolyar表示,向企业销售AI基础设施的困难在于,在采用新技术方面,它们通常比初创公司和超大规模企业慢,尤其是在AI投资回报仍不明确的情况下。
“他们中的大多数人还不知道如何使用AI,不知道如何构建系统,不知道如何用这些系统做任何事情,而且学习曲线相当大。每个人都想这样做,但他们正在试图弄清楚,从金钱角度来看,这意味着什么?他们将如何从中赚钱?”他说。
Nor-Tech是一家总部位于美国明尼苏达州伯恩斯维尔的公司,该公司工程副总裁Dominic Daninger表示,英特尔在让市场采用Gaudi 3方面面临的最大挑战是Nvidia的主导地位,尤其考虑到这个竞争对手是如何扩大自己软件产品的。
“这将是一场战斗,因为Nvidia已经主导了这个市场很长时间,而且在这里拥有如此多的软件基础设施,已经被人们所采用,”他说。
Daninger认为,有一件事可以帮助英特尔,那就是超微已经开始通过JumpStart计划提供Gaudi 3系统进行远程测试。但他补充说,他的公司还没有考虑过销售Gaudi 3系统,因为目前还没有客户询问过。
“如果我们看到任何兴趣或需求的话,我们会的,”他说。
一位不愿透露姓名的解决方案提供商高管表示,渠道将成为英特尔Gaudi 3进入市场的关键途径,因为这是大多数企业购买IT基础设施的方式,与目前进行大规模采购的小型公司相比,渠道将代表着更大的机会。
“我认为,这就是他们推动我们发展的动力所在,因为我们可能比他们更能推动市场发展,”这位高管坦言。
尽管这位高管表示,市场对Nvidia GPU替代品的需求可能会让Gaudi 3从中受益,但他观察到,英特尔的另一个竞争对手AMD目前在与合作伙伴接触方面要积极得多。
“他们的销售和我们的销售齐头并进,他们正试图积极赢得这场亲和力之战。而英特尔在这方面有点太松懈了,”该高管表示,英特尔进行的大规模裁员一直令人担忧。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。