Gaudi 3的定位是替代英伟达公司最畅销的H100图形处理器。直到今年3月,在最新的GPU Blackwell B200推出之前,H100一直是英伟达的旗舰AI加速器。英特尔表示,Gaudi 3的推理效能可以达到H100的2.3倍,可以让一些大型语言模型的训练时间更短。
英特尔于2019年收购初创公司,以此获得了人工智能处理器,Gaudi 3是该系列的第三次迭代。该芯片使用了台积电5纳米节点。Gaudi 3的处理能力由两块板载计算模块提供,分别为MME 和 TPC,它们分别针对不同任务进行了优化。
芯片的MME模块设计用于执行矩阵乘法运算。矩阵乘法是对按行和列排列的数字集合进行的数学计算,类似于电子表格中的字段。人工智能模型利用这种计算将输入数据转化为决策。
某些人工智能模型,如用于物体识别任务的模型,其大部分处理过程都是通过矩阵乘法完成的。大型语言模型等更高级的人工智能也使用其他类型的计算。Gaudi 3的 TPC 模块(该芯片包含的第二类计算电路)针对这些其他计算进行了优化。
TPC基于所谓的超长指令字架构。这是一种经过优化的芯片设计,可并行执行多个计算。由于并行执行计算比逐个完成计算更快,Gaudi 3的TPC 有助于加快人工智能模型的性能。
Gaudi 3包含64个TPC,几乎是前代产品的三倍。此外,MME(针对矩阵乘法进行优化的计算模块)的数量也是前者的四倍。芯片的逻辑电路配备了120GB内存池,其时钟速度高于英特尔上一代人工智能处理器的RAM。
该公司表示,Gaudi 3中引入的升级将其处理BF16数据的最高速度提高到了1,835 TFLOPS,即每秒万亿次计算。BF16是一种人工智能模型常用的信息存储数据格式。
性能的提升并不是Gaudi 3唯一的卖点。它还有一个板载以太网模块,可将人工智能服务器中的Gaudi 3处理器连接在一起,也可将多个此类服务器连接在一起。英特尔将芯片中单个以太网网络连接的带宽提高了一倍,达到每秒200Gb。
IBM 计划明年初在 IBM Cloud Virtual Servers for VPC 中提供 Gaudi 3。这是该公司在其公共云平台中提供的计算实例。IBM 还将在其 watsonx 产品套件中添加对 Gaudi 3 的支持,该套件包括软件工具,企业可利用这些工具构建人工智能模型、在生产中部署这些模型并执行相关任务。
好文章,需要你的鼓励
微软宣布为Word和Excel推出基于OpenAI的AI代理模式,通过简单提示即可自动生成文档和分析数据。Word用户可享受"氛围写作"功能,利用现有文档组装报告和提案。Excel代理能分析电子表格数据并生成可视化报告。尽管在SpreadsheetBench基准测试中准确率仅为57.2%,低于人类平均水平71.3%,但微软强调其针对实际工作场景优化。此外,微软还发布了基于Anthropic的Office代理,显示其正逐步减少对OpenAI的依赖。
苹果与清华合作提出EpiCache技术,解决AI长期对话中的记忆管理难题。该方法将对话自动分割成话题片段,为每个话题建立专门记忆库,实现智能匹配和高效检索。实验显示,EpiCache比传统方法准确率提高40%,内存使用减少4-6倍,响应速度提升2.4倍,为资源受限环境下的AI对话系统提供了实用解决方案。
OpenAI为美国ChatGPT用户推出"即时结账"功能,用户可在对话中直接购买Etsy和Shopify商品,无需跳转至外部网站。该功能支持Apple Pay、Google Pay等多种支付方式,并计划接入超过100万家Shopify商户。OpenAI还将开源其代理商务协议技术,与谷歌的代理支付协议形成竞争。这标志着电商购物模式的重大转变,AI聊天机器人可能重塑在线零售发现和支付生态系统。
清华大学与英伟达合作提出DiffusionNFT,一种革命性的AI图像生成训练方法。该方法通过对比正负样本进行学习,避免了复杂的概率计算,训练效率比传统方法提升25倍。研究团队在多项测试中验证了其优越性,不仅大幅提升了图像质量和文字渲染能力,还实现了无需分类器引导的高效训练,为AI图像生成技术的普及和应用奠定了重要基础。