Gaudi 3的定位是替代英伟达公司最畅销的H100图形处理器。直到今年3月,在最新的GPU Blackwell B200推出之前,H100一直是英伟达的旗舰AI加速器。英特尔表示,Gaudi 3的推理效能可以达到H100的2.3倍,可以让一些大型语言模型的训练时间更短。
英特尔于2019年收购初创公司,以此获得了人工智能处理器,Gaudi 3是该系列的第三次迭代。该芯片使用了台积电5纳米节点。Gaudi 3的处理能力由两块板载计算模块提供,分别为MME 和 TPC,它们分别针对不同任务进行了优化。
芯片的MME模块设计用于执行矩阵乘法运算。矩阵乘法是对按行和列排列的数字集合进行的数学计算,类似于电子表格中的字段。人工智能模型利用这种计算将输入数据转化为决策。
某些人工智能模型,如用于物体识别任务的模型,其大部分处理过程都是通过矩阵乘法完成的。大型语言模型等更高级的人工智能也使用其他类型的计算。Gaudi 3的 TPC 模块(该芯片包含的第二类计算电路)针对这些其他计算进行了优化。
TPC基于所谓的超长指令字架构。这是一种经过优化的芯片设计,可并行执行多个计算。由于并行执行计算比逐个完成计算更快,Gaudi 3的TPC 有助于加快人工智能模型的性能。
Gaudi 3包含64个TPC,几乎是前代产品的三倍。此外,MME(针对矩阵乘法进行优化的计算模块)的数量也是前者的四倍。芯片的逻辑电路配备了120GB内存池,其时钟速度高于英特尔上一代人工智能处理器的RAM。
该公司表示,Gaudi 3中引入的升级将其处理BF16数据的最高速度提高到了1,835 TFLOPS,即每秒万亿次计算。BF16是一种人工智能模型常用的信息存储数据格式。
性能的提升并不是Gaudi 3唯一的卖点。它还有一个板载以太网模块,可将人工智能服务器中的Gaudi 3处理器连接在一起,也可将多个此类服务器连接在一起。英特尔将芯片中单个以太网网络连接的带宽提高了一倍,达到每秒200Gb。
IBM 计划明年初在 IBM Cloud Virtual Servers for VPC 中提供 Gaudi 3。这是该公司在其公共云平台中提供的计算实例。IBM 还将在其 watsonx 产品套件中添加对 Gaudi 3 的支持,该套件包括软件工具,企业可利用这些工具构建人工智能模型、在生产中部署这些模型并执行相关任务。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。