Gaudi 3的定位是替代英伟达公司最畅销的H100图形处理器。直到今年3月,在最新的GPU Blackwell B200推出之前,H100一直是英伟达的旗舰AI加速器。英特尔表示,Gaudi 3的推理效能可以达到H100的2.3倍,可以让一些大型语言模型的训练时间更短。
英特尔于2019年收购初创公司,以此获得了人工智能处理器,Gaudi 3是该系列的第三次迭代。该芯片使用了台积电5纳米节点。Gaudi 3的处理能力由两块板载计算模块提供,分别为MME 和 TPC,它们分别针对不同任务进行了优化。
芯片的MME模块设计用于执行矩阵乘法运算。矩阵乘法是对按行和列排列的数字集合进行的数学计算,类似于电子表格中的字段。人工智能模型利用这种计算将输入数据转化为决策。
某些人工智能模型,如用于物体识别任务的模型,其大部分处理过程都是通过矩阵乘法完成的。大型语言模型等更高级的人工智能也使用其他类型的计算。Gaudi 3的 TPC 模块(该芯片包含的第二类计算电路)针对这些其他计算进行了优化。
TPC基于所谓的超长指令字架构。这是一种经过优化的芯片设计,可并行执行多个计算。由于并行执行计算比逐个完成计算更快,Gaudi 3的TPC 有助于加快人工智能模型的性能。
Gaudi 3包含64个TPC,几乎是前代产品的三倍。此外,MME(针对矩阵乘法进行优化的计算模块)的数量也是前者的四倍。芯片的逻辑电路配备了120GB内存池,其时钟速度高于英特尔上一代人工智能处理器的RAM。
该公司表示,Gaudi 3中引入的升级将其处理BF16数据的最高速度提高到了1,835 TFLOPS,即每秒万亿次计算。BF16是一种人工智能模型常用的信息存储数据格式。
性能的提升并不是Gaudi 3唯一的卖点。它还有一个板载以太网模块,可将人工智能服务器中的Gaudi 3处理器连接在一起,也可将多个此类服务器连接在一起。英特尔将芯片中单个以太网网络连接的带宽提高了一倍,达到每秒200Gb。
IBM 计划明年初在 IBM Cloud Virtual Servers for VPC 中提供 Gaudi 3。这是该公司在其公共云平台中提供的计算实例。IBM 还将在其 watsonx 产品套件中添加对 Gaudi 3 的支持,该套件包括软件工具,企业可利用这些工具构建人工智能模型、在生产中部署这些模型并执行相关任务。
好文章,需要你的鼓励
生成式AI在电商领域发展迅速,但真正的客户信任来自可靠的购物体验。数据显示近70%的在线购物者会放弃购物车,主要因为结账缓慢、隐藏费用等问题。AI基础设施工具正在解决这些信任危机,通过实时库存监控、动态结账优化和智能物流配送,帮助商家在售前、售中、售后各环节提升可靠性,最终将一次性买家转化为忠实客户。
泰国SCBX金融集团开发的DoTA-RAG系统通过动态路由和混合检索技术,成功解决了大规模知识库检索中速度与准确性难以兼得的难题。系统将1500万文档的搜索空间缩小92%,响应时间从100秒降至35秒,正确性评分提升96%,为企业级智能问答系统提供了实用的技术方案。
存储供应商Qumulo发布多租户架构Stratus,为每个租户提供独立的虚拟环境,通过加密技术和租户专用密钥管理系统实现隔离。该统一文件和对象存储软件支持本地、边缘、数据中心及AWS、Azure等云环境部署。Stratus采用加密隔离技术确保敏感数据安全,同时提供任务关键操作所需的灵活性和效率,帮助联邦和企业客户满足合规要求。
中科院和字节跳动联合开发了VGR视觉锚定推理系统,突破了传统AI只能粗略"看图"的局限。该系统能在推理过程中主动关注图片关键区域,像人类一样仔细观察细节后再得出结论。实验显示VGR在图表理解等任务上性能大幅提升,同时计算效率更高,代表了多模态AI"可视化推理"的重要进展。