相信这款低配版芯片将受到中国市场欢迎。
英特尔将推出两款专供中国市场的Gaudi 3 AI加速器,根据美国出台的制裁政策对性能做出大幅“阉割”。
英特尔在其Gaudi 3白皮书中详细介绍这两款获准在中国销售的芯片型号。两款专为中国制造的处理器分别为HL-328与HL-388,分别采用OAM与PCIe外形规格。前者计划于6月推出,后者则将同其他PCIe规格的Gaudi 3芯片一同于9月上市。
总体而言,HL-328与H:-388芯片同其他家族成员基本相同,仍采用128 GB HBM2e VRAM,带宽为3.7 TB/秒、96 MB缓存、配备PCIe 5.0 x 16接口并采用相同的解码标准。
唯一的区别只体现在设计功率方面——OAM与PCIe两个版本均为450瓦,远低于家族内的其他兄弟产品。非中版PCIe HL-338的设计功率为600瓦,OAM规格的HL-325L及HL-335设计功率更是高达900瓦。中版Gaudi 3芯片在设计功率方面相对较低,很可能是因为不提供液冷版本。
尽管白皮书中未做明确说明,但几乎可以肯定的是,此举是为了遵守美国政府提出的处理器出口管制政策。管制条文禁止美国企业向中国出口高性能芯片,所以此番“阉割”实属无奈之举。
目前还不清楚英特尔对中版Gaudi 3做出了哪些修改,也很难判断面向中国市场的这批芯片在修改之后执行速度如何。单从已知线索来看,中版HL-328与HL-388与其他Gaudi 3版本一样采用双芯片设计,毕竟其内存及缓存配置未受影响。这种双芯片设计有助于降低性能密度,确保产品不致超过4800总处理能力(TPP)的出口管制上限。
所谓4800 TPP,换算成常规性能代表芯片最高只能在16位精度下提供150 TFLOPS性能。由于Gaudi 3在16位精度下可达到1835 TFLOPS,因此英特尔必须大幅削减其性能水平,包括大规模下调核心数量、时钟速率或采取其他性能限制方法。
我们已经就中版Gaudi 3芯片的具体细节向英特尔公司求证,但尚未收到回复。若英特尔后续披露更多信息,我们将第一时间发布更新。
根据合理推测,HL-328与HL-388的性能将与英伟达H20相似——H20是GPU巨头目前获准在中国销售的最强加速芯片,拥有148 TFLOPS的16位精度性能,略低于150 TFOPS的政策限制。
由于H20和Gaudi 3中版处理器的原始核心性能基本相当,因此区别主要体现在内存(英特尔方面内存容量更大但带宽略低)与配套软件(英伟达向来以GPU开发生态为卖点)层面。
好文章,需要你的鼓励
英特尔携手戴尔以及零克云,通过打造“工作站-AI PC-云端”的协同生态,大幅缩短AI部署流程,助力企业快速实现从想法验证到规模化落地。
意大利ISTI研究院推出Patch-ioner零样本图像描述框架,突破传统局限实现任意区域精确描述。系统将图像拆分为小块,通过智能组合生成从单块到整图的统一描述,无需区域标注数据。创新引入轨迹描述任务,用户可用鼠标画线获得对应区域描述。在四大评测任务中全面超越现有方法,为人机交互开辟新模式。
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
MIT研究团队发现,AI系统无需严格配对的多模态数据也能显著提升性能。他们开发的UML框架通过参数共享让AI从图像、文本、音频等不同类型数据中学习,即使这些数据间没有直接对应关系。实验显示这种方法在图像分类、音频识别等任务上都超越了单模态系统,并能自发发展出跨模态理解能力,为未来AI应用开辟了新路径。