相信这款低配版芯片将受到中国市场欢迎。
英特尔将推出两款专供中国市场的Gaudi 3 AI加速器,根据美国出台的制裁政策对性能做出大幅“阉割”。
英特尔在其Gaudi 3白皮书中详细介绍这两款获准在中国销售的芯片型号。两款专为中国制造的处理器分别为HL-328与HL-388,分别采用OAM与PCIe外形规格。前者计划于6月推出,后者则将同其他PCIe规格的Gaudi 3芯片一同于9月上市。
总体而言,HL-328与H:-388芯片同其他家族成员基本相同,仍采用128 GB HBM2e VRAM,带宽为3.7 TB/秒、96 MB缓存、配备PCIe 5.0 x 16接口并采用相同的解码标准。
唯一的区别只体现在设计功率方面——OAM与PCIe两个版本均为450瓦,远低于家族内的其他兄弟产品。非中版PCIe HL-338的设计功率为600瓦,OAM规格的HL-325L及HL-335设计功率更是高达900瓦。中版Gaudi 3芯片在设计功率方面相对较低,很可能是因为不提供液冷版本。
尽管白皮书中未做明确说明,但几乎可以肯定的是,此举是为了遵守美国政府提出的处理器出口管制政策。管制条文禁止美国企业向中国出口高性能芯片,所以此番“阉割”实属无奈之举。
目前还不清楚英特尔对中版Gaudi 3做出了哪些修改,也很难判断面向中国市场的这批芯片在修改之后执行速度如何。单从已知线索来看,中版HL-328与HL-388与其他Gaudi 3版本一样采用双芯片设计,毕竟其内存及缓存配置未受影响。这种双芯片设计有助于降低性能密度,确保产品不致超过4800总处理能力(TPP)的出口管制上限。
所谓4800 TPP,换算成常规性能代表芯片最高只能在16位精度下提供150 TFLOPS性能。由于Gaudi 3在16位精度下可达到1835 TFLOPS,因此英特尔必须大幅削减其性能水平,包括大规模下调核心数量、时钟速率或采取其他性能限制方法。
我们已经就中版Gaudi 3芯片的具体细节向英特尔公司求证,但尚未收到回复。若英特尔后续披露更多信息,我们将第一时间发布更新。
根据合理推测,HL-328与HL-388的性能将与英伟达H20相似——H20是GPU巨头目前获准在中国销售的最强加速芯片,拥有148 TFLOPS的16位精度性能,略低于150 TFOPS的政策限制。
由于H20和Gaudi 3中版处理器的原始核心性能基本相当,因此区别主要体现在内存(英特尔方面内存容量更大但带宽略低)与配套软件(英伟达向来以GPU开发生态为卖点)层面。
好文章,需要你的鼓励
三星与AI搜索引擎Perplexity合作,将其应用引入智能电视。2025年三星电视用户可立即使用,2024和2023年款设备将通过系统更新获得支持。用户可通过打字或语音提问,Perplexity还为用户提供12个月免费Pro订阅。尽管面临版权争议,这一合作仍引发关注。
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
苹果M5 MacBook Pro评测显示这是一次相对较小的升级。最大变化是M5芯片,CPU性能比M4提升约9%,多核性能比M4 MacBook Air快19%,GPU性能提升37%。功耗可能有所增加但电池续航保持24小时。评测者认为该产品不适合M4用户升级,但对使用older型号用户仍是强有力选择。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。