相信这款低配版芯片将受到中国市场欢迎。
英特尔将推出两款专供中国市场的Gaudi 3 AI加速器,根据美国出台的制裁政策对性能做出大幅“阉割”。
英特尔在其Gaudi 3白皮书中详细介绍这两款获准在中国销售的芯片型号。两款专为中国制造的处理器分别为HL-328与HL-388,分别采用OAM与PCIe外形规格。前者计划于6月推出,后者则将同其他PCIe规格的Gaudi 3芯片一同于9月上市。
总体而言,HL-328与H:-388芯片同其他家族成员基本相同,仍采用128 GB HBM2e VRAM,带宽为3.7 TB/秒、96 MB缓存、配备PCIe 5.0 x 16接口并采用相同的解码标准。
唯一的区别只体现在设计功率方面——OAM与PCIe两个版本均为450瓦,远低于家族内的其他兄弟产品。非中版PCIe HL-338的设计功率为600瓦,OAM规格的HL-325L及HL-335设计功率更是高达900瓦。中版Gaudi 3芯片在设计功率方面相对较低,很可能是因为不提供液冷版本。
尽管白皮书中未做明确说明,但几乎可以肯定的是,此举是为了遵守美国政府提出的处理器出口管制政策。管制条文禁止美国企业向中国出口高性能芯片,所以此番“阉割”实属无奈之举。
目前还不清楚英特尔对中版Gaudi 3做出了哪些修改,也很难判断面向中国市场的这批芯片在修改之后执行速度如何。单从已知线索来看,中版HL-328与HL-388与其他Gaudi 3版本一样采用双芯片设计,毕竟其内存及缓存配置未受影响。这种双芯片设计有助于降低性能密度,确保产品不致超过4800总处理能力(TPP)的出口管制上限。
所谓4800 TPP,换算成常规性能代表芯片最高只能在16位精度下提供150 TFLOPS性能。由于Gaudi 3在16位精度下可达到1835 TFLOPS,因此英特尔必须大幅削减其性能水平,包括大规模下调核心数量、时钟速率或采取其他性能限制方法。
我们已经就中版Gaudi 3芯片的具体细节向英特尔公司求证,但尚未收到回复。若英特尔后续披露更多信息,我们将第一时间发布更新。
根据合理推测,HL-328与HL-388的性能将与英伟达H20相似——H20是GPU巨头目前获准在中国销售的最强加速芯片,拥有148 TFLOPS的16位精度性能,略低于150 TFOPS的政策限制。
由于H20和Gaudi 3中版处理器的原始核心性能基本相当,因此区别主要体现在内存(英特尔方面内存容量更大但带宽略低)与配套软件(英伟达向来以GPU开发生态为卖点)层面。
好文章,需要你的鼓励
Instagram负责人莫塞里在接受采访时透露,平台正考虑引入长视频内容功能,尽管此前一直专注于短视频。他承认为了吸引优质内容,Instagram可能需要支持长视频格式。此外,Meta最近推出了"您的算法"功能,旨在让用户更好地控制信息流内容。莫塞里承诺未来将提供更多工具,让用户主动塑造个性化内容,但完整实现可能需要2-4年时间。
香港大学联合Adobe研究院提出PS-VAE技术,成功解决了AI无法同时具备图像理解和生成能力的难题。通过创新的两阶段训练策略,让AI既能准确理解图片语义,又能生成高质量图像,在图像编辑任务上性能提升近4倍,为统一视觉AI系统开辟新路径,在数字创作、教育、电商等领域具有广阔应用前景。
在信息爆炸的时代,AI实验室的研究员们常常需要面对海量的论文、专利文件、论坛发言等各种渠道的信息。传统的查找方式不仅费时费力,还容易遗漏关键内容。那么,有没有一种方式能让AI真正代替人工,完成从找资料到写出稿的全流程工作?
华中科技大学与马里兰大学研究团队开发出Sage评估框架,首次无需人工标注即可评估AI评判员可靠性。研究发现即使最先进的AI模型在评判任务中也存在严重不一致问题,近四分之一困难情况下无法保持稳定偏好。团队提出明确评判标准和专门微调等改进方法,为构建更可靠AI评估体系提供重要工具。