今天AMD揭开了MI100的神秘面纱,这是一款用于超级计算机的GPU,号称是同类产品中速度最快的芯片,峰值性能超过10teraflops。

超级计算机通常用于运行科学研究相关工作负载例如天气预报模型和物理模拟,以前超级计算机主要是使用CPU搭建的。
但是,由于研究人员在科学计算中越来越多地使用机器学习,因此如今新型超级计算机也经常大量采用GPU,这个趋势也进一步推动了市场对AMD MI100等芯片的需求不断增长。
MI100芯片基于7纳米制程工艺,在处理FP64数据时的最高性能可以达到11.5teraflops。(FP64是双精度浮点格式的简写,是一种科学计算中经常使用的数据单元,很适合表示较大的数字)。
而当数据单元较小的时候,MI100也可以提供更高的速度。例如对于FP32数据来说,AMD预计在某些情况下峰值性能可以达到46.1teraflops。
MI100芯片令人印象深刻的性能表现,一部分要归功于封装中采用的Matrix Core技术。据AMD称,这是一种针对AI优化的专用计算引擎,可以将神经网络处理数据的速度提高近7倍。
AMD GPU的基本架构是流处理器,其作用类似于CPU的核心。MI100附带了7680个此类流处理器,这些流处理器被整合成为120个较大计算单元,成为芯片的一个组成部分,此外支持32GB内存,MI100利用这些内存来存储正在处理中的数据以加快访问速度。
一台超级计算机是由多台服务器组成的,每台服务器内部都可以配置多个GPU,具体要取决于对性能的要求。为了支持采用GPU的超算客户,MI100集成了一项名为Infinity Fabric的技术,可以将多达4个GPU链接在一起,形成所谓的蜂巢。在这种配置下的MI100芯片可以更快地相互共享数据,从而更快地执行计算,因为Infinity Fabric所提供的峰值带宽是通常用于芯片间连接的PCIe 4.0技术的2倍。
AMD推出MI100芯片正值超级计算机相关的支出不断增加的时候,全球各国都在构建新一代“百亿级”超级计算机,性能超过每秒10亿次操作,是当今最快系统所能实现的速度的若干倍。AMD已经拿下了多个订单,为即将上线的百亿亿次运算系统提供芯片,此次推出MI100,未来还将会给AMD带来更多的订单合同。
AMD对于MI100性能的大胆公布,可能意味着在这个重要的市场中,Nvidia将面临更多竞争。上个月,Nvidia刚刚宣布已经被选为欧洲四套全新超级计算机系统的GPU提供商,其中的一套系统甚至有望成为全球性能最强大的AI超级计算机。
好文章,需要你的鼓励
2025年12月18日,OpenAI CEO山姆·奥特曼(Sam Altman)做客Big Technology Podcast,与主持人Alex Kantrowitz进行了一场长达近一小时的深度对话。
这项由蚂蚁集团、香港科技大学等机构研究者完成的工作提出了Ditto框架,通过创新的数据生成管道解决了视频编辑领域的数据稀缺问题。研究团队生成了包含一百万个高质量视频编辑样本的Ditto-1M数据集,并基于此训练了Editto模型。该模型在多项评估中显著超越现有方法,实现了更精准的指令遵循和更好的时间一致性,为指令驱动的视频编辑树立了新的技术标杆。
2025年12月17日,Google DeepMind播客发布了本季收官之作。数学家Hannah Fry与公司联合创始人兼CEO Demis Hassabis进行了年度深度对话。
这项由阿里巴巴和中科院联合完成的研究提出了ImagerySearch,一种创新的视频生成方法,能够帮助AI生成更好的创意和想象力十足的视频。研究团队还创建了LDT-Bench,首个专门评估AI在处理奇异场景能力的基准。实验表明,ImagerySearch在处理创意场景时相比现有方法有显著提升,为AI创意内容生成开辟了新的方向。