今天AMD揭开了MI100的神秘面纱,这是一款用于超级计算机的GPU,号称是同类产品中速度最快的芯片,峰值性能超过10teraflops。

超级计算机通常用于运行科学研究相关工作负载例如天气预报模型和物理模拟,以前超级计算机主要是使用CPU搭建的。
但是,由于研究人员在科学计算中越来越多地使用机器学习,因此如今新型超级计算机也经常大量采用GPU,这个趋势也进一步推动了市场对AMD MI100等芯片的需求不断增长。
MI100芯片基于7纳米制程工艺,在处理FP64数据时的最高性能可以达到11.5teraflops。(FP64是双精度浮点格式的简写,是一种科学计算中经常使用的数据单元,很适合表示较大的数字)。
而当数据单元较小的时候,MI100也可以提供更高的速度。例如对于FP32数据来说,AMD预计在某些情况下峰值性能可以达到46.1teraflops。
MI100芯片令人印象深刻的性能表现,一部分要归功于封装中采用的Matrix Core技术。据AMD称,这是一种针对AI优化的专用计算引擎,可以将神经网络处理数据的速度提高近7倍。
AMD GPU的基本架构是流处理器,其作用类似于CPU的核心。MI100附带了7680个此类流处理器,这些流处理器被整合成为120个较大计算单元,成为芯片的一个组成部分,此外支持32GB内存,MI100利用这些内存来存储正在处理中的数据以加快访问速度。
一台超级计算机是由多台服务器组成的,每台服务器内部都可以配置多个GPU,具体要取决于对性能的要求。为了支持采用GPU的超算客户,MI100集成了一项名为Infinity Fabric的技术,可以将多达4个GPU链接在一起,形成所谓的蜂巢。在这种配置下的MI100芯片可以更快地相互共享数据,从而更快地执行计算,因为Infinity Fabric所提供的峰值带宽是通常用于芯片间连接的PCIe 4.0技术的2倍。
AMD推出MI100芯片正值超级计算机相关的支出不断增加的时候,全球各国都在构建新一代“百亿级”超级计算机,性能超过每秒10亿次操作,是当今最快系统所能实现的速度的若干倍。AMD已经拿下了多个订单,为即将上线的百亿亿次运算系统提供芯片,此次推出MI100,未来还将会给AMD带来更多的订单合同。
AMD对于MI100性能的大胆公布,可能意味着在这个重要的市场中,Nvidia将面临更多竞争。上个月,Nvidia刚刚宣布已经被选为欧洲四套全新超级计算机系统的GPU提供商,其中的一套系统甚至有望成为全球性能最强大的AI超级计算机。
好文章,需要你的鼓励
亚马逊云服务宣布其存储网关现已支持Nutanix的AHV虚拟化管理程序,进一步扩展混合云存储解决方案。此前AWS存储网关已支持VMware ESXi、微软Hyper-V和Linux KVM。由于AHV基于KVM架构,AWS表示添加支持相对容易。随着Broadcom收购VMware后策略调整,许多企业正寻求替代方案,Nutanix成为热门选择。分析师预测VMware可能在三年内失去35%的工作负载。
上海AI实验室团队开发了LoGoPlanner机器人导航系统,这是首个完全不依赖外部定位的端到端视觉导航框架。该系统通过视觉几何学习、隐式状态估计和几何感知规划三大核心技术,让机器人仅凭摄像头就能在复杂环境中精准导航。实验显示其性能比传统方法提升27.3%,且能跨平台部署在不同类型机器人上。
中国AI初创公司MiniMax发布M2.1模型,在多种编程语言和办公场景中显著提升了复杂任务处理和智能体能力。该模型在Rust、Java、Golang、C++等多种编程语言方面表现出色,在Web、Android和iOS界面开发的美学设计能力大幅提升。M2.1不仅专注于代码执行正确性,还能遵循复杂指导,在VIBE基准测试中平均得分88.6分。
阿里巴巴联合上海交大推出"推理调色盘"技术,通过变分自编码器学习不同推理模式特征,在AI思考前提供多样化思维引导,显著提升数学推理等任务性能3-4个百分点,实现了从词汇层面到策略层面的探索升级。