今天AMD揭开了MI100的神秘面纱,这是一款用于超级计算机的GPU,号称是同类产品中速度最快的芯片,峰值性能超过10teraflops。

超级计算机通常用于运行科学研究相关工作负载例如天气预报模型和物理模拟,以前超级计算机主要是使用CPU搭建的。
但是,由于研究人员在科学计算中越来越多地使用机器学习,因此如今新型超级计算机也经常大量采用GPU,这个趋势也进一步推动了市场对AMD MI100等芯片的需求不断增长。
MI100芯片基于7纳米制程工艺,在处理FP64数据时的最高性能可以达到11.5teraflops。(FP64是双精度浮点格式的简写,是一种科学计算中经常使用的数据单元,很适合表示较大的数字)。
而当数据单元较小的时候,MI100也可以提供更高的速度。例如对于FP32数据来说,AMD预计在某些情况下峰值性能可以达到46.1teraflops。
MI100芯片令人印象深刻的性能表现,一部分要归功于封装中采用的Matrix Core技术。据AMD称,这是一种针对AI优化的专用计算引擎,可以将神经网络处理数据的速度提高近7倍。
AMD GPU的基本架构是流处理器,其作用类似于CPU的核心。MI100附带了7680个此类流处理器,这些流处理器被整合成为120个较大计算单元,成为芯片的一个组成部分,此外支持32GB内存,MI100利用这些内存来存储正在处理中的数据以加快访问速度。
一台超级计算机是由多台服务器组成的,每台服务器内部都可以配置多个GPU,具体要取决于对性能的要求。为了支持采用GPU的超算客户,MI100集成了一项名为Infinity Fabric的技术,可以将多达4个GPU链接在一起,形成所谓的蜂巢。在这种配置下的MI100芯片可以更快地相互共享数据,从而更快地执行计算,因为Infinity Fabric所提供的峰值带宽是通常用于芯片间连接的PCIe 4.0技术的2倍。
AMD推出MI100芯片正值超级计算机相关的支出不断增加的时候,全球各国都在构建新一代“百亿级”超级计算机,性能超过每秒10亿次操作,是当今最快系统所能实现的速度的若干倍。AMD已经拿下了多个订单,为即将上线的百亿亿次运算系统提供芯片,此次推出MI100,未来还将会给AMD带来更多的订单合同。
AMD对于MI100性能的大胆公布,可能意味着在这个重要的市场中,Nvidia将面临更多竞争。上个月,Nvidia刚刚宣布已经被选为欧洲四套全新超级计算机系统的GPU提供商,其中的一套系统甚至有望成为全球性能最强大的AI超级计算机。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。