今天AMD揭开了MI100的神秘面纱,这是一款用于超级计算机的GPU,号称是同类产品中速度最快的芯片,峰值性能超过10teraflops。
超级计算机通常用于运行科学研究相关工作负载例如天气预报模型和物理模拟,以前超级计算机主要是使用CPU搭建的。
但是,由于研究人员在科学计算中越来越多地使用机器学习,因此如今新型超级计算机也经常大量采用GPU,这个趋势也进一步推动了市场对AMD MI100等芯片的需求不断增长。
MI100芯片基于7纳米制程工艺,在处理FP64数据时的最高性能可以达到11.5teraflops。(FP64是双精度浮点格式的简写,是一种科学计算中经常使用的数据单元,很适合表示较大的数字)。
而当数据单元较小的时候,MI100也可以提供更高的速度。例如对于FP32数据来说,AMD预计在某些情况下峰值性能可以达到46.1teraflops。
MI100芯片令人印象深刻的性能表现,一部分要归功于封装中采用的Matrix Core技术。据AMD称,这是一种针对AI优化的专用计算引擎,可以将神经网络处理数据的速度提高近7倍。
AMD GPU的基本架构是流处理器,其作用类似于CPU的核心。MI100附带了7680个此类流处理器,这些流处理器被整合成为120个较大计算单元,成为芯片的一个组成部分,此外支持32GB内存,MI100利用这些内存来存储正在处理中的数据以加快访问速度。
一台超级计算机是由多台服务器组成的,每台服务器内部都可以配置多个GPU,具体要取决于对性能的要求。为了支持采用GPU的超算客户,MI100集成了一项名为Infinity Fabric的技术,可以将多达4个GPU链接在一起,形成所谓的蜂巢。在这种配置下的MI100芯片可以更快地相互共享数据,从而更快地执行计算,因为Infinity Fabric所提供的峰值带宽是通常用于芯片间连接的PCIe 4.0技术的2倍。
AMD推出MI100芯片正值超级计算机相关的支出不断增加的时候,全球各国都在构建新一代“百亿级”超级计算机,性能超过每秒10亿次操作,是当今最快系统所能实现的速度的若干倍。AMD已经拿下了多个订单,为即将上线的百亿亿次运算系统提供芯片,此次推出MI100,未来还将会给AMD带来更多的订单合同。
AMD对于MI100性能的大胆公布,可能意味着在这个重要的市场中,Nvidia将面临更多竞争。上个月,Nvidia刚刚宣布已经被选为欧洲四套全新超级计算机系统的GPU提供商,其中的一套系统甚至有望成为全球性能最强大的AI超级计算机。
好文章,需要你的鼓励
北航团队发布AnimaX技术,能够根据文字描述让静态3D模型自动生成动画。该系统支持人形角色、动物、家具等各类模型,仅需6分钟即可完成高质量动画生成,效率远超传统方法。通过多视角视频-姿态联合扩散模型,AnimaX有效结合了视频AI的运动理解能力与骨骼动画的精确控制,在16万动画序列数据集上训练后展现出卓越性能。
Writer首席执行官May Habib指出,企业在构建和扩展AI智能体时面临重大挑战。智能体在构建、运行和改进方式上与传统软件截然不同,需要抛弃传统软件开发生命周期。智能体不会可靠地遵循规则,而是结果导向、具备解释和适应能力。企业需要采用目标导向方法,设计业务逻辑蓝图而非工作流程。质量保证也需要评估非二元行为和实际应用表现。智能体维护需要新的版本控制系统,涵盖提示、模型设置等所有影响行为的因素。
这项研究解决了AI图片描述中的两大难题:描述不平衡和内容虚构。通过创新的"侦探式追问"方法,让AI能生成更详细准确的图片描述,显著提升了多个AI系统的性能表现,为无障碍技术、教育、电商等领域带来实用价值。