Nvidia今天发布了一款新的高性能GPU,面向基于Ampere架构的人工智能训练和推理。
Nvidia表示,这款名为Nvidia A100的GPU芯片性能比上一代Volta GPU提升了20倍,非常适合于人工智能、数据分析、科学计算和云图形工作负载。
Nvidia在今天线上举行的GTC大会上公布了这款GPU,同时还发布了新的AI系统Nvidia DGX A100。Nvidia还向EGX Edge AI平台生态系统中添加了两款新产品,EGX A100融合加速器和EGX Jetson Xavier NX微边缘服务器,让客户有更多基于性能和成本要求的选择。
Nvidia数据中心和云平台产品管理总监Paresh Kharya在新闻发布会上表示,如今客户需要比Nvidia最早Volta AI架构高出3000倍的计算性能来训练那些最大的AI模型,而且他们还需要不同的性能水平去支持不同类型的、AI驱动的交互。
Kharya说:“软件多样性让数据中心硬件变得支离破碎。优化这种数据中心以实现高效率几乎是不可能的。”
因此,Nvidia决定利用A100重构GPU。A100芯片不仅可以大幅提升性能,而且可以在单个架构中实现AI训练和推理加速的统一。A100还可以实现大规模数据中心可扩展性,包括针对AI训练和数据分析的纵向扩展能力,以及针对AI推理的横向扩展能力。
Nvidia表示,A100 Ampere芯片是Nvidia迄今为止生产出来的最大的GPU,由540亿个晶体管组成,还打包了第三代Tensor核心,并具有针对稀疏矩阵运算的加速功能,对于AI推理和训练来说特别有用。此外,每个GPU可以划分为多个实例,执行不同的推理任务,采用Nvidia NVLink互连技术可以将多个A100 GPU用于更大的AI推理工作负载。
A100 GPU现在已经开始发售,并将在今天发布的Nvidia DGX A100第三代集成AI系统(如下图所示)中首次亮相。该系统包含8个A100 GPU,总共可提供320 GB的巨大内存,使其成为世界上最先进的AI系统。据说A100可以提供多达5 petaflops的AI性能,可以有效地将整个数据中心的功能和能力整合到一个灵活的平台中。
Nvidia方面表示,DGX A100平台还可以处理多个较小的AI工作负载,因为A100的多实例特性使其可以分区为56个实例。
Nvidia首席执行官黄仁勋在新闻发布会上表示:“这是我们第一次加速数据中心AI训练和推理以及数据分析工作负载。我希望DGX A100可以用于所有云中,计算的未来就在于数据中心规模。”
Nvidia表示,DGX A100平台的售价是20万美元,首批客户包括美国能源部阿贡国家实验室(Argonne Laboratory),该实验室预计增强AI和计算能力之后将有助于研究人员更好地理解和对抗COVID-19。
此外Oracle也采用了该平台,并称Oracle Cloud Infrastructure平台很快将提供A100 GPU,用于支持石油勘探和DNA测序等高性能计算工作负载。
A100 GPU还采用了Nvidia EGX A100融合加速器中的一些功能,该加速器将于今年晚些时候上市销售,能够实时处理和保护来自边缘传感器的流数据。Nvidia表示,EGX Jetson Xavier NX微型边缘服务器(如下图所示)是Nvidia有史以来最小的、功能最强大的AI超级计算机,它将Nvidia Xavier片上系统的功能整合到只有信用卡大小的模块中,可以流式传输来自多个高端分辨率传感器的数据,例如便利店中的安全摄像头等。
黄仁勋在声明中表示:“物联网和AI的融合引发了‘万物智能’的变革。大型行业现在可以提供智能连接的产品和服务,就像电信行业使用的智能手机一样。Nvidia EGX Edge AI平台将标准服务器转变为微型的、云原生的、安全的AI数据中心。企业借助我们的AI应用框架,可以构建从智能零售到机器人工厂再到自动呼叫中心的各种AI服务。”
Nvidia还宣布,汽车制造商宝马(BMW Group)已经在自己的汽车工厂中采用了Nvidia最新的Isaac机器人平台。该平台也采用了Nvidia Ampere A100 GPU,并将被宝马用于增强其物流工厂流程,从而更高效、更快速地生产定制配置型汽车。Nvidia表示,宝马将在全球工厂中部署Nvidia的这一新系统。
黄仁勋称:“宝马采用Nvidia Isaac机器人平台重构工厂是具有变革意义的,这引领了自动化工厂时代的发展,利用AI和机器人技术突破,创造了高度可定制的、按时按序制造的更高水平。”
Nvidia Isaac机器人平台采用DGX AI系统,以及Nvidia Quadro光线跟踪GPU以精确渲染合成机器零件,从而强化对机器人的训练。
Nvidia还公布了Nvidia Clara医疗平台的一项重要性能突破,多个新合作伙伴,以及一系列将有助于更好追踪、测试和治疗COVID-19的功能。
Nvidia表示,在性能方面Clara Parabricks计算基因组学软件在不到20分钟的时间内,就可以分析出整个人类基因组DNA序列,创下了速度新高。Nvidia还宣布推出了与美国国立卫生研究院(National Institutes of Health)合作开发的AI模型新模型,该模型可以帮助研究人员研究COVID-19胸部CT扫描,并打造用于检测感染的新工具。目前这个AI模型在NGC软件中心最新版本的Clara Imaging中提供给用户,采用了Nvidia Clara应用框架构用于医学成像。
此外Nvidia还公布了一个新的Clara Guardian应用框架,使用智能视频分析和自动语音识别技术,让医务人员可以进行生命体征监测,减少与受感染患者的接触。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。