AI 与加速计算和高性能计算相结合,形成了推动超指数级进步的数字飞轮。

黄仁勋称:“得益于各种进步,我们正处在行业高性能计算革命的开端。”
在下方的简短访谈中,NVIDIA 首席执行官向欧洲高性能计算专家们描述了我们一生中最强大的技术趋势的缘起和远景。
高性能计算正在经历多米诺骨牌效应,这种效应始于几十年前,常见于学术研究中心内的模拟仿真方面。此类实验室的研究工作吸引了航空航天、医疗健康等多个行业的注意,但他们发现,这些研究所需的大型计算量是在当时完全无法满足的,直到后来加速计算和深度学习出现,人们才重新看到曙光。
在这两种技术力量的推动下,多米诺骨牌正在倒下,并向四面八方散开。
黄仁勋在为法国 Teratec 活动致辞时表示:“当我们听到数字生物学革命、未来工厂革命或数字孪生革命时,他们都有同样的内因在推动发展。”
多米诺骨牌效应推动实现超指数级发展
可以用简单的算术来描述这种多米诺骨牌效应:高性能计算 + 加速计算 + 深度学习。
近期科学抗击新冠肺炎疫情的一个例子体现了该公式的强大成效。

图片说明:模拟仿真、加速计算和 AI 推动数字生物学呈超指数级进步。
数十年来,科学家们一直在尝试模拟原子的相互作用方式,这项工作对于推进化学研究、研制出更好的药物至关重要。难题在于如何实现观察记录复杂生物学机制。
例如,有一个团队在 2016 年取得了里程碑式的成就,利用 GPU 加速对 100 万个原子20 ns的行为进行建模。去年,由加州大学圣地亚哥分校 (UCSD) 研究员 Rommie Amaro 领导的一个研究团队利用 GPU 和深度学习,展示了健康的细胞是如何感染新型冠状病毒的。该团队在 Summit 超级计算机上对 3.05 亿个原子1毫秒行为进行了模拟, 突破了极限。
在这 15 年间当中,速度增加了 1,000 多万倍。黄仁勋称这是以超指数级、超摩尔定律的速度实现的进步。
为各行各业提供有意义的洞察
这些数字令人震惊,更了不起的是,研究人员借助仿真模拟首次看到了新型冠状病毒刺突蛋白感染健康细胞的复杂机制。
各行各业都希望拥有这种变革性的洞察力。因此,企业领导者们开始利用 Amaro 团队及许多其他科学家们所开创的技术。
制药公司正在利用经由 GPU 加速的模拟和 AI 来加速药物发现。宝马等汽车制造商正在利用此类技术实现整个工厂的建模。欧洲的 DestinE 项目将打造地球的数字孪生体,这种仿真只有结合高性能计算与 AI 才能实现。

图片说明:各行各业的领导者们都在寻求利用模拟仿真、加速计算和 AI 的融合力量。
如今模拟仿真在很多方面影响着人们的生活。例如,互联网服务使用推荐系统来了解我们喜欢购买、阅读和观看的内容。推荐系统实际上是对人类偏好的模拟,该模拟基于包含数百种产品和客户特征的几十亿数据点所呈现的模式而实现。。
在这方面,NVIDIA 创造了黄仁勋所称的 “仿真文化”。
早期,我们构建了一种基础架构,通过仿真技术确保像数百亿晶体管赋能的 NVIDIA A100 Tensor Core GPU 这样的复杂设计在第一次迭代后即可开始量产。相比之下,许多芯片制造商会经历漫长而昂贵的试错过程,通过制作多个设计以确保所有细节正确。
整装待发
这场行业高性能计算革命将席卷数据中心、公有云和混合云以及边缘网络。黄仁勋称:“应用的多样性和系统瓶颈将推动系统架构的多样性……而这正是 ARM 的魅力所在”。他指的是 NVIDIA 去年 9 月宣布的收购计划。
ARM 开放、可定制的处理器架构已经支持:
● 用于云计算的 Amazon Graviton
● Ampere Computing 的 Altra 处理器
● 用于存储服务器和 5G 基站的 Marvell 芯片
● 基于 Fujitsu 处理器的日本富岳 (Fugaku) 超级计算机
● SiPearl,用于欧洲百亿亿级 (Exascale) 系统的 CPU
● NVIDIA Grace,为应对 AI 等大数据难题量身打造的 CPU
作为移动和嵌入式系统的领导者,ARM 仍需再攀高峰,建立强大的高性能计算生态系统。

图片说明:建立蓬勃发展的生态系统需要引入多方面的、协同发展的先进技术。
黄仁勋表示:“我们相信,将 ARM 模式应用到高性能计算的时机已经到来。”他补充道:“NVIDIA 可以快速开启基于 ARM 的高性能计算生态系统”。同时指出,我们有超过 250 万名开发者,这些开发者基于 CUDA 加速的软件下载量达到 2500 万次。

图片说明:NVIDIA 已经建立了丰富的高性能计算生态系统,可以加速 ARM 和行业高性能计算的发展。
NVIDIA 和 ARM 的联手将进一步加速高性能计算生态系统的发展,并推动刚刚开始的行业高性能计算革命。
黄仁勋最后总结道:“行业面临的问题不再是计算机能够做什么,而是谁率先利用它来推动行业的革新。”
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。