深度学习领域大咖Yoshua Bengio、Geoff Hinton和Yann LeCun等多位行业专家将现身这场在9月19日至22日期间举办的世界顶级AI大会
上图从左至右,从上至下依次为:NVIDIA创始人兼首席执行官黄仁勋;NVIDIA AI研究副总裁Sanja Fidler;Google副总裁兼工程研究员、Vector Institute首席科学顾问,多伦多大学名誉教授Geoffrey Hinton;Waabi创始人兼首席执行官Raquel Urtasun;蒙特利尔大学教授Yoshua Bengio;Meta副总裁兼首席科学家,纽约大学Silver教授Yann LeCun
加利福尼亚州圣克拉拉——2022年8月15日——NVIDIA宣布将于9月19日至22日以线上形式举办秋季GTC大会。NVIDIA创始人兼首席执行官黄仁勋将发表包含众多全新发布内容的主题演讲,全球商业和技术领导者也将现身200多场会议、培训、展示。此次大会现已开放免费注册。
黄仁勋先生的主题演讲全球首播将于北京时间9月20日星期二晚间11点开始,中国重播将于北京时间9月21日星期三上午10 点开始。您无需报名就可以观看主题演讲。
本届GTC还将举办与图灵奖得主Yoshua Bengio、Geoff Hinton和Yann LeCun的围炉谈话,讨论AI将如何发展并帮助人们解决具有挑战性的问题。这场讨论会将由NVIDIA AI研究副总裁Sanja Fidler主持。此外,更欢迎您参与我们针对这场会议为中国观众特别举办的“观看派对”,届时中文主持人将对会议作出独到分析,并在线答疑。
GTC会议将探讨推动AI和元宇宙的一些关键进展,包括大型语言模型、自然语言处理、数字孪生、数字生物学、机器人和气候科学。
主要会议包括:
GTC为业务高管、数据科学家、企业IT领导者、设计师、开发者、研究者和学生等众多领域的受众提供种类丰富的会议。
适合开发者和研究者的内容
GTC为处于职业生涯各个阶段的参与者提供独特的学习和发展机会,而且其中许多机会是免费的。开发者、研究人员和学生可以报名参加135场涵盖各类主题的分会,包括:
希望加强自身技能的与会者可以报名参加NVIDIA 深度学习培训中心(DLI)为期一整天的实践研讨会和两小时的培训实验室。共有20场不同时区和语言的研讨会以及超过25个免费培训实验室,涵盖加速计算、计算机视觉、数据科学、对话式AI、自然语言处理等主题。
NVIDIA 深度学习培训中心(DLI)将发布一门新的中文课程,并为报名GTC大会的开发者提供特别优惠。在这场实时授课答疑的培训中,学员将使用在云端完全配置的GPU实验环境来动手练习,并获得 NVIDIA 培训证书。
参加 GTC 大会期间的 DLI 实战培训《模型并行 —— 构建和部署大型神经网络 (DLIW41436)》,享受3 折 GTC 特惠价,仅 999 元人民币。
全天实战培训价格为每人 999 元,非 GTC 大会期间,每场 DLI 全天培训的标准价格为 3500元。席位有限,先到先得,售完即止。
适合业务领导者的分会
本届GTC将举办30多场由来自金融服务、工业、零售、汽车、医疗等关键行业领域的世界领先企业共同举办的会议。演讲者将分享运用AI和元宇宙技术推进业务的详细解读,包括:建立AI中心、数字孪生的商业价值以及将定义我们生活、工作和娱乐方式的新技术。
除上述公司外,来自AT&T、宝马、福克斯体育、Lucid Motors、美敦力、Meta、蔚来、Pinterest、北极星、联合航空、美国银行和Ubiquant AI Lab的高管等行业领导者也将现身这些会议。
适合初创企业的会议
NVIDIA初创加速计划是一个拥有11,000多家初创企业的全球计划。本届GTC上将举办多场NVIDIA初创加速计划相关主题分会,包括:
浏览完整的GTC分会目录并马上报名。
NVIDIA财务分析师问答
NVIDIA管理层将在主题演讲后与财务分析师举行问答环节,网络直播将在investor.nvidia.com上进行。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。