Nvidia 在本月发布的最新 CUDA 运行时版本中,将多个老旧架构标记为功能完整,这意味着这些显卡系列即将迎来支持的终点。
"Maxwell、Pascal 和 Volta 架构的支持被视为功能完整,将在upcoming版本中冻结,"这家芯片制造商在 CUDA 12.8 发行说明中表示。
这一决定可能会影响仍在使用这些老款显卡的数据中心运营商和科研机构。这些架构中最新的也已接近 8 年历史,而最老的今年将迎来 11 周岁。时光飞逝,它们成长得真快。
对于仍在使用这些老旧显卡的用户来说,好消息是这些显卡在相当长一段时间内仍然可以继续使用。这些显卡包括 Nvidia 后期的 700、900 和 1000 系列桌面芯片,以及 M、P 和 V 系列数据中心产品。
根据 Nvidia 的说法,最新版本中被弃用的功能暂时仍然可以使用。但是,相关文档可能会被移除,并且在未来的版本中可能会"正式不受支持"。
据我们了解,用户最终将不得不继续使用较老的不受支持的软件,并可能在未来的操作系统版本中遇到兼容性问题。
这些变化主要影响那些使用 CUDA 在 GPU 上运行计算密集型工作负载的用户。Nvidia Maxwell 系列显卡的图形驱动程序目前仍然可用且受到积极支持。话虽如此,Maxwell 的时间已经不多了。Nvidia 早在 2021 年就终止了对其前身 Kepler 的支持。因此,Maxwell 加入其兄弟进入遗留产品库可能为时不远。
当然,仅仅因为硬件可能不再受支持,并不意味着用户会在设备报废前就放弃使用。据我们所知,德克萨斯高级计算中心的 Stallion 平铺显示系统仍在使用一批已有 13 年历史的 Quadro K5000。
仍有许多用户在使用 Maxwell、Pascal 和 Volta 硬件。利弗莫尔国家实验室的 Sierra 超级计算机配备了 IBM 的 Power9 CPU 和 Nvidia 的 V100 加速器,目前仍在运行。与此同时,其几乎相同的兄弟系统 Summit 直到去年秋天才退役。
Nvidia 的 V100 系列产品还因被 OpenAI 用于训练 GPT 3.5 而闻名,该模型为 ChatGPT 提供支持并引发了 AI 热潮。
除了弃用硬件外,CUDA 12.8 还停止了对多个较老操作系统的支持,包括 Windows 10 21H2、Debian 11、SUSE Linux Enterprise Server (SLES) 15 SP4 和 OpenSUSE 15.4。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。