Nvidia 公司正在通过即将推出的 Project DIGITS 让其最强大的图形处理单元变得人人可及。这款"个人 AI 超级计算机"由即将面世的 Nvidia GB10 Grace Blackwell 超级芯片驱动。
这款 AI 超级计算机于今天晚些时候在拉斯维加斯举行的 CES 消费电子展上发布。Project DIGITS 计划于 5 月推出,将为用户提供 1 petaflop 的人工智能计算性能,使研究人员、数据科学家和学生能够在自己的办公桌上获得通常只有大型企业才能使用的性能。它将支持先进大语言模型的原型设计、训练和微调,以及推理,使任何人都能够开发出可以媲美 ChatGPT 等应用程序功能的人工智能系统。
Nvidia 即将推出的 GB10 超级芯片是一款系统级芯片,由其最先进的 GPU——Nvidia Grace Blackwell 驱动。它具备运行大规模 AI 项目所需的所有支持组件,包括数十个 CUDA 核心和第五代 Tensor 核心,这些核心通过公司的芯片间互连技术 NVLink 与同样高性能的 Nvidia Grace 中央处理器相连。
据 Nvidia 称,GB10 超级芯片使 Project DIGITS 超级计算机能够通过标准笔记本电脑或 PC 为任何人提供巨大的 AI 计算资源。每台机器将提供 128 GB 的统一、一致内存和高达 4 TB 的 NVMe 存储。这足以运行一个拥有 2000 亿参数的大语言模型,这意味着用户将能够构建和试验超越 OpenAI 的 GPT-3 模型(拥有 1750 亿参数)能力的大语言模型。
对于需要更强大性能的用户,可以使用 Nvidia 的 ConnectX 网络技术将两台 Project DIGITS AI 超级计算机连接在一起,以支持多达 4050 亿参数的模型。
Nvidia 联合创始人兼首席执行官黄仁勋 (如图,手持 GB10 超级芯片和 AI 超级计算机) 在 CES 主题演讲中表示,Project DIGITS 的目标是让先进 AI 开发工具更容易获得,使每个人都能参与构建未来。他解释说,目标是为数百万开发者提供负担得起的 Grace Blackwell 超级芯片。
不过,可能仍有数百万开发者被排除在外,因为 Project DIGITS 机器的起价为 3,000 美元,并不能真正称得上"便宜"。但黄仁勋似乎认为会有许多 AI 开发者愿意支付这样的价格。
黄仁勋说:"在每个数据科学家、AI 研究人员和学生的办公桌上放置一台 AI 超级计算机,将使他们能够参与并塑造 AI 时代。"
开发者们将能够在 Project DIGITS 上创建、微调和测试他们的模型,然后将它们部署到 Nvidia DGX Cloud 平台、加速云实例或自己的本地数据中心基础设施上。
为了帮助使用 Project DIGITS 的开发者,公司还为他们提供了一个广泛的 AI 开发工具库,包括软件开发套件、框架和预构建的 AI 模型,这些都可以在 Nvidia 开发者门户的 Nvidia NGC 目录中找到。
此外,公司还提供了一些"AI 蓝图",以及免费访问其 NIM 微服务的权限,这些都可以在同一开发者门户中找到。
图片:Nvidia/直播
好文章,需要你的鼓励
香港中文大学与华为诺亚方舟实验室合作开发了PreMoe框架,解决了大型混合专家模型(MoE)在内存受限设备上的部署难题。研究团队发现MoE模型中的专家表现出明显的任务专业化特征,据此提出了概率专家精简(PEP)和任务自适应专家检索(TAER)两大核心技术。实验证明,DeepSeek-R1 671B模型在精简50%专家后仍保持97.2%的MATH500准确率,内存需求降至688GB;而更激进的精简方案(减少87.5%专家)也能保持72.0%的准确率。该方法适用于多种MoE架构,为强大AI系统的广泛部署铺平了道路。
SCIENCEBOARD是一项开创性研究,旨在评估多模态自主智能体在真实科学工作流中的表现。研究团队构建了一个包含169个高质量任务的基准测试,涵盖生物化学、天文学等六个科学领域,并开发了一个真实环境让智能体通过CLI或GUI接口与科学软件交互。实验评估表明,即使是最先进的模型在这些复杂科学任务上的成功率也仅为15%,远低于人类表现,揭示了当前技术的局限性并为未来科学智能体的发展提供了宝贵见解。
帝国理工学院的研究团队开发了AlphaMed,这是首个仅通过极简规则强化学习就能培养医疗推理能力的AI模型,无需依赖传统的思维链示范数据。通过分析数据信息丰富度和难度分布的影响,研究发现高信息量的医疗问答数据是推理能力的关键驱动因素。AlphaMed在六个医疗问答基准上取得了领先成绩,甚至超越了更大的封闭源模型,同时展现出自发的步骤推理能力,为医疗AI发展提供了更加开放、高效的新路径。
Alita是一种新型通用AI代理系统,采用极简设计理念,以"最小预定义,最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita,只配备一个核心能力和少量通用模块,能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示,Alita在GAIA基准测试上达到87.27%的通过率,超越包括OpenAI Deep Research在内的复杂系统,证明简约设计可带来卓越性能。