自发布以来,NVIDIA 通过持续的软件优化以及与软件合作伙伴和开源社区的紧密协作,不断提升基于 Grace Blackwell 架构的 DGX Spark 的性能。这些举措在推理、训练和创意工作流方面都取得了显著的成效。
在 CES 2026 上,全新的 DGX Spark 软件版本结合新的模型更新和开源库,为 DGX Spark 以及基于 GB10 的 OEM 系统带来了显著的性能提升。

使用统一内存和 NVFP4 本地扩展大模型
DGX Spark 专为大模型本地化应用而设计,配备 128GB 统一内存,并采用紧凑的桌面形态。两台 DGX Spark 系统互连可提供 256GB 的组合内存,支持开发者能够在本地运行更大的模型。
系统通过 ConnectX-7 网络连接,提供 200Gbps 带宽,实现高速、低延迟的多节点工作负载。
支持 NVIDIA NVFP4 数据格式,可使新一代模型大幅降低内存占用,同时提升吞吐量。例如,在相同的双 DGX Spark 配置上,使用 NVFP4 精度和推测解码运行 Qwen-235B 模型,相比 FP8 执行性能最高提升 2.6 倍。
使用 FP8 精度时,该模型会耗尽两台系统的组合内存,从而限制多任务处理和整体响应速度。将模型量化为 NVFP4 后,可将内存使用量减少约 40%,同时保持高精度,使开发者能够在获得 FP8 等效结果的同时实现更高性能,并释放足够内存以同时运行其他工作负载。最终使本地 AI 开发体验更加响应迅速且高效。
为创作者打造的强大桌面平台
DGX Spark 不仅是 AI 开发者的卓越平台,创作者也能充分利用其桌面级功能。
通过将 AI 工作负载转移到 DGX Spark,创作者可以使自己的笔记本电脑或 PC 在内容生成过程中保持响应。
阿里巴巴的 Qwen-Image 等领先的扩散模型正利用 NVFP4 减少内存占用,同时实现更高性能。
AI 视频生成尤其适合 DGX Spark,因为它需要大量的内存和算力。采用 NVFP8 优化权重的音视频生成模型相比上一代性能显著提升,使高质量视频生成在桌面端成为可能。
DGX Spark 现已纳入 NVIDIA 认证系统计划
NVIDIA 认证系统计划用于验证系统在广泛加速图形处理、计算和 AI 工作负载方面的性能表现。NVIDIA 认证系统为 AI 开发、桌面推理、数据科学、设计和内容创作工作负载提供了可信的基础,同时也对数据中心和云资源进行增强。
DGX Spark 和基于 GB10 的 OEM 系统现已纳入该计划,DGX Spark 及合作伙伴系统目前正在测试中。
快速上手
了解我们如何帮助开发者立即提高生产力,展示 Blackwell GPU 的可能性,包括:
简单可靠、步骤清晰且实用的故障排除指南,已在最新 DGX OS 上验证配置,能够让用户减少设置时间,将更多时间用于构建。
使用 NVIDIA Brev 随时随地访问 DGX Spark
借助 NVIDIA Brev,用户可以通过安全连接随时随地访问 DGX Spark。Brev 让开发者能够轻松创建 AI 云实例,利用 Launchables 功能,实现一键即可配置 AI 环境。在 CES 上,Brev 的更新展示了注册本地计算(如 DGX Spark)的能力。在 Brev 完成注册后,用户即可随时随地访问 DGX Spark,并安全地与团队共享访问权限。
Brev 支持本地与云模型的混合部署。借助路由层,用户可以将电子邮件或专有数据处理等敏感任务保留在运行于 DGX Spark 上的本地开源模型上,同时将一般推理任务路由至云端的前沿模型。实现细节可参阅 NVIDIA LLM Router 开发者示例。
Brev 对本地计算的支持将在 CES 上进行预览,正式支持将于 2026 年春季推出。
打造专属智能体
如需进一步探索,NVIDIA 与 Hugging Face 合作展示如何构建个人桌面 AI 助手。使用 DGX Spark 搭配 Reachy Mini,用户可以创建一个私有 AI 助手,在本地私密的处理数据。请参阅 NVIDIA 与 Hugging Face 教程开始体验。
加入 DGX Spark 开发者社区,开启 AI 构建之旅。
好文章,需要你的鼓励
谷歌在I/O开发者大会上发布"通用购物车"功能,基于通用商务协议(UCP)整合YouTube、Gmail、Gemini等平台的购物数据,支持Target、Shopify、Wayfair等主流零售商。AI代理可自动检测商品兼容性、推荐优惠信用卡、比价提醒,并在用户授权下自动完成日常采购。该功能旨在打通"加入购物车"到"完成结账"的全流程,实现个性化、无摩擦的购物体验。
这项联合研究提出了COVER方法和CM-EVS数据集,用贪心算法从3D场景中智能筛选全景视角,每场景仅需25帧即可完整覆盖室内场景,并附完整溯源日志。
HolderPO通过引入可调参数p的霍尔德均值替代固定的算术平均,解决了大模型推理训练中信号放大与稳定性之间的根本矛盾,配合动态退火策略在数学推理和代理任务上均创造了新的最优记录。