历史总在重演,但从不简单重复。
2016年,黄仁勋亲手将第一台DGX-1交给OpenAI,那是一个时代的开端。自此,AI的发展被写入了“规模化法则”,世界见证了由庞大算力集群筑起的高耸入云的AI“神话”。ChatGPT的诞生,正是顶端的璀璨明珠。
八年后,历史的指针再次拨向相反的坐标。黄仁勋与马斯克再次同框,但这一次,交付的不再是开启中心化纪元的钥匙,而是一颗火种——NVIDIA DGX Spark™。
今天,NVIDIA 宣布全球迄今为止最小的 AI 超级计算机 NVIDIA DGX Spark™ 正式交付。
当前数百万开发者所依赖的个人电脑(PC)、工作站和笔记本电脑,其内存与软件能力已难以满足快速增长的 AI 工作负载需求,迫使团队将工作转移至云端或本地数据中心。
作为新一代计算机,DGX Spark 以小巧的桌面机形态提供 1 PFLOP AI 性能和 128GB 统一内存,使开发者能够在本地运行最高 2000 亿参数的 AI 模型推理以及对 700 亿参数的模型进行微调。此外,开发者还可通过 DGX Spark 在本地创建 AI 智能体和运行高级软件堆栈。
NVIDIA 创始人兼首席执行官黄仁勋表示:“2016 年,我们为了向 AI 研究者提供专属超级计算机而开发了 DGX-1。我曾亲手在一家名为 OpenAI 的小型初创公司将首台 DGX-1 交给埃隆,由此诞生了 ChatGPT,点燃了 AI 变革的火种。DGX-1 不仅开启了 AI 超级计算机时代,更揭示了驱动现代 AI 发展的规模化法则。如今,DGX Spark 让我们重拾初心——把 AI 计算机交到每位开发者手中,以此引发下一轮技术突破。”
DGX Spark 将整个 NVIDIA AI 平台——包括 GPU、CPU、网络、CUDA® 库及 NVIDIA AI 软件堆栈——整合为一台可置于实验室或办公室的小型系统,该系统拥有加速代理式 AI 与物理 AI 开发所需的强大性能。凭借空前的性能与 NVIDIA 庞大的生态系统,DGX Spark 将台式机转变为 AI 开发平台。
DGX Spark 系统搭载 NVIDIA GB10 Grace Blackwell 超级芯片、NVIDIA ConnectX®-7 200Gb/s 网卡及 NVIDIA NVLink™-C2C 技术,可提供最高 1 PFLOP 的 AI 性能。其带宽是第五代 PCIe 的 5 倍,并配备 128GB CPU-GPU 一致性内存。
预装的 NVIDIA AI 软件堆栈让开发者能够开箱即用,立即投入 AI 项目开发。通过 DGX Spark,开发者可访问包括模型、库及 NVIDIA NIM 微服务在内的 NVIDIA AI 生态系统工具,建立本地工作流,例如定制 Black Forest Labs 的 Flux.1 模型优化图像生成、使用 NVIDIA Cosmos Reason 视觉语言模型创建视觉搜索与摘要智能体,或使用针对 DGX Spark 优化的 Qwen3 开发 AI 聊天机器人等。
为庆祝 DGX Spark 全球交付,黄仁勋赴德克萨斯州星舰基地,亲手将首批 DGX Spark 之一交付给 SpaceX 首席工程师埃隆·马斯克。此次交接承载着对超级计算机起源的致敬——早在 2016 年,马斯克所在团队就曾从黄仁勋手中接收了首台 NVIDIA DGX™-1 超级计算机。
其他首批收到 DGX Spark 的企业有 Anaconda、Cadence、ComfyUI、Docker、谷歌、 Hugging Face、JetBrains、LM Studio、Meta、微软、Ollama 和 Roboflow,他们正在针对 DGX Spark 对各自工具、软件和模型进行测试、验证和优化。
纽约大学全球 AI 前沿实验室等全球研究机构已预先使用 DGX Spark 加速其 AI 开发工作。
纽约大学全球 AI 前沿实验室计算机与数据科学教授 Kyunghyun Cho 表示:“DGX Spark让我们能够通过台式机访问千兆级计算能力。这种 AI 研发的新方式使我们能够快速进行原型设计并实验先进的 AI 算法和模型,甚至包括像医疗保健这类对隐私和安全性要求极高的应用领域。”
NVIDIA DGX Spark 即日起交付
宏碁、华硕、戴尔科技、技嘉、惠普、联想、微星以及各 Micro Center 门店和全球 NVIDIA 渠道合作伙伴将销售合作厂商机型。(请与这些合作伙伴联系,以了解具体的供应地区、系统配置详情和供货情况)
写在最后
在笔者看来,DGX Spark的深远影响,不仅在于其PetaFLOP级的算力参数,更在于将开发者从工程枷锁中解放出来的范式革命。
以前,AI开发者的工作流是典型的二元结构:本地编码构思,云端训练验证。这个过程不仅有数据与环境迁移的滞碍,更在“灵感-验证”的循环中插入了一条漫长的认知链路。DGX Spark的使命正是消除这种割裂感。它通过在桌面上提供极致的算力与内存,实现了两件颠覆性的事:
第一,是工作流的本地闭环。其让开发者能在同一物理设备上进行70B参数模型的微调,无缝地完成构思、编码、调试,到运行复杂AI智能体的全过程。创新迭代速度,不再受制于远程资源的可用性和网络延迟。
第二,是对关键数据的保护。通过消除环境切换的桎梏,为敏感数据提供了一个物理隔离的、绝对安全的本地环境,这是云端开发难以比拟的优势。
DGX Spark是“赋能个体”的基石,也能在其背后看到NVIDIA更深层的战略:
DGX-1以极致的中心化算力,助力催生出GPT这一“现象级”模型,造就出全新的“生产力”。
而DGX Spark,则是将这经过验证的“生产力”微缩化、个体化,激发“分布式创新”的活力。
而在创新效率的层级跃迁上,当创新的“个体单位”被重塑,整个AI生态的演化或将呈非线性加速。打个比方说,过去,因资源门槛而被埋没的颠覆性想法,现在一个有才华的开发者在办公室里就能完成验证。
所以,我们也有理由期待,由AI原生应用驱动的“寒武纪大爆发”,其引爆点或许就在这些被极致赋能的个体之中。
最后,我们反观黄仁勋与马斯克的两次交接,笔者甚至愿意相信,这可以视作AI产业前后两个时代的分水岭。
在分水岭的前半程,奇迹属于敢于孤注一掷的天才。2016年,从黄仁勋手中接过首批DGX系统的OpenAI(马斯克当时还是OpenAI的联合创始人),AI的从此以“算力崇拜”开篇,但神话由少数人书写,门槛高耸,众人仰望。
而如今,“神话”正被改写。身着皮衣的黄仁勋,再次将手中的“钥匙”DGX Spark递出给——这一次,不是交给“英雄”,而是交还给个体开发者。
而这次,DGX Spark便是这份“创新神力”下放的宣言。当AI工厂的大门不再紧闭,生产力从云端落地,AI原生应用的“生命之种”,便有了生根发芽的土壤。
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
查尔斯大学和意大利布鲁诺·凯斯勒基金会的研究团队首次系统性解决了同声传译AI系统延迟评估的准确性问题。他们发现现有评估方法存在严重偏差,常给出相互矛盾的结果,并提出了YAAL新指标和SOFTSEGMENTER对齐工具。YAAL准确性达96%,比传统方法提升20多个百分点。研究还开发了专门的长音频评估工具LongYAAL,为AI翻译技术发展提供了可靠的测量标准。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
印度理工学院团队构建了史上最大规模印度文化AI测试基准DRISHTIKON,包含64288道多语言多模态题目,覆盖15种语言和36个地区。研究评估了13个主流AI模型的文化理解能力,发现即使最先进的AI也存在显著文化盲区,特别是在低资源语言和复杂推理任务上表现不佳,为构建文化感知AI提供了重要指导。