Nvidia 公司正在通过即将推出的 Project DIGITS 让其最强大的图形处理单元变得人人可及。这款"个人 AI 超级计算机"由即将面世的 Nvidia GB10 Grace Blackwell 超级芯片驱动。
这款 AI 超级计算机于今天晚些时候在拉斯维加斯举行的 CES 消费电子展上发布。Project DIGITS 计划于 5 月推出,将为用户提供 1 petaflop 的人工智能计算性能,使研究人员、数据科学家和学生能够在自己的办公桌上获得通常只有大型企业才能使用的性能。它将支持先进大语言模型的原型设计、训练和微调,以及推理,使任何人都能够开发出可以媲美 ChatGPT 等应用程序功能的人工智能系统。
Nvidia 即将推出的 GB10 超级芯片是一款系统级芯片,由其最先进的 GPU——Nvidia Grace Blackwell 驱动。它具备运行大规模 AI 项目所需的所有支持组件,包括数十个 CUDA 核心和第五代 Tensor 核心,这些核心通过公司的芯片间互连技术 NVLink 与同样高性能的 Nvidia Grace 中央处理器相连。
据 Nvidia 称,GB10 超级芯片使 Project DIGITS 超级计算机能够通过标准笔记本电脑或 PC 为任何人提供巨大的 AI 计算资源。每台机器将提供 128 GB 的统一、一致内存和高达 4 TB 的 NVMe 存储。这足以运行一个拥有 2000 亿参数的大语言模型,这意味着用户将能够构建和试验超越 OpenAI 的 GPT-3 模型(拥有 1750 亿参数)能力的大语言模型。
对于需要更强大性能的用户,可以使用 Nvidia 的 ConnectX 网络技术将两台 Project DIGITS AI 超级计算机连接在一起,以支持多达 4050 亿参数的模型。
Nvidia 联合创始人兼首席执行官黄仁勋 (如图,手持 GB10 超级芯片和 AI 超级计算机) 在 CES 主题演讲中表示,Project DIGITS 的目标是让先进 AI 开发工具更容易获得,使每个人都能参与构建未来。他解释说,目标是为数百万开发者提供负担得起的 Grace Blackwell 超级芯片。
不过,可能仍有数百万开发者被排除在外,因为 Project DIGITS 机器的起价为 3,000 美元,并不能真正称得上"便宜"。但黄仁勋似乎认为会有许多 AI 开发者愿意支付这样的价格。
黄仁勋说:"在每个数据科学家、AI 研究人员和学生的办公桌上放置一台 AI 超级计算机,将使他们能够参与并塑造 AI 时代。"
开发者们将能够在 Project DIGITS 上创建、微调和测试他们的模型,然后将它们部署到 Nvidia DGX Cloud 平台、加速云实例或自己的本地数据中心基础设施上。
为了帮助使用 Project DIGITS 的开发者,公司还为他们提供了一个广泛的 AI 开发工具库,包括软件开发套件、框架和预构建的 AI 模型,这些都可以在 Nvidia 开发者门户的 Nvidia NGC 目录中找到。
此外,公司还提供了一些"AI 蓝图",以及免费访问其 NIM 微服务的权限,这些都可以在同一开发者门户中找到。
图片:Nvidia/直播
好文章,需要你的鼓励
生成式AI在电商领域发展迅速,但真正的客户信任来自可靠的购物体验。数据显示近70%的在线购物者会放弃购物车,主要因为结账缓慢、隐藏费用等问题。AI基础设施工具正在解决这些信任危机,通过实时库存监控、动态结账优化和智能物流配送,帮助商家在售前、售中、售后各环节提升可靠性,最终将一次性买家转化为忠实客户。
泰国SCBX金融集团开发的DoTA-RAG系统通过动态路由和混合检索技术,成功解决了大规模知识库检索中速度与准确性难以兼得的难题。系统将1500万文档的搜索空间缩小92%,响应时间从100秒降至35秒,正确性评分提升96%,为企业级智能问答系统提供了实用的技术方案。
存储供应商Qumulo发布多租户架构Stratus,为每个租户提供独立的虚拟环境,通过加密技术和租户专用密钥管理系统实现隔离。该统一文件和对象存储软件支持本地、边缘、数据中心及AWS、Azure等云环境部署。Stratus采用加密隔离技术确保敏感数据安全,同时提供任务关键操作所需的灵活性和效率,帮助联邦和企业客户满足合规要求。
中科院和字节跳动联合开发了VGR视觉锚定推理系统,突破了传统AI只能粗略"看图"的局限。该系统能在推理过程中主动关注图片关键区域,像人类一样仔细观察细节后再得出结论。实验显示VGR在图表理解等任务上性能大幅提升,同时计算效率更高,代表了多模态AI"可视化推理"的重要进展。