Nvidia 公司正在通过即将推出的 Project DIGITS 让其最强大的图形处理单元变得人人可及。这款"个人 AI 超级计算机"由即将面世的 Nvidia GB10 Grace Blackwell 超级芯片驱动。
这款 AI 超级计算机于今天晚些时候在拉斯维加斯举行的 CES 消费电子展上发布。Project DIGITS 计划于 5 月推出,将为用户提供 1 petaflop 的人工智能计算性能,使研究人员、数据科学家和学生能够在自己的办公桌上获得通常只有大型企业才能使用的性能。它将支持先进大语言模型的原型设计、训练和微调,以及推理,使任何人都能够开发出可以媲美 ChatGPT 等应用程序功能的人工智能系统。
Nvidia 即将推出的 GB10 超级芯片是一款系统级芯片,由其最先进的 GPU——Nvidia Grace Blackwell 驱动。它具备运行大规模 AI 项目所需的所有支持组件,包括数十个 CUDA 核心和第五代 Tensor 核心,这些核心通过公司的芯片间互连技术 NVLink 与同样高性能的 Nvidia Grace 中央处理器相连。
据 Nvidia 称,GB10 超级芯片使 Project DIGITS 超级计算机能够通过标准笔记本电脑或 PC 为任何人提供巨大的 AI 计算资源。每台机器将提供 128 GB 的统一、一致内存和高达 4 TB 的 NVMe 存储。这足以运行一个拥有 2000 亿参数的大语言模型,这意味着用户将能够构建和试验超越 OpenAI 的 GPT-3 模型(拥有 1750 亿参数)能力的大语言模型。
对于需要更强大性能的用户,可以使用 Nvidia 的 ConnectX 网络技术将两台 Project DIGITS AI 超级计算机连接在一起,以支持多达 4050 亿参数的模型。
Nvidia 联合创始人兼首席执行官黄仁勋 (如图,手持 GB10 超级芯片和 AI 超级计算机) 在 CES 主题演讲中表示,Project DIGITS 的目标是让先进 AI 开发工具更容易获得,使每个人都能参与构建未来。他解释说,目标是为数百万开发者提供负担得起的 Grace Blackwell 超级芯片。
不过,可能仍有数百万开发者被排除在外,因为 Project DIGITS 机器的起价为 3,000 美元,并不能真正称得上"便宜"。但黄仁勋似乎认为会有许多 AI 开发者愿意支付这样的价格。
黄仁勋说:"在每个数据科学家、AI 研究人员和学生的办公桌上放置一台 AI 超级计算机,将使他们能够参与并塑造 AI 时代。"
开发者们将能够在 Project DIGITS 上创建、微调和测试他们的模型,然后将它们部署到 Nvidia DGX Cloud 平台、加速云实例或自己的本地数据中心基础设施上。
为了帮助使用 Project DIGITS 的开发者,公司还为他们提供了一个广泛的 AI 开发工具库,包括软件开发套件、框架和预构建的 AI 模型,这些都可以在 Nvidia 开发者门户的 Nvidia NGC 目录中找到。
此外,公司还提供了一些"AI 蓝图",以及免费访问其 NIM 微服务的权限,这些都可以在同一开发者门户中找到。
图片:Nvidia/直播
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。