GPU制造商和AI提供商Nvidia近日宣布推出一系列新的生成式AI产品,旨在加速大型语言模型和其他先进AI应用的开发。
Nvidia此次在SIGGRAPH 2023大会上宣布与机器学习和AI工具开发公司Hugging Face建立新的合作伙伴关系,让开发人员可以在Nvidia DGX Cloud超级计算基础设施上部署和使用他们的生成式AI模型,以扩展工作负载。开发人员还将能够访问新的Nvidia AI Workbench,从而可以打包工作并在PC、工作站、云端以及Nvidia AI Enterprise 4.0等任何地方使用它。
Hugging Face和DGX Cloud的结合将让开发人员能够快速训练大型语言模型,这些模型是使用自己的业务数据定制的,用于特定行业的知识和应用,例如智能聊天机器人、搜索和摘要等用途。大型语言模型利用这样的超级计算能力就可以在强大的基础设施上进行培训和微调。
Nvidia公司创始人、首席执行官黄仁勋表示:“研究人员和开发人员是生成式AI核心,这正在改变每个行业。Hugging Face和Nvidia正在将全球最大的人工智能社区与全球领先的云端Nvidia AI计算平台连接起来。”
Hugging Face的平台支持超过15000个组织,构成的社区共享其用户构建、微调和部署的超过25万个AI模型和超过5万个数据集。
在此次合作中,Hugging Face将提供一项名为“Training Cluster as a Service”的全新服务,该服务将使用自己的平台和Nvidia DGX Cloud基础设施为企业客户简化全新自定义生成式AI模型的创建和定制,只需单击一下即可。
Nvidia DGX Cloud则由配备了8个H100或者A100 80 GB Tensor Core GPU的实例提供支持,每个节点总共有640GB GPU内存,从而提供了极高的性能,可用于训练和微调大量AI工作负载。
Nvidia AI Workbench:开发人员的工作空间
Nvidia AI Workbench是为开发人员提供的统一工作空间,让他们能够在需要使用的地方快速创建、测试和自定义他们预训练的生成式AI模型,这意味着他们可以使用他们自己的个人计算机、工作站、数据中心、公有云或者Nvidia DGX云端的虚拟机。
开发人员使用AI Workbench可以加载和自定义来自任何主流存储库(例如Hugging Face、GitHub和Nvidia NGC)的模型。
Nvidia企业计算副总裁Manuvir Das表示:“世界各地的企业都在寻找合适的基础设施并构建生成式AI模型和应用。Nvidia AI Workbench为跨组织团队提供了一条简化的路径来创建基于AI的应用,这些应用在现代商业中正变得越来越至关重要。”
相同的界面让开发人员可以打包他们的项目并将其跨不同的实例进行移动,他们可以在自己的PC上处理项目,在有必要的情况下将其移动到云端,而Workbench让打包过程变得更简单了,只需将其打包、移动并解压到云端即可继续开发。
Workbench AI还为开发人员提供了一整套生成式AI工具,包括企业级模型、软件开发套件、来自开源存储的库以及Nvidia AI平台,所有这一切都在统一的开发人员体验中。
Nvidia表示,许多AI基础设施提供商已经开始采用AI Workbench,包括戴尔、HPE、Lambda、联想以及Supermicro。
全新Nvidia AI Enterprise 4.0将先进AI引入生产
现在,企业借助Nvidia AI Enterprise 4.0可以获得采用生成式AI所需的工具,并构建将其连接到大规模生产应用所需的安全性和API。
新发布的AI Enterprise版本包括了云原生框架Nvidia NeMo,用于在完全托管的企业系统中构建、培训和部署大型语言模型,以创建生成式AI应用。那些希望扩展和优化AI部署的企业客户,则可以使用Triton管理服务实现自动化,该服务将自动在Kubernetes中部署多个推理服务器,并进行大规模模型编排。
Nvidia还通过Base Command Manager Essentials软件提供了集群管理功能,最大限度上提高不同数据中心的AI服务器性能,还可以管理跨不同云系统(包括多云和混合云)的AI模型使用情况。
Nvidia AI Enterprise 4.0发布之后,客户可以在合作伙伴的应用市场(包括Google Cloud)中找到。
好文章,需要你的鼓励
微软推出 Copilot+ PC 标准,要求配备高性能 NPU,引发 AI PC 市场格局变化。英伟达虽在数据中心 AI 领域占主导,但在 PC 端面临挑战。文章分析了英伟达的 AI PC 策略、NPU 与 GPU 的竞争关系,以及未来 GPU 可能在 Copilot+ 功能中发挥作用的前景。
专家预测,随着人工智能技术的迅速发展和广泛应用,2025 年可能成为 AI 泡沫破裂的关键一年。尽管 AI 仍有望在多模态模型和自动机器学习等领域取得突破,但技术瓶颈、投资回报率下降、监管趋严以及环境和伦理问题等因素可能导致 AI 热潮降温。未来 AI 发展将更注重平衡和可持续性。
研究表明,现有的公开 AI 模型在描述大屠杀历史时过于简单化,无法呈现其复杂性和细微之处。研究人员呼吁各相关机构数字化资料和专业知识,以改善 AI 对这段历史的理解和表述。他们强调需要在 AI 系统中加入更多高质量的数据,同时在审查和信息获取之间寻求平衡。
Google 推出名为 Titans 的新型 AI 架构,是 Transformer 的直接进化版。Titans 引入了神经长期记忆、短期记忆和基于惊喜的学习系统,使 AI 更接近人类思维方式。这一突破性技术有望彻底改变 AI 范式,推动机器智能向人类认知迈进一大步。