Nvidia近日表示,Nvidia AI超级计算平台最先进的版本Nvidia DGX Cloud现在已经与Nvidia AI Enterprise软件套件一起在Oracle Cloud Marketplace中提供了。
在Oracle云基础设施上发布Nvidia DGX Cloud,将为客户提供访问Nvidia最强大GPU的一种方法,用于以训练生成式AI和其他工作负载。Nvidia表示,在今年3月Nvidia GTX大会上宣布推出的Nvidia DGX Cloud AI是一项云托管的AI超级计算服务,可以立即提供客户开始训练强大生成式AI和其他应用所需的一切。
该服务基于Nvidia广受欢迎的DGX平台,后者是一种专用硬件产品,企业可以购买并设置运行在自己的本地数据中心。企业借助DGX Cloud就不再需要等待购买昂贵且经常需求的平台,而是可以按月租用AI工作负载所需的基础设施。换句话说,Nvidia正在向更多企业提供Nvidia的AI超级计算机,包括那些无力自行部署和管理其系统的企业。
Nvidia解释说,DGX Cloud的每个实例都可以提供8个80 GB Tensor Core GPU,这意味着每个节点都有640 GB的GPU内存。该平台构建在高性能、低延迟的网络结构之上,以确保工作负载可以跨互连系统集群进行扩展。通过这种方式,多个DGX Cloud实例就可以充当一个巨大的GPU来处理最苛刻的工作负载。
DGX Cloud平台与Nvidia AI Enterprise软件搭配,让客户能够访问100多个AI框架和预训练模型,以便他们可以针对特有的、特定领域的任务构建、完善和操作定制的大型语言模型和其他基于自己专有数据训练的生成式AI模型。
Nvidia表示,从今天开始,客户可以通过Oracle Cloud Marketplace访问Nvidia DGX Cloud AI。客户将可以使用Nvidia Base Command Platform与硬件交互,平台让开发人员可以通过网络浏览器访问AI超级计算功能。通过提供客户AI基础设施的单一窗格视图,Base Command Platform简化了多节点集群的管理。
Nvidia表示,客户将能够快速构建他们的生成式AI应用,并将其轻松部署Oracle Cloud Infrastructure或他们自己的本地平台上,从而更容易采用混合云策略。
配合此次发布,Nvidia分享了一个客户成功案例,称纽约州北部的奥尔巴尼大学最近在Oracle基础设施上使用了Nvidia DGX Cloud AI,作为其AI Plus计划的基础。该计划将AI教学与学习整合到大学的研究和学术事业中,涉及网络安全、天气预报、健康数据分析、药物发现和下一代半导体设计等领域。奥尔巴尼大学方面表示,正在Oracle云上使用Nvidia的平台来构建自己的本地超级计算机。
奥尔巴尼大学负责研究和经济发展的副校长Thenkurussi Kesavadas表示:“我们正在加快实现将AI融入几乎所有学术和研究学科的使命之中。我们将推动医疗、安全和经济竞争力的进步,同时帮助学生在不断变化的就业市场中发挥作用。”
好文章,需要你的鼓励
微软宣布为Word和Excel推出基于OpenAI的AI代理模式,通过简单提示即可自动生成文档和分析数据。Word用户可享受"氛围写作"功能,利用现有文档组装报告和提案。Excel代理能分析电子表格数据并生成可视化报告。尽管在SpreadsheetBench基准测试中准确率仅为57.2%,低于人类平均水平71.3%,但微软强调其针对实际工作场景优化。此外,微软还发布了基于Anthropic的Office代理,显示其正逐步减少对OpenAI的依赖。
POSTECH研究团队开发出VideoFrom3D框架,能够仅凭粗糙3D模型、摄像机轨迹和参考图片生成高质量场景视频。该方法巧妙结合图像和视频扩散模型优势,通过稀疏锚点生成和几何引导插值两个模块,实现了传统3D制作流程的革命性简化。实验证明该方法在多种复杂场景下表现优异,为3D内容创作提供了更高效的解决方案。
OpenAI为美国ChatGPT用户推出"即时结账"功能,用户可在对话中直接购买Etsy和Shopify商品,无需跳转至外部网站。该功能支持Apple Pay、Google Pay等多种支付方式,并计划接入超过100万家Shopify商户。OpenAI还将开源其代理商务协议技术,与谷歌的代理支付协议形成竞争。这标志着电商购物模式的重大转变,AI聊天机器人可能重塑在线零售发现和支付生态系统。
Meta超级智能实验室开发了ARE平台和Gaia2基准测试,为AI智能体创造了更真实的训练和评估环境。ARE支持异步交互,模拟真实世界的复杂性和不确定性。Gaia2包含1120个场景,评估AI的七项核心能力。实验显示最强模型成功率仅42%,特别在时间管理和处理歧义方面表现较差,揭示了当前AI技术的局限性和改进方向。