在数据分析、机器学习和深度学习领域中工作的数据科学家们将能够借助NVIDIA全新CUDA-X AI库实现速度的大幅提升。
CUDA-X能够充分利用Tensor Core GPU的延展性,为以下领域提供加速:
CUDA-X加速数据科学。
在本届NVIDIA的GTC大会上推出的CUDA-X AI是唯一针对数据科学加速的端到端平台。
随着企业转而采用深度学习、机器学习和数据分析等人工智能技术来更有效地利用数据, CUDA-X AI也应运而生。
适用于数据处理、功能判定、训练、验证和部署的典型工作流程,CUDA-X AI让我们能够充分利用NVIDIA Tensor Core GPU的延展性来独特地处理此类端到端的AI管道。
CUDA-X AI包含十几个专用加速库,能够将机器学习和数据科学工作负载加速至高达50倍。它已经在通过cuDF加速数据分析;通过cuDNN加速深度学习原语;通过cuML加速机器学习算法;通过DALI加速数据处理等。
这些库结合在一起,就能够为典型AI工作流程中的每一步提供加速,无论是使用深度学习来训练语音和图像识别系统,还是通过数据分析来评估抵押贷款组合的风险状况。这些工作流程中的每一步都需要处理大量数据,且每一步都能够受益于GPU加速计算。
因此,CUDA-X AI已得到渣打银行、微软、PayPal、SAS和沃尔玛等顶尖公司所采用。它已集成至主流深度学习框架中,如TensorFlow、PyTorch和MXNet。全球主要云服务提供商均在使用CUDA-X AI来加速自身云服务。今日,全球八大计算机制造商宣布其数据科学工作站和服务器经优化后能够运行NVIDIA的CUDA-X AI库。
CUDA-X AI加速库可单独下载,亦作为NVIDIA NGC软件中心的容器化软件堆栈提供,均为免费。
其可部署于任何地方,包括台式机、工作站、服务器和云计算平台。
于昨日GTC发布的所有数据科学工作站中均已集成CUDA-X AI。且昨日发布的所有NVIDIA T4服务器均经优化,能够运行CUDA-X AI。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。