在数据分析、机器学习和深度学习领域中工作的数据科学家们将能够借助NVIDIA全新CUDA-X AI库实现速度的大幅提升。
CUDA-X能够充分利用Tensor Core GPU的延展性,为以下领域提供加速:
CUDA-X加速数据科学。
在本届NVIDIA的GTC大会上推出的CUDA-X AI是唯一针对数据科学加速的端到端平台。
随着企业转而采用深度学习、机器学习和数据分析等人工智能技术来更有效地利用数据, CUDA-X AI也应运而生。
适用于数据处理、功能判定、训练、验证和部署的典型工作流程,CUDA-X AI让我们能够充分利用NVIDIA Tensor Core GPU的延展性来独特地处理此类端到端的AI管道。
CUDA-X AI包含十几个专用加速库,能够将机器学习和数据科学工作负载加速至高达50倍。它已经在通过cuDF加速数据分析;通过cuDNN加速深度学习原语;通过cuML加速机器学习算法;通过DALI加速数据处理等。
这些库结合在一起,就能够为典型AI工作流程中的每一步提供加速,无论是使用深度学习来训练语音和图像识别系统,还是通过数据分析来评估抵押贷款组合的风险状况。这些工作流程中的每一步都需要处理大量数据,且每一步都能够受益于GPU加速计算。
因此,CUDA-X AI已得到渣打银行、微软、PayPal、SAS和沃尔玛等顶尖公司所采用。它已集成至主流深度学习框架中,如TensorFlow、PyTorch和MXNet。全球主要云服务提供商均在使用CUDA-X AI来加速自身云服务。今日,全球八大计算机制造商宣布其数据科学工作站和服务器经优化后能够运行NVIDIA的CUDA-X AI库。
CUDA-X AI加速库可单独下载,亦作为NVIDIA NGC软件中心的容器化软件堆栈提供,均为免费。
其可部署于任何地方,包括台式机、工作站、服务器和云计算平台。
于昨日GTC发布的所有数据科学工作站中均已集成CUDA-X AI。且昨日发布的所有NVIDIA T4服务器均经优化,能够运行CUDA-X AI。
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。