扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
来源:驱动之家 2010年11月18日
关键字: NVIDIA
在9月份推出CUDA Toolkit 3.2 RC发布候选版进行测试后,NVIDIA今天发布了最终正式版本的CUDA 3.2工具包。新版本在性能上有了明显的提升,同时扩展了函数库,改进了集群管理特性,当然还包括对新硬件的支持。
CUDA Toolkit 3.2新特性包括:
扩充和改进CUDA函数库:
1. CUBLAS在Fermi架构下的矩阵乘法和置换性能提升50%到300%
2. CUFFT在Fermi架构下基数3、5、7的转换性能相比MKL加速2到10倍。
3. 新增CUSPARSE GPU加速稀疏矩阵函数库,性能比MKL快5到30倍。
4. 新增CURAND GPU加速随机数生成函数库,比MKL快10到20倍。
5. 加入H.264编解码库。
CUDA驱动和CUDA C改进:
- 支持6GB显存Quadro或Tesla卡。
- 在Windows平台工作站上支持Tesla开启Tesla Compute Cluster (TCC) 集群模式。
开发工具改进:
- CUDA-gdb和Parallel Nsight支持多GPU Debug。
- cuda-memcheck支持扩展至所有Fermi架构GPU。
- NVCC支持64bit Linux下的Intel C Compiler (ICC) v11.1
- 支持在4GB以上内存系统上进行GPU Debug。
其他:
- 支持在CUDA C核心使用malloc()/free()进行内存管理。
- NVIDIA System Management Interface (nvidia-smi)支持汇报GPU使用率以及多个GPU性能计数器。
新增多个CUDA GPU运算SDK程序样例。
CUDA Toolkit 3.2正式版下载:
http://developer.nvidia.com/object/cuda_3_2_downloads.html
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者