北京时间2019年12月26日下午14点30分,联泰集群在北京正式发布了水晶系列工作站产品,本次“水晶工作站产品发布会”暨“联泰集群高性能计算解决方案研讨会”由英特尔®中国独家赞助,产品在提供强悍高算力的同时,保证低噪的静音,刚柔并济。
现场请到了英特尔中国数据中心技术售前经理——拓庆国先生,带来最新的英特尔CPU架构和傲腾™技术加持的傲腾™增强型SSD讲解,以及清华大学——张宇飞教授使用联泰集群产品在科研方面的精彩案例分享。
发布会现场首先由拓总和张教授共同为水晶系列工作站揭幕,工作站产品在会场进行了点亮,完全不会影响发布会的正常进行,真正检验了工作站的静音属性。
联泰集群硬件产品技术中心总监——刘振锋、软件产品技术中心总监——孙建军、硬件产品技术中心工程师——肖学文分别从应用方向、水晶工作站一体化软件平台及水晶系列产品硬件方面对本系列产品进行了详细的介绍。
入门级深度学习工作站W5232
在讨论这个问题之前我们需要理解为什么深度学习需要使用专业的工作站?
深度学习工作站配置要求
深度学习任务对计算机的性能要求较高,各硬件主要完成以下操作。
上述图示,深度神经网络计算大致流程,下面通过深度神经网络计算环节,分析核心硬件配置理想要求
CPU:
因为主要使用显卡进行cuda计算,因此对CPU的要求并不是很高,频率越高、线程数越多越好,一般最低要求cpu核心数大于显卡个数。其中一个制约因素:cpu的最大PCI-E 通道数。每张显卡占用16条pcie通道才能达到最大性能,而单cpu最大支持48条pcie,也就是最多3条PCI-E x16接口, 但是受限主板的大小,只有选用专业的工作站板子才能充分发挥GPU卡的性能,而联泰的W5232工作站就是一个很好的选择。采用专用的双路工作站,不仅提升了CPU的处理能力,也能通过使用两张GPU卡来增加训练能力。
GPU卡:
深度学习需要较强性能的显卡进行复杂的单精度运算,通常神经网络需要大量显存和内存资源,因此需要8GB以上显存才能运行大规模的深度卷积网络,执行计算机视觉任务,一般选择GTX1070以上配置。应该购买具有较大显存的显卡。下面给出2080ti、2080、2070、1080ti、1070、1060、Titan X、Titan V的几项指标的对比:
TFLOPS(teraFLOPS FLoating-point Operations Per Second每秒浮点运算次数)单精度
也就是运算性能,决定了运算速度,首选1080ti、2080ti、Titan V,不过性能最强的titan V的价格是2080ti的三倍
VRAM (显存):显存大小决定了我们的网络模型能不能执行,大型的卷积神经网络会使用超过8G以上的显存,因此购买具有大显存的显卡才能够保证大多数卷积神经网络模型能够顺利执行。
联泰的W5232工作站就是这种入门级深度学习的工作站,采用的是两颗二代Intel至强可扩展处理器,并且配备了64GB的内存,支持2张GPU加速卡,480G的SSD作为系统盘,4T的SATA盘作为数据盘,所以整个工作站的很高的,非常适合入门级深度学习。
|
静音工作站W4232 |
CPU |
2 * Intel® Xeon® Silver 4210 Processor 10/20 Cores/threads 2.2GHz 13.74MB L3 cache 85W |
GPU |
2 * RTX2080TI |
RAM |
4 * DDR4 16G 2400MHz |
Boot Storage |
480G SSD |
Data Storage |
希捷4TB SATA |
OS |
Ubuntu/Centos/Windows |
当然这款工作站配置那么高,也可进行其他的一些图像高分辨率,高清晰度的图像的输出,像再医院里面很多的各种CT等图片都是通过这种工作站进行扫描分辨出来的,特别是对于患者这种生理结构图的处理需要更加清晰的图像,因此需要更加强劲的图形处理能力。当然对于一些医疗行业里面的关于生命科学的基本的计算工作也是可以胜任的。
今后,联泰集群还将继续推出更多更新的产品,让我们一起感受科技前沿和创新变化。
好文章,需要你的鼓励
Blackwell GPU的生产制造工作量达到Hopper GPU的两倍有余,但带来的收入仅增加至约1.7倍。
由AMD驱动的El Capitan超级计算机(现位于美国劳伦斯利弗莫尔国家实验室(LLNL))成为世界上速度最快的超级计算机。