扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
本文概述了本周高性能计算的五大热点事件,包括Cray和Sandia建立伙伴关系并创立知识研究所;RenderStream基于FireStream的工作站和服务器;NVIDIA CUDA技术中心总数的增长;Reservoir实验室和Intel在超级扩展性(extreme scale)方面的雄心;以及Jülich超级计算中心的新的混合集群。最后加上了额外的一段。
Cray和Sandia共同努力促进知识发现
杰出的超级计算机厂商Cray公司和Sandia国际实验室联合建立了用于学习和知识系统的超级计算研究所(SILKS)。这是一个合作研究和开发协议(CRADA),一次公私合作,旨在促进知识发现,数据管理以及信息论计算。SILKS位于Sandia阿尔伯克基市的总部,SILKS的研究成果来源于创始人的软件和硬件资源以及研究人员的经验和知识。
创立公司的合伙人宣布了三个主要的努力目标:
1.加快专注于解决知识发现,数据管理及信息论问题的高性能计算技术大规模的开发和应用。
2.协作克服在知识发现,数据管理及信息论领域更广泛的采用数据驱动的高性能计算技术的实现障碍。
3.应用这些技术,使在科学,工程及国家安全应用领域的发现和革新成为可能。
基础广泛的日常工作事项将涉及一系列的技术领域,包括软件,硬件,服务,教育及其相关扩展。来自Sandia 和Cray公司的代表期望共同的努力将创造尖端的技术和解决方案。
RenderStream发布了基于AMD用于OpenCL的服务器和工作站
为满足高性能计算GPU加速的需要,3D工作站专家RenderStream已经发布了基于AMD Radeon,用于OpenCL的服务器和工作站。这些21.6万亿次运算系统同样支持OpenGL以及基于Brooks的应用和产品开发。根据该公司的声明,使用AMD GPU的高性能计算GPGPU在信息安全,医学影像,计算机图形及渲染,服务器端渲染,时域有限差分(FDTD),电磁波谱,物理,生物科学及EDA领域显示了很大的潜力。
RenderStream公司基于AMD Radeon HD 6970的VDACTr8以及基于AMD Radeon HD 6990的VDAC4x2实现了1536个流处理器,每个系统8个GPU,当以超速运转的峰值性能运行时,提供了访问12,288个核以及21.6万亿次的计算能力。
官方公告提供了现实世界中来自信息安全领域服务器性能提升能力的例子:
使用基于整数的oclHashCat,RenderStream的用户将看到其计算能力接近线性指标。该计算能力打败了基于GTX 580 ,拥有4096个核以及12.6万亿次计算能力的 VDACTr8。在这个例子中,依赖于实现,相比基于GTX 580每秒180亿次的系统,基于HD 6970 和 HD 6990的VDACTr8评估出每秒超过450亿次的解决方案。
RenderStream提供了通用的GPU系统以及高性能计算特有的基于GPU的平台。基于GPU的平台采用的是NVIDIA Tesla或AMD FireStream图形处理器。
NVIDIA CUDA技术中心总数突破400个
本周,NVIDIA宣布了新增加了35个CUDA研究中心及CUDA教学中心,使得这类中心的数目达到了400个。最新的合作机构来自于14个国家,表明了并行计算--即NVIDIA--的全球影响力。
NVIDIA技术中心将借助源于CUDA的GPU的并行计算能力解决一系列具有挑战性的计算问题并教授上千个学生尖端的GPU编程技术。CUDA研究中心利用跨越多个领域的GPU计算能力,而CUDA教学中心已经将GPU计算技术纳入进他们主要的计算机编程课程。NVIDIA解释说他的CUDA研究中心计划“促进正在扩展并行计算前沿的机构之间的合作。”合作伙伴从“具有关键研究人员和专业学者的独家活动,NVIDIA指定的技术交流合作,以及获得专门的在线和面对面的培训课程”中获益。
要获取CUDA研究中心和CUDA教学中心最新的完整列表,请查看官方公告。
Intel美国国防部高级研究计划局普适高性能计算项目的合作伙伴:Reservoir实验室
为了在2018年创建可行的具有超级扩展性的计算,Reservoir实验室宣布它将和Intel研究人员合作进行编译技术及架构的开发。Reservoir实验室和Intel已经签署了分包协议,在Intel团队中引进Reservoir实验室的科研人员和相关技术,开发具有超级扩展性的计算技术,作为美国国防部高级研究计划局普适高性能计算(UHPC)研究项目的一部分。
根据透露:“普适高性能计算项目的目标是开发1千万亿次浮点指令计算能力,包括自包含制冷的单机柜系统,该系统克服了明显的能源效率,安全性及可编程性挑战。本质上,这可以看作是在更小的区域,使用更少的功率,整合当今最大的超集计算机的计算能力,并明显的增加可编程性和适用性。”
Intel普适高性能计算团队被分派任务支持并开发相关技术使美国到2018年能够建立具有超级扩展性的计算机。为了使这个具有挑战性的目标得以实现,必须在硬件和软件设计方面获得主要的突破性进展,这远远超出了当前商业所提供的级别。仅仅是改进计算机的能源效率级别超过100倍就需要明显的提升。
如果上述目标得以实现,嵌入式应用,比如美国国防部的海、陆、空系统,将受益于由此产生的技术。具有超级扩展性的系统同样将促进美国国防部的其他目的,比如智能监视侦察(ISR),电子战争(EW),集成的空中及导弹防御(IAMD),电脑化战斗指挥及设计以及网络安全,得以实现。
最初的合约要求项目提供“概念验证”,到2012年在第一代系统设计中实现超级扩展性技术。第二个阶段同样被概括地论述,如果美国国防部高级研究计划局继续选择该项目,在2014年将实现一个完整的系统设计。合约的全部范围指定在2018年交付超级扩展性系统的原型系统。
Jülich超级计算中心首次推出混合系统
新的GPU加速系统将支持位于德国的Jülich超级计算中心(JSC)进行高级研究。混合集群命名为JUDGE,用于“Jülich 专用GPU环境”,依赖GPU提升处理能力,同时最小化能量消耗。JUDGE将被用于生物学,医学和环境研究领域的数据密集型工作负载。
集群使用54台IBM System x iDataPlex服务器节点构建,每个节点包括12个核,96GB的内存,共108个NVIDIA M2050 GPU。IBM iDataPlex发行时被描述为“一个可扩展的系统能够明显减少能量消耗,冷却和空间需求。”
Martin Hiegl是IBM德国公司深度计算销售团队的主管,他评论说,“连同Jülich超级计算中心其他强大的超级计算机,新的JUDGE集群支持德国具备解决一系列科学和技术挑战的能力。”
NVIDIA高性能计算的销售主管Stefan Kraemer相信依赖于GPU加速力的混合设计,将是即将到来的亿亿次计算系统的模板。“在我们将来需要如何继续开发计算机,实现亿亿次计算目标方面, JUDGE集群是个很好的例子。JUDGE集群不只在性能方面,而且在能源消耗及能源效率方面都是有效的。”他接着说道:“像JUDGE这样的实验项目,在这个过程中起了关键作用,也是通往混合系统的关键一步。”
JUDGE并不是IBM和JSC的第一次合作。他们一起创造的QPACE超级计算机始终处于全世界最节能超级计算机Green500 列表的前十名。同时IBM和JSC在蓝色基因计划/P-based JUGENE一同合作,创造出欧洲一个最强大的计算机,具有超过一千万亿次的峰值性能。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者