AI与HPC在云端融合原创

作者：邹大斌

HPC完全可以用于支持AI应用，包括训练和推理都可以发挥作用，不过，为了更好地支持，传统HPC无论架构、计算模型等都需要优化。

至顶网服务器频道 10月31日新闻消息（文/邹大斌）： AI是当下炙手可热的话题，其热度早已超过了IT行业，而HPC是一个老话题，行业外的人很少会关注。这两者有关系吗？答案是肯定的，至少在HPC行业内的人看来是的，两者都是计算密集型应用，本质上是一样的，也是相通的。实际上，在今年举办的HPC China 2018大会上，如何让HPC更好地支持AI成为嘉宾们探讨最多的话题之一。

AI是HPC的一种典型工作负载

随着机器学习技术的成熟，AI得到了越来越广泛的应用。英特尔院士、英特尔HPC战略总监Mark Seager在大会主题演讲中透露了一组数据，人工智能市场将从2017年的25亿美元成长为2022年的80-100亿美元，年复合增长率达到30%。高速成长的AI市场凸显对计算力的需求，而现有IT基础架构甚至整个AI应用生态都并不能很好地满足AI市场的需求。

众所周知，HPC也是面向高计算密度应用场景，其强大的计算力能否用来支持AI对计算力的需求呢？Mark Seager表示，HPC是完全可以用于AI应用的，包括训练和推理都可以发挥作用。比如，在计算领域有性能越来越强大的新至强可扩展处理器，在网络方面有高速通信网卡OPA，在存储方面有创新的傲腾，它们都可以让AI应用受益。

英特尔院士、英特尔HPC战略总监Mark Seager在HPC China 2018大会演讲

不过，HPC专家指出，传统HPC在架构、计算模型以及相关软件上都还需要优化，目前HPC专家正在研究这一问题。国家并行计算机工程技术研究中心陈左宁院士在HPC China 2018大会做主题演讲时就表示，HPC应该为AI提供更多支持，HPC与AI完全能够在云端进行融合，他们也正在进行这方面的研究。

英特尔高性能计算方案和销售总经理 Nash Palaniswamy在接受至顶网记者采访时也表达了同样的观点。“现在主流的人工智能算法本质上是矩阵乘，这在HPC的环境里已经使用大概几十年了，只不过现在我们有专门硬件来进行矩阵乘的加速，但是这个方式也是一个非常传统的HPC的方式。”他说。

作为间接的证据，他介绍说，目前在很多厂商AI业务都归到HPC部门，比如联想和HP等。

不过，一个不可回避的现实是，今天在大多数AI实际应用中似乎与HPC关联不大，不少AI都建起了一个新的硬件平台。背后的原因在于这两者在计算时具有明显不同的特征，传统HPC目前还不能很好地支持AI。根据陈左宁院士的说法，传统HPC（比如数值模拟）和AI（如CNN）在算法方面还是存在很多区别的，比如传统HPC精度要求高而AI要求低，传统HPC计算访存比低而AI高，传统HPC并行度高而AI并行度低等等，这些差别导致传统HPC在应用于典型AI场景时并不能很好地发挥强大的计算能力。

而这个问题的解决需要从整个生态上着手。陈左宁院士认为，AI应用在生态面临这些挑战：

硬件架构越来越多，很难充分发挥性能，用户需要对硬件细节和应用算法非常了解；人工智能框架类型越来越多，很多AI框架还在剧烈变化；缺乏高效好用的调试和调优工具，调优工作量大；部分应用场景实时训练需求强烈（比如车载应用场景）；计算节点间、计算节点内通信效率较低等等。

“软硬兼施”建立统一的平台

无论是在传统HPC还是在AI应用，英特尔都是积极的推动者，也是HPC和AI生态系统中最为重要的厂商之一，而英特尔正大力推动这两者的融合。实际上，英特尔一直以来都对HPC的高度，而随着英特尔将自己定位为一个以数据为中心的公司之后，AI自然地成为公司的一个核心战略。

“今天的英特尔已经从之前的以PC为中心转向以数据为中心的战略。具体到数据中心领域，我们的目标是不管是计算、存储还是网络，都要降低成本同时增强整个系统的性能，也就是要移动得更快、存储得更多、所有数据类型都能处理。”Nash Palaniswamy表示。

数据显示，在从2006年-2017年的10多年时间内，计算整体成本降低了56%，存储降低了77%，但与此同时性能提升了41倍，这其中与英特尔的努力显然密不可分。

Nash Palaniswamy透露，英特尔最新一代至强可扩展处理器Cascade Lake会在不久面世，该处理器会提供更棒的性能，同时还会增加一些人工智能深度学习加速器功能在里面，从而极大程度地提升INT8的性能。同样，傲腾数据中心级持久内存也是一个非常重要的创新，单根最大可以支持到512G，可以插在内存插槽。

英特尔在这些方面的改进让HPC和AI应用都能受益。同时，英特尔还一直致力于帮助用户建立一个一致性的平台，无论是HPC还是AI应用不需要切换平台，从而简化IT基础设施，降低成本。这是英特尔在新一代至强中集成英特尔深度学习加速器DL Boost的原因之一。

“借助DL Boost做INT8运算时，最高可以提升大概11倍性能。在这个新功能帮助下进行单纯的训练运算时，最多可以做到1.4倍的性能提升。对一些普通用户来讲，其实没有这么多的训练需求完全可以放到英特尔这个平台上完成。” Nash Palaniswamy表示。

除了提升IT基础设施方面的性能和降低成本外，丰富和改进相关配套软件也是英特尔工作重点。近年来，随着AI的普及，英特尔不断丰富深度学习/机器学习的数学函数库以及数据分析加速库，比如，英特尔发布的面向各种设备和框架的深度神经网络模型开源编译器nGraph，扩展了深度学习模型的适用性和可移植性。

另一方面，英特尔也非常重视市场推广和人才培养上。在HPC CHINA 2018 大会期间，发布了“全国并行应用挑战赛”（Parallel Application Challenge 简称PAC）的获奖名单，该大赛由中国计算机学会高性能计算专业委员会指导、教育部计算机类专业教学指导委员会联合英特尔（中国）有限公司、北京并行科技股份有限公司共同倡导发起，中科院计算机网络信息中心等单位支持。PAC大赛采用英特尔至强处理器作为推荐平台，由英特尔（中国）有限公司提供围绕并行计算以及英特尔至强的相关培训内容。大赛选择华为云EI大数据MRS服务作为大赛结果评选的独家评审平台，华为云EI大数据MRS服务具有强大的AI能力开放性，能够快速集成Analytics Zoo框架，为大赛提供一站式的大赛作品统一运行平台。

“就英特尔的战略而言，我们关注的是以数据为中心的基础设施的更新和创新，而不只是AI、HPC，同时也有像BigDL、nGraph等相关技术。我们希望通过我们的持续性投入可以让我们的用户有更好用的产品，拥有更低的TCO。” Nash Palaniswamy说。

来源：至顶网服务器频道

0赞

好文章，需要你的鼓励

AI与HPC在云端融合 原创

AI是HPC的一种典型工作负载

“软硬兼施”建立统一的平台

来源：至顶网服务器频道

2018

10/31

10:26

分享

点赞

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

谷歌Gemini大模型登陆甲骨文云平台

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

成本打到6万以下，手把手教你用4路锐炫显卡+至强W跑DeepSeek

天翼云CPU实例部署DeepSeek-R1模型最佳实践

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

MWC 2025：英特尔展示基于至强6处理器的基础网络设施

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

英特尔至强6新品发布，能为数据中心带来哪些改变？

英特尔推出具备高性能和能效的以太网解决方案

英特尔推出搭载至强6处理器的卓越AI和网络解决方案

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

AI与HPC在云端融合原创