浪潮胡雷钧： KNL+FPGA是加速深度学习的黄金搭档

8月17日，在美国旧金山举行的英特尔信息技术峰会（Intel Developer Forum，简称IDF）上，浪潮首席科学家胡雷钧进行了先进技术报告演讲，他结合当前深度学习应用特点和先进计算技术架构进行分析，认为KNL+FPGA是加速深度学习的黄金搭档。

深度学习在人脸识别、语音识别、精准医疗以及无人驾驶等领域被广泛的应用，近年来在高性能计算技术的支持下，其发展十分迅速。然而，深度学习的发展也面临着众多困境，如深度学习软件扩展性不够高、计算性能不够高、深度学习线上识别能耗大等问题。

在多年的深度学习计算系统实践中，浪潮发现深度学习应用具备如下特点: 在进行线下的模型训练时，计算系统需要处理较大规模的数据量，所以训练时间非常长，它需要庞大的计算资源去训练一个模型；而当深度学习应用的相关服务或产品上线时，系统却因为要处理成千上万的人均访问量往往规模巨大，这时深度学习应用对能耗的控制需求就非常高。结合以上特点，浪潮首席科学家胡雷钧提出，深度学习平台构建应该根据线下训练和线上识别的不同应用特点分别定制开发高性能计算解决方案。

今年6月，英特尔推出新一代融核处理器Knights Landing（以下简称KNL）受到业内广泛关注，其具备多达 72 个核心，双精度浮点性能超过3TFlops，单精度则超过6TFlops，被认为是高性能计算和深度学习的革命性产品。胡雷钧认为，KNL的性能十分强大，非常合适做深度学习线下训练的平台构建。而对于能耗要求比较高的线上识别平台，胡雷钧认为可考虑采用FPGA，FPGA的能耗比是CPU的5倍以上，可大幅节省系统能耗，满足深度学习线上识别平台的构建需求。因此，采用KNL+FPGA的深度学习平台构建方案是加速深度学习应用的最佳组合。

KNL+FPGA深度学习平台构建方案在浪潮的应用实践中得到了证实，浪潮曾全球首发基于最新KNL平台的深度学习计算框架Caffe-MPI。此外，浪潮联合科大讯飞和Altera用OpenCL实现的FPGA深度学习语音识别加速方案采用CPU+Altera Arria 10 FPGA异构架构，软件完全采用高级编程模式OpenCL实现从CPU到FPGA的迁移，在100 bound数据的处理条件下，基于Altera ARRIA 10 FPGA的DNN运行时间比基于Intel Xeon E5-2650 V2 双路CPU的性能加速2.871倍，在DNN 实际运行测试中，FPGA可实现30GFlops/W的高性能功耗比，而采用OpenCL编程模型使得最终的软件开发周期比传统verilog方式缩短了1/3.

浪潮作为领先的云计算、大数据和高性能计算服务商，其深度学习计算系统已经应用于百度、阿里巴巴、奇虎360、科大讯飞等多家互联网厂商，市场占有率超过60%。

来源：ZD至顶网服务器频道

0赞

好文章，需要你的鼓励

浪潮胡雷钧： KNL+FPGA是加速深度学习的黄金搭档

来源：ZD至顶网服务器频道

2016

08/18

13:52

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

AI智能戒指可翻译手语，准确率近90%

调整GPU时钟频率可将大语言模型训练能耗降低14%

从像素到规划：地球AI助力自然生态修复

贝索斯新创公司Prometheus究竟要做什么？

AI数据中心耗电量惊人，真正的原因被忽视了

电动滑板车创始人融资500万美元，转战太空数据中心

AI模型革新缺陷检测与审查，但规模化仍面临挑战

智能体AI如何实现真实物理世界的可靠落地

英国如何借助NVIDIA技术将主权AI雄心转化为实际行动

利用智能手机前置摄像头被动监测心率的研究系统

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会