7月20日,在英特尔至强融核应用创新论坛上,伴随着英特尔至强融合处理器“Knights Landing”(以下简称KNL)正式进入中国市场,英特尔与浪潮联合发起的“KEEP”试用体验计划(KNL Evaluation and Escalation Program)也正式接受报名申请。
据了解,除了在论坛现场报名“KEEP”计划外,全球科研院所或实验室的科研小组、高校师生以及企业HPC用户,均可登陆官方网站http://inspurhpc.com/KEEP/,向Inspur-Intel中国并行计算实验室提交应用说明和KNL测试迁移申请。一旦申请审核通过,即可免费成为“KEEP”计划的体验用户。
多人现场进行KEEP报名
“KEEP”计划负责人、Inspur-Intel中国并行计算联合实验室首席工程师张清表示,KNL带来一种全新的计算体验,拥有更灵活的产品模式、更好的性能功耗比、更高的内存容量和带宽以及更简单的编程体验。
KNL的首要变化就是既可以继续做协处理器,也可以单独做中央主处理器,支持Host processor、Host processor with Integrated fabric及Co-processor三种模式。其中,Host processor模式将消除PCIE瓶颈,可寻址的物理内存最大可达到400GB,其中DDR4内存最大为384GB,带宽为90+GB/s,MCDRAM片上内存最大为16GB,带宽可达到500GB/s。同时,KNL采用了Silvermont架构的改进定制版和14nm新工艺,核心数量多达72个并支持四线程,最多拥有288个线程,双精度浮点性能超过3TFlops,单精度则超过6TFlops,性能功耗比达到12GFlops/W以上。此外,KNL与Intel Xeon Processor 是二进制兼容的,Intel Xeon平台的程序可在KNL平台直接编译运行,基于Xeon平台的优化将同样适用于KNL,这为X86应用的开发和移植带来了更多的便利。
不过,KNL在带来更好计算体验的同时,也必然会引发应用的适应性进化。张清认为,“KEEP”计划提供公共的新技术平台和技术支持,可以让HPC和深度学习用户能第一时间免费试用新技术,开展预研工作,弥补了之前一直缺乏的“平台试用,应用预研”环节。这一计划的开展将帮助众多的HPC用户提前掌握新技术,提前在新计算平台上开展应用研发工作,这将推进HPC和深度学习生态的建设。
目前,“KEEP”计划是英特尔针对KNL开展的唯一一项试用体验计划。而对于为何选择浪潮作为合作对象,张清表示这与Inspur-Intel中国并行计算联合实验室在MIC技术的应用优化上取得的诸多成绩关系密切。该实验室的重要工作就是基于MIC技术研究面向Exscale的系统架构与应用创新,通过开放课题的设立为国内外HPC用户与专家提供了行业应用领先采用新技术的机会。目前,实验室已经基于第一代MIC架构KNC完成石油勘探、生命科学、CFD、气象等10个行业相关MIC应用,并完成全球第一本MIC技术专著,培训MIC技术工程师超过500人。
据了解,在第二代MIC架构KNL平台上,Inspur-Intel中国并行计算联合实验室目前已经完成SKA核心应用算法Gridding、大规模线性方程组求解器GMRES 2个HPC应用算法的KNL迁移与优化,并完成了全球首个基于KNL平台的集群并行版本Caffe-MPI,实现高性能、高可扩展性、支持大规模数据训练的深度学习计算框架。其中,Gridding应用的计算速度(million grid points per second)在单KNL节点达到14540,而在单节点双路E5 CPU上则为2383;而GMRES应用在同时计算2800万阶线性方程组的情况下,单KNL节点的性能是单节点2双路E5 CPU的4.42倍。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。