7月20日,在英特尔至强融核应用创新论坛上,伴随着英特尔至强融合处理器“Knights Landing”(以下简称KNL)正式进入中国市场,英特尔与浪潮联合发起的“KEEP”试用体验计划(KNL Evaluation and Escalation Program)也正式接受报名申请。
据了解,除了在论坛现场报名“KEEP”计划外,全球科研院所或实验室的科研小组、高校师生以及企业HPC用户,均可登陆官方网站http://inspurhpc.com/KEEP/,向Inspur-Intel中国并行计算实验室提交应用说明和KNL测试迁移申请。一旦申请审核通过,即可免费成为“KEEP”计划的体验用户。
多人现场进行KEEP报名
“KEEP”计划负责人、Inspur-Intel中国并行计算联合实验室首席工程师张清表示,KNL带来一种全新的计算体验,拥有更灵活的产品模式、更好的性能功耗比、更高的内存容量和带宽以及更简单的编程体验。
KNL的首要变化就是既可以继续做协处理器,也可以单独做中央主处理器,支持Host processor、Host processor with Integrated fabric及Co-processor三种模式。其中,Host processor模式将消除PCIE瓶颈,可寻址的物理内存最大可达到400GB,其中DDR4内存最大为384GB,带宽为90+GB/s,MCDRAM片上内存最大为16GB,带宽可达到500GB/s。同时,KNL采用了Silvermont架构的改进定制版和14nm新工艺,核心数量多达72个并支持四线程,最多拥有288个线程,双精度浮点性能超过3TFlops,单精度则超过6TFlops,性能功耗比达到12GFlops/W以上。此外,KNL与Intel Xeon Processor 是二进制兼容的,Intel Xeon平台的程序可在KNL平台直接编译运行,基于Xeon平台的优化将同样适用于KNL,这为X86应用的开发和移植带来了更多的便利。
不过,KNL在带来更好计算体验的同时,也必然会引发应用的适应性进化。张清认为,“KEEP”计划提供公共的新技术平台和技术支持,可以让HPC和深度学习用户能第一时间免费试用新技术,开展预研工作,弥补了之前一直缺乏的“平台试用,应用预研”环节。这一计划的开展将帮助众多的HPC用户提前掌握新技术,提前在新计算平台上开展应用研发工作,这将推进HPC和深度学习生态的建设。
目前,“KEEP”计划是英特尔针对KNL开展的唯一一项试用体验计划。而对于为何选择浪潮作为合作对象,张清表示这与Inspur-Intel中国并行计算联合实验室在MIC技术的应用优化上取得的诸多成绩关系密切。该实验室的重要工作就是基于MIC技术研究面向Exscale的系统架构与应用创新,通过开放课题的设立为国内外HPC用户与专家提供了行业应用领先采用新技术的机会。目前,实验室已经基于第一代MIC架构KNC完成石油勘探、生命科学、CFD、气象等10个行业相关MIC应用,并完成全球第一本MIC技术专著,培训MIC技术工程师超过500人。
据了解,在第二代MIC架构KNL平台上,Inspur-Intel中国并行计算联合实验室目前已经完成SKA核心应用算法Gridding、大规模线性方程组求解器GMRES 2个HPC应用算法的KNL迁移与优化,并完成了全球首个基于KNL平台的集群并行版本Caffe-MPI,实现高性能、高可扩展性、支持大规模数据训练的深度学习计算框架。其中,Gridding应用的计算速度(million grid points per second)在单KNL节点达到14540,而在单节点双路E5 CPU上则为2383;而GMRES应用在同时计算2800万阶线性方程组的情况下,单KNL节点的性能是单节点2双路E5 CPU的4.42倍。
好文章,需要你的鼓励
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
医疗信息管理平台Predoc宣布获得3000万美元新融资,用于扩大运营规模并在肿瘤科、研究网络和虚拟医疗提供商中推广应用。该公司成立于2022年,利用人工智能技术提供端到端平台服务,自动化病历检索并整合为可操作的临床洞察。平台可实现病历检索速度提升75%,临床审查时间减少70%,旨在增强而非替代临床判断。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。