英特尔公司日前发布针对高性能计算与AI两大工作负载进行优化的新型通用图形处理单元,这也意味着芯片巨头正式将业务关注重点放在二者的融合身上。
除此之外,英特尔方面还公布了oneAPI计划,旨在提供更为简单的编程模型(包括GPU、中央处理器、现场可编程门阵列以及神经网络处理器等),用于开发可在任意类型架构之上运行的HPC与AI应用程序。
在此次科罗拉多州Supercomputing 2019大会上亮相的全新Ponte Vecchio离散GPU采用英特尔目前最先进的7纳米制程工艺制造,基于英特尔Xe架构设计,同时专门针对HPC与AI训练等工作负载做出了优化。
英特尔公司视觉技术团队与图形业务部门副总裁兼总经理Ari Rauch在新闻发布会上表示,“几年之前,英特尔就意识到有必要开发出一种图形架构,将传统GPU的工作负载适用范围延伸至HPC/超大规模/AI与深度学习训练等领域。”
这款新型GPU有望给英特尔带来更足的底气,在AI市场上同领先厂商英伟达以及AMD等竞争对手争夺与AI与机器学习业务相关的市场份额。就在上周,英特尔方面还公布了三款用于训练及运行AI工作负载的新型芯片。
尤其重要的是,英特尔方面还披露了新一代至强处理器的消息,包括明年上半年推出代号为Cooper Lake的新处理器,以及计划于2021年推出的Sapphire Rapids处理器。
值得注意的是,Ponte Vecchio是英特尔公司首款采用全新Foveros 3D封装技术的GPU。Foveros之所以如此重要,是因为其能够将多种芯片类型组合在同一块晶片之上,从而构建起高度专用化的新型处理器方案。
Ponte Vecchio几乎必然采用了这样的混合设计方案,因为其在设计上能够与现有至强Scalable CPU协同工作。后者包含内置AI加速功能,可用于分析HPC工作负载生成的大量数据。
Moor Insights & Strategy公司的Patrick Moorhead在采访当中表示,“业界希望在数据中心GPU产品领域开展进一步竞争,这一点已经非常明确。”但他同时强调,相关筹备工作仍在进行当中,英特尔方面可能要到明年某个时候才能真正准备就绪。
另一条有趣的消息来自英特尔的oneAPI计划。该计划包含一套开放性规范,用于编写可运行在任意计算架构之上的HPC与AI应用程序。
英特尔方面表示,异构应用程序的编写对于HPC以及AI应用来说非常关键,毕竟此类工作负载必须配合多种不同架构才能高效运行。
英特尔公司高级副总裁,架构、图形与软件首席架构师兼总经理Raja Koduri表示,“HPC与AI工作负载需要配合多种架构,涵盖CPU、通用GPU、FPGA乃至专用性更强的深度学习NNP等等。帮助客户轻松运用不同环境提供的计算功能显然至关重要,英特尔公司致力于提供软件为先的思路,为异构架构提供一个统一且可扩展的抽象层。”
OneAPI当中包括一种直接编程语言、强大的应用程序编程接口、库以及分析器。英特尔方面指出,oneAPI旨在降低开发人员的工作负担,确保他们在进行异构应用程序开发的过程中无需维护单独的代码库,也用不着使用多种编程语言或工具。
Moorhead指出,“OneAPI旨在简化开发人员的工作流程,使其轻松跨越英特尔GPU、CPU、FPGA以及Movidius加速器完成编程工作。这是一个抽象层,可实现代码复用,从而最大限度减少目前广泛存在的加速定制工作。业界希望能够在这样的基础之上实现代码复用,而不再像过去那样为不同的加速器编写不同的代码。”
Constellation Research公司分析师Holger Mueller在采访中表示,他觉得oneAPI的意义甚至超过了新款GPU,这也符合近年来软件价值高于硬件的整体趋势。
Mueller指出,“对于高管们来说,这种将代码资产在下一代应用程序中复用的能力非常重要,企业业务的加速发展也需要以此为基础。”
英特尔此次公布的新技术(包括Ponte Vecchio GPU以及oneAPI)将被引入美国能源部在伊利诺伊州阿贡国家实验室打造的Aurora超级计算机系统。这套系统计划在2021年投入使用,并将成为美国第一台性能达到百亿亿次水平的超级计算机。
Aurora中的各个计算节点包含两块至强Scalable CPU以及六块Ponte Vecchio GPU。此外,其还将整合英特尔公司的其他技术成果,包括Optane非易失性存储器以及其他多种连接组件,共同构成一套以数据为中心的完整英特尔技术产品组合。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。