Christine Boles,英特尔网络与边缘解决方案事业部副总裁兼工业解决方案业务总经理
推进当今制造业和工业部门正在进行的数字化转型需要应用前所未有的创新技术。除了自动化或监测操作之外,越来越多的企业正在迅速引入AI、分析和其他需要突破性算力的动态工作负载。
特别是AI的使用正在迅速增长:截至2022年,35%的公司报告称正在使用AI,另有42%的企业表示正在探索AI的使用。因此,拥有能够实时运行AI工作负载,或监测生产设备并能够对质量控制、生产率等自动做出决定的处理器越来越关键。最近几代的英特尔处理器,包括第13代英特尔®酷睿™移动处理器和第四代英特尔®至强®可扩展处理器,专为满足这些需求而设计。这是英特尔帮助制造商和其他工业企业部署数字技术的方式之一。通过这些技术,企业能够更轻松地识别瓶颈或潜在问题,并更灵活地处理不断变化的需求,使运营更加高效。
为什么企业需要处理繁重工作负载的能力
从19世纪指导织布机工作的穿孔卡片到20世纪40年代的第一台数控设备,人类使用技术来控制生产已有数百年历史。但几十年来,工业机器则经常使用计算机控制来指导大部分简单的动作。现在,这种情况正在迅速改变,越来越多的企业已经看到边缘AI能够极大地改变他们的运作方式。采用这些先进的数字技术需要先进的、具有成熟算力的硬件来管理AI、工业控制系统和IT支持。
考虑到这一点,第13代英特尔®酷睿™处理器继续发挥第12代英特尔®酷睿™处理器首秀的高性能混合架构的优势。高性能混合架构和英特尔®硬件线程调度器(Intel® Thread Director)优化了针对各种边缘应用案例的性能。内置的英特尔®锐炬®Xe显卡,支持动态视觉体验,同时也为受功耗或空间限制的应用带来了AI推理功能。
某些版本的第13代处理器为行业应用提供了实时和扩展温度支持等功能。此外,部分移动处理器符合10年内100%运行的行业条件,其扩展温度范围为-40摄氏度(-40 Fahrenheit)至100摄氏度(212 Fahrenheit),有助于确保在极端恶劣环境下处理器正常运行的可靠性。同时,这一代处理器提供了对英特尔®时间协调计算(Intel® TCC)和离散的、具有时间敏感网络功能的2.5GbE连接的支持,以帮助同步有延迟限制的工作负载。
BirminD是WEG旗下的工业优化实验室,提供先进的分析解决方案,正在使用第13代移动处理器来提高客户的制造效率和性能。凭借移动处理器紧凑的尺寸和更快的推理速度,BirminD发现它们可以比早期的处理器增强更多的PID控制器。
“BirminD一直在积极开发第13代英特尔酷睿i7处理器,到目前为止,与我们基于英特尔赛扬J4005处理器的解决方案相比,在推理速度上,我们看到了平均7.3倍的提高,”BirminD首席执行官Diego Mariano表示。“在同样紧凑的外形尺寸下能有这样的性能,使我们现在可以在单个边缘AI系统中扩展70倍的PID控制器。”
利用英特尔至强可扩展处理器创造更多可能
与第13代英特尔®酷睿™处理器一样,全新第四代英特尔®至强®可扩展处理器可以处理要求严苛的工作负载,其内置的加速器可提供更快的AI训练、推理能力和优化的分析能力。它们还提供了更大的内存带宽,且相比之前版本的处理器能更好地支持更多的PCIe设备。英特尔至强处理器专门针对低延迟网络连接和边缘工作负载进行了优化,与之前的处理器相比,实现了性能和能效的提升。
英特尔高级矩阵扩展(AMX)加强了针对机器视觉、缺陷检测、质量检测等其他用途的AI能力。在此基础上,英特尔DSA专为数据移动任务设计,能够帮助提升其相关的应用程序性能。内置的英特尔Speed Select技术也能帮助运营商在多个虚拟机(VM)工作负载中为最关键的任务选择最优化的性能。
凭借这些性能提升,西门子针对物联网领域在其SIMATIC IPC RS-717A可扩展的1U机架服务器平台中使用了第四代英特尔®至强®可扩展处理器。西门子的这一解决方案针对具有挑战性的环境进行了优化,并提供了灵活性,以支持工业边缘的更多用例、更多虚拟化和更多传感器。
更快的边缘性能
新一代英特尔可扩展和移动处理器建立在支持IT需求的技术基础之上,同时提高了企业在建立AI、物联网和其他边缘系统时可利用的算力标准。凭借每个处理器可以比其他系统部署更多的摄像头这一优势,领先的英特尔处理器已经在为诸多解决方案赋能。对于使用机器视觉提高产品质量的实时缺陷检测解决方案,或监控设备和生产线解决方案来说,这是一个关键优势。
更快、更强大的边缘处理能力也使得在机器人、航空电子设备等数据密集型领域运用数字孪生、自动控制和处理变得更加容易。有了这种更加动态的处理能力,企业也可以创造新的机会,于事前发现潜在问题,并提高他们的响应能力和员工及客户的体验。此外,英特尔处理器的领先性能和集成加速器在数据科学、模型训练和深度学习任务中也同样表现出色。
随着5G基础设施和连接成为工业用途和配置的新标准,英特尔的处理器已经准备就绪。第四代英特尔至强®可扩展处理器集成了虚拟无线接入网络(vRAN)加速功能,帮助运营商为5G核心网和边缘网络提供云原生功能。英特尔已经证明,这款处理器可以在单个双路服务器内为5G用户平面功能(UPF)带来1 Tbps的性能。
以高性能算力,面向制造业数字化未来
没有高性能的算力,变革制造业和其他行业运作方式的数字化解决方案就如同无本之木。通过内置的弹性和效率,以及各种设备和环境下的兼容性,第13代英特尔®酷睿™移动处理器和第四代英特尔®至强®可扩展处理器持续以领先性能赋能制造业真正实现智能化升级变革。
好文章,需要你的鼓励
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。
这项研究揭示了大型语言模型的惊人能力:只需两个特殊训练的向量,冻结的语言模型就能在一次计算中生成数百个准确词汇,而非传统的逐词生成。研究者发现,这种能力要求特定的输入排列方式,且生成速度比自回归方法快约279倍。这一发现不仅展示了语言模型未被充分探索的并行生成潜力,还为快速文本重建开辟了新方向。
腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理能力,第二阶段通过长度感知的群体相对策略优化(L-GRPO)减少输出长度。实验结果显示,该方法在AIME、MATH-500等多个基准测试中既减少了输出长度(平均20%以上),又保持或提高了准确率,展现出高效率-高准确率的理想平衡。
这项由香港科技大学团队开展的研究首次全面评估了压缩对大语言模型Agent能力的影响。研究发现,虽然4位量化能较好地保留工作流生成和工具使用能力(仅下降1%-3%),但在实际应用中性能下降达10%-15%。团队提出的ACBench基准测试横跨工具使用、工作流生成、长文本理解和实际应用四大能力,评估了不同压缩方法对15种模型的影响。结果显示,AWQ量化效果最佳,蒸馏模型在Agent任务上表现不佳,大型模型对压缩更具韧性。研究还提出ERank等创新分析方法,为实际部署提供了切实指导。