过去的几年中物联网设备呈现指数级的增长,5G网络的开发和部署,以及AI技术栈的进步,让我们所谓的“边缘”计算新领域成为可能。尽管英特尔通过一系列战略举措进入到该领域,但英特尔已经悄然成为了边缘市场中一个值得关注的厂商。上个月,英特尔对第二代Xeon Scalable Platform进行了重大更新,增加了核心数量,提高了缓存空间,提升了处理器频率。同时,英特尔还宣布对5G网络基础设施产品进行重要扩展,包括新的基于Atom P5900 Intel架构的10纳米SoC,主要面向无线基站。
今天,我想更深入地探讨一下英特尔在网络和内部部署边缘方面的发展崛起,以及让英特尔成为一个不可忽视的力量的原因所在。
简而言之,边缘是一个广义的术语,指存在于数据中心外部的所有数据端点,这不仅包括智能手机、语音助手和PC等设备,还包括数量庞大且不断增加的物联网设备和收集全球信息的传感器。英特尔将“边缘”定义为数据中心之外以数据为中心的工作负载,而不局限于特定的智能手机和终端设备。
传统上说,从这些“边缘”设备收集的数据,必须路由回云和/或数据中心,以便生成洞察,但是企业组织越来越希望直接对数据源本身、或者靠近数据源的地方,在物理计算机结构上执行这些功能——也被称为“边缘计算”。在边缘计算中,有一些子类别,例如本地边缘(当网络运营商跨本地分布式边缘体系结构运行虚拟化环境时)和网络边缘(网络连接到互联网以及其他第三方网络)。英特尔将网络边缘/区域云视为边缘的一个子类别。
我认为,边缘计算让数据不必往返于云和后端,从而降低了延迟,缩短时间,以获取可执行的洞察力,增强现有服务,并打开新的商机。英特尔认为,延迟和数据主权是我们验证工作负载放在什么位置回报最高的主要因素。边缘计算的增长受到多种因素的推动,包括互联设备不断增加,人工智能技术发展实现了边缘处理和设备上处理,5G网络的开发和部署。因此,边缘和5G可以相互赋能——通过结合4G技术,边缘计算可以弥补不足,为早期5G网络提供一个备份选择。此外,不断涌现的5G案例带来新的希望,让5G成为投资下一代网络的最佳选择之一。
让我们看一下英特尔的产品组合,以及英特尔如何利用这一快速增长的领域。英特尔不可否认的优势之一是发布节奏——英特尔正致力于各个产品组合的年度发布,其中包括对边缘至关重要的那些技术。去年英特尔宣布推出了第二代Xeon Scalable Platform,该平台是专门针对AI、5G和数据处理而设计的。上个月,英特尔更新了至强处理器,推出了多款针对性能和性价比进行优化的处理器,面向跨云、网络和边缘的客户。
在网络边缘方面,英特尔最近发布了Atom P5900,一款基于英特尔架构的10纳米SoC,旨在满足5G无线基站对高带宽和低延迟的需求。为此,英特尔设定了一个雄心勃勃的目标,即到2021年成为5G基站的第一大芯片供应商。英特尔的Xeon D SoC也是值得关注的,主要针对那些边缘常见的、功耗受限的环境而设计的。
在AI加速器方面,英特尔最近收购了Habana Labs,实力大增,并在前不久宣布用Habana Labs取代命运多舛的Nervana芯片。在计算机视觉领域,英特尔于2016年收购了Movidius,后者的Myriad VPU致力于为安全摄像头和其他物联网设备等应用实现设备上的、低功耗的深度学习和可视数据处理。此外,英特尔还拥有Arria系列FPGA和SoC,旨在以较低的功耗水平上为汽车、数据中心、军事、通信等应用提供高性能水平。有一点很重要,英特尔Xeon Scalable平台现在支持集成AI加速,而且该平台已经成为目前AI推理应用事实上的默认平台基础,尤其是那些注重延迟的应用。
综上所述,我相信英特尔拥有支持边缘计算最为广泛,最为全面的产品组合,你很难在该领域内找到其他覆盖如此之广的厂商。唯有一种芯片是英特尔不提供的,那就是DSP。
英特尔的另一个优势体现在开发者方面,涉及视觉、零售、工业、机器人和网络领域,每季度都有新功能的发布。英特尔免费的OpenVINO开发人员工具包专注于边缘AI加速,在网络和企业边缘方面促进开放协作和创新,目标是支持5G的开发和部署。英特尔Open Visual Cloud软件堆栈力求在媒体、图形、分析和沉浸式媒体领域做到这一点,为开发者提供端到端的通路。英特尔表示,Open Visual Cloud针对云原生部署进行了优化,是针对现有x86架构以及英特尔很多加速器设计的。
值得注意的是,英特尔的软件是开源的。正如我之前所写,英特尔投资了许多开源计划,致力于整合生态,加速针对边缘的服务/应用开发。
英特尔收购的Smart Edge MEC,对于那些希望启用边缘应用的企业和企业而言,是一款独特的软件。英特尔将怎么整合Smart Edge MEC,特别是与运营商和运营商服务相关的策略,十分值得关注。
除了打造广泛的开发者生态系统以加速边缘创新之外,英特尔的边缘解决方案还积累了众多客户和合作伙伴。英特尔表示,边缘部署规模每年都在翻倍。英特尔在网络边缘领域的合作伙伴包括联想、红帽、Advantech、Caswell、Nvidia、Lanner、Nexcom、Worldwide Technology、爱立信、中兴、Verizon、沃达丰、诺基亚、中国电信等等。在本地边缘计算方面,英特尔正在与富士康和QNAP等公司展开合作,预计还将进一步扩大合作规模。
需要特别注意的是,英特尔还与数百个生态系统合作伙伴启动了开发者计划。
所有这些都说明,英特尔现在在内部部署和网络边缘方面是最有实力的厂商之一。英特尔通过战略收购和内部开发,打造了令人印象深刻的产品组合,其中包括处理器、加速器、SoC、VPU和FPGA,这些产品专门用于在网络和本地边缘进行计算。此外,英特尔通过开源工具,正在构建一个令人印象深刻的开发者和合作伙伴生态,以充分利用这项技术。
我相信英特尔在这些领域还有很多市场机会,而且目前采用的措施是正确的。这些市场机会不仅涉及企业、还涉及CSP(云服务提供商),这些CSP通过采用新的业务模型或者与CoSP展开合作,颠覆着边缘市场。其中, AWS Wavelength和Verizon就是一个很好的例子。
也许很快,英特尔在边缘计算领域就不会那么低调了。
好文章,需要你的鼓励
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。
这项研究揭示了大型语言模型的惊人能力:只需两个特殊训练的向量,冻结的语言模型就能在一次计算中生成数百个准确词汇,而非传统的逐词生成。研究者发现,这种能力要求特定的输入排列方式,且生成速度比自回归方法快约279倍。这一发现不仅展示了语言模型未被充分探索的并行生成潜力,还为快速文本重建开辟了新方向。
腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理能力,第二阶段通过长度感知的群体相对策略优化(L-GRPO)减少输出长度。实验结果显示,该方法在AIME、MATH-500等多个基准测试中既减少了输出长度(平均20%以上),又保持或提高了准确率,展现出高效率-高准确率的理想平衡。
这项由香港科技大学团队开展的研究首次全面评估了压缩对大语言模型Agent能力的影响。研究发现,虽然4位量化能较好地保留工作流生成和工具使用能力(仅下降1%-3%),但在实际应用中性能下降达10%-15%。团队提出的ACBench基准测试横跨工具使用、工作流生成、长文本理解和实际应用四大能力,评估了不同压缩方法对15种模型的影响。结果显示,AWQ量化效果最佳,蒸馏模型在Agent任务上表现不佳,大型模型对压缩更具韧性。研究还提出ERank等创新分析方法,为实际部署提供了切实指导。