英特尔及其子公司Altera近日推出了一系列新的处理器,以及旨在将AI功能扩展到网络边缘的FPGA产品。
新产品据称目前已经广泛上市,其中包括了由英特尔制造的很多边缘优化型CPU和GPU,以及Altera制造的Agilex 5系列FPGA。英特尔表示,新产品旨在边缘实现各种AI功能,例如视觉计算、媒体处理以及商业智能,而Altera的FPGA则专为更广泛的用例而设计,包括AI驱动的视频、工业、机器人和医疗应用。
据英特尔称,新推出的所有芯片都具有集成的AI加速能力,可为新一代的智能设备提供动力。
该系列最高端的型号是Intel Core Ultra处理器,与第14代Intel Core Desktop处理器相比,在图像分类推理任务上性能提升高达五倍。据称,该处理器与英特尔Arc GPU以及NPU在一套简化的片上系统设计中相机和,可以用于支持零售、教育、智能城市和工业等场景中位于边缘的“要求苛刻的图形工作负载”。例如,可用于零售商支持生成式AI的销售亭或智能销售点系统,作为课堂上的交互式白板,以及工业制造业的AI视觉设备。
再往下的型号是用于边缘工作负载的新的Intel Core处理器,将英特尔第13代Intel Core移动芯片的GPU与“LGA插座灵活性”相结合,从而增强了系统的可扩展性和部署速度。根据英特尔的说法,该系列与标准的第13代Intel Core桌面级芯片相比,图形性能高出2.57倍。
此外,英特尔还推出了两款Intel Atom处理器,包括X70000C系列和X7000RE系列,都是低功率、支持AI的型号,专为网络和电信设计,分别用于工业和制造场景,具有内置的深度学习推理功能,可执行检测零日威胁、增强数据包和控制平面处理、AI驱动的质量控制等任务。
最后,英特尔宣布推出了新的Intel Arc GPU for Edge,据称与早期GPU相比,边缘AI性能有显著提高,在图形处理和媒体等场景中可以加速AI工作负载。
至于Altera,此次最新推出的Agilex 5 Soc FPGA是一款可编程芯片,旨在支持边缘设备中的AI功能,而无需使用专用的AI加速器,性能最高可达Agilex 7 FPGA的两倍。
FPGA是一种具有可自定义电路的低功率计算机芯片,能够在部署前进行非常具体的用例处理。为了支持这一点,Altera的芯片配置了Quartus Prime软件、Altera FPGA AI Suite以及Intel OpenVino Toolkit等工具,开发人员可以使用这些工具针对特定的工作负载进行芯片编程,创建AI知识属性块,并将其集成到FPGA设计中,再将其安装在设备中。
Altera表示,新推出的FPGA将加速创新,从而使企业更轻松地通过部署“嵌入式AI设备”利用在边缘生成的大量数据。
Altera首席执行官Sandra Rivera说:“我们宣布推出了新的Altera品牌,其目标是将领先的技术和创新更快地推向FPGA市场。Altera正在领导新的FPGAI时代,与张量功能与可编程性紧密耦合,同时注入FPGA和AI工具,以打造一流的开发人员体验。”
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。