英特尔至强处理器助力Aible加速生成式AI工作负载

对于需要运行生成式AI工作负载的企业来说，基于英特尔至强处理器的Aible无服务器解决方案可帮助其降低成本、提高智能化，并有效提升RAG及微调效率

近日，英特尔与端到端Serverless（无服务器）生成式AI和增强型分析方案提供商Aible合作，为企业客户提供了创新的解决方案，助力其在不同代际的英特尔®至强® CPU上运行生成式AI与检索增强生成（RAG）用例。此次合作包含了工程优化和基准测试项目，显著增强了Aible以低成本为企业客户提供生成式AI结果的能力，并帮助开发人员在应用中部署AI。在双方的通力合作下，该可扩展、高效的AI解决方案可通过高性能硬件帮助客户迎接AI挑战。

英特尔至强处理器

英特尔数据中心与人工智能事业部高级首席工程师Mishali Naik表示：“现在，客户正在寻求高效的企业级解决方案以充分释放AI潜力。我们与Aible的合作，也表明了英特尔正与行业紧密协作，推动AI创新，降低客户使用英特尔至强处理器运行最新生成式AI工作负载的门槛。”

至强处理器的生成式AI性能：Aible的解决方案展示了CPU如何显著提升从运行语言模型至RAG的一系列最新AI工作负载性能。基于针对英特尔处理器的优化，Aible技术采用高效、智能的“端到端无服务器”方法，仅在产生用户请求时才会进行资源消耗。例如，基于用户查询，向量数据库仅需几秒即可激活并检索相关信息，而语言模型同样只需简单启动即可处理并响应用户请求，这种按需操作的运行模式有助于企业降低总拥有成本（TCO）。

虽然在多数情况下，RAG功能需通过利用GPU和加速器的并行处理能力来实现，但Aible的无服务器技术与英特尔至强处理器相结合，可使RAG用例完全由CPU来驱动。性能数据显示，多款不同代际的英特尔至强处理器均可高效运行RAG工作负载。

英特尔至强处理器助力Aible加速生成式AI工作负载

配置详细信息如图，结果可能会有不同

重要意义：Aible通过无服务器的方式使用CPU，可在多个客户之间更为安全地共享底层计算资源，从而帮助客户有效降低生成式AI项目的运营成本。这种降低成本的方式可以类比为用户仅需在使用时购买电力，而非直接租赁发电机。此外，随着生成式AI需求的增长，性能优化和节能降耗变得愈发重要。Aible所提供的基于CPU的服务，为客户提供了一种经济、高效的解决方案。

根据Aible的基准测试分析，当客户采用基于CPU的无服务器解决方案运行RAG模型时，成本节省可高达55倍1。大幅降低的成本证明了Aible独家方法的有效性，同时这种无服务器的CPU采用方式也减少了通过共享服务或专用服务器构建更为昂贵的、基于GPU的基础设施需求。

此次英特尔及英特尔实验室与Aible的合作，共同优化了至强处理器上的AI工作负载。值得一提的是，通过优化Aible针对AVX-512的代码，Aible在至强处理器上实现了显著的性能及吞吐量提升，这也彰显了战略性的软件优化对于整体效率的影响。

在Aible平台的支持下，RAG模型与英特尔至强处理器的结合可推动以下应用落地：

自然语言处理（NLP）
推荐系统
决策支持系统
内容生成

英特尔与Aible的合作始于第四代至强处理器的发布。此后，双方针对至强处理器的AI工作负载、代码和库进行了一系列优化，并大幅提升了Aible的产品性能。

1 英特尔不控制或审计第三方数据。您可咨询其他来源以评估准确性。

配置详情：

1节点，2x英特尔®至强® Platinum 8280L CPU，2.70GHz, 28核心，HT开启，Turbo开启，NUMA 2，集成加速器可用[已使用]：DLB 0 [0]，DSA 0 [0]，IAA 0 [0]，QAT 0 [0]，总内存384GB (12x32GB DDR4 2933 MT/s [2934 MT/s])，BIOS SE5C620.86B.02.01.0017.110620230543，微码0x5003604，2x以太网连接X722用于10GBASE-T，1x 894.3G英特尔SSDSC2KB96，1x 1.8T英特尔SSDPE2KX020T8，2x 3.7T英特尔SSDPE2KX040T8，Red Hat Enterprise Linux 8.9 (Ootpa)，4.18.0-513.18.1.el8_9.x86_64，WORKLOAD=Aible端到端RAG-LLM，模型=Mistral-7B-OpenOrca-GGUF，all-MiniLM-L6-v2，gcc 12.2.0，IntelLLVM 2024.0.2，llama.cpp，ChromaDB，Langchain，oneAPI基础容器2024.0.1-devel-ubuntu22.04。基于英特尔03/07/24的测试。

1节点，2x英特尔®至强® Platinum 8462Y+，32核心，HT开启，Turbo开启，NUMA 2，集成加速器可用[已使用]：DLB 2 [0]，DSA 2 [0]，IAA 2 [0]，QAT 2 [0]，总内存512GB (16x32GB DDR5 4800 MT/s [4800 MT/s])，BIOS 05.12.00，微码0x2b0004d0，2x BCM57416 NetXtreme-E Dual-Media 10G RDMA以太网控制器，2x以太网控制器E810-C for QSFP，2x 3.5T三星MZQL23T8HCLS-00B7C，1x 1.8T三星MZ1L21T9HCLS-00A07，Red Hat Enterprise Linux 8.9 (Ootpa)，4.18.0-513.18.1.el8_9.x86_64，WORKLOAD=Aible端到端RAG-LLM，模型=Mistral-7B-OpenOrca-GGUF，all-MiniLM-L6-v2，gcc 12.2.0，IntelLLVM 2024.0.2，llama.cpp，ChromaDB，Langchain，oneAPI基础容器2024.0.1-devel-ubuntu22.05。基于英特尔03/07/24的测试。

1节点，2x英特尔®至强® PLATINUM 8562Y+，32核心，HT开启，Turbo开启，NUMA 2，集成加速器可用[已使用]：DLB 2 [0]，DSA 2 [0]，IAA 2 [0]，QAT 2 [0]，总内存512GB (16x32GB DDR5 5600 MT/s [5600 MT/s])，BIOS 3B05.TEL4P1，微码0x21000161，2x以太网控制器X710用于10GBASE-T，2x以太网控制器E810-C for QSFP，1x 894.3G英特尔SSDSC2KG96，1x 3.5T三星MZQL23T8HCLS-00A07，3x 3.5T三星MZQL23T8HCLS-00B7C，Red Hat Enterprise Linux 8.9 (Ootpa)，4.18.0-513.18.1.el8_9.x86_64，WORKLOAD=Aible端到端RAG-LLM，模型=Mistral-7B-OpenOrca-GGUF，all-MiniLM-L6-v2，gcc 12.2.0，IntelLLVM 2024.0.2，llama.cpp，ChromaDB，Langchain，oneAPI基础容器2024.0.1-devel-ubuntu22.06。基于英特尔03/07/24的测试。

来源：业界供稿

英特尔

0赞

好文章，需要你的鼓励

英特尔至强处理器助力Aible加速生成式AI工作负载

来源：业界供稿

2024

07/01

10:49

分享

点赞

生命科学计算测试专委会正式成立，BioProfile框架引领行业标准建设

超智算完成北京核心智算中心资产收购，加速构筑“3+X”全国算力网络新格局

走出“参数崇拜”：联想用“一体多端”重塑“人的尺度”

从“单点突破”到“一体多端”：拆解天禧AI 3.5进化背后三年的进化哲学

openGauss Summit 2025在京召开，加速行业智能化变革，共建繁荣数据库生态

2025联想天禧AI生态伙伴大会：天禧AI一体多端，与开发者共建个人AI生态

西班牙病毒如何将谷歌带到马拉加

LangChain核心库曝出严重漏洞，AI智能体机密信息面临泄露风险

Mill如何与亚马逊和全食超市达成合作协议

TechCrunch创业大赛中的9家顶尖生物技术初创公司

2025年印度科技领域十大重要发展

中科大发布Live Avatar：AI数字人无限聊天不翻车

成本打到6万以下，手把手教你用4路锐炫显卡+至强W跑DeepSeek

天翼云CPU实例部署DeepSeek-R1模型最佳实践

MWC 2025：英特尔展示基于至强6处理器的基础网络设施

英特尔至强6新品发布，能为数据中心带来哪些改变？

英特尔推出具备高性能和能效的以太网解决方案

英特尔推出搭载至强6处理器的卓越AI和网络解决方案

HPE Gen12：英特尔至强6加持，数据中心和边缘计算的“新宠”

英特尔Gaudi 2D AI加速器为DeepSeek Janus Pro模型提供加速

英特尔：旗下的“主打”18A 产品将于2025 年下半年投产

英特尔至强6加持下的火山引擎，要降低大模型的应用门槛

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: