英特尔丰富的AI产品——面向数据中心的至强处理器,边缘处理器及AI PC等产品为开发者提供最新的优化,助力其运行Meta新一代大语言模型Meta Llama 3。
Meta今日推出其下一代大语言模型(LLM)——Meta Llama 3。在发布的第一时间,英特尔即优化并验证了80亿和700亿参数的Llama 3模型能够在英特尔® 至强® 处理器、英特尔® Gaudi加速器、英特尔® 酷睿™ Ultra处理器和英特尔锐炫™ 显卡的AI产品组合上运行。
英特尔副总裁兼人工智能软件工程总经理李炜表示:“英特尔一直积极与AI软件生态系统的领先企业展开合作,致力于提供兼具性能与易用性的解决方案。Meta Llama 3是AI大语言模型重要迭代的新一浪潮。作为AI软硬件产品技术创新的引领者,英特尔很开心能够与Meta合作,充分挖掘诸如Llama 3等模型的潜力,助力生态伙伴开发领先的AI应用。”
重要意义:秉承推动AI无处不在的愿景,英特尔持续深耕软件和AI生态,以确保其产品能够满足AI领域持续变化的创新需求。在数据中心,集成英特尔®高级矩阵扩展加速引擎(Intel® AMX)的英特尔至强处理器和英特尔Gaudi能够为满足客户不断变化、多元化的需求提供更多选择。
英特尔酷睿Ultra处理器和英特尔锐炫显卡不仅为开发者提供了本地开发工具,也为在数百万台设备上进行部署提供全面的软件框架和工具支持。其中,包括PyTorch和用于本地研发的英特尔® PyTorch扩展包,以及用于模型开发和推理的OpenVINO™工具包等。
在英特尔产品上运行Llama 3:英特尔初步测试和评估80亿和700亿参数的Llama 3模型在自身产品上的性能时,使用了包括PyTorch、DeepSpeed、英特尔Optimum Habana库和英特尔PyTorch扩展包在内的开源软件,并提供最新的软件优化。有关更多性能细节,请访问英特尔开发者博客。
未来,Meta将增加新的能力、更多模型尺寸以及增强的性能。英特尔也将持续提升自身AI产品性能,以支持这一全新的大语言模型。
注释:
完整的性能声明和配置可在网址查看:https://www.intel.com/content/www/us/en/developer/articles/technical/accelerate-meta-llama3-with-intel-ai-solutions.html
仅在特定的H系列英特尔® 酷睿™ Ultra处理器驱动的系统上提供集成的英特尔锐炫™ 显卡。
好文章,需要你的鼓励
谷歌正式发布JAX-Privacy 1.0,这是基于高性能计算库JAX构建的差分隐私机器学习工具包。该库集成了最新研究成果,采用模块化设计,使研究人员和开发者能够更轻松地构建差分隐私训练管道。JAX-Privacy提供梯度裁剪、噪声生成、批量选择等核心组件,支持大规模分布式训练,已成功应用于VaultGemma等先进模型的训练中。
清华团队开发DKT模型,利用视频扩散AI技术成功解决透明物体深度估计难题。该研究创建了首个透明物体视频数据集TransPhy3D,通过改造预训练视频生成模型,实现了准确的透明物体深度和法向量估计。在机器人抓取实验中,DKT将成功率提升至73%,为智能系统处理复杂视觉场景开辟新路径。
谷歌量子AI团队发布新理论成果,展示大规模量子计算机可解决传统计算机无法处理的优化问题。研究团队开发出解码量子干涉算法,利用量子力学波动性质创建干涉模式,找到经典计算机难以发现的近似最优解。该算法将优化问题转换为解码问题,配合先进解码算法实现量子加速。研究成果为量子计算应用提供新工具包。
字节跳动研究团队提出了专家-路由器耦合损失方法,解决混合专家模型中路由器无法准确理解专家能力的问题。该方法通过让每个专家对其代表性任务产生最强响应,同时确保代表性任务在对应专家处获得最佳处理,建立了专家与路由器的紧密联系。实验表明该方法显著提升了从30亿到150亿参数模型的性能,训练开销仅增加0.2%-0.8%,为混合专家模型优化提供了高效实用的解决方案。