英特尔与微软合作,在其数据中心平台、AI PC及边缘解决方案中支持多种Phi-3模型
近日,英特尔针对微软的多个Phi-3家族的开放模型,验证并优化了其跨客户端、边缘和数据中心的AI产品组合。Phi-3家族的小型开放模型可在低算力的硬件上运行,且更容易微调以满足特定的用户要求,使开发者能够轻松构建在本地运行的应用。支持该模型的产品组合包括面向数据中心应用的英特尔®至强®处理器、英特尔® Gaudi AI加速器,以及面向客户端的英特尔®酷睿™ Ultra处理器和英特尔锐炫™显卡。
英特尔®酷睿™ Ultra处理器支持Phi-3家族开放模型
“我们为客户和开发者提供强大的AI解决方案,这些解决方案采用了业界最新的AI模型与软件。英特尔与微软等AI软件生态系统领军企业的深入合作,是推动AI无处不在的关键。此次,我们非常高兴能与微软携手,使涵盖数据中心、边缘以及客户端的一系列英特尔硬件产品为多种新的Phi-3模型提供支持。”
——Pallavi Mahajan,英特尔公司副总裁兼数据中心与人工智能软件总经理
重要意义:为了推动AI无处不在,英特尔通过与AI领导者和创新者合作,持续深耕AI软件生态系统。
英特尔与微软合作,其产品组合在发布当天即为Phi-3模型提供支持,其中包含英特尔中央处理器 (CPU)、图形处理单元 (GPU) 和英特尔Gaudi加速器。此外,英特尔与微软在DeepSpeed中共同设计了一款易用的深度学习优化软件套件——加速器抽象层,并拓展了Hugging Face上Phi-3和其他模型的自动张量并行支持。
Phi-3模型的大小非常适用于设备端推理,并让在AI PC和边缘设备上进行微调或定制等轻量级模型开发成为可能。同时,英特尔客户端硬件通过全面的软件框架和工具实现加速,其中包括PyTorch和用于本地研发的英特尔® PyTorch扩展包,以及用于模型开发和推理的OpenVINO™工具包。
未来,英特尔将持续满足企业用户的生成式AI需求,并将继续支持和优化针对Phi-3及其他行业领先语言模型的软件。
访问英特尔开发者博客可了解相关性能与技术。
好文章,需要你的鼓励
三星与AI搜索引擎Perplexity合作,将其应用引入智能电视。2025年三星电视用户可立即使用,2024和2023年款设备将通过系统更新获得支持。用户可通过打字或语音提问,Perplexity还为用户提供12个月免费Pro订阅。尽管面临版权争议,这一合作仍引发关注。
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
苹果M5 MacBook Pro评测显示这是一次相对较小的升级。最大变化是M5芯片,CPU性能比M4提升约9%,多核性能比M4 MacBook Air快19%,GPU性能提升37%。功耗可能有所增加但电池续航保持24小时。评测者认为该产品不适合M4用户升级,但对使用older型号用户仍是强有力选择。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。