过去三年,AI正以前所未有的速度席卷产业,算力正在从集中化向普惠化转型,成为支撑数字化转型和智能应用落地的关键基础设施。
在2025火山引擎春季原动力大会上,英特尔中国互联网行业总监李志辉谈到,AI技术的快速演进,正在倒逼整个IT和互联网产业体系重构,算力生态也不再是单点技术的竞争,而是软硬件、云服务、应用和服务的协同作战。
英特尔与火山引擎携手,全栈式地展示了双方在最新计算实例解决方案及应用落地方面的最新成果。围绕“芯云协同”这一核心理念,共同推动AI时代云计算技术、生态与产品的协同创新,为千行百业提供高性能、低门槛、易部署的普惠算力解决方案。
某种意义上,算力普惠的价值正体现在“让AI开发和应用像水电一样可获取”。英特尔始终相信,真正的技术创新需要让更多的企业和个人受益,通过芯云协同来打破边界,让算力触手可及,构建软硬一体的智能生态,让技术红利能够无缝渗透到千行百业。
“英特尔与火山的深度合作已经为芯云协同写下了生动的注脚。“李志辉说道。会上,英特尔联合火山引擎共同发布搭载英特尔® 至强® 6性能核处理器的第四代通用计算型(ECS)实例家族,即全新推出的通用计算基础型实例 g4i、算力增强型实例 g4ie。
火山引擎云基础产品负责人罗浩表示,过去几代产品的迭代过程中,火山引擎与英特尔始终保持紧密合作,双方实现了快速、高效的联动与协同。未来,希望借助Agentic AI的新一轮浪潮,双方能进一步深化合作,共同推动更多创新应用和全新范式的诞生,携手开拓行业发展新机遇,促进产业蓬勃繁荣。
该实例在通用算力性能提升30%的基础上,并针对AI场景进行了特定优化,比如预装知识问答镜像、向量化模型、推荐模型、多模态识别、向量化数据库等核心组件,开箱即用,显著提升了AI应用开发体验。
更重要的是,围绕2025年“智能体应用元年”,英特尔、火山引擎与华胜天成共同推出了HiAgent一体机解决方案。基于英特尔锐炫显卡算力平台,主打高性价比、易扩展、支持私有化部署,在边缘和企业AI等应用场景中,该方案能够以出色的成本效益优势,提供高效、可靠的AI算力。
同时结合华胜天成的全栈服务能力,瞄准企业AI落地的核心痛点,帮助企业从小规模试点平滑扩展至大规模应用,真正让AI生产力落地成为可能。
此外,英特尔提供了包括vLLM、PyTorch在内的完善的主流生态软件栈和封装成服务化的企业AI平台(EAP),帮助用户将上层应用平滑迁移到英特尔平台上,加速用户私有化部署LLM应用和智能体。
算力普惠的本质,是生态的协同进化。李志辉在会上强调,芯云协同已迈向新阶段,从简单的技术融合走向生态共建。英特尔呼吁行业共同建立覆盖芯片、云服务、应用层的开放标准,降低协作门槛,提升创新效率。
“算力普惠并非某一个技术的独舞,而是一次生态共融的旅程。”
当前,智能算力正在成为企业穿越周期、激发业务增量的重要底座。英特尔也希望通过持续的技术创新与生态共建,助力AI应用在更多场景落地,让算力触手可及,成为推动产业智能化的普惠引擎。
“希望每一瓦特算力都能点亮一个创新梦想,每一次芯云共振都能成为推动世界进步的力量。”李志辉说。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。