“我们正处于AI协同时代,从边缘计算平台到云平台乃至PC,人工智能的应用已无处不在。人工智能将以深远的方式改变全球的业务模式。”英特尔公司高级副总裁兼网络与边缘事业部总经理Sachin Katti在近日举行的第十七届英特尔网络与边缘计算行业大会上表示。
Sachin Katti说,要迈向AI助手时代,我们还需要解决一些挑战。当前,企业数据多在本地存储,而非公开透明的数据集。这意味着现有的大型语言模型并未针对这些本地数据进行过结构化的训练。
英特尔认为,要实现AI助手时代的目标,需要将本地数据融入现有工作流程,并为各企业提供定制化的解决方案。通过本地化的数据存储,企业可以更好地利用AI智能体,而无需将数据迁移至云端。
IDC数据显示,中国生成式AI投资2022到2027年五年的复合年增长率达到86.2%。Gartner预测,到2026年,80%的全球企业将使用生成式AI,50%的全球边缘部署将包含AI。
推动边缘计算与AI深度融合
AI的浪潮正以势不可挡的力量席卷全球,智能边缘与AI的融合为企业开辟了前所未有的机遇。如今,企业正积极拥抱变革,将AI技术融入边缘计算领域,以期释放更强大的生产力。
边缘计算的部署需要综合考虑时延、实用性、数据优化以及信息安全等因素。英特尔公司副总裁兼网络与边缘事业部中国区总经理陈伟博士表示,英特尔不断推出异构的芯片,包括至强、锐炫和酷睿系列,这些芯片在不同程度上能够支持不同规模的模型。“在过去一年中,我们观察到大约一半以上的客户都在探索基于边缘大模型的落地解决方案,并已有许多成功的实际案例。”
英特尔公司市场营销集团副总裁、英特尔中国网络与边缘及渠道数据中心事业部总经理郭威也表示,如果只是垂直大模型的标准应用,其主要部署在云端。但由于行业落地的需要,必然会促使AI算力向边缘和端侧分布。
此外,英特尔构建了包括AI加速软件、微调和训练工具、检索增强生成(RAG)流水线、部署工具等全栈开放式软件框架,其中也包含了软件合作伙伴和开源项目,简化了开发过程,实现了从设备到边缘再到数据中心的全面生成式AI部署。
英特尔中国区市场营销集团网络与边缘技术支持总监王景佳介绍说,为了降低AI部署的门槛,英特尔推出了2024版OpenVINO,该版本针对生成式AI进行了大规模的性能提升,并新增了多项功能,包括对更多新模型的支持、缓存优化、动态精度调整以及对混合专家模型的支持等。
“我们需要的技术应该是灵活、简便以及企业就绪的。英特尔确保能够把芯片和软件结合在一起。我们不会把部署的复杂度留给企业。”Sachin Katti说。
打造开放式生态系统
在不断推动技术创新和解决方案升级的同时,英特尔也在积极构建一个强大的生态系统。不断壮大的合作伙伴生态,已成为推动本土创新的重要力量。截至目前,英特尔网络与边缘事业部在中国已经与500多家OEM/ODM和150多家ISV建立了合作关系,使超过200万开发者受益。
谈及开放式生态系统,英特尔公司副总裁兼网络与边缘解决方案事业部总经理Dan Rodriguez表示:“创新是将AI和边缘相结合的关键一环。开放的生态系统能够改变市场格局。通过标准构建的开放平台,能够促进市场的发展,并为客户提供更多选择。开放系统鼓励所有人参与贡献,形成创新的良性循环。”
凭借长期构建的广泛生态系统、深厚技术底蕴,以及对各行业需求和趋势的敏锐洞察,英特尔携手众多中国本土合作伙伴,支持大语言模型(LLM)在不同行业的落地应用。
比如希沃利用AI技术提升教育生产力,特别是在备课和授课环节的应用,包括文档处理、视频剪辑工具以及智能课堂反馈系统;开域集团通过大模型实现视频内容分析,大幅提升了准确性和效率,并减少了误报率,从而降低了运营成本。
结语
面向未来的AI转型,英特尔正在引入端到端、可扩展的系统级战略,通过开放的生态系统全速助力企业推进AI创新。
随着AI和边缘技术在各行各业的广泛应用,英特尔将通过持续不断的软硬件平台和产品创新,积极推动边缘AI等新兴领域的拓展,为全球企业智能化转型铺就道路,共同迎接一个由AI驱动、智能优化的全新时代的到来。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。