IBM与VMware共同将IBM watsonx引入VMware Private AI 和 Red Hat OpenShift 的本地环境中,从而带来快速、透明的生成式AI功能
随着企业积极推动变革性创新, AI应用在2023年成为主流。尤其是生成式AI作为一种基于各种输入生成新内容的工具,大大激发了企业的想象力。生成式AI具有广泛的用例和任务范围,包括从代码生成到联络中心问题解决体验、IT 运营自动化、信息检索和内容创建。
所有AI用例的核心都是数据,而更重要的是通过访问和处理所需要的数据,从AI模型中获得最佳结果。企业需要将算力和AI模型带到创建、处理和消费企业数据的地方,以支持各种AI用例,包括传统的AI/ML 工作负载和生成式AI。企业还需要获得完整的技术堆栈满足传统企业级要求,例如使用保密计算以及能够在同一地点训练、调整和部署可以在各种云环境中运行的AI模型。
这便是“Private AI”的优势所在,这种架构旨在平衡AI带来的业务收益与企业的隐私和合规需求,侧重于为支持AI而构建的平台和基础架构,这些平台和基础架构可部署在公有云、虚拟私有云、数据中心和边缘站点中。
VMware Private AI 与 IBM 为生成式AI带来灵活性
IBM和VMware 可为企业客户带来灵活性,支持其在关键任务运营所在位置启用生成式 AI 用例。这就是为什么IBM和VMware将VMware Cloud Foundation、Red Hat OpenShift 和IBM watsonx AI和数据平台相结合。这一组合将支持企业能够在私有的本地基础架构即服务(IaaS)环境中访问 IBM watsonx,并通过 IBM Cloud 上的 watsonx SaaS 产品访问混合云。双方的共同客户将能够跨公有云、虚拟私有云、数据中心和边缘站点使用IBM watsonx的AI功能和数据管理,以及在不久的将来使用其治理功能,实现透明、可解释的AI模型。
VMware Private AI 可用于混合多云部署。通过使用Red Hat OpenShift,客户现在可以将 watsonx 引入VMware 部署的工作负载。双方的共同客户将能够访问 watsonx 平台的全部产品,该平台提供的产品可帮助客户加速部署、并扩展AI。客户可以选择使用 IBM Cloud Satellite 自动化和简化VMware Private AI with OpenShift 环境部署和第二日运营。
致力于提供多云价值的合作模式
此次合作源于IBM和VMware联合创新实验室。作为联合创新引擎,该实验室拥有一支专门的工程师团队。目标是发挥两家公司优势,通过向市场推出新产品来解决客户问题。该实验室于2018年成立,迄今已完成了众多以混合云和AI为核心的项目。
VMware和IBM计划开发一个经过验证的参考架构,支持双方客户利用混合云和受监管的本地环境训练和微调ML模型,包括用于生成式AI的大语言模型(LLM)。例如,将数据从一个国家的银行或金融机构转移到云上,可能会因监管限制而被禁止,或者由于数据太大,无法将其从一个地点转移到另一个地点。
IBM Consulting为客户提供 VMware 特定解决方案和生成式AI专业知识
今年早些时候,IBM Consulting 成立了生成式AI卓越中心,目前拥有 1000 多名具备生成式AI专业知识的顾问。他们正在与全球客户一起提升 IT 运营和核心业务流程(如人力资源或营销)生产力,改善客户体验,并创造新的业务模式。
结合IBM Consulting针对VMware 的丰富专业知识和服务能力,这将有助于在 VMware Private AI参考架构上使用企业级 AI 加速客户业务转型。
此外,对于希望实现工作负载现代化和转型的客户,IBM Consulting计划将 IBM watsonx 和 VMware Private AI 服务集成到其自主开发的IBM Consulting云加速器中,从而帮助加快云转型进程。在发布后,该集成将支持逆向工程、代码生成和代码转换,并帮助管理第二日及之后的运营,为用户带来IBM Consulting的无缝混合云管理服务。
助力客户打造生成式AI未来
IBM 与 VMware 的战略合作关系旨在帮助双方客户通过灵活的消费模式拥抱混合云,并实现任务关键型工作负载的现代化。在此过程中,IBM Consulting作为战略合作伙伴也将使客户受益匪浅。企业将能够选择何时、何地以及如何将生成式AI技术与 VMware Cloud Foundation 集成,在整个企业快速训练和部署自定义AI功能,同时保持对数据的控制。他们还获得了强有力的支持,在一个统一堆栈中充分利用 VMware 软件产品的最佳创新,打造一个与 IBM Cloud 合作伙伴技术带来的数据和 AI 功能相集成的一致环境。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。