ChatGPT的横空出世,证明了大语言模型是一条走得通、通往未来AI的道路,也意味着AI的发展经过几十年的算法、算力、数据方面的量变积累,“质变时刻”已经到来。
在当下,拥抱大模型就是拥抱AI似乎成了共识。于是,我们看到各路企业纷纷推出相关的产品,抢占赛道。这是从供给侧看,反过来从需求侧看,“让AI成为核心生产力”成为了行业客户的迫切需求。
IBM大中华区董事长、总经理陈旭东表示,IBM商业价值研究院近期对全球三千多位CEO所做的调研显示,大多数CEO相信,拥有先进的生成式AI能够提升企业的竞争力。然而技术挑战、人才挑战和文化挑战阻碍了他们的进程。尤其是数据的准备、应用和治理,以及优秀的管理智慧。企业需要的是根据其独特业务需求和自身数据而量身定制的生成式AI和模型。
为了响应客户的需求,IBM将多年以来在企业级AI领域积累的技术和经验,结合最近五年在基础模型研究方面取得的进展,推出了watsonx这个新一代数据与AI平台。
关注基础模型,大模型不应该只是“大”
众所周知,IBM是全球AI前沿技术和应用的重要参与者,1956/1962跳棋人机大战、1996-1997国际象棋人机大战、2011人机知识大赛《危险边缘》、2019人工智能辩手(Project Debater)等都是人工智能发展的里程碑式事件。
IBM大中华区首席技术官、研发中心总经理谢东表示,在落地人工智能过程中,企业一定是将人工智能能力与自己的数据和业务场景相结合,才能实现价值。
不过现在企业面临的问题是到底使用哪个模型、数据问题怎么解决?其实,基础模型(Foundation Model)是破解生成式人工智能落地的关键。基础模型在大量未标记的数据上进行训练,可以适应新的场景和用例。
现在的大语言模型规模巨大,虽然它的知识和能力非常强,但是成本也是巨大的。对于企业来讲,目标是模型需要解决特定问题,而不是模型的规模。
“基础模型对企业来说很重要,这个模型不光是通用的大语言模型,还有针对特定业务领域训练的模型以及一些行业模型等。”谢东说,“当企业应用生成式AI的时候不只是用大模型,IBM强调企业要关注基础模型,基于自己的数据和业务需求和场景对基础模型进行调整、调优。”
例如IBM与开源AI平台Hugging Face共同宣布,基于美国宇航局(NASA)卫星数据构建的IBM watsonx.ai地理空间基础模型现已在Hugging Face发布,将成为Hugging Face上至今最大的地理空间基础模型,也是首个与NASA合作构建的开源AI基础模型。
面对大模型,IBM把最合适的模型帮助企业筛选出来,提供给用户来使用,还可以帮助客户训练自己的大模型。
与消费级AI不同,企业级AI需要确保AI的可信性、适应性、可扩展。在开始阶段企业把现有的业务赋予了AI的能力,并将AI的能力横向扩充,以及在不同的AI模型之间能够进行自动化串联,使得企业的运作越来越智能化、自动化。
“在人工智能领域,IBM帮助现在的企业建立起人工智能的基础能力,围绕新一代生成式人工智能构建企业级应用,增强生产力,从以前数据为先的‘+AI’时代迈入AI为先的‘AI+’时代。”谢东说。
聚焦企业级AI,watsonx开辟新航道
IBM拥有业界最全面的基于传统的机器学习和新的基础模型的企业级AI产品组合。IBM 正在构建一组针对多种类型的业务数据进行训练的特定领域的基础模型,包括代码、时间序列数据、表格数据、地理空间数据、半结构化数据和混合模态数据(如文本与图像的组合)。这些基础模型将大大增强从代码创建到药物发现再到网络安全的各种应用,并将极大地影响人们与技术的交互方式,不仅将改变我们完成业务的方式,而且将改变客户对其业务的看法。
企业要求AI能够产生准确且值得信赖的结果,可以跨云扩展,并且可以轻松地适用于相关的企业领域和用例,watsonx正是为了满足这些需求。
watsonx是IBM在生成式AI领域发布的一个平台级产品。目前IBM已经在全球启动了watsonx三个产品集watsonx.ai、watsonx.data、watsonx.governance的陆续上市。
其中,IBM watsonx.ai为AI构建者提供利用开放直观的用户界面来训练、测试、调整和部署由基础模型提供支持的传统机器学习和新的生成式AI功能;watsonx.data是一个基于开放式湖仓一体(lakehouse)架构而构建的适于该架构的数据存储,针对受管控的数据和AI工作负载进行了优化,支持以查询、治理和开放数据格式来访问和共享数据;watsonx.governance是一个AI治理工具包,用于支持可信的AI工作流。
现在的大语言模型市场,划分维度很多,比如按照场景分为to B和to C;按照领域分为通用与垂类等。但是IBM却聚焦企业级AI。
IBM大中华区客户成功管理部总经理朱辉解释说,企业级客户拥有行业知识和自有数据,对于AI模型的过程调优、测试和可解释性有很高的要求。IBM拥有多年服务行业的积累,以及对于生成式AI的研发成果和基础模型的成果,可以满足客户对于企业级AI的要求。
“IBM Watson”是IBM企业级AI的代名称,而watsonx平台一方面源于IBM研究院的创新技术,还有IBM首屈一指的硬件软件技术和咨询专长,另一方面它基于最领先的企业级开放技术(OpenShift)以及与强大的开放生态社区(Hugging Face)的合作,而watsonx中的“X”代表未知的无限可能,“X因子”则是催生奇迹的关键。
“watsonx对IBM来说是企业级的AI服务,IBM混合云和人工智能一直在演进中,watsonx整合平台实现不同业务应用的发展。到2025年,所有Watson产品将融入基础模型和生成式AI的能力。”缪可延说。
携手共创,IBM watsonx加速落地
借助watsonx这一开放式企业级AI技术平台,IBM汇聚本地市场的科技公司、行业客户和合作伙伴,构建符合本地市场与行业特色的强大生态。通过携手共创,加速推进开放、可信、具有行业和业务针对性的企业级AI的采用,把IBM领先的企业级AI与基础模型的能力提供给更多客户,赋能千行百业,使他们成为拥有AI领先优势的价值创造者,让AI成为企业的核心生产力。
与IBM混合云平台一样,watsonx也是基于领先的企业级开放技术,也是以平台的方法,通过构建和扩展广泛而强大的生态,把IBM从存力、算力、企业级AI应用到咨询服务的全栈能力,以及源自IBM研究院的前沿AI创新技术(如基础模型与生成式AI),交到企业手中,无论企业的规模大小。
在AI基础设施方面,IBM在算力和存储方面提供了丰富的产品来支持企业的AI部署,例如LinuxONE、IBM Storage Scale等。
爱尔眼科医院集团采用LinuxONE支撑了供应链核心业务系统,由于LinuxONE的CPU芯片上集成了AI加速器,所以双方还在探索人工智能在医疗行业的应用。
百度智能云在阳泉数据中心就采用了IBM磁带存储来优化冷数据的存储,获得了非常好的安全性、成本收益。
IBM大中华区科技事业部总经理、中国区总经理缪可延表示,强大的技术是一回事,真正的落地让技术产生价值更加重要。
苏州环球科技股份有限公司利用AI赋能的一系列技术和产品(Cloud Pak for Integration),实现了应用集成的平台。同时,IBM又帮它实现了业务流程的自动化管理(Cloud Pak for Business Automation)。
上海洲邦信息科技有限公司通过低代码、无代码的方式整合IBM Cloud Pak for Intergration解决方案服务制造业客户,并融入IBM Cognos Analytics with Watson的AI助手功能,提高决策的效率。
除了技术产品,IBM在咨询服务支持方面也是同步更新。IBM Consulting大中华区总裁陈科典表示,IBM Consulting大量参与研发watsonx,IBM Consulting的watsonx实践所提供的生成式AI技术堆栈方面的专业知识以及领域和行业经验,可以助力客户加速业务转型。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。