新增生成式AI评论解说功能,以及首个针对网球比赛的数据分析应用IBM AI Draw Analysis,为温网球员进阶决赛的潜力提供深入洞察
(2023 年 6 月 21 日,北京) IBM(纽约证券交易所代码:IBM)和全英草地网球俱乐部今天公布了两项将在7月3日至16日举行的2023年温布尔登网球锦标赛(Wimbledon Championships,或简称“温网”)上推出的全新球迷数字体验新功能:
这两项新功能扩展了温网应用和 wimbledon.com 上的针对球迷的数字工具套件,是IBM和温网利用技术帮助球迷更深入地参与温网锦标赛的最新例子。
IBM AI评论解说
新的AI评论解说功能将为观看比赛集锦视频的球迷提供关键时刻的音频评论解说及字幕,球迷可以打开或关闭字幕功能。该工具旨在为球迷提供更有见地的体验,让他们在温网应用和 wimbledon.com 上通过精彩视频来抓住比赛的关键时刻。今年引入这项新功能,是为了把温网比赛现场的精彩带到赛场之外而迈出的一步,温网比赛现场由人来解说,而场外评论解说的工作则交给了生成式AI。
为了开发此项新功能,IBM Consulting的体验设计合作伙伴 IBM iX 的专家与全英俱乐部合作,利用 IBM 企业级 AI 和数据平台 watsonx 的基础模型,用网球的独特语言训练 AI。基于这些基础模型的生成AI被用来生成具有不同句子结构和特定词汇的旁白和解说,使剪辑的视频内容更具知识性,也更加引人入胜。
IBM AI Draw Analysis
IBM今年将引入温网球迷数字工具的另一个新功能是IBM AI Draw Analysis,这是网球领域的首个此类统计数据,它使用AI来确定单打抽签中每个球员进入决赛的可能性。每个球员的进阶优势将通过评级的方式来呈现,基于包括球员与潜在未来对手的比赛以及球员在单打抽签中的位置与竞争对手的比较等因素。这一新的见解将帮助球迷发现单打抽签中的异常和潜在的惊喜,而这个仅通过查看球员的排名是无法察觉的,以此来激发球迷社区的更多讨论和参与。
全英俱乐部营销及商业总监Usama Al-Qassab表示:“我们与来自IBM的合作伙伴们一起不断创新,为温网球迷提供富有洞察力和吸引力的大赛数字体验,无论他们身处世界上的任何地方。今年,我们将在温网的数字平台推出的新功能,使用了IBM最新的基础模型和生成式AI技术,帮助球迷更加深入地了解参赛球员的单打抽签情况,同时还可以观看配有精彩的生成式AI评论解说的比赛集锦视频。“
IBM市场和传播高级副总裁Jonathan Adashek表示:“IBM利用由watsonx的基础模型和生成AI赋能的创新性工具,为2023年温网锦标赛的球迷带来新的洞察力和参与度。我们亲眼目睹了这些技术帮助温网等重大体育赛事通过出色的数字体验吸引了越来越多的观众。IBM为温网打造独特球迷体验的AI和数据平台技术,也正是我们用来推动各行各业的客户加速业务转型的技术。”
今年推出的两项新功能将添加到温网应用和 wimbledon.com 上为球迷提供的人工智能数字工具套件中。该套件里还包括 IBM Power Index 排行榜、IBM Match Insights 以及个性化推荐和精彩画面集锦等应用,这些数字功能使用来自温网比赛每次击球而得出的多达 100,000 多个数据点,由 IBM Cloud 上的 IBM Watson AI 技术进行分析,旨在让球迷更容易了解要关注哪些球员、这些球员与对手的比较,以及谁可能获胜等信息。球迷们在整个温网比赛期间都可以利用这些数字工具,持续关注他们喜爱的球员,不断更新和获取量身定制新见解。
今年的温网锦标赛将于 2023 年 7 月 3 日至 7 月 16 日举行。要查看温网球迷数字工具背后黑科技的实际应用,请访问 wimbledon.com 或在移动设备上下载温网应用程序,该应用程序可在App Store和Google Play商店中获取。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。