近日,百度云与浪潮联合发布了最新版ABC一体机,为人脸识别闸机、智能安防、签到考勤、人脸登录等应用场景提供一体化交付的企业级AI设备。
此次双方联合发布的最新版ABC一体机,采用了百度自研的AI集群管理软件及浪潮AI计算服务器,内嵌百度成熟的算法模型和云管理技术,利用容器技术实现人脸识别服务的一键部署,并搭配相应的安全、监控和运维组件,实现软硬件的开箱即用。相比传统的软、硬件分别招标、单独交付的模式,百度云、浪潮推行的集成化交付模式能够极大提升AI项目交付投用的时间周期。
据悉,在去年举行的百度云智峰会上,百度云即已推出ABC一体机,并已经在钢铁、金融、电子制造等领域实现落地应用。
百度云最新的人脸识别AI模型及软件,通过1000片的超大规模GPU集群对海量数据进行了训练,使人脸1:1验证准确率达到99.77%,这一指标已经超越人类的识别精度。此次发布的最新一代ABC一体机,内置百度云这套已经适配好的软件环境及训练好的模型,免去客户搭建模型训练集群所需的技术积累和极高成本。
最新一代ABC一体机采用了浪潮最新AI计算服务器,单机支持4-16块NVIDIA Tesla P4 GPU卡,可实现88-352 TOPS INT8计算能力,极大提升人脸识别的效率。同时,根据客户实际业务应用所需的计算规模,ABC一体机可实现灵活的计算资源调配,一方面实现效率的最大化利用,另一方面极致地控制整个AI系统的TCO。
百度副总裁、百度云总经理尹世明表示:“ABC(AI人工智能、Big Data大数据、Cloud Computing云计算)技术与各行业结合,将是不可逆转的时代趋势,真正提升每一个企业的运营效率,创造更多商业潜能,创造全新机遇。百度云和领先的AI计算平台提供商——浪潮联合推出ABC一体机,也是百度ABC战略落地各行业的成功实践。”
浪潮集团AI与高性能产品总经理刘军表示:“浪潮已经建立了业界领先的最完整的AI计算阵列,浪潮还联合百度、NVIDIA等AI领导科技公司,共同建设人工智能生态链,通过ABC一体机这样的产品形式,将生态链联合创新产品推广到更多行业客户,推动产业的变革和升级。”
好文章,需要你的鼓励
这项研究提出了HoPE(混合位置编码),一种针对视觉语言模型的新型位置编码技术,专门解决长视频理解的挑战。传统位置编码技术在处理长视频时表现不佳,HoPE通过两个创新解决了这一问题:混合频率分配策略(为空间信息分配高频,时间维度使用零频率)和动态时间缩放机制(根据视频速度灵活调整时间编码)。实验证明,HoPE在长视频理解和检索任务上分别提升了8.35%和22.23%,为AI更准确理解长视频内容开辟了新途径。
东京大学研究团队推出MangaVQA基准和MangaLMM模型,专门用于评估和提升AI对日本漫画的理解能力。MangaVQA由526个高质量手动创建的问答对组成,用于评估AI系统对漫画内容的深入理解;MangaOCR则专注于漫画页内文本识别。基于这两个基准,研究团队从开源多模态模型Qwen2.5-VL微调出MangaLMM,能同时处理文本识别和内容理解任务。实验显示,即使是GPT-4o等顶尖商业模型在处理漫画的独特复杂性时也面临挑战,而专门训练的MangaLMM表现出色。
这项研究由ISTA和谷歌研究院联合开发的"影响力蒸馏"方法,通过利用二阶信息为训练样本分配最优权重,实现了大语言模型训练数据的高效选择。该方法在数学上有坚实理论支持,并创新性地引入"地标"近似技术,仅需计算少量样本的精确影响力,再高效传播到其他样本,大幅降低计算成本。实验证明,该方法在多种模型和任务上均优于或匹配现有技术,同时实现了高达3.5倍的速度提升,为大模型训练开辟了更高效的路径。
来自哈佛大学等顶尖学府的研究团队在这篇论文中挑战了传统观念,认为Token压缩不仅仅是提高AI模型运行效率的工具,更应成为生成式AI模型设计的核心原则。研究表明,精心设计的Token压缩策略可以促进多模态深度整合、减轻AI"幻觉"问题、增强处理长序列输入的能力,并提高训练稳定性。论文详细分析了现有方法的局限性,并提出了算法创新、强化学习指导和硬件协同设计等未来研究方向。