近日,第五届UG2+挑战赛成绩新鲜出炉。天翼云研发三部AI算法团队获得第五名,这是天翼云团队首次在国际AI顶会比赛中崭露锋芒,也意味着天翼云的AI技术实力正在向着世界迈进。
UG2+挑战赛由 CVPR主办,IEEE国际计算机视觉与模式识别会议(CVPR) 是全球计算机视觉三大顶会之一。本届UG2+大赛围绕雾霾条件目标检测、黑暗场景视频行为识别、大气湍流失真图像模糊缓解三大方向,面向全世界进行赛队招募,共吸引了海内外上百支优秀队伍参赛,包括NVIDIA、新加坡南洋理工大学、好未来AI Lab等人工智能企业、高等院校及科研机构。
此次天翼云研发三部AI算法团队首次参赛,在未知的黑暗视频测试集上的top1分类准确率达到87.43%,位列第五。
该赛道中,主办方提供了来自HMDB51、UCF101、Kinetics-600和 Moments in Time数据集的精选子集,其中包括11个类别标签(喝酒、跳跃、捡、倒、推、跑、坐、站、转、走和挥手)共 2625 个清晰视频,以及另一组包括11个相同类别但无标签的黑暗场景的视频共3088 个。参赛队伍需使用人工智能技术将黑暗场景的目标视频分类到11个类别中,评价指标是测试集上的Top1分类准确率。竞赛难度巨大。
为了提升黑暗场景下的行为识别模型的鲁棒性,天翼云研发三部AI算法团队使用图像增强方法对黑暗视频进行预处理,让图像从曝光强度的线性响应变得更接近人眼感受的响应,提升暗部细节。在对比现有先进视频分类算法(R3D、X3D、Timesformer、Slowfast、UniFormer、i3D等)后,天翼云研发三部AI算法团队决定利用CycleGAN做风格迁移,生成黑暗视频来进行数据增强,同时使用半监督算法,利用清晰视频和黑暗视频,使用自适应损失和标记数据的交叉熵分类损失进行模型优化。经过两个月的算法与模型优化,天翼云研发三部AI算法团队将黑暗场景下图像识别率提升了4倍,最终在未知的黑暗视频测试集上的top1分类准确率达到87.43%,夺得了第五名。
据介绍,该视频分析技术有较高的应用价值,可应用在夜间安全监控场景中,适用于大雨、大雾、雾霾等恶劣天气下的图像处理与视频分析。
通常夜间安全摄像头在光线不足的条件下发挥作用,需要捕捉分析即使是肉眼也很难识别捕捉到的动作。虽然可以使用红外成像传感器等其他设备,但成本较高,不利于大规模部署。因此,探索对黑暗具有鲁棒性的视频分析技术,从黑暗视频中提取有效的动作特征,对做好安全监控工作意义重大。
一直以来,天翼云深耕视频智能分析和图像处理相关技术,自研算法通过诸葛AI平台产品赋能千行百业,小到行程码识别,大到智慧城市。目前,天翼云大数据与AI研发团队在起草制定人工智能相关行业标准的同时,已完成百余项核心算法的自主研发。接下来,天翼云将坚持科技创新,发挥云上数智的优势,努力打造央企原始创新策源地。
好文章,需要你的鼓励
AMD宣布已超越其雄心勃勃的30x25能效目标,在AI和高性能计算系统中加速推进绿色倡议。该公司原计划在2020年至2025年期间将能效提升30倍,最终实现了38倍的显著改进,并提前完成目标。面对AI工作负载日益增长的需求,AMD的这一成就不仅展现了公司的技术实力,更体现了其在加速计算领域推动可持续解决方案的坚定承诺,为整个半导体行业树立了新的能效标准。
斯坦福大学等机构研究发现,即使是最先进的AI推理模型在数学不等式证明中也存在严重缺陷。虽然这些模型能在65%的情况下给出正确答案,但推理过程的整体正确率仅为10%。研究通过新开发的IneqMath数据集和AI评判系统,揭示了当前AI在严密逻辑推理方面的根本性挑战,为AI数学推理能力的评估和改进提供了重要参考。
甲骨文联合创始人兼首席技术官拉里·埃里森重新夺回福布斯实时富豪榜第二位,超越扎克伯格和贝佐斯,仅次于马斯克。受益于甲骨文第四财季业绩超预期,公司股价暴涨14%,埃里森净资产单日激增约250亿美元至2420亿美元。他在财报电话会议中表示,云服务需求"天文数字般"且"永不满足"。尽管甲骨文在云市场份额仅约3%,但这位80岁的科技巨头显然无退休计划。
首尔大学研究团队开发出名为ECoRAG的智能文档压缩框架,解决了AI系统在处理长文档时效率低下和准确性不足的问题。该技术通过"证据性"概念区分有用信息与干扰内容,并具备自我反思能力来决定所需信息量。实验显示,新方法在保持更高准确率的同时,显著减少了处理时间和计算成本,为搜索引擎、在线教育、医疗诊断等领域带来广阔应用前景。