计算、算法与数据是新一轮人工智能浪潮兴起与持续发展的三大核心要素,其中计算作为承载和推动人工智能走向实际应用的基础平台和决定性力量,其发展直接关乎人工智能的普及速度与社会整体智能水平。8月27-28日,2019人工智能计算大会(AICC2019)将在北京举行,届时来自全球的人工智能专家、学者、产业领导公司高层,在会议期间将全方位探讨和分享最新的人工智能计算技术与未来发展趋势、AI计算最新基准测试,以及计算技术在诸多人工智能领域中的应用等重要议题。预计将有超过2000位来自互联网、金融、安防、能源、医疗、科研院所等行业领域研究人员、开发者、用户和工业界代表参会。
AICC2019主论坛演讲嘉宾阵容强大,来自中国工程院、英国皇家工程院、百度、中国新一代人工智能发展战略研究院、浪潮、Uber、Facebook等机构的人工智能产学研顶尖专家学者,将现场分享人工智能计算前沿及实践、新一代人工智能发展的关键问题、最热门的深度学习框架PyTorch和Horovod创新等主题演讲。这些高价值内容将让与会者了解到人工智能计算的最新动向、学习到最热门的深度学习框架,以解决在实际业务中遇到的人工智能计算难题。
在主论坛之外,AICC2019还设立了自动驾驶、AI计算与基准测试、产业AI创新、AI+视觉计算、AI+创投五大主题论坛,来自阿里巴巴、百度、寒武纪、英特尔、浪潮、商汤科技、顺丰、京东方、广汽、平安科技、招商银行、光源资本、红杉中国等知名公司的数十位公司创始人、高管以及技术专家等,将分享人工智能技术在不同行业的应用,以及创业前景等,全面展现计算将如何造就人工智能时代。
首次设立的自动驾驶与AI计算与基准测试两大主题论坛备受关注。随着5G时代的到来,自动驾驶逐渐展现出巨大的商业发展空间。目前,部分领先的电商已开始部署用于仓储物流的无人车,在特定封闭场所使用的自动驾驶车辆也有望短期内问世,合肥拟建的首条自动驾驶5G示范运行线和杭州筹建的“5G自动微公交”将率先实现自动驾驶技术在城市公共交通系统中的应用,这些实际应用也进一步提升了外界对自动驾驶的期望值。AICC2019自动驾驶主题论坛将邀请百度、广汽研究院、交通运输部规划研究院等机构的专家分享自动驾驶技术的最新动态。
如同5G之于全球通讯产业、HPL之于全球超算产业一样,AI计算基准测试也引发了业界的广泛探讨并将对整个人工智能产业带来深远影响。AICC2019 AI计算与基准测试主题论坛将分享多个AI计算基准测试的评估体系与测试方法,包括由多家国际顶尖公司和研究机构联合发布的MLPerf基准测试、中国公司发起的AI Matrix基准测试、由SPEC发起的Machine Learning基准测试等。
AICC2019大会期间还将重磅发布《2019-2020中国人工智能计算力发展评估报告》,公布中国AI计算力城市榜单与热力分布等重要研究成果,为AI投资、创业与就业提供科学指导。
《中国人工智能计算力发展评估报告》由IDC和浪潮联合研究发布,旨在评估中国人工智能发展的现状,探索中国企业的破局之道。在2018年报告公布的中国计算力领先城市排名中,杭州、北京、深圳、上海和合肥成为中国领先的人工智能计算力城市排名的前五名,今年这一排名是否会发生变化值得关注。
一年一次的千人AI技术训练营已经连续两年一票难求。今年AICC2019的千人AI技术训练营将首次引入当下最火的联邦学习技术,来自平安科技的技术专家将分享联邦学习技术国内外发展现状和整体介绍、联邦学习蜂巢平台介绍与应用场景,并将现场指导学员使用联邦学习蜂巢平台完成横向/纵向联邦机器学习任务。此外,来自百度的专家将讲解源于产业实践的深度学习框架飞桨平台(PaddlePaddle),涵盖图像检测技术实践、分割技术及迁移学习工具介绍及实践、视频识别技术介绍及应用、ERNIE模型介绍及应用实践以及高速推理引擎的实现与应用等丰富内容。融汇理论与实践的课程设置,将帮助学员从零入门快速掌握联邦学习与百度飞桨的使用技巧。
AICC大会由中国工程院信息与电子工程学部主办,浪潮集团承办,旨在围绕人工智能的产业需求研讨AI计算,促进AI技术创新、合作发展与人才培养。目前,AICC大会已成为AI计算领域最具分量的前沿技术交流平台,每年都会吸引数千名AI产业与技术领袖、顶级AI专家和AI开发者等参与。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。