视觉计算是AI领域热门研究方向,也是应用落地最多、发展速度最快的人工智能技术之一,目前已经在安防、互联网、金融、医疗、物流、制造业、交通等多个行业落地。当前视觉计算发展到了什么阶段?业界领先者又有哪些新成果分享?8月28日,AICC 2019人工智能计算大会(AICC2019)将在北京举行,其中的AI+视觉计算主题论坛邀请了视觉计算领域的多位大咖,探讨AI视觉计算的前沿技术与最新应用。
视觉计算已经渗透到日常生活的方方面面:机场刷脸通关、手机人脸识别开启金融账户、停车场车牌自动识别和收费……清华大学《人工智能发展报告2018》显示,中国人工智能市场中,以生物识别、图像识别、视频识别等技术为核心的计算机视觉市场规模最大,占比达到34.9%。同时,视觉计算也受到资本市场的青睐,高额估值体现出投资机构对该领域未来发展的信心。
视觉计算的火爆,很大程度上是因为其易于落地应用,并能迅速提升效率,推动生产力的发展。尽管AI视觉计算发展还处于起步期,但已展现出巨大的应用价值和广阔的发展前景。
在AICC2019的AI+视觉计算主题论坛上,多位视觉计算领域大咖将带来涵盖技术原理、产业实践、应用案例的专题演讲,全方位解析视觉计算。
商汤科技研发总监颜深根分享主题为“大规模异构并行——深度学习背后的驱动力量”,将深入讲解大规模异构并行技术如何助力深度学习,加速视觉计算应用落地。
浙江大华研发中心副总裁殷俊将带来《应用融合推动智能计算升级》,根据应用场景将多个AI应用有机融合起来,多应用叠加多任务协同,会有什么样的化学反应?这场分享将揭晓答案。
ASC大学生超算竞赛组委会委员朱红将分享《面向人脸识别超分辨率的竞赛》,展示全球300多支大学生队伍挑战超分辨率算法设计和技术实现过程中,诞生的设计思路和优秀算法。
顺丰AI神瞳项目组智能分拣产品总监杨为民将介绍顺丰如何利用视觉智能产品,实现测量快件体积,识别车辆装载率、装卸能效、是否违规作业等。
智慧眼首席技术官王栋将带来《从AI到互联网的双核升级》。
深睿医疗技术副总裁张志辉将分享《深睿在人工智能医疗的实践》。
京东方人工智能平台架构师李昭月将介绍AI在工业落地中存在的挑战和未来的机遇,并带来测量、检测、识别、分类的应用案例。
除了AI+视觉计算主题论坛, AICC2019大会还将举办AI计算与基准测试、产业AI创新、自动驾驶和AI+创投四场主题论坛。主论坛则云集了来自中国工程院、英国皇家工程院、百度、中国新一代人工智能发展战略研究院、浪潮、Uber、Facebook等机构的人工智能产学研顶尖专家学者,将带来人工智能计算前沿及实践、人工智能加速产业智能化升级、AI计算的新发展新机遇、热门深度学习框架PyTorch和Horovod创新等主题演讲。
大会将同期举行AI千人训练营,力邀NVIDIA、百度、平安科技、浪潮资深AI工程师讲解最新AI计算技术与应用,帮助学员从零入门AI。大会期间还将重磅发布《2019-2020中国人工智能计算力发展评估报告》,揭示中国人工智能发展的现状和中国企业的破局之道,并公布中国计算力领先城市排行榜。
AICC大会由中国工程院信息与电子工程学部主办,浪潮集团承办,旨在围绕人工智能的产业需求研讨AI计算,促进AI技术创新、合作发展与人才培养。目前,AICC大会已成为AI计算领域最具分量的前沿技术交流平台,每年都会吸引数千名AI产业与技术领袖、顶级AI专家和AI开发者等参与。
点击链接http://aicconf.net/?discountCode=2019了解大会更多详情,抢AICC2019大会免费门票。
好文章,需要你的鼓励
英伟达宣布推出Alpamayo-R1开源推理视觉语言模型,专为自动驾驶研究设计,这是首个专注于自动驾驶的视觉语言行动模型。该模型基于英伟达Cosmos Reason模型构建,能够处理文本和图像,让车辆"看见"周围环境并做出决策。英伟达还发布了Cosmos Cookbook开发指南,帮助开发者训练和使用模型。这些技术对实现L4级自动驾驶至关重要。
NVIDIA研究团队开发的OmniVinci是一个突破性的多模态AI模型,能够同时理解视觉、听觉和文本信息。该模型仅使用0.2万亿训练样本就超越了使用1.2万亿样本的现有模型,在多模态理解测试中领先19.05分。OmniVinci采用三项核心技术实现感官信息协同,并在机器人导航、医疗诊断、体育分析等多个实际应用场景中展现出专业级能力,代表着AI向真正智能化发展的重要进步。
波兰AI语音公司ElevenLabs由两位30岁创始人Staniszewski和Dabkowski创立,其AI语音技术能够生成极其逼真的人声。公司在四年内从零发展到估值66亿美元,两位创始人均成为亿万富翁。该公司年收入1.93亿美元,净利润1.16亿美元,服务客户包括思科、Epic Games等知名企业。尽管面临深度伪造等技术滥用风险,ElevenLabs仍在与谷歌、微软等科技巨头竞争AI语音市场主导地位。
Salesforce研究团队发布BLIP3o-NEXT,这是一个创新的图像生成模型,采用自回归+扩散的双重架构设计。该模型首次成功将强化学习应用于图像生成,在多物体组合和文字渲染方面表现优异。尽管只有30亿参数,但在GenEval测试中获得0.91高分,超越多个大型竞争对手。研究团队承诺完全开源所有技术细节。