8月21日,英特尔联合世平集团在武汉成功举办了英特尔人工智能技术介绍与实作研讨会,杰和科技应邀出席。研讨会上,各路物联网行业大咖齐聚一堂,共同探讨人工智能技术的发展现状及未来趋势,嵌入式计算机硬件系统的最新成果和行业发展规划以及市场机遇和挑战等。本次会议的重点是AI相关技术实作,如OpenVINO、加速工具及训练开发工具包等。
全球物联网市场的飞速发展,在一定程度上得益于计算机视觉技术(尤其是AI人工智能技术)的广泛应用,AI应用涵盖了物联网领域的众多细分市场,包括零售、医疗、安防、交通等。这些应用都会用到计算机视觉技术和高分辨率摄像头,同时会生成大量需要汇总和分析的数据。为了更好地应对数据激增,英特尔宣布推出OpenVINO(Open Visual Inference & Neural network Optimization)工具包,旨在配合英特尔架构的处理器(CPU)及核显(Integrated GPU)和深度学习加速器(FPGA、Movidius VPU)的深度学习加速芯片,在增强视觉系统功能和性能的同时加速计算机视觉工作负载,简化深度学习推理和部署,帮助客户更好的平衡视觉方案的性能、功耗和成本效益。
OpenVINO工具包专注于加速深度学习并将视觉数据转换为业务洞察力,可以帮助企业在边缘侧快速实现高性能计算机视觉与深度学习的开发,为智能视觉开辟了一条新的路径。处理高质量视频时需要快速分析边缘侧的数据信息并作出及时响应,这正是OpenVINO工具包的应用优势。例如在智慧零售行业,开发者可以利用该工具包将计算机视觉功能直接部署到数字标牌、安全摄像头、POS机等应用中,加快后期视觉处理及数据分析的执行速度。针对智慧零售应用,杰和推出整合了AI视讯技术及计算处理技术的GDSM智慧商显管理系统,旨在于帮助用户优化营销策略。
在边缘侧使用英特尔计算机视觉解决方案可帮助零售商们快速识别客户身份和行为喜好,从而提供个性化的营销服务和高效响应的零售服务。杰和科技应用系统产品总监刘汉先生表示,“在计算机视觉和深度学习时代,英特尔 OpenVINO工具包有助于我们更好地把握发展机遇。在英特尔新技术的支持下,杰和GDSM智慧商显方案在顾客面部捕捉及信息计算分析处理方面实现了加速优化,同时整套方案也实现了从前端播放器到后台服务器的智慧化管理,最终提供给用户的是一套高性价比的视觉零售解决方案。”
同时会议现场的实作演示Demo,是由杰和DE67提供支持。杰和DE67是一款专为户外工控应用开发的无风扇PC,采用第7代的Intel KabyLake-U处理器,支持4K显示,具备的I/O接口,适用于户外广告机、信息亭等应用环境。
此次研讨会从技术研发和产品应用的角度,分享了英特尔公司计算机视觉和深度学习的创新成果,包括加速工具、视觉推理和神经网络优化工具包,计算机视觉深度学习产品路线图和具体的应用案例,这些有助于实现在边缘侧的深度学习推理,为更多垂直行业市场提供更高计算和图形性能的视觉解决方案
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。