从我们的智能手机到监控摄像头,人工智能在将模糊、颗粒状的照片转化为高分辨率照片方面做得越来越好。
这些改进背后的秘密是一对被称为人工智能超分辨率和人工智能升级的技术,在这两种技术中,人工智能模型在巨大的数据集上进行训练,可以提升模糊图像的质量或增加其分辨率。
IEEE会员Yale Fox表示:“由于几项关键技术的进步,人工智能的升级在这些年里有了显著的提高。其中一个进步是迁移学习,它允许开发人员将预先训练好的模型用于新任务,大大提高了升级的速度和准确性。另一个关键发展是大型图像数据集的可用性,这对于训练深度学习算法识别和生成高质量图像至关重要。”
Fox表示,图形处理单元(GPU)的进步也改善了这项技术。
“GPU和深度学习的结合对于使人工智能更快、更高效地升级也至关重要。GPU可以同时处理大量数据,从而实现更快的训练和推理。”
许多智能手机使用人工智能升级来提高照片的质量和分辨率。但这项技术也在其他领域有应用,包括医疗、卫星和娱乐行业。
卫星成像:近年来,发射到轨道上的卫星数量激增。发射更小、更轻的卫星变得更容易、更便宜。但较小的卫星可能无法像较大的卫星那样携带昂贵的高分辨率相机。正如IEEE Xplore®的这篇文章(https://ieeexplore.ieee.org/document/9757881)所示,人工智能超分辨率使较小的卫星能够用较小的相机捕捉更好的图像。
天气预报:一些气象卫星监视着地球的大部分地区。他们拍摄的照片可能只显示了几平方英里大小的细节。IEEE Access的一篇文章(https://ieeexplore.ieee.org/document/9001044)描述了一种教低分辨率气象卫星如何拍摄更好照片的系统。它通过使用旧的天气和气候数据来做到这一点,这有助于提高这些大面积气象卫星的图片质量。
视频会议:通过笔记本电脑甚至手机传输的实时视频使用了大量的互联网带宽。几十年来,这些服务一直依靠音频和视频编解码器来压缩和解压缩数据流(https://spectrum.ieee.org/ai-video-codecs-waveone)。这些编解码器中的许多都有几十年的历史,是在互联网速度慢得多的时候开发的。
Fox说:“最先进的算法现在只需要一个人的一张高分辨率照片,然后相机跟踪他们的面部肌肉是如何运动的,以创建一种深度伪造的图像。这意味着带宽和文件大小减少了近800倍,这对视频通话等应用程序至关重要。这是一个巨大的增长,它确实稍微进行了改变。”
视频游戏和流媒体视频:与在线视频会议一样,图像放大在视频游戏中产生了巨大影响。IEEE Spectrum(https://spectrum.ieee.org/ai-graphics-neural-rendering)的一份报告显示,对于一些图形密集的视频游戏,每八个像素中就有七个是由人工智能生成的,因此速度快了530%。对于如何将超分辨率技术应用于点播视频流,也有重要的研究(https://ieeexplore.ieee.org/document/10019712)。
医学成像:超分辨率技术在医学领域有着广泛的应用。许多医学图像,如X射线和MRI扫描,由于各种因素,包括扫描时间长度和设备的限制,分辨率较低。例如,提高肿瘤周围微小血管的分辨率可以帮助癌症的识别和治疗(https://ieeexplore.ieee.org/document/8854062)。超分辨率还可以改善胎儿的成像,因为胎儿往往会四处移动,使成像变得困难。
那么,是什么让这些技术变得更好呢?
IEEE高级会员Fabrizzio Soares说,更好的训练数据。
Soares说:“值得一提的是,这些算法依赖于图像中先前的知识,因此提供的样本越多,模型就越准确。但建立最完整的图像数据库是一个难题。此外,提供的样本越多,模型就越大。因此,训练和维护模型需要付出更大的努力。”
好文章,需要你的鼓励
Helios Towers供应链总监Dawn McCarroll在采访中分享了公司的数字化转型经验。作为一家在非洲和中东地区运营近15000个移动通信塔站的公司,Helios正通过SAP S/4Hana系统升级、AI技术应用和精益六西格玛方法论来优化供应链管理。McCarroll特别强调了公司Impact 2030战略中的数字包容性目标,计划在未来五年内培训60%的合作伙伴员工掌握精益六西格玛原则,并利用大数据和AI技术实现端到端的供应链集成。
德国弗劳恩霍夫研究院提出ViTNT-FIQA人脸质量评估新方法,无需训练即可评估图像质量。该方法基于Vision Transformer层间特征稳定性原理,通过测量图像块在相邻层级间的变化幅度判断质量。在八个国际数据集上的实验显示其性能可媲美现有最先进方法,且计算效率更高,为人脸识别系统提供了即插即用的质量控制解决方案,有望广泛应用于安防监控和身份认证等领域。
威胁行为者在npm注册表上传8个恶意包,伪装成n8n工作流自动化平台的集成组件来窃取开发者OAuth凭据。其中一个名为"n8n-nodes-hfgjf-irtuinvcm-lasdqewriit"的包模仿Google Ads集成,诱导用户在看似合法的表单中关联广告账户,然后将凭据传输到攻击者控制的服务器。这种攻击利用了工作流自动化平台作为集中凭据库的特点,能够获取多个服务的OAuth令牌和API密钥。
布朗大学联合图宾根大学的研究团队通过系统实验发现,AI医疗助手的角色设定会产生显著的情境依赖效应:医疗专业角色在急诊场景下表现卓越,准确率提升20%,但在普通医疗咨询中反而表现更差。研究揭示了AI角色扮演的"双刃剑"特性,强调需要根据具体应用场景精心设计AI身份,而非简单假设"更专业等于更安全",为AI医疗系统的安全部署提供了重要指导。