利用更丰富的NASA地球科学数据生成地理空间洞察,加速气候相关发现
北京2023年8月8日 /美通社/ -- 近日,IBM (NYSE: IBM) 与开源AI平台 Hugging Face 共同宣布,基于美国宇航局(NASA)卫星数据构建的IBM watsonx.ai地理空间基础模型现已在Hugging Face 发布。它将成为Hugging Face上至今最大的地理空间基础模型,也是首个与NASA合作构建的开源AI基础模型。
获取最新数据仍然是气候科学研究面临的主要挑战,因为环境条件几乎每天都在变化。尽管数据量不断增加(NASA预估到2024年,其新任务将产生25万 TB的数据),但科学家和研究人员们在分析这些大型数据集时仍面临障碍。作为与NASA签署的空间行动协议(Space Act Agreement)的一部分,IBM今年早些时候构建了一个用于处理地理空间数据的AI基础模型。现在,双方联手业内公认的开源领导者和Transformer模型库Hugging Face,共同发布上述地理空间基础模型,以扩大气候和地球科学研究中对AI技术的访问和应用,从而加速创新。
IBM研究院人工智能副总裁Sriram Raghavan表示:“在加速气候变化等关键领域的研究发现上,开源技术的角色越来越重要。IBM的基础模型旨在创建灵活、可复用的AI系统,通过将其与NASA的地球卫星数据库相结合,并发布在领先的开源AI平台Hugging Face上,我们可以利用协作的力量,实施更快速、更有影响力的解决方案,改善地球环境。”
Hugging Face产品和增长业务负责人Jeff Boudier表示:“AI仍然是一个以科学为驱动的领域,而科学进展必须通过信息共享和合作取得。这就是为什么开源AI、开放数据集和模型对于AI的持续发展如此重要,从而让更多人受益于技术。”
NASA首席科学数据官Kevin Murphy表示:“我们相信基础模型有潜力改变观测数据分析的方式,帮助我们更好地了解我们的星球。我们希望通过开源这些模型扩大其影响力。”
该基础模型由IBM和NASA共同训练,使用了过去一年在美国大陆范围内的Harmonized Landsat Sentinel-2(HLS)卫星数据,并基于洪水和焚烧区域的标记数据进行了调优。相比于目前的领先技术,该模型仅使用同等条件下一半的标记数据,便实现了15%的效果改进。通过进一步的调优,该模型还可以应用于追踪森林砍伐、预测农作物产量、检测和监测温室气体等新任务。IBM和NASA的研究人员还与克拉克大学合作,将该模型用于时间序列分割(time-series segmentation)和相似性研究等领域。
此次发布紧随双方在今年早些时候联合发布的AI模型,后者旨在加速卫星图像分析、推动科学发现。这也是NASA为期十年的开源科学倡议的一部分,该倡议旨在建立一个更为开放、包容、协作的科学共同体。
此次发布的地理空间模型借助了IBM基础模型技术,是IBM创建和训练可用于不同任务、实现多情境下信息应用的AI模型的一部分。今年7月,IBM宣布其AI和数据平台watsonx开始正式上市,它旨在基于可信任的数据,帮助企业扩大和加速领先AI技术的影响力。作为IBM watsonx的一部分,该地理空间模型的商业版将于今年晚些时候通过IBM Environmental Intelligence Suite(IBM环境智能套件,EIS)推向市场。
有关此协作的更多信息,请访问 IBM 研究院博客。
有关 IBM 未来方向和意图的声明如有更改或撤销,恕不另行通知,仅代表目标和目的。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。