利用更丰富的NASA地球科学数据生成地理空间洞察,加速气候相关发现
北京2023年8月8日 /美通社/ -- 近日,IBM (NYSE: IBM) 与开源AI平台 Hugging Face 共同宣布,基于美国宇航局(NASA)卫星数据构建的IBM watsonx.ai地理空间基础模型现已在Hugging Face 发布。它将成为Hugging Face上至今最大的地理空间基础模型,也是首个与NASA合作构建的开源AI基础模型。
获取最新数据仍然是气候科学研究面临的主要挑战,因为环境条件几乎每天都在变化。尽管数据量不断增加(NASA预估到2024年,其新任务将产生25万 TB的数据),但科学家和研究人员们在分析这些大型数据集时仍面临障碍。作为与NASA签署的空间行动协议(Space Act Agreement)的一部分,IBM今年早些时候构建了一个用于处理地理空间数据的AI基础模型。现在,双方联手业内公认的开源领导者和Transformer模型库Hugging Face,共同发布上述地理空间基础模型,以扩大气候和地球科学研究中对AI技术的访问和应用,从而加速创新。
IBM研究院人工智能副总裁Sriram Raghavan表示:“在加速气候变化等关键领域的研究发现上,开源技术的角色越来越重要。IBM的基础模型旨在创建灵活、可复用的AI系统,通过将其与NASA的地球卫星数据库相结合,并发布在领先的开源AI平台Hugging Face上,我们可以利用协作的力量,实施更快速、更有影响力的解决方案,改善地球环境。”
Hugging Face产品和增长业务负责人Jeff Boudier表示:“AI仍然是一个以科学为驱动的领域,而科学进展必须通过信息共享和合作取得。这就是为什么开源AI、开放数据集和模型对于AI的持续发展如此重要,从而让更多人受益于技术。”
NASA首席科学数据官Kevin Murphy表示:“我们相信基础模型有潜力改变观测数据分析的方式,帮助我们更好地了解我们的星球。我们希望通过开源这些模型扩大其影响力。”
该基础模型由IBM和NASA共同训练,使用了过去一年在美国大陆范围内的Harmonized Landsat Sentinel-2(HLS)卫星数据,并基于洪水和焚烧区域的标记数据进行了调优。相比于目前的领先技术,该模型仅使用同等条件下一半的标记数据,便实现了15%的效果改进。通过进一步的调优,该模型还可以应用于追踪森林砍伐、预测农作物产量、检测和监测温室气体等新任务。IBM和NASA的研究人员还与克拉克大学合作,将该模型用于时间序列分割(time-series segmentation)和相似性研究等领域。
此次发布紧随双方在今年早些时候联合发布的AI模型,后者旨在加速卫星图像分析、推动科学发现。这也是NASA为期十年的开源科学倡议的一部分,该倡议旨在建立一个更为开放、包容、协作的科学共同体。
此次发布的地理空间模型借助了IBM基础模型技术,是IBM创建和训练可用于不同任务、实现多情境下信息应用的AI模型的一部分。今年7月,IBM宣布其AI和数据平台watsonx开始正式上市,它旨在基于可信任的数据,帮助企业扩大和加速领先AI技术的影响力。作为IBM watsonx的一部分,该地理空间模型的商业版将于今年晚些时候通过IBM Environmental Intelligence Suite(IBM环境智能套件,EIS)推向市场。
有关此协作的更多信息,请访问 IBM 研究院博客。
有关 IBM 未来方向和意图的声明如有更改或撤销,恕不另行通知,仅代表目标和目的。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。