一座大坝的表面看似平静坚固,但外表可能具有欺骗性。
这就是为什么世界各国政府要求定期对大坝进行检查。这是一个复杂的过程,旨在发现大坝周围土地的微小变化、细裂缝的出现或其他表明结构承受压力的迹象。
然而,全球7万座大坝中有许多位于偏远地区,这使得定期检查变得困难。
因此,越来越多的大坝检查数据从空中获取。近年来,无人机和卫星技术的发展为大坝检查提供了新的解决方案,能够以前所未有的方式监测大坝的完整结构。
“无人机和卫星彻底改变了大坝检查,提供了能够进入到以前无法到达区域的机会,并提供了更经济的方式来监控整个结构。”IEEE终身高级会员Raul Colcher说。
大坝面临的新威胁
虽然很少见,但大坝偶尔也会失事。国际大坝委员会对世界上最大的大坝进行追踪,该委员会称其数据库中的36,000座大坝里大约有300座曾经失事。这些事件造成了重大的生命损失和财产损害。该委员会指出,尽管历史上失事率约为1%,但近年来这一比率已大幅下降。
“一般来说,出现问题的主要原因是自然因素——如侵蚀、极端天气或地震活动,以及人为因素——糟糕的项目、施工失误、维护不足和老化,”Colcher说道。
一些专家将气候变化视为大坝面临的新威胁,因为它增加了大规模降雨事件发生的可能性。IEEE高级会员Paul Kostek说:“气候变化导致大坝后的蓄水量增加,这反过来又增加了对大坝结构的压力。这凸显出加强检查以及利用技术来扩大检查人员检查范围的必要性。”
合成孔径雷达(SAR)的出现
近年来,最具价值的卫星检测工具出现了:合成孔径雷达(SAR)。这种工具利用微波脉冲绘制地面地图,收集这些脉冲从地球反射回来时的反射波(https://spectrum.ieee.org/synthetic-aperture-radar-synspective)。合成孔径雷达技术的一个优势在于,它在创建地球物体高度精细的三维模型时能够穿透云层进行观测。
多年来,已经发射了许多合成孔径雷达卫星,这些卫星持续对地球进行测量。一个合成孔径雷达卫星星座每12天经过地球上的同一地点一次。这种持续测量带来了另一项能力,即干涉合成孔径雷达(InSAR),它通过比较两幅合成孔径雷达图像来探测大坝表面从太空来看小到1毫米的微小变化。
Kostek说,SAR系统也可以安装在无人机上,从而能够从其他角度进行观测。
“使用无人机或卫星(进行检测),无需(检测人员)前往现场就可以开展检测工作,并且在必要时,可以优先检测那些需要实地查看的大坝,”Kostek说道。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。