依托72台浪潮四路服务器NF8480M3,山东省水文局建成全省首个覆盖省市两级水文信息系统的统一数据平台,力图扫除信息覆盖盲点,解决信息资源碎片化、孤岛化现象,实现对数据的灵活抽取分析,用信息化手段治水,为决策制定提供更科学的依据。
如何唤醒20 多亿条分散的水文数据
早在2011年,中央一号文件中就把水利作为国家基础设施建设的优先领域,明确提出推进水利现代化建设。水文是水利的基础,首先实现水文信息化,才能带动水文与水利的现代化。近年来,山东省水文信息化建设已初具规模,全省雨情信息和多数水位信息已基本实现了自动采集和数据库存储,建成了“水文信息服务系统”、“洪水预报系统构建平台”、“水情综合业务系统”等业务系统。
山东省水文信息系统由水文局信息处、省水情中心和17地市的水情中心构成,每个单位都有各自的独立的数据库、独立的机房及服务器、存储等硬件设施。“这些业务系统已积累了20 多亿条水文数据,并且在未来3年还将增长3—5倍”,山东省水文局信息化负责人介绍道,这些数据都是各个业务单位分散保存,导致数据资源无法共享,这在很大程度上限制了对数据资源的挖掘和利用。此外,由于各地市数据标准不一,省局得到这些这些数据要经过审核、校验、清洗,以至于和市局的水文数据存在一定误差。
“山东省要么不下雨,一下就大雨,容易形成涝灾,及时有效的决策很重要”,山东省水文局相关负责人认为,要想做出及时有效的决策,就必须对已建的系统数据资源进行整合,方便对全省水文数据的综合分析,实现不同系统之间的数据共享。
72台浪潮四路服务器服务全省19个水情单位
山东省水文局需要对全省136条河流、5000个水文监测站的数据进行采集,每5分钟上传到各地市的数据中心。山东省水文局负责人介绍:“由于省、市级机构之间空间跨度较大,而且各机构现有系统和数据资源差异同样较大,因此需要在在各单位部署性能强劲、稳定可靠的服务器,整合所有数据,实现市与市之间、市与省之间、省级之间点对点、点对多点的双向共享模式。”
经过多方考察,山东省水文局最终选择了浪潮提供的以四路服务器为核心的统一数据平台方案,在全省19个水情单位共部署72台NF8480M3。其中省局信息中心部署4台,主要承载接收17地市数据、外部发布等功能,17地市每个地市部署4台,主要承载各监测站水文信息的数据采集以及数据从县到市局的上传、存储,市局与其他市局之间的交换。
NF8480M3强大的处理性能保障了17地市的数据可以同步传输至省局信息中心,耗时几乎不超过两秒钟;4个高性能千兆网卡以及硬盘数据带宽100%提升,保证了水文数据每5分钟一次的上传流畅。当有重大汛情事件发生时,省水文局能够在第一时间召开调度会,这样的速度是及时做出决策的有力保障。
此外,山东省水文局相关负责人谈到“一旦遇到服务器宕机,尤其是在汛期,会是个大麻烦”, NF8480M3关键部件支持热插拔在线维护,能够有效隔离单点故障,保障从省局到市局的水文数据24小时不间断,业务系统稳定运行。
获取迅速及时 监测全面准确
“以前,省局和市局之间数据没有接口,省局要先给市局下通知,告知其需要哪些类型的数据,分局分拣之后再推送过来,这种‘手动挡’的操作方式显然太滞后了,而且推送过来的数据由于缺乏统一标准,校验滞后有一定的误差。”山东省水文局相关负责人介绍到,此外,过去经常会出现同一条河流却有不同的监测数据的情况,这是因为一条河流通常经过好几个地市,而市局之间数据系统各自独立,各自为政的数据必然导致判断上的片面性。
浪潮提供的解决方案使省局和市局的数据库形成了共享,山东省水文局在5分钟内即可完成全省实时水情、气象等信息的收集处理,速度比过去提高8到9倍。而且市与市之间、市与省之间、省级之间实现双向共享,数据的监测准确性、全局性也大大提升,整合之后的数据库则可以看到一条河流流经省内所有地市河段的监测数据,可以从全局上判断其汛情,做出准确的决策。
“信息管理对治水至关重要。”山东省水文局相关负责人说,“山东省在水文测报基础设施、防汛指挥系统和水文数据库建设等方面一直走在全国水文系统的前列。这次依托浪潮服务器打造的统一数据平台可以通过数据集中、数据标准化、数据加工,实现各类数据的广度共享与深度挖掘。以前我们老说‘几十年一遇的大雨’,那都是人的经验判断得来的,而以后所有的数据,都是经过机器的比对得出的,更为精准。”
好文章,需要你的鼓励
ETH Zürich等机构研究人员提出TrustVLM框架,解决视觉-语言模型预测可信度问题。该方法利用模型中存在的"模态差距",创新性地结合图像到文本和图像到图像的相似度,实现无需重新训练即可大幅提升误分类检测性能。在17个数据集的严格测试中,TrustVLM相比现有方法在关键指标上提升显著,同时改善了零样本分类准确率。此成果为AI系统在自动驾驶、医疗等安全关键领域的可靠部署提供了重要保障。
这项研究提出了个性化安全概念,解决大语言模型对不同用户采用统一安全标准的问题。研究团队创建了PENGUIN基准测试集评估模型在处理高风险场景时的个性化安全能力,并开发了RAISE框架高效获取关键用户信息。实验表明,提供用户背景可使安全分数提高43.2%,而RAISE框架通过平均仅2.7次交互即可提高安全分数31.6%。这一创新方法将AI安全从"一刀切"转向"个性定制",为高风险领域的AI应用提供了新思路。
明尼苏达大学研究团队提出了一种创新方法,通过回合级信誉分配显著提升大语言模型(LLM)智能体的多回合推理能力。传统方法只对整个过程进行评价,而他们的MT-GRPO算法能够精确评估每个决策步骤的价值,就像为每一步提供具体反馈。在维基百科搜索工具使用场景中,该方法实现了100%的工具执行成功率和50%的答案精确匹配率,远超传统方法。这一突破不仅提高了AI在多步骤任务中的表现,也为开发更复杂的AI系统提供了重要思路。
这篇研究介绍了PISCES——一种能精确从大语言模型参数中移除特定概念知识的创新技术。与现有方法不同,PISCES通过解缠器模型识别概念相关特征,直接编辑模型参数,实现了更精准的知识移除。在Gemma和Llama模型上的测试表明,该方法不仅有效降低了目标概念的准确率(低至7.7%),还保持了模型在无关领域的高性能,并显著提高了对"重新学习"的抵抗力。这一突破为AI系统的安全部署和合规使用提供了新的可能性。