深圳税务大数据平台采用浪潮双路服务器,凭借强劲的计算力和稳定可靠支撑大数据平台精准分析企业“产销对接”信息,为当地企业与全国其他企业牵线搭桥,打通上下游产业链,助力企业快速复产复工。
2020年春节,一场新冠肺炎疫情肆虐全球,许多企业被迫停工停产,经济发展陷入停滞状态。而随着疫情的缓解,企业开始复工复产,却因上下游产业复工节奏不统一导致许多企业面临原材料供应中断,产业链条断裂的情况。
浪潮双路服务器NF5280M5
为充分利用大数据平台分析疫情对辖区内企业的影响,国家税务局深圳市税务局(以下简称深圳税务)通过统计、分析企业增值税发票领用、开具户数、金额等数据,精准了解企业运营困难;借助大数大数据分析及时帮助企业梳理“产销对接”信息,为当地企业与全国其他企业牵线搭桥,打通上下游产业链,助力企业快速复产复工。
加快产销对接、减税降费等一系列惠民措施的背后依靠的正是税收大数据平台。在金税三期工程下,深圳税务开始迈入大数据时代,致力于打造一个可扩展的、稳定的、高效的、全面的大数据基础服务平台,集合征管数据、发票数据、出口退税数据、财税库银数据等宝贵数据资源,对数据进行全方位的动态采集、主题建模、全面整合,在此基础上有效预测税源动态、开展风险防控、智能纳税服务的创新智慧税务应用体系,让海量税收数据成为精准政务决策的依据。
深圳税收大数据平台主要包括五大板块:一是数据湖,提供数据的智能采集和集中存储;二是数据工厂,负责数据的加工清洗和溯源管理;三是应用广场,实现数据应用各系统的单点登录集成;四是数据超市,呈现多样化数据图标指标和可定制的自助式数据分析服务;五是社区门户,打造数据需求互助和成果交流分享的社区平台。
在大数据平台建设之初,深圳税务就提出了“全”“快”“稳”“准”“通”“活”的要求,平台要包含所有涉税数据,并能实现亿级数据的秒速查询,支撑的服务器平台除了要具备强劲计算力外,还要保障平台的稳定性。统一数据标准,覆盖数据从生产、采集到应用的全过程,实现互联互通,灵活应用。
深圳税务经过严格的测试和考察,选择了以浪潮双路服务器NF5280M5为核心的产品方案支撑起大数据计算平台。NF5280M5搭载2颗英特尔至强可扩展处理器,支持M.2和24个热插拔NVMe SSD全闪硬盘,极致的存储IO消除数据和传输瓶颈,满足海量涉税数据秒速查询需求。NF5280M5采用了不同层次的高可用技术保障大数据平台的稳定性,例如丰富的硬盘RAID机制,内存的热备、镜像、纠错,以及电源风扇的冗余热插拔设计,软硬件错误容忍能力大幅提升。
除了大数据计算平台外,深圳税务还采用浪潮服务器支撑其发票管理系统2.0版和桌面云虚拟主机应用系统,缓解业务快速增长给IT基础带来的巨大压力。
深圳税务相关负责人表示,浪潮服务器为大数据平台提供了高效、稳定的支撑,税收大数据平台为税源管理、风险防控、精准服务提供了有力的工具和抓手,尤其是疫情后期,通过大数据分析,帮助企业打通上下游生产链条,为企业跨区域解决供应和销售问题,精准帮扶企业快速复工复产。
好文章,需要你的鼓励
UniR(Universal Reasoner)是一种创新的推理增强方法,可为冻结的大语言模型提供即插即用的推理能力。由韩国科学技术院研究团队开发,该方法将推理能力分解为独立的轻量级模块,无需改变主模型结构。UniR的核心优势在于高效训练(仅更新小型推理模块)、出色的模型间迁移能力(小模型可指导大模型)以及模块组合能力(多个专用模块可通过logits相加组合使用)。在数学推理和翻译测试中,UniR显著超越现有微调方法,展示了轻量级模块如何有效增强大语言模型的推理能力。
Nebius团队开发了SWE-rebench,一个自动化管道用于从GitHub收集软件工程任务并进行去污染评估。该系统解决了两大挑战:高质量训练数据稀缺和评估基准容易被污染。通过四阶段处理(初步收集、自动安装配置、执行验证和质量评估),SWE-rebench构建了包含超过21,000个Python交互式任务的数据集,并提供持续更新的评估基准。研究发现部分语言模型在传统基准上的表现可能被污染效应夸大,而DeepSeek模型在开源模型中表现最为稳健。
这项研究提出了JQL(发音为"Jackal"),一种通过多语言方法提升大型语言模型预训练数据质量的创新系统。研究团队从拉马尔研究所等机构通过四阶段方法解决了多语言数据筛选的难题:先由人类评估内容教育价值创建基准数据,然后评估大型语言模型作为"评判者"的能力,接着将这些能力提炼到轻量级评估器中,最后应用于大规模数据筛选。实验表明,JQL在35种语言上显著优于现有方法,甚至能泛化到未见过的语言如阿拉伯语和中文,为多语言AI发展提供了高效可靠的数据筛选方案。
浙江大学和西湖大学研究团队开发的Styl3R实现了艺术风格化3D重建的重大突破,能在不到一秒内从少量未标定照片和任意风格图像创建具有多视角一致性的3D艺术场景。通过创新的双分支网络架构将结构建模与外观着色分离,系统不仅保持了原始场景结构,还准确捕捉了参考风格特征。与现有方法相比,Styl3R在处理速度和视觉质量上均显著领先,为创意内容制作开辟了全新可能。