近日,经国家发展改革委员会正式批复认定,“大数据分析技术国家工程实验室”将由曙光公司和中科院计算所等单位联合共建。该国家工程实验室的落地,正式将大数据分析技术的研发需求上升到国家高度。
近年来,“数据即资产”“数据产生价值”等观念深入人心,然而真正能够让数据价值变现的大数据挖掘与分析技术仍远远不能满足当前需要。当前的数据挖掘分析手段仅能满足“复杂数据的简单分析”、“简单数据的复杂分析”等场景,“复杂数据的复杂分析”仍在呼唤真正的大数据技术应用。换言之,“数据价值”已经体现,但“大数据价值”和“数据大价值”还未真正体现。
作为国家级重点科研平台、国家科技创新体系的重要组成部分,国家工程实验室将成为依托企业、转制科研机构、科研院所或高校等设立的研究开发实体。曙光公司和中科院计算所等共建单位,将依托大数据分析技术国家工程实验室开展一系列的数据分析技术研发和应用实践。
据曙光公司总裁历军介绍,大数据分析技术国家工程实验室将针对我国大数据挖掘与分析能力弱、大数据算法应用和综合能力不高等问题,建设大数据分析技术创新平台,支撑开展大数据复杂性和不确定性特征描述、异构大数据预处理、挖掘与分析计算系统、大数据挖掘结果与决策支持、基于大数据的智能知识获取算法等技术的研发和工程化。
中科院计算所承担着大量国家重点项目,已在将大数据挖掘与智能分析理论相结合等方面取得多项成果;曙光公司作为中国“城市云”的定义者和建设者,有着丰富的数据汇聚和分析应用实践。可以说,双方已初步具备了较强的大数据挖掘分析、知识管理与决策支持研发能力和应用经验。
针对我国大数据分析技术综合能力欠缺等问题,大数据分析技术国家工程实验室将沿着“基础设施建设、技术产品研发、工程化集成验证、生态体系构建”的体系部署,逐步打造一个开放的大数据分析技术生态体系。
按照共同的计划部署,要实现大数据分析技术水平的整体突破,首先要建成分布全国的大数据分析云基础设施,以形成共享开放的大数据资源汇聚;同时要研发集大数据分析计算架构、特色器件、关键技术和开放接口的大数据分析工具集、平台产品与技术标准;在此基础上,形成面向科学发现与政府治理的典型大数据分析示范应用与服务,最终通过共享平台、开源工具、标准体系构建大数据分析技术开放的生态体系,形成可持续的产学研用机制。
大数据分析技术国家工程实验室选择曙光,将为曙光提供践行大数据分析技术生态体系的舞台。自从曙光2015年提出“数据中国”战略以来,曙光稳步推进大数据技术与产品的研发,并针对政府大数据、科学大数据、安全大数据和工业大数据四类大数据业务展开重点布局。“科学大数据引擎”、“方舟大数据融合分析平台”等解决方案的先后出台,已在建立大数据从汇聚、融合到分析、共享的完整链条上进行了初步探索。
“曙光近年来践行‘数据中国’落地的经验表明,来自不同行业、不同领域、同类别、多种类数据的综合分析已对当前数据分析手段提出了更高要求。”历军指出,当前,在大数据分析应用与服务、大数据分析技术与系统、平台支撑体系等方面,仍亟需从技术、工艺、材料、设备方面实现技术突破。
大数据分析国家工程实验室是提升大数据基础技术支撑能力的关键一环,此次批复将有力推动院企进一步发挥产学研协同创新优势,推进大数据分析技术在相关领域深度应用,促进区域乃至全国大数据与云计算产业创新发展。曙光也将深度联合中科院计算所等共建单位,共同促进大数据分析技术、工具和系统平台的集成部署,力保率先打造开放的大数据分析生态体系。
好文章,需要你的鼓励
2025年,企业技术高管面临巨大压力,需要帮助企业从持续的AI投入中获得回报。大多数高管取得了进展,完善了项目优先级排序方法。然而,CIO仍面临AI相关问题。支离破裂的AI监管环境和宏观经济阻力将继续推动技术高管保持谨慎态度。随着AI采用增长的影响不断显现,一些CIO预期明年将带来劳动力策略变化。
这篇论文提出了CJE(因果法官评估)框架,解决了当前LLM评估中的三大致命问题:AI法官偏好倒置、置信区间失效和离线策略评估失败。通过AutoCal-R校准、SIMCal-W权重稳定和OUA不确定性推理,CJE仅用5%的专家标签就达到了99%的排名准确率,成本降低14倍,为AI评估提供了科学可靠的解决方案。
FinOps基金会周四更新了其FinOps开放成本和使用规范云成本管理工具,新版本1.3更好地支持多供应商工作流。该版本新增了合同承诺和协商协议数据集,增加了跨工作负载成本分摊跟踪列,以及云支出和使用报告时效性和完整性的元数据可见性。随着云和AI采用推动企业IT预算增长,技术供应商正在关注将成本与价值联系起来的努力。大型企业通常使用三到四家云供应商,小企业可能使用两家,同时还有数据中心、SaaS和许可等服务。
NVIDIA团队开发出Fast-FoundationStereo系统,成功解决了立体视觉AI在速度与精度之间的两难选择。通过分而治之的策略,该系统实现了超过10倍的速度提升同时保持高精度,包括知识蒸馏压缩特征提取、神经架构搜索优化成本过滤,以及结构化剪枝精简视差细化。此外,研究团队还构建了包含140万对真实图像的自动伪标注数据集,为立体视觉的实时应用开辟了新道路。