近日,经国家发展改革委员会正式批复认定,“大数据分析技术国家工程实验室”将由曙光公司和中科院计算所等单位联合共建。该国家工程实验室的落地,正式将大数据分析技术的研发需求上升到国家高度。
近年来,“数据即资产”“数据产生价值”等观念深入人心,然而真正能够让数据价值变现的大数据挖掘与分析技术仍远远不能满足当前需要。当前的数据挖掘分析手段仅能满足“复杂数据的简单分析”、“简单数据的复杂分析”等场景,“复杂数据的复杂分析”仍在呼唤真正的大数据技术应用。换言之,“数据价值”已经体现,但“大数据价值”和“数据大价值”还未真正体现。
作为国家级重点科研平台、国家科技创新体系的重要组成部分,国家工程实验室将成为依托企业、转制科研机构、科研院所或高校等设立的研究开发实体。曙光公司和中科院计算所等共建单位,将依托大数据分析技术国家工程实验室开展一系列的数据分析技术研发和应用实践。
据曙光公司总裁历军介绍,大数据分析技术国家工程实验室将针对我国大数据挖掘与分析能力弱、大数据算法应用和综合能力不高等问题,建设大数据分析技术创新平台,支撑开展大数据复杂性和不确定性特征描述、异构大数据预处理、挖掘与分析计算系统、大数据挖掘结果与决策支持、基于大数据的智能知识获取算法等技术的研发和工程化。
中科院计算所承担着大量国家重点项目,已在将大数据挖掘与智能分析理论相结合等方面取得多项成果;曙光公司作为中国“城市云”的定义者和建设者,有着丰富的数据汇聚和分析应用实践。可以说,双方已初步具备了较强的大数据挖掘分析、知识管理与决策支持研发能力和应用经验。
针对我国大数据分析技术综合能力欠缺等问题,大数据分析技术国家工程实验室将沿着“基础设施建设、技术产品研发、工程化集成验证、生态体系构建”的体系部署,逐步打造一个开放的大数据分析技术生态体系。
按照共同的计划部署,要实现大数据分析技术水平的整体突破,首先要建成分布全国的大数据分析云基础设施,以形成共享开放的大数据资源汇聚;同时要研发集大数据分析计算架构、特色器件、关键技术和开放接口的大数据分析工具集、平台产品与技术标准;在此基础上,形成面向科学发现与政府治理的典型大数据分析示范应用与服务,最终通过共享平台、开源工具、标准体系构建大数据分析技术开放的生态体系,形成可持续的产学研用机制。
大数据分析技术国家工程实验室选择曙光,将为曙光提供践行大数据分析技术生态体系的舞台。自从曙光2015年提出“数据中国”战略以来,曙光稳步推进大数据技术与产品的研发,并针对政府大数据、科学大数据、安全大数据和工业大数据四类大数据业务展开重点布局。“科学大数据引擎”、“方舟大数据融合分析平台”等解决方案的先后出台,已在建立大数据从汇聚、融合到分析、共享的完整链条上进行了初步探索。
“曙光近年来践行‘数据中国’落地的经验表明,来自不同行业、不同领域、同类别、多种类数据的综合分析已对当前数据分析手段提出了更高要求。”历军指出,当前,在大数据分析应用与服务、大数据分析技术与系统、平台支撑体系等方面,仍亟需从技术、工艺、材料、设备方面实现技术突破。
大数据分析国家工程实验室是提升大数据基础技术支撑能力的关键一环,此次批复将有力推动院企进一步发挥产学研协同创新优势,推进大数据分析技术在相关领域深度应用,促进区域乃至全国大数据与云计算产业创新发展。曙光也将深度联合中科院计算所等共建单位,共同促进大数据分析技术、工具和系统平台的集成部署,力保率先打造开放的大数据分析生态体系。
好文章,需要你的鼓励
Meta正在建设名为Hyperion的数据中心,预计提供5千兆瓦算力支持其AI实验室。该项目占地面积足以覆盖曼哈顿大部分区域,位于路易斯安那州东北部,将在数年内扩展至5GW规模。此外,Meta还计划在2026年启用1GW的Prometheus超级集群。这些项目旨在提升Meta在AI竞赛中对抗OpenAI和谷歌的竞争力,但也将消耗大量电力和水资源。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
谷歌为其AI驱动的NotebookLM平台新增"精选笔记本"功能,与全球知名作者、研究人员、出版物和非营利组织合作创建高质量互动资源。首批精选笔记本涵盖长寿建议、2025年预测、人生建议和莎士比亚作品等主题。用户可通过聊天界面提问、查看AI生成的摘要、音频概览或流程图与内容互动。该功能在桌面版NotebookLM中已上线,未来将持续增加更多精选内容。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。