5月26日,国家工业信息安全发展研究中心在“2019中国国际大数据产业博览会”(简称“数博会”)上,发布了《大数据优秀产品和应用解决方案案例集(2019)》,旨在面向全社会推广大数据优秀产品和应用解决方案,以提供可借鉴的经验和模式。
该案例集以企业综合实力、材料符合性、数据处理能力及安全性、功能和技术、经济社会效益等5个维度为评选标准,在1706个案例中进行了层层筛选,最终,曙光XData大数据智能引擎和其他32个大数据产品脱颖而出,成功入选。
万物智联的信息时代,大数据产业在迎来广阔发展前景的同时,也面临着硬件设备升级与关键技术革新的多重挑战。在信息技术飞速发展的进程中,数据来源的多元化、数据维度的多样化、数据应用的多场景化,海量且瞬息万变的大数据,如何实现实时化、可视化的采集、存储、计算与分析,已逐渐成为各行各业关注的焦点。
基于信息化产业发展的时代需求,曙光XData大数据智能引擎依托多年来专业技术的积累,实现了对海量异构数据的存储计算和智能分析。在大数据自主开发平台之上集成了多种开源框架和机器学习算法,提供了数据快速分析和可视化技术,全面打造融合、智能、快速、简易、安全的一体化大数据系统,实现一站式多通路的数据接入、计算、治理和共享服务,实现了海量跨网络数据的分析挖掘、实时计算和实时推理。
曙光XData大数据智能引擎紧跟信息技术发展趋势,以先进计算硬件设施为基础,以XData大数据智能引擎软件平台、曙光大数据工程服务体系为两翼,形成先进的大数据一体化产品解决方案。
关键一:产品架构——曙光XData大数据智能引擎采用融合的技术架构,深度实现存储融合、计算融合、调度融合、业务流程融合,构建体系化的融合的整体系统。可运行在X86服务器集群、高性能集群、虚拟化集群、容器化集群等不同的运行环境中,具有良好的兼容性。
关键二:核心技术——曙光XData大数据智能引擎通过统一数据分析语法、分布式流水线数据处理、高效数据计算、全流程自助建模、全自由度探索分析、全方位安全保障六大关键技术,大幅度提升大数据的整体服务能力,以优异的数据工程服务能力,响应不同场景的应用需求。
关键三:全域应用——紧扣数据集成、数据治理、数据存储、计算引擎、智能分析等全行业大数据应用核心需求,曙光XData大数据智能引擎以应用为导向,全面支撑安全监管、政府管理与决策、高科技研发与创新、大型企业经营与管理等大数据应用系统,覆盖政府、公安、交通、应急、科研、教育、医疗、环保、能源、电力等多个领域。
目前,大数据产业发展已经上升为国家战略,大数据的价值也得到了社会的广泛认可。曙光XData大数据智能引擎将进一步深耕全行业应用场景,发挥大数据计算价值、平台价值和产业价值,通过软硬一体化发展路径,用关键技术打通创新节点,在推动大数据产业跨越发展的同时,支撑我国数字化产业的转型升级,促进数字经济的飞速发展。
好文章,需要你的鼓励
亚马逊云服务部门与OpenAI签署了一项价值380亿美元的七年协议,为ChatGPT制造商提供数十万块英伟达图形处理单元。这标志着OpenAI从研究实验室向AI行业巨头的转型,该公司已承诺投入1.4万亿美元用于基础设施建设。对于在AI时代竞争中处于劣势的亚马逊而言,这项协议证明了其构建和运营大规模数据中心网络的能力。
Meta FAIR团队发布的CWM是首个将"世界模型"概念引入代码生成的32亿参数开源模型。与传统只学习静态代码的AI不同,CWM通过学习Python执行轨迹和Docker环境交互,真正理解代码运行过程。在SWE-bench等重要测试中表现卓越,为AI编程助手的发展开辟了新方向。
当今最大的AI数据中心耗电量相当于一座小城市。美国数据中心已占全国总电力消费的4%,预计到2028年将升至12%。电力供应已成为数据中心发展的主要制约因素。核能以其清洁、全天候供电特性成为数据中心运营商的新选择。核能项目供应链复杂,需要创新的采购模式、标准化设计、早期参与和数字化工具来确保按时交付。
卡内基梅隆大学研究团队发现AI训练中的"繁荣-崩溃"现象,揭示陈旧数据蕴含丰富信息但被传统方法错误屏蔽。他们提出M2PO方法,通过改进数据筛选策略,使模型即使用256步前的陈旧数据也能达到最新数据的训练效果,准确率最高提升11.2%,为大规模异步AI训练开辟新途径。