企业级云服务商青云QingCloud日前宣布,一站式云端大数据服务——QingMR全新升级。QingMR集成Spark与MapReduce双数据处理引擎及Apache Kylin极速海量数据OLAP分析引擎,通过统一的HDFS分布式数据存储系统及YARN调度系统,为用户提供灵活、高效、多模式的一站式云端大数据服务。针对AI开发场景,QingMR还提供了Python与R两种语言的运行环境,并预置了多个Anaconda发行版的数据科学包,为数据科学、机器学习和深度学习等AI开发场景,提供了强大的计算能力支撑。
自2015年发布第一款大数据服务开始,青云QingCloud在大数据领域的创新便从未停止,陆续推出Spark、Hadoop、Storm、HBase、ZooKeeper、Hive、SparkMR等一系列大数据服务。QingMR是青云QingCloud新一代云端大数据服务,是SparkMR的全新升级,能够提供计算、存储、分析、查询一站式全方位的大数据服务。
所谓一站式大数据服务,是指QingMR能够提供对数据的批量计算、流式计算与实时计算,并实现对计算结果的极速分析查询。全新升级的QingMR大数据服务包括“QingMR–Core”和“QingMR–Kylin”两个版本,其中Kylin版本基于国人主导的Apache顶级项目Apache Kylin的企业级大数据智能分析平台Kyligence Analytics Platform(KAP),提供PB级数据集的亚秒级查询能力,用户可体验极速海量数据OLAP分析引擎的强大与便捷。
QingMR通过QingCloud AppCenter交付部署,3分钟之内即可完成一个集群部署,并且能够通过可视化的方式完成服务的个性化定制,并提供完善的服务监控,真正实现一键部署、即刻使用。基于AppCenter框架内原生的应用感知机制,实现与其他大数据分析组件如ZooKeeper之间自动化的无缝集成。QingMR与QingStor对象存储平台也提供预置集成,用户通过简单的配置即可开启对QingStor对象存储的支持,以应对海量大规模数据的存储问题。
QingMR适用于流式数据处理、批量数据处理、极速数据查询与分析、机器学习等应用场景,能够满足企业用户实时数据计算、海量数据极速查询及分析处理的需求。QingMR提供Spark与MapReduce两种数据处理框架,并由YARN作为资源调度系统。用户可以轻松实现三种不同的计算模式,即Spark Standalone、Spark on YARN和MapReduce on YARN三者之间的切换。
青云QingCloud CTO甘泉表示,随着QingMR的全新升级,青云QingCloud大数据服务将承载更多需求和能力,满足用户不同场景的大数据需求。未来,QingMR将整合更多大数据组件,如Presto、Impala等,进一步完善QingCloud大数据服务,帮助用户挖掘数据价值、实现数据驱动增长。
好文章,需要你的鼓励
传统数据工程面临数据质量差、治理不善等挑战,成为AI项目的最大障碍。多智能体AI系统通过协作方式正在彻底改变数据准备、治理和应用模式。Google Cloud基于Gemini大语言模型构建协作生态系统,让不同智能体专门负责数据工程、科学、治理和分析等任务。系统通过分层架构理解组织环境,自主学习历史工作流程,能够预防问题并自动处理重复性任务,大幅提升效率。
中科大团队开发出LongAnimation系统,解决了长动画自动上色中的色彩一致性难题。该系统采用动态全局-局部记忆机制,能够为平均500帧的动画进行稳定上色,性能比现有方法提升35-58%。核心创新包括SketchDiT特征提取器、智能记忆模块和色彩优化机制,可大幅提升动画制作效率。
微软推出Copilot调优功能,让企业通过低代码工具利用自动化微调技术训练企业数据。与基于公开数据的通用AI模型不同,企业需要理解内部数据和流程的专业化模型。Gartner预测专业化GenAI模型市场将在2026年翻倍至25亿美元。这些模型通常基于开源模型构建,部署为小语言模型,提供更好的成本控制和数据安全性,同时更易符合欧盟AI法案要求。
南开大学团队开发出DepthAnything-AC模型,解决了现有AI距离估算系统在恶劣天气和复杂光照条件下性能下降的问题。通过创新的扰动一致性训练框架和空间距离约束机制,该模型仅用54万张图片就实现了在雨雪、雾霾、夜晚等复杂环境下的稳定距离判断,同时保持正常条件下的优秀性能,为自动驾驶和机器人导航等应用提供了重要技术支撑。