企业级云服务商青云QingCloud日前宣布SparkMR on QingCloud服务正式登陆AppCenter。SparkMR on QingCloud集成了Spark与Hadoop MapReduce双计算引擎,提供统一的HDFS数据存储引擎及YARN调度系统,为用户提供灵活、高效、可多模式切换的全新云端大数据处理平台。
青云QingCloud全新双引擎大数据服务SparkMR正式上线
大数据时代,数据资源是企业的无形资产,也是核心竞争力之一。如何低成本、高效率地进行数据统一管理和分析,获得商业决策支持成为摆在企业面前的一道难题。大数据平台正是为了企业的这种需求应运而生并持续发展创新。青云QingCloud于2015年8月推出了基于Spark的大数据集群服务,同年12月,推出Hadoop集群服务作为大数据基础平台的有力补充,以此来满足企业在大数据领域的不同需求。
但由于Spark与Hadoop作为两个独立的服务,用户同时使用这两种处理引擎时,需要部署两套HDFS,相同的数据需要加载并存放两份,无论是成本还是效率都不是最好的选择。从数据统一管理角度出发,青云QingCloud推出SparkMR on QingCloud,通过QingCloud AppCenter以云应用的方式交付用户使用,对原有大数据平台的Spark与Hadoop服务进行了全方位的整合与升级。
目前,SparkMR支持Apache Hadoop 2.7.3与Apache Spark 2.2.0。Spark和Hadoop两者结合后,成本显著降低。同时,相对原大数据平台提供更丰富、更灵活的可选配置,用户可以分角色定制节点配置(CPU 2~16核可选,内存2~64GB可选)。SparkMR on QingCloud作为支撑全新双引擎大数据平台的重要组件,具有多重亮点:
灵活的计算模式:SparkMR在底层提供统一的HDFS作为数据存储引擎,在上层提供Spark与MapReduce两种计算引擎,并提供YARN作为调度系统。用户可以轻松实现三种不同的计算模式,即Spark Standalone、Spark on YARN和MapReduce on YARN三者之间的切换。
强大的计算能力: SparkMR为了方便用户开发Spark应用,除了支持Java和Scala开发之外,还提供了Python与R两种语言的运行环境。其中为Python用户提供了Anaconda发行版的Python 2和Python 3,并支持在这两种Python版本间进行切换。同时,分别为这两个Python版本预置了多个Anaconda发行版的数据科学包,为数据科学和机器学习/深度学习等 AI 开发场景提供了强大的计算能力支撑。
便捷的集成能力:SparkMR支持指定依赖服务的功能,即通过AppCenter 2.0 框架内原生的应用感知机制,实现与其他大数据分析组件之间自动化的无缝集成。SparkMR与QingStor对象存储平台也进行了预置集成,用户可以通过简单的配置即可开启对QingStor对象存储的支持,以应对海量大规模数据的存储问题。
良好的调度策略: SparkMR提供Spark与YARN的自定义调度器的功能,用户可以根据自己实际的需求,自定义集群内资源调度策略,赋予用户在多租户使用场景下更为精细化的管理能力。
简易的服务定制:SparkMR通过控制台提供近60个配置参数,用户通过控制台的UI操作即可完成集群部署及服务的个性化定制。比如用户可以通过 UI 即可完成设置 Hadoop 代理用户的功能。SparkMR的Client(客户端)节点也实现了完全的自动化配置,用户无需再单独创建并手动配置BigData Client或者Spark Client。这意味着用户在控制台完成配置及服务定制后,在部署完成时,已经可以开始执行计算任务,真正实现了一键部署、即刻使用。
完善的服务监控:SparkMR提供了完善的服务级别分角色的监控能力,用户不仅可以看到常规资源层监控,还可以通过可视化的方式清晰了解整体服务的运行情况。同时基于服务监控,还提供了监控告警、健康检查和服务自动恢复等功能。
青云QingCloud CTO甘泉表示,SparkMR on QingCloud的推出标志着青云QingCloud大数据平台向AppCenter的迁移升级完成了重要一步。AppCenter将助力用户以应用的视角进行大数据日常管理工作,并通过自身的服务感应机制,让组件间的对接不断趋于自动化,实现动态调整。未来,QingCloud将陆续推出可视化、服务编排等更贴合企业需求的大数据服务。在深度学习领域,QingCloud也将持续深耕、不断创新,让智能化与云计算深度结合,为企业的商业决策提供有力支撑。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。