初创公司Etleap推出了面向Apache Iceberg表的云端抽取-转换-加载(ETL)数据管道服务。
Apache Iceberg是一种开源的表格式,专为数据湖中的大规模数据集设计,位于Parquet、ORC、Avro等存储系统以及AWS S3、Azure Blob、Google Cloud Store等云对象存储之上。它为数据湖带来了类似数据库的功能,包括ACID支持、分区、时间旅行和架构演进。Iceberg格式表用于大数据处理并支持SQL查询。Spark、Trino、Flink、Presto、Hive、Impala、StarRocks等查询引擎都可以同时操作这些表。
Etleap首席执行官兼创始人Christian Romming表示:"Iceberg为企业带来重大优势,但要在实践中实现这些优势需要一个托管的管道系统。我们相信我们的Iceberg管道平台能够满足这一需求,让数据平台团队能够采用Iceberg而无需构建和运营自定义管道堆栈。"
Etleap成立于2013年,由Romming创建。按照数据分析初创公司的标准,该公司融资较少,在2017年和2018年的初创和种子轮中仅筹集了约322万美元。
Romming表示,Iceberg本身不负责数据摄取或建模、管理表操作或协调跨系统的变更。用户必须构建自己的管道功能集来将数据源连接到Iceberg并完成这些工作,需要"组装摄取工具、dbt Core作业、编排器和自定义Iceberg维护的拼接组合"。
现在Etleap通过SaaS服务为用户提供这些功能。它将摄取、转换、编排和Iceberg操作统一到一个托管系统中,该系统完全在客户的虚拟私有云(VPC)内运行。
然而,支持的数据源有限。目前只支持以下Iceberg管道数据源:
启用CDC的数据库(CDC=变更数据捕获)
启用"通过事件触发转换"管道源选项的S3源
事件流
Salesforce CDC实体
可用的数据转换功能也有限。同时CDC、事件触发和事件流Iceberg管道也存在一些限制,不过这些问题应该会在未来得到解决。
Etleap目前为AWS Redshift、S3/Glue和Snowflake提供管道服务。其Iceberg管道平台已经上线,客户正在使用它来大规模运行Iceberg管道。
Q&A
Q1:Apache Iceberg是什么?有什么优势?
A:Apache Iceberg是一种开源的表格式,专为数据湖中的大规模数据集设计。它为数据湖带来了类似数据库的功能,包括ACID支持、分区、时间旅行和架构演进,多种查询引擎可以同时操作这些表。
Q2:Etleap的Iceberg管道平台解决了什么问题?
A:Iceberg本身不负责数据摄取或建模、管理表操作。用户以往需要自己构建管道功能,组装各种工具。Etleap将摄取、转换、编排和Iceberg操作统一到一个托管系统中,简化了部署和运维。
Q3:Etleap的Iceberg服务目前支持哪些数据源?
A:目前支持的数据源包括:启用CDC的数据库、启用特定选项的S3源、事件流,以及Salesforce CDC实体。数据源和转换功能相对有限,但会在未来扩展。
好文章,需要你的鼓励
Finastra最新研究显示,99%的英国金融服务公司已采用人工智能技术,AI已成为金融业的"连接纽带"。该技术不再局限于后台自动化,而是推动实时欺诈检测、个性化产品推荐和智能承保等创新应用。AI投资间接促使银行增加其他技术投入,安全支出预计2026年平均增长40%。九成公司计划投资技术现代化以支持AI扩展,云技术采用成为重点。
亚马逊FAR部门研究团队通过创新的"掩码比特建模"技术,突破了图像生成领域的传统认知。研究发现离散方法劣势源于信息容量不足而非技术路线缺陷,提出的BAR框架通过渐进式比特预测解决大词汇表计算难题,在ImageNet-256上创下0.99 gFID新纪录,同时实现数十倍的速度提升,为AI图像生成开启质量与效率并举的新时代。
HPE公司宣布其将为2026年米兰-科尔蒂纳冬奥会提供网络基础设施,这是HPE与其收购的Juniper Networks首次在重大赛事中联合部署技术服务。本届冬奥会覆盖超过2.2万平方公里,是史上地理分布最广的奥运会,拥有40多个场馆。HPE部署了包括4900多个接入点、1500多台交换机等设备,运用AI原生的HPE Mist平台和Marvis Copilot提供智能网络管理,确保为3000名运动员、媒体转播商和观众提供奥运级别的网络稳定性和安全性。
北京大学与美团联合研究团队提出轮廓引导路径探索(OPE)方法,解决AI并行推理中的"互信息饱和"问题。通过先生成多样化策略轮廓再执行具体推理,避免多条思路重复收敛的困境。在数学推理测试中,该方法显著提升了复杂问题的解决成功率,为AI推理能力的可靠性提升提供了新的技术路径。