作者:Chris Mellor
更新时间:2024年7月24日
戴尔提高了旗下数据湖仓的查询速度,添加并升级了连接器,改进了监控并提升了安全性。
今年三月,戴尔宣布让旗下AI产品组合中的数据湖仓使用Starburst Presto 查询引擎、Kubernetes组织的湖仓系统软件以及基于戴尔ECS、ObjectScale 或 PowerScale存储产品的横向扩展S3兼容对象存储。
Starburst在去年2月推出了Warp Speed 技术,以及Apache Lucene索引和缓存技术,声称它可以将基于文本的查询处理速度提高多达7倍。现在,它携手更多连接器和其他改进一起进入了戴尔的数据湖仓。
戴尔产品经理 Vrashank Jain 写道:“Warp Speed是Dell Data Lakehouse中的一项新功能,它可以自主学习查询模式并识别经常访问的数据,以创建最佳索引和缓存,同时将不常访问的数据保留在原地。”
它可以提高查询性能,“对于前20%的查询,性能可以提高3到5倍”。
无需数据工程即可自动为数据湖编制索引,并且可以使用查询加速构建和填充更高性能的面板。自主索引“为每个数据块创建适当的索引类型(位图、字典、树),从而加速联接、过滤器和搜索等操作。索引存储在计算节点的 SSD 上,可以快速访问。”
Jain写道:“智能缓存是一种专有的SSD列式块缓存,可根据数据使用频率优化性能。缓存消除了不必要的表扫描,并在查询之间提供了更多的数据重用,从而节省了计算成本。”
“借助 Warp Speed,最终用户无需对查询进行任何修改,同一集群就可以将数据湖查询的速度提高 3 到 5 倍。它还可以帮助将集群规模减少多达 40%。”客户可以在大型集群上运行更多查询,也可以在较小的集群上运行相同数量的查询。
Jain表示:“只有Dell S3 兼容存储上的数据湖支持”该Warp Speed功能。
戴尔还为数据湖仓添加了更多增强功能:
Warp Speed 包含在现有的 Dell Data Lakehouse 许可证中。计算节点的配置将进行修改,以包括已由戴尔测试和基准测试的SSD,支持Warp Speed索引和缓存。
潜在客户可以在戴尔演示中心访问戴尔的Data Lakehouse,很快还可以在客户解决方案中心访问戴尔的Data Lakehouse,以进行交互式探索和系统验证。客户和合作伙伴可以通过在演示中心创建一个免费帐户来试用。
好文章,需要你的鼓励
从信息中提取有意义的洞见结论已经不再属于“锦上添花”,而更多成为一种常态化的必需。然而,对于许多企业和个人来说,有效利用数据资源似乎仍是一项艰巨的任务。妨碍其落地的现实因素往往包括缺乏专业技能、资源有限或者拿不出充裕的时间等。这些阻力不仅会导致因未能充分发掘潜力而陷入沮丧、带来高昂的人才获取成本,在某些极端情况下(例如关键人才离职)甚至迫使企业在数据驱动洞见缺失的情况下勉强运营。
喜力啤酒对于生成式AI最重要的应用之一就是知识管理。对于长期积累下的数十万份包含有价值消费者洞察、市场数据与品牌信息的文件,如何高效访问并利用这笔资源财富一直是喜力啤酒面对的现实挑战。Costella解释道,“我们与合作伙伴共同开发出一套引擎,可以使用自然语言提出问题。以业务问题为例,该引擎不仅能够给出切实回复,还会提及支撑结论的信息来自哪里。”
爱立信企业无线部门是该公司无线产品组合、Cradlepoint(爱立信在2020年以11亿美金收购)以及云安全专业公司Ericom的结合体。Cook曾在Ciena和思科系统担任过渠道领导职务,目前负责领导该业务部门的全球合作伙伴销售。为此,他希望对曾经分散的两家公司的合作伙伴计划和参与模式进行简化,同时考虑到不同的合作伙伴情况并发挥他们的优势。他计划通过让全球业务本地化来促进增长和盈利,特别是在国际市场。
“您可以看看网络和安全的结合,以及将两者结合在一起的重要性——这是他们(HPE)所没有的——看看数据中心基础设施,看看无线校园网络,看看所有的可观察性、安全性和我们拥有的一切——我的意思是,我们拥有比其他任何厂商都多的技术,可以为基础设施层的客户带来更多价值,”Robbins在近日于亚特兰大举行的2024 XChange Best of Breed大会上这样表示。