随着人工智能对数据处理的需求空前增长,总部位于山景城的初创公司 Voltron Data 正在为 AI 领域一个鲜少讨论但至关重要的挑战提供解决方案:如何快速移动和转换海量数据以跟上 AI 发展的步伐。
Voltron Data 今天宣布与埃森哲建立战略合作伙伴关系。该公司开发了一款 GPU 加速分析引擎,可帮助企业克服数据准备方面的瓶颈问题。公司的核心产品 Theseus 能让组织使用图形处理器 (GPU) 而非传统的中央处理器 (CPU) 来处理 PB 级数据。
埃森哲银行和资本市场业务负责人 Michael Abbott 在接受 VentureBeat 独家采访时表示:"每个人都在关注那些引人注目的新技术,但底层的数据基础才是关键。要让 AI 发挥作用,你必须以前所未有的速度和节奏移动数据。"
为 AI 海啸做准备:传统数据处理方式已不够用
随着公司争相采用生成式 AI,他们发现现有的数据基础设施无法应对所需的数据量和速度。随着 AI 代理在企业运营中变得更加普遍,这一挑战将进一步加剧。
Voltron Data 的 CTO 兼联合创始人 Rodrigo Aramburu 表示:"在很短的时间内,AI 代理编写的 SQL 查询可能会比人类更多。如果 CIO 和 CTO 已经在抱怨在数据分析和云基础设施上花费太多,而需求还将大幅增加,那么我们需要大幅降低运行这些查询的成本。"
与那些在现有系统上强行添加 GPU 支持的传统数据库供应商不同,Voltron Data 从零开始构建其 GPU 加速引擎。Aramburu 告诉 VentureBeat:"大多数公司在尝试 GPU 加速时,都是将 GPU 硬塞进现有系统。通过从零开始构建...我们能够根据特定工作负载的性能特征获得 10 倍、20 倍,甚至 100 倍的性能提升。"
从 1,400 台服务器到 14 台:早期采用者获得显著成效
该公司将 Theseus 定位为对 Snowflake 和 Databricks 等成熟平台的补充,利用 Apache Arrow 框架实现高效的数据移动。Abbott 表示:"这实际上是所有这些数据库的加速器,而不是竞争对手。它仍然使用相同的 SQL 来获得相同的答案,但以并行方式更快地得到结果。"
早期采用主要集中在金融服务等数据密集型行业,用例包括欺诈检测、风险建模和合规监管。据 Aramburu 介绍,一家大型零售商在实施 Theseus 后,将服务器数量从 1,400 台 CPU 机器减少到仅 14 台 GPU 服务器。
自去年 3 月在 Nvidia 的 GTC 大会上推出以来,Voltron Data 已获得约 14 个企业客户,包括两个大型政府机构。该公司计划发布"试驾"版本,让潜在客户可以在 TB 级数据集上体验 GPU 加速查询。
将 GPU 短缺转化为机遇
当前由 AI 需求引发的 GPU 短缺对 Voltron Data 来说既是挑战也是机遇。虽然新部署面临硬件限制,但许多企业拥有原本为 AI 工作负载购买的未充分利用的 GPU 基础设施,这些资产可以在空闲期间用于数据处理。
Aramburu 指出:"我们实际上将其视为一个利好,因为市场上现在有很多以前没有的 GPU。"他补充说,Theseus 可以在可能已被淘汰的旧版 GPU 上有效运行。
Abbott 表示,这项技术对于处理他所说的"受困数据"的银行特别有价值——这些数据被锁在 PDF 和文档等格式中,可能对 AI 训练有价值,但难以大规模访问和处理。"从 Voltron 展示的数据来看,使用这项技术移动数据的效率可能比标准 CPU 高 90%,"Abbott 说,"这就是它的威力所在。"
随着企业努力应对 AI 的数据需求,能够加速数据处理和降低基础设施成本的解决方案将变得越来越重要。与埃森哲的合作可以帮助 Voltron Data 接触到更多面临这些挑战的组织,同时为埃森哲的客户提供可以显著提高其 AI 计划性能和效率的技术。
好文章,需要你的鼓励
科技领袖Pat Gelsinger加入Gloo创业公司,致力于为信仰社区开发价值导向的AI技术平台,探索科技如何成为促进社会正向发展的力量。
科技巨头和初创公司正在开发人形机器人,利用先进AI模型赋能机器人可以执行家务和物流工作,但仍面临诸多技术和信任挑战。
来自加州帕洛阿尔托的 AI 初创公司 Reve AI 正式发布了 Reve Image 1.0 文本生成图像模型。该模型在提示词遵循度、美学效果和文字渲染方面表现出色,目前可在 preview.reve.art 免费体验。作为该公司的首个产品,Reve Image 凭借其卓越的性能已跃居第三方基准测试榜首,超越了包括 Midjourney v6.1 和 Google Imagen 3 在内的多个竞品。
OpenAI 终于为其旗舰聊天机器人 ChatGPT 启用了 GPT-4o 的原生多模态图像生成功能。与传统的 DALL-E 3 相比,这项新功能作为同一模型的一部分,能够同时理解和生成文本、代码和图像,展现出更高质量的图像生成能力和更准确的文字渲染效果,已经获得用户的高度赞誉。