HPE正在收购一家名为Pachyderm的初创公司,该公司的软件平台旨在加速AI项目。

HPE在本周四宣布了这笔交易,预计交易在本月底结束,之后HPE将把Pachyderm的平台与HPE的AI软件组合整合在一起。总部位于旧金山的Pachyderm公司此前从投资方那里融资了2810万美元。
企业软件团队在训练数据集的帮助下可以开发AI模型。建立新的神经网络后,它的任务就是分析训练数据集,直到学会识别信息中感兴趣的模式。一旦神经网络达到足够高的准确度,就可以部署到生产环境中用于处理实时信息。
工程师用来提高AI模型准确性的训练数据集,通常无法以原始形式进行处理。在部署训练数据集之前,软件团队必须对数据集中可能包含的任何重复和错误记录进行过滤。准备过程通常还包括其他任务,例如将信息转换为可以使用较少硬件进行处理的形式。
准备AI训练数据集的过程是通过一种名为数据管道的自动化工作流程执行的。Pachyderm公司提供了一个平台,可以更轻松地构建数据管道。该平台可以在主流的公有云平台以及企业本地的基础设施上运行。
Pachyderm让开发人员能够编写脚本来自动执行单个数据准备任务,例如删除重复记录等等。然后,开发人员可以将这些脚本组合到数据管道中。Pachyderm使用Kubernetes容器编排引擎运行管道,这样就能够根据AI项目的要求自动添加或者删除硬件资源。
Pachyderm公司表示,他们的平台可以为每个AI项目处理高达TB级的数据,平台可以接收结构化的信息,例如电子表格、服务器日志和其他类型的文件。
Pachyderm对数据管道接收信息所做的更改操作创建了一个记录。工程师通过评估此记录,可以识别管道中潜在的技术问题。Pachyderm公司表示,该平台还能够重现过去AI项目的结果,从而更容易检查这些项目的准确性。
HPE执行副总裁、高性能计算和AI部门总经理Justin Hotard表示:“随着AI项目的规模越来越大,就越来越多地涉及复杂的数据集,数据科学家们需要可重现的AI解决方案,从而有效地最大化他们的机器学习计划,优化他们的基础设施成本,同时确保数据可靠和安全,无论他们在AI旅程的哪个阶段。”
HPE计划将Pachyderm与HPE机器学习开发系统进行集成,这是一个用于训练AI模型的软件平台,该平台基于HPE早期收购Determined AI获得的技术。
好文章,需要你的鼓励
随着员工自发使用生成式AI工具,CIO面临影子AI的挑战。报告显示43%的员工在个人设备上使用AI应用处理工作,25%在工作中使用未经批准的AI工具。专家建议通过六项策略管理影子AI:建立明确规则框架、持续监控和清单跟踪、加强数据保护和访问控制、明确风险承受度、营造透明信任文化、实施持续的角色化AI培训。目标是支持负责任的创新而非完全禁止。
NVIDIA研究团队开发的OmniVinci是一个突破性的多模态AI模型,能够同时理解视觉、听觉和文本信息。该模型仅使用0.2万亿训练样本就超越了使用1.2万亿样本的现有模型,在多模态理解测试中领先19.05分。OmniVinci采用三项核心技术实现感官信息协同,并在机器人导航、医疗诊断、体育分析等多个实际应用场景中展现出专业级能力,代表着AI向真正智能化发展的重要进步。
英国正式推出DaRe2THINK数字平台,旨在简化NHS全科医生参与临床试验的流程。该平台由伯明翰大学和MHRA临床实践研究数据链开发,能够安全传输GP诊所与NHS试验研究人员之间的健康数据,减少医生的管理负担。平台利用NHS现有健康信息,安全筛查来自450多家诊所的1300万患者记录,并使用移动消息系统保持试验对象参与度,为传统上无法参与的人群开辟了研究机会。
Salesforce研究团队发布BLIP3o-NEXT,这是一个创新的图像生成模型,采用自回归+扩散的双重架构设计。该模型首次成功将强化学习应用于图像生成,在多物体组合和文字渲染方面表现优异。尽管只有30亿参数,但在GenEval测试中获得0.91高分,超越多个大型竞争对手。研究团队承诺完全开源所有技术细节。