HPE近日宣布将简化Ezmeral数据分析产品组合,刷新用户界面,扩大提供开源工具的选择范围,集成对象和流数据源,并提高跨多个云的互操作性。
HPE表示,将通过提供独立于底层基础设施的完整数据和分析平台来解决数据孤岛的问题。增强的Ezmeral Data Fabric软件提供了跨混合云和多云部署的数据联合视图,以实现更直接的访问和治理,同时促进托管和精选开源工具的自助使用。
HPE表示,随着对文件、对象、表格和流的支持不断扩展,该软件套件可以跨多种数据源和格式以及公有云和私有云部署,现在还首次作为软件即服务产品提供给用户,具有自动策略管理功能,可让用户优化工作负载的部署。
开源承诺
Ezmeral Unified Analytics Software套件中包含了以即服务形式交付的各种开源工具(如图),包括Apache Airflow工作流管理平台、Apache Spark分析框架、Apache Superset可视化平台、Presto SQL分布式数据存储和Ray分布式计算框架。
用于AI应用训练和部署的Ezmeral,将支持机器学习Feast特征库、Kubernetes上的Kubeflow机器学习平台以及MLFlow机器学习管理平台。此外,HPE还引入了新的连接器和数据源,覆盖Snowflake的Data Cloud、MySQL、Databricks的DeltaLake、Teradata和Oracle的数据仓库。
HPE表示,该产品在设计上是混合的,可以跨边缘、托管、本地环境和公有云环境进行部署。与位置无关的部署还降低了数据传入和传出的费用。
意义重大
“这对我们来说是意义重大的,”HPE公司副总裁、Ezmeral Software总经理Mohan Rajagopalan这样表示。“我们将带着涉及数据和下一代工具的产品组合进入市场。过去,Ezmeral有十几款产品,现在已经简化为两款。”
Rajagopalan表示,这次公告突显了HPE通过托管服务支持开源项目的承诺,这些服务消除了客户应用补丁和升级的需要,同时使他们能够构建跨多个平台工作的应用。
他说:“我们不想制造分歧,我们希望鼓励真正的开源。我们负责更新和修补,但你可以自由地进行集成。”
支持的平台包括GreenLake,这是HPE的一系列硬件和软件产品,企业可以在类似云的即用即付消费基础上购买这些产品。
Rajagopalan表示:“我们有许多客户仍处于所谓的气隙环境中,我们已经与GreenLake进行了集成,通过SaaS交付模式向他们交付。”
他说,在支持任何格式数据这一更宏达更长期的战略之下,HPE扩大了对对象和流的支持。此外,HPE计划在Ezmeral的未来版本中增加对图形和表格的支持。
好文章,需要你的鼓励
这项研究介绍了Ankh3,一种创新的蛋白质语言模型,通过多任务预训练策略显著提升了模型性能。研究者采用两种互补任务:多掩码概率的掩码语言建模和蛋白质序列补全,使模型仅从蛋白质序列就能学到更丰富的表示。实验表明,Ankh3在二级结构预测、荧光预测等下游任务中表现优异,尤其在模型未曾训练过的任务上展现出强大泛化能力,为蛋白质设计和分析开辟了新路径。
法国波尔多大学研究团队开发了一个突破性框架,用于神经退行性痴呆症的差异化诊断。该框架将3D脑部MRI转换为文本报告,并利用强化学习优化的大语言模型进行详细诊断推理。不同于传统"黑箱"方法,这一系统能生成透明、有因果关系的解释,同时保持高诊断准确率。研究显示,通过群组相对策略优化(GRPO)训练的轻量级模型能展现复杂推理行为,包括假设检验和非线性思考,提供与临床决策流程一致的排序诊断结果。
这项研究提出了CLUE框架,首次能够生成自然语言解释来揭示AI事实核查系统不确定性的来源。与现有方法不同,CLUE能识别文本片段间的冲突与一致关系,并解释它们如何影响模型的预测不确定性。实验表明,CLUE生成的解释在三种语言模型和两个事实核查数据集上都更忠实于模型不确定性,用户评价其更有帮助、信息更丰富、冗余更少且逻辑更一致。CLUE不需要微调或架构更改,适用于任何白盒语言模型,为事实核查提供了实用支持。
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。