超大规模分析数据仓库供应商 Ocient 正与 AMD 展开合作,采用其第四代 EPYC CPU,使处理能力提升了 3.5 倍,内存吞吐量提高了一倍以上。
Ocient 提供一个大规模并行关系数据库系统,能够分析 PB 级数据,意味着可以在几秒到几分钟内处理数万亿行数据。Ocient 超大规模数据仓库 (OHDW) 采用计算邻接存储架构 (CASA),消除网络瓶颈并实现快速数据访问。其 Megalane 技术的特点是"通过启用极大数量的并行任务"来提高吞吐量。数据可靠性则由纠删码技术提供保障。
CEO Chris Gladwin 表示:"AI 和计算密集型数据分析工作负载正在给全球数据中心带来巨大压力,这意味着硬件和软件带来的效率对企业数据增长、性能和成本至关重要。我们很高兴能与 AMD 合作,以提升客户数据性能、节省成本,并提高运营和能源效率。"
Ocient 的超大规模数据仓库在处理器要求方面已经支持 Intel 和 AMD 两种 CPU。现在 AMD 成为了首选。
该公司告诉我们:"他们选择了配备 96 个实际核心的 AMD 9654,而不是前代 28 核心的 Intel Icelake 6348。增加的核心数量,加上提高的全核心时钟速度,带来了性能的提升。不仅如此,在 AMD 平台上,每个节点的成本、空间和功耗都相似,这使得 Ocient 能够在更小的系统占用空间内提供领先的性能解决方案,并且具有最具成本效益的功耗要求。"
Ocient 基于核心的许可模式优先考虑成本效益和计算密集型工作负载的性能。通过使用 AMD CPU,Ocient 表示其客户将获得:
- 计算密集型工作负载性能提升 3 倍 - 通过改进的功率和能源效率降低运营成本,每核心功耗降低 3 倍 - 为未来的 AI 和分析需求提供持续的可扩展性
该公司表示,由于 AI 和数据分析需求的增加,预计到 2026 年全球数据中心能源消耗将增加一倍以上,企业越来越需要寻找降低能源消耗的方法。转向 AMD 将有助于解决这个问题。
AMD 战略业务发展公司副总裁 Kumaran Siva 表示:"我们很高兴能与 Ocient 合作,将 AMD EPYC 处理器的性能与 Ocient 高效的软件解决方案相结合,使企业能够更轻松、高效地处理最具挑战性的 AI 和分析工作负载。"
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。