Supermicro宣布其全系列的H13 AMD系统可支持“Zen 4c”架构的第4代AMD EPYC™ 处理器和采用AMD 3D V-Cache™技术的第4代AMD EPYC处理器。
Supermicro服务器搭载第4代AMD EPYC处理器,适用于云端原生计算,拥有领先的线程密度和每个插槽128个内核,提供出色的机架密度及可扩展的性能与能源效率 ,能够在整合性更高的基础架构中部署云原生工作负载。 这些系统专门用于帮助云运营商应对不断增长的用户会话需求,并提供支持人工智能(AI)的新型态服务。
采用AMD 3D V-Cache技术的服务器,在执行FEA、CFD和EDA技术应用程序方面均有卓越表现。 凭借大容量的三级缓存,这类的应用程序执行速度较以往有大幅提升。 在过去几年中,AMD EPYC处理器创下了50多项基准测试的世界纪录。
Supermicro总裁暨首席执行官梁见后(Charles Liang)表示:“为了满足客户的需求,Supermicro不断突破着产品系列的界限。我们设计并交付节约资源型、应用优化型服务器,具有机柜级的整合,能实现快速部署。 随着我们为第4代AMD EPYC处理器全面优化的系统产品组合不断扩大,云运营商现在可以为数量庞大的用户和云原生服务实现极高的密度和效率,即使面对数据中心空间受限的情况也是如此。此外,我们经过强化、高性能、多插槽的多节点系统可应对广泛的技术计算工作负载,让制造公司运用内存密集型应用程序的加速效能来设计、开发和验证新产品,进而大幅缩短上市时间。”
AMD服务器产品和技术营销副总裁Lynn Comp表示:第四代AMD EPYC™处理器提供了市面x86处理器中最高的内核密度,将为云原生工作负载提供出色的效能和效率。 我们最新的数据中心处理器系列能让客户在关键基础设施整合要求的工作负载增长和灵活性之间取得平衡,通过云原生计算为数据中心带来变革,帮助客户完成更多工作的同时提高能源效率。”
好文章,需要你的鼓励
初创公司Positron获得5160万美元A轮融资,推出专门针对AI推理的Atlas芯片。该公司声称其芯片在性能功耗比和成本效益方面比英伟达H100高出2-5倍,并已获得Cloudflare等企业客户采用。Positron专注于内存优化设计,无需液体冷却,可直接部署在现有数据中心。公司计划2026年推出支持16万亿参数模型的下一代Titan平台。
这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。
忽视智能体AI的潜力,特别是其对现代化数据基础设施的需求,面临着与忽视互联网的零售商相同的生存风险。关键不在于是否投资,而在于如何确保投资转化为可衡量的现实收益。企业需要超越AI试验阶段,明确业务目标,从治理开始构建ROI模型。成功的组织在整个技术栈中嵌入智能体,从面向客户的应用到内部治理系统。通过强化数据治理、减少重复工具和统一平台,AI的ROI将从理论变为现实。
上海AI实验室联合多所高校开发出VisualPRM系统,这是首个专门用于多模态推理的过程奖励模型。该系统能像老师批改作业一样逐步检查AI的推理过程,显著提升了AI在视觉推理任务上的表现。研究团队构建了包含40万样本的训练数据集和专门的评估基准,实现了在七个推理基准上的全面性能提升,即使是最先进的大型模型也获得了5.9个百分点的改进。