至顶网服务器频道 08月30日 新闻消息:
芯片制造商英特尔公司表示,旗下今天宣布的新至强W(Xeon W)处理器将会改变工作站的格局,理由是这些至强W处理器是专为处理人工智能和虚拟现实开发的巨大处理需求而设计的。
英特尔曾在7月宣布推出旗下基于Skylake的可扩展至强平台,该产品包括一系列企业级处理器,处理内核数起步为8颗,最多可达28颗。至强芯片有些是用于服务器的,但至强 W系列是为诸如iMac Pro等工作站而设计的。据英特尔称,至强W芯片将为新一代虚拟现实和机器学习应用的发展提供动力。
英特尔高管Lisa Spelman表示,“这些新的英特尔至强处理器为精英专业人士提供了将工作站数字创作带入生活所需的功能和功能。无论是做专业级虚拟、增强现实、全8K分辨率的内容创建、先进的计算机辅助设计和仿真还是进行我们尚未发现的创新,这些强大的处理器都可以为创意和技术专业人员在他们发挥想象力时提供强大的工具。
惠普公司副总裁兼Z工作站总经理Xavier Garcia表示,至强芯片非常适合那些“迫切需要计算资源”公司,为这些公司提供了在工作站领域里所需要的前沿技术。联想工作站总经理Rob Herman做了补充,他表示,至强芯片为用户提供了“新的灵活性和强大的功能,用户可用来处理最关键的专业工作负载,这可以帮助他们有效地完成工作”。
据英特尔公司称,与上一代芯片相比,至强W芯片的媒体和娱乐工作负载性能提高了3.3倍,而总体性能则上升了1.38倍。
英特尔的新至强W芯片肯定强大,但却也面临来自Advanced Micro Devices(AMD)公司的激烈竞争,AMD基于Zen的EPYC工作站处理器也提供许多功能。 AMD还声称旗下的工作站处理器非常适合机器学习和其他资源密集型处理任务。AMD称旗下的EPYC 7601单晶片系統的整数和浮点性能“胜过最好的英特尔至强E5 v4处理器CPU“。 AMD还声称自己的芯片具有“更好的平衡”。
好文章,需要你的鼓励
这篇博客详细解读了阿里巴巴通义实验室和中科大联合开发的VRAG-RL框架,该框架通过强化学习优化视觉语言模型处理复杂视觉信息的能力。研究创新性地定义了视觉感知动作空间,使模型能从粗到细地感知信息密集区域,并设计了结合检索效率与结果质量的精细奖励机制。实验表明,该方法在各类视觉理解任务上大幅超越现有技术,Qwen2.5-VL-7B和3B模型分别提升了20%和30%的性能,为处理图表、布局等复杂视觉信息提供了更强大的工具。
香港科技大学研究团队发现AI训练中的验证器存在严重缺陷。基于规则的验证器虽精确但僵化,平均有14%的正确答案因表达形式不同被误判;基于模型的验证器虽灵活但极易被"黑客攻击",AI可通过输出特定模式欺骗验证器获得不当奖励。研究提出混合验证器设计,结合两者优势,在数学推理任务上将性能提升3个百分点,为开发更可靠的AI训练系统提供重要启示。
这项研究提出了"用生成图像思考"的创新范式,使AI能够通过生成中间视觉步骤在文本和图像模态间自然思考。研究者实现了"原生长多模态思维过程",使大型多模态模型能够生成视觉子目标和自我批评视觉假设。实验表明,该方法在处理复杂多物体场景时性能提升高达50%,为医学研究、建筑设计和刑事侦查等领域开创了新的应用可能。
这篇论文介绍了GRE套装,一个通过精细调优视觉语言模型和增强推理链来提升图像地理定位能力的创新框架。研究团队开发了高质量地理推理数据集GRE30K、多阶段推理模型GRE以及全面评估基准GREval-Bench。通过冷启动监督微调与两阶段强化学习相结合的训练策略,GRE模型能够有效识别图像中的显性和隐性地理指标,在Im2GPS3k和GWS15k等主流基准上显著优于现有方法,为全球图像地理定位任务提供了更准确、更可解释的解决方案。