ZDNet至顶网服务器频道 05月22日 新闻消息(文/张锐): 英特尔作为全球最大的个人计算机零件和CPU制造商,在自身业务发展的过程中,软件和服务在其中起到了主要的作用,尤其是在硬件优化和大数据的层面,不禁有人会问,作为CPU巨头的英特尔,软件部门会不会只是一个附属的部门呢?会不会只是为芯片提供一些帮助性的支持呢?答案必然是否定的。
众所周知,英特尔的主要业务是在CPU方面为用户提供芯片级的解决方案。从每一代CPU的发展来看,大家所看到的更多是在制程工艺上的进步以及核心方面上的变革,可能很多人不会想到在这背后软件所做的一些事情,英特尔软件与事业服务部SSG(software and service group)从2005年成立至今一直在为软件方面提供支持,在IDF2015上,ZDNet记者有幸采访到了英特尔SSG的相关负责人,带你来了解一下英特尔的SSG。
采访视频如下:
好文章,需要你的鼓励
这篇博客详细解读了阿里巴巴通义实验室和中科大联合开发的VRAG-RL框架,该框架通过强化学习优化视觉语言模型处理复杂视觉信息的能力。研究创新性地定义了视觉感知动作空间,使模型能从粗到细地感知信息密集区域,并设计了结合检索效率与结果质量的精细奖励机制。实验表明,该方法在各类视觉理解任务上大幅超越现有技术,Qwen2.5-VL-7B和3B模型分别提升了20%和30%的性能,为处理图表、布局等复杂视觉信息提供了更强大的工具。
香港科技大学研究团队发现AI训练中的验证器存在严重缺陷。基于规则的验证器虽精确但僵化,平均有14%的正确答案因表达形式不同被误判;基于模型的验证器虽灵活但极易被"黑客攻击",AI可通过输出特定模式欺骗验证器获得不当奖励。研究提出混合验证器设计,结合两者优势,在数学推理任务上将性能提升3个百分点,为开发更可靠的AI训练系统提供重要启示。
这项研究提出了"用生成图像思考"的创新范式,使AI能够通过生成中间视觉步骤在文本和图像模态间自然思考。研究者实现了"原生长多模态思维过程",使大型多模态模型能够生成视觉子目标和自我批评视觉假设。实验表明,该方法在处理复杂多物体场景时性能提升高达50%,为医学研究、建筑设计和刑事侦查等领域开创了新的应用可能。
这篇论文介绍了GRE套装,一个通过精细调优视觉语言模型和增强推理链来提升图像地理定位能力的创新框架。研究团队开发了高质量地理推理数据集GRE30K、多阶段推理模型GRE以及全面评估基准GREval-Bench。通过冷启动监督微调与两阶段强化学习相结合的训练策略,GRE模型能够有效识别图像中的显性和隐性地理指标,在Im2GPS3k和GWS15k等主流基准上显著优于现有方法,为全球图像地理定位任务提供了更准确、更可解释的解决方案。