SPEC系统性能评估测试是测试系统总体性能的Benchmark。SPEC是1988年由全球几十所知名大学、研究机构、IT企业组成的全球性的、权威的第三方应用性能测试组织,旨在确立、修改以及认定一系列服务器应用性能评估的标准。
SPEC
作为第三方产品性能测试机构,SPEC有着很好的客观性,测试结果能够经得住敲打,被企业和用户所认可,被很多中小企业用户作为采购产品衡量标准之一。在“SPEC组织”全球年会上,SPEC董事会向浪潮颁发了特殊贡献奖,以表示对浪潮在推进SPEC测试发展及SPEC中国化方面所做工作的认可。
在SPEC测试标准开发和制定过程中,浪潮不仅做出了自己的贡献,作为OSG(开放计算)技术委员会的委员给出建议,行使表决权,而且在SPEC在中国的推广过程中,浪潮更起到了重要作用,并在2004年,浪潮就创造了SPECjAppServer2002最好成绩,成为第一家打破SPEC组织测试记录的中国企业。
浪潮集团副总裁胡雷钧在SPEC年会上发表演讲,并表示:浪潮已经完成了SPEC CPUv6模型的测试和验证,并向OSG提交了报告,在其他领域,如Java性能及虚拟化性能测试等方面提供了大量技术支持工作。接下来,浪潮将在更多测试模型的开发和升级中发挥作用,并开始在云计算、大数据、网络存储等大规模应用性能测试方面和SPEC组织展开合作。
正是浪潮这种对产品性能的关注和执着追求,让浪潮获得了此次SPEC特殊贡献奖。而这种对产品性能的执着追求,也让浪潮的产品在实际应用中获得了如潮的好评。
某企业烟草项目负责人表示:物流系统运行至今已9年,抛开性能先不谈,我现在最担心的还是它的稳定性。一语道破了烟草行业的关键。烟草行业作为国家支柱产业之一,在信息化过程中如何能够做到负载均衡,系统稳定才是关键。
点击率CPU使用以及IO状况
于是,该企页通过采购浪潮天梭K1 910对整个系统镜像了大换血,并对全新的系统镜像了实测。负责人说,针对性能层面,他们加以数倍(有3倍、有6倍)于实际应用的工作负载来测试,K1 910表现从容;针对稳定性、可靠性及可用性层面,他们进行了一个月时间的不间断测试,没有发生过故障。
可以说K1自从发布以来,就备受关注,此次应用在某烟草企业的实测数据,又为K1的真实实力提供了很好的例子。
好文章,需要你的鼓励
这项研究提出了HoPE(混合位置编码),一种针对视觉语言模型的新型位置编码技术,专门解决长视频理解的挑战。传统位置编码技术在处理长视频时表现不佳,HoPE通过两个创新解决了这一问题:混合频率分配策略(为空间信息分配高频,时间维度使用零频率)和动态时间缩放机制(根据视频速度灵活调整时间编码)。实验证明,HoPE在长视频理解和检索任务上分别提升了8.35%和22.23%,为AI更准确理解长视频内容开辟了新途径。
东京大学研究团队推出MangaVQA基准和MangaLMM模型,专门用于评估和提升AI对日本漫画的理解能力。MangaVQA由526个高质量手动创建的问答对组成,用于评估AI系统对漫画内容的深入理解;MangaOCR则专注于漫画页内文本识别。基于这两个基准,研究团队从开源多模态模型Qwen2.5-VL微调出MangaLMM,能同时处理文本识别和内容理解任务。实验显示,即使是GPT-4o等顶尖商业模型在处理漫画的独特复杂性时也面临挑战,而专门训练的MangaLMM表现出色。
这项研究由ISTA和谷歌研究院联合开发的"影响力蒸馏"方法,通过利用二阶信息为训练样本分配最优权重,实现了大语言模型训练数据的高效选择。该方法在数学上有坚实理论支持,并创新性地引入"地标"近似技术,仅需计算少量样本的精确影响力,再高效传播到其他样本,大幅降低计算成本。实验证明,该方法在多种模型和任务上均优于或匹配现有技术,同时实现了高达3.5倍的速度提升,为大模型训练开辟了更高效的路径。
来自哈佛大学等顶尖学府的研究团队在这篇论文中挑战了传统观念,认为Token压缩不仅仅是提高AI模型运行效率的工具,更应成为生成式AI模型设计的核心原则。研究表明,精心设计的Token压缩策略可以促进多模态深度整合、减轻AI"幻觉"问题、增强处理长序列输入的能力,并提高训练稳定性。论文详细分析了现有方法的局限性,并提出了算法创新、强化学习指导和硬件协同设计等未来研究方向。