至顶网服务器频道 09月18日 新闻消息(文/刘新萍): 云计算应用和AI驱动的相关技术迅猛发展,由此产生的大量数据对企业基础架构中服务器系统的内存容量、带宽以及I/O性能等方面都提出了更加严苛的要求。真正意义上的下一代服务器,必须更加灵活地满足新应用的容量和使用要求,为企业的智慧化转型提供强有力的基础支持。
7月20日, 联想发布全新ThinkSystem数据中心基础设施和解决方案产品组合以及ThinkAgile软件定义的解决方案,满足不同类型客户对于计算力的不同需求。随着新品牌的正式亮相,ThinkSystem也发布了一系列新品,其中包括高密度服务器ThinkSystem SD530在内的14款服务器平台、7款存储产品、5款网络产品,帮助客户实现端到端的客户体验,完美结合了优异性能、灵活性和可靠性等特性,给传统企业注入发展活力。
ThinkSystem SD530兼具刀片式服务器的效率、密度及机架式服务器的价值与简洁性,是颇具适应性的服务器,同时兼备高密度及卓越的灵活性,拥有一流的计算容量,它不仅在重要的企业工作负载环境下表现优异,在高性能计算和人工智能方面同样可圈可点。
灵活适应,沉稳应对未来庞杂需求
"针对新兴工作负载进行基础架构扩展,并不意味着需要舍弃其对传统工作负载的处理能力。企业的当务之急是对基础架构进行灵活更新,使其在保证传统工作负载高标准运行的同时满足新兴工作负载需求。"相关业内人士指出,对于业务升级来说,通过满足企业不同工作负载需求的高性能服务器来搭建更具适应性的基础架构,成为企业未来IT架构的发展方向。
ThinkSystem SD530提供了大量有助于提高性能和灵活性的特性,并实现性能、适应性与价值的完美平衡。ThinkSystem SD530包含模块化2U Lenove D2机箱,由四个前端接入的SD530服务器组成。每个节点包含两个功能强大的英特尔?至强?可扩展处理器家族的处理器。与上一代产品相比,性能要高出56%。此外,D2机箱的创新性灵活性十足,可满足现代数据中心的各种需求。
ThinkSystem SD530拥有十足的灵活性,通过利用在企业工作负载和HPC工作负载方面均有优异表现的单个平台,可使用常用组件和管理以缩短认证和测试时间,并提高灵活性。这一点得益于D2机箱的颠覆性设计。装置的前端可容纳四个"热交换的"节点,以最大程度延长正常运行时间,可在不关闭其他三个节点的同时移除单个节点。每个SD530节点都包含处理器、内存以及6个SFF存储设备。
一流容量,奠定业务运营坚实基础
处理器不断发展推动性能的提升,也通过在技术上的创新架构,特别是将更多的创新内容放到一起,通过性能和可靠性的综合提升,实现客户在解决方案上的创新,同时一流容量的产品也更符合广泛的需求与期待。
单一平台设计使得ThinkSystem SD530以优异的性能处理各种工作负载,这不仅包括企业关键工作负载(如虚拟化、超融合基础架构和云计算),而且包括高性能计算(HPC)和人工智能(AI)。SD530可运行最高内核的英特尔?至强?铂金处理器,为要求最为严苛的HPC/AI工作负载提供支持。创新的D2机箱可容纳可选的1U托架,每个节点支持2个GPU或加速器,其内存和存储技术增强功能可在任何环境下实现卓越的性能和灵活性。
ThinkSystem SD530可提供行业领先的可靠性、可管理性和安全性,以及将来进行扩张所需的、优化了成本的性能和灵活性,同时满足小型和大型企业的需求。它能够处理一系列工作负载,如IT基础架构、协作和入门级云服务,为企业开展在线运营奠定坚实基础。
化繁为简,管理策略影响深远
形形色色的硬件颇为引人瞩目,而联想推出的管理策略的影响则更为深远。ThinkSystem SD530采用了Lenovo XClarity Controller通用全新硬件嵌入式管理引擎。XClarity Controller采用简洁的图形用户界面、符合行业标准的Redfish REST API,与上一代服务器相比,其启动时间缩短一半,固件更新速度提高6倍。
Lenovo XClarity Administrator则是一个可用于集中管理ThinkSystem服务器、存储和网络的虚拟化应用。它采用可重用的模式和策略,可加速并扩展基础架构配置和维护。它可作为中心集成点,将数据中心管理流程延伸到物理IT。在内部IT应用上运行XClarity Integrator,或通过REST API集成该应用,将有助于进一步加速服务部署,简化IT管理并降低成本,这也让联想服务器在可靠度方面始终高居榜首,并赢得了业内最高的客户满意度评分。
"我相信随着化繁为简的管理策略在ThinkSystem产品上的不断丰富和持续完善,它未来的市场接受程度和体验会有十分喜人的结果。我也相信凭借联想不同的硬件产品组合,完全可以满足企业对于云计算、大数据等不同新兴工作负载的不同需求,我们希望为企业提供一个在性价比、安全性、环保型等方面都极具优势的架构选择。"联想的工程师说道。
联想ThinkSystem数据中心基础设施和解决方案产品组合以及ThinkAgile软件定义的解决方案的问世,向业界展现了基于强大生态系统所带来的丰富行业解决方案及广阔前景。ThinkSystem SD530服务器通过强大的灵活适应性、多维度技术创新及一流容量等所指向的全新发展方向,表明联想助力中国企业构建面向最新技术趋势的IT基础架构的坚定决心。
好文章,需要你的鼓励
这项研究提出了HoPE(混合位置编码),一种针对视觉语言模型的新型位置编码技术,专门解决长视频理解的挑战。传统位置编码技术在处理长视频时表现不佳,HoPE通过两个创新解决了这一问题:混合频率分配策略(为空间信息分配高频,时间维度使用零频率)和动态时间缩放机制(根据视频速度灵活调整时间编码)。实验证明,HoPE在长视频理解和检索任务上分别提升了8.35%和22.23%,为AI更准确理解长视频内容开辟了新途径。
东京大学研究团队推出MangaVQA基准和MangaLMM模型,专门用于评估和提升AI对日本漫画的理解能力。MangaVQA由526个高质量手动创建的问答对组成,用于评估AI系统对漫画内容的深入理解;MangaOCR则专注于漫画页内文本识别。基于这两个基准,研究团队从开源多模态模型Qwen2.5-VL微调出MangaLMM,能同时处理文本识别和内容理解任务。实验显示,即使是GPT-4o等顶尖商业模型在处理漫画的独特复杂性时也面临挑战,而专门训练的MangaLMM表现出色。
这项研究由ISTA和谷歌研究院联合开发的"影响力蒸馏"方法,通过利用二阶信息为训练样本分配最优权重,实现了大语言模型训练数据的高效选择。该方法在数学上有坚实理论支持,并创新性地引入"地标"近似技术,仅需计算少量样本的精确影响力,再高效传播到其他样本,大幅降低计算成本。实验证明,该方法在多种模型和任务上均优于或匹配现有技术,同时实现了高达3.5倍的速度提升,为大模型训练开辟了更高效的路径。
来自哈佛大学等顶尖学府的研究团队在这篇论文中挑战了传统观念,认为Token压缩不仅仅是提高AI模型运行效率的工具,更应成为生成式AI模型设计的核心原则。研究表明,精心设计的Token压缩策略可以促进多模态深度整合、减轻AI"幻觉"问题、增强处理长序列输入的能力,并提高训练稳定性。论文详细分析了现有方法的局限性,并提出了算法创新、强化学习指导和硬件协同设计等未来研究方向。