随着云计算、大数据等新兴应用广泛普及,业务数据呈现爆炸式增长,海量数据的高效访问、经济存储和智能管理变得越来越重要。
从数据生命周期来看,在数据刚生成并使用时,属于在线数据,在线数据访问的频率最高,数据的价值也最高,对数据访问的性能、数据的访问的连续性、数据逻辑错误后的恢复性有很高的要求,但随着时间的推移,在线热数据会逐步变成温数据,甚至冷数据和冰数据;据统计,超过30天的数据的使用率不到10%,但这些数据仍然很重要,如何处理和合理存储这部分数据,对IT系统的运维部门来讲,是一个需要解决的重要问题。
浪潮存储基于对数据需求特点的研究,发现不同时期的数据存在不同的需求,对于存储性能、成本的需求差异较大,基于这些特点提出了热、温、冷、冰四级分层数据生命周期管理策略,根据数据的访问频率不同,提供相应的方案和产品,通过数据分级集中管理,实现存储性能、容量和成本之间的平衡,提升系统的整体存储性能的同时,减少设备投入成本。
热温冷冰数据分级管理
热数据高可用,保障业务永续
MES( 制造执行系统)、HIS(医院信息系统)、ERP(企业资源计划)等结构化数据为主的关键业务,对存储性能、对业务连续性有非常高的要求,浪潮提供基于集中式存储平台的免网关存储双活方案,在双活模式下,两个数据中心具备等同的业务处理能力并通过高速链路实时同步数据,采用浪潮独有的WAN网络加速技术,通过先进的算法实现数据流压缩、固定块切割和多数据流并发,将远程传输的性能提升高达10倍、延时降低为原来的十分之一,仅占用少量的网络带宽就可以完成海量数据的远程复制,大幅降低企业对容灾网络带宽的依赖,节约成本。若其中一个数据中心出现故障,业务会立即自动切换到另一数据中心,保持业务连续运行,并且方案不需要单独网关,在降低了延迟的同时,也减少了网关带来的额外故障风险。
在此基础上,浪潮存储可以升级至容灾更全面的两地三中心方案,即生产数据中心、同城灾备中心、异地灾备中心。其中异地灾备中心提供数据备份,当同城中心因自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。两地三中心的设计架构,可在同城双中心遇自然灾害或人为破坏时,使用异地灾备中心及时恢复并提供有效的信息服务,从而保证业务和数据的连续性。
浪潮集中式存储两地三中心解决方案
在容灾方案中,浪潮集中式存储平台能够提供满足企业关键的业务需求的可靠性和性能。在可靠性方面,浪潮存储从器部件到存储操作系统再到算法进行了全面的加强。在性能方面,通过不断打磨以iTurbo为核心的加速引擎,优化资源调度算法,充分利用更多的CPU核心和线程承载更多的数据存储进程。通过搭载iTurbo智能引擎,浪潮集中式存储在SPC-1性能测试中创造了2300 万IOPS的世界纪录。
浪潮成熟的双活、两地三中心技术方案已经在金融、医疗等关键行业有大量的成功实践,无论是在实际发生的灾难还是灾备演练,RPO和RTO均接近于零,有效保障了用户关键业务的连续性。
温数据备份,确保数据安全
容灾方案通过数据多地存放,物理上保障了在线热数据业务连续,但遇到逻辑问题仍可能面临风险。比如当前端业务新建一个文档,修改一条数据,删除一个图片时,存储会把最新的状态保存下来,数据的历史状态一直会被最新的状态覆盖。无论是恶意入侵、误操作,还是正常操作,存储并不识别上层软件的意图。如果是异常操作,则需要专业的备份系统将数据恢复到操作之前的状态。
浪潮数据备份解决方案
浪潮备份解决方案部署备份一体机DP2000G6,单一设备可提供传统备份方案中备份软件、备份服务器、备份存储三者的功能,满足企业D2D及D2D2T备份需求,简化了用备份系统的建设和维护。浪潮备份方案通过合成多种备份技术,利用上一个全备份以及其后的增量备份生成一个新的备份,兼顾全备和增备的优势,有效应对需要备份大量文件的应用场景;并通过重删和压缩技术,提高了备份速率,降低了企业扩容成本。
温数据备份方案可以有效抵御因人为误操作、被勒索病毒攻击、以及自然灾害等不可抗拒力而导致的业务中断和数据丢失所带来的风险,帮助用户实现业务永远在线,数据永不丢失。
冷数据归档,低成本存储有保障
随着互联网、人工智能、大数据等新技术的快速应用,数据采集精确度不断提升,来源不断增多,传输效率也在快速提升,数据规模爆发式增长,其中80%以上多为图片、视频等非结构化数据。这些非结构数据在使用一段时间后,会积淀为使用频率不高的冷数据,但是冷数据并非失去价值,大数据、人工智能等新兴业务对海量冷数据进行检索和挖掘的需求依然存在而且日益迫切。面对体量巨大但访问性能要求不高的冷数据,传统存储无法满足海量冷数据的低成本存储需求。
基于数据存储成本、容量、性能等方面的权衡考量,浪潮存储采用分布式存储对海量冷数据进行管理,满足大数据等新兴业务对部分冷数据进行近线或在线访问的偶发存取性能要求。
浪潮分布式存储AS13000系列可同时提供文件、块、对象、大数据四种存储服务,实现一套存储支撑一个数据中心业务,极大地提高数据共享的效率,同时所有设备统一管理,减少设备维护和管理成本,降低TCO。此外,随着业务增长,浪潮分布式存储不仅可以通过扩展节点增加容量及性能资源,还能在所需的存储类型发生了巨大变化情况下,可以将原有块存储的资源进行释放,配置为文件存储空间,从而避免重复投资,帮助企业敏捷地应对海量数据业务复杂的存储需求。同时为了保障数据的安全,浪潮分布式存储还基于回收站功能有效防止数据误删;并采用数据冗余策略,支持业界最高的8份副本、4TB/H快速重构进一步提升系统可靠性。
冰数据离线,经济节能长期保存
除了企业自身业务的特点对数据有着长期保存需求之外,在特定的行业,对数据还有明确的监管要求,如医疗行业住院病历数据需要保存30年以上;测绘地理信息业务档案保管期限最长为永久;教育行业的学生信息,成绩,档案要求永久保存。针对于此类数据访问频率非常低,但需要保障安全的数据,浪潮存储采用了模块化的磁带库,在保障数据安全的情况下,提供持久经济的解决方案。
首先,从经济节能的角度,磁带采用纳米级磁性颗粒,存储密度更高,并且一个磁带驱动器可以对应大量的磁带,当扩容时,只需考虑存储介质的成本,同等容量下磁带存储的成本仅为磁盘的1/6;磁带离线存储记录下数据后,被存放在自动磁带库的卡槽中,不用定期通电维护,节省大量能耗。
其次,在安全可靠层面,磁带配有内置和动态加密,以及介质自身的性质带来额外的安全性,如离线状态隔绝了黑客和网络攻击,无法访问或修改数据;根据相关测试表明磁带出错率相当于硬盘万分之一,能保障数据保存期限长达30-50年。
浪潮冰数据离线解决方案支持最新的LTO9磁带,单系统最高可提供400多PB数据空间,满足金融、医疗、档案、石油勘探等行业的海量重要数据离线长期存储需求。
数据作为企业重要的数字资产,随着企业数字化转型不断加速,数据安全要求越来越高,数据价值挖掘越来越深,数据全生命周期的管理模式已成为企业在智慧时代下全新的需求。为此,浪潮提出“存储即平台”战略,以面向关键应用的集中式存储平台、面向智慧应用的分布式存储平台、保障数据安全的备份存储平台、长周期保存数据的归档存储平台四大平台,针对数据不同周期的性能、容量、成本等需求特点,提供数据全生命周期存储解决方案,助力企业提速数字化转型。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。