业界云迁移的讨论主要关注如何重新设计应用程序以充分利用云服务,然后将应用程序迁移到云端。
而较少受到关注的话题是如何将数据迁移到云中。这是件有点尴尬的事情,因为数据迁移到云中其实是云迁移中最复杂的一个部分,而且在某些情况下,也是最麻烦的一个部分。将数据迁移到云中的方法很多,规划正确的数据迁移策略时也需要权衡很多考量因素。
考虑到这一现实,下面来看看将数据从本地或私有存储迁移到云端时需要解决的五个关键因素。
在云中托管应用程序的方式不止一种(例如,你可以使用虚拟机、无服务器功能或容器),同样,云存储服务也有很多类型。主要的选择包括:
不同类型的云存储有不同的优点和缺点。例如,对象存储往往是最便宜的存储形式,特别是在利用冷存储层的优势时是这样。但对象存储的非结构化性质不太适合那些需要以某种方式组织数据的应用。
因此,要将数据迁移到云中,你必须评估你的数据属于哪些类型以及这些数据在云端需要实现的功能,然后确定哪种类型的云存储服务最适合你的使用情况。
数据整合是一个将来自多个来源的数据合并以减少总体大小的过程,可以通过减少你必须存储的数据量来帮助你省钱。云数据迁移则是执行整合的绝佳时机。
毕竟,你肯定不想等到你的数据已经在云中了才去弄清楚哪些数据可以合并在一起。要在数据还在本地时就进行这项工作,这样你就可以减少首次迁移到云端的数据量。
那些保护本地数据的访问控制系统在云中并不总是有效的。例如,高度敏感的本地数据可以用“气隙隔离”,即是说将数据从网络断开,达到减少基于互联网的攻击威胁的目的。在云中没法这样做,因为云总是连网的。
同样,一些本地使用的访问控制框架可以用来限制用户对数据的访问权限,这些框架在云中可能就用不了,在云中的访问控制需求管理用的是云提供商的身份和访问管理(IAM)系统。
这意味着,在把数据迁移到云端时,你必须重新思考你的数据安全策略。你可能需要实施不同的工具,你可能需要重新思考你的数据架构的各个基本方面,以减轻未经授权的访问风险。
沿着类似的思路,在把数据迁移到云端时,你可能需要重新思考你的数据备份策略。
如果你的数据存储在云中,数据备份放在到外部位置(如内部存储、另一个云或者最好同时存内部存储和另一个云)可以说是保持数据安全的最安全方式。你也可以选择将数据备份到同一个云的一个独立区域,从独立区域恢复数据通常比从外部位置备份更快。
将数据迁移到云中可能会改变数据实际所在地的地缘政治管辖权。这种改变可能会带来合规性问题。你的企业可能要满足某些数据必须保存在特定国家的规则的要求,或者你可能由于数据存储一个新的地区而受到新合规性的约束。
无论你的具体情况如何,都需要意识到将数据迁移到云中的合规性问题,并确保你准备好解决这些问题,这一点非常重要。
将数据从企业内部迁移到云端可能比最初看起来要复杂得多。迁移到云端很少会是简单地将数据从一个存储位置搬到另一个存储位置。如果你想保护你的数据安全,同时还要优化成本和性能,你就必须要在制定云数据迁移策略时权衡各种不同的考量。
好文章,需要你的鼓励
多伦多大学研究团队提出Squeeze3D压缩框架,巧妙利用3D生成模型的隐含压缩能力,通过训练映射网络桥接编码器与生成器的潜在空间,实现了极致的3D数据压缩。该技术对纹理网格、点云和辐射场分别达到2187倍、55倍和619倍的压缩比,同时保持高视觉质量,且无需针对特定对象训练网络,为3D内容传输和存储提供了革命性解决方案。
浙江大学与腾讯联合研究团队提出MoA异构适配器混合方法,通过整合不同类型的参数高效微调技术,解决了传统同质化专家混合方法中的表征坍塌和负载不均衡问题。该方法在数学和常识推理任务上显著优于现有方法,同时大幅降低训练参数和计算成本,为大模型高效微调提供了新的技术路径。
耶鲁、哥大等四校联合研发的RKEFino1模型,通过在Fino1基础上注入XBRL、CDM、MOF三大监管框架知识,显著提升了AI在数字监管报告任务中的表现。该模型在知识问答准确率提升超过一倍,数学推理能力从56.87%提升至70.69%,并在新颖的数值实体识别任务中展现良好潜力,为金融AI合规应用开辟新路径。
加州大学圣巴巴拉分校研究团队开发出能够自我进化的AI智能体,通过《卡坦岛拓荒者》桌游测试,这些AI能在游戏过程中自主修改策略和代码。实验显示,具备自我进化能力的AI显著超越静态版本,其中Claude 3.7模型性能提升达95%。研究验证了AI从被动工具向主动伙伴转变的可能性,为复杂决策场景中的AI应用开辟新路径。