业界云迁移的讨论主要关注如何重新设计应用程序以充分利用云服务,然后将应用程序迁移到云端。
而较少受到关注的话题是如何将数据迁移到云中。这是件有点尴尬的事情,因为数据迁移到云中其实是云迁移中最复杂的一个部分,而且在某些情况下,也是最麻烦的一个部分。将数据迁移到云中的方法很多,规划正确的数据迁移策略时也需要权衡很多考量因素。
考虑到这一现实,下面来看看将数据从本地或私有存储迁移到云端时需要解决的五个关键因素。
在云中托管应用程序的方式不止一种(例如,你可以使用虚拟机、无服务器功能或容器),同样,云存储服务也有很多类型。主要的选择包括:
不同类型的云存储有不同的优点和缺点。例如,对象存储往往是最便宜的存储形式,特别是在利用冷存储层的优势时是这样。但对象存储的非结构化性质不太适合那些需要以某种方式组织数据的应用。
因此,要将数据迁移到云中,你必须评估你的数据属于哪些类型以及这些数据在云端需要实现的功能,然后确定哪种类型的云存储服务最适合你的使用情况。
数据整合是一个将来自多个来源的数据合并以减少总体大小的过程,可以通过减少你必须存储的数据量来帮助你省钱。云数据迁移则是执行整合的绝佳时机。
毕竟,你肯定不想等到你的数据已经在云中了才去弄清楚哪些数据可以合并在一起。要在数据还在本地时就进行这项工作,这样你就可以减少首次迁移到云端的数据量。
那些保护本地数据的访问控制系统在云中并不总是有效的。例如,高度敏感的本地数据可以用“气隙隔离”,即是说将数据从网络断开,达到减少基于互联网的攻击威胁的目的。在云中没法这样做,因为云总是连网的。
同样,一些本地使用的访问控制框架可以用来限制用户对数据的访问权限,这些框架在云中可能就用不了,在云中的访问控制需求管理用的是云提供商的身份和访问管理(IAM)系统。
这意味着,在把数据迁移到云端时,你必须重新思考你的数据安全策略。你可能需要实施不同的工具,你可能需要重新思考你的数据架构的各个基本方面,以减轻未经授权的访问风险。
沿着类似的思路,在把数据迁移到云端时,你可能需要重新思考你的数据备份策略。
如果你的数据存储在云中,数据备份放在到外部位置(如内部存储、另一个云或者最好同时存内部存储和另一个云)可以说是保持数据安全的最安全方式。你也可以选择将数据备份到同一个云的一个独立区域,从独立区域恢复数据通常比从外部位置备份更快。
将数据迁移到云中可能会改变数据实际所在地的地缘政治管辖权。这种改变可能会带来合规性问题。你的企业可能要满足某些数据必须保存在特定国家的规则的要求,或者你可能由于数据存储一个新的地区而受到新合规性的约束。
无论你的具体情况如何,都需要意识到将数据迁移到云中的合规性问题,并确保你准备好解决这些问题,这一点非常重要。
将数据从企业内部迁移到云端可能比最初看起来要复杂得多。迁移到云端很少会是简单地将数据从一个存储位置搬到另一个存储位置。如果你想保护你的数据安全,同时还要优化成本和性能,你就必须要在制定云数据迁移策略时权衡各种不同的考量。
好文章,需要你的鼓励
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
医疗信息管理平台Predoc宣布获得3000万美元新融资,用于扩大运营规模并在肿瘤科、研究网络和虚拟医疗提供商中推广应用。该公司成立于2022年,利用人工智能技术提供端到端平台服务,自动化病历检索并整合为可操作的临床洞察。平台可实现病历检索速度提升75%,临床审查时间减少70%,旨在增强而非替代临床判断。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。