业界云迁移的讨论主要关注如何重新设计应用程序以充分利用云服务,然后将应用程序迁移到云端。
而较少受到关注的话题是如何将数据迁移到云中。这是件有点尴尬的事情,因为数据迁移到云中其实是云迁移中最复杂的一个部分,而且在某些情况下,也是最麻烦的一个部分。将数据迁移到云中的方法很多,规划正确的数据迁移策略时也需要权衡很多考量因素。
考虑到这一现实,下面来看看将数据从本地或私有存储迁移到云端时需要解决的五个关键因素。
在云中托管应用程序的方式不止一种(例如,你可以使用虚拟机、无服务器功能或容器),同样,云存储服务也有很多类型。主要的选择包括:
不同类型的云存储有不同的优点和缺点。例如,对象存储往往是最便宜的存储形式,特别是在利用冷存储层的优势时是这样。但对象存储的非结构化性质不太适合那些需要以某种方式组织数据的应用。
因此,要将数据迁移到云中,你必须评估你的数据属于哪些类型以及这些数据在云端需要实现的功能,然后确定哪种类型的云存储服务最适合你的使用情况。
数据整合是一个将来自多个来源的数据合并以减少总体大小的过程,可以通过减少你必须存储的数据量来帮助你省钱。云数据迁移则是执行整合的绝佳时机。
毕竟,你肯定不想等到你的数据已经在云中了才去弄清楚哪些数据可以合并在一起。要在数据还在本地时就进行这项工作,这样你就可以减少首次迁移到云端的数据量。
那些保护本地数据的访问控制系统在云中并不总是有效的。例如,高度敏感的本地数据可以用“气隙隔离”,即是说将数据从网络断开,达到减少基于互联网的攻击威胁的目的。在云中没法这样做,因为云总是连网的。
同样,一些本地使用的访问控制框架可以用来限制用户对数据的访问权限,这些框架在云中可能就用不了,在云中的访问控制需求管理用的是云提供商的身份和访问管理(IAM)系统。
这意味着,在把数据迁移到云端时,你必须重新思考你的数据安全策略。你可能需要实施不同的工具,你可能需要重新思考你的数据架构的各个基本方面,以减轻未经授权的访问风险。
沿着类似的思路,在把数据迁移到云端时,你可能需要重新思考你的数据备份策略。
如果你的数据存储在云中,数据备份放在到外部位置(如内部存储、另一个云或者最好同时存内部存储和另一个云)可以说是保持数据安全的最安全方式。你也可以选择将数据备份到同一个云的一个独立区域,从独立区域恢复数据通常比从外部位置备份更快。
将数据迁移到云中可能会改变数据实际所在地的地缘政治管辖权。这种改变可能会带来合规性问题。你的企业可能要满足某些数据必须保存在特定国家的规则的要求,或者你可能由于数据存储一个新的地区而受到新合规性的约束。
无论你的具体情况如何,都需要意识到将数据迁移到云中的合规性问题,并确保你准备好解决这些问题,这一点非常重要。
将数据从企业内部迁移到云端可能比最初看起来要复杂得多。迁移到云端很少会是简单地将数据从一个存储位置搬到另一个存储位置。如果你想保护你的数据安全,同时还要优化成本和性能,你就必须要在制定云数据迁移策略时权衡各种不同的考量。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。