近日,一家大型云服务商发生了全球IT系统宕机事件。该事件无疑成为对各行各业的一次强烈警示,系统停机和服务中断很难避免。此次事件波及银行业、零售业及医疗业的各项服务,暴露了企业在依赖单一云供应商或单一区域部署时所面临的重大业务风险。

此次宕机并非云计算技术本身的缺陷,而是单一供应商策略所带来的结构性风险。它作为一个突出案例,该事件说明了混合云策略的重要性。企业要想构建真正稳健的IT体系,就需要拥有在云端与数据中心之间自由迁移数据和AI工作负载的策略,具备多云能力。
正因如此,对于想要保障业务连续性的企业而言,Cloudera的“复杂环境中的云”方案无疑是明智的选择。我们所说的“运用复杂环境中的数据”是以实践为基础的,无论在企业的数据中心、边缘设备,还是跨多个公有云环境,数据都可以自由流动。
混合云:企业自由的基石
多年来,Cloudera一直倡导混合云战略,并将其视为企业实现数字化自由的基础。我们相信,企业应当具备灵活的部署能力,在符合业务需求的位置运行数据与AI工作负载,无论是在自有数据中心、公有云,还是边缘端。同时,企业也应根据业务需求的变化,自由地在不同环境间迁移工作负载。
混合云的目标是在复杂环境中提供一致的云体验。用户既能获得公有云的敏捷性和可扩展性,又能保持私有云的安全性和可控性。这种方案旨在赋予企业自由,使其能够在不同云和数据中心之间无缝移动数据与AI工作负载,避免被供应商锁定。这种摆脱基础设施锁定的自由,正是弹性架构的核心所在。
混合云架构需包含多云功能以增强弹性
尽管混合架构提供了灵活性和选择权,但最近的云服务宕机事件也暴露出混合架构策略的一个关键盲点。如果企业的架构只是将数据中心连接到单一公有云供应商,企业仍然面临巨大的风险。企业只是用一个单点故障替换了另一个单点故障。
而真正的弹性在于消除单点故障。因此,现代混合云战略需要同时具备多云能力。实现真正的业务连续性,企业需要拥有在各类环境中故障转移的自由。这种能力需要超越简单的本地到云的连接,更涵盖云区域间的故障转移、返回数据中心的故障转移,以及更重要的在不同云供应商之间的故障转移。
Cloudera平台将多云弹性变为现实
理论上,多云故障转移策略似乎是理想的解决方案,但在实际操作中极为复杂。不同云供应商拥有不同的API、数据服务及安全模型。对多数企业而言,将关键任务数据工作负载从一个云迁移到另一个云,意味着要耗费大量时间和成本重构应用、重新设计安全策略并迁移数据。
而降低这种复杂性,正是Cloudera平台旨在解决的问题。Cloudera平台通过以下两项关键能力,实现了真正的“各类环境中的故障转移”:
以上方案组合能够实现多云弹性。企业可以在一个云供应商上运行主要工作负载,同时通过Replication Manager在不同云服务商上维护同步的备份环境。当主服务商发生故障时,企业可快速启用备份环境,确保业务连续性,更大限度减少数据丢失和停机时间。
混合云策略必须具备多云就绪能力
此次宕机事件应被视为一次演练,检验了各企业的弹性策略,也暴露出一个普遍但关键的漏洞,即企业对单一供应商的依赖。混合架构是现代企业的基础,但如果企业策略存在单一供应商的盲点,则无法真正实现弹性。企业需要认识到这一点,才可以做到在下一次中断发生时更好的应对。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。