作者:Safi Obeidullah,Citrix Field CTO,APJ亚太及日本地区首席技术官
很多原因都可能导致企业日常运营的中断。无论企业规模大小,都难免会发生一些突发情况,并因此影响员工的工作效率。导致业务中断的原因多种多样,包括自然灾害、IT事件、断电或电信服务中断等。问题是,企业应如何提前应对业务中断?
企业的灾难恢复计划可能更侧重于核心技术元素、数据中心、关键基础设施和系统;而业务连续性计划则立足于更广的视角,着眼于整个企业,从而尽量降低或完全避免业务中断对企业日常运营造成的影响。试想这样一种情况:IT系统100%可用,但员工却不能访问?他们要么无法赶往办公室,要么无法进行远程办公。那他们该如何开展工作呢?
对于任何规模的企业而言,制定业务连续性计划都是尤为关键的一步,因为它提供了一个旨在应对业务中断的框架。以下是从IT角度考虑保持企业业务连续性时,需要注意的一些指导方针:
无论是关键的IT基础设施和系统,还是业务流程,在设计和构建之初,都应该考虑到业务中断的情况。如果您在刚开始开展相关工作时,就考虑到了业务中断的应对之策,会比事后亡羊补牢要容易得多。
即使撇开技术不谈,仍需考虑到员工需要遵循的工作流程。由于许多业务流程都只存在于员工脑海中,因此应该对关键业务流程进行确认、记录并尽可能实现自动化。
当您所在的企业出现业务中断时,它不一定能够提供所有的服务。您需要确认较为关键的功能,并按照重要性对其进行排序,从而确保您的企业能够继续运营。要确保您从更广的角度看待业务运营,而不仅仅局限于IT领域,如果员工不能前往办公室工作,您的主要供应商是否有业务连续性计划来应对突发情况?
考虑到业务中断的不同方式,以及业务运营的不同环节会产生不同的影响,一旦您确定了关键功能,并对其可能受到的影响进行了评估,您就需要制定出对应的措施来降低相关风险。应对措施可能是切换至手动流程,也可能是需要特定的技术解决方案。要确定替代的运营模式,并将其纳入到业务连续性计划中。
必须将清晰的业务连续性计划存档,并存放在适当的地方,以便所有需要它的人都能够正常访问,而且尤为重要的是,在任何地方都能够访问。将计划存放在数据中心的服务器上就毫无意义,因为您不在办公室时,就无法访问这些服务器!
业务连续性计划应涵盖以下内容:
最后,业务连续性计划的制定并非一蹴而就。随着业务的变化,无论是增加了新的系统或流程,还是设置了新的业务功能,都要随之更新业务连续性计划的内容,保证它成为一份不断完善的动态文档。
目前,制定业务连续性计划是确保业务连续性的传统方法。当业务发生中断时,这为企业提供了一种替代方案。然而,作为一种不同的工作方式,它也需要维护。所以当遭遇业务中断时,企业可能需要部署其它的替代解决方案,因而需要对员工开展相关培训,以便他们了解在这样的情形下如何以不同的方式开展工作。
但是,为什么一定要这样呢?对于由于员工无法前往办公室办公而导致的业务中断,只需要员工能够远程办公就足以解决问题了。他们在家办公和在办公室、咖啡馆、机场等其他任何地方办公有什么不同呢?借助GoToMeeting或Teams这样的会议服务软件,他们可以跟身处任何地方的人会面和开展协作。而借助Citrix Workspace这样的工作空间技术,他们可以访问高效开展工作所需的所有应用程序、数据和工作流程。
企业需要为员工配备适当的工具,让他们无论身在何处都能高效地开展工作。工作不是指一个场所,而是指人们正在做的一件事情。员工远程工作的方式应该与他们在其他任何地方工作的方式相同。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。