3.5 重续运行

在IT事件应急处置完毕之后,如果启用了备用IT资源,则开启了重续运行过程。重续运行是指基于备用IT资源提供IT服务并支撑业务运营的过程。重续运行分为高可用重续运行和灾备重续运行,高可用重续运行是指基于高可用备份资源提供IT服务并支撑业务运营的过程,灾备重续运行是指基于灾备资源提供IT服务并支撑业务运营的过程。灾备重续运行又分2种情景,即同城灾备重续运行和异地灾备重续运行。

在高可用重续运行开始后,IT运维管理体系中的运维管理组织、运维管理流程和运维技术规程较高可用恢复之前通常保持不变。在灾备重续运行开始后,通常需要对灾难恢复之前的IT运维管理体系做出适当的调整。下面,分析“灾备重续运行开始后IT运维管理体系应该如何调整”这个问题。

这里选择大中型数据中心的灾备系统作为分析对象,这些灾备系统普遍采用基于磁盘阵列的数据复制技术。

首先,列出灾备系统各构成要素的日常运行状态和重续运行状态之间的差异,如表3-7所示。

表3-7 灾备系统日常运行状态和重续运行状态之间的差异

从表3-7中可以发现,同城灾备系统和异地灾备系统从日常运行状态转换到重续运行状态时,其应用服务器、数据库、应用软件及中间件、网络基础服务系统从冷备状态或温备状态转换到了ACTIVE状态,出现了较大变化,在重续运行过程中的运维工作量势必增加了很多。

然后,分析并列出同城灾备重续运行和异地灾备重续运行对IT运维管理体系的需求,如表3-8所示。

表3-8 灾备重续运行对IT运维管理体系的需求

1)从表3-8中可以有以下发现。

(1)同城灾备中心与生产中心通常采用一套IT运维管理体系。基于同城灾备重续运行开始后,一体化的运维团队完全可以应付因重续运行而增加的运维工作量。

(2)异地灾备中心日常运维人员采用最小规模配置,异地灾备重续运行开始后的运维工作量增加了很多。

2)由此得出以下结论。

(1)在同城灾备重续运行开始之后,通常不需要调整IT运维管理体系。

(2)在异地灾备重续运行开始之后,通常需要对IT运维管理体系做出适当的调整,需要事先准备一份《异地灾备重续运行期间IT运维管理体系调整计划》。