TABLA DE CONTENIDO
CONTRATO INTERADMINISTRATIVO No. 256 DE 2017
DOCUMENTO PLAN DE CONTINGENCIA PARA SISTEMA SUIT
PROYECTO: RENOVACIÓN XX XXXXXXXX WEB Y MICROSITIOS DE FUNCIÓN PÚBLICA E IMPLEMENTACIÓN DE LA SEGUNDA FASE DE LA ESTRATEGIA DE GOBIERNO EN LÍNEA PARA LA ENTIDAD
V 1.0
Diciembre de 2017 CINTEL
Xxxxxxx 00 Xx. 00-00/00 Xxxxxxx 000 Xxxxxxxx Xxxxx XXX, Tel: 0000000 Fax: 0000000/58
Bogotá D.C.
TABLA DE CONTENIDO
5.1 PLAN DE CONTINUIDAD DE FUNCIÓN PÚBLICA 10
5.2 PLAN DE CONTINGENCIA PARA EL SISTEMA DE INFORMACIÓN SUIT 11
5.3 DESCRIPCIÓN DEL ESTADO ACTUAL DEL SISTEMA DE INFORMACIÓN SUIT 12
5.4 IDENTIFICACIÓN DE LA INFRAESTRUCTURA 13
5.7 SOFTWARE BASE DEL DISEÑO DE ARQUITECTURA DEL SISTEMA DE INFORMACIÓN 14
5.8 ESTRATEGIA CONTINGENCIA 14
6.1 ROLES Y RESPONSABILIDADES 16
6.2 POLÍTICAS DE XXXXXXXX, CUSTODIA Y RECUPERACIÓN DE LA INFORMACIÓN 16
7.1 RTO (RECOVERY TIME OBJECTIVE) 18
8. RIESGOS Y VULNERABILIDADES 19
9. ACTIVIDADES DEL PLAN DE CONTINGENCIA PARA SUIT 20
COMPRENDE LAS ACTIVIDADES PARA RETORNAR AL AMBIENTE DE PRODUCCIÓN EN SUS CONDICIONES ORIGINALES. 24
10. FASE 3 Y 4: VERIFICAR Y MEJORA CONTINÚA 27
ÍNDICE DE GRAFICAS
GRÁFICA 2. APLICACIÓN DE CICLO PHVA AL PLAN DE CONTINGENCIA 9
GRÁFICA 3. IMAGEN PORTAL SUIT 12
GRÁFICA 4. TIEMPOS DE RECUPERACIÓN DE DESASTRES 18
GRÁFICA 5. ÁRBOL DE COMUNICACIONES DEL PLAN DE CONTINGENCIA 21
GRÁFICA 6. SECUENCIA DE DESARROLLO DE ACTIVIDADES 22
ÍNDICE DE TABLAS
TABLA 1. CARACTERÍSTICAS DE MÁQUINA VIRTUAL 13
TABLA 2. CARACTERÍSTICAS DE SERVIDORES 13
TABLA 3. SOFTWARE BASE SISTEMA SUIT 14
TABLA 4. RELACIÓN AMBIENTE DE PRODUCCIÓN Y ESCENARIO DE CONTINGENCIA . 15 TABLA 5. UBICACIÓN DE COPIAS DE RESPALDO PARA BASES DE DATOS EN
TABLA 6. RESPONSABLES PLAN DE CONTINGENCIA SISTEMA DE INFORMACIÓN SUIT16 TABLA 7. TIEMPOS DE RETENCIÓN COPIAS DE RESPALDO 17
TABLA 8. RIESGOS Y VULNERABILIDADES 20
TABLA 9. ACTIVIDADES PARA FASE DE ACTIVACIÓN Y NOTIFICACIÓN DEL PLAN DE CONTINGENCIA 22
TABLA 10. ACTIVIDADES FASE DE RECUPERACIÓN PLAN DE CONTINGENCIA 23
TABLA 11. ACTIVIDADES FASE DE RESTAURACIÓN 25
DOCUMENTO PLAN DE CONTINGENCIA PARA SISTEMA SUIT
HISTORIAL DE CAMBIOS
Fecha | Versión | Descripción del Cambio | Responsable |
12/2017 | 1_0 | Primera versión del Documento de plan de contingencia | CINTEL |
1. INTRODUCCIÓN
Función Pública está desarrollando la Estrategia de Gobierno en Línea (Gobierno Digital) plasmada en el Decreto Único Reglamentario del sector de Tecnologías de la Información y las comunicaciones 1078 de 2015, donde se han tenido en cuenta la necesidad de contemplar planes de contingencia para sus sistemas misionales de acuerdo con las directrices emanadas del Ministerio de las Tecnologías de la Información y las Comunicaciones (MinTIC) en su circular No.002 del 06 de julio de 2011.
En el entorno de las tecnologías de la información se encuentran amenazas significativas que pueden ser incidentes menores o catastróficos que afecten la labor normal de Función Pública, en dado caso que se presenten alguno de estos aspectos, se genera la necesidad de una recuperación en el menor tiempo posible de las labores, garantizando la continuidad de los servicios que ofrece Función Pública tanto interno como externo.
El plan de continuidad se crea e implementa para responder ante situaciones que interrumpen el normal funcionamiento de los servicios de Función Pública, es una herramienta que ayuda a mitigar el riesgo de no disponibilidad de los recursos tecnológicos para la normal realización de las labores.
El presente documento corresponde plan de contingencia para el Sistema Único de Información de Trámite (en adelante SUIT), permitiendo identificar las acciones necesarias para reestablecer la operación de los sistemas.
2. OBJETIVO GENERAL
Establecer el plan de contingencia para el Sistema SUIT en caso de una falla que genere una indisponibilidad del sistema por un tiempo mayor al establecido en los Acuerdo de Nivel de Servicio (ANS).
2.1 OBJETIVOS ESPECÍFICOS
Para este plan se han establecido los siguientes objetivos:
1. Definir roles y responsables para las acciones de contingencia.
2. Identificar riesgos y vulnerabilidades para el sistema de información.
3. Establecer las actividades para cada etapa del plan de contingencia.
3. ALCANCE
Este Plan de Contingencia está desarrollado para simular la caída de elemento tecnológico hardware o software cuyo tiempo de restauración supera el ANS siendo por tanto necesario activar los elementos de contingencia. La contingencia se activa al presentarse una falla que haga imposible la recuperación del Sistema de información SUIT en ambiente de producción.
Para el presente plan se parte de la eventualidad de una falla en las bases de datos y el servidor de aplicaciones del sistema de información SUIT en el ambiente de producción.
4. METODOLOGÍA
El estándar utilizado para la implementación de la continuidad de negocios en la OTI es la norma ISO 22301:2012, esta norma determina actividades específicas para el desarrollo de la continuidad del servicio, la norma propone desarrollar dichas actividades mediante un ciclo de mejora continua similar al Ciclo xx Xxxxxx o modelo PDCA, por sus iniciales en inglés, que traducido al español se denomina modelo PHVA (Planear, Hacer, Verificar y Actuar), y se recomienda aplicarlo para gestionar la continuidad del negocio según lo establecido en la siguiente gráfica.
Fuente: Norma ISO 22301:2012 página VI
A continuación se describen las definiciones de cada una de las etapas y sus complementos, con las cuales se desarrollarán las actividades establecidas para continuidad de servicios según lo explica la norma ISO 22301:2012 en su introducción (página vi).
Planear: Se establecen los objetivos y las actividades necesarias para generar un sistema de gestión de continuidad y proporcionar resultados de acuerdo con las necesidades de la organización y sus usuarios, alineados a los objetivos estratégicos del negocio.
Hacer: Se implementa y se transforma en operativo el sistema de continuidad teniendo en cuenta la política, los procesos, los controles y demás procedimientos.
Verificar: Se monitorea y mide el sistema de continuidad teniendo en cuenta la política, los procesos, los controles y demás procedimientos reportando los resultados a la dirección para su revisión y determinar acciones correctivas y de mejora.
Actuar: Se emprenden las acciones necesarias para mejorar continuamente el Sistema de Gestión de la Continuidad teniendo en cuenta los resultados de la revisión realizada por la dirección y los cambios que puedan aparecer del alcance, la política y los objetivos de continuidad.
Entradas: Los usuarios, personas involucradas en los procesos del negocio y los requisitos para la continuidad del negocio se basan en los temas internos y externos que son relevantes para el propósito de la organización y que se definen en su visión, misión, objetivos y que son tenidos en cuenta en la Política de Continuidad.
Salidas: La continuidad del negocio de los procesos críticos.
Mejora Continua: La mejora continua son todas las acciones, realizadas a lo largo del ciclo de vida, para aumentar la eficacia, la eficiencia y brindar beneficios tanto a la organización como a sus partes interesadas. Una organización puede mejorar a través del sistema de información de la política de continuidad de negocio, los objetivos, los resultados de auditorías, el análisis de eventos controlados, los indicadores, las acciones correctivas y preventivas y la revisión por la dirección.
A partir de lo anterior, la siguiente gráfica ilustra el sistema de información del ciclo PHVA al presente plan de contingencia, permitiendo definir acciones en cada una de las fases del ciclo y permitiendo también la mejora continua del plan.
Gráfica 2. Aplicación de ciclo PHVA al plan de contingencia
Fuente: CINTEL-2017
El desarrollo de la metodología tiene como punto xx xxxxxxx el Plan de Continuidad de Función Pública, bajo los principios y lineamientos definidos en este plan se estructura el plan de contingencia para el Sistema Misional SUIT.
5. FASE 1: PLANEAR
En fase tiene como objetivo planear la estrategia para el plan de contingencia, donde se inicia con la introducción del contexto que enmarca el sistema de información, el punto xx xxxxxxx es el plan de continuidad de la Entidad, luego se define el objetivo del plan de contingencia para el Sistema de Información SUIT y finalmente se realiza una descripción del estado actual del sistema de información. Una vez se establece el contexto del sistema de información se realizarán las siguientes actividades:
• Definir roles y responsabilidades.
• Establecer las políticas de respaldo de la información.
• Identificar riesgos y vulnerabilidades del sistema de información.
• Definir las actividades de contingencia para el sistema de información.
5.1 PLAN DE CONTINUIDAD DE FUNCIÓN PÚBLICA
Función Pública con el objetivo de definir las actividades preventivas, defectivas y correctivas para reaccionar de manera eficiente ante una eventualidad que comprometa el desarrollo de las actividades cotidianas, la seguridad del personal o la prestación del servicio cuenta con un plan de continuidad.
El plan de continuidad de la Entidad se encuentra descrito en el documento: Documento Técnico del Plan de Continuidad del Negocio1, de donde se abstrae el siguiente apartado: “Con el fin de contar con una herramienta que permita prevenir o reaccionar adecuadamente ante posibles incidentes que pongan en riesgo a los Servidores Públicos, afectar el debido desarrollo de las actividades propias de Función Pública, impedir la prestación y continuidad del servicio a los Grupos de Valor o el cumplimiento de los compromisos establecidos en la planeación estratégica, la Entidad consolidó una serie de acciones a emprender en el Plan de continuidad del negocio que, diseñadas y ejecutadas de forma planificada, permitirían responder de manera eficiente ante una
1 Función Pública (Marzo 2017), Documento Técnico del Plan de Continuidad del Negocio, extraído de
xxxx://xxx.xxxxxxxxxxxxxx.xxx.xx/xxxxxxxxx/000000/000000/XxxxxxxxxxX%X0%X0xxxxxxxxxxxxxxxxxxxxxxxxxxx el+Negocio/dda1f666-0ca1-4375-b60e-e69547fe26e5. Diciembre 2017
eventualidad, restablecer en menor tiempo la prestación de los servicios y mitigar el impacto negativo de la pérdida de recursos.”
A partir de este principio se genera el siguiente plan de contingencia, el cual contempla los lineamientos y objetivos específicos del plan de continuidad de Función Pública.
5.2 PLAN DE CONTINGENCIA PARA EL SISTEMA DE INFORMACIÓN SUIT
El presente plan de contingencia parte de la simulación de la falla del servidor de aplicaciones del ambiente de producción del sistema de información SUIT y establece las actividades a desarrollar hasta llegar a reestablecer el servicio.
Este Plan de Contingencia reúne un conjunto de actividades que facilitarán mantener el normal funcionamiento del sistema de información SUIT de Función Pública, cuando este se vea afectado negativamente por causa de algún incidente de índole interno o externo.
Dado que los sistemas que hacen parte del alcance del plan de contingencia son de carácter misional para la Entidad se tienen en cuenta los siguientes lineamientos:
• Mantener la información asequible.
• Minimizar el impacto y perdidas ante un desastre.
• Documentar el proceso de recuperación ante un desastre.
• Mantener en funcionamiento los procesos misionales de la Entidad.
• Mantener la continuidad de la información.
Para la realización del presente plan de contingencia se contempla:
• Estado actual: Se tiene como punto xx xxxxxxx la descripción del estado actual del sistema de información, donde se identifican los componentes tecnológicos del sistema.
• Meta: La meta del plan de contingencia es establecer los roles y responsables del sistema para la acción de contingencia, definir las actividades a realizar con la respectiva estimación de tiempos para el desarrollo.
• Estrategia: Este plan de contingencia se establece desde el supuesto de una falla del sistema de información en su ambiente de producción
para lo que se define como estrategia para la recuperación del servicio utilizar como escenario de contingencia realizar las acciones necesarias para utilizar el ambiente de pruebas durante el tiempo que requiere para reestablecer el servicio en el ambiente de producción.
5.3 DESCRIPCIÓN DEL ESTADO ACTUAL DEL SISTEMA DE INFORMACIÓN SUIT
El SUIT (Sistema Único de Información de Trámites), es un sistema desarrollado para que los ciudadanos puedan consultar los trámites y otros procedimientos administrativos que todas las entidades del estado ofrecen a la ciudadanía.
El sistema permite centralizar los trámites y procedimientos administrativos a nivel nacional y territorial.
Fuente: Portal SUIT- 2017.
5.4 IDENTIFICACIÓN DE LA INFRAESTRUCTURA
El Plan de Contingencia para SUIT de Función Pública abarca todos los elementos que hacen parte de los servicios tecnológicos y está compuesto por los siguientes ambientes:
• Producción.
• Desarrollo.
• Pruebas.
5.5 SERVIDORES
El servidor asociado al portal SUIT de Función Pública es: DAFPAP05. El servidor tiene las siguientes características:
Tabla 1. Características de máquina virtual
SERVIDOR | TIPO | DESCRIPCIÓN |
DAFPAP05 10.116.8.19 | Hardware | Disco Duro 800G Memoria RAM 32G Procesamiento: 8vCPU * 64bits |
Sistema operativo | Red Hat Enterprise Linux Server release 7.2 (Maipo) | |
Aplicación | tomcat7 liferay |
Fuente: CINTEL-2017
Esta información descriptiva como componente del sistema de información SUIT.
Los servidores asociados a el sistema de información SUIT : Xxxxxx.xxxx.xxx.xx y Suit-production, tienen las siguientes características:
Tabla 2. Características de servidores
SERVIDOR | TIPO | DESCRIPCIÓN |
SUIT-PRODUCTION 172.20.1.109 | Hardware | Disco Duro 100G Memoria RAM 12G Procesamiento: 8vCPU * 64bits |
Sistema operativo | Oracle linux 6.9 | |
Aplicación | LIFERAY | |
Xxxxxx.xxxx.xxx.xx 172.20.2.32 | Hardware | Disco Duro 54G Memoria RAM 4G Procesamiento: 1vCPU * 64bits |
Sistema operativo | Red hat enterprise linux 5 | |
Aplicación | Oracle internet directory oid |
Fuente: CINTEL-2017
La maquina virtual Suit-production se encuentra en el servidor fisico WEBLOGIC.
5.6 BASES DE DATOS
La instancia de base de datos asociada al Sistema de información SUIT de Función Pública es: CI-oda-scan: jdbc:oracle:thin:@//oda-scan:1521/SUIT.
5.7 SOFTWARE BASE DEL DISEÑO DE ARQUITECTURA DEL SISTEMA DE INFORMACIÓN
Tabla 3. Software base sistema SUIT
CAPA | SOFTWARE BASE SISTEMA |
Aplicación | Weblogic 11g |
Portal | Liferay 6.2 |
DIRECTORIO DE USUARIOS | OID |
Bases de datos | Oracle 11.2.04 |
Fuente: CINTEL-2017
5.8 ESTRATEGIA CONTINGENCIA
A partir de la identificación de la infraestructura asociada al sistema de información SUIT se establece como escenario de contingencia el ambiente de pruebas. Se establece en la estrategia generar una máquina virtual producto de la clonación del ambiente de pruebas, de lo anterior se genera la relación que se muestra en la siguiente tabla para la ejecución del presente plan.
Tabla 4. Relación ambiente de producción y escenario de contingencia
AMBIENTE DE PRODUCCIÓN | ESCENARIO DE CONTINGENCIA AMBIENTE DE PRUEBA | |
Aplicación | suit-production 172.20.1.109 | CLON SUIT-TEST 172.20.1.xx [por asignar] |
Base de datos | oda-scan:1521/SUIT | 172.20.1.41:1522/DESA |
Directorio de usuarios | Xxxxxx.xxxx.xxx.xx 172.20.2.32 | CLON Xxxxxx.xxxx.xxx.xx 172.20.2. xx [por asignar] |
Fuente: CINTEL- 2017
• Copias de seguridad. Para la contingencia se contempla una restauración de la información de las bases de datos en el ambiente de producción, lo anterior permitirá operar en el ambiente de contingencia con información a su última actualización. Las copias de respaldo de las bases de datos se encuentran alojadas en el servidor cronos.
Tabla 5. Ubicación de copias de respaldo para bases de datos en producción
TIPO | NODOS | DESCRIPCION | EXPORT (periodicidad) | DEPURACIÓN |
DB PRODUCCION | CRONOS-2 | BD de producción SQLServer | Fullexport incremental (diario) y Full backup (Semanal) | Full backup con log (semanal) |
ARCHIVOS (DATA) DE BASES DE DATOS | ||||
TIPO | NODOS | DESCRIPCION | SISTEMA OPERATIVO | RUTA FILE SYSTEM (periodicidad) |
EXPORT DB_ODA | YAKSA-2 | EXPORT BD ORACLE | WIN2012 R2 | YAKSA-2\G:\DBA\oda_scan (FULL- SEMANAL) |
EXPORT DB GENERADOS | EROS | EXPORT BD ORACLE PROGRAMADOS | WIN2008 | EROS\ G:\DBA EROS\ E:\ DBA_ODA |
Fuente: Función Pública, Políticas de Respaldo, Custodia y Recuperación de la Información-2017
El repositorio de anexos necesarios para la restauración se encuentra en el servidor Eros en la ruta: eros/dba/tramites.
6. FASE 2: HACER
En esta fase se definirán los roles y responsabilidades para el sistema de información, se va a identificar las vulnerabilidades asociadas y se definirán las actividades necesarias para el restablecimiento del servicio.
6.1 ROLES Y RESPONSABILIDADES
Para asegurar la acertada implementación y gestión de la continuidad de los servicios tecnológicos, se deben establecer roles y responsabilidades que involucren las áreas de gestión en la oficina de Tecnologías de la información.
Tabla 6. Responsables plan de contingencia sistema de información SUIT
Rol | Ubicación | Teléfono-ext | Responsable | Celular |
Administradores de Servidores | Departamento Administrativo de la Función Pública – Piso 5 | 508 504 | Xxxxx Xxxxxx Xxx Xxxxxx | 3103189100 3013059469 |
Administradores de Comunicaciones | Departamento Administrativo de la Función Pública – Piso 5 | 507 | Xxxxxxxx Xxxxxxxx | 3102840195 |
Administrador SUIT | Departamento Administrativo de la Función Pública – Piso 5 | 201 207 200 | Xxxx Xxxxxx Xxxxxx Xxxxxxxx Xxxxxxxxx Xxxxxx | 3108808977 3003999187 3125480756 |
Administrador DBA | Departamento Administrativo de la Función Pública – Piso 5 | 517 | Xxxxxx Xxxxxxxxx | 3178548956 |
Fuente: CINTEL-2017
6.2 POLÍTICAS DE XXXXXXXX, CUSTODIA Y RECUPERACIÓN DE LA INFORMACIÓN
Función Pública cuenta con una política de respaldo, almacenamiento y recuperación de la información crítica que garantiza la disponibilidad e integridad de los activos informáticos dispuestos en el centro de datos de su sede principal.
Esta política aplica a todos los sistemas de información y dispositivos de almacenamiento de datos que contengan información catalogada como crítica para la prestación de servicios internos y externos del Departamento Administrativo de la Función Pública alojada en los servidores del centro de
datos Ubicado en la sede principal del Departamento Administrativo de la Función Pública.2
Función Pública realiza copias de seguridad de la información en disco y en cintas, las cuales se entregan en custodia a un tercero. Las bases de datos tienen rutinas de realización de copias de seguridad diaria, para las máquinas virtuales se realiza con periodicidad quincenal.
Para la extracción de las copias de seguridad en cintas, para las bases de datos se realiza semanal y para las máquinas virtuales quincenal.
Para la copia de seguridad de las bases de datos de SUIT, existen los siguientes tiempos de retención por cada tarea programada:
Tabla 7. Tiempos de retención copias de respaldo
Tarea | Media pool | Frecuencia | Retención | Retención (días) |
Oracle_SUIT | Incremental diario | Permanente | Permanente | 365 |
Full Semanal | ||||
Full Mensual | Mensual | 12 meses | 365 |
Fuente: Función Pública-2017
7. TIEMPOS RPO y RTO
RPO y RTO son conceptos fundamentales que en base a ellos se puede planificar y decidir qué tipo de soluciones son necesarias para el plan de continuidad de la Entidad.
RPO (Recovery Point Objetive - Punto Objetivo de Recuperación), punto en el cual la información usada por una actividad debe ser restaurada para permitir la reanudación de la operación.
RTO (Recovery Time Objetive -Tiempo objetivo de recuperación), periodo de tiempo después de un incidente en el que el servicio debe ser reanudado, o la actividad debe reanudarse, o los recursos deben ser recuperados.
2 Función Pública, 18/09/2017. Políticas De Respaldo, Custodia Y Recuperación De La Información.
Gráfica 4. Tiempos de recuperación de desastres
Fuente: CINTEL – 2017
RPO (Recovery Point Objective)
RPO se refiere al volumen de datos en riesgo de pérdida que la Entidad considera tolerable. Este depende de las Políticas de Respaldo, Custodia y Recuperación de la Información definida por la Entidad.
El RPO determina el objetivo de posible pérdida máxima de datos introducidos la última copia de respaldo, hasta la caída del sistema, y no depende del tiempo de recuperación.
A partir de las políticas de respaldo, custodia y recuperación de la información se establece que:
• RPO para las máquinas virtuales es de 15 días.
• RPO para las bases de datos es de 1 día.
7.1 RTO (Recovery Time Objective)
Expresa el tiempo durante el cual la Entidad puede tolerar la falta de funcionamiento de sus aplicaciones y la caída de nivel de servicio asociada, sin afectar a la continuidad del negocio.
Pasos para seguir para recuperar las aplicaciones y los datos en caso de contingencia:
• Restaurar el servidor y su ambiente, sistema operativo. Dependiendo del tipo de problema pueden ser minutos, horas o días).
• Restaurar las copias de seguridad.
• Reanudar la operación.
Con relación al tiempo de restauración de la información se define que:
• RTO es de tres días.
7.1.1 Proceso de Restauración
Se debe tener en cuenta los siguientes requerimientos:
1. Los líderes de proceso y jefes de dependencias son los únicos autorizados para solicitar la recuperación de información contenida en los servidores del centro de datos ubicado en la sede principal del Departamento Administrativo de la Función Pública. ante una pérdida total, parcial o para realizar pruebas controladas.
2. Se debe diligenciar en su totalidad el formato (Formato respaldo y Recuperación de Información) y ser entregado al administrador de copias.
3. Los tiempos previstos en los ANS con el servicio de custodia externa para la devolución de los medios magnéticos es de tres (3) horas después de recibida la solicitud de devolución.
4. Es responsabilidad del administrador de servidores informar la disponibilidad de los respaldos, realizar el trámite para obtener los medios magnéticos, ejecutar el procedimiento de recuperación e informar los resultados.
5. Al finalizar el procedimiento se debe devolver el medio magnético solicitado en el proceso de restauración a la empresa de custodia.
8. RIESGOS Y VULNERABILIDADES
Se establecen los riesgos a los cuales están propensos los servicios de TI de la Función Pública, de igual manera determinar el nivel o factor de riesgo.
A partir del documento “SPI_Plan de tratamiento del riesgo” se identifican los riesgos que puedan afectar la continuidad del sistema de información SUIT.
Tabla 8. Riesgos y vulnerabilidades
Amenaza | Vulnerabilidad | Riesgo | Escenario del Riesgo |
Falla en activos de información | Calidad inferior de equipos (hardware) | Pérdida de disponibilidad de la información. Pérdida de la continuidad de las operaciones del negocio. | La disponibilidad del sistema de información SUIT se puede verse comprometida debido a las vulnerabilidades y bajo desempeño presente en los equipos |
Falla en activos de información | Exposición de los sistemas e Información crítica debido a vulnerabilidades técnicas de seguridad | Un solo punto dentro de la arquitectura falla | La falta de redundancia en servidores de aplicaciones o bases de datos. |
Fuente. Función Pública
9. ACTIVIDADES DEL PLAN DE CONTINGENCIA PARA SUIT
Las actividades del plan de contingencia se dividen en tres etapas:
• La activación y notificación. La activación de la Plan de contingencia donde se produce la simulación de una interrupción o corte que puede extenderse razonablemente más allá de la RTO establecido para el sistema.
• Fase de Recuperación. comprende las actividades de recuperación de las actividades para la recuperación del sistema afectado. Esta fase incluye las notificaciones y escalamiento para la recuperación.
• Restauración. Define las acciones tomadas para probar y validar la capacidad y funcionalidad del sistema en el punto original.
La desactivación incluye actividades para la notificación a los usuarios de sistema el estado de funcionamiento. Esta fase también se ocupa de la recuperación de documentación esfuerzo, la finalización del registro de actividades, la incorporación de las lecciones aprendidas en las actualizaciones del plan, y los recursos para para cualquier evento futuro.
9.1 LA ACTIVACIÓN Y NOTIFICACIÓN
La activación y notificación define las medidas iniciales tomadas una vez el sistema presenta una interrupción que ha sido detectada o que parece ser inminente.
El plan de contingencia puede ser activado si uno o más de los siguientes criterios se cumplen:
1. El tipo de interrupción indica que el tiempo es mayor al establecido en el ANS del sistema de información.
2. El elemento tecnológico afectado está dañado y puede no estar disponible dentro del tiempo establecido en el ANS.
Para la activación de la contingencia se parte de los siguientes supuestos:
▪ Las copias de seguridad actuales del sistema de información y los datos están intactos y disponibles.
▪ Se ha identificado la infraestructura para la contingencia.
▪ La indisponibilidad se genera en el ambiente de producción del sistema de información SUIT.
Árbol de comunicación de activación del plan de contingencia es:
Gráfica 5. Árbol de comunicaciones del plan de contingencia
JEFE OFICINA OTIC
|
COORDINADOR SERVICIOS DE INFORMACIÓN | COORDINADOR TECNOLOGÍAS DE LA INFORMACIÓN |
|
Software Base (Administradores SUIT) Grupo de servicios de información | Infraestructura (Responsable de servidores) Grupo de servicios de tecnología | Infraestructura (Responsable de redes y comunicaciones) Grupo de servicios de tecnología |
Fuente: CINTEL-2017
El primer paso después de la activación del Plan de contingencia es la notificación a los usuarios afectados:
• Clientes internos: Dirección de participación, transparencia y servicio al ciudadano, Oficina de comunicaciones y Grupo del servicio al ciudadano – SUIT.
• Clientes externos: Entidades públicas.
Publicación del banner de notificación de indisponibilidad del sistema de información, esto toma un tiempo aproximado de dos horas, esta actividad se desarrolla en paralelo a las actividades descritas en la siguiente tabla.
Las actividades de la etapa de activación u notificación son:
Tabla 9. Actividades para fase de activación y notificación del plan de contingencia
FASE | ACTIVIDAD | ROL RESPONSABLE | TIEMPO ESTIMADO DEL ESFUERZO MINUTOS | |
Fase de Activación y notificación | 1 | Notificar la indisponibilidad y la activación del plan de contingencia. | Coordinador Sistemas de información | 120 |
2 | Activar el plan de contingencia en la herramienta xx xxxx de servicio el cual habilita a los responsables la función de registro de las actividades. | Administrador herramienta xx xxxx de servicio | 30 | |
3 | Realizar solicitud de copias de seguridad de bases de datos y de servidor de aplicación. | Coordinador Sistemas de información | 180 |
Fuente: CINTEL-2017
Gráfica 6. Secuencia de desarrollo de actividades
Fuente: CINTEL-2017
Las actividades propuestas se desarrollan en orden secuencial, las actividades de notificación a usuarios se desarrollan en paralelo a las actividades 1,2 y 3.
El tiempo estimado para el desarrollo de actividades de esta fase es de cinco horas y treinta minutos.
9.1.1 Fase de recuperación
Esta fase inicia con las notificaciones al personal responsable de la recuperación a partir de la matriz de roles y responsabilidades.
Las actividades en esta etapa se muestran en la siguiente tabla.
Tabla 10. Actividades fase de recuperación plan de contingencia
FASE | ACTIVIDAD | ROL RESPONSABLE | TIEMPO ESTIMADO DEL ESFUERZO MINUTOS | |
Fase xx Xxxxx ngen cia | 1 | Generar una copia de seguridad de la máquina virtual del sistema de información SUIT en el ambiente de pruebas. | Responsable servidores | 720 |
2 | Crear una nueva máquina virtual a partir de la imagen generada en la actividad anterior en Oracle virtual machine. | Responsable servidores | 1440 | |
3 | Configurar el direccionamiento ip a la máquina virtual. | Responsable servidores | ||
4 | Restaurar copia de respaldo de bases de datos en ambiente de contingencia. | Responsable de bases de datos | 360 | |
5 | Restaurar y verificar copia de respaldo de OID. | Coordinador de sistemas de información | 480 | |
6 | Restaurar y verificar copia de respaldo de anexos de trámites. | Responsable de servidores | 360 | |
Coordinador sistemas de información | ||||
7 | Se instalan actualizaciones para weblogic. | Coordinador sistema de información | 1440 | |
8 | Restaurar la copia de respaldo del código fuente. | Coordinador sistema de información | ||
9 | Realizar configuración de weblogic. | Coordinador sistema de información | ||
1 0 | Configurar las reglas NAT para la relación ip pública ip privada de la aplicación. | Responsable de redes y comunicaciones | 120 |
FASE | ACTIVIDAD | ROL RESPONSABLE | TIEMPO ESTIMADO DEL ESFUERZO MINUTOS | |
1 1 | Activar las bases de datos de la aplicación. | Responsable bases de datos | 60 | |
1 2 | Realización de pruebas de funcionalidad. | Coordinador sistema de información | 120 | |
1 3 | Activar el servicio para el usuario externo. | Coordinador sistema de información | 60 | |
1 4 | Notificar a los usuarios la disponibilidad del sistema. | Coordinador sistema de información | 60 |
Fuente: CINTEL-2017
Estas actividades se desarrollan en orden secuencial. El tiempo estimado para el desarrollo de actividades de esta fase es de setenta y tres horas.
A partir de este punto se realizan las actividades para solucionar la falla generada que puede basarse en restauración de una copia de seguridad en el ambiente de producción hasta reemplazo del hardware afectado.
9.1.2 Fase de restauración del servicio
Comprende las actividades para retornar al ambiente de producción en sus condiciones originales.
Las actividades en esta etapa se describen en la siguiente tabla.
Tabla 11. Actividades fase de restauración
FASE | ACTIVIDAD | ROL RESPONSABLE | TIEMPO ESTIMADO DEL ESFUERZO MINUTOS | |
Fase de Activación y notificación para restauración | 1 | Programar la ventana de Ejecución de la restauración del sistema | Coordinador Sistemas de información | 120 |
2 | Iniciar con el registro de las actividades en la herramienta xx xxxx de ayuda para disparar las notificaciones a los responsables. | Coordinador Sistemas de información | 60 | |
3 | Realizar solicitud de copias de seguridad de bases de datos y de servidor de aplicación. | Coordinador Sistemas de información | 180 | |
FASE | ACTIVIDAD | ROL RESPONSABLE | TIEMPO ESTIMADO DEL ESFUERZO MINUTOS | |
Fase de restauración | 4 | Generar una máquina virtual para el sistema de información SUIT. | Responsable servidores | 720 |
5 | Instalar librerías de aplicación. | Responsable servidores | 240 | |
6 | Configurar el direccionamiento ip a la máquina virtual. | Responsable servidores | 60 | |
7 | Instalación de weblogic y sus actualizaciones. | Responsable servidores | 720 | |
8 | Instalación de ODS | Coordinador de sistemas de información | 960 | |
Responsable de servidores | ||||
9 | Restaurar y verificar copia de respaldo de bases de datos. | Responsable de bases de datos | 360 | |
10 | Restaurar y verificar copia de respaldo de OID. | Coordinador de sistemas de información | 480 | |
11 | Restaurar y verificar copia de respaldo de anexos de trámites. | Responsable de servidores | 1440 |
Coordinador sistemas de información | ||||
12 | Restaurar la copia de respaldo archivo de respaldo de código fuente. | Coordinador sistema de información | ||
13 | Realizar configuración de weblogic. | Coordinador sistema de información | ||
14 | Configurar capa de proxy. | Responsable de servidores | 240 | |
Fase de restauración | 15 | Configurar las reglas NAT para la relación ip pública ip privada de la aplicación. | Responsable de redes y comunicaciones | 1440 |
16 | Configurar DNS para la dirección del servidor. | Responsable de redes y comunicaciones | ||
17 | Activar las bases de datos de la aplicación. | Responsable bases de datos | ||
18 | Propagación DNS. | Responsable de redes y comunicaciones | ||
19 | Realización de pruebas de funcionalidad. | Coordinador sistema de información | ||
20 | Activar el servicio para el usuario externo. | Coordinador sistema de información | 120 |
2
3
4
8
5
6
7
Inicio de ventana para migración a producción
12
14
15
17
18
20
120
19
1440
120
16
13
240
9 10 11
480
120
1
360
960
720
60
180
60
Fase de recuperación
TIEMPO ESTIMADO DEL ESFUERZO MINUTOS
ACTIVIDAD
FASE
Fuente: CINTEL-2017
Tan pronto como la recuperación termine, se debe actualizar y activar la política de respaldo para SUIT.
10. FASE 3 y 4: VERIFICAR y MEJORA CONTINÚA
En estas fases se realiza la simulación del plan y se documentan los resultados obtenidos a partir de las actividades descritas en la fase anterior.
El resultado de esta fase es un documento (Anexo 1. plan de pruebas) donde se obtiene el tiempo real del desarrollo de cada actividad y observaciones aportadas por el responsable. El responsable de sistema de información verifica el tiempo estimado de desarrollo de las actividades en comparación con el tiempo de ejecución establecido en el plan de contingencia.
Durante la ejecución de la prueba del plan de contingencia se genera un registro del desarrollo de cada una de las actividades dentro del Anexo 2. Registro de pruebas, de las observaciones generadas y de las nuevas actividades en caso de que sea el caso.
La ejecución de las pruebas del plan de contingencia le aporta a cada responsable conocimiento y entendimiento de sus actividades y responsabilidades.
Durante la ejecución de las pruebas se generan observaciones a partir de los resultados de las actividades lo que conlleva mejoras en el plan y van enfocadas a:
• Diagramas y arquitecturas del sistema de información.
• ANS.
• Política de respaldo.
• Actualización plan de contingencia (actividades, tiempos, responsables).
11. ANEXOS
En la siguiente tabla se relacionan los anexos del documento
N° | Nombre de Anexo | Contenido |
1 | Anexo1. Plan de pruebas | Plan de pruebas del plan de contingencia de SUIT |
2 | Anexo 2. Registro de pruebas | Formato de registro de las actividades de la prueba del plan de contingencia |
ANEXO 1. PLAN DE PRUEBAS
1. PLAN DE CONTINGENCIA DE SUIT
La primera prueba del Plan de contingencia es el punto de referencia para seguir realizando pruebas que sean más estrictas posterior a la implementación de los servicios y procesos definidos como críticos en centro de datos alterno, con la finalidad de poder asegurar la capacidad de Continuidad de la entidad.
La ejecución de las pruebas del plan de contingencia le aporta a cada responsable conocimiento y entendimiento de sus actividades y responsabilidades.
La siguiente tabla muestra el tipo de pruebas y ejercicio recomendados y su respectiva valoración:
Tabla 1. Pruebas
Tipo de Prueba o Ejercicio | ¿Qué es? | Beneficios | Desventajas |
Lista de Verificación | Distribuye planes para revisión. | Asegura que el plan cubra todas las actividades. | No está dirigido hacia la eficacia. |
Recorrido Estructurado | Mirada detallada de cada paso. | Asegura que las actividades planificadas estén descritas correctamente | Valor bajo al probar las capacidades de respuesta |
Simulación | Escenario para representar los procedimientos de recuperación. | Sesión practica | Si los procesos son muy diferentes |
Paralelo | Prueba total, procesamiento principal no es interrumpido. | Asegura un alto nivel de confiabilidad sin interrumpir la operación normal | Costo elevado al involucrar gran cantidad de colaboradores. |
Interrupción Total | Es desastre, es replicado al punto de interrumpir las operaciones normales. | Pruebas más confiables de los planes | Un alto nivel de riesgo |
Fuente: CINTEL-2017
El presente plan de contingencia contempla el tipo de prueba paralelo; con este tipo de prueba no hay interrupción del servicio en el ambiente de producción durante la ejecución de las pruebas. Las pruebas se realizan en paralelo mediante la utilización del ambiente de capacitación del sistema de información SUIT.
Para la contingencia de SUIT se contempla una restauración desde una imagen obtenida de la máquina virtual del ambiente de pruebas, en este caso SUIT-TEST, lo anterior permitirá operar en el ambiente de contingencia con información a su última actualización.
Descripción de actividades a desarrollar en la prueba del plan de contingencia teniendo relación con las actividades descritas en el apartado anterior. Las pruebas se desarrollan a partir de la simulación de una falla en el servidor de aplicaciones y en la base de datos.
Tabla 2. Actividades para fase de activación de la prueba del plan de contingencia
FASE | ACTIVIDAD | ROL RESPONSABLE | TIEMPO ESTIMADO DEL ESFUERZO MINUTOS | |
Fase de Activación de la prueba | 1 | Programar la ventana de Ejecución del plan de contingencia. | Coordinador Sistemas de información | 120 |
2 | Iniciar con el registro de las actividades en la herramienta xx xxxx de servicio para disparar las notificaciones a los responsables. | Coordinador Sistemas de información | 60 | |
3 | Simular afectación de servidor de aplicación. | Responsable de servidores | 30 | |
4 | Simular afectación de bases de datos. | Responsable bases de datos | 30 |
Fuente: CINTEL-2017
El desarrollo de las pruebas inicia las notificaciones al personal responsable de la recuperación a partir de la matriz de roles y responsabilidades.
Las actividades en esta etapa se muestran en la siguiente tabla. El alcance de las pruebas del plan de contingencia no contempla la participación de proveedores.
Tabla 3. Actividades fase de recuperación plan de contingencia
FASE | ACTIVIDAD | ROL RESPONSABLE | TIEMPO ESTIMADO DEL ESFUERZO MINUTOS | |
Fase xx Xxxxx ngen cia | 1 | Generar una copia de seguridad de la máquina virtual del sistema de información SUIT en el ambiente de pruebas. | Responsable servidores | 720 |
2 | Crear una nueva máquina virtual a partir de la imagen generada en la actividad anterior en Oracle virtual machine. | Responsable servidores | 1440 | |
3 | Configurar el direccionamiento ip a la máquina virtual. | Responsable servidores | ||
4 | Restaurar copia de respaldo de bases de datos en ambiente de contingencia. | Responsable de bases de datos | 360 | |
5 | Restaurar y verificar copia de respaldo de OID. | Coordinador de sistemas de información | 480 | |
6 | Restaurar y verificar copia de respaldo de anexos de trámites. | Responsable de servidores | 360 | |
Coordinador sistemas de información | ||||
7 | Se instalan actualizaciones para weblogic. | Coordinador sistema de información | 1440 | |
8 | Restaurar la copia de respaldo del código fuente. | Coordinador sistema de información | ||
9 | Realizar configuración de weblogic. | Coordinador sistema de información | ||
1 0 | Configurar las reglas NAT para la relación ip pública ip privada de la aplicación. | Responsable de redes y comunicaciones | 120 | |
1 1 | Activar las bases de datos de la aplicación. | Responsable bases de datos | 60 | |
1 2 | Realización de pruebas de funcionalidad. | Coordinador sistema de información | 120 |
Fuente: CINTEL-2017
2. DESARROLLO DE LAS PRUEBAS
Durante la ejecución de la prueba del plan de contingencia se genera un registro del desarrollo de cada una de las actividades, de las observaciones generadas y de las nuevas actividades en caso de que sea el caso.
Tabla 4. Registro de Actividades de prueba del plan de contingencia
ACTIVIDAD | TIEMPO ESTIMADO DEL ESFUERZO MINUTOS | TIEMPO MEDIDO DURANTE LA PREUBA | OBSERVACIONES DE LA ACTIVIDAD | |
Prueba de Contingencia | 1 | 360 | ||
2 | 360 | |||
3 | 120 | |||
4 | 30 | |||
5 | 180 | |||
6 | 180 | |||
7 | 120 |
Fuente: CINTEL-2017
Finalmente, se diligencia la línea de conclusión de resultado de la ejecución de la prueba donde quedan registradas las notas concluyentes obtenidas a partir de la ejecución de la prueba.