Veamos cuales son algunos de los conceptos claves que tenemos que tener en cuenta a la hora de escoger un sistema de copias de seguridad y recuperacion ante desastres.

01.- Introducción

No es necesario explicar porque es fundamental contar con un sistema de copia de seguridad y recuperacion ante desastres en una empresa. Los datos, los sistemas y el buen funcionamiento de las aplicaciones informáticas son críticas en la mayoría de negocios.

Cada empresa cuenta con una infraestructura tecnológica que crece constantemente y que necesita funcionar en las mejores condiciones. Para algunos se trata de su programa de contabilidad, para otros de un CRM, un servidor de archivos, servidores de correo, de base de datos, de ERP y un largo etc

Es importante plantearse la pregunta, ¿qué sucederá cuando algo falle? Porque la cuestión no es si algo va a fallar, sino cuándo. Existen multitud de mecanismos para intentar minimizar el impacto de un fallo en el sistema, como pueden ser alta disponibilidad, redundancia, sistemas distribuidos, pero basta que los equipos se infecten por (tan extendido a día de hoy) ransomware, para que los sistemas críticos de una empresa se vean comprometidos.

Con frecuencia vemos en las noticias cómo grandes sistemas se han visto afectados y han tenido incluso que detener su actividad; desde hospitales hasta centros logísticos. Pero las noticias sólo reflejan las grandes historias. Si ponemos el foco en las pequeñas y medianas empresas, los casos se cuentan por miles.

La copia de seguridad es imprescindible, pero ¿es suficiente? No, en la mayoría de los casos. Al menos la copia de seguridad entendida de la forma tradicional.

Volver al principio del artículo: copia de seguridad y recuperacion ante desastres.

02.- Un ejemplo práctico

Vamos a poner como ejemplo una pequeña empresa tipo de 10 empleados.

Cada trabajador cuenta con sus equipos de sobremesa, portátiles, tablets, etc. Por desgracia, uno de los empleados abre un correo y se infecta con ramsomware. Se propaga a las unidades de red, entre las que se encuentra el servidor, y para cuando se ha dado cuenta, todos sus archivos están inutilizados.

El servidor de la empresa, cumple con varias funciones: servidor de dominio, servidor de archivos compartidos y además da servicio al programa de contabilidad y facturación.

Como la empresa está concienciada con los problemas que se pueden presentar, cuenta con una copia de seguridad de todos los datos, incluso con una copia el sistema del servidor.

El primer paso es identificar el origen del fallo: el equipo de un usuario está infectado y ha quedado inservible (a nivel de software se entiende), pero es secundario. Lo principal, es conseguir que el servidor vuelva a funcionar y el resto de usuarios pueda seguir trabajando.

Los archivos del servidor están encriptados y es posible que el sistema esté infectado y podría extender la amenaza al resto de equipos. Analizamos el equipo y vemos que está limpio. Eliminamos la aplicación de facturación y todos los ficheros encriptados.

Volvemos a instalar la aplicación y la ajustamos tal y como recomienda el fabricante del programa y restauramos la copia de seguridad de los datos, que confiamos en que sea reciente.

¿Cuánto tiempo ha supuesto este proceso? Bastante y el resto de usuarios no ha podido trabajar mientras tanto.

Ahora hay que ver si la copia estaba actualizada y si es de la semana anterior o de ayer. Hay que poner los datos al día porque los cambios desde la copia hasta el momento del desastre se han perdido y al mismo tiempo continuar con la actividad normal de la empresa.

Hemos tomado como ejemplo un supuesto en el que la empresa tiene copia de seguridad, está actualizada y los sistemas pueden volver a estar operativos en poco tiempo. ¿Qué sucede si en lugar de este virus se estropea el servidor?, ¿si no hay copias o las copias no se pueden restaurar?, ¿si hace varios meses desde la última copia?… son supuestos mucho peores, pero habituales.

Volver al principio del artículo: copia de seguridad y recuperacion ante desastres.

03.- RPO y RTO conceptos claves.

RPO (Recovery Point Objetive): cuantifica cuantos datos considera la empresa, que puede perder de forma tolerable sin que comprometa su actividad.

Ejemplo: Tenemos una empresa que realiza 2.000 facturas al día y hace las copias cada mes.

El día 20 se averían los sistemas, por lo que al recuperar la copia se encuentra que debe introducir nuevamente en el sistema 20 días x 2.000 diarias = 40.000 facturas (si es que cuenta con forma de hacerlo) + su actividad diaria.

Parece claro que esta empresa, debe reducir en la medida de lo posible, el intervalo en que realiza las copias de seguridad o puede encontrarse que, aun teniendo una copia de seguridad, no es capaz de retomar su actividad.

RTO (Recovery Time Objective): es el tiempo que puede pasar en una empresa desde que se produce un desastre hasta que continúa con su actividad normal.

En el ejemplo anterior, para poder emitir las facturas con el programa de facturación que ha dejado de funcionar, es necesario contar previamente con las que había en el sistema. ¿Cuánto tiempo puede estar sin su programa y la totalidad de sus datos? 3, 4…5 días.

Pasado un plazo de x tiempo, la empresa finalmente colapsará porque no tendrá sus datos anteriores ni forma de meter los nuevos.

Copia de seguridad y recuperacion ante desastres

¿Éstos cálculos sólo los deben hacer las grandes empresas? No, son factores que todas deben calcular.

Unas tendrán unos tiempos y una cantidad de datos más tolerables, mientras que para otras, estarán próximos a cero. No va ligado necesario al tamaño, aunque si suele volverse algo más crítico, simplemente por el volumen de datos y número de personas a las que afectan. Pero no es necesario pensar en emitir 2.000 facturas diarias. Un negocio con 10 facturas/día puede tener también graves problemas si, por ejemplo, no es capaz de identificar a los clientes a los que se las ha emitido, o los importes, garantías, etc

Este análisis nos permite ver que tolerancia tiene una empresa ante un desastre. El escenario será mejor cuando:

Las copias se hacen con la mayor frecuencia posible. Nos asegura que, en caso de necesidad, están lo suficientemente actualizadas.
Se necesita el menor tiempo posible para que los sistemas vuelvan a funcionar y además incorporen los datos que faltan desde la última copia.

Volver al principio del artículo: copia de seguridad y recuperacion ante desastres.

04.- Más consideraciones

Por descontado, hay que tener en cuenta otros factores implícitos a los sistemas de backup:

Que las copias de seguridad sean recuperables.
Y es algo en lo que no se debe simplemente confiar, hay que realizar pruebas para asegurarnos que efectivamente funcionan. ¿Y cómo lo probamos? No siempre es sencillo parar el servidor que está en producción y restaurar una copia para probar que funciona… ¿y si no funciona? Mal asunto. Por eso muchas veces se tiene copia, pero no se está seguro que vaya a funcionar en caso de necesidad.

¿Cada cuánto tiempo hacemos una copia completa?, ¿cuántas copias incrementales hasta la siguiente completa?
Si sacamos una copia completa el día 1 de enero y luego 1 diaria incremental, ¿qué sucede si 8 meses después hay un problema?: tenemos que restaurar la copia completa y posteriormente aplicar las 240 copias incrementales hasta llegar al estado del día anterior.
Lleva mucho tiempo y siempre que las 240 copias incrementales estén íntegras y funcionales. Si el día 1 de enero se hace la copia total y el día 2 la copia incremental está ilegible, todas las del día 3 en adelante no sirven.

Deben estar almacenadas en un entorno seguro.
Primero por las leyes de protección de datos y segundo, por sentido común. No tiene lógica guardar las copias en el mismo sitio que lo que estás protegiendo. Si hay un incendio, se quemarán ambas.

Volver al principio del artículo: copia de seguridad y recuperacion ante desastres.

05.- ¿Qué soluciones hay para proteger los datos de mi empresa?

Nosotros implantamos soluciones de recuperación ante desastres (DRS). No se trata de una copia de datos sin más. En tecnozero distribuimos el catálogo de la marca datto, que mitigan los problemas mencionados anteriormente.

Se trata de equipos físicos (o en appliance virtual) que realizan una copia de seguridad de los sistemas (servidores a proteger). Aunque como veremos, no tiene nada que ver con un sistema de copia de seguridad tradicional.

RPO: el sistema de DRS, copia los servidores cada pocos minutos. El plazo de tiempo desde el último backup es mínimo.

RTO: si el equipo original no funciona podemos seguir trabajando desde la máquina virtual. El tiempo de parada de actividad es mínimo

Si pensamos en los ejemplos anteriores y cambiamos los escenarios de recuperación a por ejemplo 15 minutos, vemos en seguida, las ventajas de este sistema.

Volver al principio del artículo: copia de seguridad y recuperacion ante desastres.

06.- Preguntas habituales

¿Cómo funciona el sistema de copia de seguridad y recuperacion ante desastres?
El software de DRS, toma el equipo a proteger, lo clona, crea una máquina virtual y la almacena en los discos que incorpora. El resultado es una máquina virtual, réplica exacta del sistema al que protege.
Posteriormente cada x tiempo crea instantáneas almacenando los cambios.

¿Cada cuánto tiempo se guardan los cambios?
Puede programarse según las necesidades, por ejemplo, cada 10 minutos. Las copias se almacenan en el dispositivo y se replican en un espacio seguro, en la nube.

¿Qué sucede si necesito recuperar una copia?
Puedes volver atrás en el tiempo y recuperar lo que necesites. ¿El servidor se ha infectado y los archivos están encriptados? Tienes una copia de un par de minutos antes de haber abierto La Caja de Pandora.

¿Qué sucede si el servidor se avería?
En este caso tienes la copia, pero no tienes donde recuperarla.
Solución: el hardware de DRS, incorpora su propio sistema de virtualización (depende del modelo, pues la gama más básica no lo incluye). Puedes encender tu máquina virtual en el propio dispositivo y seguir trabajando como si fuera la ahora está averiada.

¿Qué sucede si no puedo reparar mi servidor?
Puedes usar la función de baremetal. Coges la máquina virtual, almacenada en tu hardware de DRS y la restauras en un nuevo equipo, aunque no tenga las mismas características. El sistema se encarga de quitar los drivers y configuraciones específicas para que cuando arranques tu nuevo sistema, reconozca la nueva configuración.

¿Y si la oficina se incendia y también queda inutilizable el hardware de las copias de seguridad?
Las copias se almacenan localmente, porque es mucho más rápido, pero al mismo tiempo se replican en la nube. Puedes descargarlas y utilizarlas del mismo modo que lo harías en local. Incluso puedes ir mucho más allá, puedes iniciar tu máquina virtual, con tu servidor directamente desde la nube, establecer una conexión segura con tu oficina, y seguir trabajando como si el servidor estuviese totalmente operativo.
Posteriormente con más calma puedes decidir cómo continuar: comprando un servidor nuevo, virtualizando el que tienes, etc Esta opción es realmente increíble.

¿Está pensado para empresas grandes?
Los modelos grandes están pensados para empresas grandes y los modelos pequeños para empresas pequeñas, así de sencillo. Prestaciones diferentes para necesidades diferentes.

Si preguntamos:

¿Qué empresas necesitan proteger sus datos? Todas.
¿Cuánto tiempo pueden estar sin que funcionen los equipos? Poco
¿Si los datos no se pueden recuperar se puede continuar con la actividad? Complicado
El sistema de copias que utilizamos ahora, ¿funciona? “- Creo que sí” (Poca confianza da esa respuesta).

Así pues, es una solución para compañías de todo tipo y actividad. Hay que dimensionar el producto en función de las necesidades.

¿Se pueden proteger todos los equipos con este sistema? Sí.
Lo habitual es que se utilice para los servicios más críticos de una compañía, que tradicionalmente son los servidores, pero no se tiene porque limitar a ellos. Es posible que los ordenadores de los directivos sean vitales para la continuidad del negocio, o el del contable y necesiten el mismo grado de respaldo.

Volver al principio del artículo: copia de seguridad y recuperacion ante desastres.

Shares
Share This