Índice de contenido
RAID ¿Qué es?
RAID es un término utilizado en informática, cuyas siglas vienen del inglés «Redundant Array of Independent Disks»
Es un proceso utilizado para combinar varios discos duros y que éstos funcionen de manera coordinada para formar una única unidad lógica en la que almacenar los datos.
A nivel empresarial, es muy utilizado a la hora de configurar el almacenamiento de servidores NAS y aplicaciones. Ofrece mayor tolerancia a fallos y más altos niveles de rendimiento que un sólo disco duro o un grupo de discos duros independientes.
Tipos de RAID
En este post analizaremos los tipos de Raid más conocidos. Ya que cada uno tiene diferentes niveles de rendimiento, capacidad de almacenamiento y fiabilidad. Nuestra elección dependerá del tipo de información que queramos proteger. También del número de discos duros que tengamos, nuestra inversión.

Raid 0
Se necesitan mínimo 2 discos. Cuenta la Suma de tamaños de todos los HDD.
Un RAID 0, conocido como striping, utiliza como mínimo 2 discos y reparte los datos entre ambos.
- Ofrece un mayor rendimiento.
- No debe utilizarse con datos críticos.
El inconveniente es que no hay redundancia y tolerancia a fallos, por lo que cualquier fallo o avería en uno de los discos conlleva una pérdida total de los datos.
Recomendado. Si priorizamos el rendimiento del sistema y el acceso a la información (diseño gráfico, en 3D y edición de video), y contamos con un presupuesto muy ajustado. Ofrece un alto rendimiento, especialmente para archivos grandes.

Raid1
Se necesitan mínimo 2 discos. En el caso de más unidades, solo cuenta el disco de menor tamaño.
Es conocido como “espejo” o “mirroring“. El raid 1 utiliza 2 discos y duplica todos los datos de la primera unidad de forma sincronizada a una segunda unidad de almacenamiento. De esta forma, si el primer disco se estropea, el sistema seguirá funcionando y trabajando con el segundo disco sin problemas y sin perder datos.
Ofrece una rápida recuperación tras un fallo de la unidad, por tanto es una de las mejores configuraciones en cuanto a redundancia y tolerancia a fallos.
Además, disponemos de un mayor rendimiento de lectura/escritura, puesto que es posible escribir y leer de los dos discos al mismo tiempo.
La desventaja es que tendremos que comprar 2 discos para tener la misma capacidad de almacenamiento efectivo (p.e. 2x1TB. que es realmente 1 TB en total), además se puede producir una gran sobrecarga del disco.
Recomendado para servidores de nivel básico en los que sólo contamos con 2 discos duros. Se recomienda para bases de datos pequeñas u otras aplicaciones que requieren poca capacidad, pero una redundancia de datos completa.

Raid 5
Se necesitan como mínimo 3 discos (se puede romper un disco sin perder los datos) El espacio disponible en el RAID 5 será de n-1, siendo n el número de discos del raid. Si utilizamos 5 discos de 1TB tendremos: 5 discos – 1 = 4 discos -> 4TB disponibles.
Suele ser el RAID más usado en servidores, ya que aporta la velocidad y rendimiento del RAID 0 (uso eficiente de la unidad, alto rendimiento en escritura y lectura) y la seguridad del RAID 1 ante las pérdida de datos.
El RAID 5 utiliza la paridad para recuperar los datos. Se dividen los datos en bloques en los diferentes discos, de forma que si hay un fallo en uno de ellos, esa parte de los datos se subsana con los datos almacenados en el resto de los discos, permitiendo al usuario continuar (aunque funciona más lenta) con su trabajo.
¿Cuáles son sus desventajas?
Hay un impacto medio de los fallos del disco y la reconstrucción es más larga por la necesidad de volver a calcular la paridad. El rendimiento tanto de lectura como de escritura sufre un gran impacto si la matriz del RAID 5 se ha degradado. Para discos SATA de gran capacidad (de 500GB a 1TB) los tiempos de reconstrucción son muy largos y conllevan una degradación del rendimiento del controlador.
Importante: Si se produce un fallo en un segundo disco mientras se está realizando la reconstrucción del primero, se perderán todos los datos.
Lo recomendamos para un gran número de aplicaciones, pequeños servidores, proporciona alto rendimiento, redundancia de datos y además éste aprovecha mejor el espacio.

Raid6
Se necesitan como mínimo 4 discos. Puede tolerar dos fallos de discos duros (N-2)
El Raid6 es similar a la Raid 5 e incluye un disco de reserva que entra en funcionamiento una vez que uno de los discos se estropea (en este caso hasta que sustituimos el disco averiado, a todos los efectos tenemos un Raid 5).
Proporciona por tanto una elevada redundancia de datos y rendimiento de lectura.
El rendimiento en tareas de escritura es menor que el de Raid 5 debido a los dos cálculos de paridad. Requiere hacer un gasto adicional ya que dedicamos dos discos a la paridad, (si tenemos 4 discos de 1TB disponemos sólo de 2TB de espacio ya que los otros 2 TB se dedican a paridad).
El Raid 6 resulta aconsejable cuando queramos soportar varios fallos de unidades y ofrece una mayor redundancia para la protección de datos.

Raid10 (Raid 1+0)
Se necesitan un mínimo de cuatro discos
En el RAID 1+0—> Se hace un Raid 1 y sobre ellos un RAID 0
Se necesitan un mínimo de cuatro o más unidades, por lo que el coste es más elevado que en otras configuraciones.
a cambio obtenemos un alto rendimiento de lectura (gracias al Raid 0), a la vez que se proporciona tolerancia a los fallos (gracias al Raid1). P.e. si usamos 4 discos, se pueden romper hasta dos sin perder información (N-2), siempre que nos sean del mismo subgrupo.
Aunque su precio es más elevado, el RAID 10 es ideal para aplicaciones tipo servidores de bases de datos. Proporciona un elevado rendimiento, redundancia de datos completa y una rápida recuperación ante fallos de los discos.

Raid 50 (Raid 5+0)
Se necesitan como mínimo 6 discos. s*( n-1). con la posibilidad de que se puedan estropear hasta 3 discos sin perder datos.
En el Raid 5+0—> Se hace un Raid 5 y sobre ellos un RAID 0.
Con el RAID 50 conseguiremos un volumen muy robusto, un mayor rendimiento de lectura en comparación con la RAID 5 estándar, y un rendimiento de escritura de medio a alto.
Presenta las mismas desventajas que el RAID 5 (impacto medio ante los fallos de disco y tiempos de reconstrucción más largos al ser necesario volver a calcular la paridad), y un precio más elevado.

Raid 60 (Raid 6+0)
Se necesitan como mínimo 8 discos, con la posibilidad de que se puedan estropear hasta 4 discos sin perder datos.
En el Raid 6+0—> Se hace un Raid 6 y sobre ellos un RAID 0.
Obtenemos un alto rendimiento sobre todo en tareas de lectura.
Las desventajas son las mismas a las del RAID6 (rendimiento más bajo en escritura debido a los dos cálculos de paridad, y mayor gasto en hardware).

Raid 0+1
Necesitaremos 4 discos duros.
Los discos se agrupan por parejas para que cada una de éstas forme un RAID 0 y sobre estos 2 bloques montamos un Raid 1. Esta configuración es menos segura que la RAID 10, ya que no tolera dos fallos simultáneos
Tipos de RAID más usados en servidores.
Los tipos de RAID más utilizados en servidores son el RAID1, RAID5, RAID 6 y RAID 10.
Algunos términos importantes que conviene conocer son éstos:
Datos de paridad: éstos se distribuyen entre todos los discos físicos en el sistema. Si un disco físico falla, es posible reconstruirlo desde la paridad y los datos de los discos físicos restantes. Los datos de paridad están presentes en RAID 5, 6, 50 y 60.
Modo Degradado: Ocurre cuando uno de los discos del RAID se vuelve ilegible, el disco entonces es considerado corrupto y se extrae del RAID. Los datos y la paridad del disco son almacenados en los discos restantes. Este proceso degrada en gran medida el rendimiento del RAID, y es lo que se llama Modo degradado.
Hot Swap, intercambio de discos
A la hora de configurar nuestro servidor hay que evaluar el impacto que tiene una posible parada de nuestros sistemas. Por ello, recomendamos incluir los elementos críticos del hardware por duplicado. Los más importantes con:
Fuentes de alimentación y ventiladores redundantes
Hot Swap para intercambio en caliente de discos. Muy importante, ya que nos permitirá sustituir el disco averiado por uno nuevo, sin necesidad de desconectar o apagar el servidor, para luego poder reconstruir la información.
Podemos dejarlo configurado de 2 formas:
Tenemos el disco duro de reserva cargado en el RAID, aunque sin utilizar, de manera que si tenemos un fallo de disco duro automáticamente empieza a reconstruir los datos en el disco que teníamos preparado (Es un RAID 6).
No tenemos el disco insertado en el servidor pero tenemos la capacidad de sustitución en caliente. Esta es una opción algo más arriesgada, que implica tener lo más cerca posible un disco de reserva y reemplazarlo lo antes posible antes de que falle una segunda unidad.

Controladora RAID
Una controladora RAID es una tarjeta de hardware o una aplicación de software que se utiliza con el objetivo de gestionar varios discos duros en un mismo servidor.
La controladora RAID puede darse por software o por hardware. Nuestra experiencia nos dice que es más recomendable escoger las controladoras por hardware, ya que son más fiables y ofrecen mayores niveles de rendimiento.
Más abajo las explicamos sus diferencias un poco más en detalle.
Raid por software vs Raid por hardware
Un sistema RAID puede ser controlado por hardware o por software, y aquí es donde también existe diferencia tanto de funcionamiento como de rendimiento. Como ahora veremos cada sistema tiene sus pros y contras.-
RAID por software

Los discos se conectan a la placa o a una controladora, y es el procesador y el sistema operativo quienes hacen las operaciones necesarias para controlar el RAID y los discos.
Ventajas. Es fácilmente ampliable con la cantidad de discos que se necesiten, realmente la única limitación es la que ofrezca la placa base. También es más fácil de configurar.
Inconvenientes. Para aquellos RAID que necesiten más recursos, el rendimiento general del sistema puede verse afectado. Además en el caso de que se degrade el RAID, es más complicado volver a recuperarlo y se puede perder información.
RAID por hardware

Ventajas
El RAID por hardware es más fiable que el RAID por software ya que es más independiente del resto de componentes.
Ofrece un mayor rendimiento, que sobre todo se notará en RAID 5 y RAID 6 donde se realizan operaciones de paridad y se consumen más recursos.
Inconvenientes
Es necesario realizar actualizaciones del firmware.
Puede haber incompatibilidades del hardware con la placa base del servidor o que no existan drivers apropiados—> por ello aconsejamos que tarjeta y servidor sean del mismo fabricante (IBM, Dell, HP).
Dependiendo del modelo de tarjeta que escojamos, será compatible con un determinado hardware y soportará determinados niveles de RAID.
Calculadora RAID online
Si queréis probar cómo quedarían las distintas configuraciones de RAID, existen múltiples calculadores online.
http://www.raid-calculator.com/
https://www.icc-usa.com/raid-calculator
https://www.synology.com/es-es/support/RAID_calculator (bastante más visual y en español)
Preguntas frecuentes
¿Se puede hacer un RAID 5 con 2 discos?
Para un RAID 5 lo mínimo son 3 discos iguales. Por tanto no puedes construir un RAID 5 con 2 discos.
En este caso debes decantarte por un RAID 0 o por un RAID 1.
Diferencia entre RAID 1 y RAID 5
RAID 1
En el RAID 1 tenemos un número de discos que se «copian» en otros tantos iguales. Porejemplo si tenemos 2 discos podemos hacer que 1 disco se «espeje» en el otro.
Si tenemos 10 discos, podemos crear un RAID1 donde 5 de esos discos, se «espejarán» en los otros 5.
Por tanto de los «x» discos que tenemos, el 50% de ellos contendrán los datos y el otro 50% se utilizarán como espejo de los originales.
Si los discos del ejemplo son de 1TB y usamos los 10, al final con un RAID 1 tendremos disponibles 5TB para almacenar datos, mientras que los otros 5TB se usarán a modo de reserva y no estarán disponibles para el usuario.
RAID 5
En el caso del RAID 5 necesitamos un mínimo de 3 discos iguales. Uno de ellos no estará disponible para almacenar datos porque se utilizará a modo de reserva.
Si construimos un RAID 5 con 4 discos de 1TB tendremos 3TB disponibles para nuestros datos y 1TB no estará disponible porque será el que utilice el RAID 5 para comprobar la integridad.
Si tomamos el mismo ejemplo anterior de 10 discos de 1TB, tendremos 9TB disponibles y 1TB no disponible.
¿Cuántos discos pueden fallar en un RAID 5?
En un RAID 5 puede fallar únicamente 1 disco duro.
El RAID 5 hace una suma lógica de los bits almacenados en sus discosy almacena el resultado en el disco que no está disponible para el usuario.
En el caso del fallo de 1 disco duro en el RAID 5 el sistema es capaz de saber que dato falta puesto que tiene la suma de los bits (menos el dato que está en el disco que ha fallado) y el resultado. De esta forma calcula en tiempo real los datos que faltan.
Cuando esto se produce, el equipo debe realizar una gran cantidad de cálculos constantemente para suplir, en tiempo real, esa información que ya no está. Por eso, se produce una caída del rendimiento y se habla entonces de que el RAID se ha degradado hasta que se reemplace el disco defectuoso y se reconstruya el RAID.
Si se produce el fallo de un segundo disco se perderán todos los datos, con independecia de cuantos discos haya en el RAID. La controladora de RAId ya no tiene forma de saber que valores estaban almacenados enlos discos que faltan.
Si tenemos un RAID 5 con 10 discos de 1TB y falla 1, el RAID se degradará pero no habrá una pérdida de datos. Si fallan 2 discos los 9TB de almacenamiento se perderán.
RAID 0 vs no RAID
Un RAID 0 consiste en agrupar varios discos en una misma unidad. Si tenemos 2 discos de 1TB y hacemos un RAID 0 con ellos, obtendremos un Volumen de 2TB.
El RAID 0, no tiene tolerancia a fallos. Si falla 1 de los discos, se perderá el contenido de ambos.
Si por el contrario tenemos 2 discos de 1TB y no los agrupoamos en un RAID 0, tenemos 2 volúmenes de 1TB cada uno, es decir 2 discos simples.
Elegir entre RAID 5 or RAID 6
El RAID 5 y el RAID 6 son, simplificando, lo mismo.
Cuando el RAID 5 se degrada, necesitamos reemplazar el disco defectuoso.
El RAID 6 es un RAID 5 al que añadimos 1 disco adicional, que no se utiliza y que entra en funcionamiento cuando 1 disco falla.
Ventajas: en lugar de tener que cambiarlo a toda prisa cuando falla un disco, este ya está en el sistema y entra en funcionamiento automáticamente.
Desventajas: estamospagando por un disco que realemnte no se utiliza y que está «por si acaso».
Por tanto, es una cuestión más económica que técnica.
Siendo «n» el número de discos de nuestro sistema:
Con el RAID 5 tenemos disponibles para nuestros datos (n-1) discos y para el RAID 6 tenemos disponibles (n-2) discos.