Software-RAID HOWTO: Dispositivos

3. Dispositivos

Insistimos, los dispositivos de RAID por software en Linux son dispositivos por bloques, al igual que los discos convencionales y cualquier partición que establezcamos sobre estos. Un dispositivo RAID se construye sobre un número determinado de otros dispositivos por bloques. Por ejemplo, un sistema RAID-1 podría levantarse usando dos discos ordinarios, dos particiónes de disco o dos sistemas RAID.

No hay requerimientos especiales para los dispositivos sobre los que construyáis vuestros sistemas RAID, y esto os da libertad total a la hora de diseñar vuestra propia solución RAID. Y puesto que, desde esta perspectiva, RAID es sólo un conjunto -o agrupación- de dispositivos, podéis dejar volar vuestro ingenio y crear auténticos conjuntos y subconjuntos de acorde con las necesidades que se os planteen.

En este documento nos vamos a referir mediante el término "dispositivo" a elementos como "discos", "particiónes" o incluso "dispositivo RAID". Vamos que un "dispositivo" en este HOWTO es simplemente un "dispositivo por bloques de Linux". Podría tratarse cualquier cosa, desde un disco SCSI a un dispositivo de red por bloques. A menudo, nos referiremos a este rango de "dispositivos" como "discos", porque, no nos engañemos, eso es lo que serán en la inmensa mayoría de los casos. De hecho, casi siempre se trata de discos duros.

Aun así, los dispositivos de vuestros sistemas, pueden jugar varios papeles distintos en esto del RAID. Puede ser "discos libres", podría tratarse de "discos erróneos" o podrían ser los habituales discos funcionales y sanos, en su actividad usual dentro del array.

Y ahora vamos a entrar en detalle acerca de los "discos libres" y los "discos erróneos".

3.1 Discos libres

Los discos libres (también denominados "discos de reserva") son los que no toman parte en un conjunto RAID hasta que falla uno de los discos activos. Cuando se detecta un fallo de dispositivo, el disco erróneo se marca como tal y es apartado de modo que no se vuelva a utilizar, a continuación el proceso de reconstrucción comienza en el primer disco libre disponible.

De esta forma, los discos libres aportan una bonita seguridad extra ante los errores de disco. Esto puede llegar a resultar muy interesante en las configuraciones más vulnerables ante los fallos de un disco, como la RAID-5, donde dos errores de disco consecutivos dan al traste con la información de todo el conjunto entero.

Os podéis también, gracias a los discos libres, relajar un poco más: esto de aportarle un disco libre de apoyo al conjunto RAID os permite dejar al sistema en funcionamiento durante algún tiempo con un disco erróneo, puesto que la redundancia la proporciona el antaño disco libre que toma el relevo de manos del disco que os haya fallado, asumiendo sus funciones.

Aun así, es muy importante que tengáis presente que vuestros ordenadores tal vez no sigan funcionando después de un fallo de disco. La capa RAID de Linux debería de ser capaz de gestionar los fallos de disco correctamente, pero tal vez el resto de componentes del sistema no lo hagan. Es posible que vuestros drivers SCSI tengan errores (quizás diseñarlos para resolver correctamente los miles de errores de disco posibles no haya sido algo prioritario!) a la hora de resolver los fallos físicos de disco. También es muy probable que esos chipsets IDE tan baratos que os habéis comprado :( respondan a un error de disco bloqueando todo el ordenador. Etc.

Más cosas a tener en cuenta, una vez la reconstrucción comienza, el sistema inserta un disco libre en la posición en la que se ha producido una baja. Para que el reemplazo sea efectivo, la capa RAID se pondrá a leer de los discos activos para regenerar la recién perdida redundancia. Si con el uso de los discos se han ido formando bloques erróneos (un fallo de disco habitual, chequead vuestros sistemas de archivos y lo veréis por vosotros mismos), el propio proceso de reconstrucción puede, a raíz de toda la agresiva lectura que conlleva, provocar un fallo en uno de los discos "buenos". Esto nos llevará de cabeza a un fallo RAID total. ¿Ahora es cuando os volvéis a plantear lo de hacer copias de seguridad con frecuencia? Nosotros os premiamos con más de lo mismo: recordad, RAID no es un sustituto de las copias de seguridad.

3.2 Discos erróneos

Cuando la capa RAID gestiona los fallos de dispositivos correctamente, los discos fallidos son etiquetados como tales y la reconstrucción empieza inmediatamente en el primer disco libre que se presente.

Los discos erróneos constan (si no son manualmente retirados del array) como miembros del conjunto RAID. La capa RAID se limita a tratar a los dispositivos marcados como erróneos como parte inactiva del array.

Next Previous Contents