Você está na página 1de 11

Almacenamiento redundante y distribuido

Consiste en un conjunto de tcnicas hardware o software que utilizando varios discos


proporcionan principalmente tolerancia a fallos, mayor capacidad y mayor fiabilidad en el
almacenamiento. Se trata de un sistema de almacenamiento que utilizando varios discos y
distribuyendo o replicando la informacin entre ellos consigue algunas de las siguientes
caractersticas:
o Mayor capacidad: es una forma econmica de conseguir capacidades grandes de
almacenamiento. Combinando varios discos ms o menos econmicos podemos conseguir
una unidad de almacenamiento de una capacidad mucho mayor que la de los discos por
separado.
o Mayor tolerancia a fallos: en caso de producirse un error, con RAID el sistema ser capaz
en algunos casos de recuperar la informacin perdida y podr seguir funcionando
correctamente.
o Mayor seguridad: debido a que el sistema es ms tolerante con los fallos y mantiene
cierta informacin duplicada, aumentaremos la disponibilidad y tendremos ms garantas
de la integridad de los datos.

o Mayor velocidad: al tener en algunos casos cierta informacin repetida y distribuida, se


podrn realizar varias operaciones simultneamente, lo que pravocar mayor velocidad.
Este conjunto de tcnicas estn organizadas en niveles. Algunos de estos niveles son:

RAID nivel 0 (RAID 0):


En ste nivel los datos se distribuyen equitativamente y de forma transparente para los
usuarios entre dos o ms discos. Como podemos ver en la siguiente figura, los bloques de la
unidad A se almacenan de forma alternativa entre los discos 0 y 1 de forma que los bloques
impares de la unidad se almacenan en el disco 0 y los bloques pares en el disco 1.
Esta tcnica favorece la velocidad debido a que cuando se lee o escribe un dato, si el
dato est almacenado en dos discos diferentes, se podr realizar la operacin
simultneamente. Para ello ambos discos tienen que estar gestionados por
controladoras independientes.
Hay que tener en cuenta que RAID 0 no incluye ninguna informacin redundante,
por lo que en caso de producirse un fallo en cualquiera de los discos que componen la
unidad provocara la prdida de informacin en dicha unidad.

RAID nivel 1(RAID 1):


A menudo se conoce tambin como espejo. Consiste en mantener una copia idntica de la
informacin de un disco en otro u otros discos, de forma que el usuario ve nicamente una
unidad, pero fsicamente esta unidad est siendo almacenada de forma idntica en dos o
ms discos de forma simultnea.
Si se produjera un fallo en un disco la unidad podra seguir funcionando sobre un
solo disco mientras sustituimos el disco daado por otro y rehacemos el espejo.
Adicionalmente, dado que todos los datos estn en dos o ms discos, con hardware
habitualmente independiente, el rendimiento de lectura se incrementa
aproximadamente como mltiplo lineal del nmero de copias; es decir, un RAID 1
puede estar leyendo simultneamente dos datos diferentes en dos discos diferentes,
por lo que su rendimiento se duplica. Para maximizar los beneficios sobre el
rendimiento del RAID 1 se recomienda el uso de controladoras de disco
independientes, una para cada disco (prctica que algunos denominan splitting o
duplexing).

RAID nivel 5(RAID 5):


Los bloques de datos se almacenan en la unidad, y la informacin redundante de dichos
bloques se distribuye cclicamente entre todos los discos que forman el volumen RAID 5.

Por ejemplo si aplicamos RAID 5 sobre un conjunto de 4 discos, como vemos en la


siguiente figura, los bloques de datos se colocan en tres de los cuatro bloques,
dejando un hueco libre en cada lnea que ir rotando de forma cclica (una lnea est
formada por un bloque con el mismo nmero de orden de cada disco y est
representado en la figura con el mismo color). En este hueco se colocar un bloque de
paridad. Con este sistema, el bloque de paridad se coloca cada vez en un disco.

El bloque de paridad se calcula a partir de los bloques de datos de la misma lnea, de


forma que el primero ser un 1, si hay un nmero impar de unos en el primer bit de los
bloques de datos de la misma lnea, y O si hay un nmero par de unos.
En RAID 5 si se produce fallo en dos discos la informacin es irrecuperable. Esto parece
muy improbable, pero o medida que se aaden ms discos, la probabilidad aumenta.

4.1. RAID en Windows


En Windows estamos acostumbrados a que una unidad fsica corresponda con una unidad
lgica (o varias en caso de tener varias particiones). Este es el concepto clsico de
Windows, los discos bsicos. A partir de Windows 2000 comienza a aplicarse adems de
los discos bsicos un nuevo tipo de almacenamiento llamado discos dinmicos. Al igual
que en los discos bsicos crebamos unidades lgicas, en las discos dinmicas creamos
volmenes dinmicos. Existen cinco tipos de volmenes dinmicos: Simples: es un
volumen que utiliza espacio de un solo disco fsico. Es el tipo de disco dinmico que se crea
cuando transformamos una unidad lgica en un volumen dinmico. Distribuidos: es un
volumen que se crea ocupando espacio de varios discos. Se construye como una
concatenacin de discos, sin existir una regla que especifique cmotienen que almacenarse
los datas en los discos (como ocurre en RAID O). Permite crear unidades grandes a partir
de varios discos. Los principales inconvenientes son que no supone ninguna mejora en la
velocidad del acceso y que no incluye redundancia.Tambin son conocidos cama JBOD.
Seccionados: corresponde can el nivel O de RAID. Reflejados: corresponde con el nivel 1
de RAID. RAID 5: corresponde con el nivel 5 de RAID. No hay que olvidarse de que se
puede pasar un disco bsico a dinmico sin perder informacin, pero no al revs. Adems
cuando un disco se convierte en dinmico solo podr arrancar el sistema operativo que est
activo en el momento de la conversin.
4.2. RAID en Windows Vista
Dentro de la rama de sistemas operativos de Microsoft no orientados a servidores
(Windows XP, Vista ) solo es posible crear los tres primeros tipos de volmenes
dinmicos:simples, distribuidos y seccionados.
4.3. RAID en Windows 2008 Server
En la rama de sistemas operativos de servidor de Microsoft, podemos crear todos los tipos
de volmenes dinmicos .

Qu es RAID?

El trmino RAID es un acrnimo del ingls Redundant Array of Independent


Disks. Significa matriz redundante de discos independientes. RAID es un mtodo
de combinacin de varios discos duros para formar una nica unidad lgica en la
que se almacenan los datos de forma redundante. Ofrece mayor tolerancia a fallos
y ms altos niveles de rendimiento que un slo disco duro o un grupo de discos
duros independientes.
Una matriz consta de dos o ms discos duros que ante el sistema principal
funcionan como un nico dispositivo. Un RAID, para el sistema operativo, aparenta
ser un slo disco duro lgico (LUN). Los datos se desglosan en fragmentos que se
escriben en varias unidades de forma simultnea. En este mtodo, la informacin
se reparte entre varios discos, usando tcnicas como el entrelazado de bloques
(RAID nivel 0) o la duplicacin de discos (RAID nivel 1) para proporcionar
redundancia, reducir el tiempo de acceso, y/o obtener mayor ancho de banda para
leer y/o escribir, as como la posibilidad de recuperar un sistema tras la avera de
uno de los discos.
La tecnologa RAID protege los datos contra el fallo de una unidad de disco duro.
Si se produce un fallo, RAID mantiene el servidor activo y en funcionamiento hasta
que se sustituya la unidad defectuosa.
La tecnologa RAID se utiliza tambin con mucha frecuencia para mejorar el
rendimiento de servidores y estaciones de trabajo. Estos dos objetivos, proteccin
de datos y mejora del rendimiento, no se excluyen entre s.
RAID ofrece varias opciones, llamadas niveles RAID, cada una de las cuales
proporciona un equilibrio distinto entre tolerancia a fallos, rendimiento y coste.
Todos los sistemas RAID suponen la prdida de parte de la capacidad de
almacenamiento de los discos, para conseguir la redundancia o almacenar los
datos de paridad.
Los sistemas RAID profesionales deben incluir los elementos crticos por
duplicado: fuentes de alimentacin y ventiladores redundantes y Hot Swap. De
poco sirve disponer de un sistema tolerante al fallo de un disco si despus falla por
ejemplo una fuente de alimentacin que provoca la cada del sistema.
Tambin cada vez es ms recomendable, sobre todo en instalaciones de cluster,
configuraciones de dos controladoras redundantes y Hot Swap, de manera que en
el caso de fallo de una de ellas se puede proceder a su sustitucin sin tener que
detener el funcionamiento del sistema. Adems, esta configuracin con
controladoras redundantes nos permite conectar el sistema RAID a diferentes
servidores simultneamente.
Ventajas
RAID proporciona tolerancia a fallos, mejora el rendimiento del sistema y aumenta
la productividad.
Tolerancia a fallos: RAID protege contra la prdida de datos y proporciona
recuperacin de datos en tiempo real con acceso interrumpido en caso de que
falle un disco.
Mejora del Rendimiento/ Velocidad: Una matriz consta de dos o ms discos
duros que ante el sistema principal funcionan como un nico dispositivo. Los datos
se desglosan en fragmentos que se escriben en varias unidades de forma
simultnea. Este proceso, denominado fraccionamiento de datos, incrementa
notablemente la capacidad de almacenamiento y ofrece mejoras significativas de
rendimiento. RAID permite a varias unidades trabajar en paralelo, lo que aumenta
el rendimiento del sistema.
Mayor Fiabilidad: Las soluciones RAID emplean dos tcnicas para aumentar la
fiabilidad: la redundancia de datos y la informacin de paridad. La redundancia
implica el almacenamiento de los mismos datos en ms de una unidad. De esta
forma, si falla una unidad, todos los datos quedan disponibles en la otra unidad, de
inmediato. Aunque este planteamiento es muy eficaz, tambin es muy costoso, ya
que exige el uso de conjuntos de unidades duplicados. El segundo planteamiento
para la proteccin de los datos consiste en el uso de la paridad de datos. La
paridad utiliza un algoritmo matemtico para describir los datos de una unidad.
Cuando se produce un fallo en una unidad se leen los datos correctos que quedan
y se comparan con los datos de paridad almacenados por la matriz. El uso de la
paridad para obtener fiabilidad de los datos es menos costoso que la redundancia,
ya que no requiere el uso de un conjunto redundante de unidades de disco.
Alta Disponibilidad: RAID aumenta el tiempo de funcionamiento y la
disponibilidad de la red. Para evitar los tiempos de inactividad, debe ser posible
acceder a los datos en cualquier momento. La disponibilidad de los datos se divide
en dos aspectos: la integridad de los datos y tolerancia a fallos. La integridad de
los datos se refiere a la capacidad para obtener los datos adecuados en cualquier
momento. La mayora de las soluciones RAID ofrecen reparacin dinmica de
sectores, que repara sobre la marcha los sectores defectuosos debidos a errores
de software. La tolerancia a fallos, el segundo aspecto de la disponibilidad, es la
capacidad para mantener los datos disponibles en caso de que se produzcan uno
o varios fallos en el sistema.
Niveles de Raid
La eleccin de los diferentes niveles de RAID va a depender de las necesidades
del usuario en lo que respecta a factores como seguridad, velocidad, capacidad,
coste, etc. Cada nivel de RAID ofrece una combinacin especfica de tolerancia a
fallos (redundancia), rendimiento y coste, diseadas para satisfacer las diferentes
necesidades de almacenamiento. La mayora de los niveles RAID pueden
satisfacer de manera efectiva slo uno o dos de estos criterios. No hay un nivel de
RAID mejor que otro; cada uno es apropiado para determinadas aplicaciones y
entornos informticos. De hecho, resulta frecuente el uso de varios niveles RAID
para distintas aplicaciones del mismo servidor. Oficialmente existen siete niveles
diferentes de RAID (0-6), definidos y aprobados por el el RAID Advisory Board
(RAB). Luego existen las posibles combinaciones de estos niveles (10, 50, ).
Los niveles RAID 0, 1, 0+1 y 5 son los ms populares.
RAID 0: Disk Striping La ms alta transferencia, pero sin tolerancia a fallos.
Tambin conocido como separacin fraccionamiento/ Striping. Los datos se
desglosan en pequeos segmentos y se distribuyen entre varias unidades. Este
nivel de array o matriz no ofrece tolerancia al fallo. Al no existir redundancia,
RAID 0 no ofrece ninguna proteccin de los datos. El fallo de cualquier disco de la
matriz tendra como resultado la prdida de los datos y sera necesario
restaurarlos desde una copia de seguridad. Por lo tanto, RAID 0 no se ajusta
realmente al acrnimo RAID. Consiste en una serie de unidades de disco
conectadas en paralelo que permiten una transferencia simultnea de datos a
todos ellos, con lo que se obtiene una gran velocidad en las operaciones de
lectura y escritura. La velocidad de transferencia de datos aumenta en relacin al
nmero de discos que forman el conjunto. Esto representa una gran ventaja en
operaciones secuenciales con ficheros de gran tamao. Por lo tanto, este array es
aconsejable en aplicaciones de tratamiento de imgenes, audio, video o
CAD/CAM, es decir, es una buena solucin para cualquier aplicacin que necesite
un almacenamiento a gran velocidad pero que no requiera tolerancia a fallos. Se
necesita un mnimo de dos unidades de disco para implementar una solucin
RAID 0.
RAID 1: Mirroring Redundancia. Ms rpido que un disco y ms seguro
Tambin llamado Mirroring o Duplicacin (Creacin de discos en espejo). Se
basa en la utilizacin de discos adicionales sobre los que se realiza una copia en
todo momento de los datos que se estn modificando. RAID 1 ofrece una
excelente disponibilidad de los datos mediante la redundancia total de los mismos.
Para ello, se duplican todos los datos de una unidad o matriz en otra. De esta
manera se asegura la integridad de los datos y la tolerancia al fallo, pues en caso
de avera, la controladora sigue trabajando con los discos no daados sin detener
el sistema. Los datos se pueden leer desde la unidad o matriz duplicada sin que
se produzcan interrupciones. RAID 1 es una alternativa costosa para los grandes
sistemas, ya que las unidades se deben aadir en pares para aumentar la
capacidad de almacenamiento. Sin embargo, RAID 1 es una buena solucin para
las aplicaciones que requieren redundancia cuando hay slo dos unidades
disponibles. Los servidores de archivos pequeos son un buen ejemplo. Se
necesita un mnimo de dos unidades para implementar una solucin RAID 1.
RAID 0+1/ RAID 0/1 RAID 10: Ambos mundos
Combinacin de los arrays anteriores que proporciona velocidad y tolerancia al
fallo simultneamente. El nivel de RAID 0+1 fracciona los datos para mejorar el
rendimiento, pero tambin utiliza un conjunto de discos duplicados para conseguir
redundancia de datos. Al ser una variedad de RAID hbrida, RAID 0+1 combina las
ventajas de rendimiento de RAID 0 con la redundancia que aporta RAID 1. Sin
embargo, la principal desventaja es que requiere un mnimo de cuatro unidades y
slo dos de ellas se utilizan para el almacenamiento de datos. Las unidades se
deben aadir en pares cuando se aumenta la capacidad, lo que multiplica por dos
los costes de almacenamiento. El RAID 0+1 tiene un rendimiento similar al RAID 0
y puede tolerar el fallo de varias unidades de disco. Una configuracin RAID 0+1
utiliza un nmero par de discos (4, 6, 8) creando dos bloques. Cada bloque es una
copia exacta del otro, de ah RAID 1, y dentro de cada bloque la escritura de datos
se realiza en modo de bloques alternos, el sistema RAID 0. RAID 0+1 es una
excelente solucin para cualquier uso que requiera gran rendimiento y tolerancia a
fallos, pero no una gran capacidad. Se utiliza normalmente en entornos como
servidores de aplicaciones, que permiten a los usuarios acceder a una aplicacin
en el servidor y almacenar datos en sus discos duros locales, o como los
servidores web, que permiten a los usuarios entrar en el sistema para localizar y
consultar informacin. Este nivel de RAID es el ms rpido, el ms seguro, pero
por contra el ms costoso de implementar.
RAID 2: Acceso paralelo con discos especializados. Redundancia a travs
del cdigo Hamming
El RAID nivel 2 adapta la tcnica comnmente usada para detectar y corregir
errores en memorias de estado slido. En un RAID de nivel 2, el cdigo ECC
(Error Correction Code) se intercala a travs de varios discos a nivel de bit. El
mtodo empleado es el Hamming. Puesto que el cdigo Hamming se usa tanto
para deteccin como para correccin de errores (Error Detection and Correction),
RAID 2 no hace uso completo de las amplias capacidades de deteccin de errores
contenidas en los discos. Las propiedades del cdigo Hamming tambin restringen
las configuraciones posibles de matrices para RAID 2, particularmente el clculo
de paridad de los discos. Por lo tanto, RAID 2 no ha sido apenas implementado en
productos comerciales, lo que tambin es debido a que requiere caractersticas
especiales en los discos y no usa discos estndares.
Debido a que es esencialmente una tecnologa de acceso paralelo, RAID 2 est
ms indicado para aplicaciones que requieran una alta tasa de transferencia y
menos conveniente para aquellas otras que requieran una alta tasa de demanda
I/O.
RAID 3: Acceso sncrono con un disco dedicado a paridad
Dedica un nico disco al almacenamiento de informacin de paridad. La
informacin de ECC (Error Checking and Correction) se usa para detectar errores.
La recuperacin de datos se consigue calculando el O exclusivo (XOR) de la
informacin registrada en los otros discos. La operacin I/O accede a todos los
discos al mismo tiempo, por lo cual el RAID 3 es mejor para sistemas de un slo
usuario con aplicaciones que contengan grandes registros.
RAID 3 ofrece altas tasas de transferencia, alta fiabilidad y alta disponibilidad, a un
coste intrnsicamente inferior que un Mirroring (RAID 1). Sin embargo, su
rendimiento de transaccin es pobre porque todos los discos del conjunto operan
al unsono.
Se necesita un mnimo de tres unidades para implementar una solucin RAID 3.
RAID 4: Acceso Independiente con un disco dedicado a paridad.
Basa su tolerancia al fallo en la utilizacin de un disco dedicado a guardar la
informacin de paridad calculada a partir de los datos guardados en los otros
discos. En caso de avera de cualquiera de las unidades de disco, la informacin
se puede reconstruir en tiempo real mediante la realizacin de una operacin
lgica de O exclusivo. Debido a su organizacin interna, este RAID es
especialmente indicado para el almacenamiento de ficheros de gran tamao, lo
cual lo hace ideal para aplicaciones grficas donde se requiera, adems, fiabilidad
de los datos. Se necesita un mnimo de tres unidades para implementar una
solucin RAID 4. La ventaja con el RAID 3 est en que se puede acceder a los
discos de forma individual.
RAID 5: Acceso independiente con paridad distribuida.
Este array ofrece tolerancia al fallo, pero adems, optimiza la capacidad del
sistema permitiendo una utilizacin de hasta el 80% de la capacidad del conjunto
de discos. Esto lo consigue mediante el clculo de informacin de paridad y su
almacenamiento alternativo por bloques en todos los discos del conjunto. La
informacin del usuario se graba por bloques y de forma alternativa en todos ellos.
De esta manera, si cualquiera de las unidades de disco falla, se puede recuperar
la informacin en tiempo real, sobre la marcha, mediante una simple operacin de
lgica de O exclusivo, sin que el servidor deje de funcionar.
As pues, para evitar el problema de cuello de botella que plantea el RAID 4 con el
disco de comprobacin, el RAID 5 no asigna un disco especfico a esta misin sino
que asigna un bloque alternativo de cada disco a esta misin de escritura. Al
distribuir la funcin de comprobacin entre todos los discos, se disminuye el cuello
de botella y con una cantidad suficiente de discos puede llegar a eliminarse
completamente, proporcionando una velocidad equivalente a un RAID 0.
RAID 5 es el nivel de RAID ms eficaz y el de uso preferente para las aplicaciones
de servidor bsicas para la empresa. Comparado con otros niveles RAID con
tolerancia a fallos, RAID 5 ofrece la mejor relacin rendimiento-coste en un
entorno con varias unidades. Gracias a la combinacin del fraccionamiento de
datos y la paridad como mtodo para recuperar los datos en caso de fallo,
constituye una solucin ideal para los entornos de servidores en los que gran parte
del E/S es aleatoria, la proteccin y disponibilidad de los datos es fundamental y el
coste es un factor importante. Este nivel de array es especialmente indicado para
trabajar con sistemas operativos multiusuarios.
Se necesita un mnimo de tres unidades para implementar una solucin RAID 5.
Los niveles 4 y 5 de RAID pueden utilizarse si se disponen de tres o ms unidades
de disco en la configuracin, aunque su resultado ptimo de capacidad se obtiene
con siete o ms unidades. RAID 5 es la solucin ms econmica por megabyte,
que ofrece la mejor relacin de precio, rendimiento y disponibilidad para la
mayora de los servidores.
RAID 6: Acceso independiente con doble paridad
Similar al RAID 5, pero incluye un segundo esquema de paridad distribuido por los
distintos discos y por tanto ofrece tolerancia extremadamente alta a los fallos y a
las cadas de disco, ofreciendo dos niveles de redundancia. Hay pocos ejemplos
comerciales en la actualidad, ya que su coste de implementacin es mayor al de
otros niveles RAID, ya que las controladoras requeridas que soporten esta doble
paridad son ms complejas y caras que las de otros niveles RAID. As pues,
comercialmente no se implementa.

Você também pode gostar