Você está na página 1de 21

Un sistema de computacin

distribuido

Consiste en un nmero de elementos de procesamiento, no


necesariamente homogneos, que estn interconectados
mediante una red de computadores, y que cooperan para la
realizacin de ciertas tareas asignadas.
Como objetivo general, estos sistemas dividen un gran e
inmanejable problema en piezas ms pequeas para
resolverlo de una manera coordinada.
La viabilidad econmica de este planteamiento procede de
dos razones:
Una mayor potencia de computacin emparejada a la
resolucin de una tarea compleja
Que cada elemento de procesamiento autnomo pueda ser
administrado de manera independiente y desarrollar sus
propias aplicaciones

Una coleccin de ficheros almacenados en


nodos diferentes de una red y el
mantenimiento de las interrelaciones entre
ellos a travs de hiperenlaces se ha
convertido en una organizacin comn en
Internet, todo ello mediante pginas web. Las
funciones comunes de la administracin de
una base de datos, incluyendo el
procesamiento uniforme de las consultas y las
transacciones, no se aplica an a este
escenario

Tecnologa paralela frente a distribuida


Tomando nuestra atencin hacia las arquitecturas de
sistema paralelo, existen dos tipos fundamentales
de arquitecturas de sistema multiprocesador:
Arquitectura de memoria compartida
(estrechamente acoplada o tightly coupled).
Varios procesadores comparten el almacenamiento
secundario (disco) y la memoria primaria .
Arquitectura de disco compartido (dbilmente
acoplada o loosely coupled).
Varios procesadores comparten el almacenamiento
secundario (disco), pero cada uno de ellos tiene su
propia memoria primaria.

La arquitectura "nada compartido" es otro tipo


de sistema multiprocesador.
En ella, cada procesador tiene su propia
memoria (disco) primaria y secundaria, no
existe memoria comn, yesos procesadores se
comunican mediante una red de interconexin
de alta velocidad (bus o switch).

Ventajas de las bases de datos


distribuidas

1. Administracin de datos distribuidos


con distintos niveles de transparencia.
De manera ideal, un DBMS debe ser una
distribucin transparente en el sentido de
ocultar los detalles de dnde est fsicamente
ubicado cada fichero (tabla, relacin) dentro
del sistema.

Son posibles los siguientes tipos de


transparencias:

Transparencia de red o de distribucin. Hace


referencia a la autonoma del usuario de los detalles
operacionales de la red. Puede dividirse en
transparencia de localizacin y de denominacin.
La transparencia de localizacin hace mencin al
hecho de que el comando usado para llevar a cabo
una tarea es independiente de la ubicacin de los
datos y del sistema desde el que se ejecut dicho
comando.
La transparencia de denominacin implica que, una
vez especificado un nombre, puede accederse a los
objetos nombrados sin ambigedad y sin necesidad
de ninguna especificacin adicional.

Transparencia de replicacin. Como podemos


ver en la Figura pueden almacenarse copias
de los datos en distintos lugares para disponer
de una mayor disponibilidad, rendimiento y
fiabilidad.
La transparencia de replicacin permite que el
usuario no se entere de la existencia de
copias.

Transparencia de fragmentacin. Existen dos


posibles tipos de fragmentacin:
La horizontal distribuye una relacin en conjuntos
de tuplas (filas)
La vertical lo hace en subrelaciones, de modo que
cada subrelacin est definida por un subconjunto
de las columnas de la relacin original.
Una consulta global del usuario debe ser
transformada en varias consultas fragmentadas. La
transparencia de fragmentacin permite que el
usuario no se entere de la existencia de
fragmentos.

La transparencia de diseo y de ejecucin


hace referencia a la libertad de saber cmo
est diseada la base de datos distribuida y
dnde ejecuta una transaccin

Algunos tipos de arquitecturas de base de


datos.

Arquitectura "nada
compartido".

Arquitectura en red con una base de datos


centralizada en una de sus ubicaciones

Arquitectura de base
de datos distribuida
autntica

2. Incremento de la fiabilidad y la
disponibilidad

stas son dos de las ms importantes


ventajas de las bases de datos distribuidas.
La fiabilidad est definida ampliamente
como la probabilidad de que un sistema
est funcionando (no cado) en un momento
de tiempo
La disponibilidad es la probabilidad de que
el sistema est continuamente disponible
durante un intervalo de tiempo.

Cuando los datos y el software DBMS estn distribuidos


a lo largo de distintas localizaciones, uno de ellos puede
fallar, mientras el resto contina operativo.
Slo los datos y el software almacenados en la
localizacin que falla sern los que no estn disponibles.
Esto mejora tanto la fiabilidad como la disponibilidad.
Se logra una apreciable mejora al replicar tanto los
datos como el software en ms de una ubicacin.
En un sistema centralizado, el fallo de una ubicacin
provoca la cada del sistema para todos los usuarios.
En una base de datos distribuida, parte de la
informacin puede estar inaccesible, pero s se podr
acceder a otras partes de la base de datos.

3. Rendimiento mejorado.

Un DBMS distribuido fragmenta la base de datos


manteniendo la informacin lo ms cerca posible del punto
donde es ms necesaria.
La localizacin de datos reduce el enfrentamiento por la CPU
y los servicios de E/S, a la vez que atena los retardos en el
acceso implcito a las redes de rea extendida.
Cuando se distribuye una base de datos a lo largo de varias
localizaciones, lo que obtenemos son bases de datos ms
pequeas.
Como resultado, las consultas locales y las transacciones de
acceso a los datos de uno de estos sitios tienen un mayor
rendimiento debido al menor tamao de esas bases de
datos. Adems, cada sitio tiene que ejecutar un menor
nmero de transacciones que si todas ellas fueran llevadas
a cabo por una base de datos centralizada

4. Expansin ms sencilla.

En un entorno distribuido, la expansin del


sistema en trminos de incorporacin de ms
datos, incremento del tamao de las bases de
datos o la adicin de ms procesadores es
mucho ms sencilla.

Funciones adicionales de las bases de


datos distribuidas

Seguimiento de los datos. La capacidad de controlar la distribucin de los datos,


la fragmentacin y la replicacin expandiendo el catlogo DDBMS.

Procesamiento de consultas distribuidas. La posibilidad de acceder a sitios


remotos y de transmitir consultas y datos a lo largo de todos esos sitios mediante una
red de comunicacin.

Administracin de transacciones distribuidas. La facultad de disear estrategias


de ejecucin de consultas y transacciones que accedan a los datos desde ms de una
ubicacin y de sincronizar el acceso a los datos distribuidos y de mantener la
integridad de toda la base de datos.

Administracin de datos replicados. La capacidad de decidir a qu copia de un


dato acceder y de mantener la consistencia de las copias de un elemento de datos
replicado.

Recuperacin de una base de datos distribuida. La facultad de recuperarse de


las cadas de una localizacin individual u otro tipo de fallos, como los fallos en los
enlaces de comunicacin.

Seguridad. Las transacciones distribuidas deben ejecutarse con una adecuada


administracin de la seguridad de los datos y contando con los privilegios de
autorizacin/acceso de los usuarios.

Administracin del directorio (catlogo) distribuido. Un directorio contiene


informacin (metadatos) sobre los datos de la base de datos. Puede ser global a toda
la DDB, o local para cada sitio. La colocacin y distribucin del directorio son temas
relacionados con el diseo y las polticas.

A nivel de hardware, los siguientes son los


factores principales que distinguen un DDBMS
de un sistema centralizado:
Existen mltiples computadores llamados
sitios o nodos.
Estos sitios deben estar conectados por algn
tipo de red de comunicacin para transmitir
los datos y los comandos entre ellos

Estos sitios pueden estar cercanos entre s


(digamos, dentro del mismo edificio o grupo
de edificios adyacentes) y conectados
mediante una red de rea local, o estar
geogrficamente distribuidos a larga distancia
y enlazados a travs de una red de rea
expandida o long-haul.
Las redes de rea local suelen emplear cables
mientras que las long-haul utilizan lneas
telefnicas o satlites

Você também pode gostar