Los sistemas de informacin empezaron a utilizar las
bases de datos distribuidas aproximadamente a mediados de la dcada de los 70s. Estos problemas impulsaron la creacin de ALMACENAMIENTO DISTRIBUIDO, los cuales hoy en da proveen caractersticas indispensables en el manejo de informacin; es decir, la combinacin de las redes de comunicacin y las bases de datos.
Sistema de Cmputo Distribuido. Es un conjunto de elementos de procesamiento autnomos (no necesariamente homogneos) se interconectan por una red de comunicaciones y cooperan entre ellos para realizar sus tareas asignadas. Una base de datos distribuida (BDD) Es un conjunto de mltiples bases de datos lgicamente relacionados las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones. Un sistema de bases de datos distribuida(SBDD) Es un sistema en el cual mltiples sitios de bases de datos estn ligados por un sistema de comunicaciones , de tal forma que ,un usuario en cualquier sitio .
Un sistema de manejo de bases de datos distribuidas (SMBDD)
Es aquel que se encarga del manejo de la BDD y proporciona un mecanismo de acceso que hace que la distribucin sea trasparente a los usuarios.
Un sistema de base de datos distribuida (SBDD)
Es entonces el resultado de la integracin de una base de datos distribuida con un sistema para su manejo. En un sistema de base de datos distribuida, los datos se almacenan en varios computadores (llamados sitios o nodos). Los computadores de un sistema distribuido se comunican entre s a travs de diversos medios de comunicacin.
Base de Datos Distribuida. Una BD Distribuida es aquella donde los datos estn repartidos entre ms de una mquina y un SGBD que lo gestiona haciendo que la distribucin sea transparente al usuario, el acta ve toda la base de datos. Tambin es un conjunto de mltiples bases de datos lgicamente relacionadas las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones.
Definicin de una Base de Datos Distribuido: En otras palabras, cada sitio local tiene Sus propias BD reales Sus propios usuarios locales Software de administracin de transacciones (incluyendo su propio software local para bloqueo, registro en bitcora, recuperacin, etc.) As como su propio administrador de comunicacin de datos local.
Las principales diferencias entre estos tipos de configuraciones Costo de la instalacin: El costo de conectar fsicamente las localidades del sistema Costo de la comunicacin: El costo del tiempo y el dinero que interviene en enviar un mensaje desde una localidad a otra. Fiabilidad: La frecuencia con que falla una lnea de comunicacin o una localidad. Disponibilidad: La posibilidad de acceder a la informacin a pesar que podran existir los fallos en algunas localidades o lneas de comunicacin.
ALMACENAMIENTO DISTRIBUIDO DE DATOS Hay dos enfoques del almacenamiento de esta relacin en la base de datos distribuida: Rplica: El sistema conserva rplicas (copias) idnticas de la relacin y guarda cada rplica en un sitio diferente. Fragmentacin: El sistema divide la relacin en varios fragmentos y guarda cada fragmento en un sitio diferente.
Caractersticas. Autonoma Local: No dependencia de un sitio central: Operacin Continua: Independencia con respecto a la localizacin: Independencia con respecto a la fragmentacin: Independencia de rplica: Procesamiento Distribuido de Consultas: Manejo Distribuido de Transacciones: Independencia con respecto al equipo
Construccin de una base de datos distribuidos
Base distribuida particionada
Una base de datos global se divide en tres partes (A, B, C), donde cada una de las bases se almacena en lugares diferentes.
Base de datos multiplicada y distribuida: las bases de datos se duplican en cada sitio, con el objetivo de reducir costos de comunicacin y aumentar el desempeo del sistema, eliminando la necesidad de la transmisin de datos en las diferentes ubicaciones. El sistema es raro por su costo de las replicas de sus bases y el proceso de la actualizacin de datos. Distribucin de la base de datos combinando replicas y particiones: En la actualidad este tipo de distribucin se emplea con mayor frecuencia. El archivo se divide basndose en el patrn que usa, es decir los datos se guardan en los lugares donde puede ser accesado con ms frecuencia, pero si requiere un dato en ms de un sitio, este fragmento puede estar almacenado en cada uno de estos sitios.
Caractersticas. Autonoma Local: las operaciones en un sitio dado se controlan en ese sitio. No dependencia de un sitio central: No debe de haber dependencia de un sitio central para obtener un servicio. Operacin Continua: Nunca debera apagarse para que se pueda realizar alguna funcin, como aadir un nuevo sitio. Independencia con respecto a la localizacin: No debe de ser necesario que los usuarios sepan dnde estn almacenados fsicamente los datos, sino que ms el usuario lo debe de ver como si solo existiera un sitio local
Independencia de rplica: Si una relacin dada (es decir, un fragmento dado de una relacin) se puede presentar en el nivel fsico mediante varias copias almacenadas o rplicas, en muchos sitios distintos. Procesamiento Distribuido de Consultas: El objetivo es convertir transacciones de usuario en instrucciones para manipulacin de datos, y as reducir el trfico en la red implica que el proceso mismo de optimizacin de consultas debe ser distribuido. Manejo Distribuido de Transacciones: Tiene dos aspectos principales, el control de recuperacin y el control de concurrencia, cada uno de los cuales requiere un tratamiento ms amplio en el ambiente distribuido.
Objetivos de la base de datos distribuida
Autonoma Local. No dependencia de un sitio central. Operacin contina. Independencia con respecto a la localizacin. Independencia con respecto a la fragmentacin.
Ventajas
Mayor rendimiento Mayor confiabilidad Cambia de tamao con facilidad Adecuado fcilmente a la estatura Compartimiento de datos Autonoma Disponibilidad
Desventajas Peor rendimiento Menor confiabilidad Mayor complejidad Costos ms altos Costo del desarrollo del software Mayor probabilidad de errores Mayor sobrecarga de procesamiento Actualizacin de los datos duplicados
MODELO DE UNA ARQUITECTURA DISTRIBUIDA
Diseo de la base de datos distribuidas
Transparencia y autonoma La transparencia de la red es el mtodo por el cual los usuarios del sistema pueden ignorar los detalles del diseo distribuido. La autonoma local es el mtodo por el cual el diseador o administrador de una localidad pueden ser independientes del resto del sistema distribuido. Nombre de los datos. Repeticin de los datos. Fragmentacin de los datos. Localizacin de las bases locales y sus copias.
Almacenamiento distribuido de datos Replica: El sistema consiste en varias copias iguales, donde cada copia se guarda en una base diferente, lo que significa la rplica de los datos. Disponibilidad Distribucin de la base de datos combinando replicas y particiones Actualizacin de los datos duplicados
Fragmentacin de datos Si una base se encuentra fragmentada, esta base se dividir en numerosos fragmentos. Los fragmentos contienen suficiente informacin para permitir la reconstruccin de la base original. Fragmentacin horizontal Divide la base asignando a cada divisin a uno o varios fragmentos.
Fragmentacin vertical: Divide la base de un modo especial, igual que una descomposicin, implica el concepto de varios subconjuntos. Todos los esquemas resultantes contienen una clave candidato comn (o superclase) .Se aade un atributo especial que acta como clave candidata. Ambos tipos de fragmentacin se pueden mezclar.
Ejemplo: type cuenta = record nombre: char(22); maquina: char(8); login: char(8); end
Fragmentacin Mixta la base se divide por medio de una serie de relaciones de fragmentos, donde cada fragmento tiene como resultado los procedimientos de las fragmentaciones horizontales y mixtas
Secretaria Datos EUI Jefatura estudios Resultante de fragmentacin horizontal previa Replica y fragmentacin de datos la rplica y fragmentacin de datos se puede aplicar de manera continua, es decir de una pequea divisin que anteriormente se ha fragmentado tambin se puede hacer una rplica y estos fragmentos tambin se pueden volver a fragmentar.
Ventajas de la fragmentacin:
Horizontal permite el procesamiento paralelo de una relacin permite que una tabla global pueda estar donde se utiliza ms frecuentemente Vertical permite que una tabla pueda ser distribuida en funcin del uso de sus atributos. permite descomposiciones adicionales que se pueden conseguir con normalizacin. el atributo especial facilita la mezcla de fragmentos verticales permite el procesamiento paralelo de una relacin
Transparencia de la red
Los datos se pueden guardar de muchas maneras en el sistema de bases distribuidas, pero tambin es de suma importancia que este sistema disminuya cualquier informacin que los usuarios necesitan saber cmo se guarda el dato en la base. Entonces el sistema pude ocultar este tipo de detalle de la distribucin de los datos en la red a esto se lo llama transparencia de red:
12. Transparencia de localizacin
Si el sistema es transparente en cuanto a la repeticin y fragmentacin de las bases donde se ocultar al usuario gran parte del esquema de la base de datos distribuida. Sin embargo, el componente de los nombres que identifican a la base obliga al usuario a darse cuenta del hecho de que el sistema est distribuido.
Modelo de transacciones distribuidas
El acceso a los diferentes elementos de las bases en los sistemas de bases distribuidas se puede realizar mediante transacciones donde se debe conservar las propiedades ACID ( conjunto de caractersticas que se necesitan para que una serie de instrucciones puedan ser consideradas como transacciones ) Hay que tener en cuenta dos tipos de transacciones.
Transacciones locales: tienen total acceso y actualizacin de datos en una sola de las bases locales Transacciones globales: tienen total acceso y actualizacin en varias bases de datos en varias bases de datos locales Arquitectura del sistema: Cada procedimiento tiene su propio gestor de transacciones locales, cuya funcin es asegurar las propiedades ACID, los diferentes gestores de transacciones ayudan para la ejecucin de las transacciones globales, por lo tanto cada procedimiento del sistema contiene en si dos subsistemas: Modos de fallos del sistema: los sistemas de bases de datos distribuidos pueden tener los mismos fallos que los sistemas de base de datos centralizados, por ejemplo: errores de software, hardware, o fallos graves del disco, pero existen otros fallos muy importantes en este tipo de sistema. Fallos de un procedimiento Perdida de mensajes: es muy usual en este tipo de sistemas distribuidos, utilizan protocolos de control de la transmisin, como TCP/IP. Fallos de un enlace de comunicaciones Divisin de la red . Aplicacin
Aplicaciones Manufactura(multiplantas) Comando y control militar SIGs corporativos Aerolneas Cadenas hoteleras Cualquier organizacion que tenga una estructura organizacional desentralizada