Você está na página 1de 18

Bases de Datos Distribuidas

Estructura de contenidos
Mapa conceptual
Introduccin
1. Definicin
2. Reglas Caractersticas
3. Diseo de Base de Datos Distribuidas
3.1 Consideraciones
3.2 Procedimiento
3.3 Fragmentacin
3.3.1 Fragmentacin Horizontal
3.3.2 Fragmentacin Vertical
4. Replicacin
4.1 Caractersticas
4.2 Objetos de replicacin
4.3 Grupos de replicacin
4.4 Los sitios de replicacin
4.4.1 Un sitio maestro
4.4.2 Un sitio de instantneas
4.5 Replicacin de Instantneas
4.5.1 Copias de slo lectura
4.5.2 Instantneas actualizables
4.5.3 Usos de la replicacin de instantneas.
Glosario
Bibliografa
Control de Documento

2
3
4
4
6
6
7
9
10
11
12
12
12
13
13
13
14
14
14
15
15
16
17
18

1
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

MAPA CONCEPTUAL
Bases de Datos Distribuidas
2
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

Bases de Datos Distribuidas

Introduccin
La dinmica actual de las organizaciones las ha llevado a asumir la
distribucin como un factor de organizacin, bien sea
por que se
encuentran divididas en forma lgica a travs de reas o departamentos,
o porque la divisin se asume de una forma fsica a partir de sucursales,
plantas, laboratorios, etc. Siendo los datos factor determinante para la
realizacin de los diferentes procesos, no es extrao que estos tambin se
encuentren distribuidos a travs de estas reas.
Lograr de una manera lgica y coherente la integracin de la informacin
producida por las diferentes divisiones organizacionales, requiere que las
bases de datos manipuladas por estas reas estn disponibles para los
puntos o nodos de este sistema distribuido, de manera que puedan ser
accedidas globalmente, pero de forma transparente para los usuarios
quienes las procesarn localmente.
Se requiere entonces de un robusto sistema que permita gestionar las
actividades
necesarias
para
garantizar
entre
otros
aspectos,
disponibilidad, seguridad, estrategias de almacenamiento y trfico en la
red de comunicacin entre otros aspectos.
Se presenta en este material de estudio, las
principales de caractersticas de las Bases de
Datos Distribuidas (BDD), as como los tipos
de
fragmentacin
que
pueden
implementarse
para
generar
el
almacenamiento distribuido y las rplicas
como
estrategia
para
aumentar
la
disponibilidad del servicio y optimizacin del
manejo de concurrencia, asegurando un
manejo eficiente de trfico en la red.

3
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

Bases de Datos Distribuidas

1. Definicin
Un Sistema de Base de Datos Distribuida es una coleccin de sitios,
conectados por medio de una infraestructura de red, en el cual cada sitio
es un sistema de base de datos completo y estos sitios tienen acuerdos
para trabajar juntos, de tal manera que un usuario pueda acceder a los
datos de un sitio como si estuviera accediendo a ellos de forma
local.(Date, 2001)
Las principales razones para utilizar un sistema de bases de datos
distribuidas son:
Compartir Datos: Proporcionar el acceso a los datos sin importar la
ubicacin facilita los medios para optimizar procesos que requieren
de esta informacin.
Autonoma:
distribuidas.

Posibilidad

de

realizar

operaciones

locales

Disponibilidad: Garantizar que los datos se encuentren disponibles


aun cuando exista un fallo en algn nodo o sitio, de manera tal que
se deben asumir estrategias de replicacin sobre los datos.

2. Reglas Caractersticas
Date en 2001, introdujo doce reglas que deben cumplir los Sistemas de
Base de Datos Distribuidas, las cuales se resumen a continuacin.
Autonoma local: Aun cuando debe existir un administrador del
sistema global, cada sitio o nodo debe disponer de administracin
local, lo cual determina un nivel de autonoma sobre la
administracin de los datos.
Independencia de un sitio central: Todos los sitios deben ser
tratados igual y realizar sus propios procesamientos con el fin de
evitar que la cada del nodo central deje por fuera los dems nodos.
Operacin continua: As como en un sistema centralizado, se debe
garantizar que la inclusin de nuevos nodos o mantenimiento del
sistema no impidan la disponibilidad del servicio.

4
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

Bases de Datos Distribuidas

Independencia de Localizacin: La estructura lgica del sistema,


debe garantizar que se accede a los datos sin que sea necesario para
los usuarios conocer su ubicacin.
Independencia de fragmentacin: Algunos sistemas optimizan su
despeo al utilizar la fragmentacin, que implica que algunas de sus
tablas o relaciones se encuentran divididas en diferentes
ubicaciones de disco. El sistema distribuido utiliza principalmente las
bases de datos relacionales por su facilidad para reconstruir
operaciones de fragmentacin, todo esto en forma transparente al
usuario final.
Independencia de rplica: Otra estrategia en los sistemas de Base
de datos es la de generar copias de los datos almacenadas en
sitios diferentes.
Procesamiento Distribuido de Consultas: Se debe prestar
especial atencin a la optimizacin de consultas, teniendo en cuenta
que su procesamiento se hace en diferentes nodos.
Manejo Distribuido de Transacciones: Una transaccin puede
ocasionar el procesamiento en varios nodos y se requiere asegurar la
atomicidad de la transaccin, es decir Todo o Nada, para lo cual los
diferentes agentes que controlan las transacciones locales deben
estar sincronizados para ejecutar o retroceder las operaciones en
forma simultanea en los diferentes nodos donde se requiera. Otro
aspecto tienen que ver con el control de concurrencia, aqu el
bloqueo de transacciones es la accin que principalmente se utiliza.
Independencia respecto al equipo: Se debe validar que desde
diferentes equipos se pueda ejecutar el DBMS.
Independencia respecto al Sistema Operativo: Tambin se debe
garantizar que se pueden utilizar diversos Sistemas Operativos.
Independencia respecto a la red: Debe garantizarse tambin que
se pueden utilizar diferentes redes de comunicaciones.
Independencia respecto al DBMS: Es recomendable que el SMBD
que este en cada sitio manipule la misma interfaz sin que sean copias
del mismo sistema.

5
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

Bases de Datos Distribuidas

3. Diseo de Bases de Datos Distribuidas


Un Sistema de Base de Datos Distribuida es una coleccin de sitios,
conectados por medio de una infraestructura de red, en el cual cada sitio
es un sistema de base de datos completo y estos sitios tienen acuerdos
para trabajar juntos, de tal manera que un usuario pueda acceder a los
datos de un sitio como si estuviera accediendo a ellos de forma
local.(Date, 2001)
3.1. Consideraciones
Para definir la estructura organizacional en una base de datos distribuida
es necesario tener en cuenta los siguientes aspectos:
Necesidades sobre los datos compartidos
Tipo de acceso a los datos
Profundidad en la informacin

Modo de acceso

Dinmico

Informacin parcial
Esttico

Informacin total

Datos
Nivel de conocimiento

Datos y programas

Comparticin

6
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

Bases de Datos Distribuidas

En primer lugar, se debe analizar si se requiere compartir aplicaciones o


slo datos, ya que los recursos requeridos seran diferentes. Si las
aplicaciones y datos son independientes en cada nodo no se requiere de
distribuir datos o programas, se podra pensar en replicacin de datos slo
por aspectos de disponibilidad y seguridad. Para las situaciones en que se
comparten datos nicamente las estrategias de replicacin y
fragmentacin pueden utilizarse y en el caso que se compartan tanto
datos como aplicaciones se debe proveer la comunicacin entre
aplicaciones para la obtencin de datos remotos.
El segundo factor corresponde al acceso de los usuarios, identificndose
dos tipos: acceso esttico y acceso dinmico: El acceso esttico es aquel
donde el usuario siempre solicita datos de la misma manera, controlado la
mayora de veces por las aplicaciones que ejecuta. El acceso dinmico
corresponde a la posibilidad de estar ejecutando diferentes sentencias
determinadas por los requerimientos del momento.
El tercer factor es el nivel de conocimiento al que se tiene acceso, se
requiere acceso parcial a los datos o el acceso es total, esto se consigue
revisando las polticas de servicio y la estructuracin de usuarios y roles
del sistema.
3.2. Procedimiento
Existen dos alternativas a seguir para el diseo de una BDD, la estrategia
ascendente y la descendente. En la primera se parte de un numero de
bases de datos y aplicaciones que requieren ser distribuidas para lo cual
se debe generar un diseo global de administracin y comunicacin. Y la
segunda donde se planifican desde lo global hasta llegar a cada uno de los
nodos o sitios.
Sin importar la estrategia adoptada es necesario realizar los siguientes
procesos:
Se inicia con el anlisis de los requisitos que definirn el entorno del
sistema basados en los procesos y datos requeridos por los usuarios de
la base de datos, y por los parmetros de rendimiento, seguridad,
disponibilidad y flexibilidad definidos para el sistema.
Se procede a continuacin a definir el diseo de las vistas y el diseo
conceptual, que se desarrollan en forma paralela. El diseo de las vistas
define las interfaces para los usuarios y en el diseo conceptual se

7
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

Bases de Datos Distribuidas

especifican las entidades, relaciones y aplicaciones


tener acceso.

a las que se debe

El esquema conceptual global y la informacin respecto al acceso a los


datos proveen la informacin para disear la distribucin, donde se
definirn los esquemas conceptuales locales a cada nodo o sitio. A nivel de
distribucin local es comn utilizar la fragmentacin para dividir las
relaciones en otras menores que pueden ser alojadas en otros sitios. Este
tema se afrontar en el siguiente numeral de este documento.
En el diseo fsico, se especifican los esquemas conceptuales locales sobre
los dispositivos de almacenamiento fsico disponibles para lo cual se
revisan los esquemas conceptuales definidos y la informacin de acceso a
los fragmentos.
Como siempre un ltimo proceso es el de la evaluacin, en el cual se
monitorea y ajusta el diseo con la revisin peridica de los requisitos,
accesos y estadsticas de incidentes y uso.

Anlisis de requisitos

Diseo conceptual

Diseo de vistas

Esquema conceptual
global

Esquemas externos

Objetivos del
sistema

Informacin de
acceso

DISEO DE LA DISTRIBUCIN

Esquemas conceptuales
locales

Diseo fsico

Esquema fsico

Monitorizacin y
ajustes

8
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

Bases de Datos Distribuidas

3.3. Fragmentacin
Una Base de Datos puede ser fragmentada para mejorar el rendimiento y
simplificar su mantenimiento. Las consultas que tienen acceso a tablas
que han sido divididas pueden ejecutarse con mayor rapidez al contar con
menos datos a recorrer o al tener procesamiento simultneo por varios
procesadores; Por otra parte las tareas de copias de seguridad o
reindexacin pueden ejecutarse ms rpido al contar con menos datos.
Otra estrategia es la de particionar sin dividir las tablas, esto se consigue
cuando se almacenan las tablas en unidades de disco independientes, lo
cual hace que si se requiere utilizar estas tablas para una misma consulta,
varias cabezas de lectura de disco accedern a los datos de manera
simultnea, recorriendo ms rpido los datos. Se recomienda retomar los
conceptos de Raid, vistos anteriormente.

Dir. PC1

Dir. PC2

Dir. PC3

Dir. PC4

ID 1

ID 1

ID 1

ID 1

ID 2

ID 2

ID 2

ID 2

...

...

...

...

ID n

ID n

ID n

ID n

Servidor

D2 2

Usuario

PC1

PC2

PC3

PC4

Dir. PC2

ID 1

Dir. PC1

ID 1

Dir. PC1

ID 1

Dir. PC1

ID 1

Dir. PC3

ID 2

Dir. PC3

ID 2

Dir. PC2

ID 2

Dir. PC2

ID 2

Dir. PC4

...

Dir. PC4

...

Dir. PC4

...

Dir. PC3

...

Dir. Server

ID n

Dir. Server

IDn

Dir. Server

ID n

Dir. Server

ID n

9
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

Bases de Datos Distribuidas

La fragmentacin tambin tiene inconvenientes, especialmente cuando


una vista se alimenta de datos que han sido particionados, requiriendo de
tareas de unin y combinacin, as como la verificacin de dependencias,
que debera revisar en ms de una ubicacin.
Existen dos tipos de fragmentacin o divisin: horizontal y vertical, La
divisin o fragmentacin horizontal acta sobre las filas, dividiendo la
tabla en subtablas que contienen un subconjunto de las filas de la tabla
inicial. La fragmentacin vertical, se basa en las columnas de la tabla para
efectuar la divisin.
3.3.1. Fragmentacin Horizontal

Llave

Atributo 1

Atributo 2

Atributo 3

Llave

Atributo 1

Atributo 2

Atributo 3

Atributo 4

Llave

Atributo 1

Atributo 2

Atributo 3

Atributo 4

Llave

Atributo 1

Atributo 2

Atributo 3

Atributo 4

Llave

Atributo 1

Atributo 2

Atributo 3

Atributo 4

Atributo 4

Las particiones horizontales permiten dividir una tabla en varias


tablas con el mismo nmero de columnas, pero con menor nmero de
filas.
El anlisis de los datos ser el que determine la forma en que se han
de dividir los datos, con mucha frecuencia se utiliza el parmetro de
tiempo o en su ausencia columnas de referencia como sucursales,
ciudades, etc. De cualquier forma se requiere el menor nmero de
ellas, ya que una gran cantidad de consultas e UNION para obtener el
conjunto completo, puede afectar el rendimiento.

10
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

Bases de Datos Distribuidas

3.3.2. Fragmentacin Vertical

Llave

Atributo 1 Atributo 2

Llave

Atributo 1

Llave

Atributo 3

Atributo 3

Atributo 2

Dividir una tabla en varias utilizando el particionamiento vertical, hace


que existan varias tablas con la misma cantidad de filas que la
original, pero donde se varia el numero de columnas o atributos de la
tabla.
Este proceso puede ser realizado a partir de la normalizacin de datos
que permitira extraer columnas redundantes en otras tablas,
accediendo a ellas a travs de una llave relacional. Otra alternativa es
la divisin de columnas en nuevas tablas, con la ayuda de una llave
que relacione los registros particionados.
Optimizan las consultas al recorrer menos datos, ya que no se tiene
que recorrer el total de las columnas (especialmente si slo se
consultan algunas con mucha frecuencia), pero si se excede en el
nmero de particiones se puede afectar el rendimiento.

11
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

Bases de Datos Distribuidas

4. Replicacin
4.1 Caractersticas
Otra de las estrategias asociadas a las bases de datos es la de replicacin,
que consiste en copiar y mantener objetos de la base de datos en
mltiples bases de datos. Se debe asegurar que los cambios que se
aplican en un sitio se registran localmente antes de ser aplicados en los
sitios remotos donde se comparten los mismos datos.
Las siguientes son las principales caractersticas:
Los nodos o sitios que conforman el sistema distribuido no
comparten memoria, ni dispositivos de almacenamiento. Lo cual
determina que fsicamente se encuentran en lugares separados.
Existen dos tipos de transacciones, las transacciones locales que son
las que acceden a los datos que se encuentran en el lugar donde se
inicio la transaccin, y las transacciones globales que son las que
acceden a datos que estn ubicados en sitios diferentes al del inicio
de la transaccin.
Se proporciona un acceso rpido y local a los datos y se protege la
disponibilidad de las aplicaciones.
4.2 Objetos de replicacin
Se denomina objeto de replicacin a las bases de datos existentes en
varios servidores de un sistema de base de datos distribuida. La
instalacin de la replicacin le permite duplicar las tablas y los objetos
de apoyo, tales como vistas, disparadores de base de datos, paquetes,
ndices y sinnimos.
Mosc

Bogot

B
Sdney

Lectura y escritura

Datos replicados

12
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

Bases de Datos Distribuidas

4.3. Grupos de replicacin


Para facilitar la adecuada gestin de los objetos de replicacin se requiere
la creacin de Grupos de Replicacin, all se organizan los objetos de
esquemas que sean necesarios para garantizar el correcto funcionamiento
de una aplicacin o servicio.
Sin embargo es necesario aclarar que dentro de un grupo de replicacin
puede existir ms de una base de datos, adicionalmente los objetos de
una base de datos pueden pertenecer a varios grupos de replicacin.
Grupo de replicacin
Conexin

Miembro

Propuestas/Precios.xlm

Proyectos/Espec.doc

Proyectos

Proyectos

Propuestas

Propuestas

Carpetas
replicadas

4.4 Los sitios de replicacin


Existen dos tipos de sitios bsicos donde pueden existir los grupos de
replicacin, dependiendo de la estrategia de copia a utilizar.
4.4.1. Un sitio maestro
En este caso se mantiene una copia completa de todos los objetos de
un grupo de replicacin. Todos los sitios principales en un entorno de
replicacin con mltiples maestros se comunican directamente entre
s para difundir los datos y los cambios de esquema en el grupo de
replicacin.

13
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

Bases de Datos Distribuidas

Se define un sitio maestro para cada grupo de replicacin que se usa


como punto de control y gestiona el grupo y los objetos accesados por
el grupo.
4.4.2 Un sitio de instantneas.
En este caso slo se tienen todos o un subconjunto de instantneas
del objeto del grupo de replicacin. Sin embargo, stos deben ser
simples instantneas con una correspondencia uno a uno a los objetos
en el sitio principal.
4.5 Replicacin de Instantneas.
Contiene una rplica parcial o total de una tabla maestra de destino desde
un nico punto en el tiempo. Una instantnea puede ser de slo lectura o
de escritura.
4.5.1 Copias de slo lectura.
En una configuracin bsica, pueden proporcionar acceso de slo
lectura a la tabla de datos que se origina a partir de un "maestro" o
en el sitio principal. Las aplicaciones pueden consultar los datos de las
rplicas de datos locales para evitar el acceso a la red
independientemente de la disponibilidad.
Sin embargo, las aplicaciones en todo el sistema deben acceder a los
datos en el sitio principal cuando las actualizaciones son necesarias.
Aplicaciones
del cliente
Actualizacin Remota
Consulta Local

Tabla
Replicada

Tabla Maestra
Modificable

Red

Tabla de datos replicada

14
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

Bases de Datos Distribuidas

4.5.2 Instantneas actualizables.


En una configuracin ms avanzada, puede crear una instantnea
actualizable que permite a los usuarios insertar, actualizar y eliminar
filas de la tabla maestra. Una instantnea actualizable tambin puede
contener slo un subconjunto del conjunto de la tabla maestra de
destino.
Las instantneas actualizables se basan en tablas en un sitio principal
que ha sido configurado para permitir la replicacin con mltiples
maestros. De hecho, las instantneas actualizables deben ser parte
de un grupo de instantneas que se basa en un grupo maestro en un
sitio maestro.
4.5.3 Usos de la replicacin de instantneas.
La rplica de instantneas es til para varios tipos de aplicaciones.
Descarga de la informacin: Las instantneas de solo lectura son
tiles como una forma de replicar bases de datos enteras o
informacin de alta carga. Por ejemplo, cuando el rendimiento de
sistemas de alto volumen de procesamiento de transacciones es
crtico, puede ser ventajoso para mantener una base de datos
duplicada y aislar las consultas exigentes de las aplicaciones.
Distribucin de la Informacin: A partir de una tabla maestra se
tienen copias con las que se trabajan y estas rplicas son
actualizadas una vez al da.
Transporte de informacin: se pueden utilizar las rplicas de slo
lectura para mover datos de una base de datos de produccin de
procesamiento de transacciones a un almacn de datos.
Entornos desconectados: Se utilizan las rplicas para facilitar
procesos donde no se cuenta con conexin permanente, como en el
caso de los vendedores puerta a puerta, donde cada vendedor
debe visitar a los clientes regularmente con un ordenador porttil y
pedidos en una base de datos personal mientras estn
desconectados de la red corporativa y del sistema de base de datos
centralizada. A su regreso a la oficina, cada vendedor debe enviar
todos los pedidos a una base de datos centralizada, de la empresa.
15
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

GLOSARIO

Bases de Datos Distribuidas


Base de Datos Distribuida: Es una coleccin de sitios, conectados por
medio de una infraestructura de red.
Disponibilidad: Garantizar que los datos se encuentren disponibles
aun cuando exista un fallo en algn nodo.
Independencia: Todos los sitios deben ser tratados igual y realizar sus
propios procesamientos.
Replicacin: Proceso de copiar y mantener objetos de BD en mltiples
BD que componen un sistema de base de datos distribuida.

16
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

RECURSOS BIBLIOGRFICOS
Bases de Datos Distribuidas

Wales, J.,
Sanger, L. (2001).
Wikipedia La enciclopedia libre.
Recuperado el 20 de julio de 2012 de http://es.wikipedia.org
A. Silberschatz, H. F. Korth. Fundamentos de Bases de Datos, 4ta
EdicinCaptulo 19: Bases de datos distribuidas.
Elmasri, R.,Navathe, S. Fundamentos de sistemas de Bases de Datos
- 5ta Ed. Pearson Addison Wesley.
C.J. Date. Introduccin a los sistemas de bases de datos. 7 Edicin.
Capitulo 20. Bases de datos distribuidas. Ed. Prentice Hall.

17

4
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

Bases de Datos Distribuidas

Control de documento
Construccin Objeto de Aprendizaje

Bases de Datos Distribuidas

Desarrollador
de contenido
-Experto temtico-

Ana Yaqueline Chavarro

Asesor pedaggico

Rafael Neftal Lizcano Reyes

Produccin Multimedia

Eulises Orduz Amzquita


Victor Hugo Tabares Carreo

Programador

Francisco Jos Lizcano Reyes

Lder expertos temticos

Ana Yaqueline Chavarro Parra

Lder lnea de produccin

Santiago Lozada Garcs

Atribucin, no comercial, compartir igual


Este material puede ser distribuido, copiado
y exhibido por terceros si se muestran los
crditos. No se puede obtener ningn
beneficio comercial y las obras derivadas
tienen que estar bajo los mismos tminos
de licencia que el trabajo original.

18
FAVA - Formacin en Ambientes Virtuales de Aprendizaje

SENA - Servicio Nacional de Aprendizaje

Você também pode gostar