Escolar Documentos
Profissional Documentos
Cultura Documentos
Abstraccin de la informacin.
Una base de datos es en esencia una coleccin de archivos relacionados
entre s, de la cual los usuarios pueden extraer informacin sin considerar las
fronteras de los archivos.
Un objetivo importante de un sistema de base de datos es proporcionar a los
usuarios una visin abstracta de los datos, es decir, el sistema esconde ciertos
detalles de cmo se almacenan y mantienen los datos. Sin embargo para que
el sistema sea manejable, los datos se deben extraer eficientemente.
Existen diferentes niveles de abstraccin para simplificar la interaccin de
los usuarios con el sistema; Interno, conceptual y externo, especficamente el
de almacenamiento fsico, el del usuario y el del programador.
Nivel fsico.
Es la representacin del nivel ms bajo de abstraccin, en ste se describe
en detalle la forma en como de almacenan los datos en los dispositivos de
almacenamiento (por ejemplo, mediante sealadores o ndices para el acceso
aleatorio a los datos).
Nivel conceptual.
El siguiente nivel ms alto de abstraccin, describe que datos son
almacenados realmente en la base de datos y las relaciones que existen entre
los mismos, describe la base de datos completa en trminos de su estructura
de diseo. El nivel conceptual de abstraccin lo usan los administradores de
bases de datos, quienes deben decidir qu informacin se va a guardar en la
base de datos.
Consta de las siguientes definiciones:
Definicin de los datos: Se describen el tipo de datos y la longitud de campo
todos los elementos direccionables en la base. Los elementos por definir
incluyen artculos elementales (atributos), totales de datos y registros
conceptuales (entidades).
Relaciones entre datos: Se definen las relaciones entre datos para enlazar
tipos de registros relacionados para el procesamiento de archivos mltiples.
En el nivel conceptual la base de datos aparece como una coleccin de
registros lgicos, sin descriptores de almacenamiento. En realidad los archivos
conceptuales no existen fsicamente. La transformacin de registros
conceptuales a registros fsicos para el almacenamiento se lleva a cabo por el
sistema y es transparente al usuario.
Nivel de visin.
1
Nivel ms alto de abstraccin, es lo que el usuario final puede visualizar del
sistema terminado, describe slo una parte de la base de datos al usuario
acreditado para verla. El sistema puede proporcionar muchas visiones para la
misma base de datos.
Modelos de datos
2
dinmicas de una aplicacin con un uso de datos intensivo. Conceptualmente,
una aplicacin puede ser caracterizada por:
Propiedades estticas: entidades (u objetos), propiedades (o atributos) 12 de
esas entidades, y relaciones entre esas entidades.
Propiedades dinmicas: operaciones sobre entidades, sobre propiedades o
relaciones entre operaciones.
Reglas de integridad sobre las entidades y las operaciones (por ejemplo,
transacciones).
As, un modelo de datos se distingue de otro por el tratamiento que da a estas
tres categoras. El resultado de un modelado de datos es una representacin
que tiene dos componentes: las propiedades estticas se definen en un
esquema y las propiedades dinmicas se definen como especificaciones de
transacciones, consultas e informes. Un esquema consiste en una definicin de
todos los tipos de objetos de la aplicacin, incluyendo sus atributos, relaciones
y restricciones estticas. Correspondientemente, existir un repositorio de
informacin, la base de datos, que es una instancia del esquema. Un
determinado tipo de procesos slo necesita acceder a un subconjunto
predeterminado de entidades definidas en un esquema, por lo que este tipo de
procesos puede requerir slo un subconjunto de las propiedades estticas del
esquema general. A este subconjunto de propiedades estticas se le denomina
subesquema. Una transaccin consiste en diversas operaciones o acciones
sobre las entidades de esquema o subesquema. Una consulta se puede
expresar como una expresin lgica sobre los objetos y relaciones definidos en
el esquema; una consulta identifica un subconjunto de la base de datos. Las
herramientas que se usan para realizar las operaciones de definicin de las
propiedades estticas y dinmicas de la base de datos son los lenguajes de
definicin y manipulacin de datos (DDL, DML), junto con los lenguajes de
consulta (QL) que ya hemos mencionado.
3
Los modelos de datos primitivos estaban absolutamente orientados al fichero:
las entidades se representan en registros (divididos en campos, que
representan sus propiedades), que se agrupan en ficheros. Las relaciones entre
entidades son nicamente aquellas que pueden ser representadas usando
directorios, por ejemplo ndices y listas invertidas. Un ejemplo de DBMS
comercial de fichero, concretamente del tipo "lista invertida", es el CA-
DATACOMB de Computer Associates International.
Los modelos de datos clsicos son tres: el jerrquico, el de red y el relacional.
Modelo Entidad-Relacin
2.2.1 Definicin
Entidades
Atributos
Relaciones
Cardinalidad
Llaves
4
Atributos: es una caracterstica (adjetivo) de una entidad que
puede hacer 1 de tres cosas:
o Identificar
o Relacionar
o Describir
o Telefono o Telfonos
5
NOTA: en la prctica es mejor considerar "siempre" a todos los
atributos como simples y con valores simples
2.2.3 Llaves
Ejemplo:
Nombre y Direccin
Nombre y CURP
CURP
Nombre y Direccin
CURP
CURP
6
Relaciones: la conexin que existe entre 2 entidades (verbo).
7
Notacin empleada para elaborar modelos E-R
8
Diagrama E-R mostrando una relacin entre 2 entidades, con atributo en
la relacin
Diagrama E-R mostrando una relacin entre una misma entidad (tiles
para elaborar jerarquas)
9
2.2.5.3 Entidades dbiles
Atributos:
o FirstName
o first_name
2.2.5.5 Cardinalidades
10
(Muchos a
Muchos)
(Uno a
Muchos)
(Uno a Uno)
11
2.2.5.6 Mltiples relaciones entre 2 entidades
Es el principio de "herencia"
Las entidades de bajo nivel heredan todos los atributos de las entidades
de mayor nivel
12
Especializacin y generalizacin
13
2.2.5.8 Principios de diseo
Evitar redundancia: una de las ventajas del diagrama e-r es que nos
permite distinguir de una manera fcil y visual todos los entes y sus
relaciones, de manera que es muy fcil identificar si un atributo se esta
repitiendo en varias entidades o si una relacin es innecesaria.
Relacin Ternaria
14
Resultado de la conversin de relacin de relacin 3-aria a combinacin
de 2-arias
Notacin E/R (1) Ross, (2) Bachmann, (3) Martin, (4) Chen, (5) Rumbaugh
15
Notacin UML para modelos E-R
NORMALIZACION
Existen 3 niveles de Normalizacin que deben respetarse para poder decir que nuestra
Base de Datos, se encuentra NORMALIZADA, es decir, que cumple con los requisitos
naturales para funcionar optimamente y no perjudicar las Performance por mala
arquitectura.Estas 3 reglas de Normalizacin se las conoce como las 3
FORMAS NORMALES.
La Primera Forma Normal Esta primera Forma Normal, nos lleva a no repetir datos
en nuestras tablas. Los famosos maestro detalle, deben aplicarse a la estructura de la
tabla.Si nuestra tabla de ventas repite una y otra vez (por cada venta) , el nombre, el
domicilio y otros datos del Cliente, es que no hemos aplicado esta Normalizacin.Si
tenemos una tabla clientes, en la tabla ventas, solo deberia figurar el codigo del
16
cliente, para que el resto de los datos se puedan referenciar automaticamente sin
problemas y sin duplicar informacin.Lo mismo ocurriria en una tabla de detalle de
ventas, si por cada item vendido colocamos el detalle del producto, con su descripcin ,
medidas, etcTendriamos un desaprovechamiento de espacio y recursos muy
grande. Para ello, tendremos nuestra tabla maestra de Productos y con solo grabar el
cdigo de dicho producto en nuestra tabla de ventas, ser suficiente.
Ahi tenemos un claro problema !!!Acaso no se busca NO REPETIR DATOS ?Si toda una
venta tendr el mismo numero de Cliente y la misma FechaPor que no crear una
Tabla de MAESTRO DE VENTAS y que contenga esos 2 datos ?Es evidente que la
columnaClienteVenta y FechaVenta se repetirn por cada venta realizada.Es por ello
que proponemos el siguiente esquema
17
1 3 66643 34
1 4 21 3
2 1 3566 6
Y ahora nuestra nueva tabla maestra
Entonces, nuestra 2da Forma Normal nos habla de que cada columna de una tabla
debe depender de toda la clave y no constituir un dato unico para cada grupo de
registros.
Esto es muy normal encontrar en bases mal normalizadas.Vemos que los campos
DESCRIPCION , MEDIDA y PROVEEDOR no dependen de VENTAID y es por ello que no
deberian estar dentro de la tabla de detalle de ventas, ya que dependen de
PRODUCTOID.Aqui no se trata ya de eliminar grupos repedidos de datos (1ra Forma
18
Normal) sino que ante la inclusion de una clave perteneciente a otra tabla, cualquier
campo que sea subordinado de dicha clave debe estar en otra tabla y no en nuestra
tabla detalle.
ConclusinFinalmente si tomamos en cuenta que una tabla de detalle de venta (item
x item) puede contener un volumen de millones de registros, al haberle aplicado las 3
formas normales nos estaremos ahorrando varios Gigabytes de tamao en dicha tabla
y por supuesto mejorado notablemente la performance.
19