Você está na página 1de 15

ANALISIS Y DISEÑO DE SISTEMAS

Kendall & Kendall – Sexta Edición

CAPITULO 13 - DISEÑO DE BSES DE DATOS

OBJETIVOS DE DISEÑO DE SALIDA:

1. Entender los conceptos de las Bases de Datos.

2. Usar la normalización para almacenar eficazmente los datos en una base de datos.

3. Usar bases de datos para presentar datos.

4. Entender el concepto de almacenar datos.

5. Comprender las utilidades de publicar base de datos en la web.

BASES DE DATOS.

Es una fuente central de datos destinados a compartirse entre muchos usuarios para una diversidad de
aplicaciones. El corazón de una base de datos lo constituye el Sistema de Administración de la Base de
Datos (DBMS, database management system), el cual permite la creación, modificación y actualización de la
base de datos, la recuperación de datos y la generación de informes y pantallas.. La persona encargada de
garantizar que la base de datos cumpla sus objetivos se conoce como administrador de base de datos.

Entre los objetivos de efectividad de la base de datos están los siguientes:

 Asegurar que los datos se puedan compartir entre los usuarios para una diversidad de aplicaciones.

 Mantener datos que sean exactos y consistentes.

 Asegurar que todos los datos requeridos por las aplicaciones actuales y futuras se podrán acceder con
facilidad.

 Permitir a la base de datos evolucionar conforme se aumenten las necesidades de los usuarios.

 Permitir a los usuarios construir su vista personal de los datos sin preocuparse por la forma en que los
datos se encuentren almacenados físicamente.

La compartición de los datos significa que estos deben almacenarse una sola vez, esto ayuda a lograr la
integridad de los datos, debida a que los cambios se realizan con mayor facilidad y confiabilidad si estos
aparecen solo una vez en lugar de en muchos archivos diferentes. La salida de una etapa del proceso se
convierte en entrada para la siguiente etapa.

Cuando un usuario necesita datos específicos, una base de datos bien diseñada anticiparía dicha necesidad.
Por lo tanto, es más probable que los datos estén disponibles en una base de datos que en un sistema de
archivos convencional. Una base de datos bien diseñada también puede ser más flexible que los archivos
separados; es decir, una base de datos puede evolucionar conforme cambien las necesidades de los usuarios
y las aplicaciones.
El enfoque de una base de datos tiene la ventaja de permitir a los usuarios obtener su propia vista de los
datos.. Los usuarios no tienen que preocuparse por la estructura real de la base de datos o su
almacenamiento físico.

Un cambio tecnológico importante ha sido el diseño de software de base de datos que toma ventaja de la
GUI.

CONCEPTOS DE DATOS.

REALIDAD, DATOS Y METADATOS.

Al mundo real se le llama realidad. En la realidad, los datos recopilados de personas, lugares o eventos se
almacenaran en un archivo o una base de datos.

Para entender la forma y estructura de los datos, se necesita información sobre los datos mismos. A la
información que describe los datos se le llama metadatos.

Dentro del reino de la realidad hay entidades y atributos;

Dentro del reino de los metadatos hay definiciones de registros y definiciones de datos

Entidad. Es cualquier evento u objeto sobre el cual alguien escoge recopilara datos. Ejemplo: una persona,
lugar o cosa. (Un vendedor, una ciudad, un producto, una venta o un mes de año). Un evento también
puede ser una unidad de tiempo: la averiad de una maquina.

Entidades Atributos
Entidades

Datos Ocurrencias Ocurrencias


de registros de datos

Definiciones Definiciones
Metadatos
de registros de datos

Hay una unidad menor llamada Subtipo de entidad, su símbolo es un rectángulo más pequeño dentro del
rectángulo de la entidad.

Un subtipo de entidad es una relación especial uno a uno que representa los atributos adicionales (campos)
de otra entidad que podría no estar presente en cada registro de la primera entidad. Los subtipos de entidad
eliminan la posibilidad de que una entidad pueda tener campos nulos almacenados en las tablas de la base
de datos.

Un ejemplo es la entidad principal de un cliente. Los clientes preferidos podrían tener campos especiales
que contengan información de descuentos especiales, y esta información estaría en un subtipo de entidad.

Otro ejemplo son los estudiantes que tienen periodos de prácticas profesionales. EL ARCHIVO MAESTRO DE
ESTUDIANTES no debe contener información sobre los periodos de prácticas profesionales para cada
estudiante, debido a que quizá solo un número pequeño de estudiantes tiene dichos periodos.
Ejemplos de diagramas E-R Relaciones

Producto Empleado

Se asigna Uno a uno 1:1


tiene a

Paquete de oficina
productos

Medico Empleado
Uno a muchos (1:M)

Pertenece a O
trata
Muchos a uno (M:1)

Paciente Departamento

Estudiante Vendedor

toma atiende Muchos a Muchos (M:N)

Cursos Ciudad
Relaciones. Son asociaciones entre las entidades.

Uno a uno. (1:1). El diagrama anterior muestra que solo hay un paquete de productos para cada producto.
Cada empleado tiene una sola oficina. Cada EMPLEADO es miembro de un solo DEPARTAMENTO.

Uno a muchos. (1:M). Muchos a uno (M:1). A un MEDICO en un centro de salud, se le asignan muchos
PACIENTES. Cada DEPARTAMENTO tiene muchos EMPLEADOS.

Muchos a muchos. (M: N). Un ESTUDIANTE podría tener muchos CURSOS pero al mismo tiempo un CURSO
podría tener muchos ESTUDIANTES. Un VENDEDOR puede visitar muchas CIUDADES y una CIUDAD puede
ser el área de venta para muchos VENDEDORES.

Símbolo Explicación oficial Significado real

Una clase de personas,


Entidad
lugares o cosas

Entidad asociativa
Se usa para unir dos entidades

Entidad atributiva
Se para grupos repetitivos

Relación a 1 Exactamente uno

Relación a muchos
Uno o mas

Relación a 0 o 1
Solo cero o uno

Relación a 0 o mas
Puede ser cero, uno o mas

Relación a 0mas
o mas
de 1
Mayor que uno
En la figura anterior se dan los símbolos estándar para la notación tipo pata de cuervo, la explicación oficial
de los símbolos y su significado real.

Ejemplo de entidad-relación. Se presenta un diagrama entidad-relación que contiene muchas entidades,


muchos tipos diferentes de relaciones y varios atributos. En este diagrama E-R nos enfocamos en un sistema
de facturación, y en particular con la parte de la prescripción del sistema. (Por simplicidad, asumimos que las
visitas al consultorio se manejan de forma diferente y están fuera del alcance de este sistema)

Las entidades son: PRESCRIPCION, MEDIO, PACIENTE y COMPAÑÍA DE SEGUROS. La entidad de


TRATAMIENTO no es importante para el sistema de facturación, pero es parte del diagrama E-R porque se
usa para establecer una conexión entre la PRESCRIPCION y el PACIENTE. Por lo tanto lo dibujamos como una
entidad asociativa.

Aquí, un MEDICO trata muchos PACIENTES (1:M), quienes se suscriben por separado a una COMPAÑÍA DE
SEGUROS individual. El PACIENTE es solo uno de los muchos pacientes que se suscriben a dicha COMPAÑÍA
DE SEGUROS particular (M:1).

Para completar los requisitos del MEDICO, el medico necesita guardar la información acerca de los
tratamientos que tiene un PACIENTE. Muchos PACIENTES experimentan muchos TRATAMIENTOS, lo que se
convierte en una relación muchos a muchos (M:N). EL TRATAMIENTO se representa como una entidad
asociativa porque no es importante en nuestro sistema de facturación por si mismo. Los TRATAMIENTOS
pueden incluir la toma de PRESCRIPCIONES, y por ellos también es una relación M:N, debido a que muchos
tratamientos podrían requerir combinaciones de fármacos y muchos medicamentos podrían funcionar para
muchos tratamientos.

Los atributos se listan al lado de cada una de las entidades, y la clave se subraya. Por ejemplo, la entidad
PRESCRIPCION tiene un NOMBRE-PRODUCTO, DOSIFICACION, FABRICANTE y CANTIDAD.

Atributos. Es una característica de una entidad. Puede haber muchos atributos para cada entidad. Por
ejemplo, un paciente (entidad) puede tener muchos atributos como (apellido, nombre, calle, ciudad, estado,
etc.). La fecha de la última visita del paciente así como los detalles de la prescripción también son atributos.

Registros. Es una colección de datos que tiene algo en común con la entidad descrita.

Clases. Es uno de los datos en un registro que se usa para identificar al registro. Cuando una clave identifica
de manera única un registro, se llama clave primaria.

ORGANIZACIÓN DE ARCHIVOS.

Un archivo contiene un grupo de registros que proporcionan información para la operación, diseño,
administración y toma de decisiones en una organización.

Tipos de archivo.

 Los que se usan para almacenar datos por un periodo indefinido. Ejemplo: Archivos maestros y de tabla

 Los que se usan para almacenar datos temporalmente, para un propósito especifico. Pueden ser
archivos de transacción, archivos de trabajo o archivos de reporte.
Archivos maestros. Contienen registros para un grupo de entidades. Estos archivos son propensos a tener
registros grandes que contienen toda la información sobre una entidad de datos. Cada registro
normalmente contiene una clave primaria y varias claves secundarias. Los archivos maestros se encuentran
como tablas en una base de datos o como archivos indexados o del tipo indexado-secuencial.

Archivos de tabla. Contiene datos usados para calcular más datos o medidas de desempeño. Ejemplo: Una
tabla de tasas de correo usadas para determinar los gastos de envío de un paquete.

Archivos de transacción. Se usan para hacer cambios que actualizan el archivo maestro y producen
informes. Ejemplo: El archivo maestro de un suscriptor de periódico necesita ser actualizado; el archivo de
transacción contendría el numero del suscriptor y un código de transacción tal como E (para extender la
suscripción), C para cancelar la suscripción o A para cambiar la dirección.

Archivos de trabajo. Algunas veces un programa se puede ejecutar con mayor eficacia si se usa un archivo
de trabajo. Ejemplo: Cuando se reorganiza un archivo para acceder a los registros con mayor rapidez para
cierto tipo de procesos.

Archivos de reporte. Cuando se necesita imprimir un informe y no hay ninguna impresora disponible, se usa
un archivo de reporte. Enviar la salida a un archivo en lugar de a una impresora se denomina apooling.
Después cuando el dispositivo esta listo, el documento se puede imprimir.

Organización secuencial. Cuando los registros están físicamente en orden en un archivo, se dice que este
archivo es secuencial.

Listas enlazadas. Cuando los archivos se almacenan en dispositivos de accedo directo tal como un disco, las
opciones se extienden. Los registros se puede3n ordenar lógicamente, en lugar de físicamente, usando listas
enlazadas.

Organización de un archvio hash. Es el proceso de calcular una dirección a partir de la clave del registro. Los
dispositivos de acceso directo también permiten acceso a un registro dado yendo directamente a su
dirección. Debido a que no es factible reservar una dirección física para cada registro posible, se usa un
método llamado hashing (reordenamiento).

BASES DE DATOS RELACIONALES. Se pueden organizar de varias formas.

Vistas lógicas y físicas de datos. Una base de datos a diferencia de un archivo, esta diseñada para ser
compartida por muchos usuarios. Todos los usuarios ven los datos de formas diferentes. El problema es que
diferentes usuarios tienen vistas de usuarios distintas.

El analista de sistemas debe examinar estas vistas y debe desarrollar un modelo lógico global de la base de
datos. Dicho modelo lógico se debe transformar en el diseño físico correspondiente de la base de datos. El
diseño físico describe la forma como se almacenan y relacionan los datos, así como también la forma en que
se acceden.

Estructuras relacionales de datos. Consiste en una o más tablas bidimensionales, las cuales se denominan
relaciones. Las filas representan registros y las columnas contienen atributos.
NORMALIZACION. Es la transformación de las vistas de usuario complejas y del almacén de datos a un juego
de estructuras de datos más pequeñas y estables. Son mas fáciles de mantener que otras estructuras de
datos.

Los tres pasos de la normalización.

 Quitar todos los grupos repetitivos e identificar la clave primaria. Para ellos la relación se debe dividir en
dos o más relaciones.

 asegura que todos los atributos sin clave son totalmente dependientes de la clave primaria.

 Quita cualquier dependencia transitiva (los atributos sin clave son dependientes de otros atributos sin
clave).

LINEAMIENTOS PARA EL DISEÑO DE RELACION ARCHIVO MAESTRO/BASE DE DATOS.

Se deben tomar en cuenta las siguientes lineamientos:

 Cada entidad de datos separada debe crear una tabla maestra de base de datos. No combine dos
entidades distintas en un solo archivo.

 Un campo de datos específicos solo debe existir en una tabla maestra. Si un informe o pantalla necesita
información de muchas tablas, los índices deben proporcionar la vinculación para obtener los registros
necesarios.

 Cada tabla maestra o relación de la base de datos debe tener programas para Crear, Leer, Actualizar y
Eliminar (abreviado CLAE) los registros.

RESTRICCIONES DE INTEGRIDAD.

Son reglas que controlan el cambio y eliminación de registros, y ayuda a mantener los datos en la base de
datos exacta. En una base de datos se aplican tres tipos de restricciones de integridad.

 Integridad de identidad. Son reglas que controlan la composición de reglas principales. La clave
primaria no puede tener un valor nulo y si la clave primaria es una clave compuesta, ninguno de los
campos de componente en la clave puede tener un valor nulo.

 Integridad referencial. Controla la naturaleza de los registros en una relación de uno a muchos. Significa
que todas la claves externas de la tabla muchos ( la tabla hija) debe tener un registro de coincidencia en
la tabla padre. Por lo tanto no puede agregar un registro en la tabla muchos Hija) sin un registro de
coincidencia en la tabla padre.

 Integridad de dominio. Se usan para validar los datos, tales como la tabla, limite, rango y otras marcas
de validación. Las reglas de integridad de dominio se almacenan en la estructura de base de datos de
una o dos formas.
USO DE BASE DE DATOS.

PASOS EN LA RECUPERACION Y PRESENTACION DE DATOS.

a) Escoja una relación de la base de datos.

b) Una dos relaciones.

c) Proyecte las columnas de la relación.

d) Seleccione filas de la relación.

e) Derive nuevos atributos.

f) Indexe o clasifique las filas

g) Calcule los totales y medidas de desempeño.

h) Presente los datos.

El primer y ultimo paso son obligatorios, pero los seis pasos intermedios son opcionales, dependiendo
de cómo se usen los datos.

DESNORMALIZACION.

Es el proceso de tomar el modelo de datos lógicos y transformarlo en un modelo físico que es eficaz
para las tareas mas comunes. Estas tareas pueden incluir generación de informes, pero también pueden
significar consultas mas eficaces. Una de las razones de la normalización es organizar los datos para
reducir los datos redundantes. Si no se le pide almacenar los datos una y otras vez, puede ahorrar
mucho espacio. Dicha organización permite al analista reducir la cantidad necesaria de
almacenamiento, algo muy importante cuando el almacenamiento era caro.

La desnormalizacion se puede lograr de varias formas diferentes:

 Podemos tomar una relación de muchos a muchos, tal como el de VENDEDOR Y cliente, la cual
comparte las entidades asociativas de VENTAS. Al combinar los atributos de VENDEDOR y VENTAS
podemos evitar uno de los procesos de la unión. Esto podría producir una cantidad considerable de
duplicidad de datos, pero hace las consultas sobre los modelos de las ventas más eficaces.

 Evitar la referencia repetida para una tabla de búsqueda. Podría ser más eficaz repetir la misma
información, por ejemplo, la ciudad, el estado y el código postal, aun cuando esta información
normalmente se puede almacenar solo como un código postal.

ALMACENES DE DATOS.

Se diferencian de las bases de datos tradicionales. El propósito de un almacén de datos es


organizar la información para consultas rápidas y eficaces. Almacenan datos desnormalizados, pero
van un paso más hacia adelante. Dichos almacenes organizan los datos en torno a los temas. En la
mayoría de los casos, un almacén de datos es más que una base de datos procesada de manera que
los datos se presenten de manera uniformes. Por lo tanto, los datos almacenados en almacenes de
datos provienen de diferentes fuentes, normalmente de bases de datos que se establecen para
diferentes propósitos.

Diferencias entre almacén de datos y bases de datos:

1. En un almacén de datos los datos se organizan en torno a los temas principales en ligar de transacciones
individuales.

2. En un almacén de datos los datos normalmente se almacenan como datos resumido en lugar de
detallados, Los datos básicos se encuentran en una base de datos de transacciones.

3. En un almacén de datos los datos cubren un periodo mas largo que los datos en una base de datos
tradicional orientadas a transacciones porque las consultas normalmente involucran toma de decisiones
a largo plazo en lugar de los detalles en transacciones diarios.

4. La mayoría de los almacenes de datos se organizan para consultas mas rápidas, mientras que las base
de datos mas tradicionales se normalizan y estructuran de tal manera que proporcionen
almacenamiento eficaz de información.

5. Los almacenes de datos se optimizan por responder consultas complejas, conocidas como OLAP
(proceso analítico en línea), de gerentes y analistas, en lugar de consultas hechas de forma simple y
repetida.

6. Los almacenes de datos permiten acceso fácil mediante software de minería de datos (denominado
siftware) que busca modelos y puede identificar relaciones no imaginadas por los tomadores de
decisiones humanos.

7. Los almacenes de datos no incluyen una sola sino muchas bases de datos que se han procesado para
que los datos del almacén se definan uniformemente. Estas bases de datos se denominan datos limpios.

8. Los almacenes de datos normalmente incluyen datos de fuentes externas (tales como un informe de
industria, los reportes de la empresa para el Gobierno incluida la información acerca de los productos
de competidores), así como también generaron datos para uso interno.

Construir un almacén de datos es una gran tarea. El analista necesita recopilar los datos de una variedad
de fuentes y convertirlos en una forma común. Por ejemplo una base de datos podría almacenar
información acerca del genero como “Masculino”, y “Femenino”, otra la podría almacenar cono “M” y
“F” y una tercera la podría almacenar como “1” Y “0”. El analista necesita establecer un estándar y
convertir todos los datos al mismo formato.

Una vez que los datos estén limpios, el analista debe decidir como resumirlos. Una vez resumidos, se
pierden los detalles, de manera que un analista tiene que predecir el tipo de consultas que se podrían
hacer.

Después, el analista necesita diseñar el almacén de datos con una organización lógica y quizá incluso
una agrupación física, de los datos por tema. Esto requiere mucho análisis y diseño. El analista necesita
conocer bastante sobre el negocio.
PROCEDIMIENTO ANALISTICO EN LINEA (OLAP).

Se diseño para responder a las consultas complejas de los tomadores de decisiones. El tomador de
decisiones debe ver los datos de diferentes formas. Por lo tanto la base de datos en si tiene que ser
multidimensional. Muchas personas describen a OLAP como el cubo de Rubik de datos. Puede ver los
datos desde todos los diferentes lados y también los puede manipular torciéndolos o rotándolos para
que tengan sentido.

Este enfoque de OLAP valido el concepto de almacenes de datos. Ahora tenia sentido que los datos se
organizaran de formas que permitieran consultas eficaces. Por supuesto, OLAP abarca el procesamiento
de datos mediante la manipulación, resumen y cálculo, para que se abarque mas de un almacén de
datos.

MINERIA DE DATOS.

La minería de datos puede identificar modelos que un humano no puede. Ya sea que el tomador de
decisiones no pueda visualizar un patrón, o quizá no se le ocurra preguntar si ese patrón existe. Los
algoritmos de minería de datos buscan patrones en almacenes de datos siguiendo ciertos algoritmos.

La minería de datos se conoce con otro nombre, descubrimiento de datos del conocimiento (KDD o
Knowledge Data Discovery). Las herramientas disponibles para ayudar en la toma de decisiones se
denominan software; incluyen análisis estadístico, árboles de decisión, redes neurales, agentes
inteligentes, lógica difusa y visualización de datos.

PUBLICACION DE BASES DE DATOS PARA WEB.

Todas las bases de datos que se basan en la Web son para compartir información. Ejemplos:

 Puede establecer un sistema de administración de ventas y de inventario que permita a los


empleados remotamente vista, edición y actualización de pedidos.

 Puede desarrollar las aplicaciones de administración de tarea para la Web que permita a los
empleados asignar tareas o proyectos de búsqueda.

 Establecer una tienda en línea que permita a clientes navegar en una base de datos de productos y
hacer compras. Personalizar Aplicaciones Web que usen páginas dinámicas con el contenido
personalizado basado en intereses que el cliente introduce.

Muchos paquetes de software están disponibles para permitir la publicación de bases de datos
mediante el uso de XML. Ejemplo: FileMaker Pro, que recibe datos de una persona que usa un
formulario HTML estándar y envía una respuesta en XML que incluye los datos y detalles acerca de
donde se puede encontrar una hoja de estilo para los datos.

PREGUNTAS DE REPASO.

1. ¿Cuáles son las ventajas de organizar el almacenamiento de datos como archivos separados?

Un archivo se puede diseñar y construir con bastante rapidez, y cualquier asunto acerca de la
disponibilidad y seguridad de los datos se minimiza. Cuando los diseños de archivos se planean con
cuidado, se puede incluir toda la información necesaria y se reducirá el riesgo de omitir
involuntariamente datos.

2. ¿Cuáles son las ventajas de organizar el almacenamiento de datos usando un enfoque de base de
datos?

 La comparticion de datos significa que estos deben almacenarse una sola vez. Esto ayuda a
lograr la integridad de los datos, debido a que los cambios en los datos se realizan con mayor
facilidad y confiabilidad si aparecen solo una vez en lugar de en muchos archivos direferentes.

 Cuando un usuario necesita datos específicos, una base de datos bien diseñada anticiparía
dicha necesidad.

 Es más probable que los datos estén disponibles en una base de datos que en un sistema de
archivos convencional.

 Una base de datos bien diseñada puede ser más flexible que los archivos separados.

3. ¿Cuáles son las medidas de efectividad del diseño de la base de datos?

 Asegurar que los datos se puedan compartir entre los usuarios para una diversidad de
aplicaciones.

 Mantener datos que sean exactos y consistentes.

 Asegurar que todos los datos requeridos por las aplicaciones actuales y futuras se podrán
acceder con facilidad.

 Permitir a la base de datos evolucionar conforme aumenten las necesidades de los usuarios.

 Permitir a los usuarios construir su vista personal de los datos sin preocuparse por la forma en
que los datos se encuentren almacenados físicamente.

4. Mencione algunos ejemplos de entidades y sus atributos.

Ejemplo de entidad: Persona, lugar o cosa (un vendedor, una ciudad o un producto).

Ejemplos de Atributos: Es una característica de una entidad: La entidad PACIENTE tiene los
siguientes atributos: Nombre, apellidos, dirección, teléfono, sexo, correo electrónico, etc.

5. Defina el termino metadatos. ¿Cuál es el propósito de los metadatos?

Es la información que describe los datos. Son datos que definen a los datos en el archivo o base de
datos. Describen el nombre dado, la longitud y composición asignada a cada dato y/o registros.
Ejemplos: Espacios para el numero y numero de dígitos que deben ir a la derecha del punto
decimal. La letra N significa “numérico” y la letra A significa “alfanumérico”.
6. Mencione los tipos de archivos convencionales comúnmente usados. ¿De estos cuales son
archivos temporales?

 Los archivos convencionales se pueden usar para almacenar datos por un periodo indefinido.

 Los archivos temporales se usan almacena datos con un propósito específico. Estos pueden
ser:

 Archivos de transacción. Se usa para hacer cambios que actualiza el archivo maestro y
producen informes. Ejemplo: El archivo maestro de un suscriptor de periódico necesita
ser actualizado.

 Archivos de trabajo. Algunas veces un programa se puede ejecutar con mayor eficacia
si se usa un archivo de trabajo. Ejemplo: cuando se reordena un archivo para acceder a
los registros con mayor rapidez y para cierto tipo de procesos.

 Archivos de reporte. Cuando se necesita imprimir un informe y no hay ninguna


impresora disponible.

7. ¿Qué es una lista enlazada? Cuando los archivos se almacenan en dispositivos de acceso directo,
tal como un disco, las opciones se extienden. Los registros se pueden ordenar lógicamente, en lugar
de físicamente, usando listas enlazadas. Estas se logran usando un conjunto de indicadores para
dirigirlo al próximo registro lógico ubicado en cualquier parte del archivo.

8. ¿Qué sucede con frecuencia cuando se usa la organización de un archivo hash?

Los dispositivos de acceso directo también permiten acceso a un registro dado yendo directamente
a su dirección. Debido a que no es factible reservar una dirección física para cada registro posible,
se usa un método llamado hashing (reordenamiento). Hashing es el proceso de calcular una
dirección a partir de la clave del registro.

9. Mencione los tres tipos principales de organización de base de datos.

 Jerárquica

 Red

 Relacional.

10. Defina el término normalización.

Es el proceso de tomar el modelo de datos lógicos y transformarlo en un modelo físico que es eficaz
para las tareas más comunes. Estas tareas pueden incluir generación de informes, pero también pueden
significar consultas más eficaces. Una de las razones de la normalización es organizar los datos para
reducir los datos redundantes. Si no se le pide almacenar los datos una y otras vez, puede ahorrar
mucho espacio. Dicha organización permite al analista reducir la cantidad necesaria de
almacenamiento, algo muy importante cuando el almacenamiento era caro.
11. ¿Qué se remueve cuando una relación se convierte a la primera forma normal?

Se remueven los grupos repetitivos. Ejemplo: En una relación sin normalizar INFORME-VENTAS se
separar en dos relaciones separadas. Estas nuevas relaciones se nombrarán VENDEDOR y
VENDEDOR-CLIENTE.

12. ¿Qué se remueve cuando una relación se convierte de 1NF a 2NF?

Se quitan todos los atributos parcialmente dependientes y se ponen en la otra relación

13. ¿Qué se remueve cuando una relación se convierte de 2NF a 3NF?

Todos los atributos sin clave son dependientes de la clave primaria, si no hay dependencias
transitivas (sin claves).

14. Mencione las tres restricciones de una entidad. En una base de datos, describa el significado de
cada restricción.

 Integridad de identidad. La clave primaria no puede tener un valor nulo.

 Integridad referencial. Controla la naturaleza de los registros en una relación de uno a muchos.
La tabla que se conecta en el extremo uno de la relación se llama padre. La tabla que se
conecta en el extremo muchos de la relación se llama tabla hija.

15. Menciones los ochos pasos para recuperar, preclasificar y presentar los datos.

a) Escoja una relación de la base de datos.

b) Una dos relaciones.

c) Proyecte las columnas de la relación.

d) Seleccione filas de la relación.

e) Derive nuevos atributos.

f) Indexe o clasifique las filas.

g) Calcules los totales y medidas de desempeño.

h) Presente los datos.

16. ¿Qué hace una función de unión? Que es la proyección? ¿Qué es la selección?

Función de union: Tomar dos relaciones y agruparlas para hacer una relación más grande.

Proyección: Es el proceso de construir una relación mas pequeña escogiendo únicamente atributos
relevantes de una relación existente.

Selección: Es parecida a la proyección, pero en lugar de extraer las columnas, extrae las filas. La
selección crea una relación (más pequeña) nueva mediante la extracción de registros que contiene
un atributo que coincide con una cierta condición.
17. Establezca las diferencias entre clasificar e indexar.

Clasificar: Es el orden lógico de una relación. El resultado es un archivo secuencial.

Indexar: Es el orden lógico de las filas en una relación de acuerdo con alguna clave.

18. Menciones dos formas de almacenar una relación muchos a muchos y las diferencias entre los
dos métodos.

Cuando la relación es de muchos a muchos se necesitan tres tablas: Una para cada entidad de datos
y otra para la relación.

 La clave primaria de cada entidad de datos se almacena como una clave externa de la tabla
relacional. esta última podría contener simplemente las claves primarias para cada entidad de
datos o podría contener datos adicionales, tales como la calificación recibida de un curso o la
cantidad de un artículo pedido.

 Una situación inversa seria como ejemplo encontrar todos los pedidos para un artículo de una
nueva orden de pedido que se ha recibido.

19. Defina la desnormalizacion.

Es el proceso de tomar el modelo de datos lógicos y transformarlo en un modelo físico que es eficaz
para las tareas más comunes. Estas tareas pueden incluir generación de informes, pero también pueden
significar consultas más eficaces. Una de las razones de la normalización es organizar los datos para
reducir los datos redundantes. Si no se le pide almacenar los datos una y otras vez, puede ahorrar
mucho espacio. Dicha organización permite al analista reducir la cantidad necesaria de
almacenamiento, algo muy importante cuando el almacenamiento era caro.

La desnormalizacion se puede lograr de varias formas diferentes:

 Podemos tomar una relación de muchos a muchos, tal como el de VENDEDOR Y cliente, la cual
comparte las entidades asociativas de VENTAS. Al combinar los atributos de VENDEDOR y VENTAS
podemos evitar uno de los procesos de la unión. Esto podría producir una cantidad considerable de
duplicidad de datos, pero hace las consultas sobre los modelos de las ventas más eficaces.

 Evitar la referencia repetida para una tabla de búsqueda. Podría ser más eficaz repetir la misma
información, por ejemplo, la ciudad, el estado y el código postal, aun cuando esta información
normalmente se puede almacenar solo como un código postal.

20. Explique las diferencias entre las bases de datos tradicionales y los almacenes de datos.

a) En un almacén de datos, los datos se organizan en torno a los temas principales en lugar de
transacciones individuales.

b) En un almacén de datos los datos normalmente se almacenan como datos resumidos en lugar
de destallados, los datos básicos se encuentran en una base de datos de transacciones.
c) En un almacén de datos los datos cubren un periodo mas largo que los datos en una base de
datos tradicional orientada a transacciones porque las consultas normalmente involucran toma
de decisiones a largo plazo en lugar de los detalles de transacción diarios.

d) La mayoría de almacenes de datos se organizan para consultas más rápidas, mientras que las
bases de datos más tradicionales se normalizan y estructuran de tal manera que proporcionen
almacenamiento eficaz de información.

e) Los almacenes de datos normalmente se optimizan para responder consultas complejas,


conocidas como OLAP (procesamiento analítico en línea), de gerentes y analistas, en lugar de
consultar hechas de forma simple y repetida.

f) Los almacenes de datos permiten acceso fácil mediante software de minería de datos
(denominados software) que busca modelos y puede identificar relaciones no imaginadas por
los tomadores de decisiones humanos.

g) Los almacenes de datos no incluyen una sola sino muchas bases de datos que se han
procesados para que los datos del almacén se definan uniformemente. Estas bases de datos se
denominan datos limpios.

h) Los almacenes de datos normalmente incluyen datos de fuentes externas (tales como un
informe de industria, los reportes de la empresa para el Gobierno o incluso la información
acerca de los productos de competidores), así como también generaron datos para uso interno.

21. Defina lo que hace el siftware cuando se usa en la minería de datos.

Siftware: Son las herramientas disponibles para ayudar en la toma de decisiones).Incluyen análisis
estadístico, árboles de decisión, redes neurales, agentes inteligentes, lógica difusa y visualización de
datos.

Buscan patrones en almacenes de datos siguiendo ciertos algoritmos.

22. Explique como funciona XML, para facilitar el intercambio de datos de negocio.

Es un estándar no patentado, proporciona el mecanismo para tomas los datos básicos y traducirlos
a un lenguaje universal que se puede leer por cualquiera con las herramientas de traducción
adecuadas. Muchas compañías están usando el XML para mejorar el intercambio de datos
electrónicos y para mejorar aun más la experiencia de Web para clientes. XML hace posible que los
datos se entreguen por Internet, compartan y presenten de la mejor forma posible.

Elaborado por:

Jesús Antonio Hoyos Perdomo

Ing. De Sistemas

speedvirtualextr@gmail.com

Você também pode gostar