Você está na página 1de 9

RESUMEN TEMA 1

Un sistema de gestin de Bases de Datos (SGDB) consiste en una coleccin de datos interrelacionados y un conjunto de programas para acceder a dichos datos. Los objetivos principales de un SGBD consisten en proporcionar un entorno eficaz y eficiente que permita el almacenamiento y la recuperacin de informacin en una base de datos. El propsito principal de un sistema de base de datos es proporcionar a los usuarios una visin abstracta de los datos. Hay tres niveles: Nivel fsico (el nivel de abstraccin ms bajo): cmo se almacenan realmente los datos Nivel lgico: Qu datos se almacenan y qu relaciones existen entre ellos Nivel de vistas (el nivel de abstraccin ms alto): slo se ofrece una parte de una BD al usuario, hay muchas posibles vistas para la misma BD.

Ejemplar es la coleccin de informacin de una BD en un momento dado, se modifica frecuentemente. Esquema es el diseo completo de la BD y raramente se modifica. Independencia de datos fsica es la capacidad para modificar el esquema fsico sin que los programas tengan que reescribirse. Independencia de datos lgica es la capacidad para modificar el esquema fsico sin que los programas tengan que reescribirse, ms compleja. Modelo entidad-relacin (E-R): Basado en una abstraccin del mundo real que considera entidades y relaciones entre ellas as como restricciones que los datos deben cumplir. Las entidades se describen por sus atributos. Modelo orientado a objetos: Similar al modelo E-R, est basado en una coleccin de objetos que contienen valores almacenados en variables ejemplares as como fragmentos de cdigo que operan en ese objeto. Los objetos con iguales valores y mtodos se agrupan en clases. Cada objeto tiene identidad nica independiente de los datos que contenga- Un objeto accede a los datos de otro invocando un mtodo de ese otro objeto. Modelo relacional: emplea una coleccin de tablas para representar tanto los datos como las relaciones entre ellos. Cada tabla tiene varias columnas con nombre nico. Modelo de red: Los datos se representan mediante colecciones de registros y las relaciones se representan mediante enlaces. Modelo jerrquico: similar al de redes, se diferencia en que los registros se organizan como colecciones de rboles en vez de grafos dirigidos. 1

Modelo fsico: se utiliza para describir datos a muy bajo nivel, existen pocos ejemplos: modelos de unificacin y modelo de memoria por marcos. Dos tipos de lenguaje de base de datos, lenguaje de definicin (LDD) y lenguaje de manipulacin de datos (LMD). El LDD es un lenguaje que se especifica el esquema de la BD en el cual el resultado de la compilacin del LDD es un conjunto de tablas que se almacenan en un directorio de datos o diccionario de datos. Tambin un diccionario de datos contiene metadatos (datos sobre los datos) y se consulta antes de acceder o modificar los registros. La estructura de almacenamiento y mtodos de acceso se especifican mediante un conjunto de definiciones en un tipo de LDD denominado lenguaje de almacenamiento y definicin de datos. El LMD la manipulacin de datos consiste en las operaciones de recuperacin de informacin, insercin de nueva informacin, borrado de informacin y modificacin de informacin. Tambin permite a los usuarios acceder o manipular los datos mediante el modelo de datos apropiados. Hay dos tipos: Procedimentales: Requieren que el usuario especifique qu datos quiere obtener y cmo obtenerlos. No procedimentales: Requiere que el usuario especifique qu datos quiere obtener sin especificar cmo obtenerlos, stos son ms sencillos de emplear por el usuario pero menos eficientes.

Existen diferentes tipos de usuarios: Programadores de aplicaciones: Interactan con el sistema a travs de llamadas del LMD escritas en el lenguaje de la base de datos pero como el lenguaje es muy distinto al de la LMD se emplea un precompilador que convierte las instrucciones del LMD en llamadas a procedimientos normales del anfitrin. Usuarios sofisticados. Interactan con el sistema sin programas escritos, escribiendo sus consultas en un lenguaje de consulta de BD Usuarios especializados: Tipo de usuario sofisticado que escriben aplicaciones especializadas Usuarios normales. Interactan con el sistema invocando alguna aplicacin permanente.

Componentes de procesamiento de consultas: Compilador del LMD: Traduce las instrucciones del LMD a instrucciones de bajo nivel que entiende el motor de evaluacin de consultas (trata de ganar eficiencia) Precompilador del LMD: convierte las instrucciones del LMD en llamadas a procedimientos normales del anfitrin. Intrprete del LDD: interpreta las instrucciones del LDD y las registra en un conjunto de tablas que contienen metadatos. Motor de evaluacin de consultas: Ejecuta las instrucciones a bajo nivel generadas por el compilador del LMD.

RESUMEN TEMA 2
Una entidad es un objeto del mundo real que es distinguible de todos los dems objetos (p.e. una persona). Tienen unas propiedades que las hacen distinguirlas unas de otras. Una entidad puede ser concreta o abstracta. Un conjunto de entidades es la totalidad de las entidades del mismo tipo que comparten las mismas propiedades. Una se entidad se representa mediante un conjunto de atributos. Para cada atributo hay un conjunto de valores permitidos llamado dominio del atributo. Una BD incluye una coleccin de entidades cada una de las cuales incluye un nmero de entidades del mismo tipo. Podemos distinguir varios tipos de atributos: Simples y compuestos, no pueden ser divididos en subpartes, mientras que los compuestas s. Usar atributos compuestos puede referirse a un atributo entero o a partes, lo que aumenta la flexibilidad. Univalorados y multivalorados. Los atributos multivalorados pueden tener varios valores para una entidad concreta y los univalorados solo 1. Nulos. Se usan cuando una entidad no tiene un determinado valor para dicho atributo, nunca puede ser nulo un atributo clave. Derivados. El valor de este tipo de atributos puede extraerse de los valores de otros atributos o entidades.

Una relacin es una asociacin entre entidades. Se llama conjunto de relaciones a aqul que incluye relaciones del mismo tipo. Se llama participacin a la asociacin entre conjuntos de entidades de referencia. La funcin que desempea una entidad en una relacin se llama papel de la entidad. La correspondencia de cardinalidades o razn de cardinalidad expresa el nmero de entidades a las que otra entidad puede estar asociada por medio de un conjunto de relaciones. Las correspondencias de cardinalidades pueden ser: Uno a uno. Una entidad de A se asocia a los sumo a una entidad B. Uno a varios. Una entidad de A se asocia con cualquier nmero de entidades de B, una entidad de B se asocia a lo sumo con una entidad de A. Varios a uno. Varias entidades de A se asocian a lo sumo con una entidad de B, una entidad de B se puede asociar con cualquier nmero de entidades de A. Varios a varios. 1 entidad de A se puede asociar con cualquier nmero de entidades de B y viceversa.

Una superclave es un conjunto de uno o ms atributos que, tomados colectivamente, permiten identificar de forma nica una entidad en el conjunto de entidades. Se denomina clave primaria a una clave candidata elegida por el diseador de la BD como elemento principal para identificar entidades dentro de un conjunto de entidades. Dos entidades no pueden tener el mismo valor de sus atributos clave. 3

Un conjunto de entidades puede no tener suficientes atributos para formar una clav e primaria, en este caso se dice que se trata de un conjunto de entidades dbil. Un miembro de un conjunto de entidades fuerte es una entidad dominante, uno de una dbil, subordinada. Un conjunto de entidades puede incluir subgrupos que se diferencian de alguna forma de otras entidades del conjunto (ej. tipos de cuenta). El proceso de designacin de subgrupos dentro de un conjunto de entidades se denomina especializacin. La generalizacin es la manera en la que distintos grupos de entidades se sintetizan en grupos de entidades de nivel ms alto. La generalizacin es la inversa de la especializacin. Diseo de un esquema de una BD E-R. 1 En la fase inicial se trata de caracterizar completamente las necesidades esperadas por los usuarios de la BD, esta fase se denomina especificacin de los requisitos de usuario. En segundo lugar el diseador elige un modelo conceptual y en ella se trata de especificar todos los conjuntos de entidades, de relaciones y ligaduras de correspondencia. Tambin hay que identificar situaciones de conflicto y eliminar redundancia. Adems hay que describir los tipos de operaciones (transacciones) que se efectuarn, esta parte se llama la especificacin de los requisitos funcionales. En la fase de diseo lgico, el esquema conceptual se asocia al modelo de datos del SGBD que se emplear (lo veremos ms adelante). En la fase de diseo fsico se determinan las caractersticas fsicas de la BD.

3 4

RESUMEN TEMA 3
Una BD relacional consiste en un conjunto de tablas, cada una de ellas con nombre exclusivo, cada fila representa una relacin entre un conjunto de valores. Cada tabla consta de un conjunto de columnas que se denominan atributos. Un lenguaje de consulta es aquel en el que un usuario solicita informacin de la base de datos. Hay de 2 tipos: Procedimentales: En las que el usuario indica al sistema cuales son las operaciones para calcular el resultado deseado No procedimentales: En las que el usuario describe la informacin deseada sin indicar el procedimiento.

El algebra relacional es un consulta procedimental que consta de un conjunto de operaciones sobre una o varias relaciones y que producen nuevas relaciones. Estas operaciones puede ser unarias (una sola relacin) o bien binarias (pares de relaciones) y estas operaciones son: Seleccin: Selecciona las tuplas que satisfacen un predicado dado. Notacin ()

Proyeccin: Extrae una relacin que contenga slo los atributos incluidos en el subndice y elimina las filas repetidas si las hubiera. Notacin ( ) Unin: Encuentra la relacin compuesta por tuplas que aparecen en un par de relaciones y se anota con el smbolo ( ). Las relaciones tienen que ser compatibles. Diferencia de conjuntos: Busca tuplas que estn en una relacin pero no en otra. Se apunta con el smbolo (-). Las relaciones tienen que ser compatibles. Producto cartesiano: Combina informacin de cualesquiera dos relaciones. Se denota (x). Como el atributo puede aparecer en ambas relaciones hay que crear un esquema de denominaciones para distinguir entre ambos atributos. Renombramiento: Se nombra (p) y permite renombrar una relacin devolviendo el resultado de la expresin E con el nombre x. Tambin se pueden renombrar atributos Interseccin de conjuntos. Permite encontrar tuplas que estn simultneamente en dos relaciones, no aade mayor potencia computacional al algebra relacional pero simplifica la notacin. Se utiliza el smbolo ( ). Reunin natural. Sirve para simplificar algunas consultas que involucran un producto cartesiano. Combina una seleccin y un producto cartesiano en una sola operacin ya que forma un producto cartesiano de sus dos argumentos, re aliza una seleccin forzando la igualdad de los atributos que aparecen en ambos esquemas y finalmente elimina atributos duplicados. Su smbolo es ><. Divisin: Es adecuada para las consultas que incluyen la expresin para todo. Su smbolo es . Asignacin: Sirve para asignar temporalmente una relacin y se nota con el smbolo , la asignacin va de derecha a izquierda y no hace mostrar ninguna relacin al usuario.

RESUMEN TEMA 5
Las restricciones de integridad proporcionan un medio de asegurar que las modificaciones hechas a la base de datos por los usuarios no provoquen una prdida de la consistencia de los datos. Las Restriccin de integridad son predicados arbitrarios para las relaciones de la base de datos. Hay varios tipos de restricciones: Restricciones de dominios. Es el tipo de restriccin ms bsico y hace que los valores de un atributo de la base de datos estn comprendido entre unos valores definidos anteriormente. Tiene un mbito interno en una relacin determinada y no se utiliza para verificar la integridad entre varias relaciones de manera directa. Integridad referencial. Asegura la integridad de los datos entre una relacin para un conjunto de atributos determinados respecto de otra relacin con otro cierto grupo de atributos. Asegura que las relaciones entre las distintas tablas de la base de datos puedan ser mantenidas sin ninguna prdida de consistencia, pudiendo recuperarse la informacin mediante una reunin natural entre dichas relaciones. 5

a) Tuplas colgantes. Sea un par de relacin r(R) y s(S), y la reunin natural entre r y s. Se llama tupla colgante a queta tupla tsubr de r que no se rene con ninguna tupla de s. b) Clave externa. Sean r1(R1) y r2(R2) dos relaciones con las claves primarias K1 y K2 respectivamente. Un subconjunto de R2 es una clave externa que hace referencia a K1 de la relacin r1 si se exige que para cada t2 de r2 haya una tupla t1 de r1 tal que: t1[K1] = t2 * ] Asertos. Son predicados que expresan condiciones que deben cumplirse dentro de la base de datos en todo momento y que la afectan de manera global. Los asertos se chequean en su creacin y posteriormente cada vez que existe una modificacin. Las modificaciones se permiten si se comprueba que una vez hecha, el aserto se mantiene en un estado verdadero. Un abuso en el uso de asertos puede provocar una ralentizacin de funcionamiento muy importante con bases de datos grandes. Disparadores: Son funciones integradas dentro de la BD que se ejecutan cuando se cumplen una serie de condiciones. Sirven pare realizar ciertas tareas de mantenimiento cuando se dan una serie de condiciones. Los disparadores dependen del SGBD utilizado, y pueden tener mbitos de accin de columna o de tupla. Tambin pueden generar un registro de error tanto en una tabla de mantenimiento cuando se producen inserciones o actualizaciones que violan ciertas reglas.

RESUMEN TEMA 6 PARTE 1


Superclave: Dado un subconjunto K de R, se considera superclave de R si para todos los pares t1 y t2 de r tales que t1 t2 , entonces t1 *K+ t2 [K] Dependencia funcional: Sea R y R, se dice que la dependencia funcional se cumple si para todas las tuplas t1, t2 de r se da que si t1*+=t2*+ entonces t1*+=t2*+ . De acuerdo con esto, se dice que K es superclave de R si KR, es decir, siempre que t1[K]=t2[K] tambin se produce que t1[R]=t2[R], es decir t1=t2. Las dependencias funcionales permiten expresar ligaduras que no pueden ser expresadas con superclaves, al afectar las superclaves a la totalidad de la relacin, mientras que las dependencias funcionales puede afectar slo a conjuntos de atributos de la relacin. Se dice que un atributo de una dependencia funcional es raro si se puede eliminar sin modificar el cierre del conjunto de dependencias funcionales. Un atributo A es raro para si A , y F implica lgicamente (F-, -> -) U ,( A) -> Un atributo A es raro para si A , y el conjunto de dependencias funcionales (F{->-) U { ->(-A)}) implica lgicamente a F.

El recubrimiento cannico Fc de F es un conjunto de dependencias tales que F implica lgicamente todas las dependencias de Fc y Fc implica lgicamente todas las dependencias de F. Aparte posee dos propiedades y es que ninguna dependencia funcional de Fc posee atributos raros y que el lado izquierdo de cada dependencia funcional de Fc es nico, es decir, no existen dos dependencias -> 1 y 2 ->2 de Fc tales que 1=2.

RESUMEN TEMA 6 PARTE 2


Forma normal de Boyce-Codd (FNBC) Se dice que un esquema R est en FNBC respecto a un conjunto de dependencias funcionales F si, para todas las dependencias funcionales F+ de la forma -> , donde R y R se cumple al menos una de las siguientes condiciones 1) -> es una dependencia funcional trivial 2) es una superclave en el esquema R. Un diseo de BD est en FNBC si cada relacin lo est aunque puede haber redundancia. No todas las descomposiciones FNBC conservan las dependencias. Los objetivos de diseo son 3: 1) reunin sin perdida 2) FNBC 3) Conservacin de las dependencias. Y como reunin sin perdida es una condicin esencial para la descomposicin, para evitar perdida de informacin, entonces habr que abandonar la FNBC o el requisito de conservacin de las dependencias. La tercera forma normal es una relajacin de la FNBC y permite obtener siempre descomposiciones que conservan las dependencias. Tercera Forma Normal En los casos en que la descomposicin en FNBC no conserva las dependencias se pueden hacer dos cosas: Para cada actualizacin soportar el coste computacional del clculo de las reuniones para buscar violaciones Emplear una descomposicin alternativa (la 3FN) que, a diferencia de la FNBC, puede tener alguna redundancia.

La FNBC exige que todas las dependencias funcionales no triviales sean de la forma donde es una superclave, la 3FN relaja la restriccin permitiendo dependencias funcionales no triviales cuyo lado de la izquierda no sea una superclave.

Obsrvese que si un esquema satisface FNBC tambin satisface 3FN, pero no al revs. Al igual que en el caso de FNBC existe un algoritmo (algoritmo de sntesis de 3FN) que permite descomponer, con reuniones sin prdida y conservando las dependencias funcionales. Cuarta Forma Normal El problema de repeticin de informacin se produce en las anteriores normalizaciones, para evitarlo incluimos el concepto de dependencias multivaloradas cuya funcin es exigir que estn presentes otras tuplas de una cierta forma. La 4FN es una especializacin de la forma norma Boyce-Codd en la cual una relacin R est en 4FN con respecto a un conjunto de dependencias funcionales multivaloradas F si para toda dependencia multivalorada en F+ de la forma ->-> con R y R, se cumple, como mnimo, una de las condiciones siguientes: a) ->-> es una dependencia multivalorada trivial b) es una superclave en el esquema R.

RESUMEN TEMA 14
Data Mining: conjunto de tcnicas estadsticas, generalmente muy sofisticadas, que permiten extraer patrones estadsticos de grandes bases de datos para su utilizacin efectiva por parte de la empresa; actuando sobre bases de datos relaciones o sobre Data Warehouses extrayendo informacin oculta. Data Warehouses es un sistema de informacin con estas caractersticas: Es una BBDD diseada para tareas analticas, sus datos provienen de diversas aplicaciones. Soporta un nmero relativamente reducido de usuarios con interaccin prolongada. El acceso a la lectura de registros es intensivo. El contenido es modificado continuamente. Contiene informacin actual e histrica. Generalmente tienen pocas tablas pero muy grades. Cada consulta suele producir una tabla grande.

Aunque se podra definir como una coleccin orientada hacia el usuario, variante en el tiempo y no voltil que sirve como sistema de soporte en el proceso de toma de decisiones. La mayora de las tcnicas de Data Mining consisten en modelos estadsticos y matemticos muy sofisticados, generalmente provenientes de la inteligencia artificial. Inteligencia Artificial: El conjunto de programas de ordenador y sistemas que permiten efectuar tareas de complejidad tal que generalmente se entiende que slo pueden ser efectuados por humanos. 8

Redes Neuronales Artificiales (RNA) Simulan el funcionamiento y estructura del cerebro y parten del elemento ms bsico, la neurona. Su estructura es esta: En la capa de entrada se recibe la informacin que procesar la red. Las capas intermedias realizan la computacin. La capa de salida produce la reaccin adecuada para cada entrada.

La estructura no se programa, se modifica de manera autnoma mediante prueba y error. Las neuronas refuerzan o debilitan su conexin con otras neuronas dependiendo de si la salida ha sido la deseada o no. Al proceso consistente en modificar la fuerza de las conexiones sinpticas en el cerebro se le denomina aprendizaje quedando grabado el mensaje en la fuerza de l as conexiones sinpticas. Este mensaje seria una secuencia de nmeros que representa como de fuerte es su conexin. La mayor ventaja es que las RNA van aprendiendo segn va variando el entorno, no necesitan que un humano las programe ni las modifique aunque cambien las condiciones iniciales. Algoritmos Genticos (AG) Son un procedimiento de bsqueda heurstico basado en los principios de evolucin natural de Darwin en el cual los individuos mejor adaptados al medio sobreviven y transmiten su informacin gentica a sus sucesores. Con lo cual al cabo de unas generaciones la especia ser ms fuerte y ms acoplada al medio. Pasos de un (AG): 1) 2) 3) 4) 5) 6) Generar aleatoriamente una poblacin de soluciones iniciales, codificarla en binario. Calcular cmo de buena es cada solucin Elegir 2 individuos para reproducirse en funcin de su bondad. Cruzar secciones de los cromosomas generando individuos hijo Mutar con probabilidad muy baja a los hijos Sustituir la poblacin anterior por la nueva, si no hemos llegado al ptimo repetir.

Estrategia de CRM (Customer Relationship Managent) Cualquier iniciativa destinada a ayudar a una empresa a optimizar sus interacciones con sus clientes o proveedores que emplee una o ms herramientas del marketing con el propsito de adquirir o retener clientes o hacer ventas cruzadas. Diversos problemas como que la informacin web est indexada por palabras y no por contenido, los usuarios no quieren hacer encuestas, las bases de datos no son pblicas, diversos problemas de privacidad, seguridad de esos datos. Aparte surgen retos como que los sistemas de Data Mining requieren gran cantidad de datos y velocidad de proceso con lo cual necesita mucha maquina, aparte estos sistemas no son escalables y pueden llegar a no ser validos si hay demasiados datos.

Você também pode gostar