Escolar Documentos
Profissional Documentos
Cultura Documentos
INDEXACION CONCEPTOS GENERALES Indexacin: Relacionar una o varias filas de una tabla con un solo dato almacenado en otra tabla o en un archivo de ndices. Asociacin: Relacin entre una direccin del disco y la porcin del disco que contiene la informacin que se desea encontrar. ndice: Es una estructura de datos que permite acceder a diferentes filas de una misma tabla a travs de un campo o campos clave. TIPOS DE INDICES ndices ordenados: las claves de bsqueda se almacenan de forma ordenada ndices asociativos: las claves de bsqueda estn distribuidas en cajones empleando una funcin de asociacin Clave de bsqueda: atributo, del conjunto de atributos, empleado para buscar registros en un archivo. Archivo de ndices: consta de registros (denominados entradas de ndice) de la forma:
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez
NDICES ORDENADOS En un ndice ordenado, las entradas de ndices se almacenan ordenadas sobre el valor de la clave de bsqueda. Por ejemplo, el catlogo de autores en una biblioteca. Supone que los archivos (tuplas) se encuentran ordenados secuencialmente y por lo tanto tienen una llave de bsqueda primaria. ndice primario: en un archivo ordenado secuencialmente, el ndice cuya clave de bsqueda determina el orden secuencial del archivo. ndice secundario: un ndice cuya clave de bsqueda determina un orden diferente del orden secuencial del archivo. Tambin llamado ndice sin agrupacin. Archivo secuencial indexado: archivo secuencial ordenado con un ndice primario.
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez
Tambin se pueden indexar atributos no llaves, o sea, atributos por los que el archivo no se encuentra secuencialmente ordenado. Se usan ndices secundarios. Un ndice secundario apunta a bloques de punteros en memoria secundaria. Se accede a un bloque de punteros y luego se realiza una bsqueda siguiendo los punteros que se encuentran en el bloque.
Archivos de ndice de rbol B+ Los ndices de rbol B+ son una alternativa a los archivos secuenciales indexados.
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez
Un rbol B+ satisface las siguientes propiedades: Todos los caminos, desde la raz a las hojas, tienen la misma longitud. Cada nodo que no es ni raz ni hoja, tiene entre [n/2] y n hijos. Un nodo hoja tiene entre [(n1)/2] y n1 valores
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez
Casos especiales: Si la raz no es una hoja, tiene al menos 2 hijos. Si la raz es una hoja (es decir, no hay otros nodos en el rbol), puede Tener entre 0 y (n1) valores.
Ki son los valores de la clave de bsqueda Pi son punteros a hijos (para nodos que no son hojas), o punteros a cajones (para nodos hoja). Los valores de la clave de bsqueda estn ordenados: K1 < K2 < K3 < ... < Kn-1
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez
Nodos Que No Son Hoja En rboles B+ Los nodos que no son hoja forman un ndice disperso multinivel sobre los nodos hoja. Para un nodo que no es hoja con m punteros se cumple: Todas las claves de bsqueda en el subrbol al que apunta P1 son menores que K1 Para 2 i n 1, todas las claves de bsqueda en el subrbol al que apunta Pi, tienen valores mayores o iguales que Ki1y menores que Km1
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez
Consultas sobre rboles B+ Encontrar todos los registros con valor de la clave de bsqueda k. 1. Empezar con el nodo raz Examinar el nodo para el menor valor de clave de bsqueda > k. Si existe un valor as, suponer que es Ki. Entonces, siguen Pi al nodo hijo De lo contrario, k Km1, donde hay m punteros en el nodo. Entonces, siguen Pm al nodo hijo. Si el nodo alcanzado siguiendo el puntero anterior no es un nodo hoja, repetir el procedimiento anterior sobre el nodo y seguir el correspondiente puntero.
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez
Actualizaciones sobre rboles B+: Insercin Encontrar el nodo hoja en que aparecera el valor de la clave de bsqueda Si el valor de la clave de bsqueda ya est en el nodo hoja, se aade el registro al archivo y, si es necesario, se inserta un puntero en el cajn. Si el valor de la clave de bsqueda no est all, se aade el registro al archivo principal y, si es necesario, se crea un cajn.
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez
Actualizaciones sobre rboles B+: Borrado Encontrar el registro a borrar y eliminarlo del archivo principal y del cajn (si est presente) Eliminar (valor de la clave de bsqueda y puntero) del nodo hoja si no hay ningn cajn, o si se ha quedado vaco Los borrados de nodos pueden propagarse en cascada hacia arriba, hasta encontrar un nodo que tenga n/2 o ms punteros. Si el nodo raz tiene despus del borrado un solo puntero, se borra y el hijo nico se convierte en la raz.
10
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez
Antes y despus de borrar Pamplona La eliminacin del nodo hoja conteniendo Pamplona no result en su padre, al tener demasiados pocos punteros. As, los borrados en cascada se detienen al borrar el padre del nodo hoja.
Organizacin de Archivos con rboles B+ Se resuelve la degradacin de las bsquedas en el ndice mediante el uso de ndices de rbol B+ en el archivo. Tambin se soluciona el problema de la degradacin al almacenar los registros reales utilizando el nivel de hoja del rbol B+ para almacenar los registros reales en los bloques. En este caso, los nodos hoja del rbol almacenan registros, en lugar de almacenar punteros a registros. La insercin y borrado se trata del mismo modo que en un ndice de rbol B+.
11
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez
Un inconveniente de la organizacin de archivos secuenciales es que hay que acceder a una estructura de ndices para localizar los datos lo cual da como resultado ms operaciones de entrada/salida
La organizacin de archivos basada en la tcnica de asociacin (hashing) permite evitar el acceso a la estructura de ndice
CAJON En una organizacin de archivos por asociacin se obtiene la direccin del bloque de disco que contiene el registro deseado mediante el clculo directo de una funcin sobre el valor de la clave de bsqueda del registro
El trmino cajn (bucket) indica una unidad de almacenamiento que puede guardar uno a ms registros (normalmente un bloque de disco)
12
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez
Insertar: Se calcula h(K), se busca el cajn con esa direccin y se inserta el registro Bsqueda: se calcula h(K) y se busca el registro en el cajn con esa direccin Borrado: se calcula h(K), se busca el cajn con esa direccin, se localiza el registro a borrar
Clases de Funciones
Funcin de Asociacin ideal: cada cajn tiene el mismo nmero de registros. Durante la etapa de diseo no se sabe qu valores de clave de bsqueda se almacenaran; Se pretende elegir una funcin que cumpla los siguientes requisitos: Distribucin Uniforme: Cada cajn tiene asignado el mismo nmero de valores de la clave de bsqueda Distribucin Aleatoria: Cada cajn tiene, en promedio, casi el mismo nmero de registros, sin tener en cuenta la distribucin de los valores de la clave de bsqueda
13
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez
Las funciones de Asociacin requieren un diseo cuidadoso Una mala funcin de asociacin podra provocar que una bsqueda tome un tiempo proporcional al nmero de claves de bsqueda en el archivo Una funcin bien diseada, en un caso medio de bsqueda, toma un tiempo constante, independiente del nmero de claves de bsqueda en el archivo Asociacin Dinmica Fijar el nmero de cajones a priori es un problema para bases de datos que crecen en el tiempo (Asociacin Dinmica) Elegir una funcin de asociacin basada en el tamao actual del archivo (degradacin del rendimiento a medida que crece la base de datos) Elegir una funcin de asociacin basada en el tamao previsto del archivo en un determinado punto del futuro (inicialmente desperdicia espacio y al final acaba degradndose) Reorganizar peridicamente la estructura en respuesta al crecimiento del archivo (requiere tiempo y es necesario prohibir el acceso al sistema mientras se lleva a cabo)
14
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez
15
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez
create index ndice_s on sucursal (nombre_sucursal) create unique index ndice_s on sucursal (nombre_sucursal)
Varios ndices Para cierto tipo de consultas resulta ventajoso tener mltiples ndices ndice para nombre_sucursal ndice para saldo Encontrar todos los nmeros de cuenta de la sucursal de Santiago con saldo igual a 1000
16
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez
17
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez
ndice Multiclave
18
Alumnos:
Kenyi Daniel Pea Villegas Jhony Ruiz Encalada Jonatn Morales Ramrez