Escolar Documentos
Profissional Documentos
Cultura Documentos
Costos de Recuperacin Unidades de Organizacin Funciones de Dispersin Organizaciones Estticas Primitivas y Organizacin de Colisiones y Desbordes Organizaciones Dinmicas - Versiones de Dispersin Extensible
Archivo con R registros en bloques con capacidad para B registros con densidad de carga C
o Organizacin Secuencial (p.e. C=0,85 para registros de longitud variable) Registros desordenados: techo((R/(C*B))/2) Registros ordenados con bsqueda por aproximacin lineal: desde 3 (lectura de bloques extremos y el de aproximacin) Registros ordenados con bsqueda binaria: techo(log2(R/(C*B))) o Organizacin B (en el peor de los casos C=0,5): 1+piso(logC*B+1(C*R+1)) o Organizacin B+ (en el peor de los casos C=0,5): 1+piso(logC*I+1(C*(R/(C*B))+1))+1 con I capac. nodos internos o Directa: 1 (dispersin esttica) o 2 (extensible)
Costos de Recuperacin
Para archivos con registros de longitud fija pueden tener capacidad para uno o muchos registros
o Un registro: ranura (slot) o Muchos registros: bloque o cubo (bucket)
Unidades de Organizacin
Para archivos con registros de longitud variable deben tener capacidad para muchos registros: cubos Las ranuras deben tener un campo de control que indique si estn vacas, ocupadas o con contenido eliminado Los cubos deben tener un campo de control que indique la cantidad de registros que contiene, si son para registros de longitud fija, o el espacio libre que le queda, si son para registros de longitud variable
Transforman al identificador de un registro a una direccin de registro (slo registros de longitud fija) o a una direccin de cubo (registros de longitud fija o variable) Tienen como parmetro la cantidad total de registros o de bloques del archivo Pueden transformar varios identificadores a una misma direccin: sinnimos Para identificadores alfanumricos deben transformar los caracteres a un nmero, y luego calcular el resto de dividir al nmero entre la cantidad total de unidades del archivo Para identificadores numricos pueden aplicar una transformacin para aleatorizar resultados (plegado y suma de dgitos, corrimiento y suma de dgitos, dgitos centrales del cuadrado, ) y luego calcular el resto de la divisin entre la cantidad total de unidades del archivo
4
Funciones de Dispersin
Creacin: se calcula la cantidad de unidades de organizacin (ranuras o cubos) necesarias para un 20 o 30% ms de la mxima cantidad de registros que podra tener el archivo y se inicializan; se puede cargar inicialmente el archivo con una primitiva que no valide unicidad de registros. Actualizacin de Registros: insercin con validacin de unicidad, modificacin y supresin campo de control para no recorrer todo el archivo al validar unicidad (ranuras vacas vs ranuras borradas e indicadores de desborde de cubos); excepciones: insercin en ranura ocupada (colisin), o en cubo completo (desborde). De Recuperacin de Registros: consulta o recuperacin unitaria de registros, y reporte o recuperacin comprensiva de todos los registros (desordenados) por recorrido secuencial. Mantenimiento: reestructuraciones por desorganizacin, y respaldo con reorganizacin a archivos secuenciales.
5
Dispersin Extensible
La funcin de dispersin se usa para acceder a una tabla (archivo) de direcciones de cubos Cada vez que se desborda un cubo del archivo, se agrega uno nuevo y se balancea la carga del desbordado con el nuevo con la funcin de dispersin De tanto en tanto, cuando se agrega un cubo al archivo la tabla de direcciones se duplica Los cubos requieren campos de control para indicar la cantidad de registros (de longitud fija) o la cantidad de bytes libres (registros de longitud variable), y para indicar el tamao de la tabla de direcciones al agregarse o balancearse por ltima vez el cubo
7
Creacin: se calcula la cantidad de cubos necesarias para un 20 o 30% ms de la mxima cantidad de registros con los que se va a cargar inicialmente el archivo y se inicializa al tabla de direcciones para esa cantidad de cubos; se carga inicialmente el archivo con una primitiva que no valide unicidad de registros. Actualizacin de Registros: insercin con validacin de unicidad, modificacin y supresin se localiza el
cubo donde insertar o encontrar el registro, accediendo a la tabla de direcciones con la funcin de dispersin.
De Recuperacin de Registros: consulta o recuperacin unitaria de registros, y reporte o recuperacin comprensiva de todos los registros (desordenados) por recorrido secuencial del archivo de cubos. Mantenimiento: respaldo con reorganizacin a archivo secuencial.
8
De Bits Prefijos
Cubos con Capacidad para 2 Registros td tamao de dispersin del cubo Tabla: 0 0 0 0 1 2 3 3 Bloques Libres: Claves (en binario) de registros en Cubos: 0: td 2, 0000 0010 1: td 8, 1000 1001 2: td 8, 1010 3: td 4, 1100 1110
10