Você está na página 1de 7

UNIVERSIDAD NACIONAL DE TRUJILLO FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS ESCUELA DE INFORMATICA

ALUMNOS: Castillo Len Karen Snchez Carrera Mabel Murrugarra Llerena Joseph Hans. ASIGNATURA: Organizacin de archivos. ESCUELA: Informtica

Trujillo, 15 de diciembre del 2011

MTODO INDEXADO
Archivos indexados
El archivo secuencial indexado es uno de los varios mtodos de acceso existentes, mediante este mtodo el usuario obtiene accesos secuenciales a los registros clasificados por llaves y tambin acceso indexado a los mismos registros. En los archivos indexados pueden verse como un conjunto de registros, los que pueden accesarse mediante una clave. Este tipo de archivos constan de 2 partes: rea Principal rea de ndices rea Principal En esta rea se almacenan los registros, con los datos, al momento de crear el archivo. El archivo es creado secuencialmente, es decir, se escriben los registros en el archivo primario en una secuencia indicado por el ordenamiento previo de las claves. Esta rea incluye a todos los campos de cada registro. rea de ndices Esta rea es creada automticamente por el sistema. Esta rea contiene tantos registros como registros existan en el rea principal. Cada registro del rea de ndices consta de 2 campos: Clave de los Registros Puntero al Registro en el rea principal Ejemplo: Sea el siguiente archivo (slo se muestran las claves): 2, 10, 13, 4, 9, 25, 6, 28, 3 rea de ndices Clave 2 10 13 4 9 25 6 28 3 30 Puntero 1 2 3 4 5 6 7 8 9 10 1 2 10 13 4 9 25 6 28 3 30 rea principal

2 3 4 5 6 7 8 9 10

Insertar 30: Siempre se inserta al final, es decir, el archivo crece siempre hacia abajo. Eliminar 4: Se marca el registro con cero, y as se elimina lgicamente Insertar 8: Se pone al final del archivo o se busca un hueco.

Archivos Secuenciales indexados


El archivo secuencial indexado es uno de los varios mtodos de acceso existentes, mediante este mtodo el usuario obtiene accesos secuenciales a los registros clasificados por llaves y tambin acceso indexado a los mismos registros. El archivo secuencial indexado mantiene las caractersticas bsicas de los archivos secuenciales: los registros estn organizados en una secuencia basada en un campo. Dos caractersticas se aaden: un ndice del archivo para soportar los accesos aleatorios y un archivo de desbordamiento (overflow). El ndice provee una capacidad de bsqueda para llegar rpidamente a las proximidades de un registro deseado. El archivo de desbordamiento (overflow) es similar al archivo de registro usado en un archivo secuencial, pero esta integrado de forma que los registros del archivo de desbordamiento se ubican en la direccin de un puntero desde si registr precedente. En la estructura secuencial indexada ms simple, se usa un solo nivel de indexacin. El ndice, en este caso, es un archivo secuencial simple. Cada registro del archivo ndice tiene dos campos: un campo clave, que es el mismo que el campo clave del archivo principal y un puntero al archivo principal. Para encontrar un campo especfico se busca en el ndice hasta encontrar el valor mayor de la clave que es igual o precede al valor deseado de la clave. La bsqueda continua en el archivo principal a partir de la posicin indicada por el puntero. Para aclarar la idea del acceso secuencial indexado veremos el caso del diccionario. Un diccionario es un ejemplo de archivo secuencial, cuyos registros son las definiciones dadas all. Para buscar una palabra no se recorre todo el diccionario, sino que primero se abre ste en la letra correspondiente, para luego buscar en el extremo superior, hasta encontrar la palabra ms prxima a la que se busca, para as recorrer dicha hoja palabra por palabra, hasta encontrar la que buscamos. De esta forma el diccionario es un ejemplo tpico de archivo secuencial indexado, con dos niveles de ndices: El nivel superior para las letras iniciales. El nivel menor para las palabras ubicadas en el extremo superior de cada pgina. Un archivo en organizacin secuencial indexada consta de tres partes: rea Primaria o de Datos. rea de ndices. rea de Desbordamiento u Overflow. rea Primaria de Datos Esta contiene los registros que componen el archivo, el cual es creado secuencialmente. El proceso de escritura comienza en la segunda pista de un cierto cilindro, hasta completar las pistas de este cilindro. Una vez completo se continua en el siguiente cilindro, en la segunda pista, hasta completar el archivo. Si el archivo es accesado secuencialmente, segn el orden de la clave, los registros sern accesados en el orden que se han escrito.

rea de ndices Corresponde al lugar donde se almacenan algunos ndices, no todos. La primera pista de cada cilindro contiene un ndice a las claves de los registros de ese cilindro. Un esquema sencillo es suponer un nico nivel de ndices.

El ndice de pista contendr dos elementos: Normal Overflow La entrada normal est compuesta por la direccin de la pista primaria y por el mayor (o menor) valor de la clave de los registros almacenados en dicha pista. Otra alternativa es que la clave vaya primero y luego la direccin de la pista. Si no hay datos en el rea de overflow, el contenido de la entrada es el mismo que la de la entrada normal. Ejemplo: Sea el siguiente archivo, del cual slo se muestran las claves ordenadas: Supongamos que en cada pista se puede almacenar cuatro registros P0 P1 P2 P3 P4 P1:20|L:2 0 1 23 48 65 P2:33|L:3 3 9 30 50 66 P3:62|L:6 2 17 32 61 67 P4:67|L:6 7 20 33 62

rea de Overflow El rea de Overflow est destinada a contener las inserciones de losregistros que no pueden ser realizadas en el rea primaria. En el rea de overflow los registros se presentan como una lista encadenada, en que el puntero al prximo registro est compuesto por la pista y el lugar que ocupa el registro dentro de la pista (Se acostumbra a usar el mismo cilindro para el rea primaria y la de overflow). Esta lista se mantiene ordenada por clave. Cuando una pista pasa hacia rea de overflow, la entrada en el rea de overflow contiene el puntero al comienzo de la lista (nmero de pista, registro) y el mximo valor en la lista. Ejemplo: Cilindro 1 P0 P1 P2 P3 P4 P5 Area de overflow P1:9 | L:9 1 12 61 3 19 70 P2:36 | L:36 8 24 P3:70 |L:70 9 36 Area principal rea de ndices

Insertar 62, 6 P0 P1 P2 P3 P4 P5 P1:8 | P4,1:9 1 12 61 9 |L 3 19 62 P2:36 | L:36 6 24 70 P3:70 |L:70 8 36

Insertar 7 P0 P1 P2 P3 P4 P5 P1:7 | P4,2:9 1 12 61 9 |L 3 19 62 P2:36 | L:36 6 24 70 8 | P4,1 P3:70 |L:70 7 36

Insertar 2 P0 P1 P2 P3 P4 P5 P1:6 | P4,3:9 1 12 61 9 |L 2 19 62 P2:36 | L:36 3 24 70 8 | P4,1 7 | P4,2 P3:70 |L:70 6 36

Borrado de Registros El borrado puede manejarse de 2 maneras: Borrado Fsico: Si el registro estaba en el rea de overflow, se debe ajustar la lista ligada para compensar el borrado. Se deben contemplar posibles modificaciones al rea de ndices. Si el registro estaba en el rea principal, las entradas son corridas hacia la izquierda; un registro de la cadena de overflow es llevado al rea primaria y se modifica el rea de ndices. Borrado Lgico: Se marca el registro, pero no se elimina fsicamente. Las recuperaciones de informacin saltarn estos registros. Despus mediante una recoleccin de basura se puede recuperar dicho espacio.

Ejemplo: Borrar 7, Insertar 25 P0 P1 P2 P3 P4 P5 P1:6 | P4,2:9 1 12 61 9 |L 2 19 62 8 | P4,1 P2:25 | P4,3:36 3 24 70 36 | L P3:70 |L:70 6 25

Insertar 7, borrar 8 P0 P1 P2 P3 P4 P5 P1:6 | P4,3:9 1 12 61 9 |L 7 | P4,1 2 19 62 8 | P4,1 P2:25 | P4,3:36 3 24 70 36 | L P3:70 |L:70 6 25

Borrar 6 P0 P1 P2 P3 P4 P5 P1:6 | P4,3:9 1 12 61 9 |L 7 | P4,1 2 19 62 P2:36 | L:36 3 24 70 36 |L P3:70 |L:70 6 25

El 6 se marca, por lo que queda lgicamente eliminado El manejo del rea de overflow se puede realizar mediante tres estrategias distintas: rea de Overflow en el Cilindro Area de Overflow Independiente Area de Overflow Mixta a) En el Cilindro: Es una cantidad de pistas por cilindro que se reserva como rea de overflow para el rea primaria de ese cilindro, es decir, cada cilindro tiene su propia rea de overflow, y cuando sta se llena, ya no se pueden hacer ms inserciones, aunque las reas de overflow de otros cilindros tengan espacios disponibles.

Una ventaja de esta forma de manejar el overflow es que no se requiere de movimientos del brazo del disco (no hay tiempo de seek incorporado) para accesar los registros de overflow. Una desventaja es que queda mucho espacio sin usar si las inserciones no se distribuyen de manera uniforme. b) Independiente: Reside en un cilindro aparte de cualquier cilindro del rea primaria. Los registros de overflow son encadenados dentro de esta nica rea de overflow, no importando de cual cilindro o rea primaria vengan. La ventaja de esta forma es que se hace una mejor utilizacin del espacio, ya que el rea de overflow es compartida. La desventaja es que hay un mayor tiempo de bsqueda , ya que se necesita mover las cabezas lecto-grabadoras para accesar los registros de overflow correspondiente a un rea primaria determinada. c) Mixta: Este tipo de manejo de rea de overflow es una combinacin de los dos anteriores, en el sentido que cada cilindro tiene su propia rea de overflow, y adems se establece un rea de overflow independiente, comn a todos los cilindros, la cual es utilizada una vez que el rea de overflow del cilindro se encuentra llena.

Você também pode gostar