Você está na página 1de 10

Administracin de Sistemas Informticos

Unidad 1

Sistemas de Almacenamiento de la Informacin

Gestin de Bases de Datos

Gestin de Bases de Datos

Sistemas de almacenamiento de la Informacin

1. Los sistemas de informacin 2. Organizaciones fsicas de los datos 2.1. Ficheros y registros 2.2. Organizacin de ficheros 2.3. Acceso a los registros 3. Tipos de organizaciones de ficheros 3.1. Organizacin secuencial 3.1.1.Organizacin secuencial encadenada 3.1.2.Organizacin secuencial indexada 3.1.3.Organizacin secuencial indexada encadenada 3.2. Organizacin relativa 3.2.1.Organizacin relativa directa 3.2.2.Organizacin relativa indirecta o aleatoria 4. Clasificacin de los ficheros 5. Fragmentacin y compactacin de datos

Gins ngel Esteban Oller

Gestin de Bases de Datos

Sistemas de almacenamiento de la Informacin

1.- Los sistemas de informacin


Por todos es conocida la importancia que tienen los datos en una empresa y la informacin que de ellos se deriva, mas an hoy que vivimos inmersos en lo que hemos dado en denominar sociedad de la informacin. Este concepto no viene ms que a decirnos que vivimos en un mundo en el que existe una gran demanda de informacin y que sta es de vital importancia en la mayora de las ocasiones para el funcionamiento empresarial. Los sistemas de informacin son subsistemas de la empresa que facilitan la transferencia de informacin entre los dems subsistemas de la empresa como por ejemplo el financiero, el productivo, etc. Un sistema de informacin est formado por tres tipos de elementos: recursos fsicos (documentos, archivadores, equipos de comunicaciones, etc) , recursos humanos y protocolos o normas que rigen la transmisin y flujo de la informacin. Cuando la gestin de un sistema de informacin se realiza total o parcialmente utilizando ordenadores y sus complementos hablamos de un sistema informtico. El objetivo fundamental de un sistema informtico es almacenar de manera estructurada, la informacin de la empresa, o mejor dicho, los datos de la empresa. Para ello ser necesario definir dos caractersticas del mismo: su diseo fsico y su diseo lgico. El primero hace referencia a como estn realmente almacenados esos datos en los soportes de almacenamiento (dispositivos, tipos de ficheros, organizacin de estos ficheros, mtodos de acceso a los ficheros, etc.); el segundo a la visin abstracta que tenemos de esos datos en determinadas estructuras olvidndonos de los detalles fsicos mencionados antes (estructuras lgicas de datos, rboles, tablas, objetos, etc.). Segn el modelo empleado en el diseo fsico, se pueden emplear dos sistemas: Sistema basado en ficheros de datos y programas. En este tipo de sistema se emplean ficheros de almacenamiento y programas de tratamiento y recuperacin como elementos separados entre s y almacenados independientemente, sin unin fsica. Sistema basado bases de datos. En este tipo de sistema todos los elementos tienen una unin lgica, sin existir una independencia entre los elementos que forman el sistema, llegando a veces a haber una unin fsica, almacenando datos y programas en un mismo fichero. El uso de uno u otro depende fundamentalmente de la fecha de implantacin. Antes de la dcada de los 70 del siglo pasado los sistemas de ficheros eran lo habitual, a partir de esas fechas empezaron a ser sustituidos por sistemas de bases de datos; hoy es impensable un sistema informtico empresarial que no almacene sus datos en bases de datos.

2.- Organizaciones fsicas de los datos


2.1.- Ficheros y registros
Los datos contenidos en los soportes de almacenamiento se estructuran en unas unidades llamadas ficheros o archivos; un fichero es, por tanto, un conjunto de bytes almacenados de forma organizada en un soporte de almacenamiento.

Gins ngel Esteban Oller

Gestin de Bases de Datos

Sistemas de almacenamiento de la Informacin

Desde el punto de vista de un fichero, su informacin se almacena en unas unidades llamadas registros. Un registro es una estructura formada por la unin de varios elementos homogneos referentes a una misma entidad. A cada uno de esos elementos se le llama campo. Los registros son la unidad de tratamiento de los ficheros de datos, mientras que los campos son la mnima unidad de informacin de un registro.

Un registro fsico o bloque es la es la cantidad ms pequea de datos que pueden transferirse en una operacin de E/S entre la memoria principal y los dispositivos perifricos o viceversa. El tamao del bloque o registro fsico depender de las caractersticas del ordenador. En la mayora de los casos el tamao del bloque suele ser mayor que el del registro lgico, es decir, un bloque contiene un nmero variable de registros lgicos. A este nmero se le llama factor de bloqueo.

Los registros de un fichero pueden ser de longitud fija o longitud variable, bien porque el nmero de campos vara de un registro a otro, porque vara el tamao de los campos o

Gins ngel Esteban Oller

Gestin de Bases de Datos

Sistemas de almacenamiento de la Informacin

por ambas cosas. Para delimitar un registro de otro se emplean delimitadores de campo y/o de registro. Para agilizar los accesos a los registros se utilizan los buffers, que son reas de memoria en las que se almacenan bloques del disco y que se mantienen actualizadas mediante manejadores adecuados.

2.2.- Organizacin de ficheros


Se llama organizacin de un fichero a la forma en que estn estructurados y almacenados sus registros en el soporte que lo contiene. El tipo de organizacin de un fichero depende del tipo de dispositivo de almacenamiento que se utilice. La organizacin de un fichero se define cuando este se crea y no se puede cambiar durante su existencia. Atendiendo a la forma de acceso, los dispositivos de almacenamiento se pueden clasificar en: Dispositivos secuenciales. En ellos los datos se almacenan en posiciones consecutivas y para acceder a un dato hay que acceder irremediablemente a los que le anteceden. Dispositivos direccionables o de acceso directo. En ellos los datos se pueden almacenar en posiciones aleatorias y se accede directamente a un dato cualquiera sin necesidad de acceder a los que le anteceden. Obviamente en un dispositivo secuencial no se podr crear un fichero con organizacin aleatoria.

2.3.- Acceso a los registros


Se entiende por acceso a un registro al procedimiento utilizado para seleccionarlo. El tipo de dispositivo condiciona el acceso. Existen los siguientes tipos de acceso: Secuencial. Se puede utilizar con todo tipo de dispositivos, secuenciales y direccionables. Los registros se leen desde el inicio del fichero hasta el registro buscado o hasta el final del fichero si este no se encuentra. Directo. Solo se puede utilizar en dispositivos direccionables. Permite seleccionar directamente un registro mediante una clave. Indexado. Solo se puede utilizar en dispositivos direccionables. Permite seleccionar indirectamente un registro consultando primeramente y de manera secuencial una tabla (ndice) que contiene la clave de cada uno de los registros. Posteriormente, con esa clave se realiza un acceso directo al registro. Dinmico. Solo se puede realizar en dispositivos direccionables. Permite un acceso directo o por ndice a un registro; a partir de ese se efecta un acceso secuencial.

Gins ngel Esteban Oller

Gestin de Bases de Datos

Sistemas de almacenamiento de la Informacin

3.- Tipos de organizaciones de ficheros


3.1.- Organizacin secuencial
En este tipo de organizacin los registros se encuentran almacenados en el soporte en posiciones fsicamente contiguas en el mismo orden en que hayan sido introducidos, sin dejar huecos. Las ventajas del uso de este tipo de organizacin son: Rapidez en el acceso a un bloque de registros contiguos. El archivo est compactado, sin fragmentaciones. Los inconvenientes del uso de este tipo de organizacin son: Lentitud en el acceso a un registro. En el peor de los casos hay que recorrer el fichero entero. No est permitida la insercin de registros, tan solo la aadidura al final. No est permitido el borrado de registros. Cuando se necesita eliminar un registro se realiza un borrado lgico que marca el registro como no perteneciente al fichero, pero no se borra fsicamente y ocupa espacio en el soporte. Para mantener ordenado y con datos reales el fichero hay que crear uno nuevo a partir del existente.

Existen diferentes tipos de ficheros con organizacin secuencial:

3.1.1.- Organizacin secuencial encadenada


Son ficheros con organizacin secuencial gestionados mediante punteros, campos que tienen la direccin de un registro dentro del fichero. Estos punteros son un campo aadido a los campos que contienen los datos del registro y contienen la direccin del registro siguiente, anterior o ambas en la secuencia lgica del fichero, no en la fsica lo que indica que este subtipo de organizacin secuencial estar permitida en soportes direccionables y en secuenciales solo en el caso de que la secuencia lgica y fsica del fichero coincidan. La adicin de nuevos registros siempre se realiza al final pues los registros se almacenan consecutivamente para evitar fragmentaciones en el soporte. La eliminacin de registros se realiza marcndolos, es decir, se realiza un borrado lgico.

Gins ngel Esteban Oller

Gestin de Bases de Datos

Sistemas de almacenamiento de la Informacin

3.1.2.- Organizacin secuencial indexada


Este tipo de organizacin aprovecha las ventajas de la organizacin secuencial y el acceso directo. El fichero contiene una serie de reas: rea primaria es la zona donde estn contenidos todos los registros ordenados ascendentemente por el valor de una clave. Esta rea se encuentra dividida en segmentos de n registros consecutivos y almacenados en posiciones contiguas; es un rea con organizacin secuencial donde el acceso a un registro requiere dos fases, una para acceder al segmento donde se encuentra el registro y otra para recorrer de manera secuencial dicho segmento hasta acceder al registro en cuestin. rea de ndices es una zona en la que los registros estn formados por dos campos, uno que contiene la clave del ltimo registro del segmento y otro que contiene la direccin de comienzo del segmento. rea de overflow (desbordamiento) es la zona destinada a contener los registros almacenados posteriormente a la creacin del fichero. Para localizar un registro en este tipo de ficheros primero se realiza una consulta al rea de ndices hasta encontrar un valor de clave mayor que el que buscamos, obteniendo la direccin del segmento en el que probablemente estar el registro. Despus se recorre secuencialmente el segmento hasta encontrar el registro o encontrar un registro con valor de clave mayor; en este caso se recorre secuencialmente el rea de overflow hasta encontrarlo o encontrar un registro con valor de clave mayor, concluyendo que no existe dicho registro.

3.1.3.- Organizacin secuencial indexada-encadenada


Se caracteriza por combinar el uso de punteros con el de ndices, lo que supone un aumento en el tamao del registro pero tambin un aumento en el rendimiento de las bsquedas. Las eliminaciones se hacen con borrados lgicos y las adiciones sobre el rea de overflow. Deben de ser reorganizados frecuentemente para mantener los punteros e ndices consistentes. Para acceder a un registro se busca en el rea de ndices la direccin de comienzo del bloque o segmento de registros que se recorre secuencialmente siguiendo los punteros.

Gins ngel Esteban Oller

Gestin de Bases de Datos

Sistemas de almacenamiento de la Informacin

3.2.- Organizacin relativa


En estos ficheros el almacenamiento fsico de los registros se realiza mediante el empleo de una clave que indica la posicin del registro dentro del fichero y la direccin donde est almacenado. Obviamente solo se puede implementar sobre soportes direccionables. La direccin de almacenamiento del registro se obtiene de su clave; si esta es alfanumrica se emplean algoritmos para transformarla en una clave numrica. Las claves pueden necesitar de una transformacin para obtener valores del rango de direcciones disponibles para los registros del fichero, de manera que existe una relacin directa entre clave y direccin de almacenamiento. El algoritmo de transformacin que recibe el nombre de hashing debe cumplir los siguientes requisitos: Maximizar el espacio disponible en el soporte de almacenamiento. Establecer una relacin directa entre clave y direccin de almacenamiento. Producir el menor nmero posible de sinnimos (registros que con diferente clave obtienen la misma direccin de almacenamiento). Dado que los algoritmos pueden producir sinnimos, puede existir una zona de overflow para solucionar este problema. Existen dos tipos de organizacin relativa:

3.2.1.- Organizacin relativa directa


Estos ficheros emplean claves numricas, por lo que los registros poseen direcciones numricas enteras, lo que hace que la secuencia lgica de almacenamiento coincida con la fsica, es decir, el valor de la clave indica directamente la direccin de almacenamiento. Las ventajas de este tipo de organizacin son: Acceso directo y rpido a registros. Permite inserciones y borrados. Se pueden recorrer secuencialmente. Los inconvenientes que presentas son los siguientes: Se generan huecos. Al hacer un acceso secuencial hay que recorrer las posiciones vacas. Se pueden producir colisiones si dos registros tienen la misma clave. Lentitud para recorrer todo el fichero.

Gins ngel Esteban Oller

Gestin de Bases de Datos

Sistemas de almacenamiento de la Informacin

3.2.2.- Organizacin relativa indirecta o aleatoria


Son ficheros con organizacin directa y clave alfanumrica por lo que se debe transformar aplicando un algoritmo de hashing. Las ventajas y los inconvenientes son las mismas que en la organizacin relativa directa; la nica diferencia radica en que en este tipo hay que prestar atencin al algoritmo que transforma las claves en direcciones para que se optimice al mximo el espacio del soporte de almacenamiento y para que no se produzcan sinnimos o estos sean mnimos.

4.- Clasificacin de los ficheros


Segn la funcin y el use que se hace de ellos, los ficheros se clasifican en: Permanentes aquellos cuyos registros sufren pocos cambios a lo largo del tiempo. Temporales aquellos cuya existencia desde su creacin es corta. Los ficheros permanentes pueden ser: 1. Maestros Son los ficheros principales y fundamentales de los sistemas informticos. Mantienen actualizados los datos de sus registros y campos. Suelen tener pocos cambios. Por ejemplo, el fichero de clientes de una empresa. 2. Constantes Contienen datos que no varan o sufren muy pocas variaciones a lo largo del tiempo. Por ejemplo, el fichero de las provincias espaolas. 3. Histricos Contiene datos de ficheros maestros que han dejado de ser relevantes en un instante de tiempo pero se conservan para poder reproducir situaciones pasadas. Por ejemplo, el fichero de los profesores que impartieron clase en el IES Cura Valera. Los ficheros temporales pueden ser:

Gins ngel Esteban Oller

Gestin de Bases de Datos

Sistemas de almacenamiento de la Informacin

1. De movimiento Contienen datos utilizados para la actualizacin de ficheros maestros. Una vez actualizado el fichero maestro, se destruyen. 2. De maniobra Son ficheros auxiliares creados durante la ejecucin de los programas. Se destruyen antes de que el programa finalice su ejecucin. No son visibles a los usuarios.

5.- Fragmentacin y compactacin de datos


La fragmentacin es un fenmeno que se produce cuando el espacio disponible en un soporte de almacenamiento est utilizado ineficazmente como consecuencia de las diferentes operaciones de insercin y/o borrado que se han realizado sobre los archivos que contiene. Los archivos so se encuentran dispuestos de manera no contigua en el soporte sino que se encuentran troceados y como consecuencia puede haber trozos de espacio que por su tamao son pueden ser utilizados, es decir, desperdiciados. Esto hace ms lentas las operaciones de lectura y escritura sobre el soporte y que el espacio disponible no est optimizado. La fragmentacin puede ser interna cuando el espacio no aprovechado o desperdiciado aparece como asignado a un registro y externa cuando este espacio no aparece como asignado a un registro. La fragmentacin interna aparece cuando por cualquier motivo se sobredimensiona el tamao de un registro. Para eliminarla hay que modificar los tamaos y/o nmero de los campos. La fragmentacin externa aparece como consecuencia de las operaciones que se realizan sobre los ficheros (borrado lgico, huecos en archivos directos, etc). Para reducirla se emplean tcnicas de compactacin, estrategias de colocacin de modo que se seleccione, en la lista de registros disponibles el hueco del tamao ms adecuado al registro a insertar. Entre estas estrategias destacan: Primer ajuste. El nuevo registro ocupa el primer hueco disponible. Mejor ajuste. Los huecos se ordenan ascendentemente por tamao y el nuevo registro ocupa el primer hueco en el que quepa. Peor ajuste. Los huecos se ordenan descendentemente por tamao y el nuevo registro ocupa el primer hueco en el que quepa.

Por otra parte, se emplean tcnicas de compactacin para disminuir el espacio que ocupan los datos en el disco. Existen dos tipos de tcnicas: Compresin irreversible. Consiste en aplicar algoritmos que eliminan datos poco relevantes y que hacen que el archivo resultante sea casi igual al original en lo fundamental. Supone una prdida de datos, por lo que es imposible reconstruir el archivo original. Ejemplo: algoritmos MP3 o JPG Compresin exacta. Consiste en aplicar algoritmos que no eliminan datos, por los que el archivo original se puede reconstruir en cualquier momento. Algunas de estos algoritmos son: o Compresin por eliminacin de redundancia. Sin un dato aparece repetido varias veces de forma continuada se sustituye por 3 bytes: el primero indica la codificacin del dato, el segundo el valor repetido y el tercero el nmero de veces que se repite. No siempre obtiene archivos ms pequeos. o Cdigos de Huffman. Consiste en asignar cdigos muy pequeos a valores muy frecuentes y cdigos de mayor tamao a valores de menor frecuencia.

Gins ngel Esteban Oller

10

Você também pode gostar