Escolar Documentos
Profissional Documentos
Cultura Documentos
Tipos de Datos
Un SGBD es una coleccin de programas que permite a los usuarios crear y mantener una
base de datos. Este es un software de propsito general que permite:
Definir: que consiste en definir los tipos de datos, estructuras y restricciones.
Construccin: es el proceso de almacenar los datos concretos sobre algn medio de
almacenamiento.
Manipulacin: consulta, actualizacin o informes(listas).
Es imprescindible definir un tipo de dato para cada elemento de la base de datos. Estos tipos
de datos pueden ser: cadenas de caracteres alfabeticos, enteros, decimales, etc.
fig 1.1
fig 1.2
Los Ficheros solo tiene la definicin de los datos que soporta la app y solo estn restringidas a
trabajar una una sola base de datos// DBMS puede ingresar a distintas base de datos
extrayendo el catlogo de definiciones y utilizando estas definiciones despus.
*Independencia Programa-Datos: Mientras que en el procesamiento tradicional por ficheros,
la estructura de los datos estn incrustada en las app, cuando se realizan cambios que se
introducen en todos los archivos pueden obligar a producir un cambio en todos los programas.
En un DBMS esto no sucede ya que la estructura se guarda en el catalogo, y este permanece
de manera independiente de los dems.
*Independencia Programa-Operacin: una operacin est definida por la Interfaz(con el
nombre de la operacin y sus argumentos) y la implementacin(mtodo). Esta
implementacin no interfiere con la interfaz. Las app pueden operar sobre los datos invocados
a travs de los nombre y argumentos, sin importar la forma en la que fueron implementados.
*Abstraccin de datos: Es lo que permite las independencias anteriores. Esta abstraccin es
como una representacin conceptual del Modelo de datos, utilizando conceptos
lgicos( objetos, propiedades, interrelaciones).
1.3.1 Que es el catalogo de una B.D Primaria
-Definir una BD implica especificar los tipos de datos, estructuras y restricciones de los datos
que se almacenarn en la BD.
La definicin o informacin descriptiva de una BD tambien se almacena en esta ltima en
forma de catlogo o diccionario de la BD ; es lo que se conoce como metadatos.
-El sistema de BD no solo contiene la propia BD, sino tambien una completa definicin o
descripcin de la estructura de la BD y sus restricciones. Esta definicin se almacena en el
catlogo DBMS, que contiene informacin y distintas restricciones de datos. La informacin
almacenada en el catlogo se denomina metadatos y describe la estructura de la BD.
-El catlogo es utilizado por los usuarios cuando estos necesitan informacin de la estructura
de la base de datos.
Concepto de Vista
-Normalmente una base de datos tiene muchos usuarios, cada uno de los cuales puede
necesitar una perspectiva o vista diferente de la BD. Una vista puede ser un subconjunto de la
base de datos o puede contener datos virtuales derivados de los archivos de la BD pero que no
estn explcitamente almacenados.
Por ltimo estn los Trabajadores entre Bambalinas estos usuarios estn enfocados en el
diseo, desarrollo y funcionamiento de un entorno de software y sistemas de DBMS, sin
importarle la base de datos propiamente dicha.
Diseadores e implementadores de sistemas de DBMS; Desarrolladores de herramientas;
Operadores y personal de mantenimiento.
Una caracterstica fundamental del enfoque de base de datos es que proporciona cierto nivel
de abstraccin de los datos, al ocultar detalles de almacenamiento que la mayora de los
usuarios no necesitan conocer. Un modelo de datos(Coleccin de conceptos que sirven para
describir la estructura de una base de datos) proporciona los medios necesarios para lograr
dicha abstraccin.
Los modelos de datos de alto nivel o conceptuales disponen de conceptos muy cercanos al
modo como la mayora de los usuarios perciben los datos, mientras que los modelos de bajo
nivel o fsicos proporcionan conceptos que describen los detalles sobre cmo se almacenan los
datos en el ordenador. Este modelo est dirigido a los especialistas en informtica
generalmente.
Entre estos 2 extremos hay una clase de modelo de datos de representacin(o de
implementacin).
Los modelos de datos conceptuales utilizan conceptos como entidades, atributos y relaciones.
Los modelos de datos de representacin o de implementacin son los ms utilizados en las
SGBD tradicionales y entre ellos se encuentra el modelo de datos relacional,as como los
modelos de red y jerrquico.
Podemos concebir los modelos de datos orientados a objetos como una nueva familia de
modelos de implementacin de alto nivel mas prxima a los modelos conceptuales.
Los modelos de datos fsicos describen cmo se almacenan los datos en el ordenador
mediante la representacin de informacin,por ejemplo,formato de registros,rdenes de
registros y camino de accesos.
Arquitecturas ->Esquemas -> Independencia Fisica y Logica
La descripcin de una BD se conoce como esquema de la BD y se especifica durante el diseo
de la BD. La representacin de un esquema se conoce como diagrama del esquema. A cada
uno de los objetos del esquema se los conoce como elementos de esquema. Un diagrama de
esquema visualiza nicamentee algunos aspectos tales como los nombres de los tipos de
registro y de los elementos de datos y algunos tipos de restricciones.
Arquitectura de 3 esquemas
El objetivo de la arquitectura de 3 esquemas es separar las aplicaciones del usuario y la base
de datos fsica. En esta esta arquitectura se definen esquemas en los 3 siguientes niveles:
1-El nivel interno tiene un esquema interno que describe la estructura fsica de almacenamiento
de la base de datos. Este esquema interno emplea un modelo de datos fsico.
2-El nivel conceptual tiene un esquema conceptual que describe la estructura de la base de
datos completa para una comunidad de usuarios. El esquema conceptual oculta detalles fsicos
de almacenamiento y se concentra en describir entidades,tipos de datos,operaciones de los
usuarios y restricciones. Usa el modelo de de datos de alto nivel o implementacin.
3-El nivel externo o de vista incluye varios esquemas externos o de vistas de usuario.Cada
esquema externo describe la parte de la BD que interesa a un grupo de usuarios determinado y
oculta a ese grupo el resto de la BD. Usa el modelo de datos de alto nivel o implementacin.
SubDivision SQL(Lenguaje)
LDD,LMD,LAD,LDL,LCD
Un segundo criterio para la clasificacin es por el nmero de usuarios a los que da servicio.
Pueden ser monousuario, y multiusuario.
El tercer criterio de clasificacin es el nmero de sitios en los que esta distribuida la SGBD. Un
SGBD es centralizado si los datos estn almacenados en un solo sitio. La SGBD reside en un
solo ordenador.
Los SGBD distribuidos pueden tener la base de datos real distribuida en varios sitios
conectados por una red de computadoras. Los SGBD homogneos utilizan el mismo software
del SGBD en mltiples sitios. Una tendencia reciente consiste en crear software para tener
acceso a varias bases de datos autnomas preexistentes almacenadas en SGBD
heterogneos.Esto da lugar a los SGBD federados en los que los SGBD participantes estn
dbilmente acoplados y tienen cierto grado de autonoma local. Muchos SGBDD usan una
arquitectura cliente-servidor.
Un cuarto criterio es el costo de la SGBD.
Tambin podemos clasificar a las SGBD segn el camino de acceso que dispone para
almacenar ficheros.Una familia muy conocida de SGBD se basa en estructura de ficheros
invertidos. Por ltimo, los SGBD pueden ser de propsito general o de propsito especial.
Cuando el rendimiento tiene gran importancia se puede disear y construir un SGBD de
propsito especial para una aplicacin especfica y ese sistema no servir para otras
aplicaciones.
Cap 5. (13 en la 5ra edi.)
Almacenamiento. (Cintas,discos primarios, etc)
Las BBDD debe estar almacenadas en una medio de almacenamiento, estos forman una
jerarqua de almacenamiento:
*Almacenamiento principal o primario: son los medios en donde la CPU puede
opermemoriaoria principal o la cach). Son de rpido acceso pero de capacidad limitada.
*Almacenamiento secundario y Terciario: discos magnticos, pticos y cintas. El
disco duro de la compu es secundario y las unidades removibles son terciarias. Son ms
baratos, con mas capacidad pero de ms lento acceso.
En una computadora, los datos residen y se transportan por una jerarqua de medios de
almacenamiento. La memoria ms cara es la de menor capacidad con mayor accesibilidad y la
de cita es ms barata y de capacidad indefinida.
En el nivel primario de almacenamiento, la jerarqua ms alta la tiene la memoria cach (RAM
estatica), despues la DRAM (esta proporciona el lugar donde la CPU el rea de trabajo para el
programa y los datos, MEMORIA PRINCIPAL) las ventajas de esta es que es ms barata que la
cache, pero el problema es su volatibilidad y su menor velocidad que la RAM esttica.
En el almacenamiento secundario, la jerarqua es:
*Discos magneticos
*Almacenamiento masivo (CD-ROM)
*Cintas, es el nivel mas barato de la jerarquia.
Capacidad de almacenamiento se mide en Kilobytes(o 1000 bytes), megabytes(o 1M de
bytes) gigabytes(o mil millones de bytes), y terabytes(o 1.000GB).
Base de datos en memoria principal, son muy tiles para las BBDD que requieren tiempo de
respuesta extremadamente rpido (app en tiempo real).
Memoria Flash, esta memoria se encuentra entre la unidad de disco magntico y la DRAM, es
muy utilizada por su tecnologa EEPROM, ya que es muy rapida y no es voltil, pero debe
borrarse y escribirse en bloques enteros. Se utiliza mucho en MP3, etc.
Las cintas magnticas se utilizan para archivos y almacenamiento de respaldo de datos. Las
Juke-box de cintas, contienen un banco de cintas que estn catalogadas y que pueden ser
cargadas automticamente en unidades de cintas. Pertenecen al nivel terciario de
almacenamiento por su gran capacidad (Terabytes).
Fig Disco
Descripcin de dispositivo secundario.
Todos los disco son hechos con materiales magnticos. Si almacenan info en una de sus
superficies son de una cara y si no de dos caras. Para aumentar la capacidad los discos son
creados y producidos en Paquete de discos. Una Pista es un crculo concntrico de pequea
anchura donde se almacena la info, estos tienen distinto dimetro. En el caso de los Paquete
de discos, todas las pistas de mismo dimetro constituyen un Cilindro. La funcin del cilindro
es que los datos que se encuentran en el mismo cilindro se pueden leer con mayor rapidez.
Cada pista est dividida en sectores.
El mecanismo actual que lee y/o escribe el disco es la Cabeza de lectura/escritura, del disco,
que es parte del la unidad de disco(una por cada superficie). Estas cabezas estn conectadas
a un componente elctrico denominado Brazo mecnico. Los brazos estn conectados a un
Activador.
Hay discos con cabeza fija(una por pista) y otros con Cabeza mvil.
Por ltimo tenemos el controlador de Disco que controla el disco y su interaccin con el
sistema.
El tiempo transcurrido para transferir un bloque de disco, dada su direccion, controlador de
disco primario donde va a ir la cabeza es el Tiempo deBsquedaa. EL Retardo de rotacin
es cuando el disco gira para posicionar el bloque debajo de la cabeza. La suma del tiempo de
busqueda mas el retardo de rotacin dan como resultado Tiempo de transferencia de bloque.
A diferencia del acceso aleatorio, el acceso secuencial es necesario recorrer todo el
dispositivo de almacenamiento para lograr llegar a lo que nos interesa(para leer n-simo,
primero hay que leer todo n-1 bloque anterior). La cintas son un tipo de estos
almacenamientos. Al tener que recorrer toda la cinta hasta llegar a lo que queremos, esto hace
que sea muy lento el acceso y por eso es casi nula su utilizacin para guardar datos online,
pero la funcin principal de la cinta es la de Respaldo de la BBDD. Se utiliza para la base de
datos muy grande, para los datos histricos lo cuales no tienen mucha consulta, o para guardar
los ficheros ante algun problema mecnico de los disco de acceso aleatorio.
Tabla de Especificacin
Otra solucin es guardar informacin que habitualmente no se utiliza, pero puede ser til para
reconstruir la informacin perdida. Si se incorpora redundancia se debe considerar dos
problemas: (1) la seleccin de una tcnica que calcule la informacin redundante, (2) y la
seleccin de un mtodo que distribuya la info redundante en el array de discos. El primero se
soluciona con bits de paridad o con cdigo de Hamming (el disco de paridad guarda la suma de
todos los datos de los otros discos y cuando el primario falla se utiliza un sistema parecido a la
resta para reconstruir la info)
En el segundo problema la solucin es almacenar la info redundante en pocos disco o distribuir
en todos los disco de manera uniforme.
Mejora del funcionamiento con RAID
Para aumentar la velocidad de transferencia se utiliza la tcnica de segmentacin de datos.
*Segmentacin de datos a nivel bits: consiste en dividir un byte de datos en sus bits.
Esta tcnica disemina los bit por los discos, generalmente son 8(o un mltiplo de 8) y la frmula
sera: escribir el bit j en la posicin de disco j. Se podra decir que as se consigue un velocidad
de transferencia ocho veces superior ya que 8 discos fsicos son un solo disco lgico.
*Segmentacin a nivel de bloque: los bloques de un fichero se puede segmentar en
distintos discos. Esto va a permitir que la solicitudes de E/S se sirvan en paralelo y que los
tiempo de cola sean menores, as como tambin reduce el tiempo de respuesta. Pero al tener
fallos independientes el nivel es ms alto y necesita de redundancia mediante cdigos de
correccin de errores.
Prctica:
Para el clculo de Tiempo medio de Prdida de Datos;
TMPD(0)=TMF/Banco => siendo: 0 el nivel de RAID; TMF: Tiempo Medio de Fallo; Banco:
cantidad de discos.
TMPD(1)= TMF^2/2*TMF => siendo: 1: el nivel de RAID; TMF: Tiempo Medio de Falla.