Você está na página 1de 14

Cap 1.

1.1 Propiedades Implcitas de las B.D


-Una base de datos representa algn aspecto del mundo real, lo que en ocasiones se
denomina mini mundo o universo de discurso. Los cambios introducidos en el minimundo se
reflejan en la base de datos.
-Una base de datos es una coleccin de datos lgicamente coherente con algn tipo de
significado inherente. No es correcto denominar base de datos a un surtido aleatorio de
datos.
-Una base de datos se disea,construye y rellena con datos para un propsito especfico.
Dispone de un grupo pretendido de usuarios y algunas aplicaciones preconcebidas en las que
esos usuarios estn interesados.

Tipos de Datos
Un SGBD es una coleccin de programas que permite a los usuarios crear y mantener una
base de datos. Este es un software de propsito general que permite:
Definir: que consiste en definir los tipos de datos, estructuras y restricciones.
Construccin: es el proceso de almacenar los datos concretos sobre algn medio de
almacenamiento.
Manipulacin: consulta, actualizacin o informes(listas).
Es imprescindible definir un tipo de dato para cada elemento de la base de datos. Estos tipos
de datos pueden ser: cadenas de caracteres alfabeticos, enteros, decimales, etc.

fig 1.1

Describe un entorno de la base de datos. Arriba los USUARIOS Y PROGRAMADORES,


debajo, SISTEMAS DE BASE DE DATOS (las aplicaciones/consultas), SGBD (soft para
procesar la consulta, soft para acceder a los datos), debajo, DEFINICIN DE BASE DE
DATOS (metadatos), y BASE DE DATOS.

fig 1.2

1.3 Almacenamiento de fichas Vs. Almacenamiento en B.D


En el Procesamiento por Ficheros tradicionales, cada usuario necesita tener su propio
fichero para su propia aplicacin y esto genera el mal uso de recurso y sobre todo redundancia
de datos. A diferencia de un enfoque de bases de datos, que almacena todos los datos que
se definen una vez y luego son accedidos por varios usuarios.

Los Ficheros solo tiene la definicin de los datos que soporta la app y solo estn restringidas a
trabajar una una sola base de datos// DBMS puede ingresar a distintas base de datos
extrayendo el catlogo de definiciones y utilizando estas definiciones despus.
*Independencia Programa-Datos: Mientras que en el procesamiento tradicional por ficheros,
la estructura de los datos estn incrustada en las app, cuando se realizan cambios que se
introducen en todos los archivos pueden obligar a producir un cambio en todos los programas.
En un DBMS esto no sucede ya que la estructura se guarda en el catalogo, y este permanece
de manera independiente de los dems.
*Independencia Programa-Operacin: una operacin est definida por la Interfaz(con el
nombre de la operacin y sus argumentos) y la implementacin(mtodo). Esta
implementacin no interfiere con la interfaz. Las app pueden operar sobre los datos invocados
a travs de los nombre y argumentos, sin importar la forma en la que fueron implementados.
*Abstraccin de datos: Es lo que permite las independencias anteriores. Esta abstraccin es
como una representacin conceptual del Modelo de datos, utilizando conceptos
lgicos( objetos, propiedades, interrelaciones).
1.3.1 Que es el catalogo de una B.D Primaria
-Definir una BD implica especificar los tipos de datos, estructuras y restricciones de los datos
que se almacenarn en la BD.
La definicin o informacin descriptiva de una BD tambien se almacena en esta ltima en
forma de catlogo o diccionario de la BD ; es lo que se conoce como metadatos.
-El sistema de BD no solo contiene la propia BD, sino tambien una completa definicin o
descripcin de la estructura de la BD y sus restricciones. Esta definicin se almacena en el
catlogo DBMS, que contiene informacin y distintas restricciones de datos. La informacin
almacenada en el catlogo se denomina metadatos y describe la estructura de la BD.
-El catlogo es utilizado por los usuarios cuando estos necesitan informacin de la estructura
de la base de datos.

Que es la abstraccin de Datos-> Funcion Cumple el Catlogo


-La caracterstica que permite la independencia programa-datos y la independencia programaoperacin se denomina abstraccin de datos.
-Definimos la abstraccin de datos como la representacin conceptual de los datos que no
incluyen muchos detalles, cmo estn almacenados los datos o cmo estn implementadas las
operaciones (o la capacidad de ser independientes). El modelo de datos es un tipo de
abstraccin.
-El catlogo se encuentra por debajo de los usuarios y programadores y contiene la definicin
de la base de datos almacenada. Estos metadatos son la definicin de la estructura de la BD y
sus restricciones. Es utilizado por los usuarios cuando estos necesitan informacin de la
estructura de la base de datos.

Concepto de Vista
-Normalmente una base de datos tiene muchos usuarios, cada uno de los cuales puede
necesitar una perspectiva o vista diferente de la BD. Una vista puede ser un subconjunto de la
base de datos o puede contener datos virtuales derivados de los archivos de la BD pero que no
estn explcitamente almacenados.

Que se debe tener en cuenta cuando existen transacciones


multiusuarios (important)
Cuando se trata de BBDD multiusuarios el DBMS tiene que incluir un soft de control de
concurrencia para que eso varios usuarios que intentan actualizar los mismo datos, lo hagan
de un modo controlado para que el resultado sea correcto. Por ejemplo una app para la ventas
de pasajes de una aerolnea utiliza una app denominada procesamiento de transacciones en
lnea (OLTP).
Las transacciones son programas en ejecucin que incluyen una o ms accesos a la base de
datos. Propiedades:
*Aislamiento: garantiza que parezca que cada transaccin se realiza de manera
aislada, pero no lo es.
*Atomicidad: permite que se realicen o todas o ninguna de las operaciones de base de
datos de una transacciones.
1.4 Actores (del libro)
-Administrador de la BBDD (DBA): Administra los recursos de principales y secundarios de
las BBDD. Este es responsable del acceso autorizado, de la coordinacin y motorizacin de su
uso, de adquirir recursos de software y hardware. Y por supuesto de la seguridad
-Diseadores: Son los encargados de identificar los datos, de elegir la estructuras para
representar y almacenar los datos.Tambin trabajan los potenciales grupos de usuarios para
desarrollar las vistas.
-Usuarios finales:
*Usuarios finales casuales: entran en ocasiones, necesitan distinta info, lo hace por
medio de lenguajes sofisticados, estn en el nivel medio o alto (administradores).
*Usuarios finales principiantes o paramtricos: Son los ms comunes, hacen
actualizaciones y consultas por medio de transacciones estndar
*Usuarios finales avanzados: ing, cientficos y analistas, son los que implementan las
app y satisfacen sus requisitos.
*Usuarios autnomos: mantiene bbdd personales usando paquetes de programas con
interfaz grafica y basados en men.
Tambin se encuentran los Analistas de Sistemas y los Programadores de las
Aplicaciones.

Por ltimo estn los Trabajadores entre Bambalinas estos usuarios estn enfocados en el
diseo, desarrollo y funcionamiento de un entorno de software y sistemas de DBMS, sin
importarle la base de datos propiamente dicha.
Diseadores e implementadores de sistemas de DBMS; Desarrolladores de herramientas;
Operadores y personal de mantenimiento.

Los Actores DBA (Artculo de fotocopia)


Rol de DBA.
Los objetivos o tareas del DBA son:
Mantener la integridad de los datos esta se encarga de asegurar que las operaciones
ejecutadas por los usuarios sean correctas y mantengan la consistencia de la base de datos.
La proteccin contra fallas del software o hardware es garantizar la integridad de los datos.
Mantener la seguridad de los datos, la seguridad se encarga de limitar a los usuarios
a ejecutar slo las operaciones permitidas por el negocio, con el fin de disminuir el riesgo de
permitir econmicas.
Mantener la disponibilidad de los datos, el objetivo principal de una base es brindar
un servicio de almacenamiento, procesamiento y consulta de datos propios de una empresa. El
DBA debe asegurar que el servicio de base de datos est disponible todo el tiempo que el
negocio lo requiera. El DBA debe proporcionar y garantizar medios para el restablecimiento de
las base de datos que se hayan corrompido por el desperfecto del sistema, y restablecer el
servicio.
Funciones bsicas y responsabilidades.
Creando de base de datos y tablas.
Creado de BBDD:
*Localizacin fsica de los archivos.
*Tipo de base de datos, dependiendo de la carga del trabajo.
Creando Tablas.
*Seleccionar tipos de datos
*Tablas fragmentadas o no fragmentadas.
*Localizacin de la tabla.
*Determinacin del espacio en disco.
*Restricciones de integridad referencial.
Administrar la concurrencia.
*Concurrencia de lectura.
*Concurrencia de actualizacin.
Optimizacin del acceso a datos, es un aspecto importante cuan rpido se realiza la
consulta, esta tiene que ser lo ms rpido posible. La mejor regla para medir la velocidad es la
percepcin del usuario.
Definir el esquema conceptual. Definir con exactitud cual es la informacin que debe
mantenerse en la BBDD. El DBA debe crear el mapa conceptual usando el DDL.

Definir el esquema interno. Debe definir la representacin de la informacin.


Vincularse a los usuarios. Es la comunicacin entre el DBA y los usuarios y otros
administradores.
Procedimiento de respaldo y recuperacin. Debe definir un plan de backup y de
recuperacin adecuado que incluya descarga o vaciado peridico de la BBDD a un medio de
almacenamiento de respaldo, y procedimientos para cargar otra vez a partir del vaciando.
Monitoreo. Tendr que vigilar peridicamente y continuamente las actividades de los
usuarios. EL DBA analizar los datos para determinar si se necesita hacer una modificacin en
el diseo de la BBDD para mejorar su rendimiento o para facilitar las tareas de los usuarios.
Rendimiento. Deber analizar las estadsticas de tiempo de ejecucin sobre la
actividad de la BBDD y su rendimiento.
Actualizaciones. Cuando el fabricante de DBMS anuncie una nueva versin, debe
realizar un anlisis de las caractersticas que esta importa y compararlas con las necesidades
del negocio.
Documentacin. Es de suma importancia saber que modificaciones fueron efectuadas,
como fueron realizadas y cuando fueron establecidas.(esto no suele hacerse o se hace por la
mitad)
Perfil del DBA.
Concepto de Hombre orquesta(hace todo lo mencionado anteriormente) y Equipos de
DBAs (se encarga cada uno de algo).
Cuando no utilizar SGBD
Cuando el DBMS genera costos adicionales es mejor utilizar un sistema tradicional de ficheros,
estos costos pueden darse por:
*Fuerte inversin inicial en software y equipos;
*La generalidad que posee el DBMS para definir y procesar datos;
*Costos de seguridad, concurrencia, integridad y recuperacin;
Por lo tanto es mejor usar un sistema de ficheros cuando:
*La BBDD es pequea y las app son simple, estn bien definidas y no se espera
que cambien;
*Cuando lo programas tiene un requerimiento estricto de tiempo real;
*No se requiere acceso multi usuario.
Cap 2.
Modelo de Datos

Una caracterstica fundamental del enfoque de base de datos es que proporciona cierto nivel
de abstraccin de los datos, al ocultar detalles de almacenamiento que la mayora de los
usuarios no necesitan conocer. Un modelo de datos(Coleccin de conceptos que sirven para
describir la estructura de una base de datos) proporciona los medios necesarios para lograr
dicha abstraccin.
Los modelos de datos de alto nivel o conceptuales disponen de conceptos muy cercanos al
modo como la mayora de los usuarios perciben los datos, mientras que los modelos de bajo
nivel o fsicos proporcionan conceptos que describen los detalles sobre cmo se almacenan los
datos en el ordenador. Este modelo est dirigido a los especialistas en informtica
generalmente.
Entre estos 2 extremos hay una clase de modelo de datos de representacin(o de
implementacin).
Los modelos de datos conceptuales utilizan conceptos como entidades, atributos y relaciones.
Los modelos de datos de representacin o de implementacin son los ms utilizados en las
SGBD tradicionales y entre ellos se encuentra el modelo de datos relacional,as como los
modelos de red y jerrquico.
Podemos concebir los modelos de datos orientados a objetos como una nueva familia de
modelos de implementacin de alto nivel mas prxima a los modelos conceptuales.
Los modelos de datos fsicos describen cmo se almacenan los datos en el ordenador
mediante la representacin de informacin,por ejemplo,formato de registros,rdenes de
registros y camino de accesos.
Arquitecturas ->Esquemas -> Independencia Fisica y Logica
La descripcin de una BD se conoce como esquema de la BD y se especifica durante el diseo
de la BD. La representacin de un esquema se conoce como diagrama del esquema. A cada
uno de los objetos del esquema se los conoce como elementos de esquema. Un diagrama de
esquema visualiza nicamentee algunos aspectos tales como los nombres de los tipos de
registro y de los elementos de datos y algunos tipos de restricciones.
Arquitectura de 3 esquemas
El objetivo de la arquitectura de 3 esquemas es separar las aplicaciones del usuario y la base
de datos fsica. En esta esta arquitectura se definen esquemas en los 3 siguientes niveles:
1-El nivel interno tiene un esquema interno que describe la estructura fsica de almacenamiento
de la base de datos. Este esquema interno emplea un modelo de datos fsico.
2-El nivel conceptual tiene un esquema conceptual que describe la estructura de la base de
datos completa para una comunidad de usuarios. El esquema conceptual oculta detalles fsicos
de almacenamiento y se concentra en describir entidades,tipos de datos,operaciones de los
usuarios y restricciones. Usa el modelo de de datos de alto nivel o implementacin.
3-El nivel externo o de vista incluye varios esquemas externos o de vistas de usuario.Cada
esquema externo describe la parte de la BD que interesa a un grupo de usuarios determinado y
oculta a ese grupo el resto de la BD. Usa el modelo de datos de alto nivel o implementacin.

La independencia de datos es la capacidad para modificar el esquema en un nivel del sistema


de la BD sin tener que modificar el esquema del nivel inmediato superior. Podemos definir 2
tipos de independencia de datos:
1-La independencia lgica de los datos es la capacidad de modificar el esquema conceptual sin
tener que alterar los esquemas externos ni los programas de aplicacin.
Podemos modificar el esquema conceptual para ampliar la BD o para reducir la BD.En el
segundo caso la modificacion no deberia afectar a los esquemas externos que solo se refieran
a los datos restantes.Si en el SGBD se cuenta con independencia logica de datos, solo sera
preciso modificar la definicion de la vista y las correspondencias.
2-La independencia fsica de los datos es la capacidad de modificar el esquema interno sin
tener que alterar el esquema conceptual( o los externos).
La arquitectura de 3 esquemas puede facilitar la consecucin de la verdadera independencia
de datos, tanto fsica como lgica. Sin embargo, los 2 niveles de correspondencias implican un
gasto extra durante la compilacion y ejecucion de una consulta o un programa.

SubDivision SQL(Lenguaje)
LDD,LMD,LAD,LDL,LCD

Para especificar el esquema conceptual y interno se utiliza el lenguaje de definicin de


datos(LDD). Cuando en los SGBD se mantenga una clara separacin entre los niveles
conceptual e interno, el LDD servir solamente para el esquema conceptual.
Para especificar el esquema interno se utiliza el lenguaje de definicin de
almacenamiento(LDA).La correspondencia de los esquemas se puede especificar en
cualquiera de los 2 lenguajes(LDA o LDD)
El lenguaje de definicin de vista(LDV) sirve para especificar las vistas del usuario y sus
correspondencias con el esquema conceptual. Sin embargo en la mayora de las SGBD su
utiliza LDD para describir tanto el esquema conceptual como el externo.
El lenguaje de manipulacin de datos(LMD) se utiliza para cosas como la
eliminacin,modificacin, insercin de datos,etc.
Clasificacin SGBD
El principal criterio de clasificacin de una SGBD es el modelo de datos en el que se basan.
Podemos clasificarlo en ,relacionales, orientadas a objetos,objeto-relacionales,jerrquicas,red y
otros.

Un segundo criterio para la clasificacin es por el nmero de usuarios a los que da servicio.
Pueden ser monousuario, y multiusuario.
El tercer criterio de clasificacin es el nmero de sitios en los que esta distribuida la SGBD. Un
SGBD es centralizado si los datos estn almacenados en un solo sitio. La SGBD reside en un
solo ordenador.
Los SGBD distribuidos pueden tener la base de datos real distribuida en varios sitios
conectados por una red de computadoras. Los SGBD homogneos utilizan el mismo software
del SGBD en mltiples sitios. Una tendencia reciente consiste en crear software para tener
acceso a varias bases de datos autnomas preexistentes almacenadas en SGBD
heterogneos.Esto da lugar a los SGBD federados en los que los SGBD participantes estn
dbilmente acoplados y tienen cierto grado de autonoma local. Muchos SGBDD usan una
arquitectura cliente-servidor.
Un cuarto criterio es el costo de la SGBD.
Tambin podemos clasificar a las SGBD segn el camino de acceso que dispone para
almacenar ficheros.Una familia muy conocida de SGBD se basa en estructura de ficheros
invertidos. Por ltimo, los SGBD pueden ser de propsito general o de propsito especial.
Cuando el rendimiento tiene gran importancia se puede disear y construir un SGBD de
propsito especial para una aplicacin especfica y ese sistema no servir para otras
aplicaciones.
Cap 5. (13 en la 5ra edi.)
Almacenamiento. (Cintas,discos primarios, etc)
Las BBDD debe estar almacenadas en una medio de almacenamiento, estos forman una
jerarqua de almacenamiento:
*Almacenamiento principal o primario: son los medios en donde la CPU puede
opermemoriaoria principal o la cach). Son de rpido acceso pero de capacidad limitada.
*Almacenamiento secundario y Terciario: discos magnticos, pticos y cintas. El
disco duro de la compu es secundario y las unidades removibles son terciarias. Son ms
baratos, con mas capacidad pero de ms lento acceso.
En una computadora, los datos residen y se transportan por una jerarqua de medios de
almacenamiento. La memoria ms cara es la de menor capacidad con mayor accesibilidad y la
de cita es ms barata y de capacidad indefinida.
En el nivel primario de almacenamiento, la jerarqua ms alta la tiene la memoria cach (RAM
estatica), despues la DRAM (esta proporciona el lugar donde la CPU el rea de trabajo para el
programa y los datos, MEMORIA PRINCIPAL) las ventajas de esta es que es ms barata que la
cache, pero el problema es su volatibilidad y su menor velocidad que la RAM esttica.
En el almacenamiento secundario, la jerarqua es:
*Discos magneticos
*Almacenamiento masivo (CD-ROM)
*Cintas, es el nivel mas barato de la jerarquia.
Capacidad de almacenamiento se mide en Kilobytes(o 1000 bytes), megabytes(o 1M de
bytes) gigabytes(o mil millones de bytes), y terabytes(o 1.000GB).

Base de datos en memoria principal, son muy tiles para las BBDD que requieren tiempo de
respuesta extremadamente rpido (app en tiempo real).
Memoria Flash, esta memoria se encuentra entre la unidad de disco magntico y la DRAM, es
muy utilizada por su tecnologa EEPROM, ya que es muy rapida y no es voltil, pero debe
borrarse y escribirse en bloques enteros. Se utiliza mucho en MP3, etc.
Las cintas magnticas se utilizan para archivos y almacenamiento de respaldo de datos. Las
Juke-box de cintas, contienen un banco de cintas que estn catalogadas y que pueden ser
cargadas automticamente en unidades de cintas. Pertenecen al nivel terciario de
almacenamiento por su gran capacidad (Terabytes).

Fig Disco
Descripcin de dispositivo secundario.

Todos los disco son hechos con materiales magnticos. Si almacenan info en una de sus
superficies son de una cara y si no de dos caras. Para aumentar la capacidad los discos son
creados y producidos en Paquete de discos. Una Pista es un crculo concntrico de pequea

anchura donde se almacena la info, estos tienen distinto dimetro. En el caso de los Paquete
de discos, todas las pistas de mismo dimetro constituyen un Cilindro. La funcin del cilindro
es que los datos que se encuentran en el mismo cilindro se pueden leer con mayor rapidez.
Cada pista est dividida en sectores.
El mecanismo actual que lee y/o escribe el disco es la Cabeza de lectura/escritura, del disco,
que es parte del la unidad de disco(una por cada superficie). Estas cabezas estn conectadas
a un componente elctrico denominado Brazo mecnico. Los brazos estn conectados a un
Activador.
Hay discos con cabeza fija(una por pista) y otros con Cabeza mvil.
Por ltimo tenemos el controlador de Disco que controla el disco y su interaccin con el
sistema.
El tiempo transcurrido para transferir un bloque de disco, dada su direccion, controlador de
disco primario donde va a ir la cabeza es el Tiempo deBsquedaa. EL Retardo de rotacin
es cuando el disco gira para posicionar el bloque debajo de la cabeza. La suma del tiempo de
busqueda mas el retardo de rotacin dan como resultado Tiempo de transferencia de bloque.
A diferencia del acceso aleatorio, el acceso secuencial es necesario recorrer todo el
dispositivo de almacenamiento para lograr llegar a lo que nos interesa(para leer n-simo,
primero hay que leer todo n-1 bloque anterior). La cintas son un tipo de estos
almacenamientos. Al tener que recorrer toda la cinta hasta llegar a lo que queremos, esto hace
que sea muy lento el acceso y por eso es casi nula su utilizacin para guardar datos online,
pero la funcin principal de la cinta es la de Respaldo de la BBDD. Se utiliza para la base de
datos muy grande, para los datos histricos lo cuales no tienen mucha consulta, o para guardar
los ficheros ante algun problema mecnico de los disco de acceso aleatorio.
Tabla de Especificacin

Acceso paralelo al Disco mediante el uso de tecnologa de RAID.


El principal objetivo del RAID es igualar los rendimientos del disco frente a los habidos en
memoria y microprocesadores. El Data striping o franjeo de datos es una solucin para que
el acceso a los datos sea ms rpido, ya que construye un array de discos, es decir que
muchos discos funcionan como un gran disco rgido, y el hecho de que muchas usuarios
puedan realizar operaciones de E/S en paralelo hace se que el porcentaje de transacciones
sea ms alto.
Mejora de Fiabilidad con Raid
La fiabilidad es la probabilidad del buen funcionamiento del algo. El mtodo de RAID produce
que la fiabilidad de mantener los datos(es decir no perderlos) sea mayor. La principal tcnica de
RAID es la denominada Mirroring, esta consiste en escribir los datos de manera redundante
en dos discos fsicos idnticos que se trata como un solo disco lgico. Cuando se lee un disco
se puede hacer con retardo de cola, bsqueda y rotacin ms cortos, y cuando uno se rompe
se utiliza el otro hasta que se cambie el roto.

Otra solucin es guardar informacin que habitualmente no se utiliza, pero puede ser til para
reconstruir la informacin perdida. Si se incorpora redundancia se debe considerar dos
problemas: (1) la seleccin de una tcnica que calcule la informacin redundante, (2) y la
seleccin de un mtodo que distribuya la info redundante en el array de discos. El primero se
soluciona con bits de paridad o con cdigo de Hamming (el disco de paridad guarda la suma de
todos los datos de los otros discos y cuando el primario falla se utiliza un sistema parecido a la
resta para reconstruir la info)
En el segundo problema la solucin es almacenar la info redundante en pocos disco o distribuir
en todos los disco de manera uniforme.
Mejora del funcionamiento con RAID
Para aumentar la velocidad de transferencia se utiliza la tcnica de segmentacin de datos.
*Segmentacin de datos a nivel bits: consiste en dividir un byte de datos en sus bits.
Esta tcnica disemina los bit por los discos, generalmente son 8(o un mltiplo de 8) y la frmula
sera: escribir el bit j en la posicin de disco j. Se podra decir que as se consigue un velocidad
de transferencia ocho veces superior ya que 8 discos fsicos son un solo disco lgico.
*Segmentacin a nivel de bloque: los bloques de un fichero se puede segmentar en
distintos discos. Esto va a permitir que la solicitudes de E/S se sirvan en paralelo y que los
tiempo de cola sean menores, as como tambin reduce el tiempo de respuesta. Pero al tener
fallos independientes el nivel es ms alto y necesita de redundancia mediante cdigos de
correccin de errores.
Prctica:
Para el clculo de Tiempo medio de Prdida de Datos;
TMPD(0)=TMF/Banco => siendo: 0 el nivel de RAID; TMF: Tiempo Medio de Fallo; Banco:
cantidad de discos.
TMPD(1)= TMF^2/2*TMF => siendo: 1: el nivel de RAID; TMF: Tiempo Medio de Falla.

Você também pode gostar