Escolar Documentos
Profissional Documentos
Cultura Documentos
B A S E D E D A T O S
1. GENERALIDADES.
Una base de datos es una colección de información organizada de forma que un programa del
Computador accionar rápidamente los fragmentos de datos que necesite. Una base de datos es
un sistema de archivos electrónico.
Se define una base de datos como una serie de datos organizados y relacionados entre sí, los
cuales son recolectados y explotados por los sistemas de información de una empresa o
negocio en particular.
Una base de datos es un “almacén” que nos permite guardar grandes cantidades de
información de forma organizada para que luego podamos encontrar y utilizar fácilmente. A
continuación te presentamos una guía que te explicará el concepto y características de las
bases de datos.
El término de bases de datos fue escuchado por primera vez en 1963, en un simposio
celebrado en California, USA. Una base de datos se puede definir como un conjunto de
información relacionada que se encuentra agrupada ó estructurada.
Desde el punto de vista informático, la base de datos es un sistema formado por un conjunto
de datos almacenados en discos que permiten el acceso directo a ellos y un conjunto de
programas que manipulen ese conjunto de datos.
Cada base de datos se compone de una o más tablas que guarda un conjunto de datos. Cada
tabla tiene una o más columnas y filas. Las columnas guardan una parte de la información
sobre cada elemento que queramos guardar en la tabla, cada fila de la tabla conforma un
registro.
1
UNIVERSIDAD DEL QUINDÍO
FACULTAD DE CIENCIAS HUMANAS Y BELLAS ARTES
PROGRAMA DE CIENCIA DE LA INFORMACIÓN Y LA
DOCUMENTACIÓN, BIBLIOTECOLOGÍA Y ARCHIVÍSTICA.
1.3 Características
Entre las principales características de los sistemas de base de datos podemos mencionar:
2. Origen y Antecedentes
Surgen desde mediados de los años sesenta la historia de las bases de datos, en 1970 Codd
propuso el modelo relacional, este modelo es el que ha marcado la línea de investigación por
muchos años, ahora se encuentran los modelos orientados a objetos
Edgar Frank Codd (23 de agosto de 1923 a 18 de abril de 2003), en un artículo "Un modelo
relacional de datos para grandes bancos de datos compartidos" ( "un modelo relacional de
datos para grandes bancos de datos compartidos") en 1970, definió el modelo relacional y
Publicó una serie de reglas para la Evaluación de Administradores de Sistemas de Datos
Relacionales y nacieron Así las bases de datos relacionales.
A partir de los aportes de Codd el multimillonario Larry Ellison desarrollo la base de datos
Oracle, el Cual es un sistema de administración de base de datos, que se destaca por sus
Transacciones, estabilidad, escalabilidad y multiplataforma.
Las bases de datos relacionales con su Sistema de tablas, filas y columnas, pudieron competir
con las bases de datos jerárquicas y de red, ya que su bajo nivel de programación y su uso era
muy sencillo.
2
UNIVERSIDAD DEL QUINDÍO
FACULTAD DE CIENCIAS HUMANAS Y BELLAS ARTES
PROGRAMA DE CIENCIA DE LA INFORMACIÓN Y LA
DOCUMENTACIÓN, BIBLIOTECOLOGÍA Y ARCHIVÍSTICA.
En esta década el modelo relacional ha conseguido posicionarse del Mercado de las bases de
datos. Y también en este tiempo se iniciaron grandes investigaciones paralelas y distribuidas,
como las bases de datos orientadas a objetos.
Los sistemas de ficheros almacenan varias copias de los mismos datos en ficheros distintos.
Esto hace que se desperdicie espacio de almacenamiento, además de provocar la falta de
consistencia de datos.
En los sistemas de bases de datos todos estos ficheros están integrados, por lo que no se
almacenan varias copias de los mismos datos. Sin embargo, en una base de datos no se puede
eliminar la redundancia completamente, ya que en ocasiones es necesaria para modelar las
relaciones entre los datos.
Eliminando o controlando las redundancias de datos se reduce en gran medida el riesgo de que
haya inconsistencias. Si un dato está almacenado una sola vez, cualquier actualización se debe
realizar sólo una vez, y está disponible para todos los usuarios inmediatamente. Si un dato está
duplicado y el sistema conoce esta redundancia, el propio sistema puede encargarse de
garantizar que todas las copias se mantienen consistentes.
En los sistemas de ficheros, los ficheros pertenecen a las personas o a los departamentos que
los utilizan. Pero en los sistemas de bases de datos, la base de datos pertenece a la empresa y
puede ser compartida por todos los usuarios que estén autorizados.
Gracias a la integración es más fácil respetar los estándares necesarios, tanto los establecidos a
nivel de la empresa como los nacionales e internacionales. Estos estándares pueden
establecerse sobre el formato de los datos para facilitar su intercambio, pueden ser estándares
de documentación, procedimientos de actualización y también reglas de acceso.
3
UNIVERSIDAD DEL QUINDÍO
FACULTAD DE CIENCIAS HUMANAS Y BELLAS ARTES
PROGRAMA DE CIENCIA DE LA INFORMACIÓN Y LA
DOCUMENTACIÓN, BIBLIOTECOLOGÍA Y ARCHIVÍSTICA.
El SGBD proporciona muchas de las funciones estándar que el programador necesita escribir
en un sistema de ficheros. A nivel básico, el SGBD proporciona todas las rutinas de manejo de
ficheros típicas de los programas de aplicación.
En los sistemas de ficheros, las descripciones de los datos se encuentran inmersas en los
programas de aplicación que los manejan.
Esto hace que los programas sean dependientes de los datos, de modo que un cambio en su
estructura, o un cambio en el modo en que se almacena en disco, requiere cambios
importantes en los programas cuyos datos se ven afectados.
Sin embargo, los SGBD separan las descripciones de los datos de las aplicaciones. Esto es lo
que se conoce como independencia de datos, gracias a la cual se simplifica el mantenimiento
de las aplicaciones que acceden a la base de datos.
En algunos sistemas de ficheros, si hay varios usuarios que pueden acceder simultáneamente a
un mismo fichero, es posible que el acceso interfiera entre ellos de modo que se pierda
información o se pierda la integridad. La mayoría de los SGBD gestionan el acceso
concurrente a la base de datos y garantizan que no ocurran problemas de este tipo.
4
UNIVERSIDAD DEL QUINDÍO
FACULTAD DE CIENCIAS HUMANAS Y BELLAS ARTES
PROGRAMA DE CIENCIA DE LA INFORMACIÓN Y LA
DOCUMENTACIÓN, BIBLIOTECOLOGÍA Y ARCHIVÍSTICA.
Muchos sistemas de ficheros dejan que sea el usuario quien proporcione las medidas
necesarias para proteger los datos ante fallos en el sistema o en las aplicaciones. Los usuarios
tienen que hacer copias de seguridad cada día, y si se produce algún fallo, utilizar estas copias
para restaurarlos.
En este caso, todo el trabajo realizado sobre los datos desde que se hizo la última copia de
seguridad se pierde y se tiene que volver a realizar. Sin embargo, los SGBD actuales
funcionan de modo que se minimiza la cantidad de trabajo perdido cuando se produce un
fallo.
4.1 Complejidad:
Los SGBD son conjuntos de programas que pueden llegar a ser complejos con una gran
funcionalidad. Es preciso comprender muy bien esta funcionalidad para poder realizar un buen
uso de ellos.
Tanto el SGBD, como la propia base de datos, pueden hacer que sea necesario adquirir más
espacio de almacenamiento. Además, para alcanzar las prestaciones deseadas, es posible que
sea necesario adquirir una máquina más grande o una máquina que se dedique solamente al
SGBD. Todo esto hará que la implantación de un sistema de bases de datos sea más cara.
El hecho de que todo esté centralizado en el SGBD hace que el sistema sea más vulnerable
ante los fallos que puedan producirse. Es por ello que deben tenerse copias de seguridad
(Backup).
5. Tipos de Campos
Cada Sistema de Base de Datos posee tipos de campos que pueden ser similares o diferentes.
Entre los más comunes podemos nombrar:
• Numérico: entre los diferentes tipos de campos numéricos podemos encontrar enteros
“sin decimales” y reales “decimales”.
• Booleanos: poseen dos estados: Verdadero “Si” y Falso “No”.
• Memos: son campos alfanuméricos de longitud ilimitada. Presentan el inconveniente
de no poder ser indexados.
5
UNIVERSIDAD DEL QUINDÍO
FACULTAD DE CIENCIAS HUMANAS Y BELLAS ARTES
PROGRAMA DE CIENCIA DE LA INFORMACIÓN Y LA
DOCUMENTACIÓN, BIBLIOTECOLOGÍA Y ARCHIVÍSTICA.
Entre los diferentes tipos de base de datos, podemos encontrar los siguientes:
• MySql: es una base de datos con licencia GPL basada en un servidor. Se caracteriza
por su rapidez. No es recomendable usar para grandes volúmenes de datos.
•
• PostgreSql y Oracle: Son sistemas de base de datos poderosos. Administra muy bien
grandes cantidades de datos, y suelen ser utilizadas en intranets y sistemas de gran
calibre.
• Access: Es una base de datos desarrollada por Microsoft. Esta base de datos, debe ser
creada bajo el programa access, el cual crea un archivo .mdb con la estructura ya
explicada.
• Microsoft SQL Server: es una base de datos más potente que access desarrollada por
Microsoft. Se utiliza para manejar grandes volúmenes de informaciones.
Hasta hace poco los programadores cuando requerían almacenar información recurrirán a
archivos creados dentro de las aplicaciones y de acuerdo a los requerimientos puntuales
específicos. Cada uno resolvía su problema de acuerdo a su óptica, muchas veces sin pensar
en lo que los demás colegas estaban realizando.
Cuando se requería manipular estos datos se realizaban programas que incluían la definición
en detalle de estos archivos para poder operar sobre estos. Cada programa estaba constituido
por un número considerable de líneas de código (en ocasiones abrumador), para hacer incluso
tareas muy simples como un nuevo reporte, por ejemplo.
6
UNIVERSIDAD DEL QUINDÍO
FACULTAD DE CIENCIAS HUMANAS Y BELLAS ARTES
PROGRAMA DE CIENCIA DE LA INFORMACIÓN Y LA
DOCUMENTACIÓN, BIBLIOTECOLOGÍA Y ARCHIVÍSTICA.
Como los reportes son programados de acuerdo a necesidades del momento, los usuarios
deben usar lo que ya esté y acomodarlos a sus requerimientos actuales o recurrir a solicitar
nuevos programas, inclusive si son pocos los cambios que se quieren (por ejemplo, inclusión
de nuevos campos, realización de sencillos cálculos adicionales, etc.).
Como cada sección realizó sus propios programas, diseñó los archivos y tipos de datos
importantes para estos. Cada cual tenía la parte que le competía.
Cuando se quiere consolidar y agrupar información a nivel empresarial, varios problemas
pueden aparecer: Hay que recolectarla desde diferentes archivos, los formatos en cada uno, a
pesar de referirse a atributos iguales, son disímiles, hay datos que no se encuentran en ningún
archivo y otros más.
A causa de lo anterior aparecen también datos que han sido incluidos en varios archivos, con
características diferentes y peor aun con información que puede no concordar. Esto lleva a
sistemas de información inconsistente que traen como consecuencia una terrible desconfianza
en el sistema.
Cualquier parámetro, regla o restricción debe ser definida en un programa, por lo tanto los
cambios a estas llevan a modificación de aplicaciones y afectan solo aquellos archivos que la
aplicación use.
En los casos que varios usuarios requieran operar una aplicación en concreto (caso típico de
facturación) el programado debe incluir en su software rutinas que permitan manejar el acceso
concurrente a programas y datos y es su responsabilidad los buenos resultados.
7
UNIVERSIDAD DEL QUINDÍO
FACULTAD DE CIENCIAS HUMANAS Y BELLAS ARTES
PROGRAMA DE CIENCIA DE LA INFORMACIÓN Y LA
DOCUMENTACIÓN, BIBLIOTECOLOGÍA Y ARCHIVÍSTICA.
Se entenderá hasta acá, que estos sistemas, sobre todo en organización de tamaño
considerable, no podían soportar (a menos que se definieran esquemas muy rigurosos) las
operaciones y decisiones; que ofrecían un enorme desgaste administrativo y conllevaban
múltiples riesgos.
Los Sistemas de Gestión de Base de Datos (en inglés DataBase Management System) son un
tipo de software muy específico, dedicado a servir de interfaz entre la base de datos, el usuario
y las aplicaciones que la utilizan.
Generalmente nos referimos a los datos de los usuarios y de la organización, que apoyan el
negocio modelado y soportado por el Sistema de Gestión de Bases de Datos. En la etapa de
diseño lógico la arquitectura de los datos es independiente del motor donde se montará
finalmente.
8
UNIVERSIDAD DEL QUINDÍO
FACULTAD DE CIENCIAS HUMANAS Y BELLAS ARTES
PROGRAMA DE CIENCIA DE LA INFORMACIÓN Y LA
DOCUMENTACIÓN, BIBLIOTECOLOGÍA Y ARCHIVÍSTICA.
ofreciendo así una visión abstracta de estos. Para cumplir con tal fin se han definido diferentes
niveles de abstracción:
Nivel Físico. Determina como están almacenados físicamente los datos (pistas, sectores,
cilindros), representa el nivel más bajo.
Nivel Lógico o Conceptual. Determina la organización de los archivos. Índices, llaves, orden
de campos, tipos de datos.
Nivel de Vistas. Oculta parte de la información a los usuarios, es decir hace visible solo una
parte de la base de datos.
Independencia de Datos.
12.1 modelo: Es una representación de la realidad que contiene las características generales de
algo que se va a realizar. En base de datos, esta representación la elaboramos de forma gráfica.
Es una colección de herramientas conceptuales para describir los datos, las relaciones que
existen entre ellos, semántica asociada a los datos y restricciones de consistencia.
Se usan para describir datos en los niveles conceptual y de visión, es decir, con este modelo
representamos los datos de tal forma como nosotros los captamos en el mundo real, tienen una
capacidad de estructuración bastante flexible y permiten especificar restricciones de datos
explícitamente.
Existen diferentes modelos de este tipo, pero el más utilizado por su sencillez y eficiencia es el
modelo Entidad-Relación.
9
UNIVERSIDAD DEL QUINDÍO
FACULTAD DE CIENCIAS HUMANAS Y BELLAS ARTES
PROGRAMA DE CIENCIA DE LA INFORMACIÓN Y LA
DOCUMENTACIÓN, BIBLIOTECOLOGÍA Y ARCHIVÍSTICA.
• Modelo Entidad-Relación
• Modelo Orientado a Objetos
• Modelo de Datos Semántico
Tangibles :
Son todos aquellos objetos físicos que podemos ver,
tocar o sentir.
Intangibles:
Todos aquellos eventos u objetos conceptuales que no
podemos ver, aun sabiendo que existen, por ejemplo:
la entidad materia, sabemos que existe, sin embargo, no la
podemos visualizar o tocar.
Las características de las entidades en base de datos se llaman atributos, por ejemplo el
nombre, dirección teléfono, grado, grupo, etc. son atributos de la entidad alumno; Clave,
número de seguro social, departamento, etc., son atributos de la entidad empleado. A su vez
una entidad se puede asociar o relacionar con más entidades a través de relaciones.
Consideremos una empresa que requiere controlar a los vendedores y las ventas que ellos
realizan; de este problema determinamos que los objetos o entidades principales a estudiar son
el empleado (vendedor) y el artículo (que es el producto en venta), y las características que los
identifican son:
Empleado: Artículo:
Nombre Descripción
Puesto Costo
Salario Clave
R.F.C.
Bueno, ahora nos falta describir como se representa un modelo E-R gráficamente, la
representación es muy sencilla, se emplean símbolos, los cuales son:
10
UNIVERSIDAD DEL QUINDÍO
FACULTAD DE CIENCIAS HUMANAS Y BELLAS ARTES
PROGRAMA DE CIENCIA DE LA INFORMACIÓN Y LA
DOCUMENTACIÓN, BIBLIOTECOLOGÍA Y ARCHIVÍSTICA.
Símbolo Representa
Existen más aspectos a considerar con respecto a los modelos entidad relación, estos serán
considerados en el tema Modelo Entidad Relación.
Modelo Relacional
Modelo de Red
Modelo Jerárquico
11
UNIVERSIDAD DEL QUINDÍO
FACULTAD DE CIENCIAS HUMANAS Y BELLAS ARTES
PROGRAMA DE CIENCIA DE LA INFORMACIÓN Y LA
DOCUMENTACIÓN, BIBLIOTECOLOGÍA Y ARCHIVÍSTICA.
En este modelo se representan los datos y las relaciones entre estos, a través de una colección
de tablas, en las cuales los renglones (tuplas) equivalen a los cada uno de los registros que
contendrá la base de datos y las columnas corresponden a las características(atributos) de cada
registro localizado en la tupla;
Una Base de Datos Relacional es una base de datos en donde todos los datos visibles al
usuario están organizados estrictamente como tablas de valores y en donde todas las
operaciones de la base de datos operan sobre estas tablas (Dr. Codd 1970
Ejemplo;
12
UNIVERSIDAD DEL QUINDÍO
FACULTAD DE CIENCIAS HUMANAS Y BELLAS ARTES
PROGRAMA DE CIENCIA DE LA INFORMACIÓN Y LA
DOCUMENTACIÓN, BIBLIOTECOLOGÍA Y ARCHIVÍSTICA.
Ahora te preguntaras.
Existen dos formas de representarla; pero para ello necesitamos definir que es una llave
primaria: Es un atributo el cual definimos como atributo principal, es una forma única de
identificar a una entidad. Por ejemplo, el RFC de un empleado se distingue de otro por que los
RFC no pueden ser iguales.
Ahora si, las formas de representar las relaciones en este modelo son:
1. Haciendo una tabla que contenga cada una de las llaves primarias de las entidades
involucradas en la relación.
Tomando en cuenta que la llave primaria del empleado es su RFC, y la llave primaria del
articulo es la Clave.
Este modelo representa los datos mediante colecciones de registros y sus relaciones se
representan por medio de ligas o enlaces, los cuales pueden verse como punteros. Los
registros se organizan en un conjunto de gráficas arbitrarias.
1. Ejemplo:
13
UNIVERSIDAD DEL QUINDÍO
FACULTAD DE CIENCIAS HUMANAS Y BELLAS ARTES
PROGRAMA DE CIENCIA DE LA INFORMACIÓN Y LA
DOCUMENTACIÓN, BIBLIOTECOLOGÍA Y ARCHIVÍSTICA.
2. Ejemplo
Es similar al modelo de red en cuanto a las relaciones y datos, ya que estos se representan por
medio de registros y sus ligas o enlaces.
La diferencia radica en que están organizados por conjuntos de árboles en lugar de gráficas
arbitrarias.
1. Ejemplo:
2. Ejemplo
14
UNIVERSIDAD DEL QUINDÍO
FACULTAD DE CIENCIAS HUMANAS Y BELLAS ARTES
PROGRAMA DE CIENCIA DE LA INFORMACIÓN Y LA
DOCUMENTACIÓN, BIBLIOTECOLOGÍA Y ARCHIVÍSTICA.
Modelo unificador
Memoria de elementos.
A diferencia del anterior este tiene estrecha relación con las operaciones que los usuarios
realizan sobre los datos almacenados. Estas operaciones pueden ser: Recuperación o consulta,
inserción, borrado y modificación de los datos.
ENLACE.
http://sistemas.itlp.edu.mx/tutoriales/basedat1/
15
UNIVERSIDAD DEL QUINDÍO
FACULTAD DE CIENCIAS HUMANAS Y BELLAS ARTES
PROGRAMA DE CIENCIA DE LA INFORMACIÓN Y LA
DOCUMENTACIÓN, BIBLIOTECOLOGÍA Y ARCHIVÍSTICA.
16