Escolar Documentos
Profissional Documentos
Cultura Documentos
organización: tecnologías
para la administración de los
datos
Capítulo 8
El valor de los datos en la organización
• Existen dos tipos de archivos • Para entender el enfoque de
almacenamiento y recuperación,
se presentan varios problemas:
Secuenciales
• Los registros se almacenan en una Dependencia de datos programa
secuencia que depende de algún
criterio definido.
Redundancia de datos
Directos
• Permiten el acceso a un registro de
Seguridad de datos
información sin tener que buscar en
cada uno de los registros del archivo.
Integridad de datos
Base de datos
• Una base de satos es una colección de datos con estas características:
Es un conjunto de datos correlacionados.
• el programador de aplicaciones
Usuarios • el usuario final y
• el administrador de la base de datos
Sistema manejador de bases de datos
DBMS
Modelo de red
• Permite la representación múltiple, de tal forma que con cualquier registro de la base de
datos puede tener varias ocurrencias superiores a él.
Modelo relacional
• Toda la información se representa a través de arreglos bidimensionales o tablas.
datos)
Data warehouse
Data marts
Base de datos distribuidas
Modelode red
modelodedatospermite la representaciénmtlltiple, de tal forma que cualquierregistroden
Este
trodela basede datos puede tener varias ocurrencias superiores a él. No olvidemos que esta era
unadelasprincipales limitantes del modelo jerarquico de representacion de datos y que la infop
maciénde cadauno de los alumnos se repetia para cada uno de los maestros.
A pesarde que las desventajas descritas en el modelo jerarquico desaparecencon el disefro de
red,la mayor parte de la complejidad y los problemas de este modelo surgen debido a la diflcultad
enelmanejode las conexiones o ligas entre los registros y sus correspondientes registros conec»
tores.
Susprincipales desventajas residen en la dificultad de crear y dar mantenimiento a la base de
datos.
Modelorelacional
I)ara de informacionde unabasede datos,el modelorelacionalseestaemplean»
larepresentacién
cl0conmasfrecuencia,debido a las ventajasque ofrecesobrelos dos modelosanteriores,por
el
elemplo rapido entendimierito por parte de usuarios que no tienen conocimientos profundos
sObre
sistemas de bases de datos.
En estemodelo toda la informacion se representa a través de arreglos bidimensionales o ta~
blas. elusuariodelasbases
For10general, tieneconocimientos
dedatosrelacionales delastablas
(lueestandefinidas,y su interaccion con la informacion contenida en la base de datos se reduce a
Operaciones
logicasque se efectrlan con las diferentestablas.Estas basicas
operaciones son:
El modulodefiniciondedatos seutilizaparadescribirtodaslasestructuras
deinformacién
y los programasque se usanpara construir,actualizare introducir la informaciénquecontiene
una basede datos.Estecomponentecontieneun diccionario de datosque seusaparaalmacenary
crear las definiciones de los datos, incluyendo localizacion, forma en que se almacenany algunas
otras caracteristicas. Este elemento debe permitir describir los datos y las estructuras de los archi~
vos del sistema, especificando la forma en que seran agrupados. Una vez que se ha elaboradola
definicion de la basede datos, el DBMS se encargade construir y generar las estructurasde infor
macion de manera automatica.
SistemaManejader de Bases
de Dates (DBMS)
3. Permitegeneraraplicaciones (programas).
4. Hacelasfunciones de control, seguridad de usuariosy datos.
a» 8
Capitulo valor
El de datos
los enlaorganizacion
Componentes principales de un SI
con integracién de base de datos
Un SI con integracionde basede datostiene cuatro componentesprincipales:datos,hardware
software y usuarios.A continuacicm,describiremos de manera breve cada uno de ellos:
Datos
Son la basepropiamente dicha. Seconstituye con datos almacenadosy utilizados por los sistemas
de una organizacion'en particular.
Hardware 0 equipo
Se refiere a los dispositivos de almacenamiento donde reside la base de datos.
Software 0 programa
Esta constituido por un conjunto de programas que se conoce como SistemaManejadordeBases
de Datos (DBMS, por sus siglas en inglés). Este sistema maneja todas las solicitudes formuladas
por los usuarios a la base de datos.
Usuarios
lntegridad de datos
Implicaque si en la situacion cementada en el parrafe anterior, per ejemplo el area Compras came
biala descripcion de un producto, 0 per error una o mas letras de dicha descripcién sin hacer lo
mismosobreel archive del Almacén, provocara una falta de integridad de los datos y generarare
pertes erréneos.
Bases de datos
Sitemamescome referencia la imagen de una base de datos, la definiremos come una serie de cla~
tesorganizadesy relacionados entre si, los cuales son recelectades y expletados por los SI de una
e
empresa negocio en particular. Una base de datos es también una celeccien de datos con estas
caracteristicas:es un conjunto de datos correlacionados; esta construida para un propesito espe-
cifico;tiene algunos uses de intereses especial para ciertas persenas; representa un aspecto del
mundereal, per lo que los cambios en ese aspecto deben ser reflejados en la base de datos; los da~
tosson almacenades de tal ferma que son independientes de los pregramas que los usan.
Las basesde datos proporcionan la infraestructura requerida por los Sistemasde Apoyo a la
TomadeDecisionesy para los SIE, ya que estes sistemasexpletan 1ainformacion de las basesde
datosdela erganizacien, para apeyar el precese de toma de decisiones0 para lograr ventajascom~
petitivas.Per este motive es importante cenocer come estan estructuradas las bases de datos y su
maneje.
Les Sistemas Transaccionales o los SIS son los encargados de recelectar la infermacien que
centendra la base de datos, per medio de las funciones de creacion, bajas o modificacien de la in~
La forma de operar de estossistemaspuedeserbatch0 en linea,lo cualdependede la
fOrmacion.
inaneraen que se actualice la informacion de la base de datos. La infermacien recelectada per los,
Sistemas e por los SIS es explotadapor los Sistemasde Apoyo a la Tomade De-
Transaccionales
e per los mismos SIS, que preporcienan funciones de actualizacion de la infermacion en
ciSiOnes,
lines
A partir de la definicien de la base de datos, se entiende el concepto datos organizados come
deinformacien; per ejemplo,los pacientesde un hospitalles clientes,losproductes
unidades
losempleados,las materiasprimas,etc.,sen unidadesde informacionquesedenomi-
terminados,
nanentidades.
' ~- "
mi. aim. "v imam
82 1 8
CapituloEl de
valor los en
datos laorganizacién
Archivos convencionales
El uso de SI por parte de las organizacionesrequiere e1almacenamiento de grandescantidades (lg
informacién, ya seapara el uso del sistema, para generar resultados, 0 para compartirla conOtl'Og
sistemas. Actualmente, las organizaciones utilizan bases de datos para satisfacer estos requerii
mientos, sin embargo, los principales componentes de las bases de datos son los archivos,pork)
es
que importante conocer la forma en que estos estan organizados.
Como ya comentamos, un archivo esta formado por un conjunto de registros. A su vezcada
registro esta compuesto por campos, cada campo esta constituido por caracteres 0 bytes y cada
caracter consta generalmente de ocho bits. Por ejemplo, si en un archivo se almacenae1nombrey
departamento de cada uno de los empleados de una empresa, para cada empleado se utiliza unre.
gistro, el cual esta formado por dos campos: nombre y departamentof Cada campo estécom~
puesto por caracteres; por ejemplo, si el nombre es David, ello implica cinco caracteres si
y e1dc.
partamento es Sistemas, ocho caracteres. Cada uno de estos representa un byte de informacién
compuesto por ocho bits que indican su representacicm binaria.
Existen dos tipos de archivos: secuencialesy directos. En los primeros los registros estana1»
macenados en una secuencia que depende de algtm criterio definido. Por ejemplo, puedenalma-
Cenarselos registros de los empleados de la empresa de manera secuencial de acuerdo con el de
partamento a1que pertenecen o a su antigiiedad.
El uso de archivos secuenciales presenta algunas desventajas en el proceso de actualizacién,
consulta o registro de informacién, cuando se maneja un gran volumen de datos. Por ejemplo,si
se desearegistrar un nuevo empleado segtin e1departamento en el que laborara, es necesariobus
car uno por uno en los registros hasta encontrar 1aposicién en la cual debe agregarse1ainforma'
cién del nuevo empleado. Si se desea consultar o modificar informacién, también es necesario
localizar en cada uno de los registros hasta encontrarla. Si hay demasiados registros, esteproceso
puede ser muy lento.
El segundo tipo de archivos son los directos, con los cuales se eliminan las desventajasde105
archivos secuenciales,ya que su manejo es mas flexible. Los archivos directos permiten accedera
un registro de informacién sin tener que buscar uno a uno por todos los registros del archive,uti'
lizando una llave de accesodentro de este.Por ejemplo, si se desea actualizar e1registro deinfor'
31
Davidy como[laveseutiliza su nombre,esposiblellegardirectamente
maciéndelempleado
lugar donde se encuentra.
Sin embargo,esnecesarioentender que el enfoque de almacenamiento y recuperaciéndeda
tos convencional presenta varios problemas, solucionados por las bases de datos, los cualesmen
cionamosa continuacién:dependencia
dedatosprograma,alta redundanciadedatos,seguridad)
pocaintegridadde los mismos.
Redundancia de datos
La de
redundancia datos
sepresenta cuandoexisten datosquesonutilizadospor diferentes
depaf
de
tamentos unaempresa.Asi, por ejemplo,las areasde Comprasy Aimacén tienen61m1st
Data warehouse 91
de
herramientas
Las mineriadedatossonmuypoderosas
pararealizaranalisis
sofisticados
en
y
patronestendencias
que usarse
pueden endistintas
areas
dela empresa.
Data marts
Datamarts esbasicamente un pequefnodata warehouse creadoparaunadeterminadacantidadde
de
usuarios un areade una En
empresaespecifica. otraspalabras,setrata deun subconjuntodeun
almacénde datos para un propésito especifico.Un data mart tiene como funcién ser soportede
los DSS.
Algunas de las interrogantes que deben solucionarse cuando 1aempresa cuenta con tecnolo-
de
gia apoyo, como el data warehouse y el data mart, son las siguientes:gquiénes son mis mejores
se
clientes?,gdénde ubican?,gquécompran?,gqué los caracteriza?,gcualeslineas de productos son
lasmas rentables?,gquéproductos son mis 10 mejores?,aqué productos son mis 10 peores?,gqué
productos son los mas vendidos este mes?, gcémo van mis avances respecto a lo planificado?,
adonde se concentra 80% de mis ventas?, etcétera.
.ra
Ii-
58
M 8
CapituloEl
valor
de datos
los enlaorganizacién
La minerra de datos busca descubrir informacion en los almacenes de datos. La informacion que?
puede obtener es la siguiente:
Asociaciones Eventos que ocurren vinculados a un solo evento, por ejemplo, la compra de un pro-
ducto A esta asociada a un dia de la semana en que hay promociones.
Secuencias Aqui se descubre que un evento A se hace comlinmente después de un evento Y.
Agrupamlento La minen'acrea grupos similares en el patron de los datos, por ejemplO, crear gr UPOS
perfiles de personas con base en el consumo en un restaurante.
Clasrficaaon Aquase identifican
patronesque enlazanlos datos con de
caracteristicas otros ele
mentos definidos, por ejemplo, una empresa puede clasificar sus clientes en leales
revssando consumes de los mismos.
Data warehouse
, Atendery servir como punto de enlace entre los usuarios de la organizacion, asegurando que
las necesidades de informacion de los diferentes usuarios se encuentren contenidas en las
basesde datos corporativas.
o Defmirestandaresy procedimientos para respaldar y recuperar la informacién que contienen
las basesde datos.
. Proporcionar asesoria técnica a analistas y programadores que se encuentran desarrollandd
aplicacionesque crean y acceden las bases de datos.
de
Bases datos distribuidas
organizaciones
Muchas que se encuentran en distintos puntos geogréficosrequieren el uso corn!
de
partido la informacion.
Paraello puedenutilizarse de
bases datos las
distribuidas, cuales
no 65'
ténalmacenadas totalrnente en un solo lugar fisico y se comunican por medio de enlacesde (:0:
municaciones, a través de una red de computadoras distribuidas geograficamente.
Losprincipalesproblemas generadospor el uso de la tecnologia de basesde datos distribuidas
serelacionancon la duplicidad de datos y su integridad en el momento de realizar actualizaciones
alosmismos.Ademas, el control de la informacion puede constituir una desventaja,debido a que
seencuentradiseminada en diferentes localidades geograficas.
Existendos modalidades para crear basesde datos distribuidas. Una alternativa esfragmentar
la basede datos y la otra es hacer una copia de ella. La fragmentacion consiste en instalar en cada
computadora solo la parte de la base de datos que se usara con mas frecuencia en la zona geogra-
lica,mientras que el resto de los datos deberan ser transportados por la red de comunicacion en
casode ser necesario. La copia de la base de datos es total y se instala en cada una de las compu-
tadorasde la organizacién.
Data warehouse
W. H. Inmon, un data warehousees un conjunto de datos integrados orientados hacia una
Segfm
materia,que varian con el tiempo y que no son transitorios, los cuales apoyan el proceso de toma
dedecisiones
de una administracién. Es una arquitectura de informacién con fmes de apoyo a1
de toma de decisiones estratégicas, que se separan de los sistemas operativos y de produc~
Proceso
cién con el fin de no interferir con ellos.
En otras palabras, un data warehousing (almacén de datos) es el almacenamiento de datos con
fineS de al
estratégicosnegocio,conceptomuyopuesto objetivo de lasbasesdedatos
Operativas
8 importancia
resideen quesonfuentede materiaprimaselectaenlosSistemas
deApoyoa la
TomadeDecisiones(DSS).
Lasprincipales caracteristicas del data warehouse son:
' Son datos orientados hacia cliente, en vez de
organizados entidades, por ejemplo: producto,
estar orientados hacia el proceso.
Secrean y disenan fuera de las bases de datos operacionales.
' Unavez
que los datos son almacenados, éstos no cambian y el almacén de datos puede teneh
un tiempo de Vida de cinco a 10 aflos.
' Normalmente las unicas
operaciones sobre la base de datos se reducen a capture de datos y
acceso de los mismos.
$
W 8 El
CNpitulo valor
de los en
datos laorganizacién
La consulta consiste en desplegar el nombre de todos los maestros que imparten clasesal
alummo
Q0 las tablas:
E
<
3
A continuacién, llevaremos a cabo la secuencia siguiente;
a
IOIN Auxl and Maestro OVER M# GIVING Aux2
E
Pinalmente:
E
trar componentesmultimedia que se usan en las aplicaciones de la web, con 10 cual sehandes
arrolladoproductoscomercialesque son DBMS hlbridos, es decir, DBMS relacional orientadoa
objetos.