Você está na página 1de 13

A.

GESTORES DE BASES DE DATOS PARA SOFTWATE LIBRE


Definicin SGBD
Un sistema de gestin de bases de datos (SGBD) es un conjunto de programas
que permiten el almacenamiento, modificacin y extraccin de la informacin
en una base de datos, adems de proporcionar herramientas para aadir,
borrar, modificar y analizar los datos. Los usuarios pueden acceder a la
informacin usando herramientas especficas de interrogacin y de generacin
de informes, o bien mediante aplicaciones al efecto Los SGBD tambin
proporcionan mtodos para mantener la integridad de los datos, para
administrar el acceso de usuarios a los datos y para recuperar la informacin si
el sistema se corrompe. Permite presentar la informacin de la base de datos
en variados formatos. La mayora de los SGBD incluyen un generador de
informes. Tambin puede incluir un mdulo grfico que permita presentar la
informacin con grficos y tablas.
Los sistemas de gestores libres son aquellos que podemos descargar sin tener
que pagar alguna cantidad.


Los anteriormente listados, no son los nicos SGBD; desde el punto de vista
acadmico o comercial, se han desarrollado otros, quizs no tan comunes o
difundidos como los anteriores pero que hacen parte de la gran oferta que se
puede encontrar en la familia del software libre.
PostgreSQL y MySQL son los SGBD de mayor representacin dentro del
mundo de Software Libre, principalmente por su alta integracin con
herramientas de programacin WEB como PHP o JAVA.
Un DBA cul elegira? Bien, para ello se requieren evaluar algunos factores
importantes que involucra el desarrollo de cualquier sistema de informacin,
entre los cuales se tienen:
1. Factores Tcnicos:
Es necesario determinar el tipo de sistema de informacin a construir,
Cliente/Servidor, Distribuido, Data Mining, entre otros.
La Interfaz de usuario a usar.
Tipos de Lenguaje que puede soportar un SGBD.
La disponibilidad de hardware.

2. Factores Econmicos
Costo de licenciamiento
Costo de desarrollo e implementacin
Determinar el costo de capacitacin
Costo de operacin

3. Otros factores:
La seguridad de los datos
Estabilidad
Velocidad
Mecanismos de respaldo
Mecanismos de Control
Cantidad de Peticiones
Mecanismos de seguridad


MYSQL: BASE DE DATOS BASADA EN SOFTWARE LIBRE O (FUENTE
ABIERTA)
PORQU USAR MYSQL SERVER?
MySQL Database Server es muy rpido, confiable y fcil de usar. Si eso es lo
que usted est buscando, debe tenerlo y usarlo. MySQL Server tambin tiene
un prctico set de caractersticas desarrollado en cercana cooperacin con
nuestros usuarios. MySQL Server fue desarrollado inicialmente para manejar
grandes bases de datos mucho ms rpidamente que las soluciones existentes
y ha sido usado exitosamente por muchos aos en ambientes de produccin de
alta demanda. A travs de consta
nte desarrollo, MySQL Server ofrece hoy una rica variedad de funciones. Su
conectividad, velocidad y seguridad hacen a MySQL altamente satisfactorio
para accesar bases de datos en Internet.
CARACTERSTICAS DE MYSQL
Las principales caractersticas de este gestor de bases de datos son las
siguientes: Aprovecha la potencia de sistemas multiprocesador, gracias a su
implementacin multihilo. Soporta gran cantidad de tipos
de datos para las columnas. Dispone de API's en gran cantidad de lenguajes
(C, C++, Java, PHP, etc). Gran portabilidad entre sistemas.Soporta hasta 32
ndices por tabla. Gestin de usuarios y passwords, manteniendo un muy buen
nivel de seguridad en los datos.

B. MODELO ENTIDAD-RELACION
El modelo de entidad relacin es un modelo de datos basado en una
percepcin del mundo real que consiste en un conjunto de objetos bsicos
llamados entidades y relaciones entre estos objetos, implementndose en
forma grfica a travs del Diagrama Entidad-Relacin.
Entidad
Las entidades representan cosas u objetos (ya sean reales o abstractos), que
se diferencian claramente entre s.
Para poder seguir un ejemplo durante el artculo aadir ejemplos sobre un
taller mecnico, donde se podra crear las siguientes entidades:
Coches (objeto fsico): contiene la informacin de cada taller.
Empleado (objeto fsico): informacin de los trabajadores.
Cargo del empleado (cosa abstracta): informacin de la funcin del
empleado.
Estas entidades se representan en un diagrama con unos rectngulos, como
los siguientes.

Atributos
Los atributos definen o identifican las caractersticas de entidad. Cada entidad
contiene distintos atributos, que dan informacin sobre la entidad. Estos
atributos pueden ser de distintos tipos (numricos, texto, fecha).
Siguiendo el ejemplo de antes podemos analizar los atributos de nuestra
entidad Coches, que nos darn informacin sobre los coches de nuestro
supuesto taller.

Relacin
Es un vnculo que nos permite definir una dependencia entre varias entidades,
es decir, nos permite exigir que varias entidades compartan ciertos atributos de
forma indispensable.
Por ejemplo, los empleados del taller (de la entidad Empleados) tienen un
cargo (segn la entidad Cargo del empleado). Es decir, un atributo de la
entidad Empleadosespecificar que cargo tiene en el taller, y tiene que ser
idntico al que ya existe en la entidad Cargo del empleado.
Las relaciones se muestran en los diagramas como rombos, que se unen a las
entidades mediante lneas.

Relaciones de cordialidad
Podemos encontrar distintos tipos de relaciones segn como participen en ellas
las entidades. Es decir, en el caso anterior cada empleado puede tener un
cargo, pero un mismo cargo lo pueden compartir varios empleados.
Esto complementa a las representaciones de las relaciones, mediante un
intervalo en cada extremo de la relacin que especifica
cuantos objetos o cosas (de cada entidad) pueden intervenir en esa relacin.
Uno a uno: Una entidad se relaciona nicamente con otra y viceversa. Por
ejemplo, si tuvisemos una entidad con distintos chasis y otra con matrculas
deberamos de determinar que cada chasis solo puede tener una matrcula (y
cada matrcula un chasis, ni ms en ningn caso).

Uno a varios o varios a uno: determina que un registro de una entidad puede
estar relacionado con varios de otra entidad, pero en esta entidad existir solo
una vez. Como ha sido en el caso anterior del trabajador del taller.

Varios a varios: determina que una entidad puede relacionarse con otra con
ninguno o varios registros y viceversa. Por ejemplo, en el taller un coche puede
ser reparado por varios mecnicos distintos y esos mecnicos pueden reparar
varios coches distintos.

Los indicadores numricos indican el primero el nmero mnimo de registros en
una relacin y posteriormente el mximo (si no hay lmite se representa con
una n).

Claves
Es el atributo de una entidad, al que le aplicamos una restriccin que lo
distingue de los dems registros (no permitiendo que el atributo especfico se
repita en la entidad) o le aplica un vnculo (exactamente como comentbamos
en las relaciones). Estos son los distintos tipos:
Superclave: aplica una clave o restriccin a varios atributos de la entidad, para
as asegurarse que en su conjunto no se repitan varias veces y as no poder
entrar en dudas al querer identificar un registro.
Clave primaria: identifica inequvocamente un solo atributo no permitiendo que
se repita en la misma entidad. Como sera la matrcula o el nmero de chasis
de un coche (no puede existir dos veces el mismo).
Clave externa o clave fornea: este campo tiene que estar estrictamente
relacionado con la clave primaria de otra entidad, para as exigir que exista
previamente ese clave. Anteriormente hemos hablado de ello cuando
comentbamos que un empleado indispensablemente tiene que tener un cargo
(que lo hemos representado numricamente), por lo cual si intentsemos darle
un cargo inexistente el gestor de bases de datos nos devolvera un error.

EJEMPLOS
1. Aerolnea


2. Aparatos Electrnicos


C. IMPORTANCIA DE LA NORMALIZACION

El proceso de normalizacin de bases de datos consiste en aplicar una serie de
reglas a las relaciones obtenidas tras el paso del modelo entidad-relacin al
modelo relacional.

La normalizacin de base de datos es importante porque al tener una base de
datos con mucha informacin es necesario tener un buen orden para evitar
problemas de repeticiones de datos, para que el al momento de buscar
informacin sobre la base no se nos presenten errores que puedan afectar la
informacin que obtengamos de ella, tambin en ella nos damos cuenta con
que atributos podemos conocer los dems.

La normalizacin persigue fundamentalmente tres objetivos:
Simplificacin: Se trata de reducir los modelos quedndose nicamente con los
ms necesarios.
Unificacin: Para permitir la intercambiabilidad a nivel internacional.
Especificacin: Se persigue evitar errores de identificacin creando un lenguaje
claro y preciso.


Normalizacin y diagramas entidadrelacin
El diseo conceptual de la base de datos describe la manera en que se agrupar
n los elementos en la base de datos. El proceso de diseo identifica las re
laciones entre los elementos de datos y la manera ms eficiente de
agruparlos para que cumplan los requerimientos de informacin de la em
presa. El proceso tambin identifica los elementos de datos redundantes y
las agrupaciones de elementos de datos requeridos por programas de
aplicacinespecficos. Los grupos de datos se organizan, refinan y simplifican
hasta que surge una vista lgica general de las relaciones entre todos los elem
entos de datos en la base de datos. Para utilizar de manera efectiva un modelo
de base de datos relacional, es necesario simplificar las agrupaciones compleja
de datos para minimizar elementos de datos redundantes y complicadas relacio
nes muchos a muchos. El proceso para crear estructuras de datos pequeas,
estables, aunque flexibles y adaptables a partir de grupos complejos de datos
sedenomina normalizacin. En el negocio especfico que se modela aqu, un p
edido puede contener ms de una parte, pero cada parte la surte solamente un
proveedor. Si construyramos una relacin llamada PEDIDO con todos los
campos incluidos aqu, tendramos que repetir el nombre y la direccin del prov
eedor de cada parte del pedido, aun cuando el pedido contenga partes de un pr
oveedor individual. Esta relacin contiene lo que se llama grupos de datos repe
titivos porque un solo pedido puede contener una gran cantidad de partes de u
n proveedor en particular. Una manera ms eficiente de ordenar los datos es di
vidir PEDIDO en relaciones ms pequeas, cada una de las cuales describe a
una sola entidad. Si vamos paso a paso y normalizamos la relacin PEDIDO, el
resultado son las relaciones. Losdiagramas entidadrelacin y el diseo de bas
es de datos.





D. DATAWAREHOUSE O ALMACENAMIENTO DE DATOS

Un almacn de datos es una base de datos que almacena datos actuales e
histricosde potencial inters para los encargados de la toma de decisiones de
toda la empresa. Los datos se originan en muchos sistemas de transacciones o
perativas esenciales, como los sistemas de ventas, cuentas de clientes y manuf
actura, y podran incluir datos derivados de transacciones en sitios Web. El alm
acn de datos consolida y estandariza informacin de diferentes bases de
datosoperativas con el propsito de que la informacin se pueda utilizar
atraves de la empresa para el anlisis y la toma de decisiones por parte de la a
dministracin.

El almacn de datos pone los datos a disposicin de quien los necesite, pero
no se pueden modificar. Un sistema de almacn de datos tambin proporciona
una variedad de herramientas de consultas con fines especficos y estan
darizadas, herramientas analticas y caractersticas grficas para la
elaboracin de
informes. Muchas empresas utilizan portales de intranets para poner la informa
cin de los almacenes de datos a disposicin de toda la empresa.

E. DATA MINNING O MERCADOS DE DATOS
Con frecuencia, las compaas construyen almacenes de datos a nivel general
de la empresa, en los que un almacn de datos central abastece a toda la
organizacin, o crean almacenes descentralizados ms pequeos llamados de
datos. Un mercado de datos es un subconjunto de un almacn de datos en el
que una parte resumida o altamente enfocada de los datos de la organizacin
se coloca en una base de datos separada para una poblacin especfica de
usuarios. Por ejemplo, una compaa puede desarrollar mercado de datos de
marketing y ventas para manejar la informacin de los clientes. Por lo comn,
un mercado de datos se enfoca en una sola rea objetivo o lnea de negocios,
por lo que usualmente se puede construir mas rpido y aun costo ms bajo que
un almacn de datos a nivel de toda le empresa.





El almacn de datos extrae datos actuales e histricos de mltiples sistemas
operativos dentro de la organizacin. Estos datos se combinada con datos
fuentes externas y se reorganizan en una base de datos central diseada para
elaborar informes y anlisis para la administracin. El directorio de informacin
suministra informacin a los usuarios acerca de los datos disponibles en el
almacn de datos.


F. DATA MART O MINERIA DE DATOS
Las consultas de bases de datos tradicionales responden preguntas como
Cuntas unidades del producto nmero 403 se embarcaron en febrero del
20010? OLAP, o anlisis multidimensional, soporta solicitudes de informacin
Mucho ms complejas, como "Comparar las ventas del producto 403 respecto
de lo planeado, por trimestre y regin de ventas, de los dos aos anteriores.
Con OLAP y el anlisis de datos orientado a consultas, los usuarios necesitan
tener una buena idea sobre la informacin que estn buscando.
La minera de datos est ms orientada al descubrimiento de informacin. La
minera de datos proporciona conocimientos acerca de los datos corporativos
que no se podran obtener con OLAP, al encontrar patrones y relaciones
ocultas en robustas bases de datos e infiriendo reglas a partir de ellos para pre
decir el comportamiento futuro. Los patrones y las reglas se utilizan para orient
ar r la toma de decisiones y predecir el efecto de tales decisiones. Los tipos de
informacin que se pueden obtener a partir de la minera de datos incluyen
asociaciones, secuencias, clasificaciones, agrupaciones y pronsticos.

1. Las asociaciones son ocurrencias enlazadas a un solo evento. Por ejemplo,
un estudio de los patrones de compras de un supermercado podra revelar
que cuando se compran hojuelas de maz tambin se compra, en 65 por
ciento de las veces, una bebida de cola, pero cuando hay alguna promocin
se compra una bebida de cola en 85 por ciento de las veces- Esta
informacin ayuda a los gerentes a tomar mejores decisiones porque se han
dado cuenta de la rentabilidad de las promociones.
2. En las secuencias, los eventos se enlazan con el paso del tiempo. Por
ejemplo, podramos encontrar que si se compra una casa, 65 por ciento de
las veces se comprara un nuevo refrigerador dentro de las siguientes dos
semanas, y que al mes de la compra de la casa habr un 45 por ciento de
veces en que se comprara un horno.
3. La clasificacin reconoce patrones que describen el grupo al cual pertenece
un elemento por medio del anlisis de eso elementos existentes que se han
clasificado y por medio de la inferencia de un conjunto de reglas. Por
ejemplo, las empresas de tarjetas de crdito o las telefnicas se preocupan
por la prdida de clientes permanentes. La clasificacin ayuda a descubrir
las caractersticas de los clientes que se podran perder y puede aportar un
modelo para ayudar a los gerentes a predecir quienes son estos clientes e
idear campaas especiales para retenerlos.
4. El agrupamiento funciona de una manera semejante a la clasificacin
cuando an no se han definido grupos. Una herramienta de minera de
datos puede descubrir diferentes agrupamientos dentro de los datos, como
encontrar grupos de afinidad para tarjetas bancarias o particionar una base
de datos en grupos de clientes por sus caractersticas demogrficas y el tipo
de sus inversiones personales.
5. Aunque estas aplicaciones incluyen predicciones, la generacin de
pronsticos utiliza las predicciones de una manera distinta. Emplea una
serie de valores existentes para pronosticar que otros valores habr. Por
ejemplo, la elaboracin de pronsticos podra encontrar patrones en los
datos para ayudar a los gerentes a estimar el valor futuro de variables
continuas, como cifras de ventas.

La minera de datos es una herramienta poderosa y rentable, pero
plantea riesgos para la proteccin de la privacidad individual.
La tecnologa de minera de datos puede combinar informacin de muchas fuen
tes diversas para crear una "imagen de datos" detallada sobre cada uno de nos
otros nuestros ingresos, nuestros hbitos de conducir, nuestras aficiones, nuest
ras familias y nuestros intereses polticos. La Sesin Interactiva sobre
Organizaciones explora el debate acerca de si las grandes bases de datos que
almacenan perfiles de ADN utilizados en la lucha contra el crimen representan
una amenaza a la privacidad y al bienestar social.

Bajo todos estos conceptos mencionados deriva el concepto de inteligencia de
negocios.

INTELIGENCIA DE NEGOCIOS, ANLISIS DE DATOS MULTINACIONALES

Una vez que se han capturado y organizado los datos en almacenes de datos y
en mercados de datos, estn a disposicin para anlisis ms profundos. Una s
erie de herramientas permite a los usuarios analizar estos datos para descubrir
nuevos patrones, relaciones y conocimientos profundos para orientar la
tomade decisiones. Estas herramientas para consolidar, analizar y dar acceso
a extensas cantidades de datos para ayudar a los usuarios a tomar mejoresdec
isiones de negocios con frecuencia se denominan inteligencia de negocios (BI).
Las principales herramientas para la inteligencia de negocios incluyen software
para consultas e informes de bases de datos, herramientas para anlisis de dat
os multidimensionales (procesamiento analtico en lnea) y minera de datos.
Cuando pensamos en la inteligencia como se aplica a los humanos, por lo
genral, pensamos en la capacidad de la gente para combinar el conocimiento a
prendido con nueva informacin y cambiar comportamientos con la idea de
alcanzar el xito en su actividad o adaptarse a una nueva situacin. De manera
similar, la inteligencia de negocios da a las empresas la capacidad de acum
ular informacin; desarrollar conocimiento sobre clientes, competidores y
operaciones internas, y cambiar la manera de tomar decisiones para lograr una
rentabilidad ms alta y otras metas de negocios.









Procesamiento analtico en lnea (OLAP)
Suponga que su empresa vende cuatro diferentes productos tuercas, pernos, a
randelas y tornillosen las regiones Este, Oeste y Central. Si usted quisiera
haceruna pregunta bastante directa, como la cantidad de arandelas vendidas d
urante el trimestre pasado, podra encontrar fcilmente la respuesta consultand
o su base de datos de ventas.

Pero qu pasara si quisiera saber la cantidad de arandelas vendidas en cada
una de sus regiones de ventas y comparar los resultados reales con las ventas
proyectadas?
Para obtener la respuesta, usted necesitara el procesamiento analtico en lnea
(OLAP). OLAP soporta el anlisis de datos multidimensionales, el cual permite
a los usuarios ver los mismos datos en diferentes formas utilizando mltiples
dimensiones. Cada aspecto de la informacinproducto, precio, costo, regin o p
eriodo representa una dimensin diferente. As, un gerente de producto po
dra utilizar una herramienta de anlisis de datos multidimensionales para s
aber cuntas arandelas se vendieron durante junio en el Este, como se va a
compraresto con el mes anterior y con el mismo mes del ao pasado, y cmo s
e compara con el pronstico de ventas. OLAP permite a los usuarios obtener re
spuestas en lnea a preguntas especficas como las anteriores en un lapaso de
tiempo sumamente
rpido, aun cuando los datos estn almacenados en bases de datos bastante g
randes, como las cifras de ventas de varios aos.



La vista que se muestra es producto contra regin. Si usted gira 90 grados el
cubo, la cara que se mostrara es producto contra ventas reales y proyectadas.
Si lo vuelve a girar, tendr una vista de la regin contra ventas reales y proyect
adas. Se pueden tener otras vistas.

Actualmente en Guatemala de las empresas que trabajan bajo este proceso no
conozco bien pero si se que del estado esta SAT ya que actualmente estn
implementando un Almacenamiento de datos para la recaudacin de los
impuestos, y poder utilizar e cubo de informacin para las diferentes
intendencias y hacer mejores en sus procesos.