Você está na página 1de 6

DATOS: Son los hechos que describen sucesos y entidades.

"Datos" es una palabra


en plural que se refiere a más de un hecho. A un hecho simple se le denomina
"data-ítem" o elemento de dato.
INFORMACIÓN: Es un conjunto organizado de datos, que constituye un mensaje sobre un cierto fenómeno o ente. La
información permite resolver problemas y tomar decisiones, ya que su uso racional es la base del conocimiento.
REPOSITORIO DE BDD: Es un término utilizado en el dominio de las herramientas CASE. El repositorio podría
definirse como la base de datos fundamental para el diseño; no sólo guarda datos, sino también algoritmos de diseño
y, en general, elementos software necesarios para el trabajo de programación.
BASE DE DATOS: Conjunto de información almacenada en memoria auxiliar que permite acceso directo y un
conjunto de programas que manipulan esos datos.
Características: Independencia lógica y física de los datos. / Redundancia mínima. / Acceso concurrente por parte de
múltiples usuarios. / Integridad de los datos / Consultas complejas optimizadas. / Seguridad de acceso y auditoría. /
Respaldo y recuperación. / Acceso a través de lenguajes de programación estándar.
Sistema de Gestión de Base de Datos (SGBD): son un tipo de software muy específico, dedicado a servir de interfaz
entre la base de datos, el usuario y las aplicaciones que la utilizan. Se compone de un lenguaje de definición
de datos, de un lenguaje de manipulación de datos y de un lenguaje de consulta.
Ventajas de las bases de datos:
Control sobre la redundancia de datos: Los sistemas de ficheros almacenan varias copias de los mismos datos en
ficheros distintos. Esto hace q se desperdicie espacio de almacenamiento, además de provocar la falta de
consistencia de datos. En los sistemas de bases de datos todos estos ficheros están integrados, por lo que no
se almacenan varias copias de los mismos datos. Sin embargo, en una base de datos no se puede eliminar la
redundancia completamente, ya que en ocasiones es necesaria para modelar las relaciones entre los datos.
Consistencia de datos: Eliminando o controlando las redundancias de datos se reduce en gran medida el riesgo de
que haya inconsistencias. Si un dato está almacenado una sola vez, cualquier actualización se debe realizar
sólo una vez, y está disponible para todos los usuarios. Si un dato está duplicado y el sistema conoce esta
redundancia, el propio sistema puede encargarse de garantizar que todas las copias se mantienen
consistentes.
Compartición de datos: En los sistemas de ficheros, los ficheros pertenecen a las personas o a los departamentos
que los utilizan. Pero en los sistemas de bases de datos, la base de datos pertenece a la empresa y puede ser
compartida por todos los usuarios que estén autorizados.
Mantenimiento de estándares: Estos estándares pueden establecerse sobre el formato de los datos para facilitar su
intercambio, pueden ser estándares de documentación, procedimientos de actualización y también reglas de
acceso.
Mejora en la integridad de datos: La integridad de la base de datos se refiere a la validez y la consistencia de los
datos almacenados. Normalmente, la integridad se expresa mediante restricciones o reglas que no se pueden
violar. Estas restricciones se pueden aplicar tanto a los datos, como a sus relaciones, y es el SGBD quien se
debe encargar de mantenerlas.
Mejora en la seguridad: La seguridad de la base de datos es la protección de la base de datos frente a usuarios no
autorizados. Sin unas buenas medidas de seguridad, la integración de datos en los sistemas de bases de
datos hace que éstos sean más vulnerables que en los sistemas de ficheros.
Mejora en la accesibilidad a los datos: Muchos SGBD proporcionan lenguajes de consultas o generadores de
informes que permiten al usuario hacer cualquier tipo de consulta sobre los datos, sin que sea necesario que
un programador escriba una aplicación que realice tal tarea.
Mejora en la productividad: El SGBD proporciona muchas de las funciones estándar que el programador necesita
escribir en un sistema de ficheros. A nivel básico, el SGBD proporciona todas las rutinas de manejo de ficheros
típicas de los programas de aplicación.
Mejora en el mantenimiento: En los sistemas de ficheros, las descripciones de los datos se encuentran inmersas en
los programas de aplicación que los manejan. Esto hace que los programas sean dependientes de los datos,
de modo que un cambio en su estructura, o un cambio en el modo en que se almacena en disco, requiere
cambios importantes en los programas cuyos datos se ven afectados.
Aumento de la concurrencia: En algunos sistemas de ficheros, si hay varios usuarios que pueden acceder
simultáneamente a un mismo fichero, es posible que el acceso interfiera entre ellos de modo que se pierda
información o se pierda la integridad. La mayoría de los SGBD gestionan el acceso concurrente a la base de
datos y garantizan que no ocurran problemas de este tipo.
Mejora en los servicios de copias de seguridad: Muchos sistemas de ficheros dejan que sea el usuario quien
proporcione las medidas necesarias para proteger los datos ante fallos en el sistema o en las aplicaciones. Los
usuarios tienen que hacer copias de seguridad cada día, y si se produce algún fallo, utilizar estas copias para
restaurarlos.
Desventajas de las bases de datos
Complejidad: Los SGBD son conjuntos de programas que pueden llegar a ser complejos con una gran funcionalidad.
Es preciso comprender muy bien esta funcionalidad para poder realizar un buen uso de ellos.
Coste del equipamiento adicional: Tanto el SGBD, como la propia base de datos, pueden hacer que sea necesario
adquirir más espacio de almacenamiento. Además, para alcanzar las prestaciones deseadas, es posible que
sea necesario adquirir una máquina más grande o una máquina que se dedique solamente al SGBD. Todo
esto hará que la implantación de un sistema de bases de datos sea más cara.
Vulnerable a los fallos: El hecho de que todo esté centralizado en el SGBD hace que el sistema sea más vulnerable
ante los fallos que puedan producirse. Es por ello que deben tenerse copias de seguridad (Backup).
Tipos de Campos: Cada Sistema de Base de Datos posee tipos de campos que pueden ser similares o diferentes.
Entre los más comunes podemos nombrar:
• Numérico: entre los diferentes tipos de campos numéricos podemos encontrar enteros “sin decimales” y reales
“decimales”.
Booleanos: poseen dos estados: Verdadero “Si” y Falso “No”.
• Memos: son campos alfanuméricos de longitud ilimitada. Presentan el inconveniente de no poder ser indexados.
• Fechas: almacenan fechas facilitando posteriormente su explotación. Almacenar fechas de esta forma posibilita
ordenar los registros por fechas o calcular los días entre una fecha y otra.
Alfanuméricos: contienen cifras y letras. Presentan una longitud limitada (255 caracteres).
• Autoincrementables: son campos numéricos enteros que incrementan en una unidad su valor para cada registro
incorporado. Su utilidad resulta: Servir de identificador ya que resultan exclusivos de un registro.
Tipos de Base de Datos
• MySql: es una base de datos con licencia GPL basada en un servidor. Se caracteriza por su rapidez. No es
recomendable usar para grandes volúmenes de datos.
• PostgreSql y Oracle: Son sistemas de base de datos poderosos. Administra muy bien grandes cantidades de
datos, y suelen ser utilizadas en intranets y sistemas de gran calibre.
• Access: Es una base de datos desarrollada por Microsoft. Esta base de datos, debe ser creada bajo el programa
access, el cual crea un archivo .mdb con la estructura ya explicada.
• Microsoft SQL Server: es una base de datos más potente que access desarrollada por Microsoft. Se utiliza
para manejar grandes volúmenes de informaciones.
Modelo entidad-relación: Los diagramas o modelos entidad-relación (denominado por su siglas, ERD “Diagram Entity
relationship”) son una herramienta para el modelado de datos de un sistema de información. Estos modelos
expresan entidades relevantes para un sistema de información, sus inter-relaciones y propiedades.
Cardinalidad de las Relaciones: El diseño de relaciones entre las tablas de una base de datos puede ser:
Relaciones de uno a uno: una instancia de la entidad A se relaciona con una y solamente una de la entidad B.
Relaciones de uno a muchos: cada instancia de la entidad A se relaciona con varias instancias d la entidad B.
• Relaciones de muchos a muchos: cualquier instancia de la entidad A se relaciona con cualquier instancia de la
entidad B.
Estructura de una Base de Datos: Una base de datos, a fin de ordenar la información de manera lógica, posee un
orden que debe ser cumplido para acceder a la información de manera coherente. Cada base de datos
contiene una o más tablas, que cumplen la función de contener los campos.
Una base de datos posee el siguiente orden jerárquico: Tablas, Campos, Registros y Lenguaje SQL… El lenguaje SQL
es el más universal en los sistemas de base de datos. Este lenguaje nos permite realizar consultas a nuestras bases
de datos para mostrar, insertar, actualizar y borrar datos.
MANEJO DE INFORMACION:
1) Determinar necesidades de información.
• Reconocer situaciones, entorno sociocultural y contexto en que vive
• Partir de intereses, necesidades, inquietudes o carencias propias
• Preguntarse, cuestionarse o problematizar la información
• Escribir todo lo que se sabe
• Organizar preguntas por niveles de "contestabilidad"
• Eliminar las preguntas incontestables
• Acotar preguntas en tiempo y espacio (delimita la búsqueda)
• Asegurar en sus preguntas precisión, comparación y relación
• Seleccionar un foco o punto de vista
• Definir lo que se quiere saber.
• Reconocer las características de los tipos de información
• Definir un público al que destinará la información
• Adquirir conciencia de lo que no había hecho antes
2) Planear la búsqueda de información.
• Definir objetivos acorde a las necesidades de información
• Determinar un cronograma de actividades
o Definir tareas para lograr los objetivos
o Ordenar las actividades con una lógico de acción
o Definir medios, recursos y posibilidades de obtención
o Definir tiempos para la realización de cada tarea
• Reconocer instancias que manejan información
• Visualizar la extensión del tema
• Establecer campos semánticos
• Perfilar un método de sistematización de la información (registro, concentración, clasificación, organización y
jerarquización)
• Resolver la tensión entre esfuerzo y viabilidad
• Definir estrategias y tácticas de búsqueda
• Reconocer las características de los motores de búsqueda en el web
• Definir y asignar responsables en cada tarea
• Intuir URLs
• Armar mapas de prioridades
• Definir productos
• Preguntarse por niveles de realización, búsqueda o información
3) Usar estrategias de búsqueda.
• Consultar catálogos de bibliotecas y hemerotecas / Identificar palabras clave, temas y subtemas
• Conocer y aplicar técnicas de lectura rápida / Emplear el subrayado como recurso en la lectura
• Elaborar fichas de contenido / Usar buscadores e índices temáticos
• Reconocer el alcance y las limitaciones de los buscadores
• Emplear operadores lógicos y relacionales
• Acercarse a personas que conocen sobre el tema
• Usar el correo electrónico como apoyo a la búsqueda
• Elaborar guiones de entrevista / Procurar emplear ayudas de los diferentes medios
4) Identificar y registrar fuentes.
• Concretar lugares donde hay información y su nivel de accesibilidad
• Saber qué puede encontrar en cada lugar / Saber qué es una fuente
• Reconocer la especialidad, perfil o giro de las fuentes
• Evaluar la confiabilidad de las fuentes
• Distinguir la fuente de información del medio de información
• Identificar los tipos de fuentes y qué contienen / Saber cómo recopilar
• Hacer fichas que contengan: datos bibliográficos (referencias) / ideas principales (registros de información) /
utilidad posible (aplicación y uso de la información)
• Distinguir tipos de páginas de web por la diferenciación de sus dominios (.com, .org, .gob, .edu, etc)
• Realizar bookmarks y los organiza temáticamente
• Identificar usos posibles de la Biblioteca, hemeroteca y SECOBI.
5) Discriminar y evaluar la información.
• Establecer objetivos de indagación / Emplear el recorte y síntesis de información
• Distinguir lo gral y lo particular de la inf. / Emplear criterios para captar, seleccionar, integrar, organizar
• Buscar y dar congruencia en la información / Validar la información con una racionalidad
• Verbalizar esa racionalidad en sus propios términos
• Contratar las fuentes encontradas con las necesidades
• Distinguir hechos de opiniones (Evidencias de...) / Encontrar y discutir puntos de vista sobre la inf.
• Identificar la postura de la fuente en la información
• Utilizar categorías de confiabilidad, validez y niveles de profundidad en el tratamiento de la información
• Retroalimentar (revisar) lo que hace. / Ser capaz de ver la forma en que evoluciona en su trabajo
• Ser claro en sus búsquedas. / Distinguir fuentes primarias de secundarias.
6) Procesar para producir información propia.
• Cortar, copiar, borrar, pegar, sintetizar, organizar y representar, diferentes tipos de información
• Seleccionar herramientas adecuadas para procesar información
• dominar y aplicar principios de análisis y síntesis de información
• Ser capaz de reflexionar y concluir / Dominar y aplicar elementos básicos de expresión escrita
• Generar reportes.
• Olvidarse de copiar y pegar: integrar, parafrasear, transformar y representar la información.
• Utilizar esquemas, cuadros sinópticos o tablas
• Generar nuevos apartados de información, la organiza y dispone de modo diferente.
• Graficar la información / incorporar información numérica y la representa de manera diversa
• Ser capaz de escribir un ensayo.
7) Generar productos de comunicación de calidad.
• Generar productos comunicativos que responden a necesidades reales de información o cumunicación.
• Diseña los productos comunicativos para responder con seguridad a las necesidades.
• Prevee en el diseño los formatos, estructuras u organización de contenidos que hacen transparente la
información
• Procura emplear información en la forma de medios que más conviene al usuario.
• Atiende a las características propias del medio de comunicación empleado y toma en cuenta las características
del usuario.
8) Evaluar procesos y productos.
• Redactar su bitácora con cuestionamientos e inquietudes
• Comparar sus productos con el interés o inquietud inicial. / Ser objetivo consigo mismo
• Planteas nuevas preguntas a partir de lo encontrado / Identificar la utilidad del producto
• Identificar lo aprendido y reconocer su utilidad para seguir aprendiendo
• Participar en ejercicios grupales de retroalimentación / Cuestionar o reconocer su propia eficiencia
• Verificar que el producto sea comprensible para el destinatario
• Establecer criterios de evaluación, obtiene y proporciona evidencias / Distinguir el proceso del producto.
• Almacén de datos: es una colección de datos orientada a un determinado ámbito (empresa,
organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de
decisiones en la entidad en la que se utiliza. Se trata de un expediente completo de una
organización, más allá de la información transaccional y operacional, almacenado en una base de
datos diseñada para favorecer el análisis y la divulgación eficiente de datos. El almacenamiento
de los datos no debe usarse con datos de uso actual. Los almacenes de datos contienen a
menudo grandes cantidades de información que se subdividen a veces en unidades lógicas más
pequeñas dependiendo del subsistema de la entidad del que procedan o para el que sean
necesario.
ALMACENAMIENTO DE DATOS: Almacén de datos: es una colección de datos orientada a un
determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que
ayuda a la toma de decisiones en la entidad en la que se utiliza. Se trata de un expediente completo de
una organización, más allá de la información transaccional y operacional, almacenado en una base de
datos diseñada para favorecer el análisis y la divulgación eficiente de datos. El almacenamiento de los
datos no debe usarse con datos de uso actual. Los almacenes de datos contienen a menudo grandes
cantidades de información que se subdividen a veces en unidades lógicas más pequeñas dependiendo
del subsistema de la entidad del que procedan o para el que sea necesario.
Definición de Bill Inmon: define un almacén de datos en términos de las características del repositorio de
datos:
-Orientado a temas.- Los datos en la base de datos están organizados de manera que todos los
elementos de datos relativos al mismo evento u objeto del mundo real queden unidos entre sí.
-Variante en el tiempo.- Los cambios producidos en los datos a lo largo del tiempo quedan registrados
para que los informes que se puedan generar reflejen esas variaciones.
-No volátil.- La información no se modifica ni se elimina, una vez almacenado un dato, éste se convierte
en información de sólo lectura, y se mantiene para futuras consultas.
-Integrado.- La base de datos contiene los datos de todos los sistemas operacionales de la organización,
y dichos datos deben ser consistentes.
Defiende una metodología descendente (top-down) a la hora de diseñar un almacén de datos,

Definición de Ralph Kimball: una copia de las transacciones de datos específicamente estructurada
para la consulta y el análisis. También determinó que un almacen de datos no era más que la unión de
todos los Data marts de una entidad. Defiende por tanto una metodología ascendente (bottom-up) a la
hora de diseñar un almacén de datos.
Función de un almacén de datos
En el funcionamiento de un almacén de los datos son muy importantes las siguientes ideas:
-Integración de los datos provenientes de bases de datos distribuidas por las diferentes unidades de la
organización y que con frecuencia tendrán diferentes estructuras (fuentes heterogéneas). Se debe
facilitar una descripción global y un análisis comprensivo de toda la organización en el almacén de
datos.
-Separación de los datos usados en operaciones diarias de los datos usados en el almacén de datos para
los propósitos de divulgación, de ayuda en la toma de decisiones, para el análisis y para operaciones de
control. Ambos tipos de datos no deben coincidir en la misma base de datos, ya que obedecen a
objetivos muy distintos y podrían entorpecerse entre sí.
Data mart: son subconjuntos de datos de un almacén de datos para áreas específicas.
Entre las características de un data mart destacan: Usuarios limitados. / Área específica. / Tiene un
propósito específico. / Tiene una función de apoyo.
Cubos de información: Los cubos de información o cubos OLAP funcionan como los cubos de
rompecabezas en los juegos, en el juego se trata de armar los colores y en el almacen de datos se trata
de organizar los datos por tablas o relaciones; los primeros (el juego) tienen 3 dimensiones, los cubos
OLAP tienen un número indefinido de dimensiones, razón por la cual también reciben el nombre de
hipercubos. Un cubo OLAP contendrá datos de una determinada variable que se desea analizar,
proporcionando una vista lógica de los datos provistos por el sistema de información hacia el almacén
de datos, esta vista estará dispuesta según unas dimensiones y podrá contener información calculada.
El análisis de los datos está basado en las dimensiones del hipercubo, por lo tanto, se trata de un
análisis multidimensional. A la información de un cubo puede acceder el ejecutivo mediante "tablas
dinámicas" en una hoja de cálculo o a través de programas personalizados. Las tablas dinámicas le
permiten manipular las vistas (cruces, filtrados, organización, totales) de la información con mucha
facilidad. Las diferentes operaciones que se pueden realizar con cubos de información se producen con
mucha rapidez. Llevando estos conceptos a un almacén de datos, éste es una colección de datos que
está formada por «dimensiones» y «variables», entendiendo como dimensiones a aquellos elementos
que participan en el análisis y variables a los valores que se desean analizar.
-Dimensiones: son atributos relativos a las variables, son las perspectivas de análisis de las variables
(forman parte de la tabla de dimensiones). Son catálogos de información complementaria necesaria
para la presentación de los datos a los usuarios, como por ejemplo: descripciones, nombres, zonas,
rangos de tiempo, etc. Es decir, la información general complementaria a cada uno de los registros de la
tabla de hechos.
-Variables: También llamadas “indicadores de gestión”, son los datos que están siendo analizados.
Forman parte de la tabla de hechos. Más formalmente, las variables representan algún aspecto
cuantificable o medible de los objetos o eventos a analizar. Normalmente, las variables son
representadas por valores detallados y numéricos para cada instancia del objeto o evento medido. En
forma contraria, las dimensiones son atributos relativos a las variables, y son utilizadas para indexar,
ordenar, agrupar o abreviar los valores de las mismas. Las dimensiones poseen una granularidad menor,
tomando como valores un conjunto de elementos menor que el de las variables; ejemplos de
dimensiones podrían ser: “productos”, “localidades” (o zonas), “el tiempo” (medido en días, horas,
semanas, etc.), ...

Ejemplos de variables podrían ser: Beneficios, Gastos, Ventas, etc.


Ejemplos de dimensiones podrían ser: producto, localidades, tiempo, tipo de cliente, etc.
Elementos que integran un almacén de datos
Metadatos: Se define comúnmente como "datos acerca de los datos", en el sentido de que se trata de
datos que describen cuál es la estructura de los datos que se van a almacenar y cómo se relacionan. El
metadato documenta, entre otras cosas, qué tablas existen en una base de datos, qué columnas posee
cada una de las tablas y qué tipo de datos se pueden almacenar. En el ámbito de los almacenes de
datos el metadato juega un papel fundamental, su función consiste en recoger todas las definiciones de
la organización y el concepto de los datos en el almacén de datos, debe contener toda la información
concerniente a:
Tablas / Columnas de tablas / Relaciones entre tablas / Jerarquías y Dimensiones de datos / Entidades y
Relaciones
Funciones ETL (extracción, transformación y carga): Los procesos de extracción, transformación y carga
(ETL) son importantes ya que son la forma en que los datos se guardan en un almacén de datos (o en
cualquier base de datos). Implican las siguientes operaciones:
-Extracción. Acción de obtener la información deseada a partir de los datos almacenados en fuentes
externas.
-Transformación. Cualquier operación realizada sobre los datos para que puedan ser cargados en el
almacen de datos o se puedan migrar de éste a otra base de datos.
-Carga. Consiste en almacenar los datos en la base de datos final, por ejemplo el almacén de datos
objetivo normal.
Middleware: es un término genérico que se utiliza para referirse a todo tipo de software de conectividad
que ofrece servicios u operaciones que hacen posible el funcionamiento de aplicaciones distribuidas
sobre plataformas heterogéneas. Funcionan como una capa de abstracción de software distribuida, que
se sitúa entre las capas de aplicaciones y las capas inferiores. La función del middleware en el contexto
de los almacenes de datos es la de asegurar la conectividad entre todos los componentes de la
arquitectura de un almacén de datos.

Ventajas e inconvenientes de los almacenes de datos


Ventajas: 1.- Los almacenes de datos hacen más fácil el acceso a una gran variedad de datos a los
usuarios finales- 2.- Facilitan el funcionamiento de las aplicaciones de los sistemas de apoyo a la
decisión. 3.- Los almacenes de datos pueden trabajar en conjunto y, por lo tanto, aumentar el valor
operacional de las aplicaciones empresariales, en especial la gestión de relaciones con clientes.
Inconvenientes: 1.-A lo largo de su vida los almacenes de datos pueden suponer altos costos, no suele
ser estático, los costos de mantenimiento son elevados. 2.- Los almacenes de datos se pueden quedar
obsoletos relativamente pronto. 3.-A veces, ante una petición de información estos devuelven una
información subóptima, que también supone una pérdida para la organización. 4.- A menudo existe una
delgada línea entre los almacenes de datos y los sistemas operacionales. Hay que determinar qué
funcionalidades de estos se pueden aprovechar y cuáles se deben implementar en el almacén de datos,
resultaría costoso implementar operaciones no necesarias o dejar de implementar alguna que sí vaya a
necesitarse.

Você também pode gostar