Você está na página 1de 12

Fundamentos de Inteligencia de Negocios

Desarrollo Capitulo 6
Versin 3.0

Captulo 6. Fundamentos de Inteligencia de Negocios. Vision Documento Visin

Versin: Fecha:

3.0 14/03/2013

Fundamentos de la Inteligencia de Negocios.


Sesin interactiva: Organizaciones
1. Cules son los beneficios de las bases de datos de ADN?

Encontrar a posibles sospechosos de un crimen cotejando su ADN que previamente fue almacenado en una base de datos. Descartar a inocentes que fueron involucrados en un caso simplemente por sospecha o por malos procedimientos policiales. Resolver casos en los cuales ya no se tenan esperanzas de solucionarlos.

2. Qu problemas plantea la base de datos AND?

El tener solo datos almacenados de personas que han cometido algn crimen, limita la bsqueda de sospechosos puesto que hay que esperar que una persona cometa un acto criminal para que su ADN sea incluido en la bases de datos. Los errores en los procedimientos de recoleccin del ADN, puede generar a la hora de registrar estos datos, inconsistencias de informacin e incluso errores que proporcionaran bsquedas nulas.

3. Quines deben incluirse en una base de datos nacional de ADN? Debe limitarse a criminales condenados? Explique su respuesta.

Una muestra de ADN se debera proporcionar en el momento de que una persona nace, as como se toman las huellas digitales. Este es el gran limitante de la base de datos AND, hay que esperar que alguien cometa un crimen para que su ADN sea incluido en estas bases de datos. Para que se llegara a la decisin de tomar la muestra de una persona recin nacida, se deben solucionar muchos inconvenientes, como la de avanzar tecnolgicamente en la toma de muestras para que no se generen errores, as como tambin, en sistemas de seguridad para que estas bases de datos sean impenetrables y la informacin solo est disponible para quien verdaderamente la necesita.

4. Quin debe tener la facultad de utilizar bases de datos ADN?

Confidencial

Deportes LSI 03, 2012

Pg. 2

Captulo 6. Fundamentos de Inteligencia de Negocios. Vision Documento Visin

Versin: Fecha:

3.0 14/03/2013

En consecuencia, no todas las personas pueden tener acceso a esta informacin, sera un caos que cualquier persona manipulara esta informacin a su gusto ya sea para buenas o malas intenciones. La facultad de manejar esta informacin debe ser por parte de las unidades investigativas, son las nicas que tienen el poder para consultar y verificar datos y poderlos utilizar en casos donde se requiera.

Mis en accin 1. Cmo funciona el CODIS?

CODIS es un sistema desarrollado por el FBI de los estados unidos, y su funcin principal es la de aumentar la probabilidad en la identificacin de un criminal tomando como muestra su ADN y comparando con registros guardados en este sistema que es compartido por numerosos estados. Actualmente varios pases se encuentran en la adquisicin de este sistema para apoyar sus labores investigativas y forenses.

2. Qu informacin mantiene CODIS?

El sistema CODIS maneja varios tipos de registro entre los que se encuentran: los registros ADN de las personas que fueron condenadas, los registros ADN de las personas que han sido imputadas, registros ADN de personas que hayan sido parte de una investigacin, registros ADN de personas que fueron vctimas de un acto delictivo y registros ADN de personas N.N, desaparecidas y de sus familiares.

3. Quin tiene autorizacin para utilizar el CODIS?

En los estados unidos, la INTERPOL y el FBI.

4. Cmo ayuda CODIS en las investigaciones criminales?

Lo que hace es comparar el registro de una muestra con la que est en la base de datos, esta comparacin arroja un resultado con la que se podra dar sentencia a un acusado de un crimen o no.

Confidencial

Deportes LSI 03, 2012

Pg. 3

Captulo 6. Fundamentos de Inteligencia de Negocios. Vision Documento Visin

Versin: Fecha:

3.0 14/03/2013

Sesin interactiva: Administracin


1. Cul fue el impacto de los problemas de calidad de datos en las empresas descritas en este caso de estudio? BT Group: Para esta empresa el impacto que se gener por errores en el inventario, errores en la facturacin y problemas en la interaccin con sus proveedores y sus clientes. Emerson Process Management: El impacto para esta empresa se gener en el retiro del almacn de datos, debido a que este estaba repleto de informacin que no era coherente o exista duplicidad en la informacin, esto provocaba errores en facturacin y embarques. Cintas: Para esta empresa el problema fue que en el momento de centralizar toda la informacin que tenan, se encontr con informacin duplicada de los clientes en diferentes BD, esto generaba que un mismo cliente, se reconociera como dos clientes diferentes, o que clientes antiguos se reconocieran como clientes nuevos; todo esto llevo a que los clientes perdieran credibilidad y por supuesto incrementaban los costos. Bank of Amrica: Este banco tuvo que reexaminar sus procedimientos de calidad de datos para asegurar que se acoplaban con la ley de lavado de dinero. Qu factores de administracin, organizacin y tecnologa ocasionaron estos problemas? BT Group: El factor que ocasiono estos problemas, es que la organizacin en un principio no tena muy en cuenta el manejo de los datos ni su calidad, solo hasta cuando tuvo problemas de duplicidad se busc una solucin. Emerson Process Management: El factor principal fue que no se tuvo en cuenta la diversidad en las formas del ingreso de la informacin, en este caso la diversidad de culturas en la que operaba la empresa. Cintas: Para esta empresa el factor principal fue el manejo de la informacin no centralizada, sino que cada una de sus divisiones tena su propia base de datos de clientes; cuando se necesitaba centralizar los datos en un almacn de datos, surgieron los problemas de duplicidad en los clientes. Bank of Amrica: El factor que le llevo a rexaminar sus procedimientos fue la ley de lavado de dinero.

2. De qu manera resolvieron sus problemas de calidad de datos las empresas descritas en este caso? BT Group: Primero fue la creacin de un grupo de personas para realizar la verificacin de la calidad de los datos en cada una de las lneas de negocio, se centralizo la administracin de los datos y se implement una metodologa en la calidad de datos. Para realizar todo esto BT utilizo una herramienta (Trillium Software) para identificar y eliminar datos errneos y as mantener un alto nivel en la calidad de la informacin.

Confidencial

Deportes LSI 03, 2012

Pg. 4

Captulo 6. Fundamentos de Inteligencia de Negocios. Vision Documento Visin

Versin: Fecha:

3.0 14/03/2013

Emerson Process Management: Soluciono sus problemas con la implementacin de un Software (Group 1 Software Ing), que permite la creacin de perfiles, la depuracin de la informacin y la combinacin de registros en el almacn de datos. Cintas: Encontr la solucin reacondicionando su almacn de datos, mediante la utilizacin de un Software de administracin de calidad de datos (Dataflux), que ayuda a estandarizar la informacin de los clientes y eliminar registros duplicados, y permitir la validacin de los datos antes de ser ingresados al almacn de datos. Bank of Amrica: Estableci un conjunto de prcticas para detectar, integrar y manejar los datos, uniendo los administradores de datos de las diferentes lneas de negocio con el departamento de sistemas. Utilizan herramientas de creacin de perfiles y comparacin de datos para eliminar duplicidad en la informacin. Qu problemas de administracin, organizacin y tecnologa tuvieron que enfrentar?

BT Group: El principal problema fue encontrar y eliminar los datos errneos en su base de datos, datos deficientes sobre el inventario de productos. Emerson Process Management: el principal problema que encontr fue la diversidad cultural que se tena y la forma en tratar de parame trizar los datos que se deban ingresar, errores en facturacin a clientes y en embarques. Cintas: El principal problema, fue la desconfianza que se gener por parte de los clientes y la prdida de nuevos clientes, debido a la duplicidad y la mala calidad de la informacin que se tena. Bank of Amrica: revaluar y examinar cuidadosamente los procedimientos de la calidad de los datos.

3. Se ha dicho que el mayor obstculo para mejorar la calidad de datos es que los gerentes de las empresas consideran la calidad de datos como un problema tcnico. Analice de qu manera se aplica esta afirmacin a las empresas descritas en este caso de estudio. En los diferentes casos de las empresas anteriores, estas no consideraron la importancia de la calidad de datos al inicio de sus negocios, en estas empresas los gerentes no consideraron la implementacin de sistemas eficientes en la recoleccin y almacenaje de la informacin; esto llevo a que cuando se encontraron con los problemas de informacin que se tenan, se generaron gastos mayores y adems disgusto por parte de clientes, proveedores y los mismos empleados.

Mis en accin 1. Cules son las capacidades del Software para asegurar la completitud, exactitud y consistencia de los datos? Software seleccionado: SAS DataFlux Data Management: Administrar y gobernar de datos con la integracin de datos, calidad de datos, gestin de datos maestros y el acceso de datos empresariales. SAS proporciona un entorno integrado de soluciones, herramientas, metodologas y flujos de trabajo que permite a las organizaciones gestionar grandes volmenes de datos Confidencial Deportes LSI 03, 2012 Pg. 5

Captulo 6. Fundamentos de Inteligencia de Negocios. Vision Documento Visin

Versin: Fecha:

3.0 14/03/2013

como un activo valioso, conduciendo ambos procesos bsicos de funcionamiento y toma de decisiones estratgicas. Con estas capacidades de gestin de datos, las organizaciones pueden hacer un uso completo de todos los datos de entrada para descubrir conocimientos ocultos y aumentar la ventaja competitiva. La amplitud de SAS DataFlux tecnologas de ayuda a las organizaciones a disminuir los costos, aumentar la eficiencia y la productividad, y proporcionar un valor medible. De alto rendimiento, soluciones escalables de garantizar que las organizaciones pueden terminar con xito la integracin de datos ms exigentes, gestin de datos y proyectos de datos de gobernabilidad. Data Access - Acceso y uso de las fuentes de datos de toda la empresa. Data Governance - Mantener un conjunto nico y coherente de las polticas y procesos de gestin de datos. Integracin de datos - Mejorar el flujo de informacin precisa a travs de su organizacin. Calidad de Datos - Garantizar la excelencia a travs de la informacin de gestin de calidad de datos del ciclo de vida. Master Data Management - Crear una visin nica, precisa y unificada de datos corporativos.

Cmo SAS es diferente: Una plataforma de gestin de datos unificada. Mediante la combinacin de integracin de datos, calidad de datos y gestin de datos maestros en un entorno unificado de desarrollo y entrega, las organizaciones pueden optimizar cada fase del proceso de gestin de datos. El uso de un marco nico con una interfaz intuitiva permite a las organizaciones con datos que son coherentes, precisos y oportunos. Integrados capacidades analticas para la gestin de datos. SAS Analytics incorpora en el proceso ETL / ELT para proporcionar un entorno de colaboracin modelado altamente eficiente y rentable. Slo SAS puede ofrecer resultados ms rpidos mediante la incorporacin de computacin de alto rendimiento y la inteligencia analtica en el proceso de gestin de datos. La gobernanza ms establecida datos modelo de madurez. Datos de gobernabilidad es un proceso continuo, no un proyecto de una sola vez. SAS ofrece probadas, basadas en la metodologa de enfoques para ayudar a los clientes a crear un procedimiento preferente en base a su modelo de madurez de datos. Los clientes pueden utilizar plenamente sus tecnologas existentes y aadir nuevos componentes segn sea necesario. Nativa desarrollado tecnologas. SAS productos Dataflux ha sido concebido y desarrollado desde cero. Esto proporciona coherencia de desarrollo de producto y elimina complejidades tales como problemas de integracin, se superpone la funcionalidad y la incertidumbre en la direccin del producto. Un marco integral de gestin de datos para el negocio y las TI. SAS DataFlux experiencia con temas de negocios y soluciones de colaboracin ha hecho toda la empresa de gestin de datos entre las lneas de negocio y de TI en una realidad.

2. Qu pasos necesitara emprender su empresa para utilizar este Software? Confidencial Deportes LSI 03, 2012 Pg. 6

Captulo 6. Fundamentos de Inteligencia de Negocios. Vision Documento Visin

Versin: Fecha:

3.0 14/03/2013

Registrarse en la pgina web de la empresa (www.dataflux.com), donde se podr obtener informacin y soporte sobre los productos y servicios brindados por la empresa. Dataflux utiliza una metodologa de gestin de datos que consiste en: Definir, Descubrir, Diseo, Ejecutar, Evaluar y Control. Se puede seguir en Facebook, twitter y Youtube.

Panasonic crea una consola de la verdad a partir de los datos. Preguntas de repaso
1. Por qu es importante la administracin de archivos para el desempeo de los sistemas? Cuando una empresa se empieza a consolidar, su parte ms fundamental son los sistemas de informacin. Un sistema de informacin bien estructurado, forma parte de las grandes decisiones que se tomen en una empresa. Si el rea de sistemas no realiza un buen trabajo en el manejo de los archivos de informacin, difcilmente se puede ver un resultado ptimo a la hora de la toma de decisiones de los gerentes que son los que finalmente, juegan con esta informacin volvindola cifras estadsticas donde un dato errneo, puede traer consecuencias fatales.

2. Enliste y describa cada uno de los componentes de la jerarqua de datos. BIT: representa la unidad mnima en los sistemas de informacin Bites: conjunto de bits para representar un carcter. Campo: conjunto de bites para representar una palabra o frase. Registro: conjunto de campos agrupados con los que formamos un registro. Archivo: conjunto de registros agrupados con los que formamos una tabla. Base de datos: son todos los archivos o tablas consolidadas como un todo.

3. Defina y explique el significado de entidades, atributos y campos de clave. Entidad: es la representacin de cualquier objeto concreto en el mundo, fsicamente lo representara como el nombre de una tabla con sus atributos campos. Atributos: como explique anteriormente los atributos son los campos que conforman una tabla o archivo. Campos de clave: es el campo con el que vamos a identificar una tabla o archivo, por lo generar este campo se vuelve una llave primaria. Un llave primaria es un campo de una tabla el cual va a tener valores nicos sin duplicados.

4. Enliste y describa los problemas del entorno tradicional de archivos.

Confidencial

Deportes LSI 03, 2012

Pg. 7

Captulo 6. Fundamentos de Inteligencia de Negocios. Vision Documento Visin

Versin: Fecha:

3.0 14/03/2013

Redundancia e inconsistencia de datos: este problema se presenta al no tener una sola base consolidada con todos los archivos o tablas, se empiezas a generar gastos de memoria, duplicidad en los datos campos iguales en tablas diferentes que generan inconsistencia de los datos, en fin una gran desorganizacin de archivos. Dependencia entre los programas y los datos: esto refiere a que los programas que manejan los datos no deben depender de los cambios que se realizan en las bases de datos, un programa autnomo debe ser capaz de verificar los campos de una base de datos para no cometer errores de insercin o actualizacin. Carencia de flexibilidad: los programas para la recuperacin de archivos deben estar a disposicin al usuario sin que se tengan que hacer grandes esfuerzos de programacin, esto tuvo que haberse planeado en alguna fase de la elaboracin de la base de datos. Seguridad escasa: cuando se conforma una base de datos, lo primero que deberamos tener en cuenta es quien puede acceder a ella y los permisos que se deben otorgar a los usuarios, tambin tener un archivo que nos registre los cambios realizados por algn usuario a un registro de la base de datos. Carencia de comparticin y disponibilidad de los datos: los datos por lo general, deben ser relacionales, una buena base de datos relacional nos pone a disposicin los datos cuando se requieran sin tener que empezar a mirar de donde empezamos a buscar informacin.

5. Defina una base de datos y un sistema de administracin de base de datos. Una base de datos es un conjunto de datos organizado de diferentes archivos que contienes diferentes tipos de campos los cuales deben estar organizados e interrelacionados, debe estar libre de redundancia y estar disponible cuando se le requiera. Un sistema de administracin de base de datos es el software que me permite interactuar con los datos con una interfaz entendible para el programador o usuario, mostrndole los datos como se deben percibir sin necesidad de que tenga que entender la parte fsica del almacenamiento de los datos.

6. Enliste algunos beneficios de un DBSM y las soluciones que ofrecen para los problemas de un entorno tradicional de archivos. Eliminar la inconsistencia de datos. Eliminar la redundancia de los datos. Eliminar la dependencia de los datos. Eliminar la dependencia entre los programas y los datos. Centralizar la administracin de datos. Seguridad.

Confidencial

Deportes LSI 03, 2012

Pg. 8

Captulo 6. Fundamentos de Inteligencia de Negocios. Vision Documento Visin

Versin: Fecha:

3.0 14/03/2013

7. Qu es un DBMS relacional?, Cmo organiza los datos?, Cules son las tres operaciones de un DBMS relacional? Un DBMS es un software que permite a las organizaciones la centralizacin, organizacin, administracin y un acceso controlado a los datos almacenados en una BD. El DBMS es el software que interacta con los usuarios de los programas de aplicacin y la BD. Un DBMS Relacional es el que utiliza una BD Relacional, la cual presenta los datos como tablas bidimensionales (relaciones). Cada tabla contiene datos de una entidad y sus atributos. En este modelo todos los datos son almacenados en relaciones, y como cada relacin es un conjunto de datos, el orden en el que stos se almacenen no tiene relevancia, La informacin puede ser recuperada o almacenada por medio de consultas que ofrecen una amplia flexibilidad y poder para administrar la informacin. Una relacin representa una tabla que no es ms que un conjunto de filas, cada fila es un conjunto de campos y cada campo representa un valor que interpretado describe el mundo real. Cada fila tambin se puede denominar tupla o registro y a cada columna tambin se le puede llamar campo o atributo. Las operaciones de un DBMS se utilizan para generar conjuntos de datos de dos tablas diferentes seleccionando los atributos seleccionados:

SELECCIONAR: Crea un subconjunto que consta de todos los registros de la tabla que cumplen los criterios establecidos. UNIR: Combina tablas relacionales para dar al usuario ms informacin de la que est disponible en las tablas individuales. PROYECTAR: Crea un subconjunto que consiste en las columnas de una tabla, creando nuevas tablas que contengan solamente la informacin que se requiere.

8. Mencione y describa brevemente las capacidades de un DBMS. Capacidades de los DBMS: Definicin de datos: especifica la estructura del contenido de la base de datos, utilizada para crear tablas de bases de datos y para definir las caractersticas delos campos. Diccionario de datos: archivo automatizado o manual que almacena definiciones de elementos de datos y sus caractersticas. Lenguaje de manipulacin de datos: se utiliza para agregar, cambiar, eliminar y recuperar la informacin de la base de datos o Lenguaje de Consultas Estructurado o SQL o Las herramientas para el usuario de Microsoft Access para la generacin SQL Tambin: Muchos DBMS son populares generadores de informes(CrystalReports) Deportes LSI 03, 2012

Confidencial

Pg. 9

Captulo 6. Fundamentos de Inteligencia de Negocios. Vision Documento Visin

Versin: Fecha:

3.0 14/03/2013

9. Qu es la normalizacin?, Cmo se relaciona con las caractersticas de una base de datos relacional bien diseada? La normalizacin es un proceso para simplificar las agrupaciones complejas de datos para minimizar elementos de datos redundantes y complicadas relaciones muchos a muchos: con la normalizacin se crean estructuras de datos pequeas, estables, flexibles y adaptables. Al momento de realizar el diseo de las BD se debe tener en cuenta todas las relaciones que se van a tener entre los datos; con estos se est evitando la complejidad en el manejo de la informacin, generando grupos de datos organizados, refinados y simplificados.

10. Qu es una base de datos distribuida y cules son las dos formas principales de distribuir datos? Una base de datos distribuida es aquella que se almacena en ms de un lugar fsico. Hay dos formas principales para la distribucin de la BD: Particionada: Unas partes de la BD se almacenan y se mantienen fsicamente en un lugar y otras partes se mantienen y se almacenan en otros lugar diferente, de manera que cada procesador remoto tenga los datos necesarios para abastecer el rea local. La actualizacin de los archivos en la base central, se hace a partir de lotes. Replicar: Es decir, duplicar por completo la BD central en todas la ubicaciones remotas, es decir que la informacin estara disponible de manera ms inmediata.

11. Qu es un almacn de datos? Cmo puede beneficiar a las organizaciones? Un almacn de datos es una base de datos que almacn datos actuales e histricos de potencial inters para la toma de decisiones, este consolida y estandariza toda la informacin de diferentes BD operativas; un almacn de datos pone a disposicin todos los datos que posee, pero no pueden ser modificados; proporciona una serie de consultas con fines especficos y estandarizados, herramientas analticas y caractersticas grficas para la elaboracin de informes. Las organizaciones se pueden beneficiar de los almacenes de datos, en la toma de decisiones eficientes y efectivas para la organizacin, gracias al anlisis que se puede realizar a nivel de toda la empresa, un acceso ms rpido a todos los datos de la organizacin, tiene disponible tanto informacin actual como histrica.

12. Qu es la inteligencia de negocios?, Cmo se relaciona con la tecnologa de base de datos?

Confidencial

Deportes LSI 03, 2012

Pg. 10

Captulo 6. Fundamentos de Inteligencia de Negocios. Vision Documento Visin

Versin: Fecha:

3.0 14/03/2013

La inteligencia de negocio (BI), con herramientas que se utilizan para consolidar, analizar y dar acceso a extensas cantidades de datos para ayudar a los usuarios en la toma de mejores decisiones. La Inteligencia de Negocios se direcciona principalmente en Aplicaciones y Base de Datos de Soporte a la Toma de Decisiones correctas.

13. Describa las caractersticas del procesamiento analtico en lnea (OLAP) El OLAP es la capacidad para manipular y analizar grandes volmenes de datos desde mltiples puntos de vista. es agilizar la consulta de grandes cantidades de datos. Permite a los usuarios ver los mismos datos en diferentes formas utilizando mltiples dimensiones.

14. Qu es la Minera de Datos? En que difiere de OLAP? Qu tipo de informacin se pueden obtener de la minera de datos?

15. Qu es un almacn de datos? Cmo puede beneficiar a las organizaciones? Es una base de datos que almacena datos actuales e histricos de posible inters para los gerentes de la compaa. Sus beneficios son que no solo ofrecen informacin mejorada sino que tambin les facilita obtenerla a los responsables de tomar las decisiones. 16. Qu es una base de datos hipermedias? En qu difiere de una base de datos tradicional? Cmo se utiliza en la Web? 17. Es un enfoque para administrar datos que los organiza como una red de nodos vinculados en un patrn especificado por el usuario. Estos contienen textos, sonido, vdeo y grficos mediante el uso de una base de datos hipermedias. La relacin entre registros est menos estructurada que en un DBMS tradicional. 18. Cmo pueden tener acceso los usuarios a la informacin de las bases de datos internas de una compaa a travs dela Web? Los usuarios pueden acceder a las bases internas de una organizacin a travs de la Web utilizando sus PCs de escritorio y el software para navegar en la Web. Preguntas para debatir 1. Se ha dicho que no es necesario el software de administracin de base de datos para crear un entorno de base de datos. Argumentar: Se podra decir que no es necesaria la utilizacin de un DBMS si se quiere tener una BD no centralizada, con informacin redundante, inconsistencias en los datos, conflicto entre programas y datos, inflexibilidad, seguridad escasa, falta de informacin

Confidencial

Deportes LSI 03, 2012

Pg. 11

Captulo 6. Fundamentos de Inteligencia de Negocios. Vision Documento Visin

Versin: Fecha:

3.0 14/03/2013

compartida y disponibilidad en los datos. Para obtener todas estas caractersticas en una base de datos, se debe tener un DBMS para la creacin de una BD. 2. Hasta qu punto se deben involucrar los usuarios finales en la seleccin de un sistema de administracin de base de datos y el diseo de la base de datos? Los usuarios finales, no deberan tener ninguna relacin con la seleccin del DBMS o con el diseo de la BD, puesto que estas actividades deben ser realizadas por personas encargadas del diseo de la BD; los usuarios finales solo deberan estar involucrados con dar algunos requerimientos y sugerencias, con respecto a los resultados que debe tener el software realizado.

Confidencial

Deportes LSI 03, 2012

Pg. 12

Você também pode gostar