Você está na página 1de 7

[BI

Y DATAWAREHOUSE] 1

TRABAJO 4 MINERIA DE DATOS


-Qu es la minera de datos

La minera de datos suele describirse como "el proceso de extraer informacin vlida, autntica y que se pueda procesar de las bases de datos de gran tamao." En otras palabras, la minera de datos deriva patrones y tendencias que existen en los datos. Estos patrones y tendencias se pueden recopilar y definir como un modelo de minera de datos

- Informacin oculta en los datos

La informacin oculta es aquella informacin no evidente, desconocida a priori y potencialmente util, que puede recuperarse mediante tcnicas de minera de datos, como reconocimiento de regularidades o algoritmos de aprendizaje automtico, esta informacin es de gran valor, puesto que no se conoca y se trata de un descubrimiento real de nuevo conocimiento, del que antes no se tena idea y que abre la posibilidad de descubrir una nueva visin del problema. Un ejemplo de este tipo de informacin sera Qu tipos de clientes tenemos? Cul es el perfil tpico de cada clase de usuario?. By Gimena Mariaca V

- Modelando el comportamiento humano Data Mining provee un conjunto de diferentes modelos como son la regresin, clasificacin, agrupamiento, importancia de atributos, asociacin entre los mas comunes que tratan de modelar estos comportamientos mediante estos modelos para encontrar patrones que no saltan a primera vista ni con mtodos de anlisis convencionales.

- Metodologa de minera de datos


Un trabajo de minera de datos podramos decir que tpicamente consta de las siguientes partes: 1. Entendimiento del problema: se trata de hablar con el cliente, conocer sus necesidades, conocer su negocio o actividad, conocer qu datos relevantes tiene disponibles y cules seran necesarios pero no estn disponibles, etc. 2. Entendimiento de los datos: hay que saber qu significan los datos, si son continuos o discretos, qu tipo de valores toman, qu utilidad futura pueden tener y saber si estn bien capturados o no. 3. Preparacin de datos: se trata de reflexionar sobre cmo guardar los datos. Tpicamente hablaremos de tablas con filas y columnas, pero hay que ver cmo se organizan las tablas, cmo se interrelacionan entre ellas, etc. En definitiva organizar los datos para poder sacarles partido. 4. Modelamiento: una vez se tienen los datos organizados hay que definir los algoritmos que se van a utilizar para tratar los datos. Una vez tratados, los datos nos devolvern informacin til. 5. Evaluacin: los resultados obtenidos deben de ser sometidos a comprobacin, verificar que estn libres de errores, ratificar que son tiles para los objetivos perseguidos, etc.

[BI Y DATAWAREHOUSE] 3 6. Despliegue funcional-comercial: una vez se tiene automatizada la captura y tratamiento de datos para obtener unos resultados, se desarrollan herramientas, normalmente en forma de aplicaciones informticas que permiten generar alertas, informes, estadsticas, etc. que tienen una utilidad directa para la toma de decisiones y sistema de informacin del cliente. CRISP-DM es una metodologa estndar que ha sido desarrollada para la construccin de proyectos de minera de datos que propone un ciclo de vida cuya primer fase es comprensin del negocio. Esta fase comprende las siguientes subfases: determinar los objetivos del negocio, evaluacin de la situacin, determinar objetivos del proceso de explotacin de datos y realizar el plan del proyecto. En este trabajo se correlacionan algunos objetivos del negocio detectables en la subfase de determinacin los objetivos del negocio con algunas tcnicas identificables en la subfase de realizacin del plan del proyecto. En orden a esto, se se enumeran los procesos de minera de datos: prediccin, construccin de modelos, descubrimiento de grupos, identificacin de factores y deteccin de perfiles; se identifican tcnicas de sistemas inteligentes de utilidad para ejecutar dichos procesos, se asocia dichos procesos con objetivos de negocio y se propone una abstraccin del proceso involucrado.

- El reto de las mtricas


Durante las cuatro dcadas pasadas, muchos investigadores intentaron desarrollar una mtrica, que proporcione una medida abarcadora de la complejidad del software. Fenton, la caracteriza como o una bsqueda imposible del Santo Grial, Zus, toma una visin un poco diferente en cuanto a la complejidad de la, misma, lo cual toma una analoga de que el software es como un auto nuevo, lo cual mide el atractivo segn el usuario. By Gimena Mariaca V

Lo cual debemos tener en cuenta que estas caractersticas o atractivos no deben ser tomados de forma arbitraria.

- Mtodo GQM Goal-Question-Metric


Goal Question Metric (GQM), o Meta-Pregunta-Mtrica, es un enfoque presentado por Vctor Basili de la Universidad de Maryland (1984) que da respuesta a esta necesidad. Este enfoque parte de la suposicin de que una organizacin para medir adecuadamente, debe identificar las metas que desea, derivar objetivos a medir de manera cuantificable y establecer un marco que permita interpretar la informacin respecto a los objetivos. Modelo GQM o Meta-Pregunta-Mtrica El modelo GQM es una estructura jerrquica que especifica a partir de un objetivo los efectos de la medicin, el objetivo a medir, la cuestin que debe medirse y el punto de vista de donde se toma la medida. Cada objetivo se descompone en varias preguntas para entender los componentes del objetivo y finalmente se obtienen mtricas que dan respuesta a cada una de las preguntas. Todo este proceso se descompone a tres niveles: Conceptual, Operativo y Cuantitativo.

Nivel conceptual (Meta): Se establece un objetivo para cada elemento de medicin, considerando el producto, proceso y los recursos, desde diferentes puntos de vista. Nivel operativo (Pregunta): Con base en las metas definidas se establece un conjunto de preguntas que permiten caracterizar la evaluacin / logro de un objetivo especfico. Nivel cuantitativo (Mtrica): A cada pregunta se le asocian datos que permitan dar respuesta cuantitativa a los objetivos, de manera objetiva o subjetiva.

[BI Y DATAWAREHOUSE] 5 Un modelo GQM puede compartir las mismas preguntas y mtricas para diferentes objetivos, aunque se obtienen valores diferentes segn el punto de vista. El modelo obtenido requiere ser aplicado, recolectados los datos, interpretados y evaluados para determinar el cumplimiento de los objetivos iniciales. Con esto se complementan todos los pasos para cubrir el enfoque de GQM.

- Modelizacin Causal
Esta mdoelizacin tiene que ver con las reglas de asociacin en donde la Causalidad es una Interpretacin no intuitiva Posible causa -> Consecuencia Consecuencia -> nica causa Confianza causal ConfCausal(X Y)= conf(X Y)+conf(X Y)/ 2

- Gestin de Rendimiento

- Breve introduccin a Balanced ScoreCard (BSC)


El cuadro de mando integral (CMI) o Balanced Scorecard (BSC, en ingls) es la herramienta que ordena, traduce y organiza los objetivos y planes estratgicos de una organizacin. El concepto rompe con el sistema tradicional de administracin del presupuesto que slo se concentra en el resultado financiero. By Gimena Mariaca V

Posee dos componentes importantes de trabajo: El mapa de la estrategia y el tablero balanceado donde se representan visualmente las perspectivas que el modelo busca atacar y llevan a la empresa a alcanzar las ventajas estratgicas en conjunto con las operaciones de la empresa. Ese mapa incluye indicadores que miden el valor de xito o fracaso de un objetivo, las metas, los compromisos y planes de accin. - Systems-Thinking approach, un captulo aparte. Es un conjunto de componentes interrelacionados dinmico y complejo trabajar juntos con el propsito de lograr un objetivo comn, dentro de un entorno que lo limita y agentes externos que le afectan. Se pueden distinguir 2 tipos de pensamiento de sistemas: La perspectiva financiera indica si la estrategia, puesta en prctica y ejecucin, contribuye con los objetivos (Generar Valor) La perspectiva de formacin, aprendizaje y crecimiento identifica la infraestructura necesaria para generar el valor que genere rentabilidad de corto y largo plazo. La perspectiva del cliente permite identificar los segmentos de los clientes y de mercado que proporcionan rendimientos financieros

[BI Y DATAWAREHOUSE] 7 REFERENCIAS Villena J, Crespo R., Garcia J. J., Mineria de datos , Inteligencia en redes de comunicaciones , universidad Carlos III. http://asprotech.blogspot.com/2010/09/goal-question-metric.html http://msdn.microsoft.com/es-es/library/ms174949%28v=sql.90%29.aspx http://www.masquecodificar.es/2012/11/mineria-de-datos-data-mining-i.html http://asprotech.blogspot.com/2010/09/goal-question-metric.html http://ingsoftwarezm.blogspot.com/2013/01/metricas-de-producto.html

By Gimena Mariaca V

Você também pode gostar