Você está na página 1de 45

Instituto Tecnolgico Superior de La Costa Chica

TPICOS AVANZADOS DE BASES DE DATOS


UNIDAD III
BASE DE DATOS PARA EL SOPORTE EN LA TOMA DE DECISIONES

LIC. INFORMATICA

IX SEMESTRE

3.4 Minera de Datos (Data Mining).


3.4.1 Definiciones y conceptos. 3.4.2 Aplicaciones de la minera de datos. 3.4.3 Diseo de mineros de datos. 3.4.4 Obtencin de informacin a travs de patrones de bsqueda 3.4.5 Tcnicas y herramientas de la minera de datos. 3.4.6 Tendencias en minera de datos.

Integrantes del Equipo


Vanessa Lizeth Rodrguez Ramrez Rene Campos lvarez Ins Castillo Anselmo Porfirio Gallardo Salmern

Dennys Adrian Martinez Rodriguez

3.4.1 Definiciones y conceptos.


La revolucin digital que se ha ido dando durante los ltimos aos, ha posibilitado que la captura y el almacenamiento de datos tenga un coste casi nulo. En la actualidad, las organizaciones pueden disponer de una cantidad enorme de datos almacenados y de los cuales sera de gran ayuda poder sacar informacin til.

3.4.1 Definiciones y conceptos.


Para poder tratar con estas cantidades de datos, las tcnicas tradicionales de estadstica y las herramientas de gestin clsicas no sirven debido a que no estn preparadas para trabajar con tanta informacin, as que se necesitan nuevas herramientas. La revolucin digital que se ha ido dando durante los ltimos aos, ha posibilitado que la captura y el almacenamiento de datos tenga un coste casi nulo.

3.4.1 Definiciones y conceptos.


La Inteligencia de Negocios o Business Intelligence (BI)
Se puede definir como el proceso de analizar los bienes o datos acumulados en la empresa y extraer una cierta inteligencia o conocimiento de ellos. Apoya a los tomadores de decisiones con la informacin correcta, en el momento y lugar correcto, lo que les permite tomar mejores decisiones de negocios. La informacin adecuada en el lugar y momento adecuado incrementa efectividad de cualquier empresa.

3.4.1 Definiciones y conceptos.


Descubrimiento de Conocimiento en Bases de Datos (KDD) El descubrimiento de la informacin oculta en las enormes masas de datos es posible gracias a la Minera de Datos (DataMining), que entre otras sofisticadas tcnicas aplica la inteligencia artificial para encontrar patrones y relaciones dentro de los datos permitiendo la creacin de modelos: representaciones abstractas de la realidad.

3.4.1 Definiciones y conceptos.


Descubrimiento de Conocimiento en Bases de Datos Es el KDD quien se encarga de la preparacin de los datos y la interpretacin de los resultados obtenidos, los cuales dan un significado a estos patrones encontrados. As el valor real de los datos reside en la informacin que se puede extraer de ellos, informacin que ayude a tomar decisiones o mejorar nuestra comprensin de los fenmenos que nos rodean. Empleando mtodos analticos avanzados para la explotacin de datos, los negocios incrementan sus ganancias, maximizan la eficiencia operativa, reducen costos y mejoran la satisfaccin del cliente

3.4.1 Definiciones y conceptos.


La minera de datos
La minera de datos es un proceso no trivial de identificacin vlida, novedosa, potencialmente til y entendible de patrones comprensibles que se encuentran ocultos en los datos. Es el proceso automtico para el descubrimiento de informacin til en grandes cantidades de datos. Es la integracin de un conjunto de reas que tienen como propsito la identificacin de un conocimiento obtenido a partir de las bases de datos que aporten un sesgo hacia la toma de decisin. Es la herramienta ms potente que acompaa a los responsables de una empresa o cualquier tipo de proyecto, en el momento de la toma de decisiones de negocios y en el anlisis de resultados presentes, pasados, y an futuros.

LIC. INFORMTICA

IV SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.1 Definiciones y conceptos


La minera de datos
Este proceso es un campo multidisciplinario, en el que se pretende predecir resultados y/o descubrir relaciones entre los diferentes datos. Es una herramienta capaz de abarcar una amplia gama de dominios, desde aquellos de la recuperacin y extraccin de informacin, presentacin, resumen de multidocumentos, minera de datos aplicada a textos, etctera.

La minera de datos o data Mining se encarga de la preparacin, el sondeo y la exploracin de los datos para obtener la informacin que no se encuentra visible.

LIC. INFORMTICA

IV SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.1 Definiciones y conceptos


Bajo ese procedimiento se engloba al conjunto de tcnicas que se utilizan en la extraccin de la informacin que permita su procesamiento. Existe una vinculacin a los procesos industriales debido a que resulta de utilidad obtener la informacin almacenada en las base de datos de la organizacin. El lugar en donde se encuentra la minera de datos o data Mining es en la inteligencia artificial y en el anlisis estadstico. La utilizacin de las tcnicas de minera permite abordar la solucin a los inconvenientes que se pueden presentar en la prediccin, en la clasificacin y en la segmentacin.

3.4.1 Definiciones y conceptos


El Descubrimiento de Conocimiento en Bases de Datos (KDD) apunta a procesar automticamente grandes cantidades de datos para encontrar conocimiento til en ellos, de esta manera permitir al usuario el uso de esta informacin valiosa para su conveniencia. El KDD es el Proceso no trivial de identificar patrones vlidos, novedosos, potencialmente tiles y, en ltima instancia, comprensibles a partir de los datos . El objetivo fundamental del KDD es encontrar conocimiento til, vlido, relevante y nuevo sobre un

fenmeno o actividad mediante algoritmos eficientes, dadas las crecientes rdenes de magnitud en los datos.

3.4.1 Definiciones y conceptos


Se observa igualmente el volumen que presenta en cada nivel y el valor que los responsables de las decisiones le dan en esa jerarqua. El rea interna dentro del tringulo representa los objetivos que se han propuesto. La separacin del tringulo representa la estrecha unin entre dato e informacin, no as entre la informacin y el conocimiento. El data mining trabaja en el nivel superior buscando patrones, comportamientos, agrupaciones, secuencias, tendencias o asociaciones que puedan generar algn modelo que nos permita comprender mejor el dominio para ayudar en una posible toma de decisin.

Ventajas
La Minera de Datos es una herramienta eficaz para dar respuestas a preguntas complejas de Inteligencia de Negocios. Las herramientas disponibles permiten automatizar gran parte de la tarea de encontrar los patrones de comportamiento ocultos en los datos. Es una buena manera de convertir datos en informacin, y esta a su vez en conocimiento, para la correcta toma de decisiones.

Desventajas
Que los productos a comercializar son significativamente costosos. Que se requiera de experiencia para utilizar herramientas de tecnologa. Que sea fcil de hallar patrones equvocos triviales o no interesantes. La Privacidad.

Conclusiones
Las empresas suelen generar grandes cantidades de informacin sobre sus procesos productivos, desempeo operacional, mercados y clientes. Pero el xito de los negocios depende por lo general de la habilidad para ver nuevas tendencias o cambios en las tendencias. Las aplicaciones de data Mining pueden identificar tendencias y comportamientos, no slo para extraer informacin, sino tambin para descubrir las relaciones en bases de datos que pueden identificar comportamientos que no son muy evidentes.

3.4.2 Aplicaciones de la minera de datos.


La utilidad de Data Mining se puede dar dentro de los siguientes aspectos: Sistemas parcialmente desconocidos: Si el modelo del sistema que produce los datos es bien conocido, entonces no necesitamos de la minera de datos ya que todas las variables son de alguna manera predecibles. Este no es el caso del comercio electrnico, debido a los efectos del comportamiento humano, el clima y de decisiones polticas entre otros. En estos casos habr una parte del sistema que es conocida y habr una parte aparentemente de naturaleza aleatoria. Bajo ciertas circunstancias, a partir de una gran cantidad de datos asociada con el sistema, existe la posibilidad de encontrar nuevos aspectos previamente desconocidos del modelo.

3.4.2 Aplicaciones de la minera de datos.


Enorme cantidad de datos: Al contar con mucha informacin en algunas bases de datos es importante para una empresa encontrar la forma de analizar "montaas" de informacin (lo que para un humano sera imposible) y que ello le produzca algn tipo de beneficio. Potente hardware y software: Muchas de las herramientaspresentes en la minera de datos estn basadas en el uso intensivo de la computacin, en consecuencia, un equipo conveniente y un software eficiente, con el cual cuente una compaa, aumentar el desempeo del proceso de buscar y analizar informacin, el cual a veces debe vrselas con producciones de datos del orden de los Gbytes/hora (repetimos, algo humanamente imposible). El uso del data mining puede ser provechoso en el caso de poseer datos sobre sus procesos productivos, datos de seguimiento de clientes, datos externos de mercado, datos sobre la actividad de competidores, etc.

3.4.2 Aplicaciones de la minera de datos.


Algunas de las reas donde ha sido exitosa son: Deteccin de fraudes: Esta es una aplicacin que puede ser considerada como una tcnica de clasificacin. En efecto, cuando el algoritmo analiza una gran cantidad de transacciones, el mismo tratar de categorizar aquellas que sean ilegtimas mediante la identificacin de ciertas caractersticas que estas ltimas tengan en comn. Esto puede ser usado en las corporaciones para prevenir que se culmine un proceso que muestre pertenecer a una "clase" peligrosa. Anlisis de riesgos en crditos: Esta es una aplicacin similar a la anterior, pero con la ventaja de la existencia de maneras tradicionales para realizarlo. El clsico procedimiento de asignacin de puntos puede ser complementado y mejorado con la ayuda de la minera de datos.

3.4.2 Aplicaciones de la minera de datos.


Clasificacin de cuerpos celestes: Debido a la gran contribucin a estas tareas por parte del reconocimiento de imgenes y los pre-procesamientos involucrados, esta aplicacin tambin puede considerarse como perteneciente al rea del reconocimiento de patrones de imgenes (Pattern Recognition).

3.4.2 Aplicaciones de la minera de datos.


Minera de texto: Con billones de pginas en la red, se requieren de nuevas tecnologas para encontrar, clasificar y detectar particulares patrones en la informacin disponible. La esencia de los mtodos de la minera de datos aplicados a los datos numricos, puede tambin ser aplicada a datos de texto.

3.4.2 Aplicaciones de la minera de datos.


Una franquicia de hoteles a nivel nacional que utiliza aplicaciones de BI para llevar un registro estadstico del porcentaje promedio de ocupacin del hotel, as como los das promedio de estancia de cada husped, considerando las diferencias entre temporadas. Con esta informacin ellos pueden: Calcular la rentabilidad de cada hotel en cada temporada del ao. Determinar quin es su segmento de mercado. Calcular la participacin de mercado de la franquicia y de cada hotel. Identificar oportunidades y amenazas.

3.4.3 Diseo de mineros de datos

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

KDD (Knowledge Discovery in Databases)


De la necesidad de descubrir conocimiento a partir de los datos, sale el proceso de Descubrimiento de Conocimiento en Bases de Datos o KDD. Ese proceso puede ser definido como el proceso no trivial de identificar patrones en los datos que sean vlidos, que aporten informacin desconocida hasta el momento, tiles y comprensibles. El KDD consta de tres partes bien diferenciadas: 1. Preprocesamiento de los datos. 2. Minera de Datos. 3. Postprocesamiento de los resultados.

LIC. INFORMTICA

IV SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

Proceso data Mining

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.3 Diseo de mineros de datos


En esta parte se emplean cuatro fases independientemente de la tcnica especfica de extraccin de conocimiento usada. 1. Filtrado de datos. 2. Seleccin de Variables.

3. Extraccin de Conocimiento.
4. Interpretacin y Evaluacin.

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.3 Diseo de mineros de datos


FILTRADO DE DATOS El formato de los datos contenidos en la fuente de datos nunca es el idneo, y la mayora de las veces no es posible utilizar ningn algoritmo de minera. Mediante el preprocesado, se filtran los datos (se eliminan valores incorrectos, no vlidos, desconocidos, etc.), se obtienen muestras de los mismos (mayor velocidad de respuesta del proceso), o se reducen el nmero de valores posibles (mediante redondeo, agrupamiento, etc.).

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.3 Diseo de mineros de datos


SELECCIN DE VARIABLES An despus de haber sido preprocesados, se sigue teniendo una cantidad ingente de datos. La seleccin de caractersticas reduce el tamao de los datos, eligiendo las variables ms influyentes en el problema, sin apenas sacrificar la calidad del modelo de conocimiento obtenido del proceso de minera. Los mtodos para la seleccin de caractersticas son dos: 1. Los basados en la eleccin de los mejores atributos del problema. 2. Los que buscan variables independientes mediante tests de sensibilidad, algoritmos de distancia o heursticos.

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.3 Diseo de mineros de datos


EXTRACCIN DE CONOCIMIENTO Mediante una tcnica se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociacin entre dichas variables. Tambin pueden usarse varias tcnicas a la vez para generar distintos modelos.

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.3 Diseo de mineros de datos


INTERPRETACIN Y EVALUACIN Finalmente se procede a su validacin, comprobando que las conclusiones son vlidas y satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas tcnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos alcanza los resultados esperados, se alterar alguno de los procesos anteriores en busca de nuevos modelos.

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

Las diferentes tareas que puede realizar la DM son:


Clasificacin: Mediante la clasificacin se busca encontrar un modelo que pueda predecir el comportamiento de una variable a partir de sus caractersticas. Anlisis de Asociaciones: Estas tcnicas pretenden sacar patrones de las relaciones que hay entre diferentes rasgos de los datos. Deteccin de Anomalas: El objetivo de la deteccin de anomalas es encontrar aquellos elementos o caractersticas que son significativamente diferentes del resto de los datos.

LIC. INFORMTICA

IV SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.4 Obtencin de informacin a travs de patrones de bsqueda


Los algoritmos de minera de datos se clasifican en dos grandes categoras: supervisados o predictivos y no supervisados o de descubrimiento del conocimiento. Los algoritmos supervisados o predictivos predicen el valor de un atributo (etiqueta) de un conjunto de datos, conocidos otros atributos (atributos descriptivos). A partir de datos cuya etiqueta se conoce se induce una relacin entre dicha etiqueta y otra serie de atributos. Esas relaciones sirven para realizar la prediccin en datos cuya etiqueta es desconocida. Esta forma de trabajar se conoce como aprendizaje supervisado y se desarrolla en dos fases: Entrenamiento (construccin de un modelo usando un subconjunto de datos con etiqueta conocida) y prueba (prueba del modelo sobre el resto de los datos).

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.4 Obtencin de informacin a travs de patrones de bsqueda


Cuando una aplicacin no es lo suficientemente madura no tiene el potencial necesario para una solucin predictiva, en ese caso hay que recurrir a los mtodos no supervisados de descubrimiento del conocimiento que descubren patrones y tendencias en los datos actuales (no utilizan datos histricos). El descubrimiento de esa informacin sirve para llevar a cabo acciones y obtener un beneficio (cientfico o de negocio) de ellas. En la tabla siguiente se muestran algunas de las tcnicas de minera de ambas categoras.

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.4 Obtencin de informacin a travs de patrones de bsqueda


Ejemplo de un minero de datos Un minero consta de dos partes: un extractor que saca o extrae cierto conjunto de datos que podran contener algo de inters, y un mdulo "revisor" o "verificador" que, mediante anlisis matemticos o estadsticos, dictamina si hubo algo interesante en el subconjunto de datos extrados. Esta divisin tiene un sentido prctico, pues refleja la situacin de la base de datos Informix (estoy describiendo el sistema que se construy), que yace en un servidor Unix ; en tanto que los mdulos revisores o verificadores son clientes que estn situados en PC's bajo DOS. Estas dos partes trabajan bajo el esquema cliente-servidor, o en un programa monoltico si el extractor (junto con la base de datos) y el revisor yacen en la misma computadora. El extractor se gua por el rbol de conceptos para accesar la base de datos, y por los "criterios de inters" para saber qu conviene extraer para su anlisis posterior por el verificador o revisor. El verificador hace su trabajo usando parmetros que le permiten clasificar o desechar los datos a l presentados como "interesantes" o "rutinarios."

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.4 Obtencin de informacin a travs de patrones de bsqueda


En general, cualquiera de los cuatro tipos de relaciones son buscados: Clases: Los datos almacenados se utiliza para localizar los datos en grupos predeterminados. Por ejemplo, una cadena de restaurantes podra extraer los datos de compra de los clientes para determinar cuando visitan los clientes y lo que suelen pedir. Clusters: Los elementos de datos se agrupan de acuerdo a las relaciones lgicas o preferencias de los consumidores. Por ejemplo, los datos pueden ser extrados para identificar segmentos de mercado o afinidades de los consumidores. Asociaciones: Los datos pueden ser extrados para identificar asociaciones. En el ejemplo de la cervezapaal es un ejemplo de la minera asociativa.

Patrones secuenciales: Los datos se extraen de anticipar los patrones de comportamiento y las tendencias. Por ejemplo, un minorista en equipo al aire libre podra predecir la probabilidad de una mochila que se compra basado en la compra de un consumidor de bolsos y zapatos para caminar dormido.

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.4 Obtencin de informacin a travs de patrones de bsqueda


EJEMPLO: Un caso famoso acerca del comportamiento de los consumidores. Encontraron que los das jueves y sbado, los hombres que compraban paales tambin compraban cerveza. Informacin como esa, que no siempre es evidente a primera vista, puede ser utilizada para reubicar la mercanca en lugares ms estratgicos, en este ejemplo, manteniendo a los paales y a las cervezas cercanos unos de otros. Este resultado suministrado por un proceso de minera de datos, puede ser analizado en profundidad por expertos humanos. Si ellos encuentran una explicacin razonable, esta de seguro ser de mucho ayuda para que los ejecutivos de la empresa alcancen sus objetivos de una manera ms eficiente.

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.5 Tcnicas y herramientas de la minera de datos.


La aplicacin de los algoritmos de minera de datos requiere la realizacin de una serie de actividades previas encaminadas a preparar los datos de entrada debido a que, en muchas ocasiones dichos datos proceden de fuentes heterogneas, no tienen el formato adecuado o contienen ruido. Por otra parte, es necesario interpretar y evaluar los resultados obtenidos.

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.5 Tcnicas y herramientas de la minera de datos.


El proceso completo consta de las siguientes etapas: 1. Determinacion de Objetos 2. Preparacion de Datos - Seleccin: Identificacin de las fuentes de informacin externas e internas y seleccin del subconjunto de datos necesario. - Preprocesamiento: estudio de la calidad de los datos y determinacin de las operaciones de minera que se pueden realizar. 3. Transformacion de Datos : conversin de datos en un modelo analtico. 4. Mineria de Datos: tratamiento automatizado de los datos seleccionados con una combinacin apropiada de algoritmos. 5. Anlisis de resultados: interpretacin de los resultados obtenidos en la etapa anterior, generalmente con la ayuda de una tcnica de visualizacin.

6. Asimilacin de Conocimiento: aplicacin del conocimiento descubierto.

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.5 Tcnicas y herramientas de la minera de datos.


Aunque los pasos anteriores se realizan en el orden en que aparecen, el proceso es altamente iterativo, establecindose retroalimentacin entre los mismos. Adems, no todos los pasos requieren el mismo esfuerzo, generalmente la etapa de preprocesamiento es la ms costosa ya que representa aproximadamente el 60 % del esfuerzo total, mientras que la etapa de minera slo representa el 10%.

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.5 Tcnicas y herramientas de la minera de datos.


Aplicaciones de minera de Datos en la medicin del software Las tcnicas de minera de datos se estn utilizando desde hace varios aos para la obtencin de patrones en los datos y para la extraccin de informacin valiosa en el campo de la Ingeniera del Software. Entre estas aplicaciones podemos citar la utilizacin de rboles de decisin en la construccin de modelos de clasificacin de diferentes caractersticas del desarrollo de software [Khoshgoftaar y Allen, 1999] [Porter y Selby, 1990] [Tian y Palma, 1998] La aplicacin de tcnicas de clustering en la planificacin del mantenimiento [Krohn y Boldyreff, 1999] En la estimacin de la fiabilidad del software [Podgurski et al., 1999] o el uso de redes neuronales en la prediccin de riesgos de mantenimiento en mdulos de programa [Khoshgoftaar y Lanning, 1995].

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.5 Tcnicas y herramientas de la minera de datos.


La mayor parte de los trabajos realizados estn dirigidos a la obtencin de modelos de estimacin de esfuerzo de desarrollo [Srinivasan y Fisher, 1995] y modelos de prediccin de diferentes aspectos de la calidad del software [Khoshgoftaar et al., 1997]. En ambos casos, las mtricas tanto de productos como de procesos juegan un papel importante, constituyendo la base para la construccin de los modelos y posterior validacin de los mismos.

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.5 Tcnicas y herramientas de la minera de datos.


En publicaciones recientes aparece la introduccin de algoritmos de minera en la realizacin de validaciones de modelos obtenidos mediante otras tcnicas. En estos trabajos se comprueba la validez de modelos de estimacin mediante mtodos de regresin, redes neuronales, algoritmos genticos, etc. [Dolado, 2000], se validan mtricas, e incluso frameworks de medicin [Mendona y Basili, 2000].

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.6 Tendencias en minera de datos


En el Gobierno: El FBI analizar las bases de datos comerciales para detectar terroristas. A principios del mes de julio de 2002, el director del Federal Bureau of Investigation (FBI), John Aschcroft, anunci que el Departamento de Justicia comenzar a introducirse en la vasta cantidad de datos comerciales referentes a los hbitos y preferencias de compra de los consumidores, con el fin de descubrir potenciales terroristas antes de que ejecuten una accin. La inversin inicial ronda los setenta millones de dlares estadounidenses para consolidar los almacenes de datos, desarrollar redes de seguridad para compartir informacin e implementar nuevo software analtico y de visualizacin.

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.6 Tendencias en minera de datos


En la Empresa Deteccin de fraudes en las tarjetas de crdito. En 2001, las instituciones financieras a escala mundial perdieron ms de 2.000 millones de dlares estadounidenses en fraudes con tarjetas de crdito y dbito. El Falcon Fraud Manager es un sistema inteligente que examina transacciones, propietarios de tarjetas y datos financieros para detectar y mitigar fraudes. En un principio estaba pensado, en instituciones financieras de Norteamrica, para detectar fraudes en tarjetas de crdito. Sin embargo, actualmente se le han incorporado funcionalidades de anlisis en las tarjetas comerciales, de combustibles y de dbito.

El sistema Falcon ha permitido ahorrar ms de seiscientos millones de dlares estadounidenses cada ao y protege aproximadamente ms de cuatrocientos cincuenta millones de pagos con tarjeta en todo el mundo
-aproximadamente el sesenta y cinco por ciento de todas las transacciones con tarjeta de crdito.

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

3.4.6 Tendencias en minera de datos


En la Empresa Deteccin de fraudes en las tarjetas de crdito. En 2001, las instituciones financieras a escala mundial perdieron ms de 2.000 millones de dlares estadounidenses en fraudes con tarjetas de crdito y dbito. El Falcon Fraud Manager es un sistema inteligente que examina transacciones, propietarios de tarjetas y datos financieros para detectar y mitigar fraudes. En un principio estaba pensado, en instituciones financieras de Norteamrica, para detectar fraudes en tarjetas de crdito. Sin embargo, actualmente se le han incorporado funcionalidades de anlisis en las tarjetas comerciales, de combustibles y de dbito.

El sistema Falcon ha permitido ahorrar ms de seiscientos millones de dlares estadounidenses cada ao y protege aproximadamente ms de cuatrocientos cincuenta millones de pagos con tarjeta en todo el mundo
-aproximadamente el sesenta y cinco por ciento de todas las transacciones con tarjeta de crdito.

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

Conclusin
Los mineros son productos recientes que trabajan sobre bases de datos relacionales conteniendo informacin extensa. Trabajan por lo general de manera asncrona (como demonios o procesos autnomos), y buscan de manera exhaustiva datos anmalos, interesantes, desviaciones, tendencias o anomalas. Para detectar tendencias incipientes, utilizan la suma de muchos valores, que a veces es difcil detectar de forma individual. Una ventaja de los mineros es que la bsqueda la hacen de manera autnoma y automtica, de noche o en horas de poco proceso, convirtindose en ayudantes importantes que utilizan el mismo criterio que el tomador de decisiones (un gerente de producto, por ejemplo).

Otra ventaja es que no requieren hardware especial o dedicado. Trabajan en las redes de oficinas nacionales (o regionales), utilizando por las noches el servidor relacional de bases de datos, y las PCs o estaciones de trabajo (donde yacern los revisores o verificadores) ya existentes. Es decir, trabajan sobre datos ya recolectados, en mquinas ya existentes, realizando labores tiles mientras los usuarios duermen.

LIC. INFORMATICA

IX SEMESTRE

TPICOS AVANZADOS DE BASES DE DATOS

Você também pode gostar