Você está na página 1de 6

XX Workshop de Investigadores en Ciencias de la Computación 300

IMPLEMENTACIÓN DE TÉCNICAS ESPECÍFICAS DE MINERÍA DE DATOS EN


APLICACIONES WEB CON MOTORES DE BASE DE DATOS RELACIONALES

VARGAS, Luis Alejandro; FARFAN, José Humberto; RODRIGUEZ, Mariela Ester; TAPIA,
Marcela Alejandra; PAREDES, Julio Cesar RAMOS, Pablo Nicolás; LLAMPA, Alvaro
Facundo; MONTES, Leonardo Ezequiel; MOGRO, Nelson Ariel & CORDOBA, Irma Rafaela
Mercedes;
Ingeniería + Software (I+S), Área de Ingeniería Informática, Facultad de Ingeniería,
Universidad Nacional de Jujuy (U.N.Ju).

ARAMAYO, Fernando Rubén & SPADONI, Gustavo Fernando


Facultad de Ciencias Agrarias, Universidad Nacional de Jujuy (U.N.Ju.)

RESUMEN aplicándolas en lenguajes de programación


El presente proyecto pretende implementar web e implementarlos con motores de Base de
técnicas de Datamining o también denominado Datos. Es obligatorio y necesario conocer en
Minería de Datos en aplicaciones web de detalle los lenguajes involucrados, estudiar la
sistemas informáticos y procesan la implementación correcta de las técnicas de
información con motores de Base de Datos Minería de Datos y la conectividad con el
Relacionales, es decir efectuar “Análisis motor de Base de Datos.
Inteligente de Datos”. En el desarrollo de
tecnologías web genera la necesidad de contar Palabras Clave: Datamining, Análisis
con herramientas, carencia que se ha Inteligente, Programación Web
analizado y detectado en investigaciones
anteriores, por lo que se pretende CONTEXTO
implementarlo en lenguajes específicos de El proyecto se encuentra inserto dentro de las
programación web. siguientes Líneas Prioritarias de Investigación
Implica obtener ventajass y beneficios de la de la Facultad de Ingeniería (LIPIFI) - UNJu:
Minería de Datos ya sea aplicando técnicas
específicas de descripción o de aprendizaje - Ingeniería del Software
automático. Se puede mencionar Redes - Ingeniería de Procesos
Neuronales, reglas de asociación, clustering o Es un proyecto aprobado de categoría B
similares, en cualquier problema genérico de (Código D/B030)
un Sistema Informático desarrollado en un Financiamiento: Secretaría de Ciencia y
lenguaje de programación web. El objetivo es Técnica y Estudios Regionales (SeCTER) de
realizar en los datos un “Análisis Inteligente la UNJu.
de Datos”. Vigencia del Proyecto: 01/01/2018 al
Para lograr este objetivo es necesario clasificar 31/12/2019
y estudiar en profundidad las técnicas que
representan a la Minería de Datos,

26 y 27 de Abril de 2018 RedUNCI - UNNE - ISBN 978-987-3619-27-4


XX Workshop de Investigadores en Ciencias de la Computación 301

la extracción de conocimiento (KDD) en una


1. INTRODUCCIÓN secuencia iterativa de cuatro pasos: la
definición del problema, el pre -
Se entiende que la Minería de Datos es “un procesamiento de datos (que incluye la
campo de la estadística y las ciencias de la preparación de datos), data mining, y el post
computación referido al proceso que intenta data mining.
descubrir patrones en grandes volúmenes de Como se mencionó anteriormente el proyecto
conjuntos de datos” [1], el actual Grupo de de investigación “Data Mining aplicado a
Investigación se inició en el año 2.016 con el análisis telefónico” se encuentra en su última
proyecto, aprobado, de categoría B fase, centrado en el análisis y aplicación de
denominado “Data Mining aplicado a análisis técnicas específicas de minería de datos al
telefónico”, el mismo ha finalizado en problema de estudio, abarcando y estudiando
diciembre de 2017, siendo importante destacar los resultados que son de utilidad a los
que se aplicaron técnicas de Minería de Datos usuarios finales que hacen uso de la misma,
exclusivas para encontrar soluciones al principalmente en el área de seguridad
problema en cuestión. Este último es un gubernamental.
problema genérico en el que se realizó un Sin embargo existe una cantidad de técnicas
Análisis de Datos de una Red de que son estudiadas por la Minería de Datos y
Comunicaciones con el formato actual que que es necesario profundizar para fortalecer un
proveen las compañías telefónicas grupo de investigación destinado a esta
denominado “Sábanas de llamadas” para ser ciencia. Una clasificación sumamente
aplicados en el ámbito de la Seguridad de interesante y bastante completa es la planteada
Organismos Gubernamentales Provinciales y/o por Orallo et al [5] en donde se observa en
Nacionales, siendo necesario por ello forma más detallada las técnicas particulares
examinar y describir técnicas y herramientas que pueden aplicarse según se trate de
que emergen en esa área de investigación problemas Predictivos o Descriptivos (Tabla
aplicadas a la toma de decisiones [2]. 1).
El descubrimiento de la información oculta es
de importancia estratégica, y es posible por las
características de la Minería de Datos, pero es
el descubrimiento del conocimiento (KDD,
por sus siglas en inglés) el que se encarga de
la preparación de los datos y de la
interpretación de los resultados obtenidos, los
cuales darán significado a los patrones
encontrados [3]. Se destaca que KDD es Tabla 1: Aplicación de técnicas
producto del rápido desarrollo de la minería de de Data Mining según el tipo de Problema
datos y la aplicación de tecnologías de
información y bases de datos. El trabajo realizado precedentemente por el
Zhang et al [4] formulan el proceso basado de grupo de investigación se enfocó en la

26 y 27 de Abril de 2018 RedUNCI - UNNE - ISBN 978-987-3619-27-4


XX Workshop de Investigadores en Ciencias de la Computación 302

aplicación de la minería de datos en el ámbito para requerir la información de ella, tarea que
de la seguridad. Sin embargo, se pudo las empresas se han visto obligadas a requerir
determinar que el conjunto de herramientas y les permite ser competitivos en el mercado
que la caracterizan es amplio y surgieron actual. En estas últimas décadas los usuarios
problemas en la integración con los sistemas consumen productos y servicios por la web y
de donde se extraían la información, la esta modalidad de mercado exige que las
mayoría de ellos sistemas informáticos de empresas deban extraer conocimientos de la
plataforma web. Es objetivo del equipo de información con la que cuentan y puedan
trabajo investigar el procedimiento de incluir predecir acciones. Es sumamente importante
las técnicas de minería de datos en los la integración de los sistemas con la extracción
sistemas que hoy cuentan con la información del conocimiento que se realiza.
necesaria para tomar decisiones. Se puede afirmar en consecuencia que la etapa
La Inteligencia de negocios o BI, por sus de requerir y hacer uso de la información tiene
siglas en inglés, según el Data Warehouse un desafío mayor y consistente en la
Institute, lo define como la combinación de extracción del conocimiento o análisis
tecnología, herramientas y procesos que inteligente.
permiten transformar los datos almacenados Una falencia o una situación a considerar que
en información, esta información es se presentó en la investigación realizada
conocimiento y este conocimiento debe estar previamente por este grupo, es la falta de
dirigido a un plan o tener una estrategia implementación o interrelación de las técnicas
comercial. La inteligencia de negocios debe empleadas en estas herramientas de Minería
ser parte de la estrategia empresarial, que de Datos en lenguajes de programación.
permite optimizar la utilización de recursos, Existen herramientas en el mercado actual
monitorear el cumplimiento de los objetivos para Minería de Datos, tal como se puede
de la empresa y la capacidad de tomar buenas observar en el llamado “Cuadrante Mágico”
decisiones para obtener mejores resultados, tal para plataformas de Análisis Predictivo del
como puede observar en la imagen1.[8] año 2.016 (Imagen 2), de la empresa Gartner,
organización de investigación de las
tecnologías de la información reconocida
mundialmente, en donde se muestra la
comparación de las principales herramientas
para Plataformas Analítica Avanzadas [6], con
características y funcionalidades totalmente
Imagen 1: Pasos de la Inteligencia de
Negocios

Los pasos que detalla el The Data


Warehousing Institute se refiere al proceso de
convertir datos en conocimiento,
posteriormente reflejar en acciones
competitivas. Los datos deben ser procesados

26 y 27 de Abril de 2018 RedUNCI - UNNE - ISBN 978-987-3619-27-4


XX Workshop de Investigadores en Ciencias de la Computación 303

diferentes entre ellas. lugares se puede visualizar que los lenguajes


son de caracteristica web y la integración que
se debe desarrollar con la herramientas de la
imagen 2, deben estar en esta línea de trabajo.
La empresa o entidad que necesita tomar
decisiones debe por lo tanto integrar la
información que posee y el modelo de
extracción del conocimiento, siendo para ello
necesario relacionar el modelo de
conocimiento con el sistema informático, para
que personas de los distintos ámbitos de la
empresa puedan realizar el análisis con los
datos de la organización.

Imagen 2: “Cuadrante Mágico” para 2. LÍNEAS DE INVESTIGACIÓN Y


plataformas de Análisis Predictivo 2.016 de DESARROLLO
Gartner
Dentro de las Líneas Prioritarias de
Hay también, lenguajes de programación que Investigación de la Facultad de Ingeniería
son utiizados mundialmente, donde se suele (LIPIFI) - UNJu los temas que se investigarán
tomar como medida el Índice “TIOBE Quality y desarrollarán serian:
Indicator”, el cual es un índice elaborado por ● Técnicas Descriptivas de
una empresa de software holandesa que se Minería de Datos
especializa en la evaluación y seguimiento de ● Técnicas Predictivas de
la calidad de los programas informáticos[7], Minería de Datos
tal como se observa en la imagen 3, revisando ● Herramientas de Software
actualmente en tiempo real más de 300 Libre para Datamining
millones de códigos de diversos programas. ● Análisis Inteligente de Datos

3. RESULTADOS OBTENIDOS /
ESPERADOS

El presente proyecto se encuentra en su fase


inicial, y busca cumplir el objetivo general:
Imagen 3: Comparación de los principales
Implementar técnicas específicas de
lenguajes, índice TIOBE, agosto de 2.017
herramientas de Minería de datos en
De acuerdo a dicho cuadro comparativo se
aplicaciones web de sistemas informáticos con
debe hacer hincapié en los lenguajes que son
Base de Datos Relacionales; y presenta los
frecuentemente utilizados para desarrollo de
siguientes Objetivos específicos:
sistemas, considerando que en los primeros

26 y 27 de Abril de 2018 RedUNCI - UNNE - ISBN 978-987-3619-27-4


XX Workshop de Investigadores en Ciencias de la Computación 304

● Estudiar y profundizar en las Informática -


principales técnicas de Minería de Fac.Ing.UNJu
Datos,
● Analizar y establecer las principales Aramayo, Lic-Sistemas- Investigador

características de las herramientas de Fernando Ingeniero en


Ruben Informática -
Minería de Datos disponibles en la
Fac.Cs.Agr.
actualidad que permitan su UNJu
implementación en lenguajes de
programación web. Ramos, Pablo Estudiante Investigador

● Estudiar y comparar los principales Nicolás Ingeniería en


Informática -
lenguajes de programación web
Fac.Ing.UNJu
disponibles en el mercado actual.
● Estudiar e implementar la conectividad Llampa, Estudiante Investigador
de los lenguaje/s de programación web Alvaro Ingeniería en
seleccionados con un motor de base de Facundo Informática -
datos relacional. Fac.Ing.UNJu
● Implementar las técnicas de las Montes, Estudiante Investigador
herramientas selecionadas en los Leonardo Ingeniería
lenguajes de programación web Ezequiel Informática -
estudiados. Fac.Ing.UNJu
● Realizar prácticas de Análisis Mogro, Estudiante Investigador
Inteligente en problemas específicos de Nelson Ariel Ingeniería en
Minería de Datos. Informática,
Fac.Ing.UNJu
4. FORMACIÓN DE RECURSOS
Córdoba, Irma Ingeniera en Investigador
HUMANOS
Rafaela Informática -
Mercedes Fac.Ing.UNJu
Apellido/s y Formación y Rol Dentro
Nombre/s Unidad del Tapia, Ingeniera en Investigador
Académica Proyecto Marcela Sistemas de
Alejandra Información
Vargas, Luis Ingeniero en Director Fac.Ing.UNJu
Alejandro Informática -
Fac.Ing.UNJu Paredes, Julio Programador Investigador
Cesar Universitario
Farfán, José Esp.Doc.Sup - Co Fac.Ing.UNJu
Humberto Ingeniero en Director
Informática - Spadoni, Médico Investigador
Fac.Ing.UNJu Gustavo Veterinario
Fernando Fac.Cs.Agr.
Rodriguez, Lic.Sistemas - Investigador UNJu
Mariela Ester Ingeniero en

26 y 27 de Abril de 2018 RedUNCI - UNNE - ISBN 978-987-3619-27-4


XX Workshop de Investigadores en Ciencias de la Computación 305

Los alumnos Leonardo Ezequiel Montes y http://exa.unne.edu.ar/informatica/SO/Mineria


Nelson Ariel Mogro se encuentran _Datos_Vallejos.pdf, Universidad Nacional
desarrollando la tesis de grado para la del Nordeste, 2006
obtención del título de Ingeniero en [4] Zhang, S., Zhang, C., & Yang, Q. , “Data
Informática denominado “Minería de datos preparation for data mining. Applied Artificial
para soporte a decisiones de planificación Intelligence”, San Francisco, 2003, págs. 375-
educativa” cuyo Director es el Esp. Ing. José 381.
Farfán, su Codirector Ing. Mariela Rodriguez. [5] Hernández Orallo J., Ramírez Quintana J.,
Ramirez C.F., “Introducción a la Minería de
5. BIBLIOGRAFIA Datos”, Universidad Politécnica de Valencia,
España, Ed.Pearson, 2004, págs 19-42, 137-
[1] Maimon, O., & Rokac, L., 2010. ¨Data 164, 237-252
Mining and Knowledge Discovery [6] Gartner, “Magic Quadrant for Advanced
Handbook”, “O. Maimon, & L. Rokac, Data Analytics Platforms”. Obtenido de
Mining and Knowledge Discovery http://www.kdnuggets.com/2017/02/gartner-
Handbook”, Nueva York, Springer, 2010, 2017-mq-data-science-platforms-gainers-
págs. 1-18. losers.html en Agosto de 2.017.
[2] Yelitza, J., Marcano, A., & Rosalba [7] TIOBE Quality Indicator. The Importance
Talavera, P. , “Minería de Datos como soporte of Being Earnest Quality Indicator. Obtenido
a la toma de decisiones empresariales” , de https://www.tiobe.com/tiobe-index/ en
Obtenido de Septiembre de 2.017.
http://www.scielo.org.ve/scielo.php?script=sci [8] Oracle, Inteligencia de Negocios. Obtenido
_arttext&pid=S1012-15872007000100008 en de
Agosto de 2.017, Universidad de Zulia, http://www.oracle.com/ocom/groups/public/@
Maracaibo, 2007 otn/documents/webcontent/317529_esa.pdf en
[3] Vallejos, S. J. . ¨Minería de Datos¨, setiembre de 2017
Obtenido de

26 y 27 de Abril de 2018 RedUNCI - UNNE - ISBN 978-987-3619-27-4

Você também pode gostar