Você está na página 1de 8

Un Enfoque gil para el Desarrollo de Proyectos de Data Mining

Gonzalo Mariscal
Dept. de Sistemas InIormaticos y
Automatica
Universidad Europea de Madrid
Campus de Villaviciosa
28670 Villaviciosa de Odon (Madrid)
gonzalo.mariscaluem.es
Oscar Marban F. Javier Segovia
Dept. de Lenguajes y Sistemas InIormaticos e IS
Campus de Montegancedo
Facultad de InIormatica
Universidad Politecnica de Madrid
28660 Boadilla del Monte (Madrid)
omarbanIi.upm.es IsegoviaIi.upm.es


Resumen

Los proyectos de Data Mining se caracterizan
normalmente por tener requisitos volatiles o no
deIinidos al principio, debido al dinamismo del
negocio y la evolucion constante del mercado
|13|. Estas caracteristicas son comunes a los
proyectos de Ingenieria de SoItware en los que se
aplican las metodologias agiles, que son mas
Ilexibles y abiertas al cambio que las
metodologias tradicionales. En este articulo, los
autores realizan una comparativa entre las
caracteristicas de los proyectos de Ingenieria
SoItware, distinguiendo entre las IilosoIias Agil y
Tradicional, y las caracteristicas de los proyectos
de Data Mining. El principal objetivo de este
estudio es identiIicar IilosoIias de desarrollo de
proyectos soItware que puedan ser utilizadas en el
desarrollo de proyectos de Data Mining,
mejorando los procesos actuales.
1. Introduccin
Los sistemas inIormaticos con el tiempo han ido
creciendo en complejidad y tamao. Las
probabilidades de cometer errores y de perder el
control del presupuesto y del tiempo son mayores
a medida que esto ocurre. La ingenieria del
soItware, tomando y adaptando ideas extraidas de
otras ingenierias, ha desarrollado de manera
continua procesos, metodos y herramientas que
permitan desarrollar y mantener productos
soItware de calidad de una Iorma mas rapida, mas
sencilla y menos cara |23|.
Las Metodologias de Desarrollo de Proyectos
de Data Mining & Knowledge Discoverv, aunque
es un area mucho menos madura que la Ingenieria
de SoItware, han suIrido una evolucion parecida,
y es evidente que tienen unas caracteristicas muy
particulares distintas a los proyectos soItware
|16|.
En la actualidad, CRISP-DM |6| es la
metodologia mas utilizada para desarrollo de
proyectos de Data Mining, pero esta metodologia
no contempla aspectos de gestion de proyectos de
ingenieria como gestion del cambio, gestion de
calidad,... |16|, imprescindibles para desarrollar
con exito cualquier proyecto de ingenieria.
Los autores de este trabajo proponen utilizar
las IilosoIias de la Ingenieria de SoItware como
reIerencia para mejorar las metodologias de
desarrollo de Data Mining existentes en la
actualidad, al igual que la Ingenieria de SoItware
hizo con otras areas.
En el proximo apartado se revisa la
terminologia basica de cualquier ingenieria,
centrandose en la Ingenieria de SoItware y
distinguiendo entre las IilosoIias de desarrollo
soItware tradicional y agil. Posteriormente en el
tercer apartado, se revisa la bibliograIia de
trabajos anteriores que toman la Ingenieria de
SoItware como reIerencia y que aplican elementos
clasicos de la Ingenieria de SoItware al desarrollo
de proyectos de Data Mining. En la cuarta
seccion, se analizan las caracteristicas de los
proyectos de Ingenieria de SoItware desde los
puntos de vista tradicional y agil, y se comparan
con los proyectos de Data Mining. Finalmente se
plantea la posibilidad de adaptar metodologias de
desarrollo soItware al desarrollo de proyectos de
Data Mining.
2. Filosofas de desarrollo software
Antes de proIundizar en las IilosoIias de
desarrollo soItware, revisaremos la deIinicion de
los distintos componentes de la Ingenieria de
SoItware que participan en el desarrollo de un
producto soItware.


2.1.Terminologa Ingeniera de Software
Pressman |23| considera que la Ingenieria de
SoItware como cualquier ingenieria debe basarse
en la gestion de la calidad y la mejora de procesos.
Interpreta la Ingenieria de SoItware como una
tecnologia multicapa (ver Figura 1), donde el
proceso es la clave para controlar la gestion del
proyecto y establecer el contexto en el que se
aplican los metodos, se producen los resultados
(modelos, documentos, datos, inIormes, etc.), se
establecen hitos, se asegura la calidad, y el cambio
se gestiona adecuadamente.

Un enfoque de ca||dad
roceso
Mtodos
nerram|entas

Figura 1. Capas de la Ingenieria de SoItware |23|
En Ingenieria de SoItware, los metodos
indican como construir el soItware, y las
herramientas proporcionan un soporte automatico
o semi-automatico |23| para los metodos y el
proceso.
Por su parte, |27| simpliIica la deIinicion del
proceso software como un conjunto de actividades
cuyo objetivo es el desarrollo o evolucion de un
soItware.
Segun |12| una metodologia es el estudio de
como navegar a traves de cada Iase del modelo de
proceso soItware (determinando datos, control, o
jerarquias de uso, deIiniendo Iunciones y
estableciendo requisitos), y como representar los
productos de cada Iase (diagramas, hilos de
respuesta simultaneos, y diagramas de transicion
de estados).
2.2.Metodologas Tradicionales o Prescriptivas
Las metodologias tradicionales o prescriptivas son
aquellas que deIinen un conjunto de actividades,
acciones, tareas, Iundamentos y productos de
trabajo que se requieren para desarrollar un
soItware de alta calidad |23|. Estas metodologias
estan guiadas por una Iuerte planiIicacion durante
todo el proceso de desarrollo, donde se realiza una
intensa etapa de analisis y diseo antes de la
construccion del sistema.
2.3.Metodologas giles o Descriptivas
Un proceso es agil cuando el desarrollo de
soItware es incremental (entregas pequeas de
soItware, con ciclos rapidos), cooperativo (cliente
y desarrolladores trabajan juntos constantemente
con una cercana comunicacion), sencillo (el
metodo en si mismo es Iacil de aprender y
modiIicar, bien documentado), y adaptable
(permite realizar cambios de ultimo momento) |1|.
2.4.Metodologas Tradicionales vs.
Metodologas giles
Las metodologias Iormales de Ingenieria de
soItware establecen principios y practicas con el
objetivo de hacer el desarrollo de soItware mas
predecible y eIiciente. Dependiendo del grado de
Iormalidad, los metodos mas Iormales
(tradicionales) utilizan notaciones y tecnicas mas
especiIicas, mientras que los metodos menos
Iormales (agiles) utilizan tecnicas mas Ilexibles y
concentradas en practicas y experiencias.
Las primeras metodologias de desarrollo
soItware, intentaron adoptar conceptos de otras
ingenierias, acercandose a la idea de diseo
estructurado, requisitos diseo construccion,
estrategias que habia alcanzado el exito en areas
como manuIacturacion e ingenieria civil por
mencionar algunos ejemplos |23|. Sin embargo,
estos procesos aunque pudieron ser adaptados
para la produccion hardware no eran adaptables
para la produccion soItware. El soItware tenia
caracteristicas diIerentes que debian ser
consideradas. Hoy, las metodologias de soItware
se han agrupado bajo dos vertientes que tienen
tantos seguidores como detractores. Por un lado,
metodologias que contienen procedimientos muy
detallados y documentados para evitar el riesgo y
controlar la evolucion del proyecto, conocidas
como metodologias tradicionales y por otro lado,
metodologias que se enIocan a la capacidad de
respuesta ante el cambio y menos en el
seguimiento estricto de un plan, conocidas como
metodologias agiles.


3. De la Ingeniera de Software al Data
Mining
Muchos son los autores que han publicado
trabajos sobre la aplicacion de Data Mining a
datos de Ingenieria de SoItware o con el objetivo
de mejorar la gestion de proyectos soItware |3, 14,
18, 20|.
Sin embargo, son pocos los autores que han
utilizado herramientas comunmente utilizadas en
la Ingenieria de SoItware, tales como modelos de
procesos |16|, metodologias de desarrollo |2|, o
lenguajes de modelado de negocio |21, 29, 30, 31,
32|, para posteriormente adaptarlas y utilizarlas
con exito en proyectos de Data Mining.
En |16| se propone tomar la Ingenieria de
SoItware como reIerencia para deIinir modelos de
procesos que se adapten al desarrollo de proyectos
de Data Mining & Knowledge Discovery.
En |2| se aIirma que los proyectos de Data
Mining se caracterizan por tener requisitos
volatiles o no deIinidos, debido al dinamismo del
negocio y la evolucion constante del mercado.
Alnoukari et al. proponen la metodologia ASD-
DM para proyectos de Data Mining cuyo objetivo
es construir un modelo predictivo, adaptando la
metodologia agil de desarrollo soItware ASD al
desarrollo de proyectos de Data Mining de este
tipo.
En |13| se reIlejan las similitudes que existen
entre la IilosoIia agil en proyectos soItware y los
proyectos de data mining. Esta misma motivacion
es la que lleva a los autores a plantear la
posibilidad de estudiar y adaptar metodologias
agiles de desarrollo soItware al desarrollo de
proyectos de Data Mining.
Pardillo et. al. |21| describen una propuesta de
ingenieria orientada al modelo para proyectos de
Data Mining que se basa en UML para generar de
Iorma automatica aplicaciones de Data Mining a
partir de un modelo conceptual de Data Mining.
Pardillo, Trujillo y ZubcoII han implementado
extensiones de UML para modelar distintos tipos
de problemas de Data Mining, tales como reglas
de asociacion |29|, clasiIicacion |30|, clustering
|31| y series temporales |32|.
4. Comparativa de los Proyectos Data
Mining con las filosofas gil y
tradicional de Ingeniera de Software
A diIerencia de las metodologias tradicionales, la
IilosoIia agil da mayor valor al individuo, a la
colaboracion con el cliente y al desarrollo
incremental del soItware con iteraciones muy
cortas |1|. Para poder realizar un estudio sobre
que IilosoIia esta mas cercana al desarrollo de
proyectos de Data Mining (tradicional o agil), es
necesario deIinir previamente en que consiste un
proyecto de Data Mining.
4.1.Proyecto de Data Mining
En la actualidad se utiliza el termino Data
Mining de Iorma generica para reIerirse al proceso
completo de extraccion de conocimiento de
grandes volumenes de datos. A principios de los
aos 90, se planteo por primera vez el termino de
proceso de KDD |22|. El proceso de KDD se
deIine como 'el proceso no trivial de
identiIicacion de patrones validos, nuevos,
potencialmente utiles y comprensibles en los
datos |10|.
Desde el punto de vista de metodologias de
Data Mining, en el ao 2000 se produce el hito
mas importante, se publico el primer modelo de
proceso consensuado por varias empresas e
independiente de la herramienta para el desarrollo
de proyectos de Data Mining. Este modelo es
conocido como CRISP-DM (CRoss-Industry
Standard Process Ior Data Mining) |6| y esta
considerado como un estandar de Iacto` en el
mundo empresarial. En la Iigura 2 se representan
las Iases de CRISP-DM. Esta metodologia
propone las actividades que hay que realizar para
llevar a cabo el desarrollo de un proyecto de Data
Mining. Cada una de las actividades se divide en
tareas, para las que se indica que salidas produce y
que entradas necesita.


Business
understanding
Evaluation
Deployment
Data
understanding
Data
preparation
Modeling
Data

Figura 2. Metodologia CRISP-DM |6|
4.2.Seleccin de criterios de comparacin entre
filosofas tradicional y gil
A continuacion, vamos a seleccionar los
criterios de comparacion que consideramos mas
relevantes a la hora de elegir la IilosoIia de
desarrollo mas adecuada para proyectos soItware,
respecto a las IilosoIias tradicionales y agiles. Al
mismo tiempo, se revisaran estos mismos criterios
para describir las caracteristicas de los proyectos
de Data Mining. Para cada criterio se realiza un
analisis para determinar si se puede aplicar
directamente este criterio para caracterizar un
proyecto de Data Mining, o si por el contrario hay
que redeIinir dicho criterio para adaptarlo a Data
Mining.
Basandonos en varias reIerencias
bibliograIicas de Ing. SoItware |1, 5, 8, 9| y de
Data Mining |2, 13, 26, 28|, hemos seleccionado 7
criterios de comparacion (ver tabla 1) que nos
permitiran comparar que caracteristicas tienen los
proyectos soItware donde se aplican metodologias
agiles, con las caracteristicas de los proyectos
soItware donde se aplican metodologias
tradicionales, y a su vez compararlos con las
caracteristicas que normalmente tienen los
proyectos de Data Mining. Evidentemente algunos
criterios, aunque la esencia sea la misma, habra
que adaptarlos o redeIinirlos para aplicarlos a
Data Mining.
A continuacion se describe cada uno de los
criterios seleccionados, desde los puntos de vista
de Ingenieria de SoItware y de Data Mining:
1. Formalidad: Las metodologias agiles surgen
en oposicion al desarrollo de proyectos que
siguen metodologias muy Iormales y
estrictas. Estan basadas en heuristicas de
practicas de produccion de codigo, mientras
que las metodologias tradicionales estan
basadas en normas que provienen de
estandares seguidos por el entorno de
desarrollo. Cuando el proyecto es grande y
complejo, es preIerible tener una guia mas
detallada sobre lo que se debe hacer. Segun
el PMBOK |9|, mientras mas complejo es un
proyecto, mas cuidado hay que poner en la
deIinicion de metas de calendario,
responsabilidades, visibilidad, estudios de
riesgos, planiIicacion y gestion general del
proyecto. Los proyectos de mineria de datos
tienden a ser desarrollados siguiendo una
cultura mas parecida a la agil en lo que se
reIiere a la Iormalidad. Aunque la
documentacion es importante en el proceso
completo de Data Mining, solo hay que
emplear esIuerzos en la documentacion que
realmente es importante para desarrollar el
proyecto en el menor tiempo posible, sin que
el proceso de documentar implique retrasos
ni exceso de documentacion |6|. Esto no es
contradictorio con la importancia de emplear
un cuidado especial en la generacion de
resultados (reports) y la documentacion que
se presenta al usuario Iinal.
2. El tamao del proyecto corresponde a una
estimacion del numero de personas necesaria
para desarrollar el sistema. Proyectos
pequeos equivalen a 2000 o menos
esIuerzo-horas, proyectos medianos entre
2001 y 10.000, proyectos grandes de 10,000
en adelante |19|. Algunas metodologias
agiles miden el tamao del proyecto en dias
ideales (SCRUM |25|). Otras metodologias
sugieren otros metodos como storv points
(Extreme Programming |4|) en donde el
tamao se mide segun unidades subjetivas de
complejidad. Las metodologias tradicionales
generalmente utilizan, lineas de codigo y
puntos de Iuncion con el mismo Iin. Las
metodologias tradicionales, suelen usar
equipos de desarrollo mas grandes. Desde la
experiencia de los autores, los proyectos de
mineria de datos suelen ser desarrollados por
equipos pequeos, generalmente de 2 a 6
personas. CRISP-DM se puede aplicar en


proyectos de mineria de datos con equipos de
tamao pequeos y medianos. Para grandes
proyectos de de Data Mining, es complicado
estimar el tiempo y coste, y comunmente se
producen desviaciones de la planiIicacion
inicial |16|.
3. La criticidad es la naturaleza del dao que
pueden causar deIectos no detectados. Una
alta criticidad corresponde a proyectos cuyos
Iallos pueden causar perdidas de vida |8|.
Las metodologias agiles en general, no son
muy recomendadas para proyectos de alta
criticidad, pues no existe mucha experiencia
documentada sobre proyectos criticos
exitosos que han usado estas metodologias,
debido a la simplicidad de la documentacion
y del diseo. Metodologias tradicionales
como RUP |24| y MSF |17| han sido muy
utilizadas para proyectos criticos. Los
proyectos de Data Mining se consideraran de
baja criticidad, ya que su principal objetivo
es el de extraer nuevo conocimiento para la
mejora del negocio, sin que ello suponga
poner en juego vidas humanas como
establece |8|.
4. Ciclo de vida: Los metodos agiles utilizan un
modelo de desarrollo iterativo, con
iteraciones cortas y entregas de valor al
cliente. Al Iinal de cada iteracion
generalmente se realiza una re-evaluacion de
las prioridades del proyecto. Generalmente
este enIoque es usado en proyectos con
requisitos volatiles. Los metodos
tradicionales generalmente siguen un modelo
de desarrollo en cascada, una metodologia
rigida y lineal, con Ironteras bien marcadas
entre cada Iase. Generalmente este enIoque
es usado con proyectos que son estables, con
requisitos pocos cambiantes. Al igual que en
la mayoria de las metodologias agiles, los
proyectos de mineria de datos siguen un
modelo iterativo de desarrollo |6,11|.
5. Volatilidad de los Requisitos: Las
metodologias agiles asumen que los
requisitos cambian, por lo tanto tienen una
vision global de los mismos. Recogen
inIormacion de manera inIormal al inicio del
proyecto y lo reIinan en cada iteracion con
ayuda del usuario. En metodologias
tradicionales no se tiene la asuncion de que
los requisitos van a cambiar, o mas bien,
preIieren controlar el riesgo de que esto
ocurra. A inicio del proyecto suele realizarse
un documento detallado de requisitos. Los
proyectos de Data Mining se caracterizan
normalmente por tener requisitos volatiles o
no deIinidos, debido al dinamismo del
negocio y la evolucion constante del mercado
|2|. En |26| se identiIica como un Iactor
clave de exito en proyectos de Data Mining
la comprension de la mision del negocio y de
los objetivos del negocio. Se recoge
inIormacion sobre los requisitos al principio
y se va reIinando a medida que se comprende
el area de negocio y los datos. Los objetivos
de negocio se deben Iijar al principio de
proyecto y suelen mantenerse constantes,
mientras que los requisitos de Data Mining se
van especiIicando durante el desarrollo.
6. Cliente: En las metodologias agiles, el
cliente es parte continua del proceso de
desarrollo y los contratos se realizan de
Iorma progresiva. En las metodologias
tradicionales, el cliente no se involucra de
Iorma integra en el proceso y los contratos
son cerrados y establecidos a inicio del
proyecto. En CRISP-DM y en otros modelos
de Data Mining, es muy importante la
comunicacion con el cliente |26|,
especialmente al comienzo del proyecto
cuando se deIinen los objetivos y durante la
evaluacion del resultado, aunque los expertos
del dominio deben estar involucrados en la
mayoria de los procesos, ya que la
retroalimentacion continua y temprana que
pueden oIrecer es una ayuda signiIicativa
para cumplir los objetivos de negocio
establecidos.
7. Experiencia Desarrolladores: En los
proyectos tradicionales se puede Iormar a los
desarrolladores basandose en la
documentacion de proyectos anteriores, en
las entrevistas con el cliente, o utilizando
conocimiento externo. En los proyectos
agiles, al igual que ocurre en los proyectos de
Data Mining, se requiere que los
desarrolladores sean expertos en el tipo de
proyecto que se desarrolla, ya que la
documentacion utilizada no recoge todo el
conocimiento aplicado.



Tabla 1. Comparativa de las metodologias agiles y tradicionales de Ingenieria de SoItware con Data Mining
Metodo|og|as g||es Metodo|og|as 1rad|c|ona|es Data M|n|ng
1. Iorma||dad MeLodologlas
uescrlpLlvas. Las
meLodologlas son ms
flexlbles y ablerLas al
camblo.
MeLodologlas rescrlpLlvas.
CeneralmenLe requlere
documenLacln formal para
llclLacln de requlslLos,
dlseno, codlflcacln y
pruebas para cada fase del
proceso.
nfoque qi/:
Metodo|og|as
Descr|pt|vas. Las
metodo|og|as son
f|ex|b|es y ab|ertas a|
camb|o.
2. 1amao de|
royecto
ara proyecLos
pequenos y medlanos.
Algunas meLodologlas
son apllcables a
proyecLos grandes,
pero no esLn blen
documenLadas.
ara proyecLos medlanos y
grandes. uede resulLar dlflcll
de adapLar en pequenos
proyecLos
nfoque qi/: ara
proyectos pequeos y
med|anos. D|f|c|| de
gest|onar grandes
proyectos.
3. Cr|t|c|dad de|
royecto
Apllcable a proyecLos
de ba[a crlLlcldad.
ara proyecLos de ba[a a alLa
crlLlcldad.
nfoque qi/: ara
proyectos de ba[a
cr|t|c|dad.
4. C|c|o de V|da Slgue un modelo
lLeraLlvo
Slgue un modelo en cascada nfoque qi/: S|gue un
mode|o en |terat|vo
S. Vo|at|||dad de
|os kequ|s|tos
Consldera requlslLos
volLlles o no
deflnldos
Consldera requlslLos esLables nfoque qi/:
Cons|dera requ|s|tos
vo|t||es o no
def|n|dos
6. art|c|pac|n
de| C||ente
Ll cllenLe es parLe del
proceso de desarrollo.
Ll cllenLe lnLeracLua con el
equlpo de desarrollo sln
formar parLe lnLegra de el.
nfoque qi/: L| c||ente
y e| experto de|
dom|n|o son parte de|
proceso de desarro||o.
7. Lxper|enc|a
Desarro||adores
glles,
experlmenLados,
esLables,
colaboraLlvos
Capacldades adecuadas
orlenLadas al plan, acceso a
conoclmlenLo exLerno
nfoque qi/: g||es,
exper|mentados,
estab|es,
co|aborat|vos

En la Tabla 1 se puede observar que en los
criterios de comparacion seleccionados, los
proyectos de Data Mining estan proximos al
enIoque agil y se alejan del enIoque tradicional.
5. Conclusiones y lneas futuras
Considerando lo expuesto en el apartado anterior,
los proyectos de Data Mining se adaptan mas al
enIoque agil, segun los criterios que se han tenido
en cuenta: Formalidad, Tamao del Proyecto,
Criticidad del Proyecto, Ciclo de Vida,
Volatilidad de los Requisitos, Participacion del
Cliente, y Experiencia de los Desarrolladores.
Se puede concluir por tanto que los proyectos
de Data Mining, en general, suelen coincidir con
las caracteristicas que se presupone a un proyecto
soItware donde se aplica una metodologia agil.
En |16| se propone la adaptacion de modelos
de procesos de Ingenieria de SoItware a Data
Mining para cubrir las deIiciencias que existen en
la actualidad en la metodologia de Data Mining
mas utilizada, CRISP-DM, en lo que se reIiere a la
escasez de procesos de gestion, organizacion y la
calidad del proyecto.
Siguiendo la misma IilosoIia, proponemos
como continuacion de esta investigacion la


posibilidad de desarrollar una metodologia agil
para proyectos de Data Mining, partiendo de
metodologias agiles de Ingenieria de SoItware. El
objetivo ideal seria crear una metodologia agil
para el desarrollo de cualquier tipo de proyecto de
Data Mining, independiente del dominio, que
pueda ser usada para resolver cualquier tipo de
problema de Data Mining. Para ello, despues del
estudio presentado, los siguientes pasos se deben
enIocar en seleccionar una o varias metodologias
agiles de Ingenieria de SoItware, y adaptarla al
desarrollo de proyectos de Data Mining,
modiIicando o aadiendo tareas tipicas de Data
Mining que no se contemplen en Ingenieria de
SoItware.
Como reIerencias para el exito de esta
propuesta, ademas de tener en cuenta las tareas
que propone la metodologia de Data Mining
CRISP-DM, que es la mas utilizada en la
actualidad, se recomienda revisar en detalle
estudios anteriores que adaptan elementos de la
Ingenieria de SoItware a Data Mining. Merece
mencion especial la metodologia agil propuesta en
|2| para generar modelos predictivos. Ademas, se
propone tomar como base el modelo de proceso
presentado en |16|, donde se deIinen procesos que
consideramos claves y que no se usan en la
actualidad en las metodologias de Data Mining,
como pueden ser la gestion, la organizacion y la
calidad del proyecto.
Referencias
|1|Abrahamsson, P., Salo, O., Ronkainen, J., &
Warsta, J. Agile soItware development
methods. Review and analysis. VTT
Publications 478, 2002
|2|Alnoukari, M; Alzoabi, Z; and Hanna, S.
Applying adaptive soItware development
(ASD) agile modeling on predictive data
mining applications: ASD-DM methodology.
ITSim 2008. International Symposium. 2008.
Volume: 2, pags. 1-6. Kuala Lumpur,
Malaysia.
|3|Automated SoItware Engineering Research
Group. Bibliography on Mining SoItware
Engineering Data.
https://sites.google.com/site/asergrp/dmse,
2010.
|4|Beck, K., Andres, C. Extreme Programming
Explained: Embrace Change (2nd Edition).
Addison Wesley, Boston, 2004.
|5|Boehm, B., & Turner, R. Using risk to balance
agile and plan- driven methods. IEEE, 2003.
|6|Chapman, P., Clinton, J., Kerber, R., Khabaza,
T., Reinartz, T., Shearer, C., and Wirth, R.
CRISP-DM 1.0 step-by-step data mining
guide. Technical report, CRISP-DM, 2000.
|7|Chin, Gary (2004). Agile Project
Management: How to Succeed in the Face oI
Changing Project Requirements. AMACOM.
|8|Cockburn, A. The Crystal Methods or how to
make a methodology Iit. Humans and
Technology presentation. Salt Lake, UK.
2003.
|9|Cooke-Davies, T. J. Towards improved project
management practice: Uncovering the
evidence Ior eIIective practices through
empirical research. USA: Dissertation.com.
2001
|10|U. Fayyad, G. Piatetsky-Shapiro, P. Smith,
and R. Uthurusamy. Advances in Knowledge
Discovey and Data Mining. AAAI/MIT Press,
MA, 1996.
|11|Fayyad, U. M., Piaetsky-Shapiro, G., &
Smyth, P. (1996). From Data Mining to
Knowledge Discovery: An Overview.
AAAI/MIT press .
|12|The Free On-line Dictionary oI Computing.
London UK, http://wombat.doc.ic.ac.uk/cgi-
bin/Ioldoc, 2010.
|13|Graham, W. Data Mining - Desktop Survival
Guide. Togaware, 2010.
|14|Hassan, A., Xie, T. Mining SoItware
Engineering Data. ICSE 2010 Tutorial T18,
2010.
|15|Highsmith, J. and A. Cockburn, Agile
SoItware Development: The Business oI
Innovation, IEEE Computer, Sept. 2001.
|16|Marban, O.; Segovia, J.; Menasalvas, E.;
Fernandez, C. Toward data mining
engineering: a soItware engineering approach.
InIormation systems, Vol. 34, N 1, 2008,
pags. 87-107.
|17|Meier, J.D., Taylor,J., Bansode, P.,
Mackman, A., and Jones, K. Team
Development with Visual Studio Team
Foundation Server. MicrosoIt Corporation,
2007.
|18|Mendonca, M., SunderhaIt, N. Mining
SoItware Engineering Data: A Survey State-


oI-the-Art Report (SOAR). DACS Technical
Reports. 1999
|19|MG RUSH. Glosary: http://www.mgrush.
com/content/view/70/33/, 2010.
|20|Pannurat, N., Kerdprasop, N., and
Kerdprasop, K. Database Reverse Engineering
based on Association Rule Mining. IJCSI
International Journal oI Computer Science
Issues, Vol. 7, Issue 2, No 3, March 2010.
|21|Pardillo,J., Norberto, J., ZubcoII, J., Trujillo,
J. Towards a Model-Driven Engineering
Approach oI Data Mining.
|22|G. Piatetsky-Shaphiro and W. Frawley.
Knowledge Discovery in Databases.
AAAI/MIT Press, MA, 1991.
|23|Pressman, R. Ingenieria del SoItware: Un
enIoque practico, Sexta Edicion. McGraw
Hill. 2005.
|24|Rational. Rational UniIied Process: Best
Practices Ior SoItware Development Teams.
Rational SoItware White Paper. TP026B, Rev
11/01. 1998.
|25|Schwaber, K. SCRUM Development Process.
Workshop Report: Business Object Design
and Implementation.10th Annual ConIerence
on Object-Oriented Programming Systems,
Languages, and Application, 1995.
|26|Sim, J., Critical success Iactors in data
mining projects. Doctor oI Philosophy
(Business Computer InIormation Systems),
UNIVERSITY OF NORTH TEXAS, 2003.
|27|Sommerville, I. "SoItware Engineering",
Sixth Edition, Pearson Education, 2001.
|28|Subramanian, G. H., Klein, G., Jiang, J. J.,
and Chan, C. Balancing Iour Iactors in system
development projects. Commun. ACM 52, 10.
118-121, 2009.
|29|ZubcoII,J., Trujillo, J. Extending the UML
Ior Designing Association Rule Mining
Models Ior Data Warehouses. DaWaK 2005:
11-21
|30|ZubcoII,J., Trujillo, J. Conceptual Modeling
Ior ClassiIication Mining in Data Warehouses.
DaWaK 2006: 566-575
|31|ZubcoII,J., Pardillo, J, Trujillo, J. Integrating
Clustering Data Mining into the
Multidimensional Modeling oI Data
Warehouses with UML ProIiles. DaWaK
2007: 199-208
|32|ZubcoII,J., Pardillo, J., Trujillo, J. A UML
proIile Ior the conceptual modelling oI data-
mining with time-series in data warehouses.
InIormation & SoItware Technology 51(6):
977-992 (2009)

Você também pode gostar