Você está na página 1de 3

UNIVERSIDADE DE BRASLIA FACULDADE DE CINCIA DA COMPUTAO, PS-GRADUAO EM COMPUTAO APLICADA MINERAO DE DADOS

COMPARAO ENTRE METODOLOGIAS DE MINERAO DE DADOS KDD, SEMMA E CRISP-DM


Aluno: Democlydes Divino Pereira de Carvalho
1. Identificao do artigo

Azevedo, Ana. Santos, Filipe Santos , KDD, SEMMA AND CRISP-DM: A PARALLEL OVERVIEW. ISBN: 978-972-8924-63-8 2008 IADIS. 2. Palavras-chave Padres de Minerao de Dados, Descoberta de Conhecimento em Bancos de Dados, Minerao de Dados. 3. Sinopse do texto Tem havido, Nos ltimos anos, um enorme crescimento e consolidao do campo de minerao de dados. Alguns esforos esto sendo feitos em busca do estabelecimento de padres na rea. Includo nesses esforos podem ser enumerados SEMMA e CRISP-DM. Ambos crescem como padres industriais e definem um conjunto de etapas sequenciais que pretende orientar a implementao de aplicaes de minerao de dados. Neste trabalho, intenciona-se estabelecer um paralelo entre estes e o processo de KDD, bem como a compreenso das semelhanas entre eles. DCBD, A descoberta de conhecimento em bancos de dados ou termo KDD (knowledge discovery in databases) o processo de utilizao de mtodos de DM para extrair o que considerado o conhecimento de acordo com a especificao das medidas e os limiares, utilizando um banco de dados, juntamente com todo o pr-processamento exigido, subamostragem, e transformao da base de dados. O SEMMA (Sample, Explore, Modify, Model, Assess) significa (Amostragem, Explorao, Modificao, Modelo, Avaliao) e oferece um jeito fcil de compreender o processo permitindo um desenvolvimento organizado e adequado e manuteno de projetos de DM. Confere assim uma estrutura para a sua concepo, criao e evoluo, ajudando a apresentar solues para problemas empresariais, bem como para encontrar os objetivos de negcio de DM.

CRISP- DM (CRoss-Industry Standard Process for Data Mining) significa Processo Padro Inter Indstrias para Minerao de Dados consiste em um ciclo que compreende seis etapas, descritas abaixo:

O CRISP- DM vem a ser uma metodologia padro no proprietria que identifica as diferentes fases na implantao de um projeto de data mining (DMP).

4. Questo chave da tarefa: (1) Leia o artigo que compara as trs metodologias de DM e diga qual voc considera a melhor dentre elas! Justifique porqu! (2) Essa metodologia pode ser aplicada na sua pesquisa de dissertao de mestrado? Justifique! (1) Baseado no artigo, destaco que o SEMMA e o CRISP-DM, partem de implementaes do KDD, coincidindo em algumas de suas fases. Reitero o observado no artigo, que o CRISP-DM bastante completo e complexo, enquanto que o SEMMA mais simples e prtico. Sem dvida, o CRISP-DM pode se aplicar em qualquer caso de minerao de dados, pois uma notadamente completa e bem documentada, permitindo assim um fluxo de minerao consistente, coerente e detalhado da aplicao KDD realizada. (2) Minha dissertao de mestrado discorrer sobre uma proposta de arquitetura de mobilidade ipv6 entre regies militares do Exrcito Brasileiro e acredito que a metodologia CRISP-DM pode ser integralmente aplicada, porm com severa dificuldade em documentar determinadas tarefas de

natureza prtica com o risco de usar o local inadequado de determinada fase ou tarefa obrigando realizao de novos experimentos.

Você também pode gostar