Você está na página 1de 9

DATA MINING

Jaziel C. Silva

Estamos afogados em informao, mas famintos por conhecimento! (John Naisbitt).

Histrico
Dcada de 60: Tem inicio as primeiras colees de dados, surgem os primeiros DBs. Dcada de 70: A tecnologia da Informao (TI) muda seu foco do processamento de dados (DB) para o processamento de informao, surgem os DSS e MIS. Dcada de 80: O processamento do conhecimento est cada vez mais incorporado nos recursos oferecidos, com os KBSs e os Expert Systems. Esses sistemas eram orientados aplicaes especificas (espaciais, cientficos, de engenharia etc). Dcada de 90: Surgimento de Data Mining, bases de dados multimdia, tecnologia Web, grande capacidade de armazenamento e processamento.

Data Mining
Data Mining faz parte de um processo maior chamado KDD, e consiste em extrair informao vlida, previamente desconhecida e de mxima abrangncia a partir de grandes bases de dados.
Por que realizar Data Mining? Abundncia de dados nos mais diferentes setores; Grande poder de processamento disponvel atualmente; Aumento de performance dentro de uma empresa; Grande variedade de ferramentas e tecnologia disponvel; Transformar dados disponveis em informao e conhecimento de valor agregado.

Processos do KDD

Figura 1: Etapas do Processo de KDD (Fayyad et al (1996).

O Processo de Data Mining


A extrao de conhecimento a partir de grande quantidade de dados vista como um processo interativo (baseado no conhecimento dos especialistas e dos usurios) e iterativo (para melhor ajuste dos parmetros a cada iterao).

Figura 2: Etapas do processo de Minerao de Dados (Rezende, Pugliesi, Melanda, & Paula 2003).

Etapas do Processo de DM
Conhecimento do Domnio: inicia-se com o entendimento do domnio da aplicao, considerando aspectos como os objetivos dessa aplicao e as fontes de dados das quais se pretende extrair conhecimento. Pr-Processamento: Etapa onde realizada uma seleo de dados a partir dessas fontes, de acordo com os objetivos do processo. Extrao de Padres: A etapa de extrao de padres tem o objetivo de encontrar modelos (conhecimento) a partir de dados. Ps- Processamento: Essa a etapa na qual o conhecimento avaliado quanto a sua qualidade e/ou utilidade para que, em caso positivo, seja utilizado para apoio a algum processo de tomada de deciso.

reas de Aplicao
rea de Marketing; Manufatura; Finanas; Sade; Telecomunicaes; Explorao de Petrleo.

Exemplo Prtico de Aplicao, (Walmart).


A rede americana de Supermercados Walmart, identificou um hbito curioso dos consumidores. H cinco anos, ao procurar eventuais relaes entre o volume de vendas e os dias da semana, o software de Data Mining apontou que, s sextas-feiras, as vendas de cervejas cresciam na mesma proporo que as de fraldas. Crianas bebendo cerveja? No, uma investigao mais detalhada revelou que, ao comprar fraldas para seus bebs, os pais aproveitavam para abastecer o estoque de cerveja para o final de semana.

Vantagens e Desvantagens de Data Mining


Vantagens: Modelo de fcil compreenso; Analisar grandes bases de dados e encontrar padres vlidos; Variveis que no necessitam de recodificao; Os Modelos so precisos; Os Modelos so construdos e atualizados rapidamente. Desvantagens: Alto custo; Necessidades de grandes bases de dados; Novidade e complexidade; Criar ambientes ideais; Interao muito forte com analistas humanos.

Referncias Bibliogrficas
Rezende, S. O. (2003). Sistemas Inteligentes: Fundamentos e Aplicaes (1 ed.). Barueri, SP: Manole. Corts, Srgio. C; Porcaro, Rosa. M; Lifschitz, Srgio. Minerao de dados Funcionalidades, Tcnicas e Abordagens. PUC-RioInf.MCC 02/Maio, 2002. Carvalho, L. A. V. (2005) . Data Mining A Minerao de Dados no Marketing, Medicina, Economia, Engenharia e Administrao. 2005 Sferra, Helosa. H; Corra, ngela, M. C; Conceitos e Aplicaes de Data Mining. Revista de Cincia & Tecnologia Vol. 11, N 22 pp. 19-34, (2003).

Você também pode gostar