Você está na página 1de 8

FACULDADES INTEGRADAS DO BRASIL- UNIBRASIL BACHARELADO EM SISTEMAS DE INFORMAO LEANDRO CLEVERSON CHAVES WAGNER ANDR EDUARDO

DATA MINING

CURITIBA 2013

So conhecidos como tcnicas de data mining, os processos que permitam extrair conhecimentos de uma base de dados que no foram explicitamente reconhecidos ou identificados, ou seja trata-se de um conhecimento que ficaria escondido. Para Fayyad et al. !""#$ apud %a&ega '(('$ data mining )o processo no-tri&ial de identificar, em dados, padr*es &+lidos, no&os, potencialmente ,teis e ultimamente compreens-&eis.. / um processo que utili0a &+rios algoritmos que so utili0ados para encontrar padr*es, e uma base de dados. 1pesar de utili0ar bons algoritmos preciso resaltar que nem eles nos do padr*es )&alidos e no&os.. 2as ainda assim o data mining pode ser utili0ado como uma ferramenta efica0 em encontrar padr*es. 3 tambm pode ser muito bem utili0ado com para apoiar os humanos 1nalistas e 4estores$ em tomadas de deciso. %a primeira fase so feitas limpe0as na base para isso necess+rio o conhecimento sobre os dados. 1 limpe0a ser&e para no ha&er a duplica5o de dados, atra&s de erros de digita5o, &alores omissos, abre&ia5*es diferentes, entre outros. Ferramentas de data mining de&em ser capa0es de identificar todas as correla5*es entre as fontes de dados. 3ssas tcnicas de explora5o de dados, pode se extrair dos bancos de dados informa5*es criticas que &enha a ajudar na tomada de deciso de uma organi0a5o.

1 Figura acima demonstra os o funcionamento e os est+gios, para chegar 6 minera5o de dados. 1 2inera5o de 7ados, garimpar dados e explorar de dados, so ou seja, um processo de extrair informa5*es ,teis potencialmente a partir de uma base de dados bruta, utili0ando tcnicas a&an5adas e princ-pios de intelig8ncia artificial. 9 Processo :impe0a de dados; %esta ati&idade de limpe0a dos dados e pr-processamento, os dados que so considerados desnecess+rios so eliminadas. Se forem descobertos neste est+gio, isso poder+ resultar em um trabalho de baixa qualidade. <ransforma5o de dados; <ransforma5o dos dados desen&ol&er um modelo s=lido de dados, utili0a-se algoritmos para ocorrer a extra5o de conhecimento, isto indica que as transforma5*es de dados depende das tcnicas que sero utili0adas.

2inera5o de 7ados; 1 minera5o de dados pode ser considerada como o n,cleo do processo. 3m que so aplicados os algoritmos para extrair padr*es dos dados ou gerar regras que descre&em o comportamento das bases de dados. >nterpreta5o; 1 interpreta5o tem o objeti&o de &alidar o conhecimento extra-do dos dados, identifica padr*es e interpreta os dados, fa0endo assim a transforma5o do conhecimento em ferramenta de apoio as decis*es dos interessados. <odos os processos citados podem em algum estagio espec-fico ser repetido at que a a&alia5o, &alida5o e os resultados sejam considerados satisfat=rios, isso porque o conhecimento no tri&ial em um projeto de 2inera5o de 7ados.

<cnicas de 3xtra5o de >nforma5*es 3xistem di&ersas tcnicas para se extrair informa5*es de uma base dados. 7entre as mais conhecidas esto; ?acioc-nio @aseado em 2em=ria 2emory @ased ?easoning A 2@?$, os 1lgoritmos 4enticos, a 7etec5o de 1grupamentos, 1n+lise de B-nculos, Cr&ores de 7eciso, 1lgoritmo de %ai&e @ayes e outros. 3stes modelos pre0am por uma forma automati0ada de extrair informa5*es &+lidas. 1ssim sendo a escolha de um algoritmo ou tcnica depende de fatores como; Bantagens, des&antagens, objeti&os, estrutura dos dados e outros. 2ateriais e 2todos

3xistem &+rias ferramentas para an+lise de 2inera5o de 7ados como DeEa, 9racle 1d&anced 1nalytics, S1P Sybase >F, SF: Ser&er @usiness intelligence entre outras.

3xemplos de 1plica5*es Wal- Mar 3mbora recente, a hist=ria o data mining j+ tem casos bem conhecidos. 9 mais di&ulgado o da cadeia americana Dal-2art, que identificou um h+bito curioso dos consumidores. G+ cinco anos, ao procurar e&entuais rela5*es entre o &olume de &endas e os dias da semana, o softHare de data mining apontou que, 6s Sextas-feiras, as &endas de cer&ejas cresciam na mesma propor5o que as de fraldas. Irian5as bebendo cer&ejaJ %o, uma in&estiga5o mais detalhada re&elou que, ao comprar fraldas para seus beb8s, os pais apro&eita&am para abastecer o estoque de cer&eja para o final de semana. Ba!" #$ A%&r'(a G+ quem consiga detectar fraudes, cortar gastos ou aumentar a receita da empresa. 9 @anE of 1merica usou essas tcnicas para selecionar entre seus K# milh*es de clientes aqueles com menor risco de dar calote num emprstimo. 1 partir desses relat=rios, en&iou cartas oferecendo linhas de crdito para os correntistas cujos filhos ti&essem entre !L e '! anos e, portanto, precisassem de dinheiro para ajudar os filhos a comprar o pr=prio carro, uma casa ou arcar com os gastos da faculdade. ?esultado ; em tr8s anos, o banco lucrou K( milh*es de d=lares. T&l&(#%)!'(a*+&, 1tualmente, em telecomunica5*es, existe uma exploso nos crimes contra a telefonia celular, dentre os quais, a clonagem. <cnicas de data mining podem ser utili0adas para detectar h+bitos dos usu+rios de celulares. Fuando um telefonema for feito e considerado pelo sistema como uma excesso, o programa fa0 uma chamada para confirmar se foi ou no uma tentati&a de fraude.

A-%'!', ra*.# &% Al # N/0&l 7epois do final da segunda guerra mundial a Pesquisa 9peracional P($ apareceu como ferramenta fundamental para a &it=ria das tropas contra as pot8ncias do eixo. Iom a pesquisa operacional foi poss-&el resol&er matematicamente o problema de aloca5o =tima de recursos e isto &em sendo utili0ado com grande sucesso em altos n-&eis de deciso at o presente momento. Ierca de cinquenta anos depois, apareceu o data mining. Suas potencialidades esto longe de serem imaginadas e no seria ousado esperar que no mundo globali0ado possa &ir a dar seus frutos como a P9 deu no passado.

C#!(l),.# 9 trabalho &isa ajudar a entender o que data mining, como so as fases do processo de minera5o. 3 tambm demonstra casos bem sucedidos em que foram utili0adas as tcnicas de data mining para ajudar na tomada de deciso de &+rias organi0a5*es.

?3F3?M%I>1S %1B341, S. Princ-pios 3ssenciais do 7ata 2ining. >ntelliHise ?esearch and <raining. So Paulo, '(('.