Você está na página 1de 20

FACULDADE DE CINCIAS SOCIAIS E TECNOLGICAS FACITEC

CURSO: Bacharelado em Sistemas de Informao


DISCIPLINA: Fundamentos de Sistemas de Informao
PROFESSOR: Paulo de Tarso Costa de Sousa
TURMA: BSI 2B

MINERAO DE
DADOS

COMPONENTES:

RAFAEL DOS SANTOS CABRAL, Matrcula n 51002698;


ROBLDO INCIO BORGES, Matrcula n: 51002303;
RODRIGO PIMENTEL COTA, Matrcula n: 51002041;
TIAGO COLI DANTAS, Matrcula n: 51002167;
WILLIAN MOURA DIAS, Matrcula n: 51002056.

BRASLIA DF, OUTUBRO DE 2005.

FUNDAMENTOS DE SISTEMAS DE INFORMAO

SUMRIO

LISTA DE FIGURAS .................................................................................................... iii


LISTA DE REDUES ................................................................................................ iv
RESUMO ........................................................................................................................ v
CAPTULO I INTRODUO .................................................................................... 1
1.1 Explanao da Pesquisa ............................................................................................ 1
1.2 Descrio de Uma Situao ...................................................................................... 1
1.3 Objetivos ................................................................................................................... 2
CAPTULO II DESENVOLVIMENTO ...................................................................... 3
2.1 Conceitos ................................................................................................................... 3
2.2 Minerao de Dados Como Parte da DCBD ............................................................. 3
2.2.1 Objetivos da minerao de dados ........................................................................... 4
2.2.2 Tcnicas da minerao de dados ............................................................................ 5
2.2.3 Como escolher a tcnica de minerao de dados mais adequada ........................... 8
2.2.4 reas de aplicao da minerao de dados ............................................................ 9
2.2.5 O processo de descoberta do conhecimento ......................................................... 10
2.2.6 Modelo de processo CRISP-MD .......................................................................... 12
CAPTULO III CONCLUSO .................................................................................. 14
3.1 Concluses ............................................................................................................... 14
REFERNCIAS ............................................................................................................ 15

ii

FUNDAMENTOS DE SISTEMAS DE INFORMAO

LISTA DE FIGURAS
Figura 01 Processo Descoberta de Conhecimento em Banco de Dados ....................... 04
Figura 02 Modelo CRISP-DM ...................................................................................... 12

iii

FUNDAMENTOS DE SISTEMAS DE INFORMAO

LISTA DE REDUES
SIGLAS

DESCRIO

CRISP-DM Cross-Industry Standard Process for Data Mining


DCBD

Descoberta de Conhecimento em Banco de Dados

KDD

Knowledge Discovery in Databases

MBR

Memory-Based Reasoning

SQL

Structured Query Language

iv

FUNDAMENTOS DE SISTEMAS DE INFORMAO

RESUMO

A minerao de dados surgiu com o objetivo de realizar a anlise de dados e


descobrir padres importantes nos dados, contributivos para estratgias de negcios,
bases de conhecimento e pesquisas. Este trabalho busca a exposio do conceito de
minerao de dados, assim como a demonstrar a aplicao, funcionamento e tcnicas
dessa ferramenta que tem auxiliado empresas a tomarem decises de estratgias na
conduo de uma organizao. De forma a facilitar o entendimento do estudo,
inicialmente, apresentado uma minerao de dados na empresa norte-americana WaltMart, onde possvel observar o resultado de forma positiva nos negcios da empresa.
Palavras-chave: dados, minerao de dados, DCBD, CRISP-DM.

FUNDAMENTOS DE SISTEMAS DE INFORMAO

CAPTULO I INTRODUO

1.1 EXPLANAO DA PESQUISA


A tecnologia tornou relativamente fcil o acmulo de dados. A conseqncia a
ampliao do uso de banco de dados que podem ser usados para dar suporte aos objetivos
fundamentais de um negcio. Hoje as informaes so valorizadas como nunca, e os dados
armazenados em seus bancos de dados so vasculhados por profissionais especializados, a
procura de tendncias e padres.
Sem as coletas de dados, as empresas ficam limitadas a alguns servios e
reduzidas a obter vantagens estratgicas sobre as foras competitivas que ela enfrenta no
mercado globalizado. To importante como oferecer o produto ao cliente com um preo
melhor, inovando, diferenciando e estabelecendo alianas, o crescimento da empresa ficar
prejudicado se no tiver uma previso dos padres de compras de cada cliente, ou seja, o
perfil do fregus.

1.2 DESCRIO DE UMA SITUAO


A Walt-Mart foi a pioneira no uso de volumosos banco de dados em suas
transaes corporativas para revolucionar o varejo. Desde o final dos anos 90, a empresa
norte-americana passou adotar um sistema de pesquisa para prever a demanda para cada itens
individuais, analisando os padres de compras dos clientes, verificando as combinaes de
itens que os consumidores tendem a comprar durante uma visita em suas lojas.
Descobrindo os vnculos entre os itens comprados, o varejista pode facilitar a
compra desses produtos em conjunto e atender s necessidades dos clientes. Por exemplo, a
anlise de dados de compras mostrou que os compradores de fitas de vdeos para o pblico
infantil freqentemente levam mais de uma unidade por visita. A lio: no reduza todo o
estoque de fitas de vdeo para criana a um mostrador de fita no final do corredor. Assegurese de que o restante da coleo de vdeo estar por perto. O resultado? Mais compras e lucros
crescentes.

FUNDAMENTOS DE SISTEMAS DE INFORMAO

1.3 OBJETIVOS
Como objetivos deste trabalho podemos descrever:
- o conceito de minerao de dados;
- a minerao de dados como parte da DCBD;
- as tarefas desempenhadas por tcnicas de minerao de dados;
- as tcnicas de minerao de dados;
- como escolher a tcnica de minerao de dados mais adequada;
- as reas de aplicao de tcnicas de minerao de dados;
- o processo de descoberta de conhecimento;
- o modelo de processo CRISP-DM.

FUNDAMENTOS DE SISTEMAS DE INFORMAO

CAPTULO II DESENVOLVIMENTO

2.1 CONCEITOS
Antes de conceituarmos Minerao de Dados, necessrio, mencionarmos as
definies de Data Warehouse e Data Mart, haja visto ocorrer uma relao direta entre eles.
Data Warehouse armazena dados que foram extrados dos vrios bancos de dados
de uma organizao. uma fonte central de dados j trabalhados, transformados e
catalogados (OLIVEIRA, 1997).
Data Mart um subconjunto do data warehouse que est mais ajustado para
fornecer dados detalhados de uma rea especfica. Por exemplo: abrangem um subconjunto de
dados referentes a um nico aspecto do negcio da companhia, ou seja, finanas, estoque ou
pessoal de uma empresa. Os data marts so mais teis para grupos menores que precisam
acessar dados detalhados, enquanto o data warehouse usado para consolidar os dados que
sero acessado por toda a empresa (OLIVEIRA, 1997).
Data Mining consiste no uso de tcnicas automticas de explorao de grandes
quantidades de dados de forma a descobrir novos padres e relaes que, devido ao volume
de dados, no seriam facilmente descobertos a olho nu, isto , prever ou classificar e, por fim,
propor estratgias de negcios, voltadas para aumentar a competitividade, elevar os lucros e
transformar os processos corporativos. Esse procedimento utilizado para auxiliar nas
tomadas de decises que englobam mudanas estratgicas nas operaes para obterem
vantagens competitivas no mercado (OLIVEIRA, 1997).

2.2 MINERAO DE DADOS COMO PARTE DA DCBD


Freitas (1993) define que minerao de dados pode ser considerada como uma
parte do processo de Descoberta de Conhecimento em Banco de Dados (KDD Knowledge
Discovery in Databases).
O termo Descoberta de Conhecimento em Banco de Dados usado para
representar o processo de tornar dados de baixo nvel em conhecimento de alto nvel.
A minerao de dados combina mtodos e ferramentas das seguintes reas:
aprendizagem de mquina, estatstica, banco de dados, sistemas especialistas e visualizao
de dados.
3

FUNDAMENTOS DE SISTEMAS DE INFORMAO

O objetivo de todo o processo de DCBD tornar os padres compreensveis s


pessoas, visando facilitar uma melhor interpretao dos dados existentes. A figura 1 tenta
exemplificar esta citao.

Figura 1: Processo de Descoberta de Conhecimento em Banco de Dados.

2.2.1 Objetivos da minerao de dados


Os principais objetivos da minerao de dados so descobrir relacionamentos
entre dados e fornecer subsdios para que possa ser feita uma previso de tendncias futuras
baseada no passado.
Os resultados obtidos com a minerao de dados podem ser usados no
gerenciamento de informao, processamento de pedidos de informao, tomada de deciso,
controle de processo e outras aplicaes.
A minerao de dados pode ser aplicada como um processo de verificao e como
um processo de descoberta. No processo de verificao, o usurio sugere uma hiptese acerca
da relao entre os dados e tenta prov-la aplicando tcnicas como anlises estatstica e
multidimensional sobre um banco de dados contendo informaes passadas. No processo de
descoberta no feita nenhuma suposio antecipada. Esse processo usa tcnicas, tais como
descoberta de regras de associao, rvores de deciso, algoritmos genticos e redes neurais.

FUNDAMENTOS DE SISTEMAS DE INFORMAO

2.2.2 Tcnicas de minerao de dados


As tcnicas de minerao de dados podem ser aplicadas a tarefas (um tipo de
problema de descoberta de conhecimento a ser solucionado) como classificao, estimativa,
associao, segmentao e sumarizao (Carvalho, 2001).
Freitas (1993) afirma que no h uma tcnica que resolva todos os problemas de
minerao de dados. Diferentes mtodos servem para diferentes propsitos, cada mtodo
oferece suas vantagens e suas desvantagens. A familiaridade com as tcnicas necessria para
facilitar a escolha de uma delas de acordo com os problemas apresentados. A seguir so
descritas as tcnicas de minerao de dados normalmente usadas.

a) Classificao
A tarefa de classificao consiste em construir um modelo de algum tipo que
possa ser aplicado a dados no classificados visando categoriz-los em classes.
So exemplos de tarefas de classificao: classificar pedidos de crditos como de
baixo, mdio e alto risco; esclarecer pedidos de seguros fraudulentos; identificar a forma de
tratamento na qual um paciente est mais propcio a responder, baseando-se em classes de
pacientes que respondem bem a determinado tipo de tratamento mdico.

b) Estimativa (ou Regresso)


A estimativa usada para definir um valor para alguma varivel contnua
desconhecida como, por exemplo, receita, altura ou saldo de carto de crdito. Ela lida com
resultados contnuos, enquanto que a classificao lida com resultados discretos. Ela pode ser
usada para executar uma tarefa de classificao, convencionando-se que diferentes faixas
(intervalos) de valores contnuos correspondem a diferentes classes.
Como exemplos de tarefas de estimativa tm-se: estimar o nmero de filhos em
uma famlia; estimar a renda total de uma famlia; estimar o valor em tempo de vida de um
cliente; estimar a probabilidade de que um paciente morrer baseando-se nos resultados de um
conjunto de diagnsticos mdicos; prever a demanda de um consumidor para um novo
produto.

FUNDAMENTOS DE SISTEMAS DE INFORMAO

c) Associao
A tarefa de associao consiste em determinar quais itens tendem a serem
adquiridos juntos em uma mesma transao. O exemplo clssico determinar quais produtos
costumam ser colocados juntos em um carrinho de supermercado. As cadeias de varejo usam
associao para planejar a disposio dos produtos nas prateleiras das lojas ou em um
catlogo, de modo que os itens geralmente adquiridos na mesma compra sejam vistos
prximos entre si.

d) Segmentao (ou Clustering)


A segmentao um processo de partio de uma populao heterognea em
vrios subgrupos ou clusters mais homogneos. Na segmentao, no h classes predefinidas,
os registros so agrupados de acordo com a semelhana, o que a diferencia da tarefa de
classificao.
Exemplos de segmentao: agrupar os clientes por regio do pas; agrupar clientes
com comportamento de compra similar; agrupar sees de usurios Web para prever
comportamento futuro de usurio.

e) Sumarizao
A tarefa de sumarizao envolve mtodos para encontrar uma descrio compacta
para um subconjunto de dados. Um simples exemplo desta tarefa poderia ser tabular o
significado e desvios padro para todos os itens de dados. Mtodos mais sofisticados
envolvem a derivao de regras de sumarizao.

f) rvores de deciso
Uma rvore de deciso uma rvore onde cada n no terminal representa um
teste ou deciso sobre o item de dado considerado. O objetivo principal separar as classes;
tuplas de classes diferentes tendem a ser alocadas em subconjuntos diferentes, cada um
descrito por regra simples em um ou mais itens de dados. Essas regras podem ser expressas
como declaraes lgicas, em uma linguagem como SQL, de modo que possam ser aplicadas
diretamente a novas tuplas.
6

FUNDAMENTOS DE SISTEMAS DE INFORMAO

A tcnica de rvore de deciso, em geral, apropriada s seguintes tarefas:


classificao e regresso.

g) Raciocnio baseado em casos


Tambm conhecido como MBR (Memory-Based Reasoning raciocnio baseado
em memria), o raciocnio baseado em casos tem base no mtodo do vizinho mais prximo. O
MBR procura os vizinhos mais prximos nos exemplos conhecidos e combinam seus valores
para atribuir valores de classificao ou de previso. Tenta solucionar um dado problema
fazendo uso direto de experincias e solues passadas. A distncia dos vizinhos d uma
medida da exatido dos resultados.
Na aplicao do MBR, existem quatro passos importantes: 1) escolher o conjunto
de dados de treinamento; 2) determinar a funo de distncia; 3) escolher o nmero de
vizinhos mais prximos e; 4) determinar a funo de combinao.
A tcnica de raciocnio baseado em casos apropriada s seguintes tarefas:
classificao e segmentao.

h) Algoritmos genticos
Os algoritmos genticos so mtodos generalizados de busca e otimizao que
simulam os processos naturais de evoluo. Um algoritmo gentico um procedimento
iterativo para evoluir uma populao de organismos e usado em minerao de dados para
formular hipteses sobre dependncias entre variveis, na forma de algum formalismo
interno.
Os algoritmos genticos usam os operadores de seleo, cruzamento e mutao
para desenvolver sucessivas geraes de solues. Com a evoluo do algoritmo, somente as
solues com maior poder de previso sobrevivem, at os organismos convergirem em uma
soluo ideal.
A tcnica de algoritmos genticos apropriada s tarefas de classificao e
segmentao.

FUNDAMENTOS DE SISTEMAS DE INFORMAO

i) Redes neurais artificiais


As redes neurais so uma classe especial de sistemas modelados seguindo
analogia com o funcionamento do crebro humano e so formadas de neurnios artificiais
conectados de maneira similar aos neurnios do crebro (Carvalho, 2001).
Uma das principais vantagens das redes neurais sua variedade de aplicao, mas
os seus dados de entrada so difceis de serem formados e os modelos produzidos por elas so
difceis de entender.
A tcnica de redes neurais apropriada s seguintes tarefas: classificao,
estimativa e segmentao.

2.2.3 Como escolher a tcnica de minerao de dados mais adequada


A escolha de uma tcnica de minerao de dados a ser aplicada no uma tarefa
fcil. A escolha das tcnicas de minerao de dados depender da tarefa especfica a ser
executada e dos dados disponveis para anlise. As tcnicas de minerao de dados deve ser
dividida em dois passos: 1) traduzir o problema de negcio a ser resolvido em sries de
tarefas de minerao de dados; 2) compreender a natureza dos dados disponveis em termos
de contedo e tipos de campos de dados e estrutura das relaes entre os registros.
Essa escolha pode ser baseada, tambm, em critrios para classificao das
tcnicas, como pode ser visto a seguir:

Com que tipos de bancos de dados trabalhar:


Um sistema de descoberta de conhecimento pode ser classificado de acordo com
os tipos de bancos de dados sobre os quais tcnicas de minerao de dados so aplicadas, tais
como: bancos de dados relacionais, bancos de dados de transao, orientados a objetos,
dedutivos, espaciais, temporais, de multimdia, heterogneos, ativos, de herana, banco de
informao de Internet e bases textuais.

FUNDAMENTOS DE SISTEMAS DE INFORMAO

Qual o tipo de conhecimento a ser explorado:


Vrios tipos de conhecimento podem ser descobertos por extrao de dados,
incluindo regras de associao, regras caractersticas, regras de classificao, regras
discriminantes, grupamento, evoluo e anlise de desvio.

Qual tipo de tcnica a ser utilizada:


A extrao de dados pode ser categorizada de acordo com as tcnicas de
minerao de dados subordinadas. Por exemplo, extrao dirigida a dados, extrao dirigida a
questionamento e extrao de dados interativa. Pode ser categorizada, tambm, de acordo com
a abordagem de minerao de dados subordinada, tal como: extrao de dados baseada em
generalizao, baseada em padres, baseada em teorias estatsticas ou matemticas,
abordagens integradas, etc.

2.2.4 reas de aplicao de minerao de dados


A seguir, so relacionadas as principais reas de interesse na utilizao de
minerao de dados:
- Marketing: tcnicas de minerao de dados so aplicadas para descobrir
preferncias do consumidor e padres de compra, com o objetivo de realizar marketing direto
de produtos e ofertas promocionais, de acordo com o perfil do consumidor.
- Deteco de fraudes: muitas fraudes bvias (tais como, a compensao de
cheque por pessoas falecidas) podem ser encontradas sem minerao de dados, mas padres
mais sutis de fraude podem ser difceis de serem detectados, por exemplo, o desenvolvimento
de modelos que predizem quem ser um bom cliente ou aquele que poder se tornar
inadimplente em seus pagamentos.
- Medicina: caracterizar comportamento de paciente para prever visitas,
identificar terapias mdicas de sucesso para diferentes doenas, buscar por padres de novas
doenas.
- Instituies governamentais: descoberta de padres para melhorar as coletas de
taxas ou descobrir fraudes.

FUNDAMENTOS DE SISTEMAS DE INFORMAO

- Cincia: tcnicas de minerao de dados podem ajudar cientistas em suas


pesquisas, por exemplo, encontrar padres em estruturas moleculares, dados genticos,
mudanas globais de clima, oferecendo concluses valiosas rapidamente.
- Controle de processos e controle de qualidade: auxiliar no planejamento
estratgico de linhas de produo e buscar por padres de condies fsicas na embalagem e
armazenamento de produtos.
- Banco: detectar padres de uso de carto de crdito fraudulento, identificar
clientes leais; determinar gastos com carto de crdito por grupos de clientes; encontrar
correlaes escondidas entre diferentes indicadores financeiros.
- Aplice de seguro: anlise de reivindicaes determinar quais procedimentos
mdicos so reivindicados juntos, prever quais clientes compraro novas aplices, identificar
padres de comportamento de clientes perigosos, identificar comportamento fraudulento.

2.2.5 O Processo de descoberta de conhecimento


O processo de descoberta de conhecimento um mtodo semi-automtico,
complexo e iterativo (Freitas, 1993). Ele pode ser dividido em seis passos bsicos: definio
de objetivos, preparao de dados, definio de um estudo, construo de um modelo,
entendimento do modelo e predio.

1) Definio de objetivos
Neste passo, deve-se definir os objetivos de negcio que devero ser alcanados
com a minerao de dados e o que dever ser feito com os seus resultados, como por
exemplo: mudana de plano de marketing.

2) Preparao de dados
A preparao de dados envolve as tarefas de seleo e transformao dos dados.
Os tipos de dados selecionados podem estar organizados ao longo de mltiplas tabelas.
Durante a seleo de dados, o usurio pode necessitar executar junes de tabelas ou eliminar
linhas e/ou colunas de tabelas. Os mtodos de transformao incluem organizar dados na
forma desejada e converter um tipo de dado em outro tipo.
10

FUNDAMENTOS DE SISTEMAS DE INFORMAO

3) Definio de um estudo
Definir um estudo pode envolver articular um alvo, escolher uma varivel
dependente ou uma sada que caracterize um aspecto do alvo e especificar os campos de
dados que so usados no estudo. Bons estudos so unidos para caracterizar aquilo que pode
ser descrito com seus dados. Por outro lado, o alvo pode ser usado para agrupar tipos
similares de dados ou para identificar excees em um conjunto de dados. A identificao de
excees geralmente usada na descoberta de fraude ou de dados incorretos.
As atividades realizadas neste passo complementam os objetivos de negcio,
definidos anteriormente, aps a obteno de um conhecimento mais detalhado sobre os dados
operacionais existentes.

4) Construo de um modelo
A construo de um modelo feita atravs de uma tcnica de minerao de dados,
tendo como base os dados transformados e o estudo definido no passo anterior. Um modelo
resume grandes quantidades de dados por acumular indicadores. Alguns dos indicadores que
vrios modelos acumulam so: a) freqncias: mostram em qual freqncia que um certo
valor ocorre; b) pesos ou impactos: indicam a influncia exercida por algumas entradas na
ocorrncia de uma sada; c) conjunes: algumas vezes certas entradas tm mais peso juntas
do que separadas; d) diferenciao: indica a importncia de uma entrada para uma
determinada sada do que para uma outra sada.

5) Entendimento do modelo
Dependendo do tipo de modelo usado para representar os dados, existem
diferentes formas de entend-lo. Os indicadores que muitos modelos podem acumular,
conforme descritos no passo anterior, podem influenciar no entendimento do modelo, alm do
tipo de tcnica de minerao de dados aplicada na construo do modelo.

6) Predio
A predio o processo de escolher o melhor resultado possvel baseado na
anlise de dados histricos. O usurio deve analisar a informao descoberta de acordo com
11

FUNDAMENTOS DE SISTEMAS DE INFORMAO

sua tarefa de suporte deciso e objetivos. Portanto, ele precisa ter um bom entendimento
sobre o negcio da empresa e sobre o conhecimento descoberto (Freitas, 1993).

2.2.6 Modelo de processo CRISP-DM


De acordo com Carvalho (2001) o modelo de processo CRISP-DM (CrossIndustry Standard Process for Data Mining) define um processo de minerao de dados no
linear, conforme pode ser visto na Figura 2.
Neste modelo, o ciclo de vida do projeto de minerao de dados consiste de seis
fases. A seqncia dessas fases no rigorosa, depende do resultado de cada fase ou de qual
tarefa particular de uma fase precisa ser executada na prxima fase. As flechas indicam as
dependncias mais importantes e freqentes entre as fases.
O crculo externo na figura simboliza a natureza cclica da minerao de dados.
Um processo de minerao de dados continua aps uma soluo ter sido descoberta. Os
processos de minerao de dados subseqentes se beneficiaro das experincias anteriores.

Figura 2 Modelo CRISP-DM


12

FUNDAMENTOS DE SISTEMAS DE INFORMAO

A fase inicial do processo, Compreenso do Negcio visa o entendimento dos


objetivos do projeto e dos requisitos sob o ponto de vista do negcio. Baseado no
conhecimento adquirido, o problema de minerao de dados definido e um plano preliminar
projetado para ativar os objetivos.
A Compreenso dos Dados inicia com uma coleo de dados e procede com
atividades que visam: buscar familiaridade com os dados, identificar problemas de qualidade
de dados, descobrir os primeiros discernimentos nos dados ou detectar subconjuntos
interessantes para formar hipteses da informao escondida.
A Preparao de Dados cobre todas as atividades de construo do data set
final. As tarefas de preparao de dados so, provavelmente, desempenhadas vrias vezes e
no em qualquer ordem prescrita. Estas tarefas incluem seleo de tabelas, registros e
atributos, bem como transformao e limpeza dos dados para as ferramentas de modelagem.
Na Modelagem, vrias tcnicas de modelagem so selecionadas e aplicadas e
seus parmetros so ajustados para valores timos. Geralmente, existem vrias tcnicas para o
mesmo tipo de problema de minerao de dados. Algumas tcnicas tm requisitos especficos
na formao de dados. Portanto, retornar fase de preparao de dados freqentemente
necessrio.
Na Avaliao, o modelo (ou modelos) construdo na fase anterior avaliado e so
revistos os passos executados na sua construo para se ter certeza de que o modelo
representa os objetivos do negcio. O principal objetivo determinar se existe alguma
questo de negcio importante que no foi suficientemente considerada. Nesta fase, uma
deciso sobre o uso dos resultados de minerao de dados dever ser alcanada.
Aps o modelo (ou modelos) ser construdo e avaliado, na fase Aplicao ele
pode ser usado de duas formas. Na primeira forma, o analista pode recomendar aes a serem
tomadas baseando-se simplesmente na viso do modelo e de seus resultados. Na segunda
forma, o modelo pode ser aplicado a diferentes conjuntos de dados.

13

FUNDAMENTOS DE SISTEMAS DE INFORMAO

CAPTULO III CONCLUSO

3.1 CONCLUSES
Conclumos que a minerao de dados processada para identificar fatores e
tendncias nas atividades de negcios, pesquisas cientficas, deteco de fraudes, controle de
processos e controle de qualidade.
O software de minerao de dados utiliza algortimos avanados de
reconhecimento de padres, assim como uma variedade de tcnicas matemticas e estatsticas
para selecionar montanhas de dados e extrair informaes estratgicas anteriormente
desconhecidas.
A minerao de dados pode destacar padres de compra, revelar tendncias de
clientes, cortar custos suprfluos, ou descobrir relaes e oportunidades lucrativas no
percebidas. Por exemplo, muitas empresas usam a minerao de dados para encontrar formas
mais lucrativas de elaborar malas diretas (mesmo com e-mail) de sucesso, ou descobrir
melhores formas de exibir produtos numa loja, projetar um melhor website de e-commerce,
atingir clientes lucrativos no atingidos, ou identificar clientes ou produtos marginais ou no
lucrativos.
Por fim, ratificamos que os dados so um recurso organizacional essencial que
precisa ser administrado com grande importncia dentro das empresas. A maioria das
organizaes no conseguiria sobreviver ou ter sucesso sem dados de qualidade sobre as
operaes internas e externas das indstrias.

14

FUNDAMENTOS DE SISTEMAS DE INFORMAO

REFERNCIAS

CARVALHO, Lus Alfredo Vidal de. Data Mining: a minerao de dados no marketing,
medicina, economia, engenharia e administrao. So Paulo: rica, 2001.

FREITAS, Henrique. A informao como ferramenta gerencial: um telessistema de


informao em marketing para apoio deciso. Porto Alegre: Ortiz, 1993.

OBRIEN, James A. Sistemas de Informao e as decises gerenciais na era da informtica. 2


ed. So Paulo: Saraiva, 2004.

OLIVEIRA, Djalma de Pinho Rebouas. Sistemas de informaes gerenciais: estratgicas,


tticas e operacionais. 4 ed. So Paulo: Atlas, 1997.

TORRES, Noberto. Competitividade empresarial com a tecnologia da informao. So Paulo:


Makron Books, 1995.

BRASIL,

Universidade

Federal

do

Par.

Seminrio

de

MD.

Disponvel

em

http://www.ufpa.br/sampaio/bd_2003/mineracao/mineracaodedados.htm, pgina visitada em


08/09/05, s 16h 41 min.

15

Você também pode gostar