Você está na página 1de 6

Considerações Iniciais:

 Além daquelas partes que escolhemos falar, selecionei mais algumas partes
para cada um. São apenas sugestões, podemos fazer trocas.

 Algumas partes que estarão com marcador, eu vou inserir no slide, são
apenas observações para complementar.

 Dividi assim:
01 – Gabriel
02 – Alice
03 – Anne
04 – Anne
05 – David (se possível com a demonstração de algum dos softwares citados)
06 – David
07 - Alice

 Mais um detalhe: Esse trecho antes do tópico 01 é uma opção de introdução,


um pontapé inicial para a apresentação.

 A questão da privacidade é apenas para ter uma ideia formada, uma


prevenção caso Renato nos questione sobre isso. Qualquer um pode falar
essa parte, já que ela é de conhecimento geral.

1
Tópicos Do Trabalho De Mineração De Dados
(Data Minning)

Desde que a informática tomou conta de nossas vidas, imensos volumes de informação têm sido
sistematicamente coletados e armazenados. A simples armazenagem e recuperação dessa informação já
traz um grande benefício, pois agora já não é mais necessário procurar informação em volumosos e
ineficazes arquivos de papel. Contudo, apenas recuperar informação não propicia todas as vantagens
possíveis. O processo de Data Mining permite que se investigue esses dados à procura de padrões que
tenham valor para a empresa. Neste seminário pretendemos expor alguns dos principais conceitos que
estão por trás dessa importante tecnologia.

01 – O Que É Data Mining?

Consiste em uma funcionalidade que agrega e organiza dados, encontrando neles padrões associações,
mudanças e anomalias relevantes.

A expressão surgiu em comunidades de bases de dado. A mineração de dados é a etapa de análise do


processo conhecido como KDD (Knowledge Discovery in Databases), sendo a sua tradução literal
"Descoberta de Conhecimento em Bases de Dado".

Pode ser divido em algumas etapas básicas que são: exploração, construção de modelo, definição de
padrão e validação e verificação.

É uma prática relativamente recente no mundo da computação, e utiliza técnicas de recuperação de


informação, inteligência artificial, reconhecimento de padrões e de estatística para procurar correlações
entre diferentes dados que permitam adquirir um conhecimento benéfico para uma empresa ou
indivíduo. Para uma empresa, o data mining pode ser uma importante ferramenta que potencia a
inovação e lucratividade.

A mineração de dados levanta aspectos legais e questões relativas à privacidade e ética. Apesar disso,
muitas pessoas afirmam que a mineração de dados é eticamente neutra, pois não apresenta implicações
éticas.

Existem inúmeras ramificações de Data Mining, sendo algumas delas:

Redes neurais: são sistemas computacionais baseados numa aproximação à computação baseada em
ligações. Nós são interligados para formar uma rede de nós - daí o termo "rede neural". A inspiração
original para esta técnica advém do exame das estruturas do cérebro, em particular do exame de
neurônios. Exemplos de ferramentas: SPSS Neural Connection, IBM Neural Network Utility.

Indução de regras: refere-se à detecção de tendências dentro de grupos de dados, ou de “regras” sobre
o dado. As regras são, então, apresentadas aos usuários como uma lista “não encomendada”. Exemplos
de ferramentas: IDIS da Information Discovey e Knowledge Seeker da Angoss Software.
Árvores de decisão: baseiam-se numa análise que trabalha testando automaticamente todos os valores
do dado para identificar aqueles que são fortemente associados com os itens de saída selecionados para
exame. Os valores que são encontrados com forte associação são os prognósticos chaves ou fatores

2
explicativos, usualmente chamados de regras sobre o dado. Exemplos de ferramentas: Alice
d’Isoft, Business Objects BusinessMiner, DataMind.

Analise de séries temporais: a estatística é a mais antiga tecnologia em DM, e é parte da fundação
básica de todas as outras tecnologias. Ela incorpora um envolvimento muito forte do usuário, exigindo
engenheiros experientes, para construir modelos que descrevem o comportamento do dado através dos
métodos clássicos de matemática. A análise de séries temporais frequentemente é confundida como um
gênero mais simples de DM chamado “forecasting” (previsão). Exemplos de ferramentas: S+, SAS, SPSS.

Visualização: mapeia o dado sendo minerado de acordo com dimensões especificadas. Nenhuma
análise é executada pelo programa de DM além de manipulação estatística básica. Exemplos de
ferramentas: IBM Parallel Visual Explorer, SAS System, Advenced Visual Systems (AVS) Express -
Visualization Edition.

02 – O Que A Mineração De Dados Pode Fazer?


A utilização da mineração de dados é bastante usual em grandes bases de dados, e o resultado final da
sua utilização pode ser exibido através de regras, hipóteses, árvores de decisão, dendrogramas, etc. O
processo de data mining costuma ocorrer utilizando dados contidos dentro do data warehouse.

Sua premissa é uma argumentação ativa, isto é, em vez do usuário definir o problema, selecionar os
dados e as ferramentas para analisar tais dados, as ferramentas do Data Mining pesquisam
automaticamente os mesmos a procura de anomalias e possíveis relacionamentos, identificando assim
problemas que não tinham sido identificados pelo usuário.

Nos últimos anos, a mineração de dados tem sido amplamente utilizada nas áreas da ciência e
engenharia, tais como bioinformática, genética, medicina, educação e engenharia elétrica.

Os projetos de data mining podem ser implementados de várias formas: comprando software específico
para data mining, contratando consultores externos que façam a coleta dos dados e a apresentação de
um relatório pronto ao cliente final ou processando os dados no próprio cliente, criando um ambiente
em que o processo de data mining possa ser repetido e aprimorado sucessivas vezes.

Os projetos de data mining normalmente se beneficiam da criação de um ciclo, o chamado “ciclo


virtuoso de data mining”, em que os algoritmos e a informação obtida se utilizam de processamentos
anteriores do mesmo modelo, incorporando as respostas obtidas em futuros processamentos.

O alto potencial de retorno em projetos de data mining só pode ser alcançado quando o ciclo é
corretamente implementado: identificação de oportunidades, elaboração de modelo para determinação
das regras ou padrões, elaboração das ações que possam se beneficiar destas regras, medição dos
resultados destas ações, que por sua vez possibilitam a identificação de novas oportunidades e assim
sucessivamente.

03 – A Evolução Da Mineração De Dados

As duas últimas décadas acompanharam um aumento dramático na quantia de informações ou dados


que são armazenadas em formato eletrônico. Esta acumulação de dados aconteceu a uma taxa
3
explosiva. Foi calculado que a quantia de informação no mundo dobra a cada 20 meses e o tamanho e
número de bancos de dados estão aumentando ainda mais rapidamente. O valor destes dados
armazenados está tipicamente ligado à capacidade de extrair informações de mais alto nível que se
encontra subjacente a estes dados, ou seja, informação útil que sirva para dar suporte a decisões, e para
exploração e melhor entendimento do fenômeno gerador dos dados. Podem existir padrões ou
tendências úteis interessantes que, se descobertos, podem ser utilizados, por exemplo, para otimizar
um processo de negócio em uma empresa, ajudar no entendimento dos resultados de um experimento
científico, ajudar médicos a entender efeitos de um tratamento entre outros.

Dentro deste contexto, data mining tem ganho muita atenção de diversas áreas de interesse. Elas o
consideram como um campo crítico para seus negócios. O uso de informações valiosas obtidas por
mineração dos dados é necessário para manter a competitividade no ambiente comercial atual. Com o
advento do "data warehousing" que faz a armazenagem de grandes quantidades de dados em um local
comum e do contínuo avanço no aumento do poder de processamento dos computadores, os
empresários procuram por tecnologias e ferramentas para extrair informações úteis dos dados.

04 – Como A Mineração De Dados Funciona?


Como é a mineração de dados capaz de dizer coisas importantes que você não sabia ou o que vai
acontecer a seguir? Esta técnica que é usada para executar esses feitos é chamado de modelagem. A
modelagem é simplesmente o ato de construir um modelo (um conjunto de exemplos ou uma relação
matemática) com base em dados de situações em que a resposta é conhecida e, em seguida, aplicar o
modelo para outras situações em que as respostas não são conhecidos. Como um exemplo simples de
construir um modelo, considere o diretor de marketing para uma empresa de telecomunicações. Ele
gostaria de concentrar seu marketing e esforços de vendas em segmentos da população com maior
probabilidade de se tornar grandes usuários de serviços de longa distância. Ele sabe muito sobre seus
clientes, mas é impossível discernir as características comuns de seus melhores clientes, porque há
tantas variáveis. De sua base de dados existente de clientes, que contém informações como idade, sexo,
histórico de crédito, renda, CEP, ocupação, etc., ele pode usar ferramentas de mineração de dados, tais
como redes neurais, para identificar as características dos clientes que fazem lotes de chamadas de
longa distância. Por exemplo, ele pode aprender que seus melhores clientes são mulheres solteiras com
idade entre 34 e 42 que fazem mais de US $ 60.000 por ano. Este, então, é seu modelo para clientes de
alto valor, e ele faria orçamento seus esforços de marketing para conformidade.

05 – Tecnologias, Software De Mineração De Dados


É correto dizer que MINERAÇÃO DE DADOS é dinheiro no mundo de hoje. Junto com a transição para
um mundo baseado no aplicativo vem o crescimento exponencial de dados. No entanto, a maior parte
dos dados é desestruturado e, portanto, é preciso um processo e método para extrair a informação útil
a partir dos dados e transformá-lo em forma compreensível e utilizável. Este é o lugar onde a mineração
de dados encontra o seu nicho. Existem inúmeras ferramentas para tarefas de mineração de dados,
usando inteligência artificial, aprendizado de máquina e outras técnicas para extrair dados.

Vamos citar abaixo os 5 melhores softwares livres de data mining no mercado.

1. Rapidminer – ambiente open-source desenvolvido em Java. Plataforma de software que


apresenta que oferece um ambiente integrado para mineração de dados, mineração de textos,
analise preditiva e análise de negócios.

4
Weka – software escrito em Java. Primeiramente foi feito para a área de agricultura, mas hoje é uma
poderosa ferramenta para diversas áreas – inclui visualizações e algoritmos para a análise de dados e
modelagem perspectivas.

Orange – phyton, tem uma interface muito amigável e pode ser usado para vários tipos de mineração –
textos, bioinformática, etc.

Knime – java, mas pode fazer algoritimos em phyton ou R – caso os que o programa tem não atenda ao
propósito. É utilzado para análise grandes e complexas – é muito utilizado para inteligência de mercado
e na área financeira

NTLK – Escrito em Phyton, utilizado para análise Natural Language Processing ou, em português,
Processamento de Linguagem Natural. Simples, consistente e modularizado. Por "linguagem natural"
entendemos as linguagens que são utilizadas para comunicações do dia a dia por seres humanos; línguas
como o inglês, o hindi ou o português. Em contraste com linguagens artificiais como as linguagens de
programação e notações matemáticas, as linguagens naturais evoluem à medida que passam de geração
em geração, e é difícil descrevê-las por completo por meio de regras explícitas.

06 – Exemplos Na Indústria
Começamos a falar da era da industrialização com o Ford e o carro preto e caminhamos para mercados
cada vez mais segmentados e individualizados – onde a mineração de dados tem papel fundamental na
identificação de necessidades e mudanças sociais.

Ex. oferecer pacotes de serviços especializados na área de telefonia (vendas casadas), marketing, novos
produtos, abertura de novos mercados em vários setores da economia.

07. Futuro Da Mineração De Dados


O futuro do Data Mining - Inteligência artificial, algoritmo genético já fazem parte dos estudos.

Há curto prazo está relacionada com questões mais mundanas – finanças, negócios, áreas rentáveis em
geral. Campanhas de Micro- marketing irão explorar novos nichos. Publicidade terá como alvo clientes
potenciais uma precisão muito grande.

A médio prazo, a mineração de dados pode ser tão comum e fácil de usar como e-mail. Podemos usar
essas ferramentas para encontrar as melhores tarifas aéreas para Nova York, encontrar um número de
telefone de um colega há muito perdido, ou encontrar os melhores preços de carros, etc.

As perspectivas de longo prazo são verdadeiramente emocionante. Imagine que agentes inteligentes
soltos em dados de investigação médica ou em dados de partículas sub- atômicas. Computadores
podem revelar novos tratamentos para doenças ou novos insights sobre a natureza do universo.

5
 É o fim da privacidade?
O mesmo risco que você corre hoje ao utilizar serviços online, continuará correndo se a compra for
concretizada. Não há nenhum motivo novo para se preocupar. Não é como se, os funcionários do
Facebook fossem vasculhar cada uma de suas mensagens pessoais individualmente; isso é até inviável!
O objetivo desses sistemas é analisar blocos gigantescos de dados em busca de padrões
comportamentais.
A prática de monitorar os “passos” do consumidor com o objetivo de exibir uma vitrine de ofertas mais
relevante é muito comum também em sites de e-commerce e de vendas de passagens aéreas, só para
citar mais exemplos.

Referências
http://www.significados.com.br/data-mining/
http://www.devmedia.com.br/conceitos-e-tecnicas-sobre-data-mining/19342
https://portogente.com.br/portopedia/datamining-73758
http://www.joeldebortoli.com/2012/08/data-mining-mineracao-de-dados.html
http://professorloureiro.com/data-mining-conceitos-e-aplicabilidades/

Você também pode gostar