Escolar Documentos
Profissional Documentos
Cultura Documentos
Além daquelas partes que escolhemos falar, selecionei mais algumas partes
para cada um. São apenas sugestões, podemos fazer trocas.
Algumas partes que estarão com marcador, eu vou inserir no slide, são
apenas observações para complementar.
Dividi assim:
01 – Gabriel
02 – Alice
03 – Anne
04 – Anne
05 – David (se possível com a demonstração de algum dos softwares citados)
06 – David
07 - Alice
1
Tópicos Do Trabalho De Mineração De Dados
(Data Minning)
Desde que a informática tomou conta de nossas vidas, imensos volumes de informação têm sido
sistematicamente coletados e armazenados. A simples armazenagem e recuperação dessa informação já
traz um grande benefício, pois agora já não é mais necessário procurar informação em volumosos e
ineficazes arquivos de papel. Contudo, apenas recuperar informação não propicia todas as vantagens
possíveis. O processo de Data Mining permite que se investigue esses dados à procura de padrões que
tenham valor para a empresa. Neste seminário pretendemos expor alguns dos principais conceitos que
estão por trás dessa importante tecnologia.
Consiste em uma funcionalidade que agrega e organiza dados, encontrando neles padrões associações,
mudanças e anomalias relevantes.
Pode ser divido em algumas etapas básicas que são: exploração, construção de modelo, definição de
padrão e validação e verificação.
A mineração de dados levanta aspectos legais e questões relativas à privacidade e ética. Apesar disso,
muitas pessoas afirmam que a mineração de dados é eticamente neutra, pois não apresenta implicações
éticas.
Redes neurais: são sistemas computacionais baseados numa aproximação à computação baseada em
ligações. Nós são interligados para formar uma rede de nós - daí o termo "rede neural". A inspiração
original para esta técnica advém do exame das estruturas do cérebro, em particular do exame de
neurônios. Exemplos de ferramentas: SPSS Neural Connection, IBM Neural Network Utility.
Indução de regras: refere-se à detecção de tendências dentro de grupos de dados, ou de “regras” sobre
o dado. As regras são, então, apresentadas aos usuários como uma lista “não encomendada”. Exemplos
de ferramentas: IDIS da Information Discovey e Knowledge Seeker da Angoss Software.
Árvores de decisão: baseiam-se numa análise que trabalha testando automaticamente todos os valores
do dado para identificar aqueles que são fortemente associados com os itens de saída selecionados para
exame. Os valores que são encontrados com forte associação são os prognósticos chaves ou fatores
2
explicativos, usualmente chamados de regras sobre o dado. Exemplos de ferramentas: Alice
d’Isoft, Business Objects BusinessMiner, DataMind.
Analise de séries temporais: a estatística é a mais antiga tecnologia em DM, e é parte da fundação
básica de todas as outras tecnologias. Ela incorpora um envolvimento muito forte do usuário, exigindo
engenheiros experientes, para construir modelos que descrevem o comportamento do dado através dos
métodos clássicos de matemática. A análise de séries temporais frequentemente é confundida como um
gênero mais simples de DM chamado “forecasting” (previsão). Exemplos de ferramentas: S+, SAS, SPSS.
Visualização: mapeia o dado sendo minerado de acordo com dimensões especificadas. Nenhuma
análise é executada pelo programa de DM além de manipulação estatística básica. Exemplos de
ferramentas: IBM Parallel Visual Explorer, SAS System, Advenced Visual Systems (AVS) Express -
Visualization Edition.
Sua premissa é uma argumentação ativa, isto é, em vez do usuário definir o problema, selecionar os
dados e as ferramentas para analisar tais dados, as ferramentas do Data Mining pesquisam
automaticamente os mesmos a procura de anomalias e possíveis relacionamentos, identificando assim
problemas que não tinham sido identificados pelo usuário.
Nos últimos anos, a mineração de dados tem sido amplamente utilizada nas áreas da ciência e
engenharia, tais como bioinformática, genética, medicina, educação e engenharia elétrica.
Os projetos de data mining podem ser implementados de várias formas: comprando software específico
para data mining, contratando consultores externos que façam a coleta dos dados e a apresentação de
um relatório pronto ao cliente final ou processando os dados no próprio cliente, criando um ambiente
em que o processo de data mining possa ser repetido e aprimorado sucessivas vezes.
O alto potencial de retorno em projetos de data mining só pode ser alcançado quando o ciclo é
corretamente implementado: identificação de oportunidades, elaboração de modelo para determinação
das regras ou padrões, elaboração das ações que possam se beneficiar destas regras, medição dos
resultados destas ações, que por sua vez possibilitam a identificação de novas oportunidades e assim
sucessivamente.
Dentro deste contexto, data mining tem ganho muita atenção de diversas áreas de interesse. Elas o
consideram como um campo crítico para seus negócios. O uso de informações valiosas obtidas por
mineração dos dados é necessário para manter a competitividade no ambiente comercial atual. Com o
advento do "data warehousing" que faz a armazenagem de grandes quantidades de dados em um local
comum e do contínuo avanço no aumento do poder de processamento dos computadores, os
empresários procuram por tecnologias e ferramentas para extrair informações úteis dos dados.
4
Weka – software escrito em Java. Primeiramente foi feito para a área de agricultura, mas hoje é uma
poderosa ferramenta para diversas áreas – inclui visualizações e algoritmos para a análise de dados e
modelagem perspectivas.
Orange – phyton, tem uma interface muito amigável e pode ser usado para vários tipos de mineração –
textos, bioinformática, etc.
Knime – java, mas pode fazer algoritimos em phyton ou R – caso os que o programa tem não atenda ao
propósito. É utilzado para análise grandes e complexas – é muito utilizado para inteligência de mercado
e na área financeira
NTLK – Escrito em Phyton, utilizado para análise Natural Language Processing ou, em português,
Processamento de Linguagem Natural. Simples, consistente e modularizado. Por "linguagem natural"
entendemos as linguagens que são utilizadas para comunicações do dia a dia por seres humanos; línguas
como o inglês, o hindi ou o português. Em contraste com linguagens artificiais como as linguagens de
programação e notações matemáticas, as linguagens naturais evoluem à medida que passam de geração
em geração, e é difícil descrevê-las por completo por meio de regras explícitas.
06 – Exemplos Na Indústria
Começamos a falar da era da industrialização com o Ford e o carro preto e caminhamos para mercados
cada vez mais segmentados e individualizados – onde a mineração de dados tem papel fundamental na
identificação de necessidades e mudanças sociais.
Ex. oferecer pacotes de serviços especializados na área de telefonia (vendas casadas), marketing, novos
produtos, abertura de novos mercados em vários setores da economia.
Há curto prazo está relacionada com questões mais mundanas – finanças, negócios, áreas rentáveis em
geral. Campanhas de Micro- marketing irão explorar novos nichos. Publicidade terá como alvo clientes
potenciais uma precisão muito grande.
A médio prazo, a mineração de dados pode ser tão comum e fácil de usar como e-mail. Podemos usar
essas ferramentas para encontrar as melhores tarifas aéreas para Nova York, encontrar um número de
telefone de um colega há muito perdido, ou encontrar os melhores preços de carros, etc.
As perspectivas de longo prazo são verdadeiramente emocionante. Imagine que agentes inteligentes
soltos em dados de investigação médica ou em dados de partículas sub- atômicas. Computadores
podem revelar novos tratamentos para doenças ou novos insights sobre a natureza do universo.
5
É o fim da privacidade?
O mesmo risco que você corre hoje ao utilizar serviços online, continuará correndo se a compra for
concretizada. Não há nenhum motivo novo para se preocupar. Não é como se, os funcionários do
Facebook fossem vasculhar cada uma de suas mensagens pessoais individualmente; isso é até inviável!
O objetivo desses sistemas é analisar blocos gigantescos de dados em busca de padrões
comportamentais.
A prática de monitorar os “passos” do consumidor com o objetivo de exibir uma vitrine de ofertas mais
relevante é muito comum também em sites de e-commerce e de vendas de passagens aéreas, só para
citar mais exemplos.
Referências
http://www.significados.com.br/data-mining/
http://www.devmedia.com.br/conceitos-e-tecnicas-sobre-data-mining/19342
https://portogente.com.br/portopedia/datamining-73758
http://www.joeldebortoli.com/2012/08/data-mining-mineracao-de-dados.html
http://professorloureiro.com/data-mining-conceitos-e-aplicabilidades/