Escolar Documentos
Profissional Documentos
Cultura Documentos
GUILHERME NAGURA
HEVERSON PEREIRA
ISABEL BARROS
RESUMO:
DATA MINING
CLUSTERING
PONTA GROSSA
OUTUBRO/2016
1 DATA MINING
O processo de minerao de dados para descobrir conexes ocultas e para prever
tendncias futuras tem uma longa histria. Por vezes chamado de descoberta de
conhecimento em bancos de dados, o termo minerao de dados ou data mining s
foi inventado nos anos 1990, mas sua criao composta por trs disciplinas cientficas
entrelaadas: estatstica (o estudo numrico de dados relacionados), inteligncia
artificial (inteligncia artificial exibida por software e/ou mquinas) e machine
learning(algoritmos que podem aprender a partir dos dados para fazer previses). O que
era velho se tornou novo outra vez, pois a tecnologia de minerao de dados continua
evoluindo para acompanhar o potencial ilimitado do big data e a capacidade
computacional acessvel.
Minerao de dados o processo de explorao de grandes quantidades de dados
com o objetivo de encontrar anomalias, padres e correlaes para suportar a tomada de
decises e proporcionar vantagens estratgicas. Usando uma ampla variedade de
tcnicas, voc pode utilizar estas informaes para aumentar as receitas, reduzir custos,
melhorar o relacionamento com os clientes, reduzir riscos e muito mais. Por que a
minerao de dados importante? O volume de dados produzido est dobrando a cada
dois anos. Dados no-estruturados compem sozinhos 90% do universo digital. Porm,
mais informao no significa necessariamente mais conhecimento. A minerao de
dados nos permite filtrar todo o rudo catico e repetitivo, entender o que relevante e,
ento, fazer bom uso dessa informao para avaliar os provveis resultados.
Exemplos:
Em comunicaes, um mercado sobrecarregado e de concorrncia apertada, as
respostas esto muitas vezes nos dados de seus consumidores. A empresa
multimdia Sanoma utiliza modelos analticos para dar sentido a milhes de transaes
por semana, prever o comportamento do cliente e oferecer campanhas altamente
segmentadas e relevantes.
J na educao, com visualizaes unificadas e voltadas para os dados do
progresso dos alunos, os educadores podem prever o desempenho dos alunos antes que
eles entrem na sala de aula e desenvolver estratgias de interveno para mant-los no
caminho certo. Mais de 4.000 professores e 350 administradores no Plano Independent
School District podem acessar rapidamente os dados dos alunos e prever as conquistas.
Muitas das escolas do distrito esto com 90% de desempenho.
2 CLUSTERING
Clustering, ou cluster, o nome dado a um sistema que relaciona dois ou mais
computadores (conhecidos como n, ou node) para que estes trabalhem de maneira
conjunta para processar uma tarefa. O processamento visto como sendo realizado por
um nico computador, ou seja, os ns do cluster dividem entre si as atividades de
processamento e executam a tarefa desejada de maneira simultnea.
A conexo dos ns do cluster deve ser feita por uma tecnologia de rede, como
por exemplo, a Ethernet. A Ethernet uma arquitetura de interconexo para redes locais
(LAN) mais utilizada no mercado atualmente. Alm da conexo dos ns da rede, o
padro do cluster escolhido deve permitir a incluso ou retirada de ns com o cluster em
funcionamento, do contrrio, o trabalho de remoo e substituio de um computador
que apresenta algum tipo de problema faria a aplicao como um todo parar.
A utilizao de um cluster se torna uma soluo vivel pois os ns podem ser
compostos por computadores simples, no sendo necessrios possurem os mesmos
hardwares, porm recomenda-se que estes possuam o mesmo sistema operacional para
facilitar o gerenciamento do cluster. Juntos, esses computadores simples geram um
processamento similar a um supercomputador.
H vrios tipos de cluster, mas os principais so: cluster de alto desempenho,
cluster de ata disponibilidade e dluster de balanceamento de carga. Os clusters de alto
desempenho so exigentes no que diz respeito ao processamento (por exemplo, sistemas
utilizados em pesquisas cientificas). Os clusters de alta disponibilidade, o foco est em
manter a aplicao em pleno funcionamento, ou seja, sem que ocorra paradas (por
exemplo, utilizados em solues de misso crtica). O cluster de balanceamento de
carga, o foco fazer com que cada computador receba e atenda a uma requisio, no
necessariamente dividindo uma tarefa com os outros ns (por exemplo, utilizado em
stios de compras). Os tipos de clusters podem ser combinados para atender as
necessidades.