Você está na página 1de 3

UNIVERSIDADE TECNOLGICA FEDERAL DO PARAN

GUILHERME NAGURA
HEVERSON PEREIRA
ISABEL BARROS

RESUMO:
DATA MINING
CLUSTERING

PONTA GROSSA
OUTUBRO/2016

1 DATA MINING
O processo de minerao de dados para descobrir conexes ocultas e para prever
tendncias futuras tem uma longa histria. Por vezes chamado de descoberta de
conhecimento em bancos de dados, o termo minerao de dados ou data mining s
foi inventado nos anos 1990, mas sua criao composta por trs disciplinas cientficas
entrelaadas: estatstica (o estudo numrico de dados relacionados), inteligncia
artificial (inteligncia artificial exibida por software e/ou mquinas) e machine
learning(algoritmos que podem aprender a partir dos dados para fazer previses). O que
era velho se tornou novo outra vez, pois a tecnologia de minerao de dados continua
evoluindo para acompanhar o potencial ilimitado do big data e a capacidade
computacional acessvel.
Minerao de dados o processo de explorao de grandes quantidades de dados
com o objetivo de encontrar anomalias, padres e correlaes para suportar a tomada de
decises e proporcionar vantagens estratgicas. Usando uma ampla variedade de
tcnicas, voc pode utilizar estas informaes para aumentar as receitas, reduzir custos,
melhorar o relacionamento com os clientes, reduzir riscos e muito mais. Por que a
minerao de dados importante? O volume de dados produzido est dobrando a cada
dois anos. Dados no-estruturados compem sozinhos 90% do universo digital. Porm,
mais informao no significa necessariamente mais conhecimento. A minerao de
dados nos permite filtrar todo o rudo catico e repetitivo, entender o que relevante e,
ento, fazer bom uso dessa informao para avaliar os provveis resultados.
Exemplos:
Em comunicaes, um mercado sobrecarregado e de concorrncia apertada, as
respostas esto muitas vezes nos dados de seus consumidores. A empresa
multimdia Sanoma utiliza modelos analticos para dar sentido a milhes de transaes
por semana, prever o comportamento do cliente e oferecer campanhas altamente
segmentadas e relevantes.
J na educao, com visualizaes unificadas e voltadas para os dados do
progresso dos alunos, os educadores podem prever o desempenho dos alunos antes que
eles entrem na sala de aula e desenvolver estratgias de interveno para mant-los no
caminho certo. Mais de 4.000 professores e 350 administradores no Plano Independent
School District podem acessar rapidamente os dados dos alunos e prever as conquistas.
Muitas das escolas do distrito esto com 90% de desempenho.

2 CLUSTERING
Clustering, ou cluster, o nome dado a um sistema que relaciona dois ou mais
computadores (conhecidos como n, ou node) para que estes trabalhem de maneira
conjunta para processar uma tarefa. O processamento visto como sendo realizado por
um nico computador, ou seja, os ns do cluster dividem entre si as atividades de
processamento e executam a tarefa desejada de maneira simultnea.
A conexo dos ns do cluster deve ser feita por uma tecnologia de rede, como
por exemplo, a Ethernet. A Ethernet uma arquitetura de interconexo para redes locais
(LAN) mais utilizada no mercado atualmente. Alm da conexo dos ns da rede, o
padro do cluster escolhido deve permitir a incluso ou retirada de ns com o cluster em
funcionamento, do contrrio, o trabalho de remoo e substituio de um computador
que apresenta algum tipo de problema faria a aplicao como um todo parar.
A utilizao de um cluster se torna uma soluo vivel pois os ns podem ser
compostos por computadores simples, no sendo necessrios possurem os mesmos
hardwares, porm recomenda-se que estes possuam o mesmo sistema operacional para
facilitar o gerenciamento do cluster. Juntos, esses computadores simples geram um
processamento similar a um supercomputador.
H vrios tipos de cluster, mas os principais so: cluster de alto desempenho,
cluster de ata disponibilidade e dluster de balanceamento de carga. Os clusters de alto
desempenho so exigentes no que diz respeito ao processamento (por exemplo, sistemas
utilizados em pesquisas cientificas). Os clusters de alta disponibilidade, o foco est em
manter a aplicao em pleno funcionamento, ou seja, sem que ocorra paradas (por
exemplo, utilizados em solues de misso crtica). O cluster de balanceamento de
carga, o foco fazer com que cada computador receba e atenda a uma requisio, no
necessariamente dividindo uma tarefa com os outros ns (por exemplo, utilizado em
stios de compras). Os tipos de clusters podem ser combinados para atender as
necessidades.

Você também pode gostar