Você está na página 1de 28

Artigo Cientfico apresentado Faculdade de Tecnologia da Zona Sul

Fatec-ZS como exigncia parcial para a obteno do ttulo de


Tecnlogo em Informtica para Gesto de Negcios.

Big Data so dados que excedem a capacidade de


processamento dos sistemas de banco de dados
convencionais.

Um

problema de memria em escala


global.
Formao
Internet
A

de um fenmeno

das coisas

web dos dados

Cientistas

medindo o infinito

Formao

de um fenmeno

Atualmente somam-se a
esses dados
estruturados
informaes disponveis
nos meios digitais. A
internet, a melhor fonte
de dados, quase
incompreensivelmente
grande. Os usurios
criam o contedo como
postagens de blog,
tweets, interaes em
redes sociais, fotos e
vdeos. Servidores
registram
continuamente logs
sobre suas aes online.
registro de eventos
relevantes num sistema
computacional

Internet

das coisas

O termo foi cunhado em 1999 por Kevin


Ashton para descrever um futuro onde
quase tudo poderia se tornar rastrevel
atravs de uma etiqueta de RFID aplicada.
Hoje, quando se fala sobre a "internet das
coisas", se descreve a proliferao de
dispositivos conectados internet e
sensores interligados a que atualmente
conhecemos como internet.

web dos dados

A Web 3.0, anunciada como a terceira onda


da Internet, projeta estruturar todo o
contedo disponvel na rede mundial de
computadores dentro dos conceitos de
compreenso das mquinas e "semntica
das redes.

Cientistas

medindo o infinito

A metodologia cientfica exige a


exaustiva repetio de testes e
medies para comprovao das
teorias e evoluo nas pesquisas. A
computao acompanha a cincia
intrinsecamente para executar o
processamento de tarefas repetitivas.
Descodificar o genoma humano
originalmente levou 10 anos para o
processo, agora pode ser conseguido
em uma semana.

Justificativa
Compreender

o fenmeno e sua conseqncia no

setor de TI
Metodologia
Investigao

indutiva sobre o tema


Dados acadmicos dirigidos a questes tcnicas
Fontes

de pesquisa no mercado de TI

Objetivo
Tecer

parmetros para estratgia futuras na camada


de negcios

Atualmente...

...so criadas mais informaes em dois dias do que a civilizao


gerou desde seu incio at o ano de 2003 (Schmidt, 2010). O ano
de 2012 est sendo marcado pela exploso do mercado de
anlise de Big Data. Empresas como a Gartner e IBM j
observavam em 2011 que o Big Data era uma tecnologia
emergente.

Um

problema de memria em escala


global.
Big Data uma denominao nova para um problema antigo, que
adquiriu propores maiores e que exige redobrada ateno. A
possibilidade de colapso dos sistemas de tecnologia de
informao exigiu um salto tecnolgico na maneira de manipular
dados que exercem grande influncia sobre os diversos aspectos
da vida humana: cincia, poltica, economia, sociedade e
comportamento e qualquer rea que necessite ser alimentada
com dados para processamento.

Big Data um termo aplicado a conjuntos de dados cujo tamanho


alm da capacidade de ferramentas de software usadas para capturar,
gerenciar e processar os dados dentro de um tempo tolervel decorrido.
Esto configurados em grandes formatos de dados e em constante
movimento atualmente e variando de algumas dezenas de terabytes a
petabytes de muitos dados em um nico conjunto de dados.

Nos prximos dez anos, s os dados digitais devero crescer 44 vezes.


Em 2020, haver 4 bilhes de pessoas on-line criando 50 trilhes de
gigabytes de dados. " (HP Intelligent Research - ed. May 15 - 2012)

Caractersticas
At aonde (em tamanho dados):

Os limites atuais so da
ordem de:
Petabytes
Exabytes
Zettabytes

O qu est sendo analisado:


Os cientistas frequentemente vem
deparam-se com este cenrio em:

Meteorologia
Genmica
Conectnomia
Simulaes de fsicas
complexas
Pesquisas biolgicas e
ambientais
Pesquisas na Internet, finanas
Informtica empresarial.

Tipo

de dados e como lhe dar com eles

Uma das chaves para extrair dados no estruturados como udio,


vdeo, imagens, eventos, tweets, wikis, fruns e blogs, e transformlos em informaes valiosas criar um modelo de dados semntico
a partir de uma camada que fica em cima do armazenamento de
dados.
Temos de reunir os dados a partir de diferentes fontes e dar sentido a
eles. O modo pelo qual fizemos isso e a forma que a indstria tem feito,
realizar extraes dos dados a partir de lugares diferentes e construir um
repositrio, depois, produzir relatrios fora desse repositrio. um
processo que consome tempo e no uma questo extremamente
flexvel.

Tecnologias
As tecnologias que esto sendo aplicados aos dados
incluem:
Processamento Paralelo Massivo
(Massively Parallel Processing, MPP);

Redes de prospeco de dados;


Sistemas de arquivos distribudos;
Bancos de dados distribudos;
Plataformas de computao em nuvem;
Internet;
Sistemas de armazenamento escalveis.

Os

cinco Vs

Os

cinco Vs

Os

cinco Vs

Em termos tcnicos poderamos definir o Big Data por cinco termos


que denominamos por 3 Vs ( Velocidade, volume e variedade).
Porm, em algumas teses veem se acrescentando mais dois Vs
(Veracidade e valor).

Onde

e como aplicar

Atualidade - A massificao do Big Data, no entanto, ainda


enfrenta obstculos. O maior deles, como no poderia deixar de ser
quando o assunto dados, a preocupao quanto privacidade.
Se a recomendao de links patrocinados pelo Google j parece
invasiva maioria das pessoas, o mundo e a legislao atuais no
esto preparados para as possibilidades que o Big Data oferece de
agregar e tirar concluses de dados at ento esparsos.
Fazer um balano dos dados - Quase todas as organizaes tm
a possibilidade de acesso a um fluxo equilibrado de dados no
estruturados, sejam eles dirigidos s redes sociais ou gerados a
partir de sensores que monitoram os andares de uma fbrica, por
exemplo. Mas produzir uma enxurrada de informao no significa
que imperativo salvar e manusear cada byte gerado.

Primeiros

negcios

Muitas das oportunidades de Big Data comearam em reas fora


da TI: os departamentos de marketing so exemplo. Eles tm
buscado no fenmeno uma forma de obter mais conhecimento
sobre as necessidades dos clientes e identificar tendncias de
compras por meio das redes sociais.
1. Reavaliar as estruturas - Big Data exige grandes mudanas
na infraestrutura de servidores e armazenamento na maioria das
empresas.
2. Estruturar os dados O mundo do Big Data vem com uma
longa lista de novas siglas e tecnologias que provavelmente nunca
estiveram antes na mira dos CIOs.
3. Prepare sua equipe - A maioria das empresas de TI conta com
apenas o talento necessrio para dar os passos seguinte com Big
Data. Por isso, as capacidades analticas so as mais cruciais e as
que mais faltam s equipes de TI.

Analisando

o Big Data Analytics

Big Data Analytics uma prtica que cresce rpida e


influentemente. Para descobrir quantas organizaes e usurios
realmente o fazem, foi formulada uma pesquisa que perguntou
aos entrevistados:
"A sua organizao executa anlise avanada de dados contra
grandes volumes hoje?

1. CDO - Chief Data Officer o diretor corporativo responsvel


por todo o processamento e minerao de dados de uma
empresa.
2. Cientista de dados - Um novo campo foi criado em 2001,
quando o termo "cincia de dados" foi usado pela primeira vez em
um artigo pelo estatstico William Cleveland, Data Science: Um
Plano de Aco para a Expanso das reas Tcnicas do Campo de
Estatstica .

1. Montando o Quebra Cabea - Desde a poca do boca a


boca e do comrcio baseado na produo artesanal, o
relacionamento interpessoal entre cliente e produtor passou por
diversas fases evolutivas. Transitamos da indiferena e do foco
exclusivo na produo e na capitalizao descoberta de certo
controle proporcionado pela informatizao dos sistemas, como
os de atendimento aos clientes ou Call Center/URA, de
Relacionamento com os clientes CRM, de Inteligncia de
negcios BI e, por fim, a unificao de todas essas bases de
conhecimento em um sistema ou ERP.

2. O Perde e Ganha do Social Big Data - Empresas de


variados portes se aproveitam atualmente do intenso movimento
social e tecnolgico para ampliar bases de seguidores e fs, unindo
listagens de milhares e at milhes de clientes.
Cada um desses clientes mantm grande quantidade de dados
pessoais, de relacionamento, de atividades e de hbitos de
consumo disponveis de forma pblica. Porm, esses dados esto
extremamente desestruturados e dispostos em muitas redes
sociais diferentes.
As empresas que conquistaram essas bases, hoje as utilizam
apenas para manter um relacionamento atravs de contedos nos
canais sociais, sem beneficiarem-se dessa riqueza de informaes.

Como consideramos os dados, ao invs de lgica de negcios,


como entidade primria em um programa, preciso criar ou
redescobrir o idioma que nos permite concentrar os dados, ao
invs de abstraes. Em outras palavras:
Escrever programas mais curtos que tornam claro o que
estamos fazendo com os dados.
Essas abstraes por sua vez se prestam para a criao de
melhores ferramentas para no-programadores.

Melhor suporte a interatividade. Se o Hadoop tem alguma


fraqueza, a natureza orientada por lotes de computao. A
natureza gil da cincia de dados ir favorecer qualquer
ferramenta que permita mais interatividade.