Escolar Documentos
Profissional Documentos
Cultura Documentos
• Modelos de Serviços
• Prós e Contras
• Aplicações
• BigData
• Hadoop
2
O que é Computação em Nuvem?
• Computação em
nuvem é um modelo
que possibilita acesso
a um conjunto de
recursos
computacionais
compartilhados e
interligados via rede
Imagem: http://antonioricardo.org/tag/cloud/ 3
O que é Computação em Nuvem?
Imagem: http://www.uolhost.com.br/blog/cloud-computing-a-importancia-das-nuvens#rmcl 4
O que é Computação em Nuvem?
Em resumo, é uma
plataforma que provê
serviços sob-demanda,
que está sempre
disponível, em qualquer
lugar e a qualquer hora
6
O que é Computação em Nuvem?
Principais Características
• Serviço sob demanda
Alocação dinâmica de recursos
• Acesso via rede
• Compartilhamento de recursos
• Elasticidade
• Serviço mensurável
Modelo pay-as-you-go
7
O que é Computação em Nuvem?
8
O que é Computação em Nuvem?
Modelos de implantação
• Privada
• Comunitária
• Pública
• Híbrida
Imagem: http://www.cloudproviderusa.com/the-difference-between-public-cloud-private-cloud/ 9
Modelos de Serviços
Imagem: http://www.rividium.com/cloud.aspx 10
Modelos de Serviços
Termos Emergentes
Database as a Service (DBaaS)
O provedor de serviço tem a responsabilidade de instalar e
dar manutenção ao banco de dados. Assim, o usuário, que
contratou o serviço, apenas paga um valor proporcional ao
uso.
11
Modelos de Serviços
BD
SGBD
instalation
configuration
maintenance
...
13
Prós e Contras
Principais Vantagens
Confiabilidade
Replicação dos dados
Disponibilidade das aplicações
14
Prós e Contras
Principais Vantagens
• Não há contratos complexos e duradouros de prestação
de serviço
Cobra-se apenas pelos recursos multiplicados pelo tempo
de uso
• Escala por demanda
Capacidade virtualmente infinitos
• Abstração da tecnologia sendo utilizada
15
Prós e Contras
Principais Desafios
Segurança e confidencialidade dos dados
Disponibilidade
Integração de serviços
16
Aplicações
Data Centers
Imagem: http://www.wdpo.org/world-data-protection-networks/ 17
Aplicações
Data Centers
Imagem: http://www.datacentermap.com/brazil/ 18
Aplicações
ARMAZENAMENTO ARMAZENAMENTO
COM REDUNDÂNCIA COM REDUNDÂNCIA DE
LOCAL (LRS) ZONA (ZRS)
19
Aplicações
Usos mais comuns da computação em nuvem
IaaS e PaaS
Armazenamento de dados
Ambientes de testes e desenvolvimento
Processamento e análise de Big Data
Backup
20
Big Data
Imagem: https://students.washington.edu/bits/club/wp-content/uploads/2014/05/Big-data.Red_.jpg 21
Big Data
22
Big Data
3Vs Volume
Big
Data
Velocidade Variedade
23
Big Data
5Vs Volume
Valor Veracidade
Big
Data
Velocidade Variedade
24
Big Data
Dados possuem informações valiosas
25
Big Data
Observatório da Dengue
• Aumento de mensagens
relacionadas ao termo
“dengue” em uma região
pode indicar um possível
surto
Imagem: http://www.ufmg.br/online/arquivos/anexos/Portal_Observatorio_Dengue.JPG 26
Big Data
Kevin Spacey e David Fincher
possuiam grande aceitação
Mesmos usuários gostavam de
thrillers políticos
28
Armazenamento Distribuído de Dados
http://blog.triscal.com.br/wp-content/uploads/2013/06/cap-theoram-image.png 29
Bancos de Dados NoSQL
Algumas Características
Foco no armazenamento de grandes volumes de dados
Alto desempenho
30
Bancos de Dados NoSQL
• Chave-valor
Modelo simples
Pesquisa rápida
Aplicações típicas
Gerenciamento de sessões
31
Bancos de Dados NoSQL
Chave Valor
32
Bancos de Dados NoSQL
• Documentos
Cada documento é uma coleção de
pares chave-valor
Formato JSON/XML
Aplicações típicas
• Aplicações Web
33
Bancos de Dados NoSQL
{
“Id”: 13490,
{
“Produto”: “TV”,
“Id”: 13489,
{ “Tamanho”: “32’”,
“Produto”: “TV”,
“Id”: 13488, “Tela”: “LED”
{ “Tamanho”: “50’”,
“Produto”: “TV”, }
“Id”: 13487, “Tela”: “PLASMA”
“Tamanho”: “40’”,
“Produto”: “TV”, }
“Tela”: “LED”
“Tamanho”: “20’”,
}
“Tela”: “LCD”
}
34
Bancos de Dados NoSQL
• Famílias de Colunas
Eficiente ao armazenar grandes quantidades
Valores identificados por uma tripla
Aplicações típicas
• Gerenciamento de grandes volumes de dados
35
Bancos de Dados NoSQL
Reys Famílias de Colunas
Principais Adicionais
• Recomendações
37
Bancos de Dados NoSQL
Vende
38
Bancos de Dados NoSQL
Imagen: http://drzito.files.wordpress.com/2007/05/network.jpg 39
Hadoop
• Framework de processamento paralelo de dados em
larga escala
• Altamente escalável
• Tolerante a falhas
• Disponível
• Principais componentes
• Armazenamento
• HDFS – Hadoop Distributed File System
• Processamento
• MapReduce
40
HDFS - Hadoop Distributed File System
NameNode
41
HDFS - Hadoop Distributed File System
NameNode
42
HDFS - Hadoop Distributed File System
NameNode
Metadados
43
MapReduce
casa rio
boneca rio
dado casa
dado boneca
dado casa
boneca rio
rio casa
boneca dado
44
MapReduce
casa rio
boneca rio
casa rio
boneca rio dado casa
dado casa dado boneca
dado boneca
dado casa dado casa
dado rio rio dado rio
casa rio dado
rio casa
rio dado
45
chave valor
MapReduce casa,1
rio, 1
boneca, 1
rio,1
casa rio
boneca rio dado,1
casa rio casa, 1
boneca rio dado casa dado, 1
dado casa dado boneca boneca, 1
dado boneca
dado casa dado casa dado,1
dado rio rio dado rio casa, 1
casa rio dado dado, 1
rio, 1
rio casa
rio dado
rio,1
casa, 1
rio, 1
dado, 1
46
chave valor
MapReduce casa,1
rio, 1 boneca, 1
boneca, 1 boneca, 1
rio,1
casa rio
boneca rio dado,1 casa,1
casa rio casa, 1 casa, 1
boneca rio dado, 1 casa, 1
dado casa
dado casa boneca, 1 casa, 1
dado boneca
dado boneca
dado casa dado casa dado,1 dado, 1
dado rio rio dado, 1
dado rio casa, 1
casa rio dado dado, 1
dado, 1
dado, 1
rio, 1 dado, 1
rio casa
rio dado
rio, 1
rio,1
rio, 1
casa, 1
rio, 1
rio, 1
rio, 1
dado, 1 rio, 1
47
MapReduce casa,1
rio, 1 boneca, 1
boneca, 1 boneca, 1
rio,1
casa rio
boneca rio dado,1 casa,1
casa rio casa, 1 casa, 1
boneca rio dado, 1 casa, 1
dado casa
boneca, 1 casa, 1 boneca, 2
dado casa dado boneca casa, 4
dado boneca
dado, 5
dado casa dado casa dado,1 dado, 1
rio, 5
dado rio rio dado, 1
dado rio casa, 1
casa rio dado dado, 1
dado, 1
dado, 1
rio, 1 dado, 1
rio casa
rio dado
rio, 1
rio,1
rio, 1
casa, 1
rio, 1
rio, 1
rio, 1
dado, 1 rio, 1
48
MapReduce
Função Map
49
MapReduce
Função Reduce
50
Evolução do MapReduce
• HiveQL – Linguagem
similar ao SQL para
acessar os dados
Apache Pig
Apache Hive
• PigLatin - Linguagem
procedural de alto nível
• Scripts são traduzidos
para sequências de
programas MapReduce
51
Oportunidades
Data Scientist
• Alguns conhecimentos necessários
Saber programação
Ser capaz de criar modelos estatísticos
Compreender as diferentes plataformas de Big Data
Imagem: http://brmtecnologia.files.wordpress.com/2012/07/bi-analyze.png 52
Oportunidades
53
Oportunidades
54
Oportunidades
55
Oportunidades
56
Referências
http://www.sciencedaily.com/releases/2013/05/130522085217.htm
http://www-3.unipv.it/ingegneria/copisteria_virtuale/motta/doss/13-PV-DoES-18-BigData-v3.pdf
http://pig.apache.org/
http://hadoop.apache.org/
https://hive.apache.org/
http://azure.microsoft.com/en-us/pricing/details/storage/
http://thoughtsoncloud.com/2014/02/top-7-most-common-uses-of-cloud-computing/
http://pt.slideshare.net/laodias/os-cinco-vs-do-big-data
http://www.microsoft.com/en-us/news/presskits/cloud/docs/the-economics-of-the-cloud.pdf
http://www.cloudproviderusa.com/the-difference-between-public-cloud-private-cloud/
http://observatorio.inweb.org.br/dengueapp?next=/dengueapp/relatorio
https://www.youtube.com/watch?v=jyx8iP5tfCI&feature=youtu.be
57
Obrigado
58