Você está na página 1de 3

Trabalho Final da Disciplina

Informações da disciplina:
Nome do curso: Ciência de dados e Big Data Analytics
Nome da disciplina: Projeto Analítico

Questões:
1) Para o processamento de grandes massas de dados, no contexto de Big Data, é muito
utilizada uma plataforma de software em Java, de computação distribuída, voltada para
clusters, inspirada no MapReduce e no GoogleFS. Esta plataforma é:
A. Mapfix
B. Mapgoogle
C. Hadoop
D. Emrx
E. Nenhuma das repostas.

Justifique sua resposta: Hadoop é a única plataforma das apresentadas acima, que realizam
processamento de dados no contexto big-data

2) Ao utilizar armazenamento dos dados em nuvem, a localização do processamento de


aplicações Big Data não influenciará os custos e o tempo de resposta, uma vez que os dados
são acessíveis a partir de qualquer lugar.
A. Certo
B. Errado
Justifique sua resposta: Influenciará sim, pois a velocidade de conexão, pode varias de acordo
com o serviço de internet contratado, impactando diretamente no tempo de resposta e no
custo da conexão.

3) O processamento de consultas ad hoc em Big Data, devido às características de


armazenamento dos dados, utiliza técnicas semelhantes àquelas empregadas em consultas do
mesmo tipo em bancos de dados tradicionais.
A. Certo
B. Errado
Justifique sua resposta: As consultas em big data, não são de formas estruturadas, devido ao
grande volume de informação e diferentes tipos de dados disponíveis, como imagens, texto e
outros.

4) Cite duas propriedades fundamentais que distinguem computação em nuvem dos


sistemas distribuídos tradicionais.

A. Elasticidade rápida e pagamento à medida que o serviço é utilizado.


B. SLA e serviço individual.
C. Elasticidade e servidores individuais.
D. Pooling de Serviços e servidores paralelos.
E. Nenhuma das respostas.
Justifique sua resposta: Computação em nuvem pode ser facilmente adaptada a necessidade
do cliente. Se houve uma demanda muito grande em um determinado horário (pico de
acessos), pode-se ativar a elasticidade rapidamente para manter o trafego, e com isso, pagar a
mais ou menos pelo serviço, variando a elasticidade.

5) Esta afirmativa descreve que tipos de nuvem: “Serviços na nuvem são utilizados por todo o
mundo com diversas pessoas sendo que em um ambiente interno da empresa, esta proteção é
feita por firewalls, garantindo o uso exclusivo.”
A. Nuvem Híbrida.
B. Nuvem Pública.
C. Nuvem Privada.
D. Nuvem Privada e Híbrida.
E. Nenhuma das respostas.
Justifique sua resposta: Esta questão deveria ser reformulada. Mas em se tratando de rede
interna da empresa, podemos dizer que é uma nuvem privada. Pois não dá acesso ao externo;

6) Qual a vantagem da nuvem híbrida?


A. Exige cuidados especiais.
B. É que, através dela, é possível somar o que existe de melhor em cada uma das
modalidades (privada e pública) e ainda obter ganhos adicionais.
C. Exige uma série de cuidados e desenvolvimento.
D. É mais segura.
E. Nenhuma das respostas.
Justifique sua resposta: Nuvem hibrida é flexível e pode ser adaptada conforme a necessidade
do cliente.

7) Cite as técnicas de mineração de dados mais conhecidas.


A. Classificação e Associação.
B. Associação e Clusterização.
C. Classificação, Clusterização e Associação.
D. Clusterização e Classificação.
E. Nenhuma das respostas.
Justifique sua resposta: Associações: São ocorrências ligadas a um único evento.
Classificação: Reconhece modelos que descrevem o grupo ao qual o item pertence por meio
do exame dos itens já classificados e pela inferência de um conjunto de regras.
Aglomeração (clustering): Funciona de maneira semelhante a classificação quando ainda não
foram definidos grupos.

8) Qual a função do Spark?


A. Permite executarmos a função de agrupamento.
B. Permite o trabalho em cluster.
C. Permite o reuso de dados distribuídos em uma variedade de aplicações.
D. Permite trabalhar com grande volume de dados.
E. Nenhuma das respostas.
Justifique sua resposta: Spark oferece computação de cluster na memória para maiores
velocidades e oferece suporte a APIs Java, Scala e Python para praticidade no
desenvolvimento

9) Qual a dificuldade em trabalharmos com NoSQL?


A. Ausência de ferramentas de alto nível.
B. Muitas ferramentas de alto nível no mercado.
C. Padrões nas formas dos bancos de dados.
D. Segue as formas de ACID.
E. Nenhuma das respostas.
Justifique sua resposta: Devido ser uma nova plataforma de mercado, ainda precisa ser
adaptada e incluído mais mecanismos. Como ferramentas de alto nível.

10) O desafio de processamento de se trabalhar com grande volume de dados estão


relacionados a 3 aspectos, quais são eles?
A. Armazenamento, banco de dados e velocidade.
B. Velocidade, variedade e veracidade dos dados.
C. Tamanho dos atributos, velocidade e frequentes falhas.
D. Armazenamento dos dados na memória principal, a grande quantidade de iterações
sobre os dados e as frequentes falhas.
E. Nenhuma das respostas.
Justifique sua resposta: Ao processar os dados big-data, precisamos de velocidade na análise,
com uma variedade muito grande de informação e precisamos da veracidade desses dados.