Escolar Documentos
Profissional Documentos
Cultura Documentos
O nível de gerenciamento e governança de um Data Lake pode nos dar pistas para
definir seu nível de maturidade.
I – Data Swamp é o nível em que os dados de um Data Lake estão tão degradados
que não há mais como extrair informações úteis.
II – Data pond é o estágio inicial de um Data Lake, funciona de forma muito
semelhante a um Data Warehouse mal projetado. Sua construção e manutenção
exigem um alto envolvimento de uma equipe técnica.
III – Data puddle consiste em uma coleção de Data Marts para propósitos específicos.
Não é capaz de colaborar para melhorar o acesso aos dados.
IV – Em um Data Lake propriamente dito, os usuários são capazes de realizar buscas
e localizar dados diretamente.
V – Um Data Ocean é a aplicação de um Data Lake para toda uma organização.
Dessa forma é possível utilizar seus dados para tomar decisões estratégicas de
negócios.
Dentre essas afirmações estão INCORRETAS:
Nota: 10.0
A Todas, exceto IV
B I, IV e V
C Apenas III
D I, II e IV
E II e III
Você assinalou essa alternativa (E)
Você acertou!
Justificativa: O nível de maturidade descrito pela afirmação II não corresponde ao Data Pon
tal afirmação encontra-se INCORRETA. Enquanto que a afirmação III é verdadeira para u
Puddle. Portanto a afirmação está INCORRETA. As demais afirmações (I, IV e V) estão CO
A Todas, exceto V
B II, IV e V
C Todas
D I, III e V
E II e III
Você assinalou essa alternativa (E)
Você acertou!
Justificativa: O intervalo de slide é a quantidade de tempo que define a frequência em que a
janela e não a frequência de captura dos dados como alega INCORRETAMENTE a afi
de batch é a quantidade de tempo que define a frequência em que os dados são capturado
a quantidade de tempo entre cada captura de dados. Diferentemente do que diz ERRO
demais afirmações (I, IV e V) estão CORRETAS.
A I, II e III
B Todas
C I, II e IV
D II, III e V
Você assinalou essa alternativa (D)
Você acertou!
Justificativa: Entre as principais características do Impala destaca-se a possibilidade de
latência de dados armazenados em HDFS e HBase. Dessa forma a afirmação I enc
principais características do Accumulo é a segurança em nível de célula, onde cada par
rótulo de segurança que tem a capacidade de limitar os resultados de uma consulta basea
usuário. Portanto a afirmação IV está INCORRETA. As afirmações II, III e V estão CORRET
E Apenas III
A Todas
B I, II e V
C I, IV e V
D Todas, exceto V
Você assinalou essa alternativa (D)
Você acertou!
Justificativa: Diferentemente do que diz INCORRETAMENTE afirmação V, é possível ma
DStream. Isso é muito útil para realizar operações que dependem de informações e
afirmações (I, II, III e IV) estão corretas.
E Apenas IV
A II, III e IV
B I, IV e V
C I, II e IV
D Todas, exceto I
Você assinalou essa alternativa (D)
Você acertou!
Todas exceto I
Justificativa: Existem desafios no que se trata da complexidade em integrar sistema
tradicionais existentes. Ao contrário do que alega a afirmação I que está INCORRETA. Tod
e V) estão CORRETAS.
E Todas
A Todas, exceto IV
Justificativa: O algoritmo Connected Components busca encontrar todos os componentes d
entre si onde cada vértice (ou componente) dentro de um grupo pode ser alcançado a p
grupo. Além disso não deve haver nenhum caminho, ou seja, arestas, entre dois grupos
INCORRETAMENTE a afirmação IV. Todas as outras afirmações (I, II, III e V) estão CORR
B I, II e III
C II, III e IV
Você assinalou essa alternativa (C)
D IV e V
E Todas
A Todas, exceto V
B I e III
C Nenhuma
D II e IV
Você assinalou essa alternativa (D)
Você acertou!
Justificativa: Na afirmação II, é incorreto dizer que o sistema de recomendações baseada
usuário avalie o novo item, pois este sistema se baseia nas características do item e n
afirmação IV diz que os métodos de filtragem colaborativa podem ser aplicados apenas
usuários, porém podemos aplicar o mesmo princípio para as avaliações entre itens (ou
Portanto tal afirmação está INCORRETA. As demais afirmações (I, III e V) estão corretas.
E II e V
Sobre os diferentes formatos de dados suportados pelo Spark SQL avalie as seguintes
afirmações:
A II, IV e V
Você assinalou essa alternativa (A)
Você acertou!
Justificativa: A fonte de dados padrão utilizada pelo Spark para todas as operações são
sejam configurados de outra forma. Diferentemente do que INCORRETAMENTE diz a afir
de armazenamento colunar, não é baseado em chave-valor como diz ERRONEAMENTE a
e V estão CORRETAS.
B I, II e IV
C Todas, exceto I
D II, III e IV
E Todas
A II, IV e V
Você assinalou essa alternativa (A)
Você acertou!
Justificativa: A estratégia de armazenamento de dados Data Lake pode oferecer uma r
estratégias Data Warehouse e Data Mart não são capazes de oferecer. Dessa forma en
INCORRETA. Metadados técnicos são os metadados que fornecem informações a respeit
tais como: tamanho, tipo de dado, esquema. Portanto a afirmação III está INCORRETA.
estão CORRETAS.
B Todas, exceto IV
C I, II e V
D III, IV e V
E Todas
B II, III e IV
C Nenhuma
Você assinalou essa alternativa (C)
D IV e V
E II
Justificativa: Temos variações de BDaaS (Big Data as a Service) que podem implementar t
de SaaS ou ambas na mesma nuvem. Ou seja, as camadas não precisam necessariame
isso a afirmação II encontra-se INCORRETA. As demais afirmações (I, III, IV e V) estão CO