Você está na página 1de 3

ernanda Vieira Dias

202211500657 POLO CENTRO - RIO DAS OSTRAS - RJ

O resultado desta avaliação ficará disponível após o dia 21/09/2023.

TECNOLOGIAS AVANÇADAS

Simulado: NPG7979_AV_202211500657 (AG)


Aluno(a): FERNANDA VIEIRA DIAS Matrícula: 202211500657
Data: 29/07/2023 19:56:16 (Finalizada)

1a Questão
A coleta e preparação dos dados para análise no Python são de extrema importância. Os dados secundários
são assim definidos devido:

O fato de terem sido obtidos a partir de terceiros.


O fato de virem de uma fonte alternativa não convencional.
O fato de ocuparem menos espaço de memória.
O fato de requererem muito mais pré-processamento.
A sua baixa qualidade.

2a Questão
Eduardo quer mostrar aos gestores da empresa como as ações da carteira de investimentos recomendada que
ele e o time dele propuseram estão valorizando e gerando muitos dividendos aos clientes. Para isso, Eduardo
construiu um gráfico de ______, pois está lidando com dados ________ e quer mostrar o quão bem as
recomendações geradas por seu time estão evoluindo.

Respectivamente a resposta que completa as duas lacunas é:

Pizza; Numéricos
Linha; Temporais
Linha; Categóricos
Pizza; Categóricos
Linha; Numéricos

3a Questão
No mundo de Big Data, temos dados os mais variados possíveis, e sua classificação é fundamental para um
cientista de dados. As notas que compõem o histórico escolar de um aluno são classificadas como que tipo de
dados?

Semi-Estruturados
Atemporais
Numéricos
Temporais
Categóricos

4a Questão
Ser capaz de gerenciar uma infraestrutura complexa é uma habilidade fundamental para o profissional de
Tecnologia da Informação. Sendo assim, analise as alternativas e selecione a opção que apresenta o
componente responsável por desempenhar o papel de mestre na arquitetura do Hadoop.

DataNode
HServerMap
Bloco de dados
Replicador
NameNode

5a Questão
Em relação à fase de mapeamento do Hadoop, selecione a opção correta que apresenta o responsável
pela geração de fragmento para os componentes da fase de redução.

Combinador.
Redutor.
Particionador.
Mapeador.
Leitor de registros.

6a Questão
O data lake é composto por camadas e níveis. Selecione a opção correta a respeito da camada responsável por
fazer a marcação dos dados do Data Lake.

Camada de gerenciamento de dados


Camada de governança
Camada de gerenciamento do ciclo de vida da informação
Camada de segurança
Camada de Metadados

7a Questão
As bibliotecas são coleções de subprogramas utilizados no desenvolvimento de softwares. Selecione a opção
correta que contém o componente do ecossistema do Spark responsável por realizar operações paralelas em
grafos.

MLlib
RDDs
GraphX
Spark Core
Spark Streaming

8a Questão
Selecione a opção correta que contenha a ação responsável por retornar os elementos de um conjunto de
dados como um vetor.

take
coalesce
join
collect
reduce

9a Questão
A escolha adequada de uma linguagem de programação é fundamental para a maximização dos resultados
almejados. Nesse sentido, selecione a opção que contém a linguagem de programação mais adequada para
desenvolver aplicações para o Spark.

Java Script
Python
Java
Scala
R

10a Questão

Considere o trecho do programa Python abaixo. Qual o valor impresso ao executarmos o programa?

5
25
20
15
10

Você também pode gostar