Escolar Documentos
Profissional Documentos
Cultura Documentos
Dispositivo liberado pela Matrícula 202109381903 com o token 397553 em 14/10/2023 09:16:03.
Os dados que, por alguma razão, normalmente interferência humana, não chegam com todos os atributos esperados
durante a coleta de dados, são conhecidos como:
Faltantes.
Embaralhados.
Enviesados.
Nulos.
Corrompidos.
Para a regularização dos dados obtidos, qual técnica podemos utilizar objetivando fazer com que os dados fiquem na
mesma escala?
MinMax
Map & Reduce
Divide
Splice
Shuffle
KDD-DM.
KDM.
CRISP-DM.
SIGKDD.
SIGM.
https://simulado.estacio.br/alunos/ 1/3
27/11/2023, 17:49 EPS
Em relação aos RDBMS, selecione a opção que apresenta a característica que trata as transações em um banco
de dados como uma unidade indivisível.
Indivisibilidade.
Consistência.
Durabilidade.
Atomicidade.
Isolamento.
O data lake é composto por camadas e níveis. Selecione a opção correta a respeito da camada responsável por fazer a
marcação dos dados do Data Lake.
Camada de Metadados
Camada de gerenciamento do ciclo de vida da informação
Camada de segurança
Camada de gerenciamento de dados
Camada de governança
Em relação às redes de Internet das coisas, selecione a opção correta que relaciona os dispositivos entre si.
Em relação aos formatos que os dados de Big Data, selecione a opção que corresponde a quantidade de formas que
podem ser encontrados.
https://simulado.estacio.br/alunos/ 2/3
27/11/2023, 17:49 EPS
6
4
3
2
5
import numpy as np
x = np.array([1, 5, 1, 6, 4, 7, 7])
função_teste = lambda x: x+x
print(função_teste(x))
A biblioteca Pandas é amplamente utilizada para manipular dados heterogêneos, situação recorrente para
aplicações de Big Data. Nesse sentido, selecione a opção que contém a estrutura de dados que possibilita o Cientista
de dados atribuir nome para as colunas.
numpy.array
RDD
PySpark
SQL
DataFrame
https://simulado.estacio.br/alunos/ 3/3