Você está na página 1de 3

27/11/2023, 17:49 EPS

Disciplina: TÓPICOS DE BIG DATA EM PYTHON AV


Aluno: DOMRAVEL JOSÉ DE SOUZA 202109381903
Professor: ROBSON LORBIESKI
Turma: 9001

DGT0134_AV_202109381903 (AG) 14/10/2023 09:16:19 (F)

Avaliação: 5,00 pts Nota SIA: 5,00 pts

Dispositivo liberado pela Matrícula 202109381903 com o token 397553 em 14/10/2023 09:16:03.

02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS

1. Ref.: 6076846 Pontos: 0,00 / 1,00

Os dados que, por alguma razão, normalmente interferência humana, não chegam com todos os atributos esperados
durante a coleta de dados, são conhecidos como:

Faltantes.
Embaralhados.
Enviesados.
Nulos.
Corrompidos.

2. Ref.: 6076765 Pontos: 1,00 / 1,00

Para a regularização dos dados obtidos, qual técnica podemos utilizar objetivando fazer com que os dados fiquem na
mesma escala?

MinMax
Map & Reduce
Divide
Splice
Shuffle

02318 - BIG DATA ANALYTICS

3. Ref.: 6075831 Pontos: 1,00 / 1,00

Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial?

KDD-DM.
KDM.
CRISP-DM.
SIGKDD.
SIGM.

4. Ref.: 6075827 Pontos: 0,00 / 1,00

https://simulado.estacio.br/alunos/ 1/3
27/11/2023, 17:49 EPS

Quais os métodos de aprendizado de máquina que existem?

Aprendizado Supersticioso, Não-Supervisionado, Por Reforço, e Semisupervisionado


Aprendizado Supervisionado, Não-Supervisionado, Por Reforço, e Semisupervisionado
Aprendizado Supervisionado, Não-Supervisionado, Por Reforço, e Aleatório
Aprendizado Supervisionado, Escondido, Por Reforço, e Semisupervisionado
Aprendizado Supervisionado, Não-Supervisionado, Por Força Bruta, e Semisupervisionado

02508 - HADOOP E ARMAZENAMENTO DE DADOS

5. Ref.: 6076138 Pontos: 1,00 / 1,00

Em relação aos RDBMS, selecione a opção que apresenta a característica que trata as transações em um banco
de dados como uma unidade indivisível.

Indivisibilidade.
Consistência.
Durabilidade.
Atomicidade.
Isolamento.

6. Ref.: 6085378 Pontos: 0,00 / 1,00

O data lake é composto por camadas e níveis. Selecione a opção correta a respeito da camada responsável por fazer a
marcação dos dados do Data Lake.

Camada de Metadados
Camada de gerenciamento do ciclo de vida da informação
Camada de segurança
Camada de gerenciamento de dados
Camada de governança

02727 - PRINCÍPIOS DE BIG DATA

7. Ref.: 6067455 Pontos: 1,00 / 1,00

Em relação às redes de Internet das coisas, selecione a opção correta que relaciona os dispositivos entre si.

É uma conexão rede a rede


São um relacionamento máquina a máquina
São um conjunto de sinais
São interconectados entre si
São redes locais

8. Ref.: 6067386 Pontos: 1,00 / 1,00

Em relação aos formatos que os dados de Big Data, selecione a opção que corresponde a quantidade de formas que
podem ser encontrados.
https://simulado.estacio.br/alunos/ 2/3
27/11/2023, 17:49 EPS

6
4
3
2
5

02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON

9. Ref.: 6082364 Pontos: 0,00 / 1,00

Observe o trecho de código abaixo

import numpy as np
x = np.array([1, 5, 1, 6, 4, 7, 7])
função_teste = lambda x: x+x
print(função_teste(x))

Selecione a opção correta a respeito dele.

O programa ficará sintaticamente correto se for acrescentado o "SparkContext" para executar o


MapReduce.
O programa vai gerar e imprimir [2 10 2 12 8 14 14].
A saída do programa é [2].
O programa vai gerar um erro.
O programa produz a saída 31.

10. Ref.: 6076009 Pontos: 0,00 / 1,00

A biblioteca Pandas é amplamente utilizada para manipular dados heterogêneos, situação recorrente para
aplicações de Big Data. Nesse sentido, selecione a opção que contém a estrutura de dados que possibilita o Cientista
de dados atribuir nome para as colunas.

numpy.array
RDD
PySpark
SQL
DataFrame

https://simulado.estacio.br/alunos/ 3/3

Você também pode gostar