Escolar Documentos
Profissional Documentos
Cultura Documentos
1
Correto
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
a. A utilização de dados pelos órgãos públicos para basear a tomada de decisões ainda é uma
prática pouco utilizada.
c. Os dados podem ser utilizados pelos órgãos públicos para auxiliar na detecção de
anomalias no monitoramento de indicadores ou na melhoria de processos.
e. Os dados disponibilizados em painéis pelos órgãos públicos brasileiros devem ser utilizados
apenas para consulta online, ou seja, não existe a possibilidade de um usuário baixar os dados
do painel para fazer suas próprias análises.
Feedback
A letra “A” está errada. Cada vez mais os órgãos públicos vêm tomando decisões com base
nos dados, seja para detecção de anomalias, monitoramento de indicadores ou melhoria de
processos.
A letra “B” está errada. Quando bem trabalhados, monitorados e analisados, os dados servem
para auxiliar as instituições em muitos aspectos.
A letra “C” está correta. Os órgãos públicos cada vez mais vêm tomando decisões com base
nos dados, seja para detecção de anomalias, monitoramento de indicadores ou melhoria de
processos.
A letra “D” está errada. Com o objetivo de dar mais transparência em suas ações, os órgãos
públicos têm disponibilizado dados governamentais em suas páginas na internet, seguindo o
disposto na LAI.
A letra “E” está errada. A maioria dos órgãos públicos disponibilizam os seus dados na internet,
exceto aqueles que se enquadram nas hipóteses de sigilo e de informações pessoais. Muitos
desses dados estão disponíveis em painéis sobre diversos temas, permitindo que sejam
baixados para análise individual.
Questão 2
Correto
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
Com relação aos dados abertos e à Lei de Acesso à Informação, assinale a alternativa correta:
a. A disponibilização dos dados abertos não pode ser considerada uma forma de dar
transparência aos cidadãos.
c. No Brasil, todos os dados do governo podem ser acessados livremente por qualquer
cidadão.
e. Podemos definir dados abertos como aqueles que qualquer pessoa pode livremente acessá-
los, utilizá-los, modificá-los e compartilhá-los para qualquer finalidade, estando sujeito a, no
máximo, a exigências que visem preservar sua proveniência e sua abertura.
Feedback
A letra “A” está errada. A disponibilização dos dados abertos é uma forma de dar transparência
aos cidadãos.
A letra “B” está errada. Qualquer pessoa pode livremente acessar, utilizar, modificar e
compartilhar os dados abertos para qualquer finalidade.
A letra “C” está errada. No Brasil, temos a Lei de Acesso à Informação (LAI) que define as
hipóteses de sigilo e de informações pessoais, ou seja, nem todos os dados do governo podem
ser acessados.
A letra “D” está errada. Vários países disponibilizam na internet bases de dados
governamentais classificadas como dados abertos, visando dar transparência ao cidadão,
sejam países desenvolvidos ou não.
A letra “E” está correta. Essa é a definição disponibilizada no Portal Brasileiro de Dados
Abertos.
Questão 3
Correto
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
A alternativa correta é a letra “D”. Os 4 Vs que caracterizam o Big Data são volume, variedade,
velocidade e veracidade.
Questão 4
Correto
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
A letra “D” está errada. O Hadoop é usado para processamento e gerenciamento de grandes
volumes de dados e não de pequenos.
Questão 5
Correto
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
c. É a arte de extrair conhecimento por meio dos dados para se tomar melhores decisões,
realizar previsões e entender o passado.
e. É uma técnica utilizada para agrupar os dados com base em características similares.
Feedback
A letra “B” está errada. A estatística é o ramo da ciência que consiste em desenvolver e aplicar
métodos para coletar, analisar e interpretar os dados.
A letra “C” está correta. Data science ou ciência de dados é a arte de extrair conhecimento por
meio dos dados para se tomar melhores decisões, realizar previsões e entender o passado.
Questão 1
Correto
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
a. Os algoritmos de machine learning são aplicados a um conjunto de dados com objetivo de
identificar os relacionamentos existentes e gerar um modelo a partir desses dados.
c. A aprendizagem não supervisionada pode ser utilizada para resolver problemas de
classificação e regressão.
d. A classificação tem como resultado uma saída numérica. Já a regressão tem como resultado
uma saída categórica/discreta.
A letra “A” está correta. Essa é exatamente a função dos algoritmos de machine learning.
A letra “B” está errada. O Clustering é uma atividade frequentemente utilizada para se agrupar
os dados que possuem características similares nos algoritmos de aprendizagem não
supervisionada.
A letra “C” está errada. A aprendizagem supervisionada que pode ser utilizada para resolver os
problemas de classificação e de regressão.
A letra “D” está errada. A classificação tem como resultado uma saída categórica/discreta. Já a
regressão tem como resultado uma saída numérica. A alternativa inverteu os conceitos.
A letra “E” está errada. Existem muitos algoritmos utilizados na aprendizagem de máquina, por
isso, é importante escolher o mais adequado ao problema proposto.
Questão 2
Correto
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
a. A regressão linear é um algoritmo de classificação que se baseia nos vizinhos mais
próximos.
c. Árvore de decisão é uma estrutura que armazena regras de decisão e possui nós, ramos e
folhas. Os nós representam as variáveis, os ramos representam os valores possíveis de cada
nó e as folhas representam o valor final de um nó.
d. O objetivo da regressão linear é dividir os dados em grupos com base na similaridade dos
dados (clusters), ou seja, temos dados que são similares dentro de um grupo, porém diferentes
quando comparados com os dados de outros grupos.
e. Clustering é uma atividade frequentemente utilizada para agrupar os dados que possuem
características distintas.
Feedback
A letra “A” errada. O algoritmo de classificação que se baseia nos vizinhos mais próximos é o
KNN.
A letra “E” errada. Clustering é uma atividade frequentemente utilizada para agrupar os dados
que possuem características similares.
Questão 3
Incorreto
Atingiu 0,00 de 1,00
Marcar questão
Texto da questão
b. Feature engineering é uma técnica utilizada para selecionar os atributos mais relevantes que
serão utilizados para treinar o modelo.
c. A técnica da normalização é utilizada para treinar e validar um modelo com o mesmo
conjunto de dados.
e. Divisão dos dados em treino e teste é uma técnica usada na fase de pré-processamento dos
dados.
Feedback
A letra “E” está correta. A divisão dos dados em treino e teste é uma técnica usada na fase de
pré-processamento dos dados, assim como a feature selection, a feature engineering,
a normalização e a redução da dimensionalidade.
Questão 4
Incorreto
Atingiu 0,00 de 1,00
Marcar questão
Texto da questão
Assinale a alternativa que apresenta a sequência das etapas usadas na construção do modelo
preditivo:
Questão 1
Correto
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
Assinale a alternativa que apresenta a sequência das etapas do processo de análise de dados
em linguagem R:
a. Obtenção dos dados, exploração dos dados, transformação dos dados obtidos, definição do
problema, visualização dos resultados e avaliação dos resultados.
c. Definição do problema, obtenção dos dados, transformação dos dados obtidos, exploração
dos dados e visualização dos resultados.
d. Obtenção dos dados, exploração dos dados, definição do problema, transformação dos
dados obtidos e visualização dos resultados.
e. Obtenção dos dados, definição do problema, exploração dos dados, transformação dos
dados obtidos, visualização dos resultados e avaliação dos resultados.
Feedback
Texto da questão
Com relação às funções usadas nas etapas do processo de análise de dados, assinale a
alternativa correta:
a. Para utilizar a função “read.csv()”, é necessário inserir o parâmetro “file”, que é o diretório do
arquivo que se deseja carregar.
d. Com a função “dim()”, é possível recuperar algumas informações do dataset, como valor
mínimo, máximo e média.
A letra “A” está correta. Para utilizar a função “read.csv()”, é necessário inserir o parâmetro
“file”, que é o diretório do arquivo que se deseja carregar.
A letra “B” está errada. O parâmetro “dec()” que representa o separador das casas decimais.
A letra “C” está errada. A função “view()” permite uma melhor apresentação em formato de
tabela.
A letra “D” está errada. A função “dim()” verifica o número de observações e colunas
do dataset.
A letra “E” está errada. A função “summary()” recupera informações do dataset, como valor
mínimo, máximo e média.
Questão 3
Incorreto
Atingiu 0,00 de 1,00
Marcar questão
Texto da questão
Assinale a alternativa que apresenta a sequência das etapas necessárias para a construção do
modelo preditivo:
c. Obtenção dos dados, preparação dos dados, definição do problema, construção do modelo
e análise exploratória.
d. Definição do problema, obtenção dos dados, preparação dos dados, análise exploratória,
construção do modelo e visualização dos resultados.
e. Obtenção dos dados, definição do problema, preparação dos dados, análise exploratória,
construção do modelo, visualização dos resultados e avaliação dos resultados.
Feedback
A alternativa correta é a letra “D”. As etapas necessárias para a construção do modelo preditivo
são: definição do problema, obtenção dos dados, preparação dos dados, análise exploratória,
construção do modelo e visualização dos resultados.
Questão 4
Correto
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
a. É possível verificar se a divisão foi feita corretamente com a função “predict()”.
c. Para dividir o dataset em treino e teste, deve-se utilizar a função “train_test_split()” do pacote
“caret”.
e. O parâmetro “bestTune” da função “train()” é utilizado para testar diferentes valores de um
determinado parâmetro.
Feedback
Your answer is correct.
A letra “A” está errada. A função “predict()” é utilizada para gerar novas previsões. Para
verificar se a divisão foi feita corretamente, é usada a função “dim()”.
A letra “B” está correta. A construção do modelo preditivo tem como passo inicial a divisão dos
dados em treino e teste. Essa operação é possível com a utilização do pacote “caTools”, no
qual há a função “sample.split()”.
A letra “C” está errada. Atualmente, não existe a função “train_test_split()” no pacote “caret”.
A letra “D” está errada. É a função “confusionMatrix()” que possibilita calcular o desempenho do
modelo.
A letra “E” está errada. Para testar diferentes valores de um determinado parâmetro, utiliza-se o
parâmetro “tuneGrid” da função “train()”.