Escolar Documentos
Profissional Documentos
Cultura Documentos
Pergunta 1
0/0
“NumPy possui uma função chamada de genfromtxt para criar dados em Python de forma tabulada, em
NumPy, dados tabulados são avaliados como array. É muito fácil para o sistema baixar dados e processor
os itens.”
Fonte: SUBRAMANIAN, Gopi. Python Data Science Cookbook. Inglaterra: Packt Publisher, 2015. p. 40.
1. Incorreta:
2.
Resposta correta
3.
4.
5.
2. Pergunta 2
0/0
“A computação numérica começou em 1995 e, depois disso, em 2006, evoluiu para a biblioteca NumPy,
que foi a base para o objeto Series do Pandas. A biblioteca básica de plotagem é a Matplotlib.”
Fonte: CHEN, Daniel y. Análise de dados com Python e Pandas. São Paulo: Pearson, 2018. p. 379.
1.
Resposta correta
2. Incorreta:
3.
4.
5.
mostrará dados com o comando drop e duplicará dados com o comando duplicate.
3. Pergunta 3
0/0
“NumPy é um pacote Python fundamental para computação científica, ele inclui capacidade de criar
arrays multidimensionais, contém um poderoso objeto de matriz N-dimensional, funções sofisticadas
(transmissão), ferramentas para integrar C / C ++ e código Fortran.”
Fonte: BRESSERT, Eli apud PARREIRA, Lucas. SciPy and NumPy. California: O Reilly Média, 2012.
p. 5.
1.
II e III.
2.
II, IV e V.
3. Incorreta:
I e III.
4.
II, III e V.
Resposta correta
5.
I, II e III.
4. Pergunta 4
0/0
“Você deve documentar as funções que escreve. Na documentação você deve especificar as seguintes
informações:
• Ação – o que a função faz.
• Entrada – descrição dos argumentos passados para a função.
• Saída – descrição do valor retornado pela função.”
Fonte: HARA, Carmem; ZOLA, Wagner. Linguagem C. Paraíba: UFPR, 2008. p. 16.
Com base no trecho e no conteúdo estudado, pode-se afirmar que input em Python:
2.
Resposta correta
3.
4. Incorreta:
5.
5. Pergunta 5
0/0
“Em todos os exemplos que vimos até este momento, sentenças são executadas sequencialmente. A
ordem sequencial de execução de sentenças pode ser alterada se certas condições forem satisfeitas
durante a execução do programa. Isto é chamado “desvio condicional”. Todas as linguagens de
programação oferecem comandos para o desvio condicional. O mais simples é a sentença if.”
Fonte: HARA, Carmem; ZOLA, Wagner. Linguagem C. Paraíba: UFPR, 2008. p. 16.
IV. If Else significa “se algo for preenchido, então acontecerá algo”.
III e IV.
Resposta correta
2.
II e III.
3.
II e IV.
4.
I e II.
5. Incorreta:
I e III.
6. Pergunta 6
0/0
“Alguns métodos estatísticos de Pandas são referenciados com estatística indireta, onde não retorna o
valor atual, mas sim o relativo. Por exemplo, .idxmin() e o idxmax() retornam a posição do mínimo e do
máximo.”
Fonte: HEYDT, Michael. Learning Pandas. Mumbay: Packt, 2017. p. 162.
1.
2.
4.
Resposta correta
5. Incorreta:
7. Pergunta 7
0/0
I. Para manipular um arquivo importado, é necessário colocá-lo na mesma pasta do arquivo Python.
1.
I e II.
2.
III e V.
3.
III e IV.
4. Incorreta:
II e V.
5.
I e IV.
Resposta correta
8. Pergunta 8
0/0
“Em todas as opções utiliza-se pd.read_csv() para especificar o que baixar, também aplica-se a função
pd.read_Excel() para importar. Para ler outros tipos de pastas utiliza-se o parâmetro sheetname.”
Fonte: HEYDT, Michael. Learning Pandas. Mumbay: Packt, 2017. p. 195.
Com base no trecho e no conteúdo estudado sobre Excel, pode-se afirmar que:
Resposta correta
9. Pergunta 9
0/0
“Os métodos aggregate, transform e filter são normalmente utilizados para agrupar objetos em Pandas.
Espera-se investigar alguns trabalhos inerentes à objetos agrupados. O groupby é um excelente
agrupamento de diversos itens.”
Fonte: CHEN, Daniel Y. Pandas for Everyone. São Paulo: Pearson, 2018. p. 202.
Agora, observe a sintaxe abaixo:
plan.groupby('Day').aggregate({'Price': [min]})]
1.
Resposta correta
2. Incorreta:
3.
4.
5.
10. Pergunta 10
0/0
“Matplotlib é uma biblioteca versátil que gera visualizações de dados. Com variados tipos de desenhos e
opções de estilos refinados, é um instrumento de trabalho bom para criar imagens profissionais e
publicações científicas.”
Fonte: YU, Allen; CHUNG, Claire; YIM, Aldrin. Matplotlib 2.x. Mumbai: Packt, 2017. p. 8.
1. Incorreta:
II e III.
2.
I e IV.
3.
II e IV.
Resposta correta
4.
I e III.
5.
III e IV.
Módulo B - 136806 . 7 - Mineração de Dados - D.20231.B
0/0
Com base no texto acima e com relação ao ERP, pode-se dizer que:
1.
2.
3.
4.
5.
Resposta correta
2. Pergunta 2
0/0
“Há uma necessidade urgente de uma nova geração de técnicas e ferramentas computacionais para ajudar
os seres humanos a extrair informações úteis (conhecimento) de volumes de dados, essas técnicas e
ferramentas são as tema do emergente campo da descoberta do conhecimento em bancos de dados.”
Fonte: FAYYAD, U.M., PIATETSKY-SHAPIRO, G., SMYTH, P., UTHURUSAMY, R. Advances in
Knowledge Discovery and Data Mining. Califórnia: AAAI/MIT Press, 1996. P. 82.
Considerando o texto e o conteúdo da disciplina, a respeito dos filtros em Excel, pode-se dizer que:
Assim como o SQL, o Excel filtras por valores maiores ou iguais a um determinado
parâmetro na análise de dados.
Resposta correta
2.
3.
Para criar filtros em tabelas deve-se clicar com o botão direito no dado e em “formato de
célula” e selecionar o tipo de dados.
4.
Ao clicar na guia “inserir-dados”, o Excel irá inserir o filtro de dados, colocando uma
flecha de busca ao lado das tabelas.
5.
Para gerar novos filtros é necessário apagar os antigos, fazendo um de cada vez.
3. Pergunta 3
0/0
“Duas heurísticas podem ser utilizadas para indicar se esta operação deve ser utilizada: Eliminar todos os
atributos que apresentem valores constantes em todos os conjuntos de dados. A justificativa é que
atributos nesta situação não contribuem para distinguir os registros uns dos outros.”
Fonte: GOLDSHIMDIT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever, 2015. P. 39.
Com base no texto acima e no conteúdo sobre banco de dados, pode-se dizer que:
1.
2.
Atributos do tipo inteiro recebem números maiores que 128.
Resposta correta
3.
4.
5.
4. Pergunta 4
0/0
“As funcionalidades da mineração de dados são usadas para especificar os tipos de informações a serem
obtidas nas tarefas de mineração. Em geral estas tarefas podem ser classificadas em duas categorias: (1)
descritivas: caracterizam as propriedades gerais dos dados; e (2) preditivas: fazem inferência a partir dos
dados objetivando predições.”
Fonte: CASTRO, Gilberto. Ramos. Discussão conceitual sobre dado, informação e conhecimento. João
Pessoa: UFPB, 2011. P. 23.
Considerando o texto e o conteúdo da disciplina, sobre as funções da mineração, pode-se dizer que:
1.
2.
Resposta correta
3.
Analisar modos de utilização de computadores, locais de acesso, programas e sites é comum
na área da saúde.
4. Incorreta:
5.
5. Pergunta 5
0/0
“As etapas adicionais em o processo KDD, como preparação de dados, seleção de dados, limpeza de
dados, incorporação de conhecimento e interpretação adequada dos resultados mineração, são essenciais
para garantir que o conhecimento útil seja derivado dos dados.”
Fonte: FAYYAD, U.M., PIATETSKY-SHAPIRO, G., SMYTH, P., UTHURUSAMY, R. Advances in
Knowledge Discovery and Data Mining. Estados Unidos, Califórnia: AAAI/MIT Press, 1996.
Considerando o texto e o conteúdo da disciplina, sobre o processo KDD, analise as afirmativas a seguir:
1.
I e IV.
2.
III e IV.
3.
I e III.
Resposta correta
4.
II e IV.
5.
II e III.
6. Pergunta 6
0/0
“A conscientização de segurança aumentou significativamente nos últimos anos em TI, mas muitas vezes
permanece uma reflexão tardia e um fardo indesejável para a maioria das equipes de DW / BI.”
Fonte: FAYYAD, U.M.; PIATETSKY-SHAPIRO, G.; SMYTH, P.; UTHURUSAMY, R. Advances in
Knowledge Discovery and Data Mining. Califórnia: AAAI/MIT Press, 1996. P. 446.
Com base no texto acima e no conteúdo estudado, pode-se dizer, com relação ao modo de segurança do
workbench, que:
1.
2. Incorreta:
3.
4.
Resposta correta
5.
Protege contra inserção de dados através do botão preferences.
7. Pergunta 7
0/0
“Agregação de informações: Esta operação consiste em reunir (agregar) alguns registros de forma a
produzir um conjunto de dados de tamanho menor que o original. Na agregação de informações, dados
com menor detalhe. Por exemplo, é possível somar os valores de todas as compras de cada cliente,
obtendo o total de despesas por ele realizadas durante um determinado período.”
Fonte: GOLDSHIMDIT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever, 2015. P. 46.
Considerando o texto e o conteúdo da disciplina, sobre agregação e Data Warehouse, pode-se dizer que:
1.
Resposta correta
2. Incorreta:
3.
4.
5.
8. Pergunta 8
0/0
Com base no texto acima e no conteúdo sobre banco de dados, pode-se dizer que:
1. Incorreta:
2.
3.
4.
Resposta correta
5.
9. Pergunta 9
0/0
“Em particular, a utilização do computador como ferramenta educacional é um tema relevante e atual, e
tem sido objeto de pesquisa multidisciplinar. As primeiras aplicações em EDM se concentravam em
construção de modelos voltados à predição do desempenho dos estudantes com bases nos históricos
anteriores.”
Fonte: GOLDSHIMDIT, Ronaldo. BEZERRA, Eduardo. PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever, 2015. P.235.
Com base no texto acima e com relação ao EDM, pode-se dizer que:
2.
3. Incorreta:
4.
Resposta correta
5.
Tabelas feitas com a função EDM são mais claras e têm menos dados.
10. Pergunta 10
0/0
“Na grande maioria das situações, devido ao grande volume de dados, esse processo manual torna-se
impraticável. Ainda segundo Fayyad, o KDD (Knowledge Discovery in Databases ou Descoberta de
Conhecimento nas Bases de Dados) é uma tentativa de solucionar o problema causado pela chamada "era
da informação": a sobrecarga de dados.”
Fonte: CAMILO, Oliveira; SILVA, João. Mineração de dados: Conceitos, tarefas, métodos e ferramentas.
Goiás: UFG, 2009. P. 4.
Com base no texto acima e no conteúdo da disciplina, sobre as etapas do processo KDD, pode-se dizer
que:
1.
2.
A mineração é feita antes da etapa de enriquecimento.
3.
4.
Resposta correta
5.
0/0
“A limpeza dos dados inclui uma checagem da consistência das informações, correção de possíveis erros
e o preenchimento ou a exclusão de valores nulos e redundantes. Nessa fase são identificados e extraídos
os dados duplicados e/ou corrompidos. A execução dessa fase corrige a base de dados excluindo
consultas que não são necessárias e que seriam executadas pelo algoritmo minerador podendo afetar o seu
desempenho. Os métodos de limpeza são dependentes do domínio da aplicação.”
PROCACI, Alexandre. Geração de regras de associação quantitativas com intervalos não contínuos.
Minas Gerais: IC, 2004. p. 3.
Com base no trecho acima e no conteúdo estudado, analise as afirmativas a seguir sobre limpeza de
dados:
I e IV.
Resposta correta
2.
III e IV.
3. Incorreta:
II e IV.
4.
I e II.
5.
II e III.
2. Pergunta 2
0/0
“Um intervalo de confiança está associado ao nível de confiança correspondente a uma medida de certeza
de que o intervalor contém um parâmetro da população. (…) Escolhas comuns para o nível de confiança
são de 90%, 95% e 99%.”
CASTRO, Leandro C.; GOMES, Daniel E. Introdução a mineração de dados: Conceitos básicos,
algoritmos e aplicações. São Paulo: Saraiva, 2017. p. 342.
A partir do texto citado e dos conteúdos estudados, ordene os passos necessários para criar o cálculo de
confiança:
( ) Calcula-se a confiança.
1.
3, 4, 5, 2, 1.
2.
2, 4, 1, 5, 3.
3. Incorreta:
5, 3, 4, 2, 1.
4.
2, 4, 3, 1, 5.
5.
5, 2, 1, 4, 3.
Resposta correta
3. Pergunta 3
0/0
Com base no trecho acima e no conteúdo estudado, pode-se dizer que, antes de fazer a união de dois
bancos de dados, deve-se:
1.
Unir duas tabelas, usando o select inner join em um dado que se repete nas duas tabelas.
Resposta correta
2.
3.
4.
5. Incorreta:
Unir tabelas de épocas diferentes para ter mais certezas acerca de junções de dados.
4. Pergunta 4
0/0
“Também denominada operação linear, consiste em considerar os valores mínimo e máximo de cada
atributo no ajuste da escala. Esta operação mapeia os valores de um atributo no intervalo fechado de 0 até
1.”
GOLDSCHMIDT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emmanuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsevier, 2015. p. 61.
Com base no trecho acima e no conteúdo estudado, pode-se dizer que, em bancos de dados muito
grandes, para realizar a normalização linear, deve-se:
1.
2. Incorreta:
3.
5.
Resposta correta
5. Pergunta 5
0/0
“Também é possível criar triggers (gatilhos) com mais de um procedimento. Para isso primeiro precisa
definir um delimiter, ou seja, um sinal para delimitar qual será o fim de uma instrução, e que não seja o
ponto e vírgula.”
SALVADOR, Fabio. Programando em PHP, integração com MYSQL. São Paulo: Viena, 2012. p. 229.
Com base no trecho acima e no conteúdo estudado, a respeito de funções no MySQL, pode-se dizer que:
1.
I e IV.
2.
II e IV.
3.
II e III.
Resposta correta
4. Incorreta:
III e IV.
5.
I e II.
6. Pergunta 6
0/0
“O modelo típico para mineração de regras de associação em bases de dados consiste em encontrar todas
as regras que possuam suporte e confiança maiores ou iguais, respectivamente, a um suporte mínimo
(SupM in) e uma confiança mínima (ConfM in), especificados pelo usuário. Por este motivo, o modelo
costuma ser referenciado na literatura como Modelo Suporte/Confiança.”
GONÇALVEZ, Eduardo. Regras de Associação e suas Medidas de Interesse Objetivas e Subjetivas. Boa
Viagem: IC, 2005. p. 2.
Com base no trecho acima e no conteúdo estudado sobre regras de associação, pode-se dizer que:
1. Incorreta:
2.
3.
Resposta correta
4.
5.
fazem filtros eliminando dados nulos.
7. Pergunta 7
0/0
“O algoritmo para geração de itemsets freqüentes segue os mesmos passos do Apriori tradicional,
apresentando apenas algumas pequenas modificações. A principal delas está na geração do conjunto itens
freqüentes. Pois, além de encontrar o suporte de cada intervalo dos atributos quantitativos e de cada valor
dos atributos categóricos, para os atributos quantitativos, são contados também, os suportes de todas as
combinações possíveis de intervalos adjacentes, desde que o suporte destas combinações não ultrapasse o
suporte máximo determinado pelo usuário.”
PROCACI, Alexandre Geração de regras de associação quantitativas com intervalos não contínuos.
Minas Gerais: IC, 2004. p. 30.
Com base no trecho acima e no conteúdo estudado, ordene as etapas que são necessárias seguir para
filtrar por Apriori no Weka:
( ) Abrir o arquivo.
( ) Clicar em exportar.
( ) Clicar em Start.
( ) Clicar em associate.
1.
1, 3, 2, 5, 4.
2.
2, 5, 1, 4, 3.
3. Incorreta:
5, 2, 3, 1, 4.
4.
3, 1, 2, 5, 4.
Resposta correta
5.
5, 2, 1, 4, 5.
8. Pergunta 8
0/0
Com base no trecho acima e no conteúdo estudado, sobre a função delete from vendas where nome=
'blusa' and preco_produto > 2000; pode-se dizer que:
III. quando nome for maior que 2000 o campo será removido.
1.
I e II.
2.
III e IV.
3.
II e III.
Resposta correta
4.
I e IV.
5. Incorreta:
II e IV.
9. Pergunta 9
0/0
“Suponhamos que o conjunto de dados em análise possua N registros e k atributos, na técnica PCA, cada
um destes registros é interpretado com um vetor de dados, com K dimensões.”
GOLDSCHMIDT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emmanuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsevier, 2015. p. 42.
Com base no trecho acima e no conteúdo estudado sobre a contagem de itens com uma condição no
MySQL, pode-se dizer que:
1.
Resposta correta
2.
3.
4. Incorreta:
5.
10. Pergunta 10
0/0
“Critério de parada: O algoritmo termina quando não é mais possível gerar itens frequentes. Note que o
algoritmo de geração de itens frequentes Apriori percorre conjuntos de itens frequentes iterativamente em
ordem crescimento de tamanho, gerando e testando cada um até encontrar frequentes.”
GOLDSCHMIDT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emmanuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsevier, 2015. p. 30.
Com base no trecho acima e no conteúdo estudado, pode-se dizer que o algoritmo Apriori:
1. Incorreta:
2.
3.
4.
Resposta correta
5.
1. Pergunta 1
0/0
“A limpeza dos dados inclui uma checagem da consistência das informações, correção de possíveis erros
e o preenchimento ou a exclusão de valores nulos e redundantes. Nessa fase são identificados e extraídos
os dados duplicados e/ou corrompidos. A execução dessa fase corrige a base de dados excluindo
consultas que não são necessárias e que seriam executadas pelo algoritmo minerador podendo afetar o seu
desempenho. Os métodos de limpeza são dependentes do domínio da aplicação.”
PROCACI, Alexandre. Geração de regras de associação quantitativas com intervalos não contínuos.
Minas Gerais: IC, 2004. p. 3.
Com base no trecho acima e no conteúdo estudado, analise as afirmativas a seguir sobre limpeza de
dados:
1.
I e IV.
Resposta correta
2.
III e IV.
3. Incorreta:
II e IV.
4.
I e II.
5.
II e III.
2. Pergunta 2
0/0
“Um intervalo de confiança está associado ao nível de confiança correspondente a uma medida de certeza
de que o intervalor contém um parâmetro da população. (…) Escolhas comuns para o nível de confiança
são de 90%, 95% e 99%.”
CASTRO, Leandro C.; GOMES, Daniel E. Introdução a mineração de dados: Conceitos básicos,
algoritmos e aplicações. São Paulo: Saraiva, 2017. p. 342.
A partir do texto citado e dos conteúdos estudados, ordene os passos necessários para criar o cálculo de
confiança:
( ) Calcula-se a confiança.
1.
3, 4, 5, 2, 1.
2.
2, 4, 1, 5, 3.
3. Incorreta:
5, 3, 4, 2, 1.
4.
2, 4, 3, 1, 5.
5.
5, 2, 1, 4, 3.
Resposta correta
3. Pergunta 3
0/0
Com base no trecho acima e no conteúdo estudado, pode-se dizer que, antes de fazer a união de dois
bancos de dados, deve-se:
1.
Unir duas tabelas, usando o select inner join em um dado que se repete nas duas tabelas.
Resposta correta
2.
3.
4.
5. Incorreta:
Unir tabelas de épocas diferentes para ter mais certezas acerca de junções de dados.
4. Pergunta 4
0/0
“Também denominada operação linear, consiste em considerar os valores mínimo e máximo de cada
atributo no ajuste da escala. Esta operação mapeia os valores de um atributo no intervalo fechado de 0 até
1.”
GOLDSCHMIDT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emmanuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsevier, 2015. p. 61.
Com base no trecho acima e no conteúdo estudado, pode-se dizer que, em bancos de dados muito
grandes, para realizar a normalização linear, deve-se:
Ocultar opções de resposta
1.
2. Incorreta:
3.
4.
5.
Resposta correta
5. Pergunta 5
0/0
“Também é possível criar triggers (gatilhos) com mais de um procedimento. Para isso primeiro precisa
definir um delimiter, ou seja, um sinal para delimitar qual será o fim de uma instrução, e que não seja o
ponto e vírgula.”
SALVADOR, Fabio. Programando em PHP, integração com MYSQL. São Paulo: Viena, 2012. p. 229.
Com base no trecho acima e no conteúdo estudado, a respeito de funções no MySQL, pode-se dizer que:
I e IV.
2.
II e IV.
3.
II e III.
Resposta correta
4. Incorreta:
III e IV.
5.
I e II.
6. Pergunta 6
0/0
“O modelo típico para mineração de regras de associação em bases de dados consiste em encontrar todas
as regras que possuam suporte e confiança maiores ou iguais, respectivamente, a um suporte mínimo
(SupM in) e uma confiança mínima (ConfM in), especificados pelo usuário. Por este motivo, o modelo
costuma ser referenciado na literatura como Modelo Suporte/Confiança.”
GONÇALVEZ, Eduardo. Regras de Associação e suas Medidas de Interesse Objetivas e Subjetivas. Boa
Viagem: IC, 2005. p. 2.
Com base no trecho acima e no conteúdo estudado sobre regras de associação, pode-se dizer que:
1. Incorreta:
2.
servem para unir duas tabelas.
3.
Resposta correta
4.
5.
7. Pergunta 7
0/0
“O algoritmo para geração de itemsets freqüentes segue os mesmos passos do Apriori tradicional,
apresentando apenas algumas pequenas modificações. A principal delas está na geração do conjunto itens
freqüentes. Pois, além de encontrar o suporte de cada intervalo dos atributos quantitativos e de cada valor
dos atributos categóricos, para os atributos quantitativos, são contados também, os suportes de todas as
combinações possíveis de intervalos adjacentes, desde que o suporte destas combinações não ultrapasse o
suporte máximo determinado pelo usuário.”
PROCACI, Alexandre Geração de regras de associação quantitativas com intervalos não contínuos.
Minas Gerais: IC, 2004. p. 30.
Com base no trecho acima e no conteúdo estudado, ordene as etapas que são necessárias seguir para
filtrar por Apriori no Weka:
( ) Abrir o arquivo.
( ) Clicar em exportar.
( ) Clicar em Start.
( ) Clicar em associate.
1.
1, 3, 2, 5, 4.
2.
2, 5, 1, 4, 3.
3. Incorreta:
5, 2, 3, 1, 4.
4.
3, 1, 2, 5, 4.
Resposta correta
5.
5, 2, 1, 4, 5.
8. Pergunta 8
0/0
Com base no trecho acima e no conteúdo estudado, sobre a função delete from vendas where nome=
'blusa' and preco_produto > 2000; pode-se dizer que:
III. quando nome for maior que 2000 o campo será removido.
1.
I e II.
2.
III e IV.
3.
II e III.
Resposta correta
4.
I e IV.
5. Incorreta:
II e IV.
9. Pergunta 9
0/0
“Suponhamos que o conjunto de dados em análise possua N registros e k atributos, na técnica PCA, cada
um destes registros é interpretado com um vetor de dados, com K dimensões.”
GOLDSCHMIDT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emmanuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsevier, 2015. p. 42.
Com base no trecho acima e no conteúdo estudado sobre a contagem de itens com uma condição no
MySQL, pode-se dizer que:
1.
Resposta correta
2.
4. Incorreta:
5.
10. Pergunta 10
0/0
“Critério de parada: O algoritmo termina quando não é mais possível gerar itens frequentes. Note que o
algoritmo de geração de itens frequentes Apriori percorre conjuntos de itens frequentes iterativamente em
ordem crescimento de tamanho, gerando e testando cada um até encontrar frequentes.”
GOLDSCHMIDT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emmanuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsevier, 2015. p. 30.
Com base no trecho acima e no conteúdo estudado, pode-se dizer que o algoritmo Apriori:
1. Incorreta:
2.
3.
4.
Resposta correta
5.
1. Pergunta 1
0/0
1.
2.
3. Incorreta:
cada cluster contém um conjunto de dados com um tipo de atributo (por exemplo, idade ou
sexo).
4.
cada ponto fica no centro dos registros similares e cada grupo tem um centro.
Resposta correta
5.
2. Pergunta 2
0/0
Leia o trecho abaixo:
“Sendo assim, o problema descrito acima consiste em encontrar k centroides, ou médias dos grupos.
Entre os principais algoritmos de agrupamento baseados em distância, podem ser citados K-meansm K-
modes e Kmedoid. Algoritmos baseados em densidade consideram que grupos são regiões do espaço com
concentrações atípicas de pontos.”
Fonte: GOLDSHIMDIT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever. 2015. p. 97.
1. Incorreta:
III e IV.
2.
I e IV.
3.
I e III.
Resposta correta
4.
II e IV.
5.
II e III.
3. Pergunta 3
0/0
Leia o trecho a seguir:
“Média móvel é um dos mais versáteis e utilizados indicadores, sendo, inclusive, a base da grande
maioria de sistemas mecânicos de trend-following atualmente em uso. Seu cálculo é bastante simples,
sendo feito por meio da escolha de um determinado número de dados e calculando a média dos preços
nestes dias.”
Fonte: SANTANA, Genilson. O poder de previsão da análise técnica. São Paulo: FGV. 1997. p. 20.
De acordo com o texto e com o conteúdo estudado, ordene os passos para a execução de análise
bayesiana:
1.
1, 4, 2, 5, 3.
2. Incorreta:
3, 1, 2, 4, 5.
3.
3, 2, 1, 5, 4.
4.
4, 2, 1, 5, 3.
Resposta correta
5.
4, 3, 1, 5, 2.
4. Pergunta 4
0/0
“Uma das tarefas de KDD mais importantes e mais populares é a tarefa da classificação. Essa tarefa
tipicamente utiliza aprendizado supervisionado, que é um tipo de aprendizado indutivo. “
Fonte: GOLDSHIMDIT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever. 2015. p. 88.
1.
I e III.
2.
III e IV.
Resposta correta
3.
I e IV.
4. Incorreta:
II e III.
5.
II e IV.
5. Pergunta 5
0/0
Leia o trecho abaixo:
“No caso específico da tarefa de classificação, o atributo-alvo é categórico (seu domínio é composto por
categorias/classes). O outro grupo contém os atributos a serem utilizados na predição do valor,
denominados atributos previsores ou atributos de predição.”
Fonte: GOLDSHIMDIT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever. 2015. p.89.
De acordo com o texto e com o conteúdo estudado, pode-se dizer que classificar:
1.
2.
Resposta correta
3.
4.
5. Incorreta:
6. Pergunta 6
0/0
“Variável: é a característica que vai ser observada, medida ou contada nos elementos da população ou da
amostra e que pode variar, ou seja, assumir um valor diferente de elemento para elemento. Não basta
identificar a variável a ser trabalhada, é necessário fazer-se distinção entre os tipos de variáveis: Variável
qualitativa: é uma variável que assume como possíveis valores atributos ou qualidades. Também são
denominadas variáveis categóricas. Variável quantitativa: é uma variável que assume como possíveis
valores números.”
Fonte: GUEDES Aparecida, et al. Estatística Descritiva: São Paulo: Each Usp. 2019. p. 2.
De acordo com o texto e com o conteúdo estudado, pode-se dizer que, entre as classes de dados:
1.
2.
3.
4.
Resposta correta
5. Incorreta:
7. Pergunta 7
0/0
“A tarefa de Clusterização, também chamada Agrupamentos ou Análises de grupos, é usada para separar
os registros de um conjunto de dados em subconjuntos ou grupos (clusters), de tal forma que elementos
em um cluster compartilhem propriedades comuns.”
Fonte: GOLDSHIMDIT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever. 2015. p. 95.
De acordo com o texto e com o conteúdo estudado, ordene os passos para a execução de clusterização em
weka:
( ) Clicar em cluster.
( ) Clicar em canopy.
( ) Clicar em start.
( ) Clicar em choose.
1.
2, 1, 5, 3, 4.
Resposta correta
2.
3, 2, 1, 5, 4.
3.
4, 2, 1, 5, 3.
4.
1, 4, 2, 5, 3.
5. Incorreta:
4, 3, 2, 1, 5.
8. Pergunta 8
0/0
“Em um modelo de regressão múltipla, a variável dependente (Y) será determinada por mais de uma
variável independente (X). Genericamente, um modelo de regressão linear múltipla com ‘k’ variáveis
independentes e ‘p’ parâmetros.”
Fonte: MAIA, Alexandre Gori. Econometria: conceitos e aplicações. São Paulo: Saint Paul. 2019. E-
book.
De acordo com o texto e com o conteúdo estudado, ordene os passos para a execução de regressão
múltipla em weka:
( ) Clicar em regressão.
1.
2, 1, 5, 3, 4.
2.
3, 2, 1, 5, 4.
Resposta correta
3.
4, 2, 1, 5, 3.
4. Incorreta:
4, 3, 2, 1, 5.
5.
1, 4, 2, 5, 3.
9. Pergunta 9
0/0
“Uma série temporal é um conjunto de observações de um fenômeno ordenadas no tempo. Podemos citar
como exemplo: o consumo mensal de energia elétrica em casa, registrado durante um ano, ou as vendas
diárias de um produto no decorrer de um mês, dentre muitos outros.”
Fonte: GOLDSHIMDIT, Ronaldo. BEZERRA, Eduardo. PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever. 2015. p. 101.
De acordo com o texto e com o conteúdo estudado, pode-se dizer que, em análises temporais:
2.
3.
4.
Resposta correta
5. Incorreta:
10. Pergunta 10
0/0
“A árvore é uma segmentação supervisionada porque cada folha contém um valor para uma variável alvo.
Como estamos falando de classificação, cada folha contém uma classificação para seu segmento.Tal
árvore é chamada como árvore de classificação ou de decisão.”
Fonte: FOSTER, Provost; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre
mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016, p. 133.
De acordo com o texto e com o conteúdo, ordene os passos para a execução de árvores de decisão em
weka:
( ) Selecionar tree.
( ) SelecionarJ48.
( ) Clicar em start.
1.
3, 2, 1, 5, 3.
2.
4, 1, 2, 5, 3.
3.
1, 5, 2, 3, 4.
Resposta correta
4.
4, 2, 1, 5, 3.
5. Incorreta:
2, 4, 3, 1, 5.
Pergunta 1
“NumPy possui uma função chamada de genfromtxt para criar dados em Python de forma tabulada, em
NumPy, dados tabulados são avaliados como array. É muito fácil para o sistema baixar dados e processor os
itens.”
Fonte: SUBRAMANIAN, Gopi. Python Data Science Cookbook. Inglaterra: Packt Publisher, 2015. p. 40.
Com base no trecho e no conteúdo estudado, assinale a alternativa correta:
Incorreta:
Resposta correta
Pergunta 2
Fonte: CHEN, Daniel y. Análise de dados com Python e Pandas. São Paulo: Pearson, 2018. p. 379.
escolhas = pd.Series(['Versão 1', 'Versão 2', 'Versão 1 e Versão 2', 'Versão 2', 'Versão 4])
escolhas.drop_duplicates()
Resposta correta
Incorreta:
mostrará dados com o comando drop e duplicará dados com o comando duplicate.
Pergunta 3
“NumPy é um pacote Python fundamental para computação científica, ele inclui capacidade de criar arrays
multidimensionais, contém um poderoso objeto de matriz N-dimensional, funções sofisticadas
(transmissão), ferramentas para integrar C / C ++ e código Fortran.”
Fonte: BRESSERT, Eli apud PARREIRA, Lucas. SciPy and NumPy. California: O Reilly Média, 2012. p. 5.
II e III.
II, IV e V.
Incorreta:
I e III.
II, III e V.
Resposta correta
I, II e III.
Pergunta 4
“Você deve documentar as funções que escreve. Na documentação você deve especificar as seguintes
informações:
Fonte: HARA, Carmem; ZOLA, Wagner. Linguagem C. Paraíba: UFPR, 2008. p. 16.
Com base no trecho e no conteúdo estudado, pode-se afirmar que input em Python:
Pergunta 5
“Em todos os exemplos que vimos até este momento, sentenças são executadas sequencialmente. A ordem
sequencial de execução de sentenças pode ser alterada se certas condições forem satisfeitas durante a
execução do programa. Isto é chamado “desvio condicional”. Todas as linguagens de programação
oferecem comandos para o desvio condicional. O mais simples é a sentença if.”
Fonte: HARA, Carmem; ZOLA, Wagner. Linguagem C. Paraíba: UFPR, 2008. p. 16.
IV. If Else significa “se algo for preenchido, então acontecerá algo”.
III e IV.
Resposta correta
II e III.
II e IV.
I e II.
Incorreta:
I e III.
Pergunta 6
“Alguns métodos estatísticos de Pandas são referenciados com estatística indireta, onde não retorna o
valor atual, mas sim o relativo. Por exemplo, .idxmin() e o idxmax() retornam a posição do mínimo e do
máximo.”
Resposta correta
Incorreta:
Pergunta 7
“O principal propósito de Pandas é ajudar a descobrir informações rapidamente em dados, com informação
definida como significado implícito no conjunto. O desenvolvimento de Pandas se deu em 2008 por Wes
MCKinney.”
I. Para manipular um arquivo importado, é necessário colocá-lo na mesma pasta do arquivo Python.
I e II.
III e V.
III e IV.
Incorreta:
II e V.
I e IV.
Resposta correta
Pergunta 8
“Em todas as opções utiliza-se pd.read_csv() para especificar o que baixar, também aplica-se a função
pd.read_Excel() para importar. Para ler outros tipos de pastas utiliza-se o parâmetro sheetname.”
Com base no trecho e no conteúdo estudado sobre Excel, pode-se afirmar que:
Incorreta:
Resposta correta
Pergunta 9
“Os métodos aggregate, transform e filter são normalmente utilizados para agrupar objetos em Pandas.
Espera-se investigar alguns trabalhos inerentes à objetos agrupados. O groupby é um excelente
agrupamento de diversos itens.”
Fonte: CHEN, Daniel Y. Pandas for Everyone. São Paulo: Pearson, 2018. p. 202.
Resposta correta
Incorreta:
Pergunta 10
Fonte: YU, Allen; CHUNG, Claire; YIM, Aldrin. Matplotlib 2.x. Mumbai: Packt, 2017. p. 8.
plt.ylabel(u'Aquisições')
plt.legenda('lower right')
plt.xlabel(u'Tentativas')
plt.show()
Incorreta:
II e III.
I e IV.
II e IV.
Resposta correta
I e III.
1. III e IV. Pergunta 1
0/0
“NumPy possui uma função chamada de genfromtxt para criar dados em Python de forma tabulada, em
NumPy, dados tabulados são avaliados como array. É muito fácil para o sistema baixar dados e processor os
itens.”
Fonte: SUBRAMANIAN, Gopi. Python Data Science Cookbook. Inglaterra: Packt Publisher, 2015. p. 40.
1. Incorreta:
2.
Resposta correta
3.
4.
5.
2. Pergunta 2
0/0
“A computação numérica começou em 1995 e, depois disso, em 2006, evoluiu para a biblioteca NumPy,
que foi a base para o objeto Series do Pandas. A biblioteca básica de plotagem é a Matplotlib.”
Fonte: CHEN, Daniel y. Análise de dados com Python e Pandas. São Paulo: Pearson, 2018. p. 379.
escolhas = pd.Series(['Versão 1', 'Versão 2', 'Versão 1 e Versão 2', 'Versão 2', 'Versão 4])
escolhas.drop_duplicates()
1.
Resposta correta
2. Incorreta:
3.
4.
5.
mostrará dados com o comando drop e duplicará dados com o comando duplicate.
3. Pergunta 3
0/0
“NumPy é um pacote Python fundamental para computação científica, ele inclui capacidade de criar arrays
multidimensionais, contém um poderoso objeto de matriz N-dimensional, funções sofisticadas
(transmissão), ferramentas para integrar C / C ++ e código Fortran.”
Fonte: BRESSERT, Eli apud PARREIRA, Lucas. SciPy and NumPy. California: O Reilly Média, 2012. p. 5.
1.
II e III.
2.
II, IV e V.
3. Incorreta:
I e III.
4.
II, III e V.
Resposta correta
5.
I, II e III.
4. Pergunta 4
0/0
“Você deve documentar as funções que escreve. Na documentação você deve especificar as seguintes
informações:
• Ação – o que a função faz.
Fonte: HARA, Carmem; ZOLA, Wagner. Linguagem C. Paraíba: UFPR, 2008. p. 16.
Com base no trecho e no conteúdo estudado, pode-se afirmar que input em Python:
1.
2.
Resposta correta
3.
4. Incorreta:
5.
5. Pergunta 5
0/0
“Em todos os exemplos que vimos até este momento, sentenças são executadas sequencialmente. A ordem
sequencial de execução de sentenças pode ser alterada se certas condições forem satisfeitas durante a
execução do programa. Isto é chamado “desvio condicional”. Todas as linguagens de programação
oferecem comandos para o desvio condicional. O mais simples é a sentença if.”
Fonte: HARA, Carmem; ZOLA, Wagner. Linguagem C. Paraíba: UFPR, 2008. p. 16.
IV. If Else significa “se algo for preenchido, então acontecerá algo”.
1.
III e IV.
Resposta correta
2.
II e III.
3.
II e IV.
4.
I e II.
5. Incorreta:
I e III.
6. Pergunta 6
0/0
“Alguns métodos estatísticos de Pandas são referenciados com estatística indireta, onde não retorna o
valor atual, mas sim o relativo. Por exemplo, .idxmin() e o idxmax() retornam a posição do mínimo e do
máximo.”
1.
2.
3.
4.
Resposta correta
5. Incorreta:
7. Pergunta 7
0/0
“O principal propósito de Pandas é ajudar a descobrir informações rapidamente em dados, com informação
definida como significado implícito no conjunto. O desenvolvimento de Pandas se deu em 2008 por Wes
MCKinney.”
I. Para manipular um arquivo importado, é necessário colocá-lo na mesma pasta do arquivo Python.
II. A sintaxe descrita pode ser utilizada em Pandas e em NumPy.
1.
I e II.
2.
III e V.
3.
III e IV.
4. Incorreta:
II e V.
5.
I e IV.
Resposta correta
8. Pergunta 8
0/0
“Em todas as opções utiliza-se pd.read_csv() para especificar o que baixar, também aplica-se a função
pd.read_Excel() para importar. Para ler outros tipos de pastas utiliza-se o parâmetro sheetname.”
Com base no trecho e no conteúdo estudado sobre Excel, pode-se afirmar que:
2.
3. Incorreta:
4.
5.
Resposta correta
9. Pergunta 9
0/0
“Os métodos aggregate, transform e filter são normalmente utilizados para agrupar objetos em Pandas.
Espera-se investigar alguns trabalhos inerentes à objetos agrupados. O groupby é um excelente
agrupamento de diversos itens.”
Fonte: CHEN, Daniel Y. Pandas for Everyone. São Paulo: Pearson, 2018. p. 202.
plan.groupby('Day').aggregate({'Price': [min]})]
1.
Resposta correta
2. Incorreta:
calculará o suporte mínimo.
3.
4.
5.
10. Pergunta 10
0/0
“Matplotlib é uma biblioteca versátil que gera visualizações de dados. Com variados tipos de desenhos e
opções de estilos refinados, é um instrumento de trabalho bom para criar imagens profissionais e
publicações científicas.”
Fonte: YU, Allen; CHUNG, Claire; YIM, Aldrin. Matplotlib 2.x. Mumbai: Packt, 2017. p. 8.
plt.ylabel(u'Aquisições')
plt.legenda('lower right')
plt.xlabel(u'Tentativas')
plt.show()
1. Incorreta:
II e III.
2.
I e IV.
3.
II e IV.
Resposta correta
4.
I e III.
5.
III e IV.
1. Pergunta 1
0/0
“Em todos os exemplos que vimos até este momento, sentenças são executadas sequencialmente. A
ordem sequencial de execução de sentenças pode ser alterada se certas condições forem satisfeitas
durante a execução do programa. Isto é chamado “desvio condicional”. Todas as linguagens de
programação oferecem comandos para o desvio condicional. O mais simples é a sentença if.”
Fonte: HARA, Carmem; ZOLA, Wagner. Linguagem C. Paraíba: UFPR, 2008. p. 16.
IV. If Else significa “se algo for preenchido, então acontecerá algo”.
1.
II e III.
2.
I e II.
3.
II e IV.
4.
III e IV.
Resposta correta
5.
I e III.
2. Pergunta 2
0/0
“Você deve documentar as funções que escreve. Na documentação você deve especificar as seguintes
informações:
• Ação – o que a função faz.
• Entrada – descrição dos argumentos passados para a função.
• Saída – descrição do valor retornado pela função.”
Fonte: HARA, Carmem; ZOLA, Wagner. Linguagem C. Paraíba: UFPR, 2008. p. 16.
Com base no trecho e no conteúdo estudado, pode-se afirmar que input em Python:
1.
3.
Resposta correta
4.
5.
3. Pergunta 3
0/0
“Matplotlib é um pacote de visualização Python. Para ler e plotar os dados nós precisamos configurar
Python, instalando Matplotlib nas suas dependências, preparando a plataforma para executar e manter o
código rodando.”
Fonte: YU, Allen; CHUNG, Claire; YIM, Aldrin. Matplotlib 2.x. Mumbai: Packt, 2017. p. 8.
Com base no trecho e no conteúdo estudado, pode-se afirmar que a biblioteca Matplotlib pode gerar os
gráficos:
1.
2.
3.
4.
baseados em .dat.
5.
4. Pergunta 4
0/0
“NumPy é um pacote Python fundamental para computação científica, ele inclui capacidade de criar
arrays multidimensionais, contém um poderoso objeto de matriz N-dimensional, funções sofisticadas
(transmissão), ferramentas para integrar C / C ++ e código Fortran.”
Fonte: BRESSERT, Eli apud PARREIRA, Lucas. SciPy and NumPy. California: O Reilly Média, 2012.
p. 5.
1.
II, III e V.
Resposta correta
2. Incorreta:
II, IV e V.
3.
I, II e III.
4.
II e III.
5.
I e III.
5. Pergunta 5
0/0
“Os métodos aggregate, transform e filter são normalmente utilizados para agrupar objetos em Pandas.
Espera-se investigar alguns trabalhos inerentes à objetos agrupados. O groupby é um excelente
agrupamento de diversos itens.”
Fonte: CHEN, Daniel Y. Pandas for Everyone. São Paulo: Pearson, 2018. p. 202.
1.
2.
3.
Resposta correta
4.
calculará o suporte mínimo.
5.
6. Pergunta 6
0/0
Com base no trecho e no conteúdo estudado, selecione a alternativa correta sobre dicionário em Python:
1.
Resposta correta
2. Incorreta:
3.
4.
5.
7. Pergunta 7
0/0
“Para uma rápida plotagem, a Matplotlib usa uma lista de cores. Em Matplotlib 2.0 a lista pode ser
mudada do original red, green, blue, cyan, magenta yellow, e black, para ‘b’, ‘g’, ‘r’, ‘c’, ‘m’, ‘y’, ‘k’
[…].”
Fonte: YU, Allen; CHUNG, Claire; YIM, Aldrin. Matplotlib 2.x. Mumbai: Packt, 2017. p. 9.
Com base no trecho e no conteúdo estudado sobre a plotagem, pode-se dizer que:
1.
Resposta correta
2.
3. Incorreta:
4.
5.
8. Pergunta 8
0/0
“Em todas as opções utiliza-se pd.read_csv() para especificar o que baixar, também aplica-se a função
pd.read_Excel() para importar. Para ler outros tipos de pastas utiliza-se o parâmetro sheetname.”
Fonte: HEYDT, Michael. Learning Pandas. Mumbay: Packt, 2017. p. 195.
Com base no trecho e no conteúdo estudado sobre Excel, pode-se afirmar que:
Ocultar opções de resposta
1.
Resposta correta
2.
3.
4.
5.
9. Pergunta 9
0/0
“A tupla é um tipo de dado heterogêneo (aceita dados de diversos tipos, inclusive de outras listas)
identificado internamente como tipo de dado tupla, tendo por característica armazenar conjuntos de
valores.”
Fonte: MANZANO, José. Introdução à linguagem Python. São Paulo: Novatec, 2018. Ebook.
Com base no trecho e no conteúdo estudado, pode-se afirmar que a diferença entre listas e tuplas é que:
1.
2.
listas são menores.
3.
4.
Resposta correta
5. Incorreta:
10. Pergunta 10
0/0
“[…] é possível separar os dados de um dicionário em três tuplas, uma contendo apenas chaves, outra
contendo apenas os conteúdos ou uma lista com todo o conteúdo separado em pares de valores.”
Fonte: MANZANO, José. Introdução à linguagem Python. São Paulo: Novatec, 2018. Ebook.
Com base no trecho e no conteúdo estudado, assinale a alternativa correta sobre dicionário em Python:
1.
2.
3.
4.