Escolar Documentos
Profissional Documentos
Cultura Documentos
Pergunta 1
0/0
“NumPy possui uma função chamada de genfromtxt para criar dados em Python de forma tabulada, em
NumPy, dados tabulados são avaliados como array. É muito fácil para o sistema baixar dados e processor
os itens.”
Fonte: SUBRAMANIAN, Gopi. Python Data Science Cookbook. Inglaterra: Packt Publisher, 2015. p. 40.
1. Incorreta:
2.
Resposta correta
3.
4.
5.
2. Pergunta 2
0/0
“A computação numérica começou em 1995 e, depois disso, em 2006, evoluiu para a biblioteca NumPy,
que foi a base para o objeto Series do Pandas. A biblioteca básica de plotagem é a Matplotlib.”
Fonte: CHEN, Daniel y. Análise de dados com Python e Pandas. São Paulo: Pearson, 2018. p. 379.
1.
Resposta correta
2. Incorreta:
3.
4.
5.
mostrará dados com o comando drop e duplicará dados com o comando duplicate.
3. Pergunta 3
0/0
“NumPy é um pacote Python fundamental para computação científica, ele inclui capacidade de criar
arrays multidimensionais, contém um poderoso objeto de matriz N-dimensional, funções sofisticadas
(transmissão), ferramentas para integrar C / C ++ e código Fortran.”
Fonte: BRESSERT, Eli apud PARREIRA, Lucas. SciPy and NumPy. California: O Reilly Média, 2012.
p. 5.
1.
II e III.
2.
II, IV e V.
3. Incorreta:
I e III.
4.
II, III e V.
Resposta correta
5.
I, II e III.
4. Pergunta 4
0/0
“Você deve documentar as funções que escreve. Na documentação você deve especificar as seguintes
informações:
• Ação – o que a função faz.
• Entrada – descrição dos argumentos passados para a função.
• Saída – descrição do valor retornado pela função.”
Fonte: HARA, Carmem; ZOLA, Wagner. Linguagem C. Paraíba: UFPR, 2008. p. 16.
Com base no trecho e no conteúdo estudado, pode-se afirmar que input em Python:
2.
Resposta correta
3.
4. Incorreta:
5.
5. Pergunta 5
0/0
“Em todos os exemplos que vimos até este momento, sentenças são executadas sequencialmente. A
ordem sequencial de execução de sentenças pode ser alterada se certas condições forem satisfeitas
durante a execução do programa. Isto é chamado “desvio condicional”. Todas as linguagens de
programação oferecem comandos para o desvio condicional. O mais simples é a sentença if.”
Fonte: HARA, Carmem; ZOLA, Wagner. Linguagem C. Paraíba: UFPR, 2008. p. 16.
IV. If Else significa “se algo for preenchido, então acontecerá algo”.
III e IV.
Resposta correta
2.
II e III.
3.
II e IV.
4.
I e II.
5. Incorreta:
I e III.
6. Pergunta 6
0/0
“Alguns métodos estatísticos de Pandas são referenciados com estatística indireta, onde não retorna o
valor atual, mas sim o relativo. Por exemplo, .idxmin() e o idxmax() retornam a posição do mínimo e do
máximo.”
Fonte: HEYDT, Michael. Learning Pandas. Mumbay: Packt, 2017. p. 162.
1.
2.
4.
Resposta correta
5. Incorreta:
7. Pergunta 7
0/0
I. Para manipular um arquivo importado, é necessário colocá-lo na mesma pasta do arquivo Python.
1.
I e II.
2.
III e V.
3.
III e IV.
4. Incorreta:
II e V.
5.
I e IV.
Resposta correta
8. Pergunta 8
0/0
“Em todas as opções utiliza-se pd.read_csv() para especificar o que baixar, também aplica-se a função
pd.read_Excel() para importar. Para ler outros tipos de pastas utiliza-se o parâmetro sheetname.”
Fonte: HEYDT, Michael. Learning Pandas. Mumbay: Packt, 2017. p. 195.
Com base no trecho e no conteúdo estudado sobre Excel, pode-se afirmar que:
Resposta correta
9. Pergunta 9
0/0
“Os métodos aggregate, transform e filter são normalmente utilizados para agrupar objetos em Pandas.
Espera-se investigar alguns trabalhos inerentes à objetos agrupados. O groupby é um excelente
agrupamento de diversos itens.”
Fonte: CHEN, Daniel Y. Pandas for Everyone. São Paulo: Pearson, 2018. p. 202.
Agora, observe a sintaxe abaixo:
plan.groupby('Day').aggregate({'Price': [min]})]
1.
Resposta correta
2. Incorreta:
3.
4.
5.
10. Pergunta 10
0/0
“Matplotlib é uma biblioteca versátil que gera visualizações de dados. Com variados tipos de desenhos e
opções de estilos refinados, é um instrumento de trabalho bom para criar imagens profissionais e
publicações científicas.”
Fonte: YU, Allen; CHUNG, Claire; YIM, Aldrin. Matplotlib 2.x. Mumbai: Packt, 2017. p. 8.
1. Incorreta:
II e III.
2.
I e IV.
3.
II e IV.
Resposta correta
4.
I e III.
5.
III e IV.
Módulo B - 136806 . 7 - Mineração de Dados - D.20231.B
0/0
Com base no texto acima e com relação ao ERP, pode-se dizer que:
1.
2.
3.
4.
5.
Resposta correta
2. Pergunta 2
0/0
“Há uma necessidade urgente de uma nova geração de técnicas e ferramentas computacionais para ajudar
os seres humanos a extrair informações úteis (conhecimento) de volumes de dados, essas técnicas e
ferramentas são as tema do emergente campo da descoberta do conhecimento em bancos de dados.”
Fonte: FAYYAD, U.M., PIATETSKY-SHAPIRO, G., SMYTH, P., UTHURUSAMY, R. Advances in
Knowledge Discovery and Data Mining. Califórnia: AAAI/MIT Press, 1996. P. 82.
Considerando o texto e o conteúdo da disciplina, a respeito dos filtros em Excel, pode-se dizer que:
Assim como o SQL, o Excel filtras por valores maiores ou iguais a um determinado
parâmetro na análise de dados.
Resposta correta
2.
3.
Para criar filtros em tabelas deve-se clicar com o botão direito no dado e em “formato de
célula” e selecionar o tipo de dados.
4.
Ao clicar na guia “inserir-dados”, o Excel irá inserir o filtro de dados, colocando uma
flecha de busca ao lado das tabelas.
5.
Para gerar novos filtros é necessário apagar os antigos, fazendo um de cada vez.
3. Pergunta 3
0/0
“Duas heurísticas podem ser utilizadas para indicar se esta operação deve ser utilizada: Eliminar todos os
atributos que apresentem valores constantes em todos os conjuntos de dados. A justificativa é que
atributos nesta situação não contribuem para distinguir os registros uns dos outros.”
Fonte: GOLDSHIMDIT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever, 2015. P. 39.
Com base no texto acima e no conteúdo sobre banco de dados, pode-se dizer que:
0/0
Leia o trecho abaixo:
“As funcionalidades da mineração de dados são usadas para especificar os tipos de informações a serem
obtidas nas tarefas de mineração. Em geral estas tarefas podem ser classificadas em duas categorias: (1)
descritivas: caracterizam as propriedades gerais dos dados; e (2) preditivas: fazem inferência a partir dos
dados objetivando predições.”
Fonte: CASTRO, Gilberto. Ramos. Discussão conceitual sobre dado, informação e conhecimento. João
Pessoa: UFPB, 2011. P. 23.
Considerando o texto e o conteúdo da disciplina, sobre as funções da mineração, pode-se dizer que:
0/0
“As etapas adicionais em o processo KDD, como preparação de dados, seleção de dados, limpeza de
dados, incorporação de conhecimento e interpretação adequada dos resultados mineração, são essenciais
para garantir que o conhecimento útil seja derivado dos dados.”
Fonte: FAYYAD, U.M., PIATETSKY-SHAPIRO, G., SMYTH, P., UTHURUSAMY, R. Advances in
Knowledge Discovery and Data Mining. Estados Unidos, Califórnia: AAAI/MIT Press, 1996.
Considerando o texto e o conteúdo da disciplina, sobre o processo KDD, analise as afirmativas a seguir:
1. I e III.Resposta correta
6. Pergunta 6
0/0
“A conscientização de segurança aumentou significativamente nos últimos anos em TI, mas muitas vezes
permanece uma reflexão tardia e um fardo indesejável para a maioria das equipes de DW / BI.”
Fonte: FAYYAD, U.M.; PIATETSKY-SHAPIRO, G.; SMYTH, P.; UTHURUSAMY, R. Advances in
Knowledge Discovery and Data Mining. Califórnia: AAAI/MIT Press, 1996. P. 446.
Com base no texto acima e no conteúdo estudado, pode-se dizer, com relação ao modo de segurança do
workbench, que:
Ocultar opções de resposta
0/0
“Agregação de informações: Esta operação consiste em reunir (agregar) alguns registros de forma a
produzir um conjunto de dados de tamanho menor que o original. Na agregação de informações, dados
com menor detalhe. Por exemplo, é possível somar os valores de todas as compras de cada cliente,
obtendo o total de despesas por ele realizadas durante um determinado período.”
Fonte: GOLDSHIMDIT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever, 2015. P. 46.
Considerando o texto e o conteúdo da disciplina, sobre agregação e Data Warehouse, pode-se dizer que:
1. A Data Staging Area é o local onde os cluster e grupos são formados.Resposta correta
8. Pergunta 8
0/0
“Um banco de dados é uma coleção integrada de dados, organizada de tal forma a facilitar o
armazenamento eficiente, assim como sua modificação e recuperação. Normalmente, informações a
respeito do nome de cada campo e seu domínio são também armazenadas.”
Fonte: GOLDSHIMDIT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever, 2015. P. 12.
Com base no texto acima e no conteúdo sobre banco de dados, pode-se dizer que:
0/0
“Em particular, a utilização do computador como ferramenta educacional é um tema relevante e atual, e
tem sido objeto de pesquisa multidisciplinar. As primeiras aplicações em EDM se concentravam em
construção de modelos voltados à predição do desempenho dos estudantes com bases nos históricos
anteriores.”
Fonte: GOLDSHIMDIT, Ronaldo. BEZERRA, Eduardo. PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever, 2015. P.235.
Com base no texto acima e com relação ao EDM, pode-se dizer que:
1.
2.
3. Incorreta:
4.
Resposta correta
5.
Tabelas feitas com a função EDM são mais claras e têm menos dados.
10. Pergunta 10
0/0
“Na grande maioria das situações, devido ao grande volume de dados, esse processo manual torna-se
impraticável. Ainda segundo Fayyad, o KDD (Knowledge Discovery in Databases ou Descoberta de
Conhecimento nas Bases de Dados) é uma tentativa de solucionar o problema causado pela chamada "era
da informação": a sobrecarga de dados.”
Fonte: CAMILO, Oliveira; SILVA, João. Mineração de dados: Conceitos, tarefas, métodos e ferramentas.
Goiás: UFG, 2009. P. 4.
Com base no texto acima e no conteúdo da disciplina, sobre as etapas do processo KDD, pode-se dizer
que:
1.
As seleções são feitas na etapa de pós processamento.
2.
3.
4.
Resposta correta
5.
0/0
“A limpeza dos dados inclui uma checagem da consistência das informações, correção de possíveis erros
e o preenchimento ou a exclusão de valores nulos e redundantes. Nessa fase são identificados e extraídos
os dados duplicados e/ou corrompidos. A execução dessa fase corrige a base de dados excluindo
consultas que não são necessárias e que seriam executadas pelo algoritmo minerador podendo afetar o seu
desempenho. Os métodos de limpeza são dependentes do domínio da aplicação.”
PROCACI, Alexandre. Geração de regras de associação quantitativas com intervalos não contínuos.
Minas Gerais: IC, 2004. p. 3.
Com base no trecho acima e no conteúdo estudado, analise as afirmativas a seguir sobre limpeza de
dados:
1.
I e IV.
Resposta correta
2.
III e IV.
3. Incorreta:
II e IV.
4.
I e II.
5.
II e III.
2. Pergunta 2
0/0
“Um intervalo de confiança está associado ao nível de confiança correspondente a uma medida de certeza
de que o intervalor contém um parâmetro da população. (…) Escolhas comuns para o nível de confiança
são de 90%, 95% e 99%.”
CASTRO, Leandro C.; GOMES, Daniel E. Introdução a mineração de dados: Conceitos básicos,
algoritmos e aplicações. São Paulo: Saraiva, 2017. p. 342.
A partir do texto citado e dos conteúdos estudados, ordene os passos necessários para criar o cálculo de
confiança:
( ) Calcula-se a confiança.
( ) Calcula-se o suporte mínimo.
1.
3, 4, 5, 2, 1.
2.
2, 4, 1, 5, 3.
3. Incorreta:
5, 3, 4, 2, 1.
4.
2, 4, 3, 1, 5.
5.
5, 2, 1, 4, 3.
Resposta correta
3. Pergunta 3
0/0
Com base no trecho acima e no conteúdo estudado, pode-se dizer que, antes de fazer a união de dois
bancos de dados, deve-se:
1.
Unir duas tabelas, usando o select inner join em um dado que se repete nas duas tabelas.
Resposta correta
2.
3.
4.
5. Incorreta:
Unir tabelas de épocas diferentes para ter mais certezas acerca de junções de dados.
4. Pergunta 4
0/0
“Também denominada operação linear, consiste em considerar os valores mínimo e máximo de cada
atributo no ajuste da escala. Esta operação mapeia os valores de um atributo no intervalo fechado de 0 até
1.”
GOLDSCHMIDT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emmanuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsevier, 2015. p. 61.
Com base no trecho acima e no conteúdo estudado, pode-se dizer que, em bancos de dados muito
grandes, para realizar a normalização linear, deve-se:
1.
2. Incorreta:
3.
Criar uma tabela dinâmica para analisar dados mais rapidamente.
4.
5.
Resposta correta
5. Pergunta 5
0/0
“Também é possível criar triggers (gatilhos) com mais de um procedimento. Para isso primeiro precisa
definir um delimiter, ou seja, um sinal para delimitar qual será o fim de uma instrução, e que não seja o
ponto e vírgula.”
SALVADOR, Fabio. Programando em PHP, integração com MYSQL. São Paulo: Viena, 2012. p. 229.
Com base no trecho acima e no conteúdo estudado, a respeito de funções no MySQL, pode-se dizer que:
1.
I e IV.
2.
II e IV.
3.
II e III.
Resposta correta
4. Incorreta:
III e IV.
5.
I e II.
6. Pergunta 6
0/0
“O modelo típico para mineração de regras de associação em bases de dados consiste em encontrar todas
as regras que possuam suporte e confiança maiores ou iguais, respectivamente, a um suporte mínimo
(SupM in) e uma confiança mínima (ConfM in), especificados pelo usuário. Por este motivo, o modelo
costuma ser referenciado na literatura como Modelo Suporte/Confiança.”
GONÇALVEZ, Eduardo. Regras de Associação e suas Medidas de Interesse Objetivas e Subjetivas. Boa
Viagem: IC, 2005. p. 2.
Com base no trecho acima e no conteúdo estudado sobre regras de associação, pode-se dizer que:
1. Incorreta:
2.
3.
Resposta correta
4.
7. Pergunta 7
0/0
“O algoritmo para geração de itemsets freqüentes segue os mesmos passos do Apriori tradicional,
apresentando apenas algumas pequenas modificações. A principal delas está na geração do conjunto itens
freqüentes. Pois, além de encontrar o suporte de cada intervalo dos atributos quantitativos e de cada valor
dos atributos categóricos, para os atributos quantitativos, são contados também, os suportes de todas as
combinações possíveis de intervalos adjacentes, desde que o suporte destas combinações não ultrapasse o
suporte máximo determinado pelo usuário.”
PROCACI, Alexandre Geração de regras de associação quantitativas com intervalos não contínuos.
Minas Gerais: IC, 2004. p. 30.
Com base no trecho acima e no conteúdo estudado, ordene as etapas que são necessárias seguir para
filtrar por Apriori no Weka:
( ) Abrir o arquivo.
( ) Clicar em exportar.
( ) Clicar em Start.
( ) Clicar em associate.
1.
1, 3, 2, 5, 4.
2.
2, 5, 1, 4, 3.
3. Incorreta:
5, 2, 3, 1, 4.
4.
3, 1, 2, 5, 4.
Resposta correta
5.
5, 2, 1, 4, 5.
8. Pergunta 8
0/0
Com base no trecho acima e no conteúdo estudado, sobre a função delete from vendas where nome=
'blusa' and preco_produto > 2000; pode-se dizer que:
III. quando nome for maior que 2000 o campo será removido.
1.
I e II.
2.
III e IV.
3.
II e III.
Resposta correta
4.
I e IV.
5. Incorreta:
II e IV.
9. Pergunta 9
0/0
“Suponhamos que o conjunto de dados em análise possua N registros e k atributos, na técnica PCA, cada
um destes registros é interpretado com um vetor de dados, com K dimensões.”
GOLDSCHMIDT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emmanuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsevier, 2015. p. 42.
Com base no trecho acima e no conteúdo estudado sobre a contagem de itens com uma condição no
MySQL, pode-se dizer que:
1.
Resposta correta
2.
3.
4. Incorreta:
5.
0/0
“Critério de parada: O algoritmo termina quando não é mais possível gerar itens frequentes. Note que o
algoritmo de geração de itens frequentes Apriori percorre conjuntos de itens frequentes iterativamente em
ordem crescimento de tamanho, gerando e testando cada um até encontrar frequentes.”
GOLDSCHMIDT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emmanuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsevier, 2015. p. 30.
Com base no trecho acima e no conteúdo estudado, pode-se dizer que o algoritmo Apriori:
1. Incorreta:
2.
3.
4.
Resposta correta
5.
1. Pergunta 1
0/0
“A limpeza dos dados inclui uma checagem da consistência das informações, correção de possíveis erros
e o preenchimento ou a exclusão de valores nulos e redundantes. Nessa fase são identificados e extraídos
os dados duplicados e/ou corrompidos. A execução dessa fase corrige a base de dados excluindo
consultas que não são necessárias e que seriam executadas pelo algoritmo minerador podendo afetar o seu
desempenho. Os métodos de limpeza são dependentes do domínio da aplicação.”
PROCACI, Alexandre. Geração de regras de associação quantitativas com intervalos não contínuos.
Minas Gerais: IC, 2004. p. 3.
Com base no trecho acima e no conteúdo estudado, analise as afirmativas a seguir sobre limpeza de
dados:
1.
I e IV.
Resposta correta
2.
III e IV.
3. Incorreta:
II e IV.
4.
I e II.
5.
II e III.
2. Pergunta 2
0/0
A partir do texto citado e dos conteúdos estudados, ordene os passos necessários para criar o cálculo de
confiança:
( ) Calcula-se a confiança.
1.
3, 4, 5, 2, 1.
2.
2, 4, 1, 5, 3.
3. Incorreta:
5, 3, 4, 2, 1.
4.
2, 4, 3, 1, 5.
5.
5, 2, 1, 4, 3.
Resposta correta
3. Pergunta 3
0/0
Leia o trecho a seguir:
Com base no trecho acima e no conteúdo estudado, pode-se dizer que, antes de fazer a união de dois
bancos de dados, deve-se:
1.
Unir duas tabelas, usando o select inner join em um dado que se repete nas duas tabelas.
Resposta correta
2.
3.
4.
5. Incorreta:
Unir tabelas de épocas diferentes para ter mais certezas acerca de junções de dados.
4. Pergunta 4
0/0
“Também denominada operação linear, consiste em considerar os valores mínimo e máximo de cada
atributo no ajuste da escala. Esta operação mapeia os valores de um atributo no intervalo fechado de 0 até
1.”
GOLDSCHMIDT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emmanuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsevier, 2015. p. 61.
Com base no trecho acima e no conteúdo estudado, pode-se dizer que, em bancos de dados muito
grandes, para realizar a normalização linear, deve-se:
1.
2. Incorreta:
3.
4.
5.
Resposta correta
5. Pergunta 5
0/0
“Também é possível criar triggers (gatilhos) com mais de um procedimento. Para isso primeiro precisa
definir um delimiter, ou seja, um sinal para delimitar qual será o fim de uma instrução, e que não seja o
ponto e vírgula.”
SALVADOR, Fabio. Programando em PHP, integração com MYSQL. São Paulo: Viena, 2012. p. 229.
Com base no trecho acima e no conteúdo estudado, a respeito de funções no MySQL, pode-se dizer que:
1.
I e IV.
2.
II e IV.
3.
II e III.
Resposta correta
4. Incorreta:
III e IV.
5.
I e II.
6. Pergunta 6
0/0
“O modelo típico para mineração de regras de associação em bases de dados consiste em encontrar todas
as regras que possuam suporte e confiança maiores ou iguais, respectivamente, a um suporte mínimo
(SupM in) e uma confiança mínima (ConfM in), especificados pelo usuário. Por este motivo, o modelo
costuma ser referenciado na literatura como Modelo Suporte/Confiança.”
GONÇALVEZ, Eduardo. Regras de Associação e suas Medidas de Interesse Objetivas e Subjetivas. Boa
Viagem: IC, 2005. p. 2.
Com base no trecho acima e no conteúdo estudado sobre regras de associação, pode-se dizer que:
1. Incorreta:
3.
Resposta correta
4.
5.
7. Pergunta 7
0/0
“O algoritmo para geração de itemsets freqüentes segue os mesmos passos do Apriori tradicional,
apresentando apenas algumas pequenas modificações. A principal delas está na geração do conjunto itens
freqüentes. Pois, além de encontrar o suporte de cada intervalo dos atributos quantitativos e de cada valor
dos atributos categóricos, para os atributos quantitativos, são contados também, os suportes de todas as
combinações possíveis de intervalos adjacentes, desde que o suporte destas combinações não ultrapasse o
suporte máximo determinado pelo usuário.”
PROCACI, Alexandre Geração de regras de associação quantitativas com intervalos não contínuos.
Minas Gerais: IC, 2004. p. 30.
Com base no trecho acima e no conteúdo estudado, ordene as etapas que são necessárias seguir para
filtrar por Apriori no Weka:
( ) Abrir o arquivo.
( ) Clicar em exportar.
( ) Clicar em Start.
( ) Clicar em associate.
1, 3, 2, 5, 4.
2.
2, 5, 1, 4, 3.
3. Incorreta:
5, 2, 3, 1, 4.
4.
3, 1, 2, 5, 4.
Resposta correta
5.
5, 2, 1, 4, 5.
8. Pergunta 8
0/0
Com base no trecho acima e no conteúdo estudado, sobre a função delete from vendas where nome=
'blusa' and preco_produto > 2000; pode-se dizer que:
III. quando nome for maior que 2000 o campo será removido.
I e II.
2.
III e IV.
3.
II e III.
Resposta correta
4.
I e IV.
5. Incorreta:
II e IV.
9. Pergunta 9
0/0
“Suponhamos que o conjunto de dados em análise possua N registros e k atributos, na técnica PCA, cada
um destes registros é interpretado com um vetor de dados, com K dimensões.”
GOLDSCHMIDT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emmanuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsevier, 2015. p. 42.
Com base no trecho acima e no conteúdo estudado sobre a contagem de itens com uma condição no
MySQL, pode-se dizer que:
1.
Resposta correta
2.
3.
4. Incorreta:
5.
10. Pergunta 10
0/0
“Critério de parada: O algoritmo termina quando não é mais possível gerar itens frequentes. Note que o
algoritmo de geração de itens frequentes Apriori percorre conjuntos de itens frequentes iterativamente em
ordem crescimento de tamanho, gerando e testando cada um até encontrar frequentes.”
GOLDSCHMIDT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emmanuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsevier, 2015. p. 30.
Com base no trecho acima e no conteúdo estudado, pode-se dizer que o algoritmo Apriori:
1. Incorreta:
2.
3.
4.
faz o filtro de suporte e de confiança de acordo com configuração.
Resposta correta
5.
1. Pergunta 1
0/0
1.
2.
3. Incorreta:
cada cluster contém um conjunto de dados com um tipo de atributo (por exemplo, idade ou
sexo).
4.
cada ponto fica no centro dos registros similares e cada grupo tem um centro.
Resposta correta
5.
0/0
“Sendo assim, o problema descrito acima consiste em encontrar k centroides, ou médias dos grupos.
Entre os principais algoritmos de agrupamento baseados em distância, podem ser citados K-meansm K-
modes e Kmedoid. Algoritmos baseados em densidade consideram que grupos são regiões do espaço com
concentrações atípicas de pontos.”
Fonte: GOLDSHIMDIT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever. 2015. p. 97.
1. Incorreta:
III e IV.
2.
I e IV.
3.
I e III.
Resposta correta
4.
II e IV.
5.
II e III.
3. Pergunta 3
0/0
“Média móvel é um dos mais versáteis e utilizados indicadores, sendo, inclusive, a base da grande
maioria de sistemas mecânicos de trend-following atualmente em uso. Seu cálculo é bastante simples,
sendo feito por meio da escolha de um determinado número de dados e calculando a média dos preços
nestes dias.”
Fonte: SANTANA, Genilson. O poder de previsão da análise técnica. São Paulo: FGV. 1997. p. 20.
De acordo com o texto e com o conteúdo estudado, ordene os passos para a execução de análise
bayesiana:
1.
1, 4, 2, 5, 3.
2. Incorreta:
3, 1, 2, 4, 5.
3.
3, 2, 1, 5, 4.
4.
4, 2, 1, 5, 3.
Resposta correta
5.
4, 3, 1, 5, 2.
4. Pergunta 4
0/0
“Uma das tarefas de KDD mais importantes e mais populares é a tarefa da classificação. Essa tarefa
tipicamente utiliza aprendizado supervisionado, que é um tipo de aprendizado indutivo. “
Fonte: GOLDSHIMDIT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever. 2015. p. 88.
1.
I e III.
2.
III e IV.
Resposta correta
3.
I e IV.
4. Incorreta:
II e III.
5.
II e IV.
5. Pergunta 5
0/0
“No caso específico da tarefa de classificação, o atributo-alvo é categórico (seu domínio é composto por
categorias/classes). O outro grupo contém os atributos a serem utilizados na predição do valor,
denominados atributos previsores ou atributos de predição.”
Fonte: GOLDSHIMDIT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever. 2015. p.89.
De acordo com o texto e com o conteúdo estudado, pode-se dizer que classificar:
1.
2.
Resposta correta
3.
4.
5. Incorreta:
6. Pergunta 6
0/0
“Variável: é a característica que vai ser observada, medida ou contada nos elementos da população ou da
amostra e que pode variar, ou seja, assumir um valor diferente de elemento para elemento. Não basta
identificar a variável a ser trabalhada, é necessário fazer-se distinção entre os tipos de variáveis: Variável
qualitativa: é uma variável que assume como possíveis valores atributos ou qualidades. Também são
denominadas variáveis categóricas. Variável quantitativa: é uma variável que assume como possíveis
valores números.”
Fonte: GUEDES Aparecida, et al. Estatística Descritiva: São Paulo: Each Usp. 2019. p. 2.
De acordo com o texto e com o conteúdo estudado, pode-se dizer que, entre as classes de dados:
1.
2.
3.
4.
Resposta correta
5. Incorreta:
7. Pergunta 7
0/0
“A tarefa de Clusterização, também chamada Agrupamentos ou Análises de grupos, é usada para separar
os registros de um conjunto de dados em subconjuntos ou grupos (clusters), de tal forma que elementos
em um cluster compartilhem propriedades comuns.”
Fonte: GOLDSHIMDIT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever. 2015. p. 95.
De acordo com o texto e com o conteúdo estudado, ordene os passos para a execução de clusterização em
weka:
( ) Clicar em cluster.
( ) Clicar em start.
( ) Clicar em choose.
1.
2, 1, 5, 3, 4.
Resposta correta
2.
3, 2, 1, 5, 4.
3.
4, 2, 1, 5, 3.
4.
1, 4, 2, 5, 3.
5. Incorreta:
4, 3, 2, 1, 5.
8. Pergunta 8
0/0
“Em um modelo de regressão múltipla, a variável dependente (Y) será determinada por mais de uma
variável independente (X). Genericamente, um modelo de regressão linear múltipla com ‘k’ variáveis
independentes e ‘p’ parâmetros.”
Fonte: MAIA, Alexandre Gori. Econometria: conceitos e aplicações. São Paulo: Saint Paul. 2019. E-
book.
De acordo com o texto e com o conteúdo estudado, ordene os passos para a execução de regressão
múltipla em weka:
( ) Clicar em regressão.
1.
2, 1, 5, 3, 4.
2.
3, 2, 1, 5, 4.
Resposta correta
3.
4, 2, 1, 5, 3.
4. Incorreta:
4, 3, 2, 1, 5.
5.
1, 4, 2, 5, 3.
9. Pergunta 9
0/0
“Uma série temporal é um conjunto de observações de um fenômeno ordenadas no tempo. Podemos citar
como exemplo: o consumo mensal de energia elétrica em casa, registrado durante um ano, ou as vendas
diárias de um produto no decorrer de um mês, dentre muitos outros.”
Fonte: GOLDSHIMDIT, Ronaldo. BEZERRA, Eduardo. PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever. 2015. p. 101.
De acordo com o texto e com o conteúdo estudado, pode-se dizer que, em análises temporais:
1.
2.
3.
4.
Resposta correta
5. Incorreta:
10. Pergunta 10
0/0
“A árvore é uma segmentação supervisionada porque cada folha contém um valor para uma variável alvo.
Como estamos falando de classificação, cada folha contém uma classificação para seu segmento.Tal
árvore é chamada como árvore de classificação ou de decisão.”
Fonte: FOSTER, Provost; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre
mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016, p. 133.
De acordo com o texto e com o conteúdo, ordene os passos para a execução de árvores de decisão em
weka:
( ) Selecionar tree.
( ) SelecionarJ48.
( ) Clicar em start.
( ) Selecionar todos os dados.
1.
3, 2, 1, 5, 3.
2.
4, 1, 2, 5, 3.
3.
1, 5, 2, 3, 4.
Resposta correta
4.
4, 2, 1, 5, 3.
5. Incorreta:
2, 4, 3, 1, 5.
Pergunta 1
“NumPy possui uma função chamada de genfromtxt para criar dados em Python de forma tabulada, em
NumPy, dados tabulados são avaliados como array. É muito fácil para o sistema baixar dados e processor os
itens.”
Fonte: SUBRAMANIAN, Gopi. Python Data Science Cookbook. Inglaterra: Packt Publisher, 2015. p. 40.
Incorreta:
Resposta correta
Pergunta 2
Fonte: CHEN, Daniel y. Análise de dados com Python e Pandas. São Paulo: Pearson, 2018. p. 379.
escolhas = pd.Series(['Versão 1', 'Versão 2', 'Versão 1 e Versão 2', 'Versão 2', 'Versão 4])
escolhas.drop_duplicates()
Resposta correta
Incorreta:
mostrará dados com o comando drop e duplicará dados com o comando duplicate.
Pergunta 3
“NumPy é um pacote Python fundamental para computação científica, ele inclui capacidade de criar arrays
multidimensionais, contém um poderoso objeto de matriz N-dimensional, funções sofisticadas
(transmissão), ferramentas para integrar C / C ++ e código Fortran.”
Fonte: BRESSERT, Eli apud PARREIRA, Lucas. SciPy and NumPy. California: O Reilly Média, 2012. p. 5.
II e III.
II, IV e V.
Incorreta:
I e III.
II, III e V.
Resposta correta
I, II e III.
Pergunta 4
“Você deve documentar as funções que escreve. Na documentação você deve especificar as seguintes
informações:
Fonte: HARA, Carmem; ZOLA, Wagner. Linguagem C. Paraíba: UFPR, 2008. p. 16.
Com base no trecho e no conteúdo estudado, pode-se afirmar que input em Python:
são entradas de dados que serão digitados por usuários.
Resposta correta
Pergunta 5
“Em todos os exemplos que vimos até este momento, sentenças são executadas sequencialmente. A ordem
sequencial de execução de sentenças pode ser alterada se certas condições forem satisfeitas durante a
execução do programa. Isto é chamado “desvio condicional”. Todas as linguagens de programação
oferecem comandos para o desvio condicional. O mais simples é a sentença if.”
Fonte: HARA, Carmem; ZOLA, Wagner. Linguagem C. Paraíba: UFPR, 2008. p. 16.
IV. If Else significa “se algo for preenchido, então acontecerá algo”.
III e IV.
Resposta correta
II e III.
II e IV.
I e II.
Incorreta:
I e III.
Pergunta 6
“Alguns métodos estatísticos de Pandas são referenciados com estatística indireta, onde não retorna o
valor atual, mas sim o relativo. Por exemplo, .idxmin() e o idxmax() retornam a posição do mínimo e do
máximo.”
Resposta correta
Incorreta:
Pergunta 7
“O principal propósito de Pandas é ajudar a descobrir informações rapidamente em dados, com informação
definida como significado implícito no conjunto. O desenvolvimento de Pandas se deu em 2008 por Wes
MCKinney.”
I. Para manipular um arquivo importado, é necessário colocá-lo na mesma pasta do arquivo Python.
I e II.
III e V.
III e IV.
Incorreta:
II e V.
I e IV.
Resposta correta
Pergunta 8
“Em todas as opções utiliza-se pd.read_csv() para especificar o que baixar, também aplica-se a função
pd.read_Excel() para importar. Para ler outros tipos de pastas utiliza-se o parâmetro sheetname.”
Com base no trecho e no conteúdo estudado sobre Excel, pode-se afirmar que:
Incorreta:
Resposta correta
Pergunta 9
“Os métodos aggregate, transform e filter são normalmente utilizados para agrupar objetos em Pandas.
Espera-se investigar alguns trabalhos inerentes à objetos agrupados. O groupby é um excelente
agrupamento de diversos itens.”
Fonte: CHEN, Daniel Y. Pandas for Everyone. São Paulo: Pearson, 2018. p. 202.
Agora, observe a sintaxe abaixo:
plan.groupby('Day').aggregate({'Price': [min]})]
Resposta correta
Incorreta:
Pergunta 10
/
0
“Matplotlib é uma biblioteca versátil que gera visualizações de dados. Com variados tipos de desenhos e
opções de estilos refinados, é um instrumento de trabalho bom para criar imagens profissionais e
publicações científicas.”
Fonte: YU, Allen; CHUNG, Claire; YIM, Aldrin. Matplotlib 2.x. Mumbai: Packt, 2017. p. 8.
plt.ylabel(u'Aquisições')
plt.legenda('lower right')
plt.xlabel(u'Tentativas')
plt.show()
Incorreta:
II e III.
I e IV.
II e IV.
Resposta correta
I e III.
0/0
“NumPy possui uma função chamada de genfromtxt para criar dados em Python de forma tabulada, em
NumPy, dados tabulados são avaliados como array. É muito fácil para o sistema baixar dados e processor os
itens.”
Fonte: SUBRAMANIAN, Gopi. Python Data Science Cookbook. Inglaterra: Packt Publisher, 2015. p. 40.
1. Incorreta:
2.
Resposta correta
3.
4.
5.
2. Pergunta 2
0/0
Fonte: CHEN, Daniel y. Análise de dados com Python e Pandas. São Paulo: Pearson, 2018. p. 379.
escolhas = pd.Series(['Versão 1', 'Versão 2', 'Versão 1 e Versão 2', 'Versão 2', 'Versão 4])
escolhas.drop_duplicates()
1.
Resposta correta
2. Incorreta:
3.
4.
5.
mostrará dados com o comando drop e duplicará dados com o comando duplicate.
3. Pergunta 3
0/0
“NumPy é um pacote Python fundamental para computação científica, ele inclui capacidade de criar arrays
multidimensionais, contém um poderoso objeto de matriz N-dimensional, funções sofisticadas
(transmissão), ferramentas para integrar C / C ++ e código Fortran.”
Fonte: BRESSERT, Eli apud PARREIRA, Lucas. SciPy and NumPy. California: O Reilly Média, 2012. p. 5.
Com base nas informações e no conteúdo estudado, analise as afirmativas a seguir:
1.
II e III.
2.
II, IV e V.
3. Incorreta:
I e III.
4.
II, III e V.
Resposta correta
5.
I, II e III.
4. Pergunta 4
0/0
Fonte: HARA, Carmem; ZOLA, Wagner. Linguagem C. Paraíba: UFPR, 2008. p. 16.
Com base no trecho e no conteúdo estudado, pode-se afirmar que input em Python:
1.
2.
Resposta correta
3.
4. Incorreta:
5.
5. Pergunta 5
0/0
“Em todos os exemplos que vimos até este momento, sentenças são executadas sequencialmente. A ordem
sequencial de execução de sentenças pode ser alterada se certas condições forem satisfeitas durante a
execução do programa. Isto é chamado “desvio condicional”. Todas as linguagens de programação
oferecem comandos para o desvio condicional. O mais simples é a sentença if.”
Fonte: HARA, Carmem; ZOLA, Wagner. Linguagem C. Paraíba: UFPR, 2008. p. 16.
Com base nas informações e no conteúdo estudado, analise as afirmativas a seguir:
IV. If Else significa “se algo for preenchido, então acontecerá algo”.
1.
III e IV.
Resposta correta
2.
II e III.
3.
II e IV.
4.
I e II.
5. Incorreta:
I e III.
6. Pergunta 6
0/0
“Alguns métodos estatísticos de Pandas são referenciados com estatística indireta, onde não retorna o
valor atual, mas sim o relativo. Por exemplo, .idxmin() e o idxmax() retornam a posição do mínimo e do
máximo.”
Fonte: HEYDT, Michael. Learning Pandas. Mumbay: Packt, 2017. p. 162.
1.
2.
3.
4.
Resposta correta
5. Incorreta:
7. Pergunta 7
0/0
“O principal propósito de Pandas é ajudar a descobrir informações rapidamente em dados, com informação
definida como significado implícito no conjunto. O desenvolvimento de Pandas se deu em 2008 por Wes
MCKinney.”
1.
I e II.
2.
III e V.
3.
III e IV.
4. Incorreta:
II e V.
5.
I e IV.
Resposta correta
8. Pergunta 8
0/0
“Em todas as opções utiliza-se pd.read_csv() para especificar o que baixar, também aplica-se a função
pd.read_Excel() para importar. Para ler outros tipos de pastas utiliza-se o parâmetro sheetname.”
1.
2.
3. Incorreta:
4.
5.
Resposta correta
9. Pergunta 9
0/0
“Os métodos aggregate, transform e filter são normalmente utilizados para agrupar objetos em Pandas.
Espera-se investigar alguns trabalhos inerentes à objetos agrupados. O groupby é um excelente
agrupamento de diversos itens.”
Fonte: CHEN, Daniel Y. Pandas for Everyone. São Paulo: Pearson, 2018. p. 202.
plan.groupby('Day').aggregate({'Price': [min]})]
1.
Resposta correta
2. Incorreta:
3.
4.
5.
10. Pergunta 10
0/0
“Matplotlib é uma biblioteca versátil que gera visualizações de dados. Com variados tipos de desenhos e
opções de estilos refinados, é um instrumento de trabalho bom para criar imagens profissionais e
publicações científicas.”
Fonte: YU, Allen; CHUNG, Claire; YIM, Aldrin. Matplotlib 2.x. Mumbai: Packt, 2017. p. 8.
plt.ylabel(u'Aquisições')
plt.legenda('lower right')
plt.xlabel(u'Tentativas')
plt.show()
1. Incorreta:
II e III.
2.
I e IV.
3.
II e IV.
Resposta correta
4.
I e III.
5.
III e IV.
1. Pergunta 1
0/0
“Em todos os exemplos que vimos até este momento, sentenças são executadas sequencialmente. A
ordem sequencial de execução de sentenças pode ser alterada se certas condições forem satisfeitas
durante a execução do programa. Isto é chamado “desvio condicional”. Todas as linguagens de
programação oferecem comandos para o desvio condicional. O mais simples é a sentença if.”
Fonte: HARA, Carmem; ZOLA, Wagner. Linguagem C. Paraíba: UFPR, 2008. p. 16.
1.
II e III.
2.
I e II.
3.
II e IV.
4.
III e IV.
Resposta correta
5.
I e III.
2. Pergunta 2
0/0
“Você deve documentar as funções que escreve. Na documentação você deve especificar as seguintes
informações:
• Ação – o que a função faz.
• Entrada – descrição dos argumentos passados para a função.
• Saída – descrição do valor retornado pela função.”
Fonte: HARA, Carmem; ZOLA, Wagner. Linguagem C. Paraíba: UFPR, 2008. p. 16.
Com base no trecho e no conteúdo estudado, pode-se afirmar que input em Python:
1.
criam e exibem tabelas de dados com colunas e linhas.
2.
3.
Resposta correta
4.
5.
3. Pergunta 3
0/0
“Matplotlib é um pacote de visualização Python. Para ler e plotar os dados nós precisamos configurar
Python, instalando Matplotlib nas suas dependências, preparando a plataforma para executar e manter o
código rodando.”
Fonte: YU, Allen; CHUNG, Claire; YIM, Aldrin. Matplotlib 2.x. Mumbai: Packt, 2017. p. 8.
Com base no trecho e no conteúdo estudado, pode-se afirmar que a biblioteca Matplotlib pode gerar os
gráficos:
1.
2.
3.
de barra, histograma, pizza e plt.plot.
Resposta correta
4.
baseados em .dat.
5.
4. Pergunta 4
0/0
“NumPy é um pacote Python fundamental para computação científica, ele inclui capacidade de criar
arrays multidimensionais, contém um poderoso objeto de matriz N-dimensional, funções sofisticadas
(transmissão), ferramentas para integrar C / C ++ e código Fortran.”
Fonte: BRESSERT, Eli apud PARREIRA, Lucas. SciPy and NumPy. California: O Reilly Média, 2012.
p. 5.
1.
II, III e V.
Resposta correta
2. Incorreta:
II, IV e V.
3.
I, II e III.
4.
II e III.
5.
I e III.
5. Pergunta 5
0/0
“Os métodos aggregate, transform e filter são normalmente utilizados para agrupar objetos em Pandas.
Espera-se investigar alguns trabalhos inerentes à objetos agrupados. O groupby é um excelente
agrupamento de diversos itens.”
Fonte: CHEN, Daniel Y. Pandas for Everyone. São Paulo: Pearson, 2018. p. 202.
1.
2.
3.
Resposta correta
4.
5.
6. Pergunta 6
0/0
Com base no trecho e no conteúdo estudado, selecione a alternativa correta sobre dicionário em Python:
1.
Resposta correta
2. Incorreta:
3.
4.
5.
0/0
“Para uma rápida plotagem, a Matplotlib usa uma lista de cores. Em Matplotlib 2.0 a lista pode ser
mudada do original red, green, blue, cyan, magenta yellow, e black, para ‘b’, ‘g’, ‘r’, ‘c’, ‘m’, ‘y’, ‘k’
[…].”
Fonte: YU, Allen; CHUNG, Claire; YIM, Aldrin. Matplotlib 2.x. Mumbai: Packt, 2017. p. 9.
Com base no trecho e no conteúdo estudado sobre a plotagem, pode-se dizer que:
1.
Resposta correta
2.
3. Incorreta:
4.
5.
8. Pergunta 8
0/0
“Em todas as opções utiliza-se pd.read_csv() para especificar o que baixar, também aplica-se a função
pd.read_Excel() para importar. Para ler outros tipos de pastas utiliza-se o parâmetro sheetname.”
Fonte: HEYDT, Michael. Learning Pandas. Mumbay: Packt, 2017. p. 195.
Com base no trecho e no conteúdo estudado sobre Excel, pode-se afirmar que:
1.
Resposta correta
2.
3.
4.
5.
9. Pergunta 9
0/0
“A tupla é um tipo de dado heterogêneo (aceita dados de diversos tipos, inclusive de outras listas)
identificado internamente como tipo de dado tupla, tendo por característica armazenar conjuntos de
valores.”
Fonte: MANZANO, José. Introdução à linguagem Python. São Paulo: Novatec, 2018. Ebook.
Com base no trecho e no conteúdo estudado, pode-se afirmar que a diferença entre listas e tuplas é que:
1.
3.
4.
Resposta correta
5. Incorreta:
10. Pergunta 10
0/0
“[…] é possível separar os dados de um dicionário em três tuplas, uma contendo apenas chaves, outra
contendo apenas os conteúdos ou uma lista com todo o conteúdo separado em pares de valores.”
Fonte: MANZANO, José. Introdução à linguagem Python. São Paulo: Novatec, 2018. Ebook.
Com base no trecho e no conteúdo estudado, assinale a alternativa correta sobre dicionário em Python:
1.
2.
3.
5.
1. Pergunta 1
0/0
“As etapas adicionais em o processo KDD, como preparação de dados, seleção de dados, limpeza de
dados, incorporação de conhecimento e interpretação adequada dos resultados mineração, são essenciais
para garantir que o conhecimento útil seja derivado dos dados.”
Fonte: FAYYAD, U.M., PIATETSKY-SHAPIRO, G., SMYTH, P., UTHURUSAMY, R. Advances in
Knowledge Discovery and Data Mining. Estados Unidos, Califórnia: AAAI/MIT Press, 1996.
Considerando o texto e o conteúdo da disciplina, sobre o processo KDD, analise as afirmativas a seguir:
1.
II e III.
2.
I e III.
Resposta correta
3.
III e IV.
4.
I e IV.
5.
II e IV.
2. Pergunta 2
0/0
“Um banco de dados é uma coleção integrada de dados, organizada de tal forma a facilitar o
armazenamento eficiente, assim como sua modificação e recuperação. Normalmente, informações a
respeito do nome de cada campo e seu domínio são também armazenadas.”
Fonte: GOLDSHIMDIT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever, 2015. P. 12.
Com base no texto acima e no conteúdo sobre banco de dados, pode-se dizer que:
1.
2.
Resposta correta
3.
4.
5.
Tabelas e bancos de dados são nomes diferentes para a mesma coisa.
3. Pergunta 3
0/0
“É comum obter-se os dados a serem minerados de diversas fontes: banco de dados, arquivos textos,
planilhas, data warehouses, vídeos, imagens, entre outras. Surge então, a necessidade da integração destes
dados de forma a termos um repositório único e consistente. Para isto, é necessária uma análise
aprofundada dos dados observando redundâncias, dependências entre as variáveis e valores conflitantes
(categorias diferentes para os mesmos valores, chaves divergentes, regras diferentes para os mesmos
dados, entre outros).”
Fonte: CAMILO, Oliveira; SILVA, João. Mineração de dados: Conceitos, tarefas, métodos e ferramentas.
Goiás: UFG, 2009. P. 8.
Com base no texto acima e no conteúdo sobre Dashboards, pode-se dizer que:
1. Incorreta:
2.
Resposta correta
3.
4.
5.
4. Pergunta 4
0/0
Leia o trecho abaixo:
“As funcionalidades da mineração de dados são usadas para especificar os tipos de informações a serem
obtidas nas tarefas de mineração. Em geral estas tarefas podem ser classificadas em duas categorias: (1)
descritivas: caracterizam as propriedades gerais dos dados; e (2) preditivas: fazem inferência a partir dos
dados objetivando predições.”
Fonte: CASTRO, Gilberto. Ramos. Discussão conceitual sobre dado, informação e conhecimento. João
Pessoa: UFPB, 2011. P. 23.
Considerando o texto e o conteúdo da disciplina, sobre as funções da mineração, pode-se dizer que:
1.
Resposta correta
2.
3.
4.
5.
5. Pergunta 5
0/0
“Agregação de informações: Esta operação consiste em reunir (agregar) alguns registros de forma a
produzir um conjunto de dados de tamanho menor que o original. Na agregação de informações, dados
com menor detalhe. Por exemplo, é possível somar os valores de todas as compras de cada cliente,
obtendo o total de despesas por ele realizadas durante um determinado período.”
Fonte: GOLDSHIMDIT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever, 2015. P. 46.
Considerando o texto e o conteúdo da disciplina, sobre agregação e Data Warehouse, pode-se dizer que:
1.
Resposta correta
2.
3.
4.
5.
6. Pergunta 6
0/0
“Conhecer o tipo dos dados com o qual se irá trabalhar também é fundamental para a escolha do(s)
método(s) mais adequado(s). Pode-se categorizar os dados em dois tipos: quantitativos e qualitativos. Os
dados quantitativos são representados por valores numéricos. Eles ainda podem ser discretos e contínuos.
Já os dados qualitativos contêm os valores nominais e ordinais (categóricos). Em geral, antes de se aplicar
os algoritmos de mineração é necessário explorar, conhecer e preparar os dados.”
Fonte: CAMILO, Oliveira; SILVA, João. Mineração de dados: Conceitos, tarefas, métodos e ferramentas.
Goiás: UFG 2009, p.6.
Considerando o texto e o conteúdo da disciplina, sobre filtros em SQL, pode-se dizer que:
2. Incorreta:
Os dados podem ser analisados através da função drop table where idade > 20.
3.
Resposta correta
4.
5.
7. Pergunta 7
0/0
“Duas heurísticas podem ser utilizadas para indicar se esta operação deve ser utilizada: Eliminar todos os
atributos que apresentem valores constantes em todos os conjuntos de dados. A justificativa é que
atributos nesta situação não contribuem para distinguir os registros uns dos outros.”
Fonte: GOLDSHIMDIT, Ronaldo; BEZERRA, Eduardo; PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever, 2015. P. 39.
Com base no texto acima e no conteúdo sobre banco de dados, pode-se dizer que:
1.
2.
4.
5.
Resposta correta
8. Pergunta 8
0/0
“É importante destacar que o processo de KDD não requer que os dados a serem analisados pertençam à
Data Warehouse. No entanto o tratamento e a consolidação dos dados necessários à estruturação e à carga
neste tipo de ambiente são extremamente úteis e desejáveis ao processo de KDD.”
Fonte: GOLDSHIMDIT, Ronaldo. BEZERRA, Eduardo. PASSOS, Emannuel. Data Mining: Conceitos,
técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsiever, 2015. P. 19.
Considerando o texto e o conteúdo da disciplina, a respeito de Data Warehouse, pode-se dizer que:
1.
2.
Resposta correta
3. Incorreta:
4.
A terceira camada é o local onde os dados recebem limpeza.
5.
9. Pergunta 9
0/0
“A mineração de dados é parte integrante de um processo mais amplo, conhecido como KDD. Embora
muitos usem mineração de dados como sinônimo de KDD, na primeira conferência internacional sobre
KDD, realizada na cidade de Montreal, Canadá, em 1995.”
Fonte: CASTRO, Leandro C.; GOMES, Daniel E. Introdução a mineração de dados. Conceitos básicos,
algoritmos e aplicações. São Paulo: Saraiva, 2017. P. 5.
A partir do texto citado e dos conteúdos estudados, ordene os passos necessários para realizar o KDD:
1.
5, 4, 1, 2, 3.
2.
2, 3, 5, 4, 1.
3.
2, 1, 4, 3, 5.
4. Incorreta:
1, 4, 2, 5, 3.
5.
5, 1, 2, 3, 4.
Resposta correta
10. Pergunta 10
0/0
“A conscientização de segurança aumentou significativamente nos últimos anos em TI, mas muitas vezes
permanece uma reflexão tardia e um fardo indesejável para a maioria das equipes de DW / BI.”
Fonte: FAYYAD, U.M.; PIATETSKY-SHAPIRO, G.; SMYTH, P.; UTHURUSAMY, R. Advances in
Knowledge Discovery and Data Mining. Califórnia: AAAI/MIT Press, 1996. P. 446.
Com base no texto acima e no conteúdo estudado, pode-se dizer, com relação ao modo de segurança do
workbench, que:
1.
2.
3.
Resposta correta