Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Importe para o Lemonade uma base de dados de sua escolha, mas que tenha pelo
menos 3 atributos numéricos e que não seja uma dessas bases que já foram
trabalhadas: ENEM e Iris.
2. Crie um novo fluxo de trabalho com o nome Correlações. Inclua nele a caixinha Ler
dados e configure-a para ler a base de dados que você importou no item 1.
3. Se a sua base de dados tiver mais de 10 atributos, remova alguns utilizando a caixinha
Selecionar atributos. Basta ligá-la à caixinha Ler dados que já foi adicionada e
configurá-la selecionando os atributos que você deseja manter (mantenha pelo menos
3 atributos numéricos e no máximo 10).
4. Inclua a caixinha Sumário estatístico ao seu fluxo, dê um título qualquer para ela, salve
e execute o fluxo.
5. Observe a tabela gerada na aba Visualizações. Vamos trabalhar apenas com as colunas
cujos nomes começam com “Correlação com”. Se preferir, copie e cole essa tabela no
Excel ou LibreOfficeCalc e exclua as colunas que não serão necessárias (se estiver difícil
de visualizar)
a) Liste todos os pares de atributos que têm correlação forte, ou seja, que têm um
coeficiente de Pearson maior ou igual a 0,7 (em módulo). Explique ou especule o
motivo dessa correlação ser forte. (Ex.: A correlação entre posição no ranking de
felicidade de um país e seu índice de felicidade é forte (e negativa) porque o valor
do índice é inversamente proporcional à posição no ranking).
Se nenhum par de atributos tiver correlação forte, apenas cite o par que tem a
correlação mais forte dentre todos os pares de atributos.
b) Qual o par de atributos que tem correlação mais fraca? Explique ou especule o
motivo dessa correlação ser fraca.