Você está na página 1de 1

Aula Prática 07 – Análise de correlação

1. Importe para o Lemonade uma base de dados de sua escolha, mas que tenha pelo
menos 3 atributos numéricos e que não seja uma dessas bases que já foram
trabalhadas: ENEM e Iris.

Exemplos de fontes de dados (pode usar outra, se for de sua preferência):


- http://dados.gov.br
- www.kaggle.com

2. Crie um novo fluxo de trabalho com o nome Correlações. Inclua nele a caixinha Ler
dados e configure-a para ler a base de dados que você importou no item 1.

3. Se a sua base de dados tiver mais de 10 atributos, remova alguns utilizando a caixinha
Selecionar atributos. Basta ligá-la à caixinha Ler dados que já foi adicionada e
configurá-la selecionando os atributos que você deseja manter (mantenha pelo menos
3 atributos numéricos e no máximo 10).

4. Inclua a caixinha Sumário estatístico ao seu fluxo, dê um título qualquer para ela, salve
e execute o fluxo.

5. Observe a tabela gerada na aba Visualizações. Vamos trabalhar apenas com as colunas
cujos nomes começam com “Correlação com”. Se preferir, copie e cole essa tabela no
Excel ou LibreOfficeCalc e exclua as colunas que não serão necessárias (se estiver difícil
de visualizar)

6. Responda, com base na tabela de correlações gerada:

a) Liste todos os pares de atributos que têm correlação forte, ou seja, que têm um
coeficiente de Pearson maior ou igual a 0,7 (em módulo). Explique ou especule o
motivo dessa correlação ser forte. (Ex.: A correlação entre posição no ranking de
felicidade de um país e seu índice de felicidade é forte (e negativa) porque o valor
do índice é inversamente proporcional à posição no ranking).
Se nenhum par de atributos tiver correlação forte, apenas cite o par que tem a
correlação mais forte dentre todos os pares de atributos.

b) Qual o par de atributos que tem correlação mais fraca? Explique ou especule o
motivo dessa correlação ser fraca.

c) Plote no Lemonade o Gráfico de dispersão do par de atributos com correlação


mais forte que você identificou acima e confirme visualmente se os dois atributos
estão fortemente correlacionados ou não.

Você também pode gostar