Você está na página 1de 27

Aula 6:

Correlação
e
Regressão
.
6.1- Correlação
• Em alguns casos é interessante se estudar
duas variáveis conjuntamente, por exemplo:
- Intensidade de doenças e peso em pacientes;
- Altura e comprimento de animais;
- Índice de insolação e produção de massa
seca em vegetais;
- Etc...
O primeiro estudo é feito por gráfico:
diagrama de dispersão.
.

• Para se construir os gráficos as duas


variáveis são distribuídas uma no eixo das
ordenadas e a outra no eixo das abscissas.
• Exemplo: Peso, em quilogramas, e
comprimento, em centímetros, de cães.
Comprimento Peso Comprimento Peso Comprimento Peso
104 23,5 98 15,0 91 14,5
107 22,7 95 14,9 102 19,0
103 21,1 92 15,1 99 19,5
105 21,5 104 22,2 98 16,0
100 17,0 94 13,6 104 20,0
104 28,5 99 16,1 100 18,3
108 19,0 98 18,0 - -
Peso, em quilogramas, e comprimento, em
centímetros, de cães.
Peso, em quilogramas, e comprimento, em
centímetros, de cães.
Correlações positivas e negativas
• Quando as duas variáveis crescem ou
decrescem no mesmo sentido, a correlação
é chamada POSITIVA.
• Se as variáveis variam em sentido contrário
(quando uma cresce a outra decresce), a
correlação é chamada NEGATIVA.
• Quando se diz que duas variáveis são
correlacionadas não significa que o
crescimento ou decréscimo de uma leva ao
crescimento ou decréscimo da outra, mas
que elas variam conjuntamente.
.
Coeficiente de correlação
• Para verificar estatisticamente se duas
variáveis estão correlacionadas calcula-se o
coeficiente de correlação de Pearson (r).
.

• Sempre que calcularmos r, o valor variará de


-1 a +1, isto é:
- se r assume um valor 1, diz-se que as duas
variáveis tem correlação perfeita positiva.
- se r assumir o valor -1, diz-se que as duas
variáveis tem correlação perfeita negativa.
- se r assume o valor zero (0), não existe
correlação (a correlação é nula)

-1 0 +1
correlação negativa correlação positiva
.

• Segundo Carla Santos (2007) podemos


classificar as correlações em:
Coeficiente de Correlação Coeficiente Correlação
correlação de correlação
r=1 Perfeita positiva 0 Nula
Forte positiva Ínfima negativa
Moderada positiva Fraca negativa
Fraca positiva Moderada negativa
Ínfima positiva Forte negativa
0 Nula r = -1 Perfeita negativa

• SANTOS, Carla, (2007), Estatística Descritiva - Manual de Auto-


aprendizagem, Lisboa, Edições Sílabo
Exemplo de correlação positiva e negativa
Felicidade e renda no Brasil
Feliz (correlação positiva) Infeliz (correlação negativa)
Nível de Probabilidade Nível de Probabilidade
renda estimada renda estimada
1 0,18 1 0,28
2 0,25 2 0,19
3 0,25 3 0,18
4 0,26 4 0,16
5 0,25 5 0,19
6 0,27 6 0,13
7 0,29 7 0,10
8 0,27 8 0,11
9 0,41 9 0,04
10 0,30 10 0,08
• .

Obs. A renda aparece dividida em 10 variáveis Dummy, sendo 1


o menor e 10 o maior. CORBI, R. B. e MENEZEZ FILHO, N. A. 2006
.

• Tabela com cálculos intermediários para


calcular a correlação: (felicidade/renda)
x y x2 y2 xy
1 0,1800
2 0,2500
3 0,2500
4 0,2600
5 0,2500
6 0,2700
7 0,2900
8 0,2700
9 0,4100
10 0,3000
Σ
.

• Tabela com cálculos intermediários para


calcular a correlação: (felicidade/renda)
x y x2 y2 xy
1 0,1800 1 0,0324 0,1800
2 0,2500 4 0,0625 0,5000
3 0,2500 9 0,0625 0,7500
4 0,2600 16 0,0676 1,0400
5 0,2500 25 0,0625 1,2500
6 0,2700 36 0,0729 1,6200
7 0,2900 49 0,0841 2,0300
8 0,2700 64 0,0729 2,1600
9 0,4100 81 0,1681 3,6900
10 0,3000 100 0,0900 3,0000
Σ 55,00 2,73 385,00 0,7755 16,22
Ao colocarmos os valores na fórmula
teremos (felicidade/renda):

. r= 0,7634
.

Tabela com cálculos intermediários para


calcular a correlação (infelicidade/renda):
x y x2 y2 xy
1 0,28 1 0,0784 0,28
2 0,19 4 0,0361 0,38
3 0,18 9 0,0324 0,54
4 0,16 16 0,0256 0,64
5 0,19 25 0,0361 0,95
6 0,13 36 0,0169 0,78
7 0,10 49 0,0100 0,70
8 0,11 64 0,0121 0,88
9 0,04 81 0,0016 0,36
10 0,08 100 0,0064 0,80
Σ 55,00 1,46 385,00 0,2556 6,31
Ao colocarmos os valores (infelicidade /
renda) na fórmula teremos:

r = - 0,9196
.

• Correlação entre felicidade e renda no


Brasil: r = 0,7634
Correlação positiva (moderada)

• Correlação entre infelicidade e renda no


Brasil: r = -0,9196
Correlação negativa (forte)

- Interpretar os dados.
Regressão
Quando estudamos conjuntamente duas variáveis
temos duas situações possíveis:
- quando ambas variam de forma independente:
correlação
- quando uma varia em função da outra:
regressão.
• Uma variável Y (variável dependente) varia em
função de uma variável X (variável
explanatória);
• Exemplo: o peso de cobaias (variável
dependente) varia em função da idade (variável
explanatória);
.

• Gráfico de linhas:
A representação gráfica desta relação ocorre através
do gráfico de linha.
Exemplo:
Peso médio, em quilograma, de indivíduos do sexo
masculino, segundo a idade, no D.F. (IBGE, 1978)
Idade Peso Idade Peso Idade Peso
médio médio médio
3 14,6 9 26,3 15 49,7
4 16,3 10 28,4 16 52,7
5 17,8 11 30,9 17 57,3
6 19,8 12 34,2 18 58,1
7 21,6 13 38,7 19 59,4
8 23,8 14 43,4 - -
• Reta de regressão
Peso médio, em quilograma, de indivíduos do sexo
masculino, segundo a idade, no D.F. (IBGE, 1978)
.

Reta de regressão
• Um regressão perfeita geraria uma reta. Para
gerarmos uma reta a partir de qualquer
regressão precisamos calcular os coeficientes
angular e linear.
- Coeficiente angular

- Coeficiente linear
Onde e são as médias de X e Y
respectivamente.
.

Valores médios, em gramas, da produção e


número médio de vagens por plantas.
Nº vagens/ Produção/ xy x2
planta (x) planta (gr) (y)
7,6 7,0
9,2 8,1
9,3 8,8
8,5 7,6
8,2 7,6
7,4 6,6
9,1 8,2
9,0 8,0
11,4 11,2
10,4 9,0
Σ
.

Valores médios, em gramas, da produção e


número médio de vagens por plantas.
Nº vagens/ Produção/ xy x2
planta (x) planta (gr) (y)
7,6 7,0 53,20 57,76
9,2 8,1 74,52 84,64
9,3 8,8 81,84 86,49
8,5 7,6 64,60 72,25
8,2 7,6 62,32 67,24
7,4 6,6 48,84 54,76
9,1 8,2 74,62 82,81
9,0 8,0 72,00 81,00
11,4 11,2 127,68 129,96
10,4 9,0 93,60 108,16
Σ 90,10 82,10 753,22 825,07
.

• Calcular o b e o a:

a= 8,21 – (1,0173 . 9,01)


a= -0,9559
Para construir a reta inverter a equação de a
y= a + bx
• Atribuir valores arbitrários a x (8 e 12)
y = - 0,9559 + (1,0173x8) y = 7,1825
y = - 0,9559 + (1,0173x12) y = 11,2517
Com os dois pontos construir a reta
• Não se esqueça que a reta foi ajustada. Os
valores obtidos são apenas aproximações, e
não valores reais.
Exemplo: Qual a produtividade esperada em
plantas com 10 vagens?
y= a + bx y = - 0,9559 + (1,0173x10)
y = 9,2171 ou aproximadamente 9,22 gramas.

• No exemplo ajustamos o valor de y em


relação a x, mas o inverso também pode
ocorrer dependendo de quais dados podem
ser melhor fixados.

Você também pode gostar