Você está na página 1de 17

Correlação linear

Regressão Linear
Exercı́cios

Análise de Correlação e
Regressão Linear

Lucas Santana da Cunha


email: lscunha@uel.br
http://www.uel.br/pessoal/lscunha/

26 de julho de 2018
Londrina

1 / 17
Correlação linear Introdução
Regressão Linear Gráfico de Dispersão
Exercı́cios Coeficiente de correlação de Pearson

Introdução

Há casos em que pode existir um relacionamento entre duas


variáveis:
Peso vivo e circunferência do peito de ovinos;
Peso e altura de um homem adulto;
Nı́vel de colesterol e de triglicerı́deos;
Perı́odos etários e frequência do pulso;

Muitas vezes há a necessidade de avaliar o grau de relaciona-


mento entre duas ou mais variáveis;

A Análise de Correlação é o ramo da estatı́stica que estabelece


o grau de relacionamento entre duas variáveis;

2 / 17
Correlação linear Introdução
Regressão Linear Gráfico de Dispersão
Exercı́cios Coeficiente de correlação de Pearson

Gráfico de Dispersão

Uma forma visual de observarmos a correlação entre duas variáveis


é através do gráfico de dispersão.

Nesse gráfico, os valores das duas variáveis são plotadas usando-


se as coordenadas x e y . Os pontos nos darão uma ideia se
existe ou não correlação entre as duas variáveis;

3 / 17
Correlação linear Introdução
Regressão Linear Gráfico de Dispersão
Exercı́cios Coeficiente de correlação de Pearson

Correlação Positiva

Figura 1: Correlação positiva

4 / 17
Correlação linear Introdução
Regressão Linear Gráfico de Dispersão
Exercı́cios Coeficiente de correlação de Pearson

Correlação Negativa

Figura 2: Correlação negativa

5 / 17
Correlação linear Introdução
Regressão Linear Gráfico de Dispersão
Exercı́cios Coeficiente de correlação de Pearson

Correlação Nula

Figura 3: Não há correlação

6 / 17
Correlação linear Introdução
Regressão Linear Gráfico de Dispersão
Exercı́cios Coeficiente de correlação de Pearson

Coeficiente de correlação de Pearson

O coeficiente de correlação linear de Pearson tem por obje-


tivo medir o grau de relação entre duas variáveis.

Definição
Cov (X , Y )
r= , −1 ≤ r ≥ 1
Sx Sy
em que
Pn Pn
Pn x y
i=1 xi yi − i=1 in i=1 i
Cov (X , Y ) =
n−1
s Pn s
2 ( ni=1 yi )2
P
Pn ( x)
i=1 i
Pn
i=1 xi2 − n
2
i=1 yi − n
Sx = Sy =
n−1 n−1

7 / 17
Correlação linear Introdução
Regressão Linear Gráfico de Dispersão
Exercı́cios Coeficiente de correlação de Pearson

Iterpretação

Se r < 0, a correlação linear é inversa (negativa) e quanto


mais próximo de −1 maior essa correlação.

Se r > 0, a correlação linear é direta (positiva) e quanto


mais próximo de 1 maior essa correlação.

Se r = 0, existe correlação linear nula entre as variáveis, ou


seja, as variáveis não são correlacionadas linearmente.

8 / 17
Correlação linear Introdução
Regressão Linear Gráfico de Dispersão
Exercı́cios Coeficiente de correlação de Pearson

Exemplo 1
A tabela abaixo mostra a frequência do pulso médio em diferentes
perı́odos etários:

Idade (X) 2 4 6 8 10 12 14 16
Pulso (Y) 112 104 100 92 88 86 84 80

Verifique se há uma correlação linear entre o pulso médio e a idade.

9 / 17
Correlação linear
Introdução
Regressão Linear
Regressão linear simples
Exercı́cios

Introdução

A análise de regressão consiste na obtenção de uma equação


que tenta explicar a variação da variável dependente pela va-
riação do(s) nı́vel(is) da(s) variável(is) indepentedente(s).

O comportamento de Y em relação a X pode se apresentar


de diversas maneiras: linear, quadrático, cúbico, exponencial,
logarı́tmico, etc.

O modelo que explica o fenômeno, deve ser uma curva (função)


que mais se aproxime dos pontos representados no gráfico de
dispersão, levando em conta a interpretação.

10 / 17
Correlação linear
Introdução
Regressão Linear
Regressão linear simples
Exercı́cios

Regressão linear simples


Qual será a equação da reta que melhor explica a variação de Y em
função de X ?

Yi = β0 + β1 Xi + ei

11 / 17
Correlação linear
Introdução
Regressão Linear
Regressão linear simples
Exercı́cios

Mı́nimos quadrados
Para se obter a equação estimada, vamos utilizar o método
dos mı́nimos quadrados (MMQ), visando a minimização
dos erros. Assim, tem-se que:
n
X n
X
ei2 = [Yi − β0 − β1 Xi ]2
i=1 i=1

Logo, os estimadores de β0 e β1 que minimizam os erros são:

Pn
Xi ni=1 Yi
Pn P
i=1 Xi Yi −
i=1
Sxy
βˆ1 = P n
( ni=1 Xi )2
=
Pn 2 Sxx
i=1 Xi − n

βˆ0 = Ȳ − βˆ1 X̄

12 / 17
Correlação linear
Introdução
Regressão Linear
Regressão linear simples
Exercı́cios

Equação estimada
Assim, temos a regressão linear simples ajustada:

ŷ = βˆ0 + βˆ1 x

βˆ0 é o parâmetro intercepto, pois representa o ponto onde a


reta corta o eixo Y (x = 0);

βˆ1 é o parâmetro chamado coeficiente angular da reta. Tem-se


que que para o aumento de 1 unidade de X , Y aumenta em βˆ1
unidades.

13 / 17
Correlação linear
Introdução
Regressão Linear
Regressão linear simples
Exercı́cios

Coeficiente de Determinação

O quadrado do coeficente de correlação de Pearson, r 2 , é cha-


mada de coeficiente de determinação e seu campo de va-
riação é 0 ≤ r 2 ≤ 1.

Indica a proporção da variação total que é “explicada”pela re-


gressão.

Se r 2 = 1, todos os pontos observados se situam sobre a reta


de regressão, logo, as variações de Y são 100% explicadas pelas
variações de X através da função especificada.

14 / 17
Correlação linear
Introdução
Regressão Linear
Regressão linear simples
Exercı́cios

Exemplo 1
A tabela abaixo mostra a frequência do pulso médio em diferentes
perı́odos etários:

Idade (X) 2 4 6 8 10 12 14 16
Pulso (Y) 112 104 100 92 88 86 84 80

a) Determine a equação da reta de regressão linear de Y em X e


a interprete.
b) Encontre o valor estimado do pulso médio para a idade média.
c) Determine o coeficiente de determinação, r 2 , e o interprete.
d) Plote o gráfico de dispersão com a curva estimada.

15 / 17
Correlação linear
Introdução
Regressão Linear
Regressão linear simples
Exercı́cios

16 / 17
Correlação linear
Regressão Linear
Exercı́cios

Exercı́cio 1
Considere as medidas de colesterol e de triglicerı́deos de cada indivı́duo abaixo.

Nı́vel de Colesterol (X) Nı́vel de Triglicerı́deos (Y)


Paciente (mmol/l) (mmol/l)
1 5,12 2,30
2 6,18 2,54
3 6,77 2,95
4 6,65 3,77
5 6,36 4,18
6 5,90 5,31
7 5,48 5,53
8 6,02 8,83
9 10,34 9,48
10 8,51 14,20

a) Calcular o coeficiente de correlação linear de Pearson e interpretar o resultado.


b) Determine a equação da reta de regressão linear de Y em X e a interprete.
c) Estime o valor do Nı́vel de Triglicerı́deos, mmol/l, para um Nı́vel de Colesterol
igual a 6,0 mmol/l.
d) Determine o coeficiente de determinação, r 2 , e o interprete.

17 / 17

Você também pode gostar