Você está na página 1de 38

ANÁLISE DE CORRELAÇÃO E

REGRESSÃO
ANÁLISE DE CORRELAÇÃO E REGRESSÃO

1. Analise de Correlação
2. Analise de Regressão
ANÁLISE DE CORRELAÇÃO

1. Conceitos Básico
Correlação é o grau de associação entre dois ou mais
variáveis. A correlação procura explicar se as
variáveis se movem ou não em conjunto.

A correlação pode ser simples ou múltipla.

A correlação é simples quando o grau de associação é


entre duas variáveis

A correlação é múltipla quando o grau de associação


envolve mais de duas variáveis (correlação parcial).
ANÁLISE DE CORRELAÇÃO

1. Conceitos Básico

Considerando uma correlação simples entre X e Y,


podemos distinguir uma correlação positiva e
negativa.
Correlação Positiva Y
ocorre quando as duas
variáveis tendem a
mover em conjunto na
mesma direcção;
X
ANÁLISE DE CORRELAÇÃO

1. Conceitos Básico

Considerando uma correlação simples entre X e Y,


podemos distinguir uma correlação positiva e
negativa.
Correlação negativa Y
ocorre quando as duas
variáveis se movem em
direcções opostas.
X
ANÁLISE DE CORRELAÇÃO

1. Conceitos Básico

A correlação pode também ser Linear ou Não-linear.

A correlação linear ocorre Y


quando os pares de
observações de X e Y, num
diagrama de dispersão,
caem à volta da linha recta
X
ANÁLISE DE CORRELAÇÃO

1. Conceitos Básico

A correlação pode também ser Linear ou Não-linear.

A correlação não-linear
ocorre quando os pares de
Y
observações de X e Y, num
diagrama de dispersão,
caem sobre uma linha não-
linear..
X
.
ANÁLISE DE CORRELAÇÃO

1. Conceitos Básico

A correlação pode ser classificada como perfeita ou


menos perfeita.
A correlação é perfeita Y
quando todos os pares de
observações, num gráfico
de dispersão, caem sobre
uma linha recta ou não-
X
linear
ANÁLISE DE CORRELAÇÃO

1. Conceitos Básico

A correlação pode ser classificada como perfeita ou


menos perfeita.
A correlação menos Y
perfeita é aquela em que os
pares de observações, num
diagrama de dispersão,
caem à volta da linha recta
X
ou não-linear.
ANÁLISE DE CORRELAÇÃO

2. Medidas de Correlação Linear

A correlação linear simples pode ser medida de duas


maneiras: Por meio do gráfico, ou através do parâmetro
conhecido como Coeficiente de Correlação linear de
Pearson e denota-se por rxy

n X iYi   X i  Y
rxy 
n X i
2 2

  X i  n Yi 2   Yi 
2

n X iYi   X i  Y
 xy 
 2  2
n X i   X i   n Yi   Yi  
2 2
   
ANÁLISE DE CORRELAÇÃO

2. Medidas de Correlação Linear

Outras expressões equivalente e simples em termos


práticos são

 X i  X *  Yi  Y  
rxy  n

  i  
  X  X 2   X  Y
i   
2

 n  n 
  
  
 X i  X *  Yi  Y 
 xy  N
  
  X i  X 2   X i  Y
   
2

 N  N 
  
ANÁLISE DE CORRELAÇÃO

3. Propriedades do Coeficiente de Correlação

•O coeficiente de correlação pode ser positivo


ou negativo, isto é, (-1 ≤ ρxy ≤ 1);
• ρxy = -1 Correlação negativa perfeita
• ρxy = +1 Correlação positiva perfeita
• ρxy = 0 não há correlação
ANÁLISE DE CORRELAÇÃO

2. Exemplo: Considere o quadro abaixo contendo dados


sobre despesas de consumo e rendimento pessoal (em
103 MT);

Consumo (Yi) 5.5 6.5 7.0 8.0 7.9 8.4 9.8 9.5 9.0 7.5
Renda Pessoal
8.0 10.0 8.5 11.0 12.0 11.5 13.0 14.0 12.5 9.0
(Xi)

a) Calcule o coeficiente de correlação linear de Pearson


e interprete o resultado;
ANÁLISE DE CORRELAÇÃO

2. Calculo do Coeficiente de Correlacao linear de


Pearson
Consumo
Renda (Xi) Yi2 Xi2 Xi*Yi
(Yi)
5.5 8.0 30.3 64.0 44.0
6.5 10.0 42.3 100.0 65.0
7.0 8.5 49.0 72.3 59.5
8.0 11.0 64.0 121.0 88.0
7.9 12.0 62.4 144.0 94.8
8.4 11.5 70.6 132.3 96.6
9.8 13.0 96.0 169.0 127.4
9.5 14.0 90.3 196.0 133.0
9.0 12.5 81.0 156.3 112.5
7.5 9.0 56.3 81.0 67.5
∑Y = 79.1 ∑X = 109.5 ∑Y2 = 642.01 ∑X2 = 1235.75 ∑XY = 888.3
ANÁLISE DE CORRELAÇÃO

2. Calculo do Coeficiente de Correlação linear de


Pearson;
n X iYi   X i  Y
rxy 
n X i
2 2

  X i  n Yi 2   Yi 
2

10 * 888.3  79.1*109.5
rxy   0.9047
10 * 642.01  79.1 10 *1235.5  109.5 
2 2

Interpretacao: Existe um correlação positiva entre as


despesas de consumo e rendimento e a correlação é
muito forte;
ANÁLISE DE CORRELAÇÃO

2. Calculo do Coeficiente de Correlação linear de


Pearson utilizando outras formulas
Consumo
Renda (Xi) (Yi-Ym) (Xi-Xm) (Xi-Xm)*(Yi-Ym) (Yi-Ym)2 (Xi-Xm)2
(Yi)
5.5 8.0 -2.4 -3.0 7.1 5.8 8.7
6.5 10.0 -1.4 -0.9 1.3 2.0 0.9
7.0 8.5 -0.9 -2.5 2.2 0.8 6.0
8.0 11.0 0.1 0.1 0.0 0.0 0.0
7.9 12.0 0.0 1.1 0.0 0.0 1.1
8.4 11.5 0.5 0.6 0.3 0.2 0.3
9.8 13.0 1.9 2.1 3.9 3.6 4.2
9.5 14.0 1.6 3.1 4.8 2.5 9.3
9.0 12.5 1.1 1.6 1.7 1.2 2.4
7.5 9.0 -0.4 -2.0 0.8 0.2 3.8

∑Y = 79.1 ∑X = 109.5 ∑(Xi-Xm)*(Yi-Ym) = 22.2 ∑(Yi-Ym)2 = 16.3 ∑(Xi-Xm)2 = 36.7


ANÁLISE DE CORRELAÇÃO

2. Forma diferente de cálculo do Coeficiente de


Correlação linear de Pearson
 
 X i  X * Yi  Y 
rxy  n 1
  
  X i  X 2   X i  Y
   
2

 n  1  n  1 
  

22.2
rxy  10  1  0.9047
 36.7  16.3 
  
 10  1  10  1 
ANÁLISE DE REGRESSÃO

A analise de regressão

A analise de regressão é uma ferramenta estatística usada para


estudar as relações entre uma variável dependente ou
explicada, ou endógena ou ainda variável resposta, sobre uma
ou mais variáveis chamadas de variáveis independentes,
explicativas, exógenas ou ainda impulso;

A regressão pode ser simples, se envolve uma variável


independente

Yt  a  bX t   t
ANÁLISE DE REGRESSÃO

Linha de regressão simples

^ ^ ^
Yi  a  b X i
^
Yi = valor estimado de Y para cada valor de X dado
^
a = intercepto
^
b = Coeficiente de inclinação (variação media em Y
para cada variação de 1 unidade em X)
ANÁLISE DE REGRESSÃO

Método dos Minimos Quadrados Ordinarios

Yt  a  bX t   t
^ ^ ^
Sendo Yi  a  b X i e

^ ^ ^
Então, Y  Yi  Y  a  b X i   i

Que significa que os resíduos são simplesmente a


diferença entre os valores actuais e os estimados de Y.
Segue que, a melhor forma de estimar a função de
regressão populacional (FRP), é escolher a e b de tal
^ ^

forma que os resíduos sejam o mínimo possível.


ANÁLISE DE REGRESSÃO

Método dos Minimos Quadrados Ordinarios

Assim, o MQO minimiza o somatório do quadrado dos


resíduos (ε) sujeitos as constantes a e b
^ ^

 ^
min     Y  a  b X
2
t
^

2 ^
sujeito a e b
^
ANÁLISE DE REGRESSÃO

Passos para estimar os coeficientes da regressão

1º Passo: Definição da relação populacional (FRP):


Yt  a  bX t   t
2º Passo: Definição da relação amostral a estimar (FRA):
^ ^ ^
Y  ab X

3º Passo: Determinação dos resíduos:


^ ^ ^
 t  Yt  Yt  Yt  a  b X t
ANÁLISE DE REGRESSÃO

Passos para estimar os coeficientes da regressão

4º Passo: Elevação ao quadrado dos resíduos:

 ^ ^
 t2  Yt  a  b X t 
2

5º Passo: Soma do quadrado dos desvios:

 ^
    Yt  a  b X t
t
2
^

2
ANÁLISE DE REGRESSÃO
^ ^

6º Passo: Minimize   com respeito a


2
a e b

 
t

^ ^ 2
min     Y  a  b X
2
t

obtendo assim um sistema de duas equações e duas


incógnitas.
:
b  X t  a  X t   X tYt
^ ^
2

^ ^
b  X t  n a   Yt
ANALISE DE REGRESSÃO

^ ^

7º Passo: Resolve o sistema de equações em relação a a e b

^ ^
a Y b X

^ n  XY   X  Y
b
n X  ( X )
2 2
ANALISE DE REGRESSÃO

Exemplo: Com base nos dados sobre despesas de


consumo e renda pesssoal ambos medidos em u.m.,
ajuste a linha de regressão
^ ^ ^
Y  ab X
ANALISE DE REGRESSÃO

Exemplo: Cálculo dos coeficientes da regressão

Consumo
Renda (Xi) Xi2 Xi*Yi
(Yi)
^ ^
a Y b X
5.5 8.0 64.0 44.0
6.5 10.0 100.0 65.0
7.0 8.5 72.3 59.5
8.0 11.0 121.0 88.0
7.9 12.0 144.0 94.8
8.4 11.5 132.3 96.6
^ n  XY   X  Y
b
9.8 13.0 169.0 127.4
9.5 14.0 196.0 133.0
n X  ( X )
2 2
9.0 12.5 156.3 112.5
7.5 9.0 81.0 67.5
 ∑Y = 79.1  ∑X = 109.5  ∑X2 = 1235.75  ∑XY = 888.3
ANALISE DE REGRESSÃO

Exemplo: Cálculo dos coeficientes da regressão


^ n  XY   X  Y
b
n X  ( X )
2 2

^ 10 * 888.3  79.1*109.5
b  0.603268
10 *1235.75  (109.5) 2
ANALISE DE REGRESSÃO

Exemplo: Cálculo dos coeficientes da regressão


^ ^
a Y b X
 X 109.5  Y 79.1
X   10.95 Y   7.91
n 10 n 10

^
a  7.91  0.630268*10.91  1.304
ANALISE DE REGRESSÃO

^
Y  1.304  0.6033X
Interpretacao dos resultados:

Coeficiente de inclinação de 0.6033 significa que: se a


renda pessoal aumenta em 103 MT, o consumo
auementa em 0.6033 x103 MT

O coeficiente intercepto de 1.304 significa o consumo


medio em 103 MT quando a renda pessoal for igual a
zero. Por outras palavras, é o consumo autonomo ou o
consumo médio que não depende do rendimento.
ANALISE DE REGRESSÃO

Coeficiente de Determinação (r2)

Ee uma medida estatistica que mede o grau de ajuste da


linha de regressão aos dados; Representa a proporção da
variação na variavel dependente explicada pela(s)
variavel(is) independentes;
2 ^ 2
 ^

 Y  Y   
 Y  Y 
r 
2   r  1
2  
   
2
ou 2
 Y Y  Y Y
ANALISE DE REGRESSÃO

Y  Y 
2
^   Y   ^  2
^
2
Xi2 Y
  Y  Y 
Consumo (Yi) Renda (Xi) Xi*Yi
Y 
5.5 8.0 64.0 44.0 6.130 3.167 0.397 5.808
6.5 10.0 100.0 65.0 7.337 0.328 0.701 1.988
7.0 8.5 72.3 59.5 6.432 2.184 0.323 0.828
8.0 11.0 121.0 88.0 7.940 0.001 0.004 0.008
7.9 12.0 144.0 94.8 8.544 0.401 0.414 0.000
8.4 11.5 132.3 96.6 8.242 0.110 0.025 0.240
9.8 13.0 169.0 127.4 9.147 1.530 0.427 3.572
9.5 14.0 196.0 133.0 9.750 3.386 0.063 2.528
9.0 12.5 156.3 112.5 8.845 0.875 0.024 1.188
7.5 9.0 81.0 67.5 6.734 1.384 0.587 0.168

79.1 109.5 1235.8 888.3 79.101 13.367 2.964 16.329


ANALISE DE REGRESSÃO

2
 ^
 
  Y  13.367
Y
r 
2     0.8185
 
 Y Y
2
16.329

^ 2
 
 Y  Y 
r  1
2    1
2.964
 0.8185
 
 Y Y
2
16.329
ANALISE DE REGRESSÃO

Coeficiente de Determinação (r2)

Numa regressão simples, a coeficiente de determinação


pode ser estimado como o quadrado do coeficiente de
correlação de Pearson.

r  rxy 
2 2
ANALISE DE REGRESSÃO

Coeficiente de Determinação (r2)

10 * 888.3  79.1*109.5
rxy   0.9047
10 * 642.01  79.1 10 *1235.5  109.5 
2 2

r  0.9047  0.8185
2 2

Interpretação: Cerca de 81.85% das variações no


consumo são explicadas pela renda e os restantes
18.15% são devidas a outros factores não incluidos no
modelo de regressão;
ANÁLISE DE REGRESSÃO

Previsão com a Recta de Regressão

Uma das utilidade mais importantes e mais comuns da


recta de regressão é prever o comportamento da variável
dependente com base em valores conhecidos da variável
independente.

Assim, com base no exemplo anterior podemos prever


o consumo se a renda for, por exemplo, de 15 mil MT
^
Y  1.304  0.6033*15  10.3535x10 MT
3
ANÁLISE DE REGRESSÃO

Análise de Variância
Tabela de Análise de Variância (ANOVA)
A técnica dos mínimos
Fontes de Variação gl SQ SQM
quadrados permite
também decompor as  ^  Y 
2

Y
Variações Totais pelas Regressão k-1
 ^  Y 
2  
Y k 1
suas componentes ou  
Fontes de variação 2
 Y  ^ 
numa Tabela, 2 Y
Erros n-k  Y  ^   
Y
conhecida como   nk
Análise de Variância
(ANOVA)
Total n-1 Y  Y  2
ANÁLISE DE REGRESSÃO

Tabela de Análise de Variância (ANOVA)

Fontes de Variação gl SQ SQM

Regressão 1 13.3654 13.36539

Erros 8 2.96361 0.370451

Total 9 16.329 -

Você também pode gostar