Você está na página 1de 24

CAPÍTULO 15

2. Regressão Linear Simples


e Correlação

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


2.1.1 Objectivos
• Determinar a equação de regressão dos
mínimos quadrados.

• Determinar e interpretar o valor do:


– Coeficiente de correlação.
– Coeficiente de determinação.

• Realizar testes de hipóteses envolvendo a


inclinação da linha de regressão.

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


Palavras-chave
• Relações directa e • Coeficiente de
inversa correlação
• Modelo de regressão dos • Coeficiente de
mínimos quadrados determinação
• Ponto da estimativa
usando o modelo de
regressão

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


Conceito-chave
A Análise de Regressão gera um
“melhor ajustamento” da equação
matemática que pode ser usada na
previsão do valor da variável
dependente como uma função da
variável independente.

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


Relações Directa e Inversa
 Relação Directa:
– y aumenta assim que x aumenta.
– O gráfico do modelo cresce da esquerda para a
direita.
– A inclinação do modelo linear é positiva.
• Relação Inversa:
– y diminui assim que x aumenta.
– O gráfico do modelo cai da esquerda para a
direita.
– A inclinação do modelo linear é negativa.

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


2.1.2 O Modelo de Regressão Linear Simples

Modelo da População:

• yi = 0 + 1xi +i

onde yi = valor da variável dependente, y


xi = valor da variável independente, x
0 = intercepto-y da linha regressão
1 = inclinação da linha de regressão
i = Error aleatório, resíduo

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


Valor Esperado de y, E(y)

 Para qualquer valor dado de x, E(y) é


dado por uma equação linear  y , x   0  1 x
(que é a média de y dado um valor
esperado de x).

 A diferença entre o valor real de y e o


valor esperado de y é o erro, ou resíduo.
 i  yi  (  0  1 xi )
Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.
Estimação da Regressão Linear Simples

• Modelo de Regressão da Amostra:



i
 b0  b1 xi ,
onde
ŷ = valor previsto de y (ao contrário do valor
real de y).

b0   0 , b1  1

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


Determinação dos Mínimos
Quadrados da Linha de Regressão
• Mínimos Quadrados da Linha Regressão:
yˆ  b0  b1x1

– Inclinação
( x y ) – n x  y
b  i i
1 ( x 2 ) – n x 2
i
– Intercepto-y
b0  y – b1x

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


O Critério dos Mínimos Quadrados

 O critério dos MQ requer que seja


minimizada a soma dos desvios ao
quadrado entre valores de y no
diagrama de dispersão e valores de y
previstos pela equação.

n

min  ( yi  yi ) 2

i 1

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


Regressão Linear Simples: Exemplo
• Problema 15.9:
Para uma amostra de 8 trabalhadores, um director do
pessoal recolheu os seguintes dados sobre a propriedade
das acções da empresa, y, e anos com a empresa, x.
x 6 12 14 6 9 13 15 9
y 300 408 560 252 288 650 630 522
a. Determine os mínimos quadrados da linha de regressão
e interprete a sua inclinação.
b. Para um trabalhador que esteve 10 anos com a empresa,
qual é o número previsto de propriedade de acções?

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


Exemplo, cont.
x y x•y x2
6 300 1800 36
12 408 4896 144
14 560 7840 196
6 252 1512 36
9 288 2592 81
13 650 8450 169
15 630 9450 225
9 522 4698 81
Média: 10.5 451.25
Soma: 41,238 968

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


Exemplo, cont.
• Inclinação:
( x y ) – nx y 41238 – 8(10.5)(451.25)
b  i i   38.7558
1 ( x 2 ) – nx 2 2
i 968  8(10.5)

• Intercepto-y:
b  y – b x  451.25 – (38.7558)(10.5)  44.3140
0 1

Assim, o “melhor ajustamento” do modelo


linear, aredondado a uma casa decimal, é :
yˆ  44.3140  38.7558 x  44.3  38.8x

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


Exemplo, cont.
• Interpretação da inclinação: Para todo o
ano adicional que um trabalhador trabalha
para a empresa, ele adquire quotas
estimadas em 38.8 por ano.
b. Se x1 = 10, o ponto de estimação do número de
acções que este trabalhador possui é :
yˆ  44.314  38.7558 x
 44.314  38.7558(10)
 431.872  432 acções

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


2.1.3 Análise de Correlação

 Coeficiente de Correlação

 Coeficiente de Determinação

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


Coeficiente de Correlação

r
  x  x  y  y 
i i

 x  x  y  y 
2 2
i i

n x y   x  y
i i i i
 
n x   x   n y   y   2 2

  2
i  i   
2
i i

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


Coeficiente de Correlação (cont.)
Uma medida da:

– Direcção da relação linear entre x e y.


» Se x e y forem directamente relacionados, r > 0.
» Se x e y forem inversamente relacionados, r < 0.

– Força da relação linear entre x and y.


» Quanto maior for o valor absoluto de r, maior será o
valor de y que depende de uma maneira linear do
valor de x.

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


(ii) Coeficiente de Determinação

 A proporção da variação de y que é


explicada pela equação de regressão
simples dada por:
(y y) SSE 2

R  (r )2
2
ou R 1
2 i
 1 i

 ( y  y) SST 2

ou ainda
(y  y ) SSR
2

R  2 i

 ( y  y)
2
SST

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


Coeficiente de Determinação (Cont.)
• Uma medida da
– Força da relação linear entre x e y.
» Quanto maior for o valor absoluto de R2, maior
será o valor de y que depende de uma maneira
linear do valor de x.
– Montante da variação do y que está
relacionada com a variação do x.
– Rácio da variação do y que é explicada pelo
modelo de regressão dividido pela variação
total do y.

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


2.1.4 Estimação e Testes em Relação à
Linha de Regressão da Amostra
Argumento-chave:
• Se o valor de y não muda linearmente com o valor
de x, então o valor médio de y é o melhor
prognosticador do valor real de y. Isto implica que
y  y é preferível.

• Se o valor de y muda linearlmente com o valor de x,


então usando o modelo de regressão dá uma
melhor previsão do valor de y do que usando a
média de y. Isto implica que y  yˆ é preferível.

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


Três Testes de Linearidade
• (i) Teste do Coeficiente de Correlação
H0:  = 0 Não há nenhuma relação linear entre x e y.
H1:   0 Há uma relação linear entre x e y.
t  r
Teste Estatístico:
1 – r2
n– 2
• (ii) Teste da Inclinação da Linha de Regressão
H0:  = 0 Não há nenhuma relação linear entre x e y.
H1:   0 Há uma relação linear entre x e y.
b
ts 1
Teste Estatístico: y, x
 x2  n( x )2

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


O Erro-padrão da Estimativa, sy,x
– O desvio-padrão da distribuição dos:
» Pontos dos dados acima e abaixo da linha de
regressão ,
» distâncias entre os valores reais e previstos de
y,
» resíduos, de 
– A raíz quadrada de MSE dada pela
ANOVA.
 ( yi – yˆ )2
s y,x 
n–2

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


Três Testes de Linearidade (cont.)
• (iii) O Teste F de Significância Global
H0: Não há nenhuma relação linear entre x e y.
H1: Há uma relação linear entre x e y.
SSR
Teste Estatístico: F  MSR  1
MSE SSE
(n – 2)

Nota: Ao nível da regressão linear simples, o Teste F de


significância global é equivalente ao test t sobre 1. Quando
nós conduzimos a análise de regressão de variáveis
múltiplas, o test F de significância global tomará uma função
única.

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.


FIM

Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Você também pode gostar