Escolar Documentos
Profissional Documentos
Cultura Documentos
RAD1507 07 Levine13 Regressão - Linear.Simples
RAD1507 07 Levine13 Regressão - Linear.Simples
Capítulo 13
Y Y
X X
Y Y
X X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-6
Tipos de Relações
DCOVA
(continuação)
Relações fortes Relações fracas
Y Y
X X
Y Y
X X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-7
Tipos de Relações
DCOVA
(continuação)
Nenhuma relação
X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-8
Modelo de Regressão
Simples Linear
DCOVA
Coeficiente
Intercepto de inclinação Variável Erro
(população (polulação) Independente aleatório
Variável )
Yi β0 β1Xi ε i
Dependente
Y Yi β0 β1Xi ε i
Valor
Observado de Y
para Xi
εi Inclinação = β1
Valor previsto
Erro aleatório
de Y para Xi
para valor Xi
Intercepto =
β0
Xi X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-10
Equação da Regressão Simples
Linear (Linha de Previsão) DCOVA
A equação de regressão linear simples fornece
uma estimativa da linha de regressão populacional
Estimativa
(ou previsto) Estimativa da
valor Y para Estimativa do Inclinaçao
observação i Intercepto
Valor de X para
Ŷi b 0 b1X i
observação i
Os coeficientes de b0 e b1 e outros
resultados da regressão neste capítulo,
serão encontrados usando o Excel
US $ 1,000
Variável independente (X) = pés quadrados
350
300
250
200
150
100
50
0
0 500 1000 1500 2000 2500 3000
Square Feet
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
350
Inclinação
300
250
= 0.10977
200
150
100
50
Intercepto 0
= 98.248 0 500 1000 1500 2000 2500 3000
Square Feet
450
400
House Price ($1000s)
350
300
250
200
150
100
50 Não tente
0
extrapolar para
0 500 1000 1500 2000 2500 3000
Square Feet
além do alcance
de X observadas
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-25
Medidas de Variação
DCOVA
Variação total é composta de duas partes:
DCOVA
SST = soma total dos quadrados (Variação Total)
Mede a variação dos valores de Yi em torno da sua
média Y
SSR = soma dos quadrados da regressão (Variação Explicada)
Variação atribuida à relação entre X e Y
SSE = soma dos erros ao quadrados (Variação Não Explicada)
Variação em Y atribuida a outros fatores que não X
DCOVA
Y
Yi
_
SST = (Yi - Y)2
Y
_ _
Y Y
Xi X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-28
Medidas de Variação
(continuação)
DCOVA
Y
Yi
Y
Y _
_ SSR = (Yi - Y)2 _
Y Y
Xi X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-29
Medidas de Variação
(continuação)
DCOVA
Y
Yi
SSE = (Yi - Yi )2 Y
Y _
_ SSR = (Yi - Y)2 _
Y Y
Xi X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-30
Medidas de Variação
(continuação)
DCOVA
Y
Yi
SSE = (Yi - Yi )2 Y
_
SST = (Yi - Y)2
Y _
_ SSR = (Yi - Y)2 _
Y Y
Xi X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-31
Coeficiente de determinação, r2
DCOVA
O coeficiente de determinação é a porção da
variação total na variável dependente que é
explicada pela variação na variável
independente
O coeficiente de determinação também é
chamado de R-quadrado e é denotado como
SSR soma dos quadrados da regressão
r 2
SST soma total dos quadrados
nota: 0 r 1 2
X
r =1
2
X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-34
Examplos de Valores
Aproximados de r2
DCOVA
r2 = 0
Y
Sem relação linear entre X
e Y:
determinação, r2 no Excel
DCOVA
SSR 18934.9348
Regression Statistics
r2 0.58082
Multiple R 0.76211 SST 32600.5000
R Square 0.58082
Adjusted R Square 0.52842
58,08% da variação dos preços
Standard Error 41.33032
das casas é explicada pela
Observations 10
variação do tamanho das casas
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
SSE
ˆ
(Yi Yi ) 2
i 1
S YX
n2 n2
Onde,
SSE = soma dos quadrados dos erros
n = tamanho da amostra
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
baixo SYX X X
alto SYX
Linearidade
A relação entre X e Y é linear
Normalidade do Erro
Valores de erro são normalmente distribuídos para qualquer
valor dado de X
Igualdade de Variância (também chamada de homocedasticidade )
A distribuição de probabilidade dos erros tem variância
constante
x x
resíduos
x resíduos x
Não Linear
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall
Linear
13-42
Análise residual para
Independência
DCOVA
Não Independente
Independente
resíduos
resíduos
X
resíduos
Percentual
100
0
-3 -2 -1 0 1 2 3
Resíduo
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-45
Análise Residual para Igualdade
de Variâncias
DCOVA
Y Y
x x
resíduos
resíduos
x x
2 273.87671 38.12329 40
Residuals
3 284.85348 -5.853484 20
4 304.06284 3.937162
0
5 218.99284 -19.99284 0 1000 2000 3000
-20
6 268.38832 -49.38832
7 356.20251 48.79749 -40
Não parece violar
todos os pressupostos de regressão
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-47
Medição de Autocorrelação:
Estatístca de Durbin-Watson
DCOVA
15
Aqui, os resíduos 10
Residuals
5
mostram um padrão
0
cíclico, e não aleatória.
-5 0 2 4 6 8
Padrões cíclicos são -10
um sinal de auto- -15
correlação positiva Time (t)
n O intervalo possível é 0 ≤ D ≤ 4
(e e i i 1 ) 2
D deve ser próximo a 2 se H0 é
D i 2
n verdadeiro
i
e 2
i 1
D menor que 2 pode ser sinal de
autocorrelação positiva, D acima de
2 pode sinalizar autocorrelação
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall
negativa
13-50
Testes para autocorrelação
positiva
DCOVA
H0: autocorrelação positiva não existe
H1: existe autocorrelação
Calcular a Estatística de Durbin-Watson = D
(Estatítica de Durbin-Watson Statistic pode ser encontado usando Excel ou Minitab)
0 dL dU 2
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-51
Testando para autocorrelação
positiva (continuação)
DCOVA
Suponha que temos os seguintes dados de
séries temporais:
160
140
120
100
Sales
80 y = 30.65 + 4.7038x
2
60 R = 0.8976
40
20
0
0 5 10 15 20 25 30
Tim e
Existe autocorrelação?
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-52
Testando para autocorrelação
(continuação)
positiva
DCOVA
160
Examplo com n = 25: 140
120
Saída Excel/PHStat:
100
Durbin-Watson Calculations
Sales
80 y = 30.65 + 4.7038x
2
60 R = 0.8976
Soma de diferença de
quadrados dos resíduos 3296.18 40
residuais 3279.98 0
0 5 10 15 20 25 30
Estatística Durbin- Tim e
Watson 1.00494
i i1
(e e ) 2
3296.18
D i 2
n
1.00494
3279.98
ei
2
i1
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-53
Testando para autocorrelação
positiva (continuação)
DCOVA
Aqui, n = 25, e há k = 1 uma variável independente
S YX S YX
Sb1
SSX i
(X X ) 2
onde:
S=bEstimativa
1
do erro padrão da inclinação
SSE
S YX = Erro padrão da estimativa
n2
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-55
Inferências sobre a Inclinação:
Teste t
DCOVA
teste t para a inclinação da população
Há uma relação linear entre X e Y?
Hipóteses nula e alternativa
H0: β1 = 0 (não há relação linear)
H1: β1 ≠ 0 (existe relação linear)
Estatística Teste ONDE:
b1 β1
t STAT b1 = inclinação
Sb β1 = hipótese para
1 inclinação
b1 Sb1
b1 β 1 0.10977 0
t STAT 3.32938
Sb 0.03297
1
d.f. = 10- 2 = 8
a/2=.025 a/2=.025
Decisão: Rejeita H0
Há evidências suficientes de
Rejeita H0
-tα/2
Não rejeita H0
tα/2
Rejeita H0 que a metragem quadrada
0
-2.3060 2.3060 3.329 afeta preço de casa.
onde SSR
MSR
k
SSE
MSE
n k 1
onde FSTAT segue uma distribuição F com numerador k e (n - k - 1)
graus de liberdade do denominador
Estatística de regressão
Multiple R 0.76211
MSR 18934.9348
R Square 0.58082
FSTAT 11.0848
Adjusted R
Square 0.52842
MSE 1708.1957
Standard Error 41.33032
With 1 and 8 degrees p-value for
Observations 10
of freedom the F-Test
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
DCOVA
H0: β1 = 0 Estatística Teste:
H1: β1 ≠ 0 MSR
FSTAT 11.08
= .05 MSE
df1= 1 df2 = 8 Decisão:
Valor Rejeita H0 com =
Crítico:
F = 5.32
0.05
Conclusão:
= .05
Há provas suficientes de que o
0 F tamanho da casa afeta preço
Não Rejeita H0
rejeita H0
F.05 = 5.32
de venda
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-63
Intervalo de Confiança Estimado
para Inclinação
DCOVA
Estimativa de Intervalo de Confiança para Inclinação:
b1 t α / 2 S b d.f. = n - 2
1
DCOVA
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Estatística Teste
r -ρ
t STAT
(com
2 n – 2 grau de liberdade)
1 r onde
n2 r r 2 if b1 0
r r 2 if b1 0
DCOVA
Existe evidência de uma relação linear
entre os pés quadrados e preço de casa no
0,05 nível de significância?
H 0: ρ = 0 (Não há correlação)
H 1: ρ ≠ 0 (Há correlação)
=.05 , df = 10 - 2 = 8
rρ .762 0
t STAT 3.329
1 r2 1 .7622
n2 10 2
DCOVA
Y = b0+b1Xi
Intervalo de
previsão para um Y
indivíduoal, dado Xi
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall
Xi X 13-69
Intervalo de Confiança para
média Y, dado X
DCOVA
Estimativa de intervalo de Confiança para o
valor de Y, dado um determinado Xi
Intervalo de Confiança para μ Y|X X i :
Yˆ t / 2SYX hi
Tamanho do intervalo varia de
acordo com a distância da media, X
1 (X i X)2 1 (X i X)2
hi
n SSX n (X i X)2
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-70
Intervalo de previsão para um Y,
dado X
DCOVA
Estimativa de Intervalo de Confiança para um
valor individual de Y, dado um determinado
Xi
Intervalo de Confiança para YX X i :
Yˆ t / 2SYX 1 hi
1 (X i X) 2
Ŷ t 0.025S YX 317.85 37.12
n
(X i X) 2
1 (X i X) 2
Ŷ t 0.025S YX 1 317.85 102.28
n
(X i X) 2