Escolar Documentos
Profissional Documentos
Cultura Documentos
10
11
12
Peso (Y)
64
71
53
67
55
58
77
57
56
51
76
68
Altura (X1)
57
59
49
62
51
50
55
48
42
42
61
57
Idade (X2)
10
11
10
10
12
Modelo
Y 0 1 X 1 2 X 2 ... k X k
As constantes: 0, 1, 2, ..., k, so os parmetros populacionais.
^
0, 1, 2,..., k
Y 0 1 X 2 X 2
Y 0 1 X 1 2 X 2
(Y i Y i )
2
I 1
^
^
^
^
n
2
(Yi ( X 1i X 2i ... X ki )
0
1
2
k
i 1
^
i Y i Y i Y i ( 0 X 1i 2 X 2i ... k X ki )
1
Ou
Y 0 1 X 1 2 X 2 ... k X k
2
Y / X 1 X 2 X k
Var (Y / X 1 X 2 X k ) 2
Este
pressuposto
pode
parecer
muito
restritivo.
Heterocedasticidade deve ser considerada somente quando os
dados apresentarem bvia e significante no homogeneidade das
varincias.
Em geral, no considerar a homocedasticidade no acarreta efeitos
adversos nos resultados.
5. Amostra aleatria ou representativa da populao.
Y | X X X
1
Ou de modo equivalente
~N (0, 2)
, 2 )
Y / X 1 X 2 X k ~ N (
2
,
)
Y / X ,X ...,X
1
X X
1
(Y i Y i ) (Y i (
I 1
I 1
X 1i
X 2i
2
))
pi
i (Y i Y i) Y i ( 0 1 X 1i 2 X 2i p X pi)
0 , 1, 2 ,..., k
uma funo
Exemplo:
Supondo dados de peso, altura e idade de 12 crianas:
Criana
10
11
12
Peso (Y)
64
71
53
67
55
58
77
57
56
51
76
68
Altura (X1)
57
59
49
62
51
50
55
48
42
42
61
57
Idade (X2)
10
11
10
10
12
2
PESO 0 1 ALTURA 2 IDADE 3 (IDADE )
^
2
PESO 3.438 0.724 ALTURA 2.777 IDADE 0.042( IDADE )
3 0.042
X Z Peso1 - Peso2
.Sx/Sy
Y1 0 1 X 1 2 X 2
Y2 0 1 ( X 1 S X 1 ) 2 X 2
Y2 Y1 0 1 ( X 1 S X 1 ) 2 X 2 ( 0 1 X 1 2 X 2 )
Y2 Y1 1 ( X 1 S X 1 X 1 )
Y2 Y1 1S X 1
Y2 Y1 1
S X1
SY
padronizado
2
2
2
(
Y
Y
)
(
Y
Y
)
(
Y
Y
)
i
i
i i
i 1
i 1
i 1
R2 = (SSY-SSE)/SSY
R2 sempre cresce medida que mais variveis so includas no
modelo.
Um acrscimo muito pequeno em R2 pode no apresentar
3
.
438
0
.
724
ALTURA
2
.
777
IDADE
0
.
042
(
IDADE
)
PESO
Fonte
g.l.
R2
231.02
9.47
0.7802
24.40
P = 0.0052
SS
MS
soma dos
quadrados
quadrados
mdios
k=3
SSY-SSE=693.06
Resduo
n-k-1=8
SSE=195.19
Total
n-1=11
SSY=888.25
de variao
Regresso
SSR
R
SSY
2
Fcrtico = Fk,n-k-1,1-
MSR
F
MSE SSE
SSR
( n k 1)
SSY-SSE
Source
Model
Error
C Total1
DF
1
28
29
SSY
SSE
Y X Y X
Yi X i
n
Prob > F
0.0001
SSY SSE (Y i Y) [ X i Y ] [ ( X i X )]
2
1 gl
i 1
i 1
SSY ( Y i Y) 2
i 1
n 1 gl Y
n 2 gl e
DF
1
10
11
SSY
Sum of
Squares
588.9225231
299.3274768
888.2500000
SSR=
SSY-SSE
Prob > F
0.0013
SSE
C.V.
8.718857
R-square
0.663014
R2
Parameter Estimates
Variable
Parameter
Estimate
INTERCEPT
ALTURA
6.189848707
1.072230356
^
0
T for H0:
Parameter=0
0.48
4.44
Prob >
|T|
0.6404
0.0013
Standard
Error OS
Estimate
12.84874620
0.24173098
^
1
DF
1
10
11
Sum of
Squares
526.39285714
361.85714286
888.25000000
F Value
14.55
C.V.
9.586385
Prob > F
0.0034
R-square
0.592618
Parameter Estimates
Variable
Parameter
Estimate
INTERCEPT
IDADE
30.57142857
3.64285714
T for H0:
Parameter=0
3.55
3.81
Prob >
|T|
0.0053
0.0034
Standard
Error OS
Estimate
8.61370526
0.95511512
DF
2
9
11
Sum of
Squares
692.82260654
195.42739346
888.25000000
F Value
15.95
C.V.
7.426048
Prob > F
0.0011
R-square
0.779986
Parameter Estimates
Variable
Parameter
Estimate
INTERCEPT
ALTURA
IDADE
6.553048251
0.722037958
2.050126352
T for H0:
Parameter=0
0.60
2.77
2.19
Prob >
|T|
0.5641
0.0218
0.0565
Standard
Error OS
Estimate
10.94482708
0.26080506
0.93722561
DF
3
8
11
Sum of
Squares
693.06046340
195.18953660
888.25000000
F Value
9.47
C.V.
7.871718
Prob > F
0.0052
R-square
0.780254
Parameter Estimates
Variable
Parameter
Estimate
INTERCEPT
ALTURA
IDADE
(IDADE)2
3.438426001
0.723690241
2.776874563
-0.041706699
T for H0:
Parameter=0
0.10
2.61
0.37
-0.10
Prob >
|T|
0.9210
0.0310
0.7182
0.9238
Standard
Error OS
Estimate
33.61081984
0.27696316
7.42727877
0.42240715
H0 :
MS = SS/graus de liberdade
Fcrtico=Fnumerador, denominador, 1-nvel de significncia do teste
Y 0 1 X 1 2 X 2 ... k X k
A hiptese nula para este teste: "Todas as k variveis
independentes consideradas conjuntamente no explicam
significativa quantidade de variao de Y
H0: 1 = 2 = ... = k = 0
H1: ao menos 1 0 (pelo menos 1 varivel contribui
significativamente para a predio de Y)
Sob a hiptese H0, o modelo completo pode ser resumido ao
intercepto 0
Se uma varivel auxiliar na predio (determinado 0), H0
rejeitada mesmo que os outros 's sejam = 0.
Soma dos
quadrados
Graus de
liberdade
SS
n
i 1
Resduo
SSE
^
(Yi Yi ) 2
n-k-1
i 1
Total
SSY
Estatstica F
Valor p
MS
Quadrados
mdios
(Yi Y )2
MSR
MSE
SSR
k
MSR
MSE
SSE
n k 1
n-1
i 1
MS Resduo
SSE /( n k 1)
SSY (Yi Y ) 2
i 1
n
SS (Yi Y i ) 2
i 1
MSE SSE
(n k 1)
nvel de significncia.
H0 rejeitada se o valor calculado exceder o valor crtico.
F pode ser escrito em funo de R2.
SSY SSE
SSY
(1 R )
2
( n k 1)
R 2 .SSY
( SSY SSE )
R2
MSR
k
k
k
F
SSY R 2 .SSY (1 R 2 )
MSE SSE
( n k 1)
(n k 1)
(n k 1)
R2
R2
2. O teste F parcial
A partir da tabela ANOVA, informao adicional pode ser obtida
com respeito ao ganho na predio pela incluso de variveis
independentes.
X1 = ALTURA , X2 = IDADE , X3 = (IDADE)2
1. X1 = ALTURA sozinha prediz Y?
2. A incluso de X2 = IDADE contribui significativamente para a
predio de Y, aps considerar (ou controlar por) X1?
3. A incluso de X3 - (IDADE)2 - contribui significativamente para a
predio de Y, aps controlar por X1 e X2?
SS(X1) soma dos quadrados explicada por somente X1 para
predio de Y.
SS(X2|X1) soma dos quadrados explicada extra pela incluso de
X2 em adio X1 para predio de Y.
SS(X |X ,X ) soma dos quadrados explicada extra pela incluso
FIXO
Y
SSE2
Y 0 1 X 1 2 X 2
^
Y 0 1 X 1
SSY
SSE1
SSR2
SSR1
SSR1,2
X
x1
Fonte
X1
X1 e X2
X1, X2 e X3
SSR
588.92
692.82
693.06
SSE
299.33
195.43
195.19
SSY
888.25
888.25
888.25
SS(X1) = 588.92
SS(X2|X1) = SSR (X2|X1) = 692.82 - 588.92 = 103.90 --- SSE (X2|X1) = 299.33-195.43 = 103.43
SS(X3|X1,X2) = SSR (X3|X1,X2) = 693.06 - 692.82 = 0.24 --- SSE (X3|X1,X2) = 195.43-195.19 = 0.24
588.92 SSR do modelo linear simples e SSE = 299.33 (103.90+0.24+195.19) 10 (8+1+1) g.l.
103.90+0.24+195.19 = 299.33
299.33
n-k-1
588/(299.33/10)
d.f.
SS
MS
R2
X1
588.92
588.92
19.67
0.7802
X2|X1
103.90
103.90
4.78
(0.05<P<0.10)
X3|X1,X2
0.24
0.24
0.01
Resduo
195.19
24.40
Total
11
888.25
Source
Regresso
F=103.9/1 / (195.19+0.24)/9
12-k-1
Fonte
X1
X1 e X2
X1, X2 e X3
SSR
588.92
692.82
693.06
SSE
299.33
195.43
195.19
SSY
888.25
888.25
888.25
588.92
1 19.67
299.33 / 10
n-k-1
588/(299.33/10)
d.f.
SS
MS
R2
X1
588.92
588.92
19.67
0.7802
X2|X1
103.90
103.90
4.78
(0.05<P<0.10)
X3|X1,X2
0.24
0.24
0.01
Resduo
195.19
24.40
Total
11
888.25
Source
Regresso
Fonte
X1
X1 e X2
X1, X2 e X3
SSR
588.92
692.82
693.06
SSE
299.33
195.43
195.19
SSY
888.25
888.25
888.25
SSE (completo)
(n - p - 2)
n-(p+1)-1
9 g.l.
103.90
103.90 103.90
4.78
(195.19 0.24)
195.43
21.71
9
(12 1 2)
n- k-1 = p+1
195.43
X1
X2|X1
X3|X1,X2
F=103.9/1 / (195.19+0.24)/9
12-k-1
Fonte
X1
X1 e X2
X1, X2 e X3
SSR
588.92
692.82
693.06
SSE
299.33
195.43
195.19
SSY
888.25
888.25
888.25
SS(X3|X1,X2) = SSR (X3|X1,X2) = 693.06 - 692.82 = 0.24 --- SSE (X3|X1,X2) = 195.43-195.19 = 0.24
SSE (completo)
0.24
195.19
(n - p - 2)
n-k-1 p+1
8 g.l.
X1
X2|X1
X3|X1,X2
195.19
(12 2 2)
0.24
0.0098
24.40
O procedimento do teste
Para realizar o teste F parcial, deve-se computar a soma dos
quadrados extra pela adiao de X*, que aparece na tabela ANOVA
como SSR X*| X1, X2,...,Xp
reduzido
completo
Soma dos quadrados
Extra
pela incluso de X*,
dados
X1, X2,...,Xp
dados
X1, X2,...,Xp
OuSS
mais
compactadamente:
(X*| X , X ,...,X ) = SS Regresso (X , X ,...,X , X*) - SS Regresso (X , X ,...,X )
1
Como
SSY = SSR + SSE, podemos tambm fazer:
SS (X*| X , X ,...,X ) = SS Resduo (X , X ,...,X ) - SS Resduo (X , X ,...,X , X*)
1
SS ( X * | X 1 , X 2 ,..., X p )
F ( X * | X 1 , X 2 ,..., X p )
MSE( X 1 , X 2 ,..., X p , X *)
MSE( X 1 , X 2 ,..., X p , X *)
(n - p - 2)
n-k-1
MSE( X 1 , X 2 ,..., X p , X *)
(n - p - 2)
F ( X 2 | X1)
SSE (completo)
(n - p - 2)
103.90
103.90 103.90
4.78
(195.19 0.24)
195.43
21.71
9
(12 1 2)
SSE (completo)
0.24
195.19
(n - p - 2)
(12 2 2)
no rejeita H0
F1,9,0.90 = 3.36
0.24
0.0098
24.40
Hiptese nula
Modelo completo:
Y = 0 + 1X1 + 2X2 +...+ pXp + *1X*1 + *2X*2 +...+ *kX*k +
Modelo reduzido: Y = 0 + 1X1 + 2X2 +...+ pXp +
H0: "X*1 , X*2 , ..., X*k NO melhoram significativamente a predio
de Y.
H0: *1 = *2 = ... = *k = 0
O procedimento
Necessitamos calcular a soma dos quadrados EXTRA devida
incluso dos X*i do modelo completo.
SS(X*1, X*2, ..., X*k|X1, X2, ..., Xp) =
SS Regresso (X1, X2, ..., Xp, X*1, X*2, ..., X*k)
parmetros
A estatstica F:
*
*
*
SS
(
X
,
X
,...,
X
1
2
k | X 1 , X 2 ,..., X p )/k
F ( X 1* , X 2* ,..., X k* | X 1 , X 2 ,..., X p )
MS Resduo ( X 1 , X 2 ,..., X p , X 1* , X 2* ,..., X k* )
F ( X 1* , X 2* ,..., X k* | X 1 , X 2 ,..., X p )
F ( X 1* , X 2* ,..., X k* | X 1 , X 2 ,..., X p )
A estatstica F:
[SS Regresso(completo) - SS Regresso(reduzido) ]/k
F ( X , X ,..., X | X 1 , X 2 ,..., X p )
SS Resduo (completo)/(n - p - k - 1)
*
1
*
2
*
k
Exemplo:
Incluso de idade no modelo que j tem ALTURA IDADE e IDADE2.
no rejeita H
195.43 - 195.19
0.010
24.399
F calculado < F crtico --> NO rejeita H0 --> (IDADE) 2 no contribui para a
predio de PESO.
DF
1
10
11
Sum of
Squares
588.9225231
299.3274768
888.2500000
0.663014
Mean
Square
588.9225231
29.93274768
F Value
Prob > F
DF
2
9
11
rY2, X | X
1
Sum of
Squares
692.82260654
195.42739346
888.25000000
0.77999
Mean
Square
346.4113
21.714154
F Value
0.347
SSE ( X 1 )
299.3275
Prob > F
Simples
Y = 0 + 1X1 +
H0: 1 = 0
H1: 1 0
Mltipla
Parcial
Parcial mltipla
Modelo completo:
Y=0 + 1X1 +...+ kXk + Modelo completo:
Y=0 +
Y=0 +1X1+...+kXk + *X* + Y=0 + 1X1 + ...+ kXk + *1X*1 +
...+ *pX*p +
Modelo reduzido:
Modelo reduzido:
Y = 0 + 1X1 + ...+ kXk +
Y=0 + 1X1 + ...+ kXk +
H0: 1 = 2 = ... = k = 0
H1: pelo menos 1 0
SSR
SSR
MSR
1
MSR
k
F
MSE SSE
MSE SSE
( n 2)
(n k 1)
Fk,n-2,1-
Fk,n-k-1,1-
H0: * = 0
H0: *1 = *2 = *p = 0
H1: pelo menos 1 * 0
H1: * 0
SSR( copleto) SSR( reduzido )
F
Fk,(n-k-2),1-
SSE (completo)
(n - k - 2)
SSE ( completo)
Fk,(n-p-k-1),1-
(n - p - k - 1)