Escolar Documentos
Profissional Documentos
Cultura Documentos
1 / 23
Introdução
Um modelo estatı́stico é constituı́do por duas partes, uma parte
modela a média de uma variável aleatória Y e a outra parte
modela a sua variância.
Yi = β0 + β1 xi + ϵi ,
12
●
e11
●
11
● ●
e10
10
e8 ●e ●
9
●
yi = β0 + β1xi + ei
Ganho de peso (y)
● e7
9
●
8
e5 e6
●
●
● e4
●
7
e3
● ● e2
6
e1 ●
●
5
5 6 7 8 9 10
3 / 23
Introdução
De fato, embora não explı́cito na equação, esse é um modelo
condicional, ou seja, para Y |X = x, se X também for uma variável
aleatória.
Assim
ϵi = Yi − E(Yi |Xi = xi )
1
n
P Média Amostral
x̄ = n xi
i=1 de X
n n
(xi − x̄)2 =
P P
SXX = (xi − x̄)xi SQ de X
i=1 i=1
1
n
P Média Amostral
Ȳ = n Yi
i=1 de Y
n n
(Yi − Ȳ )2 =
P P
SY Y = (Yi − Ȳ )Yi SQ de Y =SQTOTAL
i=1 i=1
n
P n
P Soma de produtos
SXY = (xi − x̄)(Yi − Ȳ ) = (xi − x̄)Yi
i=1 i=1 cruzados de X e Y.
7 / 23
Estimação via Mı́nimos Quadrados
8 / 23
Estimação via Mı́nimos Quadrados
Igualando a zero:
n
X n
X
nβ̂0 + β̂1 xi = Yi
i=1 i=1
n
X n
X n
X
β̂0 xi + β̂1 x2i = xi Yi
i=1 i=1 i=1
SXY
β̂0 = Ȳ − β̂1 x̄ e β̂1 = .
SXX
9 / 23
Propriedades dos Estimadores
β̂0 e β̂1 são não tendenciosos (em média estimam certo);
Prova para β̂1 :
SXY 1 1
E(β̂1 ) = E =E(SXY ) = E [Σ(xi − x̄)Yi ]
SXX SXX SXX
1 1
= Σ{E [(xi − x̄)Yi ]} = Σ{(xi − x̄)E [Yi ]}
SXX SXX
1
= Σ{(xi − x̄)E [β0 + β1 xi + ϵi ]}
SXX
1
= Σ{(xi − x̄) [E(β0 ) + E(β1 xi ) + E(ϵi )]}
SXX
1
= Σ{(xi − x̄) [β0 + β1 xi + 0]}
SXX
Σ(xi − x̄)
= β0 + Σ{(xi − x̄) [β0 + β1 xi ]}
SXX
Σ(xi − x̄)xi
= 0 + 0 + β1 = β1
SXX
(demonstre para E(β̂0 )) 10 / 23
Propriedades dos Estimadores
σ2
Como SXX é uma soma de n termos positivos, SXX → 0 se
n → ∞.
11 / 23
Propriedades dos Estimadores
Para β̂0
x̄2
2 1
V(β̂0 ) = σ +
n SXX
(demonstre)
β̂1 e β̂0 são correlacionados, exceto quando x é centrada em
x̄
zero (x̄ = 0). A covariância é Cov(β̂0 ,β̂1 ) = −σ 2 SXX .
(demonstre)
Como ambos estimadores são combinações lineares de Y , podemos
invocar o TCL. Para n suficientemente grande:
1 x̄2 x̄
β̂ β + − SXX
0 ∼ N2 0 ; σ 2 n SXX
x̄ 1
β̂1 β1 − SXX SXX
12 / 23
Resposta estimada, predição e resı́duos
Uma vez estimado β0 e β1 podemos:
1. Estimar E(Yi ): E[Y
b i ] = Ŷi = β̂0 + β̂1 xi .
Ỹ (x) = E[Y
b (x)] + ϵ
= β̂0 + β̂1 x + ϵ
= β̂0 + β̂1 x + 0.
13 / 23
Resposta estimada, predição e resı́duos
14 / 23
Resposta estimada, predição e resı́duos
Assim, temos
1 (x − x̄)2 1 (x − x̄)2
2 2
V[Ỹ (x)] = σ + + V(ϵ) = σ + + σ2
n SXX n SXX
1 (x − x̄)2
2
= σ 1+ +
n SXX
17 / 23
ANOVA e Estimação de σ 2
Tal decomposição fornece um estimador não tendencioso de σ 2
dado por
SQRESIDU OS
σ̂ 2 = = QMRESIDU OS
n−2
que recebe o nome de Quadrado Médio dos Resı́duos. Os
resultados são organizados na tabela ANOVA:
18 / 23
ANOVA e Estimação de σ 2
A ANOVA, por si só, é um tipo de análise descritiva do ajuste do
modelo. A estatı́stica F é a razão entre variabilidades explicada
por X (modelo) e não explicada por X (erro).
Outra quantidade descritiva é o coeficiente de determinação,
popularmente conhecido como R2 dado por:
SQM ODELO SQRESIDU OS
R2 = =1−
SQT OT AL SQT OT AL
interpretado como a proporção de variabilidade em Y explicada
pelo modelo ajustado, no caso, explicada por X. Seu valor varia
entre 0 e 1, com valores altos indicando boa explicação. No caso
√
do modelo simples, R2 = ρ̂XY .
19 / 23
Inferências
Se os erros ϵi ’s forem Normalmente distribuı́dos (ou usando teoria
assintótica), a hipótese
QMM ODELO
∼ F1;n−2
QMRESIDU OS
20 / 23
Inferências
21 / 23
Inferências
Assim, para testar hipótese do tipo
H0 : β1 = β10 vs HA : β1 ̸= β10
β̂1 − β10
T = ,
√ σ̂
SXX
22 / 23
Inferências
Intervalos de Confiança a 100 × (1 − α)%:
para β1 :
σ̂ σ̂
β̂1 − |t α2 ; n−2 | √ ; β̂1 + |t α2 ; n−2 | √
SXX SXX
23 / 23