Escolar Documentos
Profissional Documentos
Cultura Documentos
de
Regressão Linear Múltipla II
Aula 26
3
Suposições e Propriedades
Observações
1) Para aplicações de regressão com dados do tipo cross-
sectional, as suposições MLR.1 a MLR.6 são conhecidas
como suposições do modelo linear clássico (suposições
CLM).
2) Uma maneira sucinta de resumir as suposições CLM na
população é
y | (x1, x2, ..., xk) ~ N(0+1 x1+2 x2+ ... +k xk; 2).
3) Sob as suposições CLM os estimadores de mínimos
quadrados são estimadores não-viesados de variância
mínima.
Distribuição amostral de β̂ j
2
βˆ j ~ N β j ;
SQT (1 R 2
)
x j x j
5
Distribuição amostral de β̂ j
Observação
Tais estimadores são normalmente distribuídos,
pois, são combinações lineares dos y´s, que são
independentes e normalmente distribuídos.
6
Distribuição amostral de β̂ j
Do teorema anterior segue que,
βˆ j β j
~ N 0; 1
2
SQTx j (1 R ) 2
xj
9
Teste de Hipóteses
(significância geral de uma regressão)
Teste F
No modelo com k variáveis explicativas e intercepto
podemos ter interesse na seguinte hipótese nula:
H0 : β1 βk 0
A qual podemos traduzir como: os regressores
conjuntamente são irrelevantes na explicação da variável
resposta.
Já a hipótese alternativa pode ser formulada da
seguinte maneira:
HA : pelo menos um parâmetro difere de zero
Teste F
SQR, SQE e SQT são v.a. e prova-se que:
SQR 2
1. ~χ n k 1;
σ 2
SQE 2
2. Se β1 β2 βk 0, ~χ(k) ;
σ 2
SQR SQR
(a) E 2 n k 1 E EQMR σ2
σ n k 1
QMR é um estimador não-viesado de 2;
SQE SQE
(b) Se β1 βk 0, E 2 k E EQME σ 2
k
QME é um estimador não-viesado de 2
13
Teste F
Consequências: (cont.)
(c) Se β1 β2 βk 0,
2
SQE/ σ SQE
k k QME
F ~ Fk ,n-k 1
SQR/ σ 2
SQR QMR
n-k 1 n-k 1
14
Teste F
Consequências: (cont.)
(d) Se β1 β2 βk 0,
E(SQT) E(SQR) E(SQE) n k 1 σ k σ (n-1 )σ
2 2 2
15
Teste F
Ainda, os resultados anteriores podem ser colocados
numa tabela, que na área de Estatística é conhecida
como Tabela de Análise de Variâncias (ANOVA):
Fontes de
SQ gl QM F
variação
Explicação SQE k QME QME/QMR
Resíduo SQR n-(k+1) QMR
Total SQT n-1
16
Teste F
A hipótese nula
H0 : β1 βk 0
será rejeitada se o valor da estatística F for superior ao
valor crítico obtido na cauda da direita da distribuição F,
com k graus de liberdade no numerador e n-k-1 graus
de liberdade no denominador, segundo o desenho a
seguir:
Região crítica:
Fc
Observação
Ainda, a estatística F, para testar a hipótese de
interesse
H0 : β1 βk 0
pode ser escrita como
R2 sob H0
F k ~ Fk; n-(k 1)
2
(1- R )
(n - k - 1)
18
Voltando ao Exemplo (TEMCO)
19
Modelo Estimado (Exemplo)
20
Voltando ao Exemplo (TEMCO)
Utilizando os resultados da estimação dos
parâmetros do modelo proposto anteriormente:
21
Teste de Hipóteses
(individuais)
Teste de Hipóteses
Para testar as hipóteses
βˆ j b
~ t n-(k 1 )
ep(βˆ ) j
23
Teste de Hipóteses
em que
ˆ 2
ep( ˆ j )
SQTx j (1 R )
2
xj
24
Voltando ao Exemplo (TEMCO)
Utilizando os resultados da estimação dos
parâmetros do modelo proposto anteriormente:
25
Modelo Estimado (Exemplo)
26
Intervalo de Confiança
27
Intervalo de Confiança para j
ˆ
IC ( β j ; ) ( β j t n-(k 1 ) ep( ˆ j ))
/2
28
Voltando ao Exemplo (TEMCO)
29
Modelo Estimado (Exemplo)
30
Inclusão e Exclusão de Variáveis
(teste conjunto)
Teste F-parcial
Objetivo
O teste F-parcial verifica a contribuição de
uma ou mais variáveis explicativas como se
estas tivessem sido as últimas variáveis
explicativas a entrar no modelo.
32
Teste F-parcial
Observação
É um critério útil para acrescentar ou
remover um conjunto de variáveis de um
modelo, sendo bastante utilizado em
critérios de seleção da melhor equação de
regressão.
33
Voltando à empresa TEMCO
No modelo de regressão linear múltipla que objetiva estimar
o comportamento médio do log(salário), já tendo educ como
regressor, a entrada da variável explicativa anosemp é
relevante? Interprete os resultados. Para tanto, considere em
suas análises:
x1 = educ
x2 = anosemp
y = log(salário)
34
Voltando à empresa TEMCO
35
Teste F-parcial
Sob H0 (e admitindo a validade das suposições CLM), não é
provar que
R2 R2
ur r
glr glur
Fp ~ Fglr glur ; glur
(1- R 2 )
ur
glur
37
Voltando à empresa TEMCO
38
Voltando à empresa TEMCO
39
Voltando à empresa TEMCO
Modelo com x1: R2 = 61%
SQR(x1) = 1,1730 gl = 44
SQR x 1 SQR x 1, x 2
glx 1 glx 1, x 2
Fp 23,85
SQR x 1, x 2
glx 1, x 2
42
Voltando à empresa TEMCO
11.2
11.0
10.8
LOGSALARIO
10.6
10.4
Correlação: 0,81
10.2
10.0
10 20 30 40 50 60 70
PRODUT IVIDADE
43
Voltando à empresa TEMCO
Modelo Completo
Voltando à empresa TEMCO
Modelo Restrito
Voltando à empresa TEMCO
A inclusão de x3 num modelo que já tem x1 e
x2 é necessária?
Fp=0,260 p=0,6127
46
Comentários
Neste caso a inclusão da produtividade no modelo
acrescentaria muito pouco em termos de
interpretação.
47
Exercício
48
Resolução
1,0594 0,7499
Fp 44 42 8,67 p = 0,0007
0,7499
42
49
Comentários
É importante observarmos que, quando passamos
de um modelo de regressão linear simples para um
modelo de regressão linear múltipla, estamos
trabalhando com um modelo mais complicado.
Assim sendo, o ganho com a introdução de novas
variáveis deve compensar a “complicação” do
modelo.
50
Exemplo
Baseando-se no seguinte modelo de regressão linear
múltipla,
salário 0 1educ 2 anosemp
auxilie o gerente de RH da TEMCO a verificar se a sua
desconfiança sobre o fato do impacto no valor médio da
variável resposta devido à variação da variável educ em uma
unidade, mantendo tudo o mais constante, ser superior ao
impacto no valor médio da variável resposta devido à
variação da variável anosemp em uma unidade, mantendo
tudo o mais constante, procede, a partir da condução de um
teste de hipóteses adequado.
Exemplo (cont.)
Em termos do problema:
H 0 : 1 2
H A : 1 2 .
Modelo Estimado e Matriz Estimada de Var-Cov dos Estimadores de MQO
Teste de Hipóteses sobre uma única
Combinação Linear de Parâmetros
(teste t)
53
Teste de Hipóteses Sobre uma Única
Combinação Linear de Parâmetros
Sejam as hipóteses
H0 : βi β j βi β j 0
HA : βi β j ( βi β j ou βi β j )
(βˆi βˆ j ) 0
tobs ~ t n k 1
^
Var βˆi βˆ j
em que
^
^
^
^
Var βˆi βˆ j Var βˆi Var βˆ j 2 Cov βˆi , βˆ j
Teste de Hipóteses Sobre uma Única
Combinação Linear de Parâmetros
ALTERNATIVAS DE SOLUÇÃO
ALTERNATIVAS DE SOLUÇÃO
ALTERNATIVAS DE SOLUÇÃO
H 0 : 1 2 1 2 0
H A : 1 2 .
61
Voltando ao Exemplo
Hipóteses
H0 : 0
HA : 0
Sob H0 1244,164 0
tobs 2 ,598802
478,7452
tcrítico t n-k 1 t 43 1,681
0 , 05
0,0128
p valor 62
2