Escolar Documentos
Profissional Documentos
Cultura Documentos
Aula 3 – Modelo de
Regressão Linear Múltipla
1º semestre de 2018
Regressão Múltipla
Uma variável dependente; múltiplas
variáveis independentes
VARIÁVEL VARIÁVEL
INDEPENDENTE DEPENDENTE
JORNADA DE ROTATIVIDADE
TRABALHO
Está associada NO EMPREGO
Está associado
VARIÁVEL
Está associada
INDEPENDENTE
CARGO
IDADE
VARIÁVEL
INDEPENDENTE
1
Modelo de Regressão Múltipla
Modelo populacional:
Intercepto Inclinações Erro aleatório
Variável
dependente
Variáveis
independentes
• b0 é o intercepto
• O coeficiente bp é a variação de y para uma variação de 1 unidade
de xp, mantidos todos os demais x constantes
2
Modelo de Regressão Múltipla
y
(y observado)
0
i
x 1
(X ,X )
1i 2i
x 2
0 i
x1
x
2
3
Interpretação dos parâmetros
Exemplo: prever preço de um imóvel (Y) pelo tamanho (X1) e idade (X2)
Exemplo: prever preço de um imóvel (Y) pelo tamanho (X1) e idade (X2)
4
Suposições do Modelo
Análise de pressupostos
Teste de homocedasticidade e de
normalidade para os resíduos – os mesmos
usados na Regressão Linear Simples
5
Coeficiente de determinação
múltiplo (R2)
n: número de observações
p: número de variáveis do modelo
Hipóteses do Modelo
6
Hipóteses do Modelo
Intercepto n-p-1 b0 s b0 b0
s b0
X1 n-p-1 b1 s b1 b1
... ... ... ...
s b1
...
Xk n-p-1 bk
s bk bk
s bk
Estimação:
Intervalo de confiança de (1-)% para i:
bi tn p1sbi
Exemplo
Número de respostas a um anúncio(y) de acordo
com o tamanho do anúncio e a circulação do jornal
7
Saída do Excel
Estatística de regressão
R múltiplo 0.812
R-Quadrado 0.659
R-quadrado ajustado 0.591 P-valor
Erro padrão 3.370 (teste F)
Observações 13
ANOVA
gl SQ MQ F F de significação
Regressão 2 219.47 109.74 9.66 0.00
Resíduo 10 113.60 11.36
Total 12 333.08
Intervalo de confiança
Conclusão
Admitindo que as suposições estão
satisfeitas, podemos continuar a
análise.
Valor-p <0,05 => rejeito H0: pelo menos uma
das variáveis tem relação linear com Y (por
meio do teste F)
Qual variável ? Ver teste t...
Circulação: p-valor=0,001
Tamanho: p-valor=0,713
Deve-se ajustar um novo modelo de regressão
apenas com circulação como variável
independente, pois variáveis que não são
significantes não devem permanecer
Como escolher quais variáveis entram
no modelo ?
Veremos no próximo tópico ....