Você está na página 1de 8

Lista 2 - Gabarito

Prof. Erica Castilho Rodrigues


Disciplina: Análise de Regressão

03 de Dezembro

1. a) Faça o diagrama de dispersão do peso reportado versus peso real usando marcadores
diferentes para cada sexo. Analise e compare a relação entre as duas variáveis para
cada sexo para cada sexo.
Resposta: O Figura 1 apresenta o gráfico de dispersão entre as variáveis. O
diagrama de dipersão mostra uma forte relação linear crescente entre o peso re-
portado e o peso real. Esta relação é aparentemente diferente entre os sexos. O
peso dos homens tende a ser maior e a inclinação também parece ser maior para
essa categoria. Desse modo, propõe-se um modelo de regressão linear para o peso
reportado em função do peso real e de uma indicadora de sexo, incluindo um
termo de interação entre as duas variáveis explicativas.

Feminino
Masculino
70
Peso Reportado

60
50
40

40 45 50 55 60 65 70 75

Peso Real

Figura 1: Gráfico referente ao Execício 1 letra a.

b) Escreva o modelo de regressão linear do peso reportado em função do peso real e


sexo, com interação entre as duas variáveis explicativas.

1
Resposta: O modelo proposto é

Y = β0 + β1 X + α1 Z + γ1 XZ + ϵ

onde
• Y : peso reportado;
• X: peso real;
• Z: indicadora de sexo (Masculino - 1, Feminino - 0);
• ϵ: erro aleatório com ϵ ∼ N (0, σ 2 ) e não correlacionados entre si;
• β0 , β1 , α1 e γ1 são os coeficientes do modelo.
c) Estime os coeficientes do modelo do item anterior.
Resposta: O modelo ajustado no R encontra-se a seguir.

Call:
lm(formula = repwt ~ weight + sex + sex * weight, data = Davis.data)
Residuals:
Min 1Q Median 3Q Max
-29.2230 -2.3247 -0.1325 2.0741 15.5783
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 41.32276 2.16785 19.062 < 2e-16 ***
weight 0.26446 0.03632 7.282 1.01e-11 ***
sexM -39.96412 3.92932 -10.171 < 2e-16 ***
weight:sexM 0.72536 0.05598 12.957 < 2e-16 ***
---
Residual standard error: 4.661 on 179 degrees of freedom
(17 observations deleted due to missingness)
Multiple R-squared: 0.8874, Adjusted R-squared: 0.8856
F-statistic: 470.4 on 3 and 179 DF, p-value: < 2.2e-16

A equação estimada para ambos os sexos é dada por:

Peso-reportado = 41.33 + 0, 27Peso-real − 38.96Sexo + 0, 72(Sexo)(Peso-real)

E para cada sexo separadamente é dada por:

P eso − reportado(F eminino) = 41.33 + 0, 27(P eso − real)

P eso − reportado(M asculino) = 1.35864 + 0.98982(P eso − real)

2
Os interceptos não tem interpretação. Espera-se que para cada aumento em uma
unidade no peso real o peso reportado aumenta em 0,27. Para os homens, espera-
se que para cada unidade no peso real o peso reportado aumenta em 0,98. Os
homens são mais honestos do que as mulheres para declarar o próprio peso.
d) Construa a Tabela de Análise de Variância.

Fonte de G.L. Soma de Quadrado


Variação Quadradis Médio
Regressão 3 30654.7 10218.23
Resíduo 179 3888.3 21.7
Total 182 34543

Tabela 1: Tabela ANOVA

e) Calcule e interprete o valor do coeficiente de determinação ajustado.


2
Resposta: O coeficiente de determinação ajustado é dado por Radjusted = 88, 56%.
Indica que 88,56% da varição total nos pesos reportados é explicada pelo modelo.
f ) Faça a análise dos resíduos, verificando as suposições listadas na letra (b) através
do seguintes gráficos de: (a) resíduos versus valores ajustados; (b) resíduos versus
variáveis explicativas; (c) probabalidade normal dos resíduos.
Resposta: A Figura 2 apresenta os três gráficos para verificação sobre suposições
do modelo. Os dois primeiros gráficos mostram que as suposições de variância
constante e linearidade não parecem ter sido violadas. Apesar disso, nota-se a
presença de alguns outliers que deveriam ser analisados com mais cuidado. O
terceiro gráfico mostra que a variância não parecer ser constante para os dois
sexos. Isso indica a violação da suposição de homocedasticidade do modelo. O
quarto gráfico dessa mesma da Figura 2 indica que os erros parecem violar a
suposção de normalidade. O teste de Shapiro-Wilk também indica que a suposição
de normalidade dos erros foi violada. Notamos, então, que várias suposições do
modelo de Regressão Linear foram violadas nesse caso.
g) Faça o teste F da signicância da regressão. (Escreva as hipóteses nula e alternativa,
faça o teste e conclua).
Resposta: As hipóteses testadas são as seguintes:

H0 : β1 = α1 = γ1 = 0

H1 : pelo menos um de β1 , α1 ou γ1 é diferente de zero.

A estatística de teste é dada por

QM R
Fobs = = 470.4 .
QM E

3
5

5
0

0
Resíduos

Resíduos
−5

−5
−10

−10
40 60 80 100 120 40 60 80 100 120

Valores Ajustados Peso−real


5

5
0

0
Resíduos

Resíduos
−5

−5
−10

−10

F M −3 −2 −1 0 1 2 3

Sexo Quantis teóricos

Figura 2: Gráfico para análise de resíduis requerente ao item (f) da questão 1.

Fixando α = 0, 05 o valor crítico da estatística de teste é F = 2.65. Como


Fobs > 2.65, rejeitamos H0 e concluímos que pelo menos um dos parâmetros é
diferente de zero, com 5% de significância.
h) Faça o teste t da signicância do coeficiente de cada variável explicativa. (Escreva
as hipóteses nula e alternativa, faça o teste e conclua).
Resposta: As hipóteses e conclusões dos testes t individuais se encontram na
Tabela 2.
i) O modelo ajustado parece ser adequado ?
Resposta: A não-significância do coeficiente linear da variável indicadora do
sexo implica na igualdade de interceptos das retas para os dois sexos. Desse
modo, podemos redefinir modelo como

Y = β0 + β1 X + α1 Z + ϵ .

A análise de resíduos também indicou que várias das suposições do modelo foram

4
Hipóteses Estatística de Teste Resultado do Teste Conclusão
e Valor - P
H0 : β1 = 0 T = 28.589 Rejeita-se H0 com 5% β1 ̸= 0
H1 : β1 ̸= 0 Valor-p=0.000 de significância.
H0 : α1 = 0 T = −1.469 Não rejeita-se H0 com 5% α1 = 0
H1 : α1 ̸= 0 Valor-p=0.1435 de significância.
H0 : γ1 = 0 T = 2.239 Rejeita-se H0 com 5% γ1 ̸= 0
H1 : γ1 ̸= 0 Valor-p=0.0263 de significância.

Tabela 2: Tabela de testes referentes ao item (h) do exercício 1.

violadas. Dessa forma, o ideal seria reajustar o modelo e verificar novamente suas
suposições.

2. Considere a função resposta E(Y ) = 30 + 2X1 + 6X2 .

a) Escreva as equações da resposta em função de X1 para valores fixos de X2 iguais a


X2 = 1, X2 = 3, X2 = 6.
Resposta:
X2 = 1 ⇒ E(Y ) = 30 + 2X1 + 6 = 36 + 2X1

X2 = 3 ⇒ E(Y ) = 30 + 2X1 + 18 = 48 + 2X1

X2 = 6 ⇒ E(Y ) = 30 + 2X1 + 36 = 66 + 2X1

b) Esboce um gráfico das equações do item (a), para X1 variando de 0 a 6. A Figura


3 apresenta os gráficos das retas.
c) Como é o efeito da interação entre X1 e X2 ?
Rsposta: Não existe interação entre X1 e X2 . O modelo não possui o termo de in-
teração X1 X2 . A forma como E(Y ) varia com X1 é a mesma, independentemente
do valor de X2 .

3. Considere a função resposta E(Y ) = 25 + 3X1 + 4X2 + 1.5X1 X2 .

a) Escreva as equações da resposta em função de X1 para valores fixos de X2 iguais a


X2 = 1, X2 = 3, X2 = 6.
Resposta:

X2 = 1 ⇒ E(Y ) = 25 + 3X1 + 4 + 1.5X1 = 29 + 4.5X1

X2 = 3 ⇒ E(Y ) = 25 + 3X1 + 4(3) + 1.5X1 (3) = 37 + 7.5X1

X2 = 6 ⇒ E(Y ) = 25 + 3X1 + 4(6) + 1.5X1 (6) = 49 + 12X1

5
Figura 3: Gráfico referente ao exercíco 1 letra b.

b) Esboce um gráfico das equações do item (a), para X1 variando de 0 a 6. A Figura


4 apresenta os gráficos das retas.
c) Como é o efeito da interação entre X1 e X2 em Y ?
Resposta: Existe um efeito de interação positivo, devido ao valor positivo do
coeficiente que multiplica o produto X1 X2 . Notamos que à medida que o X2
cresce, mais forte é o efeito posito ve X1 em Y (a reta é mais inclinada). Em
outras palavras, quando X2 fica maior a velocidade de crescimento dea E(Y ) em
função de X1 aumenta.

4. Considere a função resposta E(Y ) = 14 + 7X1 + 5X2 − 4X1 X2 .

a) Escreva as equações da resposta em função de X1 para valores fixos de X2 iguais a


X2 = 1, X2 = 4, X2 = 8.

X1 = 1 ⇒ E(Y ) = 14 + 7(1) + 5X2 − 4(1)X2 = 21 + X2

X1 = 4 ⇒ E(Y ) = 14 + 7(4) + 5X2 − 4(4)X2 = 42 − 11X2

X1 = 8 ⇒ E(Y ) = 14 + 7(8) + 5X2 − 4(8)X2 = 70 − 27X2

b) Esboce um gráfico das equações do item (a), para X2 variando de 0 a 6.


A Figura 5 apresenta os gráficos das retas.
c) Como é o efeito da interação entre X1 e X2 em Y ? Resposta:
O efeito da interação é negativo, pois o coeficiente do produto X1 X2 é negativo.
Notamos que à medida que X1 cresce o efeito de X2 em Y muda de direção. Ele
começa positivo forte e fica negativo forte.

5. O gerente de uma loja de departamentos deseja estudar a relação entre o gasto mensal

6
Figura 4: Gráfico referente ao exercíco 2 letra b.

Figura 5: Gráfico referente ao exercíco 3 letra b.

em compras (Y ) dos seus clientes em função da renda mensal (X1 ), sexo (X2 ) e tempo
de adesão ao cartão de crédito da loja (X3 ). Ele propôs o modelo para sua loja baseado
nas seguintes conclusões retiradas do mesmo estudo feito previamente em outra filial:
Resposta: Vamos definir a variável sexo da seguinte maneira: feminino=1 e mas-
culino=0. Sempre que incluirmos uma variável colocamos o termo de interação e
depois testamos se ele é significativo.

• O gasto cresce linearmente com a renda e o tempo de adesão.

Y = β0 + β1 X1 + β3 X3 + β13 X1 X3 + ϵ

• O efeito linear da renda no gasto é o mesmo para qualquer tempo de adesão (e

7
vice-versa).
β13 = 0 ⇒ Y = β0 + β1 X1 + β3 X3 + ϵ

• As mulheres gastam mais que os homens, em qualquer faixa de renda e tempo de


adesão.
Vamos colocar agora a variável sexo com os termos de interação correspondentes.

Y = β0 + β1 X1 + β2 X2 + β3 X3 + β12 X1 X2 + β23 X2 X3 + ϵ

• O efeito linear da renda no gasto não é o mesmo nos dois sexos.

β12 ̸= 0 ⇒ Y = β0 + β1 X1 + β2 X2 + β3 X3 + β12 X1 X2 + β23 X2 X3 + ϵ

• O efeito linear do tempo de adesão no gasto é o mesmo nos dois sexos.

β23 ̸= 0 ⇒ Y = β0 + β1 X1 + β2 X2 + β3 X3 + β12 X1 X2 + ϵ

O modelo final então fica

Y = β0 + β1 X1 + β2 X2 + β3 X3 + β12 X1 X2 + ϵ

Você também pode gostar