Você está na página 1de 4

ME613_Lista1

Questão 5

library(tidyverse)
dados2 <- read.table("../Downloads/gpa.txt",header = FALSE, sep = "", quote = "\"'", dec = ".", stringsA
colnames(dados2) <- c("GPA","ACT")

a) Obtenha as estimativas de mínimos quadrados de β̂0 e β̂1 e escreva a função de regressão estimada.

Primeiramente, vamos calcular X e Y

X_barra = mean(dados2$ACT)
X_barra

## [1] 24.725

Y_barra = mean(dados2$GPA)
Y_barra

## [1] 3.07405

Logo, Y = 3, 07405 e X = 24, 725


DP (Y )
Calculando β̂1 = Cor(X, Y ) DP (X) e β̂0 = Y − β̂1 X e comparando os resultados com a saída da função “lm”
no R.

b1 <- cor(dados2$ACT, dados2$GPA) * sd(dados2$GPA)/sd(dados2$ACT)


b0 <- Y_barra - b1*X_barra
rbind(c(b0,b1), coef(lm(dados2$GPA ~dados2$ACT)))

## (Intercept) dados2$ACT
## [1,] 2.114049 0.03882713
## [2,] 2.114049 0.03882713

Logo, β̂1 = 0, 03882713 e β̂0 = 2, 114049. Assim, a função de regressão estimada é: Yi = 2.114049 +
0.038827Xi

b) Faça um gráfico de dispersão dos dados e adicione a reta de regressão estimada.

1
Gráfico de dispersão
4

3
GPA

15 20 25 30 35
ACT

c) Qual é a estimativa pontual da mudança na resposta média quando o score no teste ACT aumenta em
um ponto?

Estimamos que a resposta média aumenta em 0,0388 para cada ponto adicional no score do teste ACT.

d) Encontre uma estimativa para variância dos erros σ 2


Pn
2 2 SQE (Yi −Ŷi )2
Um estimador não viesado para σ é s = QM E = = i=1n−2
n−2 , em que QM E significa Quadrado
Médio do Erro e SQE representa a Soma de Quadrado dos Erros.

GPA_ajustado <- (2.114049 + 0.038827*dados2$ACT)


residuo <- dados2$GPA - GPA_ajustado
variancia <- sum(residuo**2)/118
variancia

## [1] 0.3882848

Logo, uma estimativa para σ 2 é 0, 38828.

e) Faça uma análise gráfica dos resíduos e comente se as suposições do modelo são satisfeitas.

2
Análise gráfica dos resíduos

Resíduos 0

−1

−2

2.8 3.0 3.2 3.4


GPA ajustado

As suposições do modelo são satisfeitas pois os resíduos estão dispersos aleatoriamente em torno de 0 e
concentrados entre -1 e 1.

f) Teste a hipótese de que existe uma relação linear entre GPA e ACT.

Estabelecemos as hipóteses H0 : β1 = 0 vs β1 ̸= 0.
ˆ
Temos que pβ̂1 −βˆ1 ≈ tn−2 é a estatística do teste, onde V ar( ˆ 1β) = QM E
Sxx .
V ar( ˆ 1β)

β̂1
Sob H0 , temos que t = p ˆ
≈ tn−2
V ar( ˆ 1β)

var_B1 <- variancia/sum((dados2$ACT - X_barra)**2)


tvalue <- b1/sqrt(var_B1)

Logo, t = 3, 0397, aproximadamente.


Obtendo o p-valor: p − valor = P (|t118 | ≥ tobs = 3, 0397) = 0, 002917.
Conclusão: rejeitamos, com um nível de 99% de confiança, a hipótese de que β1 é nulo. Ou seja, temos
evidência nos dados para concluir que a relação linear entre as notas do GPA e ACT é significativa
Confirmando o resultado do teste obtido com a função do R:

fit <- lm(formula = GPA ~ dados2$ACT, data = dados2)


summary(fit)

##
## Call:

3
## lm(formula = GPA ~ dados2$ACT, data = dados2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.74004 -0.33827 0.04062 0.44064 1.22737
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.11405 0.32089 6.588 1.3e-09 ***
## dados2$ACT 0.03883 0.01277 3.040 0.00292 **
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 0.6231 on 118 degrees of freedom
## Multiple R-squared: 0.07262, Adjusted R-squared: 0.06476
## F-statistic: 9.24 on 1 and 118 DF, p-value: 0.002917

Podemos ver na parte “Coefficients” que o resultado obtido é o mesmo.

g) Para alunos com scores no teste ACT igual a 30, obtenha um IC de 95% para o GPA médio.

xnew = data.frame(x = 30)


IC <- predict(fit, newdata = xnew, interval = "confidence", level = 0.95)

Resultado:

X fit lower upper


30 2.92941 2.782565 3.076273

Assim, chegamos que o intervalo de 95% de confiança para o GPA médio dos alunos com scores no teste
ACT igual a 30 é [2, 782; 3, 076].

h) Para um novo aluno com score no teste ACT igual a 30, obtenho um IC de 95% para o GPA deste
aluno.

IP = predict(fit, newdata = xnew, interval = "prediction", level = 0.95)

Resultado:

X fit lower upper


30 2.929419 1.686754 4.172084

Logo, o IC pedido é: [1.686; 4.172]

Você também pode gostar