Você está na página 1de 4

Exercício 1 aula 15

Gabriel Corrêa Terra


Marcelo de Oliveira

Sintaxe de tratamento do dados da base:

# recebendo a base
library(data.table)
base <- fread(input = paste0("mobile.csv"), header = T, na.strings = "NA", data.table =
FALSE, dec=".")

# Classificação das variáveis qualitativas


base$blue_CAT <- as.factor(base$blue)
base$dual_sim_CAT <- as.factor(base$dual_sim)
base$four_g_CAT <- as.factor(base$four_g)
base$touch_screen_CAT <- as.factor(base$touch_screen)
base$wifi_CAT <- as.factor(base$wifi)
base$price_range_CAT <- as.factor(base$price_range)

A - Ajuste um modelo de regressão linear múltipla utilizando somente as variáveis com efeito
significante no modelo e interprete os coeficientes das variáveis no modelo.

# Pegando as variaveis com efeito significativo


modelo_analisado <- lm(index ~ battery_power + dual_sim + mobile_wt +
price_range_CAT, data=base)
summary(modelo_analisado)

Conclusão da Análise do Item ‘A’:


Call:
lm(formula = index ~ battery_power + dual_sim + mobile_wt + price_range_CAT,
data = base)

Residuals:
Min 1Q Median 3Q Max
-1099.65 -258.07 13.67 262.21 1076.63

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1181.00805 44.73282 26.401 < 2e-16 ***
battery_power -0.47532 0.01982 -23.978 < 2e-16 ***
dual_sim 35.69008 17.02544 2.096 0.036183 *
mobile_wt 0.83491 0.24081 3.467 0.000537 ***
price_range_CAT1 947.07401 24.14120 39.231 < 2e-16 ***
price_range_CAT2 1847.97625 24.14917 76.523 < 2e-16 ***
price_range_CAT3 2791.42917 24.63081 113.331 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 380.1 on 1993 degrees of freedom
Multiple R-squared: 0.8776, Adjusted R-squared: 0.8772
F-statistic: 2382 on 6 and 1993 DF, p-value: < 2.2e-16

O modelo mostra o quanto a variação de cada variável influencia no desempenho do


Celular.

battery-power: o modelo mostra que a cada 1 mAh a mais no telefone, o desempenho


reduz o equivalente a 0.47532

dual-sim: o modelo mostra que o celular possuindo 2 chips, o desempenho sobe para
1216,69813 em relação a quando tem somente 1, que é ≃ 1181,01. Isso mostra uma
variação de 35,69008 caso o aparelho tenha dois chips

mobile-wt: o modelo mostra que a cada grama a mais no telefone, o desempenho sobe
o equivalente a 0.83491 na classificação de desempenho

price_range: o modelo mostra que a cada o preço que você paga no telefone influência
índice de desempenho em: 947,07401 caso seja um preço baixo, 1847,97625 caso
seja um preço médio e 2791,42917

B - Das variáveis independentes que você selecionou no item (a), indique qual a variável que
possui
relação mais forte com a variável dependente INDEX e mostre como você fez para tirar essa
conclusão

library(relaimpo)
imp<-calc.relimp(modelo_analisado)
var.exp<-data.frame(round(imp$lmg*100,1))
colnames(var.exp)<-"imp.lmg"
nome<-rownames(var.exp)
var.exp<-data.frame(nome,var.exp)

library(ggplot2)
ggplot(var.exp, aes(nome,imp.lmg)) +
geom_bar(stat = "identity")+
geom_text(aes(label = imp.lmg), vjust = 1.5, lwd=6, colour = "white")

Conclusão da Análise do Item ‘B’:


A análise mostra que a variável que mais influencia com o desempenho do celular é a
que mostra o preço do aparelho que foi pago, no caso Price_Range. Isso significa que o preço
que você paga na compra do telefone influencia consideravelmente o seu desempenho.

C - Faça a análise da Qualidade do Ajuste do modelo e indique se o modelo está bem


ajustado interpretando cada resultado

plot(fitted(modelo_analisado),rstandard(modelo_analisado))
abline(0,0)
library(car)
qqPlot(modelo_analisado)
Conclusão da Análise do Item ‘C’:

A análise residual mostra que existe uma distribuição normal, e aproximadamente linear

Você também pode gostar