Escolar Documentos
Profissional Documentos
Cultura Documentos
Introdução
Construção do modelo
Análise gráfica
Os gráficos são uma matriz de dispersão que mostra a relação entre as variáveis
independentes e os resíduos. Eles são úteis para identificar padrões, não linearidades ou
outliers.
No 1° gráfico, vemos os resíduos pelos valores ajustado e se houver linearidade, a
linha vermelha tem que tá aproximadamente horizontal.
No 4° gráfico conseguimos ver se existe outlier ou pontos influentes, caso exista irá
ter uma linha pontilhada vermelha e os pontos estarão para fora, e o esperado é que os
resíduos estejam entre -3 e +3.
Análise Numérica
Homoscedasticidade
A homoscedasticidade indica que a variabilidade dos erros de um modelo é constante em todos
os diferentes níveis da variável independente. Ela é representada pelo p, que maior que 0,05
indica que há homoscedasticidade.
Ausência de multicolinearidade
A multicolinearidade ocorre quando duas ou mais variáveis independentes em um modelo estão
altamente correlacionadas entre si. A correlação entre as variáveis tem que ser <0,9.
Outra forma de ver a multicolinearidade é pelo vif, que é uma medida estatística que quantifica
a extensão da multicolinearidade em um modelo. Valores de VIF maiores que 5 ou 10 são
frequentemente considerados indicativos de multicolinearidade significativa.
Análise do modelo
Modelo 1:
Modelo 2:
Coeficientes padronizados
Os coeficientes padronizados são úteis para comparar o efeito relativo das diferentes
variáveis independentes no modelo, especialmente quando as variáveis têm escalas diferentes.
Eles representam uma mudança no resultado (variável dependente) em termos de desvios
padrão quando uma variável independente correspondente aumenta em um desvio padrão.
Intervalo de confiança
O intervalo de confiança é uma estatística que fornece uma faixa de valores plausíveis
para um parâmetro desconhecido. Ele é construído a partir de observações amostrais e fornece
uma medida de incerteza associada a uma estimativa. O intervalo de confiança expressa a
confiança de que o parâmetro real está contido nessa faixa.
AIC e BIC
É a explicação da variância não explicada pelo modelo, então quanto menor, melhor.
Modelos com AIC ou BIC mais baixos são geralmente considerados mais protegidos. Os
critérios AIC e BIC são usados para comparar modelos, buscando o equilíbrio entre o ajuste
do modelo e a penalização por complexidade.
Análise do problema
A análise feita através da regressão linear múltipla mostrou um comparativo entre dois
modelos, e realizada as analises verificamos que os dois modelos são muito parecidos, mas o
modelo 1 acaba sendo melhor explica a variabilidade dos preços dos apartamentos.
Conclusão
A análise estatística revelou que o modelo inicial, que inclui todas as variáveis
consideradas, é estatisticamente superior ao segundo modelo, que exclui a variável “Idade”.
Os coeficientes estimados sugerem que o tamanho do apartamento, a quantidade de vagas de
garagem e o bairro em que está localizado têm impactos significativos no preço. A análise dos
resíduos não indicados abertamente nas premissas da regressão linear, reforçando a robustez
do modelo.