Você está na página 1de 1

UNIVERSIDADE ESTADUAL DE MONTES CLAROS

PROGRAMA DE PÓS-GRADUAÇÃO EM MODELAGEM


COMPUTACIONAL E SISTEMAS - PPGMCS

Nome: Gustavo Dias Froes

1- Arquivo anexo.

2- Arquivo anexo.
a) O coeficiente de determinação R2 para o conjunto de teste (0.752) indica que o
modelo explica 75,2% da variação nos valores de resposta observados para o
conjunto de teste. Isso significa que o modelo de regressão é razoavelmente preciso
na previsão de valores para novos dados que não foram usados ​para treinar o
modelo. O coeficiente de determinação R2 para todo o conjunto de dados (0.885)
indica que o modelo explica 88,5% da variação nos valores de resposta observados
para todo o conjunto de dados. Isso significa que o modelo de regressão é
geralmente preciso na previsão de valores para novos dados. O erro quadrático
médio (conjunto de teste) (316574361.625) é uma medida de quão bem o modelo se
ajusta aos dados de teste. Quanto menor o valor do erro quadrático médio, melhor o
modelo se ajusta aos dados. Neste caso, o valor é relativamente alto, indicando que
o modelo pode ser melhorado. O erro quadrático médio (conjunto completo)
(182522415.353) é uma medida de quão bem o modelo se ajusta a todos os dados.
Novamente, quanto menor o valor do erro quadrático médio, melhor o modelo se
ajusta aos dados. Neste caso, o valor é relativamente alto, indicando que o modelo
pode ser melhorado.

b) Nesse caso, existe apenas um modelo de regressão linear simples. Para um


conjunto de dados com n atributos de entrada, existem infinitos modelos de
regressão linear múltipla que podem ser construídos, variando-se os valores dos
coeficientes de regressão.

c) A escolha dos atributos a serem usados na regressão linear múltipla depende do


objetivo da análise e do conhecimento prévio sobre os dados. Há possibilidade de
verificar a correlação entre cada atributo e a variável de resposta. Aqueles que têm
uma alta correlação positiva ou negativa com a variável de resposta são bons
candidatos para inclusão no modelo.

d) Para incluir o atributo "Estado" como entrada do modelo, é possível usar técnicas de
codificação de variáveis categóricas, como a codificação one-hot. A codificação
one-hot transforma cada valor possível da variável categórica em uma nova variável
binária, indicando se o valor está presente ou não para cada amostra.

3- Validação cruzada (ou cross-validation em inglês) é uma técnica utilizada em machine


learning para avaliar a performance de um modelo em dados que não foram usados para
treiná-lo. O objetivo da validação cruzada é estimar quão bem o modelo irá se sair em
dados novos e não vistos, evitando o overfitting (quando o modelo se ajusta muito bem aos
dados de treino, mas não generaliza bem para dados novos).

Você também pode gostar