Você está na página 1de 19

T2 - REGRESSÃO

LINEAR MÚLTIPLA
Grupo 7
Pedro Semcovici
Rebecca Wendhausen
Victor Augusto Costa Monteiro
Vinicius Henrique Crispim Rosa
Vitor Nunes Vanjura
Yago Primerano Arouca
SEÇÃO 1

Visão Geral
Banco de dados
Banco de dados de cereais matinais
Dados da tabela de informações nutricionais de cada
uma das marcas de cereal matinal
Banco de dados
Variáveis nutricionais:
calorias, proteínas, gorduras, sódio, fibra, carboidratos, açúcar,
potássio, vitaminas e minerais

Variáveis de venda:
nome da marca, empresa manufatureira, tipo de consumo, nível da
prateleira exposta na loja, peso por porção, número de copos por
porção e avaliação
Tratamento dos dados

Dados formatados de
forma adequada

Ausência de missing data


Problema de pesquisa

Utilizar as técnicas de dependência abordadas em aula, com foco na regressão


linear múltipla, para o estudo do banco de dados escolhido:

Uso de regressão linear múltipla para a previsão da avaliação dos


cereais, baseado nos seus componentes nutricionais
SEÇÃO 2

Metodologia
Metodologia

Correlação de Pearson entre cada uma das


variáveis (matplotlib.pyplot)

Função lm para encontrar o coeficiente de


determinação R-squared (R2) e o desvio
padrão dos resíduos

Aplicada a técnica de regressão linear múltipla


(sklearn) para criação de um modelo
SEÇÃO 3

Regressão
Linear
Múltipla
Variáveis independentes

Calories Protein Fat Fiber Sugars

Rating

Variável
dependente
Rating

Calories Protein Fat Fiber Sugars


Coeficiente de determinação (R-squared) = 0,89

Desvio padrão dos resíduos = 4,748

Rating

Calories Protein Fat Fiber Sugars


Coeficientes individuais das variáveis independentes Mínimo, máximo e quartis dos resíduos

Rating

Calories Protein Fat Fiber Sugars


Criação do modelo:
Calories

Protein

Fat Rating
Uso do modelo:

Fiber

PredictedRating = 70,12
Sugars
SEÇÃO 4

Bibliografia
Bibliografia
UNIVERSITY, Calvin. Cereals Datafile. 2020. Disponível em: ⟨https://sites.calvin.edu/
scofield/data/cereals.html⟩.

COURNAPEAU, D.; BRUCHER, M. Sklearn. 2007. Disponível em: ⟨https:


//scikit-learn.org/⟩.

HUNTER, J. et al. Matplotlib. 2002. Disponível em: ⟨https://matplotlib.org/3.5.1/api/


as gen/matplotlib.pyplot.html⟩.

WASKOM, M. Seaborn. 2012. Disponível em: ⟨https://seaborn.pydata.org/⟩.

Outras bibliotecas utilizadas:


pandas. v. 1.4.4. 2022. Disponível em: ⟨https://pandas.pydata.org/⟩.
NumPy. v. 1.23.0. 2022. Disponível em: ⟨https://numpy.org/⟩.
spicy.stats. v. 1.9.1. 2022. Disponível em: ⟨https://docs.scipy.org/⟩.
FIM

Você também pode gostar