Você está na página 1de 5

MBA Executivo

Atividades
Tema Principal:
Regressão Múltipla

Regressão Múltipla

1) (Ragsdale, ex. 9.17) A Duque Power Company deseja criar um modelo de regressão
para ajudar a prever seu pico diário de demanda de energia. Essa previsão é útil na
determinação da capacidade de geração que precisa estar disponível (ou que precisa
ser comprada dos concorrentes) diariamente. A demanda diária de energia no
momento do pico é influenciada primariamente pelo tempo e dia da semana. O
arquivo Dat9-17.xlsx contém dados que resumem a demanda diária da Duque no
momento de pico e a temperatura máxima diária, registradas durante o mês de julho
do ano passado.
a) Construa um modelo de regressão linear simples para prever a demanda de
energia no momento de pico usando a temperatura máxima diária. Qual é a
equação de regressão estimada?
b) Prepare um gráfico de linhas plotando os dados reais de demanda no momento de
pico versus os valores previstos por essa equação de regressão. Quão bem o
modelo se ajusta aos dados?
c) Interprete a estatística R2 para esse modelo.
d) Construa um modelo de regressão linear múltiplo para prever a demanda de
energia no momento de pico usando a temperatura máxima diária e o dia da
semana como variáveis independentes. (Observação: esse modelo terá sete
variáveis independentes.) Qual é a equação de regressão estimada?
e) Prepare um gráfico de linhas plotando os dados reais de demanda no momento de
pico versus os valores previstos por essa equação de regressão. Quão bem o
modelo se ajusta aos dados?
f) Interprete a estatística R2 para esse modelo.
g) Usando o modelo que você criou no item d, qual é a demanda de energia no
momento de pico que a Duque deveria esperar para uma quarta-feira em julho,
quando a temperatura máxima prevista for de 94 °F?
h) Calcule um intervalo de previsão com 95% de confiança para a estimativa da
questão anterior. Explique as implicações gerenciais desse intervalo para a
Duque.

2) (Ragsdale, ex. 9.18) Um avaliador coletou os dados encontrados no arquivo Dat9-


18.xlsx, os quais descrevem o preço de venda em leilão, diâmetro (em polegadas) e o
tipo de utensílio de cozinha fabricado em metal por um famoso artesão no começo do
século XX. A variável tipo de utensílio está codificada da seguinte maneira: B = tigela,
C = caçarola, D = prato, T = bandeja e P = travessa. O avaliador deseja construir um
modelo de regressão múltipla para esses dados a fim de prever o preço médio de
venda de utensílios semelhantes.

MBA Executivo - INSPER


a) Construa um modelo de regressão múltipla para esse problema (Sugestão: Crie
variáveis independentes binárias para representar os dados do tipo de utensílio.)
Qual é a função de regressão estimada?
b) Interprete o valor da estatística R2 para esse modelo.
c) Construa um intervalo de previsão aproximada com 95% de confiança para o
preço de venda esperado de uma caçarola de 18 polegadas de diâmetro.
Interprete esse intervalo.
d) Que outras variáveis não incluídas no modelo poderiam ajudar a explicar a
variação restante nos preços de venda em leilão para esses utensílios?

3) (Ragsdale, ex. 9.19 - adaptado) Chris Smith é um entusiasta de carros esportivos


com uma predileção em particular por Mini Coopers. Ele baixou dados do eBay sobre
leilões finalizados de Mini Coopers e os usou para criar um conjunto de dados no
arquivo Dat9-19.xlsx, mostrando os preços de venda, idade, milhagem e localização
dos veículos (a região “Midwest” serve como grupo de comparação). Ele gostaria de
usar estes dados para construir um modelo de regressão para prever o preço
estimado de venda dos Mini Coopers.

a) Prepare gráficos de dispersão mostrando a relação entre o preço de venda e cada


uma das variáveis independentes.
b) Usando somente regressões lineares simples, qual variável deveria ser
selecionada?
c) Faça uma regressão com todas as variáveis independentes. Qual o modelo
estimado neste caso?
d) Quais dos carros nesse conjunto de dados foram vendidos por um preço superior
aos preços estimados usando o modelo identificado no item c?
e) Que outras variáveis, se disponíveis, poderiam ajudar Chris a desenvolver um
modelo de regressão mais preciso para esse problema?

4) (Ragsdale, ex. 9.21 - adaptado) Um estimador de custos contratado por uma


empresa de construção coletou os dados encontrados no arquivo Dat9-21.xlsx,
descrevendo o custo total (Y) de 97 projetos diferentes e as 5 seguintes variáveis
independentes que se acredita exercerem uma influência relevante no custo total:
remunerações normais ou especiais pagas (X1), total de unidades de trabalho
exigidas (X2), unidades de trabalho contratadas por dia (X3), nível de equipamento
necessário (X4), e a cidade/localização do trabalho (X5). O estimador de custos
gostaria de desenvolver um modelo de regressão para prever o custo total de um
projeto como uma função dessas 5 variáveis independentes

a) Prepare cinco gráficos de dispersão mostrando a relação entre o custo total dos
projetos e cada uma das variáveis independentes. Que tipo de relação cada
gráfico sugere?
b) Considere que o estimador decida estimar um modelo com somente duas
variáveis, sendo uma delas unidades de trabalho exigidas (X2). Neste caso, qual
combinação das variáveis independentes você sugeriria que o estimador usasse?
Qual é a equação de regressão estimada para este modelo e qual é o valor de R2
ajustado?
c) Suponha que o estimador queira usar as unidades totais de trabalho (X2) e a
cidade/localização de trabalho (X5) como as únicas variáveis independentes para
o modelo de regressão para prever o custo total. No entanto, ele agora percebe
que a variável cidade/localização de trabalho (X5) poderia ser modelada mais

MBA Executivo - INSPER


apropriadamente por uma coleção de variáveis binárias. Modifique o conjunto de
dados para incluir as variáveis binárias necessárias. Devido ao fato de haver seis
valores distintos de cidade/localização, cinco variáveis binárias seriam necessárias
(assuma que a cidade/localização 6 será usada como referência).
d) Dos modelos de regressão identificados nas partes b e c, qual você recomendaria
que o estimador de custos usasse, e por quê?

5) (Ragsdale, ex. 9.22) O diretor de pessoal de uma pequena fábrica coletou os dados
encontrados no arquivo Dat9-22.xls, os quais descrevem o salário (Y) recebido por
cada operador de máquina na fábrica, junto com a avaliação de desempenho média
(X1) durante os últimos três anos, os anos de serviço (X2) e o número de diferentes
máquinas que cada empregado está capacitado a operar (X3).
O diretor de pessoal deseja construir um modelo de regressão para estimar o salário
médio que um empregado deveria esperar receber, com base em seu desempenho,
nos anos de trabalho e em suas capacitações.

a) Prepare três gráficos de dispersão mostrando a relação entre os salários e cada


uma das variáveis independentes. Que tipo de relação cada gráfico sugere?
b) Se o diretor de pessoal quisesse construir um modelo de regressão usando
apenas uma variável independente para prever os salários, que variável deveria
ser usada?
c) Se o diretor de pessoal quisesse construir um modelo de regressão usando
apenas duas variáveis independentes para prever os salários, quais variáveis
deveriam ser usadas?
d) Compare as estatísticas de R2 ajustado obtidas nos itens b e c com a de um
modelo de regressão usando todas as três variáveis independentes. Que modelo
você recomendaria ao diretor de pessoal?
e) Suponha que o diretor de pessoal opte por usar a função de regressão com todas
as três variáveis independentes. Qual é a função de regressão estimada?
f) Suponha que a companhia considere justo o salário de um empregado se ele for
equitativo a 1,5 erros padrão do valor estimado pela função de regressão no item
e. Que faixa salarial seria apropriada para um empregado com doze anos de casa
que tenha recebido médias de 4,5 em revisões de desempenho e seja capacitado
para operar quatro máquinas?

6) (Ragsdale, ex. 9.23 - adaptado) A Caveat Emptor, Inc. possui um serviço de


inspeção residencial que oferece aos possíveis compradores de casas uma
verificação completa dos principais sistemas de uma casa antes da assinatura do
contrato de compra. Os possíveis compradores muitas vezes pedem à companhia
uma estimativa do custo médio mensal com o aquecimento da casa durante o inverno.
Para responder a essa pergunta, a companhia deseja construir um modelo de
regressão para prever o custo médio mensal com aquecimento (Y) como uma função
da temperatura externa média no inverno (X1), da quantidade de isolamento no sótão
(X2), da idade da caldeira (X3) e do tamanho da casa medido em pés quadrados (X4).
Os dados sobre essas variáveis para várias casas foram coletados e podem ser
encontrados no arquivo Dat9-23.xlsx.

a) Prepare gráficos de dispersão mostrando a relação entre o custo médio com o


aquecimento e cada uma das potenciais variáveis independentes. Que tipo de
relação cada gráfico sugere?

MBA Executivo - INSPER


b) Se a companhia quisesse construir um modelo de regressão usando apenas uma
variável independente para prever o custo médio de aquecimento dessas casas,
que variável deveria ser usada?
c) Se a companhia quisesse construir um modelo de regressão usando apenas duas
variáveis independentes para prever o custo médio de aquecimento dessas casas,
sendo uma delas o tamanho da casa (X4), que variáveis deveriam ser usadas?
d) Se a companhia quisesse construir um modelo de regressão usando apenas três
variáveis independentes para prever o custo médio de aquecimento dessas casas,
sendo duas delas o tamanho da casa (X4) e a quantidade de isolamento no sótão
(X2), que variáveis deveriam ser usadas?
e) Suponha que a companhia opte por usar a função de regressão com todas as
quatro variáveis independentes. Qual é a função de regressão estimada?
f) Suponha que a companhia decida usar o modelo com a estatística R2 ajustado
mais alta. Crie um intervalo de previsão com aproximadamente 95% de confiança
para o custo médio com o aquecimento de uma casa com 4 polegadas de
isolamento no sótão, uma caldeira com 5 anos de idade, 2.500 pés quadrados, e
localizada em uma área cuja temperatura média no inverno é de 40 °F. Interprete
esse intervalo.

7) (Prova - 2019) Os índices de inadimplência de pessoa física são um expressivo


termômetro estratégico-econômico para empresas, instituições financeiras e governo.
Todas as empresas que concedem crédito (bancos privados e públicos, comércio
atacadista, comércio varejista, instituições de fomento, entre outros) precisam estar
atentas e mitigar os efeitos negativos do crédito, como a inadimplência. Para o
governo, as taxas de inadimplência são um importante sinal econômico, pois seu
aumento gera um corte nos gastos futuros dos indivíduos, reduz o consumo e,
consequentemente, prejudica a economia. A inadimplência pode ser analisada como
um problema social e de interesse do governo para o equilíbrio do sistema financeiro.
Além disso, uma maior sensibilidade dos endividados a choques externos da
economia, derivados do aumento da taxa de juros e desemprego, desencadearia um
provável aumento nas taxas inadimplência.
Com o objetivo de analisar a trajetória da inadimplência entre as unidades federativas
do Brasil, foram coletados os dados anuais da inadimplência de pessoa física (em %)
das 27 unidades federativas (UF) do Brasil nos anos de 2013 e 2016.
Para explicar as taxas de inadimplência (Inadim, em %) dos estados brasileiros, foram
coletadas as seguintes variáveis consideradas na literatura:
 Desemp - a taxa de desemprego por UF (em %);
 Educ – a escolaridade, que foi medida pelo número médio de anos de estudo por
UF;
 Endiv – endividamento de pessoas físicas (em %);
 Spread - spread médio bancário das operações com recursos livres pessoas
físicas (em %) e
 Renda – variável dummy que assume o valor 1 se o rendimento médio dos
habitantes da UF sofreu uma queda no ano e 0 em caso contrário.

a) (1,5 ponto) Construa os gráficos de dispersão e analise as correlações de forma


descritiva em relação ao problema proposto.
b) (1,5 ponto) Estime o modelo de regressão e escreva a equação estimada em
termos das variáveis analisadas (manter todas as variáveis no modelo!). Os sinais
(positivo ou negativo) dos coeficientes estão de acordo com o esperado para o

MBA Executivo - INSPER


problema em questão? Justifique suas respostas. Respostas sem justificativa
serão ignoradas.
c) (1,5 ponto) Analise o grau multicolinearidade no modelo proposto. Justifique sua
resposta.
d) (2,5 pontos) Limpe o modelo retirando as variáveis não relevantes com 95% de
confiança e descreva quais foram retiradas em cada etapa e o valor da Statt.
Escreva o modelo final limpo e interprete os coeficientes do modelo em termos do
problema.
e) (1,0 ponto) Avalie a qualidade de ajuste do modelo em termos do problema.
f) (2,0 pontos) Faça a previsão do valor esperado da inadimplência de uma UF que
tem desemprego de 8%, 9 anos de escolaridade, 20% de endividamento de
pessoa física, 50% de spread bancário e que apresentou queda na renda este
ano. Ainda, construa e interprete um intervalo aproximado com 95% de confiança
para esta previsão. Justifique suas respostas. Respostas sem justificativa serão
ignoradas.

MBA Executivo - INSPER

Você também pode gostar