Você está na página 1de 16

Atividades - Aula 7 - Regressão Linear Múltipla

1) Uma empresa que vende produtos pela internet mantém um depósito central para distribuição dos artigos e
está constantemente examinando o processo de distribuição e está interessada em analisar os fatores que af
distribuição. Atualmente, uma pequena taxa de frete é adicionada ao pedido, independentemente do volume d
coletados dados ao longo dos últimos 24 meses, indicando os custos de distribuição do depósito, as vendas e
recebidas. Esses dados estão na planilha “Internet". Com os dados do arquivo, realize as análises solicitada
a) Faça um diagrama de dispersão entre o custo de distribuição e o volume mensal de vendas. Analise a inte
entre essas variáveis.
b) Faça um modelo de regressão linear para as variáveis do item (a) e analise o coeficiente de determinação,
que o volume de vendas tem efeito sobre o custo de distribuição?
c) Faça um diagrama de dispersão entre o custo de distribuição e o número mensal de encomendas. Analise
linear entre essas variáveis.
d) Faça um modelo de regressão linear para as variáveis do item (c) e analise o coeficiente de determinação,
que o número mensal de encomendas tem efeito sobre o custo de distribuição?
e) Que variável explica a maior proporção da variação observada entre os valores do custo de distribuição?
f) Faça um diagrama de dispersão das duas variáveis explicativas. O que você conclui a respeito do tipo de a
variáveis?
g) Faça uma análise de regressão linear múltipla, determinando a equação da reta de regressão.
h) Qual o significado das inclinações (coeficientes) neste problema?
i) Calcule o coeficiente de determinação, R2, e interprete o seu significado neste problema.
j) Analise os gráficos de resíduos para cada uma das variáveis explicativas e conclua sobre a linearidade das
k) Faça uma previsão de custo de distribuição para um mês cujo volume de vendas é 600.000 e número de e

2) Uma corretora de valores, visando analisar o comportamento associado das ações preferenciais da Petrob
dados trimestrais das cotações de PETR4, do preço do barril do petróleo, e do PIB dos EUA, da China e do B
2007 (planilha PETR4).
a) Construa o diagrama de dispersão entre PETR4 e Petróleo, encontre a reta que melhor se ajusta aos ponto
valor de R2;
b) Construa o diagrama de dispersão entre PETR4 e PIB EUA, encontre a reta que melhor se ajusta aos pont
valor de R2;
c) Construa o diagrama de dispersão entre PETR4 e PIB China, encontre a reta que melhor se ajusta aos pon
valor de R2;
d) Construa o diagrama de dispersão entre PETR4 e PIB Brasil, encontre a reta que melhor se ajusta aos pon
valor de R2;
e) Qual dos modelos anteriores se mostrou mais adequado em ser ajustado como uma reta? Algum deles nã
ser tratado como relação linear? Justifique.
f) Construa um modelo de regressão linear múltipla, em que as cotações de PETR4 sejam explicadas pelas v
PIB China e PIB Brasil.
g) Qual a estimativa para a cotação de PETR4 se o Petróleo estiver a US$110 o barril, PIB EUA for igual a US
for igual a US$650 bilhões e PIB Brasil igual a US$150 bilhões?

3) Uma companhia deseja avaliar a eficácia de diferentes tipos de meios de Propaganda na promoção de se
dois tipos de meios de comunicação: a propaganda em rádio e televisão e a propaganda em jornais. Uma am
populações são semelhantes, é selecionada e analisada durante um período de teste de um mês. Para cada
despesas específico, tanto para a propaganda em rádio e televisão quanto para a propaganda em jornais. As
milhares de $) e os níveis de despesas realizadas com os meios de comunicação durante o mês de teste são
estão na planilha excel “propaganda”. De posse dessas informações realize as análises solicitadas abaixo.

a) Faça um diagrama de dispersão entre as vendas do produto (em milhares de $) e as despesas com propag
intensidade da correlação linear entre essas variáveis.
b) Faça um modelo de regressão linear para as variáveis acima e analise o coeficiente de determinação, R 2. V
despesa com propaganda em rádio e tv tem efeito sobre as vendas do produto?
c) Faça um diagrama de dispersão entre as vendas do produto (em milhares de $) e as despesas com propag
intensidade da correlação linear entre essas variáveis.
d) Faça um modelo de regressão linear para as variáveis do item (c) e analise o coeficiente de determinação,
que a despesa com propaganda em jornais tem efeito sobre as vendas do produto?
e) Que variável explica a maior proporção da variação observada entre as vendas do produto?
f) Faça um diagrama de dispersão das duas variáveis explicativas. O que você conclui?
g) Faça uma análise de regressão linear múltipla, determinando a equação da reta de regressão.
h) Qual o significado das inclinações (coeficientes) neste problema?
a) Faça um diagrama de dispersão entre as vendas do produto (em milhares de $) e as despesas com propag
intensidade da correlação linear entre essas variáveis.
b) Faça um modelo de regressão linear para as variáveis acima e analise o coeficiente de determinação, R 2. V
despesa com propaganda em rádio e tv tem efeito sobre as vendas do produto?
c) Faça um diagrama de dispersão entre as vendas do produto (em milhares de $) e as despesas com propag
intensidade da correlação linear entre essas variáveis.
d) Faça um modelo de regressão linear para as variáveis do item (c) e analise o coeficiente de determinação,
que a despesa com propaganda em jornais tem efeito sobre as vendas do produto?
e) Que variável explica a maior proporção da variação observada entre as vendas do produto?
f) Faça um diagrama de dispersão das duas variáveis explicativas. O que você conclui?
g) Faça uma análise de regressão linear múltipla, determinando a equação da reta de regressão.
h) Qual o significado das inclinações (coeficientes) neste problema?
i) Calcule o coeficiente de determinação R2, e interprete o seu significado neste problema.
j) Analise os gráficos de resíduos para cada uma das variáveis explicativas e conclua sobre a linearidade das
k) Faça uma previsão de vendas considerando um gasto com propaganda em rádio e tv de 62.000 e com pro
37.000.
4) Um estudo foi conduzido para analisar o papel de armas de fogo e de vários outros fatores na taxa de hom
informação para os anos de 1961 até 1973 é fornecida na planilha “Homicídios”. Foram analisadas as seguin
homicídios por 100.000 habitantes (homicide), o número de oficiais por tempo integral por 100.000 habitantes
adultos que estão desempregados (unemp), o número de registros de revólver por 100.000 habitantes (registe
médios dos residentes na cidade (weekly).
a) Para cada uma das quatro variáveis explicativas listadas – police, unemp, register e weekly – construa um
homicídios versus a variável explicativa e analise a relação entre essas duas variáveis.
b) Ajuste quatro modelos de regressão linear simples, usando como variável resposta a taxa de homicídios e
variáveis como a única variável explicativa.
c) Liste os coeficientes de determinação de cada modelo de regressão. Que variável explica a maior proporçã
entre os valores das taxas de homicídio?
d) Analise as associações entre todas as variáveis, duas a duas, consideradas como explicativas - police, une
6 análises). O que você conclui.
e) Faça um modelo de regressão múltipla, associando a variável resposta, taxa de homicídios, com as quatro
f) Calcule o coeficiente de determinação R2, e interprete o seu significado neste problema.
g) Analise os gráficos de resíduos para cada uma das variáveis explicativas e conclua sobre a linearidade das
h) Escreva um breve resumo de todas as suas análises.

5) (Ragsdale, ex. 9.8) Roger Gallagher tem um lote de carros usados formado apenas por corvettes usadas.
regressão para ajudar a prever o preço que espera receber pelos carros que possui. Roger coletou os dados
Carros, que descreve a milhagem, o ano do modelo, presença de teto em T e preço de venda de alguns carro
meses recentes. Y representa o preço de venda, X1 a milhagem, X2 o ano do modelo, e X3 a presença (ou aus

a) Se Roger quiser usar uma função de regressão linear simples para estimar o preço de venda de um carro,
recomenda que ele use?
b) Determine as estimativas dos parâmetros para a função de regressão representada por:

Qual é a função de regressão estimada? X2 ajuda a explicar o preço de venda dos carros se X 1 também estiv
ser a razão para isso?
c) Configure uma variável binária (X3i) para indicar se cada carro na amostra tem ou não um teto em T. Determ
parâmetros para a função de regressão representada por:

X3 ajuda a explicar o preço de venda dos carros se X 1 também estiver no modelo? Explique.
d) De acordo com o modelo anterior, em média, quanto um teto em T aumenta o valor de um carro?
e) Determine as estimativas dos parâmetros para a função de regressão representada por:

Qual é a função de regressão estimada?


f) De todas as funções de regressão consideradas aqui, qual você recomenda que Roger use?
6) (Ragsdale, ex. 9.10 - adaptado) Voltanto ao exercício 6 da Aula passada, sobre a Golden Years Easy Ret
agora que o analista de orçamento foi contratado novamente para coletar mais dados das instalações para cu
uma delas, ele obteve: o número de camas (X1), o número anual de pacientes-dia de internamento médico (X
pacientes-dia (X3) e se a instalação se localiza em zona rural ou não (X4). Os dados estão disponíveis na pla
analista continua sendo construir um modelo de regressão para estimar os salários anuais dos enfermeiros (Y
previstos para cada unidade.

a) Prepare gráficos de dispersão mostrando a relação entre os salários dos enfermeiros e cada uma das nova
Que tipo de relação cada gráfico sugere?
b) Se o analista de orçamento quisesse construir um modelo de regressão usando apenas uma variável indep
salários dos enfermeiros, que variável deveria ser usada?
c) Se o analista de orçamento quisesse construir um modelo de regressão usando apenas duas variáveis ind
6) (Ragsdale, ex. 9.10 - adaptado) Voltanto ao exercício 6 da Aula passada, sobre a Golden Years Easy Ret
agora que o analista de orçamento foi contratado novamente para coletar mais dados das instalações para cu
uma delas, ele obteve: o número de camas (X1), o número anual de pacientes-dia de internamento médico (X
pacientes-dia (X3) e se a instalação se localiza em zona rural ou não (X4). Os dados estão disponíveis na pla
analista continua sendo construir um modelo de regressão para estimar os salários anuais dos enfermeiros (Y
previstos para cada unidade.

a) Prepare gráficos de dispersão mostrando a relação entre os salários dos enfermeiros e cada uma das nova
Que tipo de relação cada gráfico sugere?
b) Se o analista de orçamento quisesse construir um modelo de regressão usando apenas uma variável indep
salários dos enfermeiros, que variável deveria ser usada?
c) Se o analista de orçamento quisesse construir um modelo de regressão usando apenas duas variáveis ind
salários dos enfermeiros, sendo uma delas o "o número total de pacientes-dia", que variáveis deveriam ser us
d) Se o analista de orçamento quisesse construir um modelo de regressão usando três variáveis independent
enfermeiros, que variáveis deveriam ser usadas?
e) Que conjunto de variáveis independentes resulta no valor mais elevado para a estatística R2 ajustado?
Linear Múltipla

l para distribuição dos artigos encomendados. A gerência


a em analisar os fatores que afetam os custos de
dependentemente do volume da encomenda. Foram
uição do depósito, as vendas e o número de encomendas
o, realize as análises solicitadas abaixo.
ensal de vendas. Analise a intensidade da correlação linear

o coeficiente de determinação, R 2. Você tem evidências de

ensal de encomendas. Analise a intensidade da correlação

o coeficiente de determinação, R 2. Você tem evidências de


?
res do custo de distribuição?
conclui a respeito do tipo de associação entre estas

reta de regressão.

e problema.
onclua sobre a linearidade das associações.
ndas é 600.000 e número de encomendas é 3.500.

ações preferenciais da Petrobras (PETR4), compilou os


PIB dos EUA, da China e do Brasil no período de 1998 a

que melhor se ajusta aos pontos do diagrama e avalie o

que melhor se ajusta aos pontos do diagrama e avalie o

a que melhor se ajusta aos pontos do diagrama e avalie o

a que melhor se ajusta aos pontos do diagrama e avalie o

omo uma reta? Algum deles não se mostrou adequado para

ETR4 sejam explicadas pelas variáveis Petróleo, PIB EUA,

o barril, PIB EUA for igual a US$12.000 bilhões, PIB China

opaganda na promoção de seus produtos. Especificamente,


opaganda em jornais. Uma amostra de 22 cidades, cujas
e teste de um mês. Para cada cidade é alocado um nível de
a a propaganda em jornais. As vendas do produto (em
ão durante o mês de teste são registrados. Esses dados
s análises solicitadas abaixo.

e $) e as despesas com propaganda em rádio e tv. Analise a

eficiente de determinação, R 2. Você tem evidências de que a


?
e $) e as despesas com propaganda em jornais. Analise a

o coeficiente de determinação, R 2. Você tem evidências de


duto?
das do produto?
conclui?
reta de regressão.
e $) e as despesas com propaganda em rádio e tv. Analise a

eficiente de determinação, R 2. Você tem evidências de que a


?
e $) e as despesas com propaganda em jornais. Analise a

o coeficiente de determinação, R 2. Você tem evidências de


duto?
das do produto?
conclui?
reta de regressão.

e problema.
onclua sobre a linearidade das associações.
rádio e tv de 62.000 e com propaganda em jornais de

outros fatores na taxa de homicídios da cidade de Detroit. A


s”. Foram analisadas as seguintes variáveis: o número de
ntegral por 100.000 habitantes (police), a percentagem de
por 100.000 habitantes (register) e os ganhos semanais

gister e weekly – construa um gráfico de dispersão de


ariáveis.
sposta a taxa de homicídios e cada uma das outras

riável explica a maior proporção da variação observada

como explicativas - police, unemp, register e weekly (serão

a de homicídios, com as quatro variáveis explicativas.


e problema.
onclua sobre a linearidade das associações.

apenas por corvettes usadas. Ele quer criar um modelo de


ossui. Roger coletou os dados encontrados na planilha
preço de venda de alguns carros que ele comercializou em
modelo, e X3 a presença (ou ausência) de teto em T.

o preço de venda de um carro, que variável X você

sentada por:

dos carros se X 1 também estiver no modelo? Qual poderia

m ou não um teto em T. Determine as estimativas dos

lo? Explique.
o valor de um carro?
sentada por:

que Roger use?


obre a Golden Years Easy Retirement Homes, considere
dados das instalações para cudado de idodos. Para cada
-dia de internamento médico (X2), o número total de
dados estão disponíveis na planilha Idosos2. O objetivo do
ários anuais dos enfermeiros (Y), salários que devem ser

fermeiros e cada uma das novas variáveis independentes.

ndo apenas uma variável independente para prever os

ndo apenas duas variáveis independentes para prever os


obre a Golden Years Easy Retirement Homes, considere
dados das instalações para cudado de idodos. Para cada
-dia de internamento médico (X2), o número total de
dados estão disponíveis na planilha Idosos2. O objetivo do
ários anuais dos enfermeiros (Y), salários que devem ser

fermeiros e cada uma das novas variáveis independentes.

ndo apenas uma variável independente para prever os

ndo apenas duas variáveis independentes para prever os


, que variáveis deveriam ser usadas?
ndo três variáveis independentes para prever os salários dos

a a estatística R2 ajustado?
Vendas pela Internet
Mês Vendas ($1.000) Número de Encomendas Custo de Distribuição ($1.000)
1 386 4015 52.95
2 446 3806 71.66
3 512 5309 85.58
4 401 4262 63.69
5 457 4296 72.81
6 458 4097 68.44
7 301 3213 52.46
8 484 4809 70.77
9 517 5237 82.03
10 503 4732 74.39
11 535 4413 70.84
12 353 2921 54.08
13 372 3077 62.98
14 328 4428 72.30
15 408 3964 58.99
16 491 4582 79.38
17 527 5582 94.44
18 444 3450 59.74
19 623 5079 90.50
20 596 5735 93.24
21 463 4269 69.33
22 389 3708 53.71
23 547 5387 89.18
24 415 4161 66.80
PETR4
Data PETR4 PETRÓLEO PIB EUA PIB CHINA PIB BR
(R$) (US$) (Bilhões US$) (Bilhões US$) (Bilhões US$)
31/03/98 4.35 14.26 8936.20 187.49 99.97
30/06/98 3.45 13.38 8995.30 222.00 107.36
30/09/98 1.96 14.68 9098.90 238.80 109.39
31/12/98 2.20 10.53 9237.10 289.79 105.82
31/03/99 3.94 15.24 9315.50 203.05 100.54
30/06/99 4.56 17.51 9392.60 237.77 106.53
30/09/99 4.76 23.58 9502.20 255.51 108.34
31/12/99 7.62 25.08 9671.10 307.18 108.20
31/03/00 7.96 24.77 9695.60 219.50 105.30
30/06/00 9.19 30.57 9847.90 257.50 110.70
30/09/00 8.89 29.84 9836.60 273.40 112.91
31/12/00 7.72 23.87 9887.70 329.60 112.95
31/03/01 8.31 24.74 9875.60 237.28 109.01
30/06/01 9.55 26.08 9905.90 277.59 113.26
30/09/01 9.25 23.26 9871.10 292.54 113.23
31/12/01 9.23 19.90 9910.00 351.35 112.16
31/03/02 10.82 25.92 9977.30 256.26 109.09
30/06/02 9.20 25.58 10031.60 299.79 115.37
30/09/02 6.92 28.75 10090.70 316.23 117.44
31/12/02 8.90 28.66 10095.80 379.81 117.66
31/03/03 9.22 27.18 10126.00 282.66 111.77
30/06/03 10.11 28.33 10212.70 323.48 116.49
30/09/03 12.05 27.61 10398.70 346.59 118.12
31/12/03 15.86 30.17 10467.00 417.41 118.46
31/03/04 18.24 31.51 10543.60 310.36 117.71
30/06/04 16.49 34.50 10634.20 354.53 125.24
30/09/04 20.02 46.38 10728.70 378.13 124.09
31/12/04 21.41 40.46 10796.40 457.07 124.34
31/03/05 22.73 54.29 10878.40 341.08 121.05
30/06/05 24.04 55.58 10954.10 390.34 128.75
30/09/05 32.55 63.48 11074.30 415.19 127.88
31/12/05 33.98 58.98 11107.20 502.32 128.17
31/03/06 39.93 65.91 11238.70 376.56 126.04
30/06/06 40.54 73.51 11306.70 435.23 130.62
30/09/06 38.11 62.48 11336.70 459.20 133.77
31/12/06 47.87 60.86 11395.50 554.56 134.72
31/03/07 44.75 68.10 11412.60 418.35 132.09
30/06/07 50.48 71.41 11520.10 487.02 138.35
30/09/07 58.50 79.17 11658.90 512.01 141.34
31/12/07 88.07 93.85 11677.10 616.67 142.34
Propaganda
Cidade rádio e TV ($1.000) jornais ($1.000) Vendas ($1.000)
1 0 40 973
2 0 40 1119 Custo
3 25 25 875
2000
4 25 25 625
5 30 30 910 1800
6 30 30 971 1600
7 35 35 931 1400 f(x) = 12.162044198895 x +
8 35 35 1177 R² = 0.48526328499208
1200
9 40 25 882
10 40 25 982 1000
11 45 45 1628 800
12 45 45 1577 600
13 50 0 1044
400
14 50 0 914
15 55 25 1329 200
16 55 25 1330 0
17 60 30 1405 0 10 20
18 60 30 1436
19 65 35 1521
20 65 35 1741
21 70 40 1866
22 70 40 1717
Custo Propaganda x Venda
2000
1800
1600
1400 f(x) = 12.162044198895 x + 699.957182320442
R² = 0.48526328499208
1200
1000
800
600
400
200
0
0 10 20 30 40 50 60 70 80
Homicídios
Ano homicide police unemp register weekly
1961 8.60 260.35 11.00 215.98 117.18
1962 8.90 269.80 7.00 180.48 134.02
1963 8.52 272.04 5.20 209.57 141.68
1964 8.89 272.96 4.30 231.67 147.98
1965 13.07 272.51 3.50 297.65 159.85
1966 14.57 261.34 3.20 367.62 157.19
1967 21.36 268.89 4.10 616.54 155.29
1968 28.03 295.99 3.90 1029.75 131.75
1969 31.49 319.87 3.60 786.23 178.74
1970 37.39 341.43 7.10 713.77 178.30
1971 46.26 356.59 8.40 750.43 209.54
1972 47.24 379.69 7.70 1027.38 240.05
1973 52.33 390.19 6.30 666.50 258.05
Carros
Mileage (X1) Year (X2) T-Top (X3) Price (Y)
115 1968 1 13875
95 1970 0 11000
125 1972 0 8000
85 1974 1 14950
77 1976 1 15625
105 1978 0 11300
88 1979 0 13250
73 1981 1 16500
55 1983 0 16500
65 1987 1 19500
45 1988 0 22300
15 1988 0 25500
23 1991 1 31900
Idosos 2

Número anual de
pacientes-dia de Número total de Instalação rural (1) e
Número de camas
internamento médico pacientes-dia não-rural (0)
(100s)
137 128 385 0
59 155 203 1
120 281 392 0
120 291 419 0
120 238 363 0
65 180 234 1
120 306 372 1
90 214 305 1
96 155 169 0
120 133 188 1
62 148 192 0
120 274 300 1
116 154 321 0
59 120 164 1
80 261 284 1
120 338 375 1
80 77 133 1
100 204 318 1
60 97 213 1
110 178 280 1
120 232 336 0
135 316 442 0
59 163 191 1
60 96 202 0
25 74 83 1
75 225 250 1
64 91 214 1
62 146 204 0
108 255 366 1
62 144 220 1
90 151 286 0
146 100 375 0
62 174 189 1
30 54 88 1
79 213 278 0
44 127 158 1
120 208 423 0
100 255 300 1
49 110 177 1
123 208 336 1
82 114 136 1
58 166 205 1
110 228 323 1
62 183 222 1
86 62 200 1
102 326 355 1
135 157 471 0
78 154 203 1
83 224 390 1
60 48 213 0
54 119 144 1
120 217 327 0
Salários anuais dos
enfermeiros ($100s)

5230
2459
6304
6590
5362
3622
4406
4173
1955
3224
2409
2066
5946
1925
4166
5257
1988
4156
1914
5173
4630
7489
2051
3803
2008
1288
4729
2367
5933
2782
4651
6857
2143
3025
2905
1498
6236
3547
2810
6059
1995
2245
4029
2784
3720
3866
7485
3672
3995
2820
2088
4432

Você também pode gostar