Você está na página 1de 15

3.

Para uma determinada empresa são conhecidos os seguintes dados, referentes ao volume de
vendas (em milhões de pesetas) e gastos com publicidade (em milhares de pesetas) dos últimos 6
anos:

Volume de vendas (mill. Ptas) Despesas com publicidade (milhares de ptas.)

10 16

15 32

20 48

22 56

30 64

32 80

a) Existe uma relação linear entre as vendas da empresa e seus gastos com publicidade? Raciocine a
resposta.
b) Obter as linhas de regressão menos quadrática.
c) Que volume de vendas da empresa se poderia esperar em um ano para gastar publicidade 60000
pesetas? E para uma despesa publicitária de 200000 pesetas?
d) Se a única coisa que importasse fosse a evolução do volume de vendas em termos de despesas
publicitárias, sem levar em conta o valor específico de cada uma delas, haveria uma correlação
ordinal entre as duas variáveis?

SOLUÇÃO:

a) Vamos desenhar o gráfico de dispersão primeiro:

Despesas
com publicidade (milhares de ptas.)
Observando-a, podemos dizer que existe uma relação linear entre ambas as variáveis.

Calculamos agora o coeficiente de determinação linear para obter uma medida descritiva do grau de
associação linear existente entre as variáveis. A expressão do coeficiente de determinação é:
S2 S2xs7
-* -

Onde Sxy representa a covariância das variáveis X e Y. Cuja expressão simplificada é:

2XY --
Sxy = n X X}

Para esclarecer a forma de cálculo construímos a seguinte tabela: (variável X = Despesas de


publicidade e variável Y = Volume de vendas)

E X E2 X2 XY

10 16 100 256 160

15 32 225 1024 480

20 48 400 2304 960

22 56 484 3136 1232

30 64 900 4096 1920

32 80 1024 6400 2560

129 296 3133 17216 7312

X=49.333; Y=21,5; sx=20.870; sxy=158

Substituindo obtemos que r2 vale 0,956 que é o que esperaríamos depois de observar o gráfico de dispersão.

b) Se expressarmos as linhas de regressão como y*= a+bx e x*=c+dy os coeficientes daqueles calculados
são os seguintes:
5
, -xy -b = —2 a =y - b y, x
-Para
5-'
s d=- c =x -dxy
e '

Aplicando-os a este problema obtemos as linhas de regressão:

Y*=3,604+0,363x ; X*=-7,356+2,637y

c) Para fazer a previsão do volume de vendas utilizamos a linha de regressão que as vendas possuem em
função dos gastos com publicidade. Para um gasto publicitário de 60000 pesetas obteremos um volume de
vendas de x*=3,604+0,363*60=25,384 milhões de pesetas.

Se o gasto for de 200 milhões de pesetas não podemos usar a linha de regressão, pois o valor 200 está fora
do caminho dos gastos com publicidade. Se substituirmos dá-nos um valor de 76204 milhões de pesetas,
porque as linhas só são válidas dentro do intervalo ou para valores próximos dos finais do percurso.

d) Para resolver esta seção calculamos o coeficiente de correlação ordinal de Spearman. O coeficiente
de Spearman consiste no cálculo do coeficiente de correlação linear dos dados transformados através
da função intervalo.

E 10 15 20 22 30 32

X 16 32 48 56 64 80

Rang Y 1 2 3 4 5 6

Rang X 1 2 3 4 5 6

Di 0 0 0 0 0 0 0

Di 2
0 0 0 0 0 0 0

O coeficiente de Spearman quando não há empates nas fileiras, como nesses dados, tem a seguinte
expressão:

N3-N

Neste caso rs é 1, portanto, há correlação ordinal positiva e perfeita, ou seja, quanto maior o gasto com
publicidade, maior o volume de vendas.

(Podemos ver que a correlação linear não é perfeita e, no entanto, a correlação ordinária é.)
4. Um banco estatal de um determinado país estuda a possibilidade de baixar as taxas de juro para
incentivar o investimento privado e, assim, abrir a possibilidade de criação de emprego. Para isso,
contrasta as taxas de juros reais de diferentes países com
o investimento privado neles, tudo durante o último período. Obtendo os resultados refletidos na
tabela a seguir:

Taxas de juros (tantas por uma)


INVESTIMENTO 0.05-0.10 0.10-0.15 0.15-0.20 0.20-0.25
(milhares de usinas

10-50 2 6

50-100 1 5

100-150 1 4

150-200 5 1

a) Existe uma relação linear entre as duas variáveis? Raciocine a resposta.


b) Constrói a reta de regressão que explica a inversão no fluxo das taxas de juros reais.
c) Como o investimento mudaria se houvesse um aumento de uma unidade nas taxas de juros reais?
Raciocinar sem fazer cálculos.
d) Se a taxa de juros real cair de 0,18 para 0,09, como o investimento variaria?

SOLUÇÃO:

Para facilitar o acompanhamento dos cálculos necessários para resolver o problema construímos a seguinte
tabela resumida: (variável X = taxa de juros real; variável Y = investimento).

YX 0.075 0.125 0.175 0.225 Margarida fi xi fi ei

30 0 0 2 6 8 240 7200

75 0 1 5 0 6 450 33750

125 1 4 0 0 5 625 78120

175 5 1 0 0 6 1050 183750

6 6 7 6 25 2365 302850
Marg. X

fi xi 0.45 0.75 1.225 1.35 3.775

fi xi2 0.03375 0.09375 0.21438 0.30375 0.64563

fijeixj 0 0 10.5 40.5 285.375

0 9.375 65.625 0
9.375 62.5 0 0

65.625 21.875 0 0

X(média)=0,151; Y(média)=94,6; sx=0,055; sy=56.248; sxy=-2,870

1. Para estudar a relação linear entre as variáveis taxa de juros e investimento, utilizaremos o
coeficiente de determinação como medida descritiva desse fato.
2. y*=237.863-948.760x
3. O incremento de uma unidade da variável independente coincide com o valor da inclinação da
reta; Neste caso o aumento será de -948.760( observamos que neste problema o aumento é fictício
porque 1 sai do caminho da variável independente).
4. O aumento será o produto entre a inclinação e a diferença entre a taxa de juros nos dois estados,
ou seja, aumenta em -948.760*(0,09-0,18)=85,388 bilhões.

5. Uma gravadora coletou as seguintes informações sobre 15 grupos musicais, nomeadamente o


número de concertos realizados neste verão e as vendas recordes desses grupos (em milhares de LPs),
obtendo os seguintes dados:

CONCERTOS

Lps 10-30 30-50 50-70

1-6 3 2 1

6-11 1 4 1

11-16 2 1 5

a) Calcular o número médio de LPs vendidos por esses grupos.


b) Obter a reta de regressão que explica a dependência linear
c) Se um grupo musical vendeu 1800 LPs, que número de concertos está previsto para este verão?

SOLUÇÃO: a) 9000 LPs

c) y*=28,22+1,42x

d) y*=28,22+1,42*1,8=30776 Concertos.
6. Com o objetivo de analisar se existe uma relação linear entre o consumo de energia elétrica
(kw.hora), variável X e o volume de produção em milhões de pesetas, variável Y, de uma empresa
obtiveram-se as seguintes informações:

x = 0,151; y = 94,6;5, = 0,055; S. = 56.248; s, = -2.870 - - - •

Solicita-se:

1. Ajuste a linha de regressão linear que explica o consumo de eletricidade em f i do volume de


produção. Razão da validade da linha montada

SOLUÇÃO:

a) y*=-10,746+2,202x

b) r=0,959

7. Uma empresa de manufatura baseia suas previsões anuais de vendas nos resultados oficiais da
demanda total do setor. Abaixo estão os dados da demanda total e das vendas realizadas pela
empresa nos últimos 11 anos.

Demanda total Vendas


(milhares de MT) (milhares de
20 MT) 9
0
22 6
0
40 12
0
33 7
0
21 5
0
39 10
0
28 8
0
14 4
0
28 7
0
29 10
0
38 14
0
1. Desenhe os gráficos de dispersão dos dados.
2. Desenhe a linha que melhor se ajusta aos dados.

3. Por meio de um ajuste mínimo quadrático encontre a linha que melhor se adapta às vendas
da empresa em função da demanda total. Se a demanda industrial total for de 300000
toneladas, que volume de vendas seria previsto usando a linha de regressão calculada?
4. Realiza a validade do ajuste linear feito na seção anterior.
Usando o método robusto de ajuste de uma linha com base na mediana, para obter uma linha
de ajuste nos termos da alínea c). Faça a previsão da seção c. usando esta linha
SOLUÇÃO:

1. X=Demanda Total, Y=Vendas

Diagrama de dispersão
dem. T./Vendas

2. y*=0,422+0,028x; y*=0,422+0,028*300=8,822 mil toneladas.


3. r=0,801; r2=0,642.
4. Para calcular a linha robusta de ajuste com base na mediana, procedemos da seguinte forma:
1. A amostra ordenada pela variável X é dividida em três partes aproximadamente iguais,
neste caso tomamos 4, 3 e 4.
2. A mediana é calculada para as variáveis X e Y no primeiro e terceiro subconjuntos de
dados.

Primeiro subconjunto: x1=Me(X)=205 ; e1=Eu(Y)=5,5

Terceiro subconjunto: x2=Me(X)=385 ; e2=Eu(Y)=11

3. Juntando os pontos, temos a linha de ajuste robusta. As expressões para a inclinação(b r) e


para o termo independente (ar) são:

- 21
x2 - x1
^2y-. -
Q
x2 - x1
p
Substituindo obtemos eR = -0,764 + 0,031 * 300 = 8,536 mil Ton. ( NOTA: Ambas as
linhas são desenhadas no gráfico de dispersão. O sinal . do gráfico corresponde aos
pontos ( x 1,y1) e (x2,y 2) e o sinal (quadrado) aos dados do problema).

8. Estuda-se a relação entre o número de anos de filiação sindical e o nível de satisfação com o
desempenho do sindicato. Isso se baseia nos dados de 7 indivíduos retirados aleatoriamente de
pessoas ligadas a partidos políticos, obtendo-se:

Anos 8 7 10 3 6 13 4

Satisfação 7 5 8 5 9 9 3

1. Calcule o coeficiente de correlação linear. Comente o resultado obtido.


2. Prever o índice de satisfação de uma pessoa que é membro do sindicato há 11 anos. Sabendo
que o índice de satisfação é 6, preveja os anos que você está no sindicato

SOLUÇÃO:

1. r=0,711
2. y*=3,118+0,474x ; y*=3,118+0,474*11=8,332 na escala de satisfação.
3. x*=0,270+1,068*y; x*=0,270+1,068*6= 6,678 anos.

9. Numa região vitivinícola, a evolução do preço (em pesetas/litro) e da quantidade de produção (em
toneladas) foi observada ao longo de alguns anos. Veja a tabela:

Produção 25-35 35-45 45-55 55-65


100 2 5
110 1
120 3 1
140 4 2
160 2 3 1
200 5 2 1

1. Calcula a linha de regressão linear que coloca o preço como uma função da produção.
2. Analise fundamentada a validade da linha obtida acima.

Quais serão os valores do preço quando a produção estiver entre 115 e 135 toneladas? Raciocine a
resposta.
SOLUÇÃO:

1. y*=68,291-0,167x
2. r=0,556 ; r2=0,309
3. y*=68.291-0.167*115= 49.086 e y*=68.291-0.167*135=45.746 ; O preço será entre
45.746 e 68.291 pesetas

10. Considerando os seguintes conjuntos de dados:


Ou 1 2 3 4 5 6 7 8 9 10
V 3 5 6 5 7 9 10 9 10 10
W 4.543 4.543 4.543 4.543 4.543 4.543 4.543 4.543 4.543 14.117
X 6.646 6.646 6 6 6 7 7 5.684 8.838 14.186

1. Desenhe o gráfico de dispersão para cada um dos conjuntos de dados.


2. Calcular a reta de regressão de cada um dos conjuntos de dados e desenhá-la no gráfico de
dispersão, considerando as variáveis U, W, X como variáveis independentes.
3. Calcule o coeficiente de correlação linear para cada um dos conjuntos.
4. O que podemos observar?
5. A remoção dos valores atípicos recalcula as seções b e c.
6. Que outras linhas pareceriam mais adequadas nos sets anteriores? Raciocine a resposta.
7. Calcule a linha de ajuste robusta

Que conclusões podemos tirar deste problema?

SOLUÇÃO:

a)
2. v*=3,067+0,788u ; x*=3,067+0,788w
3. ruv=0,877 ; rlx=0,877
4. Podemos ver que ambas as linhas são exatamente iguais e que a relação linear em ambas é a
mesma, mas pode-se ver que nas variáveis U/V a reta é mais representativa do que no outro caso.
Observamos que a presença do outlier pode alterar o resultado esperado.
5. Nenhum outlier é visível no gráfico de dispersão U/V. No diagrama W/X nota-se a presença de um
outlier, que é o ponto ( 14.117,14.186) se o eliminarmos obtemos o x * = 6,646 e a associação
linear entre eles é nula,
6. Esta seção será feita para a variável U/V vR=3,571+0,714u.
7. A principal conclusão é que você deve sempre desenhar o gráfico de dispersão de dados.

11. Um gestor de recursos humanos quer determinar o salário a pagar por uma determinada
categoria de trabalhadores de colarinho azul. Determinar tais salários a serem pagos a uma
determinada categoria de trabalhadores. Para determinar esse salário, é realizado um estudo no qual
intervêm as variáveis Salário Mensal (em milhares de ptas), Nível de Produção Anual na Empresa
(em milhões de ptas) e Nível Médio de Especialização do Trabalhador (de 0 a 10). O gestor obtém
esta série de resultados:
Sal. 123.4 135.7 115.9 100.6 98.7 150.4 124.6 110.0 138.6 123.4

Prod. 300.5 325.9 298.6 200.9 300.4 359.8 279.6 215.6 250.0 300.0

Esp. 4.3 5.5 7.8 4.9 4.3 8.5 6.4 5.6 5.3 5.0

Solicita-se:

1. Calcule o plano de regressão linear quadrática mínima que explica o salário em


função da produção e do nível de especialização.
2. Estuda a validade da função obtida na seção anterior por meio de uma medida
descritiva. Quanto vale a variância residual?
3. Calcular o coeficiente de correlação parcial para duas variáveis explicativas.
4. Comente os resultados.

Que salário deveria ser pago se o nível de produção fosse de 315 milhões de ptas? e o nível médio de
especialização de 6,6?

SOLUÇÃO:

1) Variável Y=Salário Xi=Produção X2=Nível de especialização.

A tabela de cálculo é:

E X1 X2 E 2
X12
X2 2
YX1 YX2 X1X2

123.4 300.5 4.3 15227.6 90300.1 18.5 37081.7 530.6 1292.2

135.7 325.9 5.5 18414.5 106210.8 30.3 44224.6 746.5 1792.5

115.9 298.6 7.8 13432.8 89162.0 60.8 34607.7 904.0 2329.1

100.6 200.9 4.9 10120.4 40360.8 24.0 20210.5 492.9 984.4

98.7 300.4 4.3 9741.7 90240.2 18.5 29649.5 424.5 1291.7

150.4 359.8 8.5 22620.2 129456.0 72.3 54114.0 1278.4 3058.3

124.6 279.6 6.4 15525.2 78176.2 41.0 34838.32 797.4 1789.4

110.0 215.6 5.6 12100.0 46483.4 31.4 23716.0 616.0 1207.4

138.6 250.0 5.3 19210.0 62500.0 28.1 34650.0 734.6 1325.0


123.4 300.0 5.0 15227.6 90000.0 25.0 37020.0 617.0 1500.0

1221.3 2831.3 57.6 151619.8 822889.6 349.7 350112.2 7141.8 16570.0

A linha a ser construída terá a forma y* = a + b 1 x1 + b2 x2e para calcular os coeficientes da reta
aparece um Sistema de Equações como este:

Com esses dados o sistema de equações a serem resolvidas é:

1221,3 = 10a +2831,3b1+57,6b2

350112.2 =2831.3a +822889.6 b1 +16570.0b2

7141,8 =57,6a +16570,0b1 +349,7b2

Que tem pela solução a=56198 b 1=0,158 b2=3,664 . Portanto, o plano de regressão é:
y*=56,198+0,158x1+3,664x2

y" = 56,198 - 0,158x1 + 3,664x2

2) As medidas descritivas que utilizaremos são o coeficiente de determinação e o coeficiente de


correlação. E definido seria assim:
NNN
>( - M edia^z = ), O; -Mediay)2 + >6 - 02 i=1 i=1 i=1

O coeficiente de determinação múltiplo é expresso como:

pa _SCR__SCE__s2
SCT 5CT 57
Onde s2 é a variável residual.

Uma expressão da variância residual que simplifica o cálculo é:

3 ^"=1^ - OS "=1 Ji - ¿1 )
8n

Neste caso, R 2=0,438 R=0,661 s2=138,506

3 O coeficiente de correlação parcial entre a variável dependente e uma variável explicativa mede a força
da relação linear entre ambas quando eliminamos o efeito linear das demais variáveis explicativas. Seu
resultado é:

, SCE^x^) — SCE^x^x^)
^j F SCE(x¿
Tr

Onde SCE(xi) é a variação inexplicável . Observando essa expressão, vemos que o coeficiente de
determinação parcial nos dá o aumento relativo da variável aplicada. O coeficiente de correlação parcial é
obtido a partir da raiz quadrada do coeficiente de determinação. Neste caso, SCE(x 1)=1582.51 SCE(x
2)=1643.06 SCE(x1,x 2)=1385.06 r 2=0.157 r2=0.124

y*=56.198+0.158*315+3.664*6.6=130.15

12. O gestor de uma determinada empresa quer saber, aproximadamente, a demanda anual de
produto que será feita à empresa nos próximos anos. Para determinar essa demanda, realiza um
estudo em que intervêm as variáveis Preço Médio do Produto em um Ano (em pesetas), Taxa de
Inflação Anual (IPC) (em tantos por um) e Demanda Anual (em bilhões de pesetas). Em uma
amostra de 20 anos obtém-se os seguintes resultados: (Demanda = Y, Preço =
X1 , IPC= Xa )

16.945;>,x = 3230;),
X2 = 1,1;

>, YX, = 2609,452;}, YX¿ = 0,83631;), X, X2 = 188,81

)y2= 15,5035;) x = 538638;>,x2 = 0,0738

Calcular:

a) Determinar a partir do coeficiente de correlação linear múltipla a validade da


função anterior. Quanto vale a variância residual?
b) Determinar o coeficiente de correlação parcial para cada uma das variáveis
explicativas e calcular o coeficiente de determinação para YX. e YX, .
c) Que variação ocorre na procura se o preço aumenta 3 unidades enquanto o IPC
permanece fixo e se o IPC é reduzido em 0,03 enquanto o preço permanece fixo?
Raciocine a resposta.
d) Que variação percentual ocorreria na demanda se o preço variasse de 156 a 159
pesetas e o IPC se mantivesse constante e igual a 0,04?
e) Que volume de procura prevê para um ano em que o preço é de 159 pesetas e o IPC
anual esperado é de 3,5%?

SOLUÇÃO:

a) s2 = 0,008523; R' = 0,851363 'E ' 2-1-= ■

b) SCE(
x,=0,195185; SCE(
x2º)=0,458711; ECS(x,,x , )=0,17046;
r q 2 = 0,6283934;
r2=0,1266746; r2g = 0,829803; r2., = 0,600013.

c) A variação da demanda será três vezes a inclinação correspondente à variável Preço, neste caso haveria
uma redução na demanda de 0,0184 bilhão de pesetas. A variação na demanda será um aumento na
demanda de 0,061 bilhão de pesetas.

d) A variação percentual é o quociente entre a mudança total e a situação inicial por 100. Neste problema
estará:

(-0,0184/0,9115956)x100=-2,018%

e) y*=1,95191-0,00614697·159-2,03495·0,035=0,903 bilhões de pesetas.

Você também pode gostar