Você está na página 1de 10

Exercícios de Estatística Profª Josefa A .

Alvarez 1

Exercícios de Estatística – Correlação e Regressão


(Exercícios do livro: MONTGOMERY, Douglas C. e RUNGER, George C. Estatística Aplicada e
Probabilidade para Engenheiros. 2 ed. Rio de Janeiro: LTC, 2003.)
Correlação
1- Os dados abaixo representam o número de rendas pessoais tributáveis e o registro de automóveis
de passageiros em um ano.
a) Calcular a correlação linear entre as duas variáveis?
b) Verificar ao nível de 5% se o coeficiente de correlação é zero ou diferente?
Regiões A B C D E
X = número de rendas tributáveis (em milhares) 192 80 162 246 310
Y = Número de carros de passageiros (milhares) 23 11 13 31 91

ΣX= 990 n= 5 SXX= 30104


ΣY= 169 ΣX2= 226124 SYY= 4348,8
2
ΣXY= 43238 ΣY = 10061 SXY= 9776
Resp. a) r = 0,854 b) H0: =0 Tcal =2,848 Não podemos rejeitar Ho com nível de significância de 5%
2- Uma amostra de tamanho 1 5 apresentou um coeficiente de correlação igual a 0,40. Pode- se
concluir ao nível de 5% que o coeficiente de correlação da população é zero ou diferente?
Resp. H0: =0 Tcal =1,574 Não podemos rejeitar Ho com nível de significância de 5%
3-Uma empresa de propaganda testou o grau de memorização proporcionado por 10 anúncios de
televisão através de dois grupos, um de homens e outro de mulheres. Ambos os grupos possuíam
idênticas características sócio-econômicas. Os resultados em termos do grau de memorização relativa
encontram-se na tabela.
Anúncios A B C D E F G H I J
Homens 8 3 9 2 7 10 4 6 1 5
Mulheres 9 5 10 1 8 7 3 4 2 6
Calcule o coeficiente de correlação ordinal (Spearman). b) Verificar ao nível de 5% se o coeficiente de
correlação é zero ou diferente?
Resp. a) Resp. rs=0,855 b) H0: =0 Tcal =4,654 podemos rejeitar Ho com nível de significância de 5%
4- Para os dados da tabela abaixo;
a) Determinar o coeficiente de correlação linear (Pearson) e verifique ao nível de 5% se o coeficiente
de correlação é zero ou diferente b) Determinar o coeficiente de correlação ordinal (Spearman) e
verifique ao nível de 5% se o coeficiente de correlação é zero ou diferente.
Estudantes A B C D E
Alturas (cm) 183 175 168 178 173
Peso (Kg) 77 75 68 82 84
X 877 n= 5 SXX= 125,2000
Y 386,00 X  153951,00

SYY= 158,8000
XY= 67768,00 Y 29958,00 SXY= 63,6000
Resp. a) Resp. r=0,45 ;H0: =0 Tcal =0,875 Não podemos rejeitar Ho com nível de significância de 5%
b) Resp.. rs=0,3 ;H0: =0 Tcal =0,545 Não podemos rejeitar Ho com nível de significância de 5%
5- A tabela a seguir relaciona os pesos (em centenas de libras) e as taxas de consumo de
combustível ( em mi/gal) para uma amostra de carros de passeio novos.
Peso 60 62 65 65 66 66 68 6 9 70 70
Consumo 61 60 64 64 64 68 70 70 71 69
Calcular o Coeficiente de correlação linear por postos de Spearman R. rsp = 0,9152
Exercícios de Estatística Profª Josefa A . Alvarez 2

Regressão
1. Um artigo em Concrete Research(“Near Surface Characteristics of Concrete: Intrinsic
Permeability”) apresentou dados sobre resistência à compressão (X) , e permeabilidade intrínseca (Y),
de várias misturas e curas de concreto. Um sumário das quantidades é: n = 14 ΣY = 572 ΣX =
2 2
43 ΣY = 23.530 ΣX = 157,42 e ΣXY = 1.697,80. Considere que as duas variáveis estejam
relacionadas através de um modelo de regressão linear simples.
X= 43 n= 14 Sxx= 25,349
2
Y= 572 X = 157,42 Syy= 159,714
2
XY= 1697,8 Y = 23530 Sxy= -59,057
a) Calcule as estimativas de mínimos quadrados da inclinação e da intersecção
b) Use a equação da reta ajustada para prever que o valor de permeabilidade seria observado quando
a resistência à compressão fosse X = 4,3
c) Dê uma estimativa da permeabilidade média quando a resistência à compressão for X = 3,7
Encontre um intervalo de Confiança de 95% para cada um dos itens:
d) Declive (β1) e) Intercepto (β0)
f) encontre um intervalo permeabilidade média quando X = 2,5 (Valor médio)
g) encontre um intervalo de previsão de 95% para permeabilidade quando X = 2,5.(individual)
Respostas: a) B1 = -2,33 B0 = 48,013 b) Yˆ = 37,99 c) Yˆ = 39,39
d) IC(1;95%)= [-2,917, - 1,742] e) IC( 0;95%)= [46,043, 49,983]
f) IC(µY;95%)= [41,329 , 43,047] g) IC(Y;95%)= [39,108 , 45,269]
2. Métodos de regressão foram usados para analisar dados provenientes de um estudo de
investigação da relação entre a temperatura (X) da superfície da estrada e a deflexão (Y) do
pavimento. Um sumário das quantidades é: n = 20 ΣY = 12,75 , ΣY2 = 8,86 , ΣX = 1.478 , ΣX2
= 143.215,8 e ΣXY = 1.083,67
X= 1.478 n= 20 Sxx= 33991,600
Y= 12,75 X2= 143.215,80 Syy= 0,732
XY= 1.083,67 Y2 = 8,86 Sxy= 141,445
a) Calcule as estimativas de mínimos quadrados da inclinação e da intersecção.
b) Use a equação da reta ajustada para prever que valor da deflexão do pavimento seria observado
quando a temperatura da superfície fosse 85o F
c) Qual será a deflexão média do pavimento quando a temperatura da superfície for 90oF
Respostas: a) B0= 0,330 B1 = 0,004 b) 0,684 c) 0,705
3. Um artigo no Journal of Environmental Engeneering reportou os resultados de um estudo a
respeito da ocorrência de sódio e cloreto nas correntes superficiais de um rio na parte central de
Rhode Island. Os dados a seguir se referem a Y = concentração de cloreto (em mg/l), e
X = a área das encostas exploradas para análise em (%)
X 0,19 0,15 0,57 0,70 0,67 0,63 0,47 0,70 0,60
Y 4,4 6,6 9,7 10,6 10,8 10,9 11,8 12,1 14,3
X 0,78 0,81 0,78 0,69 1,30 1,05 1,06 1,74 1,62
Y 14,7 15 17,3 19,2 23,1 27,7 27,7 31,8 39,5
X 14,51 n= 18 SXX= 3,01
Y 307,20 X  14,71

SYY= 1500,78
XY= 309,63 Y 6743,66 SXY= 61,99
a) Ajuste um modelo de regressão linear simples usando o método dos mínimos quadrados
b) Estime a concentração média de cloreto para 1% da área das encostas exploradas
c) Calcule: i) SE ii) S B1 iii) SB0 iv) R2
d) Testar a hipótese Ho: β1 = 0 contra H1: β1 ≠ 0 adotando  = 0,01 usando o teste t
Exercícios de Estatística Profª Josefa A . Alvarez 3
Respostas: a) B0 = 0,467543 B1 = 20,59161 b) 21,06
c) i) SE =3,7436 ii) SB1 =2,1575iii) S B0= 1,9502 iv) 0,8506 d) to = 9,5440rejeitar
Estatística de regressão
R múltiplo 0,9223
R-Quadrado 0,8506
R-quadrado ajustado 0,8413
Erro padrão 3,7436
Observações 18
ANOVA gl SQ MQ F F de significação
Regressão 1 1276,549 1276,549 91,08827 5,24E-08
Resíduo 16 224,2307 14,01442
Total 17 1500,78
Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores
Interseção 0,4675 1,9502 0,2397 0,8136 -3,6668 4,6019
X 20,5916 2,1575 9,5440 0,0000 16,0178 25,1654
4. Um motor de um foguete é fabricado ligando-se dois tipos de propelentes: um iniciador e um
mantenedor. Pensa-se que a tensão de cisalhante na ligação (Y), seja uma função linear da idade do
propelente (X), quando o motor for moldado. Vinte observações deram os seguintes resultados:
X= 266,75 n= 20 Sxx= 1114,659
Y= 42.648,15 X =2
4.672,44 Syy= 1699420,929
XY= 527.619,89 Y = 92.642.655,85
2
Sxy= -41199,813
a) Calcule a reta de regressão linear pelo método dos mínimos quadrados
b) estime a tensão cisalhante de um motor feito a partir de um propelente com 20 semanas
c) Encontre um intervalo de confiança de 95% para cada um dos itens:
i) Intercepto ii) Declive
iii) Encontre o Intervalo de previsão de 95% para a tensão cisalhante média quando a idade for X =
20 semanas
iv) Encontre o Intervalo de previsão de 95% para a tensão cisalhante quando a idade for X = 20
semanas (valor individual)
Respostas: a) Ŷ = 2.625,3855 – 36,9618X b) Ŷ = 1886,1495
c) i) IC( 0;95%)= [2530,115; 2720,656] ii) IC(1;95%)= [ -43,195 , -30,729 ]
iii) IC(µ Y;95%)= [1823,781 , 1948,518] v) IC(Y;95%)= [1668,905; 2103,394]
5. Os dados mostrados a seguir expressam X = o conteúdo de água na neve em 1 de abril e Y = o
campo (em polegadas) de abril a julho, nas encostas do Sanake River em Wyoming de 1919 a 1935.
Dados : n = 9 ΣX = 290,3 ΣX2 = 10.046,99 ΣY = 149,60 ΣY2 = 2.692,7
ΣXY = 5.180,37
X= 290,3 n= 9 Sxx= 683,202
Y= 149,6 2
X = 10.046,99 Syy= 206,016
XY= 5.180,37 Y = 2
2.692,70 Sxy= 354,939
a) Estime a correlação entre Y e X
b) Teste a hipótese de que ρ = 0 usando  = 0,05.
c) Ajuste um modelo de regressão linear d) Teste a hipótese Ho: β1 = 0 contra H1: β1 ≠ 0 com α =
0,05 (teste t)
Respostas: a) 0,946 b) to = 7,727 rejeitar Ho c) B0 = -0,135 B1 = 0,520 d) to = 7,727 rejeitar Ho
6. Nos dados abaixo Y = pureza de oxigênio, produzido por um processo químico de destilação e X é
a porcentagem de hidrocarbonetos presentes no condensador principal da unidade de destilação.As
seguintes quantidades podem ser computadas:
Exercícios de Estatística Profª Josefa A . Alvarez 4
2 2
n = 20 ΣX = 23,92 ΣY = 1.843,21 ΣX = 29,29 ΣY = 170.044,53 e ΣXY = 2.214,66
X= 23,92 n= 20 Sxx= 0,682
Y= 1.843,21 2
X = 29,29 Syy= 173,375
XY= 2.214,66 Y2 = 170.044,53 Sxy= 10,181
a) Determine o modelo ajustado da regressão linear simples
b) Calcule o erro padrão estimado da estimativa (Se) , do declive (SB1), erro padrão do intercepto
(SB0)
c) Teste a hipótese para : Ho :β1 = 0 contra H1: β1 ≠ 0 pelo teste T com  = 0,01
d) Teste a hipótese H0 : β1 = 0 e β1 ≠ 0 usando o teste F construa o Q.A .V. com  = 0,05
e) Calcule Intervalo de Confiança para o declive β1 com  = 0,05
f) Calcule o Intervalo de Confiança para o intercepto β0 com nível de significância  = 0,05
g) Calcule um intervalo de confiança para o valor médio quando X = 1% com  = 0,05
h) Calcule um intervalo de confiança para o valor individual quando X = 1% com  = 0,05
Respostas: a) Ŷ = 74,298 + 14,935X b) Se = 1,088 SB1 = 1,318 SB0= 1,595
c) to = 11,3289 rejeitar d) fo = 128,3442 rejeitar e) IC(1;95%)= [12,165; 17,705]
f) IC( 0;95%)= [70,947; 77,650] g) IC(µ Y;95%)= [88,488 ; 89,979]
h) IC(Y;95%)= [86,828; 91,639]
7 - Determinar o coeficiente de correlação Yˆ i = 10 - 0,28 Xi sabendo que
sx2 =25 sY2 =4. Resp.:r=-0,7
8 - Determinar a equação de regressão de Y em relação a X, sabendo que as variáveis são
negativamente correlacionadas e que:
X  0 Y  12 SX  8 SY  10 R2  0,64

Resp.: Yˆ i = 12 - Xi
9 - Supor que Yi =log do valor da produção por trabalhador e Xi = log da taxa salarial e que a letra i se
refira a i-ésima firma. Os resultados utilizando o método de mínimos quadrados são:
Firma X Yˆ i = - 0,4 + Xi onde n = 52 e SB1 =0,1
Firma Y Yˆ i = -0,3 + 0,8Xi onde n=50 e SB1 =0,1.
Determine o coeficiente de determinação de cada firma.
10 -Dada a saída do Excel Y = custo de produção
X = número de unidades produzidas
a) Determinar a equação linear de Y=f(X)
b) Calcular a estatística F e qual a conclusão ao nível de 5%. Verifique se existe regressão.
c) Calcular a estatística T e qual a conclusão ao nível de 5%. Verifique se existe regressão.
d) Calcular a estatística T ao nível de 5% para o intercepto, qual é a conclusão (reta passa pela
origem)?
e) Calcular o erro padrão da estimativa; do coeficiente linear e do coeficiente angular (declive).
f) Calcule o Coeficiente de determinação ou explicação (R-Quadrado) e Coeficiente de determinação
ajustado (R-quadrado ajustado)
g) Calcule os resíduos padronizados.
Exercícios de Estatística Profª Josefa A . Alvarez 5

RESUMO DOS RESULTADOS


Estatística de regressão
R múltiplo 0,987
R-Quadrado
R-quadrado ajustado
Erro padrão
Observações 5

ANOVA gl SQ MQ F F de significação
Regressão 28005,71 0,001677
Resíduo
Total 28720,00

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores


Interseção 40,000 11,814 0,043
Variável X 1,857 0,171 0,002

RESULTADOS DE RESÍDUOS
Observação Y previsto Resíduos
1 58,57 -8,57
2 77,14 -7,14
3 132,86 17,14
4 188,57 11,43
5 262,86 -12,86
a) Ŷ = 40,000+1,857X
b) Fcal=117,62>Ftab=10,128, devemos rejeitar Ho com =5%.
c) Tcal=10,86>Ttab=3,182, devemos rejeitar Ho com =5%.
d) Tcal=3,386>Ttab=3,182, devemos rejeitar Ho com =5%.
e) Se=15,430; S B0=11,814 S B1=0,171.
f) R2=0,9751 Rajust
2
=0,9668 g) -0,64;-0,53;1,28;0,85;-0,96
11- Verifique se a)os resíduos padronizados estão no intervalo de [-2;2]?
b) Os resíduos padronizados possuem distribuição normal?
Resposta a) Sim todos os resíduos estão no intervalo de [-2;2]. B) A distribuição dos resíduos é
normal pois eles estão alinhados em torno de uma reta

Resíduos Padronizados

2,00
1,50
1,00
Resíduos

0,50
0,00
-0,50160 165 170 175 180 185 190
-1,00
-1,50
-2,00
vendas
Exercícios de Estatística Profª Josefa A . Alvarez 6

Normal Probability Plot of the Residuals


(response is unid)
99

95
90

80
70
Percent

60
50
40
30
20

10

1
-3 -2 -1 0 1 2 3
Standardized Residual

12- Estime os Parâmetros, Calcule o coeficiente de determinação, Faça o diagrama de dispersão.


Qual é a conclusão?
x1 y1 x2 y2 x3 y3 x4 y4
10 8,04 10 9,14 10 7,46 8 6,58
8 6,95 8 8,14 8 6,77 8 5,76
13 7,58 13 8,74 13 12,7 8 7,71
9 8,81 9 8,77 9 7,11 8 8,84
11 8,33 11 9,26 11 7,81 8 8,47
14 9,96 14 8,1 14 8,84 8 7,04
6 7,24 6 6,13 6 6,08 8 5,25
4 4,26 4 3,1 4 5,39 19 12,5
12 10,8 12 9,13 12 8,15 8 5,56
7 4,82 7 7,26 7 6,42 8 7,91
5 5,68 5 4,74 5 5,73 8 6,89
Exercícios de Estatística Profª Josefa A . Alvarez 7

Linearização

x y
1 3,9
2 6,7
3 8,6
4 10
5 11

Modelo Potência y   0  x β1

Linearizando: lny  ln 0  β1  ln x

X 4,7874 n= 5 SXX= 1,6155 B1= 0,649 Se= 0,051  16,046
Y 10,12 X  6,20

SYY= 0,6882 B0= 1,402 SB0= 0,045  31,129
XY= 10,73 Y 21,15 SXY= 1,0483 R2 0,988 SB1= 0,040 r 0,994

x y X=ln(x) Y=ln(y) X2 Y2 XY
1 3,9 0,0000 1,3610 0,0000 1,8523 0,0000
2 6,7 0,6931 1,9021 0,4805 3,6180 1,3184
3 8,6 1,0986 2,1518 1,2069 4,6301 2,3640
4 10 1,3863 2,3026 1,9218 5,3019 3,1921
5 11 1,6094 2,3979 2,5903 5,7499 3,8593
4,7875 10,1153 6,1995 21,1522 10,7337

Modelo Exponencial: y   0  e β1.x

Linearizando: lny  ln 0  β1  x


x y X=x Y=ln(y) X2 Y2 XY
1 3,9 1,0000 1,3610 1,0000 1,8523 1,3610
2 6,7 2,0000 1,9021 4,0000 3,6180 3,8042
3 8,6 3,0000 2,1518 9,0000 4,6301 6,4553
4 10 4,0000 2,3026 16,0000 5,3019 9,2103
5 11 5,0000 2,3979 25,0000 5,7499 11,9895
15,0000 10,1153 55,0000 21,1522 32,8203
Exercícios de Estatística Profª Josefa A . Alvarez 8

X 15 n= 5 SXX= 10,0000 B1= 0,247 Se= 0,159  4,917


Y 10,12 X 55,00 SYY= 0,6882 B0= 1,281 SB0= 0,167  7,674
XY= 32,82 Y  21,15

SXY= 2,4743 R 2
0,890 SB1= 0,050 r 0,943

Linear y X2 Y2 XY
1 3,9 1,0000 15,2100 3,9
2 6,7 4,0000 44,8900 13,4
3 8,6 9,0000 73,9600 25,8
4 10 16,0000 100,0000 40
5 11 25,0000 121,0000 55
15 40,2 55,0000 355,0600 138,1000
X 15 n= 5 SXX= 10,0000 B1= 1,750 Se= 0,640  8,653
Y 40,20 X 55,00 SYY= 31,8520 B0= 2,790 SB0= 0,671  4,160
XY= 138,10 Y  355,06

SXY= 17,5000 R 2
0,961 SB1= 0,202 r 0,981

FORMAS FUNCIONAIS COMUMENTE UTILIZADAS


TIPO FORMA ORIGINAL LINEARIZAÇÃO
1- Linear y = a + bx Nenhuma
2- Logrítmica ou potencial y= axb Lny= Lna + bLnx
3- Exponencial ou semilogrítmica y = abx Lny= Lna + xLnb
4- Recíproca I ou Hiperbólica y = a + b(1/x) Usa-se 1/x em vez de x
5- Recíproca II ou Hiporbólica y = 1 / [a + bx] Usa-se 1/y em vez de y
6- Semilogarítmica eY = a.xb y = Lna + bLnx
7- Logística y= [M/(1 + b.e-mx) Ln(M/y-1)= Lnb – mx
Exercícios de Estatística Profª Josefa A . Alvarez 9
13- A administração de um banco desejava estabelecer um critério objetivo para avaliar a eficiência
de seus gerentes. Para isso levantou, para cada um dos subdistritos onde possuía agência, dados a
respeito do depósito médio mensal por agência e o número de estabelecimentos comerciais existentes
nesses subdistritos. Os dados são os seguintes:
Subdistritos X=nº de Estabelecimentos Comerciais Y=Depósito médio por Agência
Nossa Senhora do Ó 16 14
Casa Verde 30 16
Vila Formosa 35 19
Santana 70 30
Barra Funda 90 31
J.Paulista 120 33
Santo Amaro 160 35
Lapa 237 43
Pinheiros 378 50
Qual o modelo que você escolheria (linear; exponencial ou potência) ? Faça a previsão do Depósito
médio por Agência (R$10,00) se X=200
Linear Ŷ  17,944  0,0964X R2=0,8767 Potência Ŷ  4,3219x 0,4213 R2=0,969
Exponencial Ŷ  18,486e 0,0032x R2=0,7423
Melhor modelo Potência Ŷ  4,3219x 0,4213 R2=0,969 Ŷ  4,3219.2000,4213 =40,27
Linear y = 0,0964x + 17,944
Potência y = 4,3219x 0,4213
R2 = 0,969
R2 = 0,8767 60
60
50
50
40
40
30 30

20 20
10 10
0 0
0 100 200 300 400 0 100 200 300 400

Exponencial y = 18,486e0,0032x
R2 = 0,7423
70
60
50
40
30
20
10
0
0 100 200 300 400
Exercícios de Estatística Profª Josefa A . Alvarez 10
14- No processo de estimação dos parâmetros do modelo de regressão linear simples, obtivemos os seguintes
resultados:
X  44,4 n  12 S xx  2018,5 SYY  125,98 Yˆ  1,15  0,24X se2  0,97144
a) Verifique se existe regressão. Construa o Quadro de analise de variância. Nível de significância =0,05
b) Encontre o intervalo de confiança para os parâmetros do modelo linear. Adote nível de significância =0,05
15- No processo de estimação dos parâmetros do modelo de regressão linear simples, obtivemos os seguintes
resultados: R
2
 0,877 n  20 Yˆ  74,298  14,935X SQ Re s  1,185 s B 0  1,595
a) Calcule o coeficiente de determinação ajustado
b) Verifique se existe regressão. Construa o Quadro de analise de variância. Nível de significância =0,05
c) Verifique se a reta passa pela origem
H 0 : 1  7
d) Teste a hipótese  Adote nível de significância =0,05
H1 : 1  7

Você também pode gostar