Escolar Documentos
Profissional Documentos
Cultura Documentos
Trabalho de Estatística - Correlação e Regressão
Trabalho de Estatística - Correlação e Regressão
CURITIBA
2010
1
DANIELE FERREIRA
TRABALHO DE ESTATÍSTICA
CURITIBA
2010
2
SUMÁRIO
1. EXERCÍCIO ..................................................................................................... 7
RESOLUÇÃO ...................................................................................................... 8
Item (a) – diagrama de dispersão ....................................................................... 8
Item (b) – Coeficiente de Pearson ...................................................................... 9
2. EXERCÍCIO ..................................................................................................... 9
RESOLUÇÃO .................................................................................................... 10
Item (a) – diagrama de dispersão ..................................................................... 10
Item (b) – Ponto Discrepante ........................................................................... 11
Item (c) – Coeficiente de Pearson ..................................................................... 11
Item (d) – Coeficiente de Pearson – sem ponto discrepante ........................... 12
4. EXERCÍCIO ................................................................................................... 13
RESOLUÇÃO .................................................................................................... 13
Item (a) – Coeficiente de Pearson .................................................................... 13
5. EXERCÍCIO ................................................................................................... 14
RESOLUÇÃO .................................................................................................... 14
Item (a) – Interpretação ................................................................................... 14
Item (b) – Interpretação ................................................................................... 14
Item (c) – Interpretação ................................................................................... 14
6. EXERCÍCIO ................................................................................................... 15
RESOLUÇÃO ...................................................................................................... 5
Item (a) – Interpretação ................................................................................... 15
Item (b) – Interpretação ................................................................................... 15
7. EXERCÍCIO ................................................................................................... 15
RESOLUÇÃO .................................................................................................... 15
Item (a) – Interpretação ................................................................................... 15
Item (b) – Equação da regressão ...................................................................... 15
Item (c) – Gráfico ............................................................................................. 17
Item (d) – Interpretação ................................................................................... 17
Item (e) – Coeficiente de Determinação ........................................................... 17
Item (f) – Interpretação .................................................................................... 18
3
9. EXERCÍCIO ................................................................................................... 18
RESOLUÇÃO .................................................................................................... 18
Item (a) – Média e Desvio Padrão .................................................................... 19
Item (b) – Diagrama de Dispersão ................................................................... 19
Item (c) – Reta de Regressão ............................................................................ 20
Item (d) – Coeficiente de Correlação ............................................................... 21
4
2. Produtividade X Exercícios ........................................................................... 35
3. Produtividade X Rodízio .............................................................................. 36
5
17. EXERCÍCIO ................................................................................................... 56
RESOLUÇÃO .................................................................................................... 56
Item (a) – Coeficiente de Correlação ............................................................... 56
Item (b) – Interpretação ................................................................................... 57
6
Correlação e Regressão- Lista De Exercícios
população
município (em 1000 população % população taxa de cresc. taxa mortalidade taxa de
hab.) urbana urbana Demográfico infantil alfabetização
Itajaí 101 94 93 3,19 37 85
Blumenau 193 181 94 4,6 27 90
Rio do Sul 42 39 94 2,78 38 85
Joinville 304 292 96 6,46 25 87
Curitibanos 42 32 76 1,99 67 75
Lages 152 126 83 1,89 63 78
Canoinhas 55 36 66 2,92 41 81
Chapecó 105 77 73 5,32 13 75
Concórdia 68 25 37 2,71 28 84
Floripa 219 186 85 3,11 17 87
Criciúma 129 116 90 3,11 32 85
Laguna 42 33 78 1,21 32 77
7
Resolução:
n x2 y2 (x.y)
taxa de taxa de
mortalidade (x) alfabetização (y)
1 37 85 1369 7225 3145
2 27 90 729 8100 2430
3 38 85 1444 7225 3230
4 25 87 625 7569 2175
5 67 75 4489 5625 5025
6 63 78 3969 6084 4914
7 41 81 1681 6561 3321
8 13 75 169 5625 975
9 28 84 784 7056 2352
10 17 87 289 7569 1479
11 32 85 1024 7225 2720
12 32 77 1024 5929 2464
∑ 420 989 17596 81793 34230
a) Diagrama de Dispersão:
92
90
88
86
84
82
80
78
76
74
0 20 40 60 80
8
b) Coeficiente de Pearson
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟐.(𝟑𝟒𝟐𝟑𝟎)–(𝟒𝟐𝟎).(𝟗𝟖𝟗)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟐.(𝟏𝟕𝟓𝟗𝟔)−(𝟒𝟐𝟎)𝟐 ].[𝟏𝟐.(𝟖𝟏𝟕𝟗𝟑)−(𝟗𝟖𝟗)𝟐 ]
𝟒𝟏𝟎𝟕𝟔𝟎−𝟒𝟏𝟓𝟑𝟖𝟎 −𝟒𝟔𝟐𝟎
r= → r=
√[𝟐𝟏𝟏𝟏𝟓𝟐−𝟏𝟕𝟔𝟒𝟎𝟎].[𝟗𝟖𝟏𝟓𝟏𝟔−𝟗𝟕𝟖𝟏𝟐𝟏] √[𝟑𝟒𝟕𝟓𝟐].[𝟑𝟑𝟗𝟓]
−𝟒𝟔𝟐𝟎 −𝟒𝟔𝟐𝟎
r= → r= → r= -0,42533604//
√𝟏𝟏𝟕𝟗𝟖𝟑𝟎𝟒𝟎 𝟏𝟎𝟖𝟔𝟏,𝟗𝟗𝟗𝟖𝟐
x y x y x y x y x y
39 65 43 78 21 52 64 82 65 88
57 92 47 89 28 73 75 98 47 71
34 56 52 75 35 50 30 50 28 52
40 70 70 50 80 90 32 58 67 88
b) Existe algum aluno que foge ao geral dos demais (ponto discrepante)?
9
Resolução:
n x y x2 y2 (x.y)
1 39 65 1521 4225 2535
2 57 92 3249 8464 5244
3 34 56 1156 3136 1904
4 40 70 1600 4900 2800
5 43 78 1849 6084 3354
6 47 89 2209 7921 4183
7 52 75 2704 5625 3900
8 70 50 4900 2500 3500
9 21 52 441 2704 1092
10 28 73 784 5329 2044
11 35 50 1225 2500 1750
12 80 90 6400 8100 7200
13 64 82 4096 6724 5248
14 75 98 5625 9604 7350
15 30 50 900 2500 1500
16 32 58 1024 3364 1856
17 65 88 4225 7744 5720
18 47 71 2209 5041 3337
19 28 52 784 2704 1456
20 67 88 4489 7744 5896
∑ 954 1427 51390 106913 71869
a) Diagrama de Dispersão:
120
100
80
60
40
20
0
0 20 40 60 80 100
10
b) Sim, o ponto em questão é P= (70,50) a tendência é que a nota na disciplina de
cálculo seja sempre maior que a nota obtida no vestibular de matemática, este
aluno foi o único que obteve nota no vestibular superior a nota na disciplina de
cálculo.//
c) Coeficiente de Pearson:
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟐𝟎.(𝟕𝟏𝟖𝟔𝟗)–(𝟗𝟓𝟒).(𝟏𝟒𝟐𝟕)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟐𝟎.(𝟓𝟏𝟑𝟗𝟎)−(𝟗𝟓𝟒)𝟐 ].[𝟐𝟎.(𝟏𝟎𝟔𝟗𝟏𝟑)−(𝟏𝟒𝟐𝟕)𝟐 ]
𝟏𝟒𝟑𝟕𝟑𝟖𝟎−𝟏𝟑𝟔𝟏𝟑𝟓𝟖 𝟕𝟔𝟎𝟐𝟐
r= → r=
√[𝟏𝟎𝟐𝟕𝟖𝟎𝟎−𝟗𝟏𝟎𝟏𝟏𝟔].[𝟐𝟏𝟑𝟖𝟐𝟔𝟎−𝟐𝟎𝟑𝟔𝟑𝟐𝟗] √[𝟏𝟏𝟕𝟔𝟖𝟒].[𝟏𝟎𝟏𝟗𝟑𝟏]
𝟕𝟔𝟎𝟐𝟐 𝟕𝟔𝟎𝟐𝟐
r= → r= → r= 0,6941//
√𝟏𝟏𝟗𝟗𝟓𝟔𝟒𝟕𝟖𝟎𝟒 𝟏𝟎𝟗𝟓𝟐𝟒,𝟔𝟒𝟒𝟕
11
d) Coeficiente de Pearson - sem P= (70,50):
n x y x2 y2 (x.y)
1 39 65 1521 4225 2535
2 57 92 3249 8464 5244
3 34 56 1156 3136 1904
4 40 70 1600 4900 2800
5 43 78 1849 6084 3354
6 47 89 2209 7921 4183
7 52 75 2704 5625 3900
8 21 52 441 2704 1092
9 28 73 784 5329 2044
10 35 50 1225 2500 1750
11 80 90 6400 8100 7200
12 64 82 4096 6724 5248
13 75 98 5625 9604 7350
14 30 50 900 2500 1500
15 32 58 1024 3364 1856
16 65 88 4225 7744 5720
17 47 71 2209 5041 3337
18 28 52 784 2704 1456
19 67 88 4489 7744 5896
∑ 884 1377 46490 104413 68369
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟗.(𝟔𝟖𝟑𝟔𝟗)–(𝟖𝟖𝟒).(𝟏𝟑𝟕𝟕)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟗.(𝟒𝟔𝟒𝟗𝟎)−(𝟖𝟖𝟒)𝟐 ].[𝟏𝟗.(𝟏𝟎𝟒𝟒𝟏𝟑)−(𝟏𝟑𝟕𝟕)𝟐 ]
𝟏𝟐𝟗𝟗𝟎𝟏𝟏−𝟏𝟐𝟏𝟕𝟐𝟔𝟖 𝟖𝟏𝟕𝟒𝟑
r= → r=
√[𝟖𝟖𝟑𝟑𝟏𝟎−𝟕𝟖𝟏𝟒𝟓𝟔].[𝟏𝟗𝟖𝟑𝟖𝟒𝟕−𝟏𝟖𝟗𝟔𝟏𝟐𝟗] √[𝟏𝟎𝟏𝟖𝟓𝟒].[𝟖𝟕𝟕𝟏𝟖]
𝟖𝟏𝟕𝟒𝟑 𝟖𝟏𝟕𝟒𝟑
r= → r= → r= 0,8648//
√𝟖𝟗𝟑𝟒𝟒𝟐𝟗𝟏𝟕𝟐 𝟗𝟒𝟓𝟐𝟐,𝟏𝟎𝟗𝟒𝟑
12
4. Com o objetivo de verificar se existe correlação positiva entre a aptidão em
matemática e a aptidão em música, foi selecionado um grupo de crianças de 8 a 10 anos
de idade, que foram submetidas a dois testes de aptidão; um de matemática e outro de
música. A ordem de aplicação dos testes em cada criança foi aleatória. Os dados estão
relacionados abaixo:
Resolução:
valores de aptidão em
criança
matemática (x) música (y) x2 y2 (x.y)
1 60 80 3600 6400 4800
2 58 62 3364 3844 3596
3 73 70 5329 4900 5110
4 51 83 2601 6889 4233
5 54 62 2916 3844 3348
6 75 92 5625 8464 6900
7 48 79 2304 6241 3792
8 72 88 5184 7744 6336
9 75 54 5625 2916 4050
10 83 82 6889 6724 6806
11 62 64 3844 4096 3968
12 52 69 2704 4761 3588
∑ 763 885 49985 66823 56527
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟐.(𝟓𝟔𝟓𝟐𝟕)–(𝟕𝟔𝟑).(𝟖𝟖𝟓)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟐.(𝟒𝟗𝟗𝟖𝟓)−(𝟕𝟔𝟑)𝟐 ].[𝟏𝟐.(𝟔𝟔𝟖𝟐𝟑)−(𝟖𝟖𝟓)𝟐 ]
𝟔𝟕𝟖𝟑𝟐𝟒−𝟔𝟕𝟓𝟐𝟓𝟓 𝟑𝟎𝟔𝟗
r= → r=
√[𝟓𝟗𝟗𝟖𝟐𝟎−𝟓𝟖𝟐𝟏𝟔𝟗].[𝟖𝟎𝟏𝟖𝟕𝟔−𝟕𝟖𝟑𝟐𝟐𝟓] √[𝟏𝟕𝟔𝟓𝟏].[𝟏𝟖𝟔𝟓𝟏]
13
𝟑𝟎𝟔𝟗 𝟑𝟎𝟔𝟗
r= → r= → r= 0,1691//
√𝟑𝟐𝟗𝟐𝟎𝟖𝟖𝟎𝟏 𝟏𝟖𝟏𝟒𝟒,𝟏𝟏𝟐𝟎𝟐
a) “Como r= -0,56 (correlação relativa moderada), nenhum aluno com grande número
de faltas tirou nota alta”
b) “Como as duas variáveis são correlacionadas, bastaria usar uma delas como critério
de avaliação, pois uma acarreta a outra”
c) “Os dados observados mostraram uma leve tendência de a nota final se relacionar
inversamente com o número de faltas, então os alunos freqüentadores tiveram em geral,
melhor desempenho nas avaliações, do que os alunos que faltaram muito”
Resolução:
a) Afirmativa falsa, como a correlação é moderada pode ser que algum aluno
esteja fora do padrão e tenha obtido nota alta mesmo com grande número de
faltas.//
c) Afirmativa verdadeira, em geral, é possível afirmar que grande parte dos alunos
que freqüentam mais às aulas obtiveram notas maiores, estando um aluno ou outro
fora do padrão, diminuindo assim, o coeficiente de correlação.//
14
6. Numa amostra aleatória de n=12 livros da Biblioteca Central, encontramos r= 0,207
entre a idade da edição e o número de páginas do livro.
Resolução:
7. Nos últimos anos, em várias regiões, houve um movimento migratório que fez
crescer bastante a população urbana nos municípios médios e grandes. Neste contexto,
vamos tentar explicar o crescimento demográfico de um município em função de sua
população urbana, para os municípios do Quadro 1.
f) Quais são as principais informações que podem ser obtidas pela presente análise?
Resolução:
b) Equação da regressão:
~ ~
∑𝒙𝒚−𝒏.𝒙.𝒚 𝟒𝟗𝟗𝟎,𝟔𝟖−𝟏𝟐(𝟏𝟎𝟑,𝟎𝟖𝟑)(𝟑,𝟐𝟕𝟒𝟏𝟔𝟔)
b= ~ → b=
∑𝒙𝟐 −𝒏.𝒙𝟐 𝟐𝟎𝟐𝟐𝟕𝟑−𝟏𝟐(𝟏𝟎𝟑,𝟎𝟖𝟑)𝟐
15
𝟒𝟗𝟗𝟎,𝟔𝟖−𝟏𝟐𝟑𝟔,𝟗𝟗𝟔(𝟑,𝟐𝟕𝟒𝟏𝟔𝟔) 𝟒𝟗𝟗𝟎,𝟔𝟖−𝟒𝟎𝟓𝟎,𝟏𝟑𝟎𝟐𝟒𝟓
b= → b=
𝟐𝟎𝟐𝟐𝟕𝟑−𝟏𝟐(𝟏𝟎𝟔𝟐𝟔,𝟏𝟎) 𝟐𝟎𝟐𝟐𝟕𝟑−𝟏𝟐𝟕𝟓𝟏𝟑,𝟐𝟎
𝟗𝟒𝟎,𝟓𝟓
b= → b= 0,01258//
𝟕𝟒𝟕𝟓𝟗,𝟖
n x2 y2 (x.y)
população taxa de cresc.
urbana (x) Demográfico (y)
1 94 3,19 8836 10,1761 299,86
2 181 4,6 32761 21,16 832,6
3 39 2,78 1521 7,7284 108,42
4 292 6,46 85264 41,7316 1886,32
5 32 1,99 1024 3,9601 63,68
6 126 1,89 15876 3,5721 238,14
7 36 2,92 1296 8,5264 105,12
8 77 5,32 5929 28,3024 409,64
9 25 2,71 625 7,3441 67,75
10 186 3,11 34596 9,6721 578,46
11 116 3,11 13456 9,6721 360,76
12 33 1,21 1089 1,4641 39,93
∑ 1237 39,29 202273 153,3095 4990,68
16
c) Gráfico:
6 y = 0,0126x + 1,9773
4
Série1
3 Linear (Série1)
0
0 100 200 300 400
y=1,9773 + 0,0126(300)
y=1,9773 + 3,78
y=5,7573//
e) Coeficiente de Correlação:
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟐.(𝟒𝟗𝟗𝟎,𝟔𝟖)–(𝟏𝟐𝟑𝟕).(𝟑𝟗,𝟐𝟗)
r= →r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟐.(𝟐𝟎𝟐𝟐𝟕𝟑)−(𝟏𝟐𝟑𝟕)𝟐 ].[𝟏𝟐.(𝟏𝟓𝟑,𝟑𝟎𝟗𝟓)−(𝟑𝟗,𝟐𝟗)𝟐 ]
𝟓𝟗𝟖𝟖𝟖,𝟏𝟔−𝟒𝟖𝟔𝟎𝟏,𝟕𝟑 𝟏𝟏𝟐𝟖𝟔,𝟒𝟑
r= → r=
√[𝟐𝟒𝟐𝟕𝟐𝟕𝟔−𝟏𝟓𝟑𝟎𝟏𝟔𝟗].[𝟏𝟖𝟑𝟗,𝟕𝟏𝟒−𝟏𝟓𝟒𝟑,𝟕𝟎𝟒𝟏] √[𝟖𝟗𝟕𝟏𝟎𝟕].[𝟐𝟗𝟔,𝟎𝟑𝟔𝟗]
𝟏𝟏𝟐𝟖𝟔,𝟒𝟑 𝟏𝟏𝟐𝟖𝟔,𝟒𝟑
r= → r= → r= 0,6925// r2=0,4797//
√𝟐𝟔𝟓𝟓𝟕𝟔𝟕𝟕𝟓,𝟐 𝟏𝟔𝟐𝟗𝟔,𝟓𝟐𝟔𝟒𝟖
17
O coeficiente de correlação é 0,69, existindo portanto uma correlação positiva
média.//
Resolução:
18
a) Medidas Descritivas:
*Desvio Padrão:
𝟓𝟖,𝟏
Desvio Padrão x: √ →Desvio padrão x= 2,5407//
𝟗
𝟔𝟓𝟖,𝟓
Desvio Padrão y: √ →Desvio padrão y= 8,5553//
𝟗
b) Diagrama de Dispersão:
80
70 10; 72
8; 64
4; 56 6; 60
60
3; 50 7; 62 8; 58
50
5; 52
40 2; 48
4; 43 Série1
30
20
10
0
0 2 4 6 8 10 12
19
c) Representação da Reta no gráfico:
80
70 y = 2,9518x + 39,675
R² = 0,7688
60
50
40 Série1
Linear (Série1)
30
20
10
0
0 2 4 6 8 10 12
*Equação da Regressão:
~~
∑𝒙𝒚−𝒏.𝒙.𝒚 𝟑𝟑𝟗𝟐−𝟏𝟎(𝟓,𝟕)(𝟓𝟔,𝟓)
b= 𝟐 ~𝟐 → b=
∑𝒙 −𝒏.𝒙 𝟑𝟖𝟑−𝟏𝟎(𝟓,𝟕)𝟐
𝟑𝟑𝟗𝟐−𝟑𝟐𝟐𝟎,𝟓 𝟏𝟕𝟏,𝟓
b= → b= →b=2,9518//
𝟑𝟖𝟑−𝟑𝟐𝟒,𝟗 𝟓𝟖,𝟏
a= 56,5 - 2,9518(5,7)
a= 56,5- 16,825
a= 39,675
20
d) Coeficiente de Correlação:
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟑𝟑𝟗𝟐)–(𝟓𝟕).(𝟓𝟔𝟓)
r= →r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟑𝟖𝟑)−(𝟓𝟕)𝟐 ].[𝟏𝟎.(𝟑𝟐𝟓𝟖𝟏)−(𝟓𝟔𝟓)𝟐 ]
𝟑𝟑𝟗𝟐𝟎−𝟑𝟐𝟐𝟎𝟓 𝟏𝟕𝟏𝟓
r= → r=
√[𝟑𝟖𝟑𝟎−𝟑𝟐𝟒𝟗].[𝟑𝟐𝟓𝟖𝟏𝟎−𝟑𝟏𝟗𝟐𝟐𝟓] √[𝟓𝟖𝟏].[𝟔𝟓𝟖𝟓]
𝟏𝟕𝟏𝟓 𝟏𝟕𝟏𝟓
r= → r= → r= 0,8768//
√𝟑𝟖𝟐𝟓𝟖𝟖𝟓 𝟏𝟗𝟓𝟓,𝟗𝟖
21
10. Numa pesquisa feita com 10 famílias com renda bruta mensal entre 10 e 60 salários
mínimos, mediram-se: X: renda bruta mensal (expressa em números de salários
mínimos) e Y: a porcentagem de renda bruta anual gasta com assistência médica.
x 12 16 18 20 28 30 40 48 50 54
y 7,2 7,4 7 6,5 6,6 6,7 6 5,6 6 5,5
a) Escolha adequadamente X e Y.
Resolução:
n x y x2 y2 (x.y)
1 12 7,2 144 51,84 86,4
2 16 7,4 256 54,76 118,4
3 18 7 324 49 126
4 20 6,5 400 42,25 130
5 28 6,6 784 43,56 184,8
6 30 6,7 900 44,89 201
7 40 6 1600 36 240
8 48 5,6 2304 31,36 268,8
9 50 6 2500 36 300
10 54 5,5 2916 30,25 297
∑ 316 64,5 12128 419,91 1952,4
*Equação da Regressão:
22
𝟏𝟗𝟓𝟐,𝟒−𝟐𝟎𝟑𝟖,𝟐 −𝟖𝟓,𝟖
b= → b= → b= -0,04//
𝟏𝟐𝟏𝟐𝟖−𝟗𝟗𝟖𝟓,𝟔 𝟐𝟏𝟒𝟐,𝟒
b) Diagrama de Dispersão:
8
7
6
5
4
3
2
1
0
0 10 20 30 40 50 60
c) Coeficiente de Correlação:
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟏𝟗𝟓𝟐,𝟒)–(𝟑𝟏𝟔).(𝟔𝟒,𝟓)
r= →r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟏𝟐𝟏𝟐𝟖)−(𝟑𝟏𝟔)𝟐 ].[𝟏𝟎.(𝟒𝟏𝟗,𝟗𝟏)−(𝟔𝟒,𝟓)𝟐 ]
𝟏𝟗𝟓𝟐𝟒−𝟐𝟎𝟑𝟖𝟐 −𝟖𝟓𝟖
r= → r=
√[𝟏𝟐𝟏𝟐𝟖𝟎−𝟗𝟗𝟖𝟓𝟔].[𝟒𝟏𝟗𝟗,𝟏−𝟒𝟏𝟔𝟎,𝟐𝟓] √[𝟐𝟏𝟒𝟐𝟒].[𝟑𝟖,𝟖𝟓]
−𝟖𝟓𝟖 −𝟖𝟓𝟖
r= → r= → r= -0,9404//
√𝟖𝟑𝟐𝟑𝟐𝟐,𝟒 𝟗𝟏𝟐,𝟑𝟏𝟕𝟎𝟓𝟎𝟐
23
11. Os quatro conjuntos de dados a seguir foram preparados pelo estatístico F.J
Anscombe e são usados com freqüência em aulas sobre correlação.
d) Analise os resultados.
24
Resolução:
a)
** Para o conjunto 1 **
Conjunto 1
n (x-média x) 2 (y-média y)2 x2 y2 (x.y)
x y
1 10 8,04 1 0,2916 100 64,6416 80,4
2 8 6,95 1 0,3025 64 48,3025 55,6
3 13 7,58 16 0,0064 169 57,4564 98,54
4 9 8,81 0 1,7161 81 77,6161 79,29
5 11 8,33 4 0,6889 121 69,3889 91,63
6 14 9,96 25 6,0516 196 99,2016 139,44
7 6 7,24 9 0,0676 36 52,4176 43,44
8 4 4,26 25 10,4976 16 18,1476 17,04
9 12 10,84 9 11,1556 144 117,5056 130,08
10 7 4,82 4 7,1824 49 23,2324 33,74
11 5 5,68 16 3,3124 25 32,2624 28,4
∑ 99 82,51 110 41,2727 1001 660,1727 797,6
𝟏𝟏𝟎
Desvio Padrão x: √ 𝟏𝟎 →Desvio padrão x= 3,3166//
𝟒𝟏,𝟐𝟕𝟐𝟕
Desvio Padrão y: √ →Desvio padrão y= 2,0315//
𝟏𝟎
25
** Para o conjunto 2 **
Conjunto 2
n (x-média x)2 (y-média y)2 x2 y2 (x.y)
x y
1 10 9,14 1 2,6896 100 83,5396 91,4
2 8 8,14 1 0,4096 64 66,2596 65,12
3 13 8,74 16 1,5376 169 76,3876 113,62
4 9 8,77 0 1,6129 81 76,9129 78,93
5 11 9,26 4 3,0976 121 85,7476 101,86
6 14 8,1 25 0,36 196 65,61 113,4
7 6 6,13 9 1,8769 36 37,5769 36,78
8 4 3,1 25 19,36 16 9,61 12,4
9 12 9,13 9 2,6569 144 83,3569 109,56
10 7 7,26 4 0,0576 49 52,7076 50,82
11 5 4,74 16 7,6176 25 22,4676 23,7
∑ 99 82,51 110 41,2763 1001 660,1763 797,59
𝟏𝟏𝟎
Desvio Padrão x: √ 𝟏𝟎 →Desvio padrão x= 3,3166//
𝟒𝟏,𝟐𝟕𝟔𝟑
Desvio Padrão y: √ →Desvio padrão y= 2,0316//
𝟏𝟎
** Para o conjunto 3 **
Conjunto 3
n (x-média x)2 (y-média y)2 x2 y2 (x.y)
x y
1 10 7,46 1 0,0016 100 55,6516 74,6
2 8 6,77 1 0,5329 64 45,8329 54,16
3 13 12,74 16 27,4576 169 162,3076 165,62
4 9 7,11 0 0,1521 81 50,5521 63,99
5 11 7,81 4 0,0961 121 60,9961 85,91
6 14 8,84 25 1,7956 196 78,1456 123,76
7 6 6,08 9 2,0164 36 36,9664 36,48
8 4 5,39 25 4,4521 16 29,0521 21,56
9 12 8,15 9 0,4225 144 66,4225 97,8
10 7 6,42 4 1,1664 49 41,2164 44,94
11 5 5,73 16 3,1329 25 32,8329 28,65
∑ 99 82,5 110 41,2262 1001 659,9762 797,47
26
𝟏𝟏𝟎
Desvio Padrão x: √ 𝟏𝟎 →Desvio padrão x= 3,3166//
𝟒𝟏,𝟐𝟐𝟔𝟐
Desvio Padrão y: √ →Desvio padrão y= 2,0304//
𝟏𝟎
** Para o conjunto 4 **
Conjunto 4
n (x-média x)2 (y-média y)2 x2 y2 (x.y)
x y
1 8 6,58 1 0,8464 64 43,2964 52,64
2 8 5,76 1 3,0276 64 33,1776 46,08
3 8 7,71 1 0,0441 64 59,4441 61,68
4 8 8,84 1 1,7956 64 78,1456 70,72
5 8 8,47 1 0,9409 64 71,7409 67,76
6 8 7,04 1 0,2116 64 49,5616 56,32
7 8 5,25 1 5,0625 64 27,5625 42
8 19 12,5 100 25 361 156,25 237,5
9 8 5,56 1 3,7636 64 30,9136 44,48
10 8 7,91 1 0,1681 64 62,5681 63,28
11 8 6,89 1 0,3721 64 47,4721 55,12
∑ 99 82,51 110 41,2325 1001 660,1325 797,58
𝟏𝟏𝟎
Desvio Padrão x: √ 𝟏𝟎 →Desvio padrão x= 3,3166//
𝟒𝟏,𝟐𝟑𝟐𝟓
Desvio Padrão y: √ 𝟏𝟎
→Desvio padrão y= 2,0305//
b) Coeficiente de Correlação:
** Para o conjunto 1 **
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟏.(𝟕𝟗𝟕,𝟔)–(𝟗𝟗).(𝟖𝟐,𝟓𝟏)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟏.(𝟏𝟎𝟎𝟏)−(𝟗𝟗)𝟐 ].[𝟏𝟏.(𝟔𝟔𝟎,𝟏𝟕𝟐𝟕)−(𝟖𝟐,𝟓𝟏)𝟐 ]
𝟖𝟕𝟕𝟑,𝟔−𝟖𝟏𝟔𝟖,𝟒𝟗 𝟔𝟎𝟓,𝟏𝟏
r= → r=
√[𝟏𝟏𝟎𝟏𝟏−𝟗𝟖𝟎𝟏].[𝟕𝟐𝟔𝟏,𝟖𝟗𝟗𝟕−𝟔𝟖𝟎𝟕,𝟗𝟎𝟎𝟏] √[𝟏𝟐𝟏𝟎].[𝟒𝟓𝟑,𝟗𝟗𝟗𝟔]
27
𝟔𝟎𝟓,𝟏𝟏 𝟔𝟎𝟓,𝟏𝟏
r= → r= → r= 0,8164//
√𝟓𝟒𝟗𝟑𝟑𝟗,𝟓𝟏𝟔 𝟕𝟒𝟏,𝟏𝟕𝟒𝟒𝟏𝟔𝟕
** Para o conjunto 2 **
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟏.(𝟕𝟗𝟕,𝟓𝟗)–(𝟗𝟗).(𝟖𝟐,𝟓𝟏)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟏.(𝟏𝟎𝟎𝟏)−(𝟗𝟗)𝟐 ].[𝟏𝟏.(𝟔𝟔𝟎,𝟏𝟕𝟔𝟑)−(𝟖𝟐,𝟓𝟏)𝟐 ]
𝟖𝟕𝟕𝟑,𝟒𝟗−𝟖𝟏𝟔𝟖,𝟒𝟗 𝟔𝟎𝟓
r= → r=
√[𝟏𝟏𝟎𝟏𝟏−𝟗𝟖𝟎𝟏].[𝟕𝟐𝟔𝟏,𝟗𝟑𝟗𝟑−𝟔𝟖𝟎𝟕,𝟗𝟎𝟎𝟏] √[𝟏𝟐𝟏𝟎].[𝟒𝟓𝟒,𝟎𝟑𝟗𝟐]
𝟔𝟎𝟓 𝟔𝟎𝟓
r= → r= → r= 0,8162//
√𝟓𝟒𝟗𝟑𝟖𝟕,𝟒𝟑𝟐 𝟕𝟒𝟏,𝟐𝟎𝟔𝟕𝟒𝟎𝟒
** Para o conjunto 3 **
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟏.(𝟕𝟗𝟕,𝟒𝟕)–(𝟗𝟗).(𝟖𝟐,𝟓)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟏.(𝟏𝟎𝟎𝟏)−(𝟗𝟗)𝟐 ].[𝟏𝟏.(𝟔𝟓𝟗,𝟗𝟕𝟔𝟐)−(𝟖𝟐,𝟓)𝟐 ]
𝟖𝟕𝟕𝟐,𝟏𝟕−𝟖𝟏𝟔𝟕,𝟓 𝟔𝟎𝟒,𝟔𝟕
r= → r=
√[𝟏𝟏𝟎𝟏𝟏−𝟗𝟖𝟎𝟏].[𝟕𝟐𝟓𝟗,𝟕𝟑𝟖𝟐−𝟔𝟖𝟎𝟔,𝟐𝟓] √[𝟏𝟐𝟏𝟎].[𝟒𝟓𝟑,𝟒𝟖𝟖𝟐]
𝟔𝟎𝟒,𝟔𝟕 𝟔𝟎𝟒,𝟔𝟕
r= → r= → r= 0,8162//
√𝟓𝟒𝟖𝟕𝟐𝟎,𝟕𝟐𝟐 𝟕𝟒𝟎,𝟕𝟓𝟔𝟖𝟓𝟖
28
** Para o conjunto 4 **
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟏.(𝟕𝟗𝟕,𝟓𝟖)–(𝟗𝟗).(𝟖𝟐,𝟓𝟏)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟏.(𝟏𝟎𝟎𝟏)−(𝟗𝟗)𝟐 ].[𝟏𝟏.(𝟔𝟔𝟎,𝟏𝟑𝟐𝟓)−(𝟖𝟐,𝟓𝟏)𝟐 ]
𝟖𝟕𝟕𝟑,𝟑𝟖−𝟖𝟏𝟔𝟖,𝟒𝟗 𝟔𝟎𝟒,𝟖𝟗
r= → r=
√[𝟏𝟏𝟎𝟏𝟏−𝟗𝟖𝟎𝟏].[𝟕𝟐𝟔𝟏,𝟒𝟓𝟕𝟓−𝟔𝟖𝟎𝟕,𝟗𝟎𝟎𝟏] √[𝟏𝟐𝟏𝟎].[𝟒𝟓𝟑,𝟓𝟓𝟕𝟒]
𝟔𝟎𝟒,𝟖𝟗 𝟔𝟎𝟒,𝟖𝟗
r= → r= → r= 0,8165//
√𝟓𝟒𝟖𝟖𝟎𝟒,𝟒𝟓𝟒 𝟕𝟒𝟎,𝟖𝟏𝟑𝟑𝟕𝟑
c) Diagrama de Dispersão:
** Para o conjunto 1 **
12
10
6
Série1
0
0 5 10 15
29
** Para o conjunto 2 **
10
9
8
7
6
5
Série1
4
3
2
1
0
0 5 10 15
** Para o conjunto 3 **
14
12
10
8
Série1
6
0
0 5 10 15
30
** Para o conjunto 4 **
14
12
10
8
Série1
6
0
0 5 10 15 20
d) Análise:
31
12. Uma empresa que produz bens de alta tecnologia está preocupada com a
produtividade de funcionários que exercem funções repetitivas e procura descobrir
como algumas variáveis podem influenciar no rendimento dessas pessoas. Para isso
implementa em cada uma de suas três fábricas um programa específico: alimentação
especial sugerida pelos nutricionistas; intervalos para exercícios de relaxamento
sugerido pelos fisioterapeutas; rodízio de funções sugerido pelos psicólogos. O quadro a
seguir mostra o resultado da produtividade para diversos níveis implementados no
programa.
Resolução:
a) Diagrama de Dispersão:
3 Série1
0
95 100 105 110 115 120 125
32
** Para Produtividade x Exercícios (freqüência semanal) **
3 Série1
0
95 100 105 110 115 120 125
3 Série1
0
95 100 105 110 115 120 125
33
b) Coeficiente de Correlação;
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟔.(𝟐𝟐𝟓𝟏)–(𝟔𝟒𝟕).(𝟐𝟏)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟔.(𝟕𝟎𝟎𝟑𝟕)−(𝟔𝟒𝟕)𝟐 ].[𝟔.(𝟗𝟏)−(𝟐𝟏)𝟐 ]
𝟏𝟑𝟓𝟎𝟔−𝟏𝟑𝟓𝟖𝟕 −𝟖𝟏
r= → r=
√[𝟒𝟐𝟎𝟐𝟐𝟐−𝟒𝟏𝟖𝟔𝟎𝟗].[𝟓𝟒𝟔−𝟒𝟒𝟏] √[𝟏𝟔𝟏𝟑].[𝟏𝟎𝟓]
−𝟖𝟏 −𝟖𝟏
r= → r= → r= -0,1968//
√𝟏𝟔𝟗𝟑𝟔𝟓 𝟒𝟏𝟏,𝟓𝟑𝟗𝟕
34
** Para Produtividade x Exercícios (freqüência semanal) **
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟔.(𝟐𝟑𝟐𝟖)–(𝟔𝟒𝟕).(𝟐𝟏)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟔.(𝟕𝟎𝟎𝟑𝟕)−(𝟔𝟒𝟕)𝟐 ].[𝟔.(𝟗𝟏)−(𝟐𝟏)𝟐 ]
𝟏𝟑𝟗𝟔𝟖−𝟏𝟑𝟓𝟖𝟕 𝟑𝟖𝟏
r= → r=
√[𝟒𝟐𝟎𝟐𝟐𝟐−𝟒𝟏𝟖𝟔𝟎𝟗].[𝟓𝟒𝟔−𝟒𝟒𝟏] √[𝟏𝟔𝟏𝟑].[𝟏𝟎𝟓]
𝟑𝟖𝟏 𝟑𝟖𝟏
r= → r= → r= 0,9257//
√𝟏𝟔𝟗𝟑𝟔𝟓 𝟒𝟏𝟏,𝟓𝟑𝟗𝟕
35
** Para Produtividade x Rodízio (freqüência semanal) **
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟔.(𝟐𝟑𝟎𝟖)–(𝟔𝟒𝟕).(𝟐𝟏)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟔.(𝟕𝟎𝟎𝟑𝟕)−(𝟔𝟒𝟕)𝟐 ].[𝟔.(𝟗𝟏)−(𝟐𝟏)𝟐 ]
𝟏𝟑𝟖𝟒𝟖−𝟏𝟑𝟓𝟖𝟕 𝟐𝟔𝟏
r= → r=
√[𝟒𝟐𝟎𝟐𝟐𝟐−𝟒𝟏𝟖𝟔𝟎𝟗].[𝟓𝟒𝟔−𝟒𝟒𝟏] √[𝟏𝟔𝟏𝟑].[𝟏𝟎𝟓]
𝟐𝟔𝟏 𝟐𝟔𝟏
r= → r= → r= 0,6341//
√𝟏𝟔𝟗𝟑𝟔𝟓 𝟒𝟏𝟏,𝟓𝟑𝟗𝟕
36
13. Use as informações de poupança agregada e renda (bilhões de reais) em um país X
no período de 1990 a 1999 (dados fictícios), para estimar a influência do nível de renda
sobre a poupança.
b) Diga qual é o acréscimo na poupança agregada para cada bilhão a mais na renda.
c) Estime a poupança para uma renda de R$469 400 000 000,00. Quanto seria o
consumo agregado das famílias? (consumo+poupança=renda).
Resolução:
OBSERVAÇÃO:
Dados baseados no PIB, renda e poupança do Brasil nos anos de 1990 a 1999
(dados modificados devido a conversão para reais supondo-se um dólar de R$
2,30).
37
a) Diagrama de Dispersão:
250
y = 0,208x - 14,302
200 R² = 0,926
150
Série1
100 Linear (Série1)
50
0
0 500 1000 1500
b) Equação da Regressão:
~ ~
∑𝒙𝒚−𝒏.𝒙.𝒚 𝟖𝟐𝟒𝟕𝟏𝟎,𝟗−𝟏𝟎(𝟔𝟑𝟗,𝟔𝟓)(𝟏𝟏𝟖,𝟕𝟒)
b= 𝟐 ~𝟐 → b=
∑𝒙 −𝒏.𝒙 𝟒𝟒𝟎𝟒𝟗𝟒𝟗−𝟏𝟎(𝟔𝟑𝟗,𝟔𝟓)𝟐
𝟖𝟐𝟒𝟕𝟏𝟎,𝟗−(𝟕𝟓𝟗𝟓𝟐𝟎,𝟒𝟏) 𝟔𝟓𝟏𝟗𝟎,𝟒𝟗
b= → b= → b= 0,208/
𝟒𝟒𝟎𝟒𝟗𝟒𝟗−𝟒𝟎𝟗𝟏𝟓𝟐𝟏,𝟐𝟐𝟓 𝟑𝟏𝟑𝟒𝟐𝟕,𝟕𝟖
Equação da Regressão:
y= -14,302+0,208x
38
Acréscimo na poupança agregada para cada bilhão a mais na renda
Resposta 1 : y= -14,302+0,208x//
Resposta 2:
Observação: conforme a equação da regressão obtida com base nos dados criados
o aumento unitário (de 1 bilhão na renda não seria suficiente para gerar acréscimo
na poupança, devida a disparidade entre o nível de consumo e poupança, a
população do país em questão tende a consumir mais e poupar menos). Portanto
para a variação de um bilhão na renda teremos:
y= -14,302+0,208
y=-14,094
y=-14,302+0,208(68,76)
y=0
y=-14,302+0,208(68,76+1)
y=-14,302+14,51
y=0,20808
y=-14,302+0,208(469,4)
y=-14,302+97,6352
y=83,3332
39
Consumo Agregado das Famílias
C= 386,0668
d)
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟖𝟐𝟒𝟕𝟏𝟎,𝟗𝟑)–(𝟔𝟑𝟗𝟔,𝟓).(𝟏𝟏𝟖𝟕,𝟒)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐] √[𝟏𝟎.(𝟒𝟒𝟎𝟒𝟗𝟒𝟖,𝟖𝟓)−(𝟔𝟑𝟗𝟔,𝟓)𝟐 ].[𝟏𝟎.(𝟏𝟓𝟓𝟔𝟑𝟓,𝟎𝟐)−(𝟏𝟏𝟖𝟕,𝟒)𝟐 ]
𝟖𝟐𝟒𝟕𝟏𝟎𝟗,𝟑𝟎−𝟕𝟓𝟗𝟓𝟐𝟎𝟒,𝟏𝟎 𝟔𝟓𝟏𝟗𝟎𝟓,𝟐𝟎
r= √[𝟒𝟒𝟎𝟒𝟗𝟒𝟖𝟖,𝟓−𝟒𝟎𝟗𝟏𝟓𝟐𝟏𝟐,𝟐𝟓].[𝟏𝟓𝟓𝟔𝟑𝟓𝟎,𝟐𝟎−𝟏𝟒𝟎𝟗𝟗𝟏𝟖,𝟕𝟔] → r=
√[𝟑𝟏𝟑𝟒𝟐𝟕𝟔,𝟐𝟓].[𝟏𝟒𝟔𝟒𝟑𝟏,𝟒𝟒]
𝟔𝟓𝟏𝟗𝟎𝟓,𝟐𝟎 𝟔𝟓𝟏𝟗𝟎𝟓,𝟐𝟎
r= → r= → r= 0,9622
√𝟒𝟓𝟖𝟗𝟓𝟔𝟓𝟖𝟒𝟔𝟒𝟓 𝟔𝟕𝟕𝟒𝟔𝟑,𝟑𝟒𝟓𝟔𝟎𝟗
e) Coeficiente de determinação:
r2= 0,926//
f) Diagrama de Dispersão:
40
**Renda X Consumo
900
800 y = 0,792x + 14,302
R² = 0,9945
700
600
500
Série1
400
Linear (Série1)
300
200
100
0
0 200 400 600 800 1000 1200
A correlação entre renda e consumo é muito mais forte do que a correlação entre
renda e popança, sendo quase perfeita. Enquanto o fato do aumento da renda não
acarretar aumento significativo na poupança(podendo causar inclusive decréscimo
dependendo do nível de renda), o aumento no nível de renda representa um grande
aumento no consumo. (como já dito o país em questão tem maior tendência a
consumir e menor tendência a poupar).
41
Despesas com propagandas Vendas de Certo
(milhões R$) Produto (mil unidades)
2,5 120
6,5 190
11 240
4 140
8,5 180
14 280
6 150
5 115
10 215
13,5 220
16 320
b) Ajuste uma reta aos dados e estime a vendas do produto, para um gasto com
propaganda de 12 milhões de reais.
c) Qual o acréscimo nas vendas para cada milhão a mais gasto com propaganda?
42
Resolução:
a) Diagrama de Dispersão
350
300
250
200
150 Série1
100
50
0
0 5 10 15 20
b) Equação da Regressão:
~ ~
∑𝒙𝒚−𝒏.𝒙.𝒚 𝟐𝟏𝟗𝟎𝟎−𝟏𝟏(𝟖,𝟖𝟏)(𝟏𝟗𝟕,𝟐𝟕)
b= 𝟐 ~𝟐 → b=
∑𝒙 −𝒏.𝒙 𝟏𝟎𝟓𝟑−𝟏𝟏(𝟖,𝟖𝟏)𝟐
𝟐𝟏𝟗𝟎𝟎−𝟏𝟗𝟏𝟏𝟕 𝟐𝟕𝟖𝟑
b= → b= → b= 13,985//
𝟏𝟎𝟓𝟑−𝟖𝟓𝟑,𝟕𝟕𝟕𝟏 𝟏𝟗𝟗
a= 197,27-(13,985)(8,81) → a= 74,06
Equação da Regressão:
y= 74,06+13,985x//
y= 74,06+13,985(12)
y=74,06+167,82
43
y=241,88
c) y= 74,06+13,985x//
y=74,06+13,985
y=88,045
O acréscimo nas vendas para cada milhão a mais gasto com propaganda é 88,045.
d) Reta de Regressão
350
200
Série1
150 Linear (Série1)
100
50
0
0 5 10 15 20
44
e) Coeficiente de Correlação:
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟏.(𝟐𝟏𝟗𝟎𝟎)–(𝟗𝟕).(𝟐𝟏𝟕𝟎)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟏.(𝟏𝟎𝟓𝟑)−(𝟗𝟕)𝟐 ].[𝟏𝟏.(𝟒𝟕𝟏𝟐𝟓𝟎)−(𝟐𝟏𝟕𝟎)𝟐 ]
𝟐𝟒𝟎𝟗𝟎𝟎−𝟐𝟏𝟎𝟒𝟗𝟎 𝟑𝟎𝟒𝟏𝟎
r= → r=
√[𝟏𝟏𝟓𝟖𝟑−𝟗𝟒𝟎𝟗].[𝟓𝟏𝟖𝟑𝟕𝟓𝟎−𝟒𝟕𝟎𝟖𝟗𝟎𝟎] √[𝟐𝟏𝟕𝟒].[𝟒𝟕𝟎𝟖𝟓𝟎]
𝟑𝟎𝟒𝟏𝟎 𝟑𝟎𝟒𝟏𝟎
r= → r= → r= 0,9454//
√𝟏𝟎𝟑𝟐𝟑𝟐𝟑𝟗𝟎𝟎 𝟑𝟐𝟏𝟐𝟗,𝟕𝟗𝟕𝟔𝟕𝟔𝟗𝟔𝟐
f) Coeficiente de Determinação:
r2= 0,8958
45
15. O quadro abaixo fornece os resultados de uma pesquisa com 10 famílias de
determinada região:
b) Ajuste um modelo linear utilizando as variáveis Renda (x) e Poupança (y). Estime o
valor poupado quando a renda for de 2000 reais.
46
Resolução:
a) Coeficiente de Correlação:
Poupança
n Renda (R$100,00) (R$10,00) x2 y2 (x.y)
1 10 4 100 16 40
2 15 7 225 49 105
3 12 5 144 25 60
4 70 20 4900 400 1400
5 80 20 6400 400 1600
6 100 30 10000 900 3000
7 20 8 400 64 160
8 30 8 900 64 240
9 10 3 100 9 30
10 60 15 3600 225 900
∑ 407 120 26769 2152 7535
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟕𝟓𝟑𝟓)–(𝟒𝟎𝟕).(𝟏𝟐𝟎)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟐𝟔𝟕𝟔𝟗)−(𝟒𝟎𝟕)𝟐 ].[𝟏𝟎.(𝟐𝟏𝟓𝟏)−(𝟏𝟐𝟎)𝟐 ]
𝟕𝟓𝟑𝟓𝟎−𝟒𝟖𝟖𝟒𝟎 𝟐𝟔𝟓𝟏𝟎
r= → r=
√[𝟐𝟔𝟕𝟔𝟗𝟎−𝟏𝟔𝟓𝟔𝟒𝟗].[𝟐𝟏𝟓𝟏𝟎−𝟏𝟒𝟒𝟎𝟎] √[𝟏𝟎𝟐𝟎𝟒𝟏].[𝟕𝟏𝟏𝟎]
𝟐𝟔𝟓𝟏𝟎 𝟐𝟔𝟓𝟏𝟎
r= → r= → r= 0,9835//
√𝟕𝟐𝟓𝟓𝟏𝟏𝟓𝟏𝟎 𝟐𝟔𝟗𝟑𝟓,𝟑𝟐
47
** Para renda X nº de filhos **
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟗𝟎𝟎)–(𝟒𝟎𝟕).(𝟑𝟔)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟐𝟔𝟕𝟔𝟗)−(𝟒𝟎𝟕)𝟐 ].[𝟏𝟎.(𝟏𝟖𝟒)−(𝟑𝟔)𝟐 ]
𝟗𝟎𝟎𝟎−𝟏𝟒𝟔𝟓𝟐 −𝟓𝟔𝟓𝟐
r= → r=
√[𝟐𝟔𝟕𝟔𝟗𝟎−𝟏𝟔𝟓𝟔𝟒𝟗].[𝟏𝟖𝟒𝟎−𝟏𝟐𝟗𝟔] √[𝟏𝟎𝟐𝟎𝟒𝟏].[𝟓𝟒𝟒]
−𝟓𝟔𝟐𝟎 −𝟓𝟔𝟐𝟎
r= → r= → r= -0,7586//
√𝟓𝟓𝟓𝟏𝟎𝟑𝟎𝟒 𝟕𝟒𝟓𝟎,𝟓𝟐
48
** Poupança X nº de filhos **
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟐𝟗𝟐)–(𝟏𝟐𝟎).(𝟑𝟔)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟐𝟏𝟓𝟐)−(𝟏𝟐𝟎)𝟐 ].[𝟏𝟎.(𝟏𝟖𝟒)−(𝟑𝟔)𝟐 ]
𝟐𝟗𝟐𝟎−𝟒𝟑𝟐𝟎 −𝟏𝟒𝟎𝟎
r= → r=
√[𝟐𝟏𝟓𝟐𝟎−𝟏𝟒𝟒𝟎𝟎].[𝟏𝟖𝟒𝟎−𝟏𝟐𝟗𝟔] √[𝟕𝟏𝟐𝟎].[𝟓𝟒𝟒]
−𝟏𝟒𝟎𝟎 −𝟏𝟒𝟎𝟎
r= → r= → r= -0,7113//
√𝟑𝟖𝟕𝟑𝟐𝟖𝟎 𝟏𝟗𝟔𝟖,𝟎𝟔𝟓
49
** Média anos de estudo X nº de filhos **
média de anos de
n estudo da família nº de filhos x2 y2 (x.y)
1 3 8 9 64 24
2 4 6 16 36 24
3 5 5 25 25 25
4 12 1 144 1 12
5 16 2 256 4 32
6 18 2 324 4 36
7 8 3 64 9 24
8 8 2 64 4 16
9 4 6 16 36 24
10 8 1 64 1 8
∑ 86 36 982 184 225
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟐𝟐𝟓)–(𝟖𝟔).(𝟑𝟔)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟗𝟖𝟐)−(𝟖𝟔)𝟐 ].[𝟏𝟎.(𝟏𝟖𝟒)−(𝟑𝟔)𝟐 ]
𝟐𝟐𝟓𝟎−𝟑𝟎𝟗𝟔 −𝟖𝟒𝟔
r= → r=
√[𝟗𝟖𝟐𝟎−𝟕𝟑𝟗𝟔].[𝟏𝟖𝟒𝟎−𝟏𝟐𝟗𝟔] √[𝟐𝟒𝟐𝟒].[𝟓𝟒𝟒]
−𝟖𝟒𝟔 −𝟖𝟒𝟔
r= → r= → r= -0,7367//
√𝟏𝟑𝟏𝟖𝟔𝟓𝟔 𝟏𝟏𝟒𝟖,𝟑𝟐
50
** Renda familiar X Média anos de estudo **
média de anos de
n Renda (R$100,00) estudo da família x2 y2 (x.y)
1 10 3 100 9 30
2 15 4 225 16 60
3 12 5 144 25 60
4 70 12 4900 144 840
5 80 16 6400 256 1280
6 100 18 10000 324 1800
7 20 8 400 64 160
8 30 8 900 64 240
9 10 4 100 16 40
10 60 8 3600 64 480
∑ 407 86 26769 982 4990
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟒𝟗𝟗𝟎)–(𝟒𝟎𝟕).(𝟖𝟔)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟐𝟔𝟕𝟔𝟗)−(𝟒𝟎𝟕)𝟐 ].[𝟏𝟎.(𝟗𝟖𝟐)−(𝟖𝟔)𝟐 ]
𝟒𝟗𝟗𝟎𝟎−𝟑𝟓𝟎𝟎𝟐 𝟏𝟒𝟖𝟗𝟖
r= → r=
√[𝟐𝟔𝟕𝟔𝟗𝟎−𝟏𝟔𝟓𝟔𝟒𝟗].[𝟗𝟖𝟐𝟎−𝟕𝟑𝟗𝟔] √[𝟏𝟎𝟐𝟎𝟒𝟏].[𝟐𝟒𝟐𝟒]
𝟏𝟒𝟖𝟗𝟖 𝟏𝟒𝟖𝟗𝟖
r= → r= → r= 0,9472//
√𝟐𝟒𝟕𝟑𝟒𝟕𝟑𝟖𝟒 𝟏𝟓𝟕𝟐𝟕,𝟐𝟖
51
Temos que:
~ ~
∑𝒙𝒚−𝒏.𝒙.𝒚 𝟕𝟓𝟑𝟓−𝟏𝟎(𝟒𝟎,𝟕)(𝟏𝟐)
b= → b=
∑𝒙𝟐 −𝒏.𝒙~𝟐 𝟐𝟔𝟕𝟔𝟗−𝟏𝟎(𝟒𝟎,𝟕)𝟐
𝟕𝟓𝟑𝟓−(𝟒𝟖𝟖𝟒) 𝟐𝟔𝟓𝟏
b= → b= → b= 0,2598//
𝟐𝟔𝟕𝟔𝟗−𝟏𝟔𝟓𝟔𝟒,𝟗 𝟏𝟎𝟐𝟎𝟒,𝟏
Equação da Regressão:
y= 1,4262+0,2598x
y= 1,4262+0,2598(2000)
y= 1,4262+519,6
y= 521,0262
52
3 Vila Formosa 35 19
4 Santana 70 30
5 Barra Funda 90 31
6 Jardim Paulista 120 33
7 Santo Amaro 160 35
8 Lapa 237 43
9 Pinheiros 378 50
b) Ajuste uma reta aos dados e estime um depósito médio para um número de
estabelecimentos comerciais iguais a 350.
Resolução:
a) Diagrama de Dispersão:
60
50
40
30
Série1
20
10
0
0 100 200 300 400
53
b) Equação da Regressão:
Temos que:
~ ~
∑𝒙𝒚−𝒏.𝒙.𝒚 𝟒𝟒𝟗𝟏𝟎−𝟗(𝟏𝟐𝟔,𝟐𝟐)(𝟑𝟎,𝟏𝟏)
b= 𝟐 ~𝟐 → b=
∑𝒙 −𝒏.𝒙 𝟐𝟓𝟒𝟒𝟑𝟒−𝟗(𝟏𝟐𝟔,𝟐𝟐)𝟐
𝟒𝟒𝟗𝟏𝟎−(𝟑𝟒𝟐𝟎𝟒,𝟑𝟓𝟕𝟖) 𝟏𝟎𝟕𝟎𝟓,𝟔𝟒𝟐𝟐
b= → b= → b= 0,0964//
𝟐𝟓𝟒𝟒𝟑𝟒−𝟏𝟒𝟑𝟑𝟖𝟑,𝟑𝟗𝟔 𝟏𝟏𝟏𝟎𝟓𝟎,𝟔𝟎𝟒
Equação da Regressão:
y= 17,944+0,0964x
y= 17,944+0,0964(350)
y= 17,944+33,74
y=51,684//
c)
y= 17,944+0,0964(1)
y=18,0404
54
d) Reta de Regressão:
60
50 y = 0,0964x + 17,944
R² = 0,8767
40
30 Série1
Linear (Série1)
20
10
0
0 100 200 300 400
e) Coeficiente de Correlação:
55
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟗.(𝟒𝟒𝟗𝟏𝟎)–(𝟏𝟏𝟑𝟔).(𝟐𝟕𝟏)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟗.(𝟐𝟓𝟒𝟒𝟑𝟒)−(𝟏𝟏𝟑𝟔)𝟐 ].[𝟗.(𝟗𝟑𝟑𝟕)−(𝟐𝟕𝟏)𝟐 ]
𝟒𝟎𝟒𝟏𝟗𝟎−𝟑𝟎𝟕𝟖𝟓𝟔 𝟗𝟔𝟑𝟑𝟒
r= → r=
√[𝟐𝟐𝟖𝟗𝟗𝟎𝟔−𝟏𝟐𝟗𝟎𝟒𝟗𝟔].[𝟖𝟒𝟎𝟑𝟑−𝟕𝟑𝟒𝟒𝟏] √[𝟗𝟗𝟗𝟒𝟏𝟎].[𝟏𝟎𝟓𝟗𝟐]
𝟗𝟔𝟑𝟑𝟒 𝟗𝟔𝟑𝟑𝟒
r= → r= → r= 0,9363//
√𝟏𝟎𝟓𝟖𝟓𝟕𝟓𝟎𝟕𝟐𝟎 𝟏𝟎𝟐𝟖𝟖𝟕,𝟎𝟕𝟕𝟓
f) Coeficiente de Determinação:
R2=0,8767//
17. Com o objetivo de verificar se numa certa região existe correlação entre o nível de
escolaridade médio dos pais e o nível de escolaridade dos filhos, observou-se uma
amostra aleatória de 8 indivíduos adultos, verificando o número de anos que estes
freqüentaram (e tiveram aprovação) em escolas regulares(Y) e o número médio de anos
que os seus pais freqüentaram (e tiveram aprovação) em escolas regulares (X). Ao
resultados são apresentados no quadro abaixo:
x 0 0 2 3 4 4 5 7
y 2 3 2 5 9 8 8 15
b) Em termos do Resultado do item (a) , o que se pode dizer sobre a correlação entre o
número de anos que os 8 indivíduos freqüentaram escolas regulares (Y) e o número
médio de anos que os seus pais freqüentaram escolas regulares (X)?
Resolução:
a) Coeficiente de Pearson:
n x y x2 y2 (x.y)
1 0 2 0 4 0
2 0 3 0 9 0
56
3 2 2 4 4 4
4 3 5 9 25 15
5 4 9 16 81 36
6 4 8 16 64 32
7 5 8 25 64 40
8 7 15 49 225 105
∑ 25 52 119 476 232
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟖.(𝟐𝟑𝟐)–(𝟐𝟓).(𝟓𝟐)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟖.(𝟏𝟏𝟗)−(𝟐𝟓)𝟐 ].[𝟖.(𝟒𝟕𝟔)−(𝟓𝟐)𝟐 ]
𝟏𝟖𝟓𝟔−𝟏𝟑𝟎𝟎 𝟓𝟓𝟔
r= → r=
√[𝟗𝟓𝟐−𝟔𝟐𝟓].[𝟑𝟖𝟎𝟖−𝟐𝟕𝟎𝟒] √[𝟑𝟐𝟕].[𝟏𝟏𝟎𝟒]
𝟓𝟓𝟔 𝟓𝟓𝟔
r= → r= → r= 0,9253//
√𝟑𝟔𝟏𝟎𝟎𝟖 𝟔𝟎𝟎,𝟖𝟑𝟗𝟒
18. A tabela a seguir relaciona os pesos (em centenas de Kg) e as taxas de consumo de
combustível em rodovia (km/litro) numa amostra de 10 carros e passeio novos.
peso 12 13 14 14 16 18 19 22 24 26
consumo 16 14 14 13 11 12 9 9 8 6
c) Para estabelecer uma reta de regressão, qual deve ser a variável dependente e qual
deve ser a variável independente? Justifique a sua resposta.
57
e) Apresente o diagrama de dispersão e a reta de regressão obtida em (d).
h) Você considera o seu estudo capaz de predizer o consumo esperado para um carro de
7000 kg? Justifique sua resposta.
Resolução:
a) Coeficiente de Correlação:
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟏𝟖𝟔𝟏)–(𝟏𝟕𝟖).(𝟏𝟏𝟐)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟑𝟑𝟖𝟐)−(𝟏𝟕𝟖)𝟐 ].[𝟏𝟎.(𝟏𝟑𝟒𝟒)−(𝟏𝟏𝟐)𝟐 ]
𝟏𝟖𝟔𝟏𝟎−𝟏𝟗𝟗𝟑𝟔 −𝟏𝟑𝟐𝟔
r= → r=
√[𝟑𝟑𝟖𝟐𝟎−𝟑𝟏𝟔𝟖𝟒].[𝟏𝟑𝟒𝟒𝟎−𝟏𝟐𝟓𝟒𝟒] √[𝟐𝟏𝟑𝟔].[𝟖𝟗𝟔]
−𝟏𝟑𝟐𝟔 −𝟏𝟑𝟐𝟔
r= → r= → r= -0,9584//
√𝟏𝟗𝟏𝟑𝟖𝟓𝟔 𝟏𝟑𝟖𝟑,𝟒𝟐𝟏𝟖
58
b) Há uma forte correlação. Quanto maior o peso do veículo, menor será o
consumo.
d) Equação da Regressão:
Temos que:
~ ~
∑𝒙𝒚−𝒏.𝒙.𝒚 𝟏𝟖𝟔𝟏−𝟏𝟎(𝟏𝟕,𝟖)(𝟏𝟏,𝟐)
b= ~ → b=
∑𝒙𝟐 −𝒏.𝒙𝟐 𝟑𝟑𝟖𝟐−𝟏𝟎(𝟑𝟏𝟔,𝟖𝟒)𝟐
𝟏𝟖𝟔𝟏−(𝟏𝟗𝟗𝟑,𝟔) −𝟏𝟑𝟐,𝟔
b= → b= → b= -0,6208//
𝟑𝟑𝟖𝟐−𝟑𝟏𝟔𝟖,𝟒 𝟐𝟏𝟑,𝟔
Equação da Regressão:
y= 22,25-0,6208x//
e) Diagrama de Dispersão:
59
18
16
14
12
10
8 Série1
6
4
2
0
0 10 20 30
18
16
14 y = -0,6208x + 22,25
R² = 0,9187
12
10
Série1
8
Linear (Série1)
6
4
2
0
0 10 20 30
f) Sim, este modelo linear se aplica bem, sendo a correlação quase perfeita.
60
y= 22,25-0,6208x
y= 22,25-0,6208(20)
y= 22,25-12,416
y=9,834
y= 22,25-0,6208x
y= 22,25-0,6208(70)
y= 22,25-43,456
y=-21,20
Como o consumo não pode ser negativo (-21,20 km/l), presumimos que para
7000kg não é possível presumir-se o consumo.
19. O administrador de uma grande sorveteria anotou por um longo período de tempo a
temperatura média diária em ºC (x), e o volume de vendas diária de sorvete, em kg (y).
Com os dados, estabeleceu uma equação de regressão, resultando em:
Pede-se:
b) Qual o incremento esperado nas vendas para cada 1ºC de aumento da temperatura?
Resolução:
61
a) y= 0,5+1,8(27) → y=0,5+48,60 → y=49,10//
Horas de treinamento 8 10 10 12 15 18 18 21 25 25
chumbo no sangue (mml/L) 0,53 0,25 0,34 0,25 0,29 0,3 0,53 0,53 0,53 0,87
Pede-se:
c) O ciclista 10 tem níveis muito altos. Nossa evidência de uma relação é proveniente
quase que inteiramente desta observação? Repita (b) omitindo o ciclista 10.
e) Está claro a partir do gráfico obtido em (a) que há variação nos dados que não é
explicada pelas horas de treinamento. (O que nos dá esta informação?). Talvez o efeito
de horas de treinamento não apareça tão fortemente como deveria, porque estamos
deixando de levar em consideração outras variáveis importantes. Sugira algumas outras
variáveis que poderiam ser importantes.
Resolução:
a) Diagrama de Dispersão:
62
1
0,9
0,8
0,7
0,6
0,5
Série1
0,4
0,3
0,2
0,1
0
0 5 10 15 20 25 30
b) Coeficiente de Correlação:
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟕𝟖,𝟓𝟔)–(𝟏𝟔𝟐).(𝟒,𝟒𝟐)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟐𝟗𝟕𝟐)−(𝟏𝟔𝟐)𝟐 ].[𝟏𝟎.(𝟐,𝟐𝟗𝟓𝟐)−(𝟒,𝟒𝟐)𝟐 ]
𝟕𝟖𝟓,𝟔−𝟕𝟏𝟔,𝟎𝟒 𝟔𝟗,𝟓𝟔
r= → r=
√[𝟐𝟗𝟕𝟐𝟎−𝟐𝟔𝟐𝟒𝟏].[𝟐𝟐,𝟗𝟓−𝟏𝟗,𝟓𝟑] √[𝟑𝟒𝟕𝟗].[𝟑,𝟒𝟐]
63
𝟔𝟗,𝟓𝟔 𝟔𝟗,𝟓𝟔
r= → r= → r= 0,6385//
√𝟏𝟏𝟖𝟗𝟖,𝟏𝟖 𝟏𝟎𝟗,𝟎𝟕𝟐𝟕
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟗.(𝟓𝟔,𝟖𝟏)–(𝟏𝟑𝟕).(𝟑,𝟓𝟓)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟗.(𝟐𝟑𝟒𝟕)−(𝟏𝟑𝟕)𝟐 ].[𝟗.(𝟏,𝟓𝟑𝟖𝟑)−(𝟑,𝟓𝟓)𝟐 ]
𝟓𝟏𝟏,𝟐𝟗−𝟒𝟖𝟔,𝟑𝟓 𝟐𝟒,𝟗𝟒
r= → r=
√[𝟐𝟏𝟏𝟐𝟑−𝟏𝟖𝟕𝟔𝟗].[𝟏𝟑,𝟖𝟒𝟒𝟕−𝟏𝟐,𝟔𝟎𝟐𝟓] √[𝟐𝟑𝟓𝟒].[𝟏,𝟐𝟒𝟐𝟐]
64
𝟐𝟒,𝟗𝟒 𝟐𝟒,𝟗𝟒
r= → r= → r= 0,4612//
√𝟐𝟗𝟐𝟒,𝟏𝟑𝟖𝟖 𝟓𝟒,𝟎𝟕𝟓𝟑𝟎𝟔𝟕
65