Você está na página 1de 65

TRABALHO DE ESTATÍSTICA

EXERCÍCIOS - CORRELAÇÃO E REGRESSÃO

CURITIBA

2010

1
DANIELE FERREIRA

TRABALHO DE ESTATÍSTICA

EXERCÍCIOS - CORRELAÇÃO E REGRESSÃO

Trabalho apresentado à ESIC - Business &


Marketing School, como requisito para obtenção
de nota parcial na disciplina de Estatística
dedutiva, turma 3F1D. Sob orientação do prof o
Gilmar Bornatto.

CURITIBA

2010

2
SUMÁRIO

1. EXERCÍCIO ..................................................................................................... 7
RESOLUÇÃO ...................................................................................................... 8
Item (a) – diagrama de dispersão ....................................................................... 8
Item (b) – Coeficiente de Pearson ...................................................................... 9

2. EXERCÍCIO ..................................................................................................... 9
RESOLUÇÃO .................................................................................................... 10
Item (a) – diagrama de dispersão ..................................................................... 10
Item (b) – Ponto Discrepante ........................................................................... 11
Item (c) – Coeficiente de Pearson ..................................................................... 11
Item (d) – Coeficiente de Pearson – sem ponto discrepante ........................... 12

4. EXERCÍCIO ................................................................................................... 13
RESOLUÇÃO .................................................................................................... 13
Item (a) – Coeficiente de Pearson .................................................................... 13

5. EXERCÍCIO ................................................................................................... 14
RESOLUÇÃO .................................................................................................... 14
Item (a) – Interpretação ................................................................................... 14
Item (b) – Interpretação ................................................................................... 14
Item (c) – Interpretação ................................................................................... 14

6. EXERCÍCIO ................................................................................................... 15
RESOLUÇÃO ...................................................................................................... 5
Item (a) – Interpretação ................................................................................... 15
Item (b) – Interpretação ................................................................................... 15

7. EXERCÍCIO ................................................................................................... 15
RESOLUÇÃO .................................................................................................... 15
Item (a) – Interpretação ................................................................................... 15
Item (b) – Equação da regressão ...................................................................... 15
Item (c) – Gráfico ............................................................................................. 17
Item (d) – Interpretação ................................................................................... 17
Item (e) – Coeficiente de Determinação ........................................................... 17
Item (f) – Interpretação .................................................................................... 18

3
9. EXERCÍCIO ................................................................................................... 18
RESOLUÇÃO .................................................................................................... 18
Item (a) – Média e Desvio Padrão .................................................................... 19
Item (b) – Diagrama de Dispersão ................................................................... 19
Item (c) – Reta de Regressão ............................................................................ 20
Item (d) – Coeficiente de Correlação ............................................................... 21

10. EXERCÍCIO ................................................................................................... 22


RESOLUÇÃO .................................................................................................... 22
Item (a) – Interpretação ................................................................................... 22
Item (b) – Diagrama de Dispersão ................................................................... 23
Item (c) – Coeficiente de Correlação ............................................................... 23

11. EXERCÍCIO ................................................................................................... 24


RESOLUÇÃO .................................................................................................... 25
Item (a) – Média e Desvio Padrão .................................................................... 25
1. Conjunto 1 .................................................................................................... 25
2. Conjunto 2..................................................................................................... 26
3. Conjunto 3 .................................................................................................... 26
4. Conjunto 4 .................................................................................................... 27
Item (b) – Coeficiente de Correlação ............................................................... 27
1. Conjunto 1 .................................................................................................... 27
2. Conjunto 2..................................................................................................... 28
3. Conjunto 3 .................................................................................................... 28
4. Conjunto 4 .................................................................................................... 29
Item (c) – Diagrama de Dispersão ................................................................... 29
1. Conjunto 1 .................................................................................................... 29
2. Conjunto 2..................................................................................................... 30
3. Conjunto 3 .................................................................................................... 30
4. Conjunto 4 .................................................................................................... 31
Item (d) – Interpretação ................................................................................... 31

12. EXERCÍCIO ................................................................................................... 32


RESOLUÇÃO .................................................................................................... 32
Item (a) – Diagrama de Dispersão ................................................................... 32
1. Produtividade X Alimentação ....................................................................... 32
2. Produtividade X Exercícios ........................................................................... 33
3. Produtividade X Rodízio .............................................................................. 33
Item (b) – Coeficiente de Correlação ............................................................... 34
1. Produtividade X Alimentação ....................................................................... 34

4
2. Produtividade X Exercícios ........................................................................... 35
3. Produtividade X Rodízio .............................................................................. 36

13. EXERCÍCIO ................................................................................................... 37


RESOLUÇÃO .................................................................................................... 37
Item (a) – Diagrama de Dispersão (Renda e Poupança) ................................. 38
Item (b) – Equação da regressão e Interpretação ........................................... 38
Item (c) – Interpretação ................................................................................... 39
Item (d) – Coeficiente de Correlação ............................................................... 40
Item (e) – Coeficiente de Determinação ........................................................... 40
Item (f) – Diagrama de Dispersão (Renda e Consumo) .................................. 41

14. EXERCÍCIO ................................................................................................... 42


RESOLUÇÃO .................................................................................................... 43
Item (a) – Diagrama de Dispersão ................................................................... 43
Item (b) – Equação da regressão e Interpretação ........................................... 43
Item (c) – Interpretação ................................................................................... 44
Item (d) – Reta de Regressão ........................................................................... 44
Item (e) – Coeficiente de Correlação ............................................................... 45
Item (f) – Coeficiente de Determinação ........................................................... 45

15. EXERCÍCIO ................................................................................................... 46


RESOLUÇÃO .................................................................................................... 47
Item (a) – Coeficiente de Correlação ............................................................... 47
1. Renda e Poupança ........................................................................................ 47
2. Renda e número de Filhos ............................................................................. 48
3. Poupança e número de Filhos ....................................................................... 49
4. Média dos anos de estudo e número de Filhos ............................................... 50
5. Renda Familiar e média dos anos de estudo .................................................. 51
Item (b) – Equação da regressão e Interpretação ............................................ 51

16. EXERCÍCIO ................................................................................................... 52


RESOLUÇÃO .................................................................................................... 53
Item (a) – Diagrama de Dispersão ................................................................... 53
Item (b) – Equação da regressão e Interpretação ........................................... 53
Item (c) – Interpretação ................................................................................... 54
Item (d) – Reta de Regressão ........................................................................... 55
Item (e) – Coeficiente de Correlação ............................................................... 55
Item (d) – Coeficiente de Determinação .......................................................... 56

5
17. EXERCÍCIO ................................................................................................... 56
RESOLUÇÃO .................................................................................................... 56
Item (a) – Coeficiente de Correlação ............................................................... 56
Item (b) – Interpretação ................................................................................... 57

18. EXERCÍCIO ................................................................................................... 57


RESOLUÇÃO .................................................................................................... 58
Item (a) – Coeficiente de Correlação ............................................................... 58
Item (b) – Interpretação ................................................................................... 58
Item (c) – Interpretação ................................................................................... 58
Item (d) – Equação da Regressão ..................................................................... 59
Item (e) – Diagrama de Dispersão e reta de Regressão ................................... 59
Item (f) – Interpretação .................................................................................... 60
Item (g) – Interpretação ................................................................................... 60
Item (h) – Interpretação ................................................................................... 60

19. EXERCÍCIO ................................................................................................... 61


RESOLUÇÃO .................................................................................................... 61
Item (a) – Interpretação ................................................................................... 61
Item (b) – Interpretação ................................................................................... 61

20. EXERCÍCIO ................................................................................................... 61


RESOLUÇÃO .................................................................................................... 62
Item (a) – Diagrama de Dispersão ................................................................... 62
Item (b) – Coeficiente de Correlação ............................................................... 63
Item (c) – Interpretação e Coeficiente de Correlação ..................................... 64
Item (d) – Interpretação ................................................................................... 64
Item (e) – Interpretação ................................................................................... 64

6
Correlação e Regressão- Lista De Exercícios

1. Considerando os dados do Quadro 1:

a) Construir um diagrama de dispersão para as variáveis taxa de alfabetização e taxa de


mortalidade infantil. Quais as informações observadas no gráfico?

b) Calcule o coeficiente de correlação de Pearson entre as variáveis taxa de


alfabetização e taxa de mortalidade infantil. Interprete o resultado obtido.

Quadro 1 - Alguns dados de doze importantes municípios catarinenses

população
município (em 1000 população % população taxa de cresc. taxa mortalidade taxa de
hab.) urbana urbana Demográfico infantil alfabetização
Itajaí 101 94 93 3,19 37 85
Blumenau 193 181 94 4,6 27 90
Rio do Sul 42 39 94 2,78 38 85
Joinville 304 292 96 6,46 25 87
Curitibanos 42 32 76 1,99 67 75
Lages 152 126 83 1,89 63 78
Canoinhas 55 36 66 2,92 41 81
Chapecó 105 77 73 5,32 13 75
Concórdia 68 25 37 2,71 28 84
Floripa 219 186 85 3,11 17 87
Criciúma 129 116 90 3,11 32 85
Laguna 42 33 78 1,21 32 77

7
Resolução:

n x2 y2 (x.y)
taxa de taxa de
mortalidade (x) alfabetização (y)
1 37 85 1369 7225 3145
2 27 90 729 8100 2430
3 38 85 1444 7225 3230
4 25 87 625 7569 2175
5 67 75 4489 5625 5025
6 63 78 3969 6084 4914
7 41 81 1681 6561 3321
8 13 75 169 5625 975
9 28 84 784 7056 2352
10 17 87 289 7569 1479
11 32 85 1024 7225 2720
12 32 77 1024 5929 2464
∑ 420 989 17596 81793 34230

a) Diagrama de Dispersão:

92
90
88
86
84
82
80
78
76
74
0 20 40 60 80

Observa-se que os pontos estão bastante dispersos, poderá, provavelmente, haver


fraca ou média correlação.//

8
b) Coeficiente de Pearson

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟐.(𝟑𝟒𝟐𝟑𝟎)–(𝟒𝟐𝟎).(𝟗𝟖𝟗)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟐.(𝟏𝟕𝟓𝟗𝟔)−(𝟒𝟐𝟎)𝟐 ].[𝟏𝟐.(𝟖𝟏𝟕𝟗𝟑)−(𝟗𝟖𝟗)𝟐 ]

𝟒𝟏𝟎𝟕𝟔𝟎−𝟒𝟏𝟓𝟑𝟖𝟎 −𝟒𝟔𝟐𝟎
r= → r=
√[𝟐𝟏𝟏𝟏𝟓𝟐−𝟏𝟕𝟔𝟒𝟎𝟎].[𝟗𝟖𝟏𝟓𝟏𝟔−𝟗𝟕𝟖𝟏𝟐𝟏] √[𝟑𝟒𝟕𝟓𝟐].[𝟑𝟑𝟗𝟓]

−𝟒𝟔𝟐𝟎 −𝟒𝟔𝟐𝟎
r= → r= → r= -0,42533604//
√𝟏𝟏𝟕𝟗𝟖𝟑𝟎𝟒𝟎 𝟏𝟎𝟖𝟔𝟏,𝟗𝟗𝟗𝟖𝟐

O coeficiente de Pearson é -0,4253 existindo portanto, uma correlação negativa


fraca.//

2. Sendo X= nota na prova do vestibular de matemática e Y= nota final na disciplina de


cálculo. Estas variáveis foram observadas em 20 alunos, ao final do primeiro período
letivo de um curso de engenharia. Os dados são apresentados a seguir:

x y x y x y x y x y
39 65 43 78 21 52 64 82 65 88
57 92 47 89 28 73 75 98 47 71
34 56 52 75 35 50 30 50 28 52
40 70 70 50 80 90 32 58 67 88

a) Construa um diagrama de dispersão e verifique se existe correlação entre os dados


observados destas duas variáveis.

b) Existe algum aluno que foge ao geral dos demais (ponto discrepante)?

c) Calcule a correlação entre a nota no vestibular de matemática e a nota na disciplina


de cálculo

d) Retire o valor discrepante detectado e calcule novamente o coeficiente r . Interprete.

9
Resolução:

n x y x2 y2 (x.y)
1 39 65 1521 4225 2535
2 57 92 3249 8464 5244
3 34 56 1156 3136 1904
4 40 70 1600 4900 2800
5 43 78 1849 6084 3354
6 47 89 2209 7921 4183
7 52 75 2704 5625 3900
8 70 50 4900 2500 3500
9 21 52 441 2704 1092
10 28 73 784 5329 2044
11 35 50 1225 2500 1750
12 80 90 6400 8100 7200
13 64 82 4096 6724 5248
14 75 98 5625 9604 7350
15 30 50 900 2500 1500
16 32 58 1024 3364 1856
17 65 88 4225 7744 5720
18 47 71 2209 5041 3337
19 28 52 784 2704 1456
20 67 88 4489 7744 5896
∑ 954 1427 51390 106913 71869

a) Diagrama de Dispersão:

120

100

80

60

40

20

0
0 20 40 60 80 100

Observa-se no gráfico a existência de uma correlação média entre os dados.//

10
b) Sim, o ponto em questão é P= (70,50) a tendência é que a nota na disciplina de
cálculo seja sempre maior que a nota obtida no vestibular de matemática, este
aluno foi o único que obteve nota no vestibular superior a nota na disciplina de
cálculo.//

c) Coeficiente de Pearson:

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟐𝟎.(𝟕𝟏𝟖𝟔𝟗)–(𝟗𝟓𝟒).(𝟏𝟒𝟐𝟕)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟐𝟎.(𝟓𝟏𝟑𝟗𝟎)−(𝟗𝟓𝟒)𝟐 ].[𝟐𝟎.(𝟏𝟎𝟔𝟗𝟏𝟑)−(𝟏𝟒𝟐𝟕)𝟐 ]

𝟏𝟒𝟑𝟕𝟑𝟖𝟎−𝟏𝟑𝟔𝟏𝟑𝟓𝟖 𝟕𝟔𝟎𝟐𝟐
r= → r=
√[𝟏𝟎𝟐𝟕𝟖𝟎𝟎−𝟗𝟏𝟎𝟏𝟏𝟔].[𝟐𝟏𝟑𝟖𝟐𝟔𝟎−𝟐𝟎𝟑𝟔𝟑𝟐𝟗] √[𝟏𝟏𝟕𝟔𝟖𝟒].[𝟏𝟎𝟏𝟗𝟑𝟏]

𝟕𝟔𝟎𝟐𝟐 𝟕𝟔𝟎𝟐𝟐
r= → r= → r= 0,6941//
√𝟏𝟏𝟗𝟗𝟓𝟔𝟒𝟕𝟖𝟎𝟒 𝟏𝟎𝟗𝟓𝟐𝟒,𝟔𝟒𝟒𝟕

O coeficiente de Pearson é 0,6941 existindo portanto, uma correlação positiva


média.//

11
d) Coeficiente de Pearson - sem P= (70,50):

n x y x2 y2 (x.y)
1 39 65 1521 4225 2535
2 57 92 3249 8464 5244
3 34 56 1156 3136 1904
4 40 70 1600 4900 2800
5 43 78 1849 6084 3354
6 47 89 2209 7921 4183
7 52 75 2704 5625 3900
8 21 52 441 2704 1092
9 28 73 784 5329 2044
10 35 50 1225 2500 1750
11 80 90 6400 8100 7200
12 64 82 4096 6724 5248
13 75 98 5625 9604 7350
14 30 50 900 2500 1500
15 32 58 1024 3364 1856
16 65 88 4225 7744 5720
17 47 71 2209 5041 3337
18 28 52 784 2704 1456
19 67 88 4489 7744 5896
∑ 884 1377 46490 104413 68369

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟗.(𝟔𝟖𝟑𝟔𝟗)–(𝟖𝟖𝟒).(𝟏𝟑𝟕𝟕)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟗.(𝟒𝟔𝟒𝟗𝟎)−(𝟖𝟖𝟒)𝟐 ].[𝟏𝟗.(𝟏𝟎𝟒𝟒𝟏𝟑)−(𝟏𝟑𝟕𝟕)𝟐 ]

𝟏𝟐𝟗𝟗𝟎𝟏𝟏−𝟏𝟐𝟏𝟕𝟐𝟔𝟖 𝟖𝟏𝟕𝟒𝟑
r= → r=
√[𝟖𝟖𝟑𝟑𝟏𝟎−𝟕𝟖𝟏𝟒𝟓𝟔].[𝟏𝟗𝟖𝟑𝟖𝟒𝟕−𝟏𝟖𝟗𝟔𝟏𝟐𝟗] √[𝟏𝟎𝟏𝟖𝟓𝟒].[𝟖𝟕𝟕𝟏𝟖]

𝟖𝟏𝟕𝟒𝟑 𝟖𝟏𝟕𝟒𝟑
r= → r= → r= 0,8648//
√𝟖𝟗𝟑𝟒𝟒𝟐𝟗𝟏𝟕𝟐 𝟗𝟒𝟓𝟐𝟐,𝟏𝟎𝟗𝟒𝟑

O coeficiente de Pearson é 0,8648 existindo portanto, uma correlação positiva


forte. Há uma tendência entre esses pontos de que a nota na disciplina de cálculo
seja sempre superior a nota no vestibular de matemática. Quando tirou-se o ponto
discrepante (70,50), onde a nota no vestibular havia sido superior a nota na
disciplina de cálculo, houve um aumento da correlação entre as notas.//

12
4. Com o objetivo de verificar se existe correlação positiva entre a aptidão em
matemática e a aptidão em música, foi selecionado um grupo de crianças de 8 a 10 anos
de idade, que foram submetidas a dois testes de aptidão; um de matemática e outro de
música. A ordem de aplicação dos testes em cada criança foi aleatória. Os dados estão
relacionados abaixo:

Quadro 2- Teste de aptidão em crianças


valores de aptidão em valores de aptidão em
criança criança
matemática música matemática música
1 60 80 7 48 79
2 58 62 8 72 88
3 73 70 9 75 54
4 51 83 10 83 82
5 54 62 11 62 64
6 75 92 12 52 69
Calcule o coeficiente r e confira o resultado encontrado.

Resolução:

valores de aptidão em
criança
matemática (x) música (y) x2 y2 (x.y)
1 60 80 3600 6400 4800
2 58 62 3364 3844 3596
3 73 70 5329 4900 5110
4 51 83 2601 6889 4233
5 54 62 2916 3844 3348
6 75 92 5625 8464 6900
7 48 79 2304 6241 3792
8 72 88 5184 7744 6336
9 75 54 5625 2916 4050
10 83 82 6889 6724 6806
11 62 64 3844 4096 3968
12 52 69 2704 4761 3588
∑ 763 885 49985 66823 56527

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟐.(𝟓𝟔𝟓𝟐𝟕)–(𝟕𝟔𝟑).(𝟖𝟖𝟓)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟐.(𝟒𝟗𝟗𝟖𝟓)−(𝟕𝟔𝟑)𝟐 ].[𝟏𝟐.(𝟔𝟔𝟖𝟐𝟑)−(𝟖𝟖𝟓)𝟐 ]

𝟔𝟕𝟖𝟑𝟐𝟒−𝟔𝟕𝟓𝟐𝟓𝟓 𝟑𝟎𝟔𝟗
r= → r=
√[𝟓𝟗𝟗𝟖𝟐𝟎−𝟓𝟖𝟐𝟏𝟔𝟗].[𝟖𝟎𝟏𝟖𝟕𝟔−𝟕𝟖𝟑𝟐𝟐𝟓] √[𝟏𝟕𝟔𝟓𝟏].[𝟏𝟖𝟔𝟓𝟏]

13
𝟑𝟎𝟔𝟗 𝟑𝟎𝟔𝟗
r= → r= → r= 0,1691//
√𝟑𝟐𝟗𝟐𝟎𝟖𝟖𝟎𝟏 𝟏𝟖𝟏𝟒𝟒,𝟏𝟏𝟐𝟎𝟐

O coeficiente de Pearson é 0,1691 existindo portanto, uma correlação positiva


fraca.//

5. Com respeito aos 23 alunos de uma turma de estatística, foram observadas as


seguintes variáveis: número de faltas e nota da disciplina. Estes dados acusaram a
seguinte correlação, descrita pelo coeficiente de correlação de Pearson; r= -0,56.
Comente as seguintes frases relativas à turma em estudo e ao coeficiente obtido.

a) “Como r= -0,56 (correlação relativa moderada), nenhum aluno com grande número
de faltas tirou nota alta”

b) “Como as duas variáveis são correlacionadas, bastaria usar uma delas como critério
de avaliação, pois uma acarreta a outra”

c) “Os dados observados mostraram uma leve tendência de a nota final se relacionar
inversamente com o número de faltas, então os alunos freqüentadores tiveram em geral,
melhor desempenho nas avaliações, do que os alunos que faltaram muito”

Resolução:

a) Afirmativa falsa, como a correlação é moderada pode ser que algum aluno
esteja fora do padrão e tenha obtido nota alta mesmo com grande número de
faltas.//

b) Afirmativa falsa, para se determinar a correlação de Pearson necessita-se das


duas variáveis, ou não haveria como comparar.//

c) Afirmativa verdadeira, em geral, é possível afirmar que grande parte dos alunos
que freqüentam mais às aulas obtiveram notas maiores, estando um aluno ou outro
fora do padrão, diminuindo assim, o coeficiente de correlação.//

14
6. Numa amostra aleatória de n=12 livros da Biblioteca Central, encontramos r= 0,207
entre a idade da edição e o número de páginas do livro.

a) O que se pode dizer com base no valor deste coeficiente de correlação?

b) Esta correlação pode ser explicada meramente por fatores casuais?

Resolução:

a) Que há uma correlação fraca entre a idade da edição e o número de páginas do


livro.//

b) Sim, pode. O número de páginas de um livro não se determina pela idade da


edição, se houver correlação forte em determinada amostra envolvendo estes
fatores será mera “coincidência” ou pura manipulação de dados.//

7. Nos últimos anos, em várias regiões, houve um movimento migratório que fez
crescer bastante a população urbana nos municípios médios e grandes. Neste contexto,
vamos tentar explicar o crescimento demográfico de um município em função de sua
população urbana, para os municípios do Quadro 1.

a) Qual deve ser a variável dependente e a independente?

b) Estabeleça a equação de regressão.

c) Faça um gráfico com os pontos observados e a reta de regressão estimada.

d) Qual é a taxa de crescimento demográfico, predita pela equação de regressão, para


um município de 300 mil habitantes?

e) Calcule o coeficiente r2.

f) Quais são as principais informações que podem ser obtidas pela presente análise?

Resolução:

a) o crescimento demográfico deve ser a variável dependente e a população urbana


a variável independente.//

b) Equação da regressão:

~ ~
∑𝒙𝒚−𝒏.𝒙.𝒚 𝟒𝟗𝟗𝟎,𝟔𝟖−𝟏𝟐(𝟏𝟎𝟑,𝟎𝟖𝟑)(𝟑,𝟐𝟕𝟒𝟏𝟔𝟔)
b= ~ → b=
∑𝒙𝟐 −𝒏.𝒙𝟐 𝟐𝟎𝟐𝟐𝟕𝟑−𝟏𝟐(𝟏𝟎𝟑,𝟎𝟖𝟑)𝟐

15
𝟒𝟗𝟗𝟎,𝟔𝟖−𝟏𝟐𝟑𝟔,𝟗𝟗𝟔(𝟑,𝟐𝟕𝟒𝟏𝟔𝟔) 𝟒𝟗𝟗𝟎,𝟔𝟖−𝟒𝟎𝟓𝟎,𝟏𝟑𝟎𝟐𝟒𝟓
b= → b=
𝟐𝟎𝟐𝟐𝟕𝟑−𝟏𝟐(𝟏𝟎𝟔𝟐𝟔,𝟏𝟎) 𝟐𝟎𝟐𝟐𝟕𝟑−𝟏𝟐𝟕𝟓𝟏𝟑,𝟐𝟎

𝟗𝟒𝟎,𝟓𝟓
b= → b= 0,01258//
𝟕𝟒𝟕𝟓𝟗,𝟖

a= 3,274- 0,01258(103,083) → a= 3,274-1,2967 → a= 1,9773//

Equação da Regressão y= 1,9773 + 0,0126x//

n x2 y2 (x.y)
população taxa de cresc.
urbana (x) Demográfico (y)
1 94 3,19 8836 10,1761 299,86
2 181 4,6 32761 21,16 832,6
3 39 2,78 1521 7,7284 108,42
4 292 6,46 85264 41,7316 1886,32
5 32 1,99 1024 3,9601 63,68
6 126 1,89 15876 3,5721 238,14
7 36 2,92 1296 8,5264 105,12
8 77 5,32 5929 28,3024 409,64
9 25 2,71 625 7,3441 67,75
10 186 3,11 34596 9,6721 578,46
11 116 3,11 13456 9,6721 360,76
12 33 1,21 1089 1,4641 39,93
∑ 1237 39,29 202273 153,3095 4990,68

Temos que: média x = 103,083, média y= 3,274166

16
c) Gráfico:

6 y = 0,0126x + 1,9773

4
Série1
3 Linear (Série1)

0
0 100 200 300 400

d) Sendo x = 300 (mil), temos:

y=1,9773 + 0,0126(300)

y=1,9773 + 3,78

y=5,7573//

A taxa de crescimento demográfico predita para um município d 300 mil


habitantes será de 5,7573//

e) Coeficiente de Correlação:
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟐.(𝟒𝟗𝟗𝟎,𝟔𝟖)–(𝟏𝟐𝟑𝟕).(𝟑𝟗,𝟐𝟗)
r= →r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟐.(𝟐𝟎𝟐𝟐𝟕𝟑)−(𝟏𝟐𝟑𝟕)𝟐 ].[𝟏𝟐.(𝟏𝟓𝟑,𝟑𝟎𝟗𝟓)−(𝟑𝟗,𝟐𝟗)𝟐 ]

𝟓𝟗𝟖𝟖𝟖,𝟏𝟔−𝟒𝟖𝟔𝟎𝟏,𝟕𝟑 𝟏𝟏𝟐𝟖𝟔,𝟒𝟑
r= → r=
√[𝟐𝟒𝟐𝟕𝟐𝟕𝟔−𝟏𝟓𝟑𝟎𝟏𝟔𝟗].[𝟏𝟖𝟑𝟗,𝟕𝟏𝟒−𝟏𝟓𝟒𝟑,𝟕𝟎𝟒𝟏] √[𝟖𝟗𝟕𝟏𝟎𝟕].[𝟐𝟗𝟔,𝟎𝟑𝟔𝟗]

𝟏𝟏𝟐𝟖𝟔,𝟒𝟑 𝟏𝟏𝟐𝟖𝟔,𝟒𝟑
r= → r= → r= 0,6925// r2=0,4797//
√𝟐𝟔𝟓𝟓𝟕𝟔𝟕𝟕𝟓,𝟐 𝟏𝟔𝟐𝟗𝟔,𝟓𝟐𝟔𝟒𝟖

17
O coeficiente de correlação é 0,69, existindo portanto uma correlação positiva
média.//

f) Os principais dados que podem ser obtidos: qual a taxa de crescimento


demográfico em relação à população urbana, obtendo-se os resultados através da
equação de regressão e a média correlação existente entre esses dois fatores.//

9. Dados o tempo de serviço de 10 funcionários de uma companhia de seguros e o


número de clientes que cada um possui, verifique se existe uma associação entre estas
variáveis;

ano de serviço (x) 2 3 4 5 4 6 7 8 8 10


Nº de clientes (y) 48 50 56 52 43 60 62 58 64 72

a) Calcule as medidas descritivas destas duas variáveis;

b) Construa o diagrama de dispersão e anote os valores mínimos e máximos de x e y


que aparecem no gráfico;

c) Trace no diagrama de dispersão as retas y= X e x=Y e analise o gráfico;

d) Calcule e interprete o coeficiente de correlação.

Resolução:

n ano de serviço (x) Nº de clientes (y)


1 2 48
2 3 50
3 4 56
4 5 52
5 4 43
6 6 60
7 7 62
8 8 58
9 8 64
10 10 72
∑ 57 565

18
a) Medidas Descritivas:

* Média: x= 5,7// y=56,5//

*Desvio Padrão:

n Nº de clientes (y) (y-média y)2 n ano de serviço (x) (x-média x)2


1 48 72,25 1 2 13,69
2 50 42,25 2 3 7,29
3 56 0,25 3 4 2,89
4 52 20,25 4 5 0,49
5 43 182,25 5 4 2,89
6 60 12,25 6 6 0,09
7 62 30,25 7 7 1,69
8 58 2,25 8 8 5,29
9 64 56,25 9 8 5,29
10 72 240,25 10 10 18,49
∑ 565 658,5 ∑ 57 58,1

𝟓𝟖,𝟏
Desvio Padrão x: √ →Desvio padrão x= 2,5407//
𝟗

𝟔𝟓𝟖,𝟓
Desvio Padrão y: √ →Desvio padrão y= 8,5553//
𝟗

b) Diagrama de Dispersão:

80

70 10; 72
8; 64
4; 56 6; 60
60
3; 50 7; 62 8; 58
50
5; 52
40 2; 48
4; 43 Série1
30

20

10

0
0 2 4 6 8 10 12

x mínimo= 2, y mínimo= 43. x máximo= 10, y máximo=72//

19
c) Representação da Reta no gráfico:

80

70 y = 2,9518x + 39,675
R² = 0,7688
60

50

40 Série1
Linear (Série1)
30

20

10

0
0 2 4 6 8 10 12

Através do gráfico nota-se uma forte correlação entre os dados.

*Equação da Regressão:
~~
∑𝒙𝒚−𝒏.𝒙.𝒚 𝟑𝟑𝟗𝟐−𝟏𝟎(𝟓,𝟕)(𝟓𝟔,𝟓)
b= 𝟐 ~𝟐 → b=
∑𝒙 −𝒏.𝒙 𝟑𝟖𝟑−𝟏𝟎(𝟓,𝟕)𝟐

𝟑𝟑𝟗𝟐−𝟑𝟐𝟐𝟎,𝟓 𝟏𝟕𝟏,𝟓
b= → b= →b=2,9518//
𝟑𝟖𝟑−𝟑𝟐𝟒,𝟗 𝟓𝟖,𝟏

a= 56,5 - 2,9518(5,7)

a= 56,5- 16,825

a= 39,675

Equação da Regressão: y= 39,675+ 2,9518x//

20
d) Coeficiente de Correlação:

n ano de serviço (x) Nº de clientes (y) x2 y2 (x.y)


1 2 48 4 2304 96
2 3 50 9 2500 150
3 4 56 16 3136 224
4 5 52 25 2704 260
5 4 43 16 1849 172
6 6 60 36 3600 360
7 7 62 49 3844 434
8 8 58 64 3364 464
9 8 64 64 4096 512
10 10 72 100 5184 720
∑ 57 565 383 32581 3392

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟑𝟑𝟗𝟐)–(𝟓𝟕).(𝟓𝟔𝟓)
r= →r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟑𝟖𝟑)−(𝟓𝟕)𝟐 ].[𝟏𝟎.(𝟑𝟐𝟓𝟖𝟏)−(𝟓𝟔𝟓)𝟐 ]

𝟑𝟑𝟗𝟐𝟎−𝟑𝟐𝟐𝟎𝟓 𝟏𝟕𝟏𝟓
r= → r=
√[𝟑𝟖𝟑𝟎−𝟑𝟐𝟒𝟗].[𝟑𝟐𝟓𝟖𝟏𝟎−𝟑𝟏𝟗𝟐𝟐𝟓] √[𝟓𝟖𝟏].[𝟔𝟓𝟖𝟓]

𝟏𝟕𝟏𝟓 𝟏𝟕𝟏𝟓
r= → r= → r= 0,8768//
√𝟑𝟖𝟐𝟓𝟖𝟖𝟓 𝟏𝟗𝟓𝟓,𝟗𝟖

O coeficiente de Pearson é 0,8768, existindo portanto uma correlação forte


positiva.//

21
10. Numa pesquisa feita com 10 famílias com renda bruta mensal entre 10 e 60 salários
mínimos, mediram-se: X: renda bruta mensal (expressa em números de salários
mínimos) e Y: a porcentagem de renda bruta anual gasta com assistência médica.

x 12 16 18 20 28 30 40 48 50 54
y 7,2 7,4 7 6,5 6,6 6,7 6 5,6 6 5,5

a) Escolha adequadamente X e Y.

b) Construa o diagrama de dispersão

c) Calcule o coeficiente de correlação.

Resolução:

n x y x2 y2 (x.y)
1 12 7,2 144 51,84 86,4
2 16 7,4 256 54,76 118,4
3 18 7 324 49 126
4 20 6,5 400 42,25 130
5 28 6,6 784 43,56 184,8
6 30 6,7 900 44,89 201
7 40 6 1600 36 240
8 48 5,6 2304 31,36 268,8
9 50 6 2500 36 300
10 54 5,5 2916 30,25 297
∑ 316 64,5 12128 419,91 1952,4

a) x (renda bruta mensal) é a variável independente e y (% de renda bruta anual


gasta com assistência médica) é a variável dependente.//

*Equação da Regressão:

Temos que : média x= 31,6 e média y=6,45


~ ~
∑𝒙𝒚−𝒏.𝒙.𝒚 𝟏𝟗𝟓𝟐,𝟒−𝟏𝟎(𝟑𝟏,𝟔)(𝟔,𝟒𝟓)
b= ~ → b=
∑𝒙𝟐 −𝒏.𝒙𝟐 𝟏𝟐𝟏𝟐𝟖−𝟏𝟎(𝟑𝟏,𝟔)𝟐

22
𝟏𝟗𝟓𝟐,𝟒−𝟐𝟎𝟑𝟖,𝟐 −𝟖𝟓,𝟖
b= → b= → b= -0,04//
𝟏𝟐𝟏𝟐𝟖−𝟗𝟗𝟖𝟓,𝟔 𝟐𝟏𝟒𝟐,𝟒

a= 6,45-(-0,04)(31,6) → a= 6,45+1,2655 → a= 7,7155

Equação da Regressão y= 7,7155 – 0,04x//

b) Diagrama de Dispersão:

8
7
6
5
4
3
2
1
0
0 10 20 30 40 50 60

c) Coeficiente de Correlação:
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟏𝟗𝟓𝟐,𝟒)–(𝟑𝟏𝟔).(𝟔𝟒,𝟓)
r= →r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟏𝟐𝟏𝟐𝟖)−(𝟑𝟏𝟔)𝟐 ].[𝟏𝟎.(𝟒𝟏𝟗,𝟗𝟏)−(𝟔𝟒,𝟓)𝟐 ]

𝟏𝟗𝟓𝟐𝟒−𝟐𝟎𝟑𝟖𝟐 −𝟖𝟓𝟖
r= → r=
√[𝟏𝟐𝟏𝟐𝟖𝟎−𝟗𝟗𝟖𝟓𝟔].[𝟒𝟏𝟗𝟗,𝟏−𝟒𝟏𝟔𝟎,𝟐𝟓] √[𝟐𝟏𝟒𝟐𝟒].[𝟑𝟖,𝟖𝟓]

−𝟖𝟓𝟖 −𝟖𝟓𝟖
r= → r= → r= -0,9404//
√𝟖𝟑𝟐𝟑𝟐𝟐,𝟒 𝟗𝟏𝟐,𝟑𝟏𝟕𝟎𝟓𝟎𝟐

O coeficiente de Pearson é 0,9404; existindo portanto uma correlação forte


negativa.//

23
11. Os quatro conjuntos de dados a seguir foram preparados pelo estatístico F.J
Anscombe e são usados com freqüência em aulas sobre correlação.

Conjunto 1 Conjunto 2 Conjunto 3 Conjunto 4


x y x y x y x y
10 8,04 10 9,14 10 7,46 8 6,58
8 6,95 8 8,14 8 6,77 8 5,76
13 7,58 13 8,74 13 12,74 8 7,71
9 8,81 9 8,77 9 7,11 8 8,84
11 8,33 11 9,26 11 7,81 8 8,47
14 9,96 14 8,1 14 8,84 8 7,04
6 7,24 6 6,13 6 6,08 8 5,25
4 4,26 4 3,1 4 5,39 19 12,5
12 10,84 12 9,13 12 8,15 8 5,56
7 4,82 7 7,26 7 6,42 8 7,91
5 5,68 5 4,74 5 5,73 8 6,89

a) Calcule a média e o desvio padrão para cada conjunto de dados.

b) Calcule o coeficiente de correlação para cada conjunto de dados.

c) Construa o diagrama de Dispersão para cada conjunto de dados.

d) Analise os resultados.

24
Resolução:

a)

** Para o conjunto 1 **

Temos que a média de x = 9// e média de y= 7,5//

Conjunto 1
n (x-média x) 2 (y-média y)2 x2 y2 (x.y)
x y
1 10 8,04 1 0,2916 100 64,6416 80,4
2 8 6,95 1 0,3025 64 48,3025 55,6
3 13 7,58 16 0,0064 169 57,4564 98,54
4 9 8,81 0 1,7161 81 77,6161 79,29
5 11 8,33 4 0,6889 121 69,3889 91,63
6 14 9,96 25 6,0516 196 99,2016 139,44
7 6 7,24 9 0,0676 36 52,4176 43,44
8 4 4,26 25 10,4976 16 18,1476 17,04
9 12 10,84 9 11,1556 144 117,5056 130,08
10 7 4,82 4 7,1824 49 23,2324 33,74
11 5 5,68 16 3,3124 25 32,2624 28,4
∑ 99 82,51 110 41,2727 1001 660,1727 797,6

𝟏𝟏𝟎
Desvio Padrão x: √ 𝟏𝟎 →Desvio padrão x= 3,3166//

𝟒𝟏,𝟐𝟕𝟐𝟕
Desvio Padrão y: √ →Desvio padrão y= 2,0315//
𝟏𝟎

25
** Para o conjunto 2 **

Temos que a média de x = 9// e média de y= 7,5//

Conjunto 2
n (x-média x)2 (y-média y)2 x2 y2 (x.y)
x y
1 10 9,14 1 2,6896 100 83,5396 91,4
2 8 8,14 1 0,4096 64 66,2596 65,12
3 13 8,74 16 1,5376 169 76,3876 113,62
4 9 8,77 0 1,6129 81 76,9129 78,93
5 11 9,26 4 3,0976 121 85,7476 101,86
6 14 8,1 25 0,36 196 65,61 113,4
7 6 6,13 9 1,8769 36 37,5769 36,78
8 4 3,1 25 19,36 16 9,61 12,4
9 12 9,13 9 2,6569 144 83,3569 109,56
10 7 7,26 4 0,0576 49 52,7076 50,82
11 5 4,74 16 7,6176 25 22,4676 23,7
∑ 99 82,51 110 41,2763 1001 660,1763 797,59

𝟏𝟏𝟎
Desvio Padrão x: √ 𝟏𝟎 →Desvio padrão x= 3,3166//

𝟒𝟏,𝟐𝟕𝟔𝟑
Desvio Padrão y: √ →Desvio padrão y= 2,0316//
𝟏𝟎

** Para o conjunto 3 **

Temos que a média de x = 9// e média de y= 7,5//

Conjunto 3
n (x-média x)2 (y-média y)2 x2 y2 (x.y)
x y
1 10 7,46 1 0,0016 100 55,6516 74,6
2 8 6,77 1 0,5329 64 45,8329 54,16
3 13 12,74 16 27,4576 169 162,3076 165,62
4 9 7,11 0 0,1521 81 50,5521 63,99
5 11 7,81 4 0,0961 121 60,9961 85,91
6 14 8,84 25 1,7956 196 78,1456 123,76
7 6 6,08 9 2,0164 36 36,9664 36,48
8 4 5,39 25 4,4521 16 29,0521 21,56
9 12 8,15 9 0,4225 144 66,4225 97,8
10 7 6,42 4 1,1664 49 41,2164 44,94
11 5 5,73 16 3,1329 25 32,8329 28,65
∑ 99 82,5 110 41,2262 1001 659,9762 797,47

26
𝟏𝟏𝟎
Desvio Padrão x: √ 𝟏𝟎 →Desvio padrão x= 3,3166//

𝟒𝟏,𝟐𝟐𝟔𝟐
Desvio Padrão y: √ →Desvio padrão y= 2,0304//
𝟏𝟎

** Para o conjunto 4 **

Temos que a média de x = 9// e média de y= 7,5//

Conjunto 4
n (x-média x)2 (y-média y)2 x2 y2 (x.y)
x y
1 8 6,58 1 0,8464 64 43,2964 52,64
2 8 5,76 1 3,0276 64 33,1776 46,08
3 8 7,71 1 0,0441 64 59,4441 61,68
4 8 8,84 1 1,7956 64 78,1456 70,72
5 8 8,47 1 0,9409 64 71,7409 67,76
6 8 7,04 1 0,2116 64 49,5616 56,32
7 8 5,25 1 5,0625 64 27,5625 42
8 19 12,5 100 25 361 156,25 237,5
9 8 5,56 1 3,7636 64 30,9136 44,48
10 8 7,91 1 0,1681 64 62,5681 63,28
11 8 6,89 1 0,3721 64 47,4721 55,12
∑ 99 82,51 110 41,2325 1001 660,1325 797,58

𝟏𝟏𝟎
Desvio Padrão x: √ 𝟏𝟎 →Desvio padrão x= 3,3166//

𝟒𝟏,𝟐𝟑𝟐𝟓
Desvio Padrão y: √ 𝟏𝟎
→Desvio padrão y= 2,0305//

b) Coeficiente de Correlação:

** Para o conjunto 1 **
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟏.(𝟕𝟗𝟕,𝟔)–(𝟗𝟗).(𝟖𝟐,𝟓𝟏)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟏.(𝟏𝟎𝟎𝟏)−(𝟗𝟗)𝟐 ].[𝟏𝟏.(𝟔𝟔𝟎,𝟏𝟕𝟐𝟕)−(𝟖𝟐,𝟓𝟏)𝟐 ]

𝟖𝟕𝟕𝟑,𝟔−𝟖𝟏𝟔𝟖,𝟒𝟗 𝟔𝟎𝟓,𝟏𝟏
r= → r=
√[𝟏𝟏𝟎𝟏𝟏−𝟗𝟖𝟎𝟏].[𝟕𝟐𝟔𝟏,𝟖𝟗𝟗𝟕−𝟔𝟖𝟎𝟕,𝟗𝟎𝟎𝟏] √[𝟏𝟐𝟏𝟎].[𝟒𝟓𝟑,𝟗𝟗𝟗𝟔]

27
𝟔𝟎𝟓,𝟏𝟏 𝟔𝟎𝟓,𝟏𝟏
r= → r= → r= 0,8164//
√𝟓𝟒𝟗𝟑𝟑𝟗,𝟓𝟏𝟔 𝟕𝟒𝟏,𝟏𝟕𝟒𝟒𝟏𝟔𝟕

O coeficiente de Pearson é 0,8164 existindo portanto, uma correlação positiva


forte.//

** Para o conjunto 2 **

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟏.(𝟕𝟗𝟕,𝟓𝟗)–(𝟗𝟗).(𝟖𝟐,𝟓𝟏)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟏.(𝟏𝟎𝟎𝟏)−(𝟗𝟗)𝟐 ].[𝟏𝟏.(𝟔𝟔𝟎,𝟏𝟕𝟔𝟑)−(𝟖𝟐,𝟓𝟏)𝟐 ]

𝟖𝟕𝟕𝟑,𝟒𝟗−𝟖𝟏𝟔𝟖,𝟒𝟗 𝟔𝟎𝟓
r= → r=
√[𝟏𝟏𝟎𝟏𝟏−𝟗𝟖𝟎𝟏].[𝟕𝟐𝟔𝟏,𝟗𝟑𝟗𝟑−𝟔𝟖𝟎𝟕,𝟗𝟎𝟎𝟏] √[𝟏𝟐𝟏𝟎].[𝟒𝟓𝟒,𝟎𝟑𝟗𝟐]

𝟔𝟎𝟓 𝟔𝟎𝟓
r= → r= → r= 0,8162//
√𝟓𝟒𝟗𝟑𝟖𝟕,𝟒𝟑𝟐 𝟕𝟒𝟏,𝟐𝟎𝟔𝟕𝟒𝟎𝟒

O coeficiente de Pearson é 0,8162 existindo portanto, uma correlação positiva


forte.//

** Para o conjunto 3 **
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟏.(𝟕𝟗𝟕,𝟒𝟕)–(𝟗𝟗).(𝟖𝟐,𝟓)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟏.(𝟏𝟎𝟎𝟏)−(𝟗𝟗)𝟐 ].[𝟏𝟏.(𝟔𝟓𝟗,𝟗𝟕𝟔𝟐)−(𝟖𝟐,𝟓)𝟐 ]

𝟖𝟕𝟕𝟐,𝟏𝟕−𝟖𝟏𝟔𝟕,𝟓 𝟔𝟎𝟒,𝟔𝟕
r= → r=
√[𝟏𝟏𝟎𝟏𝟏−𝟗𝟖𝟎𝟏].[𝟕𝟐𝟓𝟗,𝟕𝟑𝟖𝟐−𝟔𝟖𝟎𝟔,𝟐𝟓] √[𝟏𝟐𝟏𝟎].[𝟒𝟓𝟑,𝟒𝟖𝟖𝟐]

𝟔𝟎𝟒,𝟔𝟕 𝟔𝟎𝟒,𝟔𝟕
r= → r= → r= 0,8162//
√𝟓𝟒𝟖𝟕𝟐𝟎,𝟕𝟐𝟐 𝟕𝟒𝟎,𝟕𝟓𝟔𝟖𝟓𝟖

O coeficiente de Pearson é 0,8162 existindo portanto, uma correlação positiva


forte.//

28
** Para o conjunto 4 **

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟏.(𝟕𝟗𝟕,𝟓𝟖)–(𝟗𝟗).(𝟖𝟐,𝟓𝟏)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟏.(𝟏𝟎𝟎𝟏)−(𝟗𝟗)𝟐 ].[𝟏𝟏.(𝟔𝟔𝟎,𝟏𝟑𝟐𝟓)−(𝟖𝟐,𝟓𝟏)𝟐 ]

𝟖𝟕𝟕𝟑,𝟑𝟖−𝟖𝟏𝟔𝟖,𝟒𝟗 𝟔𝟎𝟒,𝟖𝟗
r= → r=
√[𝟏𝟏𝟎𝟏𝟏−𝟗𝟖𝟎𝟏].[𝟕𝟐𝟔𝟏,𝟒𝟓𝟕𝟓−𝟔𝟖𝟎𝟕,𝟗𝟎𝟎𝟏] √[𝟏𝟐𝟏𝟎].[𝟒𝟓𝟑,𝟓𝟓𝟕𝟒]

𝟔𝟎𝟒,𝟖𝟗 𝟔𝟎𝟒,𝟖𝟗
r= → r= → r= 0,8165//
√𝟓𝟒𝟖𝟖𝟎𝟒,𝟒𝟓𝟒 𝟕𝟒𝟎,𝟖𝟏𝟑𝟑𝟕𝟑

O coeficiente de Pearson é 0,8165 existindo portanto, uma correlação positiva


forte.//

c) Diagrama de Dispersão:

** Para o conjunto 1 **

12

10

6
Série1

0
0 5 10 15

29
** Para o conjunto 2 **

10
9
8
7
6
5
Série1
4
3
2
1
0
0 5 10 15

** Para o conjunto 3 **

14

12

10

8
Série1
6

0
0 5 10 15

30
** Para o conjunto 4 **

14

12

10

8
Série1
6

0
0 5 10 15 20

d) Análise:

Os resultados foram praticamente os mesmos, com pequenas diferenças de


arredondamento, possuem a mesma média para todos e coeficiente de variação
quase iguais, todos com correlação forte positiva entre os dados.//

31
12. Uma empresa que produz bens de alta tecnologia está preocupada com a
produtividade de funcionários que exercem funções repetitivas e procura descobrir
como algumas variáveis podem influenciar no rendimento dessas pessoas. Para isso
implementa em cada uma de suas três fábricas um programa específico: alimentação
especial sugerida pelos nutricionistas; intervalos para exercícios de relaxamento
sugerido pelos fisioterapeutas; rodízio de funções sugerido pelos psicólogos. O quadro a
seguir mostra o resultado da produtividade para diversos níveis implementados no
programa.

Produtividade (menor = 100%) 100 102 105 108 112 120


Alimentação (frequência semanal) 4 5 1 3 6 2
Exercícios (frequência semanal) 1 3 2 4 5 6
Rodízio (frequência semanal) 3 1 2 6 4 5

a) Construa o diagrama de dispersão da produtividade contra cada uma das variáveis


explicativas. Qual variável parece manter melhor correlação com a produtividade?

b) Calcule o coeficiente de correlação linear de Pearson nos 3 casos. O coeficiente


confirma a impressão visual dos diagramas?

Resolução:

a) Diagrama de Dispersão:

** Para Produtividade x Alimentação (freqüência semanal) **

3 Série1

0
95 100 105 110 115 120 125

32
** Para Produtividade x Exercícios (freqüência semanal) **

3 Série1

0
95 100 105 110 115 120 125

** Para Produtividade x Rodízio (freqüência semanal) **

3 Série1

0
95 100 105 110 115 120 125

Analisando os gráficos a variável que representa ter maior correlação com a


produtividade é a variável “Exercícios”.

33
b) Coeficiente de Correlação;

** Para Produtividade x Alimentação (freqüência semanal) **

n Produtividade (menor = 100%) Alimentação (frequência semanal) x2 y2 (x.y)


1 100 4 10000 16 400
2 102 5 10404 25 510
3 105 1 11025 1 105
4 108 3 11664 9 324
5 112 6 12544 36 672
6 120 2 14400 4 240
∑ 647 21 70037 91 2251

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟔.(𝟐𝟐𝟓𝟏)–(𝟔𝟒𝟕).(𝟐𝟏)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟔.(𝟕𝟎𝟎𝟑𝟕)−(𝟔𝟒𝟕)𝟐 ].[𝟔.(𝟗𝟏)−(𝟐𝟏)𝟐 ]

𝟏𝟑𝟓𝟎𝟔−𝟏𝟑𝟓𝟖𝟕 −𝟖𝟏
r= → r=
√[𝟒𝟐𝟎𝟐𝟐𝟐−𝟒𝟏𝟖𝟔𝟎𝟗].[𝟓𝟒𝟔−𝟒𝟒𝟏] √[𝟏𝟔𝟏𝟑].[𝟏𝟎𝟓]

−𝟖𝟏 −𝟖𝟏
r= → r= → r= -0,1968//
√𝟏𝟔𝟗𝟑𝟔𝟓 𝟒𝟏𝟏,𝟓𝟑𝟗𝟕

O coeficiente de Pearson é -0,1968 existindo portanto, uma correlação negativa


fraca.//

34
** Para Produtividade x Exercícios (freqüência semanal) **

n Produtividade (menor = 100%) Exercícios (frequência semanal) x2 y2 (x.y)


1 100 1 10000 1 100
2 102 3 10404 9 306
3 105 2 11025 4 210
4 108 4 11664 16 432
5 112 5 12544 25 560
6 120 6 14400 36 720
∑ 647 21 70037 91 2328

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟔.(𝟐𝟑𝟐𝟖)–(𝟔𝟒𝟕).(𝟐𝟏)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟔.(𝟕𝟎𝟎𝟑𝟕)−(𝟔𝟒𝟕)𝟐 ].[𝟔.(𝟗𝟏)−(𝟐𝟏)𝟐 ]

𝟏𝟑𝟗𝟔𝟖−𝟏𝟑𝟓𝟖𝟕 𝟑𝟖𝟏
r= → r=
√[𝟒𝟐𝟎𝟐𝟐𝟐−𝟒𝟏𝟖𝟔𝟎𝟗].[𝟓𝟒𝟔−𝟒𝟒𝟏] √[𝟏𝟔𝟏𝟑].[𝟏𝟎𝟓]

𝟑𝟖𝟏 𝟑𝟖𝟏
r= → r= → r= 0,9257//
√𝟏𝟔𝟗𝟑𝟔𝟓 𝟒𝟏𝟏,𝟓𝟑𝟗𝟕

O coeficiente de Pearson é 0,9257 existindo portanto, uma correlação positiva


forte.//

35
** Para Produtividade x Rodízio (freqüência semanal) **

n Produtividade (menor = 100%) Rodízio (frequência semanal) x2 y2 (x.y)


1 100 3 10000 9 300
2 102 1 10404 1 102
3 105 2 11025 4 210
4 108 6 11664 36 648
5 112 4 12544 16 448
6 120 5 14400 25 600
∑ 647 21 70037 91 2308

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟔.(𝟐𝟑𝟎𝟖)–(𝟔𝟒𝟕).(𝟐𝟏)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟔.(𝟕𝟎𝟎𝟑𝟕)−(𝟔𝟒𝟕)𝟐 ].[𝟔.(𝟗𝟏)−(𝟐𝟏)𝟐 ]

𝟏𝟑𝟖𝟒𝟖−𝟏𝟑𝟓𝟖𝟕 𝟐𝟔𝟏
r= → r=
√[𝟒𝟐𝟎𝟐𝟐𝟐−𝟒𝟏𝟖𝟔𝟎𝟗].[𝟓𝟒𝟔−𝟒𝟒𝟏] √[𝟏𝟔𝟏𝟑].[𝟏𝟎𝟓]

𝟐𝟔𝟏 𝟐𝟔𝟏
r= → r= → r= 0,6341//
√𝟏𝟔𝟗𝟑𝟔𝟓 𝟒𝟏𝟏,𝟓𝟑𝟗𝟕

O coeficiente de Pearson é 0,6341 existindo portanto, uma correlação positiva


média.//

O coeficiente calculado confirma a impressão observada no gráfico, de que o fator


que apresenta maior correlação com a produtividade é o fator exercícios. Em
seguida o fator “rodízio” apresenta média correlação, e o que apresenta menor
correlação é o fator alimentação.

36
13. Use as informações de poupança agregada e renda (bilhões de reais) em um país X
no período de 1990 a 1999 (dados fictícios), para estimar a influência do nível de renda
sobre a poupança.

a) Construa o diagrama de dispersão e trace a reta de regressão da poupança em função


da renda. Interprete os coeficientes.

b) Diga qual é o acréscimo na poupança agregada para cada bilhão a mais na renda.

c) Estime a poupança para uma renda de R$469 400 000 000,00. Quanto seria o
consumo agregado das famílias? (consumo+poupança=renda).

d) Calcule e interprete o coeficiente de correlação

e) Calcule e interprete o coeficiente de determinação

f) Construa o diagrama de dispersão considerando o consumo como variável resposta e


a renda como variável explicativa(preditora). Estime a reta de regressão e compare com
o resultado do item a.

Resolução:

OBSERVAÇÃO:

Dados baseados no PIB, renda e poupança do Brasil nos anos de 1990 a 1999
(dados modificados devido a conversão para reais supondo-se um dólar de R$
2,30).

Quadro - Renda X Poupança: Brasil 1990-1999


Ano Renda em bi(R$) (x) Poupança em bi (R$)(y)
1990 397,7 85,5
1991 454,7 89,6
1992 516,8 92,7
1993 571 100,6
1994 575,8 98,8
1995 593,9 94,5
1996 678,5 121,3
1997 727,4 125,9
1998 892,1 170,6
1999 988,6 207,9

37
a) Diagrama de Dispersão:

250

y = 0,208x - 14,302
200 R² = 0,926

150
Série1
100 Linear (Série1)

50

0
0 500 1000 1500

Através do diagrama observa-se uma correlação forte positiva, para variações


unitárias de x haveria decréscimo em y, conforme observado na equação dada.

b) Equação da Regressão:

Temos que média x=639,65 e média y= 118,74

~ ~
∑𝒙𝒚−𝒏.𝒙.𝒚 𝟖𝟐𝟒𝟕𝟏𝟎,𝟗−𝟏𝟎(𝟔𝟑𝟗,𝟔𝟓)(𝟏𝟏𝟖,𝟕𝟒)
b= 𝟐 ~𝟐 → b=
∑𝒙 −𝒏.𝒙 𝟒𝟒𝟎𝟒𝟗𝟒𝟗−𝟏𝟎(𝟔𝟑𝟗,𝟔𝟓)𝟐

𝟖𝟐𝟒𝟕𝟏𝟎,𝟗−(𝟕𝟓𝟗𝟓𝟐𝟎,𝟒𝟏) 𝟔𝟓𝟏𝟗𝟎,𝟒𝟗
b= → b= → b= 0,208/
𝟒𝟒𝟎𝟒𝟗𝟒𝟗−𝟒𝟎𝟗𝟏𝟓𝟐𝟏,𝟐𝟐𝟓 𝟑𝟏𝟑𝟒𝟐𝟕,𝟕𝟖

a= 118,74-(0,208)(639,65) → a= 118,74-133,0472 → a= -14,302

Equação da Regressão:

y= -14,302+0,208x

38
Acréscimo na poupança agregada para cada bilhão a mais na renda

Resposta 1 : y= -14,302+0,208x//

Resposta 2:

Observação: conforme a equação da regressão obtida com base nos dados criados
o aumento unitário (de 1 bilhão na renda não seria suficiente para gerar acréscimo
na poupança, devida a disparidade entre o nível de consumo e poupança, a
população do país em questão tende a consumir mais e poupar menos). Portanto
para a variação de um bilhão na renda teremos:

y= -14,302+0,208

y=-14,094

Teremos um decréscimo de -14,094 (partindo do pressuposto renda inicial zero)


Para o acréscimo na poupança o nível de renda deverá ser no mínimo de 68,76
bilhões. Partindo deste ponto onde o nível de poupança será zero, o acréscimo de
um bilhão na renda acarretará em um acréscimo na poupança de:

y=-14,302+0,208(68,76)

y=0

y=-14,302+0,208(68,76+1)

y=-14,302+14,51

y=0,20808

Portanto o acréscimo inicial na poupança será de 0,20808//

c) Poupança para uma renda de 469,4 bilhões

y=-14,302+0,208(469,4)

y=-14,302+97,6352

y=83,3332

39
Consumo Agregado das Famílias

C+S=Y → C +83,3332= 469,4 → C= 469,4 – 83,3332

C= 386,0668

O consumo agregado das famílias seria de aproximadamente 386,07 bilhões de


reais.//

d)

Ano Renda em bi(R$) (x) Poupança em bi (R$)(y) x2 y2 (x.y)


1990 397,7 85,5 158165,3 7310,25 34003,35
1991 454,7 89,6 206752,1 8028,16 40741,12
1992 516,8 92,7 267082,2 8593,29 47907,36
1993 571 100,6 326041 10120,36 57442,6
1994 575,8 98,8 331545,6 9761,44 56889,04
1995 593,9 94,5 352717,2 8930,25 56123,55
1996 678,5 121,3 460362,3 14713,69 82302,05
1997 727,4 125,9 529110,8 15850,81 91579,66
1998 892,1 170,6 795842,4 29104,36 152192,3
1999 988,6 207,9 977330 43222,41 205529,9
∑ 6396,5 1187,4 4404949 155635 824710,9

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟖𝟐𝟒𝟕𝟏𝟎,𝟗𝟑)–(𝟔𝟑𝟗𝟔,𝟓).(𝟏𝟏𝟖𝟕,𝟒)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐] √[𝟏𝟎.(𝟒𝟒𝟎𝟒𝟗𝟒𝟖,𝟖𝟓)−(𝟔𝟑𝟗𝟔,𝟓)𝟐 ].[𝟏𝟎.(𝟏𝟓𝟓𝟔𝟑𝟓,𝟎𝟐)−(𝟏𝟏𝟖𝟕,𝟒)𝟐 ]

𝟖𝟐𝟒𝟕𝟏𝟎𝟗,𝟑𝟎−𝟕𝟓𝟗𝟓𝟐𝟎𝟒,𝟏𝟎 𝟔𝟓𝟏𝟗𝟎𝟓,𝟐𝟎
r= √[𝟒𝟒𝟎𝟒𝟗𝟒𝟖𝟖,𝟓−𝟒𝟎𝟗𝟏𝟓𝟐𝟏𝟐,𝟐𝟓].[𝟏𝟓𝟓𝟔𝟑𝟓𝟎,𝟐𝟎−𝟏𝟒𝟎𝟗𝟗𝟏𝟖,𝟕𝟔] → r=
√[𝟑𝟏𝟑𝟒𝟐𝟕𝟔,𝟐𝟓].[𝟏𝟒𝟔𝟒𝟑𝟏,𝟒𝟒]

𝟔𝟓𝟏𝟗𝟎𝟓,𝟐𝟎 𝟔𝟓𝟏𝟗𝟎𝟓,𝟐𝟎
r= → r= → r= 0,9622
√𝟒𝟓𝟖𝟗𝟓𝟔𝟓𝟖𝟒𝟔𝟒𝟓 𝟔𝟕𝟕𝟒𝟔𝟑,𝟑𝟒𝟓𝟔𝟎𝟗

O coeficiente de Pearson é 0,9622 existindo portanto, uma correlação positiva


forte.//

e) Coeficiente de determinação:

r2= 0,926//

f) Diagrama de Dispersão:
40
**Renda X Consumo

Ano Renda em bi(R$) (x) Consumo bi(R$) (x)


1990 397,7 312,2
1991 454,7 365,1
1992 516,8 424,1
1993 571 470,4
1994 575,8 477
1995 593,9 499,4
1996 678,5 557,2
1997 727,4 601,5
1998 892,1 721,5
1999 988,6 780,7
∑ 6396,5 5209,1

900
800 y = 0,792x + 14,302
R² = 0,9945
700
600
500
Série1
400
Linear (Série1)
300
200
100
0
0 200 400 600 800 1000 1200

A correlação entre renda e consumo é muito mais forte do que a correlação entre
renda e popança, sendo quase perfeita. Enquanto o fato do aumento da renda não
acarretar aumento significativo na poupança(podendo causar inclusive decréscimo
dependendo do nível de renda), o aumento no nível de renda representa um grande
aumento no consumo. (como já dito o país em questão tem maior tendência a
consumir e menor tendência a poupar).

14. Suponha os seguintes dados:

41
Despesas com propagandas Vendas de Certo
(milhões R$) Produto (mil unidades)
2,5 120
6,5 190
11 240
4 140
8,5 180
14 280
6 150
5 115
10 215
13,5 220
16 320

a) Construa o diagrama de dispersão.

b) Ajuste uma reta aos dados e estime a vendas do produto, para um gasto com
propaganda de 12 milhões de reais.

c) Qual o acréscimo nas vendas para cada milhão a mais gasto com propaganda?

d) Trace a reta no diagrama de dispersão.

e) Determine o coeficiente de correlação e interprete-o.

f) Calcule e interprete o coeficiente de determinação.

42
Resolução:

a) Diagrama de Dispersão

350

300

250

200

150 Série1

100

50

0
0 5 10 15 20

b) Equação da Regressão:

Temos que média x=8,81 e média y= 197,27

~ ~
∑𝒙𝒚−𝒏.𝒙.𝒚 𝟐𝟏𝟗𝟎𝟎−𝟏𝟏(𝟖,𝟖𝟏)(𝟏𝟗𝟕,𝟐𝟕)
b= 𝟐 ~𝟐 → b=
∑𝒙 −𝒏.𝒙 𝟏𝟎𝟓𝟑−𝟏𝟏(𝟖,𝟖𝟏)𝟐

𝟐𝟏𝟗𝟎𝟎−𝟏𝟗𝟏𝟏𝟕 𝟐𝟕𝟖𝟑
b= → b= → b= 13,985//
𝟏𝟎𝟓𝟑−𝟖𝟓𝟑,𝟕𝟕𝟕𝟏 𝟏𝟗𝟗

a= 197,27-(13,985)(8,81) → a= 74,06
Equação da Regressão:

y= 74,06+13,985x//

**Para um gasto com propaganda de 12 milhões temos:

y= 74,06+13,985(12)

y=74,06+167,82

43
y=241,88

A venda de produtos será de aproximadamente 241,88 (mil) produtos.

c) y= 74,06+13,985x//

y=74,06+13,985

y=88,045

O acréscimo nas vendas para cada milhão a mais gasto com propaganda é 88,045.

d) Reta de Regressão

350

300 y = 13,988x + 73,924


R² = 0,8958
250

200
Série1
150 Linear (Série1)

100

50

0
0 5 10 15 20

44
e) Coeficiente de Correlação:

Despesas com propagandas Vendas de Certo


n (milhões R$) Produto (mil unidades) x2 y2 (x.y)
1 2,5 120 6,25 14400 300
2 6,5 190 42,25 36100 1235
3 11 240 121 57600 2640
4 4 140 16 19600 560
5 8,5 180 72,25 32400 1530
6 14 280 196 78400 3920
7 6 150 36 22500 900
8 5 115 25 13225 575
9 10 215 100 46225 2150
10 13,5 220 182,25 48400 2970
11 16 320 256 102400 5120
∑ 97 2170 1053 471250 21900

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟏.(𝟐𝟏𝟗𝟎𝟎)–(𝟗𝟕).(𝟐𝟏𝟕𝟎)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟏.(𝟏𝟎𝟓𝟑)−(𝟗𝟕)𝟐 ].[𝟏𝟏.(𝟒𝟕𝟏𝟐𝟓𝟎)−(𝟐𝟏𝟕𝟎)𝟐 ]

𝟐𝟒𝟎𝟗𝟎𝟎−𝟐𝟏𝟎𝟒𝟗𝟎 𝟑𝟎𝟒𝟏𝟎
r= → r=
√[𝟏𝟏𝟓𝟖𝟑−𝟗𝟒𝟎𝟗].[𝟓𝟏𝟖𝟑𝟕𝟓𝟎−𝟒𝟕𝟎𝟖𝟗𝟎𝟎] √[𝟐𝟏𝟕𝟒].[𝟒𝟕𝟎𝟖𝟓𝟎]

𝟑𝟎𝟒𝟏𝟎 𝟑𝟎𝟒𝟏𝟎
r= → r= → r= 0,9454//
√𝟏𝟎𝟑𝟐𝟑𝟐𝟑𝟗𝟎𝟎 𝟑𝟐𝟏𝟐𝟗,𝟕𝟗𝟕𝟔𝟕𝟔𝟗𝟔𝟐

O coeficiente de Pearson é 0,9454 existindo portanto, uma correlação positiva


forte.//

f) Coeficiente de Determinação:

r2= 0,8958

45
15. O quadro abaixo fornece os resultados de uma pesquisa com 10 famílias de
determinada região:

Renda Poupança nº de média de anos de


Famílias (R$100,00) (R$10,00) filhos estudo da família
A 10 4 8 3
B 15 7 6 4
C 12 5 5 5
D 70 20 1 12
E 80 20 2 16
F 100 30 2 18
G 20 8 3 8
H 30 8 2 8
I 10 3 6 4
J 60 15 1 8

a) Calcule o coeficiente de correlação entre as variáveis renda e poupança, renda e


número de filhos, poupança e número de filhos, média dos anos de estudo e número de
filhos e entre as variáveis renda familiar e média de anos de estudo. Retire conclusões.

b) Ajuste um modelo linear utilizando as variáveis Renda (x) e Poupança (y). Estime o
valor poupado quando a renda for de 2000 reais.

46
Resolução:

a) Coeficiente de Correlação:

** Para renda X poupança **

Poupança
n Renda (R$100,00) (R$10,00) x2 y2 (x.y)
1 10 4 100 16 40
2 15 7 225 49 105
3 12 5 144 25 60
4 70 20 4900 400 1400
5 80 20 6400 400 1600
6 100 30 10000 900 3000
7 20 8 400 64 160
8 30 8 900 64 240
9 10 3 100 9 30
10 60 15 3600 225 900
∑ 407 120 26769 2152 7535

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟕𝟓𝟑𝟓)–(𝟒𝟎𝟕).(𝟏𝟐𝟎)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟐𝟔𝟕𝟔𝟗)−(𝟒𝟎𝟕)𝟐 ].[𝟏𝟎.(𝟐𝟏𝟓𝟏)−(𝟏𝟐𝟎)𝟐 ]

𝟕𝟓𝟑𝟓𝟎−𝟒𝟖𝟖𝟒𝟎 𝟐𝟔𝟓𝟏𝟎
r= → r=
√[𝟐𝟔𝟕𝟔𝟗𝟎−𝟏𝟔𝟓𝟔𝟒𝟗].[𝟐𝟏𝟓𝟏𝟎−𝟏𝟒𝟒𝟎𝟎] √[𝟏𝟎𝟐𝟎𝟒𝟏].[𝟕𝟏𝟏𝟎]

𝟐𝟔𝟓𝟏𝟎 𝟐𝟔𝟓𝟏𝟎
r= → r= → r= 0,9835//
√𝟕𝟐𝟓𝟓𝟏𝟏𝟓𝟏𝟎 𝟐𝟔𝟗𝟑𝟓,𝟑𝟐

O coeficiente de Pearson é 0,9835 existindo portanto, uma correlação positiva


forte.//

47
** Para renda X nº de filhos **

n Renda (R$100,00) nº de filhos x2 y2 (x.y)


1 10 8 100 64 80
2 15 6 225 36 90
3 12 5 144 25 60
4 70 1 4900 1 70
5 80 2 6400 4 160
6 100 2 10000 4 200
7 20 3 400 9 60
8 30 2 900 4 60
9 10 6 100 36 60
10 60 1 3600 1 60
∑ 407 36 26769 184 900

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟗𝟎𝟎)–(𝟒𝟎𝟕).(𝟑𝟔)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟐𝟔𝟕𝟔𝟗)−(𝟒𝟎𝟕)𝟐 ].[𝟏𝟎.(𝟏𝟖𝟒)−(𝟑𝟔)𝟐 ]

𝟗𝟎𝟎𝟎−𝟏𝟒𝟔𝟓𝟐 −𝟓𝟔𝟓𝟐
r= → r=
√[𝟐𝟔𝟕𝟔𝟗𝟎−𝟏𝟔𝟓𝟔𝟒𝟗].[𝟏𝟖𝟒𝟎−𝟏𝟐𝟗𝟔] √[𝟏𝟎𝟐𝟎𝟒𝟏].[𝟓𝟒𝟒]

−𝟓𝟔𝟐𝟎 −𝟓𝟔𝟐𝟎
r= → r= → r= -0,7586//
√𝟓𝟓𝟓𝟏𝟎𝟑𝟎𝟒 𝟕𝟒𝟓𝟎,𝟓𝟐

O coeficiente de Pearson é -0,7586 existindo portanto, uma correlação negativa


forte.//

48
** Poupança X nº de filhos **

n Poupança (R$10,00) nº de filhos x2 y2 (x.y)


1 4 8 16 64 32
2 7 6 49 36 42
3 5 5 25 25 25
4 20 1 400 1 20
5 20 2 400 4 40
6 30 2 900 4 60
7 8 3 64 9 24
8 8 2 64 4 16
9 3 6 9 36 18
10 15 1 225 1 15
∑ 120 36 2152 184 292

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟐𝟗𝟐)–(𝟏𝟐𝟎).(𝟑𝟔)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟐𝟏𝟓𝟐)−(𝟏𝟐𝟎)𝟐 ].[𝟏𝟎.(𝟏𝟖𝟒)−(𝟑𝟔)𝟐 ]

𝟐𝟗𝟐𝟎−𝟒𝟑𝟐𝟎 −𝟏𝟒𝟎𝟎
r= → r=
√[𝟐𝟏𝟓𝟐𝟎−𝟏𝟒𝟒𝟎𝟎].[𝟏𝟖𝟒𝟎−𝟏𝟐𝟗𝟔] √[𝟕𝟏𝟐𝟎].[𝟓𝟒𝟒]

−𝟏𝟒𝟎𝟎 −𝟏𝟒𝟎𝟎
r= → r= → r= -0,7113//
√𝟑𝟖𝟕𝟑𝟐𝟖𝟎 𝟏𝟗𝟔𝟖,𝟎𝟔𝟓

O coeficiente de Pearson é -0,7113 existindo portanto, uma correlação negativa


média.//

49
** Média anos de estudo X nº de filhos **

média de anos de
n estudo da família nº de filhos x2 y2 (x.y)
1 3 8 9 64 24
2 4 6 16 36 24
3 5 5 25 25 25
4 12 1 144 1 12
5 16 2 256 4 32
6 18 2 324 4 36
7 8 3 64 9 24
8 8 2 64 4 16
9 4 6 16 36 24
10 8 1 64 1 8
∑ 86 36 982 184 225

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟐𝟐𝟓)–(𝟖𝟔).(𝟑𝟔)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟗𝟖𝟐)−(𝟖𝟔)𝟐 ].[𝟏𝟎.(𝟏𝟖𝟒)−(𝟑𝟔)𝟐 ]

𝟐𝟐𝟓𝟎−𝟑𝟎𝟗𝟔 −𝟖𝟒𝟔
r= → r=
√[𝟗𝟖𝟐𝟎−𝟕𝟑𝟗𝟔].[𝟏𝟖𝟒𝟎−𝟏𝟐𝟗𝟔] √[𝟐𝟒𝟐𝟒].[𝟓𝟒𝟒]

−𝟖𝟒𝟔 −𝟖𝟒𝟔
r= → r= → r= -0,7367//
√𝟏𝟑𝟏𝟖𝟔𝟓𝟔 𝟏𝟏𝟒𝟖,𝟑𝟐

O coeficiente de Pearson é -0,7367 existindo portanto, uma correlação negativa


média.//

50
** Renda familiar X Média anos de estudo **

média de anos de
n Renda (R$100,00) estudo da família x2 y2 (x.y)
1 10 3 100 9 30
2 15 4 225 16 60
3 12 5 144 25 60
4 70 12 4900 144 840
5 80 16 6400 256 1280
6 100 18 10000 324 1800
7 20 8 400 64 160
8 30 8 900 64 240
9 10 4 100 16 40
10 60 8 3600 64 480
∑ 407 86 26769 982 4990

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟒𝟗𝟗𝟎)–(𝟒𝟎𝟕).(𝟖𝟔)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟐𝟔𝟕𝟔𝟗)−(𝟒𝟎𝟕)𝟐 ].[𝟏𝟎.(𝟗𝟖𝟐)−(𝟖𝟔)𝟐 ]

𝟒𝟗𝟗𝟎𝟎−𝟑𝟓𝟎𝟎𝟐 𝟏𝟒𝟖𝟗𝟖
r= → r=
√[𝟐𝟔𝟕𝟔𝟗𝟎−𝟏𝟔𝟓𝟔𝟒𝟗].[𝟗𝟖𝟐𝟎−𝟕𝟑𝟗𝟔] √[𝟏𝟎𝟐𝟎𝟒𝟏].[𝟐𝟒𝟐𝟒]

𝟏𝟒𝟖𝟗𝟖 𝟏𝟒𝟖𝟗𝟖
r= → r= → r= 0,9472//
√𝟐𝟒𝟕𝟑𝟒𝟕𝟑𝟖𝟒 𝟏𝟓𝟕𝟐𝟕,𝟐𝟖

O coeficiente de Pearson é 0,9472 existindo portanto, uma correlação positiva


forte.//

b) Equação da Regressão (Renda X Poupança):

51
Temos que:

Média x= 40,7 e Média y=12

~ ~
∑𝒙𝒚−𝒏.𝒙.𝒚 𝟕𝟓𝟑𝟓−𝟏𝟎(𝟒𝟎,𝟕)(𝟏𝟐)
b= → b=
∑𝒙𝟐 −𝒏.𝒙~𝟐 𝟐𝟔𝟕𝟔𝟗−𝟏𝟎(𝟒𝟎,𝟕)𝟐

𝟕𝟓𝟑𝟓−(𝟒𝟖𝟖𝟒) 𝟐𝟔𝟓𝟏
b= → b= → b= 0,2598//
𝟐𝟔𝟕𝟔𝟗−𝟏𝟔𝟓𝟔𝟒,𝟗 𝟏𝟎𝟐𝟎𝟒,𝟏

a= 12-(0,2598)(40,7) → a= 12-10,5738 → a= 1,4262

Equação da Regressão:

y= 1,4262+0,2598x

Para renda igual a 2000 reais temos:

y= 1,4262+0,2598(2000)

y= 1,4262+519,6

y= 521,0262

Para uma renda de R$ 2000,00 a poupança será de aproximadamente R$ 521,02

16. A administração de um banco desejava estabelecer um critério objetivo para avaliar


a eficiência de seus gerentes. Para isso, levantou (para cada um dos subdistritos onde
possuía agência) dados a respeito do depósito médio mensal por agência e o número de
estabelecimentos comerciais existentes nesses subdistritos. Os dados são os seguintes:

n Subdistritos nº de depósito médio


estabelecimentos mensal por agência
comerciais (10000 R$)
1 Nossa Senhora do Ó 16 14
2 Casa Verde 30 16

52
3 Vila Formosa 35 19
4 Santana 70 30
5 Barra Funda 90 31
6 Jardim Paulista 120 33
7 Santo Amaro 160 35
8 Lapa 237 43
9 Pinheiros 378 50

a) Construa o diagrama de dispersão

b) Ajuste uma reta aos dados e estime um depósito médio para um número de
estabelecimentos comerciais iguais a 350.

c) Qual o crescimento nos depósitos médios, para cada estabelecimento a mais no


subdistrito?

d) Trace a reta no diagrama de Dispersão

e) Determine o coeficiente de correlação e interprete-o

f) Calcule e interprete o coeficiente de determinação

Resolução:

a) Diagrama de Dispersão:

60

50

40

30
Série1

20

10

0
0 100 200 300 400

53
b) Equação da Regressão:

Temos que:

Média x= 126,22 e Média y=30,11

~ ~
∑𝒙𝒚−𝒏.𝒙.𝒚 𝟒𝟒𝟗𝟏𝟎−𝟗(𝟏𝟐𝟔,𝟐𝟐)(𝟑𝟎,𝟏𝟏)
b= 𝟐 ~𝟐 → b=
∑𝒙 −𝒏.𝒙 𝟐𝟓𝟒𝟒𝟑𝟒−𝟗(𝟏𝟐𝟔,𝟐𝟐)𝟐

𝟒𝟒𝟗𝟏𝟎−(𝟑𝟒𝟐𝟎𝟒,𝟑𝟓𝟕𝟖) 𝟏𝟎𝟕𝟎𝟓,𝟔𝟒𝟐𝟐
b= → b= → b= 0,0964//
𝟐𝟓𝟒𝟒𝟑𝟒−𝟏𝟒𝟑𝟑𝟖𝟑,𝟑𝟗𝟔 𝟏𝟏𝟏𝟎𝟓𝟎,𝟔𝟎𝟒

a= 30,11-(0,0964)(126,22) → a= 30,11-12,167 → a= 17,944

Equação da Regressão:

y= 17,944+0,0964x

Para um número de estabelecimentos comerciais igual a 350 temos:

y= 17,944+0,0964(350)

y= 17,944+33,74

y=51,684//

Para 350 estabelecimentos comerciais temos um depósito médio (R$ 10000) de R$


51,68//

c)

y= 17,944+0,0964(1)

y=18,0404

O acréscimo médio nos depósitos mensais para cada estabelecimento a mais é de


R$ 18,0404//

54
d) Reta de Regressão:

60

50 y = 0,0964x + 17,944
R² = 0,8767
40

30 Série1
Linear (Série1)
20

10

0
0 100 200 300 400

e) Coeficiente de Correlação:

nº de estabelecimentos depósito médio mensal


n Subdistritos X2 Y2 (X.Y)
comerciais por agência (10000 R$)

1 Nossa Senhora do Ó 16 14 256 196 224


2 Casa Verde 30 16 900 256 480
3 Vila Formosa 35 19 1225 361 665
4 Santana 70 30 4900 900 2100
5 Barra Funda 90 31 8100 961 2790
6 Jardim Paulista 120 33 14400 1089 3960
7 Santo Amaro 160 35 25600 1225 5600
8 Lapa 237 43 56169 1849 10191
9 Pinheiros 378 50 142884 2500 18900
∑ 1136 271 254434 9337 44910

55
𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟗.(𝟒𝟒𝟗𝟏𝟎)–(𝟏𝟏𝟑𝟔).(𝟐𝟕𝟏)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟗.(𝟐𝟓𝟒𝟒𝟑𝟒)−(𝟏𝟏𝟑𝟔)𝟐 ].[𝟗.(𝟗𝟑𝟑𝟕)−(𝟐𝟕𝟏)𝟐 ]

𝟒𝟎𝟒𝟏𝟗𝟎−𝟑𝟎𝟕𝟖𝟓𝟔 𝟗𝟔𝟑𝟑𝟒
r= → r=
√[𝟐𝟐𝟖𝟗𝟗𝟎𝟔−𝟏𝟐𝟗𝟎𝟒𝟗𝟔].[𝟖𝟒𝟎𝟑𝟑−𝟕𝟑𝟒𝟒𝟏] √[𝟗𝟗𝟗𝟒𝟏𝟎].[𝟏𝟎𝟓𝟗𝟐]

𝟗𝟔𝟑𝟑𝟒 𝟗𝟔𝟑𝟑𝟒
r= → r= → r= 0,9363//
√𝟏𝟎𝟓𝟖𝟓𝟕𝟓𝟎𝟕𝟐𝟎 𝟏𝟎𝟐𝟖𝟖𝟕,𝟎𝟕𝟕𝟓

O coeficiente de Pearson é 0,9363 existindo portanto, uma correlação positiva


forte.//

f) Coeficiente de Determinação:

R2=0,8767//

17. Com o objetivo de verificar se numa certa região existe correlação entre o nível de
escolaridade médio dos pais e o nível de escolaridade dos filhos, observou-se uma
amostra aleatória de 8 indivíduos adultos, verificando o número de anos que estes
freqüentaram (e tiveram aprovação) em escolas regulares(Y) e o número médio de anos
que os seus pais freqüentaram (e tiveram aprovação) em escolas regulares (X). Ao
resultados são apresentados no quadro abaixo:

x 0 0 2 3 4 4 5 7
y 2 3 2 5 9 8 8 15

a) Calcule o coeficiente de correlação de Pearson

b) Em termos do Resultado do item (a) , o que se pode dizer sobre a correlação entre o
número de anos que os 8 indivíduos freqüentaram escolas regulares (Y) e o número
médio de anos que os seus pais freqüentaram escolas regulares (X)?

Resolução:

a) Coeficiente de Pearson:

n x y x2 y2 (x.y)
1 0 2 0 4 0
2 0 3 0 9 0

56
3 2 2 4 4 4
4 3 5 9 25 15
5 4 9 16 81 36
6 4 8 16 64 32
7 5 8 25 64 40
8 7 15 49 225 105
∑ 25 52 119 476 232

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟖.(𝟐𝟑𝟐)–(𝟐𝟓).(𝟓𝟐)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟖.(𝟏𝟏𝟗)−(𝟐𝟓)𝟐 ].[𝟖.(𝟒𝟕𝟔)−(𝟓𝟐)𝟐 ]

𝟏𝟖𝟓𝟔−𝟏𝟑𝟎𝟎 𝟓𝟓𝟔
r= → r=
√[𝟗𝟓𝟐−𝟔𝟐𝟓].[𝟑𝟖𝟎𝟖−𝟐𝟕𝟎𝟒] √[𝟑𝟐𝟕].[𝟏𝟏𝟎𝟒]

𝟓𝟓𝟔 𝟓𝟓𝟔
r= → r= → r= 0,9253//
√𝟑𝟔𝟏𝟎𝟎𝟖 𝟔𝟎𝟎,𝟖𝟑𝟗𝟒

O coeficiente de Pearson é 0,9253 existindo portanto, uma correlação positiva


forte.//

b) Verificou-se que há uma forte correlação entre os dados, estudaram mais os


filhos cujos pais freqüentaram (e tiveram aprovação) escolas regulares por mais
tempo.

18. A tabela a seguir relaciona os pesos (em centenas de Kg) e as taxas de consumo de
combustível em rodovia (km/litro) numa amostra de 10 carros e passeio novos.

peso 12 13 14 14 16 18 19 22 24 26
consumo 16 14 14 13 11 12 9 9 8 6

a) Calcule o coeficiente de correlação de Pearson.

b) Considerando o resultado do item (a), como você avalia o relacionamento entre o


peso e o consumo, na amostra observada?

c) Para estabelecer uma reta de regressão, qual deve ser a variável dependente e qual
deve ser a variável independente? Justifique a sua resposta.

d) Estabeleça a equação de regressão, considerando a resposta do item (c).

57
e) Apresente o diagrama de dispersão e a reta de regressão obtida em (d).

f) Você considera adequado o modelo de ajuste de regressão do item (d)? De uma


medida desta adequação interpretando-a

g) Qual o consumo esperado para um carro de 2000 kg?

h) Você considera o seu estudo capaz de predizer o consumo esperado para um carro de
7000 kg? Justifique sua resposta.

Resolução:

a) Coeficiente de Correlação:

n peso consumo x2 y2 (x.y)


1 12 16 144 256 192
2 13 14 169 196 182
3 14 14 196 196 196
4 14 13 196 169 182
5 16 11 256 121 176
6 18 12 324 144 216
7 19 9 361 81 171
8 22 9 484 81 198
9 24 8 576 64 192
10 26 6 676 36 156
∑ 178 112 3382 1344 1861

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟏𝟖𝟔𝟏)–(𝟏𝟕𝟖).(𝟏𝟏𝟐)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟑𝟑𝟖𝟐)−(𝟏𝟕𝟖)𝟐 ].[𝟏𝟎.(𝟏𝟑𝟒𝟒)−(𝟏𝟏𝟐)𝟐 ]

𝟏𝟖𝟔𝟏𝟎−𝟏𝟗𝟗𝟑𝟔 −𝟏𝟑𝟐𝟔
r= → r=
√[𝟑𝟑𝟖𝟐𝟎−𝟑𝟏𝟔𝟖𝟒].[𝟏𝟑𝟒𝟒𝟎−𝟏𝟐𝟓𝟒𝟒] √[𝟐𝟏𝟑𝟔].[𝟖𝟗𝟔]

−𝟏𝟑𝟐𝟔 −𝟏𝟑𝟐𝟔
r= → r= → r= -0,9584//
√𝟏𝟗𝟏𝟑𝟖𝟓𝟔 𝟏𝟑𝟖𝟑,𝟒𝟐𝟏𝟖

O coeficiente de Pearson é -0,9584 existindo portanto, uma correlação negativa


forte.//

58
b) Há uma forte correlação. Quanto maior o peso do veículo, menor será o
consumo.

c) A variável dependente será o consumo e a variável independente será o peso,


analisa-se através dos dados qual a variação do consumo em função do peso do
veículo: y(x)

d) Equação da Regressão:

Temos que:

Média x= 17,8 e Média y=11,2

~ ~
∑𝒙𝒚−𝒏.𝒙.𝒚 𝟏𝟖𝟔𝟏−𝟏𝟎(𝟏𝟕,𝟖)(𝟏𝟏,𝟐)
b= ~ → b=
∑𝒙𝟐 −𝒏.𝒙𝟐 𝟑𝟑𝟖𝟐−𝟏𝟎(𝟑𝟏𝟔,𝟖𝟒)𝟐

𝟏𝟖𝟔𝟏−(𝟏𝟗𝟗𝟑,𝟔) −𝟏𝟑𝟐,𝟔
b= → b= → b= -0,6208//
𝟑𝟑𝟖𝟐−𝟑𝟏𝟔𝟖,𝟒 𝟐𝟏𝟑,𝟔

a= 11,2-(-0,6208)(17,8) → a= 11,2+11,05 → a= 22,25

Equação da Regressão:

y= 22,25-0,6208x//

e) Diagrama de Dispersão:

59
18
16
14
12
10
8 Série1
6
4
2
0
0 10 20 30

Reta da Regressão e Equação da Regressão:

18
16
14 y = -0,6208x + 22,25
R² = 0,9187
12
10
Série1
8
Linear (Série1)
6
4
2
0
0 10 20 30

f) Sim, este modelo linear se aplica bem, sendo a correlação quase perfeita.

g) Sendo os dados em centenas de Kg o consumo para 2000, será:

2000/100= 20, portanto x=20.

60
y= 22,25-0,6208x

y= 22,25-0,6208(20)

y= 22,25-12,416

y=9,834

O consumo para um veículo de 2000kg será de aproximadamente 9,8 (km/litro)

h) Não, não considero, de acordo com a equação da regressão um carro de 7000 kg


ganharia gasolina ao invés de consumir, por km rodado. É um valor exorbitante
que foge das previsões.

7000/100= 70, portanto x=70

y= 22,25-0,6208x

y= 22,25-0,6208(70)

y= 22,25-43,456

y=-21,20

Como o consumo não pode ser negativo (-21,20 km/l), presumimos que para
7000kg não é possível presumir-se o consumo.

19. O administrador de uma grande sorveteria anotou por um longo período de tempo a
temperatura média diária em ºC (x), e o volume de vendas diária de sorvete, em kg (y).
Com os dados, estabeleceu uma equação de regressão, resultando em:

y=0,5 + 1,8x, com R2= 0,80

Pede-se:

a) Qual o consumo esperado de sorvete num dia de 27ºC?

b) Qual o incremento esperado nas vendas para cada 1ºC de aumento da temperatura?

Resolução:

61
a) y= 0,5+1,8(27) → y=0,5+48,60 → y=49,10//

O consumo esperado em um dia de 27ºC é de 49,10 Kg.//

b) y= 0,5+1,8(1) → y=0,5+1,8 → y=2,30

O incremento esperado nas vendas para cada 1ºC de aumento na temperatura é de


2,30 kg.//

20. Investigaram em que medida partículas de chumbo potencialmente tóxicas emitidas


por veículos automotores são absorvidas por ciclistas que participam de competições. A
tabela abaixo, construída a partir de um gráfico apresentado em seu artigo, fornece
níveis de chumbo no sangue e horas de treinamento de 10 ciclistas.

Horas de treinamento 8 10 10 12 15 18 18 21 25 25
chumbo no sangue (mml/L) 0,53 0,25 0,34 0,25 0,29 0,3 0,53 0,53 0,53 0,87

Pede-se:

a) Faça um gráfico dos dados. Quais suas impressões?

b) Verifique se há uma correlação entre níveis de chumbo no sangue e horas de


treinamento.

c) O ciclista 10 tem níveis muito altos. Nossa evidência de uma relação é proveniente
quase que inteiramente desta observação? Repita (b) omitindo o ciclista 10.

d) O que fizemos em (c) parece razoável?

e) Está claro a partir do gráfico obtido em (a) que há variação nos dados que não é
explicada pelas horas de treinamento. (O que nos dá esta informação?). Talvez o efeito
de horas de treinamento não apareça tão fortemente como deveria, porque estamos
deixando de levar em consideração outras variáveis importantes. Sugira algumas outras
variáveis que poderiam ser importantes.

Resolução:

a) Diagrama de Dispersão:

62
1
0,9
0,8
0,7
0,6
0,5
Série1
0,4
0,3
0,2
0,1
0
0 5 10 15 20 25 30

b) Coeficiente de Correlação:

n Horas de treinamento chumbo no sangue (mml/L) x2 y2 (x.y)


1 8 0,53 64 0,2809 4,24
2 10 0,25 100 0,0625 2,5
3 10 0,34 100 0,1156 3,4
4 12 0,25 144 0,0625 3
5 15 0,29 225 0,0841 4,35
6 18 0,3 324 0,09 5,4
7 18 0,53 324 0,2809 9,54
8 21 0,53 441 0,2809 11,13
9 25 0,53 625 0,2809 13,25
10 25 0,87 625 0,7569 21,75
∑ 162 4,42 2972 2,2952 78,56

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟏𝟎.(𝟕𝟖,𝟓𝟔)–(𝟏𝟔𝟐).(𝟒,𝟒𝟐)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟏𝟎.(𝟐𝟗𝟕𝟐)−(𝟏𝟔𝟐)𝟐 ].[𝟏𝟎.(𝟐,𝟐𝟗𝟓𝟐)−(𝟒,𝟒𝟐)𝟐 ]

𝟕𝟖𝟓,𝟔−𝟕𝟏𝟔,𝟎𝟒 𝟔𝟗,𝟓𝟔
r= → r=
√[𝟐𝟗𝟕𝟐𝟎−𝟐𝟔𝟐𝟒𝟏].[𝟐𝟐,𝟗𝟓−𝟏𝟗,𝟓𝟑] √[𝟑𝟒𝟕𝟗].[𝟑,𝟒𝟐]

63
𝟔𝟗,𝟓𝟔 𝟔𝟗,𝟓𝟔
r= → r= → r= 0,6385//
√𝟏𝟏𝟖𝟗𝟖,𝟏𝟖 𝟏𝟎𝟗,𝟎𝟕𝟐𝟕

O coeficiente de Pearson é 0,6385 existindo portanto, uma correlação positiva


moderada.//

c) Coeficiente de Correlação (Omitindo o décimo ciclista):

n Horas de treinamento chumbo no sangue (mml/L) x2 y2 (x.y)


1 8 0,53 64 0,2809 4,24
2 10 0,25 100 0,0625 2,5
3 10 0,34 100 0,1156 3,4
4 12 0,25 144 0,0625 3
5 15 0,29 225 0,0841 4,35
6 18 0,3 324 0,09 5,4
7 18 0,53 324 0,2809 9,54
8 21 0,53 441 0,2809 11,13
9 25 0,53 625 0,2809 13,25
∑ 137 3,55 2347 1,5383 56,81

𝒏.∑𝒙𝒚−∑𝒙.∑𝒚 𝟗.(𝟓𝟔,𝟖𝟏)–(𝟏𝟑𝟕).(𝟑,𝟓𝟓)
r= → r=
√[𝒏.∑𝒙𝟐 −(∑𝒙)𝟐 ].[𝒏.∑𝒚𝟐 −(∑𝒚)𝟐 ] √[𝟗.(𝟐𝟑𝟒𝟕)−(𝟏𝟑𝟕)𝟐 ].[𝟗.(𝟏,𝟓𝟑𝟖𝟑)−(𝟑,𝟓𝟓)𝟐 ]

𝟓𝟏𝟏,𝟐𝟗−𝟒𝟖𝟔,𝟑𝟓 𝟐𝟒,𝟗𝟒
r= → r=
√[𝟐𝟏𝟏𝟐𝟑−𝟏𝟖𝟕𝟔𝟗].[𝟏𝟑,𝟖𝟒𝟒𝟕−𝟏𝟐,𝟔𝟎𝟐𝟓] √[𝟐𝟑𝟓𝟒].[𝟏,𝟐𝟒𝟐𝟐]

64
𝟐𝟒,𝟗𝟒 𝟐𝟒,𝟗𝟒
r= → r= → r= 0,4612//
√𝟐𝟗𝟐𝟒,𝟏𝟑𝟖𝟖 𝟓𝟒,𝟎𝟕𝟓𝟑𝟎𝟔𝟕

O coeficiente de Pearson é 0,4612 existindo portanto, uma correlação positiva


fraca.//

d) Sim, parece razoável, a retirada do décimo ciclista gerou uma mudança


razoável na correlação.

e) Sim, os dados estão bastante dispersos, poderíamos considerar como outros


fatores a alimentação e horas de sono.

65

Você também pode gostar