Você está na página 1de 5

Correlao e Regresso Lista de Exerccios

1) Barbetta (2001, p.275). Considerando os dados da Tabela 1:


a) Construir um diagrama de disperso para as variveis taxa de alfabetizao e taxa de mortalidade infantil. Quais
as informaes observadas no grfico?
b) Calcule o coeficiente de correlao de Pearson entre as variveis taxa de alfabetizao e taxa de mortalidade
infantil. Interprete o resultado obtido.
Tabela 1 - Alguns dados de doze importantes municpios catarinenses
municpio

populao
pop. urbana % de pop. taxa de cresc. taxa de mort.
taxa de
(em 1000 hab.)
urbana
demogrfico
infantil
alfabetizao
Itaja
101
94
93
3,19
37
85
Blumenau
193
181
94
4,60
27
90
Rio do Sul
42
39
94
2,78
38
85
Joinville
304
292
96
6,46
25
87
Curitibanos
42
32
76
1,99
67
75
Lages
152
126
83
1,89
63
78
Canoinhas
55
36
66
2,92
41
81
Chapec
105
77
73
5,32
13
75
Concrdia
68
25
37
2,71
28
84
Florianpolis
219
186
85
3,11
17
87
Cricima
129
116
90
3,11
32
85
Laguna
42
33
78
1,21
32
77
2) Barbetta (2001, p.275). Sejam X= nota na prova do vestibular de matemtica e Y = nota final na disciplina de clculo.
Estas variveis foram observadas em 20 alunos, ao final do primeiro perodo letivo de um curso de engenharia. Os
dados so apresentados a seguir:
X
Y
X
Y
X
Y
X
Y
X
Y
39
65
43
78
21
52
64
82
65
88
57
92
47
89
28
73
75
98
47
71
34
56
52
75
35
50
30
50
28
52
40
70
70
50
80
90
32
58
67
88
a) Construa um diagrama de disperso e verifique se existe correlao entre os dados observados destas duas
variveis.
b) Existe algum aluno que foge ao comportamento geral dos demais (ponto discrepante)?
c) Calcule a correlao entre a nota no vestibular de matemtica e a nota na disciplina de clculo.
d) Retire o valor discrepante detectado e calcule novamente o coeficiente r. Interprete.
3) Barbetta (2001, p.275). Sejam os dados do conjunto de dados do anexo do Captulo 4 (fazer download no site).
Considerando apenas a localidade da Encosta do Morro, faa um diagrama de disperso com os dados de: X= renda
familiar e Y= nmero de moradores no domiclio. Interprete.
4) Barbetta (2001, p.286). Com o objetivo de verificar se existe correlao positiva entre aptido em matemtica e aptido
em msica, foi selecionado um grupo de crianas de 8 a 10 anos de idade, que foram submetidas a dois testes de
aptido: um de matemtica e outro de msica. A ordem da aplicao dos testes em cada criana foi aleatria. Os dados
esto relacionados na Tabela 2
Tabela 2 - Testes de aptido em crianas
criana

Valores de aptido em
matemtica

msica

60

80

58

criana

Valores de aptido em
matemtica

msica

48

79

62

72

88

73

70

75

54

51

83

10

83

82

54

62

11

62

64

75

92

12

52

69

Faa o clculo do coeficiente r e confira o resultado encontrado

5) Barbetta (2001, p.286). Com respeito aos 23 alunos de uma turma de estatstica, foram observadas as seguintes
variveis: nmero de faltas e nota final da disciplina. Estes dados acusaram a segui8ntes correlao, descrita pelo
coeficiente de correlao de Pearson: r = 0,56. Comente as seguintes frases relativas turma em estudo e ao
coeficiente obtido.
a) Como r = 0,56 (correlao relativa moderada), nenhum aluno com grande nmero de faltas tirou nota alta.
b) Como as duas variveis so correlacionadas, bastaria usar uma delas como critrio de avaliao, pois uma acarreta
a outra.
c) Os dados observados mostraram uma leve tendncia de a nota final se relaciona inversamente com o nmero de
faltas, ento os alunos freqentadores tiveram, em geral, melhor desempenho nas avaliaes, do que os alunos que
faltaram muito.
6) Barbetta (2001, p.286). Numa amostra aleatria de n = 12 livros da Biblioteca Central, encontramos r = 0,207 entre a
idade da edio e o nmero de pginas do livro.
a) O que se pode dizer com base no valor deste coeficiente de correlao?
b) Esta correlao pode ser explicada meramente por fatores casuais?
7) Barbetta (2001, p.297). Nos ltimos anos, em vrias regies, houve um movimento migratrio que fez crescer bastante
a populao urbana nos municpios mdios e grandes. Neste contexto, vamos tentar explicar o crescimento
demogrfico de um municpio em funo de sua populao urbana, para os municpios da Tabela 1.
a)
b)
c)
d)
e)
f)

Qual deve ser a varivel dependente e a independente?


Estabelea a equao de regresso.
Faa um grfico com os pontos observados e a reta de regresso estimada.
Qual a taxa de crescimento demogrfico, predita pela equao de regresso, para um municpio de 300 mil
habitantes?
Calcule o coeficiente R2.
Quais so as principais informaes que podem ser obtidas pela presente anlise?

8) Barbetta (2001, p.298). Considerando que a satisfao de um aluno com curso universitrio (Y) pode ser afetada pelo
seu desempenho no curso (X), faa uma anlise de regresso, usando os dados do conjunto de dados do anexo do
Captulo 2 (fazer download no site).
9) Dados o tempo de servio de 10 funcionrios de uma companhia de seguros e o nmero de clientes que cada um possui,
verifique se existe uma associao entre estas variveis:
Anos de servio (x)
2
3
4
5
4
6
7
8
8
10
N de clientes (y)
48
50
56
52
43
60
62
58
64
72
a) Calcule as medidas descritivas destas duas variveis;
b) Construa o diagrama de disperso e anote os valores mnimo e mximo de X e Y que aparecem no grfico;
c) Trace no diagrama de disperso as retas y = X e x = Y e analise o grfico;
d) Calcule e interprete o coeficiente de correlao.
10) Numa pesquisa feita com 10 famlias com renda bruta mensal entre 10 e 60 salrios mnimos, mediram-se: X: renda
bruta mensal (expressa em nmeros de salrios mnimos) e Y: a porcentagem da renda bruta anual gasta com
assistncia mdica.
X
12
16
18
Y
7,2
7,4
7,0
a) Escolha adequadamente X e Y.
b) Construa o diagrama de disperso;
c) Calcule o coeficiente de correlao.

20
6,5

28
6,6

30
6,7

40
6,0

48
5,6

50
6,0

54
5,5

11) Os quatro conjuntos de dados a seguir foram preparados pelo estatstico F. J. Anscombe e so usados com freqncia
em aulas sobre correlao.
Conjunto 1
X
Y
10
8,04
8
6,95
13
7,58
9
8,81
11
8,33

Conjunto 2
X
Y
10
9,14
8
8,14
13
8,74
9
8,77
11
9,26

Conjunto 3
X
Y
10
7,46
8
6,77
13
12,74
9
7,11
11
7,81

Conjunto 4
X
Y
8
6,58
8
5,76
8
7,71
8
8,84
8
8,47

a)
b)
c)
d)

14
9,96
14
8,10
14
8,84
8
6
7,24
6
6,13
6
6,08
8
4
4,26
4
3,10
4
5,39
19
12
10,84
12
9,13
12
8,15
8
7
4,82
7
7,26
7
6,42
8
5
5,68
5
4,74
5
5,73
8
Calcule a mdia e o desvio padro para cada conjunto de dados.
Calcule o coeficiente de correlao para cada conjunto de dados.
Construa o diagrama de disperso para cada conjunto de dados.
Analise os resultados.

7,04
5,25
12,50
5,56
7,91
6,89

12) Uma empresa que produz bens de alta tecnologia est preocupada com a produtividade de funcionrios que exercem
funes repetitivas e procura descobrir como algumas variveis podem influenciar no rendimento dessas pessoas. Para
isso implementa em cada uma de suas trs fbricas um programa especfico: alimentao especial sugerida pelos
nutricionistas; intervalos para exerccios de relaxamento sugerido pelos fisioterapeutas; rodzio de funes sugerido
pelos psiclogos. A tabela a seguir mostra o resultado da produtividade para diversos nveis implementados no
programa.
Produtividade (menor=100%)
100
102
105
108
112
120
Alimentao (frequncia semanal)
4
5
1
3
6
2
Exerccios (frequncia semanal)
1
3
2
4
5
6
Rodzio (frequncia semanal)
3
1
2
6
4
5
a) Construa o diagrama de disperso da produtividade contra cada uma das variveis explicativas. Qual varivel
parece manter melhor correlao com a produtividade?
b) Calcule o coeficiente de correlao linear de Pearson nos trs casos. O coeficiente confirma a impresso visual dos
diagramas?
13) Use as observaes de poupana agregada e renda (bilhes de reais) em um pas X no perodo de 1990 a 1999 (dados
fictcios), para estimar a influncia do nvel de renda sobre a poupana..
a) Construa o diagrama de disperso e trace a reta de regresso da poupana em funo da renda. Interprete os
coeficientes.
b) Diga qual o acrscimo na poupana agregada para cada bilho a mais na renda.
c) Estime a poupana para uma renda de R$469 400 000 000,00. Quanto seria o consumo agregado das famlias?
OBS.: consumo + poupana = renda
d) Calcule e interprete o coeficiente de correlao.
e) Calcule e interprete o coeficiente de determinao.
f) Construa o diagrama de disperso considerando o consumo como varivel resposta e a renda como varivel
explicativa (preditora). Estime a reta de regresso e compare o resultado com o item a.
14) Suponha os seguintes dados na tabela
Despesas com Propaganda
Vendas de Certo Produto
(1000 000 R$)
(1000 unidades)
2,5
120
6,5
190
11,0
240
4,0
140
8,5
180
14,0
280
6,0
150
5,0
115
10,0
215
13,5
220
16,0
320
a) Construa o diagrama de disperso;
b) Ajuste uma reta aos dados e estime as vendas do produto, para um gasto com propaganda de 12 milhes de reais;
c) Qual o acrscimo nas vendas para cada milho a mais gasto com propaganda?
d) Trace a reta no diagrama de disperso;
e) Determine o coeficiente de correlao e interprete-o;
f) Calcule e interprete o coeficiente de determinao.

15) (Toledo e Ovalle, 1995) A tabela abaixo fornece os resultados de uma pesquisa com 10 famlias de determinada regio.
Famlias

Renda
(R$100,00)
10
15
12
70
80
100
20
30
10
60

A
B
C
D
E
F
G
H
I
J

Poupana
(R$10,00)
4
7
5
20
20
30
8
8
3
15

Nmero de
Filhos
8
6
5
1
2
2
3
2
6
1

Mdia de anos de
estudo da famlia
3
4
5
12
16
18
8
8
4
8

a)

Calcule o coeficiente de correlao entre as variveis renda e poupana, renda e nmero de filhos, poupana e
nmero de filhos, mdia dos anos de estudo e nmero de filhos e entre as variveis renda familiar e mdia de anos
de estudo. Retire concluses.
b) Ajuste um modelo linear utilizando as variveis Renda (X) e Poupana (Y). Estime o valor poupado quando a
renda for de 2.000 reais.

16) A administrao de um banco desejava estabelecer um critrio objetivo para avaliar a eficincia de seus gerentes. Para
isso, levantou (para cada um dos subdistritos onde possua agncia) dados a respeito do depsito mdio mensal por
agncia e o nmero de estabelecimentos comerciais existentes nesses subdistritos. Os dados so os seguintes:
Nmero de
Estabelecimentos
Comerciais

Subdistritos

a)
b)
c)
d)
e)
f)

Depsito Mdio
Mensal
por Agncia (10 000
R$)
14
16
19
30
31
33
35
43
50

Nossa Senhora do
16
Casa verde
30
Vila Formosa
35
Santana
70
Barra Funda
90
Jardim Paulista
120
Santo Amaro
160
Lapa
237
Pinheiros
378
Construa o diagrama de disperso;
Ajuste uma reta aos dados e estime depsito mdio para um nmero de estabelecimentos comerciais igual a 350;
Qual o acrscimo nos depsitos mdios, para cada estabelecimento a mais no subdistrito?
Trace a reta no diagrama de disperso;
Determine o coeficiente de correlao e interprete-o;
Calcule e interprete o coeficiente de determinao.

17) Barbetta (2001, p.308). Com o objetivo de verificar se numa certa regio existe correlao entre o nvel de escolaridade
mdio dos pais e o nvel de escolaridade dos filhos, observou-se uma amostra aleatria de 8 indivduos adultos,
verificando o nmero de anos que estes freqentaram (e tiveram aprovao) em escolas regulares (Y) e o nmero mdio
de anos que os seus pais freqentaram (e tiveram aprovao) em escolas regulares (X). Os resultados so apresentados
na tabela abaixo:
X
Y

0
2

0
3

2
2

3
5

4
9

4
8

5
8

7
15

a) Calcule o coeficiente de correlao de Pearson.


b) Em termos do resultado do item (a), o que se pode dizer sobre a correlao entre o nmero de anos que os 8
indivduos freqentaram escolas regulares (Y) e o nmero mdio de anos que os seus pais freqentaram escolas
regulares?
c) Estabelea a reta de regresso de y em relao a x.

d) Apresente o diagrama de disperso acompanhado da reta de regresso.


18) Barbetta (2001, p.308). A tabela a seguir relaciona os pesos (em centenas de kg) e as taxas de consumo de combustvel
em rodovia (km/litro) numa amostra de 10 carros de passeio novos.
Peso
Consumo

12
16

13
14

14
14

14
13

16
11

18
12

19
9

22
9

24
8

26
6

a) Calcule o coeficiente de correlao de Pearson.


b) Considerando o resultado do item a), como voc avalia o relacionamento entre o peso e o consumo, na amostra
observada?
c) Para estabelecer uma reta de regresso, qual deve ser a varivel dependente e qual deve ser a varivel
independente? Justifique a sua resposta.
d) Estabelea a equao de regresso, considerando a resposta do item c).
e) Apresente o diagrama de disperso e a reta de regresso obtida em d).
f) Voc considera adequado o ajuste do modelo de regresso do item d)? D uma medida desta adequao
interpretando-a.
g) Qual o consumo esperado para um carro de 2000 kg? Lembrete: os dados de consumo na tabela esto em centenas
de kg.
h) Voc considera seu estudo capaz de predizer o consumo esperado para um carro de 7000 kg? Justifique sua
resposta.
19) Barbetta (2001, p.308). Um administrador de uma grande sorveteria anotou por um longo perodo de tempo a
temperatura mdia diria, em C (X), e o volume de vendas diria de sorvete, em kg (Y). Com os dados, estabeleceu
uma equao de regresso, resultando em:
y = 0,5 + 1,8x, com R2 = 0,80
Pede-se:
a) Qual o consumo esperado de sorvete num dia de 27C?
b) Qual o incremento esperado nas vendas de sorvete a cada 1C de aumento da temperatura?
20) Atkinson et al. (1994) investigaram em que medida partculas de chumbo potencialmente txica emitidas por veculos
automotores so absorvidas por ciclistas que participam de competies. A tabela abaixo, construda a partir de um
grfico apresentado em seu artigo, fornece nveis de chumbo no sangue e horas de treinamento de 10 ciclistas.
Horas de treinamento
8
10 10 12 15 18 18 21 25 25
Chumbo no sangue (mmol/L) 0,53 0,25 0,34 0,25 0,29 0,3 0,53 0,53 0,53 0,87
Pede-se:
a) Faa um grfico dos dados. Quais suas impresses?
b) Verifique se h uma relao entre nveis de chumbo no sangue e horas de treinamento.
c) O ciclista 10 tem nveis muito altos. Nossa evidncia de uma relao proveniente quase que inteiramente desta
observao? Repita (b) omitindo o ciclista 10.
d) O que fizemos em (c) parece razovel?
e) Est claro a partir do grfico obtido em (a) que h variao nos dados que no explicada pelas horas de
treinamento. (O que nos d esta informao?) Talvez o efeito de horas de treinamento no aparea to fortemente
como deveria, porque estamos deixando de levar em considerao outras variveis importantes. Sugira algumas
outras variveis que poderiam ser importantes.

Você também pode gostar