Você está na página 1de 4

Lista de Exercícios Cap.

* Cálculos de média e variância podem usar o Excel!


1) Considere os dados de Sexo e Raça para os dados abaixo:

Sexo F M M F M F F F M M M M M M F F F M F F F F M M F M M
Raça B B B B B B B B B B B B B B B B B P B B B A B B B B N

a) Construa a tabela de freqüências para cada uma das variáveis.


b) Faça os gráficos de barras e de setores (pizza) para cada uma das variáveis.
c) Qual é a moda (maior freqüência) de cada variável?

2) Eis as notas de Pesquisa de Hábitos de Estudos e Atitudes (PHEA) para 18 alunas do


primeiro ano de uma faculdade:
154 109 137 115 152 140 154 178 101
103 126 126 137 165 165 129 200 148
e para 20 alunos do primeiro ano
108 140 114 91 180 115 126 92 169 146
109 132 75 88 113 151 70 115 187 104
(a) Faça um ramo-e-folhas face-a-face destes dados (faça um ramo único para meninos e
meninas, coloque a folhas dos meninos de um lado e das meninas do outro).
(b) Ache a média ( ) e a mediana ( ) para ambos os conjuntos de notas PHEA. Que
característica da distribuição explica o fato de ser > ?
(c) Os dados da PHEA para mulheres contém um outlier alto. Calcule a média e a mediana
para estes dados, com o outlier e sem ele. Como a remoção do outlier afeta ? Como afeta
? Seus resultados ilustram a maior robustez da mediana.
(d) Determine o desvio-padrão (s). Para você trabalhar com valores menores, em cada
conjunto de dados, subtraia a média de todos os valores e então calcule a variância e o
desvio-padrão. Porque seus cálculos manuais ficaram facilitados?
(e) Determine o coeficiente de variação (cv) para ambos os conjuntos de notas PHEA.
Compare os dois conjuntos de notas quanto à homogeneidade.
3) É dado na Fig. 1 o histograma para um conjunto de dados. Qual dos box-plots é
consistente com o histograma na descrição da distribuição dos dados. Justifique sua
escolha.

Fig. 1: Histograma e box-plots

4) Considere o seguinte conjunto de dados de uma variável numérica:

21 21 21 22 22 23 23 23 24 24
25 25 25 25 26 26 26 28 30 31
31 32 33 33 33 34 34 35 35 36

a) Calcule as medidas de posição (média, moda, mediana, primeiro e terceiro


quartil) e dispersão (amplitude, variância, desvio-padrão) para os dados.
b) Faça o histograma, gráfico de ramo e folhas e Box-plot para os dados.
c) Comente também sobre os formatos dos dados (assimetria, posição, variabilidade,
modalidade (modas)), além da presença ou não de outliers.
d) Para os dados agrupados na tabela de freqüências do histograma, calcule
média, moda, mediana, variância e desvio-padrão. Média, mediana, variância e
desvio-padrão são próximos dos dados não-agrupados (obtidos no item a)).
5) Retornamos à questão das notas de Pesquisa de Hábitos de Estudos e Atitudes – PHEA. A
Fig. 2 apresenta os Box-plots das notas dos conjuntos de dados referentes às alunas (F) e
aos alunos (M) e a todos os estudantes (T).

200

180

160

140
Notas

120

100

80

60
Feminino Masculino Todos
Conjuntos

Fig. 2: Box-plots dos conjuntos de dados


(a) Para cada um dos conjuntos de dados, estime graficamente a mediana, o primeiro e o
terceiros quartis e uma medida de dispersão;
(b) Faça uma breve comparação dos grupos de alunos e alunas. As mulheres, como grupo,
têm maiores notas do que os homens? Que grupo de notas se apresenta mais disperso?
A Tabela 1 apresenta algumas informações adicionais sobre esses conjuntos de dados

Tabela 1: Algumas medidas-resumo dos conjuntos de dados


Quantidade. Média Desvio-padrão
Conjunto
(n) ( ) (s)

Alunas (F) 18 141,06 26,44

Alunos (M) 20 121,25 32,85

Todos os
Calcule! Calcule! 31,24
alunos (T)

(c) Utilize o coeficiente de variação (cv) e compare os conjuntos em relação aos resultados
obtidos. Qual grupo foi mais homogêneo?
(d) Observe a variabilidade dos três conjuntos (F, M e T) e conjecture se o sexo é importante
para ajudar a explicar a variação das notas.
6) Os dados da tabela abaixo são de Pesos (em Kg) de 50 Homens e 40 Mulheres.

a) Construa as medidas-resumo de posição (média, quartis, mínimo e máximo) e de


dispersão (distância interquartílica, amplitude, variância, desvio-padrão e coeficiente
de variação) para os dados totais (Feminino e Masculino) e separadamente, por Sexo.

b) Faça os gráficos de histograma (freq. Relativa e de densidade), ramo-e-folhas e Box-


plot para os dados totais (Feminino e Masculino) e separadamente, por Sexo.

c) Interprete os dados, usando os resultados obtidos nos itens a) e b), explicando, se


houver, diferenças atribuídas à variável Sexo. Comente também sobre os formatos
dos dados (assimetria, posição, variabilidade, modalidade (modas)), além da presença
ou não de outliers.

64,0 64,3 64,7 65,9 66,8 67,1 67,2 67,2 67,2 67,6

67,9 68,5 68,6 68,7 68,8 68,9 68,9 69,0 69,4 69,4
Masculino

69,5 69,7 69,7 69,7 69,9 69,9 70,0 70,0 70,4 70,6

70,7 70,7 70,8 70,9 71,0 71,4 71,5 71,5 71,8 71,8

72,0 72,3 72,4 72,4 72,8 72,8 74,1 75,4 75,6 75,6

64,1 64,6 64,6 65,5 65,6 65,6 65,8 65,8 65,8 65,8

65,9 65,9 66,0 66,1 66,1 66,1 66,2 66,3 66,5 66,5
Feminino

66,6 66,6 66,7 66,8 66,9 67,1 67,4 67,6 67,6 67,7

67,8 67,9 67,9 68,0 68,1 68,5 68,8 69,7 70,2 71,9

7) Dados sobre uma amostra de 20 funcionários de uma empresa

indivíduo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Nº de filhos 0 2 3 2 1 4 5 3 6 7 4 3 2 1 3 5 6 3 2 1
Fonte: Dados fictícios

a) Calcule as medidas de posição (média, moda, mediana, primeiro e terceiro


quartil) e dispersão (amplitude, variância, desvio-padrão) para os dados.
b) Faça o diagrama de freqüências para os dados.

Você também pode gostar