Você está na página 1de 7

1) O questionário da PNAD, Pesquisa Nacional de Amostras por Domicílios, realizada pelo

IBGE coleta informação sobre os moradores. Algumas das questões são listadas abaixo.
Identifique em cada questão a variável medida e classifique-a como qualitativa ou
quantitativa. Se quantitativa, classifique-a como discreta ou contínua, e se qualitativa,
como nominal ou ordinal. Para as variáveis quantitativas indique também se a escala é
do tipo razão ou intervalar. Para cada variável indique qual gráfico você utilizaria para
representar a distribuição de frequências.

1 - Quantas pessoas moram neste domicílio?


Variável: quantitativa discreta.
Escala: intervalar.
Gráfico: Diagrama de barras.

2 - A responsabilidade pelo domicílio é de: ( ) Apenas um morador ( ) Mais de um morador


Variável qualitativa nominal.
Gráfico: diagrama de Pizza

3 - Cor ou raça: ( ) branca ( ) amarela ( ) indígena ( ) preta ( ) parda


Variável qualitativa nominal.
Gráfico: diagrama de Pizza

4 – Você sabe ler e escrever ( ) sim ( ) não


Variável qualitativa nominal.
Gráfico: diagrama de Pizza

5 – Quantos trabalhos tinha na semana de referência?


Variável: quantitativa discreta.
Escala: intervalar.
Gráfico: diagrama de barras.

6 – Qual o rendimento mensal bruto no trabalho principal? (em reais)


Variável: quantitativa contínua.
Escala: razão.
Gráfico: histograma.

7 – Quantas horas trabalhava por semana no trabalho principal?


Variável: quantitativa contínua.
Escala: razão.
Gráfico: histograma.

8 - Até o dia da semana de referência, fazia quanto tempo que estava nesse trabalho?
( ) Menos de 1 mês
( ) De 1 mês a menos de 1 ano
( ) De 1 ano a menos de 2 anos
( ) 2 anos ou mais
Variável qualitativa ordinal.
Gráfico: frequência acumulada
9 – Ano de Nascimento
Variável: quantitativa discreta.
Escala: intervalar.
Gráfico: diagrama de barras.

2) Os dados seguintes referem-se às alturas (em cm) de um grupo de 30 pessoas. Denote


este grupo por grupo 1.
161 164 166 167 167 169 169 169 170 170 170 170 170 170 171
172 172 173 173 173 174 174 174 175 176 176 176 176 177 184

a) Complete a tabela de freqüências da variável altura

Altura (cm) Freqüência Freqüência Densidade de Freqüência


Absoluta relativa Freqüência relativa
Acumulada

160 |----165 2 0,067 0,013 0,067

165|-----170 6 0,2 0,04 0,267

170|-----175 15 0,5 0,1 0,767

175|-----180 6 0,2 0,04 0,967

180|-----185 1 0,033 0,007 1

Total 30 1 0,2

b) Qual a classe de maior frequência?


170|-----175

c) Qual a proporção de pessoas com altura menor que 180 cm?


0,967

d) Comente sobre a forma do histograma correspondente à tabela de frequência acima.


Dado que o intervalo total das classes é de 160 cm a 185cm, o histograma deveria ser
transladado para a direita, de modo que não houvesse o espaço para a alturas menores
que 160cm e maiores que 185cm, uma vez que não há dados referentes à essas alturas.

e) Complete o diagrama de ramo e folhas para as alturas.


16| 14
16| 677999
17|000000122333444
17|566667
18|4
f) Calcule a média e a mediana das alturas.

média = (161 + 164 + 166 + 167 + 167 + 169 + 169 + 169 + 170 + 170 + 170 + 170 + 170 +
170 + 171 + 172 + 172 + 173 + 173 + 173 + 174 + 174 + 174 + 175 + 176 + 176 + 176 + 176
+ 177 + 184) /30 = 5148/30= 171,6

mediana = (171+172) / 2 = 171,5

g) A partir do histograma de densidades encontre o valor que deixa 10% dos valores abaixo
dele. Lembre-se que a área de cada retângulo é igual a frequência relativa da classe.

167

h) Para um outro grupo de 40 pessoas, grupo 2, encontrou-se a distribuição de freqüências


apresentada no histograma seguinte

Altura (cm) Ponto Freqüência Freqüência Densidade Freqüência relativa


Médio Absoluta relativa de Acumulada
Freqüência

150 |-----155 152,5 3 0,075 = 3/40 0,015 = 3/5 0,075

155 |-----160 157,5 10 0,25 2 0,325

160 |-----165 162,5 9 0,225 1,8 0,55

165 |-----170 167,5 9 0,225 1,8 0,775

170 |-----175 172,5 8 0,2 1,6 0,975

175 |-----180 177,5 1 0,025 0,2 1

Total 165 40 1

i) Em qual classe da distribuição de freqüências se encontra a mediana? Obtenha o seu


valor de forma aproximada.
160 |-----165
162,5

j) Obtenha de forma aproximada o valor da média e do desvio padrão das alturas.


média aprox:163,95 ; desvio padrão aprox:340,0416
k) Utilizando a informação das tabelas de freqüência, dos histogramas e das medidas
descritivas faça uma comparação dos dois grupos de pessoas quanto à altura.

3) Uma pesquisa ouviu 15 mulheres sobre certo assunto. Uma das perguntas foi relativa a
idade. Das 15 mulheres, 13 responderam suas idades, que foram: 19, 21, 29, 21, 24, 26, 28,
17, 19, 21, 25, 28, 17. Duas delas disseram que tinham mais de 30 anos. Dizemos que
estas 2 observações são censuradas à direita. Que medida de tendência central, a média
ou a mediana, você utilizaria para descrever a idade deste grupo de 15 mulheres. Justifique.

Nesse exemplo, seria melhor utilizar a mediana, pois dado a ausência da idade exata de
duas mulheres (observações censuradas à direita), utilizar a média traria um resultado
impreciso, dado que o valor exato dessas idades influencia diretamente o cálculo desta. Por
sua vez, a mediana divide a distribuição ao meio, sendo necessário apenas o valor do
elemento central (caso ímpar) ou a média ponderada dos valores centrais (caso par) para
defini-la. Como as informações faltantes estão ao extremo superior do intervalo, a ausência
de dados não impacta no cálculo da mediana que, neste caso, é igual ao oitavo elemento.

4) Abaixo são apresentados os gráficos de frequências acumuladas para as idades de 2


grupos de pessoas.

a) Para qual dos 2 grupos a distribuição das idades é mais assimétrica?


grupo 1
b)mediana=50

5) Considere os seguintes dados relativos às idades de 10 pessoas:


32 21 24 26 24 23 27 24 29 26
a) Calcule o desvio absoluto médio, a variância, o desvio padrão e o coeficiente de variação
para os dados acima.

desvio absoluto=2,4
variância=9,24
desvio padrão=3,04
coeficiente de variação= 11,88

6)Um estudo comparou o consumo calórico de adolescente e bulímicas, com composição


corporal e níveis de atividades físicas similares. Abaixo são listados os consumo calórico
diários, medido em quilocalorias, para cada 1 dos grupos

Grupo 1: Bulímicas (n = 24):


5,9 16 16,5 17 17,6 18,1 18,4 18,9 18,9 19,6 21,5 21,6

22,9 23,6 24,1 24,5 25,1 25,2 25,6 28 28,7 29,2 30,9 30,6
Grupo 2: Saudáveis (n = 15)

20,7 22,4 23,1 23,8 24,5 25,3 25,7 30,2 30,6 33,2 33,7 36,6 37,1 37,4 40,8

a) Complete a tabela seguinte com as medidas que faltam.

N Média Mediana Variânci Desvio Percentil Percentil Distância C.V


a Padrão 0,25 0,75 interquartílica

Bulímicas 24 22,43 22,25 9,6 4,8 18,25 25,4 7,15 21,4%

Saudáveis 15 29,67 30,2 12,98 6,49 23.8 36.6 12,8 21,87%

b) Qual grupo apresenta resultados mais homogêneos para o consumo calórico?


Grupo 1

c) Se o consumo calórico de cada uma das adolescentes do grupo 1 fosse aumentado em 5


quilocalorias, qual seria a média e o desvio padrão dos consumos calóricos deste grupo
após este aumento?
Média=27,43
dp=4,8
d) Quais seriam estas quantidades se o consumo calórico de cada uma das adolescentes
do grupo 1 fosse aumentado em 10%?
média=24,673
dp=5,28

e) Indique no boxplot seguinte as seguintes medidas: mínimo, máximo, mediana, 1º quartil,


2º. Quartil e distância interquartílica.

f) O boxplot indica a presença de “outliers”? Justifique.

g) Quando à forma, como você classifica a distribuição do consumo calórico para cada um
dos grupos comparados? Justifique.

h) Em relação ao grupo, qual adolescente apresenta maior consumo calórico. A adolescente


do
primeiro grupo 1, com consumo calórico igual a 23,8, ou a do grupo 2, com resultado igual a
18,1? Justifique.
7) A seguir são mostrados os tempos de espera em fila (em minutos) de clientes de duas
agências bancária com 3 caixas:
Agência com sistema de fila única (agência A)
Agência com filas individuais para os caixas. (agência B)

a) Complete a tabela com as medidas que faltam.

Média Mediana Variância Desvio Amplitude


Padrão

A 7,2 7,4 0,18 0,42 1,3

B 7,15 6,7 2,31 1,25 5,8

b) Utilize as medidas apresentadas na tabela para argumentar a favor de um dos dois tipos
de fila: fila única ou filas individuais para os caixas.

8) O boxplot abaixo apresenta uma comparação das distribuições das leituras diárias da
quantidade de ozônio no ar (em ppb) para a cidade de New York no ano de 1973.

a) Quais meses apresentaram maiores níveis medianos para quantidade de ozônio na


atmosfera?
Julho e agosto.

b) Em qual mês ocorreu maior variação nas medidas de ozônio?


Agosto.

c) Em quais meses, percebe-se a presença de “outliers”?


Maio, junho e setembro.

9) Na tabela abaixo são dados algumas medidas descritivas para a quantidade de ozônio e
para outras medidas de qualidade do ar, para New York, no ano de 1973

a) Com relação a qual destas variáveis as medidas de qualidade de ar apresentaram-se


mais homogêneas? E mais heterogêneas? Justifique

A medida mais homogênea é a velocidade do vento, pois é a que apresenta menor desvio
padrão. E a mais heterogênea é a radiação Solar, pois apresenta maior desvio padrão.

b) Observando somente as medidas acima, para quais variáveis há indicativos de que a


distribuição é aproximadamente simétrica? E para quais há indicativos de assimetria à
esquerda? E à direita? Justifique.
Ozônio: mediana muito maior que a média, logo, há assimetria no lado esquerdo.

Velocidade do vento: média e mediana pouco diferentes, logo, a distribuição é


aproximadamente simétrica

Radiação solar: mediana menor que a média, logo, há assimetria no lado direito.

Temperatura: mediana pouco menor que a média, logo, há uma leve assimetria no lado
direito.

10) Usando as informações dadas na tabela dada no item a do exercício 2 calcule de forma
aproximada o desvio padrão amostral das alturas. Compare com o valor observado para
essa quantidade.

Você também pode gostar