Você está na página 1de 15

Departamento de Estatística – EST/IE

Estatística Aplicada – EST0019 – 4ª


Período Letivo: 1° semestre de 2021
Professor: Luis Guilherme Alho Batista
Aluna: Juliane Amorim Lima (211039911)
1ª Lista de Exercícios - 12/09

1) (Larson et al, 2015; com adaptações) Para cada um dos cenários de pesquisa abaixo,
determine se você faria um censo ou usaria uma amostra. Se fosse usar uma amostra,
decida qual técnica de amostragem você empregaria. Explique o seu raciocínio e
justifique a sua resposta.
(a) Levantamento dos times de futebol mais populares entre as pessoas em Brasília/DF
Para o levantamento de times de futebol populares no DF, o mais adequado é utilizar uma
amostra, pois uma população é muito extensa. A técnica de Amostragem Estratificada é mais
adequada, pois abordaria uma população diversa e seria possível um maior controle da
pesquisa, visto que, a divisão por estratos abrangeria grupos de diferentes características, em
que a popularidade de um time de futebol pode ser influenciada pelas classes sociais e
econômicas. A população seria mais bem representada na divisão de estratos.
(b) O salário médio de 30 empregados de uma grande empresa, lotados no mesmo
edifício.
Nessa situação o mais adequado é a utilização de um censo, pois é preciso abranger todos os
30 empregados da empresa, ou seja, deve-se usar toda a população para que as conclusões
sejam válidas.

2) (Larson et al, 2015; com adaptações) Determine se as perguntas de pesquisa dispostas


abaixo são tendenciosas. Em caso afirmativo, sugira uma melhor redação. Justifique a
sua resposta.
(a) Quantas horas você dorme em uma noite normal?
A pergunta é feita com clareza, é objetiva e não induz a nenhuma outra resposta. Logo, não é
tendenciosa.
(b) Você concorda que a proibição da presença de crianças em determinados parques da
cidade é injusta?
A pergunta é tendenciosa, pois o entrevistado pode interpretar de diferentes maneiras, além da
indução de uma reposta. O risco de surgimento de uma variável estranha também e provável.
Outra alternativa de pergunta seria: “É injusto a proibição de crianças em determinados
parques?” (SIM) motivo: , (NÃO) motivo: , (PREFIRO NÃO DECLARAR).

3) (Larson et al, 2015; com adaptações) Nos itens abaixo, determine se os dados são
qualitativos ou quantitativos e determine o nível de mensuração dos conjuntos de dados.
Justifique a sua resposta.
a) As temperaturas máximas diárias (em graus Fahrenheit) em Sacramento, Califórnia,
registrados pelo National Climatic Data Center para uma semana de julho, que estão
listados a seguir.
96 77 75 84 87 94 101
Os dados são quantitativos e o nível de mensuração é intervalar, pois pode assumir valores
negativos em que o zero também representa uma numeração escalar.
(b) As classes de tamanhos de automóveis para uma amostra de sedans estão listadas a
seguir.
Minicompacto subcompacto compacto médio grande
Os dados são qualitativos de escala ordinal visto que estão dispostos em ordem do menor para
o maior, mas não existe melhor ou pior.
(c) Os quatro departamentos de uma gráfica estão listados a seguir.
Administração Vendas Produção Faturamento
Os dados são qualitativos de escala nominal pois, não é possível estabelecer uma ordem
referem-se apenas a categorias.
(d) As remunerações totais por ano (em milhões de dólares) dos dez maiores executivos
nos Estados Unidos estão listadas a seguir.
131 67 64 61 56 52 50 49 44 43
Escala quantitativa de razão, pois é incluído o ponto de partida do zero, de modo que a
presença do mesmo indicaria ausência de remuneração.

4) (Barbetta, 2002; com adaptações) “Quanto mais longo for o questionário, menor será
a confiabilidade das respostas”. Você concorda com essa afirmação? Justifique a sua
resposta.
Sim, pois o risco de o questionário estar propicio a erros é maior, podendo ser mais fácil o
surgimentos de variáveis desconhecidas. Os questionários demasiadamente longos podem ser
exaustivos para os respondentes o que interfere diretamente na confiabilidade das respostas.
Ao responder um questionário longo o respondente só espera finalizar o quanto antes já que
não terá mais a disposição do início. Portanto é fundamental a objetividade e a clareza dos
questionários.
5) (Barbetta, 2002; com adaptações) Uma empresa tem 3.414 empregados repartidos nos
seguintes departamentos: Administração (914), Transporte (348), Produção (1.401) e
Outros (751). Deseja-se extrair uma amostra entre os empregados para verificar o grau
de satisfação em relação à qualidade da comida no refeitório. Apresente um plano de
amostragem para o presente problema e calcule o tamanho ideal da amostra.
O plano de amostragem mais adequado para a pesquisa é a técnica de amostragem
estratificada que visa especificar a diversidade da população, que está dividida em
grupos/departamentos nos quais cada indivíduo pertence a somente um desses grupos e todos
tem a mesma característica em comum de empregados da empresa.

Número de
Estratos Porcentagem (%)
empregados

Administração 914 27%

Transporte 348 10%

Produção 1.401 41%

Outros 751 22%

Total 3.414 100%

Para calcular o tamanho ideal da amostra (n) utilizaremos: Margem de erro (E) = 5%,
Tamanho da população (N) = 3.414, Primeira aproximação do tamanho da amostra (n0).
n0 = 1 / E^2
n0 = 1 / 5% ^2
n0 = 1 / 0,05^2
n0 = 1/ 0,0025
n0 = 400
n =(N . n0) / N + n0
n = ( 3.414 . 400) / 3.414 + 400)
n = 1.365.600 / 3.814
n = 358,5  ≈ 359
Tamanho total da amostra de toda a população
359 . 4 = 1436
Para calcular cada estrato utilizaremos:
(Tamanho total da amostra de toda a população) x (tamanho de cada estrato) / (total da
população)

Administração: n = 1436 . 914 / 3414 = 385


Transporte: n = 1436 . 348 / 3414 = 147
Produção: n = 1436 . 1401 / 3414 = 560
Outros: n = 1436 . 751 / 3414 = 316
Conclui-se que para um total de 3.414 empregados da empresa (população-alvo) a amostra
ideal para ser analisada é de 1.408, considerando uma margem de erro de 5%.

6) (Anderson et al, 2007; com adaptações) Discuta a diferença entre a estatística como
fatos numéricos e a estatística como disciplina ou área de estudo.
A estatística como fatos numéricos é aquela utilizada no levantamento de pesquisas, coletas e
descrição de dados, em pesquisas eleitorais, por exemplo. É um fator numérico. Em
contrapartida a estatística como área de estudo é um ramo da ciência que consiste em uma
observação sistemática de evidências tendo como base o método científico para ajudar na
tomada de decisões com precisão e confiança. É um lógica aplicada a ciência.

7) (Anderson et al, 2007; com adaptações) Declare se cada uma das seguintes variáveis é
qualitativa ou quantitativa e indique sua escala de medição:
(a) Vendas anuais;
Quantitativa de razão, visto que o ponto de partida é medido pelo zero.
(b) Tamanhos de refrigerante (pequeno, médio e grande);
Qualitativa nominal, pois os nomes são apenas categorias.
(c) Classificação dos empregados (GSI até GS18);
Qualitativa ordinal, pois a classificação dos empregados está disposta em alguma ordem.
(d) Rendimento por ação;
Quantitativa de razão, pois o ponto de partida é o zero.
(e) Método de pagamento (dinheiro, cheque, cartão de crédito).
Qualitativa nominal, pois os métodos de pagamento são categóricos.

8) (Larson et al, 2015; com adaptações) Considerando o conjunto de apresentado dados


abaixo, que representa o número de quartos reservados durante uma noite de negócios
em uma amostra de hotéis, responda ao que se pede.
153 104 118 166 89 104 100 79 93 96 116 94 140 84 81 96 108 111 87 126 101 111 122 108
126 93 108 87 103 95 129 93
(a) Construa uma distribuição de frequências para o conjunto de dados com seis classes.
79, 81, 84, 87, 87, 89, 93, 93, 93, 94, 95, 96, 96, 100, 101, 103, 104, 104, 108, 108, 108, 111,
111, 116, 118, 122, 126, 126, 129, 140, 153, 166
Amplitude total (At) = maior valor – menor valor / At = 166 – 79 = 87
Amplitude de classe ( Ac) = At / n° de classes = Ac = 87/6= 14,5 --- 15
Frequência Frequência Frequência relativa Porcentagem acumulada
Classe Densidade Ponto Médio
absoluta acumulada (%) (%)
  ni Ni Fi Fi ni/ ∆i si
79|-- 94 9 9 28 28 0,6 86,5

94|-- 109 12 21 38 66 0,8 101,5

109|-- 124 5 26 16 82 0,33 116,5

124 |-- 139 3 29 9 91 0,2 131,5

139 |-- 154 2 31 6 97 0,13 146,5

154 |-- 169 1 32 3 100 0,06 161,5

Total 32 - 100 - - -

Fronteira de classes
89,5 - 94,5
93,5 - 109,5

108,5 - 124,5

123,5 - 139,5

138,5 - 154,5

153,5 - 169,5
(b) Construa um histograma de frequência utilizando a distribuição de frequência do
item. Inclua os limites de classe, pontos médios, fronteiras e frequências.

(c) Estime a média aritmética da distribuição de frequência que você construiu.


µ=ΣX÷N
µ = 3421 ÷ 32 = 106,9 --- 107
9) (Larson et al, 2015; com adaptações) Considerando o conjunto de dados apresentado
abaixo, que representa o índice de qualidade do ar para 30 cidades estadunidenses
calculado pela AIRNow, responda ao que se pede.
25 35 20 75 10 10 61 89 44 22 34 33 38 30 47 53 44 57 71 20 42 52 48 41 35 59 53 61 65 25
10, 10, 20, 20, 22, 25, 25, 30, 33, 34, 35, 35, 38, 41, 42, 44, 44, 47, 48, 52, 53, 53, 57, 59, 61,
61, 65, 71, 75, 89
a)Use um diagrama de ramos-e-folhas para exibir o conjunto de dados. Descreva
quaisquer padrões que você observar no diagrama. Explique em quais condições a
utilização desse tipo de representação gráfica é ideal.

1 0 0
2 0 0 2 5 5
3 0 3 4 5 5 8
4 1 2 4 4 7 8
5 2 3 3 7 9
6 1 1 5
7 1 5
8 9
É possível observar que nas unidades 30 e 40 houve uma maior concentração de dados, em
que o índice de qualidade do ar nessas cidades tem um padrão. Enquanto que na unidade 80
apenas uma cidade tem o índice de qualidade com nota mais próxima a 100, é possível inferir
que essa cidade tenha menos habitantes que as outras, logo tem menos poluição responsável
por afetar a qualidade do ar.
O diagrama de ramos-e-folhas é ideal para pequenos e médios conjuntos de dados, e oferece
uma apresentação detalhada, mostrando os dados específicos.

b) Use um diagrama de pontos para exibir o conjunto de dados. Descreva quaisquer


padrões que você observar no diagrama. Explique em quais condições a utilização desse
tipo de representação gráfica é ideal.

O diagrama de pontos ou de dispersão unidimensional é útil para se ter uma melhor


organização dos dados, e ideal para pequenas séries. Além de oferecer a quantidade exata de
dados da pesquisa.

(c) Forneça a média aritmética, a moda e a mediana da distribuição fornecida


Média: x = Σ X ÷ N / µ = 1299 ÷ 30 = 43,3 --- 43

Moda: Multimodal: 10, 20, 25, 35, 44, 53 e 61

Mediana: 42 + 44 ÷ 2 = 43

(d) Encontre a amplitude, o desvio-padrão e a variância da distribuição fornecida


Amplitude: A = maior valor – menor valor ; A = 89 – 10 = 79

Variância: V^2 = Σ (X - média) ÷ N = 367,6655172  368

Desvio padrão: D = raiz quadrada de V = raiz quadrada de 368 = 19

10) (Larson et al, 2015; com adaptações) Conforme a National Sporting Goods
Association, as vendas de produtos esportivos (em bilhões de dólares) nos Estados
Unidos podem ser classificadas em quatro áreas: vestuário (9,7), calçados (18,4),
equipamentos (27,5) e transporte recreativo (26,1). Represente os dados usando um
gráfico de setores.
11) (Larson et al, 2015; com adaptações) Considerando o conjunto de dados apresentado
abaixo, que representa o número de minutos que 25 pessoas de uma amostra se
exercitam a cada semana, responda ao que se pede.

108 139 120 123 120 132 123 131 131 157 150 124 111 101 135 119 116 117 127 128 139
119 118 114 127

a)Construa uma distribuição de frequência para o conjunto de dados utilizando cinco


classes. Inclua os limites de classe, pontos médios, frequências, frequências relativas,
frequências acumuladas e amplitude.
101, 108,111, 114, 116, 117, 118, 119, 119, 120, 120, 123, 123, 124, 127, 127, 128, 131, 131,
132, 135, 139, 139, 150, 157
Amplitude = Valor máx. – Valor mín. / 157 – 101 = 56
Amplitude de classe = At / n° de classes = 56/ 5 = 11,2

Frequência Frequência Frequência Frequência Ponto


Limites de
Classes Absoluta Acumulada Relativa Acumulada Médio Amplitude
Classe
(ni) (NI) (Fi) (%) (FI) (%) (Si)
101 |-- 112,2 100,5 |-- 112,7 4 4 16% 16% 107 11,2
112,2 |-- 123,4 111,7 |-- 123,9 9 13 36% 52% 118 11,2
123,4 |-- 134,6 122,9 |-- 135,1 7 20 28% 80% 129 11,2
134,6|-- 145,8 134,1 |-- 146,3 3 23 12% 92% 140 11,2
145,8 |-- 157 145,3 |-- 157,5 2 25 8% 100% 151 11,2
Total - 25 - 100% - - -

(b) Represente os dados usando um histograma de frequência relativa.


(c) Descreva a forma da distribuição como simétrica, uniforme, assimétrica à esquerda,
assimétrica à direita, ou nenhuma delas.

A distribuição é assimétrica à direita pois, ela tem uma maior concentração de dados à
esquerda e uma desconcentração a direita.

(d) Represente os dados usando um diagrama de ramos-e-folhas. Use uma linha por
ramo.

10 1 8
11 1 4 6 7 8 9 9
12 0 0 3 3 4 7 7 8
13 1 1 2 5 9 9
15 0 7

(e) Encontre a média aritmética, a moda e a mediana da distribuição fornecida.


Média: x = Σ X ÷ N = 3129 ÷ 25 = 125,16  125
Moda: Multimodal 119; 120; 123; 127; 131 e 139
Mediana: 123

(f) Encontre o valor dos primeiro, segundo e terceiro quartis dos dados.
Q = i × ( n + 1) ÷ 4
Q1 = 1 × ( 25+ 1) ÷ 4 = 6,5 = 117 + 118 ÷ 2 = 117,5
Q2 = 123
Q3 = 3 × ( 25 + 1) ÷ 4 = 19,5 = 131 + 132 ÷ 2 = 131,5

(g) Encontre a amplitude interquartílica e o coeficiente de variação da distribuição


fornecida.
Amplitude Interquartílica: Ai = Q3 – Q1 = 131,5 – 117,5 = 14
Coeficiente de Variação: V^2 = Σ (X - média) ÷ N = 157,723  158
CV = V ÷ média × 100 = 158 ÷ 125 × 100 = 126,4  126
12) (Barbetta, 2002; com adaptações) Foram anotados os tempos decorridos entre a
incidência de uma certa doença e sua cura, em uma amostra de 50 pacientes. Estes
tempos são os seguintes, em horas:

21 44 27 323 99 90 20 66 39 16 47 96 127 74 82 92 69 43 33 12 41 84 02 61 35 74 02 83 03
13 41 10 24 24 80 87 40 14 82 58 16 35 114 120 67 37 126 31 56 04

(a) Construa um histograma e comente sobre alguns aspectos relevantes desta


distribuição.
02, 02, 03, 04, 10, 12, 13, 14, 16, 16, 20, 21, 24, 24,27, 31, 33, 35, 35, 37, 39, 40, 41, 41, 43, 44, 47, 56,
58, 61, 66, 67, 69, 74, 74, 80, 82, 82, 83, 84, 87, 90, 92, 96, 99, 114, 120, 126, 127, 323

Amplitude Total = Valor máx. – Valor mín. /323 – 02 = 321


Amplitude de classe = At / n° de classes = 321 / 6 = 53,5

Classes Frequência Absoluta Frequência Acumulada Frequência Relativa Frequência Acumulada Ponto Médio Amplitude
2 -- 55,5 27 27 54% 54% 28,7 321
55,5 -- 109 18 45 36% 90% 82,25 321
109 -- 162,5 4 49 8% 98% 135,7 321
162,5 -- 216 0 49 0 98% 189,2 321
216 -- 269,5 0 49 0 98% 242,7 321
269, 5 -- 323 1 50 2% 100% 296 321
Total 50   100%      
É possível observar pelo histograma que na amostra de 50 pacientes durante as horas
decorridas de 162,5 até 269,5 não houve a cura da doença em análise. É possível inferir
também que a doença tem maiores porcentagens de cura nas primeiras horas.
O histograma é uma distribuição assimétrica a direita pois os dados encontram-se mais
concentrados a esquerda visto que, a frequência de cura da doença é maior nas primeiras
horas.

(b) Calcule a mediana, a média, o desvio-padrão e a amplitude interquartílica da


distribuição.

Média: x = Σ X ÷ N = 2.884 ÷ 50 = 57,68 = 58


Mediana: 43
Desvio-padrão:
V² = Σ (X - média) ÷ N
[(2*(2-58)² + (3-58)² + (4-58)² + (10-58)² + (12-58)² + (13-58)² + (14-58)² + 2*(16-58)² + (20-
58)² + (21-58)² + 2*(24-58)² + (27-58)² + ( 31-58)² + (33-58)² + 2*(35-58)² + (37-58)² + (39-
58)² + (40-58)² + 2*(41-58)² + (43-58)² + (44-58)² + (47-58)² + (56-58)² + (61-58)² + (66-58)²
+ (67-58)² + (69-58)² + 2*(74-58)² + (80-58)² + 2*(82-58)² + (83-58)² + (84-58)² + (87-
58)²+(90-58)² + (92-58)² + (96-58)² + (99-58)² + (114-58)² + (120-58)² + (126-58)² + (127-
58)² + (323-58)² ] / 50
= 6.782 + 3.025 + 2916 + 2.304 + 2116 + 2025 + 1936 + 1764 + 1.444
+1.309+2312+961+729+625+1058+441+361+324+289+225+196+121+4+9+64+81+121+25
6+484+576+625+676+841+1024+1156+1144+1681+3136+3844+4624+4761+70225
= 128.037 /50 = 2560
V² = 2560
S = raiz (2560) = 50,5964425

Amplitude Interquartílica:

Q1 = i . ( n + 1) ÷ 4
Q= 1 . (50 + 1) ÷ 4 = 12,75 =27+28÷ 2 = 27,5

Q2 = 43

Q3 = 3.(50 + 1) ÷ 4 = 38,25 = 99 + 100 ÷ 2 = 99,5

Ai = Q3 – Q1 = 99,5 – 27,5 = 72
(c) Faça uma representação da distribuição em diagrama de caixas (box plot).

13) Represente graficamente, por meio de histogramas exemplificativos, o formato


esperado para (i) uma distribuição simétrica; (ii) uma distribuição assimétrica à
esquerda; e (iii) uma distribuição assimétrica à direita.
----------------------------------------------------------------------------------------------------------------

14) (Barbetta, 2002; com adaptações) Os dados abaixo apresentam a distância (em km)
entre a residência e o local de trabalho de todos os funcionários da empresa AAA. 1,8 2,5
0,4 1,9 4,4 2,2 3,5 0,2 0,9 1,4 1,1 1,7 1,2 2,3 1,9 0,8 1,5 1,7 1,4 2,1 3,2 15,1 2,1 1,4 0,5 0,9 1,7
0,5 0,8 3,7 1,4 1,8 2,0 1,1 1,0 0,8 Na empresa BBB, a distância (em km) até a residência
dos seus 300 funcionários apresenta as seguintes medidas descritivas: Mediana = 2,8;
Quartil inferior = 1,6; Quartil superior = 4,2; Extremo inferior = 0,4; Extremo superior
= 8,8.
(a) Represente as distribuições para as empresas AAA e BBB em diagramas de caixa
(box plots).
(b) Quais as principais diferenças entre as empresas AAA e BBB em termos da
distância entre a residência e o local de trabalho dos funcionários? Justifique a sua
resposta.
(c) Calcule e compare as amplitudes interquartílicas das duas distribuições. Na sua
opinião, qual interpretação pode ser feita em relação aos valores encontrados?
15) (Anderson et al, 2007; com adaptações) Considere os seguintes dados amostrais: 8,9
10,2 11,5 7,8 10,0 12,2 13,5 14,1 10,0 12,2 6,8 9,5 11,5 11,2 14,9 7,5 10,0 6,0 15,8 11,5
(a) Construa um gráfico de dispersão unidimensional (dot plot);
(b) Construa uma distribuição de frequência absoluta e relativa;
(c) Informe a média, mediana e moda da distribuição;
(d) Informe a variância, o desvio-padrão e o coeficiente de variação da distribuição.

Você também pode gostar