Você está na página 1de 26

Lista 3

Exercício 1. Faça o gráfico, calcule a média aritmética, mediana, moda, quartis, amplitude total,
desvio médio absoluto, a variância (s2 e σ
b2 ) e o desvio padrão para cada um dos seguintes dados:

(a) lançamento e vendas de imóveis em São paulo, em milhares de unidades por ano:
Ano 1990 1991 1992 1993 1994 1995 1996 1997
Lançamento 14,6 12,8 10,2 21,7 24,9 26,6 31,0 38,8
Vendas 5,1 4,0 4,5 10,1 12,6 9,7 10,2 11,7

(b) Aids no Brasil:


Ano 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Casos Registrados
Homem 9.857 12.063 13.116 14.027 15.064 16.356 16.137 16.112 13246 9.824
Mulhere 2.064 2.997 3.713 4.314 5.293 6.587 7.409 7.905 6763 5.189
Óbitos Ocorridos
Homem 6.807 7.965 8.565 8.690 8.631 7.362 5.896 5.286 3.776 2.376
Mulhere 1.355 1.808 2.255 2.500 2.851 2.728 2.464 2.207 1.586 1.036
Fonte: Ministério da Saúde, citado pela Folha de São Paulo, 1/12/2001.

(c) Crianças nascidas vivas no Brasil, por mês, em 1994:


Mês Janeiro Fevereiro Março Abril Maio Junho
Nascidos Vivos 222.779 210.667 249.204 234.322 242.449 224.171
Mês Julho Agosto Setembro Outubro Novembro Dezembro
Nascidos Vivos 220.38 212.893 202.819 187.494 161.03 104.117
Fonte: IBGE.

(d) Variação, mês a mês, do Índice de Preços ao Consumidor Amplo (IPCA), em %:


Mês Jan. Fev. Mar. Abr. Maio Jun. Jul. Ago. Set. Out. Nov. Dez.
2000 0,62 0,13 0,22 0,42 0,01 0,23 1,61 1,31 0,23 0,14 0,32 0,59
2001 0,57 0,46 0,38 0,58 0,41 0,52 1,33 0,70 0,28 0,83 0,71 0,65
Fonte: Folha de São Paulo,13/03/2002.

(e) Pecuário Brasileira: Inseminação Artificial, em milhões de doses:


Ano 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
Doses 2,349 2,597 2,617 3,321 3,643 4,180 4,123 5,150 5,892 5,567 5,769 6,870
Fonte: Folha de São Paulo,04/06/2002.

(f ) Pecuário Brasileira: exportação de carne bovina:


Ano 1995 1996 1997 1998 1999 2000 2001
Em Peso 135,0 134,3 141,5 188,7 291,6 316,8 503,0
Em Valor 482,5 430,6 435,1 590,2 804,2 783,2 1.013,0
Fonte: Folha de São Paulo,04/06/2002.

Exercício 2. Na tabela a seguir encontram-se os tipos sanguíneos de 60 pessoas. Construa a distri-


buição (tabela) de frequência, faça o histograma (ou gráfico de barras).
O A A AB O O A A O O
O A A O A A O A O A
O A A O A B O A B O
A A A AB B A O O A O
O AB O A A O A O A AB
O B A O A AB A O O A

1
Exercício 3. Na tabela abaixo a seguir encontram-se os níveis de colesterol de 60 pacientes. Construa
a distribuição (tabela) de frequência, faça o histograma (ou gráfico de barras).

276 221 215 262 252 268 325 286 261 202 227 259
309 270 225 207 309 326 229 247 331 203 230 298
193 186 169 269 284 246 212 201 178 222 262 211
169 188 343 309 202 277 182 186 348 221 182 260
245 256 256 322 253 318 225 220 164 259 177 225

Exercício 4. Na tabela abaixo a seguir encontram-se os pesos, em quilogramas, de uma equipe de 60


lutadores de sumô. Construa a distribuição (tabela) de frequência, faça o histograma (ou gráfico de
barras).

164,4 152,9 163,2 163,1 161,2 160,5 162,5 159,8 162,4 162,4
171,2 162,3 161,6 162,3 162,5 163,4 160,7 160,5 161,6 161,6
161,5 167,0 161,3 158,6 159,8 161,9 162,0 166,7 164,0 164,0
159,2 170,2 163,8 163,1 163,4 162,3 163,4 162,0 162,3 162,3
162,0 161,7 162,9 160,3 162,0 161,8 161,8 164,5 163,4 163,4
161,3 158,3 161,4 165,7 158,7 162,9 157,3 162,3 173,0 173,0
156,1 162,5 162,6 159,9 164,3 162,0 168,9 163,6 163,9 163,9
164,6 172,6 160,2 169,2 163,4 164,1 162,6 163,7 156,5 156,5
159,8 162,0 157,3 161,3 173,0 162,0 163,8 167,0 162,9 162,9

Exercício 5. Na tabela abaixo a seguir encontram-se os pesos, em quilogramas, levantados no exame


médico de candidatos a dado cargo público. Construa a distribuição (tabela) de frequência, faça o
histograma (ou gráfico de barras).

61 62 55 68 59 60 62 60 61 57 59 66
63 62 55 54 61 66 65 60 69 56 62 55
56 70 52 59 60 69 57 63 62 66 67 59
60 56 63 59 64 70 58 55 64 64 58 64
64 58 60 54 67 57 62 59 58 65 62 61
66 57 60 61 63 63 54 67 63 61 60 53
62 60 65 65 61 65 52 65 58 59 52 67
56 61 61 62 53 58 65 62 56 64 58 58
68 63 59 59 62 57 65 63 56 57 60 64

Exercício 6. Determine o desvio padrão dos dados agrupados na seguinte distribuição:

Intervalo f
1`3 5
3`5 6
5`7 4
7 `a 9 3
Total 18

Exercício 7. Os dados abaixo representam as vendas semanais, em classe de salários mínimos, de


vendedores de gêneros alimentícios:

Vendas Semanais N. Vendedores (f ) (a) Faça o histograma das observações.


30 ` 35 2
35 ` 40 10 (b) Calcule a média da amostra.
40 ` 45 18 (c) Calcule o desvio padrão da amostra.
45 ` 50 50
50 ` 55 70 (d) Calcule a mediana e a moda.
55 ` 60 30
60 ` 65 18
65 `a 70 2
2
Exercício 8. O Departamento Pessoal de uma certa empresa fez um levantamento dos salários dos
120 funcionários do setor administrativo, obtendo os seguintes resultados (em salários mínimos) da
tabela abaixo.

Faixa Salarial fre (d) Se for concedido um aumento de 100% para


0`2 0,25 todos os funcionários, haverá alteração na mé-
2`4 0,40 dia? E na variância? Justifique sua resposta.
4`6 0,20
6 `a 10 0,15 (e) Se for concedido abono de dois salários míni-
mos para todos os funcionários, haverá altera-
(a) Esboce o histograma correspondente. ção na média? e na variância? E na mediana?
(b) Calcule a média, variância e desvio padrão. Justifique sua resposta.

(c) Calcule o primeiro quartil, moda e mediana.

Exercício 9. Mostre que


k
X k
X
2
fi (ci − x̄) = fi c2i − nx̄2 ,
j=1 j=1
Pk
onde k é o número de classes, fi , para i = 1, · · · , k, são as frequências absolutas nas classes, n = j=1 fi
é o tamanho da amostra e ci , para i = 1, · · · , k, são os ponto médios das classes.

Exercício 10. Em um grupo de pacientes foram tomadas as pulsações (batidas por minuto) e dosadas
as taxas de ácido úrico (mg/100ml). As médias e os desvios padrão foram:

Variável x̄ s
Pulsação 68,7 8,7
Ácido úrico 5,46 1,03

Qual das duas taxas é mais estável?

Exercício 11. Em experimentos para a determinação de clorofila em plantas, levantou-se a questão de


que se o método utilizado poderia fornecer resultados mais consistentes. Três métodos foram colocados
à prova e 12 folhas de abacaxi foram analisadas com cada um dos métodos. Os resultados foram os
seguintes:

Método (unidade) x̄ s
1(100cm3 ) 13,71 1,20
2(100g) 61,40 5,52
3(100g) 337,00 31,20

O que vc pode dizer sobre os três métodos utilizados?

Exercício 12. Considere a distribuição de 1000 empresas de um sector de atividade segundo os


resultados líquidos (em milhares de u.m.):

Classe Intervalo fre (a) Represente a distribuição graficamente.


1 0`1 0,10
(b) Determine a média e a moda da distribuição.
2 1`3 0,25
Qual o significado dos valores encontrados?
3 3`4 0,35
4 5 ` 15 0,15 (c) Calcule as frequências acumuladas e
5 15 ` 25 0,10 represente-as graficamente. Determine a me-
6 25 `a 50 0,05 diana da distribuição.
(d) Determine os quartis da distribuição. Faça a
sua representação gráfica.
(e) Analise a (as)simetria da distribuição.

3
Exercício 13. O quadro que se segue descreve a distribuição do rendimento anual (em milhares de
u.m.) de 2500 famílias da população de um país:

Classe Rendimento Annual N. Famílias (a) Represente as frequências acumuladas grafica-


1 0`1 250 mente.
2 1`2 375
3 2`5 625 (b) Determine o rendimento médio e mediano.
4 5 ` 15 750 (c) Determine os três primeiros quartis. Que in-
5 15 ` 25 375 dicações lhe dão sobre a (as)simetria?
6 25 `a 50 125
(d) O que pode concluir quanto à dispersão?

Exercício 14. Considere a seguinte tabela que representa a distribuição dos empregados de uma
instituição bancária segundo a remuneração bruta mensal (em milhares de unidades monetárias):

Classe Limites fre (a) Calcule os quartis da distribuição.


1 60 ` 80 0,078
2 80 ` 100 0,152 (b) Analise a dispersão da distribuição.
3 100 ` 120 0,312 (c) Analise a assimetria da distribuição.
4 120 ` 140 0,195
5 140 ` 160 0,072
6 160 ` 200 0,081
7 200 ` 250 0,054
8 250 ` 300 0,026
9 300 `a 350 0,030

Exercício 15. Utilizando a tabela a seguir, determine o coeficiente de assimetria por meio das quatro
fórmulas apresentadas no anexo.

Classes Salários por hora N Pessoas


1 50 ` 60 15
2 60 ` 70 20
3 70 ` 80 30
4 80 ` 90 20
5 90 `a 100 15

Exercício 16. Utilizando a tabela a seguir, determine a curtose usando a fórmula dada no anexo.

Classes Intervalo f
1 3`8 5
2 8 ` 13 15
3 13 ` 18 20
4 18 `a 23 10

Exercício 17. Responda verdadeiro ou falso. Justifique as falsas.

(a) ( ) Através dos gráficos de boxplot da figura 1, pode-se afirmar que os alunos tiveram desempe-
nhos semelhantes nas provas A e B.
(b) ( ) Através dos gráficos de boxplot da figura 1, pode-se afirmar que as medianas das provas são
equivalentes.
(c) ( ) Através dos gráficos de boxplot da figura 1, pode-se afirmar que os alunos obtiveram melhor
desempenho na prova A.

4
(d) ( ) Através dos gráficos de boxplot da figura 1, pode-se afirmar que as notas na prova B apre-
sentam uma distribuição simétrica.
(e) ( ) Através dos gráficos de boxplot da figura 1, pode-se afirmar que as notas da prova B são
mais homogêneas que as notas da prova A.
(f ) ( ) Através dos histogramas da figura 2, pode-se afirmar que os alunos tiveram desempenhos
semelhante nas provas C e D.
(g) ( ) Através dos histogramas da figura 2, pode-se afirmar que o desvio padrão da prova C é maior
que o da prova D.
(h) ( ) Através dos histogramas da figura 2, pode-se afirmar que os alunos obtiveram melhor de-
sempenho na prova D.
(i) ( ) Através dos histogramas da figura 2, pode-se afirmar que as notas na prova D apresentam
uma distribuição simétrica.
(j) ( ) Através dos histogramas da figura 2, pode-se afirmar que as notas da prova D são mais
homogêneas que as notas da prova C.

PROVA A PROVA B
10

10
8
8

6
6

4
4

2
2

Figura 1: Boxplot das notas das provas A e B

Histograma prova C Histograma prova D


10

20
8

15
Frequênca

Frequênca
6

10
4

5
2
0

0 2 4 6 8 10 0 2 4 6 8 10

Nota Nota

Figura 2: Histograma das notas das provas C e D

Exercício 18. Um programa de prevenção de acidentes de trabalho foi implementado em 15 empresas


da construção civil de uma determinada região. Os dados abaixo referem aos percentuais de redução
de acidentes de trabalho nas 15 empresas observadas.

20 15 23 11 29 5 20 22 18 17 14 5 32 13 8

5
(a) Sabendo que Q1 = 11 e Q3 = 22, faça um boxplot (gráfico de caixas).
(b) Determine, se houver, os valores discrepantes.
(c) Conclua a respeito da simetria da distribuição.

Exercício 19. Uma escola propôs dois métodos de ensino de matemática aos seus alunos: o método
A e o método B. Uma amostra de 11 alunos submetidos ao método A e uma amostra de 12 alunos
submetidos ao método B, foram selecionadas. Uma prova foi aplicada à esses alunos. O desempenho
(através das notas das provas) pode ser observado nos gráficos abaixo.

Boxplot método A Boxplot método B


10

10
8

8
6

6
4

4
2

2
0

Figura 3: Histograma das notas das provas pelos métodos A e B

Histograma método A Histograma método B


4

4
3

3
Frequênca

Frequênca
2

2
1

1
0

0 2 4 6 8 10 0 2 4 6 8 10

Nota Nota

Figura 4: Boxplot das notas das provas pelos métodos A e B

Responda as seguintes perguntas, justificando suas respostas.

(a) Através dos gráficos das figuras 3 e 4, pode-se afirmar que as medianas são equivalentes para os
métodos A e B?
(b) Nesta amostra, qual método apresentou maior dispersão?
(c) Nesta amostra, qual método apresentou maior média na nota?
(d) Através dos gráficos das figuras 3 e 4, pode-se afirmar que as notas dos alunos submetidos ao
método B apresentam uma distribuição simétrica?
(e) Através dos gráficos de boxplot da figura 4, pode-se afirmar que as notas dos alunos submetidos
ao método B são mais homogêneas que as notas dos alunos submetidos ao método A?
(f ) Baseado nessa amostra, qual método é o melhor?

6
Exercício 20. Em uma faculdade, mediram-se as alturas de 100 alunos do primeiro ano e foi montada
a tabela de frequência abaixo. Complete a Tabela de Frequências e faça um histograma.

Classe Altura (m) fj frj fj cj fj c2j


1 1,40 ` 1,50 2 0,20 2,90 4,21
2 1,50 ` 1,55 0,12 15,25 23,26
3 ` 1,60 25 0,37 39,38
4 1,60 ` 1,65 13 0,50 21,13 34,33
5 1,65 ` 17 28,48 47,70
6 1,70 ` 1,75 20 0,87 59,51
7 ` 1,80 10 0,97 17,75 31,51
8 1,80 `a 1,90 3 1 5,55 10,27
Soma 100 164,93 272,79

Exercício 21. Um grande portal de notícias criou uma nuvem de palavras com os termos mais citados
nos documentos apresentados à Justiça Eleitoral pelos 13 candidatos a presidência da República em
2018. As 10 palavras mais citadas foram:

(a) Complete a tabela de frequências.

Classe Palavras fj Fj frj


1 Brasil 613
2 Nacional 546
3 Políticas 512
4 Política 506
5 Governo 504
6 Social 440
7 Desenvolvimento 397
8 Educação 381
9 Saúde 381
10 País 377
Soma 4657

(b) Faça o gráfico de barras dos dados acima.

(c) Das 10 palavras mais citadas, qual é o percentual de vezes em que aparece a palavra Educação?

(d) Considerando as 10 palavras mais citadas, em média, quantas vezes os candidatos usaram as
palavras Nacional e Saúde (desafio)?

Exercício 22. Um órgão do governo do estado está interessado em determinar padrões sobre o inves-
timento em educação, por habitante, realizado pelas prefeituras. De um levantamento de dez cidades,
foram obtidos os valores (codificados) da tabela abaixo

Cidade A B C D E F G H I J
Investimento 25 16 14 9 19 15 19 16 19 18

7
(a) A média e a mediana são, respectivamente, (b) Receberão um programa especial as cidades
com valores de investimento inferiores à mé-
(i) 17 e 18 dia menos um desvio padrão. As cidades que
(ii) 17 e 17 receberão o programa especial são:
(iii) 18.1 e 17
(i) D e C
(iv) 17 e 16.5
(ii) A e B
(v) 16.5 e 17.5
(iii) D
(vi) NDA
(iv) Nenhuma cidade
(v) D, C e F
(vi) NDA

Exercício 23. Os dados a seguir foram obtidos em indivíduos contaminados pelo veneno de um certo
tipo de inseto e submetidos a tratamento. A variável de interesse Recup é definida como o tempo (em
horas) entre a administração do tratamento e a recuperação do indivíduo. Os valores de Recup são
separados em três grupos denominados cura rápida, com valor de Recup menor ou igual a 12, cura
normal, se o valor de Recup for maior do que 12 e menor ou igual a 45, e cura lenta, se o valor de
Recup estiver acima de 45, temos os seguintes resultados:
P P 2
Recup Tempo (em horas) xi xi
cura rápida 1 2 2 3 3 3 3 4 5 8 11 11 12 68 536
cura normal 16 22 23 37 39 42 45 224 7948
cura lenta 46 47 51 52 56 90 342 20866

Considere as seguintes afirmativas:

(i) Em relação às médias, a variabilidade(cv) do grupo cura rápida é maior que a dos demais
grupos. O grupo cura lenta apresentou a menor variabilidade(cv).

(ii) Cura rápida apresentou o maior desvio padrão.

(iii) Em relação às médias, a variabilidade(cv) do grupo cura normal é maior que a dos demais
grupos. O grupo cura rápida apresentou a menor variabilidade(cv).

(iv) Cura lenta apresentou o menor cv e o menor desvio padrão.

(v) Cura lenta apresentou o menor desvio padrão e o maior cv.

São afirmações verdadeiras os itens:

(a) i), ii) e v) (c) ii) e iii) (e) ii) e v)

(b) i) e ii) (d) i) e v) (f) NDA

Exercício 24. Os dados abaixo referem-se às notas de 5 alunos em uma prova da disciplina de Esta-
tística Básica. Com base nesses dados, complete os itens 1 a 5 abaixo:

9 10 5 7 6

(a) média: x̄ = (d) desvio padrão: s =


(b) mediana: Md = (e) coeficiente de variação: CV =
(c) variância: s2 =

Exercício 25. Responda verdadeiro (V) ou falso (F). Justifique as falsas.

8
(a) ( ) Em uma amostra de uma variável quantitativa, metade dos valores é maior ou igual à medi-
ana.
(b) ( ) Em uma amostra de uma variável quantitativa, metade dos valores é maior do que a média.
(c) ( ) Quanto maior a média, maior é a variância.
(d) ( ) Quanto maior é a variância, maior é o desvio padrão.
(e) ( ) A mediana é quem melhor representa um conjunto de dados, pois ela é a única medida de
tendência central que leva em consideração todas as observações existentes.
(f ) ( ) A mediana é menos sensível que a média a valores extremos (ou discrepantes).
(g) ( ) O intervalo entre o primeiro quartil (Q1 ) e a mediana é sempre maior do que o intervalo
entre a mediana e o terceiro quartil (Q3 ).
(h) ( ) A mediana é sempre maior ou igual ao primeiro quartil (Q1 ), e menor ou igual ao terceiro
quartil (Q3 ).
(i) ( ) A variância pode ser zero.
(j) ( ) Se variância é zero então todos os valores da amostra são iguais.
(k) ( ) A variância é uma estatística que independe da unidade de medida.
(l) ( ) O coeficiente de variação é uma medida que independe de escala.
(m) ( ) O coeficiente de variação pode ser perfeitamente substituído pelo desvio padrão.
(n) ( ) O desvio padrão pode ser um número negativo.
(o) ( ) Se a distribuição é simétrica, então a média é igual à mediana.
(p) ( ) A amplitude de variação e a amplitude interquartílica são medidas de dispersão.

Exercício 26. A figura abaixo apresenta um problema de formulação, levando a uma percepção
equivocada do que ocorre com o número de mortes após o início da validade da lei em 2005. Que erro
é esse, e a qual percepção equivocada ele leva?

Figura 5: número de morte por arma de fogo na Florida.

9
ANEXO
Fórmulas para o cálculo da medidas de assimetria
1. Coeficiente de Pearson A
O coeficiente de Assimetria de Pearson A mede o afastamento da simetria expressando a diferença
entre a média e a mediana em relação ao desvio-padrão do grupo de medidas.
Para o cálculo desse coeficiente, usa-se a seguinte fórmula:

3(x̄ − M ed)
AM ed = ,
s
onde:
AM ed = Coeficiente de Assimetria de Pearson A;
Q2 = M ed = Mediana;
x̄ = Média aritmética da amostra;
s = Desvio padrão da amostra.
Após o cálculo do coeficiente deve-se analisar o resultado encontrado, considerando a seguinte
convenção:
Se AM ed = 0, a distribuição é simétrica.
Se AM ed > 0, a distribuição é assimétrica positiva.
Se AM ed < 0, a distribuição é assimétrica negativa.
Para uma distribuição simétrica, o coeficiente de assimetria será sempre zero, pois, nesse caso, o
valor da média será igual ao valor da mediana, o que anula a expressão. Para uma distribuição
positivamente assimétrica ou assimétrica à direita, a média é sempre maior que a mediana, em
consequência o coeficiente será positivo. Para uma distribuição negativamente assimétrica ou as-
simétrica à esquerda, a média é sempre menor que a mediana, em consequência o coeficiente será
negativo.

2. Coeficiente de Pearson B
O Coeficiente de Pearson B mede o afastamento da simetria expressando a diferença entre a média
e a moda em relação ao desvio padrão do grupo de medidas.
Para o cálculo desse coeficiente, usa-se a seguinte fórmula:

X̄ − M od
AM od = ;
S
onde:
AM od = Coeficiente de Assimetria de Pearson B;
M od = Moda;
X̄= Média aritmética da amostra;
S = Desvio padrão da amostra.
Da mesma forma que na solução anterior, quando:
Se AM od = 0, a distribuição é simétrica.
Se AM od > 0, a distribuição é assimétrica positiva.
Se AM od < 0, a distribuição é assimétrica negativa.

10
3. Coeficiente de Assimetria de Bowley ou Coeficiente Quartílico de Assimetria
Este coeficiente mede o afastamento da simetria relacionando o 1o Quartil e o 3o Quartil com o 2o
Quartil (ou a mediana) do grupo de medidas. A definição desse coeficiente é apresentada a seguir.
Para o cálculo desse coeficiente, usa-se a seguinte fórmula:
Q3 + Q1 − 2M ed (Q3 − Q2 ) − (Q2 − Q1 )
AQ = = ,
Q3 − Q1 Q3 − Q1
onde:
AQ = Coeficiente de Assimetria de Bowley
Q1 = Valor do primeiro quartil
Q2 = M ed = Mediana
Q3 = Valor do terceiro quartil
Quando a distribuição for simétrica, então Q1 e Q3 serão equidistantes de Q2 ou da mediana, o
que vale dizer que a soma de Q1 e Q3 é igual a 2 vezes Q2 (ou mediana). Dessa forma, quando
a distribuição for simétrica, a relação se anula, ou seja, o resultado é igual a zero. Quando a
distribuição é assimétrica, então Q1 e Q3 não são equidistantes de Q2 , o que resultará em um valor
diferente de zero na expressão. Se a distância de Q3 em relação a Q2 for maior que a distância de
Q1 em relação a Q2 , ter-se-á um resultado positivo na expressão, o que indica uma assimetria à
direita, e, se for o inverso, haverá uma assimetria à esquerda.
Numa distribuição simétrica é válida a relação:

Q1 + Q3
Q2 = ,
2
onde:
Q1 = Valor do primeiro quartil;
Q2 = Valor do segundo quartil (ou mediana);
Q3 = Valor do terceiro quartil.
Numa distribuição assimétrica a relação válida é:

Q1 + Q3
Q2 6= ,
2
Assim sendo, valem as conclusões das formas anteriores, ou seja:
Se AQ = 0, a distribuição é simétrica.
Se AQ > 0, a distribuição é assimétrica positiva.
Se AQ < 0, a distribuição é assimétrica negativa.

4. Coeficiente de Assimetria de Kelley ou Coeficiente de Assimetria dos Centis


Esta forma é uma variante da Assimetria de Bowley, substituindo os Quartis por Centis, relacio-
nando o 90o Centil e o 10o Centil com o 50o Centil (ou mediana) do grupo de medidas. Para obter
o resultado desse coeficiente usa-se a seguinte definição.
Para o cálculo desse coeficiente, usa-se a seguinte fórmula:
C90 + C10 − 2M ed
AC =
C90 − C10
onde:
AC = Coeficiente de Assimetria de Kelley
Q2 = M ed = Mediana;

11
C90 = Valor do nonagésimo centil;
C10 = Valor do décimo centil.
As conclusões são idênticas às demais formas de análise de assimetria das distribuições. Assim,
também valem as conclusões das formas anteriores, ou seja:
Se AC = 0, a distribuição é simétrica.
Se AC > 0, a distribuição é assimétrica positiva.
Se AC < 0, a distribuição é assimétrica negativa.
Como os pontos de análise da curva não são os mesmos para as quatro fórmulas apresentadas, os
resultados entre si, dependendo do grau de desuniformidade da distribuição, podem variar. Assim,
fórmulas de Pearson, A e B, que se baseiam nas medidas centrais da distribuição, são mais seguras e
devem ser usadas prioritariamente. O Coeficiente de Kelly, que leva em conta dados mais extremos
da curva, décimo e nonagésimo centis, é o mais vulnerável em termos de sensibilidade da curva.

Fórmulas para o cálculo da medidas de curtose


Entende-se por curtose o grau de achatamento de uma distribuição, em comparação com uma distri-
buição padrão. Com referência ao grau de achatamento de uma curva, pode-se ter três tipos de curva:
mesocúrtica, leptocúrtica e platicúrtica. A curva mesocúrtica é a curva básica que apresenta um grau
de achatamento padrão equivalente ao da curva normal. Já a curva leptocúrtica apresenta um alto
grau de a lamento, superior ao normal, sendo uma curva mais fechada ou empinada. Por outro lado,
a curva platicúrtica apresenta um alto grau de achatamento, superior ao normal, sendo mais aberta.
Para medir o grau de curtose utiliza-se a seguinte definição
Q3 − Q1
K= ,
2(C90 − C10 )
onde:
C90 = 90o Centil;
C10 = 10o Centil;
Q3 = 3o Quartil;
Q1 = 1o Quartil.
Com o valor calculado pela fórmula acima, conclui-se sobre a realidade de curtose de seguinte forma:
Se K = 0, 263, a curva corresponde a uma distribuição de frequência mesocúrtica;
Se K > 0, 263, a curva corresponde a uma distribuição de frequência platicúrtica;
Se K < 0, 263, a curva corresponde a uma distribuição de frequência leptocúrtica.

Cálculo dos Quartis e Centis


Quartil: para calcular os quartis nesse caso, deve-se seguir os passos:

- Encontrar a classe da posição pi desejada, i = 1, 2, 3.

n 2n 3n
p1 = ; p2 = ; p3 = .
4 4 4
- Calcular as frequências acumuladas Fi .

Calcular o valor do quartil !


in
4 − Fi−1
Qi = li + hi ,
fi
onde:

- li : limite inferior da classe;

- Fi−1 : frequência acumulada da classe anterior à classe encontrada;

12
- fi : frequência da classe;

- hi : amplitude da classe.

Centil: para calcular os centis nesse caso, deve-se seguir os passos:

- Encontrar a classe da posição pi desejada, i = 1, 2, 3.

in
pi = , i = 1, · · · , (n − 1).
100
- Calcular as frequências acumuladas Fi .

Calcular o valor do centil


!
in
100 − Fi−1
Ci = li + hi ,
fi
onde:

- li : limite inferior da classe;

- Fi−1 : frequência acumulada da classe anterior à classe encontrada;

- fi : frequência da classe;

- hi : amplitude da classe.

13
Soluções
Ver a planilha do Excel para detalhes dos cálculos.

Observação: Se usar o tipo “histograma” no Excel, o intervalo de classe será fechado à direita e aberto à esquerda. Por
isso os histogramas desse gabarito foram construídos usando o tipo “gráfico de barras” para que os intervalos coincidam
com o que foi definido em aula.

Solução do Exercícios 1.
(a)
Lançamento Vendas
Respostas
𝑥̅ 22,58 8,49
Mediana 23,30 9,90
Moda amodal amodal
𝑥( ) 10,20 4,00
𝑄 13,70 4,80
𝑄 23,30 9,90
𝑄 28,80 10,95
𝑥( ) 38,80 12,60
Amplitude Total 28,60 8,60
Desvio Médio Absoluto 7,750 2,966
𝑠 95,556 11,678
𝜎 83,612 10,219
Desvio Padrão (s) 9,775 3,417
Desvio Padrão (𝜎) 9,144 3,197

14
(b)
Casos Registrados Óbitos Ocorridos
Homens Mulheres Homens Mulheres
Respostas
𝑥̅ 13.580,2 5.223,4 6.535,4 2.079,0
Mediana 13.636,5 5.241,0 7.084,5 2.231,0
Moda amodal amodal amodal amodal
𝑥( ) 9.824 2.064 2.376 1.036
𝑄 12.063 3.713 3.776 1.586
𝑄 13.636,5 5.241,0 6.629,0 2.231,0
𝑄 16.112 6.763 8.565 2.500
𝑥( ) 16.356 7.905 8.690 2.851
Amplitude Total 6.532 5.841 6.314 1.815
Desvio Médio Absoluto 1.959,00 1.568,00 1.761,52 506,20
𝑠 5.961.546,622 3.805.623,156 4.759.848,489 368.725,111
𝜎 5.365.391,96 3.425.060,84 4.283.863,64 331.852,60
Desvio Padrão (s) 2.441,628 1.950,801 2.181,708 607,227
Desvio Padrão (𝜎) 2.316,332 1.850,692 2.069,750 576,066

15
(c)

Nascidos Vivos
Respostas
𝑥̅ 206.027,083
Mediana 216.636,500
Moda amodal
𝑥( ) 104.117
𝑄 195.156,50
𝑄 216.636,50
𝑄 229.246,50
𝑥( ) 249.204
Amplitude Total 145.087
Desvio Médio Absoluto 28.108,056
𝑠 1.603.643.482,265
𝜎 1.470.006.525,410
Desvio Padrão (s) 40.045,518
Desvio Padrão (𝜎) 38.340,664

(d)

IPCA
Respostas
𝑥̅ 0,552
Mediana 0,490
Moda 0,230 - Unimodal
𝑥( ) 0,010
𝑄 0,255
𝑄 0,490
𝑄 0,675
𝑥( ) 1,610
Amplitude Total 1,600
Desvio Médio Absoluto 0,286
𝑠 0,157
𝜎 0,150
Desvio Padrão (s) 0,396
Desvio Padrão (𝜎) 0,388

16
(e)
Doses
Respostas
𝑥̅ 4,340
Mediana 4,152
Moda amodal
𝑥( ) 2,349
𝑄 2,969
𝑄 4,152
𝑄 5,668
𝑥( ) 6,870
Amplitude Total 4,521
Desvio Médio Absoluto 1,258
𝑠 2,235
𝜎 2,048
Desvio Padrão (s) 1,495
Desvio Padrão (𝜎) 1,431

(f)
Em Peso Em Valor
Respostas
𝑥̅ 244,414 648,400
Mediana 188,70 590,20
Moda amodal amodal
𝑥( ) 134,3 430,6
𝑄 135,0 435,1
𝑄 188,7 590,2
𝑄 316,8 804,2
𝑥( ) 503,0 1.013,0
Amplitude Total 368,7 582,4
Desvio Médio Absoluto 108,045 187,200
𝑠 18.687,471 49.870,270
𝜎 16.017,833 42.745,946
Desvio Padrão (s) 136,702 223,317
Desvio Padrão (𝜎) 126,562 206,751

17
Solução do Exercício 2.

Tipo
Classe f fre F Fre
Sanguíneo
1 A 27 0,450 27 0,450
2 B 4 0,067 31 0,517
3 AB 5 0,083 36 0,600
4 O 24 0,400 60 1,000
Total 60 1,000

Solução do Exercício 3.

Ponto
N Classes f fre F Fre
Médio
1 164 |- 187 9 0,150 9 0,150 175,5
2 187 |- 210 7 0,117 16 0,267 198,5
3 210 |- 233 13 0,217 29 0,483 221,5
4 233 |- 256 5 0,083 34 0,567 244,5
5 256 |- 279 13 0,217 47 0,783 267,5
6 279 |- 302 3 0,050 50 0,833 290,5
7 302 |- 325 5 0,083 55 0,917 313,5
8 325 |-|348 5 0,083 60 1,000 336,5
Total 60 1

18
Solução do Exercício 4.

Ponto
N Classes f fre F Fre
Médio
1 152,900 |- 155,133 1 0,011 1 0,011 154,017
2 155,133 |- 157,367 5 0,056 6 0,067 156,250
3 157,367 |- 159,600 4 0,044 10 0,111 158,483
4 159,600 |- 161,833 21 0,233 31 0,344 160,717
5 161,833 |- 164,067 42 0,467 73 0,811 162,950
6 164,067 |- 166,300 6 0,067 79 0,878 165,183
7 166,300 |- 168,533 3 0,033 82 0,911 167,417
8 168,533 |- 170,767 3 0,033 85 0,944 169,650
9 170,767 |-|173,000 5 0,056 90 1,000 171,883
Total 90 1,000

Solução do Exercício 5.

Ponto
N Classes f fre F Fre
Médio
1 52,0 |- 53,8 5 0,046 5 0,046 52,9
2 53,8 |- 55,6 7 0,065 12 0,111 54,7
3 55,6 |- 57,4 12 0,111 24 0,222 56,5
4 57,4 |- 59,2 17 0,157 41 0,380 58,3
5 59,2 |- 61,0 10 0,093 51 0,472 60,1
6 61,0 |- 62,8 20 0,185 71 0,657 61,9
7 62,8|- 64,6 15 0,139 86 0,796 63,7
8 64,6 |- 66,4 12 0,111 98 0,907 65,5
9 66,4 |- 68,2 6 0,056 104 0,963 67,3
10 68,2 |-| 70,0 4 0,037 108 1,000 69,1
Total 108 1,000

19
Solução do Exercício 6.
Respostas
Média 4,556
𝜎 4,358
𝑠 4,614
Desvio Padrão (𝜎) 2,088
Desvio Padrão (s) 2,148

Solução do Exercício 7.

Respostas
Média 51,20
𝜎 43,81
𝑠 44,03
Desvio Padrão (𝜎) 6,62
Desvio Padrão (s) 6,64
Mediana 51,43
Moda 51,67

Solução do Exercício 8.

Faixa Salarial
Respostas
Média 3,650
𝑠 5,171
𝜎 5,128
Desvio Padrão (s) 2,274
Desvio Padrão (𝜎) 2,264
Mediana 3,250
Moda 2,857
𝑄 2

20
(d) Se houver aumento de 100% para todos os funcionários, em conformidade com as propriedades da média e da
variância, a média ficará multiplicada por dois – pois todos os dados estão sendo multiplicados pela constante 2 – e a
variância será multiplicada por quatro – como o salário está sendo multiplicado por 2, a variância fica multiplicada por 22,
ou seja, 4,

(e) Também conforme as propriedades da média e da variância, se houver abono de dois salários mínimos a todos os
funcionários, a média aumentará na medida do aumento salarial – ao somarmos uma constante a todos os dados, a média
dos dados também aumenta na medida dessa constante (neste caso é aumentada de 2), a variância não mudará (ao
somarmos uma constante a todos os dados de uma série, a variância não se altera), O valor numérico da mediana altera-
se (aumenta no valor de 2), mas sua posição permanece a mesma (posição que divide a série de dados pela metade),

Exercícios 12.

Classe Intervalo LI LS at c fre fre (%) f 𝑓×𝑐 𝑓 × (𝑐 − 𝑥̅ ) F Fre


1 0 |- 1 0 1 1 0,5 0,10 10 100 50 4.658,0625 100 0,1
2 1 |- 3 1 3 2 2 0,25 25 250 500 7.088,90625 350 0,35
3 3 |- 4 3 5 2 4 0,35 35 350 1400 3.869,46875 700 0,7
4 5 |- 15 5 15 10 10 0,15 15 150 1500 1.073,34375 850 0,85
5 15 |- 25 15 25 10 20 0,10 10 100 2000 16.065,5625 950 0,95
6 25 |-| 50 25 50 25 37,5 0,05 5 50 1875 45.526,5313 1000 1
Soma 1 1000 7325 78.281,875

Respostas
Média 7,325
Mediana 3,857
Moda 3,667
AQ 0,460
S2 78,360
AMed 92,094

Média: o retorno líquido da empresa está em torno de 7,325 u.m.

Moda: A classe modal é aquela à que corresponde a maior frequência por unidade de amplitude, Neste caso, o maior
valor de fi / hi é 0,175, Correspondente à classe [3; 5[, isto é, os valores de resultado líquido mais prováveis para uma
empresa situam-se entre 3000 u.m. e 5000 u.m.

21
Mediana: 50% das empresas apresentam resultados líquidos inferiores a 3857 u.m.

i pi Classe Qi
1 250 1 |- 3 2,200(1)
2 500 1 |- 3 3,857
3 750 5 |- 15 8,333(2)

(1)
25% das empresas apresentam resultados líquidos inferiores a 2200 u.m.
(2)
75% das empresas apresentam resultados líquidos inferiores a 8333 u.m.

𝑥̅ > 𝑀𝑒 > 𝑀𝑜 além disso 𝑄 − 𝑄 ≫ 𝑄 − 𝑄 e ainda, 𝐷𝑆 ≫ 𝐷𝐼. Tudo isso indica que a distribuição é assimétrica com
assimetria positiva.

Exercícios 13.

Classe Rendimento Anual LI LS fre Nr. Famílias (f) F Fre c 𝑓 × 𝑐 𝑓 × (𝑐 − 𝑥̅ )


1 0 |- 1 0 1 0,10 250 250 0,10 0,5 125 18.168,91
2 1 |- 2 1 2 0,15 375 625 0,25 1,5 562,5 21.234,61
3 2 |- 5 2 5 0,25 625 1.250 0,50 3,5 2.187,5 19.078,52 Mediana
4 5 |- 15 5 15 0,30 750 2.000 0,80 10 7.500 712,97 Moda
5 15 |- 25 15 25 0,15 375 2.375 0,95 20 7.500 45.168,98
6 25 |-| 50 25 50 0,05 125 2.500 1 37,5 4.687,5 101.353,20
Total 2500 225.625 205.717,19

Média 9,025 i 𝒑𝒊 Classe 𝑸𝒊


𝑠 82,319 1 625 2 |- 5 2,000
Mediana 5 2 1250 2 |- 5 5,000
Moda 2,5 3 1875 5 |- 15 13,333
AQ 0,471
AMed 1,331

𝑥̅ > 𝑀𝑒 > 𝑀𝑜 além disso 𝑄 − 𝑄 ≫ 𝑄 − 𝑄 e ainda, 𝐷𝑆 ≫ 𝐷𝐼. Tudo isso indica que a distribuição é assimétrica com
assimetria positiva.

Sobre a dispersão: 𝑠 = 82,319 e 𝑥̅ = 9,025 implicam que 𝐶𝑉 = 100,53%, ou seja, existe uma grande variação em torno
da média.

22
Exercícios 14.

Classe Limites LI LS 𝑓 c 𝑐×𝑓 𝑓 𝑐×𝑓 𝐹 𝑓 × (𝑐 − 𝑥̅ )


1 60 |- 80 60 80 0,078 70 5,46 78 5.460 78 311.945,21
2 80 |- 100 80 100 0,152 90 13,68 152 13.680 230 284.194,04
3 100 |- 120 100 120 0,312 110 34,32 312 34.320 542 168.510,45
4 120 |- 140 120 140 0,195 130 25,35 195 25.350 737 2.047,03
5 140 |- 160 140 160 0,072 150 10,80 72 10.800 809 20.224,63
6 160 |- 200 160 200 0,081 180 14,58 81 14.580 890 177.106,31
7 200 |- 250 200 250 0,054 225 12,15 54 12.150 944 454.674,47
8 250 |- 300 250 300 0,026 275 7,15 26 7.150 970 522.493,34
9 300 |-| 350 300 350 0,03 325 9,75 30 9.750 1000 1.103.156,93
Total 1 133,24 1.000 133.240 3.044.352,40

Média 133,24 Classe Pi


S2 3.047,400 Q1 101,282 100 |- 120 250
CV 41,431 Q2 117,308 100 |- 120 500
Aq 42,329 Q3 143,611 140 |- 160 750
Amed 0,866
AQ 0,243

Exercícios 15. Média 77,5


𝑠 188,1313131
Classes Salários por hora LI LS N Pessoas(f) 𝐹 𝑐 𝑐 × 𝑓 𝑓 × (𝑐 − 𝑥̅ ) Moda 75,000
1 50 |— 60 50 60 15 15 55 825 7.593,75 Amed 0
2 60 |— 70 60 70 20 35 65 1.300 3.125 Amod 0,182
3 70 |— 80 70 90 30 65 80 2.400 187,5 AQ 0,167
4 80 |— 90 90 90 20 85 90 1.800 3.125
5 90 |— 100 90 100 15 100 95 1.425 4.593,75
Classe Pi
Total 100 7.750 18.625
Q1 65.000 60 |— 70 25
Q2 77.500 60 |— 70 50
Q3 95.000 80 |— 90 75

Exercícios 16.
Classe Pi
Classes Intervalo LI LS 𝑓 𝐹 𝑐 𝑐×𝑓 Q1 10,500 8 |— 13 12,5
1 3 |— 8 3 8 5 5 5.5 27.5 Q2 14,250 13 |— 18 25
2 8 |— 13 8 13 15 20 10.5 157.5 Q3 17,375 13 |— 18 37,5 Média 14
3 13 |— 18 13 18 20 40 15.5 310 C10 8 3 |— 8 5 Moda 14.667
4 18 |— 23 18 23 10 50 20.5 205 C90 20,5 18 |— 23 45 K 0.275

Resposta: Como K > 0,263, logo, a curva correspondente é suavemente platicúrtica.

23
Exercícios 20.

Histograma:

Exercícios 21.

c) 8%. d) 463,5 vezes.

24
Solução do Exercício 9: Usando as igualdades
k k
X 1X
(a + b)2 = a2 + 2ab + b2 , fj = n e x̄ = fj cj
j=1
n j=1

temos
k
X k
X k
X k
X k
X
fi (ci − x̄)2 = fi (c2i − 2ci x̄ + x̄2 ) = fi c2i − 2fi ci x̄ + fi x̄2
j=1 j=1 j=1 j=1 j=1
k
X k
X k
X k
X
= fi c2i − 2x̄ fi ci + x̄2 fi = fi c2i − 2nx̄2 + nx̄2
j=1 j=1 j=1 j=1
k
X
= fi c2i − nx̄2 .
j=1

como queríamos demonstrar.

Solução do Exercício 10: Os coeficientes de variação são: CVp = 8, 7/68, 7 = 0, 127 e CVa.u. = 1, 03/5, 46 =
0, 232, o que evidencia que a pulsação é mais estável do que o ácido úrico.

Solução do Exercício 11: Note que as médias são bastante diferentes devido às diferenças entre os métodos.
Entretanto, os três CV são próximos, o que indica que a consistência dos métodos é praticamente equivalente,
sendo que o método 3 mostrou-se um pouco menos consistente.

Solução do Exercício 17:


a) (F); basta comparar a mediana e Q3 para ver que o desempenho não foi semelhante.
b) (F); mediana da turma B é maior
c) (F); basta comparar a mediana e Q3 para ver que a turma B teve um desempenho melhor.
d) (F); assimétrica à esquerda pois Q2 − Q1 >> Q3 − Q2 e DI >> DS.
e) (F); as notas da prova A variam menos do que as notas da B.
f) (F); Pelos valores no histograma conclui-se que Média de C = 5,67 e Média de D = 8,09.
g) (V); Pelos valores no histograma conclui-se que sC = 2, 48 e sD = 1, 23.
h) (V); as notas são mais elevadas nessa prova.
i) (F); assimétrica.
j) (V); as notas apresentam menor variabilidade total.

Solução do Exercício 18:

Dados ordenados b) Não existem valores discrepantes.


5 5 8 11 13 14 15 17 18 20 20 22 23 29 32 c) Média = 16, 5 < 17 = Mediana, mas a diferença é
x(1) = 5, x(n) = 32. pequena (inconclusivo).
Q2 − Q1 = 6 > 5 = Q3 − Q2 , mas a diferença é re-
a) Q1 = 11, Q3 = 22. aQ = 22 − 11 = 11, lativamente pequena. Podemos considerar que são
CI = 11 − 1, 5 × 11 = −5, 5 < x(1) (usar o mínimo) aproximadamente iguais. Observando então que
CS = 22 + 1, 5×11 = 38, 5 > x(n) (usar o máximo) Q1 − x(1) = 6 < 10 = x(n) − Q3 , ou ainda, que
DI = 12 < 17 = D5, conclui-se que existe uma
leve assimetria positiva.

25
Solução do Exercício 19:
(a) Não, a mediana do método A é superior a do método B (ver boxplot).
(b) Método B, pois variou de 1 a 9 (ver boxplot).
(c) Método A (usar valores do histograma para calcular).
(d) Não, a DS é maior do que a DI, além disso, a caixa acima da mediana é mais larga do que a caixa abaixo
da mediana.
(e) Não, as notas do método A que são mais homogêneas (ver histograma e boxplot).
(f) Método A.

Solução do Exercício 22:


(a) i. (b) iii (desvio padrão = 4,16)

Solução do Exercício 23:


Letra D. CVcura rapida = 2, 81. CVcura normal = 2, 78. CVcura lenta = 0, 29. scura lenta = 16, 56

Solução do Exercício 24:


(a) Média=7,5 (b) Mediana = 7 (c) Variância = 4,3 (d) Desvio Padrão = 2,07 (e) CV = 0,28

Solução do Exercício 25:

(a) (V) (h) (V)


(b) (F) Em uma amostra de uma variável quantita- (i) (V)
tiva, metade dos valores é maior do que a média (j) (V)
mediana.
(k) (F) A variância tem a unidade de medida dos da-
(c) (F) Quanto maior a os desvios da média, maior é
dos elevada ao quadrado.
a variância.
(l) (V)
(d) (V).
(e) (F) A mediana não leva em consideração todas as (m) (F) Por exemplo, quando os dados tem unidades
observações existentes. de medida distintas, o coeficiente de variação pode
ser usado para comparar as variáveis mas o desvio
(f) (V) padrão não.
(g) (F) Em uma distribuição simétrica o intervalo en-
(n) (F) O desvio padrão é sempre positivo.
tre o primeiro quartil (Q1 ) e a mediana é igual
ao intervalo entre a mediana e o terceiro quartil (o) (V)
(Q3 ). (p) (V)

Solução do Exercício 26: Como a escala do gráfico está invertida, ele nos leva a pensar que diminuíram as
mortes depois de 2005, quando na verdade as só aumentaram.

26

Você também pode gostar