Escolar Documentos
Profissional Documentos
Cultura Documentos
Objetivos de aprendizagem
• Calcular o Quartil.
• Calcular o Decil.
• Calcular o Centil.
I NTERVALO I NTERQUARTIL
5 1 MÓDULO 1
A mediana divide o conjunto de dados ao meio, deixando
50% das observações abaixo dela e 50% acima dela. De modo
análogo, podemos definir qualquer separatriz como sendo um
valor que deixa p% dos dados abaixo e o restante acima.
AULA
Vamos nos concentrar aqui em um caso particular das sepa-
ratrizes, que são os quartis. O primeiro quartil, que indicaremos
por Q1 , deixa 25% das observações abaixo e 75% acima. O
segundo quartil é a mediana e o terceiro quartil, Q3 , deixa 75%
das observações abaixo e 25% acima. Na figura a seguir, Figura
5.3, temos uma ilustração desses conceitos.
0 0 0 0 0 1 1 1 2 2 2 3 3 3 4
0 0 0 0 0 1 1
cuja mediana é
Q1 = x( 7+1 ) = x(4) = 0
2
2 2 2 3 3 3 4
e, portanto,
Q3 = x(4+8) = x(12) = 3
o intervalo interquartil é calculado como
IQ = Q3 − Q1 = 3 − 0 = 3.
112 C E D E R J
5 1 MÓDULO 1
M EDIDA DE A SSIMETRIA COM BASE NOS
Q UARTIS
AULA
distribuição.
Se Q2 − Q1 < Q3 − Q2 , isso significa que “andamos mais
rápido” para cobrir os 25% inferiores do que os 25% superiores,
ou seja, a distribuição “se arrasta” para a direita.
Analogamente, se Q2 −Q1 > Q3 −Q2 , isso significa que “an-
damos mais devagar” para cobrir os 25% inferiores do que os
25% superiores, ou seja, a distribuição “se arrasta” para a es-
querda. De forma mais precisa, temos o seguinte resultado:
Para tirar o efeito de escala, temos que dividir por uma medida
de dispersão – lembre-se de que dividimos pelo desvio padrão
quando trabalhamos com as diferenças x − x∗ . Aqui, para não
termos efeito dos valores discrepantes, usaremos o intervalo in-
terquartil para gerar a seguinte medida de assimetria, que é cha-
mada medida de assimetria de Bowley:
(Q3 − Q2 ) − (Q2 − Q1 )
B=
Q3 − Q1
que pode ser reescrita como
(Q3 − Q2 ) − (Q2 − Q1 )
B=
(Q3 − Q2 ) + (Q2 − Q1 )
C E D E R J 113
Métodos Estatı́sticos I | Outras Medidas Estatı́sticas
Exercı́cio 5.4.
Considere novamente os dados da Tabela 2.2 sobre os fun-
cionários do Departamento de Recursos Humanos, cujos salá-
rios (em R$) são os seguintes: 6300, 5700, 4500, 3800, 3200,
7300, 7100, 5600, 6400, 7000, 3700, 6500, 4000, 5100, 4500.
Analise a assimetria da distribuição com base no coeficiente de
Bowley.
O B OXPLOT
A partir dos quartis constrói-se um gráfico chamado box-
plot ou gráfico de caixas, que ilustra os principais aspectos da
distribuição e é também muito útil na comparação de distribui-
ções.
O boxplot é formado basicamente por um retângulo vertical
(ou horizontal). O comprimento do lado vertical (ou horizontal)
é dado pelo intervalo interquartil (Figura 5.4.a, onde estamos
trabalhando com um retângulo vertical). O tamanho do outro
lado é indiferente, sugerindo-se apenas uma escala razoável. Na
altura da mediana, traça-se uma linha, dividindo o retângulo em
duas partes [Figura 5.4.b].
114 C E D E R J
5 1 MÓDULO 1
temos que cuidar primeiro da presença de possı́veis outliers ou
valores discrepantes, que, como já dito, são valores que se dis-
tanciam dos demais.
AULA
Regra de Valores Discrepantes
Um dado x será considerado valor discrepante ou outlier se
x < Q1 − 1, 5 IQ ou x > Q3 + 1, 5 IQ
" $
#
Exemplo 5.2. %
blablabl
116 C E D E R J
5 1 MÓDULO 1
A mediana divide o conjunto de dados em duas partes com
25 observações de cada lado (parte sombreada de cinza e a ou-
tra).
Como o número de observações é par, a mediana é a média
dos valores centrais, que estão circundados por uma borda, um
na parte inferior e outro na parte superior.
AULA
x( 50 ) + x( 50 +1) x(25) + x(26) 73 + 74
2 2
Q2 = = = = 73, 5
2 2 2
O primeiro quartil é a mediana da parte inferior, que é o valor cir-
cundado por uma borda na parte sombreada de cinza e o terceiro
quartil é a mediana da parte superior, que é o valor circundado
por uma borda na parte superior, não sombreada.
Q1 = 63
Q3 = 82
IQ = 82 − 63 = 19
Q1 − 1, 5 IQ = 63 − 1, 5 × 19 = 34, 5
Q3 + 1, 5 IQ = 82 + 1, 5 × 19 = 110, 5
Como a maior nota é 97, não há outliers na cauda superior, mas
na cauda inferior, temos a nota 29 que é menor que 34,5 e, por-
tanto, um outlier inferior. Excluı́do esse outlier, o menor valor
que não é discrepante é 37 e o maior valor é 97; logo, as juntas
são 37 e 97. Na Figura 5.8, temos o boxplot resultante.
AULA
Figura 5.9: População total (em 1000 hab) das Unidades da Federação bra-
sileiras.
Figura 5.10: População urbana e rural das UFs brasileiras (em 1000 hab).
C E D E R J 119
Métodos Estatı́sticos I | Outras Medidas Estatı́sticas
Exercı́cio 5.5.
Construa o boxplot para os salários dos funcionários do De-
partamento de Recursos Humanos, cujos valores em reais são
6300, 5700, 4500, 3800, 3200, 7300, 7100, 5600, 6400, 7000,
3700, 6500, 4000, 5100, 4500.
Exercı́cio 5.6.
Os dados a seguir representam o número de apólices de se-
guro que um corretor conseguiu vender em cada um de seus 20
primeiros dias em um emprego novo: 2, 4, 6, 3, 2, 1, 4, 3, 5, 2,
1, 1, 4, 0, 2, 2, 5, 2, 2, 1. Analise a assimetria da distribuição,
utilizando os coeficientes de Pearson e de Bowley.
Exercı́cio 5.7.
O professor Celso tem duas opções de caminho para se diri-
gir da sua casa até seu local de trabalho. Tentando definir qual
o melhor caminho, ele anota o tempo de viagem em diferentes
dias, obtendo os seguintes tempos (em minutos):
Caminho 1 12 11 10 10 8 12 15 7 20 12
Caminho 2 12 15 13 13 14 13 12 14 13 15
Exercı́cio 5.8.
Em sua polı́tica de fidelização de clientes, determinado su-
permercado tem uma promoção de dar descontos especiais dife-
renciados no mês do aniversário do cliente. O desconto básico
é de 5%, mas clientes especiais – aqueles com pontuação alta
– podem receber prêmios adicionais, que variam a cada mês e
de filial para filial. A seguir, você tem os pontos dos clientes
aniversariantes de determinado mês em uma das filiais do super-
mercado.
77 69 72 73 71 75 75 74 71 72 74 73 75 71 74
73 78 77 74 75 69 76 76 80 74 85 74 73 72 74
AULA
tes com pontuação acima do terceiro quartil por 1,5 vezes
o intervalo interquartil serão premiados. Algum cliente
ganhará a garrafa de champagne nesse mês?
Exercı́cio 5.2.
A densidade populacional média é 59,444 hab/km2 e o des-
vio padrão das densidades é 87,253 hab/km2 . Na Tabela 5.3,
apresentam-se os escores padronizados para cada UF, calcula-
dos pela fórmula zi = (xi −x)/σx . Por exemplo, para RO, o valor
−0, 6125 foi obtido como (6 − 59, 444)/87, 253.
Podemos ver que as únicas UFs com densidades relativa-
mente altas, isto é, escores fora do intervalo (−3, +3), são RJ
e DF; não há densidade relativamente baixa.
C E D E R J 121
Métodos Estatı́sticos I | Outras Medidas Estatı́sticas
Exercı́cio 5.3.
Para esses dados temos x = 71, 42; x∗ = 63; σ 2 = 215, 2836.
Logo,
71, 42 − 63
e= √ = 0, 5739
215, 2836
Exercı́cio 5.4.
Os quartis para esse conjunto de dados são
Q2 = x(8) = 5600; Q1 = x(4) = 4000; Q3 = x(12) = 6500.
O intervalo interquartil é Q3 − Q1 = 6500 − 4000 = 2500. Logo,
Exercı́cio 5.5.
Os quartis para esse conjunto de dados são
AULA
Figura 5.11: Solução do Exercı́cio 5.5.
Exercı́cio 5.6.
A média dos dados é x = 2, 6, com desvio padrão σ = 1, 5620.
A moda é x∗ = 2.
Os quartis são
x(5) + x(6)
Q1 = = 1, 5;
2
x(10) + x(11)
Q2 = = 2;
2
x(15) + x(16)
Q3 = = 4.
2
(Q3 − Q2 ) − (Q2 − Q1 ) (4 − 2) − (2 − 1, 5) 1, 5
B= = = = 0, 4286
Q3 − Q1 4 − 1, 5 3, 5
C E D E R J 123
Métodos Estatı́sticos I | Outras Medidas Estatı́sticas
Exercı́cio 5.7.
Na tabela a seguir, são apresentados os valores relevantes
para a solução do exercı́cio. Podemos concluir que o tempo
pelo caminho 2 é menos variável, apesar de ser um pouco maior.
Dessa forma, parece que o Prof. Celso deva optar por esse ca-
minho, planejando-se para sair com a devida antecedência.
Exercı́cio 5.8.
6 9 9
7 1 1 1 2 2 2 3 3 3 3 4 4 4 4 4 4 4
7 5 5 5 5 6 6 7 7 8
8 0
8 5
124 C E D E R J
5 1 MÓDULO 1
b. Temos 30 clientes. Logo,
x(15) + x(16)
Q2 = = 74,
4
Q1 = x(8) = 72,
Q3 = x(23) = 75,
AULA
IQ = Q3 − Q1 = 75 − 72 = 3.
C E D E R J 125