Escolar Documentos
Profissional Documentos
Cultura Documentos
Muitas vezes torna-se necessário conhecermos outras medidas, além das de Tendência
Central. Assim, nesta Unidade estaremos estudando medidas de posição chamadas Separatrizes:
Mediana, quartis, decis e percentis.
Mediana é uma medida de posição que é simultaneamente, medida de tendência central e medida
separatriz. Por esse motivo a mediana foi estudada na aula anterior, assim passaremos ao estudo dos
quartis, posteriormente dos decis e percentis.
Já estudamos que a mediana separa a distribuição em duas partes iguais, e que cada parte contém o
mesmo número de elementos. Contudo, uma mesma distribuição pode ser dividida em duas ou mais
partes que contenham a mesma quantidade de elementos. O nome da medida de posição separatriz
será de acordo com a quantidade de partes em que é dividida a distribuição.
Q1 Q2 Q3
Para o cálculo dos quartis utilizam-se técnicas semelhantes àquelas do cálculo da mediana.
Consequentemente, podem-se utilizar as mesmas fórmulas do calculo da mediana, levando em
conta que onde houver a expressão f i será substituída por K f i , sendo K o número da ordem
2 4
do quartil, em que K =1 corresponde ao primeiro quartil; K = 2 corresponde ao segundo quartil e K
= 3 ao terceiro quartil.
1
Exemplo: Calcule Q1, Q2 e Q3 para o seguinte conjunto de valores:
A4,1,8,0,11,10,7,8,6,2,9,12
Inicialmente precisamos colocar os valores em ordem (rol)
A0,1,2,4,6,7,8,8,9,10,11,12
a) Vamos utilizar os passos para o cálculo do 1° quartil:
1° Passo: Determina-se a posição do 1° quartil:
1 12
PQ1 3 posição do 1 quartil
4
2° Passo: Identificar a posição 3
3° Passo: Procura-se no rol o valor do número que está na posição identificada.
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12
0 1 2 4 6 7 8 8 9 10 11 12
K fi
PQK (onde K 1,2ou3)
4
2° Passo: É necessário inserir a coluna das frequências acumuladas, e nela procurar o valor da
posição do quartil.
3° Passo: O Valor do quartil será o valor da variável que corresponde àquela classe.
2
Exemplo: Calcular os valores do Q1, Q2 e Q3 da tabela seguinte:
b) Vamos calcular o Q2
1° Passo: Determinar a posição do 2° quartil (50%)
2 28
PQ 2 14 posição do 2 quartil
4
2° Passo: Procurar na coluna da F a posição do 14° elemento
3° Passo: A variável que corresponde à posição do 14° elemento é 2 (na terceira classe).
50% da pesquisa mostrou que este cruzamento teve 2 acidentes / mês.
c) Vamos calcular o Q3
1° Passo: Determinar a posição do 3° quartil (50%)
3 28
PQ 3 21 posição do 3 quartil
4
2° Passo: Procurar na coluna da F a posição do 21° elemento
3° Passo: A variável que corresponde à posição do 21° elemento é 3 (na quarta classe).
75% da pesquisa mostrou que este cruzamento teve 3 acidentes / mês.
Determina-se, inicialmente, a classe que contém o valor quartil a ser calculado. A identificação da
classe é feita por meio do termo da ordem calculada pela expressão:
K fi
PQK (onde K 1,2ou3)
4
Essa expressão determina a posição do referente quartil ou classe que contém o quartil. Assim,
temos:
3
K fi
Fant
Qk l qk 4 aQk
f QK
Sendo:
Exemplo:
Calcular os valores do Q1, Q2 e Q3 da tabela seguinte:
1 f i 54
P Q1 = 13,5
4 4
Observando a coluna de frequência acumulada, verificamos que o 13,5º termo pertence à terceira
classe (a frequência acumulada da teceria classe abrange do 12º termo ao 29º termo). Sabendo que a
classe do primeiro quartil é a terceira classe, podemos verificar qual o valor numérico do primeiro
quartil utilizando a expressão:
1 f 1
Fant 13,5 11
= 80 40 85,555555 Q1 85,56
18
Q1 l Q1 4 aQ1
f Q1
25% dos candidatos fizeram no máximo 85,56 pontos.
2 f i 2 54
2° quartil 27 (o segundo quartil pertence à terceira classe).
4 4
2 f i
Fant
27 11
Q2 l Q2 4 a Q 80
40 115,55555 Q2 115,56
fQ 2 18
2
4
50% dos candidatos fizeram no máximo 115,56 pontos.
3 f i 3 54
3° quartil 40,5 (o terceiro quartil pertence à quarta classe)
4 4
3 f i
Fant
40,5 29
Q3 l Q3 4 a Q 120
40 150,66666 Q3 150,67
fQ3 15
3
75% dos candidatos fizeram no máximo 150,67 pontos.
x1 x2 x3 x4 x5 x6 x7 x8
10 13 14 15 15 16 18 18
x1 x2 x3 x4 x5 x6 x7 x8
10 13 14 15 15 16 18 18
b) Vamos calcular o Q2
!° Passo: Determinar a posição do 2° quartil (50%)
2 38
PQ 2 19 posição do 2 quartil
4
2° Passo: Procurar na coluna da F a posição do 19° elemento
3° Passo: A variável que corresponde à posição do 19° elemento é 4 (na terceira classe).
50% dos académicos tiveram 4 faltas.
c) Vamos calcular o Q3
!° Passo: Determinar a posição do 3° quartil (50%)
3 38
PQ 3 28,5 posição do 3 quartil
4
2° Passo: Procurar na coluna da F a posição do 28,5° elemento
3° Passo: A variável que corresponde à posição do 28,5° elemento é 6 (na quarta classe).
75% dos académicos tiveram 6 faltas.
6
3.2 Decis (DK)
Nos decis, a distribuição é dividida em 10 partes iguais (D1, D2, D3, ...D9).
10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
D1 D2 D3 D4 D5 D6 D7 D8 D9
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
2 4 6 7 10 12 15 18 20 24
a) Calcular D1
1° Passo: determina-se a posição do primeiro Decil.
1 n 1 10
PD1 1 ( posição )
10 10
2° Passo: Procura-se no rol o valor do primeiro elemento;
3° passo: O valor do D1=2 que corresponde a 10% do rol
b) Calculo do D8
1° Passo: determina-se a posição do oitavo Decil.
8 n 8 10
PD 8 8 ( posição )
10 10
2° Passo: Procura-se no rol o valor do oitavo elemento;
3° passo: O valor do D8=18 que corresponde a 80% do rol
7
3.2.2 Cálculo do Decil para tabela sem Intervalo de Classe.
a) Cálculo do D3
1° Passo: Calcula-se a posição do D3
3 f 3 170
D3 51 (posição)
10 10
2° passo: Procura-se a posição do D3 pela coluna da frequência acumulada, o D3 está na 2°
classe (F 53)
3° Passo: O valor da variável na segunda classe é 1 filho, que corresponde a 30% da
pesquisa.
b) Cálculo do D8
1° Passo: Calcula-se a posição do D8
8 f 8 170
D8 144 (posição)
10 10
2° passo: Procura-se a posição do D8 pela coluna da frequência acumulada, o D8 está na 5°
classe (F 152)
3° Passo: O valor da variável na segunda classe é 4 filhos, que corresponde a 80% da
pesquisa.
Primeiramente, determina-se a classe que contém o valor do decil a ser calculado pela expressão:
K fi
(para K 1,2,3,...,9)
10
Esse termo está localizado numa classe que recebe o nome de classe decil. Para o cálculo dos decis,
utilizamos técnicas semelhantes às do cálculo dos quartis. Isto é, utilizamos a fórmula:
8
k fi
Fant
D K l DK 10 aD K
f DK
Sendo:
l DK = limite inferior da classe de decil considerado
Fant = frequência acumulada da classe anterior à classe de decil considerado
aDK = amplitude do intervalo de classe do decil considerado
fDK = frequência simples da classe do decil considerado
Exemplo : O cálculo dos decis será exemplificado com os dados da Tabela 3.6 que organiza as
estaturas de adolescentes, colhidas durante o período em que participaram de um acampamento,
durante as férias.
1 fi
Fant
5,4 0
D1 lD1 10 aD1 120 8 127,5 cm D1 127,5 cm
F D1 6
2 fi
Fant
10,8 6
D2 lD2 10 aD2 128 8 131,2 cm D 2 131,2 cm
FD2 12
Dessa forma, podemos calcular os outros decis. Por exemplo, cálculo do sétimo decil (K=7):
7 fi
Fant
37,8 34
D7 lD7 10 aD7 144 8 146,3 cm D7 146,3 cm
FD7 13
9
3.3 Percentis (Pk)
Nos percentis, a distribuição é divida em 100 partes iguais (P1, P2, P3, ... P99).
P1: é o primeiro percentil, corresponde à separação do primeiro 1% de elementos da
distribuição.
P50: é o quinquagésimo percentil, coincide com a mediana (P50 = D5 = Q2 = Md).
Para o cálculo dos percentis, utilizamos técnicas semelhantes às do cálculo dos quartis e
decis. Inicialmente, determina-se a classe que contém o valor percentil a ser calculado pela
expressão:
K fi
(K = 1; 2; 3;...; 98; 99)
100
Verificamos que o raciocínio é o mesmo utilizado para o cálculo do Quartil e Decil. Consideremos
o exemplo abaixo:
1) Calcular o P28 e P82 do conjunto B15,2,4,6,10,12,13,7,21,18,20
Devemos inicialmente ordenar os valores:
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11
2 4 6 7 10 12 13 15 18 20 21
a) Cálculo do P28
1° Passo: Determinar a posição do P28 28 n 28 11
P28 3,08
100 100
2° Passo: procura-se no rol o valor da posição do 3° elemento;
3° Passo: A variável que corresponde à posição desejada é o número 6
b) Cálculo do P82
1° Passo: Determinar a posição do P82 82 n 28 11
P82 9,02
100 100
2° Passo: procura-se no rol o valor da posição do 9° elemento;
3° Passo: A variável que corresponde à posição desejada é o número 18
O cálculo do Percentil para a tabela sem intervalo de classe é o mesmo que para os cálculos dos
Quartis e Decís. Estudemos esses cálculos através do exemplo a seguir:
10
Número de f F
quartos/chalés
1 15 15
2 30 45
3 20 65
4 12 77
5 10 87
6 8 95
f i 95
a) Calcular P45
1° Passo: Determinar a posição do P45 P 45 n 45 95 42,75
45
100 100
2° Passo: Procurar a posição do 43 elemento pela coluna da frequência acumulada, podemos
observar que o elemento de posição 43 está na segunda classe;
3° Passo O valor da variável que corresponde a 45% da pesquisa revelou que os pesquisados
preferem até dois quartos por chalé.
b) Calcular P93
1° Passo: Determinar a posição do P93 P 93 n 93 95 88,35
93
100 100
2° Passo: Procurar a posição do 88° elemento pela coluna da frequência acumulada, podemos
observar que o elemento de posição 88 está na sexta classe;
3° Passo O valor da variável que corresponde a 93% da pesquisa revelou que os pesquisados
preferem até seis quartos por chalé.
Para o cálculo dos percentís, utilizamos técnicas semelhantes ás do cálculo dos quartis e decís.
Inicialmente, determina-se a classe que contém o valor percentil a ser calculado pela expressão:
K fi
(K 1,2,3,4,...,98,99)
100
Para obtenção do percentil, utilizamos a fórmula:
K fi
Fant
PK lPK 100 aPK
f PK
Sendo:
l PK limite inferior da classe do percentil considerado
Fant = frequência acumulada da classe anterior do percentil considerado
aPK amplitude do intervalo de classe do percentil considerado
f PK = frequência simples da classe do percentil considerado
11
Exemplo: Na tabela 3.6 vamos calcular o 46º percentil (K=36) e o 76° percentil (K=76):
a) Cálculo do P46
46 f i
100 Fant
24,84 18
P46 l P a 136 8 139,42cm
f 16
46
P 46
b) Cálculo do P76
76 f i
100 Fant
41,04 34
P76 l P a 144 8 148,33cm
f P 46 13
46
Não há razão de se calcular a média de um conjunto de dados onde não haja variação desses
elementos. Ocorre, todavia, que se a variabilidade dos dados for muito grande, sua média terá um
grau de confiabilidade tão pequeno que será inútil calculá-la.
A análise completa de dados requer não apenas sua apresentação, através de gráficos e tabelas, ou o
cálculo de médias ou outras medidas de posição. Caracterizar um conjunto de dados apenas através
de uma média, por exemplo, é descreve-lo inadequadamente, uma vez que os dados diferem entre
12
si, em maior ou em menor grau. Assim, suponhamos que se deseja comparar a performance de
empregados, com base na seguinte produção diária de determinada peça:
De acordo com os resultados dos cinco testes, verificamos que a performance média do empregado
A é de 70 peças produzidas diariamente, enquanto que a do empregado B é de 71 peças. Por
conseguinte, baseados nestes únicos resultados, diríamos que a performance de B é melhor do que a
de A. Se nos fixarmos melhor nos dados, entretanto, perceberemos que a produção de A varia
apenas de 69 a 71 peças, ao passo que a de B varia de 60 a 83 peças, o que revela que a
performance de A é bem mais uniforme do que a de B. Ocorre, por outro lado, que um alto grau de
uniformidade ou pequena variação costuma ser considerada como algo de qualidade desejável em
um processo produtivo. Qualquer produção em série seria antieconómica se houvesse muita
variabilidade nos materiais ou peças fabricadas.
Para avaliar o grau de variabilidade ou dispersão dos valores de um conjunto de números, deve-se
apoiar as estatísticas denominadas medidas de dispersão. Essas nos proporcionam um conhecimento
mais completo do fenómeno a ser analisado, permitindo estabelecer comparações entre fenómenos
da mesma natureza e mostrando ate que ponto os valores se distribuem acima ou abaixo da média.
Amplitude total
É a mais simples medida de variabilidade. Representada pelo símbolo At, é dada pela diferença entre
os valores extremos de um conjunto de números. Para a tabela 1, a amplitude total para o empregado A é de
2 ( 71 – 69 ) e para o empregado B é de 23 ( 80 - 60 ).
Se os dados vierem dispostos em uma tabela de frequências, com os valores agrupados em classe,
há duas formas de se definir a amplitude total:
Primeiro método: At = Ponto médio da última classe – ponto médio da primeira classe.
Segundo método: At = Limite superior da ultima classe – limite inferior da primeira classe.
13
Restrições ao uso da Amplitude Total
Embora a amplitude total seja a mais simples das medidas de dispersão, há uma forte restrição ao
seu uso em virtude de sua instabilidade, uma vez que ela leva em conta apenas os valores extremos
da série. Além da insensibilidade aos valores extremos, a amplitude total é sensível ao tamanho da
amostra. Aumentando essa última, a amplitude total tende a aumentar, ainda que não
proporcionalmente. Finalmente, a amplitude total apresenta muita variação de uma amostra para
outra, mesmo que ambas sejam extraídas da mesma população.
Apesar dos inconvenientes dessa medida, os quais não justificam, na maioria das vezes, seu uso, há
situações especiais em que ela resulta satisfatória. É o caso, por exemplo, da amplitude da
temperatura em um dia ou no ano.
Amplitude interquartil
É a diferença entre o terceiro quartil e o primeiro quartil. Corresponde ao intervalo que engloba
50% das observações centrais.
IQ Q3 Q1
Esta medida deve ser utilizada para distribuições assimétricas uma vez que não é afectada por
valores extremos.
Variância
A variância é a medida de variabilidade que utiliza todos os dados. A variância é baseada na
diferença entre o valor de cada observação (xi) e a média. A diferença entre cada valor de xi e a
média, é chamada de diferença em redor da média.
x x
2 2
fi
População 2 i
2 i
N N
2 2
xi x xi x f i
s2 s2
Amostra
n 1 n 1
A variância só assume valores não negativos e quanto maior o tanto maior será a dispersão.
14
Desvio padrão
Uma vez que a variância é expressa em unidades ao quadrado o que torna difícil a sua interpretação,
recorre-se ao desvio padrão que é definido como sendo a raiz quadrara positiva da variância.
Usando a notação adoptada para uma variância de amostra e uma variância da população, usa-se s
para o desvio padrão da amostra e σ para o desvio padrão da população.
Coeficiente de dispersão
Notado por CD, mede o grau de concentração de valores em torno da média. É dado por:
s
CD
x
Coeficiente de Variação
Também conhecido como coeficiente de variação de Pearson. É uma medida relativa de dispersão
que mede o grau de concentração de valores em torno da média, em valor percentual.
s
C.V 100
x
1) Numa Empresa, o salário médio dos homens é de 4.000 MZM, com desvio-padrão de 1.500
MZM, e o das mulheres é em média de 3.000 MZM com desvio – padrão de 1.200 MZM. Então:
Solução:
1500
Para os homens: C.V 100 37.5%
4000
15
3000
Para as mulheres: C.V 100 40%
1200
Logo podemos concluir que os salários das mulheres apresentam maior dispersão relativa que os
dos homens.
16
3.8. Caixa de bigodes
17
Exercícios
1. 100 famílias do país A e 150 do país B foram classificadas segundo o número de filhos,
tendo-se obtido os seguintes valores:
n. de filhos 0 1 2 3 4 5 6 7 8
n. de famílias do país A 11 13 20 25 14 10 4 2 1
n. de famílias do país B 20 32 31 30 10 10 9 8 0
Tipos de caixas A B C
Pressão média de ruptura (bária) 150 200 300
Desvio padrão das pressões (bária) 40 50 60
3. Com base numa amostra constituída por rendimentos anuais colectáveis, em unidades
monetárias (u.m), de 100 famílias residentes numa determinada cidade, obteve-se a seguinte
distribuição de frequências:
18
Rendimentos Colectáveis (u.m) Frequências Absolutas
[ 0 – 01500 [ 006
[ 1500 – 03000 [ 102
[ 3000 – 04500 [ 134
[ 4500 – 06000 [ 293
[ 6000 – 07500 [ 364
[ 7500 – 09000 [ 101
4. A tabela a seguir representa os tempos que 100 utentes de um serviço de urgência demoram
a ser atendidos:
Tempo (em min) 5a9 10 a 14 15 a 19 20 a 24 25 a 29 30 a 34 35 a 39
Frequências 1 10 37 36 13 2 1
19