Você está na página 1de 14

MEDIDAS DE POSIÇÃO

Expressam a característica dos dados observados tenderem a se agrupar em torno dos valores centrais,
indicado a posição da série em relação ao eixo dos valores assumidos pela variável ou característica em
estudo. Em síntese, podemos dizer que as MEDIDAS DE POSIÇÃO tentam traduzir a semelhança que os
dados estatísticos referentes à observação de um fenômeno apresentam entre si, conforme se pode notar
pela observação dos conjuntos abaixo.
Conjunto 1 4 4 4 10 16 16 16 ̅ =10
𝒙
Conjunto 2 4 5 8 10 12 14 16 ̅ = 9,86
𝒙
Conjunto 3 7 8 9 10 11 12 13 𝑥̅ =10
Conjunto 4 10 10 10 10 10 10 10 𝑥̅ =10

A julgar apenas pela MÉDIA, teríamos que concluir pela igualdade entre os três conjuntos 1, 3 e 4. Se
estendermos nossa análise, incluindo as medidas MEDIANA teríamos que concluir pela igualdade entre os
quatro conjuntos. Mas, como os conjuntos são pequenos, conseguimos observar que eles não são iguais.
Nesse caso, a média ainda que considerada como um número que pode representar uma sequência de
números, não pode destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que
compõem o conjunto. Desse modo, precisamos efetuar outros procedimentos matemáticos para
caracterizar melhor os dados de cada grupo com o objetivo de tirarmos conclusões qualitativas.
As medidas que mostram a variação dos dados de um conjunto são chamadas de MEDIDAS DE DISPERSÃO
OU VARIABILIDADE.
Para estudarmos as medidas de variabilidade para dados não tabelados usaremos um exemplo prático.
Supomos que uma empresa esteja querendo contratar um funcionário, e no final da concorrência sobraram
dois candidatos para uma única vaga. Então foi dado 4 tarefas para cada um, onde as mesmas tiveram
como registro o tempo (em minutos) de execução.

TAREFAS 1 2 3 4
OPERÁRIO A (TEMPO) 55 45 52 48
OPERÁRIO B (TEMPO) 30 70 40 60

ANÁLISE GRÁFICA

O que se constata, é que os fenômenos passíveis de análise pelo método estatístico, bem como os dados
estatísticos a eles referentes, caracterizam-se tanto pela sua semelhança quanto pela sua variabilidade.

MEDIDAS DE DISPERSÃO OU VARIABILIDADE

Vimos que a média a moda e a mediana podiam ser usadas para resumir, num único número, aquilo que é
“médio” ou “típico” de um conjunto de dados. Mas a informação contida fornecida pelas medidas de
posição necessita em geral ser complementada pelas medidas de dispersão. Estas servem para indicar o
quanto os dados se apresentam dispersos em torno da região central. Caracterizam, portanto, o grau de
variação existente no conjunto de valores. As medidas de dispersão que nos interessam são:

Curso de Licenciatura em Matemática – Probabilidade e Estatística Página 1


- a amplitude total;
- o desvio médio;
- a variância;
- o desvio-padrão;
- e o coeficiente de variação;
- Box Plot.
A dispersão mede quão próximos os valores estão uns dos outros no grupo.

(A) Pequena Dispersão (B) Grande Dispersão

A variabilidade de B é maior que a de A.


Para termos uma boa representação dos dados, temos que ter:
Uma medida de posição (quase sempre a Média) mais uma medida de dispersão (quase sempre o Desvio
Padrão).

AMPLITUDE TOTAL
Dados não Agrupados
A amplitude total é a diferença entre o maior e o menor valor observado:
AT = x(máx) – x(mín)

Exemplo: Para os valores: 40, 45, 48, 52, 54, 62 e 70


Temos: AT = 70 – 40 = 30

Quando dizemos que a amplitude total dos valores é 30, estamos afirmando alguma coisa do grau de sua
concentração. É evidente que, quanto maior a amplitude total, maior a dispersão ou variabilidade dos
valores da variável.

Dados Agrupados
 Sem intervalos de classe:
Neste caso, ainda temos: AT = x(máx) – x(mín)
Exemplo: Considerando a tabela abaixo:
xi 1 2 3 4 5
fi 3 10 1 11 6

Temos: AT = 5 – 1 = 4
 Com intervalos de classe:
Neste caso, a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da
primeira classe: AT = Lsup (máx) – linf (mín)
Exemplo: Considerando a distribuição abaixo:

ESTATURAS
i fi
(cm)
1 150 ι— 154 4
2 154 ι— 158 9
3 158 ι— 162 11
4 162 ι— 166 8
5 166 ι— 170 5
6 170 ι— 174 3
∑ = 40

Temos: AT = 174 -150 = 24

Curso de Licenciatura em Matemática – Probabilidade e Estatística Página 2


VARIÂNCIA E DESVIO PADRÃO
Duas medidas de variação que usam todas as entradas de dados são a variância e o desvio padrão.
Contudo, antes de aprender essas medidas de variação, você precisa saber qual é o significado do desvio
de uma entrada em um conjunto de dados.
Desvio de uma entrada x em um conjunto de dados de uma população é diferença entre a entrada e a
média  do conjunto de dados, ou seja, parâmetro que indica o grau de variação de um conjunto de
elementos.

Exemplo: Dada a temperatura máxima durante 3 dias em uma cidade A, obteve-se os seguintes valores:
28º, 29º e 30º, a média calculada é de: 29º.
Em outra cidade B, foram coletadas as temperaturas máximas de 22º, 29º e 35º, obtendo de média 29º.
Logo as médias das duas cidades tem o mesmo valor. Para podermos diferenciar uma média da outra, foi
criada a noção de desvio padrão, que serve para dizer o quanto os valores dos quais se extraiu a média são
próximos ou distantes da própria média.
Quanto menor o desvio padrão, mais homogênea é a minha amostra.

DESVIO MÉDIO (DM): É a média aritmética dos desvios.


Formulação matemática:

DESVIO MÉDIO (DADOS BRUTOS) DESVIO MÉDIO (DADOS TABELADOS POPULAÇÃO)


n
n
| x  x | . fi
| x i x|
Dm  i 1
i

Dm  i 1 n

n f
i 1
i

VARIÂNCIA (S2) OU (2)


A VARIÂNCIA é uma medida que tem pouca utilidade como estatística descritiva, porém é extremamente
importante na inferência estatística. A variância leva em consideração os valores extremos e os valores
intermediários, isto é, expressa melhor os resultados obtidos.
Quando a série de dados representa uma AMOSTRA, a VARIÂNCIA é denotada por s2, e quando provém de
uma POPULAÇÃO, a VARIÂNCIA é denotada por 2 ( = sigma minúsculo, caractere do alfabeto grego,
equivalente ao s minúsculo no alfabeto arábico). Observe que há uma diferença no método de cálculo das
duas VARIÂNCIAS: quando se trata de uma POPULAÇÃO, o denominador da equação de 2 representa a
quantidade total de elementos na população (N), enquanto no caso de uma AMOSTRA, o denominador da
equação de s2 é o total de elementos na amostra menos 1 (n-1).
Formulação matemática:
VARIÂNCIA (DADOS TABELADOS
VARIÂNCIA AMOSTRAL s2 VARIÂNCIA POPULACIONAL 2
POPULAÇÃO) 2
N
n

 | xi  x |2
N

| xi  x |2 | x i  x |2 . f i
σ2  i 1
s2  i 1
σ2  i 1 n
(n  1) N f
i 1
i

Em várias situações, torna-se necessário visualizar como os dados estão dispersos. Tomando como
exemplo várias empresas que apresentem salários médios iguais, podemos concluir, então, que a
contribuição social (% do salário) será a mesma? Somente com base no salário médio, sim, mas
Curso de Licenciatura em Matemática – Probabilidade e Estatística Página 3
estaríamos chegando a uma conclusão errada. A variação em termos de faixas salariais pode ser diferente,
apesar de apresentarem a mesma média.

DESVIO PADRÃO (S) OU ()


O desvio-padrão é a medida mais usada na comparação de diferenças entre grupos, por ser mais precisa e
estar na mesma medida do conjunto de dados. Ele determina a dispersão dos valores em relação a média.
Sua formulação é dada pela raiz quadrada da média aritmética dos quadrados dos desvios, ou seja:
n

 (x i  x) 2
(x1  x) 2  (x 2  x) 2    (x n  x) 2
S i 1
= , logo temos:
n 1 n 1
DESVIO PADRÃO DESVIO PADRÃO
AMOSTRAL (S) POPULACIONAL ()
s  2 s2 σ2 2
Importante!

Condição para se usar o desvio-padrão ou variância para comparar a variabilidade entre grupos:

 mesmo número de observações;


 mesma unidade;
 mesma média.

COEFICIENTE DE VARIAÇÃO (CV)


Podemos considerar uma situação na qual se avalia o custo indireto de fabricação (CIF) de um produto
em reais e o tempo gasto em uma máquina para fabricação deste produto em segundos.
x s
R$ 175,00 R$ 5,00
CIF
68 2
Tempo
segundos segundos
A princípio, você poderia concluir que o CIF apresenta maior variabilidade. Entretanto, as condições
citadas anteriormente deveriam ser satisfeitas para que pudesse utilizar o desvio padrão para comparar a
variabilidade. Como as condições não são satisfeitas, devemos tentar expressar a dispersão dos dados em
torno da média, em termos porcentuais. Então, utilizaremos uma medida estatística chamada de
coeficiente de variação.
O coeficiente de variação (cv) é definido como o quociente entre o desvio-padrão e a média. É expresso
em porcentagem.
A grande utilidade do COEFICIENTE DE VARIAÇÃO é permitir a comparação de variabilidade de diferentes
conjuntos de dados.
S
cv  x 100, logo temos:
x

Curso de Licenciatura em Matemática – Probabilidade e Estatística Página 4


s 
CVamostra  100 ou CV população  100
x x
Para a situação do CIF e Tempo, teremos:
s 5
CVCIF   100   100  2,85%
x 175
s 2
CVt   100   100  2,94%
x 68
Portanto, neste caso, o tempo de horas da máquina apresenta maior dispersão do que o custo indireto de
fabricação (CIF), mudando a conclusão anterior.
Podemos realizar interpretações do coeficiente de variação através de algumas regras empíricas:

Se: C.V < 15% tem-se baixa dispersão


Se: 15% < C.V. < 30% tem-se média dispersão
Se: C.V > 30% tem-se elevada dispersão

Podemos classificar as distribuições em homogêneas ou heterogêneas da seguinte forma:


Distribuição homogênea: tem coeficiente da variação com baixa ou média dispersão (até 30% de
variação)
Distribuição heterogênea: tem coeficiente da variação com elevada dispersão (acima de 30% de variação)

Exemplo 1: Para preencher uma única vaga existente em uma empresa, 50 candidatos foram submetidos
a 6 provas sobre conhecimentos específicos de interesse da empresa. Três destes candidatos destacaram-
se com as notas descritas na tabela abaixo:

PROVAS
CANDIDATOS
1º 2º 3º 4º 5º 6º
A 7,0 7,5 8,0 8,0 8,5 9,0
B 6,0 7,0 8,0 8,0 9,0 10,0
C 7,5 8,0 8,0 8,0 8,0 8,5
Fonte: Dados Hipotéticos

Exemplo 2:Uma empresa fabricante de lâmpadas deseja testar uma parte de sua produção. Selecionou 60
lâmpadas de 100W e deixou-as ligadas até que queimassem. O tempo de vida útil de cada uma delas está
registrado na tabela abaixo. O objetivo é construir a tabela de Distribuição de Freqüências completa.

Tabela: Tempo de Vida Útil de Lâmpadas de 100 W


684 693 819 836 868 893 911 924 1005 1052
796 721 907 888 905 922 938 1041 1080 773
859 832 1038 962 926 1016 1093 742 821 909
939 902 912 1096 786 760 1016 920 852 762
773 1004 1005 994 852 860 859 848 876 984
697 857 952 918 870 899 971 977 1014 954

SEPARATRIZES

Outras medidas que vamos estudar são as separatrizes, que englobam:


- a própria mediana;
- os quartis;
- os decis;
- os percentis.

Mediana: divide a série em duas partes iguais.

Curso de Licenciatura em Matemática – Probabilidade e Estatística Página 5


Quartis: denominamos quartis os valores de uma série que a dividem em quatro partes iguais.

Há, portanto, três quartis:


- O primeiro quartil (Q 1 ) : é o valor situado de tal modo na série que uma quarta parte (25%)
dos dados é menor que ele e as três quartas partes restantes (75%) são maiores.
- O segundo quartil (Q 2 ) : é exatamente o valor da mediana, ou seja, o valor situado de tal modo
na série que deixa metade (50%) dos dados a esquerda dele e a outra metade à direita (Q 2 =Md).
- O terceiro quartil (Q 3 ) : é o valor situado de tal modo na série que as três quartas partes (75%)
dos dados são menores que ele e uma quarta parte restante (25%) é maior.
-

FÓRMULA DO QUARTIL PARA DADOS BRUTOS


𝑛 𝑋𝑖(𝑛+1)
𝑄𝑖 = 𝑥𝑖 . 4 ou 𝑄𝑖 = 4
FÓRMULA DO QUARTIL PARA TABELA COM INTERVALO DE CLASSE

𝛴𝑓
(𝑖. 4 𝑖 − 𝐹𝑎𝑛𝑡)
𝑄𝑖 = 𝑙𝑖 + .ℎ
𝑓𝑖classe considerada
𝛴𝑓𝑖
= somatório das frequências dividido por quatro;
4
Li = limite inferior da classe do quartil considerado;
Fant = frequência acumulada da classe anterior à classe do quartil considerado;
h = amplitude do intervalo de classe do quartil considerado;
fi = frequência simples da classe do quartil considerado.

Os quartis são valores de um conjunto de dados ordenados, que os dividem em quatro partes iguais. É
necessário, portanto, três quartis (Q1, Q2 e Q3) para dividir um conjunto de dados ordenados em quatro
partes iguais.
Q1 : deixa 25% dos elementos abaixo dele.
Q2 : deixa 50% dos elementos abaixo dele e coincide com a mediana.
Q3 : deixa 75% dos elementos abaixo dele.

Curso de Licenciatura em Matemática – Probabilidade e Estatística Página 6


A figura abaixo mostra bem o quartis:

Resposta: 1º Resposta:
Mediana Quartil
Quartil
Extremo Extremo
25% 25% 25%
25%
50%

Faixa Central

Decis: os decis por sua vez, são os dez valores que dividem a série em 10 partes iguais, onde, cada uma
delas contém 10% dos dados.

FÓRMULA DO DECIL PARA DADOS BRUTOS


𝑛 𝑋𝑖(𝑛+1)
𝐷𝑖 = 𝑥𝑖 . 10 ou 𝐷𝑖 = 10
FÓRMULA DO DECIL PARA TABELA COM INTERVALO DE CLASSE
𝛴𝑓
(𝑖. 10𝑖 − 𝐹𝑎𝑛𝑡)
𝐷𝑖 = 𝑙𝑖 + .ℎ
𝑓𝑖classe considerada
𝛴𝑓𝑖
= somatório das frequências dividido por dez;
10
Li = limite inferior da classe do decil considerado;
Fant = frequência acumulada da classe anterior à classe do decil considerado;
h = amplitude do intervalo de classe do decil considerado;
fi = frequência simples da classe do decil considerado.

Percentis: denominamos percentis os noventa e nove valores que separam uma série em 100 partes
iguais, ou seja:
P1 , P2 , P3 ,, P99 , onde P 50 = Md = Q 2 , P 25 = Q 1 e P 75 = Q 3

Por exemplo, se desejamos dividir uma produção em 5 partes iguais: Ruim, Boa, Muito Boa, Ótima e
Excelente, devemos recorrer aos percentis P20 , P40 , P60 e P80.
Observe a figura abaixo:
Ruim Boa Muito Boa Ótima Excelente

P0
P20 P40 P60 P80 P100

Curso de Licenciatura em Matemática – Probabilidade e Estatística Página 7


Percebe-se que a produção Ruim envolverá valores de P0 a P20. A produção Boa envolverá valores
de P20 a P40. A produção Muito Boa envolverá valores de P40 a P60. A produção Ótima de P60 a P80 e a
produção Excelente de P80 a P100.
Uma produção será classificada como ótima se seu valor estiver compreendido entre P60 e P80 e será
considerada excelente toda produção cujo valor for acima de P80.

FÓRMULA DO PERCENTIL PARA DADOS BRUTOS


𝑛 𝑋𝑖.(𝑛+1)
𝑃𝑖 = 𝑥𝑖 . 100 ou 𝑃𝑖 = 100
FÓRMULA DO PERCENTIL PARA TABELA COM INTERVALO DE CLASSE
𝛴𝑓
(𝑖. 100𝑖 − 𝐹𝑎𝑛𝑡)
P𝑖 = 𝑙𝑖 + .ℎ
𝑓𝑖classe considerada
𝛴𝑓𝑖
= somatório das frequências dividido por cem;
100
Li = limite inferior da classe do percentil considerado;
Fant = frequência acumulada da classe anterior à classe do percentil considerado;
h = amplitude do intervalo de classe do percentil considerado;
fi = frequência simples da classe do percentil considerado.

Sintetizando o modo de encontrar as medidas de posição de acordo com a forma de apresentação dos
dados, vemos que as medidas descritas abaixo devem ser obtidas:
Quando os Média Moda Mediana Quartis, Decis e Percentis
dados se
apresentarem
em:
Rol n Pela observação dos Pela observação dos dados Pela observação dos dados
x i dados
x i 1

n
Agrupamento n Pela observação dos Pela observação dos dados Pela observação dos dados
Simples x .f i i dados
x i 1

f i

Ramo e Folhas n Pela observação dos Pela observação dos dados Pela observação dos dados
x f i i dados
x i 1
n
Agrupamento n Fórmula Fórmula Fórmula
Em Classes x .f i i
Mo = 𝑙𝑖 +
∆1
.ℎ
𝛴𝑓
( 𝑖 − 𝐹𝑎𝑛𝑡)
2
𝛴𝑓
(𝑖. 𝑖 − 𝐹𝑎𝑛𝑡)
4
x i 1 ∆1 + ∆2 Md = 𝑙𝑖 + .ℎ 𝑄𝑖 = 𝑙𝑖 + .ℎ
f i
𝑓𝑚𝑑 𝑓𝑖classe considerada

𝛴𝑓𝑖
(𝑖. − 𝐹𝑎𝑛𝑡)
10
𝐷𝑖 = 𝑙𝑖 + .ℎ
𝑓𝑖classe considerada

𝛴𝑓𝑖
(𝑖. − 𝐹𝑎𝑛𝑡)
100
𝑃𝑖 = 𝑙𝑖 + .ℎ
𝑓𝑖classe considerada

Curso de Licenciatura em Matemática – Probabilidade e Estatística Página 8


A AMPLITUDE INTERQUARTIL
A amplitude interquartil (também chamada de dispersão média) corresponde à diferença entre o terceiros
quartil e o primeiro quartil em um conjunto de dados.
Amplitude Interquartil = Q3 – Q1
A amplitude interquartil mede a dispersão nos dados que estão entre as 50% das observações centrais.
Não é influenciada por valores extremos.
Exemplo: Dada uma amostra com os 10 intervalos de tempo necessários para se aprontar na parte da
manhã, você pode calcular a amplitude interquartil.
29 – 33 – 35 – 39 – 39 – 40 – 44 – 44 – 52
Ordenados os dados calculamos, temos Q1 = 35 e Q3 = 44.
Amplitude Interquartil = 44 – 35= 9 minutos
Logo a amplitude interquartil para o tempo necessário para se aprontar corresponde a 9 minutos. A
amplitude desde 35 até 44 é geralmente conhecida como os Cinquenta do Meio.

O RESUMO DOS CINCO NÚMEROS de um conjunto de dados consiste na menor observação, no primeiro
quartil, na mediana, no terceiro quartil e na maior observação, escritos do menor para o maior. Sendo
representado como:
Min. Q1 Md Q3 Max.

Embora as três medidas Q1, MEDIANA e Q3 mostrem a forma da distribuição de 50% dos valores ao
redor da mediana, a adição dos valores MÍNIMO e MÁXIMO a estas três medidas permite obter um
conjunto mais completo de informações sobre a forma da distribuição. O BOX PLOT é a forma gráfica de
representar estas cinco medidas estatísticas num único conjunto de resultados.
Para ilustrar considere os dados da tabela abaixo, retirada de Hines et al (2006), que representam leituras
de viscosidade em três misturas diferentes de uma matéria-prima usada em uma linha de produção. Um
dos objetivos do estudo que Hines et al discutem é comparar as três misturas.
Mistura 1 Mistura 2 Mistura 3
22,02 21,49 20,33
23,5 22,56 20,49
23,83 22,67 21,67
25,38 22,78 21,95
25,49 24,18 22,28
25,9 24,46 22,45
26,67 24,62 27,00

Apresentamos os box-plot para os dados da viscosidade. Essa apresentação permite uma interpretação
fácil dos dados. A mistura 1 tem viscosidade mais alta do que a mistura 2, e esta tem viscosidade mais
alta que a mistura 3. A distribuição da viscosidade não é simétrica, porque as linhas superior e inferior e

Curso de Licenciatura em Matemática – Probabilidade e Estatística Página 9


os comprimentos das caixas superior e inferior em torno da linha mediana não são iguais. O valor da
viscosidade máxima da mistura 3 parece alta, em comparação com os demais valores da mistura 3 e,
também, é maior que os valores das demais misturas 1 e 2. Essa observação é um outlier, e ela exige
exame e análise mais aprofundados.

Na verdade, o gráfico BOX PLOT nos fornece informações sobre a posição central, dispersão e assimetria
da respectiva distribuição de frequências dos dados.

CURVAS DE DENSIDADE E O BOX PLOT.

Distribuição em forma de Sino. Distribuição assimétrica à Esquerda. Distribuição assimétrica à Direita.

Se estivermos diante de uma situação na qual essas três medidas apresentam o mesmo valor, tal fato nos
informa que a distribuição dos dados é simétrica; quando resultam em valores diferentes, porém muito
próximos, indica que a forma dessa distribuição é aproximadamente simétrica. Nesses casos,
optaremos por qualquer uma das três: média, moda ou mediana.

Grafico Box Plot


Exemplo: Construa o gráfico das notas que representam as notas dos 40 alunos de uma sala da aula.
60 40 50 80 100 90 0 10 40 80
70 70 70 50 40 80 70 90 80 50
40 60 60 50 10 50 100 30 80 80
90 80 70 100 60 70 100 20 80 90

ESCORES Z
Um valor extremo, ou outlier é um valor localizado bem distante da média aritmética. O escore Z, que
corresponde à diferença entre o valor e a média aritmética dividida pelo desvio-padrão, é útil na
identificação de valores extremos. Quanto maior o escore Z, maior a distância desde o valor até a média
aritmética.
̅ − 𝝁)
(𝒙
𝒁=
𝒔
̅ = MÉDIA AMOSTRAL;
𝒙

Curso de Licenciatura em Matemática – Probabilidade e Estatística Página 10


µ = MÉDIA POPULACIONAL;
S = DESVIO-PADRÃO AMOSTRAL.

Figura: Áreas sob a curva Normal

Interpretação do desvio padrão

Neste item vamos apresentar duas regras para interpretação do desvio padrão:

Regra Empírica
Para qualquer distribuição amostral com média x e desvio padrão S, tem-se:
 
 O intervalo x  S , x  S contém entre 60% e 80% de todas as observações amostrais. A
porcentagem aproxima-se de 70% para distribuições fortemente simétricas, chegando a 90% para
distribuições fortemente assimétricas.
 
 O intervalo x  2S , x  2S contém aproximadamente 95% das observações amostrais para
distribuições simétricas e aproximadamente 100% para distribuições com assimetria elevada.
 
 O intervalo x  3S , x  3S contém aproximadamente 100% das observações amostrais, para
distribuições simétricas.

Exemplo1: Para analisar minuciosamente a amostra com os 10 intervalos de tempo para se aprontar, você
pode calcular os escores Z. Uma vez que a média aritmética corresponde a 39,6 minutos, o desvio-padrão
é de 6,77 minutos, e o tempo para se aprontar nos dez dias respectivamente são: 39, 29, 43, 52, 39, 44, 40,
31, 44 e 35 calcule o escore Z para todos os dias. Qual o escore Z mais alto e o mais baixo? Ouve valor
extremo?

Uma distribuição pode ser Simétrica, onde os valores abaixo da média aritmética estão distribuídos
exatamente do mesmo modo que os valores acima da média aritmética, neste caso os valores baixos e os
valores altos se contrabalançam, já, uma distribuição Assimétrica os valores não são simétricos em torno
da média, essa assimetria resulta em um desequilíbrio dos valores baixos ou dos valores altos.
 Média < mediana = negativa, ou assimétrica à esquerda;
 Média = mediana = simétrica, ou zero de assimetria;
 Média > mediana = positiva, ou assimétrica à direita.

ESCORES Z
O que é o Score Z? É o quanto uma medida se afasta da média em termos de Desvios Padrão. Quando o
escore Z é positivo isto indica que o dado está acima da média e quando o mesmo é negativo significa que
o dado está abaixo da média. Seus valores oscilam entre -3 < Z < +3 e isto correspondem a 99,72% da
área sob a curva da Distribuição Normal.

Curso de Licenciatura em Matemática – Probabilidade e Estatística Página 11


Score Z entre -3 DP até +3DP

Exemplo 2: Suponha que os pesos das pessoas adultas que pertencem a determinada população seguem
uma curva Normal com média µ = 70Kg e desvio padrão σ = 10kg. Portanto, µ -2 σ = 70 – 2*10 = 50 e
µ + 2 σ = 70 + 2*10 = 90. Então podemos afirmar que:
 Cerca de 95% dessas pessoas pesam entre 50 kg e 90 kg.
 Cerca de 2,5% dessas pessoas pesam menos de 50 kg.
 Cerca de 2,5% dessas pessoas pesam mais de 90 kg.

Exemplo 3: Calcule a porcentagem de melancias com peso de 4 kg a 7 kg, sabendo que a média do peso
das melancias é de 5 kg e o desvio-padrão é 1,5 kg.

Exercícios Gerais de Medidas de Posição e Dispersão.


1-) Consideremos 4 conjuntos funcionários com a seguinte produção diária:
A 6 6 6 6 6
B 6 7 10 5 8
C 7 10 6 10 9
D 8 6 2 6 8
Para demitir um funcionário, determine qual apresenta maior dispersão. Se você calcular para uma população e
comparar para uma amostra o resultado muda?
2- ) Vinte alunos foram submetidos a um teste de aproveitamento cujos resultados formam os que seguem:
26 28 24 13 18
18 25 18 25 24
20 21 15 28 17
27 22 13 19 28
Pede-se agrupar tais resultados em uma distribuição de frequências para dados tabelados com intervalo de classe,
determine a assimetria e a curtose, classificando-a. Utilize log(20) = 1,40
3-) Na empresa BitCompany Ltda, foi observada a distribuição de funcionário do setor de serviços gerais com
relação ao salário semanal, conforme mostra a distribuição de frequências:
Salário semanal ($) 25|--30 30|--35 35|--40 40|--45 45|--50 50|--55
Nº de funcionários 10 20 30 15 40 35
Pede-se: ( 𝑥̅ = $ 42,83,  =$ 7,97, md = $ 49,16, cv = $ 18,61%, as = -0,79)
a) o salário médio semanal dos funcionários; b) o desvio padrão, coeficiente de variação e a assimetria;
c) se o empresário divide os funcionários em três categorias, com relação ao salário, de sorte que:
- os 25% menos produtivos seja da categoria A; ( $ 36,25, $ 45, $ 49,68)
- os 25% seguintes seja da categoria B;
- os 25% seguintes, isto é, os mais produtivos, sejam da categoria C.
Pede-se determinar os limites dos salários das categorias A, B e C.

Curso de Licenciatura em Matemática – Probabilidade e Estatística Página 12


4-) A média das idades dos 50 funcionários de uma empresa é 48 anos. Aposentou-se o funcionário mais velho,
com 65 anos, e o seu lugar foi ocupado por um jovem com 24 anos que passou a ser o funcionário mais novo da
empresa. A idade média dos funcionários da empresa passou a ser de? (47,18 anos)
5-) Cinco moedas foram lançadas, e em cada lance foi anotado o número de caras. Os números de lances nos quais
foram obtidas 0, 1, 2, 3, 4, e 5 caras que estão indicados na tabela abaixo.
Nº de Caras 0 1 2 3 4 5
Nº de lances 10 12 15 16 16 6
Pede-se:
a) Construir uma tabela que apresente as percentagens dos lances e indique a do terceiro valor.
b) Qual o número mais escolhido? O que ele representa?
c) Calcule a média, moda e mediana.
6-) A prefeitura de uma cidade quer regularizar uma situação referente ao número de documentos falsificados que
aparecem em um determinado setor e o valor arrecadado por hora de um tipo de multa em reais. Em qual das duas
variáveis ocorre maior variabilidade, ou variação?
Documentos Falsificados (nº) Multa (Reais)
Média 22 800
Desvio padrão 5 100
Tabela com valores da média e desvio-padrão das variáveis estudadas.
Com base nas informações acima, conclui-se:
( ) A multa apresenta maior variabilidade, já que tem maior desvio padrão.
( ) O número de documentos falsificados apresentou maior dispersão do que a multa.
( ) Como as médias são diferentes, não temos como fazer uma comparação.
( ) O número de documentos falsificados, apresenta variabilidade relativa similar à multa.
7- A produção diária de parafusos da Indústria Aço & Ferro Ltda é de 20 lotes, contendo cada um 100.000
unidades. Ao escolher uma amostra de oito lotes, o controle de qualidade verificou o número seguinte de parafusos
com defeitos em cada lote:
Amostra 01 02 03 04 05 06 07 08
Defeito 300 550 480 980 1050 350 450 870
Pede-se projetar o número de parafusos com defeito em um dia de trabalho. (12.575 parafusos defeituosos/dia)

8- Considerando a distribuição de frequências relativas aos pesos de 150 caixas num deposito, calcule:
a). A média aritmética;(55,47) b) O desvio padrão; (10,15)
c). A mediana;(56) d) Os quartis Q1 e Q3;(48,5 e 63,44)
e). Os percentis P10 e P90;(68,44 e 41) f) O coeficiente de assimetria; (0,157)
g). O coeficiente percentílico de curtose. (0,272)

Pesos caixas (kg) 30|--40 40|--50 50|--60 60|--70 70|--80


frequência 12 30 55 45 8

Exercícios - Separatrizes
1- Visando melhorar a produção de seu departamento de manufatura, a indústria de peças Microtauro
S.A. resolveu implantar um programa de treinamento e incentivo para os operários da produção. Assim
sendo, com base no desempenho desses operários, classificou-os em ordem crescente de desempenho e
distribuiu-os nas categorias a seguir.
Categoria 1: menor desempenho - os 25% do total de operários que obtiveram o menor desempenho no
grupo.
Categoria 2: desempenho regular - os 25% do total de operários com desempenho imediatamente
superior ao da categoria 1.
Categoria 3: desempenho bom - os 25% do total de operários com desempenho imediatamente superior
ao da categoria 2.
Categoria 4: desempenho elevado - os 25% do total de operários que obtiveram o maior desempenho no
grupo.
A partir dessa classificação, a empresa pretende dar um treinamento especial para os operários incluídos
na categoria 1 e premiar os operários incluídos na categoria 4. Sabendo que os dados da pesquisa foram
Curso de Licenciatura em Matemática – Probabilidade e Estatística Página 13
apresentados conforme a tabela de frequência abaixo, calcular os intervalos da escala de desempenho que
determinarão os operários que deverão ser submetidos a treinamento e os operários habilitados a receber o
prêmio.
k Escala de medida Número de fa
de desempenho operários (fi)
1 0 |-- 10 16
2 10 |-- 20 27
3 20 |-- 30 35
4 30 |-- 40 42
5 40 |-- 50 24
TOTAL

2- Os avestruzes são de origem egípcia, podem atingir 2,8 m de altura e pesar acima de 150 kg, alguns
vivem até os 70 anos. A criação de avestruzes iniciou-se no Brasil a partir dos anos de 95/96. Um grupo
de biólogos está interessado em estudar a adaptação dessas aves em nosso país; para tanto, selecionou
uma amostra de 500 avestruzes adultos, com 20 anos de vida. Pretende-se classificá-los de acordo com o
peso do seguinte modo: 20 % dos mais leves como pequenos, os 40 % seguintes como médios, os 30 %
seguintes como grandes e os 10 % mais pesados como extras. Levando em conta a distribuição dos pesos
coletados registrados na Tabela abaixo, quais os limites de peso para cada classificação? (sugestão calcule
os percentis).
k Peso (kg) Número de avestruzes (fi) fa
1 50 |-- 75 17
2 75 |-- 100 108
3 100 |-- 125 168
4 125 |-- 150 153
5 150 |-- 175 54
TOTAL

3- Os habitantes de Paraisópolis reclamaram do mau cheiro do ar na cidade, proveniente do rio que corta
a cidade. Observou-se que uma indústria sucroalcooleira lançava seus resíduos industriais nesse rio,
causando a morte de espécies aeróbicas da fauna por asfixia (eutrofização). Para fins de monitoramento
da qualidade da água do rio, o órgão ambiental passou a colher amostras de água e a avaliar a qualidade
da mesma diariamente. As amostras em questão continham um litro de água e foram utilizadas para
determinação do percentual de 6cido sulfídrico (H2S) por litro, abaixo temos a tabela da distribuição.
Teor de H2S (%) 1|--- 3 3|---5 5|---7 7|---9 9|---11
Número de amostra (fi) 8 19 15 10 8

a) Qual é o percentual de amostras cujo teor de H2S é superior a 7%?


b) Qual é o teor médio de H2S contido no conjunto das amostras?
c) Qual é o teor mediano de H2S contido no conjunto das amostras?
d) Qual é o intervalo de teores de H2S que corresponde a 25% das amostras com os menores teores de
H2S?
e) Qual é o intervalo de teores de H2S que corresponde a 70% das amostras com os menores teores de
H2S?
f) Qual é o intervalo de teores de H2S que corresponde a 25% das amostras com os maiores teores de H2S?

Respostas
1. Os operários com desempenho inferior a 17,47 deverão receber treinamento e os operários com
desempenho superior a 37,74 estarão habilitados a receber o prémio.
2. Pequenos: entre 5O e 94,27 kg; médios: entre 94,21 e 126,74 kg; grandes: entre 126,14 e 151,85 kg;
extras: entre 151,85 e 175 kg.
3. a) 30%; b) 5,7 % de teor de H2S; c) 5,4 % de teor de H2S; d) entre 1 e 3,74% de teor de H2S; e) entre 1
e 7% de teor de H2S; f) entre 7,6 e 11 de teor de H2S.

Curso de Licenciatura em Matemática – Probabilidade e Estatística Página 14

Você também pode gostar