Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
Expressam a característica dos dados observados tenderem a se agrupar em torno dos valores centrais,
indicado a posição da série em relação ao eixo dos valores assumidos pela variável ou característica em
estudo. Em síntese, podemos dizer que as MEDIDAS DE POSIÇÃO tentam traduzir a semelhança que os
dados estatísticos referentes à observação de um fenômeno apresentam entre si, conforme se pode notar
pela observação dos conjuntos abaixo.
Conjunto 1 4 4 4 10 16 16 16 ̅ =10
𝒙
Conjunto 2 4 5 8 10 12 14 16 ̅ = 9,86
𝒙
Conjunto 3 7 8 9 10 11 12 13 𝑥̅ =10
Conjunto 4 10 10 10 10 10 10 10 𝑥̅ =10
A julgar apenas pela MÉDIA, teríamos que concluir pela igualdade entre os três conjuntos 1, 3 e 4. Se
estendermos nossa análise, incluindo as medidas MEDIANA teríamos que concluir pela igualdade entre os
quatro conjuntos. Mas, como os conjuntos são pequenos, conseguimos observar que eles não são iguais.
Nesse caso, a média ainda que considerada como um número que pode representar uma sequência de
números, não pode destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que
compõem o conjunto. Desse modo, precisamos efetuar outros procedimentos matemáticos para
caracterizar melhor os dados de cada grupo com o objetivo de tirarmos conclusões qualitativas.
As medidas que mostram a variação dos dados de um conjunto são chamadas de MEDIDAS DE DISPERSÃO
OU VARIABILIDADE.
Para estudarmos as medidas de variabilidade para dados não tabelados usaremos um exemplo prático.
Supomos que uma empresa esteja querendo contratar um funcionário, e no final da concorrência sobraram
dois candidatos para uma única vaga. Então foi dado 4 tarefas para cada um, onde as mesmas tiveram
como registro o tempo (em minutos) de execução.
TAREFAS 1 2 3 4
OPERÁRIO A (TEMPO) 55 45 52 48
OPERÁRIO B (TEMPO) 30 70 40 60
ANÁLISE GRÁFICA
O que se constata, é que os fenômenos passíveis de análise pelo método estatístico, bem como os dados
estatísticos a eles referentes, caracterizam-se tanto pela sua semelhança quanto pela sua variabilidade.
Vimos que a média a moda e a mediana podiam ser usadas para resumir, num único número, aquilo que é
“médio” ou “típico” de um conjunto de dados. Mas a informação contida fornecida pelas medidas de
posição necessita em geral ser complementada pelas medidas de dispersão. Estas servem para indicar o
quanto os dados se apresentam dispersos em torno da região central. Caracterizam, portanto, o grau de
variação existente no conjunto de valores. As medidas de dispersão que nos interessam são:
AMPLITUDE TOTAL
Dados não Agrupados
A amplitude total é a diferença entre o maior e o menor valor observado:
AT = x(máx) – x(mín)
Quando dizemos que a amplitude total dos valores é 30, estamos afirmando alguma coisa do grau de sua
concentração. É evidente que, quanto maior a amplitude total, maior a dispersão ou variabilidade dos
valores da variável.
Dados Agrupados
Sem intervalos de classe:
Neste caso, ainda temos: AT = x(máx) – x(mín)
Exemplo: Considerando a tabela abaixo:
xi 1 2 3 4 5
fi 3 10 1 11 6
Temos: AT = 5 – 1 = 4
Com intervalos de classe:
Neste caso, a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da
primeira classe: AT = Lsup (máx) – linf (mín)
Exemplo: Considerando a distribuição abaixo:
ESTATURAS
i fi
(cm)
1 150 ι— 154 4
2 154 ι— 158 9
3 158 ι— 162 11
4 162 ι— 166 8
5 166 ι— 170 5
6 170 ι— 174 3
∑ = 40
Exemplo: Dada a temperatura máxima durante 3 dias em uma cidade A, obteve-se os seguintes valores:
28º, 29º e 30º, a média calculada é de: 29º.
Em outra cidade B, foram coletadas as temperaturas máximas de 22º, 29º e 35º, obtendo de média 29º.
Logo as médias das duas cidades tem o mesmo valor. Para podermos diferenciar uma média da outra, foi
criada a noção de desvio padrão, que serve para dizer o quanto os valores dos quais se extraiu a média são
próximos ou distantes da própria média.
Quanto menor o desvio padrão, mais homogênea é a minha amostra.
Dm i 1 n
n f
i 1
i
| xi x |2
N
| xi x |2 | x i x |2 . f i
σ2 i 1
s2 i 1
σ2 i 1 n
(n 1) N f
i 1
i
Em várias situações, torna-se necessário visualizar como os dados estão dispersos. Tomando como
exemplo várias empresas que apresentem salários médios iguais, podemos concluir, então, que a
contribuição social (% do salário) será a mesma? Somente com base no salário médio, sim, mas
Curso de Licenciatura em Matemática – Probabilidade e Estatística Página 3
estaríamos chegando a uma conclusão errada. A variação em termos de faixas salariais pode ser diferente,
apesar de apresentarem a mesma média.
(x i x) 2
(x1 x) 2 (x 2 x) 2 (x n x) 2
S i 1
= , logo temos:
n 1 n 1
DESVIO PADRÃO DESVIO PADRÃO
AMOSTRAL (S) POPULACIONAL ()
s 2 s2 σ2 2
Importante!
Condição para se usar o desvio-padrão ou variância para comparar a variabilidade entre grupos:
Exemplo 1: Para preencher uma única vaga existente em uma empresa, 50 candidatos foram submetidos
a 6 provas sobre conhecimentos específicos de interesse da empresa. Três destes candidatos destacaram-
se com as notas descritas na tabela abaixo:
PROVAS
CANDIDATOS
1º 2º 3º 4º 5º 6º
A 7,0 7,5 8,0 8,0 8,5 9,0
B 6,0 7,0 8,0 8,0 9,0 10,0
C 7,5 8,0 8,0 8,0 8,0 8,5
Fonte: Dados Hipotéticos
Exemplo 2:Uma empresa fabricante de lâmpadas deseja testar uma parte de sua produção. Selecionou 60
lâmpadas de 100W e deixou-as ligadas até que queimassem. O tempo de vida útil de cada uma delas está
registrado na tabela abaixo. O objetivo é construir a tabela de Distribuição de Freqüências completa.
SEPARATRIZES
𝛴𝑓
(𝑖. 4 𝑖 − 𝐹𝑎𝑛𝑡)
𝑄𝑖 = 𝑙𝑖 + .ℎ
𝑓𝑖classe considerada
𝛴𝑓𝑖
= somatório das frequências dividido por quatro;
4
Li = limite inferior da classe do quartil considerado;
Fant = frequência acumulada da classe anterior à classe do quartil considerado;
h = amplitude do intervalo de classe do quartil considerado;
fi = frequência simples da classe do quartil considerado.
Os quartis são valores de um conjunto de dados ordenados, que os dividem em quatro partes iguais. É
necessário, portanto, três quartis (Q1, Q2 e Q3) para dividir um conjunto de dados ordenados em quatro
partes iguais.
Q1 : deixa 25% dos elementos abaixo dele.
Q2 : deixa 50% dos elementos abaixo dele e coincide com a mediana.
Q3 : deixa 75% dos elementos abaixo dele.
Faixa Central
Decis: os decis por sua vez, são os dez valores que dividem a série em 10 partes iguais, onde, cada uma
delas contém 10% dos dados.
Percentis: denominamos percentis os noventa e nove valores que separam uma série em 100 partes
iguais, ou seja:
P1 , P2 , P3 ,, P99 , onde P 50 = Md = Q 2 , P 25 = Q 1 e P 75 = Q 3
Por exemplo, se desejamos dividir uma produção em 5 partes iguais: Ruim, Boa, Muito Boa, Ótima e
Excelente, devemos recorrer aos percentis P20 , P40 , P60 e P80.
Observe a figura abaixo:
Ruim Boa Muito Boa Ótima Excelente
P0
P20 P40 P60 P80 P100
Sintetizando o modo de encontrar as medidas de posição de acordo com a forma de apresentação dos
dados, vemos que as medidas descritas abaixo devem ser obtidas:
Quando os Média Moda Mediana Quartis, Decis e Percentis
dados se
apresentarem
em:
Rol n Pela observação dos Pela observação dos dados Pela observação dos dados
x i dados
x i 1
n
Agrupamento n Pela observação dos Pela observação dos dados Pela observação dos dados
Simples x .f i i dados
x i 1
f i
Ramo e Folhas n Pela observação dos Pela observação dos dados Pela observação dos dados
x f i i dados
x i 1
n
Agrupamento n Fórmula Fórmula Fórmula
Em Classes x .f i i
Mo = 𝑙𝑖 +
∆1
.ℎ
𝛴𝑓
( 𝑖 − 𝐹𝑎𝑛𝑡)
2
𝛴𝑓
(𝑖. 𝑖 − 𝐹𝑎𝑛𝑡)
4
x i 1 ∆1 + ∆2 Md = 𝑙𝑖 + .ℎ 𝑄𝑖 = 𝑙𝑖 + .ℎ
f i
𝑓𝑚𝑑 𝑓𝑖classe considerada
𝛴𝑓𝑖
(𝑖. − 𝐹𝑎𝑛𝑡)
10
𝐷𝑖 = 𝑙𝑖 + .ℎ
𝑓𝑖classe considerada
𝛴𝑓𝑖
(𝑖. − 𝐹𝑎𝑛𝑡)
100
𝑃𝑖 = 𝑙𝑖 + .ℎ
𝑓𝑖classe considerada
O RESUMO DOS CINCO NÚMEROS de um conjunto de dados consiste na menor observação, no primeiro
quartil, na mediana, no terceiro quartil e na maior observação, escritos do menor para o maior. Sendo
representado como:
Min. Q1 Md Q3 Max.
Embora as três medidas Q1, MEDIANA e Q3 mostrem a forma da distribuição de 50% dos valores ao
redor da mediana, a adição dos valores MÍNIMO e MÁXIMO a estas três medidas permite obter um
conjunto mais completo de informações sobre a forma da distribuição. O BOX PLOT é a forma gráfica de
representar estas cinco medidas estatísticas num único conjunto de resultados.
Para ilustrar considere os dados da tabela abaixo, retirada de Hines et al (2006), que representam leituras
de viscosidade em três misturas diferentes de uma matéria-prima usada em uma linha de produção. Um
dos objetivos do estudo que Hines et al discutem é comparar as três misturas.
Mistura 1 Mistura 2 Mistura 3
22,02 21,49 20,33
23,5 22,56 20,49
23,83 22,67 21,67
25,38 22,78 21,95
25,49 24,18 22,28
25,9 24,46 22,45
26,67 24,62 27,00
Apresentamos os box-plot para os dados da viscosidade. Essa apresentação permite uma interpretação
fácil dos dados. A mistura 1 tem viscosidade mais alta do que a mistura 2, e esta tem viscosidade mais
alta que a mistura 3. A distribuição da viscosidade não é simétrica, porque as linhas superior e inferior e
Na verdade, o gráfico BOX PLOT nos fornece informações sobre a posição central, dispersão e assimetria
da respectiva distribuição de frequências dos dados.
Se estivermos diante de uma situação na qual essas três medidas apresentam o mesmo valor, tal fato nos
informa que a distribuição dos dados é simétrica; quando resultam em valores diferentes, porém muito
próximos, indica que a forma dessa distribuição é aproximadamente simétrica. Nesses casos,
optaremos por qualquer uma das três: média, moda ou mediana.
ESCORES Z
Um valor extremo, ou outlier é um valor localizado bem distante da média aritmética. O escore Z, que
corresponde à diferença entre o valor e a média aritmética dividida pelo desvio-padrão, é útil na
identificação de valores extremos. Quanto maior o escore Z, maior a distância desde o valor até a média
aritmética.
̅ − 𝝁)
(𝒙
𝒁=
𝒔
̅ = MÉDIA AMOSTRAL;
𝒙
Neste item vamos apresentar duas regras para interpretação do desvio padrão:
Regra Empírica
Para qualquer distribuição amostral com média x e desvio padrão S, tem-se:
O intervalo x S , x S contém entre 60% e 80% de todas as observações amostrais. A
porcentagem aproxima-se de 70% para distribuições fortemente simétricas, chegando a 90% para
distribuições fortemente assimétricas.
O intervalo x 2S , x 2S contém aproximadamente 95% das observações amostrais para
distribuições simétricas e aproximadamente 100% para distribuições com assimetria elevada.
O intervalo x 3S , x 3S contém aproximadamente 100% das observações amostrais, para
distribuições simétricas.
Exemplo1: Para analisar minuciosamente a amostra com os 10 intervalos de tempo para se aprontar, você
pode calcular os escores Z. Uma vez que a média aritmética corresponde a 39,6 minutos, o desvio-padrão
é de 6,77 minutos, e o tempo para se aprontar nos dez dias respectivamente são: 39, 29, 43, 52, 39, 44, 40,
31, 44 e 35 calcule o escore Z para todos os dias. Qual o escore Z mais alto e o mais baixo? Ouve valor
extremo?
Uma distribuição pode ser Simétrica, onde os valores abaixo da média aritmética estão distribuídos
exatamente do mesmo modo que os valores acima da média aritmética, neste caso os valores baixos e os
valores altos se contrabalançam, já, uma distribuição Assimétrica os valores não são simétricos em torno
da média, essa assimetria resulta em um desequilíbrio dos valores baixos ou dos valores altos.
Média < mediana = negativa, ou assimétrica à esquerda;
Média = mediana = simétrica, ou zero de assimetria;
Média > mediana = positiva, ou assimétrica à direita.
ESCORES Z
O que é o Score Z? É o quanto uma medida se afasta da média em termos de Desvios Padrão. Quando o
escore Z é positivo isto indica que o dado está acima da média e quando o mesmo é negativo significa que
o dado está abaixo da média. Seus valores oscilam entre -3 < Z < +3 e isto correspondem a 99,72% da
área sob a curva da Distribuição Normal.
Exemplo 2: Suponha que os pesos das pessoas adultas que pertencem a determinada população seguem
uma curva Normal com média µ = 70Kg e desvio padrão σ = 10kg. Portanto, µ -2 σ = 70 – 2*10 = 50 e
µ + 2 σ = 70 + 2*10 = 90. Então podemos afirmar que:
Cerca de 95% dessas pessoas pesam entre 50 kg e 90 kg.
Cerca de 2,5% dessas pessoas pesam menos de 50 kg.
Cerca de 2,5% dessas pessoas pesam mais de 90 kg.
Exemplo 3: Calcule a porcentagem de melancias com peso de 4 kg a 7 kg, sabendo que a média do peso
das melancias é de 5 kg e o desvio-padrão é 1,5 kg.
8- Considerando a distribuição de frequências relativas aos pesos de 150 caixas num deposito, calcule:
a). A média aritmética;(55,47) b) O desvio padrão; (10,15)
c). A mediana;(56) d) Os quartis Q1 e Q3;(48,5 e 63,44)
e). Os percentis P10 e P90;(68,44 e 41) f) O coeficiente de assimetria; (0,157)
g). O coeficiente percentílico de curtose. (0,272)
Exercícios - Separatrizes
1- Visando melhorar a produção de seu departamento de manufatura, a indústria de peças Microtauro
S.A. resolveu implantar um programa de treinamento e incentivo para os operários da produção. Assim
sendo, com base no desempenho desses operários, classificou-os em ordem crescente de desempenho e
distribuiu-os nas categorias a seguir.
Categoria 1: menor desempenho - os 25% do total de operários que obtiveram o menor desempenho no
grupo.
Categoria 2: desempenho regular - os 25% do total de operários com desempenho imediatamente
superior ao da categoria 1.
Categoria 3: desempenho bom - os 25% do total de operários com desempenho imediatamente superior
ao da categoria 2.
Categoria 4: desempenho elevado - os 25% do total de operários que obtiveram o maior desempenho no
grupo.
A partir dessa classificação, a empresa pretende dar um treinamento especial para os operários incluídos
na categoria 1 e premiar os operários incluídos na categoria 4. Sabendo que os dados da pesquisa foram
Curso de Licenciatura em Matemática – Probabilidade e Estatística Página 13
apresentados conforme a tabela de frequência abaixo, calcular os intervalos da escala de desempenho que
determinarão os operários que deverão ser submetidos a treinamento e os operários habilitados a receber o
prêmio.
k Escala de medida Número de fa
de desempenho operários (fi)
1 0 |-- 10 16
2 10 |-- 20 27
3 20 |-- 30 35
4 30 |-- 40 42
5 40 |-- 50 24
TOTAL
2- Os avestruzes são de origem egípcia, podem atingir 2,8 m de altura e pesar acima de 150 kg, alguns
vivem até os 70 anos. A criação de avestruzes iniciou-se no Brasil a partir dos anos de 95/96. Um grupo
de biólogos está interessado em estudar a adaptação dessas aves em nosso país; para tanto, selecionou
uma amostra de 500 avestruzes adultos, com 20 anos de vida. Pretende-se classificá-los de acordo com o
peso do seguinte modo: 20 % dos mais leves como pequenos, os 40 % seguintes como médios, os 30 %
seguintes como grandes e os 10 % mais pesados como extras. Levando em conta a distribuição dos pesos
coletados registrados na Tabela abaixo, quais os limites de peso para cada classificação? (sugestão calcule
os percentis).
k Peso (kg) Número de avestruzes (fi) fa
1 50 |-- 75 17
2 75 |-- 100 108
3 100 |-- 125 168
4 125 |-- 150 153
5 150 |-- 175 54
TOTAL
3- Os habitantes de Paraisópolis reclamaram do mau cheiro do ar na cidade, proveniente do rio que corta
a cidade. Observou-se que uma indústria sucroalcooleira lançava seus resíduos industriais nesse rio,
causando a morte de espécies aeróbicas da fauna por asfixia (eutrofização). Para fins de monitoramento
da qualidade da água do rio, o órgão ambiental passou a colher amostras de água e a avaliar a qualidade
da mesma diariamente. As amostras em questão continham um litro de água e foram utilizadas para
determinação do percentual de 6cido sulfídrico (H2S) por litro, abaixo temos a tabela da distribuição.
Teor de H2S (%) 1|--- 3 3|---5 5|---7 7|---9 9|---11
Número de amostra (fi) 8 19 15 10 8
Respostas
1. Os operários com desempenho inferior a 17,47 deverão receber treinamento e os operários com
desempenho superior a 37,74 estarão habilitados a receber o prémio.
2. Pequenos: entre 5O e 94,27 kg; médios: entre 94,21 e 126,74 kg; grandes: entre 126,14 e 151,85 kg;
extras: entre 151,85 e 175 kg.
3. a) 30%; b) 5,7 % de teor de H2S; c) 5,4 % de teor de H2S; d) entre 1 e 3,74% de teor de H2S; e) entre 1
e 7% de teor de H2S; f) entre 7,6 e 11 de teor de H2S.