Escolar Documentos
Profissional Documentos
Cultura Documentos
FACULDADE DE CIÊNCIAS
Departamento de Matemática e Informática
Resumo Teorico Estatistíca Básica 1º Semestre de 2017
Separatrizes São números que dividem uma sequência ordenada de dados em partes que contêm a mesma
quantidade de elementos da série.
Desta forma, a mediana que divide a sequência ordenada em dois grupos, cada um deles contendo 50% dos
valores da sequência, é também uma medida separatriz. Além da mediana, as outras medidas separatrizes são:
quartis, decis e percentis.
Como foi referido anteriormente, para além da medidas de tendência central, os quartis, decis e percentis são
outras medidas conhecidadas por separatrizes utilizados como medidas de posição.
Quartis (Qk)
Os quartis são medidas numericas que dividem o conjunto de dados ou distribuições de frequências
em 4 partes iguais.
Q1 Q2 Q3
Assim, o primeiro quartil, que é indicado por Q1, separa a sequência ordenada deixando 25% de seus valores à
esquerda e 75% de seus valores à direita.
O segundo quartil, indicado por Q2, separa a sequência ordenada deixando 50% de seus valores à esquerda e
50% de seus valores à direita. O Q2 é igual a Mediana da série.
O terceiro quartil Q3 obedece a mesma regra dos anteriores, isto é, um valor tal que 75% das observações são
menores e 25% são maiores que este.
Para dados não agrupados (simples) e quando o “n” é impar as posições onde se encontram os elementos
pertencentes aos quartis podem ser determinados pelas formulas:
n 1 n 1 (n 1)
P(Q1 ) ; P(Q2 ) P(mediana ) ; P(Q3 ) 3 ;
4 2 4
Onde P refere a posição onde se encontra o elemento pertencente aos quartis.
Para dados não agrupados e quanto o “n” é par as posições onde se encontram os elementos pertencentes aos
quartis podem ser determinados pelas formulas:
n2 3n 2
P(Q1 ) ; P(Q2 ) mediana ; P(Q3 )
4 4
1
Cálculo do quartil para dados simples
n = 15 Impar
Q1 X n1 X 151 X 4 7 Q2 X n1 X 151 X 8 8 Q3 X n 1 X 151 X 12 15
3 3
4 4 2 2 4 4
n = 14 par
Q1 X n 2 X 14 2 X 4 7
4 4
Xn Xn X 14 X 14
1 1 X 7 X 8 9 10
Q2 2 2
2 2
9,5
2 2 2 2
Q3 X 3n 2 X 314 2 X 1`1 15
4 4
Para dados agrupados em classe, pode – se calcular com aproximação o quartil de ordem k, usando a formula:
n k
Fa
Qk Li 4 a ; onde k 1, 2, 3
fi
Onde
k – é a ordem do quartil
Li – limite inferior da classe onde existe o quartil
Fa – frequência acumulada até a classe anterior onde existe o quartil
f i – frequência absoluta da classe onde existe o quartil
a – Amplitude da classe modal
2
Decis (Dk)
10% 10% 10% 10% 10% 10% 10% 10% 10% 10% 100%
D1 D2 D3 D4 D5 D6 D7 D8 D9
Assim, o primeiro decil, indicado por D1, separa a sequência ordenada deixando 10% de seus valores à esquerda
e 90% de seus valores à direita. De modo análogo são definidos os outros decis
A fórmula básica para determinar a posição do elemento decil para dados não agrupados será:
k (n 1)
P( Di ) ,
10
Quando os dados estão agrupados em classe a fórmula é semelhante as anteriores.
nk
Fa
Dk Li 10 a ; onde k 1, 2,...,9
fi
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
2 4 6 7 10 12 15 18 20 24
a) Calcular D1
1° Passo: determina-se a posição do primeiro Decil.
1 n 1 10
PD1 1 ( posição)
10 10
2° Passo: Procura-se no rol o valor do primeiro elemento;
3° passo: O valor do D1=2 que corresponde a 10% do rol
b) Calculo do D8
1° Passo: determina-se a posição do oitavo Decil.
8 n 8 10
PD8 8 ( posição)
10 10
2° Passo: Procura-se no rol o valor do oitavo elemento;
3° passo: O valor do D8=18 que corresponde a 80% do rol
Percentis (Pk)
100
0% 1% 1% 1% … … … … 1% 1% %
P1 P2 P3 … … … P98 P99
3
Assim, o primeiro percentil, indicado por P1, separa a sequência ordenada deixando 1% de seus valores à
esquerda e 99% de seus valores à direita.
Nos percentis, a série é divida em 100 partes iguais (P1, P2, P3, ... P99).
Para o cálculo dos percentis, utilizamos técnicas semelhantes às do cálculo dos quartis e decis. Inicialmente,
determina-se a posição do percentil ou a classe que contém o valor percentil a ser calculado pela expressão:
K fi kn
(K = 1; 2; 3;...; 98; 99)
100 100
Verifica-se que os quartis, quintis e decis são múltiplos dos percentis, então basta estabelecer a fórmula de
cálculo de percentis. Todas as outras medidas podem ser identificadas como percentis. Ou seja:
nk
Posição do percentile k é determinada por:
100
Em seguida, identifica-se o elemento que ocupa esta posição. Note que se o elemento for um número inteiro,
então o Pk procurado é um dos elementos da sequência ordenada.
Se não for um número inteiro, isto significa que P k é um elemento intermediário entre os elementos que ocupam
as posições aproximadas por falta ou por excesso do valor calculado. Neste caso, P k é definido como sendo a
média dos valores que ocupam estas posições aproximadas.
Para calcular o percentil de ordem “k” basta usar a fórmula de aproximação quando temos dados classificados
em classe.
nk
Fa
Pk Li 100 a ; onde k 1, 2,......, 99
fi
4
Exemplo 2: Registaram-se as alturas de 100 estudantes de uma Faculdade, tendo –se obtido a tabela de
distribuição de frequências abaixo. Determine os valores das separactriz: Med, Q 1, D3, P80 e comente os
resultados.
Resolução:
n
Fa
2 50 33
Mediana: Me Li a 1,64 0,06 1,68
f me 26
n 1
Fa
4 25 21
Primeiro Quartil: Q1 Li a 1,58 0,06 1,60
fi 12
n3
Fa
10 30 21
Terceiro Decil: D3 Li a 1,58 0,06 1,63
fi 12
n 80
Fa
80 79
Percentil 80: P80 Li 100 a 1,76 0,06 177
fi 11
Dos 100 estudantes, 25% destes possuem altura inferior a 1,60 cm, 30% possuem altura menor que 1,63 cm,
50% tem uma estatura inferior a 1,68 cm e só 20% dos 100 estudantes tem altura igual ou superior a 1,77 cm.
Para completar o estudo do quadro das estatísticas descritivas resta estudarmos as medidas de assimetria e
curtose. Estas medidas juntamente com as de posição e de dispersão proporcionam a descrição e compreensão
completas da distribuição de freqüência estudada.
As distribuições de frequências podem diferir quanto ao valor médio, quanto à dispersão dos valores e também quanto à
forma.
As formas em que se apresenta uma distribuição podem ser caracterizadas quanto ao grau de deformação ou assimetria e
o grau de achatamento ou afilamento da curva de frequências e do Histograma.
A assimetria é o grau de deformação de uma curva de frequências. Uma distribuição de frequência é simétrica, ou seja,
que apresenta um gráfico cuja as duas caudas possuem a mesma configuração (curva b), quando a média, a mediana e a
moda da série forem iguais.
5
A distribuição de frequência também pode ser assimétrica negativa (curva a) e assimétrica positiva (curva c), a primeira
apresenta uma cauda mais alongada à esquerda e ocorre quando média da série for menor que a moda e a ultima
(terceira) possui uma cauda mais alongada à direita e ocorre quando a média da série for maior que a moda.
x Me Mo x Me Mo x Me Mo
a) Assimetria negativa b) Distribuição simétrica c) Assimetria positiva
Média
20
16,0
15
DISTRIBUIÇÃO SIMÉTRICA
10 Mediana
16,0
5 Média=Mediana=Moda
0
0 4 8 12 16 20 24 28 32 Moda
16,0
Média
20
13,1
15
DISTRIBUIÇÃO ASSIMÉTRICA
10 Mediana POSITIVA
12,4
5 Moda < Mediana < Média
0
Moda
0 4 8 12 16 20 24 28 32
11,3
Média
20
18,9
15
DISTRIBUIÇÃO ASSIMÉTRICA
10 Mediana NEGATIVA
19,6
5 Média < Mediana < Moda
0
Moda
0 4 8 12 16 20 24 28 32
20,7
6
Coeficiente de Assimetria
A assimetria pode ser obtida pelo coeficiente de assimetria ( ei ) que é uma medida adimensional..
Coeficiente de Pearson
x Mo
: e1 onde Mo é a moda da série.
s
Desde que a moda é de difícil estimativa, o coeficiente de assimetria é obtido, com boa aproximação, pela seguinte
relação:
x – Mo = 3( x – Me), onde Me é a mediana. Assim:
3x Me
e2
s
Mas, a medida de assimetria mais utilizada é dada pelo terceiro momento (m3) centrado na média, ou seja:
xi x
3
m3
e3 3 onde m3
s n
sendo xi é cada elemento do conjunto de dados, x a média e n o número de elementos do conjunto.
O coeficiente de Assimetria permite compararmos duas ou mais distribuições diferentes e avaliar qual delas é mais
assimétrica. Quanto maior o coeficiente de Assimetria, mais assimétrica é a curva:
Assimetria fraca se: 0 < | ei | < 0,15
Exemplo 4: Considere a tabela que apresenta o número de faltas no mês dos estudantes de uma turma de Engenharia da
UEM e Calcule o coeficiente de assimetria e classifique a distribuição.
7
Observem que precisamos da média, da moda e do desvio padrão, vamos então calcular:
e1 = 21 - 24
0,685 → e1 = - 0,685 o coeficiente de assimétrica negativo confirma que se trata de uma
4,38
curva assimétrica à esquerda. Como 0,15 < | e1 | < 1 a distribuição é assimétrica moderada.
Anterirmente, vimos que existe uma relação estreita entre o valor das Medidas de Tendência Central (Média,
Moda e Mediana) e o comportamento da Assimetria de um conjunto.Todavia, quando se trata de Curtose, não há
como extrairmos uma conclusão sobre qual será a situação da distribuição, se mesocúrtica, platicúrtica ou
leptocúrtica, apenas conhecendo os valores da Média, Moda e Mediana.
A curtose é o grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada
curva normal. A distribuição que apresenta uma curva de frequências mais fechada que a normal, é denominada
8
leptocúrtica (Curva a). Quando a curva de frequência é mais aberta que a normal recebe o nome de platicúrtica
(Curva b) e a curva normal é denominada de mesocúrtica (Curva c).
a) b) c)
Platicúrtica
Leptocúrtica
Mesocúrtica
Coeficiente de curtose
A curtose (C) é definida pelo quarto momento (m4) dividido pelo o desvio-padrão da série elevado a quarta potência ( s 4 ):
m xi x 4
C 44 onde o quarto momento é dado por: m4
s n
A curtose é denominada mesocúrtica quando C=3, neste caso, tem-se uma curva normal.
Se C >3, a curva de frequência é mais fechada que a curva normal, ou seja, possui um pico e recebe a
denominação de leptocúrtica.
Se C< 3, a curva de frequência é mais achatada que a curva normal, sendo chamada de platicúrtica.
A curtose calculada para os dados da tabela anterior foi C = 2,2, portanto C< 3 e a curva de frequência é mais
achatada que a curva normal.
Uma curva normal apresenta um coeficiente de curtose de valor k = 0,263, assim podemos estabelecer comparações entre
as diversas curvas e classificá-las:
52,5 42 10,5 21
Q 3 10 2 10 2 10 10 1,62 11,62 Q3 11,62
13 13 13
17,5 15 2,5 5
Q1 6 2 6 2 6 6 0,45 6,45 Q1 6,45
11 11 11
63 55 8 16
P90 12 2 12 2 12 12 1,6 13,6 P90 13,6
10 10 10
76 1 2
P10 4 2 4 2 4 4 0,22 4,22 P10 4,22
9 9 9
Calculando o coeficiente de curtose
Q3 Q1 11,62 6,45 5,17 5,17
k 0,275586.... k 0,276
2( P90 P10 ) 2 (13,6 4,22) 2 (9,38) 18,76
2. Para os seguintes conjuntos de dados, determine os valores da média aritmética, mediana, moda e os quartis (Q1,
Q2 e Q3. a) 12,15, 16, 15, 12, 15, 15, 5, 7, 14 b) 2, 6, 3, 6, 3, 3, 4
ANO 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
Ton 12 15 18 22 17 14 18 23 29 32 34
Calcule os valores do percentil 25, 50 e percentil 75.
4.2. Qual a idade, abaixo dela corresponde a 70% das crianças (D7)?
a) D7=6 b) D7=8 c) D7=5 d) D7=9
4.3. Qual a idade que abaixo dela corresponde a 45% das crianças (P45)?
a) P45 = 4 b) P45 = 8 c) P45 = 5 d) P45 = 6
5. Considere a tabela abaixo que representa os valores economizados por crianças para a compra do presente
do dia das mães.
Salários funcionários
500 ├ 600 3
600 ├ 700 8
700 ├ 800 12
800 ├ 900 17
900 ├ 1000 10
1000 ├ 1100 8
1100 ├ 1200 6
fi 64
6.1. Qual o salário de 25% dos funcionários que ganham menos(Q1)?
a) Q1=742,68 b) Q1=741,67 c) Q1=678,97 d) Q1=698,85
8. Uma distribuidora de refrigerantes fez um levantamento sobre o consumo semanal (em litros) por pessoa, em jan/2002,
em uma cidade do litoral, obtendo a tabela abaixo:
CONSUMO Nº DE PESSOAS
0,0 0,5 10
0,5 1,0 25
1,0 1,5 9
1,5 2,0 7
2,0 2,5 6
a) Determine o percentil 10 e 90. Interprete-os c) Determine o primeiro decil e nono decil.
b) Determine o primeiro quartil e o terceiro d) Construa um Box-plot.
quartil.
e) Determine e interprete o consumo semanal mínimo dos 33% de pessoas com consumo mais alto.
f) Determine o valor Mínimo de consumo dos 67% com consumo mais alto.
g) Quais os limites (mínimo e Maximo) de consumo dos 34% de pessoas com consumo semanal intermediário
ou central.
12
c) Determine a nota minima dos primeiros 3 estudantes com nota mais alta.
d) Calcule o primeiro e o terceiro quartil.
e) Calcule e interprete o 40º percentil.
f) Construa um Box-plot.
10. Uma empresa emprega 450 trabalhadores. Sabendo-se que os salários correspondentes ao primeiro e terceiro
quartil são, respectivamente, 300 e 800 reais, encontre o número de empregados que percebem salários entre
esses valores.
11. Os dados abaixo referem-se ao número de horas extras de trabalho de uma amostra de funcionários da empresa Mcel, em
dezembro de 1991.
16 12 12 14 15 15 15 15 16 17 18 18 19 19 19 20 21 21
22 22 22 23 23 23 23 23 33 24 25 25 25 27 27 28 32
a) Calcule o primeiro e o terceiro quartis. Explique o significado destes números;
b) Construa o gráfico Boxplot.
12. Descrever a forma da curva mais provável de cada uma das seguintes distribuições:
a) x 52 , ~ x 55 , xˆ 60 b) x 78.1 , ~ x 78 , xˆ 78
c) x 50, ~
x 50, xˆ1 60 e xˆ 2 40 d) x 28 , ~
x 26 , xˆ 20
~
Onde, x media x mediana xˆ mooda
13. Indicar as posições relativas da média, mediana, moda e classifique quanto a forma, as seguintes distribuições:
a) As classificações num exame muito fácil.
b) Resultados de um teste de Estatistica muito difícil
c) As alturas de um grande grupo de homens de 25 anos de idade.
d) O número de faltas às aulas de um grande grupo de estudantes universitários.
14. Responda se cada uma das proposições a seguir é verdadeira ou falsa. Se a proposição for falsa, corrija a palavra
sublinhada para que se torne verdadeira.
a) Quando a variável quantitativa tem distribuição unimodal e simétrica, metade de seus valores é menor que a média.
b) A mediana não é uma boa medida de tendência central para uma variável quantitativa com distribuição unimodal muito
assimétrica, pois esta medida é muito influenciada por valores extremos.
c) Quando a variável quantitativa tem distribuição unimodal e simétrica, a posição relativa das medidas de tendência central é:
média<mediana<moda.
Nota 1 2 3 4 5 6 7 8 9
Nº de alunos 2 5 8 10 18 10 8 4 2
13
17. O quadro seguinte representa as alturas (em cm) de 40 alunos de uma classe.
Classes 153 – 158 158 – 163 163 –168 168 – 173 173 -178 Total
fi 4 8 16 8 4 40
Determine:
a) Calcule o coeficiente de assimetria de Pearson e classifique a distribuição quanto a simetria.
b) Calcule o coeficiente quartil de assimetria e classifique a distribuição quanto a simetria.
c) Calcule o coeficiente de curtose e classifique a distribuição quanto a curtose.
18. Suponha que receba propostas de emprego de duas empresas, A e B. Sabe-se que:
A média dos salários na empresa A é $2000 e o sétimo Decil é $1000
A média dos salários na empresa B é $2000 e a mediana é igual $1000
Suponha que, uma vez aceite a proposta de uma das empresas, seu salário será escolhido aleatoriamente entre todos
os salários desta empresa. Você quer minimizar a chance de ganhar menos de $1000, seu salário actual, ao mudar
para uma destas duas empresas. Qual delas, empresa A ou B, você escolheria ?
14