Escolar Documentos
Profissional Documentos
Cultura Documentos
Sérgio Kato
Principais Medidas Descritivas
• Distribuição de freqüências
• Medidas de dispersão
Distribuição de Freqüência: Tabelas
Tipos de freqüência:
• Absoluta
• Relativa
• Acumulada
• Relativa acumulada
Tabela de agrupamento por
intervalo de classe
Nível de colesterol
Cumulative
Frequency Percent Valid Percent Percent
Valid 100 |-- 150 20 2,5 2,5 2,5
150 |-- 200 240 30,6 30,6 33,1
200 |-- 250 350 44,6 44,6 77,7
250 |-- 300 140 17,8 17,8 95,5
300 |-- 350 10 1,3 1,3 96,8
350 |-- 400 10 1,3 1,3 98,1
400 |-- 450 5 ,6 ,6 98,7
450 |-- 500 10 1,3 1,3 100,0
Total 785 100,0 100,0
Tipos de freqüência:
• Absoluta
• Relativa
• Acumulada
• Relativa acumulada
Cálculo das freqüências
fi
• Freqüência Relativa da linha i - f ri % .100
fi
40
30
% 20
10
0
40|–45 45|–50 50|–55 55|–60 60|–65 65|–70 70|–75
Peso (kg)
50
40
30
%
20
10
0
0 1 2 3 4 5
Nº de filhos
Fem
72%
Gráfico de dispersão
Taxa Bruta vs Nascidos Vivos
120
100
Mortalidade Infantil
80
60
40
20
0
0 1000 2000 3000 4000 5000 6000
Nascidos Vivos
• Média
• Moda
• Mediana
Média
POPULAÇÃO AMOSTRA
x i x i
X
N n
fx i i fx i i
X
N n
• Um dos problemas da utilização da média é que, por
levar em conta TODOS os valores do conjunto, ela pode
ser distorcida por valores discrepantes (“outliers”) que
nele existam. É importante então interpretar
corretamente o valor da média.
Moda
É o valor que ocorre com maior freqüência.
Mediana
175625
375 3750 770
350
450 X i 1 5
0,6 425 2125
223,73
775
450 |-- n 785
500 10 1,3 475 4750 785
17562
Medidas de Tendência Central
SÍNTESE
Valor mais
Definição Valor esperado Valor central
freqüente
Considera todas as
Sim Não Não
observações
Afetada por valores
Sim Não Não
discrepantes
Usada em Menos sensível Apropriada para
Vantagem muitos métodos a valores dados
estatísticos discrepantes qualitativos
Assimetria
Medidas de Dispersão
• Amplitude
• Variância
• Desvio-padrão
• Coeficiente de Variação
• Intervalo Interquartil
Amplitude
É a medida estatística de variabilidade ou dispersão
mais simples, definida pela diferença entre o maior e o
menor valor.
H = Xmáx - Xmín
Média
Func. A: 800 810 790 800 800 800
Func. B: 700 900 800 720 930 810
N
( X i ) 2
n 2
(X i X )
i 1 S
i 1
2
2
N n 1
f i xi
2
f x 2
fx
2 i i
Fórmula
alternativa
2
N
2
s
2
i i
n
(dados agrupados) n 1
Variância
EXEMPLO: Produtividade diária (supondo dados populacionais)
Média
Func. A: 800 810 790 800 800 800
Func. B: 700 900 800 720 930 810
2 2 2 2 2
(800 800) (810 800) (790 800) (800 800) (800 800)
Variância A: 2
40
5
Variância B: 2 8560
POPULAÇÃO AMOSTRA
2 2
σ σ S S
POPULAÇÃO AMOSTRA
s
CV % 100 CV % 100
X
No exemplo:
6,32 peças
CV (A) 0,0079 ou (0,79%)
800 peças
92,52 peças
CV (B) 0,114 ou (11,4%)
810 peças
Medidas de Dispersão
Exemplo Taxa de colesterol (mg/dl)
Dados agrupados Frequenc Percen
y t xi fixi Fi fixi2
100 |--
X 223,73 150 20 2,5 125 2500 20 312500
150 |--
200 240 30,6 175 42000 260 7350000
200 |-- 1771875
250 350 44,6 225 78750 610 0
250 |-- 1058750
f x 2
300 140 17,8 275 38500 750 0
fx
2
i i i i
n 300 |--
s
2
50% 50%
1º Quartil 3º Quartil
(P25) (P75)
Box plot
Tempo até recorrência do Sarcoma de Ewing
4000,00
+
3000,00
Máximo*
tempo
2000,00
Q3
1000,00
Mediana (Q2)
Q1
0,00
Mínimo
S1-S3 S4
terapia