Você está na página 1de 35

Medidas descritivas

Sérgio Kato
Principais Medidas Descritivas

• Distribuição de freqüências

• Medidas de tendência central

• Medidas de dispersão
Distribuição de Freqüência: Tabelas

• Tabela de agrupamento simples


Mostra os valores obtidos bem como sua freqüência.

• Tabela de agrupamento por intervalo de


classe
Mostra a freqüência de ocorrência por faixa de valores.
Tabela de agrupamento simples
Dados Brutos

Tipos de freqüência:
• Absoluta
• Relativa
• Acumulada
• Relativa acumulada
Tabela de agrupamento por
intervalo de classe
Nível de colesterol

Cumulative
Frequency Percent Valid Percent Percent
Valid 100 |-- 150 20 2,5 2,5 2,5
150 |-- 200 240 30,6 30,6 33,1
200 |-- 250 350 44,6 44,6 77,7
250 |-- 300 140 17,8 17,8 95,5
300 |-- 350 10 1,3 1,3 96,8
350 |-- 400 10 1,3 1,3 98,1
400 |-- 450 5 ,6 ,6 98,7
450 |-- 500 10 1,3 1,3 100,0
Total 785 100,0 100,0

Tipos de freqüência:
• Absoluta
• Relativa
• Acumulada
• Relativa acumulada
Cálculo das freqüências

• Freqüência Absoluta da linha i - fi

fi
• Freqüência Relativa da linha i - f ri %  .100
 fi

• Freqüência Acumulada até a linha i - Fi   j 1 f j


i

• Freqüência Acumulada Relativa - Fi


Fri %  .100
 fi
Distribuição de Freqüência:
Gráficos
• Histograma
• Gráfico de colunas/barras
• Gráfico de setores
• Gráfico de dispersão
• Gráfico de linha
• Cartograma
Histograma

40
30
% 20
10
0
40|–45 45|–50 50|–55 55|–60 60|–65 65|–70 70|–75
Peso (kg)

Gráfico – Histograma do peso (Kg) observado em estudantes universitários.


Gráfico de colunas/barras

50
40
30
%
20
10
0
0 1 2 3 4 5
Nº de filhos

Gráfico– Distribuição relativa dos indivíduos, segundo o número de filhos.


Gráfico de setores

SEXO (%) Masc


28%

Fem
72%
Gráfico de dispersão
Taxa Bruta vs Nascidos Vivos

120

100
Mortalidade Infantil

80

60

40

20

0
0 1000 2000 3000 4000 5000 6000

Nascidos Vivos

Gráfico– Gráfico de dispersão da taxa de mortalidade infantil e do número


de nascidos vivos nos municípios do RS.
Gráfico de linhas

Gráfico– Taxa de crescimento anual do Índice Trimestral de Atividade


Produtiva (ITAP) e do Produto Interno Bruto (PIB) do RS, no período de 2001
a 2006.
Cartograma

Figura– Mapa do bloco Renda do Índice de Desenvolvimento Sócio


Econômico (IDESE/FEE) no RS.
EXERCÍCIO
1) Uma amostra de pessoas, que trabalha (com salário por dia), em
uma empresa é formada por subgrupos com as seguintes
características:
15 ganham R$ 45,00
15 ganham R$ 50,00
10 ganham R$ 60,00
10 ganham R$ 90,00
10 ganham R$ 120,00
Construa uma tabela de agrupamento simples com os 4 tipos de
freqüência.
Resp.
rendimento fi fri(%) Fi Fri(%)
45 15 25,0 15 25,0
50 15 25,0 30 50,0
60 10 16,7 40 66,7
90 10 16,7 50 83,3
120 10 16,7 60 100,0
Total 60 100,0 - -
2) Uma amostra do Índice de Massa Corporal (IMC) de 50 indivíduos adultos,
freqüentadores de uma academia, estão descritas a seguir:
16,0 16,4 16,7 18,1 18,3 18,3 18,4 18,5 18,5 18,9
18,9 19,0 19,2 19,2 19,5 19,6 19,6 19,7 19,8 20,0
20,1 20,1 20,2 20,3 20,5 20,9 21,0 21,1 21,2 21,4
21,4 21,4 21,6 22,3 22,5 22,6 22,7 23,2 23,3 23,7
23,7 24,2 24,2 24,5 24,8 26,5 31,6 31,8 31,9 31,9
Determinar:
a) a distribuição de freqüências (por intervalo de classes pois a variável é
quantitativa). Iniciar em 16 e utilizar amplitude do intervalo igual a 4;
para os itens “b” a “e”, utilizar a tabela gerada no item “a”
b) obtenha e interprete a fr3;
c) obtenha e interprete a Fr4;
d) qual a porcentagem de indivíduos que apresentam IMC inferior a 24;
Resp.
Imc fi fri(%) Fi Fri(%)
16 |-- 20 19 38 19 38
20 |-- 24 22 44 41 82
24 |-- 28 5 10 46 92
28 |-- 32 4 8 50 100
Total 50 100
Medidas de Tendência Central

• Média

• Moda

• Mediana
Média
POPULAÇÃO AMOSTRA

x i x i
 X
N n

fx i i fx i i

 X
N n
• Um dos problemas da utilização da média é que, por
levar em conta TODOS os valores do conjunto, ela pode
ser distorcida por valores discrepantes (“outliers”) que
nele existam. É importante então interpretar
corretamente o valor da média.
Moda
É o valor que ocorre com maior freqüência.

A moda nem sempre é única. Um conjunto de dados


pode ser:
• Bimodal
• Multimodal
• Não ter Moda

É a única medida de localização que pode ser usada para


os dados em escala nominal.
Moda
EXEMPLO:
Mediana
É o valor da variável a partir do qual metade dos casos
se encontra acima dele e metade se encontra abaixo.
n 1 N 1
50% 50% Posiçao 
2
ou
2

Mediana

Se o n° de observações for impar, a mediana será o valor


central da distribuição; se o n° for par, a mediana será a
média dos dois valores centrais.

Pouco afetada por eventuais valores discrepantes


existentes no conjunto (que costumam distorcer
substancialmente o valor da média).
Mediana
EXEMPLO: Grau de satisfação com o curso, variando de 1 a 5,
sendo 1 nada satisfeito e 5 totalmente satisfeito

“n” PAR “n” ÍMPAR


1,90 1,90
2,40 2,40
2,52 2,52
2,70 2,70
2,72 2,72
2,80
Mediana= 2,96 pontos
2,80
Mediana= 2,80 pontos
3,13 3,13
3,20 3,20
3,20 3,20
3,60 4,60
3,72 4,72
5,00 4,10
n=11
n=12
Medidas de Tendência Central
Nível de colesterol (mg/dL)
Exemplo – Dados agrupados
Frequenc Percen
y t xi fixi Fi
100 |--
Intervalo 150 20 2,5 125 2500 20
n  1 786
Posiçao    393
2 2 Modal 150 |--
200 240 30,6 175 42000 260
200 |--
n 
  Fi 1  250 350 44,6 225 78750 610
Md  l i  hi  2  250 |--
 fi  300 140 17,8 275 38500 750
 
  300 |--
350 10 1,3 325 3250 760
350 |-- n
 785 

Md  200  50 2
 260 
  218,9
400
400 |--
fx 10
i i
1,3

175625
375 3750 770

 350 
  450 X i 1 5
0,6 425 2125
223,73
775
  450 |-- n 785
500 10 1,3 475 4750 785
17562
Medidas de Tendência Central
SÍNTESE

Média Mediana Moda

Valor mais
Definição Valor esperado Valor central
freqüente

Existência Sempre existe Sempre existe Pode não existir

Considera todas as
Sim Não Não
observações
Afetada por valores
Sim Não Não
discrepantes
Usada em Menos sensível Apropriada para
Vantagem muitos métodos a valores dados
estatísticos discrepantes qualitativos
Assimetria
Medidas de Dispersão

• Amplitude

• Variância

• Desvio-padrão

• Coeficiente de Variação

• Intervalo Interquartil
Amplitude
É a medida estatística de variabilidade ou dispersão
mais simples, definida pela diferença entre o maior e o
menor valor.
H = Xmáx - Xmín

EXEMPLO: Produção diária (peças)

Média
Func. A: 800 810 790 800 800 800
Func. B: 700 900 800 720 930 810

Amplitude A= 810-790= 20 peças

Amplitude B= 930-700= 230 peças


Variância
POPULAÇÃO AMOSTRA

N
 ( X i  ) 2
n 2
(X i  X )
i 1 S 
i 1
2 
2

N n 1

 f i xi
2
 f x  2

fx
2 i i

Fórmula
alternativa
 
2
N
 2
s 
2
i i
n
(dados agrupados) n 1
Variância
EXEMPLO: Produtividade diária (supondo dados populacionais)

Média
Func. A: 800 810 790 800 800 800
Func. B: 700 900 800 720 930 810

2 2 2 2 2
(800  800)  (810 800)  (790  800)  (800  800)  (800 800)
Variância A:  2
  40
5

Variância B:  2  8560

Em que unidade está a variância?


Desvio-padrão

POPULAÇÃO AMOSTRA

2 2
σ σ S S

Quando podemos comparar os desvios?

Funcionário A: Média= 800 e Desvio-padrão= 6,32


Funcionário B: Média= 810 e Desvio-padrão= 92,52
Coeficiente de Variação

POPULAÇÃO AMOSTRA

 s
CV %  100 CV %  100
 X

No exemplo:
6,32 peças
CV (A)   0,0079 ou (0,79%)
800 peças

92,52 peças
CV (B)   0,114 ou (11,4%)
810 peças
Medidas de Dispersão
Exemplo Taxa de colesterol (mg/dl)
Dados agrupados Frequenc Percen
y t xi fixi Fi fixi2
100 |--
X  223,73 150 20 2,5 125 2500 20 312500
150 |--
200 240 30,6 175 42000 260 7350000
200 |-- 1771875
250 350 44,6 225 78750 610 0
250 |-- 1058750
 f x  2
300 140 17,8 275 38500 750 0
fx
2
i i  i i

n 300 |--
s 
2

n 1 350 10 1,3 325 3250 760 1056250


350 |--
175625400
2 10 1,3 375 3750 770 1406250
 41590625  785 400 |-- s  54,15 mg / dL
s 2

450
2. 932,05(mg / dL)2
5 0,6 425 2125 775 903125
784
450 |--
500 10 1,3 475 4750 785 2256250
17562 4159062
Intervalo Interquartil
Também conhecido como:
• Amplitude entre quartis
• Desvio entre quartis
• Distância interquartílica

50% 50%

Mediana= 2º Quartil= Percentil 50

25% 25% 25% 25%

1º Quartil 3º Quartil
(P25) (P75)
Box plot
Tempo até recorrência do Sarcoma de Ewing
4000,00

+
3000,00

Máximo*
tempo

2000,00

Q3
1000,00
Mediana (Q2)
Q1
0,00
Mínimo
S1-S3 S4
terapia

Você também pode gostar