Você está na página 1de 10

Escores padronizados

Mede a distncia de um indivduo em relao mdia em desvios padro

(x x)
Z =
s
Considere as notas de dois alunos na disciplina de Estatstica, ambos com nota 25,
mas oriundos de turmas diferentes. Qual deles teve melhor desempenho em relao
ao grupo
Turma

Mdia

Desvio Padro

20

20

1,67

O escore padronizado indica a posio do individuo dentro do grupo.


A varivel padronizada tem mdia zero e desvio padro igual a 1.
Geralmente a padronizao de variveis feita para a construo de
indicadores.

Exemplo
Empresa

Ganho
bruto

Ganho
lquido

Patrimnio

z1

z2

z3

9893

564

17689

1,17

0,50

1,38

8776

389

17359

0,81

-0,13

1,32

13572

1103

18597

2,36

2,46

1,53

6455

743

8745

0,06

1,15

-0,15

5129

203

14397

-0,37

-0,80

0,82

5432

215

3467

-0,27

-0,76

-1,05

3807

385

4679

-0,80

-0,14

-0,84

3423

187

6754

-0,92

-0,86

-0,49

3708

127

2275

-0,83

-1,08

-1,25

10

3294

297

6754

-0,96

-0,46

-0,49

11

5433

432

5589

-0,27

0,03

-0,68

12

6287

451

8972

0,01

0,10

-0,11

Mdia

6267,42

424,67

9606,42

D.P.

3090,41

276,17

5865,84

Coeficiente de variao

s
CV =
x

uma medida de variao que independe da unidade de medida

Diz o quanto o desvio padro representa em relao mdia. usualmente


expresso como porcentagem.
Um pesquisador, desejando estudar a qualidade de vida nos 120
bairros de uma cidade, mediu quatro variveis em cada um.
Variveis

Mdia Mediana

D.P.

Amplitude

Minimo

Maximo

CV

Renda domiciliar per


capita (em reais)

700

350

200

1000

100

1100

28,57%

Porcentagem de casas
com energia eltrica

80

80

40

60

100

10%

Porcentagem de casas
com saneamento bsico

76

70

15

40

60

100

19,74%

Nmero de praas
pblicas

10

10

50%

Com relao qual varivel os bairros so mais homogneos?


E mais heterogneos?

Quantis
A mediana divide o conjunto de dados em duas partes de mesmo tamanho.
Para dividirmos um conjunto de dados em 4 partes precisamos de 3
nmeros os quartis
Para dividirmos um conjunto de dados em 10 partes precisamos de 9
nmeros os decis
Para dividirmos um conjunto de dados em 100 partes precisamos de 99
nmeros os percentis
De modo geral chamamos estas quantidade de quantis da distribuio de
frequncias.
q(p) quantil de ordem p
pelo menos 100 p% dos valores so menores ou iguais a q(p)
pelo menos 100 (1-p)% dos valores so maiores ou iguais a q(p)
q(0,25), q(0,50), q(0,75) (1, 2 e 3. Quartis)
q(0,10), q(0,20), q(0,30),...., q(0,90) decis
q(0,01), q(0,02),........., q(0,99) percentis

Como calcular um quantil?


q(0,75) = ?
36 x 0,75 = 27
36 x 0,25 = 09
pelo menos 27 observaes menores ou iguais a q(0,75)
pelo menos 09 observaes maiores ou iguais a q(0,75)
q(0,75) = (13,85+14,69)/2 = 14,27

Se o nmero resultante da multiplicao de n (tamanho


do conjunto de dados) por p (ordem do quantil) for inteiro,
o quantil ser a mdia da observao de ordem np com a
observao de ordem np +1

Diagrama de Ramo e
Folhas para Salrio
4|00 56
5|25 73
6|26 66 86
7|39 44 59
8|12 46 74 95
9|13 35 77 88
10|53 76
11|06 59
12|00 79
13|23 60 85
14|69 71
15|99
16|22 61
17|26
18|75
19|40
20|
21|
22|
23|30

Diagrama de Ramo e
Folhas para Salrio

Como calcular um quantil?


q(0,20) = ?
36 x 0,20 = 7,2
36 x 0,25 = 28,8
pelo menos 7,2 observaes a q(0,75)
pelo menos 28,8 observaes a q(0,75)

8
29

q(0,20) = 7,39

Se o nmero resultante da multiplicao de n (tamanho


do conjunto de dados) por p (ordem do quantil) for
fracionrio, o quantil ser a observao cuja ordem gual
ao valor np arredondado para cima.

4|00 56
5|25 73
6|26 66 86
7|39 44 59
8|12 46 74 95
9|13 35 77 88
10|53 76
11|06 59
12|00 79
13|23 60 85
14|69 71
15|99
16|22 61
17|26
18|75
19|40
20|
21|
22|
23|30

Os quartis junto com os valores mnimos e mximos podem ser usados


para construir um grfico esquemtico da distribuio de freqncias
chamado de diagrama de caixas ou boxplot
Histogram of Salario
Boxplot of Salario
7
6

Frequency

5
4
3
2
1

15

25

Salario

0
4

10

12
14
16
Boxplot
of
Salario

18

20

22

24

Salario

Min. Q1 Q2 Q3

15

Salario

25

Max.

O tamanho da caixa
chamado
de
distncia
Interquartlica (DQ) usado
como medida de variao.

Observaes atpicas so observaes destoantes no conjunto de dados


encontradas nos extremos da distribuio. Todas observaes que encontramse a uma distncia maior do que 1,5 DQ abaixo do primeiro quartil ou a uma
distncia maior do que 1,5 DQ acima do terceiro quartil so suspeitas de serem
atpicas.
A regra acima pode ser includa na construo do boxplot. Os asteriscos
indicam os valores identificados como atpicas.
Considere os salrios (em SM) de 30 homens e 30 mulheres
Histograma de salrios - sexo feminino

Histograma de salrios - sexo masculino

40

30
40

30

30

S a l rio

P e rc e n t

P e rc e n t

20
20

10

10

20
10

0
0.0 2.5 5.0 7.5 10.0 12.5 15.0 17.5 20.0 22.5 25.0

SalarioF

10

15

20

25

SalrioM

30

35

40

45

SEXO

Mdia ponderada: Consiste numa mdia onde as observaes possuem


pesos diferentes.
Um pesquisador deseja medir a variao nos preos do caf da manha. Para
isto ele pretendo construir um ndice. Considerando que uma cesta de caf da
manha composta por pes, caf, leite e derivados.
No ltimo ms ele observou a seguinte variao nos preos.
Produto

Variao mensal nos preos


Preo atual/Preo anterior

caf

1,03

po

1,05

Leite e derivados

1,07

Variao mdia

1,05

Na mdia calculada acima todos os produtos tem o mesmo peso.

As contribuies de cada um dos produtos no custo da cesta de cafs so


diferentes. Assuma que do valor gasto com a cesta de caf 10% gasto com
caf, 40% com pes e 50% com leite e derivados.
Ento ao calcular a mdia das variaes de preo devemos dar pesos
diferentes aos produtos, isto calcular uma mdia ponderada
n

w x
i

xw =

i =1
n

w
Para o exemplo

xw =

i =1

(0,10 x 1,03) + (0,40 x 1,05) + (0,50 x 1,07)


= 1,058
0,10 + 0,4 + 0,10