Você está na página 1de 74

CAPTULO 3

REDUO E
SINTETIZAO DE
DADOS
Tratamento e Anlise de Dados
2
Temas a abordar
DISTRIBUIO DE FREQUNCIAS
MEDIDAS DE LOCALIZAO E DE POSIO
MEDIDAS DE DISPERSO E CONCENTRAO
MEDIDAS DE ASSIMETRIA E ACHATAMENTO
Cap. 3 Reduo e Sintetizao de Dados
3
Distribuio de
Frequncias
REDUO E SINTETIZAO DE
DADOS
Frequncias absolutas e relativas
4
Considerem-se as notas dos alunos da cadeira de Matemtica:
Classe Intervalo n
i
f
i

1
[0,4[
5 0,0625
2 [4,8[ 20 0,2500
3 [8,12[ 30 0,3750
4 [12,16[ 18 0,2250
5 [16,20] 7 0,0875
Total 80 1
n = nmero de observaes
n
i
= frequncias absolutas (com i = 1, 2, 3, 4, 5)
f
i
= frequncias relativas


Distribuio das notas de Matemtica
Cap. 3 Reduo e Sintetizao de Dados
Frequncias absolutas e relativas acumuladas
5
Classe Intervalo n
i
f
i
N
i
1 [0, 4[ 5 0,0625 5
2 [4, 8[ 20 0,2500 25
3 [8, 12[ 30 0,3750 55
4 [12, 16[ 18 0,2250 73
5 [16, 20] 7 0,0875 80
Total 80 1
N
i
= frequncia absoluta acumulada
Cap. 3 Reduo e Sintetizao de Dados
Frequncias absolutas e relativas acumuladas
6
Classe Intervalo n
i
f
i
F
i
1 [0, 4[ 5 0,0625 0,0625
2 [4, 8[ 20 0,2500 0,3125
3 [8, 12[ 30 0,3750 0,6875
4 [12, 16[ 18 0,2250 0,9125
5 [16, 20] 7 0,0875 1
Total 80 1
F
i
= frequncia relativa acumulada
Cap. 3 Reduo e Sintetizao de Dados
7
Medidas de Localizao
REDUO E SINTETIZAO DE
DADOS
8
Medidas de Localizao

Mdia Aritmtica
REDUO E SINTETIZAO DE
DADOS
Mdia aritmtica
9
Valor nico que equilibra a distribuio, dado que a soma dos desvios de todas
as observaes em relao mdia zero.
Cap. 3 Reduo e Sintetizao de Dados
Centro de gravidade (ou baricentro) da distribuio.
Depende do valor de todas as observaes, sendo objectivamente afectada por
valores extremos.
Mdia aritmtica
10
Os dados da amostra genrica podem ser representados por (X
1
, X
2
,,X
n
).

+ +

+ +

=1

Exemplo:
Determinar a mdia aritmtica simples
dos dados da seguinte amostra: 10, 40,
69, 4, 10, 3, 51.

=
10 + 40 + 69 + 4 +10 +3 + 51
7

= 26,71
Cap. 3 Reduo e Sintetizao de Dados
Mdia aritmtica
11
Para calcular a mdia aritmtica ponderada parte-se de um quadro com os respectivos
dados agrupados, que do seguinte tipo:
X
i
n
i
f
i

X
1
n
1
f
1

X
2
n
2
f
2


X
i
n
i
f
i


X
k
n
k
f
k

Totais n 1,00
Sabe-se que:


com i = 1,2, ..., n

=1
=

=1
= 1
Cap. 3 Reduo e Sintetizao de Dados
Mdia aritmtica
12
Para se calcular a mdia aritmtica ponderada utiliza-se qualquer uma das duas frmulas
abaixo:
1. mtodo

=1

2. mtodo

=1

Cap. 3 Reduo e Sintetizao de Dados
Mdia aritmtica
13
Exemplo
Calcule a mdia aritmtica (ponderada) para os dados da amostra apresentados no
quadro seguinte:
X
i
n
i

2 1
7 4
12 12
15 6
17 4
25 3
50 2
Totais 32
Calculando pelo 1 mtodo

=1

=
507
32
= 15,84
n
i
X
i

2
28
144
90
68
75
100
507
Cap. 3 Reduo e Sintetizao de Dados
Mdia aritmtica
14
Para calcularmos pelo 2 mtodo, organizemos o quadro de outra maneira:

= 15,84
X
i
n
i

2 1
7 4
12 12
15 6
17 4
25 3
50 2
Totais 32

=1

f
i
f
i
X
i

0,0312 0,062
0,1250 0,875
0,3750 4,500
0,1875 2,813
0,1250 2,125
0,0938 2,345
0,0625 3,125
1,0000 15,84
Cap. 3 Reduo e Sintetizao de Dados
Mdia aritmtica
15
Neste caso o problema resolve-se admitindo que os elementos de cada classe i, ou seja
n
i
, se referem todos ao ponto mdio da classe i.
O ponto mdio (X
i
) obtm-se dividindo por 2 a soma dos extremos da respectiva
classe:

2

= 1, 2, ,

=
Depois, basta utilizar um dos dois mtodos para calcular a mdia.
Cap. 3 Reduo e Sintetizao de Dados
16
Mdia aritmtica
Retomemos um quadro apresentado anteriormente
Classe Intervalo n
i

1
[0,4[
5
2 [4,8[ 20
3 [8,12[ 30
4 [12,16[ 18
5 [16,20] 7
Total 80

= 10,1
f
i

0,0625
0,2500
0,3750
0,2250
0,0875
1
X

i

2
6
10
14
18

=

f
i
X

i

0,125
1,500
3,750
3,150
1,575
10,100
Cap. 3 Reduo e Sintetizao de Dados
17
Mdia aritmtica
Calculando pelo outro mtodo

=
808
80
= 10,1
n
i
X

i

10
120
300
252
126
808
Classe Intervalo n
i

1
[0,4[
5
2 [4,8[ 20
3 [8,12[ 30
4 [12,16[ 18
5 [16,20] 7
Total 80
X

i

2
6
10
14
18

=

Cap. 3 Reduo e Sintetizao de Dados
18
Medidas de Localizao

Mediana
REDUO E SINTETIZAO DE
DADOS
Mediana
19
Mediana o valor da varivel em estudo tal que, numa amostra ordenada
metade das observaes so inferiores ou iguais a ela, e
metade esto para alm dela (so superiores ou iguais).
Cap. 3 Reduo e Sintetizao de Dados
Valor nico que ocupa a posio central na sucesso de observaes
(valor que divide a distribuio em duas metades iguais)
designado de centro de posio da distribuio.
Depende somente das posies ocupadas pelas observaes, no sendo
afectada por valores extremos.
Mediana
20
1. Dispem-se os dados da amostra por ordem crescente, isto , de tal forma que

1

2



2. Verifica-se se n par ou mpar.
Procedimentos:
n mpar
= 2 + 1

=
+1
( a observao central)
n par = 2

+
+1
2

Cap. 3 Reduo e Sintetizao de Dados
Mediana
21
Exemplo: Achar a mediana dos seguintes oito valores: 31 25 16 49 34 22 28 43.
Colocando por ordem crescente: 16 22 25 28 31 34 43 49.
n par (= 8) 8 = 2 = 4
16 22 25 28 31 34 43 49.

4
= 28

5
= 31

+
+1
2

=
28 + 31
2
= 29,5
Cap. 3 Reduo e Sintetizao de Dados

1

2

3

4

5

6

7

8

Mediana
22
1. Calculam-se as frequncias acumuladas
2. Verifica-se se n par ou mpar.
Procedimentos:
n mpar
= 2 + 1

=
+1
( a observao central)
n par = 2

+
+1
2

Cap. 3 Reduo e Sintetizao de Dados
Mediana
23
Cap. 3 Reduo e Sintetizao de Dados
X
i
n
i
N
i

1 1 1
2 3 4
3 5 9
4 2 11
Totais 11
n mpar (= 11)
= 2 + 1

=
+1

11 = 2 +1 = 5

=
+1

=
6

Contm o 6 elemento (

= 3
Mediana
24
Mediana o valor da varivel tal que a ordenada levantada no ponto
correspondente do eixo das abcissas divide a rea do histograma em duas reas
iguais.
F(x) a funo acumulada ou funo de distribuio (frequncias relativas acumuladas).

A mediana pode ser apresentada como a classe na qual a frequncia relativa
acumulada atinge 0,5 (50%).
Cap. 3 Reduo e Sintetizao de Dados
25
Mediana
Frequncias relativas:

0,50
0


Frequncias absolutas:

2

0

0
=

0
= , ,

=
Cap. 3 Reduo e Sintetizao de Dados
26
Mediana
Exerccio:
A classificao dos participantes numa prova desportiva consta no seguinte quadro:
Classes
(X)
Frequncias
(n)
30-40 6
40-50 17
50-60 76
60-70 68
70-80 22
80-90 9
Classificaes
Calcular a mediana
Cap. 3 Reduo e Sintetizao de Dados
27
Mediana
Resoluo:
Organizemos os dados de modo a podermos calcular a mediana usando a frmula:
Classes
(X)
n
i
f
i
F
i

30-40 6 0,0303 0,0303
40-50 17 0,0859 0,1162
50-60 76 0,3838 0,5000
60-70 68 0,3434 0,8434
70-80 22 0,1111 0,9545
80-90 9 0,4550 1,0000
Totais 198 1,0000
Frequncias absolutas e relativas

0,50
0

= 50 + 10
0,50 0,1162
0,3838
= 60
A classe mediana a terceira classe (classe 50-60)
Cap. 3 Reduo e Sintetizao de Dados
28
Medidas de Localizao

Moda
REDUO E SINTETIZAO DE
DADOS
29
Moda
Valor mais frequente (que ocorre mais vezes).
Cap. 3 Reduo e Sintetizao de Dados
Centro de concentrao da distribuio
Depende apenas da frequncia das observaes, no sendo afectada por
valores extremos.
Pode calcular-se para todos os tipos de varivel.
Pode no ser um valor nico (ao contrrio da mdia e da mediana). Se existir
mais do que uma moda, a distribuio designa-se por multimodal.
30
Moda
Basta verificar qual o valor de X que aparece mais vezes na amostra.
X
i
n
i

20 1
25 5
27 12
30 7
36 10
A moda 27 porque a mais observada.
Cap. 3 Reduo e Sintetizao de Dados
31
Moda
Neste caso usa-se a frmula de King.
Frequncias relativas:

= +


Frequncias absolutas:
=

=
=

= +


Cap. 3 Reduo e Sintetizao de Dados
=
32
Moda
Exemplo: Calcular o valor da moda da amostra seguinte:
Classes (X) n
i

1-3 2
3-5 3
5-7 4
7-9 7
9-11 3
11-13 1
Totais 20
Calcular
frequncias
relativas
Classes
(X)
n
i

1-3 2
3-5 3
5-7 4
7-9 7
9-11 3
11-13 1
Totais 20
Cap. 3 Reduo e Sintetizao de Dados
f
i
0,10
0,15
0,20
0,35
0,15
0,05
1,00
Classe
modal
33
Moda
Utilizando frequncias relativas

= +

= 7 + 2
0,15
0,2 + 0,15
= 7,86
Cap. 3 Reduo e Sintetizao de Dados
Classes
(X)
n
i
f
i

1-3 2 0,10
3-5 3 0,15
5-7 4 0,20
7-9 7 0,35
9-11 3 0,15
11-13 1 0,05
Totais 20 1,00
34
Moda
Determinao grfica da moda
Cap. 3 Reduo e Sintetizao de Dados
35
Moda
Distribuio de frequncias bimodal
Cap. 3 Reduo e Sintetizao de Dados
36
Comparaes das medidas
Cap. 3 Reduo e Sintetizao de Dados
Se a distribuio da varivel simtrica tem-se:


Se a curva assimtrica positiva ou enviesada esquerda:
Se a curva assimtrica negativa ou enviesada direita:

<

<

>

>


37
Medidas de Disperso e
Concentrao
REDUO E SINTETIZAO DE
DADOS
38
Medidas de Disperso e
Concentrao

Medidas de Disperso
REDUO E SINTETIZAO DE
DADOS
39
Medidas de disperso
Servem para verificar a representatividade das medidas de localizao.
muito comum encontrar variveis que, apesar de terem a mesma mdia, so
compostas de valores bem distintos.
X 20 20 20 20 20
Y 15 10 20 25 30

= 20

= 20
Os valores de X no apresentam qualquer variao relativamente mdia.
(X no apresenta qualquer disperso).
Os valores de Y apresentam diferenas significativas relativamente mdia.
(os valores de Y esto dispersos em torna da mdia).
Cap. 3 Reduo e Sintetizao de Dados
40
Medidas de disperso
Razes para calcular uma medida de disperso:
1. Necessidade de se obter um instrumento que permita avaliar a representatividade
do valor mdio num conjunto de dados;
2. Necessidade de se conhecer a disperso dos valores com o objectivo de serem
tomadas medidas concretas para a controlar.
Medidas de
disperso
Intervalo de variao
Intervalo interquartis
Valores apresentam-se na mesma
unidade de medida dos dados
originais.
No recorre ao clculo prvio de uma
medida de localizao.
Desvio absoluto mdio
Varincia
Desvio-padro
Utiliza uma medida de localizao
como termo de comparao.
Cap. 3 Reduo e Sintetizao de Dados
41
Varincia
A expresso da varincia :
2
=
1

=1

N
Peso
(Kg)
1 65
2 75
3 80
4 70
5 67
6 68
7 65
8 64
9 70
10 68
11 65
Peso dos jogadores do SLB
(valores fictcios)

2
=
1
11

2
11
=1

= 68,81
Cap. 3 Reduo e Sintetizao de Dados

=1

42
Varincia
N
Peso
(Kg)
1 65
2 75
3 80
4 70
5 67
6 68
7 65
8 64
9 70
10 68
11 65
Totais

2
=
237,637
11
= 21,60
X
i
-


-3,81
6,19
11,19
1,19
-1,81
-0,81
-3,81
-4,81
1,19
-0,81
-3,81

(X
i
-

)
2

14,516
38,316
125,216
1,416
3,276
0,656
14,516
23,136
1,416
0,656
14,516
237,637
Cap. 3 Reduo e Sintetizao de Dados

= 68,81
43
Varincia
A expresso da varincia :
2
=
1

=1

ou

2
=

=1

Peso
(Kg)
n
i

65 16
67 14
68 17
71 16
72 18
73 15
74 22
75 11
77 17
79 16
83 14
Peso dos jogadores da I Liga
(valores fictcios)
Cap. 3 Reduo e Sintetizao de Dados

=1

=1

44
Varincia
Peso (Kg)
(X
i
)
n
i

65 16
67 14
68 17
71 16
72 18
73 15
74 22
75 11
77 17
79 16
83 14
Totais 176

=
12849
176
= 73

2
=
4349
176
= 24,71
n
i
X
i

1040
938
1156
1136
1296
1095
1628
825
1309
1264
1162
12849


-8
-6
-5
-2
-1
0
1
2
4
6
10

2

64
36
25
4
1
0
1
4
16
36
100

2

1024
504
425
64
18
0
22
44
272
576
1400
4349
Cap. 3 Reduo e Sintetizao de Dados
45
Desvio padro
Desvio padro ou desvio quadrtico mdio a raiz quadrada positiva da varincia:
=
1

=1

Dados no agrupados
=
1

=1

Dados agrupados
ou
=

=1

No exemplo anterior:
= 24,71 = 4,97
Cap. 3 Reduo e Sintetizao de Dados
46
Varincia e desvio padro corrigidos
Dado o enviesamento da varincia da amostra em relao varincia do universo,
quando a amostra pequena, tem que se calcular a varincia corrigida.
O mesmo acontece quanto ao desvio padro.
As frmulas so as seguintes:
Dados no agrupados

1
2
=
1
1

=1

1
2
=
1
1

=1

Dados agrupados

1761
2
=
4349
175
= 24,85
(varincia corrigida)

1761
= 4,98 (desvio padro corrigido)
No exemplo
anterior teramos
Cap. 3 Reduo e Sintetizao de Dados
47
Intervalo de variao
=


= 83 65 = 18
Cap. 3 Reduo e Sintetizao de Dados
Peso (Kg)
(X
i
)
n
i

65 16
67 14
68 17
71 16
72 18
73 15
74 22
75 11
77 17
79 16
83 14
Totais 176
48
Coeficiente de variao
O coeficiente de variao (CV) ou coeficiente de disperso definido por:
=


No exemplo anterior seria:
=
4,97
73
= 0,068
Cap. 3 Reduo e Sintetizao de Dados
Peso (Kg)
(X
i
)
n
i

65 16
67 14
68 17
71 16
72 18
73 15
74 22
75 11
77 17
79 16
83 14
Totais 176
= 4,97

= 73
6,8%
Um CV > 50% alto grau de disperso relativa
(pequena representatividade da mdia como medida estatstica)
Um CV < 50% a mdia ser tanto mais representativa quanto menor
o valor do coeficiente.
49
Desvio absoluto mdio
a mdia dos valores absolutos dos desvios da mdia:
Dados no agrupados Dados agrupados
=
1

=1

=
1

=1

Cap. 3 Reduo e Sintetizao de Dados
50
Desvio absoluto mdio
No exemplo anterior teramos:
Peso (Kg)
(X
i
)
n
i

65 16
67 14
68 17
71 16
72 18
73 15
74 22
75 11
77 17
79 16
83 14
Totais 176
=
695
176
= 3,94


-8
-6
-5
-2
-1
0
1
2
4
6
10


8
6
5
2
1
0
1
2
4
6
10

n
i


128
84
85
32
18
0
22
22
68
96
140
695
Cap. 3 Reduo e Sintetizao de Dados
51
Quantis
Os decis, quartis, percentis, so casos particulares dos quantis.
Usam-se muito os quartis.
O primeiro quartil (q
0,25
) o valor tal que, apresentando-se ordenadas as
observaes da amostra, tem atrs de si 25% dessas observaes ou, inversamente,
tem sua frente 75% delas.
Se F(x) representar a funo acumulada de distribuio, o valor do 1 quartil, q
0,25
,
obtm-se resolvendo a equao:
F(q
0,25
) = 0,25
F(q
0,50
) o 2 quartil.
F(q
0,75
) o 3 quartil.
Cap. 3 Reduo e Sintetizao de Dados
52
Quantis
Por exemplo, o 1 quartil, pode ser obtido pela expresso:

0,25
=

0,25
0

0,25
=

4

0


Frequncias relativas Frequncias absolutas

0
=

0
=


Cap. 3 Reduo e Sintetizao de Dados
53
Quantis
Amplitude interquartis (AIQ) definida por:
Amplitude semi-quartis (ASQ) definida por:
=
0,75

0,25

=

2

Generalizando, podemos definir quantil de ordem p,
1
,
como o valor de que, apresentando-se os dados da amostra ordenados de
forma crescente,

tem trs de si

das observaes ou,


sua frente

observaes.
Cap. 3 Reduo e Sintetizao de Dados
54
Quantis
Exemplo:
As pontuaes de um teste de inteligncia sobre uma amostra de dimenso 200
distriburam-se do seguinte modo:
Classes de valores
(X)
n
i

30-40 6
40-50 18
50-60 76
60-70 68
70-80 22
80-90 10
Calcular o 3 quartil
Resultados do teste de inteligncia
Cap. 3 Reduo e Sintetizao de Dados
55
Quantis
Resoluo
Classes de
valores
(X)
n
i

30-40 6
40-50 18
50-60 76
60-70 68
70-80 22
80-90 10
Totais 200

,
=

0,75
= 60 + 10
0,75 0,50
0,34
= 67,353
Ponto
mdio
35
45
55
65
75
85

f
i

0,03
0,09
0,38
0,34
0,11
0,05
1,00
N
i

6
24
100
168
190
200

F
i

0,03
0,12
0,50
0,84
0,95
1,00

Cap. 3 Reduo e Sintetizao de Dados
frequncias
acumuladas
O terceiro quartil (q
0,75
) o valor tal que,
apresentando-se ordenadas as observaes
da amostra, tem atrs de si 75% dessas
observaes.
56
Medidas de Disperso e
Concentrao

Medidas de Concentrao
REDUO E SINTETIZAO DE
DADOS
57
Conceito
Cap. 3 Reduo e Sintetizao de Dados
Medida de Concentrao
Medir a forma como determinada caracterstica de uma
populao se distribui pelos seus elementos.
Quando faz sentido acumular a caracterstica em estudo num nmero maior ou menor
de elementos da populao.
s possvel
Quando a caracterstica se pode distribuir de modo mais ou menos uniforme, sendo
possvel conceber as seguintes situaes extremas:
Um s elemento da populao detm todo o atributo concentrao mxima;
Cada elemento da populao detm igual parcela do atributo concentrao
mnima.
58
Conceito
Cap. 3 Reduo e Sintetizao de Dados
Pode medir-se a concentrao:
rendimento familiar;
riqueza;
reas de explorao agrcola;
salrios.
No possvel aplicar medidas de
concentrao:
idade;
altura.
Anlise do grau de concentrao de
uma distribuio de frequncias pode
ser efectuada atravs
Curva de Lorenz
ndice de Gini
(indicador numrico)
(grfico)
59
ndice de Gini
Cap. 3 Reduo e Sintetizao de Dados
Classe
(/dia)
[1]
Ponto
mdio
[2]
N.
pessoas
[3]
/dia total
classe
[4]
0 - 10 5 40 200
10 20 15 70 1 050
20 30 25 120 3 000
30 40 35 100 3 500
40 50 45 60 2 700
50 - 60 55 35 1 925
Totais 425 12 375
Distribuio dos salrios dirios da
populao de uma dada localidade
[1] classes de rendimento
[2] ponto mdio da classe
[3] frequncia da classe
[4] produto da 2. pela 3. colunas
[

] [

]
60
ndice de Gini
Cap. 3 Reduo e Sintetizao de Dados


40 200
110 1 250
230 4 250
330 7 750
390 10 450
425 12 375
Totais
Frequncias
acumuladas
do n. de
pessoas
Frequncias
acumuladas
do
rendimento

1
=
40
425

2
=
110
425

1
=
200
12375

2
=
1250
12375

=

1
=1

1
=1

=
0,656922
2,588235
= 0,25


0,094118
0,258824
0,541176
0,776471
0,917647
2,588235


0,016162
0,10101
0,343434
0,626263
0,844444
1,931313


0,077956
0,157813
0,197742
0,150208
0,073203
0,656922
61
ndice de Gini
Cap. 3 Reduo e Sintetizao de Dados
O ndice de Gini varia entre 0 e 1:
0 equidade absoluta
1 concentrao absoluta
62
Curva de Lorenz
Cap. 3 Reduo e Sintetizao de Dados
A curva de Lorenz um grfico usado para representar a repartio de um qualquer
atributo, onde:
Recta de igual distribuio
Curva de Lorenz


Valores acumulados (em termos
relativos) do n. de ocorrncias
Valores acumulados (em termos
relativos) do atributo em estudo
=
63
Curva de Lorenz
Cap. 3 Reduo e Sintetizao de Dados
Repartio bastante uniforme
(a 50% dos indivduos corresponde quase 50% do atributo em estudo)
Fraca concentrao
50% dos indivduos detm 80% do atributo em estudo
Concentrao mais elevada
50% dos indivduos detm menos de 10% do atributo em estudo
Elevada concentrao
64
Medidas de Assimetria e
de Achatamento
REDUO E SINTETIZAO DE
DADOS
65
Medidas de Assimetria e
de Achatamento

Medidas de Assimetria
REDUO E SINTETIZAO DE
DADOS
66
Momentos
A frmula geral do momento de ordem r em relao a c :

,
=
1

=1

,
=
1

=1
=

=1

Dados no agrupados Dados agrupados
Quando = temos um caso particular de momentos, os momentos ordinrios de
ordem r ou momentos de ordem r em relao origem.
Quando =

trata-se dos momentos centrados de ordem r.


Cap. 3 Reduo e Sintetizao de Dados
67
Coeficiente b
1
de Pearson
O coeficiente b
1
a seguinte medida de assimetria de uma distribuio:

1
=

3
2

2
3

m
3
representa o 3 momento em relao mdia e
m
2
representa o 2 momento em relao mdia
Se b
1
> 0 a assimetria positiva.
Se b
1
= 0 a distribuio simtrica.
Se b
1
< 0 assimetria negativa.
Fischer props uma medida alternativa, o coeficiente g
1
de Fisher:


Cap. 3 Reduo e Sintetizao de Dados
68
Coeficiente b
1
de Pearson
Distribuio
simtrica
Assimetria
positiva
Assimetria
negativa
Cap. 3 Reduo e Sintetizao de Dados
69
Coeficiente b
1
de Pearson
Exemplo:
O quadro abaixo lista o nmero de acidentes de trabalho num determinado sector
durante o 1 trimestre de 2008:
X
i
n
i

0 447
1 132
2 42
3 21
4 3
5 2
acidentes
Calcular a assimetria da distribuio
Cap. 3 Reduo e Sintetizao de Dados
70
Coeficiente b
1
de Pearson
Resoluo:
Organizemos os dados de modo a calcular o coeficiente b
1
.

=
301
647
= 0,465

2
=
446,968
647
= 0,691

3
=
788,033
647
= 1,218

1
=

3
2

2
3

1
=
1,484
0,323
= 4,5
Como b
1
= 4,5 > 0
assimetria positiva.
Se utilizssemos o coeficiente g
1
de Fisher
teramos

1
= 4,5 = 2,12
X
i
n
i

0 447
1 132
2 42
3 21
4 3
5 2
Totais 647
n
i
X
i

0
132
84
63
12
10
301


-0,465
0,535
1,535
2,535
3,535
4,535


2

0,216
0,286
2,356
6,425
12,495
20,564

n
i


2

96,746
37,750
98,933
134,927
37,484
41,128
446,968


3

-0,101
0,153
3,615
16,286
44,166
93,254

n
i


3

-45,008
20,188
151,839
342,009
132,497
186,508
788,033
Cap. 3 Reduo e Sintetizao de Dados
71
Medidas de Assimetria e
de Achatamento

Medidas de Achatamento
REDUO E SINTETIZAO DE
DADOS
72
Coeficiente g
2
de Pearson
Para se estudar o achatamento de uma distribuio utiliza-se o coeficiente g
2
de
Pearson, definido do seguinte modo:

2
=
2
3 com

2
=

2
2

Este coeficiente permite-nos saber se a distribuio mais ou menos achatada do
que a distribuio normal.
Geralmente esta medida mais aplicada s distribuies simtricas.
A assimetria de uma distribuio pode ser classificada consoante o valor de g
2
:
Se g
2
> 0 a distribuio leptocrtica ou menos achatada do que a normal.
Se g
2
= 0 a distribuio mesocrtica ou com o mesmo achatamento da normal.
Se g
2
< 0 a distribuio platicrtica ou mais achatada do que a normal.
Cap. 3 Reduo e Sintetizao de Dados
73
Coeficiente g
2
de Pearson
Cap. 3 Reduo e Sintetizao de Dados
74
Coeficiente g
2
de Pearson
Exemplo:
Utilizemos o exemplo anterior e adaptemos o quadro ao clculo de b
2
.
X
i
n
i

0 447
1 132
2 42
3 21
4 3
5 2
Totais 647

2
=
446,968
647
= 0,691

4
=
2445,812
647
= 3,78

2
2
= 0,478

2
=

2
2

2
=
3,78
0,478
= 7,921

2
=
2
3

2
= 7,921 3 = 4,921
a distribuio
leptocrtica porque g
2
> 0.
n
i
X
i

0
132
84
63
12
10
301


-0,465
0,535
1,535
2,535
3,535
4,535


2

0,216
0,286
2,356
6,425
12,495
20,564

n
i


2

96,746
37,750
98,933
134,927
37,484
41,128
446,968


4

0,047
0,082
5,549
41,282
156,116
422,886

n
i


4

20,939
10,796
233,039
866,917
468,348
845,772
2 445,812
Cap. 3 Reduo e Sintetizao de Dados