Você está na página 1de 33

Universidade Federal da Bahia - UFBA

Instituto de Cincias Ambientais e Desenvolvimento Sustentvel


Barreiras - BA
Anlise estatstica descritiva: Dados agrupados em classes
Prof. Marcelo de Paula
Resumo: Nesse texto acadmico apresentamos a metodologia para o
agrupamento de dados quantitativos (discretos ou contnuos) em / classes bem como
seu tratamento estatstico, cuja representao mais simples a distribuio de fre-
quncia. A distribuio de frequncia a distribuio dos dados em classes ou catego-
rias, onde o nmero de elementos pertencentes a cada classe representa a frequncia
da classe. Aconselha-se a trabalhar com dados agrupados em classes sempre quando
estamos trabalhando diretamente com a populao ou quando a amostra for conside-
rada grande. Para a anlise exploratria dos dados agrupados em classes abordamos
as principais medidas descritivas, a saber:
Medidas de tendncia central: Mdia, moda bruta, moda de Czuber e Mediana;
Medidas de disperso: Amplitude, varincia, desvio-padro, coef. de variao;
Medidas separatrizes (Quantis): Tercil, quartil, decil e percentil;
Medidas de assimetria: Coecientes de Pearson e via momentos;
Medias de curtose: Coeciente percentlico e via momentos;
1 Introduo
Para ilustrar a medotologia estatstica usada para dados agrupados em
classes, apresentamos a seguir um estudo de caso real em que fazemos passo a passo
a construo de cada uma das medidas descritivas acima mencionadas.
Estudo de caso: Foram coletadas 270 amostras de solo na fazenda Ponta
da Serra, Caic - RN, em que, para cada amostra, mediu-se o teor de chumbo (em
ppm). Os dados esto descritos na Tabela (1).
1
Tabela (1). Teores de chumbo (ppm) em amostras de solo
coletadas na fazenda Ponta da Serra - Caic-RN.
63 71 69 83 81 70 47 69 57 122 67 24 60 124 87
73 55 80 86 68 53 84 128 51 89 62 61 90 74 51
124 102 43 108 47 94 99 86 82 99 45 66 115 59 74
38 75 99 82 38 96 97 61 79 137 47 127 123 83 66
57 136 66 71 81 41 63 81 40 82 110 49 37 92 60
57 27 109 69 98 92 74 109 81 68 70 72 26 74 80
97 71 86 85 47 95 67 82 110 74 44 93 65 123 72
53 95 92 51 37 103 48 92 62 94 48 89 73 23 58
85 52 60 82 104 83 65 26 113 44 80 53 80 81 86
112 133 86 99 107 56 93 77 109 94 24 43 68 59 91
81 43 84 85 101 67 124 79 74 105 77 54 74 70 59
15 57 60 39 68 63 77 39 28 105 117 131 72 84 85
84 89 52 83 71 69 55 94 101 35 109 104 107 95 73
88 75 66 70 57 34 32 52 108 72 116 66 38 86 48
62 78 105 65 71 90 101 67 76 84 102 114 82 64 110
84 59 47 77 53 81 101 43 56 15 35 105 106 62 84
61 47 92 59 91 88 24 78 110 68 64 111 47 40 51
83 78 103 141 72 54 86 54 59 155 63 95 100 92 84
(1)
Os dados coletados pelo pesquisador na forma em que se encontram, como na
Tabela (1), so denominados dados brutos, ou seja, sem nenhum tratamento estats-
tico. Normalmente estes dados fornecem pouca ou nenhuma informao ao leitor,
sendo necessrio uma organizao am de aumentar sua capacidade de informao.
A mais simples organizao numrica a ordenao dos dados em ordem crescente
ou decrescente. Dados apresentados dessa forma (ordenados) so chamados de ROL.
A Tabela (2) apresenta o ROL de dados referentes aos teores de chumbo (em ppm)
em amostras de solo coletadas na Fazenda Ponta da Serra - Caic-RN.
2
Tabela (2). ROL de dados referentes aos teores de chumbo (em ppm) em amostras
de solo coletadas na Fazenda Ponta da Serra - Caic-RN.
15 38 47 54 60 65 69 73 79 82 86 92 98 105 114
15 39 47 54 60 65 69 74 79 83 86 92 99 105 115
23 39 48 55 60 66 70 74 80 83 86 92 99 106 116
24 40 48 55 60 66 70 74 80 83 86 92 99 107 117
24 40 48 56 61 66 70 74 80 83 86 92 99 107 122
24 41 49 56 61 66 70 74 80 83 86 93 100 108 123
26 43 51 57 61 66 71 74 81 84 86 93 101 108 123
26 43 51 57 62 67 71 74 81 84 87 94 101 109 124
27 43 51 57 62 67 71 75 81 84 88 94 101 109 124
28 43 51 57 62 67 71 75 81 84 88 94 101 109 124
32 44 52 57 62 67 71 76 81 84 89 94 102 109 127
34 44 52 58 63 68 72 77 81 84 89 95 102 110 128
35 45 52 59 63 68 72 77 81 84 89 95 103 110 131
35 47 53 59 63 68 72 77 82 84 90 95 103 110 133
37 47 53 59 63 68 72 77 82 85 90 95 104 110 136
37 47 53 59 64 68 72 78 82 85 91 96 104 111 137
38 47 53 59 64 69 73 78 82 85 91 97 105 112 141
38 47 54 59 65 69 73 78 82 85 92 97 105 113 155
(2)
Como podemos observar na Tabela (2) a simples organizao dos dados
(ROL) aumenta muito capacidade de informao destes, pois, enquanto a Tabela
(1) nos informava apenas que tnhamos 270 valores de teor de chumbo, a Tabela (2)
nos apresenta o menor e o maior valor de teor de chumbo, dando uma idia geral da
variao dos teores de chumbo (em ppm) das amostras de solo coletadas na Fazenda
Ponta da Serra. O menor teor de chumbo encontrado foi de 15 ppm e o maior teor
de chumbo encontrado foi de 155 ppm. Portanto, houve uma variao nas amostras
de 140 ppm.
2 Apresentao tabular
2.1 Distribuies de frequncias
Aps esta primeira organizao dos dados, ou seja, aps a ordenao dos
dados, podemos ainda agrup-los em classes de menor tamanho, am de aumentar sua
a capacidade de informao. Distribuindo os dados observados em classes e contando
o nmero de indivduos contidos em cada classe, obtemos a frequncia absoluta de
cada classe. A disposio tabular dos dados agrupados em classes, juntamente com as
frequncias correspondentes denominamos distribuio de frequncia. Para identicar
uma classe, deve-se conhecer os valores dos limites inferior e superior da classe, que
3
delimitam o intervalo de classe. A construo das classes pode ser feita de maneira
subjetiva, como por exemplo, por meio do conhecimento do pesquisador a respeito da
caracterstica em estudo, ou utilizando algum critrio de categorizao. Apresentamos
nessa Seo trs critrios adotados para o procedimento de categorizao de variveis
quantitativas contnuas ou discretas.
2.2 Construo de uma distribuio de frequncia
Para montar uma distribuio de frequncias necessrio que primeiramente
se determine o nmero de classes (/) em que os dados sero agrupados. Por questes
de ordem prtica e esttica alguns autores sugerem utilizar de 5 a 20 classes. H
vrias indicaes do nmero de classes a ser utilizado, em funo do nmero de dados
(:), dentre elas podemos destacar:
Caso 1. Quando o nmero de dados : _ 100.
/ =
_
:
Caso 2. Quando o nmero de dados : 100.
/ = 5 log(:)
Caso 3. Critrio de SCOTT (1979), baseado na normalidade dos dados:
/ =

3
_
:
3. 49:
sendo
: a amplitude total;
: : o desvio-padro amostral;
: : o nmero de observaes.
Em nosso exemplo temos o nmero de observaes igual a : = 270 e, portanto,
devemos usar o segundo caso, a saber
/ = 5 log(:) = 5 log (270) = 12. 16
/
~
= 12 classes.
Aps determinado o nmero de classes (/) em que os dados sero agrupados,
deve-se ento determinar o intervalo de classe (/), que dado pela seguinte expresso:
4
/ =

/ 1
sendo
/ : a amplitude da classe;
: a amplitude total;
/ : o nmero de classes;
Em nosso exemplo temos
/ =

/ 1
=
140
12 1
= 12. 73 ppm.
/
~
= 13 ppm.
Conhecida a amplitude de classes (/), determina-se ento os intervalos de
classe. Os limites inferior e superior de cada classe devem ser determinados a partir
do limite inferior da primeira classe (11
1
) de modo que o menor valor observado esteja
localizado no ponto mdio da primeira classe, que dado por:
1`
1
=
11
1
+1o
1
2
sendo
1`
1
: o ponto mdio da primeira classe;
11
1
: o limite inferior da classe;
1o
1
: o limite superior da classe;
Assim, o limite inferior da primeira classe (11
1
) ser:
11
1
= A
min

/
2
Em nosso exemplo do teor de chumbo encontrado nas amostras coletadas
temos
11
1
= A
min

/
2
= 15
13
2
= 15 6. 5 = 8. 5.
11
1
= 8. 5 ppm.
E os demais limites so obtidos somando-se / ao limite anterior. Para montar
a distribuio de frequncia, basta apresentar as classes obtidas na forma tabular e
contar quantos indivduos existe cada classe. Apresentando os dados na forma de
distribuio de frequncia, sintetiza-se a informao contida nos mesmos, alm de
facilitar sua visualizao. A apresentao dos dados em forma de distribuio de
frequncia facilita ainda o clculo de vrias medidas estatsticas de interesse, alm de
permitir a apresentao grca dos mesmos. A Tabela (3) apresenta a distribuio de
5
frequncias do teor de chumpo (em ppm) das amostras coletadas na Fazenda Ponta
da Serra (dados agrupados em 12 classes).
Tabela (3). Distribuio de frequncias do teor de chumpo
(em ppm) das amostras coletadas na Fazenda Ponta da Serra.
Limite Limite Frequencia absoluta
Inferior (LI) Superior (LS)
,
i
1
a
classe: 8. 5 ppm 21. 5 ppm 2
2
a
classe: 21. 5 ppm 34. 5 ppm 10
3
a
classe: 34. 5 ppm 47. 5 ppm 26
4
a
classe: 47. 5 ppm 60. 5 ppm 38
5
a
classe: 60. 5 ppm 73. 5 ppm 51
6
a
classe: 73. 5 ppm 86. 5 ppm 60
7
a
classe: 86. 5 ppm 99. 5 ppm 34
8
a
classe: 99. 5 ppm 112. 5 ppm 30
9
a
classe: 112. 5 ppm 125. 5 ppm 11
10
a
classe: 125. 5 ppm 138. 5 ppm 6
11
a
classe: 138. 5 ppm 151. 5 ppm 1
12
a
classe: 151. 5 ppm 164. 5 ppm 1

270
(3)
Frequncia absoluta
A frequncia absoluta (,
i
) nada mais que o nmero de elementos per-
tencentes a i-sima classe, i = 1. 2. .... /. Podemos observar que a soma de todas as
frequncias absolutas igual ao nmero de observaes do conjunto de dados, ou seja,
k

i=1
,
i
= :, sendo : o nmero total de observaes. Na Tabela (3) onde apresen-
tamos um exemplo de distribuio de frequncias, em 12 classes, do teor de chumbo
encontrado nas amostras temos
12

i=1
,
i
= ,
1
+,
2
+,
3
+,
4
+,
5
+,
6
+,
7
+,
8
+,
9
+,
10
+,
11
+,
12
12

i=1
,
i
= 2 + 10 + 26 + 38 + 51 + 60 + 34 + 30 + 11 + 6 + 1 + 1
12

i=1
,
i
= 270 = : (quantidade total de amostras).
6
3 Medidas de posio ou tendncia central
Ao examinar uma distribuio amostral simtrica ou pelo menos aproxi-
madamente simtrica, nota-se que geralmente que os dados so mais frequentes perto
de um valor central e so mais raros ao afastar-se deste. A obteno deste valor
central de importncia fundamental para a pesquisa.
Nessa Seo veremos as medidas de posio ou tendncia central para o caso
em que o dados esto agrupados em classes. Para isso necessrio introduzir o
conceito da Hiptese Tabular Bsica (HTB).
3.1 Hiptese tabular bsica
Para ns de anlises matemticas todas as observaes contidas num in-
tervalo de classe so consideradas iguais ao ponto mdio da classe. Essa hiptese
conhecida como hiptese tabular bsica (HTB). Os clculos das medidas de posio
ou de disperso amostral usando os pontos mdios das classes como representantes de
todos os seus elementos contm menor preciso do que aqueles realizados utilizando
os dados brutos ou elaborados.
No entanto, estes erros, como j constatado por muitos pesquisadores em
estatstica, podem ser considerados desprezveis e, portanto, devem ser ignorados. A
vantagem de se utilizar a distribuio de frequncia refere-se simplicao estru-
tural dos dados sem grandes perdas de preciso, bem como o aumento da facilidade
de clculos devido a estas simplicaes, alm de fornecer uma idia da forma da
distribuio da varivel por meio da representao grca.
Para o clculo das medidas de tendncia central para dados agrupados em
classes tais como a mdia, a moda e a mediana, necessrio acrescentar algumas
colunas a mais na Tabela (3) conforme mostra a Tabela (4):
7
Tabela (4). Dados do teor de chumpo (em ppm) agrupados em classes.
Limite Limite Frequencia absoluta
Inferior (LI) Superior (LS)
,
i
A
i
,
i
A
i
1
i
1:
i
%
8. 5 21. 5 2 15 30 2 0. 74
21. 5 34. 5 10 28 280 12 4. 44
34. 5 47. 5 26 41 1066 38 14. 07
47. 5 60. 5 38 54 2052 76 28. 15
60. 5 73. 5 51 67 3417 127 47. 07
73. 5 86. 5 60 80 4800 187 69. 26
86. 5 99. 5 34 93 3162 221 81. 85
99. 5 112. 5 30 106 3180 251 92. 96
112. 5 125. 5 11 119 1309 262 97. 04
125. 5 138. 5 6 132 792 268 99. 26
138. 5 151. 5 1 145 145 269 99. 63
151. 5 164. 5 1 158 158 270 100

270 20.391
(4)
Frequncia acumulada absoluta
Muitas vezes o nosso interesse no reside na quantidade de observaes
que existe numa determinada classe, mas sim em saber a quantidade de observaes
acima ou abaixo de um determinado ponto na distribuio. Deste modo, a soma das
frequncias de todos os valores abaixo do limite superior de uma determinada classe
denida como frequncia acumulada at o ponto de interesse. Desta forma temos:
1
i
=
t

i=1
,
i
, t _ /;
sendo
,
i
: a frequncia absoluta da i-sima classe, i = 1. 2. .... t, t _ /;
t

i=1
,
i
: o somatrio de todas as frequncias absolutas at a classe t em
questo (t _ /).
Podemos observar que
1
i
1
i1
= ,
i
, i = 2. 3. .... /, ou ainda
t

i=1
,
i

t1

i=1
,
i
= ,
i
, t _ /.
Por exemplo, podemos observar na Tabela (4) que a frequncia absoluta da
segunda classe (,
2
= 10) igual a frequncia acumulada da segunda classe (1
2
= 12)
menos a frequncia acumulada da primeira classe (1
1
= 2). A frequncia absoluta da
terceira classe (,
3
= 26) igual a frequncia acumulada da terceira classe (1
3
= 38)
8
menos a frequncia acumulada da segunda classe (1
2
= 12), e assim por diante para
as demais classes.
Frequncia acumulada relativa percentual
A frequncia acumulada relativa percentual da i-sima classe, i = 1. 2. .... /,
dada por:
1:
i
% = 1:
i
100%, t _ /;
Podemos observar que
1:
i
%1:
i1
% = ,:
i
%, i = 2. 3. .... /, ou ainda
t

i=1
,:
i
%
t1

i=1
,:
i
% = ,:
i
%, t _ /.
3.2 Mdia
A mdia a principal medida de posio, sendo utilizada principalmente
quando os dados apresentam distribuio simtrica ou aproximadamente simtrica,
como acontece com a maioria das situaes prticas. Deve-se diferenciar, por meio
de notao apropriada mdia populacional da amostral.
A populao refere-se a todos os elementos de interesse do pesquisador para
a qual ca praticamente impossvel tomar as informaes elemento a elemento. A
amostra por sua vez refere-se a um subconjunto de elementos desta populao e
obtida de acordo com alguns critrios, de tal forma que haja uma representatividade
da populao da qual foi extrada, e para qual se deseja extrapolar as informaes
(inferncias estatsticas).
No exemplo anterior da plantao de milho, a populao refere-se a todos os
10.000ha plantados e uma amostra poderia ser de 20ha distribudos ao acaso pela
regio plantada. Ser utilizada para diferenciar a mdia da amostra e da populao
a seguinte notao:
Mdia populacional: Mdia amostral:
j =
k

i=1
f
i
X
i
k

i=1
f
i
A =
k

i=1
f
i
X
i
k

i=1
f
i
em que:
A
i
: o ponto mdio da i-sima classe, i = 1. 2. .... /.
,
i
: o frequncia absoluta da i-sima classe, i = 1. 2. .... /.
Ento no exemplo do teor de chumbo temos:
9
A =
k

i=1
,
i
A
i
k

i=1
,
i
=
20.391
270
= 75. 52 ppm.
Interpretao: A quantidade mdia do teor de chumbo nas amostras de
solo coletadas na fazenda Ponta da Serra - Caic-RN de 75. 52 ppm, ou ainda, o
valor mdio do qual os teores de chumbo se concentram de 75. 52 ppm.
3.3 Mediana
No caso de dados agrupados a mediana pode ser calculada de acordo com a
seguinte expresso:
`c = 11
Me
+
_
_
_
_
_
_
_
1
2
k

i=1
,
i
1
ant
,
Me
_
_
_
_
_
_
_
/
Onde:
11
Me
: o limite inferior da classe que contem a mediana;
1
ant
: a frequncia acumulada anterior classe que contem a mediana;
,
Me
: a frequncia absoluta da classe mediana;
/ : a altura (amplitude) da classe mediana;
Ento no exemplo do teor de chumbo, a partir da Tabela (4), temos:
`c = 11
Me
+
_
_
_
_
_
_
_
1
2
k

i=1
,
i
1
ant
,
Me
_
_
_
_
_
_
_
/ = 73. 5 +
_
270
2
127
60
_
13
`c = 75. 23 ppm.
Interpretao: 50% das amostras apresentaram um teor de chumbo abaixo
de 75. 23 ppm. Equivalentemente 50% das amostras apresentaram um teor de chumbo
acima de 75. 23 ppm.
10
3.4 Moda bruta
Seja um conjunto de dados agrupados em / classes, ento sua moda bruta
dada por:
`o
b
= 11
Mo
+
/
2
onde:
11
MO
: o limite inferior da classe modal;
/ : a amplitude da classe modal;
Ento no exemplo do teor de chumbo, a partir da Tabela (4), temos que a
moda bruta dada por
`o
b
= 11
Mo
+
/
2
= 73. 5 +
13
2
= 81
`o
b
= 81 ppm.
Interpretao: O valor bruto mais frequente do teor de chumbo nas amostras
de solo coletadas na fazenda Ponta da Serra - Caic-RN de 81 ppm.
3.5 Moda de Czuber
A moda denida para dados qualitativos ou para quantitativos discretos
como sendo o valor de maior frequncia na amostra. Para dados quantitativos contn-
uos a moda o valor de maior densidade. Portanto para dados quantitativos contnuos
o estimador da moda baseado na distribuio de frequncias. Esse estimador busca
encontrar o ponto de mximo do polgono de frequncias.
O estimador da moda para dados quantitativos contnuos denido a partir
da distribuio de frequncia por meio de um mtodo geomtrico, a partir do his-
tograma de frequncias (Mtodo de Czuber). Este mtodo baseado na inuncia
que as classes adjacentes exercem sobre a moda, deslocando-a no sentido da classe de
maior frequncia, o qual conduz a seguinte expresso:
`o = 11
Mo
+

1

1
+
2
/
Onde:
11
Mo
: o limite inferior da classe modal (classe mais frequente);

1
: a diferena entre a classe modal e a classe anterior;

2
: a diferena entre a classe modal e a classe posterior;
/ : a altura (amplitude) da classe modal;
Ento no exemplo do teor de chumbo, a partir da Tabela (4), temos que a
moda de Czuber dada por
11
`o = 11
Mo
+

1

1
+
2
/ = 73. 5 +
_
9
9 + 26
_
13
`o = 76. 84 ppm.
Interpretao: O valor mais frequente do teor de chumbo nas amostras de
solo coletadas na fazenda Ponta da Serra - Caic-RN de 76. 84 ppm.
Observao: Quando a classe modal a primeira classe ento no h classe
anterior e, portanto,
1
a prpria frequncia absoluta da primeira classe ,
1
, pois a
frequncia absoluta da classe anterior zero j que ela nao existe, ou seja

1
= ,
1
0 = ,
1
.
Analogamente, quando a classe modal a ltima classe ento no h classe
posterior e, portanto,
2
a prpria frequncia absoluta da ltima classe ,
k
, pois a
frequncia absoluta da classe posterior zero j que ela nao existe, ou seja

2
= ,
k
0 = ,
k
.
A Figura (5) mostra geometricamente a obteno da Moda para dados agru-
pados em classes pelo mtodo de Czuber.
Figura (5). Obteno da Moda pelo mtodo de Czuber.
(5)
12
No histograma acima, marca-se, na classe modal, os vrtices A, B, C e D.
Traa-se as retas AC e BD. No ponto de interseco destas retas (ponto E) traa-se
uma perpendicular ao eixo das classes, localizando o ponto Mo, valor da moda. O
ponto Mo divide o intervalo da classe modal (que mede /) em duas partes, cujos
comprimentos so proporcionais a
1
e
2
. Notamos pela Figura (5) que
1
a
diferena entre a frequncia da classe modal e da classe imediatamente anterior, e
2
a diferena entre as frequncias da classe modal e da imediatamente posterior.
Por E traa-se a reta FG, paralela ao eixo das classes, obtendo assim, os
segmentos EF e EG, que representam as alturas dos tringulos ABE e CDE. Sendo
11
Mo
o limite inferior da classe modal, 1o
Mo
o limite superior e x a distncia entre
11
Mo
e a moda (Mo), verica-se na Figura (5) que:
`o = 11
Mo
+r (6)
Como os tringulos ABE e CDE so semelhantes (pois possuem dois ngulos
iguais) segue que:
EF
AB
=
EG
CD
=
r

1
=
/ r

2
Resolvendo a equao em funo de r obtemos
r
2
=
1
(/ r)
r
2
=
1
/
1
r
r
2
+
1
r =
1
/
r (
1
+
2
) =
1
/
r =

1
/

1
+
2
Desse forma temos que
r =

1

1
+
2
/ (7)
Substituindo (7) em (6) obtemos nalmente a expresso para a Moda pelo
mtodo de Czuber
`o = 11
Mo
+r
`o = 11
Mo
+

1

1
+
2
/
O estimador da moda pode tambm ser considerado como o valor mdio da
classe modal (moda bruta), como apresentado por diversos autores. A justicativa
13
dada pela hiptese tabular bsica, que diz que todos os valores de uma classe so iguais
ao seu ponto mdio. Como neste caso a classe modal a de maior frequncia, a moda
considerada como igual a este ponto mdio. Nesse material o mtodo geomtrico
anteriormente apresentado considerado, por ser considerado mais eciente.
Fato: Se a distribuio de frequncias for perfeitamente simtrica ento
temos que
1
=
2
, e o valor modal para este caso particular se resume na moda
bruta, ou seja,
`o = 11
Mo
+
/
2
Demonstrao: como
1
=
2
ento segue que
`o = 11
Mo
+

1

1
+
2
/
= 11
Mo
+

1

1
+
1
/
= 11
Mo
+

1
2
1
/
`o = 11
Mo
+
/
2
conveniente comentar que as calculadoras eletrnicas no fornecem os cl-
culos da mediana e da moda, o que para grandes conjuntos de dados, seus clculos
exatos podem ser extremamente laborioso. A moda de Czuber mais apurada para
o conjunto de dados, ou seja, mais renada no que diz respeito ao valor modal em
relao a moda bruta. Na prtica, quando o conjunto de dados muito grande ento
a moda de Czuber a e moda bruta so bem prximas.
4 Medidas de disperso
Para avaliar o grau de variabilidade ou disperso dos valores de um conjunto
de dados agrupados em classes, usaremos as medidas de disperso j estudadas para
o caso de dados no agrupados. Essas medidas nos proporcionaro um conhecimento
mais completo do fenmeno a ser analisado, permitindo estabelecer comparaes entre
fenmenos da mesma natureza e mostrando at que ponto os valores se distribuem
acima ou abaixo da medida de tendncia central. Nesse trabalho apresentamos a
seguir a varincia e o desvio-padro. Para o clculo das medidas de disperso tais
como a varincia e o desvio-padro necessrio acrescentar algumas colunas na Tabela
(4) conforme mostra a Tabela (8):
14
Tabela (8). Dados do teor de chumpo (em ppm) agrupados em classes.
Limite Limite Frequencia absoluta
Inferior (LI) Superior (LS)
,
i
A
i
,
i
A
i
1
i
1:
i
% ,
i
A
2
i
8. 5 21. 5 2 15 30 2 0. 74 450
21. 5 34. 5 10 28 280 12 4. 44 7.840
34. 5 47. 5 26 41 1066 38 14. 07 43.706
47. 5 60. 5 38 54 2052 76 28. 15 110.808
60. 5 73. 5 51 67 3417 127 47. 07 228.939
73. 5 86. 5 60 80 4800 187 69. 26 384.000
86. 5 99. 5 34 93 3162 221 81. 85 294.066
99. 5 112. 5 30 106 3180 251 92. 96 337.080
112. 5 125. 5 11 119 1309 262 97. 04 155.771
125. 5 138. 5 6 132 792 268 99. 26 104.544
138. 5 151. 5 1 145 145 269 99. 63 21.025
151. 5 164. 5 1 158 158 270 100 24.964

270 20.391 1.713.193


(8)
4.1 Varincia
Para o caso de dados agrupados em classes a varincia populacional e amostral
so dadas respectivamente por:
Varincia populacional: Varincia amostral:
o
2
=
1
N
_
_
k

i=1
,
i
A
2
i

1
N
_
k

i=1
,
i
A
i
_
2
_
_
:
2
=
1
n1
_
_
k

i=1
,
i
A
2
i

1
n
_
k

i=1
,
i
A
i
_
2
_
_
em que:
A
i
: o ponto mdio da i-sima classe i = 1. 2. .... /.
,
i
: o frequncia absoluta da i-sima classe i = 1. 2. .... /.
Ento no exemplo do teor de chumbo, a varincia amostral dada por
:
2
=
1
: 1
_
_
k

i=1
,
i
A
2
i

1
:
_
k

i=1
,
i
A
i
_
2
_
_
=
1
270 1
_
1.713.193
(20.391)
2
270
_
:
2
= 643. 94 ppm
2
.
15
4.2 Desvio-padro
Para o caso de dados agrupados em classes o desvio-padro populacional e
amostral so dados respectivamente por:
Desvio-padro populacional: Desvio-padro amostral:
o =
_
o
2
: =
_
:
2
=

_
1
N
_
_
k

i=1
,
i
A
2
i

1
N
_
k

i=1
,
i
A
i
_
2
_
_
=

_
1
n1
_
_
k

i=1
,
i
A
2
i

1
n
_
k

i=1
,
i
A
i
_
2
_
_
em que:
A
i
: o ponto mdio da i-sima classe i = 1. 2. .... /.
,
i
: o frequncia absoluta da i-sima classe i = 1. 2. .... /.
Ento no exemplo do teor de chumbo, o desvio-padro amostral dada por:
: =
_
:
2
=
_
643. 94 ppm
2
: = 25. 38 ppm.
4.3 Coeciente de variao
O coeciente de variao o quociente percentual entre o desvio-padro e a
mdia do conjunto de dados, sendo expresso por
C\ =
:
A
100%.
Em nosso exemplo do teor de chumbo das amostras coletadas, temos
C\ =
25. 38
75. 52
100%
C\ = 33. 61%.
5 Medidas separatrizes (quantis)
Medidas separatrizes (ou quantis) so medidas que dividem o conjunto de
dados ordenados (ROL) em partes iguais em termos de quantidade de observaes.
Na estatstica descritiva usa-se frequentemente o Tercil, Quartil, o Decil e o Percentil.
16
5.1 Tercil
Os tercis separam um conjunto de dados ordenados (ROL) em tres partes
iguais. A Figura abaixo mostra gracamente a diviso do conjunto de dados por meio
de dos tercis.
1
1
1
2
1
3
0 1,3 2,3 3,3
Assim:
1
1
: o primeiro tercil, deixa 1,3 (33. 33%) dos elementos abaixo dele;
1
2
: o segundo tercil, deixa 2,3 (66. 67%) dos elementos abaixo dele;
1
3
: o terceiro tercil, deixa 3,3 (100%) dos elementos abaixo dele;
A expresso abaixo nos fornece o valor do i-simo tercil (1
i
), i = 1. 2. 3,
para dados agrupados em classes.
1
i
= 11
T
i
+
_
_
_
_
_
_
_
i
3
k

i=1
,
i
1
ant
,
T
i
_
_
_
_
_
_
_
/,
em que
11
T
i
: o limite inferior da classe que contm o 1
i
, i = 1. 2. 3;
1
ant
: a frequncia acumulada anterior classe que contm o 1
i
, i = 1. 2. 3;
,
T
i
: a frequncia da classe que contm o 1
i
, i = 1. 2. 3;
/ : a altura (amplitude) da classe que contm o 1
i
, i = 1. 2. 3;
Clculo do primeiro tercil (1
1
) - Exemplo do teor de chumbo das amostras.
1
1
= 11
T
1
+
_
_
_
_
_
_
_
1
3
k

i=1
,
i
1
ant
,
T
1
_
_
_
_
_
_
_
/ = 60. 5 +
_
1
3
270 76
51
_
13
1
1
= 64. 07 ppm.
Interpretao: 1,3 das amostras apresentaram um teor de chumbo abaixo de
64. 07 ppm ou equivalentemente 2,3 das amostras apresentaram um teor de chumbo
acima de 64. 07 ppm.
Clculo do segundo tercil (1
2
) - Exemplo do teor de chumbo das amostras.
17
1
2
= 11
T
2
+
_
_
_
_
_
_
_
2
3
k

i=1
,
i
1
ant
,
T
2
_
_
_
_
_
_
_
/ = 73. 5 +
_
2
3
270 127
60
_
13
1
2
= 84. 98 ppm.
Interpretao: 2,3 das amostras apresentaram um teor de chumbo abaixo de
84. 98 ppm ou equivalentemente 1,3 das amostras apresentaram um teor de chumbo
acima de 84. 98 ppm.
Clculo do terceiro tercil (1
3
) - Exemplo do teor de chumbo das amostras.
1
3
= 11
T
3
+
_
_
_
_
_
_
_
3
3
k

i=1
,
i
1
ant
,
T
3
_
_
_
_
_
_
_
/ = 151. 5 +
_
3
3
270 269
1
_
13
1
3
= 164. 5 ppm.
Interpretao: 3,3 (100%) das amostras apresentaram um teor de chumbo
abaixo de 164. 5 ppm.
Observao: O ltimo tercil sempre vai assumir um valor igual ao limite superior
da ltima classe (1o
k
).
5.2 Quartil
Os quartis separam um conjunto de dados ordenados (ROL) em quatro
partes iguais. A Figura abaixo mostra gracamente a diviso do conjunto de dados
por meio de dos quartis.
Q
1
Q
2
Q
3
Q
4
0% 25% 50% 75% 100%
assim:
Q
1
: o primeiro quartil, deixa 25% dos elementos abaixo dele;
Q
2
: o segundo quartil, deixa 50% dos elementos abaixo dele;
Q
3
: o terceiro quartil, deixa 75% dos elementos abaixo dele;
Q
4
: o quarto quartil, deixa 100% dos elementos abaixo dele;
A expresso abaixo nos fornece o valor do i-simo quartil (Q
i
), i = 1. 2. 3. 4,
para dados agrupados em classes.
18
Q
i
= 11
Q
i
+
_
_
_
_
_
_
_
i
4
k

i=1
,
i
1
ant
,
Q
i
_
_
_
_
_
_
_
/
Onde:
11
Q
i
: o limite inferior da classe que contm o Q
i
, i = 1. 2. 3. 4;
1
ant
: a frequncia acumulada anterior classe que contm o Q
i
, i = 1. 2. 3. 4;
,
Q
i
: a frequncia da classe que contm o Q
i
, i = 1. 2. 3. 4;
/ : a altura (amplitude) da classe que contm o Q
i
, i = 1. 2. 3. 4;
Observao: A expresso algbrica que nos fornece o clculo do segundo quartil
(Q
2
) coincide com a expresso da mediana, pois ambas as medidas, `c e Q
2
nos
fornece 50% dos dados abaixo de si mesma. Portanto, quando nos referimos ao
segundo quartil da distribuio estamos nos referindo a mediana da distribuio.
Vamos determinar o Q
1
. Q
2
. Q
3
e Q
4
no exemplo do teor de chumbo.
Clculo do primeiro quartil (Q
1
) - Exemplo do teor de chumbo das amostras.
Q
1
= 11
Q
1
+
_
_
_
_
_
_
_
1
4
k

i=1
,
i
1
ant
,
Q
1
_
_
_
_
_
_
_
/ = 47. 5 +
_
1
4
270 38
38
_
13
Q
1
= 57. 59 ppm.
Interpretao: 25% das amostras apresentaram um teor de chumbo abaixo de
57. 59 ppm ou equivalentemente 75% das amostras apresentaram um teor de chumbo
acima de 57. 59 ppm.
Clculo do segundo quartil (Q
2
) - Exemplo do teor de chumbo das amostras.
Q
2
= 11
Q
2
+
_
_
_
_
_
_
_
2
4
k

i=1
,
i
1
ant
,
Q
2
_
_
_
_
_
_
_
/ = 73. 5 +
_
2
4
270 127
60
_
13
Q
2
= 75. 23 ppm.
Interpretao: 50% das amostras apresentaram um teor de chumbo abaixo de
75. 23 ppm ou equivalentemente 50% das amostras apresentaram um teor de chumbo
acima de 75. 23 ppm.
19
Podemos notar que o valor obtido de Q
2
o mesmo valor obtido da mediana `c.
Clculo do terceiro quartil (Q
3
) - Exemplo do teor de chumbo das amostras.
Q
3
= 11
Q
3
+
_
_
_
_
_
_
_
3
4
k

i=1
,
i
1
ant
,
Q
3
_
_
_
_
_
_
_
/ = 86. 5 +
_
3
4
270 187
34
_
13
Q
3
= 92. 43 ppm.
Interpretao: 75% das amostras apresentaram um teor de chumbo abaixo de
92. 43 ppm ou equivalentemente 25% das amostras apresentaram um teor de chumbo
acima de 92. 43 ppm.
Clculo do quarto quartil (Q
4
) - Exemplo do teor de chumbo das amostras.
Q
4
= 11
Q
4
+
_
_
_
_
_
_
_
4
4
k

i=1
,
i
1
ant
,
Q
4
_
_
_
_
_
_
_
/ = 151. 5 +
_
4
4
270 269
1
_
13
Q
4
= 164. 5 ppm.
Interpretao: 100% das amostras apresentaram um teor de chumbo abaixo de
164. 5 ppm.
Observao: O ltimo quartil sempre vai assumir um valor igual ao limite su-
perior da ltima classe (1o
k
).
5.3 Decil
So valores que dividem uma srie de dados ordenados em dez partes iguais.
A Figura abaixo mostra gracamente a diviso do conjunto de dados por meio de dos
decis.
1
1
1
2
1
3
1
4
1
5
1
6
1
7
1
8
1
9
1
10
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
assim:
20
1
1
: o primeiro decil, deixa 10% dos elementos abaixo dele;
1
2
: o segundo decil, deixa 20% dos elementos abaixo dele;
1
3
: o terceiro decil, deixa 30% dos elementos abaixo dele;
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
10
: o dcimo decil, deixa 100% dos elementos abaixo dele;
O i-simo decil, i = 1. 2. ..... 10, de um conjunto de observaes organizadas
na forma de uma distribuio de frequncias expresso por:
1
i
= 11
D
i
+
_
_
_
_
_
_
i
10

n

i=1
,
i
1
ant
,
D
i
_
_
_
_
_
_
/
Onde:
11
D
i
: o limite inferior da classe que contm o 1
i
;
1
ant
: a frequncia acumulada anterior classe que contm o 1
i
;
,
D
i
: a frequncia da classe que contm o 1
i
;
/ : a altura (amplitude) da classe que contm o 1
i
;
No exemplo do teor de chumbo nas amostras temos:
1
1
= 42 ppm. Interpretao: 10% das amostras apresentaram um teor de chumbo
abaixo de 42 ppm, ou equivalentemente 90% das amostras apresentaram um teor de
chumbo acima de 42 ppm.
1
2
= 52. 97 ppm. Interpretao: 20% das amostras apresentaram um teor de
chumbo abaixo de 52. 97 ppm, ou equivalentemente 80% das amostras apresentaram
um teor de chumbo acima de 52. 97 ppm.
1
3
= 61. 77 ppm. Interpretao: 30% das amostras apresentaram um teor de
chumbo abaixo de 61. 77 ppm, ou equivalentemente 70% das amostras apresentaram
um teor de chumbo acima de 61. 77 ppm.
1
4
= 68. 66 ppm. Interpretao: 40% das amostras apresentaram um teor de
chumbo abaixo de 68. 66 ppm, ou equivalentemente 60% das amostras apresentaram
um teor de chumbo acima de 68. 66 ppm.
1
5
= 75. 23 ppm. Interpretao: 50% das amostras apresentaram um teor de
chumbo abaixo de 75. 23 ppm, ou equivalentemente 50% das amostras apresentaram
um teor de chumbo acima de 75. 23 ppm.
1
6
= 81. 08 ppm. Interpretao: 60% das amostras apresentaram um teor de
chumbo abaixo de 81. 08 ppm, ou equivalentemente 40% das amostras apresentaram
um teor de chumbo acima de 81. 08 ppm.
1
7
= 87. 26 ppm. Interpretao: 70% das amostras apresentaram um teor de
chumbo abaixo de 87. 26 ppm, ou equivalentemente 30% das amostras apresentaram
um teor de chumbo acima de 87. 26 ppm.
1
8
= 97. 59 ppm. Interpretao: 80% das amostras apresentaram um teor de
chumbo abaixo de 97. 59 ppm, ou equivalentemente 20% das amostras apresentaram
21
um teor de chumbo acima de 97. 59 ppm.
1
9
= 109. 03 ppm. Interpretao: 90% das amostras apresentaram um teor de
chumbo abaixo de 109. 03 ppm, ou equivalentemente 10% das amostras apresentaram
um teor de chumbo acima de 109. 03 ppm.
1
10
= 164. 5 ppm. Interpretao: 100% das amostras apresentaram um teor de
chumbo abaixo de 164. 5 ppm.
5.4 Percentil
So valores que dividem uma srie de dados ordenados em 100 partes iguais.
A Figura abaixo mostra gracamente a diviso do conjunto de dados por meio de dos
percentis.
1
1
1
2
1
3
1
50
1
51
1
98
1
99
1
100
0% 1% 2% 3% 50% 51% 98% 99% 100%
assim:
1
1
: o primeiro percentil, deixa 1% dos elementos abaixo dele;
1
2
: o segundo percentil, deixa 2% dos elementos abaixo dele;
1
3
: o terceiro percentil, deixa 3% dos elementos abaixo dele;
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
10
: o centsimo percentil, deixa 100% dos elementos abaixo dele;
O i-simo percentil, i = 1. 2. ..... 100, de um conjunto de observaes organi-
zadas na forma de uma distribuio de frequncias pode ser obtido por:
1
i
= 11
P
i
+
_
_
_
_
_
_
i
100

n

i=1
,
i
1
ant
,
P
i
_
_
_
_
_
_
/
Onde:
11
P
i
: o limite inferior da classe que contm o 1
i
;
1
ant
: a frequncia acumulada anterior classe que contm o 1
i
;
,
P
i
: a frequncia da classe que contm o 1
i
;
/ : a altura (amplitude) da classe que contm o 1
i
;
No exemplo do teor de chumbo nas amostras vamos determinar os percentis
1
33
, 1
84
, e 1
99
:
Clculo do trigsimo terceiro percentil (1
33
) - Exemplo do teor de chumbo
das amostras.
22
1
33
= 11
P
33
+
_
_
_
_
_
_
_
33
100
k

i=1
,
i
1
ant
,
P
33
_
_
_
_
_
_
_
/ = 60. 5 +
_
33
100
270 76
51
_
13
1
33
= 63. 84 ppm.
Interpretao: 33% das amostras apresentaram um teor de chumbo abaixo de
63. 84 ppm, ou equivalentemente 67% das amostras apresentaram um teor de chumbo
acima de 63. 84 ppm.
Clculo do octogsimo quarto terceiro percentil (1
84
) - Exemplo do teor
de chumbo das amostras.
1
84
= 11
P
84
+
_
_
_
_
_
_
_
84
100
k

i=1
,
i
1
ant
,
P
84
_
_
_
_
_
_
_
/ = 99. 5 +
_
84
100
270 221
30
_
13
1
84
= 102. 01 ppm.
Interpretao: 84% das amostras apresentaram um teor de chumbo abaixo de
102. 01 ppm, ou equivalentemente 16% das amostras apresentaram um teor de chumbo
acima de 102. 01 ppm.
Clculo do nonagsimo nono percentil (1
99
) - Exemplo do teor de chumbo
das amostras.
1
99
= 11
P
99
+
_
_
_
_
_
_
_
84
100
k

i=1
,
i
1
ant
,
P
99
_
_
_
_
_
_
_
/ = 99. 5 +
_
99
100
270 262
6
_
13
1
99
= 136. 98 ppm.
Interpretao: 99% das amostras apresentaram um teor de chumbo abaixo de
136. 98 ppm, ou equivalentemente 1% das amostras apresentaram um teor de chumbo
acima de 136. 98 ppm.
Observao: Podemos vericar no exemplo do teor de chumbo nas amostras
que
23
`c = Q
2
= 1
5
= 1
50
= 75. 23 ppm.
e que
1
3
= Q
4
= 1
10
= 1
100
= 1o
k
= 164. 5 ppm.
6 Medidas de assimetria
Como foi visto anteriormente, vrias medidas sintetizadoras da amostra so
apresentadas, destacando-se as medidas de tendncia central e as medidas de disper-
so, cada qual com suas particularidades e caractersticas. So apresentadas, tambm,
formas grcas para avaliao da natureza da distribuio dos dados. Neste ltimo
caso por uma inspeo emprica o pesquisador podia inferir que tipo de distribuio
os dados de sua pesquisa apresentavam. Naquele instante deu-se nfase a simetria da
distribuio, ou seja, se a forma da distribuio apresentava uma concentrao maior
dos valores em torno do valor central e se medida que se afastassem em ambas
as direes deste centro, o comportamento se mantinha semelhante, reduzindo-se as
frequncias. Uma forma de se estimar o grau de assimetria pode ser dada pelo coe-
ciente de assimetria. Nesse trabalho apresentamos os trs coecientes de assimetria
mais usados:
Primeiro coeciente de assimetria de Pearson;
Segundo coeciente de assimetria de Pearson;
Coeciente de assimetria via mtodo dos momentos;
Para todos os coecientes de assimetria acima citados vale a interpretao da
Tabela (9) que apresenta a classicao das distribuies quanto a assimetria.
Tabela (9). Classicao das distribuies quanto a assimetria.
Co = 0 Distribuio simtrica perfeita.
Co 0 Distribuio assimtrica direita (assimtrica positiva).
Co < 0 Distribuio assimtrica esquerda (assimtrica negativa).
(9)
A Figura (10) apresenta os tipos de distribuies quanto ao coeciente de
assimetria.
24
Figura (10). Tipos de distribuies quanto ao coeciente de assimetria.
Simtrica perfeita Assimtrica direita Assimtrica esquerda
Co = 0 Co 0 Co < 0
(10)
Nas situaes reais da pesquisa, esta informao de grande valia, uma vez,
que os processos de deciso e estimao so baseados em distribuies simtricas.
Como os dados destas pesquisas referem-se a amostras de uma populao, dicilmente
o coeciente de assimetria ser exatamente igual zero, mesmo quando proveniente de
uma distribuio sabidamente simtrica. Em geral temos distribuies aproximada-
mente simtricas. Por essa razo, vrios autores adotam escalas para o coeciente de
assimetria, tais como a escala abaixo:
Se Co < 0. 10 ento temos uma distribuio assimtrica negativa ou as-
simtrica esquerda.
Se 0. 10 < Co < 0. 10 ento temos uma distribuio aproximadamente simtrica.
Se Co 0. 10 ento temos uma distribuio assimtrica positiva ou assimtrica
direita.
6.1 Primeiro coeciente de assimetria de Pearson
O primeiro coeciente de assimetria de Pearson expresso por:
Co
1
=
A `o
:
em que:
A : a mdia do conjunto de dados;
`o : a moda de Czuber do conjundo de dados;
: : o desvio-padro do conjunto de dados;
Podemos observar que tal medida considera apenas a distncia entre a mdia
e a moda. Em nosso exemplo do teor de chumbo encontrado nas amostras de solo
coletadas na Fazenda Ponta da Serra, temos
25
Co
1
=
A `o
:
=
75. 52 76. 84
25. 23
Co
1
= 0. 0520
Interpretao: De acordo com o primeiro coeciente de assimetria de Pearson,
como temos 0. 10 < Co = 0. 0520 < 0. 10 podemos armar que temos uma
distribuio aproximadamente simtrica.
6.2 Segundo coeciente de assimetria de Pearson
O segundo coeciente de assimetria de Pearson expresso por:
Co
2
=
3
_
A `c
_
:
em que:
A : a mdia do conjunto de dados;
`c : a mediana do conjundo de dados;
: : o desvio-padro do conjunto de dados;
Podemos observar que tal medida considera apenas a distncia entre a mdia
e a mediana. Em nosso exemplo do teor de chumbo encontrado nas amostras de solo
coletadas na Fazenda Ponta da Serra, temos
Co
2
=
3
_
A `c
_
:
=
3 (75. 52 75. 23)
25. 23
Co
2
= 0. 0343
Interpretao: De acordo com o segundo coeciente de assimetria de Pearson,
como temos 0. 10 < Co = 0. 0343 < 0. 10 podemos armar que temos uma dis-
tribuio aproximadamente simtrica.
6.3 Momentos
Momento de ordem r de um conjunto quantitativo de dados
Considere um conjunto de dados quantitativos (discreto ou contnuo) dado
por A
1
. A
2
. .... A
n
ento seu r-simo momento dado por
`
r
=
n

i=1
A
r
i
:
=
A
r
1
+A
r
2
+... +A
r
3
:
, : = 1. 2. 3. ...
26
Se : = 1 temos que o primeiro momento igual a mdia dos dados, ou seja,
`
1
= A.
Momento de ordem r em relao a uma origem C de um conjunto
quantitativo de dados
Considere um conjunto de dados quantitativos (discreto ou contnuo) dado
por A
1
. A
2
. .... A
n
ento seu r-simo momento em relao a uma origem C dado
por
`
r
(C)
=
n

i=1
(A
i
C)
r
:
=
(A
1
C)
r
+ (A
2
C)
r
+... + (A
n
C)
r
:
, : = 1. 2. 3. ...
Momento de ordem r em relao a mdia de um conjunto quanti-
tativo de dados
Considere um conjunto de dados quantitativos (discreto ou contnuo) dado
por A
1
. A
2
. .... A
n
ento seu r-simo momento em relao a mdia dado por
`
r
(X)
=
n

i=1
_
A
i
A
_
r
:
=
_
A
1
A
_
r
+
_
A
2
A
_
r
+... +
_
A
n
A
_
r
:
, : = 1. 2. 3. ...
Se : = 1, temos que `
1
(X)
= 0, conforme visto nas propriedades da mdia.
Se : = 2, temos que `
2
(X)
= o
2
, ou seja, o segundo momento de um conjunto de
dados quantitativos em relao a sua mdia a prpria varincia populacional
dos dados.
Momento de ordemr em relao a mdia considerando um conjunto
quantitativo de dados agrupados em k classes
Considere um conjunto de dados quantitativos (discreto ou contnuo) agrupa-
dos em classes, tal que o ponto mdio de cada classe dado por A
1
. A
2
. .... A
k
tenha sua
respectiva frequncia absoluta ,
1
. ,
2
. .... ,
k
. Ento seu r-simo momento em relao
a mdia dado por
`
r
(X)
=
k

i=1
,
i
_
A
i
A
_
r
k

i=1
,
i
=
,
1
_
A
1
A
_
r
+,
2
_
A
2
A
_
r
+... +,
k
_
A
k
A
_
r
k

i=1
,
i
, : = 1. 2. 3. ...
27
Se : = 2, temos que `
2
(X)
= o
2
, ou seja, o segundo momento de um conjunto de
dados quantitativos em relao a sua mdia a prpria varincia populacional
dos dados.
Para o clculo dos coecientes de assimetria e curtose, para dados agrupados
em classes, via mtodos dos momentos, que sero vistos a seguir, precisaremos res-
pectivamente dos momentos 3 e 4 em relao a mdia. Portanto, para o clculo das
medidas de assimetria e curtose, precisamos acrescentar colunas na Tabela (8) para
determinar, primeiramente, os momentos de ordem 3 e ordem 4, respectivamente,
conforme mostra a Tabela (11):
Tabela (11). Dados do teor de chumpo (em ppm) agrupados em classes.
Classes ,
i
A
i
,
i
A
i
1
i
1:
i
% ,
i
A
2
i
,
i
_
A
i
A
_
3
,
i
_
A
i
A
_
4
8. 5 21. 5 2 15 30 2 0. 74 450 443.329. 63 26.830.308. 92
21. 5 34. 5 10 28 280 12 4. 44 7.840 1.073.073. 07 50.992.432. 29
34. 5 47. 5 26 41 1066 38 14. 07 43.706 1.069.512. 12 36.919.558. 27
47. 5 60. 5 38 54 2052 76 28. 15 110.808 378.713. 16 8.149.907. 22
60. 5 73. 5 51 67 3417 127 47. 07 228.939 31.541. 98 268.737. 67
73. 5 86. 5 60 80 4800 187 69. 26 384.000 5.394. 92 24.169. 26
86. 5 99. 5 34 93 3162 221 81. 85 294.066 181.594. 71 3.174.275. 60
99. 5 112. 5 30 106 3180 251 92. 96 337.080 849.505. 40 25.892.924. 52
112. 5 125. 5 11 119 1309 262 97. 04 155.771 904.193. 31 39.314.325. 30
125. 5 138. 5 6 132 792 268 99. 26 104.544 1.081.023. 95 61.056.232. 51
138. 5 151. 5 1 145 145 269 99. 63 21.025 335.412. 64 23.304.470. 46
151. 5 164. 5 1 158 158 270 100 24.964 561.107. 35 46.280.134. 14

270 20.391 1.713.193 922.062. 3 322.207.476


(11)
6.4 Coeciente de assimetria via mtodo dos momentos
O coeciente de assimetria via mtodo dos momentos dado por
Co =
`
3
X
(:
2
)
1;5
.
em que:
`
3
X
: o terceiro momento em relao a mdia considerando dados agrupados
em classes, expresso por
28
`
3
X
=
k

i=1
,
i
_
A
i
A
_
3
k

i=1
,
i
.
:
2
: a varincia amostral dos dados agrupados em classes.
Em nosso exemplo do teor de chumbo encontrado nas amostras de solo cole-
tadas na Fazenda Ponta da Serra, temos que o terceiro momento em relao a mdia
dado por
`
3
X
=
k

i=1
,
i
_
A
i
A
_
3
k

i=1
,
i
=
922062. 3
270
`
3
X
= 3415. 046.
Aps o clculo do terceiro momento em relao a mdia (`
3
X
) considerando
dados agrupados em classes, usamos tal medida para determinar o coeciente de
assimetria via mtodos dos momentos da seguinte forma:
Co =
`
3
X
(:
2
)
1;5
=
3415. 046
643. 94
1;5
Co = 0. 2090.
Interpretao: De acordo com o segundo coeciente de assimetria via mto-
dos dos momentos, como temos Co = 0. 2090 0. 10 ento temos uma distribuio
assimtrica positiva ou assimtrica direita.
7 Medidas de curtose (achatamento)
Uma outra medida para vericar a natureza da distribuio, denominada
de curtose. Esta uma medida do grau de achatamento da distribuio quando com-
parada ao de uma distribuio conhecida como distribuio normal que ser vista mais
adiante. Apresentamos a seguir duas das principais medidas de curtose: o coeciente
percentlico de curtose e o coeciente de curtose via mtodos dos momentos.
29
7.1 Coeciente percentlico de curtose
O coeciente percentlico de curtose dado por:
C1
P
=
Q
3
Q
1
2 (1
9
1
1
)
,
em que:
Q
1
: o primeiro quartil da distribuio;
Q
3
: o terceiro quartil da distribuio;
1
1
: o primeiro percentil da distribuio;
1
9
: o nono percentil da distribuio;
A classicao para esse coeciente a seguinte:
Se C1
P
< 0. 263 : a distribuio leptocrtica;
Se C1
P
= 0. 263 : a distribuio mesocrtica;
Se C1
P
0. 263 : a distribuio platicrtica;
Em nosso exemplo do teor de chumbo encontrado nas amostras de solo co-
letadas na Fazenda Ponta da Serra, temos que o coeciente percentlico de curtose
dado por
C1
P
=
Q
3
Q
1
2 (1
9
1
1
)
=
92. 43 57. 59
2 (109. 03 42)
C1
P
= 0. 2599.
Interpretao: De acordo com o coeciente percentlico de curtose temos
C1
P
< 0. 263, ento trata-se de uma distribuio leptocrtica.
8 Coeciente de curtose via mtodos dos momen-
tos
O coeciente de curtose via mtodos dos momentos expresso por:
C1 =
`
4
X
(:
2
)
2
.
em que
`
4
X
: o quarto momento em relao a mdia considerando dados agrupados
em classes, expresso por
30
`
4
X
=
k

i=1
,
i
_
A
i
A
_
4
k

i=1
,
i
:
2
: a varincia amostral dos dados agrupados em classes.
A Tabela (12) apresenta a classicao das distribuies quanto ao coeciente
de curtose.
Tabela (12). Classicao das distribuies quanto ao coeciente de curtose.
C1 = 3 Distribuio mesocrtica (Distribuio Normal).
C1 < 3 Distribuio leptocrtica (mais "aniladas" que a Normal).
C1 3 Distribuio platicrtica (mais "achatadas" que a Normal).
(12)
A Figura (13) apresenta os tipos de distribuies quanto ao coeciente de
curtose.
Figura (13). Tipos de distribuies quanto ao coeciente de curtose.
Distribuio leptocrtica Distribuio mesocrtica Distribuio platicrtica
C/ < 3 C/ = 3 C/ 3
(13)
Na prtica, dicilmente encontraremos um coeciente de curtose exatamente
igual a C1 = 3. O mais comum encontrarmos conjunto de dados aproximadamente
mesocrtico (aproximadamente normal). Ento, assim como no caso do coeciente
de assimetria, adotamos a seguinte escala de interpretao:
Se C1 < 2. 5 ento temos uma distribuio leptocurtica (mais anilada que a
distribuio normal).
31
Se 2. 5 < C1 < 3. 5 ento temos uma distribuio mesocurtica (aproximada-
mente normal).
Se C1 3. 5 ento temos uma distribuio platicurtica (mais achatada que a
distribuio normal).
Em nosso exemplo do teor de chumbo encontrado nas amostras de solo cole-
tadas na Fazenda Ponta da Serra, temos que o quarto momento em relao a media
dado por
`
4
X
=
k

i=1
,
i
_
A
i
A
_
4
k

i=1
,
i
=
322.207.476
270
`
4
X
= 1.193.361.
Aps o clculo do quarto momento em relao a mdia (`
4
X
) considerando
dados agrupados em classes, usamos tal medida para determinar o coeciente de
curtose via mtodos dos momentos da seguinte forma:
C1 =
`
4
X
(:
2
)
2
=
1.193.361
643. 94
2
C1 = 2. 8779.
Interpretao: De acordo com o segundo coeciente de curtose via mtodos
dos momentos, como temos 2. 5 < C1 = 2. 8779 < 3. 5 ento temos uma distribuio
mesocrtica (aproximadamente normal).
9 Referncias bibliogrcas
1. BUSSAB, Wilton O., MORETTIN, Pedro A. Estatstica Bsica. So Paulo:
Editora Saraiva, 5ed, 2002.
2. DEVORE, J. L. Probabilidade e estatstica para engenharia e cincias. Editora:
Thompson.
3. FREUND John E.; SIMON , Gary A . Estatstica Aplicada. 9. ed. Porto
Alegre: Bookman, 2000.
4. JAMES, B. Probabilidade: um curso em nvel intermedirio. IMPA (2002).
32
5. MEYER, P.L. Probabilidade, aplicaes estatstica. Traduo de Ruy C. B.
Loureno Filho, (ENCE/IBGE), Rio de Janeiro, R.J., 1984.
6. MURRAY, R. S. Probabilidade e estatstica. Editora: Makron Books.
7. TOLEDO, Geraldo Luciano, OVALLE, Ivo Izidoro. Estatstica Bsica. 2ed.
So Paulo: Editora Atlas, 1994.
8. TRIOLA, M. F. Introduo e estatstica. Editora LTC, 10
a
edio.
9. VIEIRA, Snia. Introduo Estatstica. Rio de Janeiro: Editora Campus
Ltda, 1981.
33