Você está na página 1de 10

Probabilidade e Estatística

Apostila IV

DISTRIBUIÇÃO DE FREQUÊNCIAS

1. INTRODUÇÃO
Em alguma fase de seu trabalho, o pesquisador se depara com o problema de analisar e
entender um conjunto de dados relevante ao seu objeto de estudos. Ele necessitará trabalhar
os dados para transformá-los em informações sintéticas, para compará-los com outros
resultados ou ainda, para julgar sua adequação a alguma teoria.

2. TIPOS DE VARIÁVEL
De modo geral, para cada elemento investigado numa pesquisa, tem-se associado um
ou mais resultados correspondendo à ocorrência de uma característica (ou características).
Exemplo: Um pesquisador está interessado em fazer um levantamento sobre alguns
aspectos sócio-econômicos dos empregados da seção de orçamentos da Companhia MB. Os
dados levantados geraram as seguintes variáveis (CRESPO, 2002):

Tabela 1
Variável Representação
Estado Civil X
Grau de Instrução Y
Número de Filhos Z
Salário W
Idade U

Considerando-se a característica variável estado civil, para cada empregado pode-se


associar uma das ocorrências solteiro ou casado (note que poderia haver outras possibilidades,
mas somente as duas foram consideradas). Podemos atribuir uma letra, no caso X, para
representar tal variável.
As variáveis grau de instrução e estado civil, apresentam como possíveis ocorrências
uma qualidade (ou atributo) do indivíduo pesquisado. As variáveis número de filhos, salário
e idade, apresentam como possíveis ocorrências números resultantes de uma contagem ou
mensuração. As variáveis do primeiro tipo são chamadas qualitativas, e as do segundo tipo,
quantitativas (CRESPO, 2002).
As variáveis qualitativas podem ser de dois tipos:
• Nominal: para a qual não existe nenhuma ordenação nas possíveis ocorrências.
Exemplo: Sexo.
• Ordinal: para a qual existe uma ordem nos seus resultados. Exemplo: Grau de
Instrução.
1
Probabilidade e Estatística
Apostila IV

As variáveis quantitativas também podem ser de dois tipos:


• Discreta: cujos possíveis valores formam um conjunto finito ou enumerável de
números, e que resultam, freqüentemente, de uma contagem. Exemplo: Número de
Filhos.
• Contínua: cujos possíveis valores pertencem a um intervalo de números reais e
que resultam de uma mensuração. Exemplo: Peso e Altura.

3. TABELA PRIMITIVA E ROL


Vamos considerar, em particular, a forma pela qual podemos descrever os dados
estatísticos resultantes de variáveis quantitativas. Suponha que uma coleta de dados relativos
às estaturas de quarenta funcionários de uma Construtora A resultou na seguinte tabela de
valores:
Tabela 2
Estaturas de 40 funcionários da Construtora A
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161

A esse tipo de tabela, cujos elementos não foram numericamente organizados,


denominamos tabela primitiva (CRESPO, 2002).
Partindo dos dados acima, é difícil averiguar em torno de que valor tendem a se
concentrar as estaturas, qual a menor ou qual a maior estatura ou ainda, quantos funcionários
se acham abaixo ou acima de uma dada estatura.
Assim, conhecidos os valores de uma variável, é difícil formarmos uma idéia exata do
comportamento do grupo como um todo, a partir dos dados não-ordenados. A maneira mais
simples de organizar os dados é através de uma certa ordenação (crescente ou decrescente).
A tabela obtida após a ordenação dos dados recebe o nome de rol (CRESPO, 2002).

Tabela 3
Rol das Estaturas de 40 funcionários da Construtora A
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173

Agora, podemos saber qual a menor estatura (150 cm) e qual a maior (173 cm); que a
amplitude de variação foi de 173 – 150 = 23 cm; e, ainda, a ordem que um valor particular da

2
Probabilidade e Estatística
Apostila IV

variável ocupa no conjunto. Com um exame mais acurado, vemos que há uma concentração
das estaturas em algum valor entre 160 cm e 165 cm e, mais ainda, que há poucos valores
abaixo de 155 cm e acima de 170 cm.

4. DISTRIBUIÇÃO DE FREQUÊNCIAS
No exemplo que trabalhamos, a variável em questão, estatura, será observada e
estudada muito mais facilmente quando dispusermos seus valores ordenados em uma coluna e
colocarmos, ao lado de cada valor, o número de vezes que aparecem repetidos. Denominamos
frequência o número de funcionários que ficam relacionados a um determinado valor da
variável (estatura). Obtemos, assim, uma tabela que recebe o nome de distribuição de
frequências:

Tabela 4*
Estaturas (cm) Freq. Estaturas (cm) Freq. Estaturas (cm) Freq.
150 1 158 2 167 1
151 1 160 5 168 2
152 1 161 4 169 1
153 1 162 2 170 1
154 1 163 2 172 1
155 4 164 3 173 1
156 3 165 1
Total 40
157 1 166 1
* A tabela foi tripartida para não ocupar muito espaço.

Observe que o processo dado ainda é inconveniente, já que exige muito espaço mesmo
quando o número de valores da variável (n) é de tamanho razoável. Sendo possível, a solução
mais aceitável, pela própria natureza da variável contínua, é o agrupamento dos valores em
vários intervalos.
Assim, se um dos intervalos for, por exemplo, 154 |— 1581, em vez de dizermos que a
estatura de 1 funcionário é de 154 cm; de 4 funcionários, 155 cm; de 3 funcionários, 156 cm;
e de 1 funcionário, 157 cm, diremos que 9 funcionários têm estaturas entre 154 cm, inclusive,
e 158 cm, exclusive.
Deste modo, estaremos agrupando os valores da variável em intervalos, sendo que, em
Estatística, preferimos chamar os intervalos de classes. Chamando de freqüência o número de
valores da variável pertencentes à classe, os dados da Tabela 4 podem ser dispostos como na
Tabela 5, denominada distribuição de frequências com intervalos de classe.

1
154 |– 158 é um intervalo fechado à esquerda e aberto à direita, tal que: 154 ≤ x < 158.
3
Probabilidade e Estatística
Apostila IV

Tabela 5
Estaturas de 40 funcionários da Construtora A
Estaturas (cm) Freqüência (fi)

150 |— 154 4
154 |— 158 9
158 |— 162 11
162 |— 166 8
166 |— 170 5
170 |— 174 3
Total 40

Ao agruparmos os valores da variável em classes, ganhamos em simplicidade mas


perdemos em detalhes.
Por exemplo, na Tabela 4 podemos verificar que quatro funcionários têm 161 cm de
estatura e que não existe nenhum funcionário com 171 cm de estatura. Já na Tabela 5 não
podemos ver se algum funcionário tem a estatura de 159 cm. No entanto, sabemos com
segurança que onze funcionários têm estatura compreendida entre 158 e 162 cm.
O que pretendemos com a construção dessa nova tabela é realçar o que há de essencial
nos dados e, também, tornar possível o uso de técnicas analíticas para sua total descrição, até
porque na Estatística buscamos analisar o conjunto de valores, desinteressando-nos por casos
isolados.
Nota:
• Quando os dados estão organizados em uma distribuição de freqüências, são
comumente chamados dados agrupados.

5. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS

5.1. Classe
Crespo (2002) define classes de frequência ou, simplesmente classes, como
intervalos de variação da variável. As classes são representadas simbolicamente por i, sendo i
= 1, 2, 3, ..., k (onde k é o número total de classes da distribuição).
Assim, em nosso exemplo, o intervalo 154 |— 158 define a segunda classe (i = 2).
Como a distribuição é formada por seis classes, podemos afirmar que k = 6.

4
Probabilidade e Estatística
Apostila IV

5.2. Limites de Classe


Denominamos limites de classe os extremos de cada classe. O menor número é o
limite inferior da classe (ℓi) e o maior número o limite superior da classe (Li). Então, na
segunda classe do exemplo temos: ℓ2 = 154 e L2 = 158 (CRESPO, 2002).
Nota:
• Os intervalos de classe devem ser escritos, de acordo com a Resolução 886/66 do
IBGE, em termos de desta quantidade até menos aquela, empregando, para isso,
o símbolo |— (inclusão de ℓi e exclusão de Li). Assim, o indivíduo com uma
estatura de 158 cm está incluído na terceira classe (i = 3) e não na segunda.

5.3. Amplitude de um Intervalo de Classe


Amplitude de um intervalo de classe, ou simplesmente intervalo de classe, é a
medida de tamanho do intervalo que define a classe. Ela é obtida pela diferença entre os
limites superior e inferior dessa classe e é indicada por hi (CRESPO, 2002). Assim:
hi = Li – ℓi
Na distribuição da Tabela 1.5, temos:
h2 = L2 – ℓ2 → h2 = 158 – 154 = 4 cm

5.4. Amplitude Total da Distribuição


Amplitude total da distribuição (AT) é a diferença entre o valor máximo e o valor
mínimo da distribuição (CRESPO, 2002):
AT = x(máx) – x(mín)
Em nosso exemplo, temos:
AT = 173 – 150 = 23 cm

5.5. Ponto Médio de uma Classe


Crespo (2002) define ponto médio de uma classe (xi) como o ponto que divide o
intervalo de classe em duas partes iguais. Para obtermos o ponto médio de uma classe,
calculamos a soma dos limites da classe e dividimos por 2 (média aritmética):

Assim, o ponto médio da segunda classe, em nosso exemplo, é:

Nota:
• O ponto médio de uma classe é o valor que a representa.
5
Probabilidade e Estatística
Apostila IV

5.6. Frequência Simples ou Absoluta


Frequência simples ou frequência absoluta, ou simplesmente frequência de uma
classe ou de um valor individual, é o número de observações correspondentes a essa classe ou
a esse valor (CRESPO, 2002). A frequência simples é simbolizada por fi (lemos: f índice i ou
frequência da classe i).
Assim, em nosso exemplo, temos:
f1 = 4, f2 = 9, f3 = 11, f4 = 8, f5 = 5 e f6 = 3
A soma de todas as frequências é representada pelo símbolo de somatório:

É evidente que:

Para a distribuição em estudo, temos:

Podemos, agora, dar à distribuição de frequências das estaturas dos 40 funcionários da


Construtora A a seguinte representação tabular:

Tabela 6
Estaturas de 40 funcionários da Construtora A
i Estaturas (cm) fi

1 150 |– 154 4
2 154 |– 158 9
3 158 |– 162 11
4 162 |– 166 8
5 166 |– 170 5
6 170 |– 174 3
Σ fi = 40

6. INTERVALOS DE CLASSE
A primeira preocupação que temos, na construção de uma distribuição de frequência, é
a determinação do número de classes e, consequentemente, da amplitude e dos limites dos
intervalos de classe.
Para a determinação do número de classes de uma distribuição podemos utilizar:

6
Probabilidade e Estatística
Apostila IV

Existem outras fórmulas que pretendem resolver o problema da determinação do


número de classes que deve ter a distribuição2. Entretanto, a verdade é que essas fórmulas não
nos levam a uma decisão final; esta vai depender, na realidade, de um julgamento pessoal,
que deve estar ligado à natureza dos dados e ao objetivo que se tem em vista, procurando,
sempre que possível, evitar classe com frequência nula ou com frequência relativa muito
exagerada etc. Deve-se observar que as classes devem conter todas as observações, não
podendo haver perda de dados. E ainda, com um pequeno número de classes, perde-se
informação, e com um número grande de classes, o objetivo de resumir os dados fica
prejudicado. Normalmente, sugere-se o uso de 5 a 15 classes com a mesma amplitude
(CRESPO, 2002).
Decidindo o número de classes que deve ter a distribuição, resta-nos resolver o
problema da determinação da amplitude do intervalo de classe, o que conseguimos dividindo
a amplitude total pelo número de classes:

Quando o resultado não é exato, devemos arredondá-lo para mais. Outro problema que
surge é a escolha dos limites dos intervalos, os quais deverão ser tais que forneçam, na
medida do possível, números que facilitem os cálculos. Em nosso exemplo (Tabela 6), temos:

isto é, seis classes de intervalos com amplitude igual a 4.

7. TIPOS DE FREQUÊNCIAS
Já vimos anteriormente que frequências simples ou absolutas (fi) são os valores que
representam o número de dados de cada classe. Já sabemos também que a soma das
frequências simples é igual ao número total dos dados:
Ʃ fi = n
Frequências relativas (fri) são os valores das razões entre as frequências simples e a
frequência total (CRESPO, 2002):

Logo, a frequência relativa da terceira classe, em nosso exemplo (Tabela 6), é:

2
Há quem prefira a regra de Sturges: i 1 + 3,3 × log n.
7
Probabilidade e Estatística
Apostila IV

Evidentemente:
Ʃ fri = 1 ou 100%
Nota:
• O propósito das frequências relativas é o de permitir a análise ou facilitar as
comparações.
Frequência acumulada (Fi) é a soma das frequências simples inferiores à frequência
simples do intervalo observado (CRESPO, 2002):
Fk = f1 + f2 + ... + fk
ou
Fk = Ʃ fi (i = 1, 2, ..., k)

Assim, no exemplo da Tabela 6, a frequência acumulada correspondente à terceira


classe é:

O que significa existirem 24 funcionários com estatura inferior a 162 cm (limite


superior do intervalo da terceira classe).
Considerando a Tabela 5, podemos montar a seguinte tabela com as frequências
estudadas:
Tabela 7
Estaturas
i fi xi fri Fi
(cm)
1 150 |– 154 4 152 0,100 4
2 154 |– 158 9 156 0,225 13
3 158 |– 162 11 160 0,275 24
4 162 |– 166 8 164 0,200 32
5 166 |– 170 5 168 0,125 37
6 170 |– 174 3 172 0,075 40
Σ = 40 Σ = 1,000

O conhecimento de vários tipos de freqüência ajuda-nos a responder a muitas questões


com relativa facilidade, como as seguintes:
a. Quantos funcionários têm estatura entre 154 cm, inclusive, e 158 cm?
Esses são os valores da variável que formam a segunda classe. Como f2 = 9, a resposta
é 9 funcionários.

8
Probabilidade e Estatística
Apostila IV

b. Qual a percentagem de funcionários cujas estaturas são inferiores a 154 cm?


Esses valores são os que formam a primeira classe. Como fri = 0,100, obtemos a
resposta multiplicando a freqüência relativa por 100:
0,100 × 100 = 10
Logo, a percentagem de funcionários é 10%.
c. Quantos funcionários têm estatura abaixo de 162 cm?
É evidente que as estaturas consideradas são aquelas que formam as classes de ordem
1, 2 e 3. Assim, o número de funcionários é dado por:

Portanto, 24 funcionários têm estatura abaixo de 162 cm.


d. Quantos funcionários têm estatura não-inferior a 158 cm?
O número de funcionários é dado por:

Ou então:

8. DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALOS DE CLASSE


Quando se trata de variável discreta de variação relativamente pequena, cada valor
pode ser tomado como um intervalo de classe e, nesse caso, a distribuição é chamada
distribuição sem intervalos de classe, tomando a seguinte forma:

Tabela 8
xi fi
x1 fi
x2 fi
...

...

xn fn
Ʃ fi = n

Exemplo: Seja X a variável “número de cômodos das casas ocupadas por vinte
famílias entrevistadas”. A tabela de frequências fica assim:

9
Probabilidade e Estatística
Apostila IV

Tabela 9
i Cômodos (xi) Famílias (fi)

1 2 4
2 3 7
3 4 5
4 5 2
5 6 1
6 7 1
Ʃ = 20

Completada com os vários tipos de freqüência, temos:

Tabela 10
i xi fi fri Fi

1 2 4 0,20 4
2 3 7 0,35 11
3 4 5 0,25 16
4 5 2 0,10 18
5 6 1 0,05 19
6 7 1 0,05 20
Ʃ = 20 Σ = 1,00

Nota:
• Se a variável toma numerosos valores distintos, é comum tratá-la como uma
variável contínua, formando intervalos de classe de amplitude diferente de um.
Esse tratamento (arbitrário) abrevia o trabalho, mas acarreta alguma perda de
precisão.

9. REFERÊNCIA BIBLIOGRÁFICA
• CRESPO, A. A. Estatística Fácil. 17ª edição. São Paulo: Editora Saraiva, 2002.

10

Você também pode gostar