Escolar Documentos
Profissional Documentos
Cultura Documentos
Apostila IV
DISTRIBUIÇÃO DE FREQUÊNCIAS
1. INTRODUÇÃO
Em alguma fase de seu trabalho, o pesquisador se depara com o problema de analisar e
entender um conjunto de dados relevante ao seu objeto de estudos. Ele necessitará trabalhar
os dados para transformá-los em informações sintéticas, para compará-los com outros
resultados ou ainda, para julgar sua adequação a alguma teoria.
2. TIPOS DE VARIÁVEL
De modo geral, para cada elemento investigado numa pesquisa, tem-se associado um
ou mais resultados correspondendo à ocorrência de uma característica (ou características).
Exemplo: Um pesquisador está interessado em fazer um levantamento sobre alguns
aspectos sócio-econômicos dos empregados da seção de orçamentos da Companhia MB. Os
dados levantados geraram as seguintes variáveis (CRESPO, 2002):
Tabela 1
Variável Representação
Estado Civil X
Grau de Instrução Y
Número de Filhos Z
Salário W
Idade U
Tabela 3
Rol das Estaturas de 40 funcionários da Construtora A
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
Agora, podemos saber qual a menor estatura (150 cm) e qual a maior (173 cm); que a
amplitude de variação foi de 173 – 150 = 23 cm; e, ainda, a ordem que um valor particular da
2
Probabilidade e Estatística
Apostila IV
variável ocupa no conjunto. Com um exame mais acurado, vemos que há uma concentração
das estaturas em algum valor entre 160 cm e 165 cm e, mais ainda, que há poucos valores
abaixo de 155 cm e acima de 170 cm.
4. DISTRIBUIÇÃO DE FREQUÊNCIAS
No exemplo que trabalhamos, a variável em questão, estatura, será observada e
estudada muito mais facilmente quando dispusermos seus valores ordenados em uma coluna e
colocarmos, ao lado de cada valor, o número de vezes que aparecem repetidos. Denominamos
frequência o número de funcionários que ficam relacionados a um determinado valor da
variável (estatura). Obtemos, assim, uma tabela que recebe o nome de distribuição de
frequências:
Tabela 4*
Estaturas (cm) Freq. Estaturas (cm) Freq. Estaturas (cm) Freq.
150 1 158 2 167 1
151 1 160 5 168 2
152 1 161 4 169 1
153 1 162 2 170 1
154 1 163 2 172 1
155 4 164 3 173 1
156 3 165 1
Total 40
157 1 166 1
* A tabela foi tripartida para não ocupar muito espaço.
Observe que o processo dado ainda é inconveniente, já que exige muito espaço mesmo
quando o número de valores da variável (n) é de tamanho razoável. Sendo possível, a solução
mais aceitável, pela própria natureza da variável contínua, é o agrupamento dos valores em
vários intervalos.
Assim, se um dos intervalos for, por exemplo, 154 |— 1581, em vez de dizermos que a
estatura de 1 funcionário é de 154 cm; de 4 funcionários, 155 cm; de 3 funcionários, 156 cm;
e de 1 funcionário, 157 cm, diremos que 9 funcionários têm estaturas entre 154 cm, inclusive,
e 158 cm, exclusive.
Deste modo, estaremos agrupando os valores da variável em intervalos, sendo que, em
Estatística, preferimos chamar os intervalos de classes. Chamando de freqüência o número de
valores da variável pertencentes à classe, os dados da Tabela 4 podem ser dispostos como na
Tabela 5, denominada distribuição de frequências com intervalos de classe.
1
154 |– 158 é um intervalo fechado à esquerda e aberto à direita, tal que: 154 ≤ x < 158.
3
Probabilidade e Estatística
Apostila IV
Tabela 5
Estaturas de 40 funcionários da Construtora A
Estaturas (cm) Freqüência (fi)
150 |— 154 4
154 |— 158 9
158 |— 162 11
162 |— 166 8
166 |— 170 5
170 |— 174 3
Total 40
5.1. Classe
Crespo (2002) define classes de frequência ou, simplesmente classes, como
intervalos de variação da variável. As classes são representadas simbolicamente por i, sendo i
= 1, 2, 3, ..., k (onde k é o número total de classes da distribuição).
Assim, em nosso exemplo, o intervalo 154 |— 158 define a segunda classe (i = 2).
Como a distribuição é formada por seis classes, podemos afirmar que k = 6.
4
Probabilidade e Estatística
Apostila IV
Nota:
• O ponto médio de uma classe é o valor que a representa.
5
Probabilidade e Estatística
Apostila IV
É evidente que:
Tabela 6
Estaturas de 40 funcionários da Construtora A
i Estaturas (cm) fi
1 150 |– 154 4
2 154 |– 158 9
3 158 |– 162 11
4 162 |– 166 8
5 166 |– 170 5
6 170 |– 174 3
Σ fi = 40
6. INTERVALOS DE CLASSE
A primeira preocupação que temos, na construção de uma distribuição de frequência, é
a determinação do número de classes e, consequentemente, da amplitude e dos limites dos
intervalos de classe.
Para a determinação do número de classes de uma distribuição podemos utilizar:
6
Probabilidade e Estatística
Apostila IV
Quando o resultado não é exato, devemos arredondá-lo para mais. Outro problema que
surge é a escolha dos limites dos intervalos, os quais deverão ser tais que forneçam, na
medida do possível, números que facilitem os cálculos. Em nosso exemplo (Tabela 6), temos:
7. TIPOS DE FREQUÊNCIAS
Já vimos anteriormente que frequências simples ou absolutas (fi) são os valores que
representam o número de dados de cada classe. Já sabemos também que a soma das
frequências simples é igual ao número total dos dados:
Ʃ fi = n
Frequências relativas (fri) são os valores das razões entre as frequências simples e a
frequência total (CRESPO, 2002):
2
Há quem prefira a regra de Sturges: i 1 + 3,3 × log n.
7
Probabilidade e Estatística
Apostila IV
Evidentemente:
Ʃ fri = 1 ou 100%
Nota:
• O propósito das frequências relativas é o de permitir a análise ou facilitar as
comparações.
Frequência acumulada (Fi) é a soma das frequências simples inferiores à frequência
simples do intervalo observado (CRESPO, 2002):
Fk = f1 + f2 + ... + fk
ou
Fk = Ʃ fi (i = 1, 2, ..., k)
8
Probabilidade e Estatística
Apostila IV
Ou então:
Tabela 8
xi fi
x1 fi
x2 fi
...
...
xn fn
Ʃ fi = n
Exemplo: Seja X a variável “número de cômodos das casas ocupadas por vinte
famílias entrevistadas”. A tabela de frequências fica assim:
9
Probabilidade e Estatística
Apostila IV
Tabela 9
i Cômodos (xi) Famílias (fi)
1 2 4
2 3 7
3 4 5
4 5 2
5 6 1
6 7 1
Ʃ = 20
Tabela 10
i xi fi fri Fi
1 2 4 0,20 4
2 3 7 0,35 11
3 4 5 0,25 16
4 5 2 0,10 18
5 6 1 0,05 19
6 7 1 0,05 20
Ʃ = 20 Σ = 1,00
Nota:
• Se a variável toma numerosos valores distintos, é comum tratá-la como uma
variável contínua, formando intervalos de classe de amplitude diferente de um.
Esse tratamento (arbitrário) abrevia o trabalho, mas acarreta alguma perda de
precisão.
9. REFERÊNCIA BIBLIOGRÁFICA
• CRESPO, A. A. Estatística Fácil. 17ª edição. São Paulo: Editora Saraiva, 2002.
10