Você está na página 1de 9

2.

Estatística Descritiva
2.1. Distribuição de Frequências

Metas desta Aula


Como construir uma distribuição de frequência incluindo limites, pontos médios,

frequências relativas e frequências cumulativas.

Distribuições de Frequência
Quando um conjunto de dados possui muitas entradas, pode ser difícil identificar

padrões. Iremos organizar um conjunto de dados agrupando-os em intervalos chamados

de classes e formando uma distribuição de frequência. Iremos também como usar as

distribuições de frequência para construir gráficos.

Definição:

Uma distribuição de frequência é uma tabela que mostra classes ou intervalos de

entrada de dados com um número total de entradas em cada classe. A frequência ƒ de

uma classe é o número de entrada de dados na classe.

Na distribuição de frequência do exemplo abaixo há seis classes.

Limite Limite
Classes Inferior Superior ƒ
1ª 1 5 5
2ª 6 10 8
3ª 11 15 6
4ª 16 20 8
5ª 21 25 5
6ª 26 30 4

fls. 27
As frequências para cada uma das seis classes são respectivamente 5, 8, 6, 8, 5 e 4.

Cada classe possui um limite inferior da classe, que é o menor número que pode

pertencer à classe, e o limite superior da classe, que é o maior número que pode

pertencer à classe.

Na distribuição de frequência, os limites inferiores das classes são 1, 6, 11, 16, 21 e 26,

e os limites superiores das classes são 5, 10, 15, 20, 25 e 30.

A amplitude da classe é a distância entre os limites inferiores (ou superiores) de classes

consecutivas. Por exemplo, a amplitude de classe nessa distribuição é 6 - 1 = 5.

A diferença entre o máximo e o mínimo das entradas de dados é chamada de amplitude

total.

Por exemplo, se a entrada máxima de dados é 29 e a mínima 1, a amplitude total é 29 -

1 = 28.

Orientações Gerais
Construindo uma distribuição de frequência a partir de um conjunto de dados

1. Decida sobre o número de classes a serem incluídas na distribuição de frequência.

O número de classes deve estar entre 5 e 20; caso contrário, pode ser difícil

identificar padrões. Outra maneira de se determinar o número de classes é

calculando a raiz quadrada do tamanho da amostra.

2. Determine a amplitude da classe da seguinte maneira. Determine a amplitude total

dos dados, divida a amplitude total pelo número de classes e arredonde até o

próximo número conveniente.

3. Calcule os limites de classes. Pode-se usar a entrada mínima dos dados como o

limite inferior da primeira classe. Para determinar os limites inferiores

fls. 28
remanescentes, adicione a amplitude da classe ao limite inferior da classe

precedente. Depois calcule o limite superior da primeira classe. Lembre-se de que

as classes não podem se sobrepor. Determine os limites superiores de classe

remanescentes.

4. Marque um risco em cada entrada de dado na linha da classe apropriada.

5. Conte os riscos feitos para determinar a frequência total ƒ para cada classe.

Importante: Se cada classe tem a mesma amplitude de distribuição de frequência ela é

considerada ótima. As respostas mostradas usarão o valor mínimo dos dados para o

limite inferior da primeira classe. Às vezes, pode ser mais conveniente escolher um valor

que seja ligeiramente menor do que o valor mínimo. A distribuição de frequência obtida

irá variar ligeiramente.

Exemplo 1:

Construindo uma distribuição de frequência a partir de um conjunto de dados

O conjunto de dados amostral a seguir fornece uma lista do número de minutos que 50

assinantes da Internet gastaram durante sua conexão mais recente.

Construa uma distribuição de frequência que tenha sete classes.

50 40 41 17 11 7 22 44 28 21 19 23 37

51 54 42 88 41 78 56 72 56 17 7 69 30

80 56 29 33 46 31 39 20 18 29 34 59 73

77 36 39 30 62 54 67 39 31 53 44

fls. 29
Solução:

1. O número de classes (7) está expresso no problema.

2. A entrada mínima de dados é 7, enquanto a máxima é 88; logo, a amplitude total

é 81. Divida a amplitude total pelo número de classes e arredonde para cima,

determinando que a amplitude de classes é 12.

Amplitude de classes = (entrada máxima - entrada mínima) / número de classes => (88 – 7) / 7

Amplitude de classes = amplitude total / número de classes => 81 / 7

Amplitude de classes = 11,57

Arredondar para 12.

3. A entrada mínima de dados é o limite inferior conveniente para a primeira classe.

Para encontrar os limites inferiores das seis


Limite Limite
Classes Inferior Superior classes remanescentes, adicione uma amplitude
1ª 7 18 de classe igual a 12 ao limite inferior de cada
2ª 19 30
3ª 31 42 classe anterior. O limite superior da primeira
4ª 43 54
classe é 18, o qual é um a menos do que o limite
5ª 55 66
6ª 67 78 inferior da segunda classe. Os limites superiores
7ª 79 90
das outras classes são 18 + 12 = 30, 30 + 12 = 42

e assim por diante. Os limites inferiores e superiores para as sete classes estão

mostrados na tabela ao lado.

4. Marque com um risco as entradas para cada classe.

5. O número de riscos feitos para uma classe será a frequência daquela classe.

fls. 30
A distribuição de frequência está mostrada na tabela acima. A primeira classe, 7 — 18,

tem 6 riscos. Assim, a frequência para essa classe é de 6. Observe que a soma das

frequências é 50, que é o número de entradas no conjunto de dados amostrais. A soma

é indicada por Σƒ, em que Σ é a letra grega sigma maiúscula.

Exercício 1:

Construa uma distribuição de frequência usando as idades dos habitantes de Akhiok –

Alasca - fornecidas abaixo.

Use seis classes.

28 6 17 48 63 47 27 21 3 7 12 39 50

54 33 45 15 24 1 7 36 53 46 27 5 10

32 50 52 11 42 22 3 17 34 56 25 2 30

10 33 1 49 13 16 8 31 21 6 9 2 11

32 25 0 55 23 41 29 4 51 1 6 31 5

5 11 4 10 26 12 6 16 8 2 4 28

fls. 31
Determine os valores máximo e mínimo e a amplitude das classes.

Determine os limites das classes.

Usando a função FREQUÊNCIA do Excel calcule a frequência ƒ para cada classe.

Após construir uma distribuição de frequência padrão como aquela do Exemplo 1, há

vários aspectos adicionais que você poderia incluir e que ajudariam em uma melhor

compreensão dos dados. Esses aspectos são o ponto médio e as frequências relativa e

cumulativa de cada classe, os quais podem ser incluídos como colunas adicionais de sua

tabela.

Definições:

1. O ponto médio de uma classe é a metade da soma entre os limites inferior e

superior da classe. Às vezes, o ponto médio é chamado de característica da classe.

Ponto Médio = (limite inferior da classe + limite superior da classe) / 2

2. A frequência relativa de uma classe é a porção ou porcentagem dos dados que

entra nessa classe. Para determinar a frequência relativa de uma classe, divida a

frequência ƒ pelo tamanho da amostra n.

Frequência Relativa = frequência da classe / tamanho da amostra

Frequência Relativa = ƒ / n

fls. 32
3. A frequência cumulativa de uma classe é a soma da frequência daquela classe com

a de todas as classes anteriores. A frequência cumulativa da última classe é igual

ao tamanho da amostra n.

Após determinar o primeiro ponto médio, se obtém os demais simplesmente adicionando

a amplitude da classe ao ponto médio anterior. Por exemplo, se o primeiro ponto médio

for 12,5 e a amplitude da classe for 12. Os pontos médios remanescentes serão:

e assim por diante.

Pode-se escrever também a frequência relativa sob a forma decimal ou de porcentagem.

A soma das frequências relativas de todas as classes deve ser igual a 1 ou a 100%.

Exemplo 2:

Pontos médios, frequências relativas e cumulativas.

Usando a distribuição de frequência construída no exemplo anterior, obtenha o ponto

médio, a frequência relativa e a frequência cumulativa para cada classe. Identifique

padrões.

Solução:

O ponto médio e as frequências relativa e cumulativa para as três primeiras classes são

calculados conforme segue.

fls. 33
Os pontos médios e as frequências relativa e cumulativa remanescentes estão mostrados

abaixo.

Distribuição de frequência para o tempo de uso da Internet (em minutos)

Classes L. I. L. S. ƒ P. M. ƒ Relativa ƒ Cumulativa


1ª 7 18 6 12,5 0,12 6
2ª 19 30 10 24,5 0,2 16
3ª 31 42 13 36,5 0,26 29
4ª 43 54 8 48,5 0,16 37
5ª 55 66 5 60,5 0,1 42
6ª 67 78 6 72,5 0,12 48
7ª 79 90 2 84,5 0,04 50
Total 50 Total 1

Há vários padrões no conjunto de dados. Por exemplo, o intervalo de tempo de conexão

mais comum foi de 31 a 42 minutos.

Exercício 2:

Usando a distribuição de frequência construída no exercício anterior, determine o ponto

médio e as frequências relativa e cumulativa para cada classe. Identifique padrões.

Use as fórmulas para determinar cada ponto médio, frequência relativa e

frequência cumulativa.

Organize seus resultados na forma de uma distribuição de frequência.

fls. 34
Identifique os padrões que emergem dos dados.

Exercício 3:

Faça um levantamento das idades de seus colegas de turma, depois monte uma

distribuição de frequência usando cinco classes.

fls. 35

Você também pode gostar