Você está na página 1de 14

Aula 3- Frequência

Distribuição de Frequências

A distribuição de frequência é uma tabela que mostra classes ou intervalos das entradas
de dados com uma contagem do número de entradas em cada classe.

Na distribuição de frequência mostrada há seis classes. As frequências para cada uma


das seis classes são 5, 8, 6, 8, 5 e 4. Cada classe tem um limite inferior de classe, que é
o menor número que pode pertencer à classe, e um limite superior de classe, que é o
maior número que pode pertencer à classe. Na distribuição de frequência mostrada, os
limites inferiores da classe são5, 10, 15, 20, 25 e 30. A largura de classe é a distância
entre os limites inferiores (ou superiores) de suas consecutivas classes. Por exemplo, a
largura da classe na distribuição de frequência mostrada é 6 - 1 = 5. A diferença entre as
entradas de dados máximas e mínimas é chamada de amplitude. Na tabela de
frequência mostrada, suponha que a maior entrada de dado seja 29, e a mínima seja 1. A
amplitude é, então, 29 - 1 = 28.

O conjunto de dados amostrais a seguir lista o número de minutos que 50 usuários de


lnternet gastam na rede durante sua mais recente sessão. Construa uma distribuição de
frequência para as sete classes.
Frequência absoluta 𝒇𝒊 : é o número de vezes que uma determinada característica ou
valor numérico é observado

Pode se incluir diversas características adicionais na distribuição de frequências que


ajudarão a fornecer um melhor entendimento dos dados. Essas características (pontos
médios, frequência relativa e frequência acumulada) podem ser incluídas como colunas
adicionais em sua tabela.

Elementos de uma Distribuição de Frequências:

Classe ou Classe de Frequência (K): É cada subintervalo (linha) na qual dividimos o


fenômeno. Quando temos dados brutos provenientes de uma variável contínua, devemos
agrupá-los, para a construção de uma tabela, em intervalos que também são conhecidos
por classes. Os tipos de classes ou intervalos estão exemplificados na tabela a seguir:

Limites da classe: são os extremos de cada classe. Limite superior Li Limite inferior li ,
O símbolo li |- Li significa inclusão de li e exclusão de Li l4 = 20 e L4 = 29

Amplitude de um intervalo de classe (h) - é a medida do intervalo que define a classe


h = Li - li h4 = 29-20 = 9

Amplitude total da distribuição (AT)- é a diferença entre o limite superior da última


classe (limite superior máximo) e o limite inferior da primeira (limite inferior mínimo).
AT = L(máx) - l (min)
AT = 80 - 0 = 80

Ponto médio- O ponto médio de uma classe é a soma dos limites inferiores e superiores
da classe dividida por dois. O ponto médio ê, às vezes, chamado de marca da classe.

Frequência relativa (𝑓𝑟𝑖 ) é a proporção, do total, em que é observada uma determinada


característica. A frequência relativa de uma classe é a proporção ou porcentagem de
dados que está em determinada classe. Para encontrar a frequência relativa de uma
classe, divida a frequência f pelo tamanho n da amostra.

Frequência acumulada (𝐹𝑖 ): para um determinado valor numérico ou dado original, é a


soma das frequências dos valores menores ou iguais ao referido valor. A frequência
acumulada de uma classe é a soma da frequência para aquela classe e todas as
anteriores. A frequência acumulada da última classe é igual ao tamanho n da amostra.

Frequência Acumulada Relativa (𝐹𝑟𝑖 ): é a porcentagem entre a frequência relativa


acumulada da classe e a frequência total da distribuição.
Exemplo 3:
Determinação da quantidade de classes
As classes variam segundo os interesses do pesquisador.

1°) Classes desiguais. Critério subjetivo. As classes variam segundo os interesses do


pesquisador.

Exemplo

Foram construídas 6 classes, de acordo com algumas fases da vida. As classes


apresentam tamanhos (amplitudes) diferentes.

2°) Classes de mesmo tamanho; número de classes pré-fixado.

Suponhamos que desejamos construir 7 classes. O valor mínimo da nossa amostra é 10


e o máximo é 70. A amplitude total (AT) é:

AT = máx. – mín.
AT = 70 – 10 = 60
Como o número de classes (k) é 7, a amplitude de cada classe (h) é:
h = AT / k
h = 60 / 7 >>> 8,57
Vamos utilizar h = 9. Obteremos:
Utilizamos uma amplitude de classe um pouco superior à calculada. Por isso, a 7ª classe
vai de 64 até 73 (embora o maior valor observado seja 70).

3°) Regra de Sturges.


É uma das regras mais utilizadas na prática. Vamos utilizar a regra de Sturges para
calcular o número de classes (k). Se tivermos n valores, o número de classes será:

Essa fórmula pode ser “resumida” na tabela a seguir:

Em nosso caso, n = 200. Logo:


k = 1 + 3,3.log 200
k = 1 + 3,3 . 2,3010
k = 1 + 7,5933
k = 8,5933 >>> 9

A amplitude de cada classe é


Finalmente, as classes são:
4°) Critério da raiz quadrada.

O número de classes (k) é dado por

Em nosso exemplo:

O tamanho de cada classe é

Vamos considerar h = 5. Teremos:


Nota: a última classe teve os dois extremos fechados.

5°) Critério da desigualdade:

O valor de k é o menor inteiro tal que 2k≥ n.


(fonte: http://alea-estp.ine.pt/ingles/html/nocoes/html/cap3_2¬5.html)

Em nosso caso, devemos descobrir k tal que 2k que seja maior ou igual a 200. Como 27
= 128 e 28 = 256, então k = 8. Amplitude:

Em resumo, qualquer regra para determinação do número de classes não nos leva a uma
decisão final, que depende, na realidade, de um julgamento do pesquisador.

Comparação da Regra de Sturges com outros critérios

A Regra de Sturges é uma das regras mais utilizadas na Estatística. Isso porque a
fórmula de Sturges nos fornece uma quantidade adequada de classes para os mais
variados tamanhos de amostras.

Existem várias regras e critérios para a determinação do número de classes. Aqui,


estudamos, além da Regra de Sturges, o critério da Raiz Quadrada e o critério da
Desigualdade. É importante notar que dependendo do critério adotado e do tamanho da
amostra, teremos quantidade de classes diferentes para cada critério. Na tabela a seguir,
podemos comparar os resultados para cada um dos três critérios considerando amostras
de tamanhos 20, 200, 2000 e 20000:
Perceba que o critério da Raiz Quadrada só é adequado para valores pequenos de n
(funciona bem para valores de n menores que 100 ou, no máximo, 150). Já o critério da
Desigualdade e a Regra de Sturges, nos fornecem resultados muito próximos. Porém,
devido a dificuldade em se calcular o valor de k no critério da Desigualdade, geralmente
acabamos por optar em trabalhar com a Regra de Sturges.

Gráficos de distribuições de frequência


Às vezes, é mais fácil identificar padrões de um conjunto de dados olhando o gráfico da
distribuição de frequência. Um desses gráficos é o histograma de frequência. Um
histograma de frequência é um diagrama de barras que representa a distribuição de
frequência de um conjunto de dados. Um histograma tem as seguintes propriedades:

1. A escala horizontal é quantitativa e mede os valores dos dados.


2. A escala vertical mede as frequências das classes.
3. As barras consecutivas devem estar encostadas umas nas outras.

Em virtude de as barras consecutivas no histograma estarem encostadas, elas devem


começar e terminar nas fronteiras da classe ao invés de em seus limites. As fronteiras
das classes são números que separam as classes sem formar lacunas entre elas. Você
pode marcar a escala horizontal tanto nos pontos médios quanto nas fronteiras das
classes.

Histograma é um gráfico de barras contíguas, isto é, formado por um conjunto de


retângulos justapostos. No eixo das abscissas (x) marcamos as classes, cujas
amplitudes correspondem às bases dos retângulos ou, se preferir, podemos marcar os
pontos médios de cada classe. No eixo das ordenadas (y) marcamos as frequências
absolutas, que correspondem às alturas dos retângulos. Os pontos médios das bases dos
retângulos coincidem com os pontos médios dos intervalos das classes.

Construindo o histograma da tabela abaixo:

Solução

Primeiro, encontre as fronteiras da classe. A distância entre o limite superior da primeira


classe e o limite inferior da segunda é 19- 18 =1. Metade dessa distância é 0,5. Então, as
fronteiras inferior e superior da primeira classe são as seguintes: Fronteira inferior da
primeira classe = 7 -0,5 = 6,5 ; Fronteira superior da primeira classe = 18 + 0,5 = 18,5.
As fronteiras das classes remanescentes são mostradas na tabela. Usando os pontos
médios ou as fronteiras das classes para a escala horizontal e escolhendo os valores de
frequência possíveis para a escala vertical, você pode construir o histograma.

Importante – É costumeiro, em diagramas de barras, deixar espaços entre as


barras; já em histogramas, costuma-se não deixar esses espaços.
Interpretação
De qualquer histograma, podemos ver que mais da metade dos usuários gasta entre 19 e
54 minutos na Internet durante sua sessão mais recente.

Outra maneira de representa graficamente a distribuição de frequência é usar um


polígono de frequência. Um polígono de frequência é um gráfico de linhas que enfatiza
as mudanças contínuas nas frequências.

Um polígono de frequências é um gráfico de linha que se obtém unindo polígono de


frequências por uma poligonal os pontos correspondentes às frequências das diversas
classes, centradas nos respectivos pontos médios. Mais precisamente, são plotados os
pontos com coordenadas (ponto médio, frequência simples).

Construindo um polígono de frequência


Outro exemplo:

Método estatístico vol pag 35


Larson pag 37
Cap 2 pag 4

Você também pode gostar