Você está na página 1de 9

UNIVERSIDADE TÉCNICA DE MOҪAMBIQUE

Estatistica 1
1. Tema 2: Apresentação de dados e distribuição de Frequências

2.1.1 Distribuição de Frequências

Ao colectar os dados referentes ao fenómeno objecto de estudo, normalmente o analista se


defronta com valores que se repetem algumas ou muitas vezes, sugerindo sua apresentação
através de tabelas onde somente apareçam valores distintos uns aos outros. Essa providência
favorece evidentemente uma análise e interpretação mais rápida da natureza e comportamento
do fenómeno observado.

Um dos objectivos da estatística descritiva neste caso quando se trabalha com grandes
quantidades de dados é obter uma significativa redução dos mesmos dados.

Neste caso, a Distribuição de Frequência é uma ferramenta estatística apropriada para a

apresentação de grandes massas de dados, numa forma que torna mais clara a

tendência central e a dispersão dos valores ao longo da escala de medição, bem como

a freqüência relativa de ocorrência dos diferentes valores.

Dados brutos – são os dados originais, que ainda não se encontram prontos para análise, por
não estarem numericamente organizados. (Também são conhecidos como Tabela Primitiva).
Exemplo: Considere o conjunto dos pesos (em kg) dos 20 estudantes, tirado de uma lista
alfabética da base de dados do Registo Acadêmico da USTM.

45, 41, 42, 41, 42 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
O Rol é uma lista em que os valores númericos brutos estão dispostos em uma determinada
ordem, crecente ou decrescente.
Exemplo: Apresentando em ordem crescente o conjunto dos pesos dos 20 estudantes do
exemplo anterior temos:

41, 41, 41, 42, 42 43, 44, 45, 46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60

2.1.2 Distribuição de frequências de dados tabulados não-agrupados em classe

É a simples condensação dos dados conforme as repetições de seus valores. Este tipo de
apresentação é utilizado para representar uma variável discreta ou discontínua. Para uma tabela
de tamanho razoável, esta distribuição de frequência é inconveniente, já que exige muito
espaço.
Na primeira coluna, encabeçado pelo índice i, aparecem os números correspondentes à ordem

dos valores da variável. Na segunda coluna, encabeçada por


xi , são anotados em ordem

crescente apenas os valores distintos da variável.


Na terceira coluna é uma coluna auxiliar (opcional), utilizada para que se possa processar a
contagem dos valores repetidos, sem grande esforço.

A última coluna, encabeçada por f i , apresenta as frequências, que são os resultados numéricos

provenientes da contagem. A soma de frequências é sempre igual ao número total de valores


k

f
i 1
i n
observados:
k : é o extremo superior do intervalo de valores do índice i.
fi
:é o número de observações de um valor
n : é o número total de valores observados.

Exemplo: Considerando o exemplo anterior, sobre o peso dos 20 estudantes, a tabela de


distribuição de frequência será:
i xi Frequências
 fi 
1 41 3
2 42 2
3 43 1
4 44 1
5 45 1
6 46 2
7 50 2
8 51 1
9 52 1
10 54 1
11 57 1
12 58 2
13 60 2
Soma --------- 20
Tabela1. Exemplo da distribuição de frequência de uma variável não
agrupada em classe

2.1.3 Distribuição de frequências de dados agrupados em classe

Quando a variável objecto do estudo é contínua, é sempre conveniente agrupar os valores


observados em classes. Se por outro lado, a variável é discreta e o número de valores
representativos dessa variável é muito grande, recomenda-se o agrupamento dos dados em
classes.
Neste último caso, o procedimento visa evitar certos inconvenientes, como:
 Grande extensão da tabela, dificultando, tanto quanto os dados brutos, a leitura e a
interpretação dos resultados apurados;
 Aparecimento de diversos valores da variável com frequência nula;
 Dificuldade de visualização do comportamento do fenómeno como um todo.

i Classes Frequências  f i 
1 41 |------ 45 7
2 45 |------ 49 3
3 49 |------ 53 4
4 53 |------ 57 1
5 57 |------ 61 5
Total 20
Tabela 2: Exemplo de Distribuição de dados agrupados em classe.

2.1.4 Elementos de uma distribuição de frequência com classe

Classe: Intervalos nos quais os valores da variável analisada são agrupados. Cada classe é
simbolizada por (i) e o número total de classe é simbolizado por (k).
Ex: na tabela anterior k=5 e 49 |------- 53 é a 3ª classe, onde i=3.

Limites da classe: são extremos de cada classe. O menor número é o limite inferior de classe
Linf  e o maior número, o limite superior de classe Lsup  .

Deste modo, o intervalo de classe quanto a sua natureza pode ser aberto, fechado ou misto.

Intervalos abertos – os limites da classe (inferior e superior) não pertencem a ela.


Exemplo de notação 49 --- 53
Intervalos fechados – os limites de classe (superior e inferior) pertencem à classe em questão.
Exemplo de notação, 49 |-----|53

Intervalos mistos – um dos limites pertence à classe, e o outro, não. Exemplo de notação,
49 |-----53 ou 49 ----|53.

Cálculo de número total de classes


Para montar uma distribuição de frequência é necessário que primeiro se determine o número de
classes (k) em que os dados serão agrupados.

Não existe regra fixa para se determinar o número de classes (k). Contudo, neste material são
apresentadas algumas:

Regra 1: Por questões de ordem prática e estética sugere-se utilizar de 5 a 20 classes;

Regra 2: Fórmula de Sturges, que nos dá o número de classe em função em função do número
de valores da variável:

K  1  3.3 * log n , onde n é o número de itens que compõe a amostra;

se n  25, k  5


 se n  25, k  n
Regra 3: se n  25 , então K  5 ; se n  25 então K n , ou seja, 
n= número total de observações.

De um modo geral, para a resolução dos exercícios iremos usar a regras 2 e/ou regra 3, para
determinar o número de classe em função do número de observações (n).

Exemplo: considerando o exemplo anterior podemos obter o número total de classe:


Temos que n=20 então, pela regra 2, K=1+3.3*log20= 1+3.3*1.3= 5.29  5
Amplitude Total ou “Range” ( At ) é a diferença entre o maior e o menor número do rol. A
amplitude total pode ser denotada por:
At  X max  X min

Por exemplo, o maior peso dos 20 estudantes é de 60 kg e o menor é de 41 kg, a amplitude total
será de 19 kg ( 60 kg - 41 kg).

Amplitude do intervalo de classe (c):


At
c
k  1 , onde: c= Amplitude de classe; At =amplitude total; e K  número total de classes.
19
c  4.75
Exemplo: 5 1

Ponto Médio de classe (PM):


Lsup  Linf Lsup
PM  , onde = Limite superior da classe; Linf = Limite inferior da classe;
2
Assim, o limite inferior da primeira classe será:
c
Linf 1  X min 
2 , onde X min é o menor valor de todas de todas as observações da amostra.
E os demais limites são obtidos somando-se c ao limite anterior.

Frequência simples ou absoluta


 f i  : é o valor que representa o número de observações em
uma determinada classe ou em um determinado atributo de uma variável qualitativa. A soma
das frequências simples é igual ao número total dos dados da distribuição.
Frequência relativa  f r  : é o valor da razão (proporção) entre a frequência absoluta em uma
determinada classe e a frequência total da distribuição. A soma das frequências relativas é igual
a 1 (100%).

 
Frequência simples acumulada de uma classe Fi : é o total das frequências de todos os
valores inferiores ao limite superior do intervalo de uma determinada classe.

Frequência relativa acumulada de uma classe Fr  : é a frequência acumulada da classe,


dividida pela frequência total da distribuição.

Exemplo: Elaboração de uma distribuição de frequências com classes.


Os dados da tabela abaixo foram obtidos em uma pesquisa de mercado e correspondem ao
tempo (T) em minutos que consumidores (C) de uma determinada operadora de telefonia móvel
utilizariam em um mês. Elabore uma distribuição de frequências com classe.

C T C T C T C T C T
1 104 9 122 17 129 25 144 33 183
2 108 10 142 18 138 26 151 34 138
3 138 11 106 19 122 27 146 35 115
4 101 12 201 20 161 28 82 36 179
5 163 13 169 21 167 29 137 37 142
6 141 14 120 22 189 30 132 38 111
7 90 15 210 23 132 31 172 39 140
8 154 16 98 24 127 32 87 40 136

Resolução:
Passos para elaboração de uma distribuição de frequências com classes.
Primeiro passo: Organizar os dados brutos em um ROL crescente:
82 111 132 142 167
87 115 136 142 169
90 120 137 144 172
98 122 138 146 179
101 122 138 151 183
104 127 138 154 189
106 129 140 161 201
108 132 141 163 210

Segundo passo: Calcular a amplitude total At :


X min  82 minutos, X max  210 minutos então At  X max  X min  210  82  128 minutos.

Terceiro passo: calcular o número total de classe (K)

O número de observações da amostra (n) é 40, então K  n  40  6.32  6 ou pelo sturges


K  1  3.3 * log n  1  3.3 * log 40  1  3.3 *1.6  6.28  6 classes

Quarto passo: conhecido o número de classe, calcular a amplitude de cada classe:


At 128
c   25.6
k 1 6 1 minutos
Quinto passo: calcular o limite inferior da primeira classe:
c 25.6
Linf  X min   82   82  12.8  69.2
2 2
Sexto passo: Determinar os intervalos de classes:
69.2|---94.8
94.8|---120.4
120.4|---146.0
146.0|---171.6
171.6|---197.2
197.2|---222.8
i classe f i (consumidores) Fi f r (proporção) Fr
1 69.2|---94.8 3 3 0.075 0.075
2 94.8|---120.4 8 11 0.200 0.275

3 120.4|---146.0 16 27 0.400 0.675

4 146.0|---171.6 7 34 0.175 0.850

5 171.6|---197.2 4 38 0.100 0.950

6 197.2|---222.8 2 40 0.050 1.000

Total ------- 40 1.000

Você também pode gostar