Prof.
Thiago Lopes
Disciplina: Cálculos Financeiros e Estatísticos
Conteúdos
- Distribuição de frequências (continuação)
- Agrupamento de dados em classes
2
Tipos de variáveis
Variáveis são características dos elementos que formam o conjunto de dados.
Qualitativa: quando resulta de uma classificação por categorias ou atributos.
Nominal: quando os dados são distribuídos em categorias sem uma escala de ordem. Ex.: sexo,
raça, tipo sanguíneo, profissão, nacionalidade, qualidade de uma peça (boa ou defeituosa) etc.
Ordinal: quando os dados são distribuídos em categorias que possuem uma ordenação natural. Ex.:
escolaridade, classe social, estágio de uma doença etc.
Quantitativa: quando é expressa por números. Ex.: idade, peso, altura etc..
Discreta: quando assume somente números inteiros (0, 1, 2, 3...), resultado de uma contagem. Ex.:
número de indivíduos pesquisados, número de filhos, peças com defeito.
Contínua: pode assumir qualquer valor num dado intervalo numérico (0; 1; 1,25; 2,37...), resultado
de uma medição. Ex.: peso, altura, tempo, pressão, renda, área, volume.
3
Distribuição de frequências
Distribuição de frequências de variáveis qualitativas
Quando a variável é qualitativa, agrupamos os dados segundo as categorias.
Para construir a tabela de distribuição de frequências, basta contar o número de vezes que cada categoria aparece no
conjunto de dados. Esse número de vezes será a frequência absoluta de cada categoria. Também podemos incluir a
frequência relativa, que é a porcentagem daquela categoria no conjunto de dados.
Com a tabela de distribuição de frequências podemos analisar qual categoria é mais frequente e sua representatividade na
amostra ou população estudada.
Exemplo 1)
4
Distribuição de frequências
Distribuição de frequências de variáveis quantitativas
Quando a variável é quantitativa, agrupamos os dados segundo o valor da variável.
Exemplo 2) Em uma amostra de 80 peças, foi analisado o número de defeitos existentes em cada peça.
Nesta tabela a quantidade de peças foi agrupada segundo o
número de defeitos apresentados em cada uma, que é a variável
estudada.
Pode ser de interesse do pesquisador incluir a frequência
absoluta acumulada e a frequência relativa acumulada.
5
Distribuição de frequências
Frequência absoluta simples (f)
É o número de vezes que o elemento aparece na amostra ou população, ou o número de elementos
pertencentes a uma classe.
Frequência relativa simples (fr)
É a porcentagem de um valor no conjunto de dados, dada por fri = fi/n.
Ela permite comparar grupos com relação à mesma variável, uma vez que, se considerarmos a
frequência absoluta, grupos com um número total de dados maior tendem a ter maiores frequências
absolutas dos valores da variável.
Frequência absoluta acumulada (F)
É a soma das frequências absolutas dos valores inferiores ou iguais ao valor dado. É utilizado no
tratamento de variáveis ordinais ou quantitativas.
Frequência relativa acumulada (Fr)
É a soma das frequências relativas dos valores inferiores ou iguais ao valor dado.
6
Distribuição de frequências
Exemplo 2)
7
Distribuição de frequências
Exemplo 2)
8
Distribuição de frequências
Exemplo 3) Em um lote de 120 peças, foram encontradas 30 peças com nenhum defeito, 24 peças com
apenas 1 defeito, 50 peças com 2 defeitos e 16 peças com 3 defeitos. Construa uma tabela de
distribuição de frequências para representar esses dados.
9
Distribuição de frequências
Exemplo 3) Em um lote de 120 peças, foram encontradas 30 peças com nenhum defeito, 24 peças com
apenas 1 defeito, 50 peças com 2 defeitos e 16 peças com 3 defeitos. Construa uma tabela de
distribuição de frequências para representar esses dados.
10
Distribuição de frequências
Exemplo 3) Em um lote de 120 peças, foram encontradas 30 peças com nenhum defeito, 24 peças com
apenas 1 defeito, 50 peças com 2 defeitos e 16 peças com 3 defeitos. Construa uma tabela de
distribuição de frequências para representar esses dados.
11
Distribuição de frequências
Exemplo 3) Em um lote de 120 peças, foram encontradas 30 peças com nenhum defeito, 24 peças com
apenas 1 defeito, 50 peças com 2 defeitos e 16 peças com 3 defeitos. Construa uma tabela de
distribuição de frequências para representar esses dados.
12
Distribuição de frequências
Agrupamento de dados em classes
Ocorre quando há um grande número de observações (isto é, o valor da variável assume diversos
valores distintos) de variáveis discretas, ou no caso de variáveis contínuas.
Os dados são apresentados por meio de classes ou faixas de valores.
O número ou porcentagem de uma classe chama-se frequência da classe.
13
Distribuição de frequências
Dados brutos
São o conjunto de dados numéricos obtidos após a crítica dos valores coletados.
Exemplo 1)
14
Distribuição de frequências
Rol
É o arranjo dos dados brutos em ordem crescente ou decrescente.
21 22 23 23 25 27 27 30 30 32 33 33
34 36 36 36 36 36 37 37 38 38 39 40
40 41 41 42 42 43 45 45 48 48 49
Amplitude total (AT) ou “range” (R)
É a diferença entre o maior e o menor valor observados.
R = xmáx – xmín = 49 – 21 = 28
15
Distribuição de frequências
Número de classes (K)
Cabe ao pesquisador determinar o número de classes que pretende utilizar. Usar poucas classes pode
ocultar detalhes importantes dos dados, e muitas classes tornam a apresentação demasiado detalhada.
Não há uma fórmula exata para o cálculo do número de classes. Como referência, podemos adotar a
regra:
K = 5 para n ≤ 25 e K ≈ , para n > 25
No Exemplo 1, como n = 35: K ≈ ≈ 5,9 ≈ 6 classes
O número de classes costuma ser aproximado para o maior inteiro. Por exemplo, se K ≈ 6,4 , aproxima-
se para 7 classes.
16
Distribuição de frequências
Amplitude das classes (h)
É a distância entre os limites inferiores (ou superiores) de classes consecutivas. É calculada dividindo-se
a amplitude total (R) pelo número de classes (K).
h≈R÷K
A amplitude das classes deve ser um número com o qual seja fácil de trabalhar, de preferência um
número inteiro, e deve ser sempre arredondada para mais.
No Exemplo 1, temos: h ≈ 28 ÷ 6 ≈ 4,7 ≈ 5
17
Distribuição de frequências
Limites das classes
Os intervalos das classes (ou extremos das classes) são estabelecidos começando do menor valor
observado (ou um inteiro logo abaixo) e somando a amplitude das classes.
Recomenda-se expressar os limites das classes pelo símbolo “ |– ”, incluindo-se o limite inferior e
excluindo-se o limite superior, isto é, os intervalos devem ser fechados à esquerda e abertos à direita.
No Exemplo 1, as classes serão:
20 |– 25 25 |– 30 30 |– 35 35 |– 40 40 |– 45 45 |– 50
As classes não podem se sobrepor. Os limites superiores coincidem com os limites inferiores das classes
seguintes, mas apenas a classe seguinte é que contém o valor em questão, já que o intervalo é fechado
à esquerda.
O intervalo “20 |– 25” compreende todos os valores de 20 a 25, incluindo o 20 e excluindo o 25. O
número 25 pertence à classe “25 |– 30”. 18
Distribuição de frequências
Pontos médios das classes (xi)
O ponto médio de uma classe é a média aritmética do limite inferior e do limite superior da classe.
Se a classe for 20 |– 25, seu ponto médio será:
19
Distribuição de frequências
A partir dos dados brutos, construiremos a tabela de distribuição de frequências.
21 22 23 23 25 27 27 30 30 32 33 33
34 36 36 36 36 36 37 37 38 38 39 40
40 41 41 42 42 43 45 45 48 48 49
Exemplo 1)
20
Distribuição de frequências
A partir dos dados brutos, construiremos a tabela de distribuição de frequências.
21 22 23 23 25 27 27 30 30 32 33 33
34 36 36 36 36 36 37 37 38 38 39 40
40 41 41 42 42 43 45 45 48 48 49
Exemplo 1)
21
Distribuição de frequências
A partir dos dados brutos, construiremos a tabela de distribuição de frequências.
21 22 23 23 25 27 27 30 30 32 33 33
34 36 36 36 36 36 37 37 38 38 39 40
40 41 41 42 42 43 45 45 48 48 49
Exemplo 1)
22
Distribuição de frequências
A soma das frequências absolutas deve coincidir com o total de elementos n do conjunto de dados, e a
soma das frequências relativas deve ser igual a 100%. As classes devem compreender todos os
elementos, nenhum pode ficar de fora.
As tabelas de distribuição de frequências por classes mostram a distribuição da variável de forma
rápida, mas perdem em exatidão, principalmente quando a variável é contínua. Isso porque todos os
dados de uma mesma classe passam a ser representados pelo ponto médio dessa classe.
No entanto, seria inviável construir uma tabela de variáveis discretas ou contínuas sem agrupamento
dos dados em classes, caso precisássemos trabalhar com um número elevado de elementos, pois a
tabela ficaria muito extensa.
23
Distribuição de frequências
Uma distribuição de frequências de variáveis agrupadas em classes pode ser apresentada sob forma
gráfica, através de um histograma.
20 25 30 35 40 45 50
24