Você está na página 1de 11

2.

Organização dos dados: distribuição de frequências e gráficos

2.1. Distribuição de frequências


A distribuição de frequência ou tabela de frequência é um arranjo na forma de uma tabela de
dados estatísticos, atribuindo a cada dado a sua frequência correspondente.

Tipos de frequências
a) Frequência absoluta simples (𝑓𝑖) - A frequência absoluta simples ou simplesmente
frequência é o número de repetições de um valor individual ou de uma classe de valores da
variável.

b) Frequência relativa - (𝑓𝑟𝑖) é o quociente entre a frequência absoluta de um determinado


valor
e o número total de dados.
fi
fri 
n
Importante: A frequência relativa é um número entre 0 e 1. A soma das frequências relativas é
igual a 1.

c) Frequência relativa percentual (𝑓r(%)) - A frequência percentual é a percentagem da


frequência absoluta em relação ao número total de dados. E é calculado multiplicando a
frequência relativa por 100%. É expresso em percentagem.
fi
fri   100%
n
Importante: A frequência relativa é um número entre 0 e 1. A soma das frequências relativas é
igual a 100%

d) Frequência absoluta acumulada (F𝑖) - é a soma da frequência absoluta dessa ordem ou


classe i, com as frequências anteriores partindo de cima para baixo.

e) Frequência relativa acumulada (Fr(%)) - pode ser calculada a partir da definição de


frequências acumuladas ou da definição de frequências relativas

1
Alguns conceitos

Dados Brutos-são os dados originais que ainda não se encontram numericamente organizados.

Rol - é uma lista em que os valores ou dados numéricos são dispostos em uma determinada
ordem, crescente ou decrescente.

Amplitude total ( At ) é a diferença entre o maior valor ( X max ) e o menor ( X min ) num
determinado conjunto de dados, ou é a diferença entre os extremos do rol.
At  X max  X min

Exemplo: os dados a seguir correspondem ao consumo de água de uma determinada família,


ilustrando as três definições anteriores.

a) Dados brutos: 58 62 80 57 28 96 19 90 86 38
b) Rol: 19 28 38 57 58 62 80 86 90 96 ( aqui os dados estão em ordem crescente)
c) c) At = 96-16 = 77
Assim para valores de consumo de água, a amplitude total é 77 dm3

Há duas maneiras de representar a distribuição de frequências dos dados: quando os


valores são não classificados ou não agrupados (tabela 1) e quando os dados são
classificados ou agrupados (tabela 2)

Número Número de Pesos(kg) Número de pacientes


de filhos funcionários [53-55[ 10
0 3 [55 -57[ 15
2 2 [57-59[ 19
3 10 [59-61[ 14
4 5 [61-63[ 12
5 7 total 70
total 27 Tabela 2: dados agrupados em classe
Tabela 1: dados não agrupados em classe

2.1.1. Distribuição de frequências para dados não agrupados em classe

2
As distribuições de frequências não agrupadas são utilizadas quando temos poucos dados e o
número de valores ou o número das modalidades apresenta repetições.

Exemplo: considere os seguintes dados referentes ao número de bebés nascidos na maternidade de um


hospital em cada um dos dias do mês de Setembro:

312302434232122043114332132032

Apresenta os dados numa distribuição de frequências

Solução

Número de bebés fi fr fr(%) Fi Fr


0
1
2
3
4
Total

2.1.2. Distribuição de frequências para dados agrupados em classe


Se o número de dados observados for grande é conveniente agrupar os dados em classes

Pesos(kg) Número de pacientes


[53-55[ 10 53 e o limite inferior e 55 limite superior

Cada uma das linhas representa [55 -57[ 15 55 e o limite inferior e 57 limite superior
uma classe, assim temos 5 classes, [57-59[ 19 57 e o limite inferior e 59 limite superior
ou seja, k=5
[59-61[ 14
[61-63[ 12
total 70

Amplitude da classe (i) e a diferença entre o limite superior


e o limite inferior. Neste exemplo i=55-53=2

Ponto médio da classe (PM ou xi) – é a soma do limite


inferior e superior dividido por dois.

Os procedimentos mais comuns têm os seguintes passos.


Passo 1 - Construir o Rol
Passo2 - Determinar a amplitude total At  X max  X min

3
Passo3 - determinar ou escolher o número de classes (k)
Método 1. escolher arbitrariamente k entre 5 a 20
Método 2. calcular pela fórmula de Sturges, k  1  3,3  log n

Método 3. k  n
At
Passo 4 - Determinar o intervalo de classe (i) i 
k
Passo5 - Determinar os limites inferior e superior das classes.

Exemplo: considera os seguintes dados referentes a altura em centímetros de 30 alunos do curso


de Saúde Pública.

152 152 154 154 155 156


156 157 157 160 160 160
160 160 160 160 162 164
166 166 169 169 170 170
171 175 176 176 180 188

Representa os dados numa tabela de frequência em classes.


Resolução
n  30 porque temos 30 dados
Passo 1 – felizmente os dados estão em Rol
Passo 2 – Amplitude total At  X max  X min At  188  152  36

Passo 3 – Número de classe k  1  3,3  log n  1  3,3  log 30  6 (o número de classe sempre
deve ser um numero inteiro)
At 36
Passo 4 – intervalo da classe i   6
k 6

Altura em
cm numero de alunos fi fr Fi Fr
[152 – 158[ 9
[158 – 164[ 8
164 – 170 5
170 – 176 4
176 – 182 3
182 – 188 1
Total 30

4
2.2.Gráficos

Os gráficos1 são ferramentas utilizadas para representar dados estatísticos, facilitando a leitura, a
interpretação e a análise desses dados.

Existem vários tipos de gráficos. Os principais deles são: gráfico de barras, histograma, gráfica
circular ou de sectores, gráfico de linhas e o diagrama de dispersão.

1. Gráfico de barras
Um gráfico de barras é uma representação gráfica em um eixo cartesiano das frequências de
uma variável qualitativa ou discreta.

2. Histograma
É usado para representar as frequências de uma variável quantitativa contínua. Em um dos eixos
são posicionadas as classes da variável contínua (os intervalos ou as marcas de classe que são
os pontos médios de cada intervalo) e no outro eixo as frequências. Não existe espaçamento
entre as barras.

3. Gráfico circular ou de sectores

1 Todo gráfico deve ter titulo, escala e fonte de dados, de forma a dispensar qualquer esclarecimento adicional.

5
Um gráfico de circular ou de sectores2 é uma representação circular das frequências relativas de
um avariável qualitativa ou discreta que permite, de forma simples e rápida, sua comparação.

Eles são úteis quando as categorias são poucas. Se o gráfico tivesse muitas variáveis, ele
forneceria quase nenhuma informação e seria praticamente incompreensível, como no exemplo
a seguir.

4. Gráfico de linhas
Um gráfico de linha é uma representação gráfica em um eixo cartesiano da relação que existe
entre duas variáveis refletindo claramente as mudanças produzidas

2 Ângulo = Frequência relativa X 360 (graus que tem uma circunferência)

6
5. Diagrama de dispersão
Um gráfico de dispersão mostra a relação entre duas variáveis quantitativas em um eixo
cartesiano.

7
2.3.Exercícios de aplicação

1. Os dados abaixo representam as alturas em centímetros de 40 alunos de uma turma.

162 163 148 166 169 154 170 166 164 165 159 175 155 163 171 172 170 157 176 157 157
165 158 158 160 158 163 165 164 178 150 168 166 169 152 170 172 165 162 164

a) Organiza os dados numa tabela de frequências em classe (frequência absoluta, relativa, frequência
absoluta acumulada e frequência relativa acumulada)
b) Representa os dados num histograma.
c) Qual é a percentagem dos alunos com a altura inferior a 170 cm?

2. A tabela a seguir mostra o número de horas que 45 pacientes do hospital dormiram após a
administração de um determinado anestésico.

7 10 12 4 8 7 3 8 5
12 11 3 8 1 1 13 10 4
4 5 5 8 7 7 3 2 3
8 13 1 7 17 3 4 5 5
3 1 17 10 4 7 7 11 8
a) Organiza os dados numa tabela de frequências em classe (frequência absoluta, relativa, frequência
absoluta acumulada e frequência relativa acumulada)
b) Representa os dados num histograma.

3. A seguir, o número de bebês nascidos durante um ano em 60 hospitais comunitários

3 1 2 3 0 2 4 3 4 2 3 2 1 2 2
0 4 3 1 1 4 3 3 2 1 3 2 0 3 2

a) Indica e classifica a variável em estudo


b) Construa uma tabela de frequências
c) Represente os dados num gráfico de barras

4. Os seguintes dados referem-se ao tempo gasto (em minutos) por 36 trabalhadores entre sua residência e
o local de trabalho no centro de Maputo.

8
5 21 26 13 14 29 12 31 5 50 18 33
23 22 37 32 7 17 15 38 20 11 26 25
27 8 24 12 39 28 9 47 19 22 42 18
a) Construa uma tabela de distribuição de frequências depois de definir a amplitude das classes do

modo que achar mais conveniente. Use k  n


b) Determine o ponto médio de cada classe.

5. Num determinado dia, o administrador do instituto superior de ciências e saúde entrevistou 73 candidatos
a vagas nos cursos lecionados no ISGE-GM, tendo classificado estes segundo a sua candidatura:
Na tabela abaixo apresentam-se os resultados obtidos.

S T H S T S S P H T S O S O P P S H S O

M S S O S P O S H O P S T S H O T H P S

O T O S T H T S T S S O S S S M S T S P

O S O T P S S T S M O S T
Psicologia clinica (P), Saúde Publica (S), Enfermeiros do Trabalho (T), Higiene e Segurança no Trabalho (H), Medicina (M) e
Outras (O)

a) Represente adequadamente em uma tabela de frequência os dados acima e interprete a informação


contida.
b) Represente os dados num gráfico adequado.

6. Nas eleições para a Direcção da Ordem dos Médicos votaram 2000 médicos. Na lista A votaram
35%, na lista E votaram 550 Médicos e na lista X os restantes (não houve votos brancos nem
nulos).
a) Quantos médicos votaram na lista A?
b) Qual a percentagem de votantes na lista E?
c) Qual a lista que ganhou as eleições?

7. Os dados abaixo são referentes ao número de pacientes de tuberculose que entram por dia num
centro de saúde.

Número de pacientes 0 1 2 3 4 5 Total


Frequência absoluta simples 1 4 10 - 2 2 25

a) Determine o valor em falta

9
b) Complete a tabela determinando as frequências relativas em percentagem e acumuladas.

8. Um estudo sobre as causas de mortalidade materna num determinado distrito no Centro de Moçambique
mostrou que 23 mortes foram causadas hipertensão, 9 foram devidos a hemorragias graves, 12 foram
atribuídos a complicações no parto e 6 por abortos inseguros.
a) Construa uma tabela de frequências para representar os dados em questão.
b) Represente os dados num gráfico circular

9. Foi realizado um estudo sobre o número de radiografias realizadas no último ano para um grupo de 200
pacientes e as informações são apresentadas na seguinte tabela incompleta:

Radiografias Número de pacientes fr Fi


0 0,2
1 84
2 0,72
3
4 24
5 0,02
a) Completa a tabela

10. O seguinte histograma mostra a distribuição de frequência de patologia tamanho do tumor (em
cm) para uma amostra de pacientes com câncer:

10
a) Quantos elementos tem a amostra?
b) Qual é a percentagem de pacientes com câncer com nível aproximado de tamanho do tumor
patológico = 2
c) Qual

11

Você também pode gostar