Você está na página 1de 23

ESTATÍSTICA APLICADA À

QUALIDADE
AULA 1

Prof. Ricardo Alexandre Deckmann Zanardini


CONVERSA INICIAL

Seja bem-vindo à nossa aula. Estudaremos aqui os principais elementos


da estatística para que possamos aplicar esses conhecimentos em situações
reais. Iniciaremos nossos estudos tratando de conceitos fundamentais da
estatística. Aprenderemos técnicas de coleta, organização, representação e
interpretação de dados. Nesta aula, vamos tratar da importância da estatística
em nossas vidas, de como realizar um estudo estatístico e de como podemos
organizar os dados coletados. Desde já, sucesso nos estudos!

TEMA 1 – CONCEITOS INICIAIS

Estamos constantemente em contato com informações relacionadas à


estatística, tais como o crescimento da produção industrial em um determinado
período, a variação de preços de materiais escolares, a taxa de mortalidade
infantil, o número de assaltos em determinada região, as intenções de votos em
uma eleição e muitas outras situações relacionadas a pesquisas, coleta e
apresentação de dados, descrição de fenômenos, representação de informações
por meio de gráficos e muito mais.
A base da estatística está na coleta de dados que são informações
provenientes de medições, contagens, respostas ou observações.
Há registros que comprovam que, desde a antiga Babilônia, localizada no
Egito, dados referentes a nascimentos e óbitos eram coletados pelo Estado.
Acredita-se que a origem da palavra estatística está na palavra “status”, que
significa estado.
Com o passar do tempo, a estatística foi ficando cada vez mais importante
e mais utilizada. No caso do controle da qualidade, por exemplo, a estatística
exerce um papel fundamental. Com o aumento da produção, a etapa referente à
verificação da qualidade do que era produzido ficou mais complexa e a
estatística passou a ser utilizada para a obtenção de informações importantes
referente à conformidade ou não dos produtos com padrões exigidos.
Quando pensamos em estatística, definimos como uma área da
matemática que tem como objetivo coletar, organizar, analisar e interpretar
dados.
Quando lidamos com esses dados, temos dois tipos de conjuntos, um
denominado população e outro que chamamos de amostra. A população

2
consiste em todos os dados relacionados a um fenômeno enquanto que a
amostra é uma parte da população. Podemos dizer, então, que a amostra é um
subconjunto da população.

Mas, na prática, qual é a diferença e a importância da população e da


amostra? Temos inúmeros exemplos, mas vamos pensar em uma indústria que
produz lâmpadas de LED para iluminação residencial. Após a fabricação, cada
lâmpada é testada. Como temos os dados referentes a todas as lâmpadas,
estamos tratando de uma população. Agora, vamos pensar em uma indústria
que fabrica palitos de fósforo. Não podemos testar todos os palitos para ver se
acendem corretamente, mas podemos realizar os testes com uma parte desses
palitos, ou seja, consideramos uma amostra da produção.
Um outro exemplo muito comum está relacionado às pesquisas realizadas
em época de eleição. Se considerarmos que em uma certa cidade que possui
15.323 eleitores e 1.214 foram entrevistados, a população são as respostas de
15.323 eleitores e a amostra são as respostas de 1.214 eleitores. Como 1.214
eleitores foram entrevistados, não conhecemos todas as respostas, mas apenas
uma parte delas.
Muitas vezes, dados obtidos a partir de uma amostra são utilizados para
que possamos obter conclusões relacionadas a uma população. Para que esse
processo tenha consistência, precisamos utilizar técnicas apropriadas para isso,
tais como uma amostra significativa e aleatória em relação à população. É
comum alguns estudos estatísticos não terem valor por problemas na coleta de
dados, tais como uma amostra insuficiente ou uma amostra tendenciosa.

3
A estatística é dividida em dois ramos, a descritiva que consiste em
coletar, organizar resumir e apresentar dados, e a inferencial que utiliza dados
da amostra para fazer considerações a respeito da população.
No que se refere aos dados, temos dois tipos. Os dados qualitativos se
referem a atributos não numéricos e os dados quantitativos se referem a
contagens ou medidas numéricas. Por exemplo, nomes ou cores são dados
qualitativos e preços ou tamanhos são dados quantitativos. Um dado qualitativo
pode ser ordinal quando possui uma ordem natural de intensidade, por exemplo,
uma estatura baixa, média ou alta ou pode ser nominal quando não possui uma
ordem natural como olhos castanhos, azuis ou verdes. Quando tratamos de
dados qualitativos, não realizamos cálculos matemáticos.
Exemplo: em uma pesquisa realizada em uma empresa, identificaram-se
os seguintes indicadores:
i. idade;
ii. renda;
iii. estado civil;
iv. número de filhos;
v. setor de trabalho;
vi. tempo de empresa; e
vii. nota obtida na última avaliação de produtividade.
A partir dessas informações, determine as variáveis qualitativas e as
variáveis quantitativas.
Resolução:
• variáveis qualitativas – estado civil, setor de trabalho;
• variáveis quantitativas – idade, renda, número de filhos, tempo de
empresa, nota obtida na última avaliação de produtividade.
Agora que já sabemos o que é estatística, população, amostra e dados,
podemos pensar em como é feito um estudo estatístico.

TEMA 2 – ESTUDO ESTATÍSTICO

Um estudo estatístico tem como objetivo coletar dados e, a partir desses


dados, ter recursos para realizar a tomada de decisões.
Assim, o primeiro passo é definir um objetivo e quais são as variáveis
associadas a esse objetivo. Também é importante identificar a população
referente ao estudo.
4
Feito isso, é preciso definir um plano para a coleta de dados. Caso seja
utilizada uma amostra, é preciso ter certeza de que a amostra é capaz de
representar satisfatoriamente a população.
Após a coleta dos dados, é preciso organizar, descrever os dados e
verificar se há erros no processo.
Finalmente, podemos interpretar os dados para tomarmos as decisões
necessárias.
No decorrer dos nossos estudos, aprenderemos a utilizar técnicas de
estatística para a realização das etapas de um estudo estatístico descritivo.
Ao realizarmos um estudo estatístico, há importantes técnicas
relacionadas às formas de realizarmos esse estudo e coletarmos os dados.
Vamos acompanhar as explicações referentes a quatro maneiras diferentes de
fazermos isso.

• Estudo observacional: nesse estudo, são observados os aspectos de


interesse, mas as condições não são modificadas, ou seja, não há
alteração e nem tratamento no processo de obtenção dos dados.
Podemos citar, por exemplo, a observação da capacidade de um grupo
de pessoas montar determinadas peças.

• Experimento: nessa modalidade, é aplicado um tratamento em uma


amostra e, a partir disso, as respostas são observadas. Esse grupo recebe
o nome de grupo experimental. É comum que outra amostra, chamada de
grupo de controle, não receba qualquer tipo de tratamento para que as
respostas obtidas a partir desses dois grupos sejam comparadas. É
comum que experimentos sejam realizados em uma determinada fase dos
estudos de um novo medicamento.

• Simulação: a simulação é uma forma muito comum de estudo de


fenômenos que ainda não podem ser realizados fisicamente ou de
fenômenos que exigem um grande esforço ou que possuem grandes
riscos ao serem realizados. Para fazer uma simulação, um modelo físico
ou matemático é criado e as condições do problema são reproduzidas e
observadas. Um exemplo é a utilização da simulação para o estudo da
possibilidade de ocorrência ou não de acidentes aéreos a partir de
alterações em determinadas aeronaves.

5
• Pesquisa de mercado: nessas pesquisas, determinadas características
são investigadas por meio de questionários feitos com pessoas. As
pessoas são entrevistadas pessoalmente, por telefone, por e-mail, ou por
alguma outra forma física ou eletrônica, tais como formulários que são
respondidos e depois analisados. É comum, por exemplo, que uma
pesquisa assim seja realizada para medir o nível de satisfação dos
clientes de uma concessionária em relação aos respectivos veículos
adquiridos.

Agora que sabemos quais são os métodos de coleta de dados, vamos


falar um pouco a respeito de técnicas de amostragem. Uma amostragem é uma
técnica muito utilizada na estatística. Na amostragem, a contagem ou medição
é feita com uma parte da população enquanto que um censo é um estudo
realizado com todos os membros da população.
Ao realizarmos uma amostragem, é preciso considerar uma amostra
significativa para que o estudo seja confiável. Como não estamos considerando
a população, mesmo que a amostra seja confiável, é comum que exista um erro
entre os dados da amostra em relação aos dados da população. Na estatística
inferencial, há técnicas de controle desses erros.
Uma amostra é chamada de amostra aleatória simples quando toda a
amostra possível de mesmo tamanho tem as mesmas chances de ser
selecionada. Uma forma de obtermos uma amostra aleatória simples é
atribuirmos um número diferente para cada elemento da população e a partir da
geração de números aleatórios, selecionar os elementos que irão compor a
amostra. É como se fosse um sorteio. Os números aleatórios podem ser obtidos
a partir de tabelas ou de aplicativos destinados a essa tarefa. Um exemplo é
pensar em realizar um estudo relacionado ao controle de qualidade de peças
produzidas por uma indústria. Cada peça recebe um número diferente e, de
forma aleatória, são selecionadas as peças que formarão a amostra desse
estudo.
Também é possível escolher os elementos que irão compor a amostra
seguindo técnicas, tais como amostra estratificada, amostra por agrupamento ou
amostra sistemática.
Uma amostra estratificada é utilizada quando precisamos de elementos
de diferentes segmentos da população. A população é dividida em grupos
denominados de estratos e as amostras são obtidas aleatoriamente a partir de

6
cada estrato. Assim, é possível garantir que cada um desses grupos terá uma
amostra significativa relacionada. Por exemplo, em uma indústria que produz
parafusos, podemos separar a produção em grupos de acordo com
características relevantes, tais como parafusos franceses, sextavados, para
madeira e autoatarraxantes e, a partir de cada um desses estratos, selecionar
de forma aleatória as respectivas amostras.
No que se refere à amostra por agrupamento, a população naturalmente
está dividida em grupos distribuídos geograficamente, cada um deles contendo
características similares. Para obter uma amostra por agrupamento, a população
é dividida em grupos e todos os membros de um ou de mais grupos são
selecionados. É importante cuidar para que não sejam selecionados os membros
de todos esses grupos. Também é importante verificar se todos os grupos
possuem característica similares. Podemos imaginar como exemplo que uma
rede de supermercados possui diferentes filiais. Podemos considerar que os
funcionários de cada filial formam os grupos nos quais a população corresponde
a todos os funcionários da rede.
Considerando agora uma amostra sistemática, temos números
associados a todos os membros da população que são ordenados seguindo um
determinado critério. A partir desses números, escolhe-se um valor inicial e os
membros são selecionados a partir de intervalos regulares. É uma amostragem
fácil de ser utilizada. Podemos, por exemplo, atribuir números diferentes para
cada funcionário de uma empresa e selecionar os números que são múltiplos de
10.
Uma amostra que existe, mas que não é recomendada por gerar dados
tendenciosos é a amostra de conveniência que utiliza apenas os elementos
disponíveis de uma população.
Uma amostra precisa ser diversificada para que contemple aspectos
distintos da população. Imagine que um pesquisador vai até um estádio de
futebol e faz uma entrevista com torcedores para saber quantos gostam de
futebol. Se o objetivo da pesquisa é saber quantos torcedores gostam de futebol,
é aceitável a escolha da amostra, mas se o objetivo é identificar a porcentagem
de habitantes de uma cidade que gostam de futebol, a amostra escolhida não é
suficientemente diversificada e os resultados obtidos são tendenciosos.
Considerando o controle de qualidade de uma indústria, por mais que a
busca por uma gestão cada vez mais organizada, otimizada e sustentável ocorra,

7
ainda é preciso acompanhar as etapas dos processos e a estatística está
presente de uma forma muito próxima. É possível inspecionar etapas da
produção por amostragem e utilizar ferramentas estatísticas para o
acompanhamento do processo produtivo. Sendo assim, a coleta de dados
exerce também um importante papel nesse cenário.
Agora que já sabemos como coletar dados, é importante aprendermos
maneiras de organizá-los.

TEMA 3 – DADOS NÃO AGRUPADOS

A forma mais simples de organização dos dados é quando eles não estão
agrupados, ou seja, são apresentados um a um. Quando os dados são
coletados, mas não passaram por qualquer tipo de tratamento, eles são
chamados de dados brutos. No entanto, podemos organizar os dados em uma
ordem. No caso de dados numéricos, podemos colocar esses dados em uma
ordem crescente. Os dados ordenados recebem o nome de rol.
Exemplo 1: a seguir, temos os comprimentos em centímetros de onze
árvores natalinas naturais que foram comercializadas na primeira semana do
mês de dezembro, em uma loja especializada:

201, 223, 198, 187, 213, 209, 207, 202, 201, 214, 215

Organize esses dados em uma ordem crescente.


Resolução: como são poucos dados, podemos ordená-los manualmente
ou por meio do Excel. Caso não seja possível utilizar o Excel, uma alternativa
similar é o uso de uma planilha Google.
No caso do Excel, o primeiro passo é abrir uma planilha e inserir os dados
do problema:

8
Em seguida, selecionamos estes valores e, na aba “Página Inicial”,
clicamos em “Classificar e Filtrar” e selecionamos a opção “Classificar do Menor
para o Maior”:

Assim, temos o seguinte resultado:

9
O rol, ou seja, os dados em ordem crescente, é:

187, 198, 201, 201, 202, 207, 209, 213, 214, 215, 223.

A partir desses dados, podemos começar a pensar em como podemos


descrever as informações que temos. Como temos uma quantidade pequena de
informações, fica fácil de identificarmos, por exemplo, que o menor comprimento
corresponde a 187 centímetros e o maior corresponde a 223 centímetros:

187, 198, 201, 201, 202, 207, 209, 213, 214, 215, 223

Também é possível observar que o tamanho mediano, ou seja, o elemento


que está na posição central do rol é 207 centímetros:

187, 198, 201, 201, 202, 207, 209, 213, 214, 215, 223

Não realizamos cálculos, mas podemos saber que os comprimentos


variam de 187 a 223 centímetros e que 207 centímetros é a altura mediana das
árvores comercializadas.
Agora, com um cálculo simples, podemos saber a amplitude total, ou seja,
qual é a variabilidade dos dados. Para isso, basta fazermos a diferença entre o
maior e o menor valor:

10
223 – 187 = 36

Assim, dizemos que a amplitude do intervalo é igual a 36 centímetros.


Essas características (centro e amplitude) são importantes quando
estamos organizando e descrevendo os dados.
Exemplo 2: a seguir temos as quantidades de erros de impressão em
cartões de visita feitos em uma gráfica durante os 21 dias úteis de um
determinado mês.

10 5 7 8 2 12 6
4 6 7 3 9 11 10
9
3 7 8 6 5 9

Organize os dados, determine o menor valor, o maior valor e a amplitude


total.
Resolução: os dados ordenados, manualmente ou por meio do Excel, são:

2 3 3 4 5 5 6
6 6 7 7 7 8 8
9
9 9 10 10 11 12

Menor valor: 2
Maior valor: 12
Amplitude total: 12 – 2 = 10
Futuramente, aprenderemos ainda a representarmos graficamente os
dados, a calcularmos medidas de posição (média, moda e mediana), medidas
de dispersão (variância e desvio padrão) e muito mais.
Para poucos dados, podemos ter a representação de cada um deles, mas
quando o número de dados aumenta, muitas vezes precisamos de formas
eficientes de agrupamento dos dados. Estudaremos a distribuição de frequência
e a distribuição de frequência por classe.

TEMA 4 – DISTRIBUIÇÃO DE FREQUÊNCIA

Quando estamos trabalhando com dados e há repetição de valores,


podemos organizar esses dados em uma tabela contendo o valor de cada dado
11
e o respectivo número de repetições. Essa forma de organizar os dados é
denominada de distribuição de frequência. É bastante utilizada, pois, além de
facilitar a visualização das informações, apresenta esses dados de forma
resumida.
Vamos acompanhar alguns exemplos que ajudarão a entender melhor
como construímos uma tabela de distribuição de frequência e como essas
tabelas podem ser úteis.
Exemplo 1: em uma grande concessionária de automóveis há uma
pesquisa de satisfação que é realizada após cada atendimento realizado. A
pesquisa é bem simples e o cliente precisa apenas atribuir uma nota de 1 a 5,
em que 1 indica que o atendimento foi ruim e a nota 5 indica que o atendimento
foi excelente.
No final de um certo dia, as notas recebidas, já em ordem crescente,
foram:

1, 1, 2, 2, 2, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5

Dessa forma, construa uma tabela contendo as notas e quantos


atendimentos receberam cada uma dessas notas.
Resolução: como temos dois atendimentos que receberam nota 1, três
atendimentos que receberam nota 2, um atendimento que recebeu nota 3, 7
atendimentos que receberam nota 4 e quatro atendimentos que receberam nota
5, a tabela de distribuição de frequência é dada por:

Nota (xi) Número de atendimentos (fi)


1 2
2 3
3 1
4 7
5 4

A tabela anterior facilita a organização e a visualização dos dados. Na


primeira coluna temos as notas recebidas que são representadas por x i e na
segunda coluna as respectivas quantidades de atendimentos que receberam
cada uma dessas notas. Esses números são chamados de frequências e
representados por fi.
Assim, para cada dado xi, temos uma frequência correspondente f i.
12
A partir da tabela, fica fácil de identificar o menor valor (1) e o maior valor
(5). Também podemos calcular a amplitude total fazendo 5 – 1 = 4. Mas como
podemos identificar qual é o elemento que está no centro desses dados?
Se olharmos para os dados não agrupados, fica fácil identificar que a
posição central é ocupada pelo número 4, ou seja, dos 17 elementos, temos oito
valores à esquerda de 4 e oito valores à direita de 4:

1, 1, 2, 2, 2, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5

Mas em relação à tabela de distribuição de frequência, como é que nós


podemos identificar qual é esse elemento?
Precisamos de uma forma de relacionar os elementos da tabela com as
respectivas posições que esses elementos ocupam no rol. Assim, precisamos
de uma nova coluna para adicionarmos a frequência acumulada, ou seja, a
frequência de cada elemento em relação à posição que eles estão no rol.

Nota Número de atendimentos Frequência acumulada


(xi) (fi) (fa)
1 2
2 3
3 1
4 7
5 4

Mas como podemos obter e qual é o significado da frequência


acumulada?
Se observarmos o rol, o número 1 ocupa as duas primeiras posições:

1, 1, 2, 2, 2, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5

O número 2 começa na terceira posição e vai até a quinta posição:

1, 1, 2, 2, 2, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5

O 3 ocupa a sexta posição:

1, 1, 2, 2, 2, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5

13
O número 4 começa na sétima posição e vai até a décima terceira
posição:

1, 1, 2, 2, 2, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5

O número 5 vai da décima quarta até a décima sétima posição:

1, 1, 2, 2, 2, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5

Assim, basta somarmos a frequência com as frequências anteriores para


obtermos a frequência acumulada e conseguirmos indicar onde os dados estão
localizados no rol.
Vamos fazer de forma detalhada.
A primeira frequência acumulada se refere ao número 1 e é igual a 2.
Assim, basta repetirmos esse valor na coluna da frequência acumulada:

Nota Número de atendimentos Frequência acumulada


(xi) (fi) (fa)
1 2 2
2 3
3 1
4 7
5 4

Vamos agora somar o valor da coluna da frequência acumulada com a


próxima frequência, ou seja, vamos fazer 2 + 3 = 5:

Nota Número de atendimentos Frequência acumulada


(xi) (fi) (fa)
1 2 2
2 3 5
3 1
4 7
5 4

Isso significa que o número 1 ocupa as duas primeiras posições e que o


número 2 vai da posição seguinte, ou seja, da terceira posição até a posição de
número 5.

14
Vamos agora somar a frequência acumulada do momento com a próxima
frequência. Fazendo 5 + 1 = 6, temos que o número 3 está na sexta posição:

Nota Número de atendimentos Frequência acumulada


(xi) (fi) (fa)
1 2 2
2 3 5
3 1 6
4 7
5 4

Precisamos agora somar a nova frequência acumulada com a próxima


frequência, ou seja, precisamos fazer 6 + 7 = 13:

Nota Número de atendimentos Frequência acumulada


(xi) (fi) (fa)
1 2 2
2 3 5
3 1 6
4 7 13
5 4

E, finalmente, vamos somar 13 com 4, o que resulta em 17:

Nota Número de atendimentos Frequência acumulada


(xi) (fi) (fa)
1 2 2
2 3 5
3 1 6
4 7 13
5 4 17

Para sabermos, a partir da tabela, qual é o elemento que ocupa a posição


central, basta dividirmos o total de elementos ao meio, ou seja, 17 / 2 = 8,5 e
arredondarmos para o próximo inteiro que é o número 9. O elemento que está
na posição central ocupa a nona posição. Mas e na tabela, como identificar qual
é o dado que está nessa posição? Basta verificarmos na coluna da frequência

15
acumulada onde está a nona posição. Como o 9 está entre o 6 e o 13,
precisamos olhar na linha do número 13, qual é o respectivo dado. Observe que
é o número 4.

Nota Número de atendimentos Frequência acumulada


(xi) (fi) (fa)
1 2 2
2 3 5
3 1 6
4 7 13
5 4 17

Assim, o 4 é o valor que ocupa a posição central.


Futuramente, estudaremos essa abordagem novamente quando formos
tratar de mediana, que é o nome dado ao valor que está na posição central do
rol.
Além da frequência acumulada, temos a frequência relativa que indica a
porcentagem de cada frequência em relação ao total de dados.
Para obtermos cada uma das frequências relativas, vamos dividir as
frequências pelo total de elementos e em seguida vamos multiplicar o resultado
por 100 para termos a respectiva porcentagem.
Para a primeira frequência relativa, basta fazermos 2 / 17 = 0,1176 e
multiplicando por 100, temos 11,76%. A segunda frequência relativa é dada por
3 / 17 = 0,1765 = 17,65%. As demais frequências relativas são: 1 / 17 = 0,0588
= 5,88%, 7 / 17 = 0,4118 = 41,18% e 4 / 17 = 0,2353 = 23,53%. Acrescentando
mais uma coluna na tabela e inserindo esses valores, temos:

Nota Número de Frequência Frequência


(xi) atendimentos acumulada relativa
(fi) (fa) (fr)
1 2 2 11,76%
2 3 5 17,65%
3 1 6 5,88%
4 7 13 41,18%
5 4 17 23,53%

16
Podemos utilizar uma distribuição de frequência para criarmos uma folha
de verificação, uma tabela destinada à coleta de informações referentes a não
conformidades de um produto ou de um serviço.
A seguir, temos um exemplo de uma folha de verificação referente a uma
indústria de produtos alimentícios:

Processo analisado: produção de cookies americanos


Produção diária: 5.000 unidades
Amostra verificada: 200 unidades
Porcentagem verificada: 4%
Defeito Frequência
Pouco chocolate 10
Parte de baixo queimada 15
Tamanho reduzido 8

Uma folha de verificação é muito útil para o processo do controle de


qualidade.

TEMA 5 – DISTRIBUIÇÃO DE FREQUÊNCIA POR CLASSE

Vamos agora aprender a organizar dados em uma distribuição de


frequência por classe. Utilizamos essa forma de agrupamento de dados quando
temos muitos valores relativamente próximos e não necessitamos de muita
precisão, pois não vamos trabalhar com os dados exatos, mas sim com valores
desconhecidos, mas que estão em determinados intervalos. Uma distribuição
assim denominada de distribuição de frequência por classe, é bastante utilizada.
Um exemplo muito comum é a faixa salarial. Em muitas pesquisas, pede-se para
que seja informada a renda mensal. O princípio é dizer em qual das faixas
salariais apresentadas está a renda da pessoa que está fornecendo a
informação. Por exemplo, se na pesquisa são apresentadas as faixas “de R$
1.000,00 a R$ 2.000,00”, “de R$ 2.000,00 a R$ 3.000,00”, “de R$ 3.000,00 a R$
4.000,00”, e assim por diante, e o salário mensal corresponde a R$ 1.812,36, a
pessoa vai assinalar a opção “de R$ 1.000,00 a R$ 2.000,00”. Note que o valor
exato do salário não é informado, mas se sabe que é um valor entre R$ 1.000,00
e R$ 2.000,00. Essa forma de organização e agrupamento dos dados é bastante
comum e possui algumas características importantes. Os intervalos não

17
precisam ter os mesmos tamanhos, mas o ideal é fazer com que todos os
intervalos tenham o mesmo tamanho. Cada classe terá um limite inferior e um
limite superior e a amplitude do intervalo é a diferença entre esses limites.
Também teremos um ponto muito útil pertencente ao intervalo que é o ponto
médio. Esse ponto é dado a partir da média aritmética dos limites da classe:

Li + Ls
pm =
2

em que Li é o limite inferior da classe, Ls é o limite superior da classe e p m é o


ponto médio do intervalo. Por exemplo, no intervalo de R$ 3.000,00 a R$
4.000,00, temos Li = 3.000,00, Ls = 4.000,00 e p m = 3.500,00. O número de
classes depende do problema e das características dos dados. O ideal é que
tenhamos no mínimo cinco classes e no máximo 20 classes para que seja
possível identificar de maneira mais consistente os possíveis padrões existentes.
Após definirmos quantas classes serão utilizadas, precisamos definir o
tamanho de cada intervalo. Para isso, primeiro precisamos da amplitude dos
dados, ou seja, a diferença entre o maior valor e o menor valor. Em seguida,
vamos dividir a amplitude total pelo número de classes e arredondar para o
próximo inteiro, mesmo que o resultado seja inteiro. Por exemplo, se essa divisão
resultar em 7,31, arredondamos para 8 e mesmo que o resultado obtido fosse 7,
por exemplo, teríamos que arredondar para 8 para garantir que tenhamos um
tamanho suficiente para cada intervalo. Para a primeira classe, o limite inferior
pode ser o menor valor ou um número conveniente abaixo desse valor mínimo
dos dados.
Não é obrigatório que seja feito sempre assim, mas é uma sugestão
bastante interessante para a construção da tabela da distribuição de frequência
por classe.
Vamos exemplificar os passos sugeridos para a construção de uma tabela
de distribuição de frequência por classe.
Exemplo 1: em uma empresa de tecnologia, há 60 funcionários. As idades
deles são apresentadas a seguir:

32 45 43 26 28 30 31 32 44 32
54 46 41 20 26 44 38 26 37 47
33 35 38 47 46 32 49 35 25 27

18
28 43 22 29 42 30 35 41 39 34
43 26 25 25 43 26 26 38 31 27
27
33 28 39 32 43 29 38 44 42
Construa uma tabela de distribuição de frequência por classe contendo
seis classes.
Resolução: inicialmente, vamos ordenar os dados, manualmente ou por
meio do Excel.

20 22 25 25 25 26 26 26 26 26
26 27 27 27 28 28 28 29 29 30
30 31 31 32 32 32 32 32 33 33
34 35 35 35 37 38 38 38 38 39
39 41 41 42 42 43 43 43 43 43
44 44 44 45 46 46 47 47 49 54

Agora que temos os dados ordenados, precisamos saber a amplitude


total. Basta fazermos 54 menos 20, o que corresponde a 34. Como precisamos
de seis classes, para sabermos o tamanho de cada classe, vamos dividir 34 por
6, o que resulta em 5,666667. Podemos arredondar esse número para 6. Assim,
teremos seis classes, cada uma com uma amplitude igual a 6. Podemos
considerar o menor valor dos dados como sendo o limite inferior da primeira
classe.
Logo, a tabela com os intervalos é dada por

Intervalo Frequência
20 Ⱶ 26
26 Ⱶ 32
32 Ⱶ 38
38 Ⱶ 44
44 Ⱶ 50
50 Ⱶ 56

O símbolo Ⱶ indica que o limite inferior pertence ao intervalo e que o limite


superior não pertence ao intervalo, pois a barra vertical à esquerda corresponde
a um intervalo fechado, ou seja, o número pertence ao intervalo e a ausência da

19
barra vertical à direita indica um intervalo aberto, ou seja, o número não pertence
ao intervalo.
Precisamos agora adicionar as frequências referentes a cada um dos
intervalos.
Considerando os dados ordenados, manualmente ou por meio do Excel,

20 22 25 25 25 26 26 26 26 26
26 27 27 27 28 28 28 29 29 30
30 31 31 32 32 32 32 32 33 33
34 35 35 35 37 38 38 38 38 39
39 41 41 42 42 43 43 43 43 43
44 44 44 45 46 46 47 47 49 54

temos 5 elementos a serem adicionados na primeira classe: 20, 22, 25, 25, 25.
Note que o intervalo vai de 20 a 26, mas o símbolo Ⱶ indica que o 20 pertence
ao intervalo, mas o 26 não, pois não temos uma barra vertical na direita do
símbolo, mas apenas na esquerda. Assim, os dados iguais a 26 serão
considerados como pertencentes ao segundo intervalo. Como o intervalo é dado
por 26 Ⱶ 32, temos que colocar nessa classe os valores que vão de 26 a 32,
exceto os valores iguais a 32. Como estamos trabalhando com números inteiros,
adicionamos nessa classe os valores que vão de 26 a 31, mas se os dados
fossem números reais, colocaríamos valores de 26 a 31,99999999999..., ou
seja, de 26 até todos os valores que estão muito próximos de 32, mas que não
são iguais a 32. Assim, no segundo intervalo de classe temos 18 valores (26, 26,
26, 26, 26, 26, 27, 27, 27, 28, 28, 28, 29, 29, 30, 30, 31, 31). Na terceira classe
temos 12 valores (32, 32, 32, 32, 32, 33, 33, 34, 35, 35, 35, 37). Na quarta classe,
15 valores (38, 38, 38, 38, 39, 39, 41, 41, 42, 42, 43, 43, 43, 43, 43), na quinta
classe, 9 valores (44, 44, 44, 45, 46, 46, 47, 47, 49) e na sexta classe, 1 valor
(54). Assim, a tabela de distribuição de frequência por classe corresponde a

Intervalo Frequência
20 Ⱶ 26 5
26 Ⱶ 32 18
32 Ⱶ 38 12
38 Ⱶ 44 15

20
44 Ⱶ 50 9
50 Ⱶ 56 1

Nesse exemplo, temos os dados não agrupados e, a partir deles, por


opção, construímos a tabela de distribuição de frequência por classe. Dessa
maneira, se for preciso, podemos ter resultados exatos em um estudo utilizando
os dados originais. No entanto, se os dados são obtidos já em intervalos de
classe, não temos acesso aos dados exatos. Como a distribuição de frequência
por classe utilizando intervalos e não os dados exatos, os resultados obtidos são
aproximados. Por esse motivo, antes de coletar os dados, é preciso levar em
consideração a precisão desejada para os resultados.
Agora que temos a tabela de distribuição de frequência por classe,
sabemos qual é a frequência referente a cada classe e os limites das classes,
mas não sabemos os valores dos dados contidos em cada classe. Sendo assim,
precisamos de um número que represente esses dados e para isso vamos
escolher o ponto médio de cada intervalo de classe. Vimos que os pontos médios
são obtidos a partir da fórmula

Li + Ls
pm =
2

em que Li é o limite inferior da classe, Ls é o limite superior da classe e p m é o


ponto médio do intervalo.
Para a tabela que acabamos de obter, os respectivos pontos médios são
apresentados a seguir.

Intervalo Frequência Ponto Médio


20 Ⱶ 26 5 23
26 Ⱶ 32 18 29
32 Ⱶ 38 12 35
38 Ⱶ 44 15 41
44 Ⱶ 50 9 47
50 Ⱶ 56 1 53

Da mesma forma feita em uma distribuição de frequência, na distribuição


de frequência por classe podemos obter a frequência acumulada somando as
frequências de cada classe:
21
Intervalo Frequência Frequência
Acumulada
20 Ⱶ 26 5 5
26 Ⱶ 32 18 23
32 Ⱶ 38 12 35
38 Ⱶ 44 15 50
44 Ⱶ 50 9 59
50 Ⱶ 56 1 60

Também é possível obtermos as frequências relativas dividindo cada


frequência pela frequência total e multiplicando o resultado por 100 para
obtermos a respectiva porcentagem:

Intervalo Frequência Frequência Frequência


Acumulada Relativa
20 Ⱶ 26 5 5 8,33%
26 Ⱶ 32 18 23 30%
32 Ⱶ 38 12 35 20%
38 Ⱶ 44 15 50 25%
44 Ⱶ 50 9 59 15%
50 Ⱶ 56 1 60 1,67%

FINALIZANDO

Nesta aula, estudamos os elementos fundamentais da estatística, tais


como população e amostra. Vimos importantes técnicas relacionadas a um
estudo estatístico e como podemos organizar os dados de uma forma em que
eles não estão agrupados, mas também em dois tipos de agrupamentos, o
primeiro que é a distribuição de frequência e o segundo que é a distribuição de
frequência por classe.

22
REFERÊNCIAS

CASTANHEIRA, N. P. Estatística aplicada a todos os níveis. Curitiba:


Intersaberes, 2012.

23

Você também pode gostar