Você está na página 1de 55

Distribuio de Freqncia

Representao do conjunto de
dados

Distribuies de Representao
freqncia Grfica
Freqncia relativa Histogramas
Freqncia
acumulada
Organizao dos dados
Os mtodos utilizados para organizar dados compreendem o
arranjo desses dados em subconjuntos que apresentem
caractersticas similares.

mesma idade (ou faixa etria), mesma finalidade, mesma escola,


mesmo bairro, etc

Os dados agrupados podem ser resumidos em tabelas ou grficos


e, a partir desses, podemos obter as estatsticas descritivas j
definidas: mdia, mediana, desvio, etc.

Dados organizados em grupos ou categorias/classes so


usualmente designados distribuio de freqncia.
Distribuio de frequncia

Uma distribuio de freqncia um mtodo de se agrupar dados


em classes de modo a fornecer a quantidade (e/ou a percentagem)
de dados em cada classe

Com isso, podemos resumir e visualizar um conjunto de dados sem


precisar levar em conta os valores individuais.

Uma distribuio de freqncia (absoluta ou relativa) pode ser


apresentada em tabelas ou grficos
Distribuio de frequncia

Uma distribuio de freqncia agrupa os

dados por classes de ocorrncia, resumindo

a anlise de conjunto de dados grandes.


Construindo uma distribuio de
freqncia
Eventos Altura
Adotemos o conjunto Aluno 1 1,60
Aluno 2 1,69
de dados que Aluno 3 1,72
represente a Aluno 4 1,73
Aluno 5 1,73
populao Aluno 6 1,74
Aluno 7 1,75
Ordene em ordem Aluno 8 1,75
crescente ou Aluno 9 1,75
Aluno 10 1,75
decrescente Aluno 11 1,75
Aluno 12 1,76
Aluno 13 1,78
Aluno 14 1,80
Aluno 15 1,82
Aluno 16 1,82
Aluno 17 1,84
Aluno 18 1,88
Construindo uma distribuio de
freqncia
Determine a Quantidade de classes (k)
Regra de Sturges (Regra do Logaritmo)
k = 1 + 3,3log(n)
Regra da Potncia de 2
k = menor valor interiro tal que 2k n
Regra da Raiz Quadrada
k= n
Bom senso !!!
Decida a quantidade de classes que GARANTA observar
como os valores se distribuem.
Construindo uma distribuio de
freqncia

Regra de Sturges (Logaritmo) Regra da Potncia de 2 Bom Senso

Q ua nt ida de Q ua nt ida de
Quantidade de Quantidade de Quantidade de Quantidade de Quantidade de M N IM A de M X IM A de
dados (n) Classes (k) dados (n) Classes (k) dados (n) C la s s e s ( k ) C la s s e s ( k )

1 1 1e2 1 at 50 5 10
2 2 3e4 2 51 a 100 8 16
3a5 3 5a8 3 101 a 200 10 20
6 a 11 4 9 a 16 4 201 a 300 12 24
12 a 23 5 17 a 32 5 301 a 500 15 30
24 a 46 6 33 a 64 6 mais de 500 20 40
47 a 93 7 65 a 128 7
94 a 187 8 129 a 256 8
188 a 376 9 257 a 512 9
377 a 756 10 513 a 1024 10
Construindo uma distribuio de
freqncia
Calcule a amplitude das classes (h)
Calcule a amplitude do conjunto de dados
L = xmx xmn
Calcule a amplitude (largura) da classe
h=L/k
Arredonde convenientemente
Calcule os Limites das Classes
1a classe: xmn at xmn + h
2a classe: xmn + h at xmn + 2 . h
........................
ka classe: xmn + (k-1) . h at xmn + k . h
Construindo uma distribuio de
freqncia
Limite das classes
Utilize a notao:
[x,y) intervalo de entre x (fechado) at y (aberto)
Freqentemente temos que arredondar a amplitude das classes
e, conseqentemente, arredondar tambm os limites das classes.
Como sugesto, podemos tentar, se possvel, um ajuste simtrico
nos limites das classes das pontas (i.e., primeira e ltima) nas
quais, usualmente, a quantidade de dados menor.
Ponto mdio das classes
xk = Linferior + ( Lsuperior Linferior ) / 2
Construindo uma distribuio de
freqncia
Determinao da freqncia das classes
Consiste em agrupar os dados em cada classe e contar os totais

Traar o grfico
Dividir o eixo horizontal em tantas partes quanto for o nmero de
classes. Sugesto: deixe espao entre o eixo vertical e a primeira classe.
Identifique a maior freqncia da classe na tabela e marque esse
nmero (ou outro um pouco maior) na extremidade do eixo vertical;
divida esse eixo em algumas partes e marque os valores
correspondentes
Desenhe um retngulo, para cada classe, com largura igual
largura da classe e com altura igual freqncia da classe
Exemplo Altura
1,60
1,69
Do nosso exemplo: 1,72
Ordenamos os dados 1,73
1,73
Por Sturges, temos:
1,74
n=18 ; k=5 (nmero de 1,75
classes)
1,75
Amplitude de classes 1,75
Amplitude do conjunto 1,75
de dados: 1,88- 1,75
1,60=0,28m 1,76
Amplitude de classes: 1,78
0,28/5=0,056
1,80
Arredondado h = 0,06m 1,82
1,82
1,84
1,88
Construindo uma tabela de freqncia
Altura
1,60
Calcule os Limites de 1,69
1,72
Classe
1,73
Arredonde os Limites de 1,73
Classe nos extremos 1,74
1,75
1,9-1,88=0,02 Aqui sobra 1,75
Distribua o excesso: 0,02m! 1,75
1,60-0,01; 1,88+0,01 1,75
Ajuste todas as classes 1,75
Amplitude 0,06 1,76
Limites Limite 1,78
inferiores superior 1,80
1,60 1,66 1,82
1,66 1,72 1,82
1,72 1,78 1,84
1,78 1,84 1,88
1,84 1,90
Construindo uma tabela de freqncia
Amplitude 0,06
Frequncia
Dados Classe Frequncia
Acumulada
Freqncias absolutas 1,60 1,59-1,65 1 1
Distribua os eventos ou ocorrncia 1,69 1,65-1,71 1 2
1,72 1,71-1,77 10 12
por suas respectivas classes 1,73 1,77-1,83 4 16
Freqncias acumuladas 1,73 1,83-1,89 2 18
1,74 Total 18
Some as ocorrncias de dados 1,75
cumulativamente s classes 1,75
1,75
Observao importante: 1,75
1,75
muito til representar as 1,76
frequncias em termos percentuais 1,78

ao total de amostras 1,80


1,82
1,82
1,84
1,88
Representao Grfica
Amplitude 0,06
Histograma Classe Frequncia
Frequncia
Acumulada
Na abscissas, distribua 1,59-1,65 1 1
as classes 1,65-1,71 1 2
1,71-1,77 10 12
Na ordenada da 1,77-1,83 4 16
esquerda, as 1,83-1,89 2 18
Total 18
freqncias absolutas
Construa um grfico de 12 20
10
barras para as 8
15
freqncias 6 10
4
Construa um grfico de 2
5
linha para a freqncia 0 0
acumulada (utilize a 1,59- 1,65- 1,71- 1,77- 1,83-
1,65 1,71 1,77 1,83 1,89
escala da direita)
Distribuio de Freqncia:
Histogramas e Polgonos de
Freqncia
Uma distribuio de freqncia representada por um grfico de
barras denominada histograma

Outro grfico de interesse o chamado polgono de freqncia

O polgono de freqncia obtido unindo-se os pontos mdios da


parte superior de cada retngulo do histograma com segmentos de
reta

importante notar que tanto o histograma quanto o polgono de


freqncia indicam a freqncia absoluta de cada classe
Distribuio de Freqncia:
Histogramas e Polgonos de
Freqncia
Digamos que temos histogramas para as alturas dos
estudantes de duas turmas diferentes, traados de
acordo com as regras descritas at agora

Poderamos sobrepor os desenhos para fazer uma


anlise comparativa das turmas?

Que cuidados devemos tomar?


Distribuio de Freqncia:
Histogramas e Polgonos de
Freqncia
O problema com esta regra de construo que o
histograma construdo especfico para o conjunto em
anlise

Para fazermos anlises comparativas de conjuntos de dados


diferentes, as classes devem ser as mesmas!

Devemos, ento, utilizar algum conhecimento prvio da rea


em estudo para definir o intervalo aceitvel de variao dos
dados e, a partir da, definir as classes

Essas classes genricas serviro para o estudo de


quaisquer conjunto de dados e permitiro anlises
comparativas
Distribuio de Freqncia:
Histogramas e Polgonos de
Freqncia
Em um histograma, as classes devem SEMPRE ter a mesma
largura?

No necessariamente!

Existem casos em que mais adequado agrupar os dados em


classes com larguras desiguais.

O exemplo tpico a classificao de pessoas por faixas etrias


(infantil, juvenil, adulto, snior, etc). Essas faixas no tm a mesma
largura.
Distribuio de Freqncia:
Histogramas com Classes de Larguras
Desiguais
A representao grfica dos dados em um histograma com
classes de larguras desiguais requer a transformao dos
valores de freqncia absoluta em densidade de freqncia.

Isso fundamental pois devemos manter a rea dos


retngulos proporcionais freqncia da classe

A densidade de freqncia dada por:

freqncia da classe
densidade de freqncia =
largura da classe
Distribuio de Freqncia:
Histogramas com Classes de Larguras
Desiguais
Isso significa que a altura das barras (i.e., os
valores na escala do eixo vertical) NO
representam a freqncia da classe, mas sim a
densidade de freqncia.

Para calcularmos a freqncia da classe devemos


multiplicar a densidade (indicada no eixo vertical)
pela largura respectiva
Outros Grficos
Amplitude 0,05
Frequncia
Classe Frequncia
Relativa (%)
1,59-1,65
1,65-1,71
1
1
6%
6%
Grfico
1,71-1,77
1,77-1,83
10
4
56%
22%
de Pizza
1,83-1,89 2 11%
Total 18
Frequncia Relativa (%)

11% 6% 6%
1,59-1,65
1,65-1,71
22%
1,71-1,77
1,77-1,83
55%
1,83-1,89
Outros Grficos
Frequncia Frequncia Frequncia
Classe Frequncia
Relativa(%) Acumulada Acumulada(%)
1,71-1,77 10 56% 10 56%
1,77-1,83 4 22% 14 78%
1,83-1,89 2 11% 16 89%
1,65-1,71 1 6% 17 94%
1,59-1,65 1 6% 18 100%

Grfico de
Total 18

120%
100% 89%
94% 100%
Pareto
80%
56% 78%
60%
40%
20%
0%
1,71-1,77 1,77-1,83 1,83-1,89 1,65-1,71
Outros Grficos
Classe de Altura (m) Freqncia Freq. Acumulada

1.55 [--- 1.63 2 2


1.63 [--- 1.71 12 14
1.71 [--- 1.79 22 36
1.79 [--- 1.87 13 49
1.87 [--- 1.96 2 51

OGIVA DE GALTON
Distribuio Acumulada
60

Freq:uncia acumulada
60 50
50
Freqncia

40 Series2
40 Seqncia1
30 Series1
30 Seqncia2
Series3
20 Seqncia3 20
10 Seqncia4 10
0
1.55 [--- 1.63 [--- 1.71 [--- 1.79 [--- 1.87 [--- 0
1.63 1.71 1.79 1.87 1.96 1.55 [--- 1.63 [--- 1.71 [--- 1.79 [--- 1.87 [---
1.63 1.71 1.79 1.87 1.96
Classes de alturas (m)
Classes de alturas (m)
Mdia Ponderada: Mdia de uma
tabela de freqncia
Quando os dados esto resumidos em uma
tabela de freqncias, podemos calcular
aproximadamente a mdia aritmtica
ponderando sobre:
Pontos mdios de cada intervalo supe-se que
todos os elementos das classes ocorrem no ponto
mdio das respectivas classes;
Exemplo: temos 7 ocorrncias na faixa entre 1,75 e
1,79. Consideramos que as sete ocorrncias
equivalem a (1,79+1,75)/2=1,77 ponto mdio da
classe.
Mdia Ponderada: Mdia de uma
tabela de freqncia

x=
( f .x)
f
x = ponto mdio da classe
f = freqncia
f = n
Mdia Ponderada
A mdia ponderada considerada ponderada quando
os valores dos conjuntos tiverem pesos / freqncias
diferentes
Numa distribuio utilizando os valores discretos,
calcula-se:

Erros por No de
x=
x. f x. f
=
f
pginas paginas
n
0 25
1 20 (0 25) + (1 20) + (2 3) + (3 1) + (4 1) 33
x= = = 0,66
2 3 (25 + 20 + 3 + 1 + 1) 50
3 1
4 1
Mdia Ponderada
Quando tivermos uma distribuio com dados
agrupados por classes de valores, calculamos
considerando o valor de cada classe como o
ponto mdio respectivo da classe.

Alturas de Ponto Frequncia


Pessoas Mdio (Xi) (fi) xi.fi
x=
x. f x. f
=
1,59-1,65
1,65-1,71
1,62
1,68
1
1
1,62
1,68 f n
1,71-1,77 1,74 10 17,4
1,77-1,83 1,80 4 7,2 31,62
1,83-1,89 1,86 2 3,72 x= = 1,76
Total 18 31,62 18
Clculo da Moda para dados
Agrupados
Caso 1: dados agrupados por valores
discretos moda o valor com maior
freqncia.
Caso 2: dados agrupados por classes
Moda Bruta
Mtodo de King
Mtodo de Czuber
Mtodo de Pearson
Clculo da Moda para dados
Agrupados: Moda Bruta
Moda Bruta
Tome a classe que apresenta a maior
freqncia classe modal
A moda ser o ponto mdio da classe modal:
(liminf + limsup)/2
Clculo da Moda para dados
Agrupados: King
Mtodo de King:
f post
M o = liminf + h
f ant + f post
Onde
Liminf: limite inferior da classe modal
fant: freqncia da classe anterior modal
fpost: freqncia da classe posterior modal
h: amplitude da classe modal
Clculo da Moda para dados
Agrupados: Czuber
Mtodo de Czuber (mais preciso):
f Mo f ant
M o = liminf +
f Mo ( f ant + f post )
h

Onde
Liminf: limite inferior da classe modal
fMo: freqncia da classe modal
fant: freqncia da classe anterior modal
fpost: freqncia da classe posterior modal
h: amplitude da classe modal
Clculo da Moda para dados
Agrupados: Pearson
Mtodo de Pearson:

M o = 3M d 2 X
Onde
Md: Mediana
X : Mdia
Clculo da Mediana para dados
Agrupados

Dados agrupados por classes


Mediana o valor localizado a Lx=n/2
Aps clculo de Lx, determina-se o valor da mediana
por: ~ h.(L x Fant )
X = Liminf +
fi
Onde:
Lx Localizao (posio) da Mediana
Fant freqncia acumulada at a classe anterior classe
da mediana
fi freqncia absoluta da classe da mediana
h amplitude de classe
Liminf Limite inferior da classe da mediana
Clculo dos Percentis para dados
Agrupados por Classes

O percentil o valor localizado a LPx=(K/100)*n


Onde K o percentil desejado (ex.: P45 K=45)
Aps clculo de LPx, determina-se o valor do percentil
por:
h.(L P x Fant )
Px = Liminf +
fi
Onde:
LPx Localizao (posio) do Percentil
Fant freqncia acumulada at a classe anterior classe
do percentil
fi freqncia absoluta da classe do percentil
h amplitude de classe
Liminf Limite inferior da classe do percentil
Medidas de Posio Dados Agrupados:
Mediana / Separatrizes (alternativo)
Para definirmos um procedimento alternativo de clculo da mediana e
quaisquer outras separatrizes, utilizaremos o exemplo abaixo:
Medidas de Posio Dados Agrupados:
Mediana / Separatrizes (alternativo)
Encontra-se a classe onde
est a mediana. Faz-se,
ento, a proporcionalidade
entre a rea e a base do
retngulo hachurado e o que
define a classe onde est a
mediana

12,008,00 Md 8,00
=
33% 22%

16,00
Md = 10,67
Medidas de Posio Dados Agrupados:
Mediana / Separatrizes (alternativo)
Encontra-se a classe onde
est Q3. Faz-se, ento, a
proporcionalidade entre a
rea e a base do retngulo
hachurado e o que define a
classe de Q3

16,00 12,00 Q 12,00


= 3
22% 14%

16,00
Q3 = 15,82
Mtodo Alternativo
A regra de trs gera precisamente o mesmo resultado
na aplicao da equao para clculo dos percentis
para dados agrupados. Seno vejamos:
Lsup Linf Px Linf Lsup Linf Px Linf
= =
pi p px pacm fi
n
( f px f acm )
n
Lsup Linf Px Linf
=
fi f px f acm
Linf + ( Lsup Linf )( f px f acm ) Linf + h ( f px f acm )
Px = =
fi fi
Mtodo Alternativo
Onde:
Lsup = limite superior classe do percentil
Linf = limite inferior classe do percentil
Px = valor do percentil procurado
pi = percentual representativo da classe do percentil
ppx = percentil procurado
pacm = percentual acumulado at a classe anterior classe do
percentil
fi = frequncia da classe do percentil
n = tamanho da amostra
fpx = posio do percentil procurado
facm = frequncia acumulada at a classe anterior classe do
percentil
Medidas de Disperso
(Dados Agrupados)
O desvio-padro, nesse caso, faz uma ponderao da distncia dos
pontos mdios de cada classe para a mdia, e a respectiva
freqncia de valores:

f j (~x j x ) ( )
k k
2
j j
f ~
x 2

j =1 j =1
s= (amostra) = (populao )
n 1 N
Desvio padro de dados
agrupados

n[ ( f .x )] [ ( f .x)]
2 2

s=
n(n 1)

Desvio padro para uma tabela de freqncias


x = ponto mdio da classe
f = frequncia da classe
n = tamanho da amostra (ou f = soma das frequncias)
Assimetria
Comparando a mdia, a moda e a mediana, podemos
concluir pela assimetria da distribuio:
Assimetria: no simetria distribuio tende mais para um lado
Dados negativamente assimtricos (assimetria para a
esquerda)
Mdia e mediana esquerda da moda
Em geral, mdia esquerda da mediana
Dados positivamente assimtricos (assimetria para a
direita)
Mdia e mediana direita da moda
Em geral, mdia direita da mediana
Assimetria

mdia moda
mediana Mdia = moda = mediana

Assimtrica esquerda Simtrica


x<~
x < Mo x=~
x = Mo
moda mdia
mediana x>~
x > Mo
Assimtrica direita
Interpretando Histogramas

Histograma uma ferramenta estatstica que permite


resumir informaes de um conjunto de dados,
visualizando a forma da distribuio desses dados, a
localizao do valor central e a disperso dos dados em
torno do valor central

Ou seja, em anlises de processos produtivos,


freqentemente obtemos informaes teis sobre a
populao/amostra de dados coletados pela anlise da
forma do histograma
Simtrico ou em Forma de Sino
O valor mdio est localizado no centro do
histograma
A freqncia mais alta no meio e diminui
gradualmente na direo dos extremos

Ocorre quando no existem restries aos


valores que a varivel de controle pode
assumir

Processo geralmente sob controle,


somente causas comuns esto presentes
Processo usualmente est estvel
Assimtrico
O valor mdio est localizado fora do centro
do histograma
A freqncia diminui gradativamente em um
dos lados e de modo um tanto abrupto do
outro lado

Ocorre quando no possvel que a varivel


de controle assuma valores mais altos (ou
mais baixos)

Processo em que o limite inferior (superior)


controlado (apenas um limite de especificao)
Por exemplo, teoricamente impossvel
valores inferiores 0% para a varivel
impureza
Despinhadeiro

O valor mdio est localizado fora do


centro do histograma

A freqncia diminui abruptamente de um


dos lados e suavemente em direo ao
outro

Processo no atende s especificaes e


uma inspeo 100% realizada para
eliminar produtos defeituosos
Ilhas Isoladas ou Pico Isolado
Parte do grfico relativamente simtrica
com o acrscimo de algumas classes
mais afastadas de menores freqncias

Ocorre quando dados de outra


distribuio, diferente da distribuio da
maior parte das medidas, so includos

Processo com anormalidades, ou erro de


medio e/ou registro de dados, ou
incluso de dados de um processo
diferente
Bimodal ou com Dois Picos

A freqncia mais baixa no centro do


histograma e existe um pico em cada
lado

Ocorre quando dados de duas


distribuies, com mdias muito
diferentes, so misturados

Os valores da varivel de controle


devem estar associados a duas
mquinas ou dois turnos distintos, por
exemplo
Achatado ou Plat
Todas as classes possuem mais ou
menos a mesma freqncia, exceto
aquelas das extremidades

Ocorre quando dados de duas


distribuies, com mdias no muito
diferentes, so misturados

Os valores da varivel de controle


devem estar associados a nveis
distintos de algum (ou alguns) dos
fatores que constituem o processo em
anlise
Histogramas e Limites de
Especificao de Processos
Atende, com folga, os limites de
especificao
Mdia no centro da faixa de especificao
Variabilidade aceitvel
Manter a situao atual

Especificao atendida sem nenhuma


margem extra
Mdia no centro da faixa de especificao
Variabilidade um pouco elevada
Adotar medidas para reduzir um pouco a
variabilidade
Histogramas e Limites de
Especificao de Processos
No atende os limites de especificao
Mdia deslocada para a esquerda
Variabilidade aceitvel
Adotar medidas para deslocar a mdia para o centro
(valor nominal)

No atende os limites de especificao


Mdia no centro da faixa de especificao
Variabilidade elevada
Adotar medidas para reduzir a variabilidade

No atende os limites de especificao


Mdia deslocada para a esquerda
Variabilidade elevada
Adotar medidas para deslocar a mdia para o centro e
reduzir a variabilidade
Coeficiente de Assimetria

Coeficiente de Assimetria de Pearson


(As)
3.( x ~
x)
As =
s
Permite comparar duas ou mais distribuies diferentes e avaliar
qual mais assimtrica.
Quanto maior o Coeficiente de Assimetria de Pearson, mais
assimtrica curva.
Assimtrica moderada: 0,15<|As|<1
Assimtrica forte: |As|>1
Curtose

Grau de achatamento (ou


afilamento) de uma (Q3 Q1 )
C=
distribuio em relao com a 2.( P90 P10 )
distribuio normal.
Distribuio
Normal

Leptocrtica Platicrtica
Mesocrtica
C<0,263 C>0,263
C=0,263

Você também pode gostar