Você está na página 1de 53

Di st r i bui o de

Fr eqnc i a
Repr esent a o do
c onj unt o de dados
Distribuies de
freqncia
Freqncia relativa
Freqncia
acumulada
Representao
Grfica
Histogramas
Or gani za o dos
dados
Os mtodos utilizados para organizar dados compreendem o arranjo
desses dados em subconjuntos que apresentem caractersticas
similares.
mesma idade (ou faixa etria), mesma finalidade, mesma escola,
mesmo bairro, etc
Os dados agrupados podem ser resumidos em tabelas ou grficos e,
a partir desses, podemos obter as estatsticas descritivas j
definidas: mdia, mediana, desvio, etc.
Dados organizados em grupos ou categorias / classes so
usualmente designados distribuio de freqncia.
Di st r i bui o de
f r equnc i a
Uma distribuio de freqncia um mtodo de se agrupar dados
em classes de modo a fornecer a quantidade (e/ou a percentagem)
de dados em cada classe
Com isso, podemos resumir e visualizar um conjunto de dados sem
precisar levar em conta os valores individuais.
Uma distribuio de freqncia (absoluta ou relativa) pode ser
apresentada em tabelas ou grficos
Di st r i bui o de
f r equnc i a
Uma distribuio de freqncia agrupa os
dados por classes de ocorrncia, resumindo
a anlise de conjunto de dados grandes.
Adotemos o conjunto
de dados que
represente a
populao
Ordene em ordem
crescente ou
decrescente
Eventos Altura
Aluno 1 1,60
Aluno 2 1,69
Aluno 3 1,72
Aluno 4 1,73
Aluno 5 1,73
Aluno 6 1,74
Aluno 7 1,75
Aluno 8 1,75
Aluno 9 1,75
Aluno 10 1,75
Aluno 11 1,75
Aluno 12 1,76
Aluno 13 1,78
Aluno 14 1,80
Aluno 15 1,82
Aluno 16 1,82
Aluno 17 1,84
Aluno 18 1,88
Const r ui ndo uma
di st r i bui o de f r eqnc i a
Const r ui ndo uma
di st r i bui o de f r eqnc i a
Determine a Quantidade de classes (k)
Regra de Sturges (Regra do Logaritmo)
k = 1 + 3,3log(n)
Regra da Potncia de 2
k = menor valor interiro tal que 2
k
n
Regra da raiz quadrada

Bom senso !!!


Decida a quantidade de classes que GARANTA observar
como os valores se distribuem.
n k =
Quantidade de
dados (n)
Quantidade de
Classes (k)
Quantidade de
dados (n)
Quantidade de
Classes (k)
Quant idade de
dados (n)
Quant i dade
M NIM A de
Cl as s es ( k )
Quant i dade
M XIM A de
Cl as s es ( k )
1 1 1 e 2 1 at 50 5 10
2 2 3 e 4 2 51 a 100 8 16
3 a 5 3 5 a 8 3 101 a 200 10 20
6 a 11 4 9 a 16 4 201 a 300 12 24
12 a 23 5 17 a 32 5 301 a 500 15 30
24 a 46 6 33 a 64 6 mai s de 500 20 40
47 a 93 7 65 a 128 7
94 a 187 8 129 a 256 8
188 a 376 9 257 a 512 9
377 a 756 10 513 a 1024 10
Regra de Sturges (Logari tmo) Regra da Potnci a de 2 Bom Senso
Const r ui ndo uma
di st r i bui o de f r eqnc i a
Const r ui ndo uma
di st r i bui o de f r eqnc i a
Calcule a amplitude das classes (h)
Calcule a amplitude do conjunto de dados
L = x
mx
x
mn
Calcule a amplitude (largura) da classe
h = L / k
Arredonde convenientemente
Calcule os Limites das Classes
1
a
classe: x
mn
at x
mn
+ h
2
a
classe: x
mn
+ h at x
mn
+ 2 . h
........................
k
a
classe: x
mn
+ (k-1) . h at x
mn
+ k . h
Limite das classes
Utilize a notao:
[x,y) intervalo de entre x (fechado) at y (aberto)
Freqentemente temos que arredondara amplitude das classes e,
conseqentemente, arredondar tambm os limites das classes.
Como sugesto, podemos tentar, se possvel, um ajuste simtrico
nos limites das classes das pontas (i.e., primeira e ltima) nas quais,
usualmente, a quantidade de dados menor.
Ponto mdio das classes
x
k
= ( L
superior
L
inferior
) / 2
Const r ui ndo uma
di st r i bui o de f r eqnc i a
Determinao da freqncia das classes
Consiste em agrupar os dados em cada classe e contar os totais
Traar o grfico
Dividir o eixo horizontal em tantas partes quanto for o nmero de
classes. Sugesto: deixe espao entre o eixo vertical e a primeira classe.
Identifique a maior freqncia da classe na tabela e marque esse
nmero (ou outro um pouco maior) na extremidade do eixo vertical;
divida esse eixo em algumas partes e marque os valores
correspondentes
Desenhe um retngulo, para cada classe, com largura igual
largura da classe e com altura igual freqncia da classe
Const r ui ndo uma
di st r i bui o de f r eqnc i a
Do nosso exemplo:
Ordenamos os dados
Por Sturges, temos:
n=18 ; k=5 (nmero de
classes)
Amplitude de classes
Amplitude do conjunto
de dados: 1,88-
1,60=0,28m
Amplitude de classes:
0,28/5=0,056
Arredondado h = 0,06m
Altura
1,60
1,69
1,72
1,73
1,73
1,74
1,75
1,75
1,75
1,75
1,75
1,76
1,78
1,80
1,82
1,82
1,84
1,88
Ex empl o
Const r ui ndo uma t abel a de
f r eqnc i a
Calcule os Limites de
Classe
Altura
1,60
1,69
1,72
1,73
1,73
1,74
1,75
1,75
1,75
1,75
1,75
1,76
1,78
1,80
1,82
1,82
1,84
1,88
Amplitude 0,06
Limites
inferiores
Limite
superior
1,60 1,66
1,66 1,72
1,72 1,78
1,78 1,84
1,84 1,90
Arredonde os Limites de
Classe nos extremos
1,9-1,88=0,02
Distribua o excesso:
1,60-0,01; 1,88+0,01
Freqncias absolutas
Distribua os eventos ou ocorrncia
por suas respectivas classes
Freqncias acumuladas
Some as ocorrncias de dados
cumulativamente s classes
Observao importante:
muito til representar as
frequncias em termos percentuais
ao total de amostras
0,06
Dados Classe Frequncia
Frequncia
Acumulada
1,60 1,59-1,65 1 1
1,69 1,65-1,71 1 2
1,72 1,71-1,77 10 12
1,73 1,77-1,83 4 16
1,73 1,83-1,89 2 18
1,74 Total 18
1,75
1,75
1,75
1,75
1,75
1,76
1,78
1,80
1,82
1,82
1,84
1,88
Amplitude
Const r ui ndo uma t abel a de
f r eqnc i a
Repr esent a o
Gr f i c a
Histograma
Na abscissas, distribua
as classes
Na ordenada da
esquerda, as
freqncias absolutas
Construa um grfico de
barras para as
freqncias
Construa um grfico de
linha para a freqncia
acumulada (utilize a
escala da direita)
0,06
Classe Frequncia
Frequncia
Acumulada
1,59-1,65 1 1
1,65-1,71 1 2
1,71-1,77 10 12
1,77-1,83 4 16
1,83-1,89 2 18
Total 18
Amplitude
0
2
4
6
8
10
12
1,59-
1,65
1,65-
1,71
1,71-
1,77
1,77-
1,83
1,83-
1,89
0
5
10
15
20
Di st r i bui o de Fr eqnc i a:
Hi st ogr amas e Pol gonos
de Fr eqnc i a
Uma distribuio de freqncia representada por um grfico de
barras denominada histograma
Outro grfico de interesse o chamado polgono de freqncia
O polgono de freqncia obtido unindo-se os pontos mdios da
parte superior de cada retngulo do histograma com segmentos de
reta
importante notar que tanto o histograma quanto o polgono de
freqncia indicam a freqncia absoluta de cada classe
Di st r i bui o de Fr eqnc i a:
Hi st ogr amas e Pol gonos
de Fr eqnc i a
Digamos que temos histogramas para as alturas dos
estudantes de duas turmas diferentes, traados de
acordo com as regras descritas at agora
Poderamos sobrepor os desenhos para fazer uma
anlise comparativa das turmas?
Que cuidados devemos tomar?
O problema com esta regra de construo que o
histograma construdo especfico para o conjunto em anlise
Para fazermos anlises comparativas de conjuntos de dados
diferentes, as classes devem ser as mesmas!
Devemos, ento, utilizar algum conhecimento prvio da rea
em estudo para definir o intervalo aceitvel de variao dos
dados e, a partir da, definir as classes
Essas classes genricas serviro para o estudo de
quaisquer conjunto de dados e permitiro anlises
comparativas
Di st r i bui o de Fr eqnc i a:
Hi st ogr amas e Pol gonos
de Fr eqnc i a
Di st r i bui o de Fr eqnc i a:
Hi st ogr amas e Pol gonos
de Fr eqnc i a
Em um histograma, as classes devem SEMPRE ter a mesma
largura?
No necessariamente!
Existem casos em que mais adequado agrupar os dados em
classes com larguras desiguais.
O exemplo tpico a classificao de pessoas por faixas etrias
(infantil, juvenil, adulto, snior, etc). Essas faixas no tm a mesma
largura.
Di st r i bui o de Fr eqnc i a:
Hi st ogr amas c om Cl asses
de Lar gur as Desi guai s
A representao grfica dos dados em um histograma com
classes de larguras desiguais requer a transformao dos
valores de freqncia absoluta em densidade de freqncia.
Isso fundamental pois devemos manter a rea dos
retngulos proporcionais freqncia da classe
A densidade de freqncia dada por:
classe da largura
classe da freqncia
freqncia de densidade =
Di st r i bui o de Fr eqnc i a:
Hi st ogr amas c om Cl asses
de Lar gur as Desi guai s
Isso significa que a altura das barras (i.e., os valores
na escala do eixo vertical) NO representam a
freqncia da classe, mas sim a densidade de
freqncia.
Para calcularmos a freqncia da classe devemos
multiplicar a densidade (indicada no eixo vertical)
pela largura respectiva
Out r os Gr f i c os
0,05
Classe Frequncia
Frequncia
Relativa (%)
1,59-1,65 1 6%
1,65-1,71 1 6%
1,71-1,77 10 56%
1,77-1,83 4 22%
1,83-1,89 2 11%
Total 18
Amplitude
Frequncia Relativa (%)
22%
11%
6%
6%
55%
1,59-1,65
1,65-1,71
1,71-1,77
1,77-1,83
1,83-1,89
Grfico
de Pizza
Out r os Gr f i c os
Classe Frequncia
Frequncia
Relativa(%)
Frequncia
Acumulada
Frequncia
Acumulada(%)
1,71-1,77 10 56% 10 56%
1,77-1,83 4 22% 14 78%
1,83-1,89 2 11% 16 89%
1,65-1,71 1 6% 17 94%
1,59-1,65 1 6% 18 100%
Total 18
100%
94%
89%
56%
78%
0%
20%
40%
60%
80%
100%
120%
1,71-1,77 1,77-1,83 1,83-1,89 1,65-1,71
Grfico de
Pareto
Classe de Altura (m) Freqncia Freq. Acumulada
1.55 [--- 1.63 2 2
1.63 [--- 1.71 12 14
1.71 [--- 1.79 22 36
1.79 [--- 1.87 13 49
1.87 [--- 1.96 2 51
Distribuio Acumulada
0
10
20
30
40
50
60
1.55 [---
1.63
1.63 [---
1.71
1.71 [---
1.79
1.79 [---
1.87
1.87 [---
1.96
Classes de alturas (m)
F
r
e
q

n
c
i
a
Seqncia1
Seqncia2
Seqncia3
Seqncia4
OGIVA DE GALTON
0
10
20
30
40
50
60
1.55 [---
1.63
1.63 [---
1.71
1.71 [---
1.79
1.79 [---
1.87
1.87 [---
1.96
Cl asses de al turas (m)
F
r
e
q
:
u

n
c
i
a

a
c
u
m
u
l
a
d
a
Series2
Series1
Series3
Out r os Gr f i c os
Quando os dados esto resumidos em uma
tabela de freqncias, podemos calcular
aproximadamente a mdia aritmtica
ponderando sobre:
Pontos mdios de cada intervalo supe-se que
todos os elementos das classes ocorrem no ponto
mdio das respectivas classes;
Exemplo: temos 7 ocorrncias na faixa entre 1,75 e
1,79. Consideramos que as sete ocorrncias
equivalem a (1,79+1,75)/2=1,77 ponto mdio da
classe.
Mdi a Ponder ada: Mdi a
de uma t abel a de
f r eqnc i a
Mdi a Ponder ada: Mdi a
de uma t abel a de
f r eqnc i a

=
f
x f
x
) . (
x = ponto mdio da classe
f = freqncia
f = n
Erros por
pginas
No de
paginas
0 25
1 20
2 3
3 1
4 1
n
f x
f
f x
x

= =
. .
66 , 0
50
33
) 1 1 3 20 25 (
) 1 4 ( ) 1 3 ( ) 3 2 ( ) 20 1 ( ) 25 0 (
= =
+ + + +
+ + + +
= x
Mdi a Ponder ada
A mdia ponderada considerada ponderadaquando
os valores dos conjuntos tiverem pesos / freqncias
diferentes
Numa distribuio utilizando os valores discretos,
calcula-se:
Mdi a Ponder ada
Quando tivermos uma distribuio com dados
agrupados por classes de valores, calculamos
considerando o valor de cada classe como o
ponto mdio respectivo da classe.
Alt ur as de
Pessoas
Ponto
Mdio (Xi)
Frequncia
(fi)
xi.fi
1,59-1,65 1,62 1 1,62
1,65-1,71 1,68 1 1,68
1,71-1,77 1,74 10 17,4
1,77-1,83 1,80 4 7,2
1,83-1,89 1,86 2 3,72
Total 18 31,62
n
f x
f
f x
x

= =
. .
1,76
18
62 , 31
= = x
Cl c ul o da Moda par a
dados Agr upados
Caso 1: dados agrupados por valores
discretos moda o valor com maior
freqncia.
Caso 2: dados agrupados por classes
Moda Bruta
Mtodo de King
Mtodo de Czuber
Mtodo de Pearson
Cl c ul o da Moda par a
dados Agr upados: Moda
Br ut a
Moda Bruta
Tome a classe que apresenta a maior
freqncia classe modal
A moda ser o ponto mdio da classe modal:
(lim
inf
+ lim
sup
)/2
Cl c ul o da Moda par a
dados Agr upados: Ki ng
Mtodo de King:
Onde
Lim
inf
: limite inferior da classe modal
f
ant
: freqncia da classe anterior modal
f
post
: freqncia da classe posterior modal
h: amplitude da classe modal
h
f f
f
M
post ant
post
o
+
+ =
inf
lim
Cl c ul o da Moda par a
dados Agr upados: Czuber
Mtodo de Czuber (mais preciso):
Onde
Lim
inf
: limite inferior da classe modal
f
Mo
: freqncia da classe modal
f
ant
: freqncia da classe anterior modal
f
post
: freqncia da classe posterior modal
h: amplitude da classe modal
( )
h
f f f
f f
M
post ant Mo
ant Mo
o
+

+ =
inf
lim
Cl c ul o da Moda par a
dados Agr upados: Pear son
Mtodo de Pearson:
Onde
M
d
: Mediana
: Mdia
X M M
d o
2 3 =
X
Cl c ul o da Medi ana
par a dados Agr upados
Dados agrupados por classes
Mediana o valor localizado a L
x
=n/2
Aps clculo de L
x
, determina-se o valor da mediana
por:
Onde:
L
x
Localizao (posio) da Mediana
Fant freqncia acumulada at a classe anterior classe
da mediana
f
i
freqncia absoluta da classe da mediana
h amplitude de classe
Lim
inf
Limite inferior da classe da mediana
i
ant
f
F h
Lim X
) L .(
x
inf
~

+ =
Cl c ul o dos Per c ent i s par a
dados Agr upados por
Cl asses
O percentil o valor localizado a L
Px
=(K/100)*n
Onde K o percentil desejado (ex.: P
45
K=45)
Aps clculo de L
Px
, determina-se o valor do percentil
por:
Onde:
L
Px
Localizao (posio) do Percentil
Fant freqncia acumulada at a classe anterior classe
do percentil
f
i
freqncia absoluta da classe do percentil
h amplitude de classe
Lim
inf
Limite inferior da classe do percentil
i
ant
x
f
F h
Lim P
) L .(
x
P
inf

+ =
Medi das de Posi o Dados
Agr upados: Medi ana /
Separ at r i zes
Para definirmos um procedimento de clculo da mediana, e quaisquer
outras separatrizes, utilizaremos o exemplo abaixo:
Encontra-se a classe onde
est a mediana. Faz-se,
ento, a proporcionalidade
entre a rea e a base dos
retngulos hachurado e o
que define a classe mediana
M
d
= 10,67
X

% 22
00 , 8
% 33
00 , 8 00 , 12
=

d
M
Medi das de Posi o Dados
Agr upados: Medi ana /
Separ at r i zes
Encontra-se a classe onde
est Q3. Faz-se, ento, a
proporcionalidade entre a
rea e a base dos retngulos
hachurado e o que define a
classe de Q3
Q
3
= 15,82
% 14
00 , 12
% 22
00 , 12 00 , 18
3

=
Q
Medi das de Posi o Dados
Agr upados: Medi ana /
Separ at r i zes
Medi das de Di sper so
(Dados Agr upados)
O desvio-padro, nesse caso, faz uma ponderao da distncia dos
pontos mdios de cada classe para a mdia, e a respectiva
freqncia de valores:
( ) ( )
) (populao (amostra)
N
x f
n
x x f
s
k
j
j j
k
j
j j

= =

=

=
1
2
1
2
~
1
~

Desvi o padr o de dados


agr upados
) 1 (
)] . ( [ )] . ( [
2 2

=

n n
x f x f n
s
Desvio padro para uma tabela de freqncias
x = ponto mdio da classe
f = frequncia da classe
n = tamanho da amostra (ou f = soma das frequncias)
Assi met r i a
Comparando a mdia, a moda e a mediana, podemos
concluir pela assimetria da distribuio:
Assimetria: no simetria distribuio tende mais para um lado
Dados negativamente assimtricos (assimetria para a
esquerda)
Mdia e mediana esquerda da moda
Em geral, mdia esquerda da mediana
Dados positivamente assimtricos (assimetria para a
direita)
Mdia e mediana direita da moda
Em geral, mdia direita da mediana
Assi met r i a
mdia
mediana
moda
Mdia = moda = mediana
mdia moda
mediana
Assimtrica direita
Assimtrica esquerda Simtrica
Mo x x > >
~
Mo x x < <
~
Mo x x = =
~
I nt er pr et ando
Hi st ogr amas
Histograma uma ferramenta estatstica que permite
resumir informaes de um conjunto de dados,
visualizando a forma da distribuio desses dados, a
localizao do valor central e a disperso dos dados em
torno do valor central
Ou seja, em anlises de processos produtivos,
freqentemente obtemos informaes teis sobre a
populao/amostra de dados coletados pela anlise da
forma do histograma
O valor mdio est localizado no centro do
histograma
A freqncia mais alta no meio e diminui
gradualmente na direo dos extremos
Ocorre quando no existem restries aos
valores que a varivel de controle pode
assumir
Processo geralmente sob controle,
somente causas comuns esto presentes
Processo usualmente est estvel
Si mt r i c o ou em For ma
de Si no
O valor mdio est localizado fora do centro
do histograma
A freqncia diminui gradativamente em um
dos lados e de modo um tanto abrupto do
outro lado
Ocorre quando no possvel que a varivel
de controle assuma valores mais altos (ou
mais baixos)
Processo em que o limite inferior (superior)
controlado (apenas um limite de especificao)
Por exemplo, teoricamente impossvel
valores inferiores 0% para a varivel
impureza
Assi mt r i c o
O valor mdio est localizado fora do
centro do histograma
A freqncia diminui abruptamente de um
dos lados e suavemente em direo ao
outro
Processo no atende s especificaes e
uma inspeo 100% realizada para
eliminar produtos defeituosos
Despi nhadei r o
Parte do grfico relativamente simtrica
com o acrscimo de algumas classes
mais afastadas de menores freqncias
Ocorre quando dados de outra
distribuio, diferente da distribuio da
maior parte das medidas, so includos
Processo com anormalidades, ou erro de
medio e/ou registro de dados, ou
incluso de dados de um processo
diferente
I l has I sol adas ou Pi c o
I sol ado
A freqncia mais baixa no centro do
histograma e existe um picoem cada
lado
Ocorre quando dados de duas
distribuies, com mdias muito
diferentes, so misturados
Os valores da varivel de controle
devem estar associados a duas
mquinas ou dois turnos distintos, por
exemplo
Bi modal ou c om Doi s
Pi c os
Todas as classes possuem mais ou
menos a mesma freqncia, exceto
aquelas das extremidades
Ocorre quando dados de duas
distribuies, com mdias no muito
diferentes, so misturados
Os valores da varivel de controle
devem estar associados a nveis
distintos de algum (ou alguns) dos
fatores que constituem o processo em
anlise
Ac hat ado ou Pl at
Atende, com folga, os limites de
especificao
Mdia no centro da faixa de especificao
Variabilidade aceitvel
Manter a situao atual
Especificao atendida sem nenhuma
margem extra
Mdia no centro da faixa de especificao
Variabilidade um pouco elevada
Adotar medidas para reduzir um pouco a
variabilidade
Hi st ogr amas e Li mi t es de
Espec i f i c a o de
Pr oc essos
No atende os limites de especificao
Mdia deslocada para a esquerda
Variabilidade aceitvel
Adotar medidas para deslocar a mdia para o centro
(valor nominal)
No atende os limites de especificao
Mdia no centro da faixa de especificao
Variabilidade elevada
Adotar medidas para reduzir a variabilidade
No atende os limites de especificao
Mdia deslocada para a esquerda
Variabilidade elevada
Adotar medidas para deslocar a mdia para o centro e
reduzir a variabilidade
Hi st ogr amas e Li mi t es de
Espec i f i c a o de
Pr oc essos
Coef i c i ent e de
Assi met r i a
Coeficiente de Assimetria de Pearson
(As)
s
x x
As
)
~
.( 3
=
Permite comparar duas ou mais distribuies diferentes e avaliar
qual mais assimtrica.
Quanto maior o Coeficiente de Assimetria de Pearson, mais
assimtrica curva.
Assimtrica moderada: 0,15<|As|<1
Assimtrica forte: |As|>1
Cur t ose
Grau de achatamento (ou
afilamento) de uma distribuio
em relao com a distribuio
normal.

Distribuio
Normal
Mesocrtica
C=0,263
Leptocrtica
C<0,263
Platicrtica
C>0,263
) .( 2
) (
10 90
1 3
P P
Q Q
C

Você também pode gostar