Você está na página 1de 53

Distribuio de

Freqncia

Representao do
conjunto de dados

Distribuies de
freqncia
Freqncia relativa
Freqncia
acumulada

Representao
Grfica
Histogramas

Organizao dos
dados

Os mtodos utilizados para organizar dados compreendem o arranjo


desses dados em subconjuntos que apresentem caractersticas
similares.
mesma idade (ou faixa etria), mesma finalidade, mesma escola,
mesmo bairro, etc

Os dados agrupados podem ser resumidos em tabelas ou grficos e,


a partir desses, podemos obter as estatsticas descritivas j
definidas: mdia, mediana, desvio, etc.

Dados organizados em grupos ou categorias / classes so


usualmente designados distribuio de freqncia.

Distribuio de
frequncia

Uma distribuio de freqncia um mtodo de se agrupar dados


em classes de modo a fornecer a quantidade (e/ou a percentagem)
de dados em cada classe

Com isso, podemos resumir e visualizar um conjunto de dados sem


precisar levar em conta os valores individuais.

Uma distribuio de freqncia (absoluta ou relativa) pode ser


apresentada em tabelas ou grficos

Distribuio de
frequncia
Uma distribuio de freqncia agrupa os
dados por classes de ocorrncia, resumindo
a anlise de conjunto de dados grandes.

Construindo uma
distribuio de freqncia
Adotemos o conjunto
de dados que
represente a
populao
Ordene em ordem
crescente ou
decrescente

Eventos
Aluno 1
Aluno 2
Aluno 3
Aluno 4
Aluno 5
Aluno 6
Aluno 7
Aluno 8
Aluno 9
Aluno 10
Aluno 11
Aluno 12
Aluno 13
Aluno 14
Aluno 15
Aluno 16
Aluno 17
Aluno 18

Altura
1,60
1,69
1,72
1,73
1,73
1,74
1,75
1,75
1,75
1,75
1,75
1,76
1,78
1,80
1,82
1,82
1,84
1,88

Construindo uma
distribuio de freqncia
Determine a Quantidade de classes (k)
Regra de Sturges (Regra do Logaritmo)
k = 1 + 3,3log(n)

Regra da Potncia de 2
k = menor valor interiro tal que 2k n

Regra da raiz quadrada

k= n

Bom senso !!!


Decida a quantidade de classes que GARANTA observar
como os valores se distribuem.

Construindo uma
distribuio de freqncia
Regra de Sturges (Logaritmo)

Regra da Potncia de 2

Bom Senso

Quantidade de
dados (n)

Quantidade de
Classes (k)

Quantidade de
dados (n)

Quantidade de
Classes (k)

Quantidade de
dados (n)

Q ua nt ida de
M N IM A de
C la s s e s ( k )

Q ua nt ida de
M X IM A de
C la s s e s ( k )

1
2
3a5
6 a 11
12 a 23
24 a 46
47 a 93
94 a 187
188 a 376
377 a 756

1
2
3
4
5
6
7
8
9
10

1e2
3e4
5a8
9 a 16
17 a 32
33 a 64
65 a 128
129 a 256
257 a 512
513 a 1024

1
2
3
4
5
6
7
8
9
10

at 50
51 a 100
101 a 200
201 a 300
301 a 500
mais de 500

5
8
10
12
15
20

10
16
20
24
30
40

Construindo uma
distribuio de freqncia
Calcule a amplitude das classes (h)
Calcule a amplitude do conjunto de dados
L = xmx xmn

Calcule a amplitude (largura) da classe


h=L/k
Arredonde convenientemente

Calcule os Limites das Classes

1a classe: xmn at xmn + h


2a classe: xmn + h at xmn + 2 . h
........................
ka classe: xmn + (k-1) . h at xmn + k . h

Construindo uma
distribuio de freqncia

Limite das classes


Utilize a notao:
[x,y) intervalo de entre x (fechado) at y (aberto)

Freqentemente temos que arredondar a amplitude das classes e,


conseqentemente, arredondar tambm os limites das classes.
Como sugesto, podemos tentar, se possvel, um ajuste simtrico
nos limites das classes das pontas (i.e., primeira e ltima) nas quais,
usualmente, a quantidade de dados menor.

Ponto mdio das classes


xk = ( Lsuperior Linferior ) / 2

Construindo uma
distribuio de freqncia

Determinao da freqncia das classes


Consiste em agrupar os dados em cada classe e contar os totais

Traar o grfico
Dividir o eixo horizontal em tantas partes quanto for o nmero de
classes. Sugesto: deixe espao entre o eixo vertical e a primeira classe.
Identifique a maior freqncia da classe na tabela e marque esse
nmero (ou outro um pouco maior) na extremidade do eixo vertical;
divida esse eixo em algumas partes e marque os valores
correspondentes
Desenhe um retngulo, para cada classe, com largura igual
largura da classe e com altura igual freqncia da classe

Exemplo
Do nosso exemplo:
Ordenamos os dados
Por Sturges, temos:
n=18 ; k=5 (nmero de
classes)

Amplitude de classes
Amplitude do conjunto
de dados: 1,881,60=0,28m
Amplitude de classes:
0,28/5=0,056
Arredondado h = 0,06m

Altura
1,60
1,69
1,72
1,73
1,73
1,74
1,75
1,75
1,75
1,75
1,75
1,76
1,78
1,80
1,82
1,82
1,84
1,88

Construindo uma tabela de


freqncia
Altura
Calcule os Limites de
Amplitude
0,06
Classe
Limites
Limite
inferiores
1,60
1,66
1,72
1,78
1,84

superior
1,66
1,72
1,78
1,84
1,90

Arredonde os Limites de
Classe nos extremos

1,9-1,88=0,02
Distribua o excesso:
1,60-0,01; 1,88+0,01

1,60
1,69
1,72
1,73
1,73
1,74
1,75
1,75
1,75
1,75
1,75
1,76
1,78
1,80
1,82
1,82
1,84
1,88

Construindo uma tabela de


freqncia
Amplitude

Freqncias absolutas
Distribua os eventos ou ocorrncia
por suas respectivas classes

Freqncias acumuladas
Some as ocorrncias de dados
cumulativamente s classes

Observao importante:
muito til representar as
frequncias em termos percentuais
ao total de amostras

Dados

Classe

1,60 1,59-1,65
1,69 1,65-1,71
1,72 1,71-1,77
1,73 1,77-1,83
1,73 1,83-1,89
1,74
1,75
1,75
1,75
1,75
1,75
1,76
1,78
1,80
1,82
1,82
1,84
1,88

Total

0,06
Frequncia

1
1
10
4
2
18

Frequncia
Acumulada

1
2
12
16
18

Representao
Grfica
0,06

Amplitude

Histograma
Na abscissas, distribua
as classes
Na ordenada da
esquerda, as
freqncias absolutas
Construa um grfico de
barras para as
freqncias
Construa um grfico de
linha para a freqncia
acumulada (utilize a
escala da direita)

Classe

Frequncia

Frequncia
Acumulada

1,59-1,65
1,65-1,71
1,71-1,77
1,77-1,83
1,83-1,89

1
1
10
4
2

1
2
12
16
18

Total

18

12
10
8
6
4
2
0

20
15
10
5
0
1,59- 1,65- 1,71- 1,77- 1,831,65 1,71 1,77 1,83 1,89

Distribuio de Freqncia:
Histogramas e Polgonos
de Freqncia

Uma distribuio de freqncia representada por um grfico de


barras denominada histograma

Outro grfico de interesse o chamado polgono de freqncia

O polgono de freqncia obtido unindo-se os pontos mdios da


parte superior de cada retngulo do histograma com segmentos de
reta

importante notar que tanto o histograma quanto o polgono de


freqncia indicam a freqncia absoluta de cada classe

Distribuio de Freqncia:
Histogramas e Polgonos
de Freqncia
Digamos que temos histogramas para as alturas dos
estudantes de duas turmas diferentes, traados de
acordo com as regras descritas at agora

Poderamos sobrepor os desenhos para fazer uma


anlise comparativa das turmas?

Que cuidados devemos tomar?

Distribuio de Freqncia:
Histogramas e Polgonos
de Freqncia
O problema com esta regra de construo que o
histograma construdo especfico para o conjunto em anlise
Para fazermos anlises comparativas de conjuntos de dados
diferentes, as classes devem ser as mesmas!
Devemos, ento, utilizar algum conhecimento prvio da rea
em estudo para definir o intervalo aceitvel de variao dos
dados e, a partir da, definir as classes
Essas classes genricas serviro para o estudo de
quaisquer conjunto de dados e permitiro anlises
comparativas

Distribuio de Freqncia:
Histogramas e Polgonos
de Freqncia

Em um histograma, as classes devem SEMPRE ter a mesma


largura?

No necessariamente!

Existem casos em que mais adequado agrupar os dados em


classes com larguras desiguais.

O exemplo tpico a classificao de pessoas por faixas etrias


(infantil, juvenil, adulto, snior, etc). Essas faixas no tm a mesma
largura.

Distribuio de Freqncia:
Histogramas com Classes
de Larguras Desiguais
A representao grfica dos dados em um histograma com
classes de larguras desiguais requer a transformao dos
valores de freqncia absoluta em densidade de freqncia.
Isso fundamental pois devemos manter a rea dos
retngulos proporcionais freqncia da classe
A densidade de freqncia dada por:

densidade de freqncia

freqncia da classe
largura da classe

Distribuio de Freqncia:
Histogramas com Classes
de Larguras Desiguais
Isso significa que a altura das barras (i.e., os valores
na escala do eixo vertical) NO representam a
freqncia da classe, mas sim a densidade de
freqncia.
Para calcularmos a freqncia da classe devemos
multiplicar a densidade (indicada no eixo vertical)
pela largura respectiva

Outros Grficos
0,05

Amplitude

Classe

Frequncia

1,59-1,65
1,65-1,71
1,71-1,77
1,77-1,83
1,83-1,89

1
1
10
4
2

Total

18

Frequncia
Relativa (%)
6%
6%
56%
22%
11%

Frequncia Relativa (%)


11%

6% 6%

1,59-1,65
1,65-1,71

22%

1,71-1,77
1,77-1,83
55%

1,83-1,89

Grfico
de Pizza

Outros Grficos
Classe

Frequncia

Frequncia
Relativa(%)

Frequncia
Acumulada

Frequncia
Acumulada(%)

1,71-1,77
1,77-1,83
1,83-1,89

10
4
2

56%
22%
11%

10
14
16

56%
78%
89%

1,65-1,71
1,59-1,65

1
1

6%
6%

17
18

94%
100%

Total

18

120%
100%
80%
60%

89%
56%

78%

94%

40%
20%
0%
1,71-1,77 1,77-1,83 1,83-1,89 1,65-1,71

100%

Grfico de
Pareto

Outros Grficos
Classe de Altura (m) Freqncia
1.55 [--- 1.63
1.63 [--- 1.71
1.71 [--- 1.79
1.79 [--- 1.87
1.87 [--- 1.96

2
12
22
13
2

Freq. Acumulada

2
14
36
49
51

OGIVA DE GALTON

Distribuio Acumulada
60
50
40
30
20
10
0

Seqncia1
Seqncia2
Seqncia3
Seqncia4
1.55 [--- 1.63 [--- 1.71 [--- 1.79 [--- 1.87 [--1.63
1.71
1.79
1.87
1.96

Classes de alturas (m)

Freq:uncia acumulada

Freqncia

60
50
40

Series2

30

Series1
Series3

20
10
0
1.55 [--1.63

1.63 [--1.71

1.71 [--1.79

1.79 [--1.87

Classes de alturas (m)

1.87 [--1.96

Mdia Ponderada: Mdia


de uma tabela de
freqncia
Quando os dados esto resumidos em uma
tabela de freqncias, podemos calcular
aproximadamente a mdia aritmtica
ponderando sobre:
Pontos mdios de cada intervalo supe-se que
todos os elementos das classes ocorrem no ponto
mdio das respectivas classes;
Exemplo: temos 7 ocorrncias na faixa entre 1,75 e
1,79. Consideramos que as sete ocorrncias
equivalem a (1,79+1,75)/2=1,77 ponto mdio da
classe.

Mdia Ponderada: Mdia


de uma tabela de
freqncia

( f .x )

x=
f
x = ponto mdio da classe
f = freqncia
f = n

Mdia Ponderada
A mdia ponderada considerada ponderada quando
os valores dos conjuntos tiverem pesos / freqncias
diferentes
Numa distribuio utilizando os valores discretos,
calcula-se:
Erros por
pginas

No de
paginas

25

20

x. f x. f

x=
=
n
f
(0 25) + (1 20) + (2 3) + (3 1) + (4 1) 33
=
= 0,66
x=
(25 + 20 + 3 + 1 + 1)
50

Mdia Ponderada
Quando tivermos uma distribuio com dados
agrupados por classes de valores, calculamos
considerando o valor de cada classe como o
ponto mdio respectivo da classe.
Frequncia
Alturas de
Ponto
Pessoas Mdio (Xi)
(fi)
1,59-1,65

1,62

1,65-1,71

1,68

1,71-1,77

1,74

1,77-1,83

1,80

1,83-1,89

1,86

Total

1
1
10
4
2
18

xi.fi
1,62
1,68
17,4
7,2
3,72
31,62

x. f x. f

x=
=
n
f

31,62
x=
= 1,76
18

Clculo da Moda para


dados Agrupados
Caso 1: dados agrupados por valores
discretos moda o valor com maior
freqncia.
Caso 2: dados agrupados por classes
Moda Bruta
Mtodo de King
Mtodo de Czuber
Mtodo de Pearson

Clculo da Moda para


dados Agrupados: Moda
Bruta

Moda Bruta
Tome a classe que apresenta a maior
freqncia classe modal
A moda ser o ponto mdio da classe modal:
(liminf + limsup)/2

Clculo da Moda para


dados Agrupados: King

Mtodo de King:
M o = lim inf +

f post
f ant + f post

Onde
Liminf: limite inferior da classe modal
fant: freqncia da classe anterior modal
fpost: freqncia da classe posterior modal
h: amplitude da classe modal

Clculo da Moda para


dados Agrupados: Czuber
Mtodo de Czuber (mais preciso):
f Mo f ant
M o = lim inf +
h
f Mo ( f ant + f post )

Onde

Liminf: limite inferior da classe modal


fMo: freqncia da classe modal
fant: freqncia da classe anterior modal
fpost: freqncia da classe posterior modal
h: amplitude da classe modal

Clculo da Moda para


dados Agrupados: Pearson

Mtodo de Pearson:

M o = 3M d 2 X
Onde
Md: Mediana
X : Mdia

Clculo da Mediana
para dados Agrupados
Dados agrupados por classes
Mediana o valor localizado a Lx=n/2
Aps clculo de Lx, determina-se o valor da mediana
por:
~
X = Liminf +

Onde:

h.(L x Fant )
fi

Lx Localizao (posio) da Mediana


Fant freqncia acumulada at a classe anterior classe
da mediana
fi freqncia absoluta da classe da mediana
h amplitude de classe
Liminf Limite inferior da classe da mediana

Clculo dos Percentis para


dados Agrupados por
Classes
O percentil o valor localizado a LPx=(K/100)*n
Onde K o percentil desejado (ex.: P45 K=45)

Aps clculo de LPx, determina-se o valor do percentil


por:
Onde:

h.(L P x Fant )
Px = Liminf +
fi

LPx Localizao (posio) do Percentil


Fant freqncia acumulada at a classe anterior classe
do percentil
fi freqncia absoluta da classe do percentil
h amplitude de classe
Liminf Limite inferior da classe do percentil

Medidas de Posio Dados


Agrupados: Mediana /
Separatrizes

Para definirmos um procedimento de clculo da mediana, e quaisquer


outras separatrizes, utilizaremos o exemplo abaixo:

Medidas de Posio Dados


Agrupados: Mediana /
Separatrizes

Encontra-se a classe onde


est a mediana.
Faz-se,
X
ento, a proporcionalidade
entre a rea e a base dos
retngulos hachurado e o
que define a classe mediana

12,008,00 Md 8,00
=
33%
22%

Md = 10,67

Medidas de Posio Dados


Agrupados: Mediana /
Separatrizes

Encontra-se a classe onde


est Q3. Faz-se, ento, a
proporcionalidade entre a
rea e a base dos retngulos
hachurado e o que define a
classe de Q3

18,0012,00 Q3 12,00
=
22%
14%

Q3 = 15,82

Medidas de Disperso
(Dados Agrupados)

O desvio-padro, nesse caso, faz uma ponderao da distncia dos


pontos mdios de cada classe para a mdia, e a respectiva
freqncia de valores:

s=

j =1

f j (~
xj x)

n 1

(amostra)

j =1

2
f j (~
xj )

(populao )

Desvio padro de dados


agrupados
n[ ( f .x )] [ ( f .x)]
2

s=

n(n 1)

Desvio padro para uma tabela de freqncias


x = ponto mdio da classe
f = frequncia da classe
n = tamanho da amostra (ou f = soma das frequncias)

Assimetria
Comparando a mdia, a moda e a mediana, podemos
concluir pela assimetria da distribuio:
Assimetria: no simetria distribuio tende mais para um lado

Dados negativamente assimtricos (assimetria para a


esquerda)
Mdia e mediana esquerda da moda
Em geral, mdia esquerda da mediana

Dados positivamente assimtricos (assimetria para a


direita)
Mdia e mediana direita da moda
Em geral, mdia direita da mediana

Assimetria

mdia

mediana

moda

Mdia = moda = mediana

Assimtrica esquerda

Simtrica

x=~
x = Mo

x<~
x < Mo
moda

mdia
mediana

x>~
x > Mo

Assimtrica direita

Interpretando
Histogramas
Histograma uma ferramenta estatstica que permite
resumir informaes de um conjunto de dados,
visualizando a forma da distribuio desses dados, a
localizao do valor central e a disperso dos dados em
torno do valor central
Ou seja, em anlises de processos produtivos,
freqentemente obtemos informaes teis sobre a
populao/amostra de dados coletados pela anlise da
forma do histograma

Simtrico ou em Forma
de Sino

O valor mdio est localizado no centro do


histograma

A freqncia mais alta no meio e diminui


gradualmente na direo dos extremos

Ocorre quando no existem restries aos


valores que a varivel de controle pode
assumir

Processo geralmente sob controle,


somente causas comuns esto presentes

Processo usualmente est estvel

Assimtrico

O valor mdio est localizado fora do centro


do histograma

A freqncia diminui gradativamente em um


dos lados e de modo um tanto abrupto do
outro lado

Ocorre quando no possvel que a varivel


de controle assuma valores mais altos (ou
mais baixos)

Processo em que o limite inferior (superior)


controlado (apenas um limite de especificao)

Por exemplo, teoricamente impossvel


valores inferiores 0% para a varivel
impureza

Despinhadeiro
O valor mdio est localizado fora do
centro do histograma
A freqncia diminui abruptamente de um
dos lados e suavemente em direo ao
outro
Processo no atende s especificaes e
uma inspeo 100% realizada para
eliminar produtos defeituosos

Ilhas Isoladas ou Pico


Isolado
Parte do grfico relativamente simtrica
com o acrscimo de algumas classes
mais afastadas de menores freqncias
Ocorre quando dados de outra
distribuio, diferente da distribuio da
maior parte das medidas, so includos
Processo com anormalidades, ou erro de
medio e/ou registro de dados, ou
incluso de dados de um processo
diferente

Bimodal ou com Dois


Picos
A freqncia mais baixa no centro do
histograma e existe um pico em cada
lado
Ocorre quando dados de duas
distribuies, com mdias muito
diferentes, so misturados
Os valores da varivel de controle
devem estar associados a duas
mquinas ou dois turnos distintos, por
exemplo

Achatado ou Plat
Todas as classes possuem mais ou
menos a mesma freqncia, exceto
aquelas das extremidades
Ocorre quando dados de duas
distribuies, com mdias no muito
diferentes, so misturados
Os valores da varivel de controle
devem estar associados a nveis
distintos de algum (ou alguns) dos
fatores que constituem o processo em
anlise

Histogramas e Limites de
Especificao de
Processos

Atende, com folga, os limites de


especificao

Mdia no centro da faixa de especificao

Variabilidade aceitvel

Manter a situao atual

Especificao atendida sem nenhuma


margem extra

Mdia no centro da faixa de especificao

Variabilidade um pouco elevada

Adotar medidas para reduzir um pouco a


variabilidade

Histogramas e Limites de
Especificao de
Processos

No atende os limites de especificao

Mdia deslocada para a esquerda

Variabilidade aceitvel

Adotar medidas para deslocar a mdia para o centro


(valor nominal)

No atende os limites de especificao

Mdia no centro da faixa de especificao

Variabilidade elevada

Adotar medidas para reduzir a variabilidade

No atende os limites de especificao

Mdia deslocada para a esquerda

Variabilidade elevada

Adotar medidas para deslocar a mdia para o centro e


reduzir a variabilidade

Coeficiente de
Assimetria
Coeficiente de Assimetria de Pearson
(As)
3.( x ~
x)
As =
s

Permite comparar duas ou mais distribuies diferentes e avaliar


qual mais assimtrica.
Quanto maior o Coeficiente de Assimetria de Pearson, mais
assimtrica curva.

Assimtrica moderada: 0,15<|As|<1


Assimtrica forte: |As|>1

Curtose
Grau de achatamento (ou
afilamento) de uma distribuio
em relao com a distribuio
normal.

(Q3 Q1 )
C=
2.( P90 P10 )

Distribuio
Normal

Mesocrtica

Leptocrtica

Platicrtica

C=0,263

C<0,263

C>0,263

Você também pode gostar