Escolar Documentos
Profissional Documentos
Cultura Documentos
Representao do conjunto de
dados
Distribuies de
freqncia
Freqncia relativa
Freqncia
acumulada
Representao
Grfica
Histogramas
Distribuio de frequncia
Uma distribuio de freqncia um mtodo de se agrupar dados
em classes de modo a fornecer a quantidade (e/ou a percentagem)
de dados em cada classe
Distribuio de frequncia
Uma distribuio de freqncia agrupa os
dados por classes de ocorrncia, resumindo
a anlise de conjunto de dados grandes.
Eventos
Aluno 1
Aluno 2
Aluno 3
Aluno 4
Aluno 5
Aluno 6
Aluno 7
Aluno 8
Aluno 9
Aluno 10
Aluno 11
Aluno 12
Aluno 13
Aluno 14
Aluno 15
Aluno 16
Aluno 17
Aluno 18
Altura
1,60
1,69
1,72
1,73
1,73
1,74
1,75
1,75
1,75
1,75
1,75
1,76
1,78
1,80
1,82
1,82
1,84
1,88
Regra da Potncia de 2
k = menor valor interiro tal que 2k n
k= n
Regra da Potncia de 2
Bom Senso
Quantidade de
dados (n)
Quantidade de
Classes (k)
Quantidade de
dados (n)
Quantidade de
Classes (k)
Quantidade de
dados (n)
Q ua nt ida de
M N IM A de
C la s s e s ( k )
Q ua nt ida de
M X IM A de
C la s s e s ( k )
1
2
3a5
6 a 11
12 a 23
24 a 46
47 a 93
94 a 187
188 a 376
377 a 756
1
2
3
4
5
6
7
8
9
10
1e2
3e4
5a8
9 a 16
17 a 32
33 a 64
65 a 128
129 a 256
257 a 512
513 a 1024
1
2
3
4
5
6
7
8
9
10
at 50
51 a 100
101 a 200
201 a 300
301 a 500
mais de 500
5
8
10
12
15
20
10
16
20
24
30
40
Traar o grfico
Dividir o eixo horizontal em tantas partes quanto for o nmero de
classes. Sugesto: deixe espao entre o eixo vertical e a primeira classe.
Identifique a maior freqncia da classe na tabela e marque esse
nmero (ou outro um pouco maior) na extremidade do eixo vertical;
divida esse eixo em algumas partes e marque os valores
correspondentes
Desenhe um retngulo, para cada classe, com largura igual
largura da classe e com altura igual freqncia da classe
Exemplo
Do nosso exemplo:
Ordenamos os dados
Por Sturges, temos:
n=18 ; k=5 (nmero de
classes)
Amplitude de classes
Amplitude do conjunto
de dados: 1,881,60=0,28m
Amplitude de classes:
0,28/5=0,056
Arredondado h = 0,06m
Altura
1,60
1,69
1,72
1,73
1,73
1,74
1,75
1,75
1,75
1,75
1,75
1,76
1,78
1,80
1,82
1,82
1,84
1,88
0,06
Limite
superior
1,66
1,72
1,78
1,84
1,90
Aqui sobra
0,02m!
Altura
1,60
1,69
1,72
1,73
1,73
1,74
1,75
1,75
1,75
1,75
1,75
1,76
1,78
1,80
1,82
1,82
1,84
1,88
Freqncias absolutas
Distribua os eventos ou ocorrncia
por suas respectivas classes
Freqncias acumuladas
Some as ocorrncias de dados
cumulativamente s classes
Observao importante:
muito til representar as
frequncias em termos percentuais
ao total de amostras
Dados
Classe
1,60 1,59-1,65
1,69 1,65-1,71
1,72 1,71-1,77
1,73 1,77-1,83
1,73 1,83-1,89
1,74
1,75
1,75
1,75
1,75
1,75
1,76
1,78
1,80
1,82
1,82
1,84
1,88
Total
0,06
Frequncia
1
1
10
4
2
18
Frequncia
Acumulada
1
2
12
16
18
Representao Grfica
0,06
Amplitude
Histograma
Na abscissas, distribua
as classes
Na ordenada da
esquerda, as
freqncias absolutas
Construa um grfico de
barras para as
freqncias
Construa um grfico de
linha para a freqncia
acumulada (utilize a
escala da direita)
Classe
Frequncia
Frequncia
Acumulada
1,59-1,65
1,65-1,71
1,71-1,77
1,77-1,83
1,83-1,89
1
1
10
4
2
1
2
12
16
18
Total
18
12
10
8
6
4
2
0
20
15
10
5
0
1,59- 1,65- 1,71- 1,77- 1,831,65 1,71 1,77 1,83 1,89
Distribuio de Freqncia:
Histogramas e Polgonos de
Freqncia
Uma distribuio de freqncia representada por um grfico de
barras denominada histograma
Outro grfico de interesse o chamado polgono de freqncia
O polgono de freqncia obtido unindo-se os pontos mdios da
parte superior de cada retngulo do histograma com segmentos de
reta
importante notar que tanto o histograma quanto o polgono de
freqncia indicam a freqncia absoluta de cada classe
Distribuio de Freqncia:
Histogramas e Polgonos de
Freqncia
Digamos que temos histogramas para as alturas dos
estudantes de duas turmas diferentes, traados de
acordo com as regras descritas at agora
Distribuio de Freqncia:
Histogramas e Polgonos de
Freqncia
O problema com esta regra de construo que o
histograma construdo especfico para o conjunto em
anlise
Para fazermos anlises comparativas de conjuntos de dados
diferentes, as classes devem ser as mesmas!
Devemos, ento, utilizar algum conhecimento prvio da rea
em estudo para definir o intervalo aceitvel de variao dos
dados e, a partir da, definir as classes
Essas classes genricas serviro para o estudo de
quaisquer conjunto de dados e permitiro anlises
comparativas
Distribuio de Freqncia:
Histogramas e Polgonos de
Freqncia
Em um histograma, as classes devem SEMPRE ter a mesma
largura?
No necessariamente!
Existem casos em que mais adequado agrupar os dados em
classes com larguras desiguais.
O exemplo tpico a classificao de pessoas por faixas etrias
(infantil, juvenil, adulto, snior, etc). Essas faixas no tm a mesma
largura.
Distribuio de Freqncia:
Histogramas com Classes de Larguras
Desiguais
A representao grfica dos dados em um histograma com
classes de larguras desiguais requer a transformao dos
valores de freqncia absoluta em densidade de freqncia.
Isso fundamental pois devemos manter a rea dos
retngulos proporcionais freqncia da classe
A densidade de freqncia dada por:
densidade de freqncia
freqncia da classe
largura da classe
Distribuio de Freqncia:
Histogramas com Classes de Larguras
Desiguais
Isso significa que a altura das barras (i.e., os
valores na escala do eixo vertical) NO
representam a freqncia da classe, mas sim a
densidade de freqncia.
Para calcularmos a freqncia da classe devemos
multiplicar a densidade (indicada no eixo vertical)
pela largura respectiva
Outros Grficos
0,05
Amplitude
Classe
Frequncia
1,59-1,65
1,65-1,71
1,71-1,77
1,77-1,83
1,83-1,89
1
1
10
4
2
Total
18
Frequncia
Relativa (%)
6%
6%
56%
22%
11%
6% 6%
1,59-1,65
1,65-1,71
22%
1,71-1,77
1,77-1,83
55%
1,83-1,89
Grfico
de Pizza
Outros Grficos
Classe
Frequncia
Frequncia
Relativa(%)
Frequncia
Acumulada
Frequncia
Acumulada(%)
1,71-1,77
1,77-1,83
1,83-1,89
10
4
2
56%
22%
11%
10
14
16
56%
78%
89%
1,65-1,71
1,59-1,65
1
1
6%
6%
17
18
94%
100%
Total
18
120%
100%
80%
60%
89%
56%
78%
94%
40%
20%
0%
1,71-1,77 1,77-1,83 1,83-1,89 1,65-1,71
100%
Grfico de
Pareto
Outros Grficos
Classe de Altura (m) Freqncia
1.55 [--- 1.63
1.63 [--- 1.71
1.71 [--- 1.79
1.79 [--- 1.87
1.87 [--- 1.96
2
12
22
13
2
Freq. Acumulada
2
14
36
49
51
OGIVA DE GALTON
Distribuio Acumulada
60
50
40
30
20
10
0
Seqncia1
Seqncia2
Seqncia3
Seqncia4
1.55 [--- 1.63 [--- 1.71 [--- 1.79 [--- 1.87 [--1.63
1.71
1.79
1.87
1.96
Freq:uncia acumulada
Freqncia
60
50
40
Series2
30
Series1
Series3
20
10
0
1.55 [--1.63
1.63 [--1.71
1.71 [--1.79
1.79 [--1.87
1.87 [--1.96
( f .x)
x=
f
x = ponto mdio da classe
f = freqncia
f = n
Mdia Ponderada
A mdia ponderada considerada ponderada quando
os valores dos conjuntos tiverem pesos / freqncias
diferentes
Numa distribuio utilizando os valores discretos,
calcula-se:
Erros por
pginas
No de
paginas
25
20
x. f x. f
x=
=
n
f
(0 25) + (1 20) + (2 3) + (3 1) + (4 1) 33
=
= 0,66
x=
(25 + 20 + 3 + 1 + 1)
50
Mdia Ponderada
Quando tivermos uma distribuio com dados
agrupados por classes de valores, calculamos
considerando o valor de cada classe como o
ponto mdio respectivo da classe.
Frequncia
Alturas de
Ponto
Pessoas Mdio (Xi)
(fi)
1,59-1,65
1,62
1,65-1,71
1,68
1,71-1,77
1,74
1,77-1,83
1,80
1,83-1,89
1,86
Total
1
1
10
4
2
18
xi.fi
1,62
1,68
17,4
7,2
3,72
31,62
x. f x. f
x=
=
n
f
31,62
x=
= 1,76
18
M o = liminf +
Onde
f post
f ant + f post
f Mo f ant
M o = liminf +
h
f Mo ( f ant + f post )
Onde
Liminf: limite inferior da classe modal
fMo: freqncia da classe modal
fant: freqncia da classe anterior modal
fpost: freqncia da classe posterior modal
h: amplitude da classe modal
M o = 3M d 2 X
Onde
Md: Mediana
X : Mdia
Onde:
h.(L x Fant )
fi
h.(L P x Fant )
Px = Liminf +
fi
12,008,00 Md 8,00
=
33%
22%
16,00
Md = 10,67
Q 12,00
16,00 12,00
= 3
22%
14%
Q3 = 15,82
16,00
Mtodo Alternativo
A regra de trs gera precisamente o mesmo resultado
na aplicao da equao para clculo dos percentis
para dados agrupados. Seno vejamos:
Lsup Linf
pi
Lsup Linf
Px Linf
Px Linf
=
fi
p px pacm
f px f acm )
(
n
n
Lsup Linf
Px =
fi
Px Linf
=
f px f acm
Linf + h ( f px f acm )
fi
Mtodo Alternativo
Onde:
Lsup = limite superior classe do percentil
Linf = limite inferior classe do percentil
Px = valor do percentil procurado
pi = percentual representativo da classe do percentil
ppx = percentil procurado
pacm = percentual acumulado at a classe anterior classe do
percentil
fi = frequncia da classe do percentil
n = tamanho da amostra
fpx = posio do percentil procurado
facm = frequncia acumulada at a classe anterior classe do
percentil
Medidas de Disperso
(Dados Agrupados)
O desvio-padro, nesse caso, faz uma ponderao da distncia dos
pontos mdios de cada classe para a mdia, e a respectiva
freqncia de valores:
f j (~x j x )
k
s=
j =1
n 1
2
~
(
)
f
x
j j
k
(amostra)
j =1
(populao )
s=
n(n 1)
Assimetria
Comparando a mdia, a moda e a mediana, podemos
concluir pela assimetria da distribuio:
Assimetria: no simetria distribuio tende mais para um lado
Assimetria
mdia
mediana
moda
Assimtrica esquerda
Simtrica
x=~
x = Mo
x<~
x < Mo
moda
mdia
mediana
x>~
x > Mo
Assimtrica direita
Interpretando Histogramas
Histograma uma ferramenta estatstica que permite
resumir informaes de um conjunto de dados,
visualizando a forma da distribuio desses dados, a
localizao do valor central e a disperso dos dados em
torno do valor central
Ou seja, em anlises de processos produtivos,
freqentemente obtemos informaes teis sobre a
populao/amostra de dados coletados pela anlise da
forma do histograma
Assimtrico
O valor mdio est localizado fora do centro
do histograma
A freqncia diminui gradativamente em um
dos lados e de modo um tanto abrupto do
outro lado
Ocorre quando no possvel que a varivel
de controle assuma valores mais altos (ou
mais baixos)
Processo em que o limite inferior (superior)
controlado (apenas um limite de especificao)
Por exemplo, teoricamente impossvel
valores inferiores 0% para a varivel
impureza
Despinhadeiro
O valor mdio est localizado fora do
centro do histograma
A freqncia diminui abruptamente de um
dos lados e suavemente em direo ao
outro
Processo no atende s especificaes e
uma inspeo 100% realizada para
eliminar produtos defeituosos
Achatado ou Plat
Todas as classes possuem mais ou
menos a mesma freqncia, exceto
aquelas das extremidades
Ocorre quando dados de duas
distribuies, com mdias no muito
diferentes, so misturados
Os valores da varivel de controle
devem estar associados a nveis
distintos de algum (ou alguns) dos
fatores que constituem o processo em
anlise
Histogramas e Limites de
Especificao de Processos
Atende, com folga, os limites de
especificao
Mdia no centro da faixa de especificao
Variabilidade aceitvel
Manter a situao atual
Histogramas e Limites de
Especificao de Processos
No atende os limites de especificao
Mdia deslocada para a esquerda
Variabilidade aceitvel
Adotar medidas para deslocar a mdia para o centro
(valor nominal)
No atende os limites de especificao
Mdia no centro da faixa de especificao
Variabilidade elevada
Adotar medidas para reduzir a variabilidade
No atende os limites de especificao
Mdia deslocada para a esquerda
Variabilidade elevada
Adotar medidas para deslocar a mdia para o centro e
reduzir a variabilidade
Coeficiente de Assimetria
Coeficiente de Assimetria de Pearson
(As)
3.( x ~
x)
As =
s
Curtose
Grau de achatamento (ou
afilamento) de uma
distribuio em relao com a
distribuio normal.
(Q3 Q1 )
C=
2.( P90 P10 )
Distribuio
Normal
Mesocrtica
Leptocrtica
Platicrtica
C=0,263
C<0,263
C>0,263