Escolar Documentos
Profissional Documentos
Cultura Documentos
Histograma e Distribuicao de Frequencia
Histograma e Distribuicao de Frequencia
Distribuies de freqncia
Freqncia relativa Freqncia acumulada
Representao Grfica
Histogramas
Os dados agrupados podem ser resumidos em tabelas ou grficos e, a partir desses, podemos obter as estatsticas descritivas j definidas: mdia, mediana, desvio, etc. Dados organizados em grupos ou categorias / classes so usualmente designados distribuio de freqncia.
Distribuio de frequncia
Uma distribuio de freqncia um mtodo de se agrupar dados em classes de modo a fornecer a quantidade (e/ou a percentagem) de dados em cada classe
Com isso, podemos resumir e visualizar um conjunto de dados sem precisar levar em conta os valores individuais.
Uma distribuio de freqncia (absoluta ou relativa) pode ser apresentada em tabelas ou grficos
Distribuio de frequncia
Uma distribuio de freqncia agrupa os dados por classes de ocorrncia, resumindo a anlise de conjunto de dados grandes.
Construindo uma distribuio de freqncia Adotemos o conjunto de dados que represente a populao Ordene em ordem crescente ou decrescente
Eventos Aluno 1 Aluno 2 Aluno 3 Aluno 4 Aluno 5 Aluno 6 Aluno 7 Aluno 8 Aluno 9 Aluno 10 Aluno 11 Aluno 12 Aluno 13 Aluno 14 Aluno 15 Aluno 16 Aluno 17 Aluno 18 Altura 1,60 1,69 1,72 1,73 1,73 1,74 1,75 1,75 1,75 1,75 1,75 1,76 1,78 1,80 1,82 1,82 1,84 1,88
Regra da Potncia de 2
k = menor valor interiro tal que 2k n
k= n
Regra da Potncia de 2
Quantidade de dados (n) Quantidade de Classes (k)
Quantidade de dados (n)
Bom Senso
Q ua nt ida de M N IM A de C la s s e s ( k ) Q ua nt ida de M X IM A de C la s s e s ( k )
1 2 3 4 5 6 7 8 9 10
1e2 3e4 5a8 9 a 16 17 a 32 33 a 64 65 a 128 129 a 256 257 a 512 513 a 1024
1 2 3 4 5 6 7 8 9 10
5 8 10 12 15 20
10 16 20 24 30 40
Freqentemente temos que arredondar a amplitude das classes e, conseqentemente, arredondar tambm os limites das classes. Como sugesto, podemos tentar, se possvel, um ajuste simtrico nos limites das classes das pontas (i.e., primeira e ltima) nas quais, usualmente, a quantidade de dados menor.
Traar o grfico
Dividir o eixo horizontal em tantas partes quanto for o nmero de classes. Sugesto: deixe espao entre o eixo vertical e a primeira classe. Identifique a maior freqncia da classe na tabela e marque esse nmero (ou outro um pouco maior) na extremidade do eixo vertical; divida esse eixo em algumas partes e marque os valores correspondentes Desenhe um retngulo, para cada classe, com largura igual largura da classe e com altura igual freqncia da classe
Exemplo
Do nosso exemplo:
Ordenamos os dados Por Sturges, temos:
n=18 ; k=5 (nmero de classes)
Amplitude de classes
Amplitude do conjunto de dados: 1,881,60=0,28m Amplitude de classes: 0,28/5=0,056 Arredondado h = 0,06m
Altura 1,60 1,69 1,72 1,73 1,73 1,74 1,75 1,75 1,75 1,75 1,75 1,76 1,78 1,80 1,82 1,82 1,84 1,88
Construindo uma tabela de freqncia Altura Calcule os Limites de Amplitude 0,06 Classe Limites Limite
inferiores 1,60 1,66 1,72 1,78 1,84 superior 1,66 1,72 1,78 1,84 1,90
1,60 1,69 1,72 1,73 1,73 1,74 1,75 1,75 1,75 1,75 1,75 1,76 1,78 1,80 1,82 1,82 1,84 1,88
0,06
Frequncia Frequncia Acumulada
Freqncias absolutas
Distribua os eventos ou ocorrncia por suas respectivas classes
Dados
Classe
1,60 1,59-1,65 1,69 1,65-1,71 1,72 1,71-1,77 1,73 1,77-1,83 1,73 1,83-1,89 1,74 1,75 1,75 1,75 1,75 1,75 1,76 1,78 1,80 1,82 1,82 1,84 1,88
Freqncias acumuladas
Some as ocorrncias de dados cumulativamente s classes
Total
1 1 10 4 2 18
1 2 12 16 18
Observao importante:
muito til representar as frequncias em termos percentuais ao total de amostras
Representao Grfica
Amplitude
0,06
Frequncia 1 1 10 4 2 Frequncia Acumulada 1 2 12 16 18
Histograma
Na abscissas, distribua as classes Na ordenada da esquerda, as freqncias absolutas Construa um grfico de barras para as freqncias Construa um grfico de linha para a freqncia acumulada (utilize a escala da direita)
Total 12 10 8 6 4 2 0
18 20 15 10 5 0
Poderamos sobrepor os desenhos para fazer uma anlise comparativa das turmas?
densidade de freqncia
Outros Grficos
Amplitude
0,05
Frequncia 1 1 10 4 2 Frequncia Relativa (%) 6% 6% 56% 22% 11%
Grfico de Pizza
Total
11%
6% 6%
1,59-1,65
22%
1,83-1,89
Outros Grficos
Classe 1,71-1,77 1,77-1,83 1,83-1,89 1,65-1,71 1,59-1,65 Frequncia 10 4 2 1 1 Frequncia Relativa(%) 56% 22% 11% 6% 6% Frequncia Acumulada 10 14 16 17 18 Frequncia Acumulada(%) 56% 78% 89% 94% 100%
18
Grfico de Pareto
Outros Grficos
Classe de Altura (m) Freqncia 1.55 [--- 1.63 1.63 [--- 1.71 1.71 [--- 1.79 1.79 [--- 1.87 1.87 [--- 1.96 2 12 22 13 2
Freq. Acumulada
2 14 36 49 51
OGIVA DE GALTON
Distribuio Acumulada
60
60 50 40 30 20 10 0
1.55 [--- 1.63 [--- 1.71 [--- 1.79 [--- 1.87 [--1.63 1.71 1.79 1.87 1.96
Freq:uncia acumulada
50 40 30 20 10 0 1.55 [--1.63 1.63 [--1.71 1.71 [--1.79 1.79 [--1.87 1.87 [--1.96 Series2 Series1 Series3
Freqncia
Mdia Ponderada: Mdia de uma tabela de freqncia Quando os dados esto resumidos em uma tabela de freqncias, podemos calcular aproximadamente a mdia aritmtica ponderando sobre:
Pontos mdios de cada intervalo supe-se que todos os elementos das classes ocorrem no ponto mdio das respectivas classes; Exemplo: temos 7 ocorrncias na faixa entre 1,75 e 1,79. Consideramos que as sete ocorrncias equivalem a (1,79+1,75)/2=1,77 ponto mdio da classe.
( f .x ) x= f
x = ponto mdio da classe f = freqncia f = n
Mdia Ponderada
A mdia ponderada considerada ponderada quando os valores dos conjuntos tiverem pesos / freqncias diferentes Numa distribuio utilizando os valores discretos, calcula-se:
Erros por pginas
0 1 2 3 4
No de paginas
25 20 3 1 1
x. f x. f x= = n f
(0 25) + (1 20) + (2 3) + (3 1) + (4 1) 33 = = 0,66 x= (25 + 20 + 3 + 1 + 1) 50
Mdia Ponderada
Quando tivermos uma distribuio com dados agrupados por classes de valores, calculamos considerando o valor de cada classe como o ponto mdio respectivo da classe.
Frequncia Alturas de Ponto Pessoas Mdio (Xi) (fi)
1,59-1,65 1,65-1,71 1,71-1,77 1,77-1,83 1,83-1,89 1,62 1,68 1,74 1,80 1,86
xi.fi
1,62 1,68 17,4 7,2 3,72 31,62
Total
1 1 10 4 2 18
x. f x. f x= = n f
31,62 x= = 1,76 18
Clculo da Moda para dados Agrupados Caso 1: dados agrupados por valores discretos moda o valor com maior freqncia. Caso 2: dados agrupados por classes
Moda Bruta Mtodo de King Mtodo de Czuber Mtodo de Pearson
Moda Bruta
Tome a classe que apresenta a maior freqncia classe modal A moda ser o ponto mdio da classe modal: (liminf + limsup)/2
Mtodo de King:
M o = lim inf + f post f ant + f post h
Onde
Liminf: limite inferior da classe modal fant: freqncia da classe anterior modal fpost: freqncia da classe posterior modal h: amplitude da classe modal
Clculo da Moda para dados Agrupados: Czuber Mtodo de Czuber (mais preciso):
f Mo f ant M o = lim inf + h f Mo ( f ant + f post )
Onde
Liminf: limite inferior da classe modal fMo: freqncia da classe modal fant: freqncia da classe anterior modal fpost: freqncia da classe posterior modal h: amplitude da classe modal
Mtodo de Pearson:
M o = 3M d 2 X
Onde
Md: Mediana X : Mdia
Onde:
h.(L x Fant ) fi
Lx Localizao (posio) da Mediana Fant freqncia acumulada at a classe anterior classe da mediana fi freqncia absoluta da classe da mediana h amplitude de classe Liminf Limite inferior da classe da mediana
LPx Localizao (posio) do Percentil Fant freqncia acumulada at a classe anterior classe do percentil fi freqncia absoluta da classe do percentil h amplitude de classe Liminf Limite inferior da classe do percentil
Md = 10,67
Q3 = 15,82
s=
j =1
f j (~ xj x) n 1
(amostra)
j =1
2 f j (~ xj )
(populao )
s=
n(n 1)
Desvio padro para uma tabela de freqncias x = ponto mdio da classe f = frequncia da classe n = tamanho da amostra (ou f = soma das frequncias)
Assimetria
Comparando a mdia, a moda e a mediana, podemos concluir pela assimetria da distribuio:
Assimetria: no simetria distribuio tende mais para um lado
Assimetria
mdia
mediana
moda
Assimtrica esquerda
Simtrica
x<~ x < Mo
moda mdia mediana
x=~ x = Mo
x>~ x > Mo
Assimtrica direita
Interpretando Histogramas
Histograma uma ferramenta estatstica que permite resumir informaes de um conjunto de dados, visualizando a forma da distribuio desses dados, a localizao do valor central e a disperso dos dados em torno do valor central Ou seja, em anlises de processos produtivos, freqentemente obtemos informaes teis sobre a populao/amostra de dados coletados pela anlise da forma do histograma
Assimtrico
O valor mdio est localizado fora do centro do histograma A freqncia diminui gradativamente em um dos lados e de modo um tanto abrupto do outro lado Ocorre quando no possvel que a varivel de controle assuma valores mais altos (ou mais baixos) Processo em que o limite inferior (superior) controlado (apenas um limite de especificao) Por exemplo, teoricamente impossvel valores inferiores 0% para a varivel impureza
Despinhadeiro
O valor mdio est localizado fora do centro do histograma A freqncia diminui abruptamente de um dos lados e suavemente em direo ao outro Processo no atende s especificaes e uma inspeo 100% realizada para eliminar produtos defeituosos
Achatado ou Plat
Todas as classes possuem mais ou menos a mesma freqncia, exceto aquelas das extremidades Ocorre quando dados de duas distribuies, com mdias no muito diferentes, so misturados Os valores da varivel de controle devem estar associados a nveis distintos de algum (ou alguns) dos fatores que constituem o processo em anlise
Especificao atendida sem nenhuma margem extra Mdia no centro da faixa de especificao Variabilidade um pouco elevada Adotar medidas para reduzir um pouco a variabilidade
Coeficiente de Assimetria
Coeficiente de Assimetria de Pearson (As) 3.( x ~ x) As = s
Permite comparar duas ou mais distribuies diferentes e avaliar qual mais assimtrica. Quanto maior o Coeficiente de Assimetria de Pearson, mais assimtrica curva.
Curtose
Grau de achatamento (ou afilamento) de uma distribuio em relao com a distribuio normal.
Distribuio Normal