Você está na página 1de 55

Distribuio de Freqncia

Representao do conjunto de dados


Distribuies de freqncia
Freqncia relativa Freqncia acumulada

Representao Grfica
Histogramas

Organizao dos dados


Os mtodos utilizados para organizar dados compreendem o arranjo desses dados em subconjuntos que apresentem caractersticas similares.
mesma idade (ou faixa etria), mesma finalidade, mesma escola, mesmo bairro, etc

Os dados agrupados podem ser resumidos em tabelas ou grficos e, a partir desses, podemos obter as estatsticas descritivas j definidas: mdia, mediana, desvio, etc. Dados organizados em grupos ou categorias/classes so usualmente designados distribuio de freqncia.

Distribuio de frequncia
Uma distribuio de freqncia um mtodo de se agrupar dados em classes de modo a fornecer a quantidade (e/ou a percentagem) de dados em cada classe

Com isso, podemos resumir e visualizar um conjunto de dados sem precisar levar em conta os valores individuais.

Uma distribuio de freqncia (absoluta ou relativa) pode ser apresentada em tabelas ou grficos

Distribuio de frequncia
Uma distribuio de freqncia agrupa os dados por classes de ocorrncia, resumindo a anlise de conjunto de dados grandes.

Construindo uma distribuio de freqncia


Adotemos o conjunto de dados que represente a populao Ordene em ordem crescente ou decrescente
Eventos Aluno 1 Aluno 2 Aluno 3 Aluno 4 Aluno 5 Aluno 6 Aluno 7 Aluno 8 Aluno 9 Aluno 10 Aluno 11 Aluno 12 Aluno 13 Aluno 14 Aluno 15 Aluno 16 Aluno 17 Aluno 18 Altura 1,60 1,69 1,72 1,73 1,73 1,74 1,75 1,75 1,75 1,75 1,75 1,76 1,78 1,80 1,82 1,82 1,84 1,88

Construindo uma distribuio de freqncia


Determine a Quantidade de classes (k)
Regra de Sturges (Regra do Logaritmo)
k = 1 + 3,3log(n)

Regra da Potncia de 2
k = menor valor interiro tal que 2k n

Regra da Raiz Quadrada

k= n

Bom senso !!!


Decida a quantidade de classes que GARANTA observar como os valores se distribuem.

Construindo uma distribuio de freqncia


Regra de Sturges (Logaritmo)
Quantidade de dados (n) Quantidade de Classes (k)

Regra da Potncia de 2
Quantidade de dados (n) Quantidade de Classes (k)
Quantidade de dados (n)

Bom Senso
Q ua nt ida de M N IM A de C la s s e s ( k ) Q ua nt ida de M X IM A de C la s s e s ( k )

1 2 3a5 6 a 11 12 a 23 24 a 46 47 a 93 94 a 187 188 a 376 377 a 756

1 2 3 4 5 6 7 8 9 10

1e2 3e4 5a8 9 a 16 17 a 32 33 a 64 65 a 128 129 a 256 257 a 512 513 a 1024

1 2 3 4 5 6 7 8 9 10

at 50 51 a 100 101 a 200 201 a 300 301 a 500 mais de 500

5 8 10 12 15 20

10 16 20 24 30 40

Construindo uma distribuio de freqncia


Calcule a amplitude das classes (h)
Calcule a amplitude do conjunto de dados
L = xmx xmn

Calcule a amplitude (largura) da classe


h=L/k Arredonde convenientemente

Calcule os Limites das Classes


1a classe: xmn at xmn + h 2a classe: xmn + h at xmn + 2 . h ........................ ka classe: xmn + (k-1) . h at xmn + k . h

Construindo uma distribuio de freqncia


Limite das classes Utilize a notao:
[x,y) intervalo de entre x (fechado) at y (aberto)

Freqentemente temos que arredondar a amplitude das classes e, conseqentemente, arredondar tambm os limites das classes. Como sugesto, podemos tentar, se possvel, um ajuste simtrico nos limites das classes das pontas (i.e., primeira e ltima) nas quais, usualmente, a quantidade de dados menor.

Ponto mdio das classes xk = Linferior + ( Lsuperior Linferior ) / 2

Construindo uma distribuio de freqncia


Determinao da freqncia das classes
Consiste em agrupar os dados em cada classe e contar os totais

Traar o grfico
Dividir o eixo horizontal em tantas partes quanto for o nmero de classes. Sugesto: deixe espao entre o eixo vertical e a primeira classe. Identifique a maior freqncia da classe na tabela e marque esse nmero (ou outro um pouco maior) na extremidade do eixo vertical; divida esse eixo em algumas partes e marque os valores correspondentes Desenhe um retngulo, para cada classe, com largura igual largura da classe e com altura igual freqncia da classe

Exemplo
Do nosso exemplo:
Ordenamos os dados Por Sturges, temos:
n=18 ; k=5 (nmero de classes)

Amplitude de classes
Amplitude do conjunto de dados: 1,881,60=0,28m Amplitude de classes: 0,28/5=0,056 Arredondado h = 0,06m

Altura 1,60 1,69 1,72 1,73 1,73 1,74 1,75 1,75 1,75 1,75 1,75 1,76 1,78 1,80 1,82 1,82 1,84 1,88

Construindo uma tabela de freqncia


Calcule os Limites de Classe Arredonde os Limites de Classe nos extremos
1,9-1,88=0,02 Distribua o excesso:
1,60-0,01; 1,88+0,01 Aqui sobra 0,02m!
Altura 1,60 1,69 1,72 1,73 1,73 1,74 1,75 1,75 1,75 1,75 1,75 1,76 1,78 1,80 1,82 1,82 1,84 1,88

Ajuste todas as classes


Amplitude Limites inferiores 1,60 1,66 1,72 1,78 1,84 0,06 Limite superior 1,66 1,72 1,78 1,84 1,90

Construindo uma tabela de freqncia


Amplitude

0,06
Frequncia Frequncia Acumulada

Freqncias absolutas
Distribua os eventos ou ocorrncia por suas respectivas classes

Dados

Classe

1,60 1,59-1,65 1,69 1,65-1,71 1,72 1,71-1,77 1,73 1,77-1,83 1,73 1,83-1,89 1,74 1,75 1,75 1,75 1,75 1,75 1,76 1,78 1,80 1,82 1,82 1,84 1,88

Freqncias acumuladas
Some as ocorrncias de dados cumulativamente s classes

Total

1 1 10 4 2 18

1 2 12 16 18

Observao importante:
muito til representar as frequncias em termos percentuais ao total de amostras

Representao Grfica
Amplitude

0,06
Frequncia 1 1 10 4 2 Frequncia Acumulada 1 2 12 16 18

Histograma
Na abscissas, distribua as classes Na ordenada da esquerda, as freqncias absolutas Construa um grfico de barras para as freqncias Construa um grfico de linha para a freqncia acumulada (utilize a escala da direita)

Classe 1,59-1,65 1,65-1,71 1,71-1,77 1,77-1,83 1,83-1,89

Total 12 10 8 6 4 2 0

18 20 15 10 5 0

1,59- 1,65- 1,71- 1,77- 1,831,65 1,71 1,77 1,83 1,89

Distribuio de Freqncia: Histogramas e Polgonos de Freqncia


Uma distribuio de freqncia representada por um grfico de barras denominada histograma Outro grfico de interesse o chamado polgono de freqncia O polgono de freqncia obtido unindo-se os pontos mdios da parte superior de cada retngulo do histograma com segmentos de reta importante notar que tanto o histograma quanto o polgono de freqncia indicam a freqncia absoluta de cada classe

Distribuio de Freqncia: Histogramas e Polgonos de Freqncia


Digamos que temos histogramas para as alturas dos estudantes de duas turmas diferentes, traados de acordo com as regras descritas at agora

Poderamos sobrepor os desenhos para fazer uma anlise comparativa das turmas?

Que cuidados devemos tomar?

Distribuio de Freqncia: Histogramas e Polgonos de Freqncia


O problema com esta regra de construo que o histograma construdo especfico para o conjunto em anlise Para fazermos anlises comparativas de conjuntos de dados diferentes, as classes devem ser as mesmas! Devemos, ento, utilizar algum conhecimento prvio da rea em estudo para definir o intervalo aceitvel de variao dos dados e, a partir da, definir as classes Essas classes genricas serviro para o estudo de quaisquer conjunto de dados e permitiro anlises comparativas

Distribuio de Freqncia: Histogramas e Polgonos de Freqncia


Em um histograma, as classes devem SEMPRE ter a mesma largura? No necessariamente! Existem casos em que mais adequado agrupar os dados em classes com larguras desiguais. O exemplo tpico a classificao de pessoas por faixas etrias (infantil, juvenil, adulto, snior, etc). Essas faixas no tm a mesma largura.

Distribuio de Freqncia: Histogramas com Classes de Larguras Desiguais


A representao grfica dos dados em um histograma com classes de larguras desiguais requer a transformao dos valores de freqncia absoluta em densidade de freqncia. Isso fundamental pois devemos manter a rea dos retngulos proporcionais freqncia da classe A densidade de freqncia dada por:

densidade de freqncia

freqncia da classe largura da classe

Distribuio de Freqncia: Histogramas com Classes de Larguras Desiguais


Isso significa que a altura das barras (i.e., os valores na escala do eixo vertical) NO representam a freqncia da classe, mas sim a densidade de freqncia. Para calcularmos a freqncia da classe devemos multiplicar a densidade (indicada no eixo vertical) pela largura respectiva

Outros Grficos
Amplitude

0,05
Frequncia 1 1 10 4 2 Frequncia Relativa (%) 6% 6% 56% 22% 11%

Classe 1,59-1,65 1,65-1,71 1,71-1,77 1,77-1,83 1,83-1,89

Grfico de Pizza

Total

18 Frequncia Relativa (%)

11%

6% 6%

1,59-1,65
22%

1,65-1,71 1,71-1,77 1,77-1,83


55%

1,83-1,89

Outros Grficos
Classe 1,71-1,77 1,77-1,83 1,83-1,89 1,65-1,71 1,59-1,65 Frequncia 10 4 2 1 1 Frequncia Relativa(%) 56% 22% 11% 6% 6% Frequncia Acumulada 10 14 16 17 18 Frequncia Acumulada(%) 56% 78% 89% 94% 100%

Total 120% 100% 80% 60% 40% 20% 0%

18

89% 56% 78% 94% 100%

Grfico de Pareto

1,71-1,77 1,77-1,83 1,83-1,89 1,65-1,71

Outros Grficos
Classe de Altura (m) Freqncia 1.55 [--- 1.63 1.63 [--- 1.71 1.71 [--- 1.79 1.79 [--- 1.87 1.87 [--- 1.96 2 12 22 13 2
Freq. Acumulada

2 14 36 49 51

OGIVA DE GALTON

Distribuio Acumulada
60

60 50 40 30 20 10 0
1.55 [--- 1.63 [--- 1.71 [--- 1.79 [--- 1.87 [--1.63 1.71 1.79 1.87 1.96

Freq:uncia acumulada

50 40 30 20 10 0 1.55 [--1.63 1.63 [--1.71 1.71 [--1.79 1.79 [--1.87 1.87 [--1.96 Series2 Series1 Series3

Freqncia

Seqncia1 Seqncia2 Seqncia3 Seqncia4

Classes de alturas (m)

Classes de alturas (m)

Mdia Ponderada: Mdia de uma tabela de freqncia


Quando os dados esto resumidos em uma tabela de freqncias, podemos calcular aproximadamente a mdia aritmtica ponderando sobre:
Pontos mdios de cada intervalo supe-se que todos os elementos das classes ocorrem no ponto mdio das respectivas classes; Exemplo: temos 7 ocorrncias na faixa entre 1,75 e 1,79. Consideramos que as sete ocorrncias equivalem a (1,79+1,75)/2=1,77 ponto mdio da classe.

Mdia Ponderada: Mdia de uma tabela de freqncia

( f .x) x= f
x = ponto mdio da classe f = freqncia f = n

Mdia Ponderada
A mdia ponderada considerada ponderada quando os valores dos conjuntos tiverem pesos / freqncias diferentes Numa distribuio utilizando os valores discretos, calcula-se:
Erros por pginas
0 1 2 3 4

No de paginas
25 20 3 1 1

x. f x. f x= = n f
(0 25) + (1 20) + (2 3) + (3 1) + (4 1) 33 = = 0,66 x= (25 + 20 + 3 + 1 + 1) 50

Mdia Ponderada
Quando tivermos uma distribuio com dados agrupados por classes de valores, calculamos considerando o valor de cada classe como o ponto mdio respectivo da classe.
Frequncia Alturas de Ponto Pessoas Mdio (Xi) (fi)
1,59-1,65 1,65-1,71 1,71-1,77 1,77-1,83 1,83-1,89 1,62 1,68 1,74 1,80 1,86

xi.fi
1,62 1,68 17,4 7,2 3,72 31,62

Total

1 1 10 4 2 18

x. f x. f x= = n f

31,62 x= = 1,76 18

Clculo da Moda para dados Agrupados


Caso 1: dados agrupados por valores discretos moda o valor com maior freqncia. Caso 2: dados agrupados por classes
Moda Bruta Mtodo de King Mtodo de Czuber Mtodo de Pearson

Clculo da Moda para dados Agrupados: Moda Bruta


Moda Bruta
Tome a classe que apresenta a maior freqncia classe modal A moda ser o ponto mdio da classe modal: (liminf + limsup)/2

Clculo da Moda para dados Agrupados: King


Mtodo de King:

M o = liminf +
Onde

f post f ant + f post

Liminf: limite inferior da classe modal fant: freqncia da classe anterior modal fpost: freqncia da classe posterior modal h: amplitude da classe modal

Clculo da Moda para dados Agrupados: Czuber


Mtodo de Czuber (mais preciso):

f Mo f ant M o = liminf + h f Mo ( f ant + f post )


Onde
Liminf: limite inferior da classe modal fMo: freqncia da classe modal fant: freqncia da classe anterior modal fpost: freqncia da classe posterior modal h: amplitude da classe modal

Clculo da Moda para dados Agrupados: Pearson


Mtodo de Pearson:

M o = 3M d 2 X
Onde
Md: Mediana X : Mdia

Clculo da Mediana para dados Agrupados


Dados agrupados por classes
Mediana o valor localizado a Lx=n/2 Aps clculo de Lx, determina-se o valor da mediana por: ~
X = Liminf +

Onde:

h.(L x Fant ) fi

Lx Localizao (posio) da Mediana Fant freqncia acumulada at a classe anterior classe da mediana fi freqncia absoluta da classe da mediana h amplitude de classe Liminf Limite inferior da classe da mediana

Clculo dos Percentis para dados Agrupados por Classes


O percentil o valor localizado a LPx=(K/100)*n
Onde K o percentil desejado (ex.: P45 K=45)

Aps clculo de LPx, determina-se o valor do percentil por:


Px = Liminf +

Onde:

h.(L P x Fant ) fi

LPx Localizao (posio) do Percentil Fant freqncia acumulada at a classe anterior classe do percentil fi freqncia absoluta da classe do percentil h amplitude de classe Liminf Limite inferior da classe do percentil

Medidas de Posio Dados Agrupados: Mediana / Separatrizes (alternativo)


Para definirmos um procedimento alternativo de clculo da mediana e quaisquer outras separatrizes, utilizaremos o exemplo abaixo:

Medidas de Posio Dados Agrupados: Mediana / Separatrizes (alternativo)


Encontra-se a classe onde est a mediana. Faz-se, ento, a proporcionalidade entre a rea e a base do retngulo hachurado e o que define a classe onde est a mediana

12,008,00 Md 8,00 = 33% 22%


16,00

Md = 10,67

Medidas de Posio Dados Agrupados: Mediana / Separatrizes (alternativo)


Encontra-se a classe onde est Q3. Faz-se, ento, a proporcionalidade entre a rea e a base do retngulo hachurado e o que define a classe de Q3

Q3 12,00 16,00 12,00 = 22% 14%


16,00

Q3 = 15,82

Mtodo Alternativo
A regra de trs gera precisamente o mesmo resultado na aplicao da equao para clculo dos percentis para dados agrupados. Seno vejamos:

Lsup Linf pi

Lsup Linf Px Linf Px Linf = = fi p px pacm f px f acm ) ( n n Px Linf = f px f acm fi = Linf + h ( f px f acm ) fi

Lsup Linf fi

Px =

Linf + ( Lsup Linf )( f px f acm )

Mtodo Alternativo
Onde:
Lsup = limite superior classe do percentil Linf = limite inferior classe do percentil Px = valor do percentil procurado pi = percentual representativo da classe do percentil ppx = percentil procurado pacm = percentual acumulado at a classe anterior classe do percentil fi = frequncia da classe do percentil n = tamanho da amostra fpx = posio do percentil procurado facm = frequncia acumulada at a classe anterior classe do percentil

Medidas de Disperso (Dados Agrupados)


O desvio-padro, nesse caso, faz uma ponderao da distncia dos pontos mdios de cada classe para a mdia, e a respectiva freqncia de valores:

s=

x j x) f j (~
k j =1

n 1

(amostra)

2 ~ ( ) f x j j k j =1

(populao )

Desvio padro de dados agrupados


s= n[ ( f .x )] [ ( f .x)]
2 2

n(n 1)

Desvio padro para uma tabela de freqncias x = ponto mdio da classe f = frequncia da classe n = tamanho da amostra (ou f = soma das frequncias)

Assimetria
Comparando a mdia, a moda e a mediana, podemos concluir pela assimetria da distribuio:
Assimetria: no simetria distribuio tende mais para um lado

Dados negativamente assimtricos (assimetria para a esquerda)


Mdia e mediana esquerda da moda Em geral, mdia esquerda da mediana

Dados positivamente assimtricos (assimetria para a direita)


Mdia e mediana direita da moda Em geral, mdia direita da mediana

Assimetria

mdia

mediana

moda

Mdia = moda = mediana

Assimtrica esquerda

Simtrica

x<~ x < Mo
moda mdia mediana

x=~ x = Mo

x>~ x > Mo

Assimtrica direita

Interpretando Histogramas
Histograma uma ferramenta estatstica que permite resumir informaes de um conjunto de dados, visualizando a forma da distribuio desses dados, a localizao do valor central e a disperso dos dados em torno do valor central Ou seja, em anlises de processos produtivos, freqentemente obtemos informaes teis sobre a populao/amostra de dados coletados pela anlise da forma do histograma

Simtrico ou em Forma de Sino


O valor mdio est localizado no centro do histograma A freqncia mais alta no meio e diminui gradualmente na direo dos extremos Ocorre quando no existem restries aos valores que a varivel de controle pode assumir Processo geralmente sob controle, somente causas comuns esto presentes Processo usualmente est estvel

Assimtrico
O valor mdio est localizado fora do centro do histograma A freqncia diminui gradativamente em um dos lados e de modo um tanto abrupto do outro lado Ocorre quando no possvel que a varivel de controle assuma valores mais altos (ou mais baixos) Processo em que o limite inferior (superior) controlado (apenas um limite de especificao) Por exemplo, teoricamente impossvel valores inferiores 0% para a varivel impureza

Despinhadeiro
O valor mdio est localizado fora do centro do histograma A freqncia diminui abruptamente de um dos lados e suavemente em direo ao outro Processo no atende s especificaes e uma inspeo 100% realizada para eliminar produtos defeituosos

Ilhas Isoladas ou Pico Isolado


Parte do grfico relativamente simtrica com o acrscimo de algumas classes mais afastadas de menores freqncias Ocorre quando dados de outra distribuio, diferente da distribuio da maior parte das medidas, so includos Processo com anormalidades, ou erro de medio e/ou registro de dados, ou incluso de dados de um processo diferente

Bimodal ou com Dois Picos


A freqncia mais baixa no centro do histograma e existe um pico em cada lado Ocorre quando dados de duas distribuies, com mdias muito diferentes, so misturados Os valores da varivel de controle devem estar associados a duas mquinas ou dois turnos distintos, por exemplo

Achatado ou Plat
Todas as classes possuem mais ou menos a mesma freqncia, exceto aquelas das extremidades Ocorre quando dados de duas distribuies, com mdias no muito diferentes, so misturados Os valores da varivel de controle devem estar associados a nveis distintos de algum (ou alguns) dos fatores que constituem o processo em anlise

Histogramas e Limites de Especificao de Processos


Atende, com folga, os limites de especificao Mdia no centro da faixa de especificao Variabilidade aceitvel Manter a situao atual

Especificao atendida sem nenhuma margem extra Mdia no centro da faixa de especificao Variabilidade um pouco elevada Adotar medidas para reduzir um pouco a variabilidade

Histogramas e Limites de Especificao de Processos


No atende os limites de especificao Mdia deslocada para a esquerda Variabilidade aceitvel Adotar medidas para deslocar a mdia para o centro (valor nominal) No atende os limites de especificao Mdia no centro da faixa de especificao Variabilidade elevada Adotar medidas para reduzir a variabilidade No atende os limites de especificao Mdia deslocada para a esquerda Variabilidade elevada Adotar medidas para deslocar a mdia para o centro e reduzir a variabilidade

Coeficiente de Assimetria
Coeficiente de Assimetria de Pearson (As) 3.( x ~ x) As = s

Permite comparar duas ou mais distribuies diferentes e avaliar qual mais assimtrica. Quanto maior o Coeficiente de Assimetria de Pearson, mais assimtrica curva.

Assimtrica moderada: 0,15<|As|<1 Assimtrica forte: |As|>1

Curtose
Grau de achatamento (ou afilamento) de uma distribuio em relao com a distribuio normal.
Distribuio Normal

C=

(Q3 Q1 ) 2.( P90 P 10 )

Mesocrtica C=0,263 Leptocrtica C<0,263 Platicrtica C>0,263

Você também pode gostar