Você está na página 1de 41

Distribuições de freqüência e

seus gráficos
Professor:
Renaldo Antonio Gonsalves
Anotações para Aula
A subjetividade para estabelecer o
número de classes
• Não há uma regra objetiva para estabelecer o
número de classes para se fazer um estudo.
• O número de classes está ligado as
características do fenômeno analisado – por
exemplo, um estudo do perfil da sociedade no
Brasil necessita de um número maior de classes
pois a distribuição da renda é muito desigual.
• As classes que definem o desempenho dos
alunos de uma escola particular, cujo os alunos
tenham características semelhantes, pode ser
pequena.
A subjetividade para estabelecer o
número de classes
• No caso de um estudo do perfil da sociedade no
Brasil necessita de um número maior de
classes.
Exemplo: Sem Renda (e); Baixa (d); Nova Média
(c); Média (b) e Alta (a).
• O desempenho dos alunos de uma escola com
alunos que tenham características semelhantes.
Exemplo: Notas baixas (c); Médias (b) e Altas (a).
Distribuições de freqüência
Salários no comércioVarejista.

102 124 108 86 103 82


71 104 112 118 87 95
103 116 85 122 87 100
105 97 107 67 78 125
109 99 105 99 101 92
Quantas classes usaremos?
Faremos uma tabela de distribuição de freqüência com
cinco classes.
Valor mínimo = 67
Valores-chave: Valor máximo = 125
Desvio padrão 14,72
Média 99,63
Coeficiente de Variação 14,78%
Passos para construir uma
distribuição de freqüência
1. Decida o número de classes, que deve ficar entre 2 e 15.
(Para o problema proposto usaremos 5.)
2. Calcule a amplitude das classes.
Primeiro calcule: amplitude total = valor máximo – mínimo. Em
seguida, divida o resultado pelo número de classes. Por fim,
arredonde até o próximo número conveniente. (125 – 67)/5 = 11,6
(arredondado para 12)
3. Calcule os limites das classes.
O limite inferior da classe é o valor mais baixo que pertence a ela e o
limite superior é o mais alto. Use o valor mínimo (67) como limite
inferior da primeira classe.

4. Marque um risco | em cada entrada de dado na classe apropriada.

Quando todos os valores estiverem marcados, conte os riscos em


cada classe para determinar a freqüência dessa classe.
Dados Ordenados

67 97 105
71 99 107
78 99 108
82 100 109
85 101 112
86 102 116
87 103 118
87 103 122
92 104 124
95 105 125
Construa uma distribuição de freqüência
Mínimo = 67, Máximo = 125
Número de classes = 5
Amplitude de classe = 12

Classe Limites Riscos


67 78 3

79 90 5

91 102 8

103 114 9

115 126 5
Faça primeiro todos os limites inferiores.
Histograma de freqüência
Classe Fronteiras
67–78 3 66,5–78,5
79–90 5 78,5–90,5
91–102 8 90,5–102,5 Salários
9
9

103–114 9 102,5–114,5 8
8
7

115–126 5 114,5–126,5 6
5 5
5
4

3
3
2
1
0
66,5 78,5 90,5 102,5 114,5 126,5
Salários
Polígono de freqüência
Notação para estabelecer os limites dos intervalos
Classe
Salários
67 |–78 3
9 9
78 |–90 5 8 8
7
90 |–102 8 6
5 5 5
102 |–114 9
4
114 |–126 3
5 3
2
1
0
72,5 84,5 96,5 108,5 120,5
Salários
Marque o ponto médio no topo de cada barra. Conecte os pontos
médios consecutivos. Estenda o polígono até os eixos.
Outras informações
Ponto médio: (limite inferior + limite superior)/2
Freqüência relativa: freqüência da classe/freqüência total
Freqüência cumulativa: número de valores em determinada classe ou
abaixo dela
Ponto
Classe Freqüência relativa Freqüência
médio cumulativa
(67 + 78)/2 3/30
67–78 3 72,5 0,10 3
79–90 5 84,5 0,17 8
91–102 8 96,5 0,27 16
103–114 9 108,5 0,30 25
115–126 5 120,5 0,17 30
Histograma de freqüência relativa

Salários

Freqüência relativa
0,30
0,30 0,27

0,20 0,17 0,17

0,10
0,10

0
66,5 78,5 90,5 102,5 114,5 126,5

Salários

A escala vertical mede as freqüências


relativas.
Aspecto das distribuições
Simétrica Uniforme

Média = Mediana

Assimétrica à Direita ou Assimétrica à Esquerda ou


Assintótica à esquerda Assintótica à Direita

Média > Mediana Média < Mediana


Gráfico de freqüência cumulativa (ogiva)

Um gráfico de freqüência cumulativa (ou ogiva) mostra o


número de valores, em um conjunto de dados, que são
iguais ou inferiores a um dado valor x.

Freqüência cumulativa
Salários
30
30
25

20
16

10 8

3
0
0
66,5 78,5 90,5 102,5 114,5 126,5

Salários
Cuidados para construção das
tabelas:
• Os intervalos de classe, não devem se sobrepor
– p. ex. as variáveis discretas só permitem
acréscimos unitários – consumo de cigarros por
dia: 0 cigarros: de 0 – 1: de 2 – 4; de 5 – 10:
Mais de 10.
• Os intervalos devem ser do mesmo tamanho.
• Os intervalos devem ser uma combinação entre
a quantidade para descrever detalhes e a
facilidade de leitura dos dados. O número
mínimo de intervalo é 3 e o recomendado para o
máximo é 15.
Gráficos e Representações
Plote tronco-e-folhas
Se o valor mais baixo é 67 e o mais alto é 125, o tronco
vai de 6 a 12.

102 124 108 86 103 82

Tronco Folhas
6|
7|
8| 6 2
9|
10 | 2 8 3
Para ver a
11 |
representação
12 | 4
completa, avance
até o próximo slide.
Plote tronco-e-folhas

6 |7 Chave: 6|7 significa 67


7 |18
8 |25677
9 |25799
10 | 0 1 2 3 3 4 5 5 7 8 9
11 | 2 6 8
12 | 2 4 5
Plote tronco-e-folhas
com duas linhas por tronco
Chave: 6|7 significa 67 6|7
7|1
7|8
Dígitos da 1a linha 0 1 2 3 4 8|2
Dígitos da 2a linha 5 6 7 8 9 8|5677
9|2
9|5799
10 | 0 1 2 3 3 4
10 | 5 5 7 8 9
Dígitos da 1a linha 0 1 2 3 4 11 | 2
Dígitos da 2a linha 5 6 7 8 9 11 | 6 8
12 | 2 4
12 | 5
Plote de pontos

Preços de Blusas

66 76 86 96 106 116 126


Preços
Diagrama de pizza
• É usado para descrever as partes de um todo.
• O ângulo central para cada segmento é:
Número na categoria
Número total

O orçamento do Ministério da Educação


(em bilhões de Reais) dividido em três
categorias Bilhões de R$
Ensino do 3o Grau 5,7
Ensino do 2o Grau 5,9
Ensino do 1o Grau 2,7
Construa um diagrama de pizza para esses dados.
Diagrama de pizza
Vôo espacial humano Bilhões de US$ Graus
5,7 143
Tecnologia 149
5,9
Apoio às missões 2,7 68
Total 14,3 360
Apoio às
missões 5,7
19%
14,3
5,9
14,3
Vôo espacial
humano
40%
Orçamento da Nasa
Tecnologia (em bilhões de dólares)
41%
Mapa de dispersão
Nota
Faltas final
x y
8 78
2 92
5 90
Nota final 12 58
(y) 95
90 15 43
85
80 9 74
75
70 6 81
65
60
55
50
45
40
0 2 4 6 8 10 12 14 16
Faltas (x)
MEDIDAS DE ASSIMETRIA
E CURTOSE

Estatística
MEDIDAS DE ASSIMETRIA
E CURTOSE
As medidas de assimetria e curtose proporcionam,
juntamente com as medidas de posição e dispersão, a
descrição e compreensão completas da distribuição de
freqüências estudadas.

As distribuições de freqüências não só diferem quanto


ao valor médio e a variabilidade, como também quanto
a sua forma.
As medidas de assimetria referem-se à forma da curva
de uma distribuição de freqüências, mais
especificamente permitem fazer inferências sobre o
polígono de freqüência ou do histograma.
MEDIDAS DE ASSIMETRIA
E CURTOSE
Simetria: uma distribuição de freqüência é simétrica
quando a média, mediana e moda são iguais, ou seja,
apresentam um mesmo valor, ou ainda, coincidem
num mesmo ponto.

Assimetria: quando a média, mediana e a moda recaem


em pontos diferentes da distribuição, isto é, apresentam
valores diferentes, sendo que o deslocamento desses
pontos podem ser para a direita ou para a esquerda.
Quanto ao grau de deformação, as curvas de freqüência
podem ser:

1 – Simétrica
2 – Assimétrica Positiva
3 – Assimétrica Negativa
MEDIDAS DE ASSIMETRIA E CURTOSE

Distribuição de Freqüências Simétrica:


Neste caso, a média aritmética será igual à mediana, e
esta, por sua vez, igual à moda.
_
X = Me = Mo
MEDIDAS DE ASSIMETRIA E CURTOSE

Curva ou Distribuição de Freqüências Assimétrica Positiva:


Neste caso, a média aritmética apresentará um valor maior do que a
mediana, e esta, por sua vez, apresentará um valor maior do que a
moda. Assim:.
_
Mo < Me < X
• A cauda é mais alongada à
direita da ordenada máxima
(ordenada correspondente à
moda).
• Nas distribuições
assimétricas à direita, há
uma predominância de
valores superiores a moda.
MEDIDAS DE ASSIMETRIA E CURTOSE
Curva ou Distribuição de Freqüências Assimétrica
Negativa :
Neste caso, a média aritmética apresentará um valor
menor do que a mediana, e esta, por sua vez,
apresentará um valor menor do que a moda. Assim:.

_
Mo > Me > X

• A cauda é mais alongada à


esquerda da ordenada
máxima (ordenada
correspondente à moda).
• Nas distribuições
assimétricas à esquerda, há
uma predominância de
valores superiores a moda.
Método de Comparação entre Medidas de Tendência Central

Trata-se de um método rudimentar, que não permite


estabelecer até que ponto a curva analisada se desvia
da simetria. Nesta comparação simples temos:

x > Mo  Assimetria Positiva


x = Mo  Simetria
x < Mo  Assimetria Negativa
Método de Comparação entre Medidas de Tendência Central

Podemos usar alguns coeficientes para medir a


simetria das distribuições:

Coeficiente de Pearson:

3 (média  mediana)
Coef . de Pearson
Desvio Padrão

Coeficiente de Pearson: A multiplicação da diferença entre a média e a


mediana por 3, e a divisão pelo desvio padrão geram resultados que
ficam entre +3 e -3. O resultado 0 (zero) indica simetria.
Método de Comparação entre Medidas de Tendência Central

Podemos usar alguns coeficientes para medir a


simetria das distribuições:

Coeficiente de Bowley:

2 (Q3  Q1  2(mediana))
Coef . Bowley 
Q3  Q1
Coeficiente de Bowley: o resultado deste teste varia no intervalo
entre +2 e -2. O resultado 0 (zero) indica simetria.
Método de Comparação entre Medidas de Tendência Central

Podemos usar alguns coeficientes para medir a


simetria das distribuições:
Terceiro Momento:

__

 i
( X  X ) 3

3o Momento n
s3
1) O cálculo do terceiro momento pode resultar em valores
grandes (positivos e negativos), no entanto o 0 (zero) indica
simetria.
Regra Empírica (68-95-99,7%)
Dados com distribuição simétrica na forma de sino têm as seguintes
características.

13,5% 13,5%

2,35% 2,35%

–4 –3 –2 –1 0 1 2 3 4

Cerca de 68% dos dados estão a até 1 desvio padrão da média.

Cerca de 95% dos dados estão a até 2 desvios padrão da média.

Cerca de 99,7% dos dados estão a até 3 desvios padrão da média.


Como usar a Regra Empírica
O valor médio das casas de determinada rua é de US$ 125 mil,com um
desvio padrão de US$5 mil. O conjunto de dados tem uma distribuição na
forma de sino. Estime o porcentual de casas que custam entre US$ 120 e
US$ 135 mil.

105 110 115 120 125 130 135 140 145

US$ 120 mil fica 1 desvio padrão abaixo da média


e US$ 135 mil fica 2 desvios padrão acima da 68% + 13,5% = 81,5%
média.

Logo, 81,5% das casas custam entre US$ 120 e US$ 135 mil.
Distribuição Normal

Todas as distribuições normais podem ser


transformadas em distribuições normais
padronizadas, mudando-se a escala da distribuicao
original para “Z”.
Se isso não fosse possível, seria necessário construir
uma tabela separada da distribuição normal para cada
par de valores µ e σ.
A distribuicão normal padronizada tem média zero e
desvio padrão 1 (um). Sendo comum encontrarmos 3
desvios para à direita da média e 3 desvios à
esquerda da média.
Há uma maneira de transformar as variáveis de um
problema em escala normal:
___
Xi  X Xi  
Z  ou Z 
s 
Escore padrão
O escore padrão, ou escore z, representa o número de
desvios padrão que separa um valor x da média.
valor – média
desvio padrão

Em um concurso público com 560 candidatos , as pontuações


tiveram uma média de 152 e desvião padrão de 7 em uma
distribuição normal. Calcule o escore z para os candidatos com
pontuações de:
(a) 161 (b) 148 (c) 152

Quantos candidatos estão acima de (a)?


Cálculos de escore z
(a)

Um valor de x = 161 está 1,29


desvio padrão acima da média.
1,29
(b)
Um valor de x = 148 está 0,57
desvio padrão abaixo da
0,57 média.

(c)
Um valor de x = 152 é igual à
média.
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4965 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4983 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,49 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,500
Distribuição Normal

A função distribuição de probabilidade


de uma normal com média µ e o
desvio σ pode ser definida:

x  1 

1
F ( x)  exp 2 ( x   )  dx
2
 2   2 

Assim, se uma variável aleatória contínua tem distribuição X normal com


média µ e desvio padrão σ, então a probabilidade de X estar entre dois
valores x0 e x1, sendo x1 > x0 é definida pela função acima.
Exercícios
O preço médio de um ação é de R$ 50,00 e
seu desvio padrão é R$ 10,00. Suponha
normal a distribuição dos preços deste
ativo no mercado. Determinar:
a) Que % de preços estará entre R$ 47,00
e R$ 51,50?
b) Que % de preços será maior que a
média de mercado?
c) Que % de preços será igual a média de
mercado?
d) Coletada uma amostra de 650 dados na
bolsa, quantificar o número de cotações
que estarão situados acima de R$ 73,50.
Respostas:

a) 17,8%

b) 50,0%
2
c) zero

d) 6 cotações (6,11)

Você também pode gostar