Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística Descritiva
Introdução: Neste tópico será apresentado aos alunos os principais usos
da Estatística, seus usos no Estado e Empresas, bem como as definições
do que seja um dado estatístico e os principais tipos e elementos que
dizem respeito a uma representação tabular.
1.1.1 Variáveis
Nominal
Qualitativ
a
Ordinal
Variável
Quantitati Discreta
va
Contínua
Tipos de Variáveis
Populações Quantitativas Qualitativas
Contínua Discreta Nominal Ordinal
Alunos de No na Conceito Final A,
Idade, peso sexo
Graduação Classe B ou R
Velocidade N.o de
Automóveis Cores Limpeza
km/h defeitos
Venda de Valor em No de Tipo de Muito
Imóveis reais oferta imóvel dispendioso
Eis alguns exemplos das diversas maneiras como os dados podem ser
distorcidos.
Pequenas amostras
Números imprecisos
Estatística Descritiva - 1.4
Porcentagens distorcidas
Cifras parciais
Distorções deliberadas
Perguntas tendenciosas
Gráficos enganosos
Pressão do pesquisador
Más amostras
Estatística Descritiva - 1.5
Exemplo:
Alturas N.o de
Alunos
1,45 |------ 5
1,55
1,55 |------ 8
1,65
1,65 |------ 13
1,75
1,75 |------ 7
1,85
1,85 |------ 5
1,95
1,95 |------ 2
2,05
Total 40
c) Toledo e Ovale
número de
classes (k)
n.o de elementos observados mínimo
máximo
até 50 5 10
51 a 100 8 16
101 a 200 10 20
201 a 300 12 24
301 a 500 15 30
mais de 500 20 40
Além dessas existem outras fórmulas empíricas para resolver o problema para
determinação do número de classes [n(k)], há quem prefira n ) k ( n ≅ . Entretanto, a
verdade é que essas fórmulas não nos levam a uma decisão final; esta vai depender na
realidade de um julgamento pessoal, que deverá estar ligado à natureza dos dados,
procurando, sempre que possível, evitar classes com freqüências nulas ou freqüências
relativas exageradamente grandes.
Exemplo:
1,55 ---| 1,65 : compreende todos os valores entre 1,55 e 1,65, inclusive o
1,55 exclusive o 1,65
1,55 |--- 1,65 : compreende todos os valores entre 1,55 e 1,65, inclusive o
1,55 e exclusive o 1,65
h = Ls – Li
Estatística Descritiva - 1.10
1,95
1,95 |------ 2 0,0500
2,05
Total 40 1,0000
− Vmenor
Vmaior
2o – Calcule a amplitude de classe h =
k
o resultado obtido em h deve ser sempre arredondado para maior, de forma a
garantir que todos os dados sejam incluídos na distribuição de freqüências. Importante
frisar que tanto a primeira classe quanto a última não devem ficar sem dados.
Em alguns casos o arredondamento utilizado– que deve ser sempre para maior –
pode implicar que a última classe fique sem elementos, para isso, uma alternativa seria
começar a primeira classe com um valor inferior ao menor valor dos dados.
Notas Importantes: A última classe deve conter pelo menos um elemento dos
dados;
Não devem existir dados sem classe
Seja o exemplo:
Resolução
Classes Dados
1,49 |----- 1,59 1,49 1,49 1,50 1,52 1,53 1,58
1,59 |----- 1,69 1,59 1,60 1,60 1,62 1,63 1,64 1,64 1,65 1,67
1,67 1,68
1,69 |----- 1,79 1,69 1,69 1,70 1,70 1,71 1,72 1,73 1,73 1,74
1,75 1,78 1,78
1,79 |----- 1,89 1,80 1,83 1,84 1,84 1,85 1,86 1,87 1,88
1,89 |----- 1,99 1,92 1,97 1,98
1,49 pertence a essa classe |------- 1,59 não pertence a essa classe
Alturas Alunos
1,49 |----- 1,59 6
1,59 |----- 1,69 11
1,69 |----- 1,79 12
1,79 |----- 1,89 8
1,89 |----- 1,99 3
Total 40
Freqüências
Ordenadas,
correspond
em ao eixo
y
Abscissas correspondem ao
eixo x
1, 2, 3, 3, 3, 4, 4, 5, 5, 5,
2 3 3 7 8 0 5 5 6 5
2, 2, 3, 3, 4, 4, 4, 5, 5, 5,
3 8 3 1 9 5 1 3 6 3
2, 2, 3, 3, 4, 8, 4, 5, 6, 7,
6 3 9 2 1 8 9 5 7 0
2, 2, 3, 3, 4, 4, 4, 4, 4, 5,
4 9 8 8 7 4 1 1 2 0
4. Ordenar os ramos
Estatística Descritiva - 1.17
Original Organizado
Ramo Folha Ramo Folha
(unidad (decimal) (unidad (decimal)
e) e)
1 2 1 2
2 3643839 2 3334689
3 339871288 3 123378889
4 0595119741 4 0111124557
12 99
5 05653635 5 03355566
6 7 6 7
7 0 7 0
8 8 8 8
Estatística Descritiva - 1.18
Características:
- todas as barras devem ter a mesma largura
- devem existir espaços entre as barras
As larguras das barras que deverão ser todas iguais podendo ser adotado qualquer
dimensão, desde que seja
conveniente e desde que não se superponham. O número no topo de cada barra pode
ou não omitido, se
forem conservada, a escala vertical pode ser omitida.
Características:
1.3.3.9 Cartograma
Exemplo:
População da Região Sul do Brasil - 1990
Estado População Área Densid
(hab.) (km2 )
2
ade
Paraná 9.137.700 199.324 45,8
Santa 4.461.400 95.318 46,8
Catarina
Rio Grande do 9.163.200 280.674 32,6
Sul
Total 22.762.300 575.316 39,56
Fonte: IBGE
Estatística Descritiva - 1.24
Estatística Descritiva - 1.25
1.3.3.11 Ogivas
1.4.1 Média
∑x i
, ou simplesmente x = ∑x
x= i =1
n
n
onde:
x=
∑ x = 16 + 18 + 23 + 21 + 17 + 16 + 19 + 20 = 150 = 18,75
n 8 8
∑x F
i =1
i i
∑ xF
x = , ou simplesmente x =
∑F
n
i
∑F
i =1
Onde:
x=2223334444555555555666666778
xi Fi xiFi
2 3 6
3 3 9
4 4 16
5 9 45
6 6 36
7 2 14
8 1 8
Total 28 134
∑ xF 134
= 4,7857
x = =
∑F 28
Classes Fi xi xiFi
(PM)
39 |-- 50 4 44,5 178,
0
50 |-- 61 5 55,5 277,5
61 |-- 72 5 66,5 332,5
72 |-- 83 6 77,5 465,0
Estatística Descritiva - 1.29
∑ xF 1695,5
= 67,82
x = =
∑F 25
n
Xg = n
x1* x2 * ...* xn = n
∏x
i =1
i
Estatística Descritiva - 1.30
n
Xg = n
∏x
i =1
i = 6
1,045* 1,05* 1,06* 1,07* 1,05* 1,07 = 6
1,398196817
b) Média Harmônica ( xh )
n n
xh = =
1 1 1 1
∑ x x + x + ...+ x
1 2 n
xh =
∑f = f +f 1 2 + ...+ fn
fi f f f
∑x x + x 1 2
+ ...+ n
xn
i 1 2
1.4.2 Mediana
a) Dados Ímpares
Seja a a série: 36 37 39 40 40 41 41 42 42
(n+ 1) (9 + 1)
Posição da Mediana = = = 5º Termo da série ordenada
2 2
36 37 39 40 40 41 41 42 42
1º 2º 3º 4º 5º 6º 7º 8º 9º
b) Dados pares
36 37 39 40 40 41 41 42 42 45
10 10
= 5º Termo da Série e + 1 = 6º Termo da Série
2 2
Estatística Descritiva - 1.33
36 37 39 40 40 41 41 42 42 45
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º
Aplica-se a moda:
4, 4, 6, 7, 7, 8, 8, 8, 9 e 10.
Pela simples observação, temos que o valor “8”, aparece com mais
freqüência, portanto este valor é a moda.
Vale lembrar que, que uma série de dados pode apresentar mais
de uma moda, como por exemplo:
4, 4, 4, 5, 5, 5, 5, 6, 6, 7, 8, 8, 8, 8, 9, 10, e 10
Mo = Md = x → curva simétrica
1.5 Separatrizes
Qi = quartis i = 1, 2, 3,
Di = decis i = 1, 2, 3,...,9
Ci = centis i = 1, 2, 3,...,99
1.5.1 Quartil
Símbolo: Qi i = 1, 2 e 3
Estatística Descritiva - 1.37
n
Q1 = (quartil inferior)
2
2n n
Q2 = = = Mediana
4 2
3n
Q3 = (quartil superior)
4
1.5.2 Decis
Símbolo: Di i= l, 2,.3,..,9
Assim teremos i = 1, 2, 3, 4, 5, 6, 7, 8, e 9
in
Di = , onde
10
in
Ci = onde
100
1, 2, 3, 3, 3, 4, 4, 5, 5, 5,
2 3 3 7 8 0 5 5 6 5
2, 2, 3, 3, 4, 4, 4, 5, 5, 5,
3 8 3 1 9 5 1 3 6 3
2, 2, 3, 3, 4, 8, 4, 5, 6, 7,
6 3 9 2 1 8 9 5 7 0
2, 2, 3, 3, 4, 4, 4, 4, 4, 5,
4 9 8 8 7 4 1 1 2 0
Estatística Descritiva - 1.40
1, 2, 2, 2, 2, 2, 2, 2, 3, 3,
2 3 3 3 4 6 8 9 1 2
3, 3, 3, 3, 3, 3, 3, 4, 4, 4,
3 3 7 8 8 8 9 0 1 1
4, 4, 4, 4, 4, 4, 4, 4, 4, 5,
1 1 2 4 5 5 7 9 9 0
5, 5, 5, 5, 5, 5, 5, 6, 7, 8,
3 3 5 5 5 6 6 7 0 8
1n 1* 40 o
a) Primeiro Decil = = = 4 Termo = 2,3
10 10
1n 1* 40
b) Primeiro Quartil = = = 10º Termo = 3,2
4 4
n 40
c) Mediana = = = mediana é par = 20º e 21º termo = 4,1
2 2
3n 3* 40
d) Terceiro Quartil = = = 30º Termo = 5,0
4 4
9n 9* 40
e) Nono Decil = = = 36º Termo = 5,6
10 10
Conclusões:
Cinqüenta por cento dos alunos estão notas entre 3,2 e 5,0
1.5.4 Box-plot
valor mínimo;
primeiro quartil;
mediana;
terceiro quartil; e
valor máximo.
Máximo = 2630.
R = Xmax – X min
∑x i −x
Dm = i =1
,
n
200
A = { 55, 45, 52, 48} , média = = 50,00
4
∑ 14
14
Pela fórmula, Dm = = 3,50
4
O Desvio Médio tem aplicação restrita, não sendo comum o seu uso no
dia a dia em cálculos estatísticos.
1.6.1.3 Variância
∑( x −x ) 2 (∑ x) 2
i
que por transformação temos: ∑x 2
−
n
σ =
2
, σ2 =
n n
A = {55 45 52 48 }
Resolução:
xi x2
55 3025
45 2025
52 2704
48 2304
∑ 200 10058
∑( x − x )
2 (∑ x) 2
(200) 2
i
= ∑x 2
−
n =
10058 −
4 = 14,50
σ2 = , σ2 =
n n 4
∑ ( x − x)
2
Fi
σ 2
=
i
, podendo ser também expressa da seguinte maneira:
∑ Fi
(∑ xiFi) 2
∑ xi 2 Fi −
σ2 =
∑ Fi
∑ Fi
xi = ponto médio da classe
Fi = freqüência dos dados na classe
Consumo Fi
05 |---
25 4
25 |---
45 6
45 |--- 1
65 4
65 |--- 2
85 6
∑ 5
0
Resolução
(∑ xiFi) 2
∑ ( x − x ) Fi = ∑ xi 2 Fi − (2990) 2
2
= 196850 −
σ2 =
i
∑ Fi 50
= 360,96
∑ Fi ∑ Fi 50
(∑ x ) 2
Para populações = ∑ x2 − n
σ=
n
Estatística Descritiva - 1.50
(∑ xFi) 2
∑x 2
Fi −
Para populações
σ=
∑F
∑F
a) Variância Amostral
∑( x −x ) 2 (∑ x) 2
i
= ∑x 2
−
n
s =
2
, s2 =
n −1 n −1
∑( x −x ) 2 (∑ x) 2
(200) 2
i
= ∑x 2
−
n =
10058 −
4 = 19,33
s2 = , s2 =
n −1 n −1 4 −1
Estatística Descritiva - 1.51
(∑ xiFi) 2
∑ xi 2
Fi −
∑ ( x − x ) Fi = ∑ Fi
2
i
s 2
=
∑ Fi − 1 ∑ Fi − 1
Para o exemplo dado o valor da variância fica assim recalculado
(∑ xiFi) 2
∑ ( x − x ) Fi = ∑ xi 2 Fi − (2990) 2
2
= 196850 −
s 2
=
i
∑ Fi 50
= 368,33
∑ Fi − 1 ∑ Fi − 1 50 − 1
∑ (x − x) ( x)
− ∑
2
∑x
2 2
s= n
n− 1 s=
n− 1
(∑ xFi) 2
∑ (x − x) F
2
∑x 2
Fi −
s=
∑F −1 s=
∑F
∑ F −1
σ S
C.V . = ou C.V . =
x x
Estatística Descritiva - 1.52
σ 1500,00
Para os homens C.V . = = = 0,375 ou 37,5%
x 4000,00
σ 1200,00
Para as mulheres C.V . = = = 0,4 ou 40,0%
x 3000,00
1.6.1 Assimetria
Mo = Md = x → curva simétrica
a) Coeficientes de Assimetria
3 ( X − Med )
As =
S
b) Escalas de assimetria:
1.6.2 Curtose
⇒ CURVA PLATICÚRTICA
⇒ CURVA MESOCÚRTICA
⇒ CURVA LEPTOCÚRTICA
Q3 − Q1
K=
2 ( P90 − P10 )