Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatstica Aplicada
Belm - Par
2013
censos,
pesquisas
de
opinio
pblica,
aos
vrios
ndices
kN n
N n0
N n0
(1)
n0
Nh
, onde n
N
n
,
m
com h 1, , m.
Exemplo: Com o objetivo de conhecer algumas caractersticas dos alunos de uma
escola com N alunos. Supondo que seja de interesse realizar um levantamento por
amostragem para avaliar diversas caractersticas da populao de alunos desta
escola. Qual deve ser o tamanho mnimo ( n0 ) e o tamanho corrigido ( n) da amostra,
tal que se possa admitir, com alta confiana, que os erros amostrais no
ultrapassem 4% ( E = 0,04). Calcule para:
a) N = 35 alunos;
b) N = 200 alunos;
c) N = 200.000 alunos.
Observe que para manter o mesmo erro amostral, no item a) foi necessria
uma amostra abrangendo quase 100% da populao; enquanto que no item b) a
amostra abrange 76%; e no item c) abrange apenas 0,3% da populao. , portanto,
errnea a ideia de que para uma amostra ser representativa deva abranger uma
porcentagem fixa da populao.
Exemplo: Uso das tcnicas de amostragem.
Suponha que em uma regio existam 6.000 alunos de Ensino Fundamental, 3.000
do Ensino Mdio e 1.000 do Ensino Superior. Para selecionar uma amostra de 250
alunos:
a) Utilizando uma amostragem aleatria simples:
Para selecionar uma amostra aleatria simples deve-se garantir que a
populao a ser estudada homognea, ou seja, esta populao no pode ser
subdividida em relao a alguma caracterstica em comum. Considerando que isso
seja verdade, ou seja, que a populao de 10.000 estudantes homognea
seleciona-se uma amostra de 250 alunos, enumerando-se a populao de 1 a
10.000 e fazendo um sorteio aleatrio de 250 alunos.
b) Utilizando uma amostragem estratificada:
7
m = 3 (nmero de estratos),
nh = 250 / 3 = 83 estudantes.
m = 3 (nmero de estratos),
h = 1, 2, 3
6000
250 0,60 150 alunos do ensino fundamental
10000
3000
n2 250
250 0,30 75 alunos do ensino mdio
10000
1000
n3 250
250 0,10 25 alunos do ensino superior.
10000
n1 250
Exemplo: sexo, estado civil, grau de escolaridade, cor dos olhos, etc. Pode ser
subdividida em nominal e ordinal.
Nominal: assume resultados em categorias ou atributos sem ordenao. Exemplo:
Gnero, cor dos olhos.
Ordinal: assume resultados em categorias que podem ser naturalmente ordenados.
Exemplo: Escolaridade, dia da semana, faixa etria, faixa salarial, etc.
Varivel Quantitativa: quando o resultado da observao expresso em nmeros.
Exemplo: nmero de empregados, nmero de imveis, salrio, altura, peso, etc.
A varivel quantitativa pode ser:
Contnua: quando assume qualquer valor entre dois limites e que resultam
normalmente de uma mensurao. Exemplo: peso (em Kg), altura (em cm), idade,
salrio (em R$), temperatura (em oC), etc.
Discreta: quando assume valores inteiros, inclusive zero e que resultem,
frequentemente de uma contagem. Exemplo: nmero de alunos, nmero de filhos,
tamanho da famlia, etc.
Quadro 1: Esquema de classificao de variveis.
Qualitativa
Varivel
Quantitativa
Nominal
Ordinal
Discreta
Contnua
Conforme
(1993)
deve-se
utilizar
as
seguintes
regras
de
arredondamento:
1.6.1. Regra I - Se o 1 algarismo a ser abandonado for menor que 5 o ltimo a
permanecer fica inalterado.
Exemplo: Arredondar para centsimos os nmeros abaixo.
a) 47,3227 47,32
b) 0,29364 0,29
c) 53,77474 53,77
d) 30,00132 30,00
b) 23,09425 23,1
quando
temos
c) 38,97777 39,0
parcelas
de
d) 74,28583 74,3
percentagem
que
sofreram
40,7
19,199% 19,2
19,2
13,535% 13,5
13,5
26,643% 26,6
99,8
26,6
100,0%
10
3.1. TABELA: um quadro, aberto nas laterais, que resume um conjunto de dados
dispostos segundo linhas e colunas de maneira sistemtica.
3.1.1. Principais Elementos de uma Tabela:
a)
b)
c)
Observao: Nenhuma casa deve ficar sem preenchimento. Todas devem ter o
registro de algum nmero ou sinal:
- (hfen): quando o valor numrico nulo;
... (reticncias): quando no se dispe de dado;
? (ponto de interrogao): quando h dvida sobre a exatido do valor;
0; 0,0; ou 0,00 (zero), quando o valor numrico pequeno para ser expresso
pela unidade utilizada. Este deve conter o mesmo nmero de casas decimais
padronizado pela tabela;
x (letra x): quando o dado for omitido a fim de evitar individualizao da
informao.
3.1.2. Regras para Tabelas
a) em artigos ou publicaes que contenham muitas tabelas, estas sero numeradas
em ordem crescente, conforme o aparecimento;
14
Corpo
Coluna
indicadora
da
Tabela
cabealho
Coluna
numrica
Total
Rodap: fonte, notas, observaes.
Ms
Janeiro
Fevereiro
Total
Quantidade
20.000
10.000
30.000
Municpio
Marab
Santarm
Belm
Total
Quantidade
13.000
17.000
50.000
80.000
15
Marca
Quantidade
18.000
12.000
10.000
40.000
FIAT
GM
Chevrolet
Total
Filial
So Paulo
Rio de Janeiro
Total
Ms
Janeiro
10.000
12.000
22.000
Total
Fevereiro
3.000
5.000
8.000
13.000
17.000
30.000
1 classe
Tempo de Estudo
(em dias)
10 | 20
Nmero de
Alunos (fi)
38
Fi
fri
Fri
Xi
16
2 classe
3 classe
4 classe
5 classe
6 classe
20 | 30
30 | 40
40 | 50
50 | 60
60 | 70
45
30
22
10
15
160
T
.
K
(li ls )
.
2
b) Tipos de Frequncias
b.1) Frequncia Absoluta Acumulada de Classe ( Fi): a acumulao sucessiva, a
partir da primeira classe at uma classe qualquer, das frequncias simples ou
absoluta das classes.
F1 f 1
F2 f1 f 2
...
FK f1 f 2 ... f K
f
f
fri K i i
n
fi
Obs.:
fr
i 1
b.4) Percentual
i) Percentual Simples: o percentual de cada intervalo e calculada em funo da
frequncia simples;
ii) Percentual Acumulado: o percentual de cada intervalo e calculada em funo
da frequncia acumulado.
18
Dependentes (Xi)
0
1
2
3
4
Professores (fi)
40
50
30
20
10
150
Fi
fri
Fri
19
20
Observao: Este tipo de grfico pode ser feito em mais dimenses, quando isto
ocorre este grfico denomina-se Estereograma.
4.2.3. Grficos em Colunas ou Barras Empilhadas
Eles diferem dos grficos em barras ou colunas convencionais apenas pelo
fato de apresentar cada barra ou coluna segmentada em partes componentes.
Servem para representar comparativamente dois ou mais atributos.
Figura 5: Quantidade de Alunos Matriculados, no Perodo de Janeiro de 2007 a Dezembro de 2010,
por Turno.
21
Figura 8: Quantidade de Desistncia de Aluno por Turno, nos meses de Agosto a Dezembro de 2010.
22
2008
2009
2010
2011
4.4. CARTOGRAMAS: So ilustraes relativas a cartas geogrficas (mapas). O
objetivo desse grfico o de figurar os dados estatsticos diretamente relacionados
com reas geogrficas ou polticas.
Figura 11: Percentual de Domiclios no Brasil com Automveis de Uso Particular - 2011.
23
Frequncia Relativa
Figura 13: Histograma dos salrios pagos aos funcionrios do Estado do Par, no ano de 2000.
5
6
7
8
9
10 11
Salrio em unidades monetrias
12
13
4.5.2. Polgono de Frequncia: Unindo-se por linhas retas os pontos mdios das
bases superiores dos retngulos do histograma, obtemos o polgono de frequncia.
O polgono de frequncia pode referir-se s frequncias absolutas ou as relativas,
conforme a escala no eixo vertical. O polgono de frequncia pode ser montado
sozinho (sem o histograma).
24
41
43
47
51
55
59
61
Figura 15: Polgono de frequncia das idades de alunos da Escola Onsima Santarm: 2010.
25
Xi .
X 1 X 2 ... X n i 1
X
n
n
10 14 13 15 16 18 12
14 pessoas.
7
26
f X f 2 X 2 ... f k X k
X 1 1
f 1 f 2 ... f k
( f
i 1
Xi)
em que
f
i 1
f
i 1
fi
2
6
10
12
4
34
xi.fi
0
6
20
36
16
78
Logo X
X i fi
i 1
78/34 = 2,3 2
fi
i 1
f
i 1
Xi
f
i 1
X i fi
208
504
660
512
340
216
2.440
2440
61 . Logo: X 61 cm
40
5.2. MEDIANA( M d )
Colocados os valores em ordem crescente de grandeza (rol), a mediana ( M d ) ser
o valor que ocupa a posio central da srie de dados, ou seja, o valor que divide
a srie em duas partes com nmeros iguais de elementos. A mediana prefervel
mdia quando se est interessado em conhecer exatamente o centro da distribuio
27
28
Frequncia ( f i )
0
1
2
3
4
Total
2
6
9
13
5
35
Frequncia acumulada
( FAc (i ) )
2
8
17
30
35
-
Quando o somatrio das frequncias for mpar o valor mediano ser o termo que
ocupa a posio dada pela frmula:
f
2
f
2
1
2
1
2
1
1
8
Frequncia acumulada
( FAc (i ) )
1
3
4
6
7
8
-
fi
2
n
para localizar a classe mediana;
2
fi / 2 FAc( ant.)
li i 1
xh
fi
h = Intervalo de classe.
Exemplo
Frequncia ( f i ) Frequncia acumulada ( FAc ( i ) )
4
4
9
13
11
24
8
32
5
37
3
40
40
f
40
1 Localizar a classe mediana: i
20 . A frequncia acumulada que contm
2
2
Classes
50 | 54
54 | 58
58 | 62
62 | 66
66 | 70
70 | 74
Total
20 13. 4 60,54
11
5.3. MODA ( M o )
A moda ( M o ) o valor que ocorre com maior frequncia ou o valor que mais se
repete. Quando a srie de dados tal que as frequncias so maiores nos
extremos, ou quando se quer destacar um valor de alta frequncia ou quando se
pretende obter uma medida rpida e aproximada da tendncia central, a moda pode
ento, ser considerada para a interpretao dos dados. Com relao moda, uma
30
srie de dados pode ser classificada em amodal (no possui moda), unimodal
(possui apenas uma moda), bimodal (possui duas modas) ou multimodal (possui
mais de duas modas).
5.3.1. A Moda quando os dados no esto agrupados
A moda facilmente reconhecida: basta, de acordo com definio, procurar o valor
que mais se repete.
Ex: Na srie {7, 8, 9, 10, 10, 10, 11, 12} a moda igual a 10.
H sries nas quais no exista valor modal, isto , nas quais nenhum valor aparea
mais vezes que outros.
Ex: {3, 5, 8, 10, 12} no apresenta moda. A srie amodal.
Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos,
ento, que a srie tem dois ou mais valores modais.
Ex: {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 } apresenta duas modas: 4 e 7. A srie bimodal.
5.3.2. A Moda quando os dados esto agrupados
a) Sem intervalos de classe: Uma vez agrupados os dados, possvel determinar
imediatamente a moda: basta localizar o valor da varivel de maior frequncia.
Ex: Qual a temperatura mais comum medida no ms abaixo:
Temperatura Frequncia
0 C
3
1 C
9
2 C
12
3 C
6
Resp: 2 C a temperatura modal, pois a de maior Frequncia.
b) Com intervalos de classe: A classe que apresenta a maior Frequncia
denominada classe modal. Pela definio, podemos afirmar que a moda, neste
caso, o valor dominante que est compreendido entre os limites da classe
modal. O mtodo mais simples para o clculo da moda consiste em tomar o ponto
mdio da classe modal. Damos a esse valor a denominao de moda bruta.
M o (li l s ) / 2
da moda).
Mtodo mais elaborado pela frmula de CZUBER:
( fMo fant )
Mo li
( fMo fant )
h
Mo li
h ou
( fMo fant ) ( fMo fpost )
h = Intervalo de classe.
11 9
4 59,6
2 11 9 8
Mo 58
Obs.: A moda utilizada quando desejamos obter uma medida rpida e aproximada
de posio ou quando a medida de posio deva ser o valor mais tpico da
distribuio. J a mdia aritmtica a medida de posio que possui a maior
estabilidade e a mediana a medida mais central.
5.4. MEDIDAS SEPARATRIZES
Alm das medidas de posio que estudamos, h outras que, consideradas
individualmente, no so medidas de tendncia central, mas esto ligadas
mediana relativamente sua caracterstica de separar a srie em partes que
apresentam o mesmo nmero de valores.
Essas medidas - os quartis, os decis e os percentis - so conhecidas pelo
nome genrico de separatrizes.
5.4.1. QUARTIS - Qq
32
q fi
i 1
ou p
qn ;
4
33
q 4 FAc ( ant )
Qq liQq
h ,
f iQq
para q = 1, 2, 3
2 40 20
O quartil 2 = M d , logo: p
. Logo a classe mediana ser 58 | 62
4
li = 58; FAc (ant ) = 13; fi = 11; hi = 4
Substituindo esses valores na frmula, obtemos:
20 13
4 60,54 Md
11
Q2 58
10 4
4 56,66
9
30 24
4 65
8
1 40 10 Q 54
O quartil 1: p
1
O quartil 3: 3. fi / 4 = 30 Q3 62
5.4.2. DECIS - Dd
A definio dos decis obedece ao mesmo princpio dos quartis, com a
modificao da porcentagem de valores que ficam aqum e alm do decil que se
pretende calcular. A frmula bsica ser: kfi /10 onde k o nmero de ordem do
decil a ser calculado. Indicam-se os decis: D 1, D2,... , D9. Deste modo precisa-se de 9
decis para se dividir uma srie em 10 partes iguais.
34
5. fi / 10 = fi / 2
D3 54
fi
0
1
3
4
2
6
5
3
AT = 4 - 0 = 4
Exemplo:
Classes
4 | 6
6 | 8
8 |10
fi
6
2
3
AT = 10 4 = 6
Q3 = (70+62)/2 = 66
(- 4) - (-0,2) = -3,8
(- 3) - (-0,2) = -2,8
(- 2) - (-0,2) = -1,8
3 - (-0,2) = 3,2
5 - (-0,2) = 5,2
=
3,8
2,8
1,8
3,2
5,2
16,8
(- 4) - (-2) = - 2
(- 3) - (-2) = - 1
(- 2) - (-2) = 0
3 - (-2) = 5
5 - (-2) = 7
=
2
1
0
5
7
15
Pela Mediana: DM = 15 / 5 = 3
37
aritmtica e a sua frmula bsica pode ser traduzida como: a raiz quadrada da
mdia aritmtica dos quadrados dos desvios e representada por:
n
(Xi X )
i 1
Exemplo: Calcular o desvio padro da populao representada por {-4, -3, -2, 3, 5}.
Como= - 0,2, ento:
-4
-3
-2
3
5
- 3,8
- 2,8
- 1,8
3,2
5,2
=
14,44
7,84
3,24
10,24
27,04
62,8
2
(Xi X )
62,8
12,56 3,54
5
Obs: Quando nosso interesse no se restringe descrio dos dados, mas partindo
da amostra, visamos tirar inferncias vlidas para a respectiva populao, convm
efetuar uma modificao, que consiste em usar o divisor n - 1 em lugar de n. A
frmula ficar ento: S
(X
X )2
n 1
38
-2,1
-1,1
-0,1
0,9
1,9
4,41
1,21
0,01
0,81
3,61
8,82
7,26
0,12
5,67
10,83
32,70
f i 30 e 32,7 / 30 = 1,09.
( X i fi ) 2
n
ou S
f
i
2
X i fi
( X i fi ) 2
n
f
1
i
2
X i fi
amostra.
Ex: Calcule o desvio padro populacional do exemplo anterior:
.
0
2
1
6
2
12
3
7
4
3
Total 30
0
6
24
21
12
63
0
1
4
9
16
0
6
48
63
48
165
( 63)2
30 1,09 1,044
30
165
(63)2
30 1,128 1,062
30 1
165
Pontos
2 4
4 6
6 8
8 10
Total ()
8
7
13
2
30
3
5
7
9
24
35
91
18
168
9
25
49
81
72
175
637
162
1046
( X i fi ) 2
n
fi
X i fi
(168) 2
30
30
1046
3,507 1,873
( X i fi ) 2
X i fi
n
1
i
2
(168) 2
1046
30
30 1
3,628 1,905
6.1.5. VARINCIA - S 2
o desvio padro elevado ao quadrado. A varincia uma medida que tem
pouca utilidade como estatstica descritiva, porm extremamente importante na
inferncia estatstica e em combinaes de amostras.
6.2. MEDIDA DE DISPERSO RELATIVA
6.2.1 Coeficiente de Variao
uma medida adimensional, til para comparar variabilidades de diferentes
amostras, onde as mdias so muito desiguais ou as unidades de medidas so
diferentes. O coeficiente de variao (CV) o desvio padro expresso em
porcentagem da mdia, isto , magnitude relativa do desvio padro quando
comparado com a mdia da distribuio das medidas. O coeficiente dado por:
CV( X)
S
100%
X
40
Mdia
175 cm
68 kg
Desvio Padro
5,0 cm
2,0 kg
Tabulao de dados
Quadro 1 - Exemplo de Banco de Dados. Informaes sobre o estado civil, grau de
instruo, nmero de filhos, salrio (expresso como frao do salrio mnimo), idade
41
Solteiro
Casado
Casado
Solteiro
Solteiro
Casado
Solteiro
Solteiro
Casado
Solteiro
Casado
Solteiro
Solteiro
Casado
Casado
Solteiro
Casado
Casado
Solteiro
Solteiro
Casado
Solteiro
Solteiro
Casado
Casado
Casado
Solteiro
Casado
Casado
Casado
Solteiro
Casado
Casado
Solteiro
Casado
Casado
Solteiro
Solteiro
Casado
Casado
Nde
filhos*
1
2
3
0
1
2
0
2
2
0
5
2
1
3
2
3
5
4
Grau de instruo
Ensino fundamental
Ensino fundamental
Ensino fundamental
Ensino mdio
Ensino fundamental
Ensino fundamental
Ensino fundamental
Ensino fundamental
Ensino mdio
Ensino mdio
Ensino mdio
Ensino fundamental
Ensino mdio
Ensino fundamental
Ensino mdio
Ensino mdio
Ensino mdio
Ensino fundamental
Superior
Ensino mdio
Ensino mdio
Ensino mdio
Ensino fundamental
Superior
Ensino mdio
Ensino mdio
Ensino fundamental
Ensino mdio
Ensino mdio
Ensino mdio
Superior
Ensino mdio
Superior
Superior
Ensino mdio
Superior
Ensino Mdio
Superior
Ensino Fundamental
Ensino Mdio
Salrio
(em SM)
4,00
4,56
5,25
5,73
6,26
6,66
6,86
7,39
7,59
7,44.
8,12
8,46
8,74
8,95
9,13
9,35
9,77
9,80
10,53
10,76
11,06
11,59
12,00
12,79
13,23
13,60
13,85
14,69
14,71
15,99
16,22
16,61
17,26
18,75
19,40
19,82
20,25
22,10
23,30
24,50
Idade
anos meses
26
03
32
10
36
05
20
10
40
07
28
00
41
00
43
04
34
10
23
06
33
06
27
11
37
05
44
02
30
05
38
08
31
07
39
07
25
08
37
04
30
09
34
02
41
00
26
01
32
05
35
00
46
07
29
08
40
06
35
10
31
05
36
04
43
07
33
07
48
11
42
02
32
06
28
05
41
03
30
01
Regio de
procedncia
Interior
Capital
Capital
Outro
Outro
Interior
Interior
Capital
Capital
Outro
Interior
Capital
Outro
Outro
Interior
Outro
Capital
Outro
interior
Interior
Outro
Capital
Outro
Outro
Interior
Outro
Outro
Interior
Interior
Capital
Outro
Interior
Capital
Capital
Capital
Interior
Interior
Capital
Capital
Interior
EXERCCIOS
1. Considerando os dados do Quadro 1 referentes a Empresa GloboAnalisys, que
realizou um levantamento sobre alguns aspectos socioeconmicos dos seus
funcionrios, em Dezembro de 2011. Pede-se:
a) Classificar as variveis
b) Organizar as variveis em tabelas
c) Construir grficos para representar cada tabela
42
43
1.141,
1.272,
1.139,
respectivamente;
respectivamente; tubos, 390, 344, 330, respectivamente. Montar uma tabela de dupla
entrada. Valores em 1.000 t.
7. Montar uma srie para representar os valores das exportaes de acar,
fornecidas pelo Instituto do Acar e do lcool, nos anos de 2004 a 2010, em milhares
de dlares; 60.193 - 80.114 - 812.826 106.879 112.064 126.740 149.548.
8. Montar uma srie cronolgica para representar a quantidade de alunos matriculados
no ensino de Ensino Fundamental no Brasil nos anos de 2005 a 2010 em milhares de
alunos, segundo dados fictcios: 19720; 21473; 21887; 22598; 22473; 23564.
9.
Idealizar
uma
srie
geogrfica
para
representar
seguinte
fato:
total
de
29,
13, 78, 4,
110
estabelecimentos de
ensino
44
2
3
2
2
6
8
2
5
3
1
8
2
3
0
4
3
7
0
0
4
2
0
2
1
2
0
6
6
0
2
8
5
3
4
6
0
6
6
0
0
0
3
152
162
166
168
169
154
163
166
168
169
155
163
167
168
169
158
163
167
168
169
159
164
167
168
170
159
165
167
168
170
160
165
167
168
170
161
165
168
169
170
161
166
168
169
170
a. Classifique a varivel.
b. Construir uma distribuio de frequncias com classes para os dados.
c. Determinar as frequncias relativas percentuais.
d. Determinar as frequncias absolutas acumuladas.
e. Determinar as frequncias relativas acumuladas.
f. Construir o histograma e o polgono de frequncias.
g. Calcular a mdia aritmtica, a moda e a mediana.
h. Calcular os quartis, decil 1, decil 9, percentil 10 e 90.
i. Calcular a varincia, o desvio-padro e o coeficiente de variao.
j. Analisar os resultados.
15. Resultados da prova de Rapidez Numrica - Exame de Admisso do Colgio
So Jos - 2011:
25
33
35
37
55
27
40
16
14
46
45
39
28
34
29
21
28
41
20
23
27
33
46
a. Classifique a varivel.
29
29
38
10
44
33
47
16
36
42
32
34
22
15
15
18
27
33
51
36
21
24
19
19
21
27
17
26
300
140
150
350
150
230
120
100
180
150
500
140
250
450
135
350
240
100
190
140
120
150
100
430
170
600
350
550
200
120
100
200
120
425
450
500
120
450
300
500
200
350
150
600
100
150
100
400
500
600
350
500
200
120
200
100
200
300
100
100
100
600
600
150
100
250
142
200
150
150
5,0
4,5
3,0
7,0
6,0
6,5
6,5
4,0
6,0
7,0
5,0
5,0
3,0
7,0
1,0
7,0
7,0
8,0
a. Classifique a varivel.
2,0
8,0
4,0
7,0
4,0
1,0
1,5
8,0
5,0
7,0
5,5
3,0
8,0
7,0
3,0
6,0
2,0
0,5
7,0
5,0
4,5
9,0
3,5
9,5
6,2
5,0
4,5
5,5
2,0
5,5
7,0
3,0
8,0
5,0
2,0
2,0
6,0
2,0
4,4
8,0
2,5
6,0
47