Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTATSTICA BSICA
Presidente Prudente
2008
ndice
1.0 Introduo.......................................................................................................... 2
1.1 O que Estatstica.............................................................................................. 3
Anlise exploratrio de dados
4
6
7
7
8
13
13
3.0 Medidas-resumo...............................................................................................
17
17
17
18
19
19
20
21
22
22
24
25
5.0 Probabilidade...................................................................................................
26
5.1 Introduo.......................................................................................................... 26
5.2 Probabilidade condicional e independncia....................................................... 27
5.3 Exerccios........................................................................................................... 28
Dados da Companhia MB..................................................................................
29
Bibliografia ............................................................................................................
30
1.0 Introduo
Exemplo 1.0
Um pesquisador est interessado em fazer um levantamento sobre alguns aspectos
scio econmico dos empregados da seo de oramentos de uma companhia. Usando
informaes obtidas do departamento pessoal, ele elaborou a Tabela 1.0.
Tabela 1.0
Informaes sobre estado civil, grau de instruo, nmero de filhos, salrio
(expresso como frao do salrio mnimo), idade (medida em anos e meses) e
procedncia de 36 empregados da seo de oramentos da Companhia.
Estado
Grau de
Civil
Instruo
1
Solteiro
Fundamental
2
Casado
Fundamental
3
Casado
Fundamental
...
...
...
35
Casado
Mdio
36
Casado
Superior
Fonte: Bussab e Morettin (2002)
N de
Filhos
...
1
2
...
2
3
Salrio
4,00
4,56
5,25
...
19,40
23,30
Idade
Anos Meses
26
3
32
10
36
5
...
...
48
11
42
2
Regio de
Procedncia
Interior
Capital
Capital
...
Capital
Interior
De modo geral, para cada elemento investigado numa pesquisa, tem-se associado
um (ou mais de um) resultado correspondendo realizao de uma caracterstica
(ou caractersticas). Por exemplo, considerando a varivel estado civil, para cada
empregado pode-se associar um dos resultados, solteiro ou casado (note que poderia
haver outras possibilidades, como separado, divorciado, mas somente as duas
mencionadas foram consideradas no estudo).
Resumindo
Como as variveis so classificadas e outros exemplos:
Qualitativa
Nominal
Ordinal
Quantitativa
Discreta
Contnua
quantitativa.
O nmero do telefone de uma pessoa, o nmero da casa, o nmero de sua
identidade. s vezes o sexo do indivduo registrado na planilha de dados como 1 se
macho e 2 se fmea, por exemplo. Isto no significa que a varivel sexo passou a ser
quantitativa!
Proporo (fi)
0,3333
0,5000
0,1667
1,0000
2.3 Grficos
Tabela 1.3.
Grau de Instruo
Freqncia (ni)
Fundamental
12
Mdio
18
Superior
6
Total
n = 36
Fonte: Bussab e Morettin (2002)
Proporo (fi)
0,3333
0,5000
0,1667
1,0000
Figura 1.0
Grfico em Barras para a varivel Grau de Instruo
18
18
16
14
Freqncia (ni)
12
12
10
8
6
4
2
0
Fundamental
Mdio
Grau de Instruo
Superior
50%
Fundamental
Mdio
33%
Superior
17%
Freqncia (ni)
4
5
7
3
0
1
n = 20
Figura 1.2
Grfico de Barra para a varivel Nmeros de Filhos
35
35
30
25
Porcentagem
25
20
20
15
15
10
2
3
Nmeros de Filhos
Figura 1.3
Grfico de Disperso Dot Plot
10
(iii) Histograma
O Histograma utilizado para representar a distribuio de freqncia. um
grfico de barras contguas, com bases proporcionais aos intervalos de classes e a rea
de cada retngulo proporcional respectiva freqncia relativa. Indicaremos a
amplitude do i-simo intervalo por ai. Para que a rea do retngulo respectivo seja
proporcional a fi, a sua altura deve ser proporcional a fi/ai, que chamada de densidade
de freqncia da i-sima classe. Quanto mais dados tivermos em cada classe, mais alto
deve ser o retngulo. Com essa conveno, a rea total do histograma ser 1 (um).
Exemplo: Considerando a varivel Salrio dos empregados da seo de oramentos da
Companhia MB, temos os seguintes dados:
Tabela 1.5
Freqncias e Porcentagens dos 36 empregados da seo de oramentos da
companhia MB, por faixas de salrio.
Classe de
Freqncia
Proporo
(fi)
Salrio
(ni)
04 |-- 08
10
0,2778
08 |-- 12
12
0,3333
12 |-- 16
8
0,2222
16 |-- 20
5
0,1389
20 |-- 24
1
0,0278
Total
n = 36
1,0000
Fonte: Bussab e Morettin (2002)
Porcentagem
(100 x fi)
27,78
33,33
22,22
13,89
2,78
100,00
Densidade de Freqncia
(fi/ai)
0,0695
0,0833
0,0556
0,0347
0,0070
10
Figura 1.4
Histograma da varivel Salrio
0,09
0,08
0,0833
0,07
0,06
0,0695
0,05
0,0556
0,04
0,0347
0,03
0,02
0,01
0,007
04 |-- 08
08 |-- 12
12 |-- 16
Classes de Salrios
16 |-- 20
20 |-- 24
11
Tabela 1.6
Dvida Externa do Brasil de 1956 a 2006, em Milhes de Dlares.
Ano
Dvida
Ano
Dvida
Ano
Dvida
1956
2736
1957
2491
1958
2870
1959
3160
1960
3738
1961
3291
1962
3533
1963
3612
1964
3294
1965
3823
1966
3771
1967
3440
1968
4092
1969
4635
1970
6240
1971
8284
1972
11464
Fonte: IPEADATA
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
14857
20032
25115
32145
37951
52187
55803
64259
73963
85487
93745
102127
105171
111203
121188
113511
115506
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
123439
123910
135949
145726
148295
159256
179935
199998
241644
241468
236156
226067
227689
235414
220182
187987
191999
Figura 1.5
Grfico de Linhas para a varivel Dvida Externa do Brasil no perodo 1956 a 2006
250000
150000
100000
50000
19
56
19
58
19
60
19
62
19
64
19
66
19
68
19
70
19
72
19
74
19
76
19
78
19
80
19
82
19
84
19
86
19
88
19
90
19
92
19
94
19
96
19
98
20
00
20
02
20
04
20
06
200000
Ano
12
2.4 Ramo-e-Folhas
53
70
82
70
71
78
84
95
55
69
51
69
77
74
72
87
55
59
53
63
55
82
85
73
67
53
52
54
64
50
5
6
7
8
9
01233345559
34799
00123478
22457
5
2.5 Exerccios
1) Um questionrio foi aplicado aos alunos do primeiro ano de uma escola fornecendo
as seguintes informaes:
ID:
Turma:
Sexo:
Idade:
Alt:
Peso:
Filh:
Fuma:
Identificao do aluno;
Turma a que o aluno foi alocado (A ou B);
Feminino (F) ou Masculino (M);
Idade;
Altura;
Peso;
Nmero de filhos na famlia;
Hbito de fumar (sim ou no);
13
Toler:
Tolerncia ao cigarro: (I) Indiferente, (P) Incomoda Pouco e (M)
Incomoda Muito;
Exer:
Horas de atividade fsica, por semana;
Cine:
Nmero de vezes que vai ao cinema por semana;
OpCine:
Opinio a respeito das salas de cinema na cidade: (B) regular a boa e (M)
muito boa
TV:
Horas gastas assistindo TV, por semana
OpTV:
Opinio da programao na TV: (R) Ruim, (M) Mdia, (B) Boa e (N)
no sabe.
Tabela A
Informaes do questionrio estudantil. Dados brutos.
ID Turma Sexo Idade Alt Peso Filh
1 A
F
17
1,60 60,5 2
2 A
F
18
1,69 55,0 1
3 A
M
18
1,85 72,8 2
... ...
...
...
...
...
...
49 B
M
17
1,80 71,0 1
50 B
M
18
1,83 86,0 1
Fonte: Magalhes e Pedroso de Lima (2004).
Fuma
No
No
No
...
No
No
Toler
P
M
P
...
P
P
Exer
0
0
5
...
7
7
Cine
1
1
2
...
0
7
Opcine
B
B
M
...
M
M
Tv
16,5
7
15
...
14
20
14
OpTV
R
R
R
...
R
B
N de
Filhos
0
1
2
0
0
0
0
Idade
Regio de
procedncia
Interior
Capital
Capital
Outra
Outra
Interior
Interior
26
32
36
40
28
41
40
Freqncia
Solteiro
Casado
Total
4
3
7
Porcentagem 100x
57,14
42,85
100,00
Freqncia
Capital
Interior
Outro
Total
2
3
2
7
Porcentagem
28,57
42,85
28,07
100,00
15
c) Idade
Resoluo
Idade
Freqncia
26 32
32 38
38 42
Total
2
2
3
7
Porcentagem
28,27
28,57
42,85
100,00
11
10
16
10
8
8
14
10
14
14
12
19
12
5
8
14
6
12
12
12
13
12
8
7
10
11
7
11
9
12
14
5
6
12
22
14
8
7
11
7
15
8
12
9
15
Resoluo
8
7
Freqncia
6
5
5
5
4
4
3
3
2
2
1
0
5
10
11
12
Nmero de Erros
13
14
15
16
19
22
16
x + x 2 + x3 + + x n
x= 1
=
n
x
i =1
Mediana
A mediana representada por md obs o valor que ocupa a posio central dos
dados ordenados. o valor que divide os dados, isto , metade dos dados ser maior que a
mediana e metade ser menor.
Considere a seguinte srie de valores: 5, 2, 6, 13, 9, 15, 10.
De acordo com a definio de mediana, o primeiro passo a ser dado ordenar o
conjunto de valores: 2, 5, 6, 9, 10, 13, 15. O valor que divide a srie em duas partes iguais
9. Logo, a mediana 9.
Moda
A moda dada pelo valor mais freqente do conjunto de dados.
Mximo e Mnimo
O mximo o valor maior da observao do conjunto de dados, enquanto que o
mnimo a menor observao.
17
( x x ) 2 + ( x 2 x ) 2 + ( x3 x ) 2 + + ( x n x ) 2
s2 = 1
=
n 1
(x
i =1
x)2
n 1
s = s2
A expresso apresenta da definio N auxilia o leitor na interpretao da
varincia como uma medida de variabilidade.
Entretanto, possvel obter uma expresso alternativa que facilita os clculos:
1 n 2
2
s =
xi n ( x )
n 1 i =1
3.3 Quantis
Tanto a mdia como o desvio padro podem no ser medidas adequadas para
representar um conjunto de dados, pois:
So afetadas, de forma exagerada, pois valores extremos:
Apenas com estes dois valores no temos idia da simetria ou assimetria da
distribuio dos dados.
Para contornar esses fatos, outras medidas tm de ser consideradas.
Vimos que a medida um valor que deixa metade dos dados abaixo dela e metade
acima. De modo geral, podemos definir uma medida, chamada quantil de ordem p
p-quantil, indicada por q(p), onde uma proporo qualquer 0<p<1, tal que 100% das
observaes sejam menores do que q(p).
Indicamos, abaixo , alguns quantis e seus nomes particulares.
18
25 x0 + 20 x1 + 3 x 2 + 1x3 + 1x 4
= 0,66
50
b) Calcule a varincia?
Var=
25(0 0,66) 2 + 20(1 0,66) 2 + 3(2 0,66) 2 + 1(3 0,66) 2 + 1(4 0,66) 2
=0,704
50
19
64
68
68
76
60
72
88
60
68
80
60
72
88
60
Colocando em ordem
60,60,60,60,64,64,68,68,68,72,72,72,76,76,80,88,88
Mediana=68
(b) Calcule: Mnimo, Q1, Q2, Q3 e Mximo;
Resoluo
Maximo=60
Mnimo=60
q(0,25) = Q1 = 60
q(0,50) = Q2 = 68
q(0,75) = Q3 =76
20
Exemplo 1.4
Queremos verificar se existe ou no associao entre o sexo e a carreira escolhida
por 200 alunos de Economia e Administrao.
Distribuio conjunta das freqncias e propores (em porcentagem), segundo o sexo
(x) e o curso escolhido (y).
x
Masculino
Feminino
Total
85(61%)
35(58%)
120(60%)
Administrao 55(39%)
25(42%)
80(40%)
60(100%)
200(100%)
y
Economia
140(100%)
Total
Fonte: Bussab e Morettin (2002)
A partir dessa tabela podemos observar que independentemente do sexo, 60% das
pessoas preferem Economia a 40% preferem Administrao ( observe na coluna de
total)
No havendo dependncia entre as variveis esperaramos essas mesmas
propores para cada sexo. Observando a tabela, vemos que as propores do sexo
masculino (61% e 39%) e do sexo feminino (60% e 40%). Esses resultados parecem
indicar no haver dependncia entre que, neste caso, as variveis sexo e escolha do
curso parece ser no associados.
21
X2
,
X2 +n
T=
n
(r 1)( s 1)
Exemplo 1.5
Neste tipo de grfico temos os possveis pares de valores (x ,y), na ordem que
aparecem.
Para o exemplo, vemos que parece haver uma associao entre as variveis,
porque no conjunto a medida que aumenta o tempo de servio, aumenta o numero de
clientes.
22
Tabela1.5: Numero de anos de servio (x) por numero de clientes (y) de agentes de uma
Companhia de Seguros.
Tabela 1.5
Agente
Anos de Servios(x)
A
2
B
3
C
4
D
5
E
4
F
6
G
7
Fonte: Bussab e Morettin (2002)
Figura1.7
Grficos de disperso para as variveis (x) anos de servios e (y): numero de clientes.
Grfico de Disperso
Numeros de clientes
70
60
50
40
Grfico de
Disperso
30
20
10
0
0
Anos de Servios
23
Dp(s)
N
Regio de
S
Procedncia
Capital
11
11,46 5,22
Interior
12
11,55 5,07
Outra
13
10,45 3,02
Todos
36
11,12 4,52
Fonte: Bussab e Morettin (2002)
Var(s)
S(1)
q(1)
q(1)
q(1)
S(n)
27,27
25,71
9,13
20,46
4,56
4,00
5,73
4,00
7,41
7,81
8,74
7,05
9,77
10,64
9,80
10,17
16,63
14,70
12,79
14,66
19,40
23,30
16,22
23,30
( x x)( y i y )
,
Cov (x,y) = i =1 i
n
n
24
Cov( x, y )
dp ( x).dp ( y )
4.6 Exerccios
Com base na tabela abaixo, voc concluiria que o tipo de atividade est
relacionada ao fato de as embarcaes serem de propriedades estatal ou particular ?
Encontre uma medida de dependncia entre as variveis.
Atividades
Propriedades
Estatal
Particular
Total
Total
Costeira
Fluvial
Internacional
5
92
97
141
231
372
51
48
99
197
371
658
Resoluo
Tabela de desvio
Atividades
Propriedades
Estatal
Particular
Total
Costeira
Fluvial
Internacional
5(33,64)
92(63,64)
141(129,02)
231(242,98)
51(34,34)
48(64,66)
197
371
25
5.0 Probabilidade
5.1 Introduo
Denominamos fenmeno aleatrio situao ou acontecimento cujos resultados
no podem ser previstos com certeza.
Chamamos de espao amostral ao conjunto de todos os resultados possveis de
certo fenmeno aleatrio. Ele ser representado pela letra grega (Omega). Os
subconjuntos de so denominados eventos e so representados pelas letras latinas
A,B,......O conjunto vazio , como j tradicional, ser denominado por .
A unio de dois eventos A e B, denotada por AUB, representa a ocorrncia de pelo
menos um dos eventos A ou B.
Dois eventos A e B so adjuntos ou mutuamente exclusivos quando no tem
elementos em comum. Isto A B = .
Dizemos que A e B so complementares se sua unio o espao amostral e sua
interseco vazia. O complemento de A ser representado por A c e temos A A c =
e A A c = .
Considera-se probabilidade como sendo uma funo P(.) que atribui valores
numricos aos eventos do espao amostral.
Definio: Probabilidade
Uma funo P(.) denominada probabilidade se satisfaz as condies:
i)0 P(A) 1, A
ii)P()=1
n n
iii)P Aj = p ( Aj ) , com os Aj ' s distintos
j =1 j =1
26
c , c ,c
1
3,
....,
e que suas probabilidades sejam conhecidas. Suponha ainda que para um evento A, se conheam
as probabilidades P(A
P(C j A ) =
P( A C j ) P (C j )
k
P( A C ) P(C )
i =1
, j = 1,2,3,......, k .
27
5.3 Exerccios
As Preferncias de homens e mulheres por cada gnero de filme alugado em uma
locadora de vdeos esto apresentadas na prxima tabela.
Sexo Filme
Comdia
Romance
Policial
Homens
Mulheres
136
102
92
195
248
62
62
835
O filme alugado ser uma comdia?
Resoluo
P(C) = P (M) * P(C M ) + P (H) * P(C H ) = P(C H ) + P(C H )
P(C) =
476 287 92
+
= 0,803
835 835 835
d)O filme ser policial dado que foi alugado por um homem?
Resoluo
P(P H ) =
P( P H )
P( H )
P(P H ) =
248 476
= P( P H ) = 0,91
476 835
28
Companhia MB
Os dados abaixo correspondem a uma pesquisa realizada na Cia MB.
Foram selecionados 36 funcionrios e observadas as seguintes variveis:
estado civil, grau de instruo, nmero de filhos, salrio(em n de salrios
mnimos),
idade (em anos) e regio de procedncia.
Dados da Tabela 2.1. Pag 11 do livro.
No Estado
Civil
1
Solteiro
2
Casado
3
Casado
4
Solteiro
5
Solteiro
6
Casado
7
Solteiro
8
Solteiro
9
Casado
10 Solteiro
11 Casado
12 Solteiro
13 Solteiro
14 Casado
15 Casado
16 Solteiro
17 Casado
18 Casado
19 Solteiro
20 Solteiro
21 Casado
22 Solteiro
23 Solteiro
24 Casado
25 Casado
26 Casado
27 Solteiro
28 Casado
29 Casado
30 Casado
31 Solteiro
32 Casado
33 Casado
34 Solteiro
35 Casado
36 Casado
Instruo
ensino fundamental
ensino fundamental
ensino fundamental
ensino mdio
ensino fundamental
ensino fundamental
ensino fundamental
ensino fundamental
ensino mdio
ensino mdio
ensino mdio
ensino fundamental
ensino mdio
ensino fundamental
ensino mdio
ensino mdio
ensino mdio
ensino fundamental
superior
ensino mdio
ensino mdio
ensino mdio
ensino fundamental
superior
ensino mdio
ensino fundamental
ensino mdio
ensino mdio
ensino mdio
ensino mdio
superior
ensino mdio
superior
superior
2 grau
superior
Nmero de
Filhos
1
2
1
2
3
0
1
2
0
2
2
0
5
2
1
3
2
3
Salrio
Idade
Procedncia
4,00
4,56
5,25
5,73
6,26
6,66
6,86
7,39
7,59
7,44
8,12
8,46
8,74
8,95
9,13
9,35
9,77
9,80
10,53
10,76
11,06
11,59
12,00
12,79
13,23
13,60
13,85
14,69
14,71
15,99
16,22
16,61
17,26
18,75
19,40
23,30
26
32
36
21
41
28
41
43
34
24
34
28
37
44
30
39
32
40
26
37
31
34
41
26
32
35
47
30
41
36
31
36
44
34
49
42
Interior
Capital
Capital
Outro
Outro
Interior
Interior
Capital
Capital
Outro
Interior
Capital
Outro
Outro
Interior
Outro
Capital
Outro
Interior
Interior
Outro
Capital
Outro
Outro
Interior
Outro
Outro
Interior
Interior
Capital
Outro
Interior
Capital
Capital
Capital
Interior
29
Bibliografia
Wilton de O. Bussab, Pedro A. Morettin- Estatstica Bsica- So Paulo : Saraiva. 5 edio,
2005.
30