Escolar Documentos
Profissional Documentos
Cultura Documentos
e Informtica
ESTATSTICA
1. INTRODUO:
A Estatstica, ramo da Matemtica Aplicada, teve sua origem na Antigidade, vrios povos
j registravam o nmero de nascimentos, de bitos, de habitantes, faziam estimativas de riqueza
individual e social, distribuam eqitativamente terras ao povo, cobravam impostos, etc., por
processos que, hoje, chamamos de Estatsticas.
Originalmente as Estatsticas tratavam dos negcios do Estado (especialmente com
objetivos tributrios ou militares) o que justifica a etimologia da palavra que surgiu do latim
STATUS (Estado).
A palavra Estatstica usada em dois sentidos:
1.1. ESTATSTICAS (no plural)
refere-se a dados numricos e so informaes sobre
determinado assunto, grupo de pessoas, fenmenos de interesse do Estado, etc., obtidas por
um pesquisador.
1.2. ESTATSTICA (no singular) significa o conjunto de processos usados na classificao,
organizao, descrio, anlise e interpretao de dados experimentais.
Comumente a Estatstica relacionada com dados e nmeros da Sade Pblica, Bolsa de
Valores, Crescimento de Populao, Testes Psicolgicos, Engenharia, Fsica, Matemtica,
Qumica, Economia, alm de setores do planejamento da produo, anlises comerciais e estudos
sociolgicos.
2. EVOLUO HISTRICA DA ESTATSTICA
Os vrios aspectos e acontecimentos da evoluo histrica da Estatstica agrupam-se em
trs perodos:
2.1. 1 PERODO - PREPARAO DOS FATOS
Abrange a Idade Antiga, Idade Mdia e parte da Idade Moderna, na Histria da Civilizao.
caracterizado por registros de interesse Estatal, sendo denominado de perodo da Estatstica
Administrativa. No livro sacro , Chouking, de Confcio, tem-se notcias da preparao dos
Estados da China, no ano 2238 a.C. O imperador Iao ordenou o levantamento sobre agricultura,
indstria e comrcio. Ainda na Idade Antiga, conta-nos a Bblia Sagrada o levantamento do povo
judaico para fins guerreiros e, na poca de Augusto, era feito o recenseamento da populao
(com o objetivo de verificar o quanto o povo pagava de impostos) e extenso territorial do Imprio
Romano. A Igreja Catlica, por ocasio do conselho de Trento, ordenou que se fizesse o registro
de nascimentos, casamentos e mortes.
Na Idade Mdia, destacam-se os rabes, no ano 721, com a coleta numrica das cidades
dominadas, contagem de suas populaes , fbricas e de cada espcie de seus produtos, para
controle das conquistas territoriais.
Carlos Magno, rei dos francos e imperador do Ocidente, de 771 a 814, tendo em vista fins
de carter financeiro e administrativo, estabeleceu o organismo de Estado.
Guilherme, o Conquistador, ordenou a elaborao de um cadastro da diviso do solo da
Inglaterra das vrias classes sociais existentes, para fins de arrecadao de impostos, o que deu
origem em 1086, obra Domesday Book, considerada como modelo marcante desse perodo.
A Estatstica na psicologia se inicia com os estudos dos fisiologistas do sculo XIX (Fischer,
Watson, Wundt e outros). Embora divergindo de suas concepes filosficas, tinham em comum
nas suas pesquisas o pensamento de que possvel aplicar tcnicas experimentais e
procedimentos matemticos ao estudo dos problemas psicolgicos, ou seja, sentimentos,
emoes, percepes, alegrias, tristezas, ansiedades, stress, etc.
Essas caractersticas,
chamadas psicolgicas, quando ativadas, repercutem somaticamente, ou seja, so refletidas
atravs do corpo ( suores, tremores, rubores, etc...).
A medida dessa repercusso ser interpretada na Estatstica pelo psiclogo, atravs de
tabelas, grficos, medidas de tendncia central , medidas de disperses, etc.
Na psicologia, a Estatstica como ferramenta de trabalho contribui para o planejamento
experimental de dados coletados (populao em estudo), anlise de suas variveis, processo de
amostragem, chegando na realizao do experimento propriamente dito ou seja, um instrumento
avaliador em psicologia projetado com auxlio dos princpios estatsticos.
5.
CONCEITOS INTRODUTRIOS:
5.1. DADOS
So informaes obtidas a partir de medies de grandezas, resultados de pesquisas,
respostas a questionrios ou contagem de modo geral.
Crtica dos
Apresentao
Tabelas
Anlises
dados
5.7.
dados
dos dados
Grficos
sexo (que tem dois resultados possveis: masculino ou feminino), nmero de filhos, estatura, peso,
inteligncia, beleza, profisso, etc, corresponde um certo nmero de resultados possveis.
Na prtica, no trabalhamos estatisticamente com os elementos existentes, mas sim, com
alguma de suas caractersticas que sejam fundamentais ao nosso estudo. Por exemplo: o
conjunto de elementos pode ser parafusos produzidos por uma mquina. No faremos nenhum
tratamento matemtico com os parafusos e sim, com alguma de suas caractersticas como, por
exemplo, comprimento, peso, dimetro, perfeito ou defeituoso, etc.
Como podemos notar, a caracterstica de interesse poder ser qualitativa ou quantitativa.
Temos, ento, variveis qualitativas e variveis quantitativas:
7.1.
VARIVEL QUALITATIVA
A varivel ser qualitativa quando resultar de uma classificao por tipo (categorias)
ou atributo (modalidades) , por exemplo:
a) Populao: parafusos produzidos por uma mquina
Varivel: qualidade (perfeito ou defeituoso);
b) Populao: nmero de registros de casamentos de um cartrio civil
Varivel: qualidade (com comunho de bens ou com separao de bens)
c) sexo atributo: masculino ou feminino
d) cor da pele atributo: branca, preta, amarela, vermelha, parda, etc.,
e) cor dos olhos atributo: azuis, verdes, castanhos, pretos, etc.
7.2.
VARIVEL QUANTITATIVA
A varivel ser quantitativa quando seus valores forem expressos em nmeros, ou seja,
refere-se exclusivamente a quantidades (idade dos alunos de uma Universidade, salrios dos
funcionrios de uma empresa, etc.), subdividindo-se em discretas e contnuas.
7.2.1. VARIVEL QUANTITATIVA DISCRETA (OU DESCONTNUA)
Uma varivel quantitativa discreta quando assume valores pertencentes a um conjunto
enumervel (um nmero finito de valores isolados dentro de um intervalo), os valores so
obtidos mediante alguma forma de contagem, razo pela qual seus valores so expressos
atravs de nmeros naturais {0; 1; 2; 3; ...}, por exemplo: a) nmero de filhos de um casal pode
ser 3 filhos, mas no pode ser 2,75 filhos;
b) nmero de livros em uma estante pode ser 300 livros, mas no pode ser 275,832 livros;
c) nmero de chamadas telefnicas pode ser 50 chamadas, mas no pode ser 37,682
chamadas;
d) Populao: aparelhos produzidos por uma linha de montagem. Varivel : nmero de defeitos
por unidade.
7.2.2. VARIVEL QUANTITATIVA CONTNUA
Uma varivel quantitativa contnua quando pode assumir qualquer valor num
certo
intervalo
de variao, assim, as observaes (ou valores) so obtidos atravs de
mensurao (medida) e a interpretao de que se trata de um valor aproximado, pois no
existem instrumentos capazes de oferecer preciso absoluta, por exemplo:
a) se uma pessoa tem altura de 1,78m, devemos considerar que o valor exato est entre
1,775m e 1,785m , por exemplo;
b) o comprimento de um terreno;
c) o dimetro externo de uma pea;
d) o peso de certa pessoa (50,5 kg ; 50,573kg ; 50,585kg ; ...).
9. ESTIMATIVAS
So caractersticas numricas de uma amostra.
Exemplo: Clculo da mdia ou clculo do desvio padro das notas de uma prova aplicada a
um conjunto de alunos.
Os elementos numricos caractersticos de uma amostra so estimativas dos elementos
correspondentes na populao, que so os parmetros.
POPULAO
AMOSTRA
AVALIAO
PARMETRO
ESTIMATIVA
II. Se o algarismo seguinte, aquele a ser arredondado, for maior do que cinco ( 5 ),
ser desprezado juntamente com os que o sucedem, acrescentando-se uma unidade ao
algarismo no qual se faz o arredondamento, tendo-se um valor por excesso.
Exemplo: Arredondar os dados abaixo com as aproximaes indicadas:
a) 15,6766 (aproximao 0,01)
15,68
b) 23,45384 (aproximao 0,001)
23,454
valor por excesso
c) 10,7 para o inteiro mais prximo
11
III. Se o algarismo seguinte, aquele a ser arredondado, for igual a cinco ( 5 ) , usamos os
seguintes critrios:
1) Se o primeiro algarismo aps aquele que formos arredondar for 5, seguido apenas de
zeros, conservamos o algarismo se ele for PAR ou aumentamos uma unidade se ele
for MPAR, desprezando os algarismos seguintes.
EXEMPLO: Arredondar para a 1 casa decimal ( 0,1 ) os nmeros:
1) 34,6500
passa para 34,6
2) 36,75000 passa para 36,8
2) Se o 5 for seguido de outros algarismos dos quais, pelo menos um diferente de
zero, aumentamos uma unidade no algarismo e desprezamos os seguintes.
EXEMPLO: Arredondar para a 1 casa decimal (0,1) os nmeros:
1) 36,7502
passa para 36,8
2) 34,6503
passa para 34,7
NOTA: NO SE DEVEM FAZER ARREDONDAMENTOS SUCESSIVOS EM NENHUMA
HIPTESE.
EXERCCIO: Transformar o dado bruto 15,6715 em dado elaborado com linear de percepo
0,01 e dizer:
a) qual o algarismo duvidoso;
b) quais os algarismos exatos;
c) quais os algarismos certos
SOLUO:
15,67[15
15,67
despreza-se
a) o algarismo duvidoso o 7 por estar influenciado por uma aproximao.
Se o dado bruto fosse 15,6766, o arredondamento passaria para 15,68 . Neste
caso, o algarismo 7 no mais figura no nmero, sendo, portanto, duvidoso;
b) os algarismos exatos so : 1 , 5 e 6;
c) os algarismos certos so : 1 , 5 , 6 e 7.
11.2. COMPENSAO
Suponhamos os dados abaixo, aos quais aplicamos as regras do arredondamento:
15,32
37,85
11,44
30,17
94,78
passa para
+
15,3
37,8
11,4
30,2 +
94,7 (94,8)
9
Verifica-se que houve uma pequena discordncia : a soma exatamente 94,7 quando, pelo
critrio do arredondamento, deveria ser 94,8. Entretanto, para a apresentao dos resultados,
necessrio que desaparea essa diferena, a qual possvel pela prtica do que denominamos
compensao, conservando o mesmo nmero de casas decimais.
De um modo geral, fazemos a compensao descarregando a diferena na(s) parcela(s)
maior(es). Assim, no exemplo dado, teremos:
15,3
37,9
11,4
30,2
94,8
xi
= x1 + x2 + x3 + x4 + x5 = 10 + 25 + 40 + 15 + 28 = 118
i=1
20
=
( xi
+ 3 )2
i=1
b) (x3 + y3)3 + (x4 + y4)3 + (x5 + y5)3 + (x6 + y6)3 =
( xi
i=3
+ yi )3
II.
Sendo k uma constante real (diferente de zero) e x uma varivel real, temos:
n
n
( k . xi ) = k . xi
i=1
i=1
III.
NOTAS: CUIDADO!
n
I.
( xi . yi )
i=1
xi
i=1
i=1
yi
II.
2
n
x
i
i=1
i=1
xi2
Exerccios:
1. Escreva na notao de somatrio as somas:
a) (x1 - x )2 + (x2 - x )2 + (x3 - x )2 + . . . + (x9 - x )2 =
2
3 3x
i
d)
- 4 =
2
i=1
e)
i.xi=
xi
fi
2
2
4
5
5
3
6
2
b) x i =
f) x i2 . f i =
c) f i =
d) x i . f i =
g) (x i 10 ) 2 . f i =
11
x .f
h) i i =
i) | x i i | . f i =
i
13. DISTRIBUIO DE FREQNCIAS
j) (2 x i 10 ) 2 . f i =
163,
169,
168,
166,
160,
162,
164,
165,
168,
165,
160,
168,
164,
164,
166,
161,
169,
166,
168,
168
13.2. ROL
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
Estat. (cm) x i
160
161
162
163
164
165
166
167
168
169
fi
2
1
1
1
3
2
3
0
5
2
20
f1
f2
f3
f4
f5
f6
f7
f8
f9
f10
12
R = 169 160
R=9
I.
K 4,472135955. . .
13
II.
Regra de Sturges:
k 1 + 3,22 . log n
, n o tamanho da amostra.
R
k
ou
Xmx. - Xmn.
k
9
2,25
4
Podemos adotar h = 3. Esse valor corresponde a diferena entre o limite superior e o
inferior da classe.
h = Ls L i
a mdia aritmtica simples entre o limite inferior e o limite superior de cada classe.
Quando Xi no dado, tomamos o PM para seu valor, ou seja, fazemos Xi = PM
PM =
Li + L s
2
PM = Li +
h
2
fi
fi
ou
fr =
fi
n
, onde n = f i
NOTA: A soma das freqncias relativas simples sempre igual a 1 (um), ou seja,
fr = 1
Xi
160
161
162
163
164
165
166
167
168
169
fi
2
1
1
1
3
2
3
0
5
2
20
fr
0,10
0,05
0,05
0,05
0,15
0,10
0,15
0
0,25
0,10
1,00
f%
10 %
5%
5%
5%
15 %
10 %
15 %
0%
25 %
10 %
100 %
fa
2
3
4
5
8
10
13
13
18
20
f ra
0,10
0,15
0,20
0,25
0,40
0,50
0,65
0,65
0,90
1,00
f %a
10 %
15 %
20 %
25 %
40 %
50 %
65 %
65 %
90 %
100 %
PM=Xi
161,5
164,5
167,5
170,5
fi
4
6
8
2
20
fr
0,20
0,30
0,40
0,10
1,00
f%
20 %
30 %
40 %
10 %
100 %
fa
4
10
18
20
fra
0,20
0,50
0,90
1,00
f %a
20 %
50 %
90 %
100 %
Clculos auxiliares:
I. PM1 =
PM3 =
II.
III.
L i1 + L s1
2
L i3 + L s3
2
160 + 163
= 161,5
2
PM2 =
166 + 169
= 167,5
2
PM4 =
fr =
1
f1
4
=
n
20
= 0,20
fr =
2
f2
6
=
n
20
= 0,30
fr =
3
f3
8
=
= 0,40
n
20
fr =
4
f4
2
=
= 0,10
n
20
L i2 + L s2
2
L i4 + L s 4
2
163 + 166
= 164,5
2
169 + 172
= 170,5
2
fa1 = 0 + 4 = 4
fa2 = 0 + 4 + 6 = 10
fa = 0 + 4 + 6 + 8 = 18
3
fa 4 = 0 + 4 + 6 + 8 + 2 = 20
OBS.: Como a varivel x =167 no aparece na amostra, poder ser omitida da tabela.
16
Distribuio de Freqncias
Exemplos:
Ex1:
103
63
78
98
135
84
86
64
87
130
99
71
114
127
110
115
83
110
120
70
130
115
90
98
115
114
110
140
92
90
120
125
100
107
105
95
85
125
92
100
50
75
86
100
101
99
75
86
93
87
50
63
64
70
71
75
75
78
83
84
85
86
86
86
87
87
90
90
92
92
93
95
98
98
99
99
100
100
100
101
103
105
107
110
110
110
114
114
115
115
115
120
120
125
125
127
130
130
135
140
- Observa-se no rol de alturas que alguns valores se repetem. Pode-se fazer uma
condensao das medidas estabelecendo-se uma correspondncia entre o valor individual e o
respectivo nmero de vezes em que o mesmo foi observado.
17
fi
50
i =1
Obs: A soma das freqncias sempre igual ao nmero de valores observados:
= N , onde:
i =1
Exemplo
0 |--- 10
---|
0 ---| 10
--|---|
0 --- 10
0 |---| 10
Significado
Incluso na classe do valor situado a sua esquerda e excluso do valor
situado a sua direita.
Incluso na classe do valor situado a sua direita e excluso do valor
situado a sua esquerda.
Ambos os valores direita e esquerda esto excludos da classe.
Ambos os valores direita e esquerda esto includos na classe.
Ex2: Teste com 500 perguntas, cada qual valendo um ponto, aplicado a 1000 alunos.
Dados Agrupados
Tabela 4 - Resultado do teste - 10 classes
Classes - Notas
0 |-- 50
50 |-- 100
100 |-- 150
150 |-- 200
200 |-- 250
250 |-- 300
300 |-- 350
350 |-- 400
400 |-- 450
450 |-- 500
Total
10
fi
Freqncias (fi)
10
30
40
90
200
260
200
120
30
20
1000
= 1000
i =1
19
f = 1000
i
i =1
0 |-- 5
5 |-- 10
10 |-- 15
15 |-- 20
20 |-- 25
25 |-- 30
30 |-- 35
35 |-- 40
40 |-- 45
45 |-- 50
.
.
.
Freqncias
(fi)
0
1
0
2
3
0
3
0
1
0
.
.
.
1
1000
100
f = 1000
i
i =1
onde: N =
Temos:
h = LS - LI
intervalo [h 10%h; h + 10%h], igualmente razovel. Sempre que possvel, conveniente tomar
um valor inteiro para h.
Ex: Com relao tabela de alturas:
H = 90 cm
k=7
h = 90 cm / 7 12, 85
Sendo 10% de 12,85 = 1,285, temos:
12,85 1,28 = 11,57
12,85 + 1,28 = 14,13
Portanto, razovel usar um valor de h qualquer que esteja contido no intervalo [11,57; 14,13]
Vamos adotar o valor h = 13 cm para a tabela de alturas e a partir da determinar todas as
classes.
A partir de XMIN = 50, somaremos 13 at que tenhamos uma classe que contenha o XMAX = 140.
+13
|
50
+13
|
63
+13
|
76
+13
|
89
+13
|
102
+13
|
115
+13
|
128
|
141
Observando-se a tabela de dados brutos (Tabela 1), ou o rol (Tabela 2) ou ainda a tabela de
freqncias de dados no agrupados (Tabela 3), conta-se o nmero de ocorrncias dentro de cada
classe. Obtm-se, assim, a tabela abaixo:
fi
1
6
9
14
8
8
4
50
22
fi
1
4
6
11
11
10
5
2
50
PM
(50 + 62) / 2 =
56
(62 + 74) / 2 =
68
(74 + 86) / 2 =
80
(86 + 98) / 2 =
92
(98 + 110) / 2 = 104
(110 + 122) / 2 = 116
(122 + 134) / 2 = 128
(134 + 146) / 2 = 140
Obs: Poderamos tambm ter calculado o PM da primeira classe e obter os PM das classes
seguintes somando 12 (que a amplitude de classe) sucessivamente, como abaixo:
+12
|
56
+12
|
68
+12
|
80
+12
|
92
+12
|
104
+12
|
116
+12
|
128
|
140
Tipos de Freqncias
Uma tabela de freqncias pode representar um dos seguintes tipos de freqncias:
Freqncias simples:
Absoluta
Relativa (e Porcentual)
Abaixo de (crescente)
Freqncias acumuladas:
Acima de (decrescente)
Absoluta
Relativa (e Porcentual)
Absoluta
Relativa (e Porcentual)
fri =
fi
fi
,
N
N = fi
j =1
23
Obs: A soma das freqncias simples relativas de uma tabela sempre igual a 1. Isto :
k
f ri
=1
i =1
f %i =
fi
100
N
ou
Obs: A soma das freqncias percentuais de uma tabela sempre igual a 100. Isto :
k
%i
= 100%
i =1
Ex: Freqncias relativas e percentuais das classes de medidas de altura, calculadas na tabela
seguinte.
Tabela 9 - Distribuio de Freqncias de Dados Agrupados em Classes (III)
Freqncia Relativa e Freqncia Porcentual
Classes - Alturas
(cm)
50 |--- 62
62 |--- 74
74 |--- 86
86 |--- 98
98 |--- 110
110 |--- 122
122 |--- 134
134 |--- 146
Total
fi
PM
fr i
f% i
1
4
6
11
11
10
5
2
50
56
68
80
92
104
116
128
140
1/50 = 0,02
4/50 = 0,08
6/50 = 0,12
11/50 = 0,22
11/50 = 0,22
10/50 = 0,20
5/50 = 0,10
2/50 = 0,04
1,00
0,02 100 = 2%
0,08 100 = 8%
0,12 100 = 12%
0,22 100 = 22%
0,22 100 = 22%
0,20 100 = 20%
0,10 100 = 10%
0,04 100 = 4%
100%
24
fi
PM
1
4
6
11
11
10
5
2
50
56
68
80
92
104
116
128
140
fr i
f%i
0,02 2%
0,08 8%
0,12 12%
0,22 22%
0,22 22%
0,20 20%
0,10 10%
0,04 4%
1,00 100%
f a i f ari
1
5
11
22
33
43
48
50
f a%i
0,02 2%
0,1 10%
0,22 22%
0,44 44%
0,66 66%
0,86 86%
0,96 96%
1 100%
fai
far i
fa%i
50
49
45
39
28
17
7
2
50/50 =1
49/50 = 0,98
45/50 = 0,90
39/50 = 0,78
28/50 = 0,56
17/50 = 0,34
7/50 = 0,14
2/50 = 0,04
1 100 = 100%
0,98 100 = 98%
0,90 100 = 90%
0,78 100 = 78%
0,56 100 = 56%
0,34 100 = 34%
0,14 100 = 14%
0,04 100 = 4%
Questes:
Com relao Tabela 13:
Qual a altura que representa a terceira classe?
Qual o nmero de alunos com altura entre 74 e 86 cm?
Qual o nmero de alunos com altura entre 62 e 98 cm?
Qual o nmero de alunos com altura abaixo de 110 cm?
26
Exerccios:
1. Os dados brutos abaixo representam o QI de 60 alunos:
110
115
112
163
85
92
137
123
87
103
121
163
77
135
135
98
105
132
165
101
81
152
84
110
70
177
128
105
163
93
127
143
178
129
138
172
98
118
154
181
133
142
110
147
151
87
109
155
127
160
185
163
91
113
144
120
118
125
170
97
a. Construa uma distribuio de freqncias que contenha PM, fi, f%, f%a e f%a .
b. Com base na tabela construda no item anterior responda:
1. Qual o QI que representa a quinta classe?
2. Qual o nmero de alunos com QI na quarta classe?
3. Qual o nmero de alunos com QI abaixo de 115?
4. Qual o nmero de alunos com QI abaixo de 125?
5. Qual a porcentagem de alunos com QI na sexta classe?
6. Qual a porcentagem de alunos com QI abaixo de 160?
7. Qual o nmero de alunos com QI acima de 144?
8. Qual o QI abaixo do qual h 40 pessoas?
2. Um professor de educao fsica obteve as alturas em metros de 60 alunos escolhidos
aleatoriamente de um grupo de 600 alunos que fazem parte da escola. Os resultados so
dados na tabela abaixo:
1,55
1,65
1,68
1,69
1,70
1,76
1,56
1,65
1,68
1,69
1,70
1,77
1,58
1,65
1,68
1,70
1,72
1,78
1,60
1,65
1,68
1,70
1,72
1,79
1,60
1,65
1,68
1,70
1,72
1,80
1,60
1,65
1,68
1,70
1,72
1,81
1,60
1,65
1,68
1,70
1,73
1,82
1,62
1,66
1,68
1,70
1,75
1,83
1,63
1,67
1,68
1,70
1,75
1,85
1,65
1,68
1,69
1,70
1,75
1,89
fi
1
3
6
8
10
16
14
12
8
2
80
Classes
1000 |--- 2000
2000 |--- 3000
3000 |--- 4000
4000 |--- 5000
5000 |--- 6000
6000 |--- 7000
f%
PM
1500
2500
3500
4500
5500
6500
Quadro I:
f%a
Quadro II:
fa
fa
f%a
fi
fr
2
5
12
13
5
3
40
Supondo que o Quadro I represente notas, responda:
I-a. Quantos alunos tm nota abaixo de 33?
I-b. Qual a porcentagem de alunos com nota acima de 78?
I-c. Qual a nota abaixo da qual tem 10 pessoas?
I-d. Qual a nota abaixo da qual tem 12 pessoas?
I-e. Quantas pessoas tm nota acima de 47 e abaixo de 85?
Supondo que o Quadro II represente salrio em R$, responda:
II-a. Quantas pessoas ganham menos de 4700?
II-b. Qual a porcentagem de pessoas que ganham acima de 2250?
II-c. Qual o salrio abaixo do qual tem 25 pessoas?
f%
fra
5. Construa uma tabela de freqncias para os dados abaixo sem agrup-los em classes:
5, 5, 6, 7, 7, 7, 8, 8, 9, 10, 15, 15, 15, 15, 15.
28
Representaes Grficas
Alm da apresentao tabular, uma outra maneira de se sumarizar e apresentar dados
estatsticos por meio de grficos.
A principal vantagem do uso de grficos sobre o uso de tabelas que os grficos permitem
uma visualizao imediata dos valores observados, na sua totalidade. Soma-se a isso o carter
esttico: trata-se de uma representao mais atraente, tendendo a chamar mais ateno sobre os
dados.
Os princpios que norteiam a construo de grficos foram introduzidos pelo matemtico
francs Ren Descartes em 1637, ao desenvolver a geometria analtica.
Representaes grficas em coordenadas cartesianas so feitas em um plano chamado
plano cartesiano (em homenagem a Descartes). Este plano representado por duas retas
perpendiculares entre si, que o dividem em quatro quadrantes (ver Fig. 1). A reta horizontal,
orientada para a direita, chamada de eixo das abscissas e a vertical, orientada para cima, eixo
das ordenadas. A orientao destas retas indica a direo em que os valores das abscissas e das
ordenadas aumentam. Os valores das abscissas e das ordenadas so marcados a intervalos
regulares em cada um dos eixos. O ponto de cruzamento entre os eixos , em geral, tomado como
sendo a origem de ambos os eixos. A qualquer par ordenado (x, y) associa-se um nico ponto no
plano cartesiano, com valor de abscissa x e valor de ordenada y.
y
(-1, +3)
+3
10 quadrante
2 quadrante
+2
+1
-2
(-2, -1)
30 quadrante
-1
(+2,+1)
+1
+2
+3
-1
40 quadrante
-2
(+2, -2)
0
12
1
8
2
6
3
7
4
3
5
2
29
Tabela 3
Classes de notas
0 |--- 10
10 |--- 20
20 |--- 30
30 |--- 40
40 |--- 50
50 |--- 60
60 |--- 70
70 |--- 80
80 |--- 90
90 |--- 100
TOTAL
PM
5
15
25
35
45
55
65
75
85
95
fi
1
4
6
10
15
20
8
5
2
1
72
30
Fig. 15 - Histograma referente tabela de classe de notas (Tabela 3) com PMs marcados no eixo
das abscissas
II. POLGONO DE FREQNCIAS obtido unindo-se os pontos mdios das bases
superiores dos retngulos do histograma.
Ex: Considerando-se ainda os dados da Tabela 3, na figura seguinte exibido o polgono de
freqncias juntamente com o histograma j apresentado na figura 14.
Ex: Comparar a distribuio de notas de trs turmas de CC em uma prova de Estatstica. Estas
distribuies encontram-se tabeladas abaixo, em termos de freqncias percentuais.
Tabela 4: Turma 1
Classes de PM
f%i
Notas
0 |--- 1
0,5
2%
1 |--- 2
1,5
5%
2 |--- 3
2,5
11%
3 |--- 4
3,5
15%
4 |--- 5
4,5
18%
5 |--- 6
5,5
23%
6 |--- 7
6,5
16%
7 |--- 8
7,5
5%
8 |--- 9
8,5
3%
9 |--- 10
9,5
2%
TOTAL
100%
Tabela 5: Turma 2
Classes de
PM
f%i
Notas
0 |--- 1
0,5
0%
1 |--- 2
1,5
2%
2 |--- 3
2,5
9%
3 |--- 4
3,5
13%
4 |--- 5
4,5
17%
5 |--- 6
5,5
20%
6 |--- 7
6,5
23%
7 |--- 8
7,5
10%
8 |--- 9
8,5
4%
9 |--- 10
9,5
2%
TOTAL
100%
Tabela 6: Turma 3
Classes
PM
de Notas
0 |--- 1
0,5
1 |--- 2
1,5
2 |--- 3
2,5
3 |--- 4
3,5
4 |--- 5
4,5
5 |--- 6
5,5
6 |--- 7
6,5
7 |--- 8
7,5
8 |--- 9
8,5
9 |--- 10
9,5
TOTAL
f%i
3%
7%
12%
18%
22%
16%
13%
6%
3%
0%
100%
32
Tabela 7
Classes de notas
0 |--- 10
10 |--- 20
20 |--- 30
30 |--- 40
40 |--- 50
50 |--- 60
60 |--- 70
70 |--- 80
80 |--- 90
90 |--- 100
TOTAL
PM
5
15
25
35
45
55
65
75
85
95
fi
1
4
6
10
15
20
8
5
2
1
72
fai
1
5
11
21
36
56
64
69
71
72
fai
72
71
67
61
51
36
16
8
3
1
n
c
i
a
s
70
60
50
40
30
20
10
0
10
20
30
40
50
60
70
80
90
100
Notas
60
50
40
30
20
10
90
80
70
100
Notas
60
50
40
30
20
10
33
60
50
40
30
20
10
Notas
100
90
80
70
60
50
40
30
20
10
Md: Mediana
Fig. 20 - Ogiva de Galton Crescente e Decrescente relativas aos dados da Tabela 7 Determinao grfica da mediana da distribuio
34
Exerccios
1. Construa um grfico em setores para os dados da tabela abaixo:
Grupo
A
B
C
D
E
TOTAL
% Acertos
10
15
25
40
10
100
A
B
C
D
E
Nmero de alunos
cursando por perodo
Manh
Tarde
Noite
5
8
10
8
8
20
13
30
20
20
35
40
10
43
8
1
2
3
4
5
6
7
8
9
10
11
12
13
4. Dado o grfico abaixo, que representa a temperatura de uma srie de pessoas, responda:
a) Qual o nmero de pessoas cuja temperatura se encontra representada no grfico?
b) Quantas pessoas possuem temperatura maior que 380C?
c) Qual a percentagem de pessoas normais, considerando como normais aquelas com
temperaturas entre 360C e 370C?
35
10
20
30
40
50
60
70
80
idade
em
anos
fi
20
40
60
50
30
200
7. Para a tabela abaixo, construa as duas ogivas (use fa e fa) e marque no grfico
construdo o valor da mediana.
Classes
140 |--- 145
145 |--- 150
150 |--- 155
155 |--- 160
160 |--- 165
165 |--- 170
170 |--- 175
175 |--- 180
180 |--- 185
185 |--- 190
190 |--- 195
195 |--- 200
Total
fi
3
3
2
4
4
6
10
8
5
4
2
1
52
36
fi
7
11
9
7
5
1
40
80
60
40
20
20
30
40
50
60
70
80
90
100
Notas
Medidas de Posio
Alm da organizao e apresentao de dados estatsticos, a Estatstica Descritiva tambm
compreende a tarefa de sumarizao, ou reduo, dos dados.
H diversas medidas que possibilitam a condensao da informao contida dentro de um
conjunto de observaes. Os dois tipos de medidas mais importantes so as medidas de posio
e as medidas de disperso. H ainda as medidas de assimetria e de curtose.
Dentre as medidas de posio, as principais so as chamadas medidas de tendncia
central, sendo as trs mais utilizadas: a mdia aritmtica, a mediana e a moda. So assim
denominadas devido ao fato de haver uma tendncia dos dados de se concentrarem em torno
destes valores.
Soma-se s medidas de tendncia central ainda outras medidas de posio, denominadas
genericamente de separatrizes ou quantis, que so os quartis, decis e percentis.
O clculo de medidas de tendncia central tem por finalidade a representao de um
conjunto de dados atravs de um nico valor numrico. Alm disso, estas medidas calculadas para
uma amostra podem ser usadas como estimativa das mesmas quantidades para a populao a
partir da qual a amostra foi colhida.
Mdia Aritmtica
A mdia aritmtica a principal e mais utilizada medida de tendncia central.
Esta medida denotada por:
*
x : Caso se trate da mdia de uma amostra.
*
: Caso estejamos nos referindo a uma populao.
Clculo da mdia para dados no agrupados.
37
x
x=
i=1
= 7,0
Generalizando, temos que a mdia de um conjunto de N observaes: x1, x2, x3, ..., xN
definida como:
x1 + x 2 + x3 +K+ x N
N
o que pode ser escrito de uma forma mais compacta, usando-se o smbolo de somatrio:
x=
x
x=
i=1
x=
1 + 2 + 2 + 2 + 3 + 3 + 4 + 4 + 4 + 4 + 5 + 5 + 5 + 6 + 6 + 6 + 8 + 8 + 8 + 8 + 8 + 9 + 9 + 9 + 9 + 9 + 10 + 10 + 10 + 10 + 10 + 10
32
1+ 3 2 + 2 3 + 4 4 + 3 5 + 3 6 + 5 8 + 5 9 + 6 10
6,5
32
ou ainda, usando uma tabela onde anotamos cada valor de nota e a freqncia com a qual este se
repete como dispositivo prtico:
38
6,5
Nota (xi)
1
2
3
4
5
6
8
9
10
Total
fixi
11 = 1
32 = 6
23 = 6
44 = 16
35 = 15
36 = 18
58 = 40
59 = 45
610 = 60
207
fi
1
3
2
4
3
3
5
5
6
32
temos:
207
x=
6,5
32
xi
=
i=1
x=
207
6,5
32
i=1
por f2, e assim por diante, tal que o nmero total de observaes dado por N = f i , a mdia
i =1
f
x=
xi
i=1
fi xi
ou simplesmente: x =
i=1
i=1
fi PMi
x=
i=1
fi
1204
6,0
200
i =1
onde o limite superior do somatrio, igual a 5, agora dado pelo nmero de classes.
Generalizando, quando temos M classes cada qual com um valor de ponto mdio: PM1,
PM2, PM3, ..., PMM, onde a freqncia de valores na primeira classe seja f1, a freqncia de
valores na segunda classe seja f2, e assim por diante, tal que o nmero total de observaes
M
fi PMi
fi PMi
x=
i=1
ou x =
i=1
fi
i=1
Mediana
A mediana, denotada por Md, definida como o ponto na escala de medidas abaixo do qual
se encontra exatamente metade das observaes (e, portanto, acima do qual se encontra a outra
metade).
Obteno da mediana para dados no agrupados
Para se obter a mediana de um conjunto de observaes, conhecendo-se o valor individual
de cada observao, inicialmente coloca-se os valores observados em ordem (crescente ou
decrescente). Tem-se ento duas possibilidades:
O total de valores medidos mpar: A mediana o valor central do rol de observaes;
O total de valores medidos par: A mediana dada pela mdia aritmtica dos dois valores
centrais do rol de medidas.
Ex1: Considerando o seguinte conjunto de valores de medidas de alturas, em metros:
1,56; 1,77; 1,65; 1,48; 1,81; 1,92; 1,72
Obter a mediana destes valores.
Resposta:
Inicialmente, colocamos estes valores em ordem crescente. Obtemos, ento, um rol de medidas:
1,48; 1,56; 1,65; 1,72 ; 1,77; 1,81; 1,92
O nmero total de observaes de altura N = 7. Tem-se, portanto, um nmero mpar de medidas.
Portanto, a mediana ser o quarto valor do rol:
Md = 1,72m
Ex2: Considerando o seguinte conjunto de valores de medidas de peso, em Kg:
67; 56; 82; 47; 71; 94; 101; 63
Resposta:
Inicialmente, colocamos estes valores em ordem crescente. Obtemos, ento, um rol de medidas:
47; 56; 63; 67; 71; 82; 94; 101
40
Classe
mediana
Classes de
Altura (cm)
80 |--- 90
90 |--- 100
100 |--- 110
110 |--- 120
120 |--- 130
130 |--- 140
140 |--- 150
Total
fi
fa
2
3
5
12
10
15
3
50
2
5
10
22
32
47
50
- ' fa
2
. h
Md = Li +
fi
N / 2 = 50 / 2 = 25
Md = 120 +
Md = 120 + 3
25 22
. 10
10
Md = 123
Resposta:
Para determinar o valor da mediana, observa-se a coluna de freqncias acumuladas
percentuais abaixo de (quarta coluna). Estes valores de freqncias nos informam que 64% dos
valores medidos se encontram abaixo do valor de altura 130 cm e que 44% se encontram abaixo
de 120 cm. Deve haver, portanto, um valor de altura, que se situa entre 120 cm e 130 cm, tal que
abaixo dele esto 50% das medidas.
Partindo do pressuposto que as medidas de altura se distribuem uniformemente pelos
intervalos de classe, podemos assumir que existe uma proporcionalidade entre intervalos de altura
e intervalos de freqncia. Isto permite-nos montar a seguinte regra de trs:
130
64%
(130 120) --------- (64 44)
(x 120) --------- (50 44)
x
120
10 ------------ 20
(x 120) ------------ 6
50%
44%
20 (x120) = 10 6
x = 60 / 20 + 120
x = 123
Assim, a mediana Md = 123 cm. Isto , 50% dos alunos tm altura abaixo de 123 cm e,
portanto, os outros 50% tm altura acima de 123 cm.
Moda
A moda, que ser denotada por Mo, a medida de tendncia central mais fcil de se obter.
definida como o ponto na escala de medidas com maior freqncia dentro da distribuio.
Resposta:
O valor que se apresenta com freqncia mais alta 9, portanto este o valor da moda, ou seja,
Mo = 9.
Ex2: Um aluno B obteve as seguintes notas em uma srie de provas s quais foi submetido: 6, 6,
6, 8, 9, 9, 9, 10.
Obter a moda deste conjunto de dados.
Resposta:
Os valores de nota 6 e 9 aparecem ambos com freqncia igual a 3 e no h nenhum valor que
aparea com freqncia superior a esta. Como estes valores no so adjacentes, dizemos que
esta distribuio possui duas modas: Mo1 = 6 e Mo2 = 9. Trata-se, portanto de uma distribuio
bimodal.
Ex3: Um aluno C obteve as seguintes notas em uma srie de provas s quais foi submetido: 6, 8,
8, 8, 9, 9, 9, 10.
Obter a moda deste conjunto de dados.
Resposta:
Os valores de nota 8 e 9 aparecem ambos com freqncia igual a 3 e no h nenhum valor que
aparea com freqncia superior a esta. Como estes valores so adjacentes, a moda tomada
como a mdia aritmtica entre eles, isto , Mo = (8 + 9)/2 = 8,5. Trata-se de uma distribuio
unimodal.
Ex4: Um aluno C obteve as seguintes notas em uma srie de provas s quais foi submetido: 6, 6,
8, 8, 9, 9, 10, 10.
Obter a moda deste conjunto de dados.
Resposta:
Todos os valores de notas possuem a mesma freqncia, j que todos ocorreram duas vezes.
Neste caso, como no h nenhum valor que tenha maior freqncia que os demais, esta
distribuio no possui moda. Diz-se, neste caso, que se trata de uma distribuio amodal.
Obs1: Distribuies com trs modas so chamadas trimodais e distribuies com 4 ou mais
modas, so ditas polimodais.
Ex5: Um conjunto de 90 alunos foi submetido a uma prova com 10 testes, cada qual valendo 1
ponto. A distribuio de notas destes alunos mostrada no histograma a seguir (Fig. 1).
Distribuio de notas de um conjunto de
alunos
Freqncia
20
15
10
5
0
1
5
6
Nota
10
picos, diz-se que a distribuio bimodal, ainda que o tamanho dos picos no seja
essencialmente igual. Neste caso, as modas da distribuio acima so Mo1= 2 e Mo2=9.
Ex6: Um conjunto de 60 alunos foi submetido a uma prova com 12 testes, cada qual valendo 1
ponto. A distribuio de notas destes alunos mostrada no histograma a seguir (Fig. 2).
F'
h
' F + F'
Mo a Moda
Li o limite inferior da classe modal
F a freqncia simples da classe posterior classe modal
F a freqncia simples da classe anterior classe modal
h a amplitude da classe modal (h = Ls Li)
Classe modal a classe que apresenta a maior freqncia simples
Nota: MODA BRUTA o ponto mdio da classe modal
Exemplo: Determine a moda para os dados da distribuio abaixo:
Notas de
N de alunos
Matemtica
fi
0 |--- 2
15
2 |--- 4
23
4 |--- 6
46
Classe Modal (fi mx. = 46)
6 |--- 8
37
8 |--- 10
9
130
37
2
M0 = 4 + 1,233...
M0 5,23
23 + 37
A moda bruta da distribuio MB = (4 + 6) / 2
MB = 5
Clculo da MODA para valores agrupados em Classes (Mtodo ou Processo de CZUBER)
1
. h
Mo = Li +
1 + 2
Li = limite inferior da classe modal
1 = diferena entre a freqncia simples da classe modal e a imediatamente anterior a ela
2 = diferena entre a freqncia simples da classe modal e a imediatamente posterior a ela
h = amplitude de classe
Mo = 4 +
Ex. Calcular a moda por CZUBER para os dados da tabela anterior (notas de matemtica)
Temos: a classe modal 4 |--- 6 (3 classe, pois apresenta maior fi)
Li = 4 ; 1 = 46 23 = 23 ; 2 = 46 37 = 9 e h = 6 4 = 2
Logo: Mo = 4 +
23
.2 = 4 + 1,4375
23 + 9
Mo 5,44
Freqncia
D i stri b u i o d e n o ta s d e u m c o n j u n to d e
a lu n o s
16
14
12
10
8
6
4
2
0
0
4
No t a s
5. Em distribuies unimodais em que ocorrem medidas extremas muito destoantes da maior parte
das outras medidas, a mediana , provavelmente, a melhor medida de tendncia central. Ex:
Em uma distribuio de salrios em que muitos ganham pouco e poucos ganham muito, como
no caso deste conjunto de valores, para os funcionrios de uma pequena empresa: 300, 400,
400, 500, 600, 800, 10000, o clculo da mdia resulta em aproximadamente 1857. Observa-se
que este valor no representa bem os dados, pois embora seja este um bom salrio mdio, ele
s to alto devido ao fato de um funcionrio ganhar muito mais do que todos os outros, os
quais, por sua vez, ganham at bem pouco. Neste caso, a mediana, que 500, uma medida
de tendncia central que representa melhor o conjunto de salrios.
6. Em grupos de medidas unimodais e simtricos (onde a metade do histograma abaixo da moda
uma reflexo especular da metade acima da moda), obtm-se valores iguais para a mdia,
mediana e moda.
7. Quando um grupo de medidas sabe-se ser uma amostra de um grupo simtrico maior (que a
populao a partir da qual esta amostra foi colhida), a mdia da amostra est provavelmente
mais prxima do centro da distribuio maior de dados do que a mediana ou a moda.
Classes
02 |---- 04
04 |---- 06
06 |---- 08
08 |---- 10
10 |---- 12
PM
3
5
7
9
11
fi
3
5
10
6
2
26
fa
3
8
18
24
26
PM . fi
9
25
70
54
22
180
PM . fi
n
180
6,92
26
x = 6,92
fi = 10
h=86=2
n
( - ' fa )
(13 - 8)
.h = 6 +
.2 = 6 +1
c) Md = Li + 2
fi
10
Md = 7
45
1
.h
1 + 2
2 = 10 6 = 4
6 +
5
.2
5+4
, h=86=2
= 6 + 1,11... 7,11
Mo 7,11
M o 3.Md 2. x
Mo 7,16
Medidas de Disperso
As medidas de tendncia central no so suficientes para, sozinhas, caracterizarem um
conjunto de dados estatsticos. Vamos procurar entender o por que disto atravs de um exemplo.
Ex: Para cada uma das tabelas que se seguem: Tabela 1, Tabela 2 e Tabela 3, vamos calcular o
valor da mdia, da mediana e da moda, bem como levantar os respectivos histogramas.
Tabela 1
QI
fi
85 |--- 90
4
90 |--- 95
10
95 |--- 100
16
100 |--- 105
20
105 |--- 110
20
110 |--- 115
16
115 |--- 120
10
120 |--- 125
4
Total
100
fi PM
350
925
1560
2050
2150
1800
1175
490
10500
PM
87,5
92,5
97,5
102,5
107,5
12,5
117,5
122,5
Freqncia
20
15
10
5
122,5
117,5
12,5
107,5
102,5
97,5
92,5
87,5
QI
PM
97,5
102,5
107,5
12,5
fi PM
1462,5
3587,5
3762,5
1687,5
10500
Freqncia
102,5
107,5
12,5
QI
Mdia = 105
Mediana = 105
Moda = 105
H1 = 125 85 = 40
H2 = 115 95 = 20
H3 = 105 105 = 0
Estes resultados nos indicam que a primeira distribuio apresenta uma disperso maior do
que a segunda, a qual , por sua vez, maior do que a terceira.
Vejamos ainda um segundo exemplo.
Ex2: Tendo-se dois grupos, cada qual com 10 crianas, foi aplicado a cada uma delas um teste de
QI e o conjunto de valores que se obteve para cada grupo est listado a seguir. Calcular, para
cada grupo, o valor da mdia, bem como a amplitude total.
1o Grupo: 85, 105, 105, 105, 105, 105, 105, 105, 105, 125
Mdia1 = 105
H1 = 125 85 = 40
2o Grupo: 85, 90, 95, 100, 105, 105, 110, 115, 120, 125
Mdia2 = 105
H2 = 125 85 = 40
Observa-se que, se a mdia e a amplitude total fossem tomadas como medidas de
tendncia central e de disperso, respectivamente, representativas de cada uma das distribuies,
chegar-se-ia concluso de que as duas distribuies so aproximadamente iguais no que diz
respeito tanto ao valor em torno do qual as medidas se aglutinam, como quanto a heterogeneidade
das mesmas. Contudo, fica evidente, ao se perscrutar os dados, que uma das distribuies mais
heterognea que a outra. Qual?
Desta forma, o fato de a amplitude total ser uma medida que leva em conta, no seu
cmputo, apenas os valores extremos da distribuio, faz com que ela seja uma medida de
disperso pouco precisa, devendo ser usada apenas para efeito de inspeo preliminar do
conjunto de observaes.
Tabelas 4: Aluno B
Xi
Xi
4
5
6
6
5
4
Total
Aluno C
Xi X
0
-5
2
-3
4
-1
6
+1
8
+3
10
+5
Total
0
Xi
-1
0
+1
+1
0
-1
0
X >0. Assim, para qualquer distribuio, ao efetuarmos esta soma, obteremos zero.
Tabelas 5:
Xi
4
5
6
6
5
4
Total
X |, bem como de ( X i
Aluno B
Xi X | Xi X | ( Xi
-1
+1
0
0
+1
+1
+1
+1
0
0
-1
+1
0
4
Xi
X)
1
0
1
1
0
1
4
0
2
4
6
8
10
Total
Aluno C
X i X | X i X | ( X i X )2
-5
+5
25
-3
+3
9
-1
+1
1
+1
+1
1
+3
+3
9
+5
+5
25
0
18
70
Na ltima linha da terceira coluna de cada uma das duas tabelas, exibe-se o resultado da
soma:
N
i=1
Tambm, na ltima linha da quarta coluna de cada tabela, exibe-se o resultado da soma:
N
( Xi X)
i=1
( )2 .
ou Di
i =1
Com base nos clculos feitos neste exemplo podemos agora definir as seguintes medidas
de disperso:
Desvio Mdio
O desvio mdio, que ser denotado por DM, definido por:
N
Xi X
DM= i=1
| Di |
ou DM= i =1
, onde N o total de observaes feitas.
N
N
Das tabelas acima, obtemos para cada um dos alunos:
DMB = 4/6 = 0,666.... 0,7 e DMC = 18/6 = 3
49
Varincia
A varincia ser denotada por:
s2 , caso se trate de uma amostra;
2, caso se trate de uma populao.
e definida como:
N
( Xi X)
2
s = i=1
N -1
2 =
( X i X)
ou s 2 =
N-1
N
( )2
Di
i =1
, para amostra e
( )2
Di
i =1
ou 2 =
, para populao
N
N
onde, em ambos os casos, N o nmero total de observaes.
i=1
Das tabelas acima, obtemos para cada um dos alunos (considerando o conjunto de notas
de cada um como uma populao):
2B = 4/6 = 0,666.... 0,7
2C = 70/6 = 11,666... 11,7
Desvio Padro
O desvio padro ser denotado por:
s , caso se trate de uma amostra;
, caso se trate de uma populao.
e definido como a raiz quadrada da varincia:
N
s=
Xi X
i =1
)2
=
N-1
N
( X i X)
( )2
Di
i =1
N-1
N
ou
s=
s 2 , para amostra e
( )2
Di
i =1
=
ou = 2 , para populao
N
N
onde, em ambos os casos, N o nmero total de observaes.
i=1
18
Xi
129
= 7 ,1666... 7 ,2
18
18
Vamos ento calcular a varincia deste conjunto de notas (considerando-o como uma
populao), atravs da definio desta quantidade, dada anteriormente:
X=
=
( 8 7 ,2 )
i =1
( 5 7 , 2 ) + ( 5 7 ,2 ) + ( 5 7 , 2 ) + ( 6 7 ,2 ) + ( 6 7 ,2 ) + ( 6 7 ,2 ) + ( 6 7 ,2 ) + ( 6 7 ,2 )
+ ( 8 7 ,2 )
18
2
+ ( 8 7 ,2 )
+ ( 8 7 ,2 )
+ ( 8 7 ,2 )
+ ( 8 7 ,2 )
+ (8 7 ,2 )
+ ( 8 7 ,2 )
+ (10 7 , 2 )
+ (10 7 , 2 )
18
2
42,52
= 2,36222... 2,4
18
Notando-se a repetio de algumas parcelas nesta soma, poderamos ter efetuado a
mesma da seguinte maneira:
2
3 (5 7 ,2 ) + 5 ( 6 7 ,2 ) + 8 (8 7 ,2 ) + 2 (10 7 ,2 )
18
ou ainda, dispondo os valores das notas em uma tabela, com suas respectivas freqncias,
podemos usar a tabela como dispositivo prtico para o clculo da varincia:
Tabela 6:
xi
fi
fi xi
fi ( X i X )2 = fi . (Di)2
5
3
15
3 (5 - 7,2)2 = 14,52
6
5
30
5 (6 - 7,2)2 = 7,20
8
8
64
8 (8 - 7,2)2 = 5,12
10
2
20
2 (10 - 7,2)2 = 15,68
Total
18
129
42,52
Desta forma, na ltima linha da quarta coluna tem-se o somatrio da quantidade fi ( X i X )2
sobre todos os valores individuais das notas. Para se obter a varincia, basta dividir este valor pelo
nmero de notas. O desvio padro ento obtido tirando-se a raiz quadrada do valor assim
calculado.
Com base no caminho que seguimos para o clculo da varincia e do desvio padro para o
caso de dados tabulados no agrupados, podemos particularizar a definio destas quantidades
da seguinte maneira:
Varincia:
M
s2 =
fi Xi X
i =1
)2
ou s 2 =
( )2
fi D i
i =1
fi - 1
N-1
, para amostra e
i =1
M
2
fi ( X i X)
i=1
fi
ou 2 =
( )2
fi D i
i =1
N
, para populao
i=1
51
onde, neste caso, chamamos de M o nmero de observaes diferentes entre si, cada qual tendo
um valor de freqncia fi a si associada. importante no confundir M com o nmero total de
observaes que :
M
N = fi
i=1
Desvio Padro:
Por definio, o desvio padro sempre dado pela raiz quadrada da varincia. Portanto,
temos:
M
s=
fi Xi X
i =1
)2
=
( )2
fi D i
i =1
N-1
fi - 1
ou s =
s 2 , para amostra e
ou =
2 , para populao.
i =1
M
fi Xi X
i =1
)2
( )2
fi D i
i =1
N
fi
i =1
PM i fi
x = i =1 5
fi
708
30
i=1
52
Varincia:
M
f i ( PM i X )
2
s = i=1
, para amostra e
fi - 1
i=1
M
f i ( PM i X )
i=1
, para populao
fi
i=1
onde aqui M o nmero de classes, cada qual tendo um valor de freqncia fi a si associada.
M
Desvio Padro:
Por definio, o desvio padro sempre dado pela raiz quadrada da varincia. Portanto,
temos:
M
f i ( PM i X )
s=
i=1
f i ( PM i X )
, para amostra e =
fi - 1
i=1
, para populao.
fi
i=1
i=1
s =
s=
105,20
3,6
29
105,20
2
29
Considerando-se um conjunto de dados que seja descrito por uma distribuio normal
(tambm chamada Gaussiana) pode-se afirmar que:
No intervalo [ - , + ] se concentram 68,27% da populao;
No intervalo [ - 2, + 2] se concentram 95,45% da populao;
No intervalo [ - 3, + 3] se concentram 99,73% da populao.
Quando usar cada um dos coeficientes de variabilidade (medidas de disperso)
e as relaes existentes entre os vrios coeficientes
53
Vrias consideraes devem ser feitas na deciso de qual medida de variabilidade adotar
em uma determinada situao. Uma delas diz respeito estabilidade amostral da medida, isto , a
sua relativa constncia em repetidas amostragens. Com relao a este aspecto, quando a
amostragem aleatria, pode-se estabelecer uma ordem entre as medidas de disperso, indo da
mais precisa para a menos precisa: desvio padro, desvio mdio, amplitude semi-interquartlica e
amplitude total. No que diz respeito rapidez e facilidade de cmputo, a ordem inversa, isto , a
amplitude total a mais fcil e rpida de ser calculada e o desvio padro se encontra no extremo
oposto. Se clculos estatsticos posteriores (alm de medidas de posio e disperso) devem ser
feitos, tais como coeficientes de correlao, equaes de regresso, etc, ento o desvio padro
definitivamente a escolha mais acertada.
Comparando-se o desvio padro e o desvio mdio, uma vez que o primeiro definido em
termos de desvios quadrticos, trata-se de uma medida que associa um peso relativamente maior
para os maiores desvios com relao mdia. Se uma distribuio possui um nmero no usual
de casos extremos de desvio em uma ou ambas as direes, em relao mdia, alguns
investigadores preferem o desvio mdio ao desvio padro, como medida de disperso
A amplitude interquartlica atribui importncia ainda menor aos desvios extremos do que o
desvio mdio, e por esta razo, pode ser prefervel em algumas situaes, em detrimento do uso
do desvio mdio e do desvio padro. Esta uma medida que d maior importncia massa
central de medidas. Assim, quando a mediana a medida de valor central adotada, Q (amplitude
semi-interquartlica) deve ser a medida de variabilidade a ser usada conjuntamente, j que ambas
as medidas baseiam-se nos mesmos princpios.
Recapitulando:
Usar a amplitude total quando:
A.
Precisa-se do ndice de disperso mais rpido de ser calculado;
B.
Deseja-se informao relacionada com medidas extremas.
II.
Usar a amplitude semi-interquartlica quando:
A.
A mediana a nica medida de valor central de que se dispe;
B.
A distribuio se encontra truncada ou incompleta em alguma das extremidades;
C.
Existem algumas poucas medidas muito extremas, isto , muito mais desviadas da
medida de valor central que as restantes.
III.
Usar o desvio mdio quando:
A.
Existem desvios extremos os quais, quando quadrados, iriam aumentar em demasia a
estimativa do desvio padro;
B.
Um ndice de disperso bastante preciso desejado, sem que seja necessrio o trabalho
extra envolvido no clculo do desvio padro;
C.
A distribuio aproximadamente normal (gaussiana), e pretende-se estimar o desvio
padro a partir do desvio mdio.
IV.
Usar o desvio padro quando:
A.
Clculos que dependero do conhecimento desta medida devero ser feitos
posteriormente;
B.
So desejadas interpretaes relacionadas curva de distribuio normal.
I.
54
Exerccios:
1. Para os dados seguintes (I, II, III, IV, V, VI e VII), calcular:
a) Amplitude total;
b) Mdia aritmtica;
c) Varincia;
d) Desvio padro.
(I) 5, 6, 7, 8, 9, 10, 11
(II)
xi
fi
(III)
5
1
6
2
7
2
8
3
10
4
11
5
(IV)
Classes
151 |---- 158
158 |---- 165
165 |---- 172
172 |---- 179
179 |---- 186
Total
(V)
fi
5
18
42
27
8
100
Classes
5000 |--- 6000
6000 |----7000
7000 |----8000
8000 |----9000
9000 |----10000
10000 |----11000
11000 |----12000
Total
fi
8
10
16
14
10
5
2
65
(VI)
xi
200
230
280
290
315
500
(VII)
fi
3
8
11
12
15
16
Tempo (s)
17 |--- 22
22 |--- 27
27 |--- 32
32 |--- 37
37 |--- 42
fi
1
5
10
7
2
2. Calcule a mdia, desvio padro, varincia e desvio mdio para a distribuio da tabela
abaixo:
Classes
151 |--- 158
158 |--- 165
165 |--- 172
172 |--- 179
179 |--- 186
Total
fi
5
18
42
27
8
100
55
O clculo das probabilidades ir determinar o quanto estamos errando e qual o risco disso
acontecer no processo da induo, j que o mesmo no pode ser exato por partir de uma amostra
para concluir sobre a populao.
Estudaremos o clculo das probabilidades, a Estatstica descritiva e a Amostragem para em
seguida fazer o estudo da Estatstica indutiva.
HISTRICO
Em 1654, Blaise Pascal recebeu de seu amigo Chevalier de Mr a seguinte questo:
Em 8 lances de um dado, um jogador deve obter 1, mas aps 3 tentativas sem sucesso o jogo
interrompido. Como se deveria indenizar esse jogador ?.
Pascal, ento, iniciou, com Pierre de Fermat, uma correspondncia sobre problemas desse
tipo, que passou a ser considerado o ponto de partida da teoria das probabilidades (teoria dos
jogos de azar). Embora eles no divulgassem seus resultados, Huygens, em 1657, publicou um
pequeno folheto (sobre o raciocnio em jogos de dados), estimulado pela correspondncia entre
Pascal e Feremat.
Jaques Bernoulli (1654 1705), em seu tratado Ars conjectandi (A arte de conjecturar),
publicado em 1713, oito anos aps sua morte, dedicou os dois ltimos captulos a problemas que
ilustram a teoria das probabilidades.
Abraham De Moivre (1667 1754) nasceu na Frana mas, por motivo de perseguio
religiosa, acabou exilando-se na Inglaterra, onde dava grande quantidade de aulas de Matemtica
para se sustentar. Tomou contato com Newton e Halley e em 1697 foi eleito para o Royal Society
e mais tarde para as Academias de Paris e Berlim. Pretendia ser professor em uma academia mas
mesmo com a proteo de Leibniz no consegui e isso se deve em parte a sua descendncia
inglesa.
Moivre foi o mais importante devoto da Teoria das probabilidades, interessando-se em
desenvolve processos gerais e notaes que considerava como uma nova lgebra.
Sua obra mais clebre foi a Doutrina das Probabilidades, em 1718, onde apresenta
mais de 50 problemas e questes, entre outros, a questo sobre dados, a probabilidade de tirar
bolas de cores diferentes de uma urna e outros jogos.
atribudo a Moivre o princpio segundo o qual a probabilidade de um evento composto
o produto das probabilidades das componentes, embora essa idia j tivesse aparecido em
trabalhos anteriores. Este princpio aparece no Doutrina que ainda contm os primeiros
vestgios da lei dos erros ou curvas de distribuio interpretada por Moivre.
Moivre manteve cordial e extensa correspondncia com Jean Bernoulli entre 1704 e 1714,
tais eram os interesses comuns sobre sries infinitas e probabilidades. Nesta poca, seus
56
resultados adquiriram tamanha importncia que Newton ao ser procurado dizia Procure M.
Moivre; ele sabe essas coisas melhor do que eu.
Moivre morreu aos 88 anos, e a partir da, a pesquisa matemtica permaneceu por muito
tempo estagnada na Inglaterra.
Por volta de 1750, um sculo aps o contato entre Pascal e Fermat, Euler faz referncias
sobre expectativas de vida, loterias e outros aspectos. Mas foi Pierre Simon de Laplace quem
deu o maior avano teoria das probabilidades. Comeou a escrever artigos sobre probabilidades
em 1774 e os reuniu na sua obra Teoria analtica das probabilidades (1812). Laplace, em sua
obra Ensaios filosficos sobre probabilidades (1814), escreveu que a teoria das
probabilidades apenas o senso comum expresso em nmeros.
E outros nomes surgiram, tais como Karl Pearson (1857 1936) e Francis Galton (1822
1911), ligando a probabilidade definitivamente Estatstica. Na Rssia, Kolmogorov (1903)
resolveu, definitivamente, o problema de dar uma definio de probabilidade precisa e
completamente aceitvel, que foi o que se tentou fazer durante trs sculos e por volta de 1906,
inicia-se o estudo das cadeias ligadas de eventos, chamadas cadeias de Markov (Andrei
Andreyevitch Markov, 1856 1922). Ao longo da histria, percebe-se que o desenvolvimento da
teoria das probabilidades foi estimulado pela variedade de suas aplicaes, dentre as quais, a
Psicologia, a Gentica, a Economia, a Engenharia e a Estatstica.
No sculo XX, a Probabilidade e a Estatstica esto intimamente ligadas Matemtica
pura, bem como crescente a sua dependncia com relao aos computadores.
INTRODUO
Todas as vezes que se estudam fenmenos de observao, cumpre-se distinguir o prprio
fenmeno e o modelo matemtico (determinstico ou probabilstico) que melhor o explique.
Os fenmenos estudados pela Estatstica so fenmenos cujo resultado, mesmo em
condies normais de experimentao variam de uma observao para outra, dificultando dessa
maneira a previso de um resultado futuro.
Para a explicao desses fenmenos, fenmenos aleatrios, adota-se um modelo
matemtico probabilstico. Neste caso, o modelo utilizado ser o Clculo das probabilidades.
Na teoria das probabilidades, estudaremos os experimentos aleatrios eqiprovveis,
isto , experimentos onde qualquer resultado pode ocorrer com a mesma chance, por exemplo, no
lanamento de uma moeda, a probabilidade de ocorrer cara ou coroa a mesma, ou seja,
ambas tm a mesma chance de ocorrncia.
57
CONCEITOS INTRODUTRIOS
1. Experimento Aleatrio
todo experimento que mesmo repetido em condies idnticas apresentam resultados
imprevisveis.
No lanamento de uma moeda (no viciada) podem ocorrer dois resultados possveis: cara
ou coroa, mas no podemos prever a face que ocorrer aps cada lanamento da moeda, mesmo
que faamos o experimento por vrias vezes.
2. Espao Amostral
o conjunto de todos os resultados possveis de um experimento aleatrio.
Representaremos o espao amostral por S e o nmero de seus elementos por n(S).
Exemplos:
a) No lanamento de uma moeda, temos os seguintes resultados possveis:
S = {cara, coroa} e n(S) = 2
b) No lanamento de um dado (no viciado) temos os seguintes resultados possveis:
S = {1; 2; 3; 4; 5; 6} e n(S) = 6
3. Evento
todo (ou qualquer) subconjunto de um espao amostral.
Exemplo: No lanamento de um dado (no viciado) o espao amostral S = {1; 2; 3; 4; 5; 6}.
A partir desse espao amostral, podemos obter eventos do tipo:
a) Ocorrer um nmero mpar: A = {1; 3; 5}
b) Ocorrer um nmero primo: B = {2; 3; 5}
c) Ocorrer um nmero menor que 7: C = {1; 2; 3; 4; 5; 6} = S
d) Ocorrer um nmero maior que 6: D = { } ou D =
4. Evento certo
o prprio espao amostral e sempre vai ocorrer.
No exemplo anterior, o item (c) representa um evento certo.
No lanamento de uma moeda sempre vai ocorrer a uma cara ou uma coroa, portanto, o
evento ocorrer uma cara ou uma coroa um evento certo.
5. Evento impossvel
o evento que nunca vai ocorrer, ou seja, um conjunto vazio.
No exemplo do tpico (3), item (d) temos um caso de evento impossvel.
No lanamento de um dado (no viciado) o evento sair o nmero zero um evento
impossvel, ou seja, E = .
6. Evento simples
o evento constitudo por um nico elemento do espao amostral.
Exemplo:
No lanamento de um dado (no viciado), o evento sair o nmero 6 um evento simples.
7. Evento composto
o evento constitudo por mais de um elemento do espao amostral.
Exemplo:
No lanamento de um dado (honesto), o evento sair um nmero impar um evento
composto.
8. Evento Interseco
o evento formado pelos elementos que pertencem simultaneamente a todos os eventos
dados.
58
AB = {x / xA e xB}
A
o evento interseco
B
= AB
S (espao amostral)
Exemplo: Dados:
S = {1; 2; 3; 4; 5; 6} (espao amostral)
A = {1; 2; 3;4} (eventos de S)
B = {3; 4; 5}
Temos que: AB = {3; 4} o evento interseco.
1
2
B
3
4
5
6
9. Evento Unio
o evento formado pelos elementos que pertencem a pelo menos um dos eventos dados.
A U B = {x / xA ou xB}
S
A
A = {x / xS e xA} = S A
S
AB =
S
Exemplo: Dados: S = {1; 2; 3; 4; 5; 6} , A = {2; 4; 6} e B = {1; 3; 5}, temos:
AB = { } =
(Veja que A e B so eventos do espao amostral S e a interseco vazia pelo fato
de nenhum nmero par ser impar e vice-versa).
59
A2
A1
An
Exerccio:
No lanamento de um dado (no viciado) so considerados os seguintes eventos:
A: sair um nmero par.
A = {2; 4; 6}
B: sair um nmero menor ou igual a quatro.
B = {1; 2; 3; 4}
C: sair o nmero cinco.
C = {5}
Pede-se:
a) AB=
b) AC =
c) BC=
d) AUB=
e) AUC =
f) BUC =
g) A =
h) B =
i) C =
j) A B =
l) A C =
m) B C =
n) A UB =
o) A U C =
p) B U C =
r) A U C =
s) B U C =
q) A U B =
t) A I B =
u) A I C =
v) B I C =
Seja uma experincia em que pode ocorrer qualquer um dos n resultados possveis. Cada
um dos n resultados possveis chamado ponto amostral e o conjunto S de todos os pontos
amostrais chamado espao amostral; qualquer subconjunto A do espao amostral S
chamado de evento.
Chama-se probabilidade de ocorrer um evento A de um espao amostral S ao nmero:
P(A) =
n (A)
n (S)
onde:
P() = 0
(probabilidade do evento impossvel)
P(S) = 1
(probabilidade do evento certo)
0 P(A) 1
P(A) + P( A ) = 1
P( A ) = 1 P(A)
Exemplo 1:
Lanando-se um dado comum e honesto, determinar a probabilidade de que o nmero da
face voltada para cima seja maior que 2.
Temos:
a) O espao amostral : S= {1 ; 2 ; 3 ; 4 ; 5 ; 6}
n(S) = 6
n(A)
4
2
=
=
n(S)
6
3
P (A) =
2 1
=
6 3
n(A) = 4
ou P( A ) = 1 P(A) = 1
2
1
=
3
3
2
S
Exemplo 2 :
Uma urna contm quatro (4) bolas brancas, numeradas de 1 a 4 e trs(3) bolas pretas,
numeradas de 1 a 3, indistinguveis pelo tato ou pela cor. Determinar a probabilidade de obter:
a) Uma bola branca;
b) Um nmero par;
c) Uma bola branca e nmero par.
Temos: Espao amostral : S = {b1 ; b2 ; b3 ; b4 ; p1 ; p2 ; p3}
n(S) = 7
a) Evento bola branca : A = {b1 ; b2 ; b3 ; b4 }
P(A) =
n(A) 4
=
n(S) 7
P( A ) = 1 -
3
4
=
7
7
n(B) 3
=
n(S) 7
n(A) = 4
P( B) = 1
n(B) = 3
3
4
=
7
7
n(C) = 2
n(C)
2
=
n(S)
7
61
EXERCCIOS
01. Joga-se um dado honesto de seis faces e l-se o nmero da face voltada para cima. Calcular
a probabilidade de se obter:
a) O nmero 1;
b) Um nmero par;
c) Um nmero maior que 4;
d) Um nmero menor que 7;
e) Um nmero maior que 6.
02. Numa eleio para prefeito de uma certa cidade, concorreram somente os candidatos A e B.
Em uma seo eleitoral votaram 250 eleitores. Do nmero total de votos da urna dessa seo,
42% foram para o candidato A, 34% para o candidato B, 18% foram anulados e os restantes
estavam em branco. Tirando-se, ao acaso, um voto dessa urna, determinar a probabilidade de
que seja um voto em branco.
03. Retirando-se, ao acaso, uma carta de um baralho comum, de 52 cartas, qual a probabilidade
de se obter uma carta de copas ?
04. Os 240 cartes de um conjunto so numerados consecutivamente de 1 a 240. Retirando-se ao
acaso um carto desse conjunto, determinar a probabilidade do mesmo ser numerado com um
mltiplo de 13.
05. Uma urna contm trs bolas pretas e cinco bolas brancas. Quantas bolas azuis devem ser
colocadas nessa urna de modo que, retirando-se uma bola ao acaso, a probabilidade de ela
ser azul seja igual a 2/3 ?
06. Num grupo de 10 pessoas esto A e B. Escolhidas ao acaso 5 pessoas do grupo, qual a
probabilidade de A e B serem escolhidas ?
07. Uma pesquisa sobre os grupos sangneos ABO, na qual foram testadas 6000 pessoas
de um mesma raa, revelou que 2527 tm o antgeno A, 2234 o antgeno B e 1846 no tm
nenhum antgeno. Nestas condies qual a probabilidade de uma dessas pessoas,
escolhida aleatoriamente, ter os dois antgenos ?
08. A tabela a seguir d o nmero de mquinas de calcular existentes em um escritrio, segundo
suas caractersticas. Todas as mquinas esto embaladas em estojos iguais. Escolhendo um
estojo ao acaso, determine a probabilidade de:
a)
b)
c)
d)
NOVAS
USADAS
ELTRICAS MANUAIS
45
30
15
10
62
(Teorema da soma)
S
Para trs eventos temos:
P(AUBUC) = P(A) + P(B) + P(C) P(AB) P(AC) P(BC) + P(ABC)
II. Se (A B) = , A e B so chamados eventos mutuamente exclusivos (no podem ocorrer
simultaneamente). Neste caso, temos:
A
S
III. Se (A B) = e (A U B) = S, A e B so chamados eventos exaustivos e
B
S
A2
An
A1
A2
An
Exemplo 1:
Numa urna existem 10 bolas numeradas de 1 a 10. Retirando uma bola ao acaso, qual a
probabilidade de ocorrer mltiplo de 2 ou mltiplo de 3?
* Espao amostral: S = {1 ; 2 ; 3 ; ... ; 10}
n(S) = 10
* Evento mltiplo de 2 : A = {2 ; 4 ; 6 ; 8 ; 10}
n(A) = 5
* Evento mltiplo de 3 : B = {3 ; 6 ; 9}
n(B) = 3
A B = {6}
n(A B) = 1
Portanto:
7
5
3
1
P(A U B) = P(A) + P(B) P(A B) =
+
=
= 70%
10 10 10 10
Exemplo 2:
Numa urna existem 10 bolas numeradas de 1 a 10. Retirando uma bola ao acaso, qual a
probabilidade de ocorrer nmero mpar e mltiplo de 6 ?
* Espao amostral : S = {1 ; 2 ; 3 ; ... ; 10}
n(S) = 10
* Evento nmero mpar : A = {1 ; 3 ; 5 ; 7 ;9}
n(A) = 5
* Evento mltiplo de 6 : B = {6}
n(B) = 1
Como A e B so mutuamente exclusivos, pois A B = , temos:
5
1
6
P(A U B) = P(A) + P(B) =
+
=
= 60%
10
10
10
16. PROBABILIDADE CONDICIONADA
P(A / B) =
ou simplesmente P(A / B) =
P (A B)
P(B)
n( A I B)
P(B)
B
S
P (A B)
P(A)
ou P(B / A) =
n( A I B)
P( A )
Exemplo 1:
Numa urna existem quatro bolas brancas, numeradas de 1 a 4, e seis bolas pretas,
numeradas de 1 a 6. Retirando-se uma bola ao acaso, observa-se que a mesma preta. Qual a
probabilidade de seu nmero ser par ?
Sejam: * Evento nmero par : A = {b2 ; b4 ; p2 ; p4 ; p6}
* Evento bola preta : B = {p1 ; p2 ; p3 ; p4 ; p5 ; p6}
Temos:
(A B) = {p2 ; p4 ; p6}
n(A) = 3
n(B) =6
n(A B) = 3
64
3
P(A I B)
3
1
P(A / B) =
= 10 =
=
= 50% ou
6
P(B)
6
2
10
P(A / B) =
n( A I B)
3 1
=
= = 50%
P(B)
6 2
Observao: Para este problema bastaria considerar como espao amostral o conjunto dos
nmeros das bolas pretas, isto , {1; 2; 3; 4; 5; 6} e a probabilidade de o resultado ser par, ou
seja:
P(E) =
n(E)
3
1
=
=
= 50%
n(S)
6
2
Exemplo 2 :
Jogando-se um dado honesto e sabendo que ocorreu um nmero maior que 3, qual a
probabilidade de ser um nmero mpar ?
2
1
5
3
n(B) = 3
B
S
P(A / B) =
n(A I B)
1
=
n(B)
3
AB={5}
P(A / B) =
n(A B) = 1
1
3
P(B / A) = P(B)
I. Se A e B so dependentes, ento :
Exemplo:
Numa urna existem quatro bolas brancas, numeradas de 1 a 4, e seis bolas pretas, numeradas
de 1 a 6. Considere os eventos A , B e C, respectivamente: nmero par , bola preta e nmero
primo.
A = { b2 ; b4 ; p2 ; p4 ; p6 }
n(A) = 5
B = { p1 ; p2 ; p3 ; p4 ; p5 ; p6 }
n(B) = 6
C = { b2 ; b 3 ; p 2 ; p 3 ; p 5 }
n(C) = 5
A B = { p2 ; p 4 ; p 6 }
n(A B) = 3
A C = { b2 ; p 2 }
n(A C) = 2
S = { b1 ; b2 ; b3 ; b4 ; p1 ; p2 ; p3 ; p4 ; p5 ; p6 }
n(S) = 10
A e B so independentes, pois:
3
P(A B)
3
1
P(A / B) =
= 10 =
=
6
P(B)
6
2
10
5 1
=
10 2
P(A) =
P(A / B) = P(A)
A e C no so independentes, pois:
2
P(A C) 10
2
P(A / C) =
=
=
5
P(C)
5
10
Assim, P(A B) = P(A) . P(B) =
P(A) =
1 3
3
.
=
2 5
10
1
2
P(A / C) P(A)
Note que :
P(A C) =
1
5
; P(A) . P(C) =
1 1
1
.
=
2 2
4
P(A / B) =
P(A B)
n(A B)
=
P(B)
n(B)
P(B) =
i =1
A2
A1
A3
A4
An
66
U1
U2
U3
total
2
3
5
3
1
4
4
2
6
9
6
15
Os eventos UI (sair urna I), UII (sair urna II) e UIII (sair urna III) determinam uma
probabilidade total de S. Seja V o evento sair bola vermelha. Ento pelo teorema da probabilidade
total P(V) = P(UIV) + P(UIIV) + P(UIIIV)
Temos: P(UI) = 1/3 , P(UII) = 1/3 , P(UIII) = 1/3
P(V na urna I) = 2/5, P(V na urna II) = 3/4 e P(V na urna III) = 4/6
Pelo teorema da multiplicao, vem:
1 2
2
1 3
1
1 4
2
=
, P(UIIV) = .
=
e P(UIIIV) = .
=
P(UIV) = P(UI) . P(V / UI) = .
3 5
15
3 4
4
3 6
9
2
1
2
109
Ento; P(V) =
+
+
=
Obs.: P(UIV) = P(UI) . P(V / UI) (vide p.72)
15
4
9
180
P(A i ) . P(B / A i )
P(A1) . P(B / A 1 ) + P(A 2 ) . P(B / A 2 ) + ... + P(A n ) . P(B / A n )
Exemplo:
u1
u2
u3
1
5
3
9
3
2
4
9
3
3
2
8
total
7
10
9
26
67
Escolheu-se uma urna ao acaso e dela extraiu-se uma bola ao acaso, verificando-se que a
bola branca. Qual a probabilidade da bola ter vindo da urna 2 ? e da urna 3 ?
Temos: P(u1) = 1/3 ; P(u2) = 1/3 ; P(u3) 1/3
1
3 1
3
P(br/u1) =
; P(br/u2) =
=
; P(br/u3) =
9
9 3
8
Queremos: P(u2 / br) e P(u3 / br)
Aplicando o Teorema de Bayes, temos:
P(u2 / br) =
P(u2 ) . P(br / u2 )
P(u1) . P(br/u1 ) + P(u2 ) . P(br/u 2 ) + P(u3 ) . P(br/u3 )
1 1
.
24
3 3
P(u2 / br) =
=
1 1
1 1
1 3
59
. + . + .
3 9
3 3
3 8
Como podemos observar, a probabilidade a priori de u2 era 1/3. Dada a informao que saiu
24
.
uma bola branca, a probabilidade a posteriori de u2 ser
59
Analogamente, a probabilidade de a bola ter vindo da urna 3 ser:
P(u3 / br) =
P(u 3 ) . P(br / u 3 )
P(u1 ) . P(br/u1 ) + P(u 2 ) . P(br/u 2 ) + P(u3 ) . P(br/u3 )
1 3
.
27
3
8
P(u3 / br) =
=
1 1
1 1
1 3
59
. + . + .
3 9
3 3
3 8
Para obter a probabilidade da bola Ter vindo da urna 1 e utilizando os valores encontrados
pelo teorema de Bayes, basta recordar que:
P(u1 / br) + P(u2 / br) + P(u3 / br) = 1
Assim,
68
EXERCCIOS
01. Dois dados honestos, com faces numeradas de 1 a 6, so lanados simultaneamente.
Construir o espao amostral desse experimento e determinar a probabilidade de se obter dois
nmeros cuja soma 7.
1
2
3
4
5
6
02. Dois dados no viciados so lanados simultaneamente. Calcule a probabilidade de que suas
faces superiores exibam:
a) soma igual a 5 ou soma igual a 8;
b) soma igual a 7 ou produto igual a 6.
03. Uma urna contm exatamente doze bolas sendo trs azuis, quatro brancas e cinco vermelhas.
Quatro bolas so retiradas uma a uma, ao acaso e sem reposio. Sabendo que as trs
primeiras so de cores diferentes obtenha as probabilidade de a quarta ser :
a) azul
b) branca
c) vermelha
04. Uma urna contm apenas seis bolas azuis numeradas de 1 a 6 e seis bolas brancas
numeradas de 5 a 10. Uma bola retirada ao acaso dessa urna. Calcular a probabilidade de
se ter na bola retirada :
a) o nmero 5;
b) o nmero 5, sabendo que a bola branca;
c) o nmero 5, sabendo que o nmero da bola mpar.
69
05. Uma urna contm somente 10 bolas sendo 6 brancas e 4 pretas. Duas bolas so retiradas
sucessivamente e ao acaso dessa urna, sem reposio da primeira antes da retirada da
segunda. Calcular a probabilidade de se obter:
a) duas bolas brancas;
b) a primeira branca e a segunda preta;
c) a primeira preta e a segunda branca;
0,25.
Determinar
07. Ao se tentar abrir uma porta com um chaveiro contendo vrias chaves parecidas, das quais
apenas uma destranca a referida porta, muitas pessoas acreditam que mnima a chance de
se encontrar a chave certa na 1 tentativa, e chegam mesmo a dizer que essa chave s vai
aparecer na ltima tentativa. Para esclarecer essa questo, calcule, no caso de um chaveiro
contendo 5 chaves:
a) a probabilidade de se acertar na 1 tentativa;
b) a probabilidade de se encontrar a chave certa depois da 1 tentativa
c) a probabilidade de se acertar somente na ltima tentativa.
70
RESUMO DE PROBABILIDADES
1. CONCEITO
Numa experincia com vrios resultados possveis, todos com a mesma chance de
ocorrer, dizemos que:
a) ESPAO AMOSTRAL (representado por S) o conjunto de todos os resultados
possveis dessa experincia (ou experimento);
b) EVENTO (representado por E) qualquer subconjunto do espao amostral;
c) n(S) o nmero de elementos de S e n(E) o nmero de elementos de E.
A probabilidade de ocorrer o evento E, de um espao amostral S , dada
por:
n de casos favorveis (o que se quer).
n(E)
P(E) =
n(S)
n de casos possveis.
2. PROPRIEDADES:
a) P() = 0 (evento impossvel)
b) P(S) = 1 ou 100% (evento certo)
c) 0 P(E) 1
E
d) P(E) + P( E ) = 1
E
EX.1 Joga-se, ao acaso, um dado honesto de seis faces numeradas de 1 a 6 e lse o nmero da faca voltada para cima. Calcular a probabilidade de obter:
a) o nmero 1
b) um nmero par
c) um nmero maior que 4
d) um nmero menor que 7
e) um nmero maior que 6
Soluo:
O espao amostral S = {1; 2; 3; 4; 5; 6} e n(S) = 6
n( A )
1
a) A = { 1 }
n(A) = 1 e P(A) =
=
P(A) 0,1667 16,67%
n(S)
6
n(B)
3
b) B = {2; 4; 6 }
n(B) = 3 e P(B) =
=
P(B) = 0,50 = 50%
n(S)
6
n(C) 2 1
c) C = {5; 6}
n(C) = 2 e P(C) =
= =
P(C) 0,3334 33,34%
n(S) 6 3
n(D) 6
d) D = {1;2;3;4;5;6}
n(D) = 6 e P(D) =
=
P(D)=P(S) =1=100%
n(S) 6
n(E)
0
e) E = { } ou E =
n(E) = 0 e P(E) =
=
P(E)=P() = 0 = 0%
n(S)
6
EX.2 Numa urna existem 4 bolas numeradas de 1 a 4 que diferem apenas pela
numerao. Retiram-se duas bolas, ao acaso e simultaneamente. Qual a probabilidade
de obter bolas com nmeros que tm soma par?
Soluo:
O espao amostral S = {(1;2),(1;3),(1;4),(2;3),(2;4),(3;4)}
n(S) = 6
2
n(E)
1
=
=
33,34%
E = {(1;3),(2;4)}
n(E) = 2
P(E) =
n(S)
3
6
71
Obs.: ou = U
72
4
4
8
2
+
=
=
15,38%
52
52
52
13
P(RUC) = P(R) + P(C) P(RC)
e) Rei ou Copas
RC = {Rc}
n(RC) =1
16
n(R )
n(C)
n(R I C)
4 13 1
4
P(RUC) =
+
=
+
=
=
30,77%
n(S)
n(S)
n(S)
52 52 52
13
52
Ex.2 No lanamento de dois dados honestos com faces numeradas de 1 a 6,
determinar a probabilidade de que os nmeros obtidos tenham soma 8 ou produto
impar.
Soluo:
U
O espao amostral formado por: n(S) = 6 . 6 = 36 pares
A = {soma 8} = {(2;6),(3;5),(4;4),(5;3),(6;2)}
n(A) = 5
B = {produto impar} = {(1;1),(1;3),(1;5),(3;1),(3;3),(3;5),(5;1),(5;3),(5;5)} n(B) = 9
AB = {(3;5),(5;3)}
n(AB) = 2
Portanto:
n(A )
n(B)
n( A I B)
P(A U B) = P(A) + P(B) P(A B) =
+
n(S)
n(S)
n(S)
5
9
2
12
1
P(A U B) =
+
=
=
33,34%
36
36
36
36
3
d) Rei ou Dama
EXERCCIOS
01. Sejam A e B dois eventos tais que P(A) = 0,3 e P(A U B) = 0,7. Seja P(B) = x.
Para que valor de x, A e B so mutuamente exclusivos?
02. Lanando-se um dado honesto de seis faces numeradas de 1 a 6, qual a
probabilidade de ocorrer na face superior:
a) o nmero 5;
b) um nmero impar;
c) um nmero menor que 3.
03. Uma urna contm 10 bolas brancas, 8 vermelhas e 6 pretas, todas idnticas.
Retirando-se uma bola ao acaso, qual a probabilidade de:
a) sair branca;
b) sair vermelha;
c) no sair preta;
d) no sair vermelha;
e) sair branca ou preta.
04. Uma caixa contm 20 peas de um mesmo tipo, das quais 4 so defeituosas.
Determine a probabilidade de retirarmos uma pea boa desta caixa.
05. Lana-se uma moeda 2 vezes.
a) Obtenha o espao amostral S;
b) Determine a probabilidade de ocorrer cara nos dois lances;
c) Determine a probabilidade de ocorrerem resultados iguais
73
06. Uma urna contm 20 bolas idnticas numeradas de 1 a 20. Extraindo-se uma bola
ao acaso dessa urna, qual a probabilidade do nmero da bola sorteada ser:
a) mltiplo de 2 ou de 3;
b) mltiplo de 5 ou de 7.
4. PROBABILIDADE DA INTERSECO DE EVENTOS (Regra do Produto)
Consideremos dois eventos A e B contidos num mesmo espao amostral S ,
sendo A e B independentes, isto , a ocorrncia de um deles no influencia na
ocorrncia do outro. A probabilidade de ocorrer A e B (A B) dada por:
Obs.: e =
branca na 1 e
branca na 2
74
EXERCCIOS
01. Sejam A e B dois eventos tais que P(A) = 0,2 e P(A U B) = 0,8. Seja P(B) = x.
Para que valor de x, A e B so independentes?
02. Uma urna contm 12 bolas brancas e 18 bolas verdes.
sucessivamente, sem reposio, duas bolas, qual a probabilidade de:
a) ambas serem brancas;
b) ambas serem verdes;
c) a 1 branca e a 2 verde;
d) de cores diferentes.
Retirando-se
03. Um atirador tem 25% de chance de acertar um tiro no alvo. Dando trs tiros, qual
a probabilidade de acertar:
a) uma nica vez o alvo;
b) duas vezes o alvo.
04. Um lote possu 20 peas onde 6 possuem qualidade tipo A. Retirando-se duas
peas desse lote, qual a probabilidade de ambas no possurem esta qualidade
quando:
a) h reposio da 1 pea no lote;
b) no h reposio da 1 pea no lote.
Distribuies discretas de probabilidade
1. Distribuio Binomial
Uma varivel aleatria tem distribuio Binomial quando um experimento fundamentado
nas seguintes hipteses:
A) so realizadas n provas independentes:
B) cada prova uma prova de Bernoulli, ou seja, s pode levar a sucesso ou fracasso;
C) a probabilidade p de sucesso em cada prova constante. Em conseqncia, a
probabilidade de fracasso q = 1 p tambm o .
Uma varivel aleatria X, com distribuio de Bernoulli, igual ao nmero de sucessos nessas
n provas. Assim, X poder assumir os valores 0, 1, 2, 3, ... ,n.
Se nessas n provas ocorrer sucessos nas k primeiras provas e fracassos nas (n k)
provas restantes, temos:
1, 1, 1, ... , 1 e 0, 0, 0, ... , 0 ou p, p, p, ... , p e q, q, q, ... ,q
pk e qn k
k
nk
nk
n
n!
onde : =
, nk
k k! (n k )!
Soluo: Temos: n = 5, k = 3,
3
5 1 1
Ento: P(X = 3) = . .
3 2 2
p=
53
1
1
1
eq=1p=1
=
2
2
2
3
5!
1 1
=
. .
3! (5 3)! 2 2
5.4.3! 1
1
20
1
10
5
.
.
=
.
=
=
= 0,3125 = 31,25%
3!. 2!
8
4
2.1 32
32
16
Ex. 2 Num teste do tipo certo-errado, com 10 perguntas, qual a probabilidade de um
aluno, respondendo as questes ao acaso, acertar 70% das perguntas?
Soluo:
1
1
Temos: n = 10, k = 70% . 10 = 7, p =
e q=1p=
2
2
P(X = 3) =
10
10 1 1
10 1
10.9.8
1
120
P(x = 7) = . . = . =
=
0,1172 11,72%
.
3.2.1 1024
1024
7 2 2
3 2
Ex. 3 A probabilidade de um atirador acertar o alvo 1/3. Se ele atirar 6 vezes, qual a
probabilidade de:
a) acertar exatamente 2 tiros?
b) no acertar nenhum tiro?
Soluo:
1
1
2
=
e k = n de tiros
Temos: n = 6, p = , q = 1 p = 1
3
3
3
2
6
a) P(x = 2) = .
2
6.5 1 16
240
1 2
.
.
=
0,3292 32,92%
. =
2.1 9 81
729
3 3
6
b) P(x = 0) = .
0
64
1 2
0,0878 8,78%
. =1.1.
729
3 3
Ex. 4 Sabe-se que 80% dos animais submetidos a um certo tratamento sobrevivem. Se esse
tratamento foi aplicado a 10 animais, qual a probabilidade de que exatamente 5 sobrevivam?
Soluo:
Temos: n = 10, k = 5, p = 80% = 0,8 e q = 1 p = 1 0,8 = 0,2 (20%)
10
10.9.8.7.6
Ento: P(X = 5) = . 0,8 5 . 0,210 5 =
. 0,32768 . 0,2 5
5
5
.
4
.
3
.
2
.
1
P(X = 5) = 252 . 0,32768 . 0,00032 0,02642 2,64%
f(x) =
x 2
1 .
2
e
,
.
. 2
onde: = mdia de distribuio
= desvio-padro
= 3,1416
e = 2,7182
< x < +
50%
50%
Mo Md
A tabela de faixa central d a rea sob a curva normal padro entre Z = 0 e qualquer valor
positivo de Z, mas, sendo a curva simtrica em relao mdia, em torno de z = 0, os valores
fornecidos so vlidos tambm para valores negativos de z. O sinal da varivel Z serve apenas
para indicar se o valor est acima ou abaixo da mdia.
Portanto, P(0 Z zo) = P(zo Z 0)
rea = probabilidade da varivel aleatria z
estar entre z = 0 e z = zo
0
zo
3 2 1
68,27%
95,45%
99,73%
78
zo
zo
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0
0.1
0.2
0.3
0.4
0.0000
0.0398
0.0793
0.1179
0.1554
0.0040
0.0438
0.0832
0.1217
0.1591
0.0080
0.0478
0.0871
0.1255
0.1628
0.0120
0.0517
0.0910
0.1293
0.1664
0.0160
0.0557
0.0948
0.1331
0.1700
0.0199
0.0596
0.0987
0.1368
0.1736
0.0239
0.0636
0.1026
0.1406
0.1772
0.0279
0.0675
0.1064
0.1443
0.1808
0.0319
0.0714
0.1103
0.1480
0.1844
0.0359
0.0753
0.1141
0.1517
0.1879
0.5
0.6
0.7
0.8
0.9
0.1915
0.2257
0.2580
0.2881
0.3159
0.1950
0.2291
0.2612
0.2910
0.3186
0.1985
0.2324
0.2642
0.2939
0.3212
0.2019
0.2357
0.2673
0.2967
0.3238
0.2054
0.2389
0.2704
0.2995
0.3264
0.2088
0.2422
0.2734
0.3023
0.3289
0.2123
0.2454
0.2764
0.3051
0.3315
0.2157
0.2486
0.2794
0.3078
0.3340
0.2190
0.2518
0.2823
0.3106
0.3365
0.2224
0.2549
0.2852
0.3133
0.3389
1.0
1.1
1.2
1.3
1.4
0.3413
0.3643
0.3849
0.4032
0.4192
0.3438
0.3665
0.3869
0.4049
0.4207
0.3461
0.3686
0.3888
0.4066
0.4222
0.3485
0.3708
0.3907
0.4082
0.4236
0.3508
0.3729
0.3925
0.4099
0.4251
0.3531
0.3749
0.3944
0.4115
0.4265
0.3554
0.3770
0.3962
0.4131
0.4279
0.3577
0.3790
0.3980
0.4147
0.4292
0.3599
0.3810
0.3997
0.4162
0.4306
0.3621
0.3830
0.4015
0.4177
0.4319
1.5
1.6
1.7
1.8
1.9
0.4332
0.4452
0.4554
0.4641
0.4713
0.4345
0.4463
0.4564
0.4649
0.4719
0.4357
0.4474
0.4573
0.4656
0.4726
0.4370
0.4484
0.4582
0.4664
0.4732
0.4382
0.4495
0.4591
0.4671
0.4738
0.4394
0.4505
0.4599
0.4678
0.4744
0.4406
0.4515
0.4608
0.4686
0.4750
0.4418
0.4525
0.4616
0.4693
0.4756
0.4429
0.4535
0.4625
0.4699
0.4761
0.4441
0.4545
0.4633
0.4706
0.4767
2.0
2.1
2.2
2.3
2.4
0.4772
0.4821
0.4861
0.4893
0.4918
0.4778
0.4826
0.4864
0.4896
0.4920
0.4783
0.4830
0.4868
0.4898
0.4922
0.4788
0.4834
0.4871
0.4901
0.4925
0.4793
0.4838
0.4875
0.4904
0.4927
0.4798
0.4842
0.4878
0.4906
0.4929
0.4803
0.4846
0.4881
0.4909
0.4931
0.4880
0.4850
0.4884
0.4911
0.4932
0.4812
0.4854
0.4887
0.4913
0.4934
0.4817
0.4857
0.4890
0.4916
0.4936
2.5
2.6
2.7
2.8
2.9
0.4938
0.4953
0.4965
0.4974
0.4981
0.4940
0.4955
0.4966
0.4975
0.4982
04941
0.4956
0.4967
0.4976
0.4982
0.4943
0.4957
0.4968
0.4977
0.4983
0.4945
0.4959
0.4969
0.4977
0.4984
0.4946
0.4960
0.4970
0.4978
0.4984
0.4948
0.4961
0.4971
0.4979
0.4985
0.4949
0.4962
0.4972
0.4979
0.4985
0.4951
0.4963
0.4973
0.4980
0.4986
0.4952
0.4964
0.4974
0.4981
0.4986
3.0
3.1
3.2
3.3
3.4
0.4986
0.4990
0.4993
0.4995
0.4997
0.4987
0.4991
0.4993
0.4995
0.4997
0.4987
0.4991
0.4994
0.4995
0.4997
0.4988
0.4991
0.4994
0.4996
0.4997
0.4988
0.4992
0.4994
0.4996
0.4997
0.4989
0.4992
0.4994
0.4996
0.4997
0.4989
0.4992
0.4994
0.4996
0.4997
0.4989
0.4992
0.4995
0.4996
0.4997
0.4990
0.4993
0.4995
0.4996
0.4998
0.4990
0.4993
0.4995
0.4997
0.4998
3.5
3.6
3.7
3.8
3.9
0.4998
0.4998
0.4999
0.4999
0.5000
0.4998
0.4998
0.4999
0.4999
0.5000
0.4998
0.4999
0.4999
0.4999
0.5000
0.4998
0.4999
0.4999
0.4999
0.5000
0.4998
0.4999
0.4999
0.4999
0.5000
0.4998
0.4999
0.4999
0.4999
0.5000
0.4998
0.4999
0.4999
0.4999
0.5000
0.4998
0.4999
0.4999
0.5000
0.5000
0.4998
0.4999
0.4999
0.5000
0.5000
0.4998
0.4999
0.4999
0.5000
0.5000
79
2 PARCELA
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,3
0,4177
1,39
Exemplo 1:
O tempo necessrio para executar uma tarefa uma varivel normal de mdia 60 minutos e
desvio padro 5 minutos. Qual a proporo de vezes que o tempo necessrio ser:
a) maior que 70 minutos?
b) menor que 65 minutos?
50%
c) exatamente 40 minutos?
d) maior que 53 e menor que 62 minutos?
Soluo:
Temos: = 60 e = 5
x 60
x
Pela transformao linear z =
=
60 70
X
5
70 60
0,4772
a) x = 70
zo =
= 2,00
5
Da tabela obtemos: 0,4772
Z
zo=2,00
50%
50%
65 60
= 1,00
5
Da tabela obtemos: 0,3413
b) x = 65
zo =
60
65
X
0,3413
50%
Z
0 zo=1,00
80
d) x = 53
z=
53 60 62
0,4192
X
0,1554
z=
x
x 1,60
=
0,30
1,50 1,60
z1 = 0,33
0,30
1,80 1,60
x2 = 1,80
z2=
z2 = 0,67
0,30
P(1,50 < x < 1,80) = P(0,33 < Z < 0,67)
a) x1 = 1,50
z1 =
Tab. : 0,1293
Tab.: 0,2486
0,33
0,2486
0,67
b) x = 1,75
z1 =
z1 = 0,5
Tab. : 0,1915
0,5
50%
0,1915
1,60 1,75
0,5
81
P(x > 1,75) = P(z > 0,5) = 0,5000 0,1915 = 0,3085 = 30,85%
1,48 1,60
0,30
P(x < 1,48) = P(z < 0,4)
c) x = 1,48
z1 =
z1 = 0,4
50%
Tab. : 0,1554
0,5
0,1554
1,48 1,60
0,4
P(x < 1,48) = P(z < 0,4) = 0,5000 0,1554 = 0,3446 = 34,46%
d) A operao inversa aos itens (a), (b) e (c), ou seja, dada a probabilidade, determine
a medida.
0,4 = 40%
Na tabela com
P(z) = 0,4000,
encontramos
Z0 = 1,28
0,1 = 10%
z=
Zo
1,60 x
1,28 =
x 1,60
0,30
x = 1,98 m
82
ESTATSTICA DESCRITIVA
(ANOTAES DE AULA)
ALUNO(A):______________________________ RA.:_________
PROF. MACHADO
1 SEMESTRE DE 2013
83