Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTATSTICA - CURSO 1
INPE
So Jos dos Campos
Maro de 2003
SUMRIO
Pg.
LISTA DE FIGURAS
LISTA DE TABELAS
CAPTULO 1 INTRODUO . . . . . . . . . . . . . . . . . . . . .
11
11
12
12
14
14
16
18
20
20
1.7.1 Mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
1.7.2 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
1.7.3 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
22
22
22
. . . . . . . . . . . . . . . . . . . . . . . . .
23
1.8.4 Varincia ( 2 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
24
. . . . . . . . . . . . . . . . . . . . .
24
1.9.1 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
1.9.2 Assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
1.9.3 Curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
CAPTULO 2 PROBABILIDADE
. . . . . . . . . . . . . . . . . .
27
27
27
28
2.4 Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
30
30
32
32
33
2.7.3 Complemento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
34
35
37
38
2.10.1 Permutao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
2.10.2 Combinaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
40
41
43
44
47
47
47
50
52
52
54
. . . . . . . . . . . . . . . . . . . . . . . . . .
55
58
58
59
59
61
61
62
62
3.8 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
63
64
64
65
66
66
67
69
69
74
75
76
77
81
81
82
87
89
. . . . . . . . . . . . . . . . . . . . . . . .
92
94
94
95
97
4.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
97
97
4.1.2 Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
97
97
97
98
99
. . . . . . . . . . . . . . . . . . . . . .
101
4.4 A Distribuio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
102
104
105
106
4.6 Distribuio F
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
107
107
108
108
. . . . . . .
111
114
114
115
117
. . . . . . . . . . . . . . . . . . . . . . . . . .
117
118
118
5.4.1 conhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
118
5.4.2 desconhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
119
122
5.6 Teste da hiptese de que a varincia populacional tem um valor especfico 123
5.7 Teste da razo de varincias . . . . . . . . . . . . . . . . . . . . . . . .
125
127
5.8.1
5.8.2
12
12
12
e
e
22
22
22
conhecidas . . . . . . . . . . . . . . . . . . . . . . . . . . . .
127
desconhecidas, mas 12 = 22 . . . . . . . . . . . . . . . . . . .
127
12
22
. . . . . . . . . . . . . . . . . . .
128
132
133
5.8.3
desconhecidas, mas
6=
134
139
140
150
152
157
161
LISTA DE FIGURAS
Pg.
1.1
12
1.2
Histograma de freqncia . . . . . . . . . . . . . . . . . . . . . . . . .
16
1.3
17
1.4
18
1.5
19
1.6
20
1.7
21
1.8
Exemplos de curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
2.1
32
2.2
33
2.3
Complemento do conjunto A . . . . . . . . . . . . . . . . . . . . . . . .
34
2.4
45
3.1
48
3.2
Grfico de f dp de f . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
50
3.3
Grfico F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
52
3.4
53
3.5
54
3.6
55
3.7
90
3.8
90
6.1
6.2
142
6.3
157
6.4
158
LISTA DE TABELAS
Pg.
1.1
15
1.2
17
1.3
18
1.4
20
5.1
118
5.2
Canditados selecionados . . . . . . . . . . . . . . . . . . . . . . . . . .
134
5.3
Valores da Eij . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
137
CAPTULO 1
INTRODUO
1.1
O que Estatstica?
11
1.2
Tipos de Variveis
12
2-
13
Distribuies de Freqncia
14
fi = n
(1.1)
i=0
Exemplo
Seja o conjunto de dados abaixo (Tabela 1.1), que representa o nmero filhos de
funcionrios da empresa Fictcia S.A..
Freqncia
15
10
13
6
3
3
50
As freqncias so:
f0 = 15 (corresponde ao valor 0)
f1 = 10 (corresponde ao valor 1)
f2 = 13 (corresponde ao valor 2)
f3 = 6 (corresponde ao valor 3)
f4 = 3 (corresponde ao valor 4)
f5 = 3 (corresponde ao valor 5)
15
Freq. Relativa
0,30
0,20
0,26
0,12
0,06
0,06
1,00
(1.2)
pi = 1
(1.3)
pi =
i=0
1.5
16
Freqncia
Freq. Relativa
0
1
2
3
4
5
Total
15
10
13
6
3
3
50
0,30
0,20
0,26
0,12
0,06
0,06
1,00
Freq. Relativa
Acumulada
0,30
0,50
0,76
0,88
0,94
1,00
-
17
Freqncia
2
11
18
10
8
1
50
18
Freq. Relativa
0,04
0,22
0,36
0,20
0,16
0,02
1,00
19
Num. de Funcionrios
0
2
13
31
41
50
1.6.1
Curvas de Freqncia
20
Mdia
e
A mdia de um conjunto de N nmeros X1 , X2 , ..., XN representada por X
definida por:
= X1 + X2 + ... + XN
X
N
PN
i=1 Xi
=
N
(1.4)
X
=
m
X
xi
i=1
fi
N
fi
N
(1.5)
nmero de classes.
1.7.2
Mediana
21
Moda
A moda o valor que ocorre com mais freqncia. A moda pode no existir e, mesmo
que exista, pode no ser nica.
Exemplos:
{1, 1, 3, 3, 5, 7, 7, 7, 11, 13} tem moda 7
{3, 5, 8, 11, 13, 18} no tem moda
{3, 5, 5, 5, 6, 6, 7, 7, 7, 11, 12} tem duas modas 5 e 7 (bimodal)
1.8
Medidas de Disperso
Amplitude Total
Desvio Mdio
i=1
|
| Xi X
N
Exemplo:
O desvio mdio de {2, 3, 6, 8, 11} 2.8
22
(1.6)
Para dados agrupados (em tabelas de freqncia) o desvio padro computado por:
m
1 X
| fi
DM =
| Xi X
N i=1
(1.7)
Coeficiente de Variao
Disp. absoluta
M edia
(1.8)
Varincia ( 2 )
i=1
2
(xi X)
N
(1.9)
23
1.8.5
Desvio Padro ()
PN
i=1
2
(xi X)
N
(1.10)
1.9
1.9.1
Pm
i=1
fi
(xi X)
N
(1.11)
mr =
(1.12)
i=1
Observao:
= m0
X
1
0 2
0
2 = m2 m1
m1 = 0
2 = m2
24
Xi X
N
r
(1.13)
i=1
xi X
N
fi
(1.14)
Assimetria
moda
X
s
(1.15)
1.9.3
m3
m3
=p 3
3
s
m2
(1.16)
Curtose
25
m4
m4
= 2
4
s
m2
(1.17)
26
CAPTULO 2
PROBABILIDADE
2.1
P (e1 ) =n
n1
n
(2.1)
Onde:
e1 o resultado;
n o nmero total de vezes que se repete o experimento;
n1 o nmero de vezes que o resultado e1 ocorre;
n1
n
i = 1, 2, ..., N
2.2
(2.2)
Experimentos aleatrios
27
Exemplos:
a) Lanamento de uma moeda honesta;
b) Lanamento de um dado;
c) Lanamento de duas moedas;
d) Retirada de uma carta de um baralho completo de 52 cartas;
e) Determinao da vida til de um componente eletrnico.
2.3
Espao Amostral
Eventos
28
Exemplos:
1. No lanamento de um dado, onde S = {1, 2, 3, 4, 5, 6}, temos:
a) A = {2, 4, 6} S; logo A um evento de S;
b) B = {1, 2, 3, 4, 5, 6} S; logo B um evento certo de S (B = S);
c) C = {4} S; logo C um evento elementar de S;
d) D = S; logo D um evento impossvel de S.
Um evento sempre definido por uma sentena. Assim os eventos acima podem ser
definidos pelas sentenas: a) "Obter um nmero par"; b) "Obter um nmero menor
ou igual a seis"; c) "Obter um nmero maior que trs e menor que cinco"; d) "Obter
um nmero maior que seis".
2. Lanam-se dois dados. Enumerar os seguintes eventos:
a) Sada de faces iguais;
b) Sada de faces cuja soma seja igual a 10;
c) Sada de faces cuja soma seja menor que 2;
d) Sada de faces cuja soma seja menor que 15;
e) Sada de faces onde uma face o dobro da outra.
Neste caso, o espao amostral pode ser representado por uma tabela de dupla
entrada:
D2
(1, 1)
(1, 2)
(1, 3)
(1, 4)
(1, 5)
(1, 6)
(2, 1)
(2, 2)
(2, 3)
(2, 4)
(2, 5)
(2, 6)
(3, 1)
(3, 2)
(3, 3)
(3, 4)
(3, 5)
(3, 6)
(4, 1)
(4, 2)
(4, 3)
(4, 4)
(4, 5)
(4, 6)
(5, 1)
(5, 2)
(5, 3)
(5, 4)
(5, 5)
(5, 6)
(6, 1)
(6, 2)
(6, 3)
(6, 4)
(6, 5)
(6, 6)
D1
S=
29
a) A = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)};
b) B = {(4, 6), (5, 5), (6, 4)};
c) C = (evento impossvel);
d) D = S (evento certo);
e) E = {(1, 2), (2, 1), (2, 4), (3, 6), (4, 2), (6, 3)}.
2.5
{e1 , e2 , e3 , e4 }
2.6
Dado um experimento aleatrio, sendo S o seu espao amostral, vamos admitir que
todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S um
conjunto eqiprovvel.
Definimos probabilidade de um evento A (A S) ao nmero real P (A), tal que:
P (A) =
no de resultados f avoraveis a A
n(A)
=
o
n de resultados possiveis
n(S)
(2.3)
Exemplo:
Considerando o lanamento de um dado, pede-se:
a) A probabilidade do evento A "obter um nmero par na face superior".
Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
A = {2, 4, 6} n(A) = 3.
Logo, P (A) =
3
6
= 12 .
30
6
6
= 1.
0
6
= 0.
Exerccios Complementares:
1 - No lanamento de dois dados, calcule a probabilidade de se obter soma
igual a 5.
2 - Qual a probabilidade de sair uma figura quando retiramos uma carta de
um baralho de 52 cartas?
3 - Retira-se uma carta de um baralho completo de 52 cartas.
a) Qual a probabilidade de sair uma carta de copas ou de ouros?
b) Qual a probabilidade de sair um rei ou uma carta de espadas?
4 - No lanamento de um dado, qual a probabilidade de se obter um nmero
no inferior a 5?
5 - So dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma
carta do primeiro baralho e uma carta do segundo. Qual a probabilidade
de tiramos uma dama e um rei, no necessariamente nessa ordem?
31
2.7
Unio de conjuntos
Observao:
1) A B = B A
2) A A = A
3) A = A
4) Se A B A B = B (em particular A S = S).
32
Ai
(2.4)
i=1
2.7.2
Interseco de conjuntos
Observao:
1) A B = B A
2) A A = A
3) A =
4) Se A B A B = A (em particular A S = A)
5) (A B) C = A (B C).
A representao da interseco de n eventos A1 , A2 , ..., An (A1 A2 ... An ) dada
33
por:
n
\
Ai
(2.5)
i=1
2.7.3
Complemento
Definio: S A = A = Ac = {ei S / ei
/ A} , i = 1, . . . , n. O complemento de
um evento A , portanto, o evento contendo todos os resultados no espao amostral
S que no pertenam a A. O complemento de A pode ser visto na Figura 2.3.
Observao:
1) (Ac )c = A
2) A Ac = S
3) c = S
4) A Ac =
5) S c = .
2.7.4
34
35
Ai ) =
i=1
P (Ai )
(2.6)
i=1
n
[
Ai ) =
i=1
n
X
P (Ai )
(2.7)
i=1
(2.8)
(2.9)
Observao:
1.
P (A1 A2 A3 ) = P (A1 ) + P (A2 ) + P (A3 )
= [P (A1 A2 ) + P (A2 A3 ) + P (A1 A3 )]
= +P (A1 A2 A3 )
36
(2.10)
Eventos Independentes
(2.11)
37
Anlise Combinatoria
Permutao
Em particular
n!
(n r)!
(2.12)
Pnn = n!
38
onde n1 + n2 + ... + nk = n
(2.13)
11!
3!2!2!2!1!1!
= 831.600.
Combinaes
Uma combinao de n objetos tomados r de cada vez, uma escolha dos n objetos,
no se levando em considerao a ordem de sua posio. O nmero
n de combinaes
k
de n objetos, tomados k de cada vez, representado por Cn ou k .
O clculo (ou frmula) para combinaes pode ser obtido atravs de uma permutao
que pode ser construida da seguinte maneira: Sabe-se que o nmero de permutaes
de n elementos tomados k de cada vez Pnk . Primeiro uma combinao particular de
k elementos selecionada. Cada diferente permutao desses k elementos levar
a uma permutao na lista. Como h k! permutaes desses k elementos, esta
combinao particular produzir k! permutaes na lista. Quando uma combinao
diferente de k elementos selecionada, k! outras permutaes na lista so obtidas.
Como cada combinao de k elementos produzir k! permutaes, o nmero total
39
2.11
Pnk
n!
=
=
k!
k!(n k)!
(2.14)
Probabilidade Condicional
P (A B)
P (B)
(2.15)
P (A) P (B)
= P (A)
P (B)
(2.16)
P (B/A) =
P (B) P (A)
= P (B)
P (A)
(2.17)
Da mesma forma,
40
P (A1 ) > 0, P (A1 A2 ) > 0, ..., P (A1 A2 A3 ... An1 ) > 0. Ento
P (A1 A2 ... An ) =
= P (A1 ) P (A2 /A1 ) P (A3 /A1 A2 )...
P (An /A1 A2 ...An1 ).
(2.18)
Exemplo:
Suponha que 4 bolas sejam selecionadas, uma de cada vez, sem reposio, de uma
urna contendo v bolas vermelhas e a azuis. (v 2, a 2). Qual a probabilidade de
se obter uma sequncia de resultados vermelho, azul, vermelho, azul?
vj : uma bola vermelha retirada na j-sima vez
aj : uma bola azul retirada na j-sima vez
onde j=1,2,3,4
P (v1 , a2 , v3 , a4 ) =
= P (v1 ) P (a2 /v1 ) P (v3 /v1 a2 ) P (a4 /v1 a2 v3 )
v
v+a
2.12
a
v+a1
v1
v+a2
a1
v+a3
Probabilidade Total
k
X
P (Aj B)
j=1
41
(2.19)
k
X
P (Aj ) P (B/Aj )
(2.20)
j=1
Logo,
P (CA1 ) = P [(CA1 A1 ) (CA1 A2 )]
42
ou
P (CA1 ) =
P (CA1 Ai ) =
(2.21)
Teorema de Bayes
Sejam os eventos A1 , A2 , ..., Ak que formam uma partio do espao S tal que
P (Aj ) > 0 para todo j = 1, 2, ..., k, e seja B qualquer evento tal que P (B) > 0.
Ento, para i = 1, 2, ..., k, temos:
P (Ai )P (B/Ai )
P (Ai /B) = Pk
j=1 P (Aj )P (B/Aj )
(2.22)
P (Ai B)
P (B)
(2.23)
P (A1 CA1 )
P (CA1 )
(2.24)
43
expressar
P (CAi /A1 )P (A1 )
P (A1 /CA1 ) = P
i P (CA1 /Ai )P (Ai )
(2.25)
Esta formulao pode obviamente ser generalizada para uma situao onde os
eventos A1 , A2 , ..., An formam um sistema completo de resultados de alguma
operao e onde K denota um resultado arbitrrio desta operao. Neste caso tem-se
que:
P (Ai /K) =
P (K/Ai )P (Ai )
P (Ai K)
=P
P (K)
P (K/Ai )P (Ai )
(2.26)
que conhecida como a frmula de Bayes e que tem aplicaes diversas na rea de
sensoriamento remoto.
A seguir dada uma aplicao especfica utilizada em Classificao.
2.13.1
Teoria de Bayes
Suponha que seja medida alguma caracterstica x de uma cena (por exemplo, o
nvel de cinza de cada pixel ) e que tenha que se decidir a qual de duas classes (por
exemplo, vegetao ou solo) um pixel pertence. Este um problema unidimensional,
de classificao em duas classes, no domnio de caracterstica da imagem. Se um
nmero grande de pixels est disponvel, que pode ser considerado representativo
de cada classe (isto , dados de treinamento) podemos calcular um histograma da
frequncia relativa da caracterstica para cada classe, conforme mostrado na Figura
2.4.
Considere-as como aproximaes das funes densidade de probabilidade (f.d.p.)
contnuas de uma amostra infinita de dados. Essas funes densidade de
probabilidade condicionais, P (x/A1 ) e P (x/A2 ) tem rea unitria e descrevem a
probabilidade de um pixel ter valor x da caracterstica, dado que ele est na classe A1
ou na classe A2 , respectivamente. Cada f.d.p. pode ser delineada pela probabilidade
a priori P (Ai ) que a classe Ai ocorra na rea de interesse na imagem.
Estas
funes
de
probabilidade
delineadas
P (x/Ai )P (Ai )
representam
44
P (x/Ai )P (Ai )
P (x)
(2.27)
P (x/Ai )P (Ai )
(2.28)
Onde
P (x) =
2
X
1
Uma regra de deciso pode agora ser formada com as probabilidades a posteriori da
equao 2.27. Se um pixel tem valor x na caracterstica, uma abordagem intuitiva
satisfatria designar o pixel classe A1 se P (A1 /x) maior que P (A2 /x).
Semelhantemente, o pixel seria designado classe A2 se P (A2 /x) maior que
P (A1 /x). Sendo P (x) igual para as duas classes na equao 2.28 ela pode ser ignorada
numa comparao dos dois e podemos escrever a regra de deciso de Bayes
45
ou
P (x/A1 )P (A1 ) = P (x/A2 )P (A2 )
uma deciso no pode ser tomada a partir das probabilidades de classe. Um processo
de desempate deve ser empregado, tal como escolher aleatoriamente classe 1 ou
classe 2. Pode ser mostrado que a regra de deciso de Bayes minimiza a probabilidade
mdia de erro sobre todo o conjunto de dados classificados, se todas as classes tem
f.d.p. normal.
Na prtica, as probabilidades P (Ai ) so difceis de ser obtidas e consequentemente
supe-se que elas sejam iguais. Obviamente resultados mais exatos seriam obtidos se
elas pudessem ser estimadas a partir de dados externos. Se, por exemplo, o objetivo
determinar a proporo dos tipos de cultura plantados numa estao particular,
a partir de imagens do Landsat de uma rea agrcola, podemos sensatamente
estabelecer as probabilidades a priori iguais s estimativas histricas da porcentagem
de cada cultura na rea.
46
CAPTULO 3
VARIVEIS ALEATRIAS E DISTRIBUIES
3.1
Varivel Aleatria
Evento Correspondente
A1 = {(r, r, r)}
A4 = {(c, c, c)}
3.2
47
P
i=1
i,
p(xi ) = 1
10
11
12
p(X)
1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
48
n 1
,
x 210
x = 0, 1, 2, . . . , 10.
(3.1)
R
<X
x <X ,
f (x)dx = 1
P (c < x < d) =
f (x)dx
c
Obs:
a) P (c < x < d) representa a rea sob a curva, como exemplificado no
grfico da Figura 3.2, da f.d.p. f , entre x = c e x = d.
b) Constitui uma consequncia da descrio probabilstica de X que, para
qualquer valor especificado de X, digamos x0 , teremos P (X = x0 ) = 0,
Rx
porque P (X = x0 ) = x00 f (x)dx = 0
Exemplo:
a) Suponhamos que a v.a. X seja contnua. Seja a f.d.p. f dada por:
(
f (x) =
2x 0 < x < 1,
0 caso contrrio.
49
f (x)dx =
1
R
P (X 1/2) deve-se calcular 02 (2x)dx = 14 .
R1
0
a
x3
1500 x 2500,
caso contrrio.
R
Para calcular a constante a, recorre-se condio f (x)dx = 1, que
R 2500
significa, neste caso 1500 xa3 dx = 1, obtendo-se a = 7.031.250.
3.3
(3.2)
Observao:
a) A funo de distribuio de X tambm frequentemente chamada de
funo de distribuio acumulada de X.
50
(3.3)
(3.4)
Teoremas:
p(xj ),
FX (x) =
f (s)ds.
Exemplos:
0 se
1 se
3
F (x) =
1
se
1 se
x < 0,
0 x < 1,
1 x < 2,
0 x 2.
51
2x 0 < x < 1,
0
caso contrrio.
x 0,
0R
x
2
F (x) =
(2s)ds = x 0 < x 1,
0
1
x > 1.
O grfico est apresentado na Figura 3.4.
3.4
Distribuies Bivariadas
Suponha que um certo experimento envolve duas v.a. X e Y , cada qual com uma
distribuio discreta.
A funo de probabilidade conjunta de X e Y definida pela funo p tal que
52
(3.5)
Observao:
a)
p(xi , yi ) = 1.
b) Se X e Y forem independentes
p(xi , yi ) = P (X = xi ) P (Y = yi )
Exemplo:
Suponha que a varivel aleatria X possa assumir somente of valores 1, 2, e 3, que
a varivel aleatria Y possa assumir somente os valores 1, 2, 3 e 4, e que a funo
de probabilidade conjunta de X e Y seja dada pela tabela:
Y
0,1
0,1
0,3
0,1
0,2
0,2
53
a) P (X 2 e Y 2);
b) P (X = 1).
P4
y=1
p(1, y) = 0, 2.
f (x, y)dxdy
(3.6)
f (x, y) 0
para
<x<
54
<y <
e
Z
f (x, y)dxdy = 1
(3.7)
A probabilidade que o par (X, Y ) pertena a uma regio do plano xy pode ser
encontrada integrando a f.d.p. conjunta sobre esta regio. A Figura 3.5 mostra um
exemplo de f.d.p. conjunta.
3.5
Distribuies Marginais
X
y
55
p(x, y)
(3.8)
p(x, y)
(3.9)
Exemplo:
Suponha que a varivel aleatria X possa assumir somente of valores 1, 2, e 3, que
a varivel aleatria Y possa assumir somente os valores 1, 2, 3 e 4, e que a funo
de probabilidade conjunta de X e Y seja dada pela tabela:
Marginal
de X
0,1
0,1
0,2
0,3
0,1
0,2
0,6
0,2
0,2
0,4
0,2
0,2
0,2
1,0
Marginal de Y
fX (x) =
f (x, y)dy
(3.10)
fY (y) =
f (x, y)dx
Observao
56
(3.11)
Se X e Y forem independentes
P (x, y) = PX (x) PY (y)
(Caso discreto)
(Caso contnuo)
Exemplo:
Suponha que X e Y possuam um distribuio contnua conjunta, cuja p.d.f. conjunta
seja definida por:
(
f (x, y) =
3 2
y
2
0 x 2 e 0 y 1,
caso contrrio.
1
0
3 2
y3 1 1
y dy =
|= .
2
2 0 2
1
2
0x2
0 caso contrrio.
Tem-se que:
Z
2
0
3 2
3
y dx = y 2 x |20 = 3y 2
2
2
57
3y 2 0 y 1
0
caso contrrio.
1
P (X ) =
2
1
2
1
P (Y ) =
2
3.6
3.6.1
1
1
1
dx = x |21 =
2
2
2
2
1
1/2
1
2
2
3y 2 dy = y 3 x |11/2 = 1
3
= .
4
1
7
= .
8
8
Suponha que uma varivel aleatria (v.a.) X possua uma distribuio discreta cuja
f.d.p. p(x). A esperana de X, denotada por E(X), um nmero definido por
= E(X) =
xp(x)
(3.12)
Exemplo
Suponha que uma v.a. X possa assumir somente quatro valores: 2, 0, 1, e4, e que
P (X = 2) = 0.1; P (X = 0) = 0.4; P (X = 1) = 0.3; P (X = 4) = 0.2
Ento
E(x) = 2 (0.1) + 0 (0.4) + 1 (0.3) + 4 (0.2)
= 0.9
58
3.6.2
Distribuies Contnuas
Se uma varivel aleatria (v.a.) X possui uma distribuio contnua com f.d.p. f (x),
ento a esperana E(X) definida por
Z
= E(X) =
xf (x)dx
(3.13)
Exemplo
Suponha que a f.d.p. de uma v.a. X com uma distribuio contnua seja:
(
f (x) =
caso contrrio
Ento
Z
E(X) =
x (2x)dx
Z
0
1
2x2 dx
2x3 1
=
|
3 0
2
=
3
Observao
O nmero E(X) tambm denominado valor esperado de X, ou a mdia de X.
3.6.3
Propriedades da Esperana
P1.
Se a uma constante qualquer
E(X a) = E(X) a
P2.
59
P3.
Se X1 , X2 , ..., Xn so n variveis aleatrias tais que E(Xi ) existe (i = 1, 2, ..., n),
ento
E(X1 + X2 + ... + Xn ) = E(X1 ) + E(X2 ) + ... + E(Xn )
P4.
Se X1 , X2 , ..., Xn so n variveis aleatrias independentes, tais que E(Xi ) existe
(i = 1, 2, ..., n), ento
E
n
Y
!
Xi
i=1
n
Y
E(Xi )
i=1
Exemplos:
60
3.7
Definio
Suponha que X uma v.a. com mdia = E(X). A varincia de x, representada
por V ar(X) definida por
V ar(X) = E (x )2 ,
3.7.1
onde
= E(X)
(3.14)
Suponha que uma v.a. X possua uma distribuio discreta, cuja f.d.p. p(x). Ento
V ar(X) =
X
(x )2 p(x)
x
x2 p(x) 2
(3.15)
Exemplo:
Suponha que uma v.a. X possa assumir somente quatro valores: 2, 0, 1, e 4, e que
P (X = 2) = 0, 1; P (X = 0) = 0, 4; P (X = 1) = 0, 3; P (X = 4) = 0, 2
Como visto anteriormente, E(X) = 0, 9. Ento
V ar(X) =
X
(x )2 p(x)
x
61
ou
V ar(X) =
x2 p(x) 2
= (2)2 (0, 1) + (0)2 (0, 4) + (1)2 (0.3) + (4)2 (0, 2) (0, 9)2
= 0, 4 + 0, 3 + 3, 2 0, 81
= 3, 09
3.7.2
Suponha que uma v.a. X possua uma distribuio contnua, cuja f.d.p. f (x). Ento
Z
V ar(X) =
(x )2 f (x)dx
x2 f (x)dx 2
Exemplo
Suponha que a f.d.p. de uma v.a. X com uma distribuio contnua seja:
(
f (x) =
caso contrrio
Z
V ar(X) =
=
=
=
3.7.3
Propriedades da Varincia
P1.
V ar(X) = 0 se e somente se existe uma constante c tal que P (X = c) = 1
62
(3.16)
P2.
V ar(aX) = a2 V ar(X)
P3.
V ar(X + a) = V ar(X)
P4.
V ar(X) = E(X 2 ) [E(X)]2
P5.
Se X1 , X2 , ..., Xn so v.a. independentes, ento
V ar(X1 X2 ... Xn ) = V ar(X1 ) + V ar(X2 ) + ... + V ar(Xn )
Exemplo:
Seja uma v.a. com mdia e desvio padro . Calcular a mdia e varincia de:
a) Z = 3X 7
b) Z =
X7
2
c) Z =
a) E(Z) = 3 7
V ar(Z) = 9 2
b) E(Z) =
V ar(Z) =
2
4
V ar(Z) =
c) E(Z) =
3.8
7
2
=0
=1
Momentos
Definio
Para qualquer varivel aleatria (v.a.) X e qualquer inteiro positivo k, a esperana
E(X k ) denominado k-simo momento de X, ou momento de ordem k
63
3.8.1
Momentos Centrais
Suponha que Xh seja umai v.a. com E(X) = . Para qualquer inteiro positivo k,
a esperana E (X )k denominado k-simo momento central de X, ou
k-simo momento em torno da mdia.
Observao
Se a distribuio
dei X simtrica com respeito sua mdia , e se oh momentoi
h
central E (X )k existe para um dado k mpar, ento o valor de E (X )k
ser igual a zero.
3.8.2
Definio
Considere uma v.a. X, e para cada nmero real t, seja Mx (t) a funo
Mx (t) = E etx
(3.17)
Mx1 (0)
d tx
=
E e
dt
t=0
d tx
= E
e
dt
t=0
= E Xetx t=0
= E(X)
(3.18)
Analogamente, temos
Mxk (0)
=
=
=
=
dk tx
E e
dtk
k t=0
d tx
E
e
dtk
k tx t=0
E X e t=0
E Xk
64
(3.19)
Portanto:
Mx1 (0) = E(X), Mx2 (0) = E(X 2 ), Mx3 (0) = E(X 3 ), ...
Exemplo:
Suponha que X seja uma v.a. com f.d.p. dada por
(
f (x) =
ex para x > 0
0
caso contrario
tx
Mx (t) = E e
tx
e dx =
0
e(t1)x dx =
e(t1)x
|
t1 0
Logo, V ar(X) = 2 12 = 1
3.8.3
P1.
Seja X uma v.a. com f.g.m. MX , e seja Y = aX + b, onde a e b so constantes, e
seja MY a f.g.m. de Y . Ento, para qualquer valor de t tal que MX (at) exista,
MY (t) = ebt MX (at)
(3.20)
P2.
Suponha que X1 , X2 , ..., Xn sejam n v.a. independentes, e que Mi (i = 1, 2, ..., n)
seja a f.g.m. de Xi . Seja Y = X1 + X2 + ... + Xn , e seja MY a f.g.m. de Y . Ento
65
n
Y
Mi (t)
(3.21)
i=1
Exemplo:
Suponha que X e Y sejam independentes e identicamente distribuidas (i.i.d.) e que
a f.g.m. de cada uma seja dada por:
M (t) = et
2 3
< t < .
Encontre a f.g.m. de Z = 3X Y + 4.
Soluo:
Sejam
2
X1 = 3X M1 (t) = M (3t) = e9t 3
2
X2 = Y M2 (t) = M (t) = et 3
MZ = M (X1 + X2 + 4) = e4t M1 (t)M2 (t)
2
2
= e4t (e9t 3 )(et 3 )
2 +4t6
= e10t
3.9
3.9.1
Suponha que uma v.a. X possua uma distribuio discreta, cuja funo de
probabilidade (f.p.) seja p(x), e que outra v.a. Y = r(X) seja definida como uma
certa funo de X. Ento a f.p. (g) de Y pode ser calculada de p de maneira direta:
g(y) = P (Y = y)
= P [r(X) = y]
X
=
p(x)
(3.22)
x:r(x)=y
Exemplo:
Suponha que X seja uma v.a. com f.p. dada por:
P (X = 2) = 0, 2; P (X = 1) = 0, 1; P (X = 0) = 0, 3; P (X = 1) = 0, 2;
P (X = 2) = 0, 1 e P (X = 3) = 0, 1.
Suponha que Y seja outra v.a. tal que Y = 2X 2 3. Qual a f.p. de Y?
66
Soluo:
Como X s pode assumir os valores -2,1, 0, 2 e 3, ento Y = 2X 2 3 poder assumir
os valores -3 (quando X = 0), -1 (quando X = 1 ou 1), 5 (quando X = 2 ou 2),
e 15(quando X = 3).Logo, a f.p. de Y dada por:
P (Y = 3) = P (X = 0) = 0, 3; P (Y = 1) = P (X = 1) + P (X = 1) = 0, 3;
P (Y = 5) = P (X = 2) + P (X = 2) = 0, 3 e P (Y = 15) = P (X = 3) = 0, 1.
3.9.2
Suponha que X seja uma v.a. com distribuio contnua, cuja f.d.p. seja f (x).
Suponha que Y seja outra v.a. definida com uma funo de X, isto , Y = r(X).
Para qualquer nmero y a funo de distribuio acumulada G(y) pode ser
calculada por
G(y) = P (Y y)
= P [r(X) y]
Z
=
f (x)dx.
(3.23)
{x:r(x)y}
dG(y)
dy
Exemplo:
Suponha que X possua uma distribuio uniforme no intervalo (-1,1), isto :
(
f (x) =
1
2
Determine a f.d.p. de Y = X 2 .
Soluo:
67
(3.24)
= P ( y x y) =
R y
R y
= y f (x)dx = y 21 dx =
=
y
Logo,
d( y)
dy
1
2 y
g(y) =
=
para 0 y < 1
Observao:
Em alguns casos, para algumas funes r(X) a f.d.p. de Y pode ser calculada
diretamente, sem ter que derivar primeiro a sua funo de distribuio G(y). Para
tal, algumas condies devem ser satisfeitas, como enunciado abaixo:
Seja uma v.a. com f.d.p. f e para qual P (a < X < b) = 1. Seja Y = r(X),
e suponha que r(x) seja contnua e estritamente crescente ou estritamente
decrescrente para a < x < b. Suponha tambem que a < X < b se e
somente se < Y < , e seja X = s(Y ) a funo inversa para < Y <
Ento a f.d.p. de Y dada por
(
g(x) =
f [s(y)] |
0
ds(y)
dy
Exemplo:
Suponha que X seja uma v.a. com distribuio exponencial, isto :
(
f (x) =
Determinar a f.d.p. de Y =
caso contrrio
X.
Soluo:
68
Como Y =
dx
dy
X, ento X = Y 2 . Logo,
f (y) =
= 2y. Portanto,
1 y2 /
e
2y.
Logo,
(
f (y) =
2y
ey
2 /
para y > 0
caso contrrio
Suponha que certa mquina produza um item defeituoso com probabilidade p (0 <
p < 1) e produza um item no defeituoso com probabilidade q = 1 p. Suponha
que n itens independentes produzidos por essa mquina sejam examinados, e faa X
representar o nmero de itens que so defeituosos. A v.a. X ter uma distribuio
discreta, e os possveis valores de X sero 0, 1, 2, 3, ..., n.
A probabilidade de se obter uma sequncia particular dos n itens contando
exatamente x defeituosos e n x no defeituosos px pnx . Como existem nx
sequncias diferentes desse tipo, segue que a funo de probabilidade de X ser:
(
n
p(x) = P (X = x) =
px q nx para x = 0, 1, 2, 3, ..., n
caso contrrio
Exemplo:
69
P (X = k) =
20
k
para k = 0, 1, 2, 3, ..., 20
P (X = 4) = 0, 218
P (X = 8) = 0, 022
P (X = 1) = 0, 058
P (X = 2) = 0, 137
P (X = 5) = 0, 175
P (X = 6) = 0, 109
P (X = 9) = 0, 007
P (X = 10) = 0, 002
P (X = 3) = 0, 205
P (X = 7) = 0, 055
70
3.10.1.1
n
X
x p(x)
x=0
=
=
n
X
x=1
n
X
x=1
= np
n!
px q nx
x!(n x)!
n(n 1)!
ppx1 q nx
x(x 1)!(n x)!
n
X
x=1
(n 1)!
px1 q nx
(x 1)!(n x)!
(3.25)
n
Onde p(x) = x px q nx
Fazendo y = x 1 tem-se
n1
X
n1
y py q n1y
E(X) = np
(3.26)
y=0
Mas, pela frmula binomial (ver por exemplo Wonnacott, pag. 153)
k
(p + q)
k
k
k1
p2 q k2 + . . . + pk
pq
+
= q +
1
2
k
X
k
=
pi q ki
i
i=0
k
(3.27)
Portanto,
E(X) = np (p + q)n1
(3.28)
E(X) = np
(3.29)
Como p + q = 1, temos
71
3.10.1.2
(3.30)
X
X
x(x 1)
(3.31)
X (n 2)!
py q ny2
y!(n x)!
= n(n 1)p2
(3.32)
Assim,
E {X(X 1)} = E(X 2 X)
= E(X 2 ) E(X)
= n(n 1)p2
(3.33)
72
Como:
V ar(X) = E(X 2 ) E(X) + E(X) {E(X)}2
= n(n 1)p2 + np n2 p2
= np(1 p)
= npq
De fato f (x) =
temos que ter
(3.34)
n
x px q nx de fato uma funo de probabilidade. Para tanto
X n
x px q n1 = 1
(3.35)
q
+
p
q
+
p
q
+
...
+
0
1
2
que por sua vez igual a (p + q)n , e como p + q = 1 fica demonstrado que f (x) de
fato uma funo de probabilidade.
Exemplo
Em 100 lances de uma moeda honesta, a mdia do nmero de caras
= N p = 100
1
= 50
2
(3.36)
r
N pq =
100
1 1
= 5.
2 2
(3.37)
Observao
A funo geratriz de momentos de uma distribuio binomial
n
Mx (t) = p et + q
73
(3.38)
3.10.2
Distribuio Hipergeomtrica
Suponha que uma urna contenha A bolas verdes e B bolas azuis. Suponha que se
retire n bolas sem reposio. Seja X v.a. que indica o nmero de bolas verdes obtidas.
Ento
max {0, n B} X min {n, A} .
B
nx
A+B
n
(3.39)
V ar(X) =
nA
A+B
(3.40)
nAB
A+Bn
2
(A + B) A + B 1
(3.41)
Exemplo:
Pequenos motores eltricos so expedidos em lotes de 50 unidades. Antes que
uma remessa seja aprovada, um inspetor escolhe 5 desses motores e o inspeciona.
Se nenhum dos motores inspecionados for defeituosos, o lote aprovado. Se
um ou mais forem verificados defeituosos, todos os motores da remessa so
inspecionados. Suponha que existam, de fato, trs motores defeituosos no lote. Qual
a probabilidade de que a inspeo 100 por cento seja necessria?
Soluo:
Seja X a v.a. que representa o nmero de motores defeituosos enecontrado. A
inspeo de todo o lote ser necessria se X 1. Logo,
3 47
P (X 1) = 1 P (X = 0) = 1
50 5
5
74
= 0, 28
3.10.3
P (X = x) =
r+x1
x
pr q x x = 0, 1, 2...
(3.42)
rq
p
V ar(X) =
(3.43)
rq
p2
(3.44)
Exemplo:
Suponha que a probabilidade de sair cara em uma moeda seja de 1/3. Suponha
tambm que esta moeda seja jogada at que apaream 5 caras.
a) Calcule a probabilidade de que a quinta cara aparea na dcima segunda
jogada.
b) Qual o nmero esperado de coroas que aparecero antes de se obter 5
caras?
Soluo:
Seja X a v.a. que representa o nmero de coroas que aparecem antes de que a quinta
cara aparea. X possui uma distribuio binomial negativa.
a)
P (X = 7) =
75
11
7
5 7
1
2
3
3
b)
E(X) =
3.10.4
5. 23
1
3
= 10
Distribuio Geomtrica
(3.45)
q
E(X) = ;
p
(3.46)
V ar(X) =
q
p2
(3.47)
Exemplos:
76
q
0, 9
=
= 9.
p
0, 1
3.10.5
Distribuio de Poisson
Seja X uma v.a. com distribuio discreta, e suponha que X assuma valores inteiros
no negativos. dito que X possui uma distribuio de Poisson com mdia
onde ( > 0) se a funo de probabilidade de X dada por:
P (X = x) = e
x
x!
x = 0, 1, 2, 3, ...
(3.48)
Observao
O smbolo e representa uma constante que aproximadamente igual a 2, 7183. O
seu nome uma homenagem ao matemtico suio I. Euler, e constitui a base do
chamado logaritmo natural.
Para determinao da mdia e da varincia de uma v.a. de Poisson, preciso primeiro
77
X
x
=
etx e
x!
x=0
x
X
(et )
= e
x=0
et
= e
x!
= e(e 1)
t
Diferenciando teremos
t
0
M (t) = et e{(e 1)}
2
t
t
00
M (t) = et e{(e 1)} + et e{(e 1)}
Para t = 0 temos
0
E(X) = m (0) =
(3.49)
00
(3.50)
78
=
1
(n x)!x! n
n
n(n 1)...(n x + 1) x (1 /n)n
=
nx
x! (1 /n)x
P (X = x) =
(3.51)
1
e
n
n(n 1)...(n x + 1)
1
nx
x
1
1
n
(3.52)
x
x!
(3.53)
79
Soluo:
Seja X a v.a. que representa o nmero de pessoas que sofrem a reao
nociva aps injerir o soro. Ento,
P (X = x) = e
x
x = 0, 1, 2, 3, ..,
x!
1)
P (X = 3) = e2
23
= 0, 18
3!
2)
P (X 3) = 1 {P
(X = 1)o+ P (X = 2)}
n (X 0= 0) + P
1
2
= 1 e2 20! + e2 21! + e2 22!
P (X = 3) =
2000
3
P (X = x) =
e0,7 0, 7x
x = 0, 1, 2, 3, ..,
x!
80
Logo,
P (X 3) = 1 {P
n (X = 0) + P (X = 1) +oP (X = 2)}
= 1 e0,7 + 0, 7e0,7 +
0,72 e0,7
2
= 1 e0,7 (1 + 0, 7 + 0, 245)
= 0, 341
c) Dez por cento das ferramentas produzidas por um certo processo de
fabricao revelaram-se defeituosas. Determinar a probabilidade de, em
uma amostra de 10 ferramentas escolhidas ao acaso, exatamente duas
sejam defeituosas, mediante o emprego de:
1) distribuio binomial
2) distribuio de Poisson
Soluo:
1)
P (X = 2) =
10
2
2)
= N p = 10(0, 1) = 1
12 e1
1
P (X = 2) =
= 1 = 0, 1839
2!
2e
3.11
3.11.1
Definio
Dizemos que uma v.a. X possui uma distribuio Normal (ou Gaussiana) com
mdia e varincia 2 ( < < e > 0) se X possuir uma distribuio
contnua com f.d.p. dada por:
1 x 2
1
f (x) = e 2 ( ) para < x <
2
81
(3.54)
Mdia
E(X) =
(3.55)
V ar(X) = 2
(3.56)
Varincia
2 t2
2
<x<
(3.57)
Teorema 1
Se X possui uma distribuio normal com mdia e varincia 2 , e se Y = aX + b,
onde a e b so constantes, com a 6= 0, ento Y ter uma distribuio normal com
mdia a + b e varincia a2 2
Prova
A funo geratriz de momentos de Y ser
My (t) = ebt Mx (at)
= ebt
eat+
h
= e
2 a2 t2
2
2
(a+b)t+a2 2 t2
,
(3.58)
que a funo geratriz de momentos de uma distribuio com mdia a+b e varincia
a2 2 .
3.11.2
82
<x<
(3.59)
Segue do Teorema 1 que se uma varivel X tem uma distribuio normal com mdia
e varincia 2 , ento a varivel
Z=
(3.60)
P (Z
P (Z
P (Z
P (Z
2) P (Z < 1)
2) P (Z > 1)
2) (1 P (Z 1))
2) + P (Z 1) 1
P (2 Z 2)
P (Z 2) P (Z < 2)
P (Z 2) P (Z > 2)
P (Z 2) (1 P (Z 2))
= 2 P (Z 2) 1
= 2 0, 9773 1 = 0, 9546
83
2
= P (2 Z 1, 5)
= P (Z 1, 5) P (Z < 2)
=
=
=
=
P (Z 1, 5) P (Z > 2)
P (Z 1, 5) (1 P (Z 2))
P (Z 1, 5) + P (Z 2) 1
0, 9332 + 0, 9772 1 = 0, 9104
4
= 1 P (Z 0, 5) = 1 0, 6915 = 0, 3085
ii) P (X > 72) = P ( X
>
7268
)
4
= P (Z > 1) = 0, 1587
P ( 6668
X
7268
)
4
4
P (0, 5 Z 1)
P (Z 1) P (Z < 0, 5)
0, 8413 0, 3085 = 0, 5328
Teorema 2
Se as v.a. X1 , X2 , ..., Xk so independentes e se Xi normalmente distribuida com
mdia i e varincia i2 com (i = 1, 2, 3, ..., k), ento a soma X1 + X2 + ... + Xk ter
uma distribuio normal com mdia 1 + 2 + ... + k e varincia 12 + 22 + ... + k2 .
Prova:
Seja Mi (t) a f.g.m. de Xi para (i = 1, 2, ..., k) e seja M (t) a f.g.m. de X1 + X2 +
84
k
Y
Mi (t)
i=1
k
Y
i=1
Pk
= e(
i t+
i=1
i2 t
2
P
i )t+ 12 ( ki=1 i2 )t
Esta f.g.m.
P pode
ser identificada
P como a f.g.m. de uma distribuio normal com
k
k
2
mdia
i=1 i e varincia
i=1 i . Logo, essa a distribuio de X1 + X2 +
... + Xk
Exemplo:
Suponha que a altura, em inches, de mulheres de uma certa populao segue uma
distribuio normal com mdia 65 e desvio padro 1, e que as alturas dos homens
segue uma distribuio normal com mdia 68 e desvio padro 2. Supor tambm que
uma mulher seja selecionada aleatoriamente e independentemente um homem seja
selecionado aleatoriamente. Determinar a probabilidade que a mulher seja mais alta
que o homem.
Soluo:
Sejam M e H as v.a. que representem as alturas da mulher e do homem,
respectivamente. Ento
M ~ N (65, 12 )
H ~ N (68, 22 )
Logo, (M H) ~ N (65 68, 12 + 22 ), isto , (M H) ~ N (3, 5).
Portanto Z =
M H+3
3
P (M > H) = P (M H > 0) = P M H+3
>
5
5
85
Corolrio 1
Se as v.a. X1 , X2 , ..., Xk so independentes, se Xi possui uma distribuio normal
com mdia i e varincia i2 onde (i = 1, 2, ..., k), e se a1 , a2 , ..., ak e b so constantes
para as quais pelo menos um dos valores de a1 , a2 , ..., ak diferente de zero, ento
a varivel a1 X1 + a2 X2 + ... + ak Xk + b tem uma distribuio normal com mdia
a1 1 + a2 2 + ... + ak k + b e varincia a21 12 + a22 22 + ... + a2k k2
Corolrio 2
Suponha que as v.a. X1 , X2 , ..., Xk formem uma amostra aleatria de uma
a mdia amostral. Ento X
ter
distribuio com mdia e varincia 2 , e seja X
uma distribuio normal com mdia e varincia
2
n
Exemplo:
Suponha que em um certo exame de Matemtica Avanada, os estudantes da
Universidade A obtm notas normalmente distribudas com mdia 625 e varincia de
100, e que os estudantes da Universidade B obtm notas normalmente distribudas
com mdia 600 e varincia de 150. Se dois estudantes da Universidade A e cinco
estudantes da Universidade B fazem este exame, qual a probabilidade que a nota
mdia dos estudantes da Universidade A seja maior que a nota mdia dos estudantes
da Universidade B?
Soluo:
Temos que:
A = 625
B = 600
A2
B2 = 150
= 100
150
3
= 30, isto ,
xA ~ N (625, 50)
xB ~ N (600, 30)
Logo, (
xA xB ) ~ N (625 600, 50 + 30), isto , (
xA xB ) ~ N (25, 80).
Portanto,
xB 25 > 025
P (
xA > xB ) = P (
xA xB > 0) = P xA
80
80
25
86
3.11.3
X
x = (x),
nP
/ n
lim
(3.61)
1
2
1
2
1
2
V ar(H) = 900
= 450
1
4
Portanto a varivel Z =
padro. Logo,
H450
15
87
i=1
Xi
Para grandes valores de n segue, pelo Teorema Central do Limite, que P ser
aproximadamente normalmente distribudo com mdia e varincia dadas por:
E(P ) = p
V ar(P ) =
pq
.
n
Exemplo:
Suponha que a proporo de itens defeituosos em um grande lote de peas seja 0,1.
Qual o menor nmero de itens que deve ser retirado do lote para que a probabilidade
seja de pelo menos 0,99 que a proporo de itens defeituosos na amostra seja menor
que 0,13.
Soluo: Seja P a proporo de defeituosos na amostra. Para n grande tem-se que
P ser aproximadamente normalmente distribudo com mdia = 0, 1 e varincia
2 =
(0,1)(0,9)
n
0,09
.
n
88
Portanto,
P
0, 13 0, 1
P
< q
0, 99
0,09
n
Ou seja,
Z<
0, 03
0,3
= P Z < 0, 1 n 0, 99
0, 1 n 2, 33
3.11.4
n 543
Distribuio Uniforme
para x
caso contrrio
Esta f.d.p. est representada pela Figura 3.7. Observe que a funo anterior satisfaz
os requisitos para ser uma f.d.p., j que
1
dx = 1
(3.62)
89
ba
=
dx
a
90
(3.63)
Exemplo:
Um ponto escolhido ao acaso no segmento de reta [0,2]. Qual ser a a probabilidade
de que o ponto escolhido esteja entre 1 e 1,5?
Seja X a v.a. que representa a coordenada do ponto escolhido. Tem-se que a f.d.p.
de X dada por:
(
f (x) =
1
2
para 0 x 2
0 caso contrrio
Portanto,
P (1 X 1, 5) =
0, 5
1
=
2
4
Mdia
A mdia de uma v.a. uniforme [, ]
Z
x
dx
2 2
=
2 ( )
( )( + )
=
2 ( )
E(X) =
(3.64)
ou
E(X) =
+
2
(3.65)
91
mas
Z
1
E[X ] =
x2 dx
3 3
=
3 ( )
( 2 + + 2 )
=
3
2
(3.66)
Assim
( 2 + + 2 )
V ar[X] =
3
( 2 + 2 2)
=
12
( )2
=
12
3.11.5
+
2
(3.67)
Distribuio Exponencial
dito que uma v.a. X possui uma distribuio exponencial com mdia onde
( > 0) se X possui uma distribuio contnua para a qual a f.d.p. f (x) dada por
(
f (x) =
x
1
e
para x > 0
para x 0
F (x) = P (X x) =
0
x
1 x
e = 1 e
para x 0.
Portanto, P (X > x) = e .
A mdia e varincia de uma v.a. X com distribuio exponencial so dadas por:
E(X) =
V ar(X) = 2
92
(3.68)
(3.69)
Observao
2y y2
e
(3.70)
2
4
V ar(X) =
4
E(X) =
(3.71)
(3.72)
Exemplo:
Suponha que um fusvel tenha uma durao de vida X, a qual pode ser considerada
uma v.a. contnua com uma distribuio exponencial. Existem dois processos pelos
quais o fusvel pode ser fabricado. O processo I apresenta uma durao de vida
esperada de 100 horas, enquanto o processo II apresenta uma durao de vida
esperada de 150 horas. Suponha que o processo II seja duas vezes mais custoso
(por fusvel) que o processo I, que custa C dlares por fusvel. Admita-se, alm
disso, que se um fusvel durar menos que 200 horas, uma multa de K dlares seja
lanada sobre o fabricante. Qual processo deve ser empregado?
Soluao:
O custo esperado por fusvel para o processo I dado por:
(
CI =
C
C +K
se X > 200
se X 200
Logo,
E(CI ) = CP (X > 200) + (C + K)P (X 200)
200
200
= Ce 100 + (C + K)(1 e 100 )
= Ce2 + (C + K)(1 e2 )
= C + K(1 e2 )
Analogamente, o custo esperado por fusvel para o processo II dado por:
4
E(CII ) = 2C + K(1 e 3 )
93
Portanto,
4
Distribuio Gama
dito que uma v.a. X possui uma distribuio Gama com parmetro e se X
possui uma distribuio contnua cuja f.d.p. dada por:
(
f (x) =
1 x
x e
()
para x > 0
para x 0
A mdia e varincia de uma v.a. X que possui uma distribuio Gama so dadas
por:
V ar(X) =
2
E(X) =
(3.73)
(3.74)
Observao 1
A distribuio exponencial um caso particular da distribuio Gama, quando =
1.
Observao 2
Se as v.a. X1 , X2 , ..., Xk so independentes e se Xi possui uma distribuio Gama
com parmetros i e (i = 1, 2, ..., k), ento a soma de X1 + X2 + ... + Xk possui
uma distribuio Gama com parmetros 1 + 2 + ... + k e .
3.11.7
1
2(12 )
x1 1
1
94
x2 2
x2 2 2
x
+
2 1 1
(3.75)
onde:
E(X1 ) = 1 V ar(X1 ) = 12
E(X2 ) = 2 V ar(X2 ) = 22
e
Cov(X1 ,X2 )
1 2
=
=
Cor(X1 , X2 )
Observao
X1 e X2 so independentes se e somente se forem no correlacionadas.
3.11.8
Diz-se que:
X1
X2
..
.
X=
Xn
possue uma distribuio normal multivariada se a f.d.p. conjunta de
X1 , X2 , ..., Xn for dada por:
1
P 1/2 e
f (X) =
n/2
(2) |
|
12 (X)
P1
i
(X)
onde:
o vetor mdias;
X
a matriz de covariancia;
1
X
a inversa de
;e
X
| o determinante de
.
95
(3.76)
e
= E(X)
X
= E (X )(X )T
ou seja:
i = E(Xi )
ij = E [(Xi i )(Xj j )]
96
CAPTULO 4
INFERNCIA ESTATSTICA
4.1
Introduo
Estatstica
Estimao Pontual
97
4.2.1
1X r
x
mr =
n i=1 i
0
(4.1)
mj = 0 j j = 1, 2, ..., k.
0
2x x2
e
para x > 0
= x
2
Logo,
98
4
x
= x
2 =
Pn
i=1
x2i
Pn
2
x =
i=1 (xi
x)2
99
(4.2)
Alm disso, L() e log L() possuem seus mximos para o mesmo valor de , e muitas
vezes mais fcil encontrar o mximo do logaritmo da funo de verossimilhana.
Se a funo de verossimilhana contm k parmetros 1 , 2 , ..., k , os estimadores de
mxima verossimilhana sero a soluo das k-equaes
L(1 , 2 , ..., k )
= 0
1
L(1 , 2 , ..., k )
= 0
2
.. .. ..
. . .
L(1 , 2 , ..., k )
= 0
k
Exemplo:
Determinar os estimadores dos parmetros e 2 da distribuio Normal pelo
mtodo de Mxima Verossimilhana.
Soluo:
e i=1 2 ( )
=
2
n/2
(2 )
X
n
n
ln L(, 2 ) = ln 2 ln(2)
2
2
i=1
100
(
2 )
1 xi
2
Pn
n
xi n
L(, 2 )
1 X
= 2
(xi ) = i=1 2
i=1
xi
= x
Analogamente,
L(, 2 )
n
= 2 +
2
Pn
i=1 (xi
2 4
)2
n 2 +
Pn
i=1 (xi
2 4
n)2
=0
4.3
Pn
i=1 (xi
x)2
Estimadores No Tendenciosos
= ,
Um estimador um estimador no tendencioso de um parmetro , se E()
para todo possvel valor de . Em outras palavras, um estimador do parmetro
no tendencioso se sua esperana (ou mdia) igual ao verdadeiro valor
(desconhecido) de
Exemplo:
Vimos que os estimadores dos momentos e de mxima verossimilhana de e 2 da
distribuio normal so dados por:
= x
2 =
Pn
i=1 (xi
x)2
101
4.4
A Distribuio 2
n
x
1
x 2 1 e 2
2n/2 ( n
)
2
para x > 0
para x 0
A mdia e varincia de uma v.a. X que possui uma distribuio 2 so dadas por:
E(X) = n
(4.3)
V ar(X) = 2n
(4.4)
Teorema 1:
Se as variveis X1 , X2 , ..., Xk so independentes e se Xi possui uma distribuio 2
com ni graus de liberdade (i = 1, 2, ..., k), ento a soma X1 + X2 + ... + Xk possui
uma distribuio 2 com n1 , n2 , ..., nk graus de liberdade.
Teorema 2:
Se as v.a. X1 , X2 , ..., Xk so independentes e identicamente distribuidas, cada uma
delas com distribuio normal padro ento a soma X12 + X22 +, ..., Xk2 possui uma
distribuio 2 com k graus de liberdade.
Exemplo:
Suponha que X1 , X2 , ..., Xn formem uma amostra aleatria de uma distribuio
normal com mdia e varincia 2 . Encontre a distribuio de
a)
)2
n(X
2
Pn
b)
i=1 (Xi
2
Soluo
102
)2
a) Sabemos que
X
/ n
N (0, 1)
Portanto,
)2
(X
2 /n
21
b) Temos que
Xi
N (0, 1)
Portanto,
(Xi )2
2
21
i=1 (Xi
2
)2
2n .
Observao:
ento temos que
1. Se for substituido por X,
Pn
i=1 (Xi
2
2
X)
2n1 .
Ou seja,
(n 1)s2
2
Pn
~
2n1 ,
onde
s =
2
X)
n1
i=1 (Xi
(n 1)s2
2
=n1
E(s2 ) = 2
103
V ar
(n 1)s2
2
= 2(n 1)
(n 1)2
2 4
2
2
V
ar(s
)
=
2(n
1)
V
ar(s
)
=
4
n1
Exemplo:
Suponha que X1 , X2 , ..., Xn formem uma amostra aleatria de uma distribuio
normal com mdia e varincia 2 . Supondo que n = 16, determine of valores
das seguintes probabilidades:
a)
b)
2
1X
(Xi )2 2 2
2
n i=1
n
1X
2
2 2 2
(Xi X)
2
n i=1
Soluo:
a)
2
1X
(Xi )2 2 2
2
n i=1
= P
Pn
i=1 (Xi
2
)2
2n
= P 8 216 32
= 0, 99 0, 05 = 0, 94
b)
2
1X
2 2 2
(Xi X)
2
n i=1
= P
Pn
i=1 (Xi
2
2
X)
2n
= P 8 215 32
= 0, 995 0, 10 = 0, 985
4.5
A Distribuio t-student
Considere duas v.a. independentes Y e Z tais que Y possua uma distribuio normal
padro, e Z possua uma distribuio 2 com n graus de liberdade. Suponha que uma
104
(4.5)
(0, 1)
e
Pn
2
(Xi X)
2n1
2
Logo,
Pn
21 =
2
(Xi X)
2 (n1)
)
n(X
tn1
s
(4.6)
Exemplo:
Suponha que X1 , X2 , ..., Xn formem uma amostra aleatria de uma distribuio
e s2 respectivamente
normal com mdia e varincia 2 desconhecidos. Sejam X
a mdia e a varincia amostral dos Xi s. Para um tamanho de amostra n = 16,
encontre o valor de k tal que:
> + ks) = 0, 05
P (X
(X ) n
P
> k n = 0, 05
s
105
P (tn1 > k n) = P (t15 > 4k) = 0, 05
Logo, 4k = 1, 753. Ou seja, k = 0, 438.
4.5.2
P nA
i=1
XAi
nA
B =
X
PnB
i=1
XBi
nB
A X
B
X
s
A2
N A B ,
nA
B2
nB
Portanto,
A X
) (A B )
(X
qB 2
2
A
B
+
nA
nB
N (0, 1)
2nA 1 ,
(nB 1)s2B
B2
Logo,
(nA 1)s2A (nB 1)s2B
+
A2
B2
106
2nA +nB 2
2nB 1
4.6
tnA +nB 2
Distribuio F
Considere duas v.a. independentes Y e Z tais que Y possua uma distribuio 2 com
m graus de liberdade, e Z possua uma distribuio 2 com n graus de liberdade.
Suponha que uma v.a. X seja definida por
X=
Y /m
nY
=
Z/n
mZ
(4.7)
i=1 (Xi
12
2
X)
(m 1)s21
2m1
12
e
Pn
i=1 (Yi
22
Y )2
(n 1)s22
=
2n1
2
2
107
Logo,
s21 /12
Fm1,n1
s22 /22
(4.8)
s21
Fm1,n1
s22
(4.9)
Se 12 = 22 , ento
Exemplo:
Suponha que uma amostra de tamanho 6 seja retirada de uma populao
normalmente distribuda com mdia 1 e varincia 30, e que uma amostra de
tamanho 3 seja retirada de uma outra populao normalmente distrbuda com
mdia 2 e varincia 76. Qual a probabilidade de s21 > s22 ?
Soluo:
2 2
s1 /1
22
s21
>1 =P
> 2
= P
s22
s22 /22
1
76
= P (F5,29 > ) = P (F5,29 > 2, 5) = 0, 05
30
P (s21
4.7
4.7.1
>
s22 )
(4.10)
X
z 2
P z 2
= 1 ,
/ n
108
ou seja
z X
+ z
P X
2
2
n
n
= 1 .
(4.11)
+ z ,
L2 = X
2
n
(4.12)
(4.13)
(4.14)
(4.15)
Logo, o intervalo com 95% de confiana para [43, 51; 46, 09]
2 - Desvio Padro () desconhecido
Como
X
tn1 ,
s/ n
(4.16)
P t 2 ,(n1)
X
t 2 ,(n1) = 1 ,
s/ n
109
ou seja
t (n1) s X
+ t (n1) s
P X
2
2
n
n
= 1 .
(4.17)
Portanto o intervalo
+ t (n1) s
t (n1) s , X
X
2
2
n
n
(4.18)
(4.19)
(4.20)
(4.21)
(4.22)
(4.23)
110
4.7.2
Vimos que
(n 1)s2
2n1 .
2
(4.24)
(n 1)s2
2
2
P (1 ),[n1]
,[n1] = 1 ,
2
2
2
ou seja
"
(n 1)s2
(n 1)s2
2
P
2 ,[n1]
2(1 ),[n1]
2
#
= 1 .
(4.25)
Portanto o intervalo
(n 1)s2 (n 1)s2
,
2 ,[n1] 2(1 ),[n1]
2
(n 1)s2
4(13, 52)
=
= 4, 85
2
,[n1]
11, 143
2
111
L2 =
(n 1)s2
4(13, 52)
=
= 111, 74
2
(1 ),[n1]
0, 484
2
1 - Varincias 12 e 22 Conhecidas
Como
X1 1
(0, 1)
1
n1
X2 2
(0, 1).
2
n2
(4.26)
Logo
1 X
) (1 2 )
(X
q2 2
(0, 1)
1
22
+
n1
n2
(4.27)
1 X
2 ) z/2
(X
s
12
n1
22
n2
1 X
2 ) + z/2
, (X
12
n1
22
n2
2 - 12 e 22 Desconhecidas mas 12 = 22
Vimos que
(
x1
x2 )(1 2 )
1/n1 +1/n2
tn1 +n2 2
(4.28)
112
(
x1 x2 ) t/2,[n1 +n2 2]
(n1
1)s21
+ (n2
n1 + n2 2
1)s22
1
1
+
n1 n2
Exemplo:
Uma amostra de 10 lmpadas eltricas, da marca A, apresentou a vida mdia de
1400 horas e desvio padro de 120 horas. Uma amostra de 20 lmpadas eltricas,
da marca B, apresentou a vida mdia de 1200 horas e o desvio padro de 100 horas.
Supondo que A = B , determinar os limites de confiana de a) 95% e b) 99% para
a diferena entre as vidas mdias das populaes das marcas A e B.
Soluo:
a) Para 1 = 0, 95 tem-se que t0,025,28 = 2, 048. Portanto, o I.C. de 95% para
A B ser:
9(120)2 + 19(100)2
28
1
1
+
10 20
!
= (200 67, 77)
Ou seja,
P (132, 23 A B 267, 77) = 0, 95
b) Analogamente, para 1 = 0, 99 tem-se que t0,005,28 = 2, 763. Portanto, o I.C.
de 99% para A B ser:
9(120)2 + 19(100)2
28
1
1
+
10 20
Ou seja,
P (108, 57 A B 291, 43) = 0, 99
113
!
= (200 91, 43)
4.7.4
Vimos que
s22 /22
Fn2 1,n1 1
s21 /12
(4.29)
P F(1/2),[n2 1],[n1 1]
s2 2
22 12 F/2,[n2 1],[n1 1]
s1 2
(4.30)
ou
1
F/2,[n1 1],[n2 1]
s2
2
s2
12 12 F/2,[n2 1],[n1 1] 12
s2
2
s2
(4.31)
Exemplo:
Duas mquinas A e B produzem parafusos com o mesmo tamanho mdio. Duas
amostras de tamanho nA = 61 e nB = 41 dos parafusos de A e B foram analisadas
e os desvios padres amostrais foram s2A = 3, 5 mm e s2B = 4, 5 mm. Determine um
intervalo de 95% de confiana para
Soluo:
2
A
.
2
B
A2
3, 5
3, 5
P 0, 556
2 1, 74
= 0, 95
4, 5
B
4, 5
A2
P 0, 432 2 1, 353 = 0, 95
B
4.7.5
114
Vimos que:
E(
p) = p
p(1 p)
V ar(
p) =
n
(4.32)
(4.33)
p(1 p)
p p,
n
(4.34)
p z/2
p(1 p)
, p + z/2
n
p(1 p)
n
!
(4.35)
4.7.6
p z/2
p(1 p)
p p + z/2
n
p(1 p)
n
!
=1
p1 (1 p1 ) p2 (1 p2 )
+
p1 p2 p1 p2 ,
n1
n2
(4.36)
(p1 p2 ) z/2
p1 (1 p1 ) p2 (1 p2 )
+
n1
n2
115
CAPTULO 5
TESTES DE HIPTESES
Consideraremos aqui problemas estatsticos envolvendo um parmetro cujo valor
desconhecido mas deve cair dentro de um certo domnio (isto , o conjunto
de todos os possveis valores de ). Vamos supor que possa ser particionado em
2 (dois) subconjuntos distintos 0 e 1 , e que o estatstico deva decidir se o valor
desconhecido de cai em 0 ou em 1 .
5.1
117
5.4
5.4.1
H0 verdadeira
H0 falsa
aceita H0
1 (Coef. de confiana)
rejeita H0
(nvel de significncia)
1 (poder do Teste)
H0 : = 0
H1 : 6= 0
118
1. Retira-se uma amostra de tamanho n e calcula-se X.
2. Calcula-se o valor da estatstica
Z=
0
X
/ n
3. Sob a hiptese nula, tem-se que Z possui uma distribuio normal padro.
Portanto,
Rejeita-se H0 se | Z |> Z/2 (isto , se Z < Z/2 ou Z > Z/2 )
Aceita-se H0 se | Z |< Z/2 (isto , Z/2 Z Z/2 ),
onde o nvel de significncia do teste.
5.4.2
desconhecido
H0 : = 0
H1 : 6= 0
Calcula-se a estatstica
t=
0
X
s/ n
Sob a hiptese nula, tem-se que t possui uma distribuio t-Student com n 1 graus
de liberdade. Portanto,
Rejeita-se H0 se | t |> t/2,[n1]
Aceita-se H0 se | t | t/2,[n1]
Observao
Se os testes das sees (5.4.1 e 5.4.2) tiverem uma hiptese alternativa unilateral
(i.e. se H1 : > 0 , ou H1 : < 0 ) o teste dever rejeitar unilateralmente (i.e. se
t > t,[n1] , ou t < t,[n1] , respectivamente.)
119
Exemplos:
1. Uma mquina automtica para encher pacotes de caf enche-os segundo uma
distribuio normal, com mdia e varincia sempre igual a 400 g 2 . A mquina
foi regulada para = 500g. Colhe-se, periodicamente uma amostra de 16 pacotes
para verificar se a produo est sob controle, isto , se = 500g ou no. Se uma
dessas amostras apresentasse uma mdia amostral de 492 g, voc pararia ou no a
produo para regular mquina, considerando o nvel de significncia de 1%? Para
quais valores de mdia amostral a mquina ser regulada?
Soluo:
As hipteses so:
H0 : = 500
H1 : 6= 500
Pelos dados do problema a varincia sempre a mesma e igual a 2 = 400. A
estatstica a ser calculada :
z=
0
X
492 500
= p
= 1, 6
/ n
400/16
120
Soluo:
As hipteses so:
H0 : = 1800
H1 : > 1800
Como supe-se que o desvio padro no se tenha modificado, temos que = 100. A
estatstica a ser calculada :
z=
0
1850 1800
X
=
= 3, 55
/ n
100/ 50
0
X
31, 5 30
=
= 2, 5
s/ n
3/ 25
121
5.5
Vimos que o erro tipo I representa o erro de se rejeitar H0 quando ela de fato
verdadeira. A probabilidade deste erro e fixada e portanto controlada pelo
estatstico.
Temos tambm o erro tipo II (beta) que representa o erro de aceitar H0 quando ela
falsa.
Quando rejeitamos H0 , automaticamente estamos aceitando H1 , isto , estamos
aceitando que o parmetro pertena ao espao definido pela hiptese H1 . O erro tipo
II depender do verdadeiro valor do parmetro. Quanto mais afastado o verdadeiro
valor do parmetro estiver do valor especificado em H0 , menor ser o erro tipo II.
Portanto, para calcular , temos que especificar este valor em H1 , isto , ter-se as
hipteses definidas por:
H0 : = 0
H1 : = 1
Vimos que o erro tipo I foi fixado em 0,01, supondo que H0 fosse verdadeira, isto ,
X
2, 33 | = 1800 =
0, 01 = P (erro I) = P (Z 2, 33) = P
/ n
100
X 1800
2, 33 = P X 1800 + 2, 33
=
= P
100/ 50
50
1832, 95
= P X
122
X
1832, 95 1850
<
= P
= P (Z < 1, 206)
= 0, 1131
/ n
100/ 50
O clculo acima pode ser efetuado para vrios valores de . Considerando-se () a
probabilidade de aceitar H0 como funo de , isto ,
< 1832, 95 | ,
() = P (aceitarH0 | ) = P X
pode-se calcular a funo
() = 1 ().
Esta funo denominada funo poder do teste.
5.6
Suponha que uma varivel seja normalmente distribuida com uma varincia
desconhecida e se deseje efetuar o seguinte teste de hipteses:
H0 : 2 = 02
H1 : 2 6= 02
Calcula-se a estatstica
X2 =
(n 1)s2
02
123
Observao
1. Se a hiptese alternativa fosse
H1 : 2 > 02 ,
H0 seria rejeitada se X 2 > 2,[n1] .
2. Se a hiptese alternativa fosse
H1 : 2 < 02 ,
H0 seria rejeitada se X 2 < 21,[n1] .
Exemplo:
Uma das maneiras de manter sob controle a qualidade de um produto controlar
a sua variabilidade. Uma mquina de encher pacotes de caf est regulada para
ench-los com mdia de 500 g e desvio padro de 10 g. Colheu-se uma amostra de
16 pacotes e observou-se uma varincia s2 = 169g 2 . Supondo que o peso de cada
pacote segue uma distribuio normal, voc diria que a mquina est desregulada
com relao varincia?
Soluo:
Deseja-se testar:
H0 : 2 = 100
H1 : 2 6= 100
A estatstica a ser calculada :
X2 =
e o procedimento do teste :
(n 1)s2
(15)(169)
=
= 25, 35
2
0
100
Aceita-se H0 se 21/2,[n1] X 2 2/2,[n1] ,
isto ,
Aceita-se H0 se 6, 262 X 2 27, 488,
e
Rejeita-se H0 se X 2 < 27, 488 ou X 2 > 27, 488
Portanto, aceita-se H0 , e conclumos que a mquina no est desregulada quanto
varincia.
124
5.7
H0 :
H1
(5.2)
O procedimento do teste :
Calcula-se a estatstica
f=
s21
s22
(5.3)
f F/2,[n1 1],[n2 1]
(5.4)
1
F/2,[n2 1],[n1 1]
(5.5)
ou
f > F/2,[n1 1],[n2 1]
125
(5.6)
Exemplo:
Uma das maneiras de medir o grau de satisfao dos empregados de uma mesma
categoria quanto poltica salarial por meio do desvio padro de seus salrios. A
fbrica A diz ser mais coerente na poltica salarial do que a fbrica B. Para verificar
essa afirmao, sorteou-se uma amostra de 10 funcionrios no especializados de A,
e 15 de B, obtendo-se os desvios padres sA = 1000 reais e sB = 1600 reais. Qual
seria a sua concluso?
Soluo:
A hiptese a ser testada :
H0 : A2 = B2
H1 : A2 6= B2
(5.7)
Temos que:
f=
s2A
1000
=
= 0, 667
2
sB
1500
f F0,025,[9],[14]
(5.8)
ou seja, se
1
f 3, 12
3, 77
0, 27 f 3, 12
(5.9)
126
5.8
5.8.1
12 e 22 conhecidas
Calcula-se a estatstica
x1 x2
Z=q 2
1
22
+
n1
n2
(5.10)
Sabemos que, sob a hiptese H0 , a varivel Z possui uma distribuio normal padro.
Portant, o procedimento do teste consiste em:
Rejeita-se H0 se | Z |> Z/2
Aceita-se H0 se | Z | Z/2
5.8.2
12 e 22 desconhecidas, mas 12 = 22
1
x2
qx
1
1
+
n
n
1
(5.11)
Como vimos anteriormente, esta estatstica possui ima distribuio t-Student com
n1 + n2 2 graus de liberdade. Portanto,
Rejeita-se H0 se | t |> t/2; n1 +n2 2
Aceita-se H0 se | t | t/2; n1 +n2 2
127
5.8.3
12 e 22 desconhecidas, mas 12 6= 22
Suponha que a hiptese de igualdade de varincias tenha sido rejeitada. Neste caso,
devemos calcular a estatstica
x1 x2
t= q 2
s1
s2
+ n22
n1
(5.12)
s21
,
n1
B=
s22
.
n2
Sendo este valor geralmente fracionrio, costuma-se arredondar para o inteiro mais
prximo para obter o nmero de graus de liberdade.
O procedimento do teste ento
Rejeita-se H0 se | t |> t/2 ,
Aceita-se H0 se | t | t/2 ,
Exemplos:
1. Uma amostra de 10 lmpadas eltricas, da marca A, apresentou a vida mdia
de 1400 horas e uma amostra de 20 lmpadas eltricas, da marca B, apresentou
a vida mdia de 1200 horas. Suponha que os desvios padres populacionais dos
tempos de vida das lmpadas das duas marcas sejam conhecidos e iguais a 120 e
100, respectivamente. Teste, ao nvel de significncia de 99%, a hiptese que as duas
marcas produzem lmpadas com o mesmo tempo mdio de vida.
Soluo:
Queremos testar a hiptese:
H0 : A = B
H1 : A 6= B
128
(5.13)
s2A
50
=
= 0, 667
2
sB
75
f F0,025,[11],[14]
ou seja, se aproximadamente
1
f 3, 06
3, 52
0, 28 f 3, 06
129
(5.14)
A
xB
qx
1
+ n1
n
A
=q
6876
1
1
12
+ 15
(11)(50)+(14)(75)
25
= 2, 56
Mdia
Varincia
A
B
70,5
84,3
71,6
169,5
Soluo:
Vamos inicialmente testar a hiptese de que as varincias so iguais:
H0 : A2 = B2
H1 : A2 6= B2
130
Temos que:
f=
s2A
71, 6
=
= 0, 42
2
sB
169, 5
f F0,05,[14],[19]
(5.15)
ou seja, se aproximadamente
1
f 2, 20
2, 33
0, 43 f 2, 20
Logo, rejeitamos H0 ao nvel de significncia de 0,10, e conclumos que as varincias
no so iguais.
Portanto, agora podemos testar a hiptese de igualdade de mdias:
H0 : A = B
H1 : A 6= B
A estatstica a ser utilizada deve ser:
70, 5 84, 3
xA xB
=q
t= q 2
= 3, 79
2
sA
sB
71,6
169,5
+
+
15
20
nA
nB
(5.16)
O valor crtico deve ser encontrado pela tabela t-Student com graus de liberdade
dado por:
=
175, 51
= 32, 46
= 32,
1, 627 + 3, 780
131
5.9
p0 (1p0 )
n
(5.17)
Temos que p =
32
50
H0 : p = 0, 50
H1 : p > 0, 50
p0 (1p0 )
n
0, 64 0, 50
q
= 1, 98
0,502
50
(5.18)
132
Para o nvel de significncia de 0,01 o valor crtico ser 2,33. Como o valor calculado
menor que o valor crtico, aceitamos H0 , e conclumos que os resultados so devidos
ao acaso e que o indivduo no tem faculdades de PES.
5.9.1
H0 : p1 = p2
H1 : p1 6= p2
Como
p1 p2 = p1 p2 = 0
(sobH0 )
(5.19)
e
p2A pB =
p1 q1 p2 q2
1
1
+
= pq( + )
n1
n2
n1 n2
(sobH0 )
(5.20)
em que
P =
n1 p1 + n2 p2
n1 + n2
(5.21)
p1 p2
p1 p2
(5.22)
e aceita-se H0 se | Z | Z/2
Exemplo:
Doi grupos, A e B, so formados, cada um por 100 pessoas que tm a mesma
enfermidade. ministrado um soro ao grupo A, mas no ao B (denominado grupo de
controle); a todos os outros respeitos, os dois grupos so tratados de modo idntico.
Determinou-se que 75 e 65 pessoas dos grupos A e B, respectivamente, curaram-se da
enfermidade. Testar a hiptese de que o soro auxilia a cura da enfermidade, adotado
o nvel de significncia de 0,01.
Soluo:
Denominando de pA e pB as propores populacionais curadas mediante o uso do
133
o soro no eficaz
H1 : pA > pB
o soro eficaz
75 + 65
= 0, 70
200
(5.23)
1
1
+
) = 0, 0042
100 100
(5.24)
pA pB
0, 75 0, 65
=
= 1, 543
pA pB
0, 0042
(5.25)
Teste 2 da independncia
Candidato
B
Indeciso
Totais
24
24
17
27
92
23
14
8
19
64
12
10
13
9
44
59
48
38
55
200
134
C
X
Pij e Pj =
j=1
L
X
Pij
(5.26)
i=1
Observe que:
L X
C
X
Pij =
i=1 j=1
L
X
Pi =
i=1
C
X
Pj = 1
(5.27)
j=1
Suponha agora que uma amostra de n individuos seja retirada da populao. Para
i = 1, 2, 3, ..., L, e j = 1, 2, 3, ..., C, seja Nij o nmero de individuos classificados
na i-sima linha e j-sima coluna. Alm disso, seja Ni o nmero de individuos
classificados na i-sima linha e Nj o nmero total de individuos classificados na
j-sima coluna.
Ni =
C
X
Nij e Nj =
j=1
L
X
Nij
(5.28)
Nj = n
(5.29)
i=1
Observe que
L X
C
X
i=1 j=1
Nij =
L
X
Ni =
i=1
135
C
X
j=1
O teste 2 pode ser usado para testar essa hiptese. Cada individuo na populao
deve pertencer a uma das L C celulas da tabela de contingncia. Sob a hiptese
H0 , as probabilidades desconhecidas Pij dessas celulas foram expressas em funo
PL
PC
dos parmetros desconhecidos Pi e Pj . Como
i=1 Pi = 1 e
j=1 Pj = 1, o
nmero de parmetros desconhecidos a serem estimados quando H0 verdadeiro
(L 1) + (C 1), ou L + C 2.
Para i = 1, 2, 3, ..., L, e j = 1, 2, 3, ..., C, seja Eij o estimador quando H0 verdadeira,
do nmero esperado de observaes classificadas na i-sima linha e j-sima coluna.
Portanto, a estatstica Q definida no teste 2 de aderncia dada por
L X
C
X
(Nij Eij )2
Q=
Eij
(5.30)
i=1 j=1
Eij = n
Ni
n
Nj
n
Ni Nj
n
(5.31)
A hiptese nula ser rejeitada quando Q > c , onde c obtido na tabela 2 com
(L 1)(C 1) graus de liberdade.
136
18,88
15,36
12,16
16,60
12,98
10,56
8,36
12,10
137
CAPTULO 6
ANLISE DE VARINCIA
6.1
Introduo
139
Total
Mdia
1
y11
y12
y13
...
2
y21
y22
y23
...
3
y31
y32
y33
...
...
...
...
...
...
i
yi1
yi2
yi3
...
...
...
...
...
...
k
yk1
yk2
yk3
...
y1n
y2n
y3n
...
yin
...
ykn
T1
y1
T2
y2
T3
y3
...
...
Ti
yi
...
...
Tk
yk
140
onde
Ti =
n
X
yij
j=1
Pn
j=1
yi =
yij
k X
n
X
yij =
k
X
i=1 j=1
Pk Pn
y =
i=1
j=1
Ti
i=1
yij
nk
Pk
=
i=1
yi
(6.1)
141
Fig. 6.2 Distribuies normais com mesma mdia () para todas as populaes
Uma forma alternativa para escrever a equao (6.1) obtida substituindo-se i por
+ i , onde definida como sendo a mdia de todos os i .
Assim, podemos escrever yij como:
yij = + i + ij
sujeito restrio de que
Pk
i=1
(6.2)
i-sima populao.
Uma forma alternativa, ento, de se expressar a hiptese nula e a hiptese
alternativa, faz uso dos i . Caso no haja efeito da i-sima populao (i=1,2, . . . ,k),
as mdias das mesmas so iguais (um tratamento no superior ao outro), e as
hipteses ficam expressas como:
H0 : 1 = 2 = 3 = . . . = k = 0
H1 : pelo menos um dos i no zero.
Nosso teste se basear na comparao de duas estimativas independentes da
varincia populacional comum, 2 . Essas estimativas sero obtidas dividindo-se a
variabilidade total dos dados em duas componentes.
A varincia de todas as observaes agrupadas em uma nica amostra de tamanho
142
k X
n
X
(yij y )2
nk 1
i=1 j=1
i=1
i=1 j=1
Pk Pn
j=1 (yij
i=1
y )2
Pk Pn
i=1
j=1 (yij
Pk
yi
i=1 (
y )2
yi )2 .
Portanto:
SST = SSC + SSE
Muitos autores referem-se soma dos quadrados para as colunas como soma dos
quadrados dos tratamentos. Esta terminologia derivada do fato que as k diferentes
populaes so frequentemente classificadas de acordo com diferentes tratamentos.
Uma estimativa de 2 , baseada em (k 1) graus de liberdade dada por:
s21 =
SSC
k1
143
SSE
k(n 1)
SST
nk 1
Mas
Pn
yi )
j=1 (yij
n1
Pn
yi )2
n1
j=1 (yij
i=1
k
X
(n 1)s2i
i=1
E(SSE) = E
k
X
(n 1)s2i
!
= (n 1)
i=1
k
X
E(s2i )
i=1
= (n 1)
k
X
i2
i=1
144
Ou seja,
E
Assim sendo, s22 =
SSE
(n1)k
SSE
(n 1)k
= E(s22 ) = 2
um estimador no tendencioso de 2 .
k
X
(
yi y ) = n
i=1
= n
= n
k
X
i=1
k
X
k
X
yi2
2n
y
i=1
yi2 2n
y
k
X
k
X
i=1
yi + nk
y2 = n
k
X
i=1
yi + n
k
X
y2
i=1
yi2 2n
y k
y + nk y2
i=1
yi2 nk y2
i=1
Portanto,
E(SSC) = E
k
X
!
yi2
nk y2
=n
i=1
k
X
E yi2 nkE y2
i=1
k
X
V ar (
yi ) + E 2 (
yi ) nk V ar (
y ) + E 2 (
y )
i=1
2
i2
=
n
n
pois i2 = 2 para i = 1, 2, . . . , k.
145
V ar (
y ) =
2
nk
E (
y ) =
Ento
k 2
X
2
2
E(SSC) = n
+ ( + i ) nk
+
n
nk
i=1
k 2
X
2
2
= n
+ + 2i + i 2 nk2
n
i=1
2
= k + nk + 2n
k
X
i + n
i=1
= 2 (k 1) + n
k
X
k
X
i2 2 nk2
i=1
i2
i=1
Assim,
SSC
k1
SSC
k1
= E(s21 ) = 2 + n(k 1)
k
X
i2
i=1
146
Em geral, calcula-se SST e SSC primeiro e da, fazendo uso da identidade da soma
dos quadrados obtem-se SSE = SST - SSC.
As frmulas definidas anteriormente para o cmputo de SST e SSC no so as mais
simples para se utilizar. Frmulas alternativas preferenciais elas so:
SST =
k X
n
X
yij2
i=1 j=1
Pk
SSC =
i=1
147
Ti2
T2
nk
T2
nk
Soma dos
Graus de
Quadrados
de Variao
Quadrados
Liberdade
Mdios
Tratamento
SSC
k1
Resduo
SSE
k(n 1)
Total
SST
nk 1
s21 =
s22 =
f calculado
SSC
k1
SSE
k(n1)
f=
s21
s22
Exemplo:
Os dados da tabela abaixo representam 5 amostras, cada uma de tamanho n=5,
tiradas de distribuies normais independentes com mdias 1 , 2 , 3 , 4 , 5 e
varincia comum 2 . Testar a hiptese de que as mdias so iguais, ao nvel de
significncia de 5%.
Total
Mdia
Populao
C
5
4
8
6
9
7
8
6
3
5
2
3
2
3
4
1
7
6
9
4
26
5,2
39
7,8
20
4,0
14
2,8
33
6,6
Soluo:
Deseja-se testar a hiptese:
H0 : 1 = 2 = 3 = 4 = 5
H1 : pelo menos duas mdias so diferentes
148
132
5,28
Tem-se que:
SST =
k X
n
X
yij2
i=1 j=1
T2
nk
= 5 2 + 4 2 + . . . + 42 + 72
1322
25
(6.3)
Ti2
T2
n
nk
262 + 392 + 202 + 142 + 332 1322
=
5
25
= 776, 400 696, 960 = 79, 440
i=1
SSC =
(6.4)
SSE = SST SSC = 37, 040 79, 470 = 57, 600
A Tabela ANOVA dada por:
Fonte
de Variao
Soma dos
Quadrados
Graus de
Liberdade
Quadrados
Mdios
Tratamento
79,440
19,860
Resduo
Total
57,600
137,040
20
24
3,880
f calculado
6,90
k X
n
X
yij2
i=1 j=1
SSC =
k
X
T2
i
i=1
ni
T2
N
T2
N
149
6.3
1)s2i
N k
i=1 (ni
Calcula-se tambm
b = 2, 3026
q
h
onde
q = (N
k) log s2p
k
X
" k
#
X 1
1
1
h=1+
3(k 1) i=1 ni 1 N k
b um valor da varivel aleatria B que possui uma distribuio 2 com k 1 graus
de liberdade. A quantidade q ser grande quando as varincias amostrais diferem
significativamente, e ser igual a zero quando todas as varincias amostrais forem
iguais. Assim, rejeita-se H0 ao nvel de significncia quando
b > 2,k1
150
Exemplo:
Use o teste de Bartlett para testar a hiptese de que as varincias das trs populaes
abaixo so iguais:
A
4
Total
Amostra
B
5
C
8
7
6
6
1
3
5
3
4
6
8
9
5
23
21
36
80
Soluo:
Deseja-se testar a hiptese:
H0 : 12 = 22 = 32
H1 : as varincias no so iguais
Tem-se que:
n1 = 4, n2 = 6, n3 = 5, N = 15, k = 3.
s21 = 1, 583;
s22 = 2, 300;
s23 = 2, 700
Assim,
s2p =
1 1 1 1
1
h = 1+
+ +
= 1, 1167
6 3 5 4 12
(6.6)
b =
151
6.4
(6.7)
(yij y ) = c
i=1 j=1
r
X
c
r X
c
X
X
2
(
yi y ) + r
(
yj y ) +
(yij yi yj + y )2
2
i=1
j=1
i=1 j=1
r X
c
X
(yij y ) =
[(
yi y ) + (
yj y ) + (yij yi yj + y )]2
2
i=1 j=1
152
onde
P P
SST = ri=1 cj=1 (yij y )2 = soma total de quadrados
SSR = c
SSC = r
SSE =
Pr
yi
i=1 (
Pc
yj
y )2
j=1 (
Pr
i=1
Pc
j=1 (yij
SSR
r1
SSC
c1
SSE
(r 1)(c 1)
153
Para testar a hiptese nula de que os efeitos das linhas so todos zeros, isto :
H0 : 1 = 2 = . . . = r = 0
H1 : pelo menos um dos i no zero,
calculamos a estatstica
f1 =
s21
,
s23
s22
,
s23
154
r X
c
X
T2
rc
yij2
i=1 j=1
Pr
Ti2
T2
Pc c 2 rc
T2
j=1 Tj
SSC =
r
rc
SSR =
i=1
Soma dos
Graus de
Quadrados
de Variao
Quadrados
Liberdade
Mdios
Devido s
linhas
SSR
r1
s21 =
SSR
r1
f1 =
s21
s23
Devido s
colunas
SSC
c1
s22 =
SSC
c1
f2 =
s22
s23
Erro
SSE
(r 1)(c 1)
Total
SST
rc 1
s23 =
f calculado
SSE
(r1)(c1)
Exemplo:
A tabela abaixo apresenta os resultados da safra mdia de trigo, para trs variedades
0
de trigo e quatro tipos de fertilizantes. Teste a hiptese H0 de que no h diferena
na safra mdia de trigo quando diferentes tipos de fertilizantes so utilizados. Teste
00
V1
V2
V3
Total
F1
F2
F3
F4
64
55
59
58
72
57
66
57
74
47
58
53
210
159
183
168
Total
236
252
232
720
155
H0 : 1 = 2 = 3 = 4 = 0
0
: 1 = 2 = 3 = 0
00
H0
H1
SST =
yij2
i=1 j=1
Pr
T2
7202
= 642 + 552 + . . . + 532
= 662
rc
12
Ti2
T2
2102 + 1592 + 1832 + 1682 7202
= 498
SSR =
3
12
Pc c 2 rc
T2
2362 + 2522 + 2322 7202
j=1 Tj
SSC =
=
= 56
r
rc
4
12
SSE = 662 498 56 = 108
i=1
TABELA ANOVA
Fonte
de Variao
Soma dos
Quadrados
Graus de
Liberdade
Quadrados
Mdios
f calculado
Fertilizantes
498
166
9,22
Var. de trigo
Erro
Total
56
108
662
2
6
11
28
18
1,56
00
156
6.5
Na seo anterior foi suposto que os efeitos das linhas e colunas eram aditivos. Isto
equivalente a dizer que
ij ij 0 = i0 j i0 j 0
ou
ij i0 j = ij 0 i0 j 0
0
157
158
Colunas
r
Total
...
y111
y121
...
y1c1
y112
..
.
y122
..
.
...
..
.
y1c2
..
.
y11n
y12n
...
y1cn
...
...
...
...
...
...
...
...
...
...
...
...
yr11
yr12
..
.
yr21
yr22
..
.
...
...
..
.
yrc1
yrc2
..
.
yr1n
yr2n
...
yrcn
T1
T2
...
Tr
Total
Mdia
T1
y1
Tr
yr
n
X
yijk
yijk
k=1
Ti =
c X
n
X
j=1 k=1
Tj =
r X
n
X
yijk
i=1 k=1
T =
r X
c X
n
X
yijk
159
Pn
Pn
j=1
k=1
yijk
cn
Pr
Pn
i=1
yj =
yijk
k=1
rn
PP
yj =
rn
Pr
y =
i=1
Tij
n
Pc
yi =
yijk
k=1
yij =
Ti
cn
Tj
rn
Tj
rn
Pc
j=1
k=1
yijk
rcn
T
rcn
(6.8)
i = 0;
c
X
j=1
j = 0;
r
X
i=1
160
ij = 0;
c
X
j=1
ij = 0;
H0 : 1 = 2 = . . . = c = 0
0
00
: 11 = 12 = . . . = rc = 0
00
H0
H1
6.5.1
(yijk y )
= cn
i=1 j=1
r
X
c
X
(
yi y ) + rn
(
yj y )2 +
2
i=1
+ n
r X
c
X
j=1
2
(
yij yi yj + y ) +
i=1 j=1
r X
c X
n
X
(yijk yij )2
de linhas e colunas
r X
c X
n
X
SSE =
(yijk yij )2 = soma de quadrados dos erros
i=1 j=1 k=1
161
00
SSR
;
r1
s22 =
SSC
;
c1
s23 =
SS(RC)
;
(r 1)(c 1)
s24 =
SSE
.
rc(n 1)
00
s21
para H0 ;
s24
f2 =
s22
0
para H0 ;
2
s4
f3 =
s23
00
para H0 ;
2
s4
00
r X
c X
n
X
2
yijk
T2
rcn
Pr
T2
rcn
Pccn 2
T
T2
j=1 j
SSC =
PrrnPc rcn
Pc
Pr
2
2
2
T2
j=1 Tij
i=1
j=1 Tj
i=1 Ti
SS(RC) =
+
n
cn
rn
rcn
SSE = SST SSR SSC SS(RC)
SSR =
162
Soma dos
Quadrados
Graus de
Liberdade
Quadrados
Mdios
Devido s
linhas
SSR
r1
s21 =
SSR
r1
f1 =
s21
s24
Devido s
colunas
SSC
c1
s22 =
SSC
c1
f2 =
s22
s24
Devido
interao
Erro
SS(RC)
(r 1)(c 1)
SS(RC)
(r1)(c1)
f3 =
s23
s24
SSE
rc(n 1)
Total
SST
rcn 1
s23 =
s24 =
f calculado
SSE
rc(n1)
Exemplo:
Utilizando os dados a seguir, teste as hipteses abaixo, utilizando nvel de
significncia de 5%:
Exemplo:
Fertilizantes
V1
Variedades de Trigo
V2
V3
64
66
72
81
74
51
70
64
65
F2
65
63
58
57
43
52
47
58
67
F3
59
68
66
71
58
39
65
59
42
58
41
46
57
61
53
53
59
38
F1
F4
Soluo:
163
H0 : 1 = 2 = 3 = 0
0
00
: 11 = 12 = . . . = 43 = 0
00
H0
H1
Variedades de Trigo
V1
V2
V3
Total
F1
200
217
190
607
F2
186
152
172
510
F3
192
196
139
527
F4
145
171
150
466
Total
723
736
651
2110
21102
SST = 64 + 66 + . . . + 38
= 3779
36
2
SSR =
= 1157
9
36
SSC =
SS(RC) =
= 350
12
36
164
Soma dos
Quadrados
Graus de
Liberdade
Quadrados
Mdios
f calculado
Devido aos
fertilizantes
1157
385,67
6,17
Devido s
variedades de
trigo
Devido
interao
350
175,00
2,80
771
128,50
2,05
Erro
1501
24
62,54
Total
3779
35
00
165