Escolar Documentos
Profissional Documentos
Cultura Documentos
Prefcio
Estas notas de aula foram feitas para compilar o contedo de vrias referncias bibliogrcas
tendo em vista o contedo programtico da disciplina ET101-Estatstica 1 ministrada para
os cursos de graduao em Engenharia na rea 2 da Universidade Federal de Pernambuco.
Em particular, elas no contm nenhum material original e no substituem a consulta a
livros textos. Seu principal objetivo dispensar a necessidade dos alunos terem que copiar
as aulas e, deste modo, poderem se concentrar em entender o contedo das mesmas.
Contedo
Prefcio
1 Introduo Probabilidade
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
1.10
1.11
1.12
Introduo . . . . . . . . . . .
Mtodos de Contagem . . . .
2.2.1 Regra da Adio . . .
2.2.2 Regra da Multiplicao
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
2
4
4
5
5
6
7
7
9
10
10
11
12
15
15
15
15
16
3 Probabilidade Condicional
22
4 Variveis Aleatrias
34
3.1
3.2
4.1
4.2
4.3
4.4
4.5
Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Independncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Introduo . . . . . . . . . . . . . .
Funo de Distribuio Acumulada
Tipos de Varivel Aleatria . . . .
Varivel Aleatria Discreta . . . . .
Varivel Aleatria Contnua . . . .
.
.
.
.
.
ii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
22
30
34
35
37
37
38
4.6
4.7
4.8
4.9
5 Esperana e Momentos
5.1
5.2
5.3
5.4
5.5
5.6
O Conceito de Esperana . . . . . . . . . . . . . . .
5.1.1 Denio da Esperana - Caso Discreto . . .
5.1.2 Denio da Esperana - Caso Contnuo . .
Esperana de Funes de Variveis Aleatrias . . .
5.2.1 Caso Discreto . . . . . . . . . . . . . . . . .
5.2.2 Caso Contnuo . . . . . . . . . . . . . . . .
Propriedades da Esperana . . . . . . . . . . . . . .
Momentos . . . . . . . . . . . . . . . . . . . . . . .
5.4.1 Momentos Centrais . . . . . . . . . . . . . .
Correlao, Covarincia, e Desigualdade de Schwarz
Esperana Condicional . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6.4
6.5
6.6
6.7
7.3
7.4
7.5
7.6
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Geomtrica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Binomial Negativa ou Pascal. . . . . . . . . . . . . . . . . . . . . . .
6.3.1 Relao entre as Distribuies Binomial e Binomial Negativa.
Poisson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Hipergeomtrica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Poisson como um Limite de Eventos Raros de Binomial . . . . . . . .
A Distribuio Multinomial . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Introduo . . . . . . . . . . . . . . . . . .
Normal ou Gaussiana . . . . . . . . . . . .
7.2.1 Tabulao da Distribuio Normal
Exponencial . . . . . . . . . . . . . . . . .
Cauchy . . . . . . . . . . . . . . . . . . . .
Qui-quadrado . . . . . . . . . . . . . . . .
t de Student . . . . . . . . . . . . . . . . .
iii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
38
38
39
39
41
41
42
42
45
46
47
48
51
51
51
53
53
53
54
56
57
58
61
62
65
65
65
66
67
67
69
70
71
73
73
73
76
77
78
79
80
7.7
Resumo de Dados . . . . . . . . . .
8.1.1 Tipos de Variveis . . . . .
8.1.2 Distribuies de Freqncias
8.1.3 Representao Grca . . .
8.1.4 Medidas de Posio . . . . .
8.1.5 Medidas de Disperso . . . .
8.1.6 Quantis . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
9 Distribuies Amostrais
9.1
9.2
9.3
9.4
9.5
9.6
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Introduo . . . . . . . . . . . . . . . . . . . . . .
Populao e Amostra . . . . . . . . . . . . . . . .
Seleo de uma Amostra . . . . . . . . . . . . . .
9.3.1 Amostra Aleatria Simples . . . . . . . . .
Estatsticas e Parmetros . . . . . . . . . . . . . .
Distribuies Amostrais . . . . . . . . . . . . . .
9.5.1 Distribuio Amostral da Mdia Amostral
9.5.2 Distribuio Amostral de uma Proporo .
Determinao do Tamanho de uma Amostra . . .
10 Estimao
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
Varincia Conhecida . .
Varincia Desconhecida
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
80
82
82
82
83
85
86
87
88
92
92
92
93
93
94
95
96
98
98
100
100
101
104
105
108
11 Testes de Hiptese
109
Referncias Bibliogrcas
119
iv
109
112
113
113
115
115
116
117
Captulo 1
Introduo Probabilidade
1.1 Denio de Conjuntos e Exemplos
Denio 1.1.1: Um conjunto uma coleo de elementos distintos onde os elementos no
so ordenados.
Um conjuntos pode ser especicado, listando seus elementos dentro de chaves. Por exemplo,
A = {0, 1, 2, 3, 5, 8, 13}, B = {0, 1, 2, . . . , 1000}.
Alternativamente, um conjunto pode ser especicado por uma regra que determina os membros do conjunto, como em:
Nn = {0, 1, 2, . . . , n 1},
Z = {x : x um inteiro},
Z + = {x : x um inteiro positivo},
Q = {x : x racional}.
Por outro lado, os seguintes conjuntos so no-enumerveis:
IR = {x : x um nmero real},
(a, b) = {x : a < x < b}, onde a < b,
[a, b] = {x : a x b}, onde a < b.
Existem dois conjuntos especiais que nos interessaro. Em muitos problemas nos dedicaremos a estudar um conjunto denido de objetos, e no outros. Por exemplo, em alguns
problemas podemos nos interessar pelo conjunto dos nmeros naturais; ou em outros problemas pelo conjuntos dos nmeros reais; ou ainda por todas as peas que saem de uma linha
produo durante um perodo de 24h, etc. O conjunto que contm todos os elementos que
queremos considerar chamado de conjunto universo e denotado por . Por outro lado, o
conjunto especial que no possui elementos chamado de conjunto vazio e denotado por
. Este conjunto tem cardinalidade 0 e portanto nito. Por exemplo,
Exemplo 1.2.1: Seja = {0, 1, 2, 3, 4, 5, 6, 7}, A = {0, 1, 5} e B = {1, 2, 3, 4}. Ento segue
que Ac = {2, 3, 4, 6, 7}, A B = {0, 1, 2, 3, 4, 5}, A B = {1}, A B = {0, 5}.
C D = , A C e B D. Prove que A = C e B = D.
Soluo: Basta provar que C A e D B . Seja C , ento como C D = , temos
que
/ D. Logo, como B D, segue que
/ B . Mas como A B = , temos que A.
Portanto, C A.
Para provar que D B , seja D, ento como C D = , temos que
/ C . Logo,
como A C , segue que
/ A. Mas como A B = , temos que B . Portanto, D B .
Relaes e propriedades das operaes Booleanas incluem as seguintes:
1. Idempotncia: (Ac )c = A
2. Comutatividade (Simetria): A B = B A e A B = B A
3. Associatividade: A (B C) = (A B) C) e A (B C) = (A B) C)
4. Distributividade: A (B C) = (A B) (A C) e A (B C) = (A B) (A C)
5. Leis de De Morgan: (A B)c = Ac B c e (A B)c = Ac B c .
Prova: Suponha que (A B)c . Ento, / (A B), o que por sua vez implica
que
/ A e
/ B . Logo, Ac e B c , ou seja, (Ac B c ). Ento,
(A B)c (Ac B c ). Agora suponha que (Ac B c ). Ento, Ac e B c , o
que por sua vez implica que
/Ae
/ B . Logo,
/ (A B), ou seja, (A B)c .
c
c
c
c
c
Ento, (A B ) (A b) . Portanto, (A B ) = (A b)c .
A prova da outra Lei de Morgan anloga e deixada como Exerccio.
Observe que as Leis de De Morgan permitem que possamos expressar unies em termos
de interseces e complementos e interseces em termos de unies e complementos.
As noes de unio e interseco se estendem para colees arbitrrias de conjuntos
atravs de dois quanticadores: existe (), e para todo ().
I A = { : ( I, A )} e I A = { : ( I, A )}.
Por exemplo, se = 0, 1, 2, . . ., I o conjunto de inteiros positivos divisveis por 3 e
A = N = {0, 1, 2, . . . , 1}, ento
I N = e I N = N3 .
A B = {(a, b) : a A, b B}.
A B = {(1, c), (1, d), (2, c), (2, d), (3, c), (3, d)}, e
B A = {(c, 1), (c, 2), (c, 3), (d, 1), (d, 2), (d, 3)}.
A noo de produto cartesiano pode ser estendida da seguinte maneira: Se A1 , . . . , An
forem conjuntos, ento,
A1 A2 . . . An = {(a1 , a2 , . . . , an ) : ai Ai },
ou seja, o conjunto de todas as nuplas ordenadas.
Um caso especial importante surge quando consideramos o produto cartesiano de um
conjunto por ele prprio, isto , A A. Exemplos disso surgem quando tratamos do plano
euclideano, IR IR, onde IR o conjunto de todos os nmeros reais, e do espao euclideano
tridimensional, representado por IR IR IR.
cido como conjuntos das partes de A, e denotado por 2A , cujos elementos so subconjuntos
de A.
Pode-se provar que a cardinalidade do conjunto das partes de qualquer conjunto dado A
maior que a cardinalidade de A.
1.5 Partio
Deste modo os conjuntos de uma partio so disjuntos par a par e cobrem todo o conjunto
universo. Portanto, cada elemento pertence a um, e somente um, dos conjuntos A
de uma partio.
Exemplo 1.5.2: Se = {1, 2, 3, 4}, ento {A1 , A2 }, onde A1 = {1, 2, 3} e A2 = {4}, uma
partio de .
IA () =
1 se A,
0 se
/ A.
A = B ( )IA () = IB ().
O fato que conjuntos so iguais se, e somente se, suas funes indicadoras forem idnticas
nos permitem explorar a aritmtica de funes indicadoras:
IAc = 1 IA ,
A B IA IB ,
IAB = min(IA , IB ) = IA IB ,
Autor: Leandro Chaves Rgo
IAB = max(IA IB , 0) = IA IB c ,
para construir argumentos rigorosos no que se refere a relao entre conjuntos. Ou seja,
ns transformamos proposies sobre conjuntos em proposies sobre funes indicadoras
e podemos ento utilizar nossa familiaridade com lgebra para resolver perguntas menos
familiares sobre conjuntos.
Soluo: Exerccio.
Denio 1.9.2:
Exemplo 1.9.3:
1. A menor lgebra de eventos A = {, };
2. A maior lgebra de eventos o conjunto das partes de ;
3. Um exemplo intermedirio, temos:
Exemplo 1.9.4: A coleo de conjuntos de nmeros reais nitos e co-nitos uma lgebra
que no uma -lgebra.
Exemplo 1.9.5: A -lgebra de Borel B de subconjuntos reais , por denio, a menor lgebra contendo todos os intervalos e a -lgebra usual quando lidamos com quantidades
reais ou vetoriais. Em particular, temos que unies enumerveis de intervalos (por exemplo,
o conjunto dos nmeros racionais), seus complementos (por exemplo, o conjunto dos nmeros
irracionais), e muito mais est em B .
Denio 1.10.1:
1
rn (A) =
n
IA (i ) =
i=1
Nn (A)
.
n
Autor: Leandro Chaves Rgo
10
FR0. rn : A IR.
FR1. rn (A) 0.
FR2. rn () = 1.
FR3. Se A e B so disjuntos, ento rn (A B) = rn (A) + rn (B).
Ns prosseguiremos como se existisse alguma base emprica ou metafsica que garanta que
rn (A) P (A), embora que o sentido de convergncia quando n cresce s ser explicado pela
Lei dos Grandes Nmeros, que no ser discutida em detalhes neste curso. Esta tendncia da
freqncia relativa de estabilizar em um certo valor conhecida como regularidade estatstica.
Deste modo, P herdar propriedades da freqncia relativa rn .
P (
i=1 Ai ) =
P (Ai ).
i=1
Note que para espaos amostrais nitos, somente existem um nmero nito de subconjuntos diferentes, logo para que tenhamos uma coleo enumervel de eventos disjuntos dois
a dois, um nmero enumervel destes deve ser vazio. Como veremos adiante a probabilidade
de um evento vazio nula, o que implica que para espaos amostrais nitos K3 e K4 so
equivalentes.
Denio 1.12.1: Uma funo que satisfaz K0K4 chamada de uma medida de probabilidade.
P (A) =
||A||
||||
12
P () = 1 P () = 0.
Parte 3, segue do fato que 1 = P () = P (A) + P (Ac ) P (A), j que P (Ac ) 0 por K1.
dada por
P (B Ai ).
i
13
B = B = B (i Ai ) = i (B Ai ).
O resultado segue ento por K4 .
P (ni=1 Ai )
P (Ai ).
i=1
Prova: Omitida.
Corolrio 1.12.10: Para n eventos arbitrrios {A1 , . . . , An },
n
P (Ai )
P (Ai ) (n 1).
i=1
Prova: Utilizando a Lei de De Morgan e a desigualdade de Boole para os eventos {Ac1 , . . . , Acn },
temos
Logo,
P (Aci ) =
(1 P (Ai )).
i=1
P (Ai )
P (Ai ) (n 1).
i=1
ndices que um subconjunto no-vazio qualquer de {1, 2, . . . , n}. Para eventos arbitrrios
{A1 , . . . , An },
P (ni=1 Ai ) =
(1)||I||+1 P (iI Ai ),
=I{1,...,n}
P (A1 A2 A3 ) = P (A1 )+P (A2 )+P (A3 )P (A1 A2 )P (A1 A3 )P (A2 A3 )+P (A1 A2 A3 ).
Exemplo 1.12.14: Se {Ai } for uma partio enumervel de e P (Ai ) = abi , i 1, ento
quais as condies que a e b devem satisfazer para que P seja uma medida de probabilidade?
Captulo 2
Espaos Amostrais Finitos
2.1 Introduo
Vericamos no captulo anterior que se = {1 , 2 , . . . , n } um conjunto nito, ento para
determinar a probabilidade de qualquer evento A suciente especicar a probabilidade de
cada eventos simples {i }, ou seja P ({i }) = pi . fcil ver que os axiomas de Kolmogorov
implicam que pi 0, i 1 e ni=1 pi = 1, e P (A) = i A P ({i }).
Para determinarmos as probabilidades dos eventos simples, precisamos de algumas hipteses adicionais. Por exemplo, se = {w1 , w2 , w3 }, {w1 } for 3 vezes mais provvel, que
{w2 , w3 }, e {w2 } for igualmente provvel a {w3 }, temos que: p1 = 3(p2 + p3 ), p2 = p3 . Logo,
como p1 + p2 + p3 = 1, temos que p3 = p2 = 81 , e p1 = 34 .
Vimos tambm que de acordo com a interpretao clssica de probabilidade, onde o
espao amostral nito e os possveis resultados do experimento so equiprovveis, ento
a probabilidade de qualquer evento A A proporcional a sua cardinalidade, isto , P (A) =
||A||
. Portanto, importante que saibamos contar a quantidade de elementos que um evento.
||||
Exemplo 2.2.1: Suponha que estejamos planejando uma viagem e devamos escolher entre
o transporte por nibus ou por trem. Se existirem trs rodovias e duas ferrovias, ento
existiro 3 + 2 = 5 caminhos disponveis para a viagem.
Exemplo 2.2.2: Quantos divisores inteiros e positivos possui o nmero 360? Quantos desses
Exemplo 2.2.3: De quantos modos o nmero 720 pode ser decomposto em um produto
seqncias binrias de comprimento r igual a 2r pois neste caso temos para cada posio
i da seqncia ni = 2. O nmero de subconjuntos de um dado conjunto ||A|| = r pode ser
determinado enumerando A = {a1 , a2 , a3 , . . . , ar } e descrevendo cada subconjunto B de A
por uma seqncia binria
(b1 , b2 , . . . , br )
, onde bi = 1 se ai B e bi = 0, caso contrrio. Como existem 2r destas seqncias, ento
existem 2r subconjuntos de um conjunto de r elementos. Portanto, se ||A|| = r, o conjunto
das partes de A, possui 2r elementos, o que explica a notao exponencial do conjunto das
partes.
(n i),
(n)r = n(n 1) (n r + 1) =
i=0
n! = (n)n = n(n 1) 1,
onde n! conhecida como funo fatorial. Em termos, de funo fatorial, ns podemos
escrever:
n!
(n)r =
.
(n r)!
Propriedades da funo fatorial n! incluem as seguintes:
0! = 1! = 1 e n! = n(n 1)!.
Soluo: Temos que garantir que cada elemento de A tem uma imagem diferente. Como
A nito e tem n elementos, garante-se deste modo que f tambm sobrejetora e, portanto,
bijetora. Ento, o primeiro elemento de A tem n opes, o segundo n 1 opes, at que
o ltimo elemento de A tem somente uma opo disponvel. Portanto, existem n! funes
bijetoras f : A A.
Exemplo 2.2.8: De quantos modos possvel colocar r rapazes e m moas em la de modo
que as moas permaneam juntas?
Soluo: Primeiro temos r + 1 opes de escolher o lugar das moas. Em seguida, temos
r! maneiras de escolher a posio dos rapazes entre si, e m! maneiras de escolher a posio
das moas entre si. Portanto, temos (r + 1)r!m! modos diferentes de escolha.
o elemento que ocupa o lugar de ordem k , da esquerda para a direita, sempre maior que
k 3?
Soluo: Comecemos escolhendo os nmeros da direita para esquerda. Observe que
o nmero no lugar de ordem 10, tem que ser maior que 7, portanto existem 3 opes. O
nmero no lugar de ordem 9, tem que ser maior que 6, existem, portanto, 3 opes visto
que um dos nmeros maiores que 6 j foi utilizado na ltima posio. De maneira similar
pode-se ver que existem 3 opes para os nmeros que ocupam do terceiro ao oitavo lugar.
O nmero no lugar de ordem 2, tem somente 2 opes, pois oito nmeros j foram escolhidos
anteriormente. Finalmente, resta apenas um nmero para o lugar de ordem n. Portanto,
existem 2 38 permutaes deste tipo.
19
n
r
(n)r
n!
=
.
r!
(n r)!r!
Para vericar isto, note que o nmero de colees ordenadas de tamanho r sem repetio
(n)r . Como os elementos de cada seqncia de comprimento r so distintos, o nmero de
permutaes de cada seqncia r!. Porm, utilizando a regra da multiplicao, o procedimento de escolhermos uma coleo ordenada de r termos sem repetio igual a primeiro
escolher uma coleo no-ordenada de r termos sem repetio e depois escolhermos uma
ordem para esta coleo no ordenada, ou seja, temos que
n
r!,
r
(n)r =
n
r
n
,
nr
n
0
n
1
= 1,
= n,
n
r
= 0 se n < r.
2 =
r=0
n
.
r
(a + b) =
k=0
n k nk
a b .
k
Exemplo 2.2.10: Dentre oito pessoas, quantas comisses de trs membros podem ser escolhidas, desde que duas comisses sejam a mesma comisso se forem constitudas pelas
mesmas pessoas (no se levando em conta a ordem em que sejam escolhidas)? A resposta
dada por 83 = 56 comisses possveis.
Autor: Leandro Chaves Rgo
Exemplo 2.2.12: Um grupo de oito pessoas formado de cinco homens e trs mulheres.
Quantas comisses de trs pessoas podem ser constitudas, incluindo exatamente dois homens? Aqui deveremos fazer duas coisas, escolher dois homens (dentre cinco) e escolher duas
mulheres (dentre trs). Da obtemos como nmero procurado 52 31 = 30 comisses.
nmeros 1? Neste caso, temos quatro casos possveis: todas seqencias que no contm
1, todas seqncias que contm apenas um nmero 1, todas seqncias que contm dois
nmeros 1, e todas as seqncias que contm trs nmeros 1. Para 0 r n, temos que
existem exatamente nr seqncias binrias com r nmeros 1. Portanto, pela regra da adio
temos que existem
n
n
n
n
+
+
+
0
1
2
3
Exemplo 2.2.14: Quantas seqncias de cara e coroa de comprimento n contm pelo menos
1 cara? Neste caso, note que apenas uma seqncia no contm nenhuma cara (a seqncia
que contm apenas coroa). Como o nmero total de seqncias de cara e coroa de comprimento n igual a 2n , temos ento 2n 1 seqncias de comprimento n contendo pelo menos
uma cara.
Contagem Multinomial
Considere que temos r tipos de elementos e ni cpias indistinguveis do elemento do tipo i.
Por exemplo, a palavra probabilidade tem duas cpias de cada uma das letras a,b,d,i e uma
cpia de cada uma das letras l,p,r,o,e. O nmero de seqncias ordenadas de comprimento
n = ri=1 ni dado por:
n
n1
n n1
n2
n n1 n2
1 =
n3
n!
r
i=1
ni !
n
,
n1 n2 . . . nr
Autor: Leandro Chaves Rgo
(x1 + x2 + . . . + xr ) =
j<r1 ij
i1 =0 i2 =0
onde ir = n
ni1
ir1 =0
n
i1 i2 . . . ir
xikk ,
k=1
j<r ij .
Exemplo 2.2.16: Um monitor tendo resoluo de n = 1.280 854 pixels, com r = 3 cores
possveis (verde, azul, e vermelho) para cada pixel, pode mostrar i1 in2 i3 imagens tendo i1
pixels verdes, i2 pixels azuis, e i3 pixels vermelhos. O nmero total de imagens que pode ser
exibida por este monitor para qualquer composio de cores de ver, azul, e vermelho pode
ser obtido utilizando o Teorema Multinomial fazendo x1 = x2 = . . . = xr = 1, dando o
resultado de rn possveis imagens.
(2.1)
Captulo 3
Probabilidade Condicional
3.1 Probabilidade Condicional
Como vimos no captulo anterior, existem vrias possveis interpretaes de probabilidade.
Por exemplo, pode-se interpretar probabilidade de um evento A como um limite das freqncias relativas de ocorrncia do evento A em realizaes independentes de um experimento.
Por outro lado, a interpretao subjetiva de probabilidade associa a probabilidade de um
evento A com o grau de crena pessoal que o evento A ocorrer. Em ambos os casos, probabilidade baseada em informao e conhecimento. Reviso desta base de informao ou
conhecimento pode levar a reviso do valor da probabilidade. Em particular, conhecimento
que determinado evento ocorreu pode inuenciar na probabilidade dos demais eventos.
Considerando-se a interpretao freqentista de probabilidade, suponha que estejamos
interessados em saber qual a probabilidade de um dado evento A, visto que sabe-se que um
dado evento B ocorreu. Suponha que realizasse um experimento n vezes das quais o evento
A (resp., B e A B ) ocorre NA (resp., NB > 0 e NAB ) vezes. Seja rA = NA /n a freqncia
relativa do evento A nestas n realizaes do experimento. A probabilidade condicional de
A dado que sabe-se que B ocorreu segundo esta interpretao freqentista, sugere que ela
deve ser igual ao limite das freqncias relativas condicionais do evento A dado o evento B ,
isto , ela deve ser o limite da razo NAB /NB quando n tende ao innito. fcil provar
que esta razo igual a rAB /rB , que por sua vez segundo a interpretao freqentista de
probabilidade aproximadamente igual a P (A B)/P (B) para valores grandes de n.
Considerando-se uma interpretao mais subjetiva suponha que a incerteza de um agente
descrita por uma probabilidade P em (, A) e que o agente observa ou ca sabendo que
o evento B ocorreu. Como o agente deve atualizar sua probabilidade P (|B) de modo a
incorporar esta nova informao? Claramente, se o agente acredita que B verdadeiro,
ento parece razovel requerer que
P (B c |B) = 0
(3.1)
Em relao aos eventos contidos em B , razovel assumir que sua chance relativa permanea inalterada se tudo que o agente descobriu foi que o evento B ocorreu, ou seja, se
22
23
P (A1 )
P (A1 |B)
=
P (A2 )
P (A2 |B)
(3.2)
P (A|B) =
P (A B)
.
P (B)
P (A|B) = P (A B|B) =
P (A B)
.
P (B)
P (A|B) =
P (A B)
P (B)
Vamos provar que para um evento xo B que satisfaz P (B) > 0, P (|B) satisfaz os
axiomas K1-K4 acima e realmente uma medida de probabilidade. Para provar K1, note
que para todo A A, como P (A B) 0, ns temos
P (A B)
0.
P (B)
Para provar K2, note que B = B , ento
P ( B)
P (B)
P (|B) =
=
= 1.
P (B)
P (B)
P (A|B) =
Finalmente, para provar K4 (que implica K3), note que se A1 , A2 , . . . so mutuamente exclusivos A1 B, A2 B, . . . tambm o so, ento
P ((i Ai ) B)
P (i (Ai B))
=
P (B)
P (B)
i P (Ai B)
=
P (Ai |B).
P (B)
i
P (i Ai |B) =
=
24
2. P (A|B) = P (A B|B);
3. se A B , ento P (A|B) = 1;
4. P (A B|C) = P (A|B C)P (B|C).
Fazendo C = na propriedade 4 acima, temos que:
P (A B) = P (A|B)P (B).
Utilizando induo matemtica, pode-se facilmente provar que
Teorema 3.1.3:
todo A A
P (A|Bi )P (Bi )
P (A) =
i:P (Bi )=0
Prova:
A = A = A (i Bi ) = i (A Bi ).
Como os eventos Bi 's so mutuamente exclusivos, os eventos (A Bi )'s tambm so
mutuamente exclusivos. Ento axioma K3 implica que
P (A) = P (i (A Bi )) =
P (A Bi )
i
P (A Bi ) =
i:P (Bi )=0
P (A|Bi )P (Bi ).
i:P (Bi )=0
Se ns interpretarmos a partio B1 , B2 , . . . como possveis causas e o evento A corresponda a um efeito particular associado a uma causa, P (A|Bi ) especica a relao estocstica
entre a causa Bi e o efeito A.
Por exemplo, seja {D, Dc } uma partio do espao amostral, onde o evento D signica
que um dado indivduo possui uma certa doena. Seja A o evento que determinado teste para
P (D|A) =
P (A D)
P (A|D)P (D)
=
.
c
P (A D) + P (A D )
P (A|D)P (D) + P (A|Dc )P (Dc )
Mais geralmente, quando temos uma partio B1 , B2 , . . ., temos que a frmula de Bayes
dada por:
P (Bi |A) =
=
P (A Bi )
=
j P (A Bj )
P (A Bi )
j:P (Bj )=0 P (A Bj )
P (A|Bi )P (Bi )
.
j:P (Bj )=0 P (A|Bj )P (Bj )
fcil de provar esta frmula usando o Teorema da Probabilidade Total. As probabilidades P (Bi ) so usualmente chamadas de probabilidades a priori e as probabilidades
condicionais P (Bi |A) so chamadas de probabilidades a posteriori. O seguinte exemplo
ilustra uma aplicao da frmula de Bayes.
Exemplo 3.1.4: Considere uma imagem formada por n m pixels com a k -sima linha
P (R = k) =
1
n
ns temos que
P (R = k|D) =
P (D|R = k) =
1 dk
nm
n
1 di
i=1 n m
dk
n
i=1
dk
,
m
di
Ento, mesmo que a linha tenha inicialmente sido escolhida ao acaso, dado o evento que
encontramos ao acaso um pixel defectivo nesta linha, agora mais provvel que seja uma
linha contendo um nmero grande de pixels defectivos dk .
P (B1 |B2 ) =
P (B1 |B2 ) =
3
9
3
9
4
10
4
10
e P (B1c ) =
4
10
+ 49
6
10
2
15
2
5
6
.
10
Logo,
1
= .
3
Embora probabilidade condicional seja bastante til, ela sofre de alguns problemas, em
particular quando se quer tratar de eventos de probabilidade zero. Tradicionalmente, se
P (B) = 0, ento P (A|B) no denida. Isto leva a um nmero de diculdades loscas em relao a eventos com probabilidade zero. So eles realmente impossveis? Caso
contrrio, quo improvvel um evento precisa ser antes de ele ser atribudo probabilidade
zero? Deve um evento em algum caso ser atribudo probabilidade zero? Se existem eventos
com probabilidade zero que no so realmente impossveis, ento o que signica condicionar em eventos de probabilidade zero? Por exemplo, considere o espao de probabilidade
([0, 1], B, ) onde B a -lgebra de Borel restrita a eventos contidos em [0, 1] e uma
medida de probabilidade na qual todo intervalo em [0, 1] possui probabilidade igual ao seu
comprimento. Seja B = {1/4, 3/4} e A = {1/4}. Como P (B) = 0, P (A|B) no denida.
Porm parece razovel assumir que neste caso P (A|B) = 1/2 j que intuitivamente implica
que todos os estados so equiprovveis, mas a denio formal de probabilidade condicional
no nos permite obter esta concluso.
Alguns dos problemas mencionados no pargrafo anterior podem ser tratados considerandose probabilidades condicionais (e no probabilidade incondicionais) como a noo fundamental, porm a discusso destes modelos est fora do escopo deste curso.
P (E F )
.
P (F )
0, 4
0, 1
P (E|F )
.
0, 7
0, 7
Autor: Leandro Chaves Rgo
P (G = d1 , Y = d2 , M = d3 )
P (Y = d2 , M = d3 )
P (M = d3 |G = d1 , Y = d2 )P (G = d1 |Y = d2 )P (Y = d2 )
=
P (M = d3 |Y = d2 )P (Y = d2 )
P (M = d3 |G = d1 , Y = d2 )P (G = d1 |Y = d2 )
=
P (M = d3 |Y = d2 )
1/3
=
P (M = d3 |Y = d2 )
P (G = d1 |Y = d2 , M = d3 ) =
28
P (Y = d2 , M = d3 )
P (Y = d2 )
P (Y = d2 , M = d3 , G = d1 ) + P (Y = d2 , M = d3 , G = d2 ) + P (Y = d2 , M = d3 , G = d3 )
=
P (Y = d2 )
P (M = d3 |Y = d2 , G = d1 )P (G = d1 |Y = d2 )P (Y = d2 )
=
P (Y = d2 )
P (M = d3 |Y = d2 , G = d2 )P (G = d2 |Y = d2 )P (Y = d2 )
+
P (Y = d2 )
P (M = d3 |Y = d2 , G = d3 )P (G = d3 |Y = d2 )P (Y = d2 )
+
P (Y = d2 )
= P (M = d3 |Y = d2 , G = d1 )P (G = d1 |Y = d2 )
+P (M = d3 |Y = d2 , G = d2 )P (G = d2 |Y = d2 )
+P (M = d3 |Y = d2 , G = d3 )P (G = d3 |Y = d2 )
1 1 1
1
=1 + +0= .
3 2 3
2
P (M = d3 |Y = d2 ) =
Exemplo 3.1.9: Seja D o evento que um indivduo selecionado ao acaso de uma popu-
lao tem uma doena particular, Dc seu complemento. A probabilidade que um indivduo
selecionado ao acaso nesta populao tenha determinada dena pd . Existe um teste para
diagnstico desta doena que sempre acusa presena da doena quando o indivduo tem a
doena. Contudo, quando o indivduo no tem a doena, o teste reporta falsamente que
o indivduo tem a doena com probabilidade pt . Seja T P o evento que o teste reporta
positivamente que o indivduo tem a doena. Formalmente, temos:
P (D|T P ) =
pd
P (T P |D)P (D)
=
= 0, 02.
P (T P |D)P (D) + P (T P |Dc )P (Dc )
pd + pt (1 pd )
Exemplo 3.1.10: Sabemos que os eventos {B1 , B2 , B3 } so disjuntos par a par e que sua
unio igual ao espao amostral. Estes eventos tem as seguintes probabilidades P (B1 ) = 0, 2
e P (B2 ) = 0, 3. Existe um outro evento A que sabemos que P (A|B1 ) = 0, 3; P (A|B2 ) = 0, 4;
e P (A|B3 ) = 0, 1. Calcule:
29
Exemplo 3.1.11: Suponha que todos os bytes tenham a mesma probabilidade. Seja W o
nmero de 1's em um byte. Considere os seguintes eventos:
A = {O primeiro e o segundo bit so iguais a 1, e}
B = {W um nmero mpar.}
Calcule:
(a) P (A)
(b) P (B)
(c) P (B|A)
(d) P (A|B)
Soluo:
P (A) =
P (B) =
||B||
=
||||
||A||
26
1
= 8 = .
||||
2
4
8
1
P (B|A) =
onde P (A B) =
||AB||
(61)+(63)+(65)
28
8
3
+
28
8
5
8
7
1
= .
2
P (A B
,
P (A)
= 18 . Portanto,
P (B|A) =
P (A|B) =
1
8
1
4
1
= .
2
P (A B)
=
B
1
8
1
2
1
= .
4
Exemplo 3.1.12:
Soluo:
P (A B)
=
P (A|B) =
P (B)
1
36
4
36
1
= .
4
Exemplo 3.1.13:
30
(b) Qual a probabilidade que o aluno sabia a resposta dado que a pergunta foi respondida
corretamente?
1
(1 p).
m
P (B|A) =
P (A|B)P (B)
1p
=
c
c
P (A|B)P (B) + P (A|B )P (B )
1 p + m1 (1 p)
3.2 Independncia
O que exatamente signica que dois eventos so independentes? Intuitivamente, isto signica que eles no tm nada haver um com o outro, eles so totalmente no relacionados; a
ocorrncia de um no tem nenhuma inuncia sobre o outro. Por exemplo, suponha que duas
diferentes moedas so lanadas. A maioria das pessoas viria os resultados desses lanamentos
como independentes. Portanto, a intuio por trs da frase o evento A independente do
evento B que nosso conhecimento sobre a tendncia para A ocorrer dado que sabemos que
B ocorreu no alterada quando camos sabendo que B ocorreu. Ento, usando probabilidades condicionais podemos formalizar esta intuio da seguinte forma, A independente
de B se P (A|B) = P (A). Mas usando a denio de probabilidade condicional, chega-se a
seguinte concluso A independente de B se P (A B) = P (A)P (B). Como esta ltima
expresso denida inclusive para o caso de P (B) = 0, ela a expresso adotada como a
denio de independncia entre eventos.
P (A) = P (A B) + P (A B c ).
Como A e B so independentes, ns temos
Denio 3.2.4: Uma coleo de eventos {Ai }iI independente par a par se para todo
i = j I , Ai e Aj so eventos independentes.
P (iI Ai ) =
P (Ai )
iI
E uma coleo de eventos {Ai }iI mutuamente independente se para todo J I nito,
{Ai }iJ mutuamente independente.
Considere os seguintes exemplos que ilustram o conceito de independncia.
Exemplo 3.2.6:
P (A B) = P ({1}) =
1
11
=
= P (A)P (B).
4
22
Similarmente, pode-se provar o mesmo resultado para os outros pares. Contudo, a probabilidade
1
P (A B C) = P () = 0 = P (A)P (B)P (C) = .
8
Ento, A, B , e C no so mutuamente independentes.
1
4
Exemplo 3.2.9:
P (A) = P (ni=1 Ai ) =
P (Ai ) =
i=1
pi
i=1
P (B) =
P (ni=1 Aci )
P (Aci )
i=1
(1 pi )
i=1
(1 pi )
P (C) = P (B ) = 1 P (B) = 1
i=1
Exemplo 3.2.10:
33
Portanto,
1
P (Bk ) = P (Ac1 Ac2 Ac2k2 A2k1 ) = P (Ac1 )P (Ac2 ) P (Ac2k2 )P (A2k1 ) = ( )2k1 ,
2
onde a penltima igualdade se deve ao fato dos lanamentos serem independentes. Logo,
P (Joo vencer) =
P (
k=1 Bk )
P (Bk ) =
k=1
2
1
( )2k1 = .
2
3
k=1
Captulo 4
Variveis Aleatrias
4.1 Introduo
Suponha que uma moeda lanada cinco vezes. Qual o nmero de caras? Esta quantidade
o que tradicionalmente tem sido chamada de varivel aleatria. Intuitivamente, uma
varivel porque seus valores variam, dependendo da seqncia de lanamentos da moeda
realizada; o adjetivo aleatria usado para enfatizar que o seu valor de certo modo
incerto. Formalmente, contudo, uma varivel aleatria no nem aleatria nem uma
varivel.
PX (i Ai ) = P (X 1 (i Ai )) = P (i X 1 (Ai )) =
P (X 1 (Ai )) =
i
PX (Ai ).
i
Vale a pena salientar que em muitos problemas, j teremos a informao sobre a distribuio induzida PX denida em (R, B). Nestes casos, estaremos esquecendo a natureza
34
Denio 4.2.1: A funo de distribuio acumulada de uma varivel aleatria X , representada por FX , denida por
Teorema 4.2.2: Uma funo real G satisfaz F1F3 se e somente se G uma distribuio
de probabilidade acumulada.
1
= lim PX ((x , x]).
n
n
1
])
n
1
)
n
Exemplo 4.2.3: Determine quais das seguintes funes so funes de distribuio acumuladas, especicando a propriedade que no for satisfeita caso a funo no seja uma
distribuio acumulada.
(a)
ex
1+ex
Exemplo 4.2.4: Seja K o nmero de ons emitidos por uma fonte em um tempo T . Se
FK (1) FK (1/2) = 0, 1, qual o valor de P (K = 1)?
Exemplo 4.2.5:
37
FX (x) =
fX (t)dt, x R.
Exemplo 4.4.1: Assuma que X uma varivel aleatria discreta que assume os valores 2,
5, e 7 com probabilidades 1/2, 1/3, e 1/6, ento sua funo de distribuio acumulada :
1/2
FX (x) =
5/6
38
se
se
se
se
x < 2,
2 x < 5,
5 x < 7,
x 7.
A funo de distribuio de uma varivel discreta sempre uma funo degrau que tem
saltos nos pontos que a varivel assume com probabilidade positiva, e o valor do salto em
um ponto xi , como vimos igual a probabilidade da varivel assumir este valor.
aleatria se e somente se, f (x)dx = 1, j que neste caso fcil provar que a funo
x
F denida por f (t)dt satisfaz as condies F1, F2, e F3. Portanto, pelo Teorema ??
F uma funo de distribuio acumulada. Logo, a distribuio de uma varivel aleatria
contnua X pode ser determinada tanto pela funo de distribuio acumulada FX ou pela
sua funo de densidade fX .
Formalmente, uma varivel aleatria X tem densidade se FX a integral de sua derivada;
sendo neste caso a derivada de FX uma funo densidade para X . Alm disso, em quase
todos os casos encontrados na prtica, uma varivel aleatria X tem densidade se FX (i)
contnua e (ii) derivvel por partes, ou seja, se FX derivvel no interior de um nmero
nito ou enumervel de intervalos fechados cuja unio a reta R.
Por exemplo, considere
0 se x < 0,
x se 0 x < 1,
FX (x) =
1 se x 1.
Ento X tem densidade pois FX contnua e derivvel em todos os pontos da reta exceto
em {0, 1}.
4.6.2 Bernoulli.
Dizemos que X tem uma distribuio Bernoulli com parmetro p, onde 0 p 1, se
X(w) {x0 , x1 } e p(x1 ) = p = 1 p(x0 ).
A funo de probabilidade Bernoulli pode ser utilizada para modelar a probabilidade de
sucesso em uma nica realizao de um experimento. Em geral, qualquer varivel aleatria
dicotmica, ou seja que assume somente dois valores, pode ser modelada por uma distribuio
Bernoulli. Denomina-se de ensaio de Bernoulli, qualquer experimento que tem uma resposta
dicotmica. Um exemplo clssico de um ensaio Bernoulli o lanamento de uma moeda no
necessariamente balanceada.
4.6.3 Binomial.
Dizemos que X tem uma distribuio Binomial com parmetros n e p, onde n um nmero
inteiro e 0 p 1, se X(w) {0, 1, . . . , n} e p(k) = nk pk (1 p)1k , para k {0, 1, . . . , n}.
Note que utilizando o Teorema Binomial, temos que
n
p(k) =
k=0
k=0
n k
p (1 p)nk = (p + 1 p)n = 1.
k
p(k)
=
p(k 1)
n!
pk (1 p)nk
(k)!(nk)!
n!
pk1 (1 p)nk+1
(k1)!(nk+1)!
nk+1 p
k
1p
40
p(1)
np
=
< 1,
p(0)
1p
ento as probabilidades so sempre decrescentes em k , e o valor mais provvel 0. No outro
extremo, se
p(n)
p
=
> 1,
p(n 1)
n(1 p)
ento as probabilidades so estritamente crescentes em k , e o valor mais provvel n. Se
p
p
1
< 1p
< n, ento a funo comea crescendo em k , enquanto nk+1
> 1, e depois
n
k
1p
p(k)
p
decresce em k . Portanto, se p(k1)
= nk+1
= 1 para algum valor de k , temos que k e
k
1p
k 1 so os valores mais provveis. Caso contrrio, o valor mais provvel ser o maior valor
p(k)
p
de k para o qual p(k1)
= nk+1
> 1, isto , o valor mais provvel ser o maior valor de k
k
1p
tal que k < (n + 1)p. No exemplo da Figura 4.6.3, observe que o valor mais provvel para
k = 1, pois (n + 1)p = 1,8.
Exemplo 4.6.1: Uma moeda com probabilidade 0,4 de cair cara jogada 5 vezes, qual a
Exemplo 4.6.2: A taxa de sucesso de um bit em uma transmisso digital 90%. Se 20 bits
forem transmitidos, qual a probabilidade de que exatamente 15 deles tenha sido transmitidos
com sucesso? Qual a probabilidade de que no mximo 18 deles tenham sido transmitidos
com sucesso?
Exemplo 4.6.3 :
41
4.6.4 Uniforme.
Dizemos que X tem uma distribuio uniforme com parmetros a e b, onde a e b so nmeros
reais e a < b, se a funo densidade de X igual a
fX (x) =
1
U (x a)U (b x).
ba
Este modelo freqentemente usado impropriamente para representar completa ignorncia sobre valores de um parmetro aleatrio sobre o qual apenas sabe-se estar no intervalo
nito [a, b]. Esta distribuio tambm freqentemente utilizada para, modelar a fase de
osciladores e fase de sinais recebidos em comunicaes incoerentes. Ela tambm serve para
modelar a escolha de um nmero aleatrio entre a e b.
Neste caso, a funo de distribuio acumulada dada por:
se x < a,
0
x
1
xa
se
a x < b,
FX (x) =
dt =
ba
a ba
1
se x b.
Exemplo 4.6.4: Sabe-se que igualmente provvel que um dado cliente possa requisitar
um servio no tempo disponvel de servio [t0 , t1 ]. Se o tempo necessrio para executar este
servio igual a < t1 t0 , qual a probabilidade que o servio ser executado antes do
trmino do intervalo de tempo disponvel de servio?
Soluo: Para que o servio seja executado em tempo hbil, necessrio que o cliente
t1
t0
1
o requisite antes do tempo t1 . Logo, P (X t1 ) = t1 t
dt = t1t
.
t0
0
1 t0
FX (x) =
f (x)dx +
p(xi ),
xi x
FX (x) =
0
p(0) + (1 p(0))
42
x t
e dt
0
se x < 0,
se x 0.
Note que esta funo de distribuio no nem contnua nem uma funo degrau.
Onde um evento Boreliano em IRn se pertence a menor -lgebra que contem todas regies
da seguinte forma: Ca = {(X1 , X2 , . . . , Xn ) : Xi ai , 1 i n}.
Dado um vetor aleatrio X , pode-se denir uma probabilidade induzida PX no espao mensurvel (IRn , B n ) da seguinte maneira: para todo A B n , denimos PX (A) =
P (X 1 (A)). Por denio de vetor aleatrio, tem-se que X 1 (A) A, ento PX est bem
denida.
lim FX (x) = 0.
xi
Portanto, a funo de distribuio acumulada conjunta de X1 , . . . , Xn1 pode ser facilmente determinada da funo de distribuio acumulada conjunta de X1 , . . . , Xn
fazendo xn . Observe que funes de distribuio acumuladas conjuntas de ordem
maiores determinam as de ordem menores, mas o contrrio no verdadeiro. Em
particular, temos que
lim FX (x) = 1.
x
Exemplo 4.8.3: Seja F0 : IR2 IR uma funo denida no plano tal que F0 (x, y) = 1
se x 0, y 0, e x + y 1, e F0 (x, y) = 0, caso contrrio. claro que F1, F2, e F3 so
satisfeitas, mas F0 no funo de distribuio de nenhum vetor aleatrio (X, Y ). Se fosse,
teramos uma contradio
0 P (0 < X 1, 0 < Y 1)
= F0 (1, 1) F0 (1, 0) F0 (0, 1) + F0 (0, 0) = 1 1 1 + 0 = 1
Os tipos discretos e contnuos de variveis aleatrias tm os seguintes anlogos no caso
multivariado. (a) Se X for um vetor aleatrio discreto, ou seja assumir um nmero enumervel de valores {x1 , x2 . . . , }, podemos denir uma funo de probabilidade de massa conjunta,
p tal que
p(xi ) 0.
i=1
p(xi ) = 1.
Neste caso, pode-se denir a funo probabilidade de massa marginal de Xi como sendo
pXi (xi ) =
x1
xi1 xi+1
F (x1 , . . . , xn ) =
x1
fXi (xi ) =
Exemplo 4.8.4: Duas linhas de produo fabricam um certo tipo de pea. Suponha que
a capacidade em qualquer dia seja 4 peas na linha 1 e 3 peas na linha 2. Admita que o
nmero de peas realmente produzida em uma dada linha em um dado dia seja uma varivel
aleatria. Sejam X e Y o nmero de peas produzido pela linha 1 e 2 em um dado dia,
respectivamente. A tabela a seguir d a distribuio conjunta de (X, Y ):
0
1
2
3
4
Y
1
0
0
0,1
0,1
0
0
0
0,2
0
0
0
2
0,1
0
0,1
0
0,1
3
0,2
0,1
0
0
0
(a) Determine a probabilidade que mais peas sejam produzidas pela linha 2.
(b) Determine as funes probabilidade de massa marginais de X e Y .
Exemplo 4.8.5: Suponha que um vetor aleatrio bidimensional (X, Y ) tenha densidade
fX,Y (x, y) =
x2 +
0
xy
3
se 0 x 1 e 0 y 2,
, caso contrrio.
P (Y X > 0) =
0
x2 +
x
2
xy
dydx
3
x 2
x2
x2 (2 x) + ( )dx =
3 2
2
0
4
3
2
7x
x
x
17
=(
+ 2 + )|10 = .
24
3
3
24
(4.1)
(
0
7x3
2x
+ 2x2 + )dx
6
3
fX (x) =
0
x2 +
xy
2x
dy = 2x2 + ,
3
3
Autor: Leandro Chaves Rgo
fY (y) =
x2 +
45
xy
1 y
dx = + ,
3
3 6
P (X B|A) =
P ([X B] A)
,
P (A)
para B boreliano. Pode-se vericar facilmente que isto dene uma probabilidade nos borelianos vericando-se os axiomas de Kolmogorov. Podemos interpretar a distribuio condicional
de X dado A como a nova distribuio que se atribui a X quando sabe-se da ocorrncia do
evento A. A funo de distribuio associada distribuio condicional chamada funo
distribuio condicional de X dado A:
FX (x|A) = P (X x|A).
Agora suponhamos que os eventos aleatrios A1 , A2 , . . . formem uma partio (nita ou
enumervel) de . Pelo Teorema da Probabilidade Total, temos
P (X B) =
P (An )P (X B|An ), B B,
n
FX (x) = P (X x) =
P (An )P (X x|An )
n
P (X B|Y = yn ) = P (X B|An ),
Autor: Leandro Chaves Rgo
P (Y = yn )P (X B|Y = yn ), B boreliano
P (X B) =
n
FX (x) =
P (Y = yn )FX (x|Y = yn ).
n
0
1
2
0
0,1
0,2
0
Y
1
0,1
0
0,1
2
0,1
0,3
0,1
P (X x|y < Y y + ) =
P (X x, y < Y y + )
P (y < Y y + )
x
(4.2)
y+
P (X x, y < Y y + ) =
P (X x, y < Y y + ) 2
Similarmente,
P (X x|Y = y) =
fX,Y (s, y)
ds,
fY (y)
Exemplo 4.8.7:
fX,Y (x, y) =
x2 +
0
xy
3
se 0 x 1 e 0 y 2,
, caso contrrio.
2
0
x2 + xy
dy = 2x2 + 2x
, para 0 x 1, fX (x) = 0,
3
3
1 2
y
xy
1
caso contrrio; e que fY (y) = 0 x + 3 dx = 3 + 6 , para 0 y 2, fY (y) = 0, caso
contrrio. Portanto, aplicando nosso resultado anterior, temos para 0 y 2:
fX,Y (x, y)
g(x|y) =
=
fY (y)
x2 + xy
3
1
+ y6
3
se 0 x 1,
, caso contrrio.
x2 + xy
3
2x2 + 2x
3
se 0 y 2,
Similarmente, para 0 x 1:
fX,Y (x, y)
h(y|x) =
=
fX (x)
, caso contrrio.
P (X1 A1 , . . . , Xn An ) =
P (Xi Ai ).
i=1
O prximo teorema estabelece trs critrios para provar que um conjunto de variveis
aleatrias mutuamente independente.
n
i=1
FXi (xi ).
pX (x) =
pXi (xi ).
i=1
fX (x) =
i=1
P (X A|Y B) = P (X A),
ou seja, se X e Y so independentes o conhecimento do valor de Y no altera a descrio
probabilstica de X .
P (X = xij ) =
j=1
pX (xij ),
j=1
Exemplo 4.9.1:
2n
P (Y = 1) =
(1/2)
n=1
(1/4)n =
=
n=1
1/4
= 1/3.
1 1/4
Conseqentemente,
P (Y = 1) = 1 P (Y = 1) = 2/3.
Podemos estender este resultado para uma funo de um vetor aleatrio X de forma
anloga. Neste caso se Y = H(X), denotemos por xi1 , xi2 , xi3 , . . . os valores de X tal que
H(xij ) = yi para todo j . Ento, temos que
P (X = xij ) =
j=1
pX (xij ),
j=1
50
0<Y <0<X<1
e P (0 < X < 1) = 1, temos FY (y) = 0, y 0. Se y > 0, ento
P (Y y) = P ( log(X) y) = P (X ey ) = 1 ey ,
ou seja, Y Exp(1).
Captulo 5
Esperana e Momentos
5.1 O Conceito de Esperana
O conceito de Esperana ou Valor Esperado de uma varivel aleatria X , ou a mdia
to antigo quanto o prprio conceito de probabilidade. Na verdade, at possvel denir
probabilidade em termos de esperana, mas esta no uma maneira comum de se apresentar
a teoria. Existem quatro tipos de interpretaes da Esperana:
1. Parmetro m de uma medida de probabilidade, funo de distribuio, ou funo
probabilidade de massa, tambm conhecido como mdia.
2. Um operador linear em um conjunto de variveis aleatrias que retorna um valor tpico
da varivel aleatria interpretado como uma medida de localizao da varivel aleatria.
3. mdia do resultado de repetidos experimentos independentes no longo prazo.
4. preo justo de um jogo com pagamentos descritos por X .
51
EX =
xi pi +
i:xi <0
xi p i ,
i:xi 0
desde que pelo menos um dos somatrios seja nito. Em caso os dois somatrios no sejam
nitos, a esperana no existe. Caso EX seja nita, diz-se que X integrvel.
1/2. Ento,
EX = a(0.5) + a(0.5) = 0.
Note ento que muitas variveis aleatrias diferentes podem ter o mesmo valor esperado
ou esperana. ( s variar o valor de a no exemplo anterior.)
Exemplo 5.1.4: Aleatria. Se X {1, 2, . . . , n} for uma varivel aleatria com distribuio de probabilidade aleatria com parmetro n, temos que sua esperana dada por:
n
kp(k) =
EX =
k=1
1
1
k =
n
n
k=
k
1 n(n + 1)
n+1
=
.
n
2
2
Onde utilizamos a frmula da soma dos primeiros n termos de uma progresso aritmtica. Em
geral, se X for uma varivel aleatria com distribuio de probabilidade aleatria assumindo
os valores {x1 , x2 , . . . , xn }, ento:
n
1
EX =
xi .
n i=1
Exemplo 5.1.5: Bernoulli. Se X {0, 1} for uma varivel aleatria com distribuio de
probabilidade Bernoulli com parmetro p, temos que sua esperana dada por:
EX = 0(1 p) + 1(p) = p.
Exemplo 5.1.6: Binomial. Se X for uma varivel aleatria com distribuio de probabilidade Binomial com parmetros n e p, temos que sua esperana dada por:
n
n k
EX =
k
p (1 p)nk =
k
k=0
k
k=1
n!
pk (1 p)nk
k!(n k)!
n
n
k=1
n 1 k1
(n 1)!
pk (1 p)nk = np
p (1 p)nk = np.
k1
(k 1)!(n k)!
k=1
53
Denio 5.1.7: Se X uma varivel aleatria contnua com funo densidade de probabilidade f , ento sua esperana dada pela frmula
0
EX =
xf (x)dx +
xf (x)dx,
0
desde que pelo menos uma das integrais seja nita. Em caso as duas integrais no sejam
nitas, a esperana no existe. Caso EX seja nita, diz-se que X integrvel.
Deve-se observar a analogia entre o valor esperado de uma varivel aleatria e o conceito
de centro de gravidade em Mecnica. Se um objeto tem massa distribuda sobre a reta, em
pontos discretos, x1 , x2 , . . ., e se p(xi ) for a massa do ponto xi , ento vemos que
i=1 xi p(xi )
representa o centro de gravidade do objeto em relao a origem. Similarmente, se um objeto
tem massa distribuda continuamente sobre uma reta, e se f (x) representar a densidade de
massa em x, ento xf (x)dx determina o centro de gravidade deste objeto. Ento, podemos interpretar a esperana de uma varivel aleatria X como sendo o centro da distribuio
de probabilidade de X .
Considere o seguinte exemplo:
Exemplo 5.1.8: Uniforme. Se X U (a, b), ento X possui densidade igual a f (x) =
se x (a, b), e f (x) = 0, caso contrrio. Logo, temos que sua esperana dada por:
b
EX =
a
1
ba
x
a+b
dx =
.
ba
2
Denio 5.2.1: Seja X uma varivel aleatria discreta e seja Y = H(X). Se Y assumir
os seguintes valores y1 , y2 , . . . e se p(yi ) = P (Y = yi ), denimos:
yi p(yi ).
EY =
i=1
EY = E(H(X)) =
H(xi )p(xi ).
i=1
i=1
H(xi )p(xi ) =
H(xij )p(xij ) =
i=1
yi
i=1 j=1
i=1
p(xij ) =
yi p(yi ) = EY.
j=1
i=1
Exemplo 5.2.3: Suponha que X uma varivel aleatria tal que P (K = k) = e k! , para
k
k e
EY =
k=0
k=2
k!
k e
=
k=1
k!
k(k 1)e
=
k=1
k!
ke
+
k=1
k!
k2
+ = 2 + .
(k 2)!
Tambm podemos estender este resultado para o caso de uma funo real de um vetor
aleatrio. Neste caso, se Y = H(X), temos que EY = i H(xi )pX (xi ), onde os xi so os
valores assumidos pelo vetor aleatrio X .
Teorema 5.2.4: Seja X uma varivel aleatria contnua, Y = (X) uma outra varivel
aleatria, ento
EY =
yfY (y)dy =
(x)fX (x)dx,
Prova: Omitida.
Uma frmula anloga tambm vlida quando consideramos funes de vetores aleatrios.
EY =
yfY (y)dy =
Exemplo 5.2.6: Suponha que X seja uma varivel aleatria com densidade dada por:
f (x) =
ex
2
ex
2
se x 0,
se x > 0.
EY =
(5.1)
|x|f (x)dx
1
= (
xex dx +
xex dx)
2
0
0
1
ex dx xex |
= (xex |0 +
0 +
2
1
= (0 + 1 + 0 + 1) = 1.
2
ex dx)
Exemplo 5.2.7:
Z = L(X) =
200k
se X k ,
200X 50(k X) se X < k .
1
EZ =
L(x)fX (x)dx =
3
L(x)dx.
3
Obviamente, o lucro L(x) depende do valor de k . Se k 3, ento L(x) = 200k , para todo x
6
entre 3 e 6, logo EZ = 13 3 200kdx = 200k . Se k 6, ento L(x) = 250x 50k , para todo
x entre 3 e 6, logo
EZ =
1
3
6
3
1
1
(250x 50k)dx = (125x2 50kx)|63 = (3375 150k).
3
3
Autor: Leandro Chaves Rgo
1 k
EZ = ( (250x 50k)dx +
3 3
1
= (125k 2 + 1350k 1125)
3
6
k
56
1
(200k)dx) = (125(k 2 9) 50k(k 3) + 200k(6 k))
3
Resumindo, temos:
se k 3,
200k
1
2
(125k + 1350k 1125) se 3 < k < 6,
EZ =
31
(3375 150k)
se k 6.
3
Note que para k 3, o lucro esperado crescente em k , e que para k 6 o lucro esperado
decresce com k . Na regio, 3 < k < 6, temos que o lucro esperado uma parbola que atinge
o mximo para k = 5,4. Como o nmero de equipamentos fabricados tem que ser inteiro
ento o mximo deve ocorrer ou em k = 5 ou em k = 6, comparando estes valores temos
que, se k = 5, ento EZ = 833,33; e se k = 6, ento EZ = 825. Portanto, o fabricante deve
produzir 5 equipamentos por dia para maximizar seu lucro esperado.
E(X + Y ) =
(xi + yj )p(xi , yj ) =
i
xi p(xi ) +
i
yj
j
xi
j
p(xi , yj ) = EX +
i
p(xi , yj ) +
yj p(xi , yj )
i
yj p(yj ) = EX + EY.
j
P (X Y ) = P (X Y 0),
o que, pela propriedade 2, implica que E(X Y ) 0. Pela propriedade 4, temos que
E(X Y ) = EX + E(Y ). Finalmente, pela propriedade 3, temos que E(X Y ) =
EX EY , ou seja podemos concluir que EX EY 0.
n
i=1
57
Xi ) =
E(
Xi ) =
i=1
i1
i1
in
j=1
xin p(xin ) =
xi1 p(Xi1 )
p(xij ) =
xi1 xin
i1
in
EXi .
i=1
seja, Y possui densidade par, logo EY = yfY (y)dy = 0, pois a integral de uma
funo mpar yfY (y) em torno de um intervalo simtrico em torno de zero.1
Pode-se denir outras medidas de posio de uma varivel aleatria, tais como: mediana
e moda. A mediana de uma v.a. X qualquer nmero m tal que P (X m) 0,5 e P (X
m) 0,5. Por exemplo, se X assume os valores 1, 0, 1 com probabilidades 1/4, 1/4, 1/2,
respectivamente, ento qualquer nmero no intervalo fechado de 0 a 1. A moda de uma
varivel aleatria discreta o seu valor mais provvel. Como para uma varivel aleatria
contnua todos os valores tem probabilidade zero, dene-se como moda neste caso, o valor
que maximiza a funo densidade de probabilidade. A moda no necessariamente nica,
pois a funo probabilidade de massa (caso discreto) ou a funo densidade de probabilidade
(caso contnuo) pode atingir seu mximo em vrios valores x1 , x2 , . . ..
Quando uma funo densidade de probabilidade tem mltiplos mximos locais, comum
se referir a todos os mximos locais como modas da distribuio (mesmo que a denio
formal implique que apenas o mximo global uma moda da distribuio). Tais distribuies
contnuas so chamadas de multimodais (em oposio a unimodal).
Em distribuies unimodais simtricas, isto , distribuies tal que existe um nmero m
tal que P (X m x) = P (X m x) para todo x IR, a esperana (se bem denida),
mediana, e moda coincidem e so iguais a m.
5.4 Momentos
Momentos do informaes parciais sobre a medida de probabilidade P , a funo de distribuio acumulada, ou a funo probabilidade de massa de uma varivel aleatria discreta
1 Como
denida, donde conclumos que pelo menos uma das integrais yfY (y)dy ou 0 yfY (y)dy nita, e
como fY (y) par estas integrais tem mesmo mdulo mas sinais contrrios, o que nos permite armar que a
integral sobre toda reta nula.
58
Denio 5.4.1:
Na seo anterior, vimos que o segundo momento de uma varivel aleatria Poisson com
parmetro dado por: 2 + . Vamos agora calcular o segundo momento de uma varivel
aleatria X Binomial com parmetros n e p:
n
2
EX =
k=0
n
n k
p (1 p)nk =
k
k2
k=1
n!
pk (1 p)nk =
k!(n k)!
n!
n!
pk (1 p)nk +
k
pk (1 p)nk
k!(n k)!
k!(n
k)!
k=1
k(k 1)
k=1
n
2
n(n 1)p
k=2
(n 2)!
pk2 (1 p)nk + np
(k 2)!(n k)!
m
= n(n 1)p
j=0
(m)!
pj (1 p)mj + np = n(n 1)p2 + np.
(j)!(m j)!
Pode-se provar que momentos de ordem superiores nitos implicam momentos de ordem
inferiores nitos.
Note que o primeiro momento central zero, pois E(X EX) = EX EEX = EX
EX = 0. O segundo momento central conhecido como varincia e denota-se por V arX .
A varincia pode ser tambm calculada por:
E(X EX) =
k=0
n
(EX)nk EX k
k
n
EX n = E(X EX + EX)n =
k=0
n
(EX)nk E(X EX)k .
k
Como um corolrio, temos que o n-simo momento central existe se, e somente se, o
n-simo momento existe.
59
1
1
EX k = [(m a)k + (m + a)k ].
2
2
P (X = m a) = P (X = m + a) =
1
EX = m, EX 2 = [2m2 + 2a2 ] = m2 + a2 , V arX = a2 .
2
Este exemplo, mostra que podemos encontrar uma varivel aleatria bem simples possuindo
qualquer esperana e varincia predeterminadas.
Exemplo 5.4.4 :
1
V arX =
n
x2i
i=1
1
2(
xi )2 .
n i=1
EX 2 =
1
ba
x2 dx =
(EX)2 = (
Portanto, V arX =
b3 a3
3(ba)
( a+b
)2 =
2
b3 a3
3(b a)
a+b 2
).
2
(ba)2
.
12
Propriedades da Varincia
As seguintes propriedades da varincia so conseqncias imediatas de sua denio.
1. V arX 0.
2. Se X = c, V ar(X) = 0.
Prova:
V ar(X + a) = E(X + a)2 (E(X + a))2
= EX 2 + 2aEX + a2 (EX)2 2aEX a2 = EX 2 (EX)2 = V arX.
60
Prova:
V ar(aX) = E(aX)2 (E(aX))2 = a2 EX 2 a2 (EX)2 = a2 V arX.
Prova:
V ar(X + Y ) = E(X + Y )2 [E(X + Y )]2
= E(X 2 + 2XY + Y 2 ) (EX)2 2EXEY (EY )2
= EX 2 + EY 2 (EX)2 (EY )2 + 2E(XY ) 2EXEY = V arX + V arY
A). Mas, como a cota superior pode exceder 1, temos que min(1, Eg(X)) P (X A).
Corolrio 5.4.7: Seja X uma varivel aleatria, ento para todo > 0, P (|X| )
E|X|
E|X|
|x|
1
])
n
P (Z
n
1
) = 0.
n
Portanto, P (Z = 0) = 1 P (Z > 0) = 1.
Note que este ltimo corolrio implica que, quando V ar(X) = 0, ou seja E(XEX)2 =
0, temos que P (X = EX) = 1, ou seja X constante com probabilidade 1.
61
Corolrio 5.4.9: Desigualdade (Original) de Chebyshev. Seja X uma varivel
aleatria, ento P (|X EX| ) V arX
.
2
x2
Prova:
Denio 5.5.1: A correlao entre duas variveis aleatrias X e Y dada por EXY se
esta esperana existe. A covarincia entre elas dada por Cov(X, Y ) = E[(X EX)(Y
EY )] = EXY (EX)(EY ).
Note que Cov(X, X) = V arX . Pela prova da propriedade 5 de varincia, vemos que a
seguinte relao vlida:
4(EXY )2 4EX 2 EY 2 0,
e temos a primeira desigualdade. A segunda desigualdade segue da primeira trocando X por
X EX e Y por Y EY na expresso da primeira desigualdade.
O coeciente de correlao entre duas variveis aleatrias X e Y dado por
(X, Y ) =
Cov(X, Y )
V ar(X)V ar(Y )
Denio 5.6.1:
(a) Se (X, Y ) for uma vetor aleatrio contnuo bidimensional, dene-se o valor esperado
condicional de Y dado que X = x, como sendo
0
E(Y |X = x) =
yfY |X (y|x)dy +
yfY |X (y|x)dy,
0
E(Y |X = xi ) =
yj pY |X (yj |xi ) +
j:yj 0
yj pY |X (yj |xi ),
j:yj >0
63
I[0,] (x).
fX (x) =
2 |x
e2|yx
I[0,] (x)dy
= e I[0,] (x)(e
x2
2x2
e2y dy + e2x
e2y dy)
x2
1 1
= ex I[0,] (x)( + ) = ex I[0,] (x).
2 2
Logo, a densidade condicional de Y dado X igual a
fY |X (y|x) =
fX,Y (x, y)
2
= e2|yx | .
fX (x)
Portanto,
E(Y |X = x) =
yfY |X (y|x)dy =
x2
ye2(x
2 y)
ye2|yx | dy
dy +
ye2(yx ) dy
x2
y
2
2
= ( e2(x y) |x
2
x2
2 y)
e2(x
2
y
2
dy) + ( e2(yx ) |
x2
2
x2
e2(yx )
dy)
2
x2 1
x2 1
) + ( + ) = x2 .
2
2
2
2
Observe que E(Y |X = x) uma funo de x, chamemos esta funo de h(x). Ento,
temos que E(Y |X) = h(X) uma funo da varivel aleatria X e portanto uma varivel
aleatria. Por outro lado, E(Y |X) uma mdia da varivel Y . A seguir listamos algumas
propriedades da esperana condicional:
=(
Prova:
EY =
yfY (y)dy =
fX (x)(
y(
fY |X (y|x)fX (x)dx)dy
yfY |X (y|x)dy)dx =
= E[E(Y |X)].
Autor: Leandro Chaves Rgo
64
Exemplo 5.6.3: Podemos utilizar este ltimo resultado para calcular a esperana (incondicional) de Y no exemplo anterior.
xex dx
= 0 + 2(xex |
0 +
x2 ex
ex dx)
= 2(0 + 1) = 2.
Captulo 6
Principais Variveis Aleatrias Discretas
6.1 Introduo
Neste captulo descreveremos um pouco sobre os principais modelos de variveis aleatrias
discretas.
6.2 Geomtrica.
Dizemos que X tem uma distribuio Geomtrica com parmetro , onde 0 < 1, se
X(w) {1, 2, 3, . . .} e p(k) = (1 ) k1 , para k {1, 2, 3, . . .}.
Utilizando o resultado de uma soma innita de uma Progresso Geomtrica, temos que
(1 )
p(k) =
k=1
k1
k1 = 1.
= (1 )
k=1
k=1
Exemplo 6.2.1 :
65
k(1 ) k1 =
EX =
k=1
k1 =
= (1 )
j=1 k=j
66
(1 ) k1
k=1 j=1
j1
j=1
1
1
Onde utilizamos a frmula da soma innita de uma progresso geomtrica com razo .
Com um clculo similar, porm mais longo, pode-se provar que V arX = (1)
2.
Exemplo 6.2.2:
P (X > s + t, X > s)
P (X > s + t)
=
.
P (X > s)
P (X > s)
Mas
P (X > s + t) =
(1 ) k1 = s+t .
k=s+t+1
P (X r) = P (Y n).
Observe que estas duas distribuies tratam de ensaios de Bernoulli repetidos. A distribuio binomial surge quando lidamos com um nmero xo de ensaios e estamos interessados
no nmero de sucessos que venham a ocorrer. A distribuio binomial negativa encontrada
quando xamos o nmero de sucessos e ento registramos o nmero de ensaios necessrio.
6.4 Poisson.
Dizemos que X tem uma distribuio Poisson com parmetro , onde 0, se X(w)
k
{0, 1, . . .} e p(k) = e k! , para k {0, 1, . . .}.
Usando o resultado da expanso em srie de Taylor da funo exponencial, temos que
para todo x real,
xk
x
e =
.
k!
k=0
p(k) =
k=0
k=0
e k
k
= e
= e e = 1.
k!
k!
k=0
e k
EX =
k
=
k!
k=0
e k
e k1
k
=
= .
k!
(k 1)!
k=1
k=1
J vimos que o segundo momento de uma varivel aleatria com distribuio Poisson()
igual a 2 + . Portanto, V arX = 2 + ()2 = .
Podemos analisar o valor mais provvel de uma distribuio de Poisson, atravs da razo
de dois valores sucessivos da funo probabilidade de massa:
pk+1
=
.
pk
k+1
Note que esta razo estritamente decrescente em k . Logo, {pk } sempre decrescente se
< 1, decresce aps p0 = p1 se = 1, e cresce inicialmente se > 1 e eventualmente decresce
qualquer que seja o valor de . Formalmente, um valor mais provvel de uma distribuio
de Poisson denido como k se pk +1 pk e pk 1 pk . (Note que podem existir valores
adjacentes que possuam o mesmo valor.) Mas esta condio equivalente a,
k k + 1, ou
1 k .
Note que se tomarmos k como sendo o maior inteiro menor ou igual a esta restrio
satisfeita, e portanto este um valor mais provvel desta distribuio. A Figura 6.4 nos
mostra a funo probabilidade de massa da Poisson para 3 valores de parmetros 1, 4, e 10.
Exemplo 6.4.2: Suponha que o nmero de clientes que chegam em um banco segue uma
distribuio de Poisson. Se a probabilidade de chegarem 3 clientes for o triplo da de chegarem
4 clientes em um dado perodo de 10 minutos. Determine:
(a) Qual o nmero esperado de clientes que chegam em um perodo de 1 hora neste banco?
(b) Qual o nmero mais provvel de clientes que chegam em um perodo de 1 hora neste
banco?
69
6.5 Hipergeomtrica.
A distribuio hipergeomtrica descreve o nmero de sucessos em uma seqncia de n amostras de uma populao nita sem reposio.
Por exemplo, considere que tem-se uma carga com N objetos dos quais D tm defeito. A
distribuio hipergeomtrica descreve a probabilidade de que em uma amostra de n objetos
distintos escolhidos da carga aleatoriamente exatamente k objetos sejam defeituosos.
Em geral, se uma varivel aleatria X segue uma distribuio hipergeomtrica com parmetros N, D, e n, ento a probabilidade de termos exatamente k sucessos dada por
p(k) =
D
k
N D
nk
N
n
EX =
nD
=
N
k=0
n
k=1
D
k
N D
nk
N
n
=
k=1
k=1
D1 N D
k1
nk
N 1
n1
nD
EX =
N k =0
D
k
N D
n k
N
n
nD
.
N
Onde utilizamos o fato que o somatrio igual soma da funo probabilidade de massa de
uma varivel aleatria Hipergeomtrica para todos os valores que tem probabilidade positiva,
e portanto, igual a 1. Com um clculo similar, porm mais longo, pode-se provar que
(N D)(N n)
.
V arX = nD
N
N (N 1)
Exemplo 6.5.1: Suponha que uma urna contm 20 bolas brancas e 10 bolas pretas. Se 4
bolas so retiradas da urna. Determine:
(a) A probabilidade de pelo menos uma bola ser branca, se as bolas so retiradas com
reposio.
Exemplo 6.5.2: Por engano 3 peas defeituosas foram misturadas com boas formando um
lote com 12 peas no total. Escolhendo ao acaso 4 dessas peas, determine a probabilidade
de encontrar:
(a) Pelo menos 2 defeituosas.
(b) No mximo 1 defeituosa.
(c) No mnimo 1 boa.
p(k) =
n(n 1) (n k + 1) k
n k
n!
pk (1 p)nk =
p (1 p)nk .
p (1 p)nk =
k
k!(n k)!
k!
n(n 1) (n k + 1) k n nk
( ) (
)
k!
n
n
k
1
k1
=
[(1)(1 ) (1
)][1 ]nk
k!
n
n
n
p(k) =
n k
k
pn (1 pn )nk = e .
k
k!
gito incorreto possa aparecer 0,002. Se os erros forem independentes, qual a probabilidade
de encontrar k dgitos incorretos em um nmero binrio de 25 dgitos? Se um computador
forma 106 desses nmeros de 25 dgitos por segundo, qual a probabilidade de que pelo
menos um nmero incorreto seja formado durante qualquer perodo de 1 segundo?
Soluo: A probabilidade de que k dgitos sejam incorretos em um nmero binrios
de 25 dgitos igual a 25
(0,002)k (0,998)25k . Em particular, a probabilidade de que pelo
k
menos um dgito seja incorreto igual a 1 (0,998)25 0,049. Se tivssemos usado a
aproximao pela Poisson ento teramos uma Poisson com parmetro 25 0,002 = 0,05,
logo a probabilidade de pelos menos um dgito incorreto neste nmero de 25 dgitos seria
1 e0,05 0,049.
A probabilidade de que pelo menos um nmero incorreto seja formado durante o perodo
6
de 1 segundo igual a 1 (0,049)10 1 e49000 1.
P (X1 = n1 , X2 = n2 , . . . , Xk = nk ) =
n!
pn1 1 pn2 2 pnk k ,
n1 !n2 ! nk !
Autor: Leandro Chaves Rgo
Captulo 7
Principais Variveis Aleatrias
Contnuas
7.1 Introduo
Neste captulo, vamos explorar alguns exemplos importantes de variveis aleatrias contnuas.
Vamos vericar que esta realmente uma funo densidade de probabilidade. Fazendo
a substituio de variveis t = x
, obtemos
(x)2
1
e 22 dx =
2
1 t2
e 2 dt = I.
2
I2 =
1
2
t2
2
dt
s2
2
1
2
ds =
(t2 +s2 )
2
dtds.
I2 =
1
2
1
=
2
1
2
re
0
2
r 2
2
e
0
r 2
2
|
0 d
1d = 1.
0
73
drd
EX =
Fazendo a mudana de varivel y =
EX =
y + y2
e 2 dy =
2
(x)2
1
x e 22 dx.
2
x
,
temos
y y2
e 2 dy +
2
y2
e 2 dy = 0 + = .
2
75
z 2
1
E(X ) =
(y + )2 e 2 dz
2
2
z 2
z 2
1
=
z 2 e 2 dz + 2
ze 2
2
2
2
z
1
+2
e 2 dz.
2
2
A segunda parcela, pela resultado da esperana da normal padro igual a zero. A ltima
parcela pelo resultado da integral da densidade da normal, temos que igual a 2 . Para
z 2
calcular a primeira parcela, vamos usar integral por partes onde u = z e dv = ze 2 . Assim
obtemos
z 2
2
E(X 2 ) = (ze 2 |
+
2
= 2 + 2 .
z 2
2
dz) + 2
O seguinte teorema arma que transformaes lineares de variveis aleatrias com distribuio normal tambm so distribudas normalmente.
yb
yb
) = FX (
).
a
a
ou seja, Y N (a + b, a2 2 ).
76
1 x2
e 2 dx.
2
a
Esta integral no pode ser resolvida analiticamente, contudo mtodos de integrao numrica
podem ser empregados para calcular integrais da forma acima e de fato valores de P (X s)
existem em vrias tabelas. A funo de distribuio acumulada de uma normal padro usux2
s
almente denotada por . Portanto, temos que (s) = 12 e 2 dx. Ento, consultando
valores de em uma tabela, podemos determinar que P (a < X b) = (b) (a).
Utilizando o resultado do Corolrio 7.2.2 e valores de , podemos obter para qualquer
X N (, 2 ), o valor de P (a < X b):
P (a < X b) =
a
X
b
<
b
a
(
) (
)
P (a < X b) = P (
Exemplo 7.2.3: Suponha que X tenha uma distribuio N (2; 0,16). Empregando a tbua
de distribuio normal, calcule as seguintes probabilidades:
(a) P (X 2,3).
(b) P (1,8 X 2,1).
2,3 2
) = 1 (0,75) = 1 0,7734 = 0,2266.
0,4
Parte (b),
P (1,8 X 2,1) = (
2,1 2
1,8 2
)(
) = (0,25)(0,5) = 0,59870,3085 = 0,2902.
0,4
0,4
Exemplo 7.2.4: Um equipamento com dois terminais com uma resistncia equivalente de
1 Megohm opera em uma sala com temperatura de 300K. A voltagem trmica V que ele gera
observada na banda de 1,5GHz at 2,5GHz. Qual a probabilidade que a magnitude da
voltagem exceda 8 milivolts? Assuma que V N (0, 2 ), onde 2 = 4T RB , a constante
de Boltzman que igual a 1,38 1023 , V medido em volts, T medido em graus Kelvin,
R medido em ohms, e B medido em Hertz.
Autor: Leandro Chaves Rgo
0,008 0
0,008 0
)) + (
)
0,004
0,004
7.3 Exponencial
Dizemos que X tem uma distribuio Exponencial com parmetro , onde > 0 um
nmero real, se a funo densidade de X igual a
fX (x) = ex U (x),
onde U (x) = I[0,) (x) conhecida como funo degrau.
A Figura 7.3 mostra a funo densidade exponencial para = 0,5, = 1, e = 1,5.
A densidade exponencial pode ser utilizada para modelar os seguintes fenmenos: tempo
de vida de componentes que falham sem efeito de idade; tempo de espera entre sucessivas
chegadas de ftons, emisses de eltrons de um ctodo, ou chegadas de consumidores; e
durao de chamadas telefnicas.
Se X Exp(), ento X possui densidade igual a fX (x) = ex U (x). Logo, temos que
sua esperana dada por:
EX =
xe
0
dx =
xex |
0
ex dx =
ex 1
| = .
0
EX 2 =
0
x2 ex dx = x2 ex |
0 +2
Portanto,
V arX = EX 2 (EX)2 =
xex dx =
2
.
2
1
1
2
2 = 2.
2
P (X > s + t, X > s)
P (X > s + t)
=
.
P (X > s)
P (X > s)
P (X > s + t) =
(s+t)
ex dx = [ex ]
.
s+t = e
s+t
s
. Portanto,
Exemplo 7.3.1: Observa-se que um tipo particular de chip igualmente provvel durar
menos que 5.000 horas ou mais que 5.000 horas. Determine:
Soluo: Seja X o tempo de durao de um chip deste tipo. Tempos que X tem uma
distribuio exponencial, devemos agora determinar seu parmetro. Sabe-se que P (X <
5000) = P (X > 5000), e como P (X < 5000) + P (X > 5000) = 1, temos que P (X <
log 2
5000) = 0,5. Portanto, 1 e(5000) = 0,5, ou seja, = 5000
. Ento, o tempo de durao
mdio deste tipo de chip 5000
horas.
log 2
Para calcular a probabilidade desejada temos que
log 2
5
+ e2 log 2
7.4 Cauchy
Dizemos que X tem uma distribuio Cauchy com parmetro x0 e > 0, se a funo
densidade de X igual a
1
.
fX (x) = 2
+ (x x0 )2
A Figura 7.4 mostra a funo densidade Cauchy para alguns pares de parmetros.
Pode-se provar que a razo entre duas variveis aleatrias com distribuio Normal padro
independentes tem uma distribuio Cauchy com parmetros x0 = 0 e = 1.
Se X Cauchy(x0 , ), ento X no integrvel, ou seja EX no est denida, pois:
0
2
dx = , e
+ (x x0 )2
x
2
dx = .
+ (x x0 )2
Autor: Leandro Chaves Rgo
79
7.5 Qui-quadrado
Dizemos que X tem uma distribuio Qui-quadrado com parmetro n, onde n nmero
natural, se a funo densidade de X igual a
fX (x) =
xn/21 ex/2
U (x),
2n/2 (n/2)
onde (p) = 0 xp1 ex dx para p > 0 a funo gama. n conhecido como nmero de
graus de liberdade da distribuio Qui-quadrado.
A Figura 7.5 mostra a funo densidade Qui-quadrado para 1, 2, 3, 4, e 5 graus de
liberdade.
7.6 t de Student
80
Dizemos que X tem uma distribuio t de Student com parmetro n, onde n nmero
natural, se a funo densidade de X igual a
fX (x) =
x2 (n+1)
[(n + 1)/2]
(1 + ) 2 ,
n
[n/2] n
Note que se n = 1, temos que a distribuio t de Student igual a distribuio Cauchy(0,1). Se n , a distribuio t de Student converge para a distribuio normal padro.
Pode-se provar que se Z uma distribuio normal padro independente de V que tem distribuio Qui-quadrado com n graus de liberdade, ento X = ZV tem uma distribuio t
n
f (x, y) =
1
21 2
1 2
exp{
1
x 1 2
x 1 y 2
y 2 2
[(
) 2(
)(
)+(
) ]},
2
2(1 )
1
1
2
2
Captulo 8
Anlise Exploratria de Dados
8.1 Resumo de Dados
8.1.1 Tipos de Variveis
Quando se faz um experimento cientco, em geral queremos observar os resultados referentes alguma caracterstica de interesse. Tais caractersticas de interesse so denominadas
variveis. Por exemplo, podemos estar interessados no tempo de vida til de um dado equipamento eletrnico. As variveis podem ser classicadas como qualitativas quando descrevem
possveis atributos de um dado experimento ou quantitativas quando descrevem possveis nmeros resultantes de um processo de contagem ou mensurao. Por exemplo, a marca e o
modelo de um equipamento eletrnico so variveis qualitativas, porm o temo de vida til
uma varivel quantitativa.
As variveis qualitativas podem ser classicadas como nominais ou ordinais dependendo
se existe ou no uma ordem natural em seus possveis resultados. No exemplo anterior tanto
a marca como o modelo so variveis nominais. Para um exemplo de uma varivel ordinal,
considere o grau de escolaridade de um individuo em uma dada pesquisa.
As variveis quantitativas podem ser classicadas como discretas ou contnuas dependendo se o conjunto de possveis resultados um conjunto enumervel ou no enumervel.
O tempo de vida til de um equipamento pode ser considerado como uma varivel contnua.
J o nmero de ftons emitidos por uma fonte radioativa uma varivel discreta.
Em algumas situaes podem se atribuir valores numricos aos diversos atributos ou
classes de uma varivel qualitativa para que se possa efetuar uma anlise como se esta
fosse quantitativa, desde que haja alguma possvel interpretao desta atribuio. Um caso
bastante til no caso de uma varivel dicotmica, ou seja, que assume apenas dois possveis
valores. Por exemplo, o sexo de um indivduo em uma dada observao. Pode-se neste caso
associar-se o valor zero a um sexo e o valor 1 ao outro.
Um outro possvel critrio para classicar variveis em funo da escala de medida
adotada para se analisar o resultado do experimento. As escalas de medidas podem ser:
nominais, ordinais, intervalares, e de razo.
83
Uma escala ordinal alm de classicar os resultados tambm pode ser utilizada para
estabelecer uma ordem entre as diferentes classes de possveis resultados, por exemplo,
grau de escolaridade de um indivduo, classe socio-econmica de um indivduo, posio
que um dado indivduo conclui uma certa corrida. Transformaes que preservam a
ordem no alteram a estrutura de uma classe ordinal.
Uma escala intervalar pode ser utilizada para alm de classicar e ordenar os resultados
tambm quanticar a diferena entre as classes. Nesta escala necessitamos estabelecer
uma origem arbitrria e uma unidade de medida nesta escala. Por exemplo, a temperatura de um dado equipamento em funcionamento medida em graus centgrados
constitui uma medida numa escala intervalar. Considere o caso em que temos trs
equipamentos E1, E2, e E3, operando em temperaturas de 40, 45 e 80 graus centgrados, respectivamente. vlido armar que a diferena de temperatura entre E3
e E2 7 vezes maior que a diferena de temperatura entre E2 e E1. Contudo, neste
escala no faz sentido armar que E3 tem uma temperatura 2 vezes maior que E1,
pois lembre que a origem e a unidade de graus centgrados escolhidas so arbitrrias,
se estivssemos medindo a temperatura em graus Fahrenheits no se observaria esta
relao.
Uma escala de razo podem ser utilizada para alm de classicar e ordenar os resultados
tambm estabelecer quo maior um resultado que outro. A diferena com a escala
intervalar que agora existe um zero bem denido neste escala. A altura de um
indivduo, o tempo at ocorrncia de um dado evento, o nmero de ocorrncias de um
dado evento em um dado intervalo de tempo so exemplos de medidas que utilizam
uma escala de razo. Observe que se no caso em que temos dois equipamentos E1 e
E2 com tempo de vida til de 100h e 200h, respectivamente. vlido armar que o
tempo de vida til de E2 o dobro do tempo de vida til de E1.
85
Existem vrios tipos de grcos para representar a distribuio dos dados de uma varivel
qualitativa. Os dois mais utilizados so: o grco de barras e o grco de setores ou pizza.
O grco de barras consiste em construir retngulos ou barras, uma para cada classe, em
que uma das dimenses proporcional freqncia de ocorrncia desta classe, e a outra dimenso arbitrria porm igual para todas as barras. As barras so dispostas paralelamente
umas s outras, horizontal ou verticalmente.
O grco de setores destina-se a representar a composio, usualmente em porcentagem,
de partes de um todo. Consiste de um crculo de raio arbitrrio, representando o todo,
dividido em setores, sendo que cada setor corresponde a uma classe e tem rea proporcional
a freqncia relativa de ocorrncia desta classe.
Variveis Quantitativas
Para uma varivel quantitativa discreta podemos tambm utilizar um grco de barras como
no caso de variveis quantitativas, onde agora temos uma barra para cada possvel valor que a
varivel pode assumir. Tambm podemos considerar um grco de disperso unidimensional
onde desenhamos apenas pontos no plano cartesiano da forma (xi , ni ), isto , onde a abscissa
do ponto um possvel valor da varivel e a ordenada a freqncia de ocorrncia deste
valor.
Uma outra alternativa de grco para varivel quantitativa que muito til no caso de
variveis contnuas conhecida como histograma.
Para a construo de um histograma, o primeiro passo denir os intervalos contguos e
disjuntos que cubram todos os resultados observados. Uma vez denidos os intervalos, um
histograma nada mais do que um grco de barras contguas, onde a base proporcional ao
comprimento do intervalo e a rea da barra proporcional a freqncia relativa de ocorrncia
de intervalos neste dado intervalo. Logo, se o i-simo intervalo tem comprimento i e a
freqncia relativa de ocorrncia de resultados neste intervalo fi , ento a altura da barra
deve ser proporcional a fi /i , que chamada de densidade de freqncia da i-sima classe.
Com essa conveno a rea total do histograma deve ser proporcional a 1.
Exemplo 8.1.1: Duzentas baterias automotivas de uma dada marca foram testadas quanto
a sua vida til. Os resultados do teste em meses so reportados na tabela abaixo:
Durabilidade Freq. Relativa
0 3
0,02
3 6
0,05
6 9
0,15
9 12
0,25
12 15
0,30
15 18
0,23
(a) Construa um histograma referente a tabela acima.
87
Soluo: (a) Para a construo do histograma note que a freqncia relativa das 5
classes so, respectivamente: 14/25, 7/25, 3/25, 3/100, e 1/100. Como cada classe tem
comprimento 6, a altura de cada barra no histograma deve ser 1/6 da freqncia relativa da
sua classe correspondente.
(b) Para o clculo da mdia, devemos utilizar a aproximao de cada classe pelo seu
ponto mdio deste modo:
md
6
= ,
50
56
portanto, md = 5,36. Como a classe de maior freqncia a primeira, temos que a moda
igual a 3.
dm(X) =
n
i=1
|xi x|
.
n
Autor: Leandro Chaves Rgo
var(X) =
=
n
i=1
x2i
n
i=1 (xi
n
2x
x)2
n
i=1
xi
n
2
i=1 (xi
+ x2 =
2xi x + x2 )
n
n
2
i=1 xi
x2 .
n
(8.1)
8.1.6 Quantis
Apenas a informao da medida de posio e de disperso no nos do informao a respeito
da simetria ou assimetria da distribuio dos resultados. Os quantis so medidas que servem
para informar a este respeito. Vimos que a mediana uma medida tal que metade dos
resultados so menores e a outra metade maior que a mediana. Analogamente, podemos
denir um quantil de ordem p ou p-quantil, indicado por q(p), onde p uma proporo
qualquer, 0 < p < 1, tal que 100p% dos resultados sejam menores que q(p). Existem alguns
quantis que so usados mais freqentemente e recebem nomes particulares: q(0,25) o 1o.
quartil ou 25o. percentil; q(0,5) a mediana, 5o. decil, ou 50o. percentil; q(0,75) o terceiro
quartil ou 75o. percentil; e q(0,95) o 95o. percentil.
Por exemplo, se temos uma coleo de n resultados, como deveramos denir q(1/n)? Seja
x(1) x(2) x(n) uma reordenao dos resultados em ordem crescente, conhecida como
estatstica de ordem dos resultados. Ento, em analogia com a denio da mediana, o quantil
q(1/n) denido como sendo a mdia aritmtica entre x(1) e x(2) , de modo que exatamente
100/n% dos resultados so menores que q(1/n). Similarmente, o quantil q(2/n) denido
como sendo a mdia aritmtica entre x(2) e x(3) . Mas neste caso como q(1/n) x(2) q(2/n),
o resultado x(2) deve corresponder a um quantil q(p), onde n1 < p < n2 . Para a denio
formal dos quantis assume-se linearidade entre os quantis da forma q(m/n), para m n.
1
+2
n n
q(1/n)+q(2/n)
,
2
89
3
x(2) igual ao quantil q( 2 ) = q( 2n
). Em geral,
i1
i
+
i0,5
2i1
ao quantil q( n 2 n ) = q( 2n ) = q( n ), para i =
seguindo o
o
maior
valor
(n)
2n
observado dos resultados e igual ao quantil q( n0,5
)
,
dene-se
q(p)
como
sendo igual a x(n) .
n
2(i1)1
2i1
Finalmente, se p = 2n + (1 ) 2n , onde 0 < < 1, ento dene-se q(p) como sendo
igual a x(i1) + (1 )x(i) .
Resumindo, temos que
x(1)
x
(n)
q(p) =
x
(i)
x(i1) + (1 )x(i)
,
,
,
,
se
se
se
se
1
,
p < 2n
2n1
p > 2n ,
p = 2i1
,
2n
2(i1)1
p = 2n + (1 ) 2i1
, onde 0 < < 1.
2n
x(n) q(0,5);
q(0,75) q(0,5); e
x(n) q(0,75).
90
3,47.
2 = (13/30)+(46/30)+(96/30)+(167/30)+(255/30)+(363/30)3,472
2,16.
Logo, o desvio padro igual aproximadamente a 1,47. O primeiro quartil dado por
x(8) = 2, e o terceiro quartil dado por x(23) = 5. Com estes resultados podemos observar
que
(a) q(0,5) x(1) = 2,5 = x(n) q(0,5);
(b) q(0,5) q(0,25) = 1,5 = q(0,75) q(0,5); e
(c) q(0,25) x(1) 1 = x(n) q(0,75).
Logo, podemos concluir que estes dados formam uma distribuio simtrica.
No caso de variveis contnuas descritas atravs de sua distribuio de freqncias, para
o clculo dos quantis utilizamos uma metodologia similar a do clculo da mediana, sendo
que agora q(p), 0 < p < 1, calculado atravs de uma proporo de forma que p% da rea
do histograma esteja antes de q(p) e (1 p)% esteja aps q(p), como no seguinte exemplo.
No. de Divrcios
2.800
1.400
600
150
50
q(0,1)
6
= ,
10
56
logo, q(0,1) = 1,07. Para o nono decil note que as duas primeiras classes contm 84% das
observaes, e as trs primeiras contm 96% das observaes, ento o nono decil deve estar
na terceira classe e podemos determin-lo tambm por uma proporo:
q(0,9) 12
6
= ,
6
12
logo q(0,9) = 15.
Para obtermos o intervalo interquartil, precisamos encontrar o primeiro e o terceiro quartil
que podemos obter de maneira similar a parte (a).
q(0,25)
6
= ,
25
56
logo, q(0,25) = 2,68. O terceiro quartil deve estar na segunda classe, ento como a primeira
claase j contm 56% das observaes:
q(0,75) 6
6
= ,
19
28
logo, q(0,75) = 10,07. Portanto, o intervalo interquartil [2,68; 10,07].
Captulo 9
Distribuies Amostrais
9.1 Introduo
Quando vamos aplicar modelos probabilsticos em algum problema prtico, precisamos ter
uma informao a respeito da distribuio de probabilidade da varivel aleatria de interesse.
Existem dois processos clssicos para a obteno da distribuio de uma varivel aleatria:
eduzir uma distribuio a priori de um especialista da rea, ou inferir a distribuio a partir
de uma anlise de dados. Neste curso, no trataremos de mtodos de eduo, mas nos
concentraremos em mtodos de inferncia.
Denio 9.2.1: Populao o conjunto de todos os elementos ou resultados sob investigao. Amostra um subconjunto formado por elementos selecionados da populao.
Denio 9.3.1: Uma amostra aleatria simples de tamanho n de uma populao mode-
lada por uma varivel aleatria X , com uma dada distribuio, um conjunto de n variveis
aleatrias independentes X1 , X2 , . . . , Xn , cada uma com a mesma distribuio de X .
1
n1
n
i=1
Xi ;
n
i=1 (Xi
X)2 ;
elementos da amostra ordenados, isto , X(1) X(2) X(n) , so conhecidos como estatsticas
de ordem da amostra.
95
Exemplo 9.5.1: Suponha que retiramos com reposio todas as amostras de tamanho
2 da populao {1, 3, 5, 5, 7}. A distribuio conjunta da amostra (X1 , X2 ) dada por:
1
3
5
7
1 1/25 1/25 2/25 1/25
3 1/25 1/25 2/25 1/25 Vamos calcular ento a distribuio da mdia amostral. Por
5 2/25 2/25 4/25 2/25
7 1/25 1/25 2/25 1/25
exemplo, P (X = 3) = P (X1 = 1, X2 = 5) + P (X1 = X2 = 3) + P (X1 = 5, X2 =
1) = 5/25. Similarmente, os demais valores podem ser obtidos conforme tabela a seguir:
x
1
2
3
4
5
6
7
P (X = x) 1/25 2/25 5/25 6/25 6/25 4/25 1/25
Exemplo 9.5.2: No caso do lanamento de uma moeda 50 vezes, usando como estatstica
X o nmero de caras obtidas, a distribuio amostral desta estatstica uma binomial com
parmetros n = 50 e p, onde p a probabilidade de cara em um lanamento qualquer desta
moeda. Se estivermos interessados em saber se esta moeda honesta, ou seja, em checar
se p = 0,5, e soubermos que em 50 lanamentos ocorreram 36 caras podemos calcular que
P0,5 (X 36) = 0, 0013, ou seja, se a moeda for honesta, ento a probabilidade de se obterem
36 ou mais caras igual a 0,0013, ento existe evidncia que p deve ser diferente de 0,5. Por
outro lado, se obtivermos 29 caras, obtemos que P0,5 (X 29) = 0, 1611, ento se a moeda
for honesta aproximadamente 1/6 das vezes observa-se um valor maior ou igual a 29, ento
no temos dados sucientes para descartar a hiptese que a moeda seja honesta neste caso.
as possveis amostras de tamanho 2 de elementos que podem ser selecionadas com reposio
desta populao. Determine.
(a) A mdia e varincia populacional.
(b) A distribuio da mdia e varincia amostrais.
1+3+5+7
4
= 4, e a varincia populacional
dada por =
4 = 5. Para determinarmos a mdia a varincia amostrais,
considere a seguinte tabela onde todos as possveis amostras esto enumeradas:
2
Teorema 9.5.4: Seja X uma varivel aleatria com mdia e varincia 2 , e seja (X1 , X2 , . . . , Xn )
uma amostra aleatria simples de X . Ento,
2
E(X) = e V ar(X) = .
n
Autor: Leandro Chaves Rgo
E(X) =
97
1
(EX1 + EX2 + + EXn ) = .
n
V ar(X) =
1
2
(V
arX
+
V
arX
+
+
V
arX
)
=
.
1
2
n
n2
n
Note que conforme n vai aumentando a distribuio de X tende a car mais concentrada
em torno de sua mdia , pois sua varincia vai diminuindo. Alm disso, o prximo teorema
nos d uma informao mais detalhada para a distribuio amostral da mdia para valores
grandes de n. Este teorema conhecido como Teorema do Limite Central.
Teorema 9.5.5: Para amostras aleatrias simples (X1 , X2 , . . . , Xn ), retiradas de uma po-
2 /n
2 /n
n(X)
obter que
N (0, 1), ou seja, ne N (0, 1).
Exemplo 9.5.6: Suponha que uma mquina est regulada para produzir lmpadas com
tempo de vida til mdio de 10.000horas. De uma amostra de 50 lmpadas produzidas por
esta mquina, verica-se o tempo de vida til de cada uma delas. Determine a probabilidade
de que o tempo de vida til mdio seja menor ou igual a 8.000horas.
Soluo: Sabe-se que o tempo de vida til de uma lmpada distribudo de acordo com
uma Exponencial. Portanto, como o tempo de vida til mdio de 10.000horas, temos que
50(8000 10000)
P (X 8000) = P (Z
) = ( 2) = 0,0793.
10000
Exemplo 9.5.7: Suponha que uma mquina est regulada para produzir lmpadas de modo
que 10% delas tenham tempo de vida til menor ou igual a 1.000horas. De uma amostra
de 50 lmpadas produzidas por esta mquina, qual a probabilidades de encontrarmos no
mximo 90% com tempo de vida til maior que 1.000 horas.
Soluo: Como temos uma amostra maior que 30, podemos utilizar o TCL para armar
que a proporo amostral tem uma distribuio N (0,1, (0,1)(0,9)
). Portanto,
50
P (1 p 0,9) = P (
p 0,1) = P (Z 0) = 0,5.
P (|X | ) ,
onde representa o grau de conana necessrio para que o erro amostral seja no mximo
2
igual a . Como a distribuio amostral de X N (, n ), temos que o tamanho mnimo da
amostra n tem que satisfazer
n
n
P ( X ) = P (
Z
) = ,
onde Z tem uma distribuio normal padro. Da distribuio normal padro, temos que
+1
+1
+1
+1
P (1 (
) Z 1 (
)) = P (Z 1 (
)) P (Z < 1 (
))
2
2
2
2
+1
+1
=
(1
) = .
2
2
Portanto,
n
+1
= 1 (
), ou seja,
2
))2
2 (1 ( +1
2
n=
.
2
Note que o tamanho da amostra depende da varincia da populao. Como era de se
esperar, quanto mais variabilidade tiver a populao, mais amostras sero necessrias para
que se possa fazer armaes conveis a respeito dos erros dos estimadores. Contudo, em
geral o valor da varincia da populao desconhecido. Na prtica, pode-se fazer um projeto
piloto para que se possa estimar o valor desta varincia e, em seguida, us-la para determinar
o tamanho de amostra do estudo principal.
No caso de propores, como neste caso, = p(1 p), temos que
n=
(1 ( +1
))2 p(1 p)
2
2
))2
(1 ( +1
2
.
n=
42
Exemplo 9.6.1: Uma varivel aleatria X tem distribuio amostral N (3, 22 ). Qual deve
ser o tamanho n de uma amostra aleatria de X para que a mdia amostral X tenha 84,13%
dos valores menores que 3,4?
n(3,4 3)
).
0,8413 = P (X 3,4) = P (Z
2
1 (0,8413)
= 5, ou seja, n = 25.
Logo, n = 2 0,4
Autor: Leandro Chaves Rgo
Captulo 10
Estimao
10.1 Estimativas e Estimadores
Uma aplicao muito importante de estatsticas a obteno de estimativas dos parmetros
da populao, tais como mdia e varincia da populao. O objetivo da estimao selecionar um nico nmero baseado nos dados da amostra, sendo esse nmero o mais plausvel
para um parmetro . Em geral, se X for uma varivel aleatria com distribuio de probabilidades caracterizada por um parmetro desconhecido , e se X1 , X2 , . . . , Xn for uma
= h(X1 , X2 , . . . , Xn ) chamada
amostra aleatria de tamanho n de X , ento a estatstica
assume um valor
de um estimador de . Note que depois da amostra ter sido selecionada,
E , chamado estimativa de . Portanto, uma estimativa pontual de algum parmetro da
de uma estatstica
.
populao um nico valor numrico E
Problemas de estimao ocorrem freqentemente, os parmetros mais comuns que se
desejam estimar so:
A mdia amostral X .
A varincia amostral S 2 =
1
n1
n
i=1 (Xi
X)2 .
Exemplo 10.1.1 :
Exemplo 10.2.2: A mdia amostral X um estimador no-viesado para mdia populacional , pois
1
E(X) =
n
EXi = .
i=1
Exemplo 10.2.3: Considere uma populao com N elementos, com mdia populacional
=
1
N
N
i=1
Xi , e varincia populacional
1
=
N
(Xi )2 .
i=1
2 =
(Xi X)2 .
n i=1
Vamos mostrar que esse estimador viesado. Note que
n
(Xi X)2 =
i=1
(Xi + X)2
i=1
n
2
(Xi ) 2
i=1
n
(X )2
(Xi )(X ) +
i=1
i=1
(Xi )2 n(X )2 .
=
i=1
Portanto,
n
1
E(
)= (
E(Xi )2 nE(X )2 )
n i=1
2
1
= (
V ar(Xi ) nV ar(X))
n i=1
=
1
2
n1 2
(n 2 n ) =
.
n
n
n
2
Logo, o vis de
2 igual a n1
2 2 =
. Portanto, o estimador
2 em geral subestima
n
n
2
o verdadeiro parmetro . Por outro lado, o vis diminui com n tendendo a zero quando n
n
> 0,
2
,
n
P (|X n | > )
quando n , para qualquer
2
0,
n2
> 0.
Autor: Leandro Chaves Rgo
Teorema 10.2.6: Se {Tn } uma seqncia de estimadores de tal que limn E(Tn ) =
e limn V ar(Tn ) = 0, ento {Tn } consistente.
Prova: Note que pela desigualdade triangular, se |Tn | > , ento |ETn | >
|Tn ETn | > 2 . Portanto,
ou
4V ar(Tn )
2
4V ar(Tn )
2
= 0.
Exemplo 10.2.7:
Vimos que S 2 um estimador no-viesado para 2 . possvel demonstrar no caso em que a populao tem distribuio normal com mdia e varincia 2
que
2 4
2
V ar(S ) =
.
n1
Logo, S 2 consistente para 2 .
e V ar(
2 ) = ( n1
)2 n1
n
2
para .
n1 2
S ,
n
temos que E(
2 ) = n1
2 2 quando n ,
n
0 quando n . Logo, pelo teorema
2 tambm consistente
Exemplo 10.2.10 :
Denio 10.2.11:
2
.
n
P (L U ) = ,
Autor: Leandro Chaves Rgo
P ( U ) = .
n(X )
Z=
tem uma distribuio normal padro. Seja 1 () o valor tal que P (Z 1 ()) = .
Ento, temos que
P ( (( + 1)/2) Z =
n(X )
1 (( + 1)/2)) = .
P (X 1 (( + 1)/2)/ n X + 1 (( + 1)/2)/ n) = .
n(X )
P (Z =
1 ()) = .
P ( X + 1 ()/ n) = .
Exemplo 10.3.1: Suponha que temos uma populao com distribuio Bernoulli(p). Por
exemplo, p pode representar a probabilidade de um determinado tipo de capacitor ser produzido com defeito por uma determinada fbrica. Dada uma amostra aleatria X1 , X2 , . . . , Xn
de tamanho n da produo de capacitores desta fbrica, podemos estimar um intervalo de
conana bilateral para p. Note que a varincia da populao dada por p(1 p). Portanto,
sendo p a proporo de capacitores com defeito na amostra, como 2 = p(1 p), o resultado
1)/2)
1
, p +
4n
1 (( + 1)/2)
1
],
4n
p)
p)
tervalo [
p 1 (( + 1)/2) p(1
, p + 1 (( + 1)/2) p(1
]. O primeiro mtodo sempre
n
n
correto, porm muito conservador pois em geral p(1 p) pode ser bem menor que 1/4, e
ento estamos propondo um intervalo com amplitude maior que a necessria. O segundo
mtodo vlido desde que np e n(1 p) sejam maiores que 5, pois caso contrrio, se for pequeno a distribuio normal no poder mais ser usada e teremos que utilizar a distribuio
binomial.
Exemplo 10.3.2: O comprimento dos eixos produzidos por uma empresa tem aproximadamente uma distribuio normal com desvio padro de 4cm. Uma amostra com 16 eixos
forneceu uma mdia de 4,52cm.
Para o tem (b), como / n = 1, temos |X | tem distribuio normal padro, logo
P (|X | 0,5) = P (|Z| 0,5) = 0,383.
Exemplo 10.3.3:
[0,25 1 (0,99)
0,25(0,75)
, 0,25 + 1 (0,99)
400
0,25(0,75)
]
400
0,25(0,75)
), 20.000(0,25 + 1 (0,99)
400
= [5.000 1.006,75, 5.000 + 1006,75] = [3.993,25, 6006,75].
[20.000(0,25 1 (0,99)
0,25(0,75)
)]
400
Exemplo 10.3.4: Uma pesquisa sobre renda familiar foi realizada entre as famlias que
tem rendimento de at 5 salrios mnimos. Sabe-se que o desvio padro populacional de
1,2. Uma amostra de 200 famlias foram selecionadas e seus resultados aparecem na tabela
Rendimento Freqncia
1
90
2
50
abaixo:
3
30
4
20
5
10
(a) Estime, com 95% de conabilidade, o intervalo de conana para a mdia de renda
familiar desta populao.
(b) Estime a proporo real de famlias que tem rendimento de at 2 salrios mnimos,
com 95% de conabilidade.
108
1,2
1,2
[2,05 1 (0,975)
, 2,05 + 1 (0,975)
] = [1,884; 2,216].
200
200
Para o tem (b), temos que p = 140/200 = 0,7. Usando p(1 p) como estimativa
para a varincia populacional, temos que o intervalo de conana de 95% para proporo
populacional :
[0,7 1 (0,975)
0,7(0,3)
, 0,7 + 1 (0,975)
200
0,7(0,3)
] = [0,636; 0,764].
200
Pode-se provar que se a populao tem uma distribuio normal, ento T = n(X)
tem
S
uma distribuio t de student com n 1 graus de liberdade. Seja (, n 1) o valor tal
que P (T (, n 1)) = . Ento, utilizando o mesmo procedimento da seo anterior,
podemos vericar que
Captulo 11
Testes de Hiptese
11.1 Teste de Hiptese
Na seo anterior, estudamos o problema de estimar um parmetro de uma populao atravs de uma amostra selecionada desta populao. Em muitas situaes prticas no estamos
interessados em estimar o parmetro, mas ao invs estamos interessados em aceitar ou rejeitar uma armao a respeito do parmetro. Tal armao conhecida como hiptese. E
o mtodo utilizado para decidirmos aceitar ou rejeitar uma dada hiptese a partir de dados amostrais conhecido como Teste de Hiptese. A idia central deste procedimento
assumir que a hiptese verdadeira e vericar se a amostra observada parece razovel ou
consistente, dada esta suposio.
Denio 11.1.1: Uma hiptese estatstica uma armao sobre os parmetros de uma
ou mais populaes.
2
= P (erro I) = P (X > 230|X N (220, ))
n
n(X 220)
n(230 220)
>
)
= P(
= P (Z >
2(10)
) = P (Z > 2,5) = 0, 0062.
8
Autor: Leandro Chaves Rgo
) = P (Z 2,5) = 0,0062.
4
4
Neste caso, e foram iguais devido a simetria da regio crtica em relao as hipteses nula
e alternativa. Note que se ao invs de termos escolhido o valor crtico 230, aumentssemos
esse valor, ento diminuiria e aumentaria.
Poderamos tambm especicar um valor para a probabilidade de erro do tipo I e vericar
qual seria a regio crtica que satisfaria esta probabilidade de erro pre-especicada. Por
exemplo, suponha que queiramos encontrar a regio crtica cujo o seja igual a 0,01. Temos:
2(X 220)
> 2,325) = P (X > 229,3).
8
Para a regio crtica (229,3, ), podemos determinar o valor de para esta regio.
) = P (Z 2,675) = 0,0038.
4
4
Este segundo tipo de procedimento bastante utilizado, pois em geral a hiptese alternativa no contm apenas um nico valor de parmetro como no exemplo acima. Muitas
vezes, se nossa hiptese nula H0 : = 220v , nossa hiptese alternativa ser H1 : = 220v .
Como os parmetros da hiptese alternativa so muitos, a soluo adotar o ltimo procedimento descrito acima, ou seja, pre-estabelecer um valor , e calcular uma regio crtica
que satisfaa esta restrio. No caso de uma hiptese alternativa bilateral, em geral toma-se
como regio de aceitao um intervalo simtrico ao redor da hiptese nula, deste modo se
xarmos = 0,01, teremos
2(X 220)
| > 2,575) = 1 P (209,7 X 230,3).
8
Deste modo, determinamos a regio de aceitao [209,7; 230,3] de modo que o nvel de
signicncia de 0,01 seja satisfeito. Mesmo determinada esta regra de deciso, no poderemos
determinar , pois no existe um nico valor de na hiptese alternativa. Neste caso,
poderemos considerar uma funo (), conhecida como funo caracterstica de operao.
() = P (aceitar H0 |),
112
p0 (1 p0 )
, p0 + 1 (1 /2)
n
p0 (1 p0 )
].
n
Exemplo 11.3.1: Um relatrio arma que 40% de toda gua obtida atravs de poos arte-
sianos salobra. Existem controvrsias sobre esta armao, alguns dizem que a proporo
maior outros que menor. Para acabar com a dvida, sorteou-se 400 poos e observou-se
que em 120 deles a gua era salobra. Qual devia ser a concluso ao nvel de signicncia de
3%?
Soluo: Neste caso, estamos testando H0 : p = 0,4 contra uma hiptese alternativa
bilateral H1 : p = 0,4. Logo, a regio de aceitao dada por:
[0,41 (0,985)
(0,4)(0,6)
, 0,4+1 (0,985)
400
(0,4)(0,6)
] = [0,40,053; 0,4+0,053] = [0,347, ; 0,453].
400
Como p = 120/400 = 0,3, podemos rejeitar a hiptese nula ao nvel de conana de 3%.
populao economicamente ativa. Uma amostra aleatria de 1500 pessoas revelou que 1300
destas pessoas esto empregadas. Para um nvel de signicncia de 5%, pode-se dizer que a
armao est correta?
Soluo: Neste caso, temos a hiptese nula H0 : p = 0,15 contra a hiptese alternativa
H1 : p < 0,15. Logo, a regio de aceitao dada por:
[0,15 + 1 (0,05)
(0,15)(0,85)
, ] = [0,135; +).
1500
Como p = 200/1500 = 0,133, podemos rejeitar a hiptese nula ao nvel de conana de 5%,
e portanto, concluir que a armao estava correta.
115
Como se n 30, a varincia da amostra s2 prxima de 2 , temos que s pode ser usado
no lugar de nos procedimentos acima sem grande prejuzo aos clculos. Deste modo o
teste para a mdia de uma populao com varincia conhecida pode ser utilizado, no caso de
n 30, para testar a mdia de uma populao com varincia desconhecida. O tratamento
exato no caso em que 2 desconhecida e a amostra pequena envolve o uso da distribuio
t de student e ser estudado mais adiante.
Exemplo 11.4.1: O McDonald's pretende instalar uma nova lanchonete se no local tran-
sitarem no mnimo 200 carros por hora durante certos perodos do dia. Para 20 horas
selecionadas aleatoriamente durante tais perodos, o nmero mdio de carros que transitaram pelo lugar foi de 208,5 com desvio padro de 30,0. O gerente assume a hiptese de que
o volume de carro no satisfaz a exigncia de 200 ou mais carros por hora. Para um nvel
de signicncia de 5% esta hiptese pode ser rejeitada?
Soluo: Neste caso, temos que a hiptese nula dada por H0 : = 200 e a hiptese
alternativa H1 : > 200. Como a amostra pequena (<30) e a varincia da populao
30
30
(, 200 + (0,95, 19) ] = (, 200 + 1,729 ] = (, 211,6].
20
20
Portanto, a hiptese no pode ser rejeitada a este nvel de conana.
Exemplo 11.4.2:
100
(, 200 + (0, 95, 24) ] = (, 234,2].
25
Logo, a amostra no grande o suciente para garantirmos que a resistncia mdia maior
que 200 ao nvel de signicncia de 5%.
n|X 0 |
n|x0 0 |
p = P (|X 0 | > |x0 0 |) = P (
>
)
n|x0 0 |
n|x0 0 |
P (|Z| >
) = 2(1 (
)).
n(X 0 )
n(x0 0 )
p = P (X > x0 ) = P (
>
)
n|x0 0 |
n|x0 0 |
P (Z >
) = 1 (
).
117
n(X 0 )
n(x0 0 )
p = P (X < x0 ) = P (
<
)
n|x0 0 |
n|x0 0 |
) = (
).
P (Z <
Exemplo 11.5.1: Suponha novamente a situao anterior onde queremos testar a hiptese
nula H0 : = 220v versus H1 : = 220v , temos uma amostra de tamanho 4 e sabemos que
a varincia igual a 64v 2 . Suponha ainda que a mdia amostral deu igual a 227v , podemos
ento calcular o p-valor:
4|227 220|
7
p = 2(1 (
)) = 2(1 ( )) = 2(1 0,9599) = 0,0802.
4
64
Portanto, a probabilidade de quando a hiptese nula verdadeira uma amostra selecionada
de tamanho 4 tenha mdia amostral mais distante de 220v que 227v igual a 0,0802, ou
ainda, a um nvel de signicncia de 10% a hiptese nula seria rejeitada, mas a um nvel de
signicncia de 5% a hiptese nula no pode ser rejeitada.
Temos ento que rejeitaremos a hiptese H0 se o p-valor for bastante pequeno. A tabela
a seguir ilustra a escala de evidncias de Fisher contra a hiptese H0 :
p-valor
0,1
0,05
0,025
0,001
0,005
0,001
Natureza da
Evidncia
marginal moderada substancial forte muito forte fortssima
1600(|220,5 220|)
Referncias Bibliogrcas
Livros Textos:
1. Meyer, P. (1983), Probabilidade - Aplicaes Estatstica, 2a. edio, Livros Tcnicos e Cientcos Editora, Rio de Janeiro.
2. Bussab, W. & Moretin, P. (2002), Estatstica Bsica, 5a. edio, Saraiva, So Paulo.
Livros Suplementares:
1. Davenport Jr., W. (1987), "Probability and Random Processes - an introduction for
applied scientists and engineers", McGraw-Hill Book Company Inc.
2. Fine, T. (2006), Probability and Probabilistic Reasoning for Electrical Engineering,
Prentice Hall.
3. Montgomery, D. & Runger, G. (2003), Estatstica e Aplicada e Probabilidade para
Engenheiros, 2a. edio, LTC, Rio de Janeiro.
119