Você está na página 1de 27

Probabilidade em espacos metricos poloneses

por
Roberto Imbuzeiro M. F. de Oliveira
IMPA
i

Indice
1 Um curso relampago de analise em espacos metricos poloneses 1
1.1 Espacos metricos poloneses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Topologia: abertos e fechados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Topologia: compactos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.4 Metricas equivalentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Medidas sobre espacos poloneses: conceitos basicos 5
2.1 Convergencia fraca e suas caracterizacoes . . . . . . . . . . . . . . . . . . . . . 5
2.2 Conjuntos pequenos de funcoes que determinam a convergencia fraca . . . . 6
2.3 Compactos quase exaurem qualquer medida . . . . . . . . . . . . . . . . . . . . 7
2.4 Teorema de Prohorov na direcao facil . . . . . . . . . . . . . . . . . . . . . . . . 8
3 Medidas sobre seq uencias e particoes 9
3.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.2 Distribuicoes sobre N
N
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.3 Pesos, particoes e medidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.4 Comparando duas medidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4 O teorema de Prohorov e a metrizacao da convergencia fraca 15
4.1 A parte difcil do Teorema de Prohorov . . . . . . . . . . . . . . . . . . . . . . 15
4.2 Convergencia fraca e convergencia uniforme . . . . . . . . . . . . . . . . . . . . 17
4.3 Metrizando a convergencia fraca . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4.4 A -algebra de Borel sobre as medidas . . . . . . . . . . . . . . . . . . . . . . . 22
5 A construcao de probabilidades condicionais regulares 23
5.1 Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
5.2 A construcao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
5.3 Esperancas condicionais com relacao a v.a.s . . . . . . . . . . . . . . . . . . . . 25
ii
Captulo 1: Um curso relampago de analise em espacos metricos
poloneses
1.1 Espacos metricos poloneses
Um espaco metrico e um par (M, d) onde M e um conjunto e d : M M [0, +)
satisfaz:
x, y M, x ,= y d(x, y) > 0e x = y d(x, y) = 0;
x, y M, d(y, x) = d(x, y);
x, y, z M, d(x, y) d(x, z) +d(z, y).
Uma seq uencia x
n

nN
M e dita Cauchy se lim
k+
sup
m,nk
d(x
n
, x
m
) = 0. Um espaco
metrico e dito completo se toda seq uencia de Cauchy tem um limite, isto e, algum x M tal
que d(x
n
, x) 0 quando n +.
D M e denso se sup
xM
inf
aD
d(x, a) = 0. Se existe D M denso e enumeravel,
(M, d) e dito separavel.
Finalmente, (M, d) e um espaco polones se e um espaco metrico separavel e completo.
A partir de agora (M, d) sera sempre um espaco metrico polones a nao ser que o contrario
seja dito. B sera a -algebra de Borel sobre M, isto e, a -algebra gerada pelos abertos (ver
a proxima secao). Alem disso, D M sera um subconjunto denso e enumeravel.
1.2 Topologia: abertos e fechados
B(x, r) sera a bola aberta de raio r > 0 ao redor de x M, isto e:
B(x, r) y M : d(x, y) < r.
A bola fechada sera representada por B[x, r]:
B[x, r] y M : d(x, y) r.
Diremos que A M e aberto se para todo x A existe um r > 0 tal que B(x, r) A.
Exerccio 1.1. As seguintes condicoes sao equivalentes.
1. A e aberto;
2. A e a uniao de bolas abertas;
3. A e a uniao de bolas abertas da forma B(a, q), onde a A D e q > 0 e racional.
Prove ainda que a uniao de abertos e aberta e que a intersecao nita de abertos e aberta.
F M e dito fechado se F
c
MF e aberto.
1
Exerccio 1.2. Prove que F M e fechado sse toda seq uencia de Cauchy feita de elementos
de F converge para um elemento de F. Prove ainda que toda intersecao de fechados e fechada
e que a uniao nita de fechados e fechada.
Se S M, o interior S
o
e o fecho S sao dados por:
S
o

AS aberto
A
S
FS fechado
F.
Exerccio 1.3. Prove que S
o
e aberto, S e fechado e (S
o
)
c
= S
c
.
Finalmente, a fronteira de S e dada por S SS
o
.
Exerccio 1.4. s S se existem seq uencias contidas em S e S
c
cujo limite e s.
1.3 Topologia: compactos
Uma colecao de abertos / de M e uma cobertura de C M se C
AA
A. K M e dito
compacto se toda cobertura de K por abertos possui uma subcobertura nita. Escreveremos
K M para representar esta propriedade.
Proposicao 1.1. As seguintes propriedades sao equivalentes.
1. K e compacto;
2. qualquer cobertura de K por bolas abertas possui uma subcobertura nita;
3. K e fechado e para todo > 0 existe N

(K) < + tal que K esta contido na uniao de


N

(K) bolas abertas de raio ;


4. toda seq uencia em K possui subseq uencia convergente para elemento de K.
Antes de provar a propisicao, fazemos uma ressalva importante. O teorema de Heine-Borel
nos diz que se M = R
d
com a metrica usual, entao K R
d
sse e fechado e limitado. Tal
resultado nao vale para espacos metricos poloneses em geral.
Prova: 1 2e trivial: bolas abertas sao abertos e abertos sao unioes de bolas abertas.
2 3: basta provar que K e fechado. Seja x MK. Provaremos que ha um r > 0
tal que B(x, r) K = ; da seguira que K
c
e aberto e K e fechado.
Considere a colecao / de bolas abertas da forma B(k, d(k, x)/2), com k K. Note que
qualquer k K esta em uma delas; logo, por 2, existe uma subcolecao nita B(k
i
, d(k
i
, x)/2),
1 i m dessas bolas que contem K. Por outro lado, note que se r = min
1im
d(k
i
, x)/2,
entao B(x, r) B(k
i
, d(k
i
, x)/2) = para cada i, logo B(x, r)
m
i=1
B(k
i
, d(k
i
, x)/2)
c
K
c
.
Isto prova a armacao desejada.
3 4: seja x
n

nN
uma seq uencia em K. Provaremos que ela tem uma subseq uencia
Cauchy, a qual tem de convergir para algum x K porque K e fechado.
Por hipotese, K pode ser coberto por uma colecao nita de bolas de raio 1. Logo existe
alguma bola B
1
de raio 1 tal que x
n
B
1
para innitos valores de n; seja N
1
o conjunto de
tais valores.
2
Por inducao, podemos construir conjuntos innitos N N
1
N
2
N
3
. . . tais que para
cada j N, existe uma bola B
j
de raio 1/j tal que x
n
B
j
para todo n N
j
e, alem disso,
n
j
minN
j
< n
j+1
. A subseq uencia x
nj

j
satisfaz n
j
+ e x
ni
B
j
para todo i j,
de modo que i, i

j,
d(x
ni
, x
n
i

) max
x,yBj
d(x, y) 2/j.
Segue que x
nj
e Cauchy, como queramos.
4 1: Seja o / uma dada cobertura de K por abertos. Suponha, para chegar a uma
contradicao, que / nao possui uma subcobertura nita.
Escolha para cada x K um raio r
x
> 0 tal que
r
x
=
1
2
supr > 0 : B(x, r
x
) A
x
para algum aberto A
x
/.
Dena indutivamente uma seq uencia x
n

n
emK da seguinte forma: escolha x
1
K arbitrari-
amente. Escolhidos x
1
, . . . , x
m
, ha necessariamente algum x
m+1
K tal que d(x
m+1
, x
j
)
r
xj
para todo 1 j m, ja que, em caso contrario, teramos
K
m
_
i=1
B(x
i
, r
xi
)
m
_
i=1
A
xi
e o lado esquerdo seria uma subcobertura nita de /. Logo podemos escolher este x
m+1

K

m
i=1
B(x
i
, r
xi
) como o elemento seguinte da seq uencia e prosseguir indenidamente.
Por 4, ha uma subseq uencia x
nj
de x
n
convergindo a algum x K. Podemos supor
que os ndices n
1
< n
2
sao tais que:
d(x
n1
, x), d(x, x
n2
) < r
x
/10 d(x
n1
, x
n2
) < r
x
/5.
Mas note que se para todo y M e r > 0 com d(x, y) < r < 2r
x
,
B(y, r d(y, x)) B(x, r) A
x
para algum A
x
/.
Logo r
y
r
x
d(x, y)/2. Segue que
r
xn
1
r
x
r
x
/20 = 19r
x
/20 > r
x
/5 > d(x
n1
, x
n2
),
o que contradiz o fato que d(x
n1
, x
n2
) > r
xn
1
imposto na construcao da seq uencia x
n
. Isto
implica que / contem uma subcobertura nita. 2
Corolario 1.2. K M e compacto se e fechado e para alguma seq uencia
j
0 existe
k
j
N tal que K pode ser coberto por k
j
bolas (abertas ou fechadas) de raio
j
.
Prova: Exerccio. 2
3
1.4 Metricas equivalentes
Sejam (M, d) um espaco metrico. Dizemos que um segundo espac metrico (N, f) e equiv-
alente a (M, d) quando existe uma bijecao : M N e funcoes crescentes

: [0, +)
[0, +) com

(r) > 0 para r > 0, lim


r0

(r) = 0 e
x, y M,

(d(x, y)) f((x), (y))


+
(d(x, y)).

E facil provar que neste caso, um conjunto A M e aberto/fechado/compacto/Borel-


mensuravel sse (A) N e. Segue-se que, do ponto de vista de quase todos os teoremas
aqui, os dois espacos sao equivalentes.
4
Captulo 2: Medidas sobre espacos poloneses: conceitos basicos
2.1 Convergencia fraca e suas caracterizacoes
Seja (M, d) espaco metrico completo e separavel com B = a -algebra de Borel. Chamare-
mos de T(M) o espaco de distribuicoes (ou seja, medidas de probabilidade) sobre (M, B).
Considere
n

nN
T(M, B). Dizemos que
n
converge fracamente a (ou

n
) quando para todo A M aberto
(A) liminf
nN

n
(A).
Proposicao 2.1.
n
e equivalente a qualquer uma das seguintes propriedades.
1. para todo F M fechado, (F) limsup
n

n
(F);
2. para todo S B com (S) = 0,
n
(S) (S);
3. para toda f : M R contnua e limitada,
_
f d
n

_
f d [Faca isso provando e
usando a formula
_
f d =
_
m
0
x M : f(x) t dt,
que vale para toda f : M R mensuravel e nao negativa com valores entre 0 e m.].
4. Para toda f : M [0, 1] Lipschitz,
_
f d
n

_
f d;
Prova:
n
implica que, quando F fechado (logo A = F
c
aberto),
1 (F) = (F
c
) liminf
nN
(1
n
(F)) = 1 limsup
nN

n
(F),
donde segue o item 1. O item 2 segue do 1 porque neste caso o interior S
o
e o fecho S tem a
mesma massa sob :
(SS
o
) = (S) = 0.
Da segue que (S) = (S) = (S
o
) (exerccio). Alem disso
(S) = (S) limsup
n

n
(S) limsup
n

n
(S) (como S S)
e de forma analoga (S) liminf
n

n
(S), logo lim
n

n
(S) existe e iguala (S).
Provamos agora que 2 3. Note que basta provar 3para f : M [0, +) limitada
e nao-negativa. Dena
h
f
: (x, t) M [0, +) I
f(x)t
.
Entao para todo x M,
f(x) =
_
+
0
h
f
(x, t) dt =
_
m
0
h
f
(x, t) dt
5
onde m = sup
x
f(x), ja que h
f
(x, t) = 0 para t > m. Usando Fubini (todas as funcoes
envolvidas sao nao-negativas), vemos que
_
M
f(x) d(x) =
_
M
__
m
0
h
f
(x, t) dt
_
d(x) =
_
m
0
__
M
h
f
(x, t) d(x)
_
dt =
_
m
0
(L
f,t
) dt,
onde L
f,t
x M : f(x) t. Isto prova a formula sugerida em 3.
Prosseguimos notando que L
f,t
= x M : f(x) = t para todo t.

E um exerccio provar
que este conjunto so pode ter medida positiva para enumeraveis valores de t, portanto para
quase todo t [0, m], 2 implica que

n
(L
f,t
) (L
f,t
).
Os valores acima estao sempre entre 0 e 1 e [0, m] e um intervalo limitado. Portanto, o
Teorema da Convergencia dominada mostra que:
_
f d
n
=
_
m
0

n
(L
f,t
) dt
_
m
0
(L
f,t
) dt =
_
f d,
o que prova 3.
3 4e trivial, portanto so nos resta demonstrar que 4 (
n
). Tome A M
aberto. Para cada > 0 dena:
f

(x) min
_
1,
d(x, A
c
)

_
.
Claramente f

(x) = 0 para todo x A


c
e > 0. Por outro lado, para x A, d(x, A
c
) > 0,
posto que A e aberto, portanto f

(x) 1 quando 0. Deduzimos disto que f

I
A
quando 0.
Cada f

e Lipschitz e est a entre 0 e 1 (exerccio). Se 4 vale, temos:


> 0,
_
f

d = lim
n
_
f

d
n
liminf
n
_
I
A
d
n
= liminf
n

n
(A),
ja que f

I
A
como visto acima. Se agora deixamos que 0, f

I
A
,
_
f

d (A) e
vemos que:
(A) liminf
n

n
(A).
Como A M e um aberto arbitrario,
n
. 2
2.2 Conjuntos pequenos de funcoes que determinam a convergencia fraca
Sera freq uentemente conveniente ter de checar a covergencia fraca recorrendo apenas a um
conjunto enumeravel de abertos A M ou de funcoes contnuas bem comportadas f : M R.
Os exerccios a seguir dao conta disto.
Exerccio 2.1. Seja D M denso e enumeravel. Suponha que para toda escolha de q
1
, q
2
, . . . , q
k
racionais positivos e a
1
, a
2
, . . . , a
k
D tem-se

k
j=1
B(a
j
, q
j
)
_
liminf
n

n
_

k
j=1
B(a
j
, q
j
)
_
.
6
Mostre que
n
neste caso.
[Dica: A e o limite crescente de conjuntos do tipo
k
j=1
B(a
j
, q
j
). Mostre que para todo k
(
k
j=1
B(a
j
, q
j
)) liminf
n
(
k
j=1
B(a
j
, q
j
)) liminf
n

n
(A)
e faca k +.]
Exerccio 2.2. Para q > 0 racional e B =
k
j=1
B(a
j
, q
j
) como no exerccio anterior, dena
f
B,q
(x) min
_
1,
d(x, B
c
)
q
_
.
Seja H o conjunto de todas as funcoes desta forma. Demonstre que elas todas tomam valores
entre 0 e 1 e sao Lipschitz. Prove que
n
se e somente se
_
f d
n

_
f d para toda
f H. [Dica: repita os passos da prova da ultima parte da Proposicao 2.1.]
2.3 Compactos quase exaurem qualquer medida
Ja foi dito acima que nem todo fechado limitado em (M, d) e compacto. Uma conseq uencia
disso e que nem sempre havera uma seq uencia de compactos K
n
M. No entanto, o
resultado a seguir mostra que algo deste tipo vale aproximadamente do ponto de vista de
qualquer medida de probabilidade.
Proposicao 2.2. Seja T(M) distribicao. Entao para todo > 0 existe K

M tal que
(K

) 1 .
Prova: Seja D = a
i

+
i=1
um subconjunto enumeravel e denso de M. Para cada r
j
= 2
j
(j N), sabemos que
M =
iN
B[a
i
, r
j
] lim
k
(
k
i=1
B[a
i
, r
j
]) = (
iN
B[a
i
, r
j
]) = 1.
Logo para todo > 0 e j N existe k
j
= k
j,
tal que
(
kj
i=1
B[a
i
, r
j
]) 1

2
j
.
Tome entao
(2.1) K

j=1
_

kj
i=1
B[a
i
, r
j
]
_
.
Temos
(K
c

) =
_
_
_
+
_
j=1
_

kj
i=1
B[a
i
, r
j
]
_
c
_
_
_

j=1
(1
_

kj
i=1
B[a
i
, r
j
]
_
)

j=1

2
j
= .
7
Para terminar a prova, basta mostrar que K

e mesmo compacto. Para isto usaremos o


Corolario 1.2: de fato, K

e a intersecao de conjuntos fechados, logo e fechado. Alem disso,


r
j
0 e para cada j
K


kj
i=1
B[a
i
, r
j
] N
j
(K

) k
j
< +.
Isto encerra a prova. 2
2.4 Teorema de Prohorov na direcao facil
Um dos resultados mais importantes provados nestas notas e o teorema que relaciona as
seguintes denicoes.
Denicao 2.3. Um conjunto ( T(M) e dito relativamente compacto se cada seq uencia
em ( possui uma subseq uencia fracamente convergente a um elemento de T(M).
Denicao 2.4. Um conjunto ( T(M) e dito justo (tight) se para todo > 0 existe um
compacto K

M com
(, (K

) 1 .
Teorema 2.5 (Prohorov). ( T(M) e relativamente compacto se e somente se e justo.
A prova da parte se requer alguns resultados ainda nao provados, mas a parte somente
se e relativamente simples.
Prova: [da parte somente se] A prova e semelhante `a de Proposicao 2.2. Recorde a notacao
utilizada naquela prova e xe um > 0. Mostraremos em primeiro lugar que para todo j N
existe um k
j
N tal que para todo (

kj
i=1
B[a
i
, r
j
]
_
1

2
j
.
Suponha, para chegar a uma contradicao, que isto nao e o caso. Entao para cada k N existe

k
( tal que
k
(
k
i=1
B[a
i
, r
j
]) < 1 /2
j
. Como ( e relativamente compacto, vemos que
para alguma subseq uencia k
n

n

kn
. Mas entao para todo m N,
(
km
i=1
B(a
i
, r
j
)) liminf
n

kn
(
km
i=1
B(a
i
, r
j
)),
e como k
n
k
m
para todo n sucientemente grande,
(
km
i=1
B(a
i
, r
j
)) liminf
n

kn
(
kn
i=1
B(a
i
, r
j
)) < 1

2
j
.
Tomando m + obtemos uma contradicao, o que implica que
j N, k
j
N (
_

kj
i=1
B[a
i
, r
j
]
_
1

2
j
.
Para terminar, dena K

como em (2.1), repita a demonstracao de Proposicao 2.2 a partir


daquele ponto e deduza que K

e compacto e tem a medida desejada. 2


8
Captulo 3: Medidas sobre seq uencias e particoes
3.1 Objetivos
Um problema com o qual nos depararemos na prova do Teorema de Prohorov e o seguinte:
suponha que temos uma famlia de distribuicoes que suspeitamos de convergir fracamente.
Para conrmar esta suspeita, temos que ter um candidato a limite e mostrar que ele serve.
Isto requer a construcao de distribuicoes com certas propriedades desejadas e maneiras de
medir a distancia entre distribuicoes.
Cumprir estas exigencias e o objetivo deste captulo. Provaremos em primeiro lugar que
a construcao de medidas sobre N
N
e relativamente simples. Da mostraremos que toda me-
dida em um espaco polones pode ser recuperada das massas dadas a conjuntos em particoes
sucessivamente mais nas. Mostraremos, por outro lado, que qualquer atribuicao consis-
tente de massas corresponde a uma unica medida de probabilidade.

E neste ultimo passo
que o resultado sobre medidas em N
N
sera usado.
3.2 Distribuicoes sobre N
N
Atribua a N a -algebra de todas as partes de N. O espaco de probabilidade que consider-
aremos aqui sera N
N
com a -algebra produto. Cada elemento f N pode ser pensado como
uma funcao f : n N f(n) N e e esta notacao que utilizaremos a seguir.
Seja N

o conjunto de todas as seq uencias nitas de naturais, isto e todos os vetores


a = (a
1
, . . . , a
n
) N
n
para algum n N. Para cada a N

, dena o conjunto de todas as


seq uencias innitas (ou funcoes) com prexo a:
Pref(a) f N
N
: 1 i n, f(i) = a
i
.
Estes cunjuntos sao claramente mensuraveis. Se e uma medida de probabilidade sobre N
N
,
e um exerccio demontrar que
p(a) (Pref(a)) (a N

)
satisfaz as seguintes propriedades:
1. p e uma funcao bem denida de N

em [0, 1];
2.

kN
p(k) = 1; e
3. para todo (a
1
, . . . , a
n
) N

,

kN
p(a
1
, a
2
, . . . , a
n
, k) = p(a
1
, . . . , a
n
).
Nosso principal objetivo nesta secao e provar uma especie de recproca a este resultado.
Teorema 3.1. Seja p : N

[0, 1] uma funcao satisfazendo as tres propriedades acima.


Entao existe uma unica medida sobre N
N
tal que:
a N

, (Pref(a)) = p(a).
9
Prova: Provaremos apenas a existencia (a unicidade e exerccio). Para tal, construiremos um
espaco de probabilidade (, T, P) e uma seq uencia I
n
: N (n N) tal que
a N

, P((I
n
)
nN
Pref(a)) = P(1 i n, I
i
= a
i
) = p(a
1
, . . . , a
n
).
Note que isto encerrara a prova, ja que F = (I
n
)
nN
sera v.a. (isto e, mensuravel com relacao
`a -algebra produto em N
N
) e = P
F
sera a distribuicao desejada.
Partimos de algum (, T, P) onde se possa denir uma seq uencia U
n

n
de v.a.s iid com
distribuicao uniforme sobre [0, 1). Por exemplo, tome
0
= [0, 1), T
0
a -algebra de Borel
sobre [0, 1) e P
0
a medida de Lebesgue sobre (
0
, T
0
); construa (, T, P) como o produto de
um n umero enumeravel de copias de (
0
, T
0
, P
0
); e dena U
n
atraves de projecoes nos fatores
do produto cartesiano.
Dena agora uma seq uencia de ndices I
n

n
da seguinte forma indutiva: para n = 1,
tomamos
I
1
= j tal que

ij1
p(i) U
1
<

ij
p(i).
Note que, como

i
p(i) = 1, I
1
esta bem denida e tem distribuicao dada por
P(I
1
= j) = p(j).
Note ainda que p(I
1
) > 0 sempre, pois I
1
= j implica que
U
1

_
_

ij1
p(i),

ij
p(i)
_
_
portanto o intervalo tem comprimento p(j) > 0. Finalmente, note que I
1
e funcao de U
1
Suponha indutivamente que ja denimos I
1
, . . . , I
n
, que sabemos que
P(I
1
= j
1
, . . . , I
n
= j
n
) = p(j
1
, . . . , j
n
),
que o vetor (I
1
, . . . , I
n
) e funcao de U
1
, . . . , U
n
e ainda p(I
1
, . . . , I
n
) > 0 sempre. Denimos
agora I
n+1
da seguinte forma:
I
n+1
= j
n+1
tal que

ijn+11
p(I
1
, . . . , I
n
, i)
p(I
1
, . . . , I
n
)
U
n+1
<

ijn+1
p(I
1
, . . . , I
n
, i)
p(I
1
, . . . , I
n
)
.
A condicao de consistencia implica que

i
p(i
1
, . . . , i
n
, i) = p(i
1
, . . . , i
n
)

i
p(i
1
, . . . , i
n
, i)
p(i
1
, . . . , i
n
)
= 1
sempre que p(i
1
, . . . , i
n
) > 0, o que e o caso na formula acima. Alem disso, ve-se facilmente
que
P(I
n+1
= j
n+1
[ I
1
= j
1
, . . . , I
n
= j
n
) =
p(j
1
, . . . , j
n
, j
n+1
)
p(j
1
, . . . , j
n
)
,
ja que U
n+1
e independente de U
1
, . . . , U
n
e portanto tambem de I
1
, . . . , I
n
. Note ainda que
p(I
1
, . . . , I
n
, I
n+1
)
p(I
1
, . . . , I
n
)
> 0,
10
o que se pode provar de forma analoga ao caso n = 1. Da deduz-se usando a hipotese indutiva
que:
P(I
1
= j
1
, . . . , I
n
= j
n
, I
n+1
= j
n+1
) = p(j
1
, . . . , j
n
, j
n+1
)
e p(I
1
, . . . , I
n
, I
n+1
) > 0 sempre.
Finalmente, note que I
n+1
e funcao de I
1
, . . . , I
n
e U
n+1
, logo (usando a hipotese indutiva)
(I
1
, . . . , I
n+1
) e funcao de U
1
, . . . , U
n+1
. Isto mostra que as propriedades da inducao podem
ser preservadas e completa a prova. 2
3.3 Pesos, particoes e medidas
Nesta secao discutiremos a relacao entre medidas em espacos poloneses e a construcao
acima. Para isto, precisamos falar de particoes. Uma particao boa de (M, d) e uma colecao
nita ou enumeravel de subconjuntos disjuntos de M cuja uniao e M. Suporemos, por con-
veniencia, que alguns dos conjuntos na particao podem ser vazios, de modo que todas as
particoes que discutiremos terao cardinalidade enumeravel (isto e, igual a de N). O diametro
de uma particao o e o supremo sobre A o e x, y A de d(x, y).
O seguinte resultado e imediato.
Proposicao 3.2. Para todo > 0 existe uma particao boa o

de M com diametro .
Prova: Tome S
1
B(a
1
, /2) e, para j 2, S
j
B(a
j
, /2)
j1
i=1
B
i
. Claramente
+
j=1
S
j
=
M e os conjuntos sao disjuntos e com diametro . 2
Para o restante do captulo, necessitaremos de uma seq uencia de particoes boas o
j
com
diamero
j
0. Suponha que o
j
= S
i,j

+
i=1
para cada j N. Entao podemos associar a
cada seq uecia nita de inteiros a = (a
1
, . . . , a
n
) o conjunto:
A(a) =
n

j=1
S
aj,j
.
Note que cada um destes conjuntos tem diametro
n
, ja que esta e uma cota para o diametro
de S
an,n
. Note ainda que, para cada n N,
(
n
A(a) : a N
n

e uma particao boa de M.


Suponha agora que temos uma funcao-peso p : N

[0, 1] satisfazendo as propriedades


da secao anterior e um requerimento a mais:
a N

, A(a) = p(a) = 0.
Tal p e dita compatvel com a seq uencia o
j

jN
.
Exerccio 3.1. Suponha que T(M) e dena p = p

pela formula:
p

(a) A(a), a N

.
Mostre que p

e compatvel com o
j

jN
.
11
Escolha por m, um elemento w(a) M para cada a N

, com w(a) A(a) sempre que


este conjunto for nao-vazio. Dena para cada n N uma medida de probabilidade:

aN
n
p(a)
w(a)
.
Lema 3.3. As medidas
n
convergem fracamente a um elemento

T(M), sendo que,


para toda f : M R que e limitada e Lipschitz com constante L,
n N,

_
M
f d
n

_
M
f d

L
n
.
Alem disso, se os pesos p() sao da forma p

para alguma T(M) (cf. Exerccio 3.1),


entao

= .
Prova: Comecamos por provar a segunda armacao supondo a veracidade da primeira. Neste
caso, provar que

= e equivalente a mostrar que


n
. Faremos isto mostrando que,
para toda f : M R Lispschiz com constante L e limitada,
(3.1) n N,

_
M
f d
n

_
M
f d

L
n
,
o que e suciente pela Proposicao 2.1. Note ainda que, ao provar (3.1), podemos supor sem
perda de generalidade que L = 1.
Suponha, entao, que p = p

para alguma T(M). Fixo n N, dena uma funcao


q
n
: x M w(a) onde a N
n
e tal que x A(a).
Como foi observado acima, (
n
= A(a)
aN
n e uma particao de M, logo q
n
e bem denida.
Alem disso, como q
n
(x) = w(a) A(a) para todo x, e cada A(a) tem diametro
n
, temos
d(q
n
(x), x)
n
.
Seja X uma v.a. com valores em M com distribuicao . Note que X
n
q
n
(X) tem
distribuicao dada por
n
, a que
P
Xn
=

aN
n
P(X A(a))
w(a)
=

aN
n
(A(a))
w(a)
=

aN
n
p(a)
w(a)
.
Logo, se f e como acima,

_
M
f d
n

_
M
f d

= [E[f(X
n
) f(X)] [ E[[f(X
n
) f(X)[] .
Como fe 1-Lipschitz, [f(X) f(X
n
)[ d(X, X
n
) = d(X, q
n
(X))
n
e esta cota prova (3.1).
Agora provaremos a primeira parte. O principal passo para tal sera construir um espaco
de probabilidade (, T, P) e uma seq uencia X
n

n
de v.a.s, cada uma com distribuicao
n
e
satisfazendo d(X
n
, X
m
)
n
para todo n m.
Aqui entra o Teorema 3.1. Tomaremos (, T) = N
N
com a -algebra produto e
X
n
(f) = w(f(1), . . . , f(n)), f N
N
, n N.
12
Para obter as distribuicoes corretas, P sera a ( unica) medida de probabilidade sobre (, T)
tal que:
a N, P(Pref(a)) = p(a).
Isto imediatamente implica que
P
Xn
=

aN
n
p(a)
w(a)
,
como desejado.
Note agora que, para n m, X
n
(f) = w(f(1), . . . , f(n)) A(f(1), . . . , f(n)) e analoga-
mente X
m
(f) A(f(1), . . . , f(m)). Como o segundo conjunto esta contido no primeiro e este
primeiro tem diametro
n
, temos que d(X
n
, X
m
)
n
sempre que n m.
Para terminar a prova, notamos que, como
n
0 e M e completo, a v.a. limite X

=
lim
n+
X
n
e bem denida e d(X, X
n
)
n
sempre. Logo, se tomamos

= P
X
, temos

_
M
f d
n

_
M
f d

= [E[f(X
n
) f(X

)] [ E[[f(X
n
) f(X

)[] .
Seguindo os passos da parte anterior, prova-se que o lado esquerdo e L
n
. Em particular,

. 2
Observacao 3.4.

E importante observar que nem sempre p(a) =

(A(a)) para todo a


N

. De fato, podem haver diferentes escolhas de pesos p que correspondem a uma mesma
distribuicao, mesmo em casos simples como

=
a
para algum a M.
3.4 Comparando duas medidas
O ultimo resultado deste captulo mostra como podemos estimar a distanciaentre duas
medidas diferentes atraves de pesos que as geram. O resultado abaixo nos sera extremamente
importante na demonstracao do Teorema de Prohorov.
Lema 3.5. Com as denicoes anteriores, suponha duas funcoes-peso p
(1)
, p
(2)
: N

[0, 1]
consistentes com o
j

jN
sao dadas. Dena
(1)
=
(1)

,
(2)
=
(2)

a partir dessas funcoes


como na secao anterior. Entao, para toda f : M [0, 1] que e Lipschitz com constante L e
todo n N,

_
M
f d
(1)

_
M
f d
(2)

2 L
n
+

aN
n
[p
(1)
(a) p
(2)
(a)[.
Prova: Considere as medidas

(b)
n

aN
n
p
(b)
(a)
w(a)
, b 1, 2.
como na secao anterior. Pelo Lema 3.3,

_
M
f d
(b)

_
M
f d
(b)
n

L
n
13
para b = 1, 2. Alem disto,

_
M
f d
(1)
n

_
M
f d
(2)
n

aN
n
p
(1)
(a)f(w(a))

aN
n
p
(2)
(a)f(w(a))

aN
n
[p
(1)
(a) p
(2)
(a)[[f(w(a))[
(0 f 1 sempre)

aN
n
[p
(1)
(a) p
(2)
(a)[.
O lema segue trivialmente destas armacoes. 2
14
Captulo 4: O teorema de Prohorov e a metrizacao da convergencia
fraca
4.1 A parte difcil do Teorema de Prohorov
A construcao da secao anterior sera usada agora para provar o Teorema de Prohorov, do
qual decorrera a metrizacao da convergencia fraca.
Recorde o enunciado da Secao 2.4. Provaremos agora a direcao sedaquele resultado, que
e equivalente ao seguinte teorema.
Teorema 4.1. Seja
(t)

t
T(M) uma seq uencia justa de distribuicoes. Entao ela contem
uma subseq uencia fracamente convergente a uma T(M).
Prova: Os principais ingredientes da prova ja foram apresentados. Falta agora junta-los da
forma adequada.
Em primeiro lugar, sejam
j
0 (j N). Construiremos para cada j uma particao como
na Proposicao 3.2:
o
j
S
i,j
: i N.
Para deni-la, considere uma enumeracao D = a
i

iN
de D M denso e dena:
S
1,j
= B(a
1
,
j
/2),
S
i,j
= B(a
i
,
j
/2)
ki1
B(a
k
,
j
/2), i 2.
Note que
(4.1)
im
S
i,j
=
im
B(a
i
,
j
/2)
e quando m +, a partic ao cobre todo o espaco.
Cada o
j
e claramente uma particao boa nos termos da Secao 3.3. Alem disso, se K M
e compacto, para cada j N B(a
i
,
j
/2)
iN
e uma cobertura de K (de fato, de M) por
abertos, logo existe m(j, K) N com
K
im(j,K)
B(a
i
,
j
/2) =
im(j,K)
S
i,j
.
Dena A(a) =
n
j=1
S
aj,j
, a = (a
1
, . . . , a
n
) N

a partir de o
j

jN
como na Secao 3.3.
A seguinte armacao e um exerccio.
Exerccio 4.1. Para cada n N e > 0 existe um m(, n) N tal que para toda
(t)
como
acima:

aN
n
\[m(,n)]
n

(k)
(A(a)) ,
com [m(, n)] = 1, 2, 3, . . . , m(, n). [Dica: tome K M tal que
(k)
(K) 1 para
todo k N. Note entao que A(a) : a N
n
e derivada de uma cobertura de K por abertos.]
15
Para cada t N, dena uma funcao peso p
(t)
(a) =
(t)
(A(a)) como no captulo anterior.
Usando o truque diagonal e passando a uma subseq uencia se necessario, podemos supor que
o limite
p(a) lim
t+
p
(t)
(a)
existe para cada a N

(exerccio).
A armacao a seguir e crucial.
Armacao 4.2. p : N [0, 1] e consistente com o
j

jN
e para todo n N,
lim
t+

aN
n
[p
(t)
(a) p(a)[ = 0.
Antes de prova-la, mostramos como ela encerra esta demonstracao. Pelo Lema 3.3, existe
uma medida =

correspondendo aos pesos p : N

[0, 1] da maneira indicada no captulo


anterior. Do mesmo modo, para todo t N a medida
(t)
pode ser obtida a partir dos pesos
p
(t)
. Pelo Lema 3.5, para todo t N e toda f : M [0, 1] Lipschitz com constante L > 0 e
todo n N

_
f d
(t)

_
f d

2L
n
+

aN
n
[p
(t)
(a) p(a)[.
A Armacao implica que o segundo termo acima vai a zero quando t +, para qualquer
n xo. Segue que
limsup
tN
[
_
f d
(t)

_
f d[ 2L
n
0 (n +).
Portanto,
_
f d
(t)

_
f d para toda f : M [0, 1] Lipschitz. Isto implica que
(t)

quando t +, como desejado.
Para demonstrar a armacao, provaremos em primeiro lugar que
(4.2)

aN
n
[p
(t)
(a) p
(s)
(a)[ 0 quando s + e t +.
Para tal, escolhemos em primeiro lugar > 0 e n N. Entao tomamos m(, n) N como no
exerccio acima. Vemos que, por um lado, para todos t, s N

aN
n
\[m(,n)]
n
[p
(t)
(a) p
(s)
(a)[

aN
n
\[m(,n)]
n
(p
(t)
(a) +p
(s)
(a)) 2,
e por outro lado, quando t, s +
limsup
t,s+

aN
n
[p
(t)
(a) p
(s)
(a)[ 2 + limsup
t,s+

a[m(,n)]
n
[p
(t)
(a) p
(s)
(a)[ = 2,
ja que cada termo em

a[m(,n)]
[p
(t)
(a) p
(s)
(a)[ vai a 0 e temos um n umero xo de termos.
Como > 0 e arbitrario, a ultima equacao implica (4.2).
16
Usamos agora o lema de Fatou em conjuncao com (4.2) para deduzir que:
limsup
t+

aN
n
[p
(t)
(a) p(a)[ = limsup
t+

aN
n
lim
s+
[p
(t)
(a) p
(s)
(a)[
limsup
t+
liminf
s+

aN
n
[p
(t)
(a) p
(s)
(a)[
= 0
Isto prova a segunda parte da armacao.
A primeira armacao segue disto da seguinte forma: primeiro note que p(a) = 0 sempre
que A(a) = 0, posto que neste caso p
(t)
(a) = 0 para todo t. Seja agora a N

dado;
provaremos que p(a) =

i
p(ai). Para isso note que para todo t N,
p(a)

i
p(ai) = (p(a) p
(t)
(a))

i
(p(ai) p
(t)
(ai)),
ja que p
(t)
(a) =

i
p
(t)
(ai). Agora tome t + e note que (p(a) p
(t)
(a)) 0 e ainda
[

i
(p(ai) p
(t)
(ai))[

i
[p(ai) p
(t)
(ai)[

bN
n+1
[p(b) p
(t)
(b)[ 0
pela segunda parte da armacao. Conclumos que p(a)

i
p(ai) = 0, como desejado. Para
terminar, basta provar a propriedade restante de funcoes peso consistentes (1 =

i
p(i)), mas
isto ca como exerccio baseado na ultima conta acima. 2
4.2 Convergencia fraca e convergencia uniforme
A denicao de convergencia fraca nao garante em princpio que haja convergencia uniforme
das funcoes envolvidas. No entanto, veremos agora que o seguinte resultado vale.
Proposicao 4.3. Suponha que
n

nN
T(M) e dado. Entao
n
implica que
para todo L > 0
sup
_

_
f d
n

_
f d

: f : M [0, 1]L-Lipschitz
_
0.
Prova: Suponha que a Proposicao nao vale. Entao existem > 0,
n

nN
com
n

e f
n
: M [0, 1] L-Lipschitz com
n N,

_
f
n
d
n

_
f
n
d

> .

nN
e relativamente compacto (exerccio), logo (por Prohorov) justo. Tome,
entao, um compacto K M tal que (K) > 1 /4. Veja que

_
K
f
n
d
n

_
K
f
n
d

>
_
K
c
f
n
d
_
K
c
f
n
d
n
/2
ja que 0 f
n
1 e
n
(K
c
) /4 para cada n.
17
Considere as funcoes f
n
[
K
: K [0, 1]. Elas sao limitadas e equicontnuas, posto que
todas sao L-Lipschitz. Pelo Teorema de Ascoli-Arzel`a, podemos supor (passando a uma
subseq uencia se necessario) que
lim
n
sup
xK
[f
n
(x) f(x)[ = 0
para alguma f : K [0, 1] contnua. Como

_
K
f
n
d
n

_
K
f d
n

sup
xK
[f
n
(x) f(x)[ 0,
e similarmente para , temos que
liminf
n

_
K
f d
n

_
K
f d

> 0.
Logo
_
K
f d
n
,
_
K
f d. Se f estivesse denida sobre todo K, tal fato contradiria
n
.
No caso presente, ainda e verdade que f : K [0, 1] e contnua e
L
f,t
= x K : f(x) t
e fechado em K, logo tambem em M K. Como 0 f 1, sabemos que
_
K
f d =
_
1
0
(L
f,t
) dt
e
_
K
f d
n
=
_
1
0

n
(L
f,t
) dt.
Usando o mesmo raciocnio da Proposicao 2.1, vemos que de fato

n
(L
f,t
) (L
f,t
)
para quase todo t [0, 1], o que implica
_
K
f d
n

_
K
f d. Da contradicao segue o teorema
desejado. 2
4.3 Metrizando a convergencia fraca
Tendo o Teorema de Prohorov pronto, podemos tambem mostrar que ha uma metrica
d
P
sobre T(M) tal que
n
se e somente se d
P
(
n
, ) 0. Alem disso, resultara que
(T(M), d
P
) e um espaco metrico polones onde as medidas discretas sao densas (Teorema 4.6).
A metrica d
P
, chamada de metrica de Prohorov, e denida pela seguinte expressao:
d
P
(, ) = inf > 0 : F M fechado, (F) (F

) + e (F) (F

) +,
onde
F

= x M : d(x, F) < .
Exerccio 4.2. Prove que d
P
e de fato uma metrica sobre T(M).
18
Exerccio 4.3. Sejam p
1
, . . . , p
n
[0, 1] com

n
i=1
p
i
= 1 e a
1
, b
1
, . . . , a
n
, b
n
M. Construa
as medidas:
=
n

i=1
p
i

ai
e
=
n

i=1
p
i

bi
.
Mostre que
d(, ) max
1in
d(a
i
, b
i
).
Lema 4.4. Suponha que
n

nN
T(M). Entao
n
se e somente se d(
n
, )
0.
Prova: Se: suponha que d
P
(
n
, ) 0. Mostraremos que para toda f : M [0, 1]
Lipschitz (com constante L > 0) e limitada,
_
f d
n

_
f d. Para tal, dena L
f,t
= x
M : f(x) t. Como L
f,t
e fechado, vemos que para todo n N e todo > d
P
(
n
, ),
_
f d =
_
1
0
(L
f,t
) dt
_
1
0

n
(L

f,t
) dt +.
Note agora que
y L

f,t
x com f(x) t e d(x, y) < .
A hipotese de que f e Lipshitz implica que, se d(x, y) < , f(y) f(x)L. Disto deduzimos
que
L

f,t
L
f,tL
.
Portanto
_
1
0
(L

f,t
) dt +
_
1
0

n
(L
f,tL
) dt.
Note que
n
(L
f,tL
) = 1 se t L, logo podemos cotar
_
1
0

n
(L
f,tL
) dt
_
1
L

n
(L
f,tL
) dt +L
_
1
0

n
(L
f,s
) ds,
o que implica:
_
1
0

n
(L
f,t
) dt =
_
f d
n
+ (1 +L).
Fazendo d
P
(
n
, ), vemos que
_
f d
_
f d
n
+ (1 +L)d
P
(
n
, ).
Um raciocnio analogo nos mostra que, de fato,

_
f d
_
f d
n

(1 +L)d
P
(
n
, ).
19
Da segue a armacao desejada.
Somente se: Supondo que
n
, mostraremos que para todo > 0, liminf
n
d
P
(
n
, )
. De fato,dena:
f
,F
(x) min
_
0, 1
d(x, F)

_
para > 0 e F M. Para > 0 xo, todas as funcoes desta forma sao 1/-Lipschitz
(exerccio), logo pela Proposicao 4.3:

n
sup
FM

_
f
,F
d
n

_
f
,F
d

0
Note entao que se F M e fechado e =
I
F
f
,F
I
F
,
logo
(F)
n
(F

)
_
f
,F
d
_
f
,F
d
n

n
e similarmente

n
(F) (F

)
n
.
Para todo > 0 existe um n
0
tal que
n
para todo n n
0
. Para tais n, temos
d
P
(
n
, ) , como desejado. 2
Lema 4.5. A dupla (T(M), d
P
) e um espaco metrico completo.
Prova: Usaremos o seguinte exerccio.
Exerccio 4.4. Um espaco metrico (N, ) e completo se e somente se toda seq uencia que e
Cauchy segundo possui subseq uencia que converge a algum x N (tambem segundo ).
Nosso objetivo sera provar que toda seq uencia Cauchy em (T(M), d
P
) tem uma sub-
seq uencia convergente segundo d
P
. Pelo lema anterior, isto equivale a mostrar que toda
seq uencia de Cauchy segundo d
P
tem uma subseq uencia que converge fracamente. Faremos
isto mostrando que se
n

nN
e Cauchy, seus elementos formam um conjunto justo, o que
implica o resultado nal pelo Teorema de Prohorov.
Seja portanto
n

nN
Cauchy. Recorde que (M, d) possui um subconjunto denso D =
a
i

+
i=1
M. Provaremos que, se > 0 e xo,
(4.3) k
j
Nn N,
n
(
kj
i=1
B[a
j
, 2
j
]) 1

2
j
.

E um exerccio mostrar em detalhes que isto implica que ha um compacto K

M com

n
(K

) 1 para todo n N [Dica: siga os passos da prova da Proposicao 2.2.].


Fixe j N e
j
= /2
j
. Como D e denso,
n N,
n
(
k
i=1
B[a
i
, 2
j1
])
n
(
+
i=1
B[a
i
, 2
j1
]) =
n
(M) = 1,
logo para cada n N ha um k
n,j
tal que

n
(
kn,j
i=1
B[a
i
, 2
j1
]) 1

j
2
.
20
Como lim
n,m
d
P
(
n
,
m
) = 0, ha algum n
0
N tal que
n n
0
, d(
n0
,
n
) = min
_

j
2
,
1
2
j+1
_
.
Fixe este n
0
, tome k
j
= max
nn0
k
n,j
N e dena:
F
+
=
kj
i=1
B[a
i
, 2
j
].
Note que F
+

kn,j
i=1
B[a
i
, 2
j1
] para cada n n
0
, logo
n n
0
,
n
(F
+
)
n
(
kn,j
i=1
B(a
i
, 2
j1
)) 1

j
2
.
Para n > n
0
, temos
n0
(
kn
0
,j
i=1
B[a
i
, 2
j1
])
n
(F
+
) +, por causa de d
P
(
n
,
n0
) e da
propriedade
F
+
(
kn
0
,j
i=1
B[a
i
, 2
j1
])

obtida por construcao. Isto implica que


n > n
0
,
n
(F
+
)
n0
(
kn,j
i=1
B(a
i
, 2
j1
)) 1
j
.
Deduz-se, portanto, que (4.3) vale. 2
Teorema 4.6. A dupla (T(M), d
P
) e um espaco metrico polones onde as disribuicoes disc-
retas sobre subconjuntos nitos de M sao densas. Alem disso, convergencia segundo d
P
e
equivalente `a convergencia fraca de disribuicoes.
Prova: So falta provar que (T(M), d
P
) e separavel e que as medidas discretas sao densas.
Faremos isto de maneira unicada. Seja D M denso e enumeravel. Considere o conjunto:
T
_

aS
q
a

a
: S M nito e nao vazio, q
a
Q
+
,

aS
q
a
= 1.
_
.
Note que T e enumeravel. Mostraremos que T e denso em T(M). Faremos isso em etapas.
Primeiro notamos que as medidas com suporte enumeravel
/

iN
p(i)
wi
: i N, w
i
M, p(i) 0; e ainda

iN
p(i) = 1
sao densas em T(M). Isto segue do Lema 3.3.
Agora mostraremos que
B

in
p(i)
wi
: n N, i [n], w
i
M, p(i) 0; e ainda

i[n]
p(i) = 1
tambem e denso. De fato, isto segue do seguinte exerccio.
Exerccio 4.5. Se =

iN
p(i)
wi
/ =

j[n]
q(i)
wi
B,
d
P
(, )

i[n]
[p(i) q(i)[ +

in+1
p(i).
Prove que isto implica que todo elemento de / pode ser aproximado por um elemento de B.
21
Usando o mesmo exerccio, podemos notar que um elemento de B pode ser substitudo por
outro arbitrariamente proximo com p(i) Q
+
racionais (basta arredondaros pesos). Por
m, chegamos a T substituindo os pontos w
i
por elementos de D, o que, pelo Exerccio 4.3,
resulta numa aproximacao arbitrariamente boa. Isto encerra a prova. 2
4.4 A -algebra de Borel sobre as medidas
Como (T(M), d
P
) e polones, ele possui uma -algebra de Borel B
P
gerada pelos abertos.
O objetivo desta secao e dar uma caracerizacao de B
P
.
Para A M mensuravel, dena M
A
: T(M) [0, 1] por
M
A
() (A) ( T(M)).
Para f : M R mensuravel, dena I
f
: T(M) [0, 1] por
I
f
()
_
f d(A) ( T(M)).
Enumeremos alguns fatos que seguem diretamente da equivalencia entre d
P
e convergencia
fraca:
Proposicao 4.7. Para f contnua e limitada, I
f
e aplicacao contnua de (T(M), d
P
) em R.
Alem disso, se A M e aberto ou fechado, M
A
e B
P
-mensuravel.
Prova: A primeira armacao decorre de uma das caracterizacoes da convergencia fraca. Se
A M e aberto, e
f
n
(x) min1, nd(x, A
c
) ,
ve-se que I
fn
M
A
pontualmente (isto e apenas convergencia monotona), logo M
A
e men-
suravel porque e o limite de funcoes contnuas. O resultado para fechados segue por comple-
mentacao. 2
Exerccio 4.6. B
P
e a menor -algebra sobre T(M) tal que M
A
e mensuravel para todo
A M.
22
Captulo 5: A construcao de probabilidades condicionais regulares
5.1 Preliminares
Seja (, T, P) um espaco de probabilidade e ( T uma sub--algebra.

E um fato que
para cada Y L
1
(, T, P) existe um unico elemento E[Y [ (] L
1
(, (, P) tal que para toda
Z : R (-mensuravel e limitada
E[Y Z] = E[E[Y [ (] Z] .
Esta v.a. (-mensuravel E[Y [ (] e chamada a esperanca condicional de Y dada (. Nosso
objetivo sera provar que, no caso em que (, T) = (M, d), E[Y [ (] () =
_
Y dP

, onde
P

T(M) e funcao (-mensuravel de .


Exerccio 5.1. Suponha que para cada x M esta denida uma medida de probabilidade
P
x
sobre (M, B) e que / B e uma sub--algebra. Prove a equivalencia das seguintes
propriedades.
1. para toda f : M R Lipschitz e limitada, I
f
(x)
_
f dP
x
e funcao /-mensuravel de
x e ainda:
se g : M R e /-mens. e limitada,E[fg] = E[I
f
g] ;
2. para todo aberto A M, P
x
(A) e funcao /-mensuravel de x e ainda:
se g : M R e /-mens. e limitada,E[I
A
g] = E[P
x
(A)g] ;
3. a mesma propriedade acima, mas para todo A B mensuravel;
4. para toda Y : M R mensuravel e limitada, I
Y
(x)
_
Y dP
x
e /-mensuravel e ainda:
se g : M R e /-mens. e limitada,E[Y g] = E[I
Y
g] ;
5. para toda Y : M R mensuravel em L
1
,
_
[Y [ dP
x
e nita P-quase-certamente,
I
Y
(x)
_
Y dP
x
e /-mensuravel e ainda:
se g : M R e /-mens. e limitada,E[Y g] = E[I
Y
g] .
Prove tambem que neste caso, Y L
1
E[Y [ /] (x) =
_
Y dP
x
P-quase certamente. Chamamos
P
x
(A) P(A [ /) (x) da probabilidade condicional (regular) de A dada /.
5.2 A construcao
Provaremos o seguinte resultado.
Teorema 5.1. Seja H B uma sub--algebra. Entao existe um mapa levando cada x M
a uma distribuicao P
x
sobre (M, B) tal que para toda f : M R Lipschitz e limitada,
23
1. I
f
(x)
_
f dP
x
e funcao H-mensuravel de x M;
2. I
f
(x) = E[f [ H] (x) -quase certamente, isto e, para toda g : M R H-mensuravel e
limitada,
_
I
f
(x)g(x) dP(x) =
_
f(y)g(y) dP(y).
Note que, pelo primeiro exerccio, segue que P( [ H) (x) = P
x
() e probabilidade condi-
cional regular.
Prova: Precisaremos dos resultados e construcoes do Captulo 3. Em particular, recorde-se
da denicao de A(a) para a N

.
Denimos
p
x
(a) E
_
I
A(a)
[ H

(x).
Exerccio 5.2. Usando as regras da probabilidade condicional, mostre que existe um conjunto
E H de medida 1 tal que para todo x E, p
x
(a) [0, 1],
a
1
, . . . , a
n
N, A(a
1
, . . . , a
n
) = p
x
(a
1
, . . . , a
n
) = 0;
1 =

i
p
x
(i)
e
a
1
, . . . , a
N
,

j
p
x
(a
1
, . . . , a
N
, j) = p
x
(a
1
, . . . , a
N
).
[Dica: cada p
x
() e H-mensuravel, logo os eventos individuais descritos acima estao em M.
Prove que cada um deles tem prob. 1 e que ha um n umero enumeravel deles.]
Vemos assim que, fora de um conjunto de medida numa, a funcao-peso p
x
: N

[0, 1] e
consistente com as particoes envolvidas. Logo se denimos
P
n,x

aN
n
p
x
(a)
w(a)
,
entao existe uma medida P
x
sobre (M, B) tal que P
n,x
P
x
para cada x E. Como cada
mapa x P
n,x
T(M) e claramente H/B
P
-mensuravel, o limite pontual x E P
x
tambem o e; logo
_
f dP
x
e funcao H-mensuravel de x para cada f Lipschitz e limitada.
Notamos agora que (exerccio)
_
f dP
n,x
=
_
f
n
dP
n,x
,
onde
f
n
=

aN
n
I
A(a)
f(w(a)).
Veja que para todo x existe um A(a) tal que x A(a). Se f tem constante de Lipschitz L,
ve-se que como d(x, w(a)) e menor que o diametro de A(a), [f(x) f(w(a))[ L
n
. Donde
[f f
n
[
n
. Mas agora note que, com probabilidade 1 (exerccio),
E[f
n
[ H] (x) =

aN
n
E
_
I
A(a)
[ (

(x)f(w(a)) =

aN
n
p
x
(a)f(w(a)),
24
o que e igual a
_
f
n
dP
n,x
, que e igual a
_
f dP
n,x
e converge para
_
f dP
x
. Por outro lado,as
propriedades de esperanca condicional implicam que, tambem com probabilidade 1,
[E[f [ (] E[f
n
[ H] (x)[ E[[f f
n
[ [ (]
n
0.
Logo com probabilidade 1
E[f [ (] =
_
f dP
x
.
2
5.3 Esperancas condicionais com relacao a v.a.s
Podemos olhar para E[Z [ H] = E[Z [ X] ou P(A [ H) = P(A [ X) no caso em que H =
(X) para alguma v.a. X : M N, onde N e algum outro espaco polones.
Se P e um terceiro espaco polones (com -algebra de Borel |), e um fato que toda
W : M P que e (X)/| mensuravel pode ser escrita como f(X), onde f : N P e
mensuravel. Segue que neste caso, se Z : M R e v.a., existe uma funcao mensuravel
f
Z
(t) E[Z [ X = t] (t N) tal que E[Z [ X] = f
Z
(X). Do mesmo modo, para cada A T
existe um mapa mensuravel g
A
: N T(M) escrito como g
A
(t) = P(A [ X = t) tal que
g
A
(X) = P(A [ X).
25

Você também pode gostar