Você está na página 1de 239

T

DR
AF
Teoria Ergodica
Um Curso Introdutorio

Krerley Oliveira e Marcelo Viana

DR
AF
T

ii

DR
AF

Conte
udo

0 Elementos de Teoria da Medida


0.1 Espacos mensur
aveis . . . . . . . . . . .
0.2 Espacos de medida . . . . . . . . . . . .
0.2.1 Medida de Lebesgue . . . . . . .
0.2.2 Medida produto . . . . . . . . .
0.3 Funco
es mensur
aveis . . . . . . . . . . .
0.4 Integraca
o em espacos de medida . . . .
0.5 Teoremas de convergencia . . . . . . . .
0.6 Derivaca
o de medidas . . . . . . . . . .
0.7 Os espacos Lp () . . . . . . . . . . . . .
0.7.1 Lp () com 1 p < . . . . . .
0.7.2 Produto interno em L2 () . . . .
0.7.3 Funco
es essencialmente limitadas
0.7.4 Convexidade . . . . . . . . . . .
0.8 Medidas em espacos metricos . . . . . .
0.9 Exerccios . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

1
1
3
5
8
9
11
14
14
15
16
16
17
18
18
22

1 Medidas Invariantes e Recorr


encia
1.1 Medidas Invariantes . . . . . . . . . . . .
1.2 Teorema de recorrencia de Poincare . . . .
1.2.1 Vers
ao mensur
avel . . . . . . . . .
1.2.2 Teorema de Kac . . . . . . . . . .
1.2.3 Vers
ao topol
ogica . . . . . . . . . .
1.3 Exemplos . . . . . . . . . . . . . . . . . .
1.3.1 Expans
ao decimal . . . . . . . . .
1.3.2 Transformaca
o de Gauss . . . . . .
1.3.3 Rotaco
es no crculo . . . . . . . . .
1.3.4 Rotaco
es em toros . . . . . . . . .
1.3.5 Transformaco
es conservativas . . .
1.3.6 Fluxos conservativos . . . . . . . .
1.4 Transformaco
es induzidas . . . . . . . . .
1.4.1 Transformaca
o de primeiro retorno
1.4.2 Transformaco
es induzidas . . . . .
1.4.3 Torres de Kakutani-Rokhlin . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

27
27
28
29
30
31
32
32
34
38
40
41
41
43
43
44
45

iii


CONTEUDO

iv

Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

47

1.5

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

49
49
50
50
51
53
55
57
58
59
61
61
62
64
66
69
70

3 Teoremas Erg
odicos
3.1 Teorema erg
odico de Von Neumann . . . . . . . . .
3.1.1 Isometrias em espacos de Hilbert . . . . . .
3.1.2 Enunciado e prova do teorema . . . . . . .
3.1.3 Convergencia em L2 () . . . . . . . . . . .
3.2 Teorema erg
odico de Birkhoff . . . . . . . . . . . .
3.2.1 Tempo medio de visita . . . . . . . . . . . .
3.2.2 Medias temporais . . . . . . . . . . . . . . .
3.2.3 Teorema de von Neumann e consequencias .
3.3 Teorema erg
odico subaditivo . . . . . . . . . . . .
3.3.1 Preparaca
o da demonstraca
o . . . . . . . .
3.3.2 Lema fundamental . . . . . . . . . . . . . .
3.3.3 Estimativa da funca
o . . . . . . . . . .
3.3.4 Majoraca
o da funca
o + . . . . . . . . . . .
3.3.5 Consequencias . . . . . . . . . . . . . . . .
3.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

75
76
76
78
79
80
80
81
83
85
86
88
89
90
92
93

4 Ergodicidade
4.1 Sistemas erg
odicos . . . . . . . . . . .
4.1.1 Conjuntos e funco
es invariantes
4.1.2 Caracterizaca
o espectral . . . .
4.2 Exemplos . . . . . . . . . . . . . . . .
4.2.1 Rotaco
es em toros . . . . . . .
4.2.2 Expans
ao decimal . . . . . . .
4.2.3 Deslocamentos de Bernoulli . .
4.2.4 Transformaca
o de Gauss . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

95
95
96
97
100
100
101
103
107

DR
AF

2 Exist
encia de Medidas Invariantes
2.1 Alguns exemplos simples . . . . . . . . . . . . . . .
2.2 A topologia fraca . . . . . . . . . . . . . . . . . .
2.2.1 Definica
o e propriedades da topologia fraca
2.2.2 Teorema Portmanteau . . . . . . . . . . . .
2.2.3 A topologia fraca e metriz
avel . . . . . . .
2.2.4 Compacidade de M1 (M ) . . . . . . . . . .
2.2.5 Dualidade e topologias fracas . . . . . . . .
2.2.6 Teorema de Prohorov . . . . . . . . . . . .
2.3 Demonstraca
o do teorema de existencia . . . . . .
2.4 Exemplos . . . . . . . . . . . . . . . . . . . . . . .
2.4.1 Medidas em produtos semi-diretos . . . . .
2.4.2 Fluxos suspens
ao . . . . . . . . . . . . . . .
2.4.3 Transformaco
es de Poincare . . . . . . . . .
2.4.4 Extens
ao natural . . . . . . . . . . . . . . .
2.5 Operador de Koopman . . . . . . . . . . . . . . . .
2.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.


CONTEUDO

v
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

110
111
115
115
117
118
119
119
122
122
123
125
126
128
128
130
133
134

5 Unicidade erg
odica
5.1 Unicidade erg
odica . . . . . . . . . . . . . . . . . . .
5.2 Minimalidade . . . . . . . . . . . . . . . . . . . . . .
5.3 Exemplos . . . . . . . . . . . . . . . . . . . . . . . .
5.3.1 Rotaco
es em toros . . . . . . . . . . . . . . .
5.3.2 Od
ometros . . . . . . . . . . . . . . . . . . .
5.3.3 Grupos topol
ogicos e grupos de Lie . . . . . .
5.3.4 Translaco
es em grupos compactos . . . . . .
5.3.5 Interc
ambios de intervalos . . . . . . . . . . .
5.3.6 Minimalidade e ergodicidade de interc
ambios
5.4 Teorema de Weyl . . . . . . . . . . . . . . . . . . . .
5.4.1 Ergodicidade . . . . . . . . . . . . . . . . . .
5.4.2 Unicidade erg
odica . . . . . . . . . . . . . . .
5.4.3 Demonstraca
o do teorema de Weyl . . . . . .
5.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

139
139
141
142
142
143
144
146
148
150
152
153
154
157
158

6 Correla
co
es
6.1 Sistemas misturadores . . . . . .
6.1.1 Propriedades . . . . . . .
6.1.2 Mistura fraca . . . . . . .
6.1.3 Caracterizaca
o espectral .
6.2 Deslocamentos de Markov . . . .
6.2.1 Ergodicidade . . . . . . .
6.2.2 Mistura . . . . . . . . . .
6.3 Outros exemplos . . . . . . . . .
6.3.1 Endomorfismos de Tn . .
6.3.2 Interc
ambios de intervalos

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

161
162
162
165
167
169
173
175
177
177
178

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

DR
AF

4.4
4.5

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

4.3

4.2.5 Endomorfismos lineares do toro . . .


4.2.6 Argumento de Hopf . . . . . . . . .
Coment
arios sobre sistemas conservativos .
4.3.1 Teoria de Kolmogorov-Arnold-Moser
4.3.2 Bilhares . . . . . . . . . . . . . . . .
4.3.3 Fluxos geodesicos . . . . . . . . . . .
4.3.4 Sistemas parcialmente hiperb
olicos .
Propriedades de medidas erg
odicas . . . . .
Teorema da decomposica
o erg
odica . . . . .
4.5.1 Enunciado do teorema . . . . . . . .
4.5.2 Desintegraca
o de uma medida . . . .
4.5.3 Partico
es mensur
aveis . . . . . . . .
4.5.4 Demonstraca
o do teorema . . . . . .
Teorema da desintegraca
o de Rokhlin . . .
4.6.1 Esperancas condicionais . . . . . . .
4.6.2 Construca
o das medidas condicionais
4.6.3 Conclus
ao da demonstraca
o . . . . .
Exerccios . . . . . . . . . . . . . . . . . . .

4.6

4.7

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.


CONTEUDO

vi

6.3.3 Processos com mem


oria finita . . . . . . . . . . . . . . . . 181
Decaimento de correlaco
es . . . . . . . . . . . . . . . . . . . . . . 181
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185

6.4
6.5

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

187
188
190
190
191
193
195
198
198
199
199
199
199
199
199
199

8 Entropia
8.1 Definica
o de entropia . . . . . . . . . . . . . . . . . . . . .
8.1.1 Entropia em Teoria da Informaca
o . . . . . . . . .
8.1.2 Entropia de uma partica
o . . . . . . . . . . . . . .
8.1.3 Entropia de um sistema din
amico . . . . . . . . . .
8.2 Teorema de Kolmogorov-Sinai . . . . . . . . . . . . . . . .
8.2.1 Partico
es geradoras . . . . . . . . . . . . . . . . . .
8.3 Entropia local . . . . . . . . . . . . . . . . . . . . . . . . .
8.3.1 Prova do teorema de Shannon-McMillan-Breiman .
8.4 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.1 Deslocamentos de Markov . . . . . . . . . . . . . .
8.4.2 Transformaca
o de Gauss . . . . . . . . . . . . . . .
8.4.3 Transformaco
es expansoras do intervalo . . . . . .
8.4.4 Automorfismos do toro . . . . . . . . . . . . . . . .
8.5 A entropia como invariante . . . . . . . . . . . . . . . . .
8.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

201
202
202
203
208
211
213
215
216
220
220
221
223
223
223
225

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

DR
AF

7 Sistemas equivalentes
7.1 Equivalencia erg
odica . . . . . . . . . . . .
7.2 Equivalencia espectral . . . . . . . . . . . .
7.2.1 Invariantes de equivalencia espectral
7.2.2 Teorema espectral . . . . . . . . . .
7.2.3 Autovetores e mistura fraca . . . . .
7.3 Espectro discreto . . . . . . . . . . . . . . .
7.4 Espectro de Lebesgue . . . . . . . . . . . .
7.4.1 Exemplos e propriedades . . . . . .
7.4.2 Deslocamentos gaussianos . . . . . .
7.5 Sistemas de Kolmogorov . . . . . . . . . . .
7.5.1 Propriedades . . . . . . . . . . . . .
7.6 Transformaco
es expansoras do intervalo . .
7.6.1 Exatid
ao . . . . . . . . . . . . . . .
7.7 Espacos de Lebesgue . . . . . . . . . . . . .
7.8 Exerccios . . . . . . . . . . . . . . . . . . .

Captulo 0

DR
AF

Elementos de Teoria da
Medida

Neste captulo inicial recordamos algumas noco


es e resultados b
asicos da Teoria
da Medida que s
ao u
teis para o que segue. Nossa intenca
o e proporcionar
ao leitor uma fonte de referencia r
apida sobre medida e integraca
o, para uma
leitura satisfat
oria dos captulos seguintes. Por isso, omitimos as provas dos
teoremas deste captulo que podem ser encontradas nos livros de Castro [Cas04],
Fernandez [Fer02] ou Rudin [Rud87]. Se o leitor possui conhecimento b
asico de
Teoria da Medida pode passar a
` leitura do captulo seguinte.

0.1

Espa
cos mensur
aveis

Uma noca
o b
asica na Teoria da Medida e a noca
o de a
lgebra, e por extens
ao,
a noca
o de -
algebra de subconjuntos. Comecamos por introduzi-las e estudar
algumas de suas propriedades. Em seguida definimos espacos mensur
aveis e
apresentamos uma tecnica de construca
o de -
algebras.
Dado um subconjunto A X denotaremos por Ac o complementar X \ A
do conjunto A em relaca
o a X.

Defini
c
ao 0.1. Uma a
lgebra de X e uma famlia B de subconjuntos de X que
e fechada para as operaco
es elementares de conjuntos e contem X. Isto e:
XB

A B implica Ac B

A B e B B implica A B B.

Observe que A B = (Ac B c )c e A \ B = A B c tambem est


ao em B,
quaisquer que sejam A, B B. Alem disso, por associatividade, a uni
ao e a
interseca
o de qualquer n
umero finito de elementos de B tambem est
ao em B.
1

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

Defini
c
ao 0.2. Uma a
lgebra diz-se uma -
algebra de subconjuntos de X se
tambem for fechada para as uni
oes enumer
aveis:
Aj B para j = 1, 2, . . . implica

j=1

Aj B.

f
E
acil ver que uma -
algebra B tambem e fechada para as interseco
es enu

c c
mer
aveis: de fato, se Aj B para j = 1, 2, . . . , n, . . . ent
ao
A
=

j=1 j
j=1 Aj
tambem est
a em B.

DR
AF

Defini
c
ao 0.3. Um espaco mensur
avel e uma dupla (X, B) onde X e um conjunto e B e uma -
algebra de subconjuntos de X. Os elementos de B s
ao
chamados conjuntos mensur
aveis.
Em seguida apresentamos algumas construco
es de -
algebras.

Exemplo 0.4. Seja X um conjunto qualquer.

1. Denotemos por 2X a famlia de todos os subconjuntos de X. Ent


ao B = 2X
e claramente uma -
algebra.
2. B = {, X} e tambem uma -
algebra.

Note que se B e uma a


lgebra de X ent
ao {, X} B 2X . Portanto {, X}
X
e a menor a
lgebra e 2 e a maior a
lgebra de X.
Proposi
c
ao 0.5. Considere uma famlia n
ao-vazia qualquer {Bi : i I} de a
lgebras (I e um conjunto qualquer, que serve apenas para indexar os elementos
da famlia). Ent
ao a interseca
o B = iI Bi e tambem uma -
algebra.
Agora, dado um conjunto qualquer E de subconjuntos de X, podemos aplicar
a Proposica
o 0.5 a
` famlia de todas as -
algebras que contem E. Note que esta
famlia e n
ao vazia, uma vez que contem a -
algebra 2X , pelo menos. De acordo
com a observaca
o anterior, a interseca
o de todas estas -
algebras e tambem uma
-
algebra, e e claro que contem E. Alem disso, do modo como e construda, ela
est
a contida em todas as -
algebras que contem E. Portanto e a menor -
algebra
que contem E. Isto conduz a
` seguinte definica
o:

Defini
c
ao 0.6. A -
algebra gerada por uma famlia E de subconjuntos de X e
a menor -
algebra (E) que contem a famlia E, ou seja, e a interseca
o de todas
as -algebras que contem E.

Lembremos que um espaco topol


ogico e uma dupla (X, )) em que X e um
conjunto e T e uma famlia de subconjuntos de X fechada para as interseco
es finitas e uni
oes quaisquer. Essa famlia T e chamada topologia e os seus elementos
s
ao chamados abertos de X. Neste contexto e natural considerar a construca
o
que acabamos de descrever tomando E = . Isto nos conduz a
` seguinte noca
o:

Defini
c
ao 0.7. A -
algebra de Borel de um espaco topol
ogico e a -
algebra
( ) gerada pela topologica , isto e, a menor -
algebra que contem todos os
subconjuntos abertos. Neste caso, os conjuntos mensur
aveis recebem o nome de
borelianos.

0.2. ESPAC
OS DE MEDIDA

Espa
cos de medida

DR
AF

0.2

Observe que os subconjuntos fechados de X, ou seja, os complementares dos


subconjuntos abertos, tambem pertencem a ( ).
Um caso particular importante ocorre quando consideramos o espaco metrico
X = Rn munido com a dist
ancia euclidiana. Os borelianos formam uma grande
gama de conjuntos que por definica
o, inclui todos os subconjuntos abertos e
fechados, bem como todas as uni
oes ou interseco
es de subconjuntos abertos ou
fechados. De fato, poderia ate pensar-se que todo subconjunto fosse boreliano,
mas isso n
ao e verdade. Um exemplo de subconjunto de R que n
ao e boreliano
est
a construdo no Exerccio 0.6.

Agora introduzimos o conceito de medida e analisamos algumas das suas propriedades fundamentais. Em seguida apresentamos alguns resultados sobre construca
o de medidas. Finalmente, analisamos duas importantes classes de medidas:
medidas de Lebesgue em espacos euclideanos e medidas produto em espaco de
sequencias.
Defini
c
ao 0.8. Uma medida num espaco mensur
avel (X, B) e uma funca
o :
B [0, +] que satisfaz:
1. () = 0;
S
P
2. ( j=1 Aj ) = j=1 (Aj ) para quaisquer Aj B disjuntos dois-a-dois.

A tripla (X, B, ) e chamada espaco de medida. Quando vale (X) < dizemos
que e uma medida finita e se (X) = 1 dizemos que e uma probabilidade.
Neste u
ltimo caso, (X, B, ) e um espaco de probabilidade.

Exemplo 0.9. Seja X um conjunto e consideremos a -


algebra B = 2X . Dado
X
qualquer p X, consideremos a funca
o p : 2 [0, +] definida por:
(
1 se p A
p (A) =
0 se p
/ A.
Esta medida p e usualmente designada medida de Dirac no ponto p.

Defini
c
ao 0.10. Diremos que uma medida e -finita se existir uma sequencia
de subconjuntos A1 , A2 , . . . de X satisfazendo (Ai ) < para todo i N e
X=

Ai .

i=1

A segunda propriedade na definica


o de medida (Definica
o 0.8) e chamada
-aditividade. Dizemos que uma funca
o : B [0, +] e finitamente aditiva
se
N
N
[
X
(
Aj ) =
(Aj )
j=1

j=1

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

para qualquer famlia finita A1 , . . . , AN B de subconjuntos disjuntos dois-adois. Note que, em particular, toda medida e finitamente aditiva.
Em seguida apresentamos um resultado muito u
til na construca
o de medidas.
Teorema 0.11 (Extens
ao). Seja B0 uma a
lgebra de subconjuntos de X e seja
0 : B0 [0, +] uma funca
o -aditiva com () = 0 e (X) < . Ent
ao
existe uma u
nica medida definida na -
algebra B gerada por B0 que e uma
extens
ao de 0 , isto e, para todo elemento B B0 temos que 0 (B) = (B).

DR
AF

O Teorema 0.11 se aplica com as mesmas conclus


oes quando a medida 0 em
quest
ao e apenas -finita. Alem disso, se 0 e apenas finitamente aditiva ainda
assim existe uma medida que estende 0 a
` B. Porem, neste caso n
ao podemos
garantir que tal extens
ao e u
nica.
Em geral, ao tentarmos mostrar que uma funca
o definida numa -
algebra
e uma medida, o mais difcil e verificar a -aditividade. O criterio mais usado
para esse efeito e expresso no seguinte resultado:
Teorema 0.12 (Continuidade no vazio). Seja B uma a
lgebra de subconjuntos
de um conjunto X e seja : B [0, +) uma funca
o finitamente aditiva com
(X) < . Ent
ao e -aditiva se, e somente se,
lim (

n
\

Aj ) = 0

(1)

j=1

para quaisquer conjuntos mensur


aveis A1 Aj com
j=1 Aj = .

A demonstraca
o deste teorema e proposta como Exerccio 0.9. Usando argumentos an
alogos, e possvel obter outras caracterizaco
es para a -aditividade
de uma funca
o finitamente aditiva:

Teorema 0.13 (Continuidade superior e inferior). Seja B uma a


lgebra de subconjuntos de um conjunto X e seja : B [0, +) uma funca
o finitamente
aditiva com (X) < . As seguintes condico
es s
ao equivalentes:
1. e -aditiva;

2. para toda sequencia A1 Aj de conjuntos mensur


aveis vale
lim (An ) = (
j=1 Aj );

(2)

3. para toda sequencia A1 Aj de conjuntos mensur


aveis vale
lim (An ) = (
j=1 Aj ).

(3)

Outro resultado relacionado, que ser


au
til para nosso estudo, e o teorema
das classes mon
otonas, que enunciamos a seguir.

Defini
c
ao 0.14. Dizemos que uma coleca
o n
ao-vazia de subconjuntos mensur
aveis que contem X de subconjuntos mensur
aveis C e uma classe mon
otona,
se C e fechada para as uni
oes e interseco
es enumer
aveis mon
otonas, ou seja, se

0.2. ESPAC
OS DE MEDIDA

dados subconjuntos A1 A2 em C, ent


ao n1 An C e
dados subconjuntos A1 A2 em C, ent
ao n1 An C.

Claramente, as famlias {, X} e 2X s
ao classes mon
otonas. Alem disso, se
{Ci : i I} e uma famlia qualquer de classes mon
otonas, ent
ao iI Ci e uma
classe mon
otona. Portanto, dado um subconjunto A de 2X , podemos sempre
considerar a menor classe mon
otona que contem A.

DR
AF

Teorema 0.15 (Classes mon


otonas). A menor classe mon
otona que contem
uma a
lgebra A coincide com a -
algebra (A) gerada por A.

Outro fato importante sobre -


algebras, que nos ser
au
til mais tarde, afirma
que todo elemento B da -
algebra gerada por uma a
lgebra e aproximado por algum elemento B0 da a
lgebra, no sentido em que a medida da diferenca simetrica
BB0 = (B \ B0 ) (B0 \ B)

pode ser t
ao pequena quanto se queira.

Teorema 0.16 (Aproximaca


o). Seja (X, B, ) um espaco de probabilidade e
seja B0 uma a
lgebra que gera a -
algebra B. Ent
ao para todo > 0 e todo
B B existe B0 B0 tal que (BB0 ) < .

Defini
c
ao 0.17. Um espaco de medida diz-se completo se todo subconjunto de
um conjunto mensur
avel com medida nula tambem e mensur
avel.

possvel transformar qualquer espaco de medida (M, B, ) num espaco


E
completo, do seguinte modo. A famlia B de todos os conjuntos A M tais
que (AB) = 0 para algum B B e uma -
algebra que contem B. Considere

: B [0, +] dada por


(A) = (B) se (AB) = 0 para algum B B. Esta
cuja restrica
funca
o est
a bem definida e e uma medida em B,
o a B coincide com

. Por construca
o, (M, B,
) e um espaco de medida completo. Frequentemente,
chamaremos uma funca
o definida em M de mensur
avel se ela for mensur
avel

relativamente a
` -
algebra completada B.

0.2.1

Medida de Lebesgue

A medida de Lebesgue corresponde ao que entendemos por volume de subconjuntos de Rd . Ela e construda do seguinte modo.
Consideremos M = [0, 1] e seja B0 a famlia de todos os subconjuntos da

forma B = I1 IN onde I1 , . . . , IN s
ao intervalos disjuntos dois-a-dois. E
f
acil ver que B0 e uma a
lgebra de subconjuntos de M . Alem disso, temos uma
funca
o m0 : B0 [0, 1] definida nesta a
lgebra por

m0 I1 IN = |I1 | + + |IN | ,

onde |Ij | representa o comprimento de cada intervalo Ij . Note que m0 (M ) = 1.


No Exerccio 0.3 pedimos que mostre que m0 e uma funca
o -aditiva.

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

Note que a -
algebra B gerada por B0 coincide com a -
algebra de Borel
de M , j
a que todo aberto pode ser escrito como uni
ao enumer
avel de intervalos abertos disjuntos dois-a-dois. Ent
ao, pelo Teorema 0.11, existe uma u
nica
probabilidade m definida em B que e uma extens
ao de m0 . Chamamos m de
medida de Lebesgue em [0, 1].
Mais geralmente, definimos medida de Lebesgue m no cubo M = [0, 1]d
de qualquer dimens
ao d 1 da seguinte maneira. Primeiramente, chamamos
ret
angulo em M qualquer subconjunto da forma R = I1 Id onde os Ij
s
ao intervalos, e definimos

DR
AF

m0 (R) = |I1 | |Id | .

Em seguida, consideramos a a
lgebra B0 dos subconjuntos de [0, 1]d da forma
B = R1 RN , onde R1 , . . . , RN s
ao ret
angulos disjuntos dois-a-dois, e
definimos
m0 (B) = m0 (R1 ) + + m0 (RN )

para todo B nessa a


lgebra. A -
algebra gerada por B0 coincide com a -
algebra
de Borel de M . A medida de Lebesgue em M = [0, 1]d e a extens
ao de m0 a
essa -
algebra.
Para definir a medida de Lebesgue em todo o espaco euclidiano Rd , decompomos esse espaco em cubos de lado unit
ario
Rd = m1 Z md Z [m1 , m1 + 1) [md , md + 1).

Cada cubo [m1 , m1 + 1) [md , md + 1) pode ser identificado com [0, 1)d
por meio da translaca
o Tm1 ,...,md (x) = x (m1 , . . . , md ) que envia o ponto
(m1 , m2 , . . . , md ) na origem. Isso nos permite definir uma medida mm1 ,m2 ,...,md
em C, dada por

mm1 ,m2 ,...,md (B) = m0 Tm1 ,...,md (B)
para todo o conjunto mensur
avel B C. Finalmente, dado qualquer conjunto
mensur
avel B Rd , definimos
X
X

m(B) =

mm1 ,...,md B [m1 , m1 + 1) [md , md + 1) .


m1 Z

md Z

Note que m n
ao e uma medida finita, mas e uma medida -finita.

Exemplo 0.18 (Medida de volume no crculo). Chamamos crculo ao conjunto


S 1 dos n
umeros complexos com m
odulo igual a 1. Considere a aplicaca
o sobrejetora : [0, 1] S 1 definida por (t) = e2it . Chamamos medida de Lebesgue
no crculo a
` medida definida por (B) = 2m( 1 (B)). Assim, por exemplo,
a medida de Lebesgue de um arco de crculo coincide com o seu comprimento.
Observe que com esta definica
o, a medida de qualquer conjunto mensur
avel
B e igual a
` medida da sua imagem R (B), onde R : S 1 S 1 denota a
rotaca
o de a
ngulo 2. Na verdade, m
odulo multiplicaca
o por um n
umero
positivo, e a u
nica medida em S 1 que satisfaz esta condica
o para todo (veja
o Exerccio 0.13).

0.2. ESPAC
OS DE MEDIDA

Exemplo 0.19. Seja : [0, 1] R uma funca


o contnua e positiva. Dado
qualquer intervalo I, com extremos 0 a < b 1, defina
Z b
(I) =
(x) dx.
a

Em seguida, estenda a definica


o de para a a
lgebra B0 das uni
oes finitas
A = I1 Ik de intervalos disjuntos dois-a-dois, por meio da relaca
o
(A) =

k
X

(Ij ).

DR
AF

j=1

As propriedades b
asicas da integral nos dizem que e finitamente aditiva.
Deixamos para o leitor a tarefa de mostrar que a medida e -aditiva na
a
lgebra formada pelas uni
oes finitas de intervalos. Alem disso, () = 0 e
([0, 1]) < j
a que e contnua, portanto limitada. Com o auxlio do Teorema 0.11 podemos estender para toda -
algebra dos borelianos de [0, 1].
Observe que a medida que acabamos de construir tem a seguinte propriedade especial: se um conjunto A [0, 1] tem medida de Lebesgue zero ent
ao
(A) = 0. Essa propriedade chama-se continuidade absoluta (com respeito a
`
medida de Lebesgue) e ser
a estudada com mais detalhes na Seca
o 0.6.
Vamos agora exibir uma medida que, apesar de ser positiva em qualquer
aberto, n
ao e absolutamente contnua com respeito a
` medida de Lebesgue:

Exemplo 0.20. Considere uma enumeraca


o {r1 , r2 , . . . } do conjunto Q dos
n
umeros racionais. Defina por:
X 1
(A) =
.
2i
ri A

Observe que a medida de qualquer aberto da reta e positiva, pois necessariamente A contem algum ri . Apesar disso, a medida de Q e
X 1
(Q) =
= 1.
2i
ri Q

Em particular, n
ao e absolutamente contnua com respeito a
` medida de Lebesgue.

Este exemplo nos motiva a introduzir a definica


o de suporte de uma medida:

Defini
c
ao 0.21. Seja X um espaco topol
ogico e seja uma medida na a
lgebra de Borel de X. O suporte supp() da medida e o conjunto formado
pelos pontos x X tais que (V ) > 0 para qualquer vizinhanca V de x.

Segue imediatamente da definica


o que o suporte de uma medida e um conjunto fechado. No Exemplo 0.20 acima, o suporte da medida e a reta inteira,
apesar de que (Q) = 1. Se o espaco X e separ
avel ent
ao o suporte de qualquer
medida e n
ao-vazio:

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

Proposi
c
ao 0.22. Seja X um espaco topol
ogico separ
avel e uma medida
(n
ao-nula) em X. Ent
ao, o suporte supp() e n
ao-vazio.
Demonstraca
o. De fato, se supp() e vazio, ent
ao para cada ponto x X
podemos encontrar uma vizinhanca aberta Vx tal que (Vx ) = 0. Como X e
separ
avel, a sua topologia admite uma base enumer
avel de abertos {A j : j =
1, 2, . . . }. Ent
ao para cada x podemos escolher i(x) N tal que x Ai(x) Vx .
Ent
ao,
X = xX Vx = cupxX Ai(x)

DR
AF

e portanto

(X) = (xX Ai(x) )

(Ai ) = 0.

i=1

Isto e uma contradica


o e, portanto, supp() n
ao pode ser vazio.

0.2.2

Medida produto

Dados dois espacos de medida (X1 , A1 , 1 ) e (X2 , A2 , 2 ), e possvel tornar o


produto cartesiano X1 X2 um espaco de medida, da seguinte forma.
Em primeiro lugar, consideramos em X1 X2 a -
algebra gerada pela famlia
de todos os produtos da forma A1 A2 com A1 A1 e A2 A2 . Ela e chamada
-
algebra produto e representada por A1 A2 . Em seguida, definimos
(1 2 )(A1 A2 ) = 1 (A1 )2 (A2 ),

para A1 A1 e A2 A2 . Usando o Teorema 0.11, obtem-se que existe uma


u
nica medida 1 2 definida na -
algebra A1 A2 que estende a igualdade
anterior. Ela e chamada medida produto.
Esta construca
o se generaliza sem dificuldade ao produto de uma famlia finita qualquer de espacos de medida X1 , X2 , . . . , Xn . Para os nossos prop
ositos e
u
til ir mais longe e definir tambem o produto de uma famlia infinita enumer
avel
de espacos de medida.
Consideremos espacos de medida (Xi , Bi , i ), com i I, onde o conjunto de
ndices tanto pode ser I = N como I = Z. Consideremos o produto cartesiano
=

iI

Xi = {(xi )iI : xi Xi }.

(4)

Chamamos cilindros de os subconjuntos da forma

[m; Am , . . . , An ] = {(xi )iI : xi Ai para m i n}

(5)

onde m I, n N e Ai Bi para m i n. Por definica


o, a -
algebra
produto em e a -
algebra B gerada pela famlia de todo os cilindros. Note que
a famlia B0 das uni
oes finitas de cilindros disjuntos dois-a-dois e uma a
lgebra

0.3. FUNC
OES
MENSURAVEIS

(que gera B). Vamos agora definir a medida produto em . Primeiramente,


consideramos a aplicaca
o definida na famlia dos cilindros por
([m; Am , . . . , An ]) =

n
Y

i (Ai ).

(6)

i=m

DR
AF

Em seguida estendemos a
`a
lgebra B0 , estipulando que a medida de qualquer
uni
ao finita de cilindros disjuntos dois-a-dois e igual a
` soma das medidas dos
cilindros. Esta extens
ao est
a bem definida e e -aditiva. Finalmente, recorrendo
ao Teorema 0.11, estendemos para uma medida em (, B). O espaco de medida
(, B, ) construdo desta forma e denominado produto dos espacos (Xi , Bi , i ),
i I.
Um caso particular importante da construca
o anterior ocorre quando os
espacos (Xi , Bi , i ) s
ao todos iguais a um dado (X, C, ). Estes sistemas modelam sequencias de experimentos aleat
orios identicos em que o resultado de cada
experimento e independente dos demais. Sup
oe-se que cada experimento toma
valores no conjunto X, com distribuica
o de probabilidade igual a . Neste caso
a medida fica dada por
([m; Am , . . . , An ]) =

n
Y

(Ai ).

(7)

i=m

Ela e chamada medida de Bernoulli definida por . Observe que (7) significa
que a probabilidade de {xm Am , . . . , xn An } e o produto das probabilidades dos eventos xi Ai . Portanto, ela traduz a independencia dos sucessivos
experimentos.
No caso em que X = {1, . . . , d} e um conjunto finito, munido da -
algebra
2X , esta construca
o fica um pouco mais simples. Por exemplo, basta considerar
apenas cilindros elementares
[m; am , . . . , an ] = {(xi )iI X : xm = am , . . . , xn = an },

(8)

onde cada Aj consiste de um u


nico ponto aj . De fato, todo cilindro e uma uni
ao
finita de cilindros elementares dois-a-dois. Alem disso, a relaca
o (7) pode ser
escrita
([m; am , . . . , an ]) = pam pan
(9)
onde pa = ({a}) para cada a X.

0.3

Fun
co
es mensur
aveis

Funco
es mensur
aveis tem um papel em Teoria da Medida semelhante ao das fun
c
oes contnuas em Topologia. De fato, assim como continuidade corresponde a
`
ideia de que a famlia dos subconjuntos abertos e preservada, mensurabilidade
corresponde a
` ideia de preservaca
o da famlia dos conjuntos mensur
aveis.
Para formalizarmos esta noca
o, consideremos um espaco mensur
avel qualquer (X, B) . Denotaremos por [, +] o conjunto R {, +}.

10

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

Defini
c
ao 0.23. Uma funca
o f : X [, +] e mensur
avel se f 1 ((c, +])
pertence a B para todo c R.
Uma condica
o equivalente e que a pre-imagem de qualquer boreliano de R
pertence a -algebra B. Deixamos ao leitor o cuidado de verificar que esta
segunda condica
o e de fato equivalente a
` definica
o que acabamos de dar. No
Exerccio 0.5 sugerimos igualmente que prove a seguinte proposica
o:
Proposi
c
ao 0.24. Seja f : X Y uma funca
o qualquer e C uma -
algebra de
Y . Se definimos B = {f 1 (C) X : C C}, ent
ao B e uma -
algebra de X.

DR
AF

Este resultado garante que dada qualquer funca


o f : X [, +] sempre
podemos munir X com uma -
algebra relativamente a
` qual f seja mensur
avel.
No entanto, em geral estamos interessados em -algebras com propriedades
adicionais, por exemplo a -
algebra de Borel de um espaco topol
ogico.

Exemplo 0.25. Se X e um espaco topol


ogico e B e a sua -
algebra de Borel,
ent
ao toda funca
o contnua f : X R e mensur
avel. De fato, continuidade
significa que a pre-imagem de qualquer aberto de R e um aberto de X e, portanto, est
a em B. Como os abertos geram a -
algebra de Borel de R, segue que
a pre-imagem de qualquer boreliano da reta tambem est
a em B.

Exemplo 0.26. Dado um conjunto B X definimos a funca


o caracterstica
XB : X R de B por:

1, se x B;
B (x) =
0, caso contr
ario.
Observe que a funcca
o XB e mensur
avel se, e somente se, B for um subconjunto
mensur
avel: de fato, XB1 (A) {, B, X \ B, X} para qualquer A R.
Entre as propriedades b
asicas das funco
es mensur
aveis temos:

Proposi
c
ao 0.27. Sejam f, g : X [, +] funco
es mensur
aveis e sejam
a, b R. Ent
ao tambem s
ao mensur
aveis as seguintes funco
es:
(af + bg)(x) = af (x) + bg(x)

(f g)(x) = f (x) g(x).

Alem disso, se fn : X [, +] e uma sequencia de funco


es mensur
aveis,
tambem s
ao mensur
aveis as seguintes funco
es:
s(x) = sup{fn (x) : n 1}

i(x) = inf{fn (x) : n 1},

f (x) = lim sup fn (x)

f (x) = lim inf fn (x).

Em particular, se f (x) = lim f (x) existe ent


ao f e mensur
avel.

As combinaco
es lineares de funco
es caractersticas formam uma classe importante de funco
es mensur
aveis:

EM ESPAC
0.4. INTEGRAC
AO
OS DE MEDIDA

11

Defini
c
ao 0.28. Dizemos que uma funca
o s : M R e simples se existem
constantes 1 , . . . , k R e conjuntos mensur
aveis A1 , . . . , Ak B disjuntos
dois-a-dois tais que
k
X
k X Ak ,
(10)
s=
j=1

onde XA e a funca
o caracterstica do conjunto A.

DR
AF

Note que toda funca


o simples e mensur
avel. Na direca
o recproca, o pr
oximo
resultado afirma que toda funca
o mensur
avel e limite de alguma sequencia de
funco
es simples. Este fato ser
a importante na seca
o seguinte.

Proposi
c
ao 0.29. Seja f : X [, +] uma funca
o mensur
avel. Ent
ao
existe uma sequencia (sn )n de funco
es simples tal que |sn (x)| |f (x)| para todo
ne
lim sn (x) = f (x) para todo x X.
n

Se f e limitada ent
ao a sequencia pode ser escolhida de modo que a convergencia
seja uniforme. Se f e n
ao-negativa ent
ao podemos tomar 0 s1 s2 f .

0.4

Integra
c
ao em espa
cos de medida

Nesta seca
o definimos a integral de Lebesgue de uma funca
o em relaca
o a uma
medida. Esta noca
o generaliza a noca
o de integral de Riemann que e normalmente apresentada no C
alculo ou num primeiro curso de An
alise. A motivaca
o
para fazermos esta generalizaca
o e que a integral de Riemann n
ao est
a definida
para muitas funco
es u
teis, por exemplo, para funco
es caractersticas de conjuntos mensur
aveis em geral (veja o Exemplo 0.34 abaixo). J
a a integral de
Lebesgue faz sentido em toda a classe das funco
es mensur
aveis que, como vimos
na Proposica
o 0.27, e fechada para as principais operaco
es da An
alise.
Ao longo desta seca
o (X, B, ) ser
a sempre um espaco de medida. Vamos
definir a noca
o de integral de Lebesgue por etapas. O primeiro passo trata da
integral de uma funca
o simples:
P
Defini
c
ao 0.30. Seja s = kj=1 k XAk uma funca
o simples. Ent
ao a integral
de s em relaca
o a
` medida e dada por:
Z

s d =

k
X

k (Ak ).

j=1

f
E
acil verificar que esta definica
o e coerente: se duas combinaco
es lineares de
funco
es caractersticas definem uma mesma funca
o ent
ao os valores das integrais
obtidos a partir das duas combinaco
es coincidem.
O pr
oximo passo e definir integral de uma funca
o mensur
avel n
ao-negativa.
A ideia e definir a integral da funca
o como sendo o limite das integrais de funco
es
simples que a aproximam, utilizando a Proposica
o 0.29:

12

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

Defini
c
ao 0.31. Seja f : X [0, ] uma funca
o mensur
avel n
ao-negativa.
Ent
ao
Z
Z
f d = lim
sn d,
n

onde s1 s2 . . . e uma sequencia n


ao-decrescente de funco
es simples tal que
limn sn (x) = f (x) para todo x X.

DR
AF

N
ao e difcil verificar que esta definica
o e coerente: o valor da integral n
ao
depende da escolha da sequencia de funco
es simples crescendo para f .
Para estender a definica
o de integral a qualquer funca
o mensur
avel, observemos que dada uma funca
o f : X [, +] sempre podemos escrever
f = f + f com
f + (x) = max{f (x), 0} e f (x) = max{f (x), 0}.

claro que as funco


E
es f + e f s
ao n
ao-negativas. Alem disso, pela Proposica
o 0.27, elas s
ao mensur
aveis se, e somente se, f e mensur
avel.
Defini
c
ao 0.32. Seja f : X [, +] uma funca
o mensur
avel. Ent
ao
Z
Z
Z
f d = f + d f d,

desde que alguma das integrais do lado direito seja finita (valem as convenco
es
usuais (+) a = + e a (+) = para todo a R).

Defini
c
ao 0.33. Dizemos que uma funca
o e integr
avel se for mensur
avel e sua
integral for um n
umero real. Denotamos o conjunto das funco
es integr
aveis por
L1 (X, B, ) ou, mais simplesmente, por L1 ().
Dada uma funca
o mensur
avel f : X R e um conjunto mensur
avel E
definimos a integral de f sobre E por
Z
Z
f d = f XE d,
E

onde XE e a funca
o caracterstica do conjunto E.

Exemplo 0.34. Considere X = [0, 1] munido da medida de Lebesgue m. Seja


f = XB , onde B e o subconjunto dos n
umeros racionais. Ent
ao (B) = 0 e
portanto, usando a Definica
o 0.31, a integral de Lebesgue de f e igual a zero.
Por outro lado, um c
alculo direto mostra que toda soma de Riemann inferior de
f e igual a 0 mas toda soma de Riemann superior de f e igual a 1. Portanto,
a integral de Riemann de f n
ao est
a definida. Outra forma de chegar a esta
mesma conclus
ao e utilizando o fato conhecido de que a integral de Riemann
de um conjunto mensur
avel est
a definida se, e somente se, a sua fronteira tem
medida nula. Note que no caso presente a fronteira de B tem medida positiva.

EM ESPAC
0.4. INTEGRAC
AO
OS DE MEDIDA

13

m
X

p i xi

Exemplo 0.35. Sejam x1 , . . . , xm X e p1 , . . . , pm > 0 com p1 + + pm = 1.


Consideremos a medida de probabilidade definida em 2X por
onde xi e a medida delta de Dirac em xi .

i=1

P
Em outras palavras (A) = xi A pi para todo subconjunto A de X. Ent
ao,
para qualquer funca
o f : X [, +],
f d =

m
X

f (xi )pi .

DR
AF

i=1

Proposi
c
ao 0.36. O conjunto L1 () das funco
es integr
aveis e um espaco vetorial real, ou seja: af + bg L1 (M ) para todo f,Rg L1 (M ) e todo a, b R.
Alem disso, a aplicaca
o I : L1 () R, I(f ) = f d e um funcional linear
positivo, ou seja:
Z
Z
Z
af + bg d = a f d + b g d.
e se f (x) g(x) para todo x en
ao
Z
Z
f d g d.

R
R
Em particular, f d |f | d para toda f L1 (M ).

Vamos encerrar esta seca


o observando que a noca
o de integral pode ser
estendida a uma classe ainda mais ampla de funco
es, n
ao necessariamente mensur
aveis mas que coincidem com alguma funca
o mensur
avel num subconjunto
com medida total do domnio. Para explicar isto precisamos da seguinte noca
o,
que ser
a utilizada frequentemente ao longo do texto:

Defini
c
ao 0.37. Dizemos que uma propriedade e v
alida em -quase todo ponto
se e v
alida em todo o X exceto, possivelmente, num conjunto de medida nula.

Por exemplo, dizemos que uma sequencia de funco


es (fn )n converge para
uma funca
o em -quase todo ponto se existe um conjunto mensur
avel N com
(N ) = 0 tal que f (x) = limn fn (x) para todo x X \ N . Analogamente,
dizemos que duas funco
es f e g s
ao iguais em -quase todo ponto se existe um
conjunto mensur
avel N com (N ) = 0 tal que f (x) = g(x) para todo x X \N .
Neste caso, supondo que as funco
es sejam integr
aveis, as suas integrais coincidem
Z
Z
f d = g d se f = g em -quase todo ponto.

Esta observaca
o permite definir integral para qualquer funca
o f , possivelmente
n
ao mensur
avel)R que e igual
em
-quase
todo
ponto
a
uma
funca
o mensur
avel
R
g: basta tomar f d = g d.

0.5

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

Teoremas de converg
encia

14

Nesta seca
o mencionamos tres resultados importantes para o estudo da convergencia de funco
es sob o sinal de integral. O primeiro deles lida com sequencias
mon
otonas de funco
es:
Teorema 0.38 (Convergencia mon
otona). Seja fn : X [, +] uma
sequencia mon
otona de funco
es mensur
aveis n
ao-negativas e seja f a funca
o
definida por f (x) = limn fn (x). Ent
ao
Z
Z
lim fn d = f (x) d.

DR
AF

O pr
oximo resultado vale para sequencias mais gerais, n
ao necessariamente
mon
otonas:

Teorema 0.39 (Lema de Fatou). Seja fn : X [, +] uma sequencia


de funco
es mensur
aveis n
ao-negativas. Ent
ao, a funca
o f definida por f (x) =
lim inf n fn (x) e integr
avel e vale
Z
Z
lim inf f (x) d lim inf fn d.
n

O mais poderoso dos resultados que mencionamos nesta seca


o e o teorema
da convergencia dominada, que garante que podemos tomar o limite sob o sinal
da integral sempre que a sequencia de funco
es e majorada por alguma funca
o
integr
avel:

Teorema 0.40 (Convergencia dominada). Consideremos fn : X R uma


sequencia de funco
es mensur
aveis e suponha que existe uma funca
o integr
avel
g tal que |fn (x)| |g(x)| para -quase todo x em X. Suponha tambem que a
sequencia (fn )n converge em -quase todo ponto para uma funcca
o f . Ent
ao f
e integr
avel e vale:
Z
Z
lim

0.6

fn d =

f d.

Deriva
c
ao de medidas

Dado um subconjunto mensur


avel A de Rd , dizemos que um ponto a A e um
ponto de densidade de A se este conjunto preenche a maior parte de qualquer
pequena vizinhanca de a, isto e,
lim

(B(a, ) A)
= 1.
(B(a, ))

(11)

Teorema 0.41. Seja A um subconjunto mensur


avel de Rd com medida de Lebesgue (A) maior que zero. Ent
ao -quase todo ponto a A e ponto de densidade
de A.

0.7. OS ESPAC
OS LP ()

15

No Exerccio 0.19 sugerimos uma demonstraca


o deste resultado. Ele pode
tambem ser obtido como consequencia direta do teorema que vamos enunciar a
seguir. Dizemos que uma funca
o f : Rd R e localmente integr
avel se f XK e
integr
avel para todo compacto K Rd .

DR
AF

Teorema 0.42 (Derivaca


o de Lebesgue). Seja X = Rd , B a -
algebra de Borel
e a medida de Lebesgue em Rd . Seja f : X R uma funca
o localmente
integr
avel. Ent
ao
Z
1
lim
|f (y) f (x)|d = 0 em -quase todo ponto.
r0 (B(x, r)) B(x,r)
Em particular,

1
lim
r0 (B(x, r))

f (y)d = f (x)

em -quase todo o ponto.

B(x,r)

O conjunto das medidas definidas num mesmo espaco mensur


avel possui a
seguinte realaca
o de ordem natural:

Defini
c
ao 0.43. Sejam e duas medidas num espaco mensur
avel (X, B).
Dizemos que e absolutamente contnua em relaca
o a se todo conjunto mensur
avel E que satisfaz (E) = 0 tambem satisfaz (E) = 0. Nesse caso escrevemos  .
Outro resultado importante, conhecido por teorema de Rad
on-Nikodym,
afirma que quando  a medida pode ser vista como a integral com
respeito a de uma certa funca
o mensur
avel , que e chamada densidade ou
derivada de Rad
on-Nikodym de relativamente a .
Teorema 0.44 (Rad
on-Nikodym). Se e s
ao medidas finitas tais que 
ent
ao existe uma funca
o mensur
avel : X [0, +] tal que = , ou seja,
tal que
Z
(E) =
d, para todo o conjunto mensur
avel E X.
(12)
E

Alem disso, essa funca


o e essencialmente u
nica: duas quaisquer funco
es que
satisfazem (12) s
ao iguais para -quase todo ponto.

0.7

Os espa
cos Lp ()

Nesta seca
o vamos definir espacos formados por funco
es que possuem propriedades de integrabilidade especiais. Estes espacos s
ao espacos vetoriais normados que s
ao completos com respeito a essa norma, ou seja, espacos de Banach. Tambem enunciaremos algumas desigualdades envolvendo as normas destes espacos. Ao longo da seca
o (X, B, ) ser
a sempre um espaco de medida.

0.7.1

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

Lp () com 1 p <

16

Dado qualquer p [1, ), dizemos que f : X C e uma funca


o p-integr
avel
se a funca
o |f |p e integr
avel.

Defini
c
ao 0.45. Denotamos por Lp () o conjunto das funco
es complexas que
s
ao iguais em -quase todo ponto a uma funca
o p-integr
avel, m
odulo a relaca
o
de equivalencia que identifica duas quaisquer funco
es que s
ao iguais em -quase
todo ponto.

DR
AF

Note que se e finita, o que ocorrer


a frequentemente nos nossos exemplos,
todas as funco
es mensur
aveis limitadas est
ao em Lp (), uma vez que
Z
|f |p d (sup |f |)p m(X).

Em particular, se X e compacto ent


ao toda funca
o contnua est
a em L p (). Ou
0
p
seja, C (X) L () para todo p.
Para cada funca
o f Lp (), definimos
Z
 p1
p
kf kp =
|f | d
.

O pr
oximo teorema mostra que Lp () fica munido da estrutura de um espaco
de Banach:
Teorema 0.46. O conjunto Lp () e um espaco vetorial complexo. Alem disso,
kf kp e uma norma em Lp () e essa norma e completa.
A parte mais interessante da demonstraca
o deste teorema e provar a desigualdade triangular que, neste caso, e conhecida como desigualdade de Minkowski:
Teorema 0.47 (Desigualdade de Minkowski). Sejam f, g Lp (). Ent
ao:
Z
 p1 Z
 p1
Z
 p1
|f + g|p d

|f |p d
+
|g|p d
.

Nos Exercicios 0.22 e 0.24 propomos que o leitor prove a desigualdade de


Minkowski e, a partir da, complete a prova do Teorema 0.46.

0.7.2

Produto interno em L2 ()

O caso p = 2 merece atenca


o especial da nossa parte. A raz
ao e que neste caso
a norma k k2 definida anteriormente vem de um produto interno (hermitiano),
a saber:
Z
f g = f g d.
(13)

Segue das propriedades da integral que esta express


ao realmente define um produto interno em L2 (). Este produto se relaciona com a norma k k2 por:
p
kf k2 = f f .
Em particular, vale a desigualdade de Cauchy-Schwartz: :

0.7. OS ESPAC
OS LP ()

17

Teorema 0.48 (Desigualdade de Cauchy-Schwartz). Dadas f, g L2 (), ent


ao
f g L1 () e vale a desigualdade:

f g d

sZ

|f |2 d

sZ

|g|2 d.

Esta desigualdade tem a seguinte consequencia interessante. Suponha que a


medida e finita e seja f L2 () qualquer. Ent
ao, tomando g 1,
|f | d =

|f g| d

sZ

|f |2 d

sZ

1 d < .

DR
AF

Isto mostra que toda funca


o em L2 () est
a em L1 ().
Para valores de p quaisquer, vale a seguinte generalizaca
o da desigualdade
de Cauchy-Schwartz:

Teorema 0.49 (Desigualdade de H


older). Dado 1 < p < considere q definido
ao, para toda f Lp () e g Lq () temos que
pela relaca
o p1 + 1q = 1. Ent
f g L1 () e vale a desigualdade:
Z

0.7.3

|f g| d

Z

|f | d

 p1 Z

|g| d

 q1

Fun
co
es essencialmente limitadas

Em seguida vamos estender a definica


o dos espacos Lp () para o caso p = .
Para isso precisamos da seguinte noca
o. Dizemos que uma funca
o e essencialmente limitada se existe uma constante K > 0 tal que |f (x)| K em -quase
todo ponto. Nesse caso, chamamos supremo essencial de f , e denotamos por
supess (f ), o nfimo dos valores de K satisfazendo essa condica
o.

Defini
c
ao 0.50. Denotamos por Lp () o conjunto das funco
es complexas que
s
ao iguais em -quase todo ponto a uma funca
o p-integr
avel, m
odulo a relaca
o
de equivalencia que identifica duas quaisquer funco
es que s
ao iguais em -quase
todo ponto.
Podemos definir uma norma em L () por

kf k = supess (f ).

Deixamos como exerccio para o leitor (veja o Exerciccio 0.25) verificar que a
conclus
ao da Proposicao 0.46 permanece v
alida no caso p = . Mais precisamente, L () munido da norma k k e um espaco de Banach. Observe que se
e uma medida finita, ent
ao L () Lp () para qualquer p 1.

0.7.4

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

Convexidade

18

Dizemos que uma funca


o : I R definida num intervalo I da reta e convexa
se para cada x, y I e t [0, 1] vale
(tx + (1 t)y) t(x) + (1 t)(y).

Alem disso, dizemos que e c


oncava se for convexa. Para funco
es duas
vezes diferenci
aveis temos o seguinte criterio pr
atico: e convexa se 00 (x) > 0
para todo x I e e c
oncava se 00 (x) < 0 para todo x I.

DR
AF

Teorema 0.51 (Desigualdade de Jensen). Seja : I R R uma funca


o convexa.
Se e uma probabilidade em X e f L1 () e tal que f d I, ent
ao:
Z
 Z

f d f d.

Exemplo 0.52. Para toda probabilidade e toda funca


o positiva integr
avel f
temos
Z
Z
log f d log f d.

De fato, isto corresponde a


` desigualdade de Jensen para a funca
o : (0, ) R
dada por (x) = log x. Observe que e convexa: 00 (x) = 1/x2 > 0 para
todo x.

Exemplo 0.53. Seja : R R uma funca


o convexa,
P seja (i )i uma sequencia
de n
umeros reais n
ao-negativos satisfazendo
i=1 i 1 e seja (ai )i uma
sequencia limitada de n
umeros reais. Ent
ao,
!

X
X

i a i
i (ai ).
(14)
i=1

i=1

Isto pode ser visto da seguinte forma. Considere X = [0, 1] munidoP


da medida

de Lebesgue . Seja f : [0, 1] R uma funca


o da forma f (x) = i=1 ai XEi
onde os Ei s
ao conjuntos mensur
aveis disjuntos dois-a-dois tais que (Ei ) = i .
A desigualdade de Jensen aplicada a
` funca
o f d
a precisamente a relaca
o (14).

0.8

Medidas em espa
cos m
etricos

Ao longo desta seca


o, a menos de indicaca
o em contr
ario, suporemos que e
uma medida boreliana de probabilidade num espaco metrico M .

Defini
c
ao 0.54. Uma medida boreliana num espaco topol
ogico e regular se
para todo subconjunto mensur
avel B e todo > 0 existe um conjunto fechado
F e um conjunto aberto A tais que F B A e (F \ A) < .
Proposi
c
ao 0.55. Toda medida de probabilidade num espaco metrico e regular.


0.8. MEDIDAS EM ESPAC
OS METRICOS

19

DR
AF

Demonstraca
o. Seja B0 a famlia dos subconjuntos borelianos B tais que para
todo > 0 existe um fechado F e um aberto A satisfazendo F B A e
(F \ A) < . Note que B0 contem todos os fechados de M . De fato, se B e um
fechado ent
ao (pelo Teorema 0.12) (B \ B) 0 quando 0 e, portanto,
podemos tomar F = B e A = B para algum > 0 pequeno.
imediato que a famlia B0 e fechada para a passagem ao complementar, isto
E
e, B c B0 sempre que B c B0 . Alem disso, considere uma famlia enumer
avel
Bn , n = 1, 2, . . . qualquer de elementos de B0 e denote B =
B
.
Por
n=1 n
hip
otese, para todo n N e > 0, existe um fechado Fn e um aberto An
satisfazendo Fn Bn An e (An \ Fn ) < /2n+1 . A uni
ao A =
e um
n=1 An
m
aberto e qualquer uni
ao finita F = n=1 Fn e um fechado. Fixemos o inteiro m
suficientemente grande para que

n=1


Fn \ F < /2

(lembre o Teorema 0.12). Ent


ao F B A e

[
 X

 X
A\F
An \ F n +
Fn \ F <
n=1

n=1

n=1

2n+1

= .
2

Isto mostra que B B0 . Deste jeito mostramos que B0 e uma -


algebra. Logo
B0 contem todos os subconjuntos borelianos de M .
Uma consequencia do resultado acima e que os valores que uma probabilidade toma nos fechados (ou nos abertos) de M determinam completamente: se e outra probabilidade tal que (F ) = (F ) para todo fechado F
(ou (A) = (A) para todo aberto A) ent
ao = , isto e, (B) = (B) para
todo boreliano B.
A proposica
o que provaremos a seguir implica que os valores das integrais
das funco
es contnuas limitadas tambem determinam a probabilidade completamente. De fato, isso vale mesmo para o conjunto (menor) de funco
es Lipschitz
limitadas.
R
R
Proposi
c
ao 0.56. Se e s
ao probabilidades em M tais que d = d
para toda funca
o : X R Lipschitz limitada, ent
ao = .
Demonstraca
o. Usaremos o seguinte fato simples de topologia:

Lema 0.57. Dado qualquer subconjunto fechado F de M e dado > 0, existe


uma funca
o Lipschitz g : M [0, 1] tal que g (x) = 1 para todo x F e
g (x) = 0 para todo x M \ F .

Demonstraca
o. Considere a funca
o h : R [0, 1] dada da seguinte forma:
h(s) = 1 se s 0, h(s) = 0 se s 1 e h(s) = 1 s se 0 s 1. Defina

1
g : M [0, 1], g(x) = h d(x, F ) .

Note que g e Lipschitz, por ser composica


o de funco
es Lipschitz. As demais
propriedades no lema s
ao imediatas.

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

20

Agora podemos terminar a prova da Proposica


o 0.56. Seja F um subconjunto
fechado qualquer de M e, para cada > 0, seja g : M [0, 1] uma funca
o
como no lema acima. Por hip
otese,
Z
Z
g d = g d para todo > 0.
Alem disso, pelo teorema da convergencia dominada (Teorema 0.40),
Z
Z
lim g d = (F ) e lim g d = (F ).
0

DR
AF

Isto mostra que (F ) = (F ) para todo fechado F , donde resulta que = .

Como observamos no Exemplo 0.25, funco


es contnuas s
ao automaticamente
mensur
aveis, relativamente a
` -
algebra de Borel. O resultado que vamos provar a seguir afirma que vale uma especie de recproca: funco
es mensur
aveis a
o
contnuas se restringirmos a certos subconjuntos com medida quase total.
Teorema 0.58 (Lusin). Seja : M N uma transformaca
o mensur
avel
com valores num espaco metrico separ
avel N . Dado qualquer > 0 existe um
conjunto fechado F M tal que (M \F ) < e a restrica
o de a F e contnua.
Demonstraca
o. Seja {xn : n N} um subconjunto enumer
avel denso de N
e, para cada k 1, seja Bn,k a bola de centro xn e raio 1/k. Fixe > 0.
Pela Proposica
o 0.55, para cada (n, k) podemos encontrar um conjunto aberto
An,k M contendo 1 (Bn,k ) e satisfazendo (An,k \ 1 (Bn,k )) < /2n+k+1 .
Defina

\

E=
1 (Bn,k ) Acn,k .
n,k=1

Por um lado,

(M \ E)

n,k=1

(An,k \ 1 (Bn,k )) <

n,k=1

2n+k+1

.
2

Por outro lado, todo 1 (Bn,k ) e subconjunto aberto de 1 (Bn,k ) Acn,k , j


a
que o complementar e o conjunto fechado Acn,k . Consequentemente, 1 (Bn,k )
e aberto em E para todo (n, k). Isto mostra que a restrica
o de ao conjunto E
e contnua. Para terminar a demonstraca
o basta usar a Proposica
o 0.55 mais
uma vez para encontrar um conjunto fechado F E tal que (E \F ) < /2.
Vamos agora discutir outra propriedade importante de medidas em certos
espacos metricos.

Defini
c
ao 0.59. Uma medida num espaco topol
ogico e justa se para todo
> 0 existe um subconjunto compacto K tal que (K c ) < .


0.8. MEDIDAS EM ESPAC
OS METRICOS

21

Segue imediatamente da Proposica


o 0.55 que toda medida de probabilidade
num espaco metrico compacto (ou ate mesmo -compacto) e justa. Mas, esta
conclus
ao e ainda mais geral:
Proposi
c
ao 0.60. Toda medida de probabilidade num espaco metrico completo
e separ
avel e justa.

DR
AF

Demonstraca
o. Seja {pk : k N} um subconjunto enumer
avel denso de M .
k , 1/n), k N formam uma
Ent
ao, para cada n 1, as bolas fechadas B(p
cobertura enumer
avel de M . Dado > 0 e n 1, fixemos k(n) 1 de tal forma
que o conjunto (fechado)
k(n)

Ln =

k , 1/n)
B(p

k=1

satisfaca (Ln ) > 1 /2n . Tomemos K =


e fechado e
n=1 Ln . Note que K
(K c )

 X

Lcn <
= .
n
2
n=1
n=1

Resta verificar que K e compacto. Para isso basta mostrar que toda sequencia
(xi )i em K admite alguma subsequencia de Cauchy (uma vez que M e completo, segue que esta subsequencia e convergente). Tal subsequencia pode ser
construda da seguinte forma. Como xi L1 para todo i, existe l(1) k(1) tal
que o conjunto de ndices
I1 = {i N : xi B(pl(1) , 1)}

e infinito. Seja i(1) o menor elemento de I1 . Em seguida, como xi L2 para


todo i, existe l(2) k(2) tal que
I2 = {i I1 : xi B(pl(2) , 1/2)}

e infinito. Seja i(2) o menor elemento de I2 \ {i(1)}. Repetindo este procedimento, construmos uma sequencia decrescente In de subconjuntos infinitos de
N, e uma sequencia crescente i(1) < i(2) < < i(n) < de n
umeros tais
que i(n) In e todos os xi , i In est
ao contidos numa mesma bola fechada de
raio 1/n. Em particular,
d(xia , xib ) 2/n para todo a, b n.

Isto mostra que a subsequencia (xi(n) )n e realmente de Cauchy.

Corol
ario 0.61. Suponha que M e um espaco metrico completo separ
avel e e
uma medida de probabilidade em M . Para todo > 0 e todo conjunto boreliano
B M existe um compacto L B tal que (B \ L) < .

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

22

Demonstraca
o. Pela Proposica
o 0.55 podemos encontrar um conjunto fechado
F B tal que (B \ F ) < /2. Pelo Teorema 0.58, existe um subconjunto
compacto K M tal que (M \ K) < /2. Tome L = F K. Ent
ao L e
compacto e (B \ L) < .
Analogamente, quando o espaco metrico M e completo e separ
avel podemos
melhorar o enunciado do teorema de Lusin, substituindo fechado por compacto na conclus
ao:

DR
AF

Teorema 0.62 (Lusin). Suponha que M e um espaco metrico completo separ


avel. Seja : M N uma transformaca
o mensur
avel com valores num
espaco metrico separa
avel N . Ent
ao dado qualquer > 0 existe um conjunto
compacto K M tal que (M \ K) < e a restrica
o de a K e contnua.
Conclumos com outro fato importante sobre medidas em espacos metricos
completos separ
aveis. Uma medida diz-se at
omica se existe algum ponto x
tal que ({x}) > 0. Tais pontos s
ao chamados a
tomos. Caso contr
ario, diz-se
n
ao at
omica.
Teorema 0.63. Seja M um espaco metrico completo separ
avel e seja uma
medida de probabilidade n
ao at
omica em M . Ent
ao existe uma aplicaca
o mensur
avel : M [0, 1] tal que e uma bijeca
o com inversa mensur
avel, restrita
a um subconjunto com medida total, e e a medida de Lebesgue em [0, 1].
Deixamos a demonstraca
o deste teorema a cargo do leitor: veja o roteiro no
Exerccio 0.27.

0.9

Exerccios

0.1. Seja X um conjunto e considere a famlia de subconjuntos


B0 = {A X : A e finito ou Ac e finito}.

Mostre que B0 e uma a


lgebra. Alem disso, B0 e uma -
algebra se, e somente se,
o conjunto X e finito.

0.2. Seja X um conjunto e considere a seguinte famlia de conjuntos


B1 = {A X : A e finito ou enumer
avel ou Ac e finito ou enumer
avel}.

Mostre que B1 e a -
algebra gerada pela a
lgebra B0 do Exerccio 0.1.

0.3. Seja B0 a coleca


o dos subconjuntos de X = [0, 1] que se escrevem como
uni
ao finita de intervalos disjuntos. Verifique que B0 e uma a
lgebra de subconjuntos de X. Em seguida, seja 0 : B0 [0, 1] a funca
o definida nesta a
lgebra
por

0 I1 IN = |I1 | + + |IN | ,

onde |Ij | representa o comprimento de Ij . Mostre que 0 e uma funca


o -aditiva.

0.9. EXERCICIOS

23

0.4. O limite superior de uma sequencia de conjuntos En X e o conjunto


lim supn En formado pelos pontos x X tais que x En para infinitos valores
de n. Analogamente, o limite inferior da sequencia e o conjunto lim inf n En dos
pontos x X tais que existe n0 tal que x En para todo n n0 . Verifique
que:
S
T
(a) lim inf n En = n1 mn En
T
S
(b) lim supn En = n1 mn En

DR
AF

e conclua da que lim inf n En lim supn En .


0.5. Prove a Proposica
o 0.24.

0.6. O objetivo e exibir um subconjunto da reta que n


ao e boreliano. Seja
um n
umero irracional qualquer. Defina em R a seguinte relaca
o:
xy

existem m, n Z tais que x y = n + m.

Verfique que e uma relaca


o de equivalencia. Ent
ao as classes de equivalencia
de definem uma partica
o da reta em subconjuntos disjuntos dois-a-dois. Seja
E0 qualquer conjunto que contenha exatamente um elemento de cada classe de
equivalencia (utilize o axioma da escolha). Mostre que E0 n
ao e boreliano.

Dica: Assuma o contr


ario e utilize a -aditividade da medida de Lebesgue
para chegar a uma contradica
o.
0.7. Seja (X, B, ) um espaco de medida. Mostre que se A1 ,A2 , . . . est
ao em B
ent
ao

[
X
(
Aj )
(Aj ).
j=1

j=1

0.8. Seja B = 2X e considere : B [0, +] definido por:


(
#A se A e finito
.
(A) =

se A e infinito

Mostre que e uma medida (ela e chamada medida de contagem).

0.9. Demonstre o Teorema 0.13 a partir do Teorema 0.12 (teorema da continuidade no vazio).

0.10. Seja (X, B) um espaco mensur


avel, onde o conjunto X e n
ao-enumer
avel
e a -
algebra B e definida como no Exerccio 0.2. Mostre que : B [0, +]
definida por:
(
0 se A e finito ou enumer
avel
(A) =
c
1 se A e finito ou enumer
avel

e uma medida de probabilidade.

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

24

0.11. Seja X = {1, 2, . . . , d} um conjunto finito, munido da topologia discreta.


Considere o espaco M = X N das sequencias com valores em X. Fixe qualquer
n
umero (0, 1). Para cada x = (xn )n e y = (yn )n em , defina


d(x, y) = N (x,y) onde N (x, y) = min n 0 : xn 6= yn

Verifique que d e uma metrica que gera a topologia produto em . Mostre, sem
usar o teorema de Tychonoff, que (M, d) e um espaco compacto.

DR
AF

0.12. Seja X = {1, . . . , d} um conjunto finito, munido da topologia discreta, e


seja M = X N . Seja B0 a a
lgebra gerada pela famlia de todos os cilindros de M :
[a1 , . . . , ak ] = {(xn )n : x1 = a1 , . . . , xk = ak },

com k 1 e a1 , . . . , ak X.

Mostre que toda funca


o aditiva : B0 [0, 1] com (M ) = 1 se estende a uma
medida (-aditiva) de probabilidade na -
algebra boreliana de M .
Dica: Todo cilindro de M e compacto.

0.13. Seja a medida de Lebesgue em S 1 , que foi definida no Exemplo 0.18.


Dado um nmero

[0, 1], represente por R : S 1 S 1 a rotaca


o de a
ngulo
2. Verifique que (B) = (R (B)) para todo subconjunto boreliano B de S 1 .
Prove tambem que, a menos de multiplicaca
o por um n
umero positivo, e a
u
nica medida em S 1 que satisfaz esta condica
o para todo .
0.14. Prove a Proposica
o 0.29.

0.15. Seja T : X X uma funca


o mensur
avel e uma medida. Defina
T (A) = (T 1 (A)). Mostre que T e uma medida.
0.16. Sejam f e g funco
es mensur
aveis. Mostre que f e integr
avel se, e somente
se, |f | e integr
avel e, nesse caso,
Z
Z


f d |f | d.


Alem disso, se f e integr
avel e |f | |g| ent
ao g e integr
avel.

0.17. Seja
o integr
avel. Mostre que para todo > 0 existe > 0
R f uma funca
tal que | E f d| < para todo conjunto mensur
avel E com (E) < .

0.18. Mostre que a e um ponto de densidade do conjunto A se e s


o se


(B A)
lim inf
: B bola contida em B(a, ) e contendo a = 1
0
(B)
0.19. Prove o Teorema 0.41.
Dica: ??

0.9. EXERCICIOS

25

0.20. Seja x1 , x2 M e p1 , p2 , q1 , q2 > 0 com p1 + p2 = q1 + q2 = 1. Considere


as medidas de probabilidade e dadas por
X
X
(A) =
pi ,
(A) =
qi ,
xi A

xi A

ou seja, = p1 x1 + p2 x2 e = q1 x1 + q2 x2 . Mostre que  e  e


calcule as respectivas derivadas de Rad
on-Nikodym.
0.21. Prove a desigualdade de H
older.
ap
p

+ bq para qualquer par de n


umeros reais

DR
AF

Dica: Utilize o fato de que ab


n
ao-negativos a, b.

0.22. Prove a desigualdade de Minkowski.

Dica: Utilize a desigualdade de H


older.

0.23. Mostre que se e uma medida finita ent


ao Lp () L1 () para todo
p
q
p 1. Mais geralmente, L () L () sempre que p q.
0.24. Prove o Teorema 0.46.

Dica: Utilize o teorema da convergencia dominada para provar que a norma


e completa.
0.25. Mostre que k k e uma norma completa em L ().

0.26. Seja (En )n uma famlia enumer


avel de conjuntos mensur
aveis. Defina

F =

E
.
Ou
seja,
F
est
a
formado
pelos
pontos
que
pertencem a

k=1 n=k n
P
En para infinitos valores de n. Mostre que se n (En ) < ent
ao (F ) = 0.
Este fato e conhecido como Lema de Borel-Cantelli.
Dica: Para cada i 1 considere o conjunto Fi dos pontos que
P pertencem a
En para, pelo menos, i valores de n. Mostre que (Fi ) (1/i) n (En ).
0.27. O objetivo principal deste exerccio e demonstrar o Teorema 0.63. Seja
(M, B) um espaco mensur
avel cuja -
algebra B admite algum subconjunto gerador enumer
avel {Un : n N}. Seja C = {0, 1}N.

(a) A aplicaca
o : M C, (x) = XUn (x) n e injetiva e mensur
avel.
Agora suponha que M e um espaco metrico separ
avel completo e e uma
probabilidade boreliana em M .

(b) Existe um conjunto boreliano M1 M com (M1 ) = 1 tal que (M1 ) e


um conjunto boreliano de C e a restrica
o de 1 a (M1 ) e mensur
avel.
Dica: Use o teorema de Lusin (Teorema 0.62).

(c) Existe uma aplicaca


o mensur
avel : M [0, 1] e um conjunto boreliano
M2 M com (M2 ) = 1 tal que a restrica
o de a M2 e bijeca
o mensur
avel
sobre um boreliano do intervalo, com inversa mensur
avel.

26

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

(d) Se e n
ao at
omica existe uma aplicaca
o mensur
avel : M [0, 1] e
um conjunto boreliano M3 M com (M3 ) = 1 tal que a restrica
o de
a M3 e bijeca
o mensur
avel sobre um boreliano do intervalo, com inversa
mensur
avel, e e a medida de Lebesgue em [0, 1].
Dica: Considere a aplicaca
o h : [0, 1] [0, 1] dada por h(x) = ([0, x]).
Agora suponha que e at
omica. O conjunto
{aj } dos a
tomos e enumer
avel.
P
Denote pj = (aj ) para cada j e seja p = j P
pj . Considere N = [0, 1 p] {aj }
munido da probabilidade = | [0, 1 p] + j pj aj .

DR
AF

(e) Existe uma aplicaca


o mensur
avel : M N que e uma bijeca
o mensur
avel com inversa mensur
avel, restrita a um subconjunto com medida
total, e satisfaz = .

Captulo 1

DR
AF

Medidas Invariantes e
Recorr
encia

O objeto de estudo da Teoria Erg


odica e o comportamento de sistemas din
amicos
relativamente a medidas que permanecem invariantes sob a aca
o da din
amica.
A presenca da medida invariante tem consequencias importantes para o comportamento assint
otico do sistema. Muitos modelos interessantes de fen
omenos
naturais podem ser formulados desta forma e, como veremos, a teoria e muito
rica em resultados e aplicaco
es.??
Neste captulo introduzimos as noco
es fundamentais e ilustramos estes aspectos da teoria que acabamos de mencionar por meio de exemplos. Especialmente,
enunciamos o primeiro resultado importante, o teorema de recorrencia de Poincare (Teoremas 1.2 e 1.5). Ele afirma que quase toda a o
rbita, relativamente
a
` medida invariante, regressa arbitrariamente perto do ponto inicial. O teorema de Kac (Teorema 1.3) complementa este resultado, dando uma estimativa
quantitativa para os tempos de retorno.

1.1

Medidas Invariantes

Seja (M, B, ) um espaco de medida. Vamos comecar por definir medida invariante de uma transformaca
o mensur
avel f : M M .
A medida e invariante por f (tambem dizemos que f preserva ) se
(E) = (f 1 (E))

para todo conjunto mensur


avel E M .

(1.1)

Heuristicamente, isto significa que a probabilidade de um ponto estar num


dado conjunto e a probabilidade de que a sua imagem esteja nesse conjunto s
ao
iguais. Note que a definica
o (1.1) faz sentido, uma vez que a pre-imagem de um
conjunto mensur
avel por uma transformaca
o mensur
avel ainda e um conjunto
mensur
avel.
possvel, e conveniente, estender esta definica
E
o a outros tipos de sistemas
din
amicos alem das transformaco
es. Estamos especialmente interessados em
27

28

CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

fluxos, ou seja, famlias de transformaco


es f t : M M , onde t R, satisfazendo
as seguintes condico
es:
f 0 = id

e f s+t = f s f t para todo s, t R.

(1.2)

DR
AF

Isto tambem implica que toda a transformaca


o f t e invertvel e a sua inversa
t
e f . Fluxos aparecem naturalmente associados a equaco
es diferenciais, do
seguinte modo: sob condico
es adequadas, para cada ponto x existe uma u
nica
soluca
o t 7 x (t) da equaca
o que satisfaz x (0) = x; ent
ao f t (x) = x (t) define
um fluxo no domnio M da equaca
o diferencial.
Dizemos que uma medida e invariante pelo fluxo (f t )t se ela e invariante
por cada uma das transformaco
es f t , ou seja, se
(E) = (f t (E))

para todo mensur


avel E M e todo t R.

(1.3)

Proposi
c
ao 1.1. Sejam f : M M uma transformaca
o mensur
avel e uma
medida em M . Ent
ao f preserva se, e somente se,
Z
Z
d = f d.
(1.4)
para toda funca
o -integr
avel : M R.

Demonstraca
o. Suponhamos que a medida e invariante. Vamos mostrar que
a relaca
o (1.4) e v
alida para classes de funco
es sucessivamente mais amplas.
Inicialmente, observe que por hip
otese (B) = (f 1 (B)) para todo conjunto
mensur
avel B. Como,
Z
Z
XB d = (B) e (f 1 (B)) = (XB f ) d,
isto mostra que (1.4) e v
alida para as funco
es caractersticas. Ent
ao, por linearidade da integral, (1.4) e v
alida para funco
es simples. Em seguida, vamos usar
um argumento de aproximaca
o para concluir que (1.4) vale para toda funca
o integr
avel. Dada qualquer funca
o integr
avel : M R, considere uma sequencia
(sn )n de funco
es simples convergindo para e tal que |sn | || para todo
n. Tal sequencia existe, pela Proposica
o 0.29. Ent
ao, usando o teorema da
convergencia dominada (Teorema 0.40) duas vezes:
Z
Z
Z
Z
f d = lim sn f d = lim (sn f ) d = ( f ) d.
n

Isto mostra que (1.4) vale para toda funca


o integr
avel se e invariante. A
recproca tambem segue imediatamente dos argumentos que apresentamos.

1.2

Teorema de recorr
encia de Poincar
e

O teorema de recorrencia de Poincare afirma que relativamente a qualquer medida invariante finita de um sistema din
amico mensur
avel, quase todo ponto x

1.2. TEOREMA DE RECORRENCIA


DE POINCARE

29

1.2.1

e recorrente: existem tempos tj tais que f tj (x) x. De fato, daremos


duas vers
oes deste enunciado, a primeira de natureza mensur
avel (Seca
o 1.2.1)
e a segunda de natureza topol
ogica (Seca
o 1.2.3). O teorema de Kac, que provaremos na Seca
o 1.2.2 complementa estes resultados de forma quantitativa.
Posteriormente descrevemos algumas aplicaco
es destes resultados.

Vers
ao mensur
avel

DR
AF

O nosso primeiro resultado afirma que, dada qualquer medida invariante finita,
quase todo ponto de qualquer conjunto mensur
avel E regressa a E um n
umero
infinito de vezes:

Teorema 1.2 (Recorrencia de Poincare). Seja f : M M uma transformaca


o
mensur
avel e seja uma medida finita invariante por f . Seja E M qualquer
conjunto mensur
avel com (E) > 0. Ent
ao, para -quase todo ponto x E
existem infinitos de valores de n para os quais f n (x) tambem est
a em E.

Demonstraca
o. Representemos por E0 o conjunto dos pontos x E que nunca
regressam a E. Inicialmente, vamos provar que E0 tem medida nula. Para isso,
comecamos por observar que as suas pre-imagens f n (E0 ) s
ao disjuntas duas-aduas. De fato, suponhamos que existem m > n 1 tais que f m (E0 ) intersecta
f n (E0 ). Seja x um ponto na intersecca
o e seja y = f n (x). Ent
ao y E0 e
mn
m
f
(y) = f (x) E0 , que est
a contido em E. Isto quer dizer que y volta
pelo menos uma vez a E, o que contradiz a definica
o de E0 . Esta contradica
o,
prova que as pre-imagens s
ao disjuntas duas-a-duas, como afirmamos.
Observando que (f n (E0 )) = (E0 ) para todo n 1, porque e invariante,
conclumos que

n=0

X
 X
f n (E0 ) =
(f n (E0 )) =
(E0 ).
n=0

n=0

Como supomos que a medida e finita, a express


ao do lado esquerdo e finita. Por
outro lado, a
` direita temos uma soma de infinitos termos, todos iguais. O u
nico
jeito desta soma ser finita e que as parcelas sejam nulas. Portanto, devemos ter
(E0 ) = 0, tal como foi afirmado.
Agora, denotemos por F o conjunto dos pontos x E que regressam a
E apenas um n
umero finito de vezes. Como consequencia direta da definica
o,
temos que todo ponto x F tem algum iterado f k (x) em E0 . Ou seja,
F

f k (E0 )

k=0

Como (E0 ) = 0 e e invariante, temos:


k
(F ) (
(E0 ))
k=0 f

(f k (E0 )) =

k=0

Portanto, (F ) = 0 como queramos provar.

X
k=0

(E0 ) = 0


CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

30

Teorema de Ka
c

1.2.2

Seja f : M M uma transformaca


o mensur
avel e seja uma medida finita
invariante por f . Seja E M qualquer conjunto mensur
avel com (E) > 0.
Considere a funca
o tempo de primeiro retorno E : E N {} definida da
seguinte forma:
E (x) = min{n 1 : f n (x) E}
(1.5)

DR
AF

sempre que o conjunto do lado direito for n


ao vazio, isto e, se x tiver algum
iterado em E; caso contr
ario, E (x) = . De acordo com o Teorema 1.2, a
segunda alternativa s
o ocorre para um conjunto de pontos com medida nula.
O resultado que vamos apresentar a seguir mostra que esta funca
o e integr
avel e d
a mesmo o valor da sua integr
avel. Para o enunciado precisamos da
seguinte notaca
o:
E0 = {x E : f n (x)
/ E para todo n 1} e

E0 = {x M : f n (x)
/ E para todo n 0}.

Ou seja, E0 e o conjunto dos pontos de E que nunca regressam a E e E0 e o


conjunto dos pontos de M que nunca entram em E. Note que (E0 ) = 0, pelo
teorema de recorrencia de Poincare.
Teorema 1.3 (Kac). Seja f : M M , seja uma medida invariante e seja
E um subconjunto com medida positiva. Ent
ao a funca
o E e integr
avel e
Z
E d = (M ) (E0 ).
E

Demonstraca
o. Para cada n 1, defina

En = {x E : f (x)
/ E, . . . , f n1 (x)
/ E, mas f n (x) E} e

En = {x M : x
/ E, f (x)
/ E, . . . , f n1 (x)
/ E, mas f n (x) E}.

Ou seja, En e o conjunto dos pontos de E que retornam a E pela primeira vez


exatamente no momento n,
En = {x E : E (x) = n},

e En e o conjunto dos pontos que n


ao est
ao em E e que entram em E pela
claro que estes conjuntos s
primeira vez exatamente no momento n. E
ao mensur
aveis e, portanto, E e funca
o mensur
avel. Alem disso, os conjuntos En , En ,
n 0 s
ao disjuntos dois-a-dois e a sua uni
ao e todo o espaco M . Portanto
(M ) =

n=0

X


(En ) + (En ) = (E0 ) +
(En ) + (En ) .

(1.6)

n=1

Agora observe que

f 1 (En ) = En+1
E n+1

para todo n.

(1.7)

1.2. TEOREMA DE RECORRENCIA


DE POINCARE

31

De fato, f (y) En quer dizer que o primeiro iterado de f (y) que est
a em E e

f n (f (y)) = f n+1 (y) e isto ocorre se, e somente se, y En+1


ou y E n+1 . Isto
prova a igualdade (1.7). Logo, pela invari
ancia de ,

(En ) = (f 1 (En )) = (En+1


) + (E n+1 ) para todo n.

Aplicando esta relaca


o repetidas vezes, obtemos que

(En ) = (Em
)+

m
X

(Ei ) para todo m > n.

(1.8)

i=n+1

DR
AF

A relaca
o (1.6) implica que (Em
) 0 quando m . Portanto, tomando o
limite quando m na igualdade (1.8), obtemos:

(En ) =

(Ei ),

(1.9)

i=n+1

Para finalizar a demonstraca


o, substituimos(1.9) na igualdade (1.6). Desta
forma obtemos que
Z

X
X
 X

n
(M ) (E0 ) =
(Ei ) =
n(E ) =
E d,
n=1

i=n

n=1

como queramos demonstrar.

Em alguma situaco
es, por exemplo quando o sistema (f, ) e erg
odico (esta
propriedade ser
a definida e estudada no Captulo 4) o conjunto E0 tem medida
zero. Ent
ao a conclus
ao do teorema de Kac diz que
Z
1
(M )
E d =
(1.10)
(E) E
(E)
para todo conjunto mensur
avel E. O lado esquerdo desta igualdade e o tempo
medio de retorno a E. A igualdade (1.10) diz que o tempo medio de retorno e
inversamente proporcional a
` medida de E.

n1 k
Observa
c
ao 1.4. Por definica
o, En = f n (E) \ k=0
f (E). O fato de que
a soma (1.6) e finita implica que a medida deste conjunto converge para zero
quando n . Isto ser
au
til mais tarde.

1.2.3

Vers
ao topol
ogica

Agora suponhamos que M e um espaco topol


ogico, munido da sua -
algebra de
Borel B. Dizemos que um ponto x M e recorrente para uma transformaca
o
f : M M se, para toda vizinhanca U de x existe algum n 1 tal que f n (x)
est
a em U . Analogamente, dizemos que x M e recorrente para um fluxo (f t )t
se para toda vizinhanca U de x existe algum t > 0 tal que f t (x) est
a em U .
No pr
oximo teorema supomos que o espaco topol
ogico M admite uma base
enumer
avel de abertos, ou seja, existe uma famlia enumer
avel {Uk : k N} de
abertos tal que todo aberto de M pode ser escrito como uni
ao de elementos U k
dessa famlia. Esta hip
otese e satisfeita na maioria dos exemplos interessantes.

32

CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

Teorema 1.5 (Recorrencia de Poincare). Suponhamos que M admite uma base


enumer
avel de abertos. Seja f : M M uma transformaca
o mensur
avel e seja
uma medida finita em M invariante por f . Ent
ao, -quase todo ponto x M
e recorrente para f .
k o conjunto dos pontos x Uk
Demonstraca
o. Para cada k representamos por U
k tem medida
que nunca regressam a Uk . De acordo com o Teorema 1.2, todo U
nula. Consequentemente, a uni
ao enumer
avel
[
=
k
U
U

DR
AF

kN

tem medida nula. Portanto, para demonstrar o teorema ser


a suficiente que
e recorrente. Isso e f
mostremos que todo ponto x que n
ao est
a em U
acil, como
e seja U uma vizinhanca qualquer de x. Por definica
vamos ver. Seja x M \ U
o,
existe algum elemento Uk da base de abertos tal que x Uk e Uk U . Como
, tambem temos que x
k . Em outras palavras, existe algum
x n
ao est
a em U
/U
n 1 tal que f n (x) est
a em Uk . Em particular, f n (x) tambem est
a em U .
Como a vizinhanca U e arbitr
aria, isto prova que x e um ponto recorrente.
Observe que as conclus
oes dos Teoremas 1.2 e 1.5 n
ao s
ao verdadeiras, em
geral, se omitirmos a hip
otese de que a medida e finita:

Exemplo 1.6. Seja f : R R a translaca


o de 1 unidade, isto e, a transformaca
o
f
definida por f (x) = x+1 para todo x R. E
acil verificar que f deixa invariante
a medida de Lebesgue em R (que e infinita). Por outro lado, nenhum ponto e
recorrente para f . Portanto, pelo teorema de recorrencia, f n
ao pode admitir
nenhuma medida invariante finita.
No entanto, e possvel estender estes enunciados para certos casos de medidas
infinitas: veja o Exerccio 1.3.

1.3

Exemplos

Em seguida vamos descrever alguns exemplos simples de medidas invariantes


por transformaco
es ou por fluxos, que nos ajudam a interpretar o significado do
teorema de recorrencia de Poincare, bem como obter conclus
oes interessantes.

1.3.1

Expans
ao decimal

O nosso primeiro exemplo e a transformaca


o definida no intervalo [0, 1] do seguinte modo
f : [0, 1] [0, 1], f (x) = 10x [10x]

onde [10x] representa o maior inteiro menor ou igual a 10x. Em outras palavras,
f associa a cada x [0, 1] a parte fracion
aria de 10x. O gr
afico da transformaca
o
f est
a representado na Figura 1.1.

33

1.3. EXEMPLOS
1

PSfrag replacements

1/10
3/10

DR
AF

7/10
9/10

2/10

4/10

6/10

8/10

Figura 1.1: Transformaca


o parte fracion
aria de 10x

Afirmamos que a medida de Lebesgue no intervalo e invariante pela transformaca


o f , isto e, ela satisfaz a condica
o
(E) = (f 1 (E))

para todo conjunto mensur


avel E M.

(1.11)

Esse fato pode ser verificado da seguinte forma. Comecemos por supor que E
e um intervalo. Ent
ao, conforme ilustrado na Figura 1.1, a pre-imagem f 1 (E)
consiste de dez intervalos, cada um deles dez vezes mais curto do que E. Logo, a
medida de Lebesgue de f 1 (E) e igual a
` medida de Lebesgue de E. Isto mostra
que (1.11) e satisfeita no caso de intervalos. Como consequencia, essa relaca
o e
satisfeita sempre que E e uma uni
ao finita de intervalos. Agora, a famlia das
uni
oes finitas de intervalos e uma a
lgebra que gera a -
algebra de Borel de [0, 1].
Portanto, para concluir a demonstraca
o basta usar o seguinte fato geral:
Lema 1.7. Seja f : M M uma transformaca
o mensur
avel e uma medida
finita em M . Suponha que existe uma a
lgebra A de subconjuntos mensur
aveis
de M tal que A gera a -
algebra B de M e (E) = (f 1 (E)) para todo E A.
Ent
ao o mesmo vale para todo conjunto E B, isto e, a medida e invariante
por f .

Demonstraca
o. Comecemos por provar que C = {E B : (E) = (f 1 (E))}
e uma classe mon
otona. Para isso, seja E1 E2 . . . uma sequencia de
elementos em C e seja E =
i=1 Ei . Pelo Teorema 0.13, temos que
(E) = lim (Ei ) e (f 1 (E)) = lim (f 1 (Ei )).
i

Ent
ao, usando o fato de que Ei C,

(E) = lim (Ei ) = lim (f 1 (Ei )) = (f 1 (E)).


i

Logo E C. Analogamente ?? se mostra que a interseca


o de qualquer sequencia
decrescente de elementos de C est
a em C. Isto prova que C e de fato uma classe
mon
otona.

34

CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

Agora e f
acil obter a conclus
ao do lema. Note que C contem A, por hip
otese.
Portanto, usando o teorema das classes mon
otonas (Teorema 0.14), segue que
C contem a -
algebra B gerada por A. Isto e precisamente o que queramos
provar.
Agora vamos explicar como, a partir do fato de que a medida de Lebesgue e
invariante pela transformaca
o f , podemos obter conclus
oes interessantes usando
o teorema de recorrencia de Poincare. A funca
o f tem uma relaca
o direta com
o algoritmo da expans
ao decimal: se x e dado por

DR
AF

x = 0, a0 a1 a2 a3

com ai {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, ent


ao a sua imagem e dada por
f (x) = 0, a1 a2 a3 .

Com isso, fica f


acil escrever a express
ao do iterado n-esimo, para qualquer n 1:
f n (x) = 0, an an+1 an+2

(1.12)

Agora, seja E o subconjunto dos x [0, 1] cuja expans


ao decimal comeca
com o dgito 7, ou seja, tais que a0 = 7. De acordo com o Teorema 1.2, quase
todo elemento de E tem infinitos iterados que tambem est
ao em E. Levando
em conta a express
ao (1.12), isto quer dizer que existem infinitos valores de n
tais que an = 7. Portanto, provamos que quase todo n
umero x cuja expans
ao
decimal comeca por 7 tem infinitos dgitos iguais a 7.
Claro que no lugar de 7 podemos considerar qualquer outro dgito. Alem
disso, tambem podemos considerar blocos com v
arios dgitos (Exerccios 1.5 e
1.6). Mais tarde provaremos um resultados muito mais forte: para quase todo
n
umero x [0, 1], todo dgito aparece com frequencia 1/10 na sua expans
ao
decimal. O enunciado preciso aparecer
a na Proposica
o 4.11.

1.3.2

Transforma
c
ao de Gauss

O sistema que apresentamos nesta seca


o est
a relacionado com outro importante algoritmo em Teoria dos N
umeros, a expans
ao de um n
umero em fraca
o
contnua, cuja origem remonta ao problema de achar a melhor aproximaca
o
racional para um n
umero real qualquer. Vamos descrever este algoritmo sucintamente.
Dado um n
umero x0 (0, 1), seja
 
1
1
a1 =
e
x1 =
a1 .
x0
x0

Note que a1 e um n
umero natural, x1 [0, 1) e tem-se
x0 =

1
.
a1 + x1

35

1.3. EXEMPLOS

Ent
ao
x1 =

Supondo que x1 seja diferente de zero, podemos repetir o processo, definindo


 
1
1
a2 =
e
x2 =
a2 .
x1
x1
1
a1 + x2

e portanto x0 =

a1 +

1
a2 + x2

DR
AF

Por recorrencia, para cada n 1 tal que xn1 (0, 1) define-se




1
1
an =
e
xn =
an = G(xn1 )
xn1
xn1
e tem-se

x0 =

a1 +

(1.13)

a2 +

1
an + xn

N
ao e difcil mostrar que a sequencia

zn =

a1 +

(1.14)

a2 +

1
an

converge para x0 quando n , e e usual traduzir este fato escrevendo


1

x0 =

a1 +

(1.15)

a2 +

an +

que e chamada expans


ao em fraca
o contnua de x0 .
Note que a sequencia (zn )n definida pela relaca
o (1.14) consiste de n
umeros
racionais. De fato, mostra-se que estes s
ao os n
umeros racionais que melhor
aproximam o n
umero x0 , no sentido de que zn est
a mais pr
oximo de x0 do
que qualquer outro n
umero racional com denominador menor ou igual que o
denominador de zn (escrito em forma irredutvel). Observe tambem que para
obter (1.15) suposemos que xn (0, 1) para todo n N. Se encontramos algum
xn = 0, o processo p
ara nesse momento e consideramos (1.13) a expans
ao em
fraca
o contnua de x0 . Claro que este u
ltimo caso ocorre somente se x0 e um
n
umero racional.

36

CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

O algoritmo de expans
ao em fraca
o contnua est
a intimamente conectado
com o sistema din
amico no intervalo [0, 1] que vamos descrever a seguir. A
transformaca
o de Gauss G : [0, 1] [0, 1] e definida por
 
1
1
G(x) =
= parte fracion
aria de 1/x,
x
x

DR
AF

se x (0, 1] e G(0) = 0. O gr
afico de G pode ser esbocado facilmente, a partir
da seguinte observaca
o: para todo x em cada intervalo (1/(k + 1), 1/k] a parte
inteira de 1/x e igual a k e, portanto, G(x) = 1/x k. Veja a Figura 1.2.
1

...

PSfrag replacements

1/4

1/3

1/2

Figura 1.2: Transformaca


o de Gauss

A expans
ao em fraca
o contnua de qualquer n
umero x0 (0, 1) pode ser
obtida a partir da transformaca
o de Gauss, da seguinte forma: para cada n 1
o n
umero natural an e determinado por
Gn1 (x0 ) Ian .

e xn e simplesmente o n-esimo iterado Gn (x0 ) de x0 . Este processo se encontrarmos algum xn = 0; como explicamos anteriormente, isto s
o pode acontecer
se o n
umero x0 for racional (veja o Exerccio 1.8). Em particular, todos os
iterados de G est
ao definidos para um conjunto com medida de Lebesgue total
de pontos iniciais.
O que torna esta transformaca
o interessante do ponto de vista da Teoria
Erg
odica e que G admite uma probabilidade invariante que e equivalente a
`
medida de Lebesgue no intervalo. De fato, considere a medida definida por
Z
c
(E) =
dx para cada mensur
avel E [0, 1],
(1.16)
E 1+x
onde c e uma constante positiva. Note que a integral est
a bem definida, j
a que
a funca
o integrando e contnua no intervalo [0, 1]. Alem disso, essa funca
o toma

37

1.3. EXEMPLOS

valores no intervalo [c/2, c] e, portanto,

c
m(E) (E) c m(E)
2

(1.17)

para todo conjunto mensur


avel E [0, 1]. Em particular, e de fato equivalente
a
` medida de Lebesgue m, isto e, as duas medidas tem os mesmos conjuntos com
medida nula.
Proposi
c
ao 1.8. A medida e invariante por G. Alem disso, se escolhermos
c = 1/log2 ent
ao e uma probabilidade.

DR
AF

Demonstraca
o. Vamos utilizar o seguinte lema:

Lema 1.9. Seja f : [0, 1] [0, 1] uma transformaca


o tal que existem intervalos
abertos I1 , I2 , . . . disjuntos dois-a-dois tais que
1. a uni
ao k Ik tem medida de Lebesgue total em [0, 1] e

2. a restrica
o fk = f | Ik a cada Ik e um difeomorfismo sobre (0, 1).

Seja : [0, 1] [0, ) uma funca


o integr
avel (para a medida de Lebesgue) tal
que
X
(x)
(y) =
(1.18)
|f 0 (x)|
1
xf

(y)

para quase todo y [0, 1]. Ent


ao a medida = dx e invariante por f .

Demonstraca
o. Seja = E a funca
o caracterstica de um conjunto mensur
avel
E [0, 1] qualquer. Pela f
ormula de mudanca de vari
aveis,
Z
Z 1
(f (x))(x) dx =
(y)(fk1 (y))|(fk1 )0 (y)| dy.
Ik

Note que (fk1 )0 (y) = 1/f 0 (fk1 )0 (y). Portanto, a relaca


o anterior implica que
Z

(f (x))(x) dx =

Z
X

(f (x))(x) dx

k=1 Ik
Z 1
X
k=1

(f 1 (y))
(y) 0 k1
dy.
|f (fk )(y)|

(1.19)

Usando o teorema da convergencia mon


otona (Teorema 0.38) e a hip
otese (1.18),
vemos que a u
ltima express
ao em (1.19) e igual a
Z 1
Z 1

X
(fk1 (y))
(y)
dy
=
(y)(y) dy.
|f 0 (fk1 )(y)|
0
0
k=1

R1
R1
Deste jeito mostramos que 0 (f (x))(x) dx = 0 (y)(y) dy. Como = dx
e = XE , isto quer dizer que (f 1 (E)) = (E) para todo conjunto mensur
avel
E [0, 1]. Portanto, e invariante por f .


CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

38

Para concluir a demonstraca


o da Proposica
o 1.8 devemos mostrar que a
condica
o (1.18) vale para (x) = c/(1 + x) e f = G. Seja Ik = (1/(k + 1), 1/k) e
seja Gk a restrica
o de G a Ik . Note que G1
k (y) = 1/(y + k) para todo k. Note
tambem que G0 (x) = (1/x)0 = 1/x2 para todo x 6= 0. Portanto,

X
X
(G1
c
c(y + k)
1 2 X
k (y))
=
.
=
1
0
(y + k)(y + k + 1)
|G (Gk )(y)| k=1 y + k + 1 y + k
k=1
k=1

Observando que

(1.20)

DR
AF

1
1
1
=

,
(y + k)(y + k + 1)
y+k y+k+1

vemos que a u
ltima soma em (1.20) pode ser escrita na forma telesc
opica: todos
os termos, exceto o primeiro, aparecem duas vezes, com sinais contr
arios, e
portanto se cancelam. Logo a soma e igual ao primeiro termo:

X
k=1

1
c
=
= (y).
(y + k)(y + k + 1)
y+

Isto mostra que a igualdade (1.18) e realmente satisfeita e, portanto, podemos


usar o Lema 1.7 para concluir que e invariante.
Finalmente, usando a primitiva c log(1 + x) da funca
o (x) vemos que
([0, 1]) =

c
dx = c log 2.
1+x

Logo, escolhendo c = 1/ log 2 obtemos que e uma probabilidade.

Esta proposica
o permite utilizar ideias de Teoria Erg
odica, aplicadas a
` transformaca
o de Gauss, para obter conclus
oes interessantes em Teoria dos N
umeros.
Por exemplo (veja o Exerccio 1.7), o n
umero 7 aparece infinitas vezes na expans
ao em fraca
o contnua de quase todo n
umero x0 (1/8, 1/7), isto e, tem-se
an = 7 para infinitos valores de n N. Mais tarde provaremos um fato muito
mais preciso: para quase todo x0 (0, 1) o n
umero 7 aparece com frequencia
1
64
log
log 2
63

na sua expans
ao em fraca
o contnua. Tente intuir desde j
a de onde vem este
n
umero!

1.3.3

Rota
co
es no crculo

Como vimos anteriormente (Exemplo 0.18) o crculo S 1 = {z C : |z| = 1} est


a
munido de uma medida de Lebesgue, que coincide com o comprimento no caso
dos arcos de crculo e que e invariante por todas as rotaco
es R . Dividindo esta

39

1.3. EXEMPLOS

medida por 2 obtemos uma probabilidade em S 1 . Sempre que nos referirmos


a
` medida de Lebesgue no crculo teremos em mente esta probabilidade.
Existe um modo equivalente de definir o crculo que e u
til em diversas circunst
ancias. Considere em R a relaca
o de equivaencia que identifica quaisquer
n
umeros cuja diferenca e um n
umero inteiro, isto e:
xy

x y Z.

DR
AF

Representamos por [w] R/Z a classe de equivalencia de qualquer w R e


denotamos por R/Z o espaco de todas as classes de equivalencia. Este espaco
herda da reta uma estrutura de grupo abeliano, dada pela operaca
o
[x] + [y] = [x + y];

note que esta definica


o est
a bem formulada: a classe de equivalencia do lado
direito n
ao depende da escolha dos representantes x e y das classes do lado
esquerdo. Alem disso, R/Z se identifica naturalmente com o crculo, por meio
da seguinte bijeca
o:
R/Z S 1 , [x] 7 e2xi

(mais uma vez, a express


ao do lado direito n
ao depende da escolha do representante x da classe de equivalencia). Por esta identificaca
o a rotaca
o R corresponde a
` transformaca
o
R/Z R/Z,

[x] 7 [x] + []

que tambem denotaremos por R (por abuso de linguagem, por vezes chamaremos R de rotaca
o de a
ngulo ).
Aqui destacamos que a din
amica de R possui dois comportamentos bem
distintos, dependendo de . Se e racional, digamos = p/q com p Z e
q N, ent
ao
Rq ([x]) = [x + q] = [x] para todo [x].

Como consequencia, todo ponto x S 1 e peri


odico de perodo q. No caso
contr
ario temos:

Proposi
c
ao 1.10. Se e irracional ent
ao O([x]) = {Rn ([x]) : n N} e um
subconjunto denso de R/Z para todo [x].

Demonstraca
o. Afirmamos que o conjunto D = {m + n : m Z, n N} e
denso em R. De fato, Considere um n
umero qualquer r R. Dado qualquer
> 0, podemos escolher p Z e q N tais que |q p| < . Note que o n
umero
a = q p e necessariamente diferente de zero, uma vez que e irracional.
Suponhamos que a e positivo (o outro caso e an
alogo). Subdividindo a reta
em intervalos de comprimento a, vemos que existe um n
umero inteiro l tal que
0 r la < a. Isto implica que
|r (lq lp)| = |r la| < a < .


CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

40

Como m = lq e n = lq s
ao inteiros e e arbitr
ario, isto mostra que r est
a no
fecho do conjunto D, para todo r R.
Agora, dados y R e > 0, podemos tomar r = y x e, usando o par
agrafo
anterior, podemos encontrar m, n Z tais que |m + n (y x)| < . Isto
equivale a dizer que a dist
ancia de [y] ao iterado Rn ([x]) e menor que . Como
x, y e s
ao arbitr
arios, isto mostra que toda o
rbita O([x]) e densa.

DR
AF

Em particular, segue que todo ponto do crculo e recorrente para R (isto


tambem e verdade quando e racional). A proposica
o anterior tambem ter
a
v
arias implicaco
es interessantes no estudo das medidas invariantes de R . Entre
outras coisas, veremos na Proposica
o ?? que se e irracional ent
ao a medida de
Lebesgue e a u
nica medida de probabilidade que e preservada por R . Relacionado com isso, veremos que as o
rbitas de R se distribuem de modo uniforme
em S 1 .

1.3.4

Rota
co
es em toros

As noco
es que acabamos de apresentar podem ser generalizadas para qualquer
dimens
ao, como vamos explicar em seguida. Para cada d 1, considere a
relaca
o de equivalencia em Rd que identifica dois vetores se a sua diferenca e
um vetor com coordenadas inteiras:
(x1 , . . . , xd ) (y1 , . . . , yd )

(x1 y1 , . . . , xd yd ) Zd .

Chamamos toro de dimens


ao d ou, simplesmente, d-toro o espac
Td = Rd /Zd = (R/Z)d

das classes de equivalencia desta relaca


o. Seja m a medida de volume em R d .
A operaca
o
[(x1 , . . . , xd )] + [(y1 , . . . , yd )] = [(x1 + y1 , . . . , xd + yd )]

faz de T um grupo abeliano. A rotaca


o associada a um vetor = (1 , . . . , d )
e
R : Td Td , R ([x]) = [x] + [].
A aplicaca
o

: [0, 1]d Td ,

(x1 , . . . , xd ) 7 [(x1 , . . . , xd )]

e sobretora e nos permite definir a medida de probabilidade


 de Lebesgue no
d-toro, por meio da seguinte f
ormula: (B) = m 1 (B) para todo B Td
tal que 1 (B) e mensur
avel. Esta medida e invariante por R para todo .
Dizemos que um vetor = (1 , . . . , d ) e racionalmente independente se para
quaisquer n
umeros inteiros n0 , n1 , . . . , nd temos que
n0 + n 1 1 + + n d d = 0

n0 = n1 = = nd = 0.

Caso contr
ario dizemos que e racionalmente dependente.
Deixamos ao cuidado do leitor (Exerccio 1.13) provar a seguinte proposica
o:

Proposi
c
ao 1.11. Seja = (1 , . . . , d ) um vetor racionalmente independente.
Ent
ao O([x]) = {Rn ([x]) : n N} e um subconjunto denso de Td para todo [x].

41

1.3. EXEMPLOS

Transforma
co
es conservativas

1.3.5

Seja M Rk um aberto do espaco euclidiano Rd e seja f : M M um


difeomorfismo de classe C 1 . Isto quer dizer que f e uma bijeca
o e tanto ele
quanto a sua inversa s
ao deriv
aveis com derivada contnua. Representaremos
por vol a medida de Lebesgue, ou medida de volume, em M . A f
ormula de
mudanca de vari
aveis afirma que, para qualquer conjunto mensur
avel B M ,
Z
vol(f (B)) =
| det Df | dx.
(1.21)
B

DR
AF

Daqui se deduz facilmente

Lema 1.12. Um difeomorfismo f : M M de classe C 1 deixa invariante a


medida de volume se, e somente se, o valor absoluto | det Df | do seu jacobiano
e constante igual a 1.

Demonstraca
o. Suponha primeiro que o valor absoluto do jacobiano e igual 1
em todo ponto. Considere um conjunto mensur
avel E e seja B = f 1 (E). A
f
ormula (1.21) d
a que
Z
vol(E) =
1 dx = vol(B) = vol(f 1 (E)).
B

Isto significa que f deixa invariante o volume e, portanto, provamos a parte


sedo enunciado.
Para provar a parte somente se, suponha que | det Df | fosse maior que 1 em
algum ponto x. Ent
ao, como o jacobiano e contnuo, existiria uma vizinhanca
U de x e algum n
umero > 1 tais que
| det Df (y)|

para todo y U.

Ent
ao a f
ormula (1.21) aplicada a B = U daria
Z
vol(f (U ))
dx vol(U ).
U

Denotando E = f (U ), isto implica que vol(E) > vol(f 1 (E)) e, portanto, f n


ao
deixa invariante o volume. Do mesmo modo se mostra que se o valor absoluto
do jacobiano e menor que 1 em algum ponto ent
ao f n
ao deixa invariante o
volume.

1.3.6

Fluxos conservativos

Agora vamos considerar o caso de fluxos f t : M M , t R. Suporemos que o


fluxo e de classe C 1 , no sentido de que a aplicac ao (t, x) 7 f t (x) e de classe C 1 .
Ent
ao cada transformaca
o f t e um difeomorfismo C 1 : a inversa e f t . Como f 0
e a identidade e o jacobiano varia continuamente, obtemos que det Df t (x) > 0
em todo ponto.

42

CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

Aplicando o Lema 1.12 neste contexto, obtemos que o fluxo deixa invariante
a medida de volume se, e somente se,
det Df t (x) = 1 para todo x U e todo t R.

(1.22)

DR
AF

No entanto esta conclus


ao n
ao e muito u
til na pr
atica porque, em geral, n
ao
temos uma express
ao explcita para f t , e portanto n
ao e claro como verificar a
condica
o (1.22). Felizmente, existe uma express
ao razoavelmente explcita para
o jacobiano, de que iremos falar em seguida, que pode ser usada em muitas
situaco
es interessantes.
Suponhamos que M e um aberto de Rd e o fluxo f t : M M corresponde
a
`s trajet
orias de um campo de vetores F : M Rk de classe C 1 . Em outras
palavras, t 7 f t (x) e a soluca
o da equaca
o diferencial
dy
= F (y)
dt

(1.23)

que tem x como condica


o inicial (quando tratando de equaco
es diferenci
aveis
sempre suporemos que as suas soluco
es est
ao definidas para todo tempo).
A f
ormula de Liouville exprime o jacobiano de f t em termos do divergente
div F do campo de vetores:
Z t

det Df t (x) = exp
div F (f s (x)) ds para todo x e todo t.
0

Lembre que o divergente de um campo de vetores F e o traco da sua matriz


jacobiana, isto e
F
F
div F =
++
.
(1.24)
x1
xd
Combinando a f
ormula de Liouville com (1.22) obtemos

Lema 1.13 (Liouville). O fluxo (f t )t associado a um campo de vetores F de


classe C 1 deixa invariante a medida de volume se e somente se o divergente de
F e identicamente nulo.
Podemos generalizar esta discuss
ao para o caso em que M e uma variedade
Riemanniana qualquer, de dimens
ao d 2. Neste caso, a medida de Lebesgue e
dada por uma d-forma diferenci
avel , chamada forma de volume, que se escreve
em coordenadas locais como = dx1 dxd . Isto significa que o volume de
qualquer conjunto mensur
avel B contido num domnio de coordenadas locais e
dado por
Z
vol(B) =

(x1 , . . . , xd ) dx1 dxd .

Escrevendo o campo de vetores em coordenadas locais (x1 , . . . , xd )


F (x1 , . . . , xd ) = (F1 (x1 , . . . , xd ), . . . , Fd (x1 , . . . , xd )),

temos a seguinte vers


ao do teorema de Liouville:


1.4. TRANSFORMAC
OES
INDUZIDAS

43

Teorema 1.14 (Liouville). O fluxo (f t )t associado a um campo de vetores F


de classe C 1 preserva a medida de volume na variedade M se, e somente se,
d
X
(Fi )
i=1

xi

=0

em todo ponto.

DR
AF

A prova deste teorema pode ser encontrada no livro de Sternberg [Ste58].


O Exerccio 1.11 e uma aplicaca
o destas observaco
es no contexto, muito importante, dos fluxos hamiltonianos.??

1.4

Transforma
co
es induzidas

Nesta seca
o vamos descrever uma construca
o, baseada no teorema de recorrencia
de Poincare (Teorema 1.2), que permite associar a um dado sistema erg
odico
(f, ) outros sistemas intimamente relacionados com ele mas que podem, em
muitos casos, ser escolhidos de modo a terem melhores propriedades globais.

1.4.1

Transforma
c
ao de primeiro retorno

Seja f : M M uma transformaca


o mensur
avel e uma probabilidade invariante. Seja E M um conjunto mensur
avel com (E) > 0 e seja (x) = E (x)
o tempo de primeiro retorno de x a E, tal como foi definido em (1.5). A transformaca
o de primeiro retorno ao domnio E e definida por
g(x) = f (x) (x)

num subconjunto com medida total de E. Tambem denotamos por E a restrica


o de aos subconjuntos mensur
aveis de E.
Proposi
c
ao 1.15. A medida E e invariante pela transformaca
o g : E E.

Demonstraca
o. Para cada k 1, denote por Ek o conjunto dos pontos x E
tais que (x) = k. Por definica
o, g(x) = f k (x) para todo x Ek . Seja B um
subconjunto mensur
avel qualquer de E. Ent
ao
(g 1 (B)) =

X
k=1

(f k (B) Ek ).

Por outro lado, como e f -invariante,






B = f 1 (B) = f 1 (B) E1 + f 1 (B) \ E .

Analogamente,



f 1 (B) \ E = f 2 (B) \ f 1 (E)


= f 2 (B) E2 + f 1 (B) \ (E f 1 (E)) .

(1.25)

(1.26)


CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

44

Substituindo em (1.26), obtemos

2
1
[
 X


B =
f k (B) Ek + f 2 (B) \
f k (E) .
k=1

k=0

Repetindo este argumento sucessivamente, obtemos que

n
n1
[
 X


B =
f k (B) Ek + f n (B) \
f k (E) .
k=1

(1.27)

k=0

DR
AF

claro que a u
Vamos passar ao S
limite quandon . E
ltima parcela e majorada
n1 k
n
por f (E) \ k=0 f (E) . Logo, usando a Observaca
o 1.4, ela converge
para zero quando n . Deste modo, conclumos que

 X

B =
f k (B) Ek .
k=1

Juntamente com (1.25), isto mostra que (g 1 (B)) = (B) para todo subconjunto mensur
avel B de E. Isto e, a medida E e invariante por g.

1.4.2

Transforma
co
es induzidas

Na direca
o contr
aria, dada uma medida invariante qualquer de g : E E,
podemos construir uma certa medida invariante para f : M M . Ali
as,
para isto g n
ao precisa ser a transformaca
o de primeiro retorno: a construca
o
que vamos apresentar a seguir e v
alida para qualquer transformaca
o induzida
de f , ou seja, qualquer transformaca
o da forma
g : E E,

g(x) = f (x) (x),

onde : E N e uma funca


o mensur
avel (basta que esteja definida num subconjunto com medida total em E). Como antes, denotamos por Ek o conjunto
dos x E tais que (x) = k. Ent
ao definimos:
(B) =

X
X

n=0 k>n

(f n (B) Ek ),

(1.28)

para todo conjunto mensur


avel B M .

Proposi
c
aRo 1.16. A medida definida em (1.28) e invariante por f e satisfaz
(M ) = E d. Em particular, e finita se, e somente se, a funca
o e
integr
avel com respeito a .
Demonstraca
o. Primeiro, provamos a invari
ancia de . Pela definica
o (1.28),
X
X
 X
 X

f 1 (B) =
f (n+1) (B) Ek =
f n (B) Ek .
n=0 k>n

n=1 kn


1.4. TRANSFORMAC
OES
INDUZIDAS

45

Podemos reescrever a express


ao acima como:

 X
 X

f 1 (B) =
f n (B) Ek +
f k (B) Ek .
n=1 k>n

(1.29)

k=1

A respeito da u
ltima parcela, observe que

k=1



 X

f k (B) Ek = g 1 (B) = B =
B Ek ,
k=1

DR
AF

uma vez que e invariante por g. Substituindo esta igualdade em (1.29), vemos
que
f

(B) =

X
X

n=1 k>n

(B) Ek +

X
k=1



B Ek = B

para todo conjunto mensur


avel B E. A segunda afirmaca
o na proposica
o e
uma consequencia direta das definico
es:
(M ) =

X
X

n=0 k>n

(f

(M ) Ek ) =

X
X

(Ek ) =

n=0 k>n

k=1

k(Ek ) =

d.

Isto completa a demonstraca


o.

interessante analisar como esta construca


E
o se relaciona com a construca
o
da seca
o anterior quando g e a transformaca
o de primeiro retorno de f e a
medida e a restrica
o E de alguma medida invariante de f :

Corol
ario 1.17. Se g e a transformaca
o de primeiro retorno de f a E, ent
ao
(B) = (B) para todo conjunto mensur
avel B E.

Demonstraca
o. Por definica
o, f n (E) Ek = para todo 0 < n < k. Isto
implica que, dado qualquer conjunto mensur
avel BP
E, todas as parcelas com
n > 0 na definica
o (1.28) s
ao nulas. Logo, (B) = k>0 (B Ek ) = (B).

Ent
ao, as duas medidas e restritas ao conjunto E coincidem com . Por
consequencia, . Alem disso, o teorema de Kac nos diz que,
Z
Z
(M ) =
d =
d = (M ) (E0 ).
E

Portanto, = se, e somente se, (E0 ) = 0.

1.4.3

Torres de Kakutani-Rokhlin

possvel, e u
E
til, generalizar a construca
o anterior um pouco mais, abrindo
m
ao da pr
opria transformaca
o f : M M . Mais precisamente, dada uma
transformaca
o g : E E, uma medida em E invariante por g, e uma funca
o


CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

46

mensur
avel : E N, vamos mostrar como construir uma transformaca
o
f : M M e uma medida invariante por f tais que E pode ser identificado
com um subconjunto de M , g e a transformaca
o de primeiro retorno de f a E,
com tempo de retorno dado por , e a medida restrita a E coincide com .
Esta transformaca
o f e chamada torre de g com tempo . A medida e
finita se, e somente se, e integr
avel com respeito a . Elas s
ao construdos da
seguinte forma. Comeca
mos por definir:
M = {(x, n) : x E e 0 n < (x)}
k1
[
[

Ek {n}.

DR
AF

k=1 n=0

Ou seja, M consiste de k c
opias de cada conjunto Ek = {x E : (x) = k},
empilhadas umas sobre as outras. Chamamos cada k>n Ek {n} de n-esimo
andar de M . Veja a Figura 1.3.

...

PSfrag replacements

andar k
andar k 1

...

andar 2
andar 1

E1

E2

E3

Ek

terreo

Figura 1.3: Torre de g com tempo

Em seguida definimos f : M M da seguinte forma:


f (x, n) =

(x, n + 1) se n < (x) 1


.
(g(x), 0)
se n = (x) 1

Em outras palavras, a din


amica eleva cada ponto (x, n) um andar de cada
vez, ate alcancar o andar (x) 1; a essa altura o ponto cai diretamente para
(g(x), 0), no andar terreo. O andar terreo E {0} se identifica naturalmente
com o conjunto E. Alem disso, a transformaca
o de primeiro retorno a E {0}
corresponde precisamente a g : E E.
Finalmente, a medida fica definida por
| (Ek {n}) = | Ek

1.5. EXERCICIOS

47

claro que a restrica


para todo 0 n < k. E
o de ao andar terreo coincide
com . Alem disso, e invariante por f e
(M ) =

k=1

k(Ek ) =

d.

Isto completa a construca


o da torre de Kakutani-Rokhlin.
??

Exerccios

DR
AF

1.5

1.1. Utilizando o Lema 1.9, de outra prova de que a transformaca


o f (x) = 10x
mod 1 preserva a medida de Lebesgue no intervalo.

1.2. Mostre que o seguinte enunciado e equivalente ao Teorema 1.2, isto e,


qualquer um dos dois pode ser deduzido a partir do outro: Sejam f : M M
uma transformaca
o mensur
avel e uma medida invariante finita. Seja E M
qualquer conjunto mensur
avel com (E) > 0. Ent
ao existe N 1 e um conjunto
D E com medida positiva, tal que f N (x) E para todo ponto x D.

1.3. Seja f : M M uma transformaca


o invertvel e suponha que e uma
medida invariante -finita, ou seja, tal que existe uma sequencia crescente de
subconjuntos mensur
aveis Mk com medida finita cuja uni
ao e o espaco M inteiro.
Dizemos um ponto x vai para infinito se, para qualquer k, existe apenas um
n
umero finito de iterados de x que est
ao em Mk . Mostre que, dado qualquer
conjunto mensur
avel E M com (E) > 0, quase todo ponto x E regressa a
E infinitas vezes ou vai para infinito.
k dos pontos x E que nunca
Dica: Para cada k, considere o conjunto E
regressam a E e que tem um n
umero infinito de iterados em Mk . Comece por
mostrar que os seus iterados f n (Ek ), n 1 s
ao disjuntos dois-a-dois e use esse
k ) = 0.
fato para concluir que (E
1.4. Sejam f : M M uma transformaca
o n
ao necessariamente invertvel,
uma probabilidade invariante e D M um conjunto com medida positiva.
Prove que quase todo ponto de D passa uma fraca
o positiva do tempo em D:
lim sup
n

1
#{0 j n 1 : f j (x) D} > 0
n

para -quase todo ponto x D. D


a para substituir lim sup por lim inf no
enunciado ?

Dica: Considere o subconjunto dos pontos onde o lim sup = 0 e use o teorema
da convergencia dominada.
1.5. Prove que, para quase todo n
umero x [0, 1] cuja expans
ao decimal contem
o bloco 617 (por exemplo x = 0, 3375617264 ), esse bloco aparece infinitas
vezes na expans
ao.

48

CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

1.6. Prove que o dgito 7 aparece infinitas vezes na expans


ao decimal de quase
todo n
umero x [0, 1].
1.7. Para (Lebesgue) quase todo n
umero x0 (1/8, 1/7) o n
umero 7 aparece
infinitas vezes na sua expans
ao em fraca
o contnua, isto e, tem-se a n = 7 para
infinitos valores de n N.
1.8. Um n
umero x (0, 1) e racional se, e somente se, existe n 1 tal que
Gn (x) = 0.

DR
AF

1.9. Mostre que se A e uma matriz n n com coeficientes inteiros, ent


ao a
transformaca
o induzida fA : Tn Tn definida por fA ([x]) = [A(x)] preserva a
medida de Lebesgue de Tn .
1.10. Suponha que f : M M e um difeomorfismo local de classe C 1 de uma
variedade Riemanniana compacta M . Seja vol a medida de volume em M e seja
: M [0, ) uma funca
o contnua. Mostre que f preserva a medida = vol
se, e somente se,
X

xf 1 (y)

(x)
= (y) para todo y M.
| det Df (x)|

No caso em que f e invertvel isto significa que f preserva a medida se e


somente se (x) = (f (x))| det Df (x)| para todo x M .

1.11. Seja U um aberto de R2d e H : U R uma funca


o de classe C 2 . Deno2d
tamos as vari
aveis em R por (p1 , q1 , . . . , pd , qd ). O campo de vetores hamiltoniano associado a H e definido por


H
H
H
H
F (p1 , . . . , pd , q1 , . . . , qd ) =
,...,
,
,...,
.
q1
qd
p1
pd
Verifique que o fluxo definido por F preserva o volume.

1.12. Considere a sequencia 1, 2, 4, 8, . . . , an = 2n , . . . . Mostre que dado um


dgito i {1, . . . , 9}, existe uma quantidade infinita de valores n tal que an
comeca com este dgito.
1.13. Seja = (1 , . . . , d ) um vetor racionalmente independente. Mostre que
ao
rbita O([x]) = {Rn ([x]) : n N} e densa em Td para todo [x].

Captulo 2

DR
AF

Exist
encia de Medidas
Invariantes

Nesta captulo provaremos o seguinte resultado, que garante a existencia de


medidas invariantes para uma classe muito ampla de transformaco
es:
Teorema 2.1. Seja f : M M uma transformaca
o contnua num espaco
metrico compacto. Ent
ao existe pelo menos uma medida de probabilidade em M
que e invariante por f .

O passo principal na demonstraca


o deste teorema e considerar uma certa
topologia, chamada topologia fraca , no conjunto M1 (M ) das medidas de probabilidade em M . A ideia da definica
o e que duas medidas s
ao consideradas
pr
oximas se as integrais que elas d
ao a (muitas) funco
es contnuas limitadas
est
ao pr
oximas. A propriedade crucial que torna topologia fraca t
ao u
til para
provar o Teorema 2.1, e que ela faz de M1 (M ) um espaco compacto.
Ao final do captulo tambem introduzimos o operador de Koopman, que ser
a
muito u
til a seguir. Em particular ele nos permite usar ferramentas de An
alise
Funcional para dar uma prova alternativa do Teorema 2.1, como veremos.

2.1

Alguns exemplos simples

Comecemos por apresentar alguns exemplos que mostram que nenhuma das
duas hip
oteses do Teorema 2.1, continuidade e compacidade, pode ser omitida.
Considere f : (0, 1] (0, 1] dada por f (x) = x/2. Suponha que f admite
alguma probabilidade invariante; o objetivo e mostrar que isso n
ao acontece.
Pelo teorema de recorrencia (Teorema 1.5), relativamente a essa probabilidade
quase todo ponto de (0, 1] e recorrente. Mas e imediato que n
ao existe nenhum ponto recorrente: a o
rbita de qualquer x (0, 1] converge para zero e,
em particular, n
ao acumula no ponto inicial x. Portanto, f e um exemplo de
transformaca
o contnua num espaco n
ao compacto que n
ao admite nenhuma
probabilidade invariante.
49

50

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

Modificando um pouco o exemplo, podemos mostrar que o mesmo fen


omeno pode ocorrer em espacos compactos, se a transformaca
o n
ao e contnua.
Considere f : [0, 1] [0, 1] dada por f (x) = x/2 se x 6= 0 e f (0) = 1. Pela
mesma raz
ao que antes, nenhum ponto x (0, 1] e recorrente. Portanto, se
existe alguma probabilidade invariante ela tem que dar peso total ao u
nico
ponto recorrente, que e x = 0. Em outras palavras, precisa ser a medida de
Dirac 0 suportada em zero, que e definida por
0 (E) = 1 se 0 E

e 0 (E) = 0 se 0
/ E.

DR
AF

Mas a medida 0 n
ao e invariante por f : tomando E = {0} temos que E tem
medida 1 mas a sua pre-imagem f 1 (E) e o conjunto vazio, que tem medida
nula. Portanto, esta transformaca
o tambem n
ao tem nenhuma probabilidade
invariante.
O nosso terceiro exemplo e de natureza um pouco diferente. Consideremos
f : [0, 1] [0, 1] dada por f (x) = x/2. Trata-se de uma transformaca
o contnua
num espaco compacto. Logo, pelo teorema que iremos demonstrar, admite
alguma probabilidade invariante. Pelos mesmos argumentos que usamos no
caso anterior, se conclui que de fato h
a uma u
nica probabilidade invariante, que
e a medida de Dirac 0 suportada no ponto zero. Note que neste caso a medida
0 e de fato invariante.
Mencionamos este u
ltimo caso para enfatizar as limitaco
es do Teorema 2.1
(que s
ao inerentes a
` sua grande generalidade): as medidas que ele garante existirem podem ser completamente triviais; por exemplo, neste caso quando falamos
de quase todo pontoestamos nos referindo apenas ao ponto x = 0. Por isso,
um objetivo importante em Teoria Erg
odica e encontrar medidas invariantes
mais sofisticadas, com propriedades adicionais (por exemplo, serem equivalentes a
` medida de Lebesgue) que as tornem mais interessantes.

2.2

A topologia fraca

Nesta seca
o M sempre ser
a um espaco metrico. O nosso objetivo e definir a
topologia fraca no conjunto M1 (M ) das medidas borelianas de probabilidade
em M e discutir as suas propriedades principais.
Representamos por d(, ) a funca
o dist
ancia em M e por B(x, ) a bola de
centro x M e raio > 0. Dado B M , denotamos d(x, B) = inf{d(x, y) :
y B} e chamamos -vizinhanca de B ao conjunto B dos pontos x M tais
que d(x, B) < .

2.2.1

Defini
c
ao e propriedades da topologia fraca

Dada uma medida M1 (M ), um conjunto finito = {1 , . . . , N } de funco


es
contnuas limitadas i : M R e um n
umero > 0, definimos
Z
Z


V (, , ) = { M1 (M ) : i d i d < para todo i}.
(2.1)

2.2. A TOPOLOGIA FRACA

51

DR
AF

Note que a interseca


o de dois quaisquer conjuntos desta forma contem algum
conjunto desta forma. Isto assegura que a famlia {V (, , ) : , } pode ser
tomada como base de vizinhancas de cada M1 (M ).
A topologia fraca e a topologia definida por esta base de vizinhancas. Em
outras palavras, os abertos da topologia fraca s
ao os conjuntos A M1 (M )
tais que para todo elemento A existe algum V (, , ) contido em A.
Observe que esta topologia depende apenas da topologia de M e n
ao da sua
dist
ancia. Observe tambem que ela e Hausdorff: a Proposica
o 0.56 implica que
se e s
ao probabilidades distintas ent
ao existe > 0 e alguma funca
o contnua
limitada : M R tal que V (, {}, ) V (, {}, ) = .
Lema 2.2. Uma sequencia (n )nN converge para uma medida M1 (M ) na
topologia fraca se e somente se
Z
Z
dn d para toda funca
o contnua : M R.

Demonstraca
o. Para provar a parte somente se, considere qualquer funca
o
contnua limitada e forme o conjunto = {}. Como (n )n , temos que
dado qualquer > 0 existe uma ordem n
tal que n V (, , ) para todo
nn
. Mas isto significa, precisamente, que
Z
Z


dn d < para todo n n
.

R
R
Em outras palavras, a sequencia
d.
R ( dn )n converge para
R
A recproca afirma que se ( dn )n converge para d, para toda funca
o
contnua limitada ent
ao, dados quaisquer e existe uma ordem a partir da
qual n V (, , ). Para verificar esse fato, escrevemos = {1 , . . . , N }. A
hip
otese garante que para cada i existe n
i tal que
Z
Z


i dn i d < para todo n n
i .
Tomando n
= max{
n1 , . . . , n
N }, temos n V (, , ) para todo n n
.

2.2.2

Teorema Portmanteau

Vamos agora discutir outras maneiras u


teis de definir a topologia fraca . De
fato, nas relaco
es (2.2), (2.3), (2.4) e (2.5) apresentamos outras escolhas naturais
de vizinhancas de uma probabilidade M1 . Em seguida, no Teorema 2.3,
provamos que todas estas escolhas d
ao origem a
` mesma topologia em M 1 (M ),
que e a topologia fraca .
Dada qualquer famlia finita F = {F1 , . . . , FN } de fechados de M e dado
qualquer > 0, considere
Vf (, F, ) = { M1 : (Fi ) < (Fi ) + para todo i}.

(2.2)

52

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

A construca
o seguinte e an
aloga, apenas substituindo fechados por abertos.
Dada qualquer famlia finita A = {A1 , . . . , AN } de abertos de M e dado qualquer
> 0, considere
Va (, A, ) = { M1 : (Ai ) > (Ai ) para todo i}.

(2.3)

Chamamos conjunto de continuidade de qualquer conjunto boreliano B cujo


bordo B tem medida nula para . Dada uma famlia finita B = {B1 , . . . , BN }
de conjuntos de continuidade de e dado qualquer > 0, considere

DR
AF

Vc (, B, ) = { M1 : |(Bi ) (Bi )| < para todo i}.

(2.4)

Finalmente, consideremos uma variaca


o mais direta da definica
o da topologia
fraca , onde a base de vizinhancas e definido por
Z
Z



V (, , ) = { M1 (M ) :
i d i d < para todo i}.
(2.5)

onde > 0 e = {1 , . . . , N } e uma famlia finita de funco


es Lipschitz.
Lembre que uma funca
o e Lipschitz se existe alguma constante C > 0 tal que
|(x) (y)| Cd(x, y) para todo x, y no domnio.
Dadas duas topologias T1 e T2 num mesmo conjunto, dizemos que T1 e mais
fraca que T2 (ou T2 e mais forte que T1 ) se todo subconjunto que e aberto para
T1 tambem e aberto para T2 . Dizemos que as duas topologias s
ao equivalentes
se elas contem exatamente os mesmos abertos.
Teorema 2.3. As topologias definidas pelas bases de vizinhancas (2.1), (2.2),
(2.3), (2.4) e (2.5) s
ao todas equivalentes.

claro que a topologia (2.5) e mais fraca que a topologia (2.1),


Demonstraca
o. E
j
a que toda funca
o Lipschitz e contnua.
Para mostrar que a topologia (2.2) e mais fraca que a topologia (2.5), considere qualquer famlia finita F = {F1 , . . . , FN } de subconjuntos fechados de
M . De acordo com o Lema 0.57, para cada > 0 e cada i existe uma funca
o
Lipschitz i : M [0, 1] tal que XFi i XFi . Denote por o conjunto
das funco
es 1 , . . . , N obtidas deste modo. Como
Z
Z


i d i d < (Fi ) (Fi ) < para todo i
segue que V (, , ) est
a contido em Vf (, F, ).
f
E
acil ver que as topologias (2.2) e (2.3) s
ao equivalentes. De fato, seja
F = {F1 , . . . , Fn } uma famlia finita de fechados e seja A = {A1 , . . . , AN }, onde
claro que
cada Ai e o complementar de Fi . E
Vf (, F, ) = { M1 : (Fi ) < (Fi ) + para todo i}
= { M1 : (Ai ) > (Ai ) para todo i} = Va (, A, ).

Em seguida, vamos mostrar que a topologia (2.4) e mais fraca que a topologia
(2.2)=(2.3). Dada qualquer famlia finita B = {B1 , . . . , BN } de conjuntos de

2.2. A TOPOLOGIA FRACA

53

continuidade de seja, para cada i, Fi o fecho e Ai o interior de Bi . Denote


F = {F1 , . . . , FN } e A = {A1 , . . . , AN }. Como (Fi ) = (Bi ) = (Ai ),
(Fi ) < (Fi ) + (Bi ) < (Bi ) +

(Ai ) > (Ai ) (Bi ) > (Bi )

DR
AF

para todo i. Isto significa que Vf (, F, )Va (, A, ) est


a contido em Vc (, B, ).
Finalmente, provemos que a topologia (2.1) e mais fraca que a topologia
(2.4). Seja = {1 , . . . , N } uma famlia finita de funco
es contnuas limitadas.
Fixemos um inteiro ` tal que sup |i (x)| < ` para todo i. Para cada i, as preimagens 1
ao disjuntas duas-a-duas. Portanto, 1
i (s), s [`, `] s
i (s) = 0
exceto para um conjunto enumer
avel de valores de s. Em particular, podemos
escolher k N e pontos ` = t0 < t1 < tk1 < tk = ` tais que tj tj1 < /2
e ({1
ao cada
i (tj )}) = 0 para todo j. Ent
Bi,j = 1
i ((tj1 , tj ])

e conjunto de continuidade para . Alem disso,


k
X
j=1

tj (Bi,j )

i d

k
X

tj1 (Bi,j ) >

j=1

k
X
j=1

tj (Bi,j ) /2

e valem desigualdades an
alogas para as integrais relativamente a . Segue que

i d

k
X

i d
` |(Bi,j ) (Bi,j )| + /2

(2.6)

j=1

para todo i. Denote B = {Bi,j : i = 1, . . . , N e j = 1, . . . , k}. Ent


ao a relaca
o
(2.6) implica que Vc (, B, /(2k`)) est
a contido em V (, , ).

2.2.3

A topologia fraca
e metriz
avel

Agora suponha que o espaco metrico M e separ


avel, ou seja, ele admite subconjuntos enumer
aveis densos. Vamos mostrar que nesse caso e possvel exibir
dist
ancias em M1 (M ) que induzem a topologia fraca .
Dados , M1 (M ), defina D(, ) como sendo o nfimo de todos os
n
umeros > 0 tais que
(B) < (B ) +

e (B) < (B ) +

para todo boreliano B.

(2.7)

Lema 2.4. A funca


o D e uma dist
ancia em M1 (M ).

Demonstraca
o. Comecemos por mostrar que se D(, ) = 0 ent
ao = . De
fato, a hip
otese implica que
e (B) (B)

(B) (B)

54

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

representa o fecho. Quando


para todo subconjunto boreliano B M , onde B
B e um fechado estas desigualdades significam que (B) = (B). Como vimos anteriormente, duas medidas que coincidem nos subconjuntos fechados s
ao
necessariamente iguais.
Deixamos a verificaca
o das demais condico
es na definica
o de dist
ancia ao
cuidado do leitor.
Esta dist
ancia e denominada metrica de Levy-Prohorov. No que segue representaremos por BD (, r) a bola relativamente a D com centro em M1 (M )
e raio r > 0.

DR
AF

Proposi
c
ao 2.5. Se M e espaco metrico separ
avel ent
ao a topologia induzida
pela dist
ancia D coincide com a topologia fraca em M1 (M ).

Demonstraca
o. Seja > 0 e seja F = {F1 , . . . , FN } uma famlia finita de fechados de M . Fixe (0, /2) tal que (Fi ) < (Fi ) + /2 para todo i. Se
BD (, ) ent
ao
(Fi ) < (Fi ) + < (Fi ) + para todo i,

o que significa que Vf (, F, ). Isto mostra que a topologia induzida pela


dist
ancia D e mais forte que a topologia (2.2) que, como vimos anteriormente,
e equivalente a
` topologia fraca .
Resta provar que se M e separ
avel ent
ao a topologia fraca e mais forte que
a topologia induzida por D. Dado > 0, fixemos (0, /3). Para isso, seja
{p1 , p2 , . . . } um subconjunto enumer
avel denso de M . Para cada j, as esferas
B(pj , r) = {x : d(x, pj ) = r}, r > 0 s
ao disjuntas duas-a-duas. Portanto, e
possvel encontrar r > 0 arbitrariamente pequeno tal que (B(pj , r)) = 0 para
todo j. Fixemos um tal r, com r (0, /3). A famlia {B(pj , r) : j = 1, 2, . . . } e
uma cobertura enumer
avel de M por conjuntos de continuidade de . Fixemos
k 1 tal que o conjunto U = kj=1 B(pj , r) satisfaz

U > 1 .

(2.8)

Em seguida, consideremos a partica


o (finita) P de U definida pela famlia
{B(pj , r) : j = 1, . . . , k}: os elementos de P s
ao os conjuntos maximais P U
tais que, para cada j, ou P est
a contido em B(pj , r) ou P e disjunto de B(pj , r).
Veja a Figura 2.1. Em seguida, seja E a famlia de todos as uni
oes finitas de
elementos de P. Note que o bordo de todo elemento de E est
a contido na uni
ao
dos bordos dos B(pj , r), 1 j k e, consequentemente, tem medida nula. Ou
seja, todo elemento de E e conjunto de continuidade de .
Se Vc (, E, ) ent
ao
|(E) (E)| <

para todo E E.

Em particular, (2.8) juntamente com (2.9) implicam que



U > 1 2.

(2.9)

(2.10)

55

2.2. A TOPOLOGIA FRACA

Figura 2.1: Partica


o definida por uma cobertura

DR
AF

Agora, dado um subconjunto boreliano B qualquer, denote por EB a uni


ao dos
elementos de P que intersectam B. Ent
ao EB B e portanto a relaca
o (2.9)
d
a que
|(EB ) (EB )| < .

Observe que B est


a contida em EB U c . Alem disso, EB B porque todo
elemento de P tem di
ametro menor que 2r < . Estes fatos, juntamente com
(2.8) e (2.10) implicam que
(B) (EB ) + < (EB ) + 2 (B ) + 2

(B) (EB ) + 2 < (EB ) + 3 (B ) + 3.

Como 3 < , estas relaco


es implicam que BD (, ).

2.2.4

Compacidade de M1 (M )

Nesta seca
o supomos que o espaco metrico M e compacto e provamos

Teorema 2.6. O espaco M1 (M ) munido da topologia fraca e compacto.

Na demonstraca
o utilizaremos dois resultados cl
assicos, que enunciamos nos
dois teoremas a seguir. O leitor pode encontrar demonstraco
es destes teoremas
no livro de Rudin [Rud87].
Como e usual, denotamos por C 0 (M ) espaco vetorial C 0 (M ) das funco
es
contnuas : M R, munido da norma da convergencia uniforme:
kk = sup{|(x)| : x M }.

fato b
E
asico conhecido que esta norma e completa e portanto define em C 0 (M )
uma estrutura de espaco de Banach.

Teorema 2.7. C 0 (M ) e separ


avel, isto e, admite subconjuntos enumer
aveis
densos.

Um operador linear : C 0 (M ) R diz-se positivo se () > 0 para toda


funca
o positiva em todo ponto. O pr
oximo teorema diz que as integrais s
ao
os u
nicos operadores lineares positivos no espaco das funco
es contnuas:

56

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

Teorema 2.8 (Riesz-Markov). Seja : C 0 (M ) R qualquer operador linear


positivo. Ent
ao existe uma u
nica medida boreliana finita em M tal que
Z
() = d para toda C 0 (M ).
Alem disso, e uma probabilidade se e somente se (1) = 1.

Vamos agora provar o Teorema 2.6. Como j


a sabemos que o espaco M 1 (M )
e metriz
avel, basta provar a seguinte proposica
o:

DR
AF

Proposi
c
ao 2.9. Toda sequencia (k )kN em M1 (M ) admite alguma subsequencia que e convergente na topologia fraca .
Demonstraca
o. Seja {n : n N} um subconjunto enumer
avel densoR na bola
unit
aria de C 0 (M ). Para cada n N, a sequencia de n
umeros reais n dk ,
k N e limitada por 1. Portanto, para cada n N existe uma sequencia (k jn )jN
tal que
Z
n dkjn converge para algum n
umero n R quando j .

Alem disso, cada sequencia (kjn+1 )jN pode ser escolhida como subsequencia da
anterior (kjn )jN . Definamos `j = kjj para cada j N. Por construca
o, a menos
de um n
umero finito de termos, (`j )jN e uma subsequencia de (kjn )jN para
todo n. Logo
Z

n dn`j

para todo n N.

Daqui se deduz facilmente que

() = lim
j

d`j existe

(2.11)

para toda funca


o C 0 (M ). De fato, suponha primeiro que est
a na bola
0
unit
aria de C (M ). Dado qualquer > 0 podemos encontrar n F tal que
k n k . Ent
ao
Z
Z


d`j n d`j
para todo j. Como

n d`j converge (para n ), segue que


Z
Z
lim sup d`j lim inf d`j 2.
j

R
Como e arbitr
ario, conclumos que limj d`j existe. Isto prova (2.11)
quando a funca
o est
a na bola unit
aria. O caso geral reduz-se imediatamente a
esse, substituindo por /kk. Assim, completamos a prova de (2.11).
Finalmente, e claro que o operador : C 0 (M ) R definido por (2.11) e
linear e positivo: () min > 0 para toda funca
o C 0 (M ) positiva em

2.2. A TOPOLOGIA FRACA

57

todo ponto. Alem disso, (1) = 1. Logo, peloRTeorema 2.8, existe alguma probabilidade boreliana em M tal que () = d para toda funca
o contnua
. Agora a igualdade em (2.11) pode ser reescrita
Z
Z
= lim d`j para toda C 0 (M ).

De acordo com o Lema 2.2, isto quer dizer que a subsequencia (`j )jN converge
para na topologia fraca . Isto completa a demonstraca
o do Teorema 2.6.

Dualidade e topologias fracas

DR
AF

2.2.5

A definica
o da topologia fraca no espaco das probabilidades, que acabamos de
apresentar, e um caso particular de uma construca
o geral em An
alise Funcional
que vamos esbocar a seguir.
Seja E um espaco de Banach e seja E o seu dual, isto e, o espao dos
funcionais lineares contnuos g : E R. O dual e tambem um espaco de
Banach, com a norma
kgk = sup

 |g(v)|

: v E \ {0} .
kvk

(2.12)

A topologia fraca no espaco E e a topologia definida pela base de vizinhancas


V (v, {g1 , . . . , gN }, ) = {w E : |gi (v) gi (w)| < para todo i},

(2.13)

onde g1 , . . . , gN E . Em termos de sequencias, ela satisfaz


(vn )n v

(g(vn ))n g(v) para todo g E .

A topologia fraca no dual E e a topologia definida pela base de vizinhancas


V (g, {v1 , . . . , vN }, ) = {h E : |g(vi ) h(vi )| < para todo i},

(2.14)

onde v1 , . . . , vN E . Ela satisfaz


(gn )n g

(gn (v))n g(v)

para todo v E.

Esta u
ltima topologia e not
avel devido ao seguinte fato:

Teorema 2.10 (Banach-Alaoglu). Se o espaco E e separ


avel ent
ao a bola
unit
aria fechada de E e fechada para a topologia fraca .

A construca
o que realizamos anteriormente corresponde ao caso em que E
e o espaco C 0 (M ) das funco
es contnuas e E e o espaco M(M ) das medidas
1
com sinal num espaco metrico compacto M . De fato, segue do teorema de

1 Uma medida com sinal


ca = 1 2 de duas medidas (positivas) finitas
R
Re uma diferen
R
em M . Definimos d = d1 d2 para toda funca
o que e integr
avel para 1 e 2 .
Alem disso, f = f 1 f 2 .

58

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

Riesz-Markov (Teorema 2.8) que M(M ) corresponde ao dual de C 0 (M ) quando


R
identificamos cada medida M(M ) com o funcional linear I () = d.
Note que neste contexto a definica
o da norma (2.12) d
a
R
 | d|

kk = sup
: C 0 (M ) \ {0} .
sup ||

DR
AF

Em particular, o conjunto M1 (M ) das medidas de probabilidade est


a contido
na bola unit
aria de M(M ). Como este subconjunto e fechado na topologia
fraca , conclumos que o Teorema 2.6 tambem segue diretamente do teorema de
Banach-Alaoglu.
Agora consideremos uma transformaca
o contnua f : M M qualquer em
M e consideremos a sua aca
o
f : M(M ) M(M ),

7 f

no espao das medidas com sinal. Ent


ao f e um operador linear em M(M ) e e
contnuo relativamente a
` topologia fraca . Existe outro operador linear contnuo
naturalmente associado a f , a saber
Uf : C 0 (M ) C 0 (M ),

7 f.

Agora observe que estes operadores s


ao duais (lembre do Lema 2.13):
Z
Z
Z
Uf () d = ( f ) d = d(f ).

(2.15)

Estas consideraco
es motivam a noca
o de operador de Koopman, que apresentaremos na Seca
o 2.5.

2.2.6

Teorema de Prohorov

O teorema que vamos enunciar nesta seca


o d
a um criterio para compacidade de
uma famlia de medidas de probabilidade que se aplica mesmo para uma classe
de espacos metricos M que inclui praticamente todos os exemplos interessantes.

Defini
c
ao 2.11. Um conjunto M de medidas num espaco topol
ogico e justo
se para todo > 0 existe um subconjunto compacto K tal que (K c ) < para
toda media M.

Note que quando M se reduz a uma u


nica medida esta definica
o corresponde
exatamente a
` Definica
o 0.59. Claramente, esta propriedade e heredit
aria: se
um conjunto e justo ent
ao todo subconjuntodele tambem e justo. Note tambem
que se M e um espaco metrico compacto ent
ao o espaco M1 (M ) de todas as
medidas de probabilidade constitui um conjunto justo. Portanto o resultado a
seguir generaliza o Teorema 2.6:
Teorema 2.12 (Prohorov). Seja M e um espaco metrico separ
avel completo.
Ent
ao, dado qualquer K M1 (M ), as seguintes condico
es s
ao equivalentes:

(a) o conjunto K e justo

59

DO TEOREMA DE EXISTENCIA

2.3. DEMONSTRAC
AO

(b) toda sequencia em K possui alguma subsequencia convergente.

A demonstraca
o pode ser encontrada no livro de Billingsley [Bil68]. No
Exerccio 2.9 convidamos o leitor a provar que (a) implica (b), que e a parte
mais u
til do enunciado.

2.3

Demonstra
c
ao do teorema de exist
encia

DR
AF

Comecemos por introduzir uma notaca


o u
til. Dado f : M M e qualquer
medida em M denota-se
por
f

e
chama-se
iterado de por f a medida


definida por f B = f 1 (B) para cada conjunto mensur
avel E M .
Note que e invariante por f se e somente se f = .

Lema 2.13. Sejam uma medida e f uma funca


o mensur
avel limitada. Ent
ao
Z
Z
df = f d.
(2.16)

Demonstraca
o. Se e a funca
o caracterstica de um conjunto mensur
avel B
ent
ao a relaca
o (2.16) significa que f (B) = (f 1 (B)), o que e verdade por
hip
otese. Pela linearidade da integral, segue que (2.16) vale sempre que e uma
funca
o simples. Finalmente, como toda funca
o mensur
avel limitada pode ser
aproximada uniformemente por funco
es simples (veja a Proposica
o 0.29), segue
que a conclus
ao do lema e verdadeira em geral.

Proposi
c
ao 2.14. A aplicaca
o f : M1 (M ) M1 (M ) e contnua relativamente a
` topologia fraca .

Demonstraca
o. Seja > 0 e = {1 , . . . , n } uma famlia qualquer de funco
es
contnuas limitadas. Como f e contnua, a famlia = {1 f, . . . , n f }
tambem consiste de funco
es contnuas limitadas. Pelo lema anterior,
Z
Z
Z
Z
| i d(f ) i d(f )| = | (i f ) d (i f ) d|

e portanto o lado esquerdo e menor que se o lado direito for menor que . Isto
quer dizer que

f V (, , ) V (f , , )) para todo , e
e este u
ltimo fato mostra que f e contnua.

A esta altura, o Teorema 2.1 pode ser deduzido de um resultado cl


assico sobre
operadores contnuos em espacos vetoriais topol
ogicos, conhecido como teorema
do ponto fixo de Schauder-Tychonoff. Um espaco vetorial topol
ogico e um espaco
vetorial V munido de uma topologia relativamente a
` qual as duas operaco
es
(adica
o de vetores e produto de um vetor por um escalar) s
ao contnuas. Um
conjunto K V diz-se convexo se (1 t)x + ty K para todo x, y K e todo
t [0, 1].

60

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

Teorema 2.15 (Schauder-Tychonoff). Seja F : V V uma transformaca


o
contnua num espaco vetorial topol
ogico V . Suponha que existe um conjunto
compacto convexo K V tal que F (K) K. Ent
ao F (v) = v para algum
v K.

DR
AF

O Teorema 2.1 corresponde ao caso em que V = M(M ) e o espaco das


medidas com sinal, K = M1 (M ) e o espaco das probabilidades em M , e F =
f e a aca
o de f em M(M ). No entanto, a situaca
o do Teorema 2.1 e bem
mais simples do que o caso geral do teorema de Schauder-Tychonoff, porque
o operador f alem de ser contnuo tambem e linear. Isso permite dar uma
demonstraca
o direta e elementar do Teorema 2.1, que tambem tem a vantagem
de fornecer informaca
o adicional sobre a medida invariante.
Para fazer isso, seja uma probabilidade qualquer em M : por exemplo, a
medida de Dirac em um ponto qualquer. Forme a sequencia de probabilidades
n =

n1
1X j
f
n j=0

(2.17)

onde fj e a imagem de pelo iterado f j . Pelo Teorema 2.6, esta sequencia


tem algum ponto de acumulaca
o, ou seja, existe alguma subsequencia (nk )kN
e alguma probabilidade M1 (M ) tais que
nk 1
1 X
fj
nk j=0

(2.18)

na topologia fraca . Agora e suficiente provar o seguinte

Lema 2.16. Todo ponto de acumulaca


o de uma sequencia (n )nN do tipo
(2.17) e uma probabilidade invariante por f .

Demonstraca
o. A relaca
o (2.18) afirma que dada uma famlia = { 1 , . . . , n }
de funco
es contnuas limitadas e para todo > 0 tem-se
Z
k 1 Z
1 nX

j

(i f ) d i d < /2
nk j=0

(2.19)

para todo i e todo k suficientemente grande. Pelo Lema 2.14, temos que
f = f lim
k

nk 1
nk

1 X
1 X
fj = lim
fj .
k nk
nk j=0
j=1

(2.20)

Agora observe que

nk Z
k 1 Z

1 nX
1 X

(i f j ) d
(i f j ) d
nk j=0
nk j=1
Z
Z

1
2
=
i d (i f nk ) d
sup |i |
nk
nk

61

2.4. EXEMPLOS

e esta u
ltima express
ao e menor que /2 para todo i e todo k suficientemente
grande. Juntando este fato com (2.19), conclumos que
Z
nk Z
1 X


(i f j ) d i d <
nk j=1

(2.21)

para todo i e todo k suficientemente grande. Isto significa que

DR
AF

nk
1 X
fj
nk j=1

quando k . Mas (2.20) significa que esta mesma sequencia converge para
f . Por unicidade do limite, segue que f = .
Isto completa a demonstraca
o do Teorema 2.1.

Corol
ario 2.17 (Recorrencia de Birkhoff). Se f : M M e uma transformaca
o contnua num espaco metrico compacto ent
ao f tem algum ponto recorrente.

Demonstraca
o. Pelo Teorema 2.1, existe alguma probabilidade f -invariante .
Por outro lado, todo espaco metrico compacto admite uma base enumer
avel de
abertos. Portanto, podemos aplicar o Teorema 1.5, para concluir que -quase
todo ponto e recorrente. Em particular, o conjunto dos pontos recorrentes e n
ao
vazio, conforme foi afirmado.

2.4

Exemplos

Aqui vamos descrever algumas aplicaco


es do Teorema 2.1 e outras construco
es
interessantes de medidas invariantes.

2.4.1

Medidas em produtos semi-diretos

Sejam (X, A) e (Y, B) espacos mensur


aveis. Chamamos produto semi-direto a
qualquer transformaca
o mensur
avel F : X Y X Y da forma F (x, y) =
(f (x), g(x, y)). Representamos por : X Y X a projeca
o can
onica. Por
definica
o,
F = f .
(2.22)
Seja m uma probabilidade em X Y invariante por F e seja = m a sua
projeca
o para X. Ent
ao, usando a invari
ancia de m,
f = f m = F m = = ,

ou seja, e invariante por f . A pr


oxima proposica
o d
a uma recproca parcial
para esta conclus
ao: sob hip
oteses apropriadas, toda a medida invariante por f
e projeca
o de alguma medida invariante


CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

62

Proposi
c
ao 2.18. Suponha que M e um espaco metrico completo separ
avel, N
e um espaco metrico compacto e F e contnua. Ent
ao, para toda medida em
M invariante por f existe alguma medida m em X Y invariante por F , tal
que m = .
Deixamos a prova desta proposica
o a cargo do leitor (veja o Exerccio 2.10).
??

2.4.2

Fluxos suspens
ao

DR
AF

Vamos lembrar uma construca


o cl
assica que associa a cada transformaca
o invertvel f : M M e cada funca
o mensur
avel : M (0, ] um fluxo
g t : N N , t R chamado suspens
ao de f com tempo de retorno , cujas
propriedades de recorrencia est
ao diretamente ligadas a
`s propriedades da transformaca
o f . Alem disso, a cada medida invariante por f vamos associar uma
medida invariante pelo fluxo.
O primeiro passo e construir o domnio N do fluxo suspens
ao. Consideremos
a transformaca
o F : M R M R dada por F (x, s) = (f (x), s (x)).
Observe que F e invertvel. Seja a relaca
o de equivalencia em M R definida
por
(x, s) (
x, s) existe n Z tal que F n (x, s) = (
x, s).

Note que D0 = {(x, s) M R : 0 s < (x)} e um domnio fundamental


para esta relaca
o, ou seja, toda classe de equivalencia tem exatamente um representante em D0 . Representamos por N o conjunto das classes de equivalencia
desta relaca
o e denotamos por : M N a projeca
o can
onica que associa a
cada (x, s) M R a sua classe de equivalencia.
Agora considere o fluxo Gt : M R M R dado por Gt (x, s) = (x, s + t).

E imediato que Gt F = F Gt para todo t R. Isto garante que Gt , t R


induz um fluxo g t , t R no espaco quociente N , dado por
g t ((x, s)) = (Gt (x, s))

para todo x M e s, t R.

(2.23)

De fato, se (x, s) = (
x, s) ent
ao existe n Z tal que F n (x, s) = (
x, s). Logo,
Gt (
x, s) = Gt F n (x, s) = F n Gt (x, s)

e, portanto, (Gt (x, s)) = (Gt (


x, s)). Isto mostra que o fluxo g t , t R est
a
realmente bem definido.
A aplicaca
o x 7 (x, 0) e injetiva e portanto podemos identificar M com o
subconjunto = (M {0}) de N . Observando que
g (x) ((x, 0)) = (x, (x)) = (f (x), 0)

(2.24)

vemos que, com esta identificaca


o, a transformaca
o f : M M corresponde
a
` transformaca
o de primeiro retorno (ou transformaca
o de Poincare ) do fluxo
suspens
ao a . Veja a Figura 2.2.
Agora seja uma medida em M invariante por f . Denotemos por ds a
claro que a medida (infinita) ds e invariante
medida de Lebesgue na reta R. E

63

2.4. EXEMPLOS

PSfrag replacements
M

f (x)

(x)

DR
AF

Figura 2.2: Fluxo suspens


ao

pelo fluxo Gt , t R. Alem disso, ela e invariante pela transformaca


o F , uma
vez que e invariante por f . Chamamos suspens
ao de com tempo de retorno
a medida definida em N por
= ( ds | D0 ).

(2.25)

Em outras palavras, e a medida dada por


Z

d =

d(x)

(x)

((x, s)) ds

para cada funca


o mensur
avel limitada : N (0, ). Em particular,
Z
Z
(N ) = 1 d = (x) d(x)

(2.26)

e finito se, e somente se, a funca


o e integr
avel para .

Proposi
c
ao 2.19. O fluxo g t , t R preserva a medida .

Demonstraca
o. Fixemos t R. Dado qualquer conjunto mensur
avel B N ,
= 1 (B)D0 . Pela definica
Para
seja B
o de , temos que (B) = (ds)(B).
t
n

cada n Z seja Bn o conjunto dos (x, s) B tais que G (x, s) F (D0 ) e seja
n ). Como D0 e um domnio fundamental, {B
n : n Z} e uma partica
Bn = (B
o

n = 1 (Bn ) D0 e,
de B e {Bn : n Z} e uma partica
o de B. Alem disso, B
n ) para todo n. A definica
portanto, (Bn ) = ( ds)(B
o do fluxo suspens
ao
d
a que
[
[




n ) =
n ) .
1 g t (Bn ) = Gt 1 (Bn ) = Gt
F k (B
F k Gt (B
kZ

kZ

n )) D0 , conclumos que
Observando que F n (Gt (B



n )) .
g t (Bn ) = ( ds) 1 (g t (Bn )) D0 = ( ds) F n (Gt (B


CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

64

Como a medida ds e invariante por F e por Gt , a u


ltima express
ao e igual
n ). Portanto,
a ( ds)(B
X
X
n ) = ( ds)(B)
= (B).
(g t (B)) =
(g t (Bn )) =
( ds)(B
nZ

nZ

Isto prova que e invariante pelo fluxo g t , t R.

DR
AF

No Exerccio 2.12 convidamos o leitor a relacionar as propriedades de recorrencia dos sistemas (f, ) e (g t , ).

2.4.3

Transforma
co
es de Poincar
e

Aqui apresentamos uma especie de inversa da construca


o descrita na seca
o anterior. Seja g t : N N , t R um fluxo mensur
avel e seja uma medida
invariante. Seja uma seca
o transversal do fluxo, ou seja, um subconjunto
de N tal que para todo x existe (x) (0, ] tal que g t (x)
/ para
todo t (0, (x)) e g (x)(x) sempre que (x) for finito. Chamamos (x)
de tempo de primeiro retorno de x a . O nosso objetivo e construir, a partir
de , uma medida invariante para a transformaca
o de primeiro retorno (ou
transformaca
o de Poincare )
f : {x : (x) < } ,

f (x) = g (x) (x).

Observe que esta transformaca


o e injetiva.
Para cada > 0, denotamos = {x : (x) }. Dados A
e (0, ], denotamos A = {g t (x) : x A e 0 t < }. Observe que a
aplicaca
o (x, t) 7 g t (x) e uma bijeca
o de A [0, ) em A . Suporemos que
est
a munida de uma -
algebra de subconjuntos mensur
aveis para a qual:
1. a funca
o e as transformaco
es f e f 1 s
ao mensur
aveis;

2. se A e mensur
avel ent
ao A N e mensur
avel, para todo (0, ].

Lema 2.20. Seja A um subconjunto mensur


avel de para algum > 0.
Ent
ao, a funca
o 7 (A )/ e constante no intervalo (0, ].
claro que
Demonstraca
o. Considere qualquer (0, ] e qualquer l 1. E
A =

l1
[

g i/l (A/l )

i=0

e esta uni
ao e disjunta. Usando que e invariante pelo fluxo g t , t R,
conclumos que (A ) = l(A/l ) para todo (0, ] e todo l 1. Ent
ao,
(Ar ) = r(A ) para todo (0, ] e todo n
umero racional r (0, 1). Usando
que os dois lados desta relaca
o variam monotonamente com r, conclumos que
a igualdade permanece v
alida para todo n
umero real r (0, 1). Isso implica a
conclus
ao do lema.

65

2.4. EXEMPLOS

(A) =

Dado qualquer subconjunto mensur


avel A de , > 0, definimos
(A )

para qualquer (0, ].

Em seguida, dado qualquer subconjunto mensur


avel A de , definimos
(A) = sup (A ).

DR
AF

Veja a Figura 2.3. Deixamos ao cuidado do leitor verificar que e uma medida
em . N
os a chamaremos de transporte de pelo fluxo atraves de .

f (A)

PSfrag replacements

Figura 2.3: Medida transporte atraves de uma seca


o transversal

Proposi
c
ao 2.21. Suponhamos que a medida e finita. Ent
ao a medida em
e invariante pela transformaca
o de Poincare f .

Demonstraca
o. Comecamos por observar que a transformaca
o f e essencialmente sobrejetiva: o complementar da imagem f () tem medida nula. De fato,
suponha que existe um conjunto E com (E) > 0 contido em \ f (). N
ao e
restrica
o supor que E para algum > 0. Ent
ao, (E ) > 0. Como e
finita, por hip
otese, podemos aplicar o teorema de recorrencia de Poincare ao
fluxo g t , t R. Obtemos que existe z E tal que g s (z) E para valores
de s > 0 arbitrariamente grandes. Por definica
o, z = g t (y) para algum y E
e algum t (0, ]. Por construca
o, a trajet
oria passada de y intersecta e,
portanto, existe x tal que f (x) = y. Isto contradiz a escolha de E. Logo a
nossa afirmaca
o est
a provada.
Dado um conjunto mensur
avel B , denotemos A = f 1 (B). Alem disso,
dado > 0, consideremos uma partica
o enumer
avel de B em subconjuntos
mensur
aveis B i satisfazendo as seguintes condico
es: para cada i existe i > 0
tal que
1. B i e Ai = f 1 (B i ) est
ao contidos em i ;
2. sup( | Ai ) inf( | Ai ) < i .

66

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

Em seguida, escolha ti < inf( | Ai ) sup( | Ai ) < si tais que si ti < i .


Fixe i = i /2. Ent
ao, usando o fato de que f e essencialmente sobretiva,
g ti (Aii ) Bi i (si ti )

e g si (Aii ) Bi i +(si ti ) .

Logo, usando a hip


otese de que e invariante,

(Aii ) = (g ti (Aii )) (Bi i (si ti ) )

(Aii ) = (g si (Aii )) (Bi i +(si ti ) ).

Dividindo por i obtemos que

DR
AF

(si ti )
(B i ) > (1 2)(B i )

(si ti )
(Ai ) 1 +
(B i ) < (1 + 2)(B i ).

Finalmente, somando sobre todos os valores de i, conclumos que


(Ai ) 1

(1 2)(A) (B) (1 + 2)(A).

Como e arbitr
ario, isto prova que a medida e invariante por f .

2.4.4

Extens
ao natural

Dada uma transformaca


o qualquer f : M M e sempre possvel encontrar uma
M
que e invertvel. Por extens
extens
ao f : M
ao queremos dizer que existe
M tal que f = f . Este fato e muito
uma aplicaca
o sobrejetiva : M
u
til porque permite reduzir a prova de muitos enunciados do caso geral ao caso
de transformaco
es invertveis. Na verdade, extens
oes invertveis est
ao longe de
ser u
nicas. Por outro lado, a construca
o que vamos apresentar nesta seca
o e,
e o menor espaco onde e possvel definir uma
em algum sentido, minimal: M
extens
ao invertvel da transformaca
o f . Em particular, dada qualquer medida
invariante de f existe uma u
nica medida invariante
de f tal que
= .
o conjunto de todas as pre-
Para comecar, tomamos para M
orbitas de f , ou
seja, o conjunto de todas as sequencias (xn )n0 indexadas pelos n
umeros inteiros
n
ao-positivos e satisfazendo f (xn ) = xn+1 para todo n < 0. Consideramos a
M que associa a cada sequencia (xn )n0 o seu termo x0 de
aplicaca
o : M
M
como sendo o deslocamento a
ordem zero. Finalmente, definimos f : M
`
esquerda:
f(. . . , xn , . . . , x0 ) = (. . . , xn , . . . , x0 , f (x0 )).
claro que f est
E
a bem definida e satisfaz f = f . Alem disso, ela e
invertvel: a inversa e o deslocamento a
` direita
(. . . , yn , . . . , y1 , y0 ) 7 (. . . , yn , . . . , y2 , y1 ).

um espaco mensur
Se M e um espaco mensur
avel podemos tornar M
avel,
munindo-o da -
algebra gerada pela famlia dos subconjuntos
: xi Ai para i = k, . . . , 0}
[k; Ak , . . . , A0 ] = {(xn )n0 M

(2.27)

67

2.4. EXEMPLOS

onde k 0 e Ak , . . . , A0 s
ao subconjuntos mensur
aveis de M . Ent
ao e
aplicaca
o mensur
avel, uma vez que
1 (A) = [0; A].

(2.28)

Alem disso, f e mensur


avel se f for:

f1 ([k; Ak , . . . , A0 ]) = [k 1; Ak , . . . , A2 , A1 f 1 (A0 )].

(2.29)

A inversa de f tambem e mensur


avel, j
a que

(2.30)

DR
AF

f([k; Ak , . . . , A0 ]) = [k + 1; Ak , . . . , A0 , M ].

um espaco
Analogamente, se M e um espaco topol
ogico podemos tornar M
topol
ogico, munindo-o da topologia gerada pela famlia dos subconjuntos
: xi Ai para i = k, . . . , 0}
[k; Ak , . . . , A0 ] = {(xn )n0 M

(2.31)

onde k 0 e Ak , . . . , A0 s
ao subconjuntos abertos de M . As relaco
es (2.28) e
(2.30) mostram que e f1 s
ao contnuas, enquanto que (2.29) mostra que f e
contnua se f for.
um espaco
Se M e um espaco metrico, com dist
ancia d, podemos tornar M
metrico munindo-o da dist
ancia
d x
, y) =

0
X

2n d(xn , yn ),

onde x = (xn )n0 e y = (yn )n0 .

n=

A seguinte observaca
o e uma consequencia imediata da definica
o: se x
e y est
ao
numa mesma pre-imagem 1 (x) ent
ao
fj (
x, y) para todo j 0.
d(
x), fj (
y )) 2j d(

Portanto, toda pre-imagem 1 (x) e um conjunto est


avel, ou seja, um conjunto
uniformemente contrativo para a transformaca
o f.
Um conjunto M tal que f 1 () = e chamado conjunto invariante
A pr
de f . Vale uma noca
o an
aloga para a transformaca
o f.
oxima proposica
o
mostra que todo conjunto invariante fechado de f admite um u
nico levantamento
a um conjunto invariante fechado de f:

Proposi
c
ao 2.22. Suponha que M e um espaco topol
ogico. Se M e
= 1 () e o u
um conjunto invariante fechado de f ent
ao
nico conjunto
= .
invariante fechado de f satisfazendo ()

Demonstraca
o. Segue imediatamente da propriedade f = f que se e
conjunto invariante de f ent
ao 1 () e conjunto invariante de f. Como e
1
um conjunto
contnua, () e fechado se for. Na direca
o recproca, seja

invariante fechado de f tal que () = . Queremos mostrar que, dado qualquer


CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

68

Escrevamos x = (xn )n0 .


x0 , todo ponto x 1 (x0 ) est
a contido em .
Considere qualquer vizinhanca de x da forma:
V = [k; Ak , . . . , A0 ],

com k 0 e Ak , . . . , A0 abertos em M .

(2.32)

DR
AF

Note que fk (
x) 1 (xk ) e que xk , uma vez que xk f k (x) e o conjunto
= implica que existe algum
e invariante por f . Ent
ao, a hip
otese de que ()
1
segue que fk (

ponto yk (xk ) . Como e invariante por f,


yk ) .
k
Alem disso, e claro da construca
o que f (
yk ) V . Isto mostra que x e
j
acumulado por elementos de ,
a que os conjuntos V da forma (2.32) formam
e fechado, segue que x

uma base de vizinhancas. Como


.
Agora seja
uma medida invariante por f e seja =
. A propriedade

f = f implica que e invariante por f :


f = f
= f
=
= .

Dizemos que
e um levantamento de . O pr
oximo resultado, que e uma
vers
ao da Proposica
o 2.22 para medidas, afirma que toda medida invariante de
f admite um u
nico levantamento a uma medida invariante de f:

Proposi
c
ao 2.23. Seja uma medida em M invariante por f . Ent
ao existe
invariante por f tal que
uma u
nica medida
em M
= .

Demonstraca
o. Seja
qualquer levantamento de f. De acordo com (2.28), a
condica
o
= implica que

([0; A0 ]) =
( 1 (A0 )) = (A0 )

para todo conjunto mensur


avel A0 M . De acordo com (2.29),

fk ([k; Ak , . . . , A0 ]) = [0; Ak f1 (Ak+1 ) f k (A0 )].

Logo, a condica
o de que
e invariante por f implica que




[k; Ak , . . . , A0 ] =
[0; Ak f 1 (Ak+1 ) f k (A0 )]

= Ak f 1 (Ak+1 ) f k (A0 )

(2.33)

para todo k 0 e quaisquer subconjuntos mensur


aveis Ak , . . . , A0 de M . Por
aditividade, a igualdade (2.33) caracteriza a medida
de maneira u
nica na
a
lgebra B0 das uni
oes finitas disjuntas de conjuntos [k; Ak , . . . , A0 ]. Como B0
isto prova a unicidade do levantamento. ??
gera a -
algebra de M,
??

2.5. OPERADOR DE KOOPMAN

Operador de Koopman

2.5

69

DR
AF

Nesta seca
o apresentamos uma isometria linear no espaco L1 () motivada pela
discuss
ao na Seca
o 2.2.5. A sua grande utilidade e permitir o uso de ferramentas
de An
alise no estudo das propriedades de medidas invariantes. Para ilustrar
este fato, daremos uma demonstraca
o alternativa do Teorema 2.6 a partir de
propriedades espectrais deste operador.
Seja (M, B) um espaco mensur
avel, f : M M uma transformaca
o mensur
avel e e uma medida invariante por f . O operador de Koopman e o operador
linear
Uf : L1 () L1 (), Uf () = f.

Note que Uf est


a bem definido e preserva a norma de L1 ():
Z
Z
Z
kUf ()k1 = |Uf ()| d = || f d = || d = kk1

(2.34)

uma vez que e invariante. Alem disso, Uf e um operador linear positivo:


Uf () > 0 em -quase todo ponto sempre que > 0 em -quase todo ponto.
Resumimos estes fatos na seguinte proposica
o:
Proposi
c
ao 2.24. O operador Uf : L1 (M ) L1 (M ) induzido por f e linear,
positivo e uma isometria, isto e, ele preserva a norma de L1 ().

A propriedade (2.34) implica que o operador Uf e injetivo. Porem, em geral


Uf n
ao e sobrejetivo (a menos que f seja invertvel). Veja o Exerccio 2.11.
Podemos tambem considerar vers
oes do operador de Koopman definidas nos
espacos Lp (),
Uf : Lp () Lp (), Uf () = f
para qualquer p [1, ]. A Proposica
o 2.24 permanece v
alida em todos estes
casos: todos estes operadores s
ao isometrias lineares positivas.
Quando M e um espaco metrico e f e contnua, e particularmente interessante observar a aca
o de Uf restrita ao espaco C 0 (M ) das funcco
es contnuas:
Uf : C 0 (M ) C 0 (M ).

f
E
acil verificar que este operador e contnuo relativamente a
` norma da convergencia uniforme. Conforme vimos na Seca
o 2.2.5 o dual de C 0 (M ) est
a
identificado de maneira natural com o espaco M(M ) das medidas com sinal em
M . Alem disso, a relaca
o (2.15) mostra que o o operador dual
Uf : C 0 (M ) C 0 (M )

corresponde precisamente a
` aca
o f : M(M ) M(M ) da transformaca
o f
quando fazemos essa identificaca
o. Esse fato vai nos permitir usar resultados de
Teoria Espectral para dar outra demonstraca
o do Teorema 2.1.
Para isso precisamos lembrar algumas noco
es da teoria de operadores positivos. O leitor interessado poder
a encontrar mais detalhes e demonstraco
es no
livro de Deimling [Dei85].


CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

70

Seja E um espaco de Banach sobre os reais. Um subconjunto fechado e


convexo C e chamado de cone de E, se ele satisfaz:
C C para todo 0 e C (C) = {0}.
Dizemos que o cone C e normal quando

inf{kx + yk : x, y C tais que kxk = kyk = 1} > 0.

DR
AF

Fixemos um cone C de E. Dado um operador linear contnuo T : E E,


diremos que T e um operador positivo sobre C se T (C) C. Dado um funcional
linear contnuo : E R, diremos que e um funcional positivo sobre C se
(v) 0 para todo v C. Por definica
o, o cone dual C e o cone em E
formado por todos os funcionais positivos.
imediato que C 0 (M )+ = { C 0 (M ) : 0} e um cone
Exemplo 2.25. E
0
normal de C (M ). Pelo teorema de Riesz-Markov (Teorema 2.8), o cone dual e
identificado naturalmente com o espaco das medidas (positivas) finitas em M .
Denotaremos por r(T ) o raio espectral do operador linear contnuo T :
p
r(T ) = lim n kT nk.
n

Representando por T : E E o operador dual de T , vale que r(T ) = r(T ).


O resultado a seguir e um consequencia do teorema de Banach-Mazur; veja a
Proposica
o 7.2 no livro de Deimling [Dei85]:
Teorema 2.26. Seja C um cone normal num espaco de Banach E e seja T :
E E um operador positivo sobre C. Ent
ao, r(T ) e autovalor do operador

dual T : E E e admite autovetor v C .


Como aplicaca
o deste resultado, vamos dar uma prova alternativa da existencia de probabilidades invariantes. Considere o cone C = C 0 (M )+ em E =
C 0 (M ). Conforme j
a observamos, o cone dual C e o espaco das medidas

finitas em M . E claro da definica


o que o operador T = Uf e positivo sobre
C. Alem disso, o seu raio espectral e igual a 1, uma vez que o operador U f e
uma isometria. Logo, pelo Teorema 2.26, existe alguma medida finita em M
que e autovetor do operador dual T = f associado ao autovalor 1. Em outras
palavras, a medida e invariante. Multiplicando por uma constante adequada,
podemos supor que e uma probabilidadde.

2.6

Exerccios

2.1. Seja M um espaco metrico e (n )n uma sequencia em M1 (M ). Mostre


que as seguintes condico
es s
ao todas equivalentes:
1. (n )n converge para uma probabilidade na topologia fraca .

2. lim supn n (F ) (F ) para todo fechado F M .

2.6. EXERCICIOS

71

3. lim inf n n (A) (A) para todo aberto A M .

4. limn n (B) = (B) para todo conjunto de continuidade B de .


R
R
5. limn dn = d para toda funca
o Lipschitz : M R.

DR
AF

2.2. Prove a seguinte generalizaca


o do Lema 2.16: Seja f : M M uma
transformaca
o contnua num espaco metrico compacto, uma probabilidade
em M e (In )n uma sequencia de intervalos de n
umeros naturais tais que #In
converge para infinito quando n vai para infinito. Ent
ao qualquer ponto de
acumulaca
o da sequencia
1 X j
n =
f
#In
jIn

e uma probabilidade f -invariante.

2.3. Fixe qualquer subconjunto denso F da bola unit


aria de C 0 (M ). Mostre que
uma sequencia (n )nN de probabilidades em M converge na topologia fraca
para alguma M1 (M ) se, e somente se,
Z
Z
dn converge para
d para todo F.

2.4. Seja f1 , f2 , . . . , fN : M M uma famlia finita qualquer de transformaco


es
contnuas num espaco metrico compacto que comutam entre si: fi fj = fj fi
para todo i e todo j. Prove que existe alguma probabilidade que e invariante
por fi para todo i {1, 2, . . . , N }.
2.5. Mostre que o conjunto das medidas com suporte finito e denso em M1 (M ),
relativamente a
` topologia fraca .
2.6. A topologia uniforme em M1 (M ) e definida pelo sistema de vizinhancas
Vu (, ) = { M1 (M ) : |(B) (B)| < para B B}

e a topologia pontual e definida pelo sistema de vizinhancas

Vp (, B, ) = { M1 (M ) : |(Bi ) (Bi )| < para i}

onde > 0, n 1 e B = {B1 , . . . , BN } e uma famlia finita de conjuntos


mensur
aveis. Observe que a topologia uniforme e mais forte que a topologia
pontual a qual, por sua vez, e mais forte que a topologia fraca . Mostre, por
meio de exemplos, que essas relaco
es podem ser estritas.

2.7. Sejam Vk , k = 1, 2, . . . vari


aveis aleat
orias reais, ou seja, funco
es mensur
aveis reais Vk : (X, B, ) R definidas em algum espaco de probabilidade
(X, B, ). A funca
o de distribuica
o de Vk e a funca
o Fk : R [0, 1] definida
por Fk (a) = ({x X : Vk (x) a}). Diz-se que (Vk )k converge em distribuica
o
para uma vari
avel aleat
oria V se
lim Fk (a) = F (a) para todo ponto de continuidade a de F ,
k

onde F representa a funca


o de distribuica
o de V . O que isto tem que ver com
a topologia fraca ?

72

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

2.8. Seja M um espaco metrico. Mostre que para toda funca


o mensur
avel
limitada : M R existe uma sequencia n : M R, n 1 de funco
es
contnuas satisfazendo sup |n | sup || e convergindo para || em todo ponto.
Dica: Comece por tratar o caso de funco
es caractersticas. Seja A a famlia
de todos os boreliamos cuja funca
o caracterstica e limite de funco
es contnuas
n : M [0, 1]. Use o Lema 0.57 para verificar que A contem todos os subconjuntos fechados de M . Mostre que A e uma -
algebra e, portanto, contem
todos os borelianos. Finalmente, trate o caso geral.

DR
AF

2.9. Mostre que (a) implica (b) no Teorema 2.12, ou seja, se K M1 (M ) e


justo ent
ao toda sequencia em K admite alguma subsequencia convergente em
M1 (M ).
2.10. Prove a Proposica
o 2.18.
Dica: Use o Exerccio 2.9.

2.11. Mostre, por meio de um exemplo, que o operador de Koopman Uf pode


n
ao ser sobrejetivo. Existe algum exemplo em que f n
ao e invertvel e, ainda
assim, Uf e sobrejetivo? ??

2.12. Seja f : M M uma transformaca


o mensur
avel e uma medida invariante. Seja g t : N N um fluxo suspens
ao de f e seja a suspens
ao
correspondente da medida (veja a Seca
o 2.4.2).
(a) Mostre que x M e recorrente para a transformaca
o f se, e somente se,
(x, s) N e recorrente para o fluxo g t , qualquer que seja s R.

(b) Conclua que o conjunto dos pontos recorrentes de f tem medida total para
se, e somente se, o conjunto dos pontos recorrentes de g t , t R tem
medida total para

Em particular, isto acontece se pelo menos uma das medidas ou e finita.


2.13. Seja g t : N N , t R o fluxo definido por um campo de vetores X de
classe C 1 numa variedade Riemanniana compacta N . Suponha que este fluxo
preserva a medida de volume associada a
` metrica Riemanniana. Seja uma
hipersuperfcie de N transversal a X em todo ponto e seja a medida de volume
em associada a
` restrica
o da metrica Riemanniana. Defina : (0, ) por
(x) = |X(x) N (x)|, onde N (x) e um vetor unit
ario ortogonal a . Mostre
que a medida = e invariante pela transformaca
o de Poincare f :
do fluxo. De fato, ela coincide com a medida transporte do volume pelo fluxo
atraves de (Seca
o 2.4.3).
A construca
o no pr
oximo exerccio tem um papel relevante na teoria de
interc
ambios de intervalos:
R4 o conjunto das 4-uplas (1 , 2 , h1 , h2 ) munido da medida de
2.14. Seja N
volume = d1 d2 dh1 dh2 . Defina
Gt : M M, t R,

Gt (1 , 2 , h1 , h2 ) = (et 1 , et 2 , et h1 , et h2 )

2.6. EXERCICIOS
F (1 , 2 , h1 , h2 ) =

(2 , 1 2 , h1 + h2 , h1 ) se 1 > 2
(2 1 , 2 , h2 , h1 + h2 ) se 1 < 2 .

F : M M,

73

pela relaca
Seja N o quociente de N
o de equivalencia z z F n (z) = z para

(0, ) o
algum n Z. Seja : N N a projeca
o can
onica. Seja a
: M
funcional definido por a
(1 , 2 , h1 , h2 ) = 1 h1 + 2 h2 .
Mostre que
1. F preserva a medida ; logo, define uma medida no espaco quociente
N . Essa medida e finita?

DR
AF

2. F preserva a
; logo, existe um funcional a : N N tal que a = a
.

3. Gt comuta com F ; logo, Gt induz um fluxo g t no espaco quociente N .


4. Gt preserva
; logo, g t preserva a medida .

5. Gt preserva a
; logo, g t preserva o funcional a.

6. = ({(1 , 2 , h1 , h2 ) : 1 + 2 = 1} e uma seca


o transversal para g t .

7. Calcule a transformaca
o de Poincare f : , bem como o tempo de
primeiro retorno .

8. Calcule a medida induzida por em (recorde a Seca


o 2.4.3). Essa
medida e finita?
9. Verifique que e invariante por f .


CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

DR
AF

74

Captulo 3

DR
AF

Teoremas Erg
odicos

Neste captulo discutiremos alguns dos principais resultados da Teoria Erg


odica.
Para motivar o tipo de problema ao qual eles respondem, consideremos um
conjunto mensur
avel E M com medida positiva e um ponto x M qualquer.
Queremos analisar o conjunto dos iterados de x que visitam E, isto e,
{j 0 : f j (x) E}.

Por exemplo, o teorema de recorrencia de Poincare afirma que, para quase todo
x E, este conjunto e infinito. Gostaramos de ter informaca
o mais precisa, de
natureza quantitativa. Chamamos tempo medio de visita de x a E o valor de
E (x) = lim

1
#{0 j < n : f j (x) E}.
n

(3.1)

No caso de fluxos temos uma noca


o an
aloga, definida por
E (x) = lim


1
m {0 t T : f t (x) E}
T

(3.2)

(m e a medida de Lebesgue na reta). Seria interessante saber, por exemplo,


em que condico
es este tempo medio de visita e positivo. Antes de abordar este
problema e necess
ario responder a uma quest
ao ainda mais b
asica: o limite em
(3.1)-(3.2) existe?
Estas perguntas remontam ao trabalho do grande fsico austraco Ludwig
Boltzmann (1844-1906), fundador da teoria cinetica dos gases. Boltzmann era
partid
ario da teoria at
omica, que na epoca ainda era muito controversa, segundo
a qual a materia gasosa est
a formada por um grande n
umero de min
usculas
partculas em movimento e que se chocam continuamente. Em princpio, seria
possvel descrever o comportamento de um gas sistemas aplicando as leis da
Mec
anica Newtoniana a cada uma das suas partculas (moleculas). Na pr
atica
isso n
ao e realista, p orque o n
umero de moleculas e enorme.
O problema da teoria cinetica dos gases era, ent
ao, explicar o comportamento observ
avel dos gases, no nvel macrosc
opico, como resultado estatstico
75


CAPITULO 3. TEOREMAS ERGODICOS

76

DR
AF

da combinaca
o de todos esses movimentos das suas moleculas. Para formular
a sua teoria, Boltzmann sentiu necessidade de fazer uma suposica
o, que ficou
conhecida como hip
otese erg
odica. Em linguagem moderna, a hip
otese erg
odica
afirma que, para os sistemas (fluxos hamiltonianos) que descrevem o movimento
das partculas de um g
as, o tempo medio de visita a qualquer subconjunto mensur
avel E existe e e igual a
` medida de E, para quase todo ponto x.
O esforco para validar (ou invalidar) esta hip
otese conduziu a importantes
avancos tanto em Matem
atica (Teoria Erg
odica, Sistemas Din
amicos) quanto
em Fsica Te
orica (Mec
anica Estatstica). O que nos diz respeito neste captulo
s
ao os resultados matem
aticos relativos a
` existencia do tempo medio de visita.
A quest
ao de saber quando E (x) = (E) para quase todo x ser
a tratada no
Captulo 4.
Representando por a funca
o caracterstica do conjunto E, podemos reescrever a express
ao no lado direito de (3.1) como:
lim

n1
1X
(f j (x)).
n j=0

(3.3)

Isto sugere uma generalizaca


o natural da nossa pergunta inicial: o limite acima
existe para funco
es muito gerais, por exemplo, para todas as funco
es integr
aveis?
O teorema erg
odico de Von Neumann (Teorema 3.4) afirma que, de fato, o
limite em (3.3) existe no espaco L2 (), para toda funca
o L2 (). O teorema
erg
odico de Birkhoff (Teorema 3.8) vai mais longe e afirma que h
a convergencia
em -quase todo ponto, para toda funca
o L1 (). Em particular, o limite
em (3.1) est
a bem definido para -quase todo x (Teorema 3.6).
Daremos uma demonstraca
o direta do teorema de von Neumann e tambem
mostraremos como ele pode ser deduzido do teorema erg
odico de Birkhoff.
Quanto a este u
ltimo, iremos obte-lo como caso particular de um resultado
ainda mais forte, o teorema erg
odico subaditivo de Kingman (Teorema 3.16).
Este teorema afirma que n /n converge em quase todo ponto, para qualquer
sequencia de funco
es n tal que m+n m + n f m .
Todos estes resultados permanecem v
alidos para fluxos, m
odulo adaptaco
es
naturais dos enunciados.

3.1

Teorema erg
odico de Von Neumann

Nesta seca
o enunciamos e provamos o teorema erg
odico de von Newumann.

3.1.1

Isometrias em espa
cos de Hilbert

Lembre que um espaco de Hilbert e umpespaco vetorial H munido de um produto


interno hu, vi tal que a norma kvk = hv, vi que lhe est
a associada e completa
(toda sequencia de Cauchy e convergente). Vamos considerar apenas espacos de
Hilbert sobre R.


3.1. TEOREMA ERGODICO
DE VON NEUMANN

77

Dado um subespaco fechado F de H e dado qualquer vetor x H, existe


um u
nico vetor PF (x) F tal que
kx PF (x)k = inf{kx vk : v F }.

Observe que PF (v) = v para todo v F e, por consequencia, PF2 = PF . Alem


disso, hx PF (x), vi = 0 para todo v F , ou seja, x PF (x) pertence ao
complemento ortogonal F . Chamamos a PF (v) projeca
o ortogonal de x em
F . Escrevendo x = PF (x) + x PF (x) vemos que H = F + F . Como
F F = {0}, segue que

DR
AF

H = F F

para todo subespaco fechado F H.

(3.4)

Exemplo 3.1. Considere o espaco de Hilbert L2 (), com o produto interno


Z
h, i = d.

Se 0 e a funca
o constante igual a 1 e F = h0 i e o subespaco gerado por 0
em L2 (), ou seja, o espaco das funco
es constantes, ent
ao a projeca
o ortogonal
PF () e definida por
Z
PF () =

d.

De fato, como F e gerado por 0 , temos que PF () = c0 para algum c R.


Para calcular a constante c, note que
Z
h, 0 i
hPF () , 0 i = 0 c =
= d.
h0 , 0 i
Dado um operador linear contnuo U : H H, definimos o seu adjunto
U : H H pela relaca
o
hU u, vi = hu, U vi para todo u, v H.

(3.5)

O operador diz-se uma isometria se ele preserva o produto interno:


hU u, U vi = hu, vi para todo u, v H.

(3.6)

Isso e equivalente a dizer que U preserva a norma de H (veja o Exerccio 3.1).


Outra condica
o equivalente e U U = id . De fato,
hU u, U vi = hu, vi u, v

hU U u, vi = hu, viu, v

U U = id .

A propriedade U U = id implica que U e injetivo; em geral, uma isometria n


ao
e necessariamente sobrejetiva. Veja os Exerccios 2.11 e 3.2.
Exemplo 3.2. Se f : M M preserva uma medida ent
ao, como vimos na
Seca
o 2.5, o seu operador de Koopman Uf : L2 () L2 () e uma isometria.


CAPITULO 3. TEOREMAS ERGODICOS

78

Dada um operador linear contnuo U : H H, definimos o conjunto dos


vetores invariantes por U como o sendo o subespaco
I(U ) = {v H : U v = v}.

Observe que I(U ) e um subespaco vetorial fechado, uma vez que U e contnuo.
Quando U e uma isometria, temos que I(U ) = I(U ):
Lema 3.3. Se U : H H e uma isometria ent
ao U v = v se, e somente se,
U v = v.

DR
AF

Demonstraca
o. Como U U = id , e claro que U v = v implica U v = v. Agora
suponha que U v = v. Ent
ao hU v, vi = hv, U vi = hv, vi = kvk2 . Logo, usando
que U preserva a norma de H,
kU v vk2 = hU v v, U v vi = kU vk2 2hU v, vi + kvk2 = 0.

Isto significa que U v = v.

3.1.2

Enunciado e prova do teorema

Teorema 3.4 (von Neumann). Seja U : H H uma isometria num espaco


de Hilbert H, e seja P a projeca
o ortogonal sobre o subespaco I(U ) dos vetores
invariantes por U . Ent
ao,
n1
1X j
U v = Pv
n n
j=0

lim

para todo v H.

(3.7)

Demonstraca
o. Seja L(U ) o conjunto dos vetores v H da forma v = U u u
) o seu fecho. Afirmamos que
para algum u H e seja L(U
) .
I(U ) = L(U

(3.8)

Isto pode ser verificado da seguinte forma. Considere quaisquer v I(U ) e


). Pelo Lema 3.3, temos que v I(U ), ou seja U v = v. Alem disso,
w L(U
), existem un H, n 1 tais que U uk uk w. Ent
por definica
o de L(U
ao
hv, U un un i = hv, U un i hv, un i = hU v, un i hv, un i = 0

) .
para todo n e, como consequencia, hv, wi = 0. Isto prova que I(U ) L(U

Em seguida, considere qualquer v L(U ) . Ent


ao, em particular,
hv, U u ui = 0 ou seja, hU v, ui hv, ui = 0

para todo u H. Isto quer dizer que U v = v. Usando Lema 3.3 uma vez mais,
) I(U ) e, portanto, a prova
deduzimos que v I(U ). Isto mostra que L(U
de (3.8) est
a completa. Como consequencia, usando (3.4),
)
H = I(U ) L(U

(3.9)


3.1. TEOREMA ERGODICO
DE VON NEUMANN

79

Agora vamos verificar a igualdade (3.7), sucessivamente, quando v I(u),


), e no caso geral. Suponha primeiro que v I(u). Por um
quando v L(U
lado, P v = v. Por outro lado,
n1
n1
1X j
1X
U v=
v=v
n j=0
n j=0

DR
AF

para todo n. Logo esta sequencia converge para v quando n . Isto prova
(3.7) neste caso.
Em seguida suponha que v L(U ). Ent
ao, por definica
o, existe u H tal
imediato que
que v = U u u. E
n1
n1

1X j
1 X j+1
1
U v=
U
u U j u = (U n u u).
n j=0
n j=0
n

A norma da esta u
ltima express
ao est
a majorada por 2kuk/n e, portanto, converge para zero quando n . Isto mostra que
lim
n

n1
1X j
U v = 0 para todo v L(U ).
n j=0

(3.10)

). Ent
Mais em geral, suponha que v L(U
ao, existem vk L(U ) convergindo
para v quando k . Observe que
n1
n1
X
1 n1
1X j
1X

Ujv
U vk
kU j (v vk )k kv vk k
n j=0
n j=0
n j=0

para todo n e todo k. Juntamente com (3.10), isto implica que


lim
n

n1
1X j
).
U v = 0 para todo v L(U
n j=0

(3.11)

), isto mostra que


Como a relaca
o (3.8) implica que P v = 0 para todo v L(U

(3.7) vale tambem quando v L(U ).


).
O caso geral de (3.7) segue imediatamente, j
a que H = I(U ) L(U

3.1.3

Converg
encia em L2 ()

Dada uma transformaca


o mensur
avel f : M M que preserva uma probabilidade em M , dizemos que uma funca
o mensur
avel : M R e invariante se
f = em -quase todo ponto. O seguinte resultado e um caso particular
do Teorema 3.4:
Teorema 3.5. Para qualquer L2 () a sequencia
n1
1X
fj
n j=0

(3.12)


CAPITULO 3. TEOREMAS ERGODICOS

80

converge em L2 () para a projeca


o ortogonal da funca
o no subespaco das
funco
es invariantes. Se f e invertvel, ent
ao a sequencia
n1
1X
f j
n j=0

(3.13)

tambem comverge em L2 () para .

DR
AF

Demonstraca
o. Seja U = Uf : L2 () L2 () o operador de Koopman de uma
transformaca
o f : M M que preserva uma medida finita . Note que uma
funca
o est
a em I(U ) se, e somente se, f = em -quase todo ponto. Seja
a projeca
o ortogonal de em I(U ). Pelo Teorema 3.4, a sequencia em (3.12)
converge para em L2 (). Isto prova a primeira afirmaca
o.
A segunda afirmaca
o e an
aloga, considerando U = Uf 1 , ou seja U = Uf1 .
Obtemos que a sequencia em (3.13) converge para a projeca
o ortogonal de no
espaco I(Uf1 ). Observando que I(Uf1 ) = I(Uf ), conclumos que o limite desta
sequencia e a mesma funca
o que obtivemos antes.

3.2

Teorema erg
odico de Birkhoff

O teorema de Birkhoff melhora bastante o teorema de von Neumann porque a


sua conclus
ao e formulada em termos de convergencia em -quase todo o ponto,
que e uma propriedade mais forte do que convergencia em L2 ().

3.2.1

Tempo m
edio de visita

Comecamos por enunciar a vers


ao do teorema para tempos medios de visita:

Teorema 3.6 (Birkhoff). Seja f : M M uma transformaca


o mensur
avel
e uma probabilidade invariante por f . Dado qualquer conjunto mensur
avel
E M , o tempo medio visita
1
#{j = 0, 1, . . . , n 1 : f j (x) E}
n
R
existe em -quase todo ponto x M . Alem disso, E (x) d(x) = (E).
E (x) = lim
n

Observe que se E (x) existe para um certo ponto x M ent


ao
E (f (x)) = E (x).

De fato, por definica


o,

1X
XE (f j (x))
n n
j=1

E (f (x)) = lim

n1

1X
1
XE (f j (x)) XE (x) XE (f n (x))
n n
n
j=0

= lim


1
XE (x) XE (f n (x))
n n

= E (x) + lim

(3.14)


3.2. TEOREMA ERGODICO
DE BIRKHOFF

81

Como a funca
o caracterstica e limitada, o u
ltimo limite e igual a zero. Isto
prova a igualdade (3.14).
O exemplo a seguir mostra que o tempo medio de visita n
ao existe para todo
ponto, em geral:

Exemplo 3.7. Considere o n


umero x (0, 1) definido pela expans
ao decimal
x = 0, a1 a2 a3 . . . , onde ai = 0 se 2k i < 2k+1 com k par e ai = 1 se
2k i < 2k+1 com k mpar. Ou seja,
x = 0, 01100001111111100000000000000001 . . .,

DR
AF

onde os blocos alternantes de 0s e de 1s tem comprimentos dados pelas sucessivas


potencias de dois. Seja f : [0, 1] [0, 1] a transformaca
o definida na Seca
o 1.3.1
e seja E = [0, 1/10). Isto e, E e o conjunto dos pontos cuja expans
ao decimal
f
comeca com o dgito 0. E
acil ver que se n = 2k 1 com k = 2q ent
ao
lim
q

n1
1X
1 + 22 + 24 + + 2k2
4 22q2 1
1
XE (f j (x)) = lim
=
lim
= ,
q
q 3 22q 1
n j=0
2k 1
3

quando q . Por outro lado, se n = 2k 1 e k = 2q + 1 ent


ao
n

lim
q

1 + 22 + 24 + + 2k1
4 22q+1 1
2
1X
XE (f j (x)) = lim
= lim
= .
2q
q
q 3 22q 1
n j=0
2 1
3

Assim, o tempo medio de visita de x ao conjunto E n


ao existe.

3.2.2

M
edias temporais

Conforme observamos anteriormente


E (x) = lim
n

n1
1X
(f j (x)),
n j=0

onde = XE .

O pr
oximo enunciado generaliza o Teorema 3.6 para o caso em que e uma
funca
o integr
avel qualquer:

Teorema 3.8. Seja f : M M uma transformaca


o mensur
avel e uma
probabilidade invariante por f . Dada qualquer funca
o integr
avel : M R, o
limite
n1
1X
(f j (x))
(3.15)
(x)

= lim
n n
j=0
existe em -quase todo ponto x M . Alem disso, a funca
o definida desta
forma e integr
avel e satisfaz
Z
Z
(x)
d(x) = (x) d(x).


CAPITULO 3. TEOREMAS ERGODICOS

82

Um pouco mais adiante obteremos este teorema como caso particular de


um resultado mais geral, o teorema erg
odico subaditivo. O limite e chamado
media temporal de : A proposica
o a seguir mostra que as medias temporais
s
ao constantes ao longo de o
rbitas, em -quase todo ponto, generalizando a
igualdade (3.14):
Proposi
c
ao 3.9. Seja : M R uma funca
o integr
avel. Ent
ao,
(f
(x)) = (x)

para -quase todo ponto x M .

(3.16)

DR
AF

Demonstraca
o. Por definica
o,

n
n1

1X
1X
1
(f j (x)) = lim
(f j (x)) + (f n (x)) (x)
n n
n n
n
j=1
j=0

(f
(x)) = lim


1
(f n (x)) (x)
n n

= (x)

+ lim

Vamos precisar do seguinte lema:

Lema 3.10. Se e uma funca


o integr
avel ent
ao lim n n1 (f n (x)) = 0 para
-quase todo ponto x M .
Demonstraca
o. Fixe qualquer > 0. Como e invariante, temos que


{x M : |(f n (x))| n} = {x M : |(x)| n}

X

|(x)|
=
{x M : k
< k + 1} .

k=n

Somando sobre todo n N, obtemos que

 X

|(x)|
{x M : |(f n (x))| n} =
k {x M : k
< k + 1}

n=1
k=1
Z
|| d.

Como e integr
avel, por hip
otese, todas estas express
oes s
ao finitas. Isso implica
que o conjunto B() dos pontos x tais que |(f n (x))| n para infinitos valores
de n tem medida nula (veja o Exerccio 0.26). Segue imediatamente da definica
o
de B() que para todo x
/ B() existe algum p 1 tal que |(f n (x))| < n
para todo n p. Agora considere o conjunto B =
ao B tem
i=1 B(1/i). Ent
medida nula e para todo x
/ B vale que lim(1/n)(f n (x)) = 0.
Aplicando o Lemma 3.10 a
` funca
o = obtemos a igualdade (3.16).

Em geral, o subconjunto com medida total onde vale a convergencia (3.15)


no Teorema 3.8 depende da funca
o que estamos considerando. No entanto,
em alguns casos e possvel escolher esse conjunto independentemente da funca
o.
Um exemplo u
til desta situaca
o e o seguinte:


3.2. TEOREMA ERGODICO
DE BIRKHOFF

83

Teorema 3.11. Suponha que M e um espaco metrico compacto e f : M M


e uma aplicaca
o contnua. Ent
ao existe um conjunto mensur
avel G M com
(G) = 1 tal que
n1
1X
(f j (x)) (x)

(3.17)
n j=0
para todo x G e toda funca
o contnua : M R.

DR
AF

Demonstraca
o. Pelo teorema erg
odico de Birkhoff, para cada funca
o contnua
existe um conjunto G() M com (G()) = 1 tal que (3.17) e v
alido
para todo x G(). Pelo Teorema 2.7, o espaco C 0 (M ) das funco
es contnuas
admite algum subconjunto {k : k N} enumer
avel denso. Tomemos
G=

G(k ).

k=1

claro que (G) = 1. Portanto basta provar que (3.17) vale para toda funca
E
o
contnua sempre que x G. Isso pode ser feito da seguinte maneira. Dado
C 0 (M ) e qualquer > 0, tomemos k N tal que


k k k = sup |(x) k (x)| : x M .
Ent
ao, dado qualquer ponto x G,
lim sup
n

lim inf
n

n1
n1
1X
1X
(f j (x)) lim
k (f j (x)) + = k (x) +
n n
n j=0
j=0

n1
n1
1X
1X
(f j (x)) lim
k (f j (x)) = k (x) .
n n
n j=0
j=0

Isto implica que

lim sup
n

n1
n1
1X
1X
(f j (x)) lim inf
(f j (x)) 2.
n
n j=0
n j=0

Como e arbitr
ario, segue que o limite (x)

existe, conforme afirmado.

3.2.3

Teorema de von Neumann e consequ


encias

O teorema de von Neumann (Teorema 3.5) tambem pode ser deduzido diretamente do teorema de Birkhoff, como vamos mostrar a seguir.
Considere qualquer funca
o L2 () e seja a sua media temporal. Comecamos por mostrar que L2 () e a sua norma satisfaz kk
2 kk2 . Para
isso, note que
||
lim
n

n1
 1 n1
2
X
2
1X
f j | .
| f j | e, portanto, | lim
n
n j=0
n j=0


CAPITULO 3. TEOREMAS ERGODICOS

84

hZ

Ent
ao, pelo Lema de Fatou (Teorema 0.39),
h
2 i1/2
| d
lim inf
n

Z  n1
2 i1/2
1X
| f j | d
.
n j=0

(3.18)

Podemos usar a desigualdade de Minkowski (Teorema 0.47) para majorar a


sequencia do lado direito:

DR
AF

n1 Z
h Z  1 n1
2 i1/2
i1/2
X
1 Xh
| f j | d

| f j |2 d
.
n j=0
n j=0

(3.19)

R
1/2
Como e invariante por f , a express
ao do lado direito e igual a
||2 d
.
Portanto, (3.18) e (3.19) implicam que kk
2 kk2 < .
Pn1
Agora vamos mostrar que (1/n) j=0
f j converge para em L2 ().
Inicialmente, suponha que a funca
o e limitada, isto e, que existe C > 0 tal
que || C. Ent
ao
1 n1

X

fj C

n j=0

para todo n

||
C.

Ent
ao podemos usar o teorema da convergencia dominada (Teorema 0.40) para
concluir que
Z 
Z  n1
n1
2
2
1X
1X
j
lim
lim
f d =
f j d = 0,
n
n n
n j=0
j=0

Pn1
ou seja, que (1/n) j=0 f j converge para em L2 (). Falta estender esta
conclus
ao para uma funca
o qualquer em L2 (). Para isso, consideremos uma
sequencia (k ) de funco
es limitadas tal que (k )k converge para . Por exemplo

(x) se |(x)| k
k (x) =
0
caso contr
ario.

Denotemos por k as respectivas medias temporais. Dado qualquer > 0,


fixemos k0 tal que k k k2 < /3 para todo k k0 . Note que k( k ) f j k2
e igual a k k k2 para todo j 0, porque a medida e invariante. Logo,
1 n1

X

( k ) f j k k k2 < /3 para todo n 1 e k k0 . (3.20)

n j=0
2

Observe tambem que k e a media temporal da funca


o k . Portanto,
o argumento do par
agrafo anterior d
a que
k k k2 k k k2 < /3 para todo k k0 .

(3.21)


3.3. TEOREMA ERGODICO
SUBADITIVO

85

Por hip
otese, para cada k 1 existe n0 (k) 1 tal que
1 n1

X

k f j k < /3.

n j=0
2

(3.22)

Somando (3.20), (3.21), (3.22)obtemos


1 n1

X
f j < para todo n n0 (k0 ).

n j=0
2

DR
AF

Isto completa a prova do teorema de von Neumann a partir do teorema de


Birkhoff.
No Exerccio 3.5 propomos uma generalizaca
o destas conclus
oes para um
espaco Lp () qualquer.

Corol
ario 3.12. A media temporal de qualquer funca
o L2 () coincide
com a projeca
o ortogonal P () de no subespaco das funco
es invariantes.
Pn1
Demonstraca
o. Por um lado, o Teorema 3.5 d
a que (1/n) j=0 f j converge
2
para P () em L (). Por outro lado, acabamos de mostrar que essa sequencia
converge para em L2 (). Por unicidade do limite, P () = .

Corol
ario 3.13. Se f : M M e invertvel ent
ao as medias temporais de
qualquer funca
o L2 () para f e para f 1 coincidem em -quase todo ponto:
lim
n

n1
n1
1X
1X
f j = lim
fj
n n
n j=0
j=0

em -quase todo ponto.

(3.23)

Demonstraca
o. O limite do lado esquerdo de (3.23) e a projeca
o ortogonal de
no subespaco das funco
es invariantes por f 1 , enquanto que o limite do lado
direito e a projeca
o ortogonal de no subespaco das funco
es invariantes por f .
claro que estes dois subespacos s
E
ao exatamente o mesmo. Logo os dois limites
coincidem em L2 (m).

3.3

Teorema erg
odico subaditivo

Dizemos que uma sequencia de funco


es n : M R e subaditiva para uma
transformaca
o f : M M se
m+n m + n f m

para todo m, n 1.

(3.24)

Exemplo 3.14. A sequencia n : M R diz-se aditiva se vale a igualdade


em (3.24), ou seja, se m+n = m + n f m para todo m, n 1. Por exemplo,
toda soma temporal
n1
X
n (x) =
(f j (x))
j=0


CAPITULO 3. TEOREMAS ERGODICOS

86

f
constitui uma sequencia aditiva. E
acil verificar que toda sequencia aditiva e
desta forma, com = 1 .
No pr
oximo exemplo usamos a noca
o de norma de uma matriz quadrada,
que e definida do seguinte modo. Seja A uma matriz quadrada de dimens
ao
d 2. Ent
ao
n kAvk
o
kAk = sup
: v Rd \ {0}
(3.25)
kvk

DR
AF

Segue diretamente da definica


o que a norma do produto de duas matrizes e
menor ou igual que o produto das normas dessas matrizes:
kABk kAk kBk .

(3.26)

Exemplo 3.15. Seja A : M GL(d) uma funca


o mensur
avel com valores
no conjunto GL(d) das matrizes quadradas invertveis de dimens
ao d. Defina
n (x) = A(f n1 (x)) A(f (x))A(x) para todo n 1 e x M . Ent
ao a
sequencia n (x) = log kn (x)k e subaditiva. De fato,
m+m (x) = n (f m (x))m (x)

e portanto, usando (3.26),

m+n (x) = log kn (f m (x))m (x)k


log km (x)k + log kn (f m (x))k = m (x) + n (f m (x)).

para todo m, n e x.

Lembre que, dada uma funca


o : M R representamos por + : M R
+
a funca
o definida por (x) = max{(x), 0}.

Teorema 3.16 (Kingman). Seja uma probabilidade invariante para uma


transformaca
o f : M M e seja n : M R, n 1 uma sequencia subaditiva
1
de funco
es mensur
aveis tal que +
ao a sequencia (n /n)n con1 L (). Ent
verge em -quase todo ponto para uma funca
o mensur
avel : M [, +).
Alem disso, + L1 () e
Z
Z
Z
1
1
d = lim
n d = inf
n d [, +).
n n
n n

A prova do Teorema 3.16 que vamos apresentar e devida a Avila, Bochi [AB].
Uma caracterstica importante e que o teorema erg
odico de Birkhoff n
ao e usado
na prova. Isso nos permitir
a obter o teorema de Birkhoff como corol
ario do
Teorema 3.16.

3.3.1

Prepara
c
ao da demonstra
c
ao

Uma sequencia (an )n em [, +) e dita subaditiva se vale am+n am + an


para todo m, n 1.


3.3. TEOREMA ERGODICO
SUBADITIVO

87

lim
n

Lema 3.17. Se (an )n e uma sequencia subaditiva ent


ao
an
an
= inf
[, ).
n n
n

(3.27)

Demonstraca
o. Se am = para algum m ent
ao, pela subaditividade, temos
que an = para todo n > m. Ent
ao os dois lados de (3.27) s
ao iguais a ,
e portante o lema e v
alido neste caso. A partir daqui suporemos que an R
para todo n.
Seja L = inf n (an /n) [, +) e seja B qualquer n
umero real maior do
que L. Ent
ao podemos encontrar k 1 tal que

DR
AF

ak
< B.
k

Para n > k, podemos escrever n = kp + q, onde p e q s


ao n
umeros inteiros tais
que p 1 e 1 q k. Ent
ao, por subaditividade,
an akp + aq pak + aq pak + ,

onde = max{ai : 1 i k}. Logo,

an
pk ak

+ .
n
n k
n

Observe que pk/n converge para 1 e /n converge para zero quando n .


Portanto, uma vez que ak /k < B, temos
L

an
<B
n

para todo n suficientemente grande. Fazendo B L, conclumos que


lim

an
an
= L = inf
.
n n
n

Isto completa o argumento.

Agora seja (n )n como nas hip


oteses do Teorema 3.16. Por subaditividade,
n 1 + 1 f + + 1 f n1 .

+
Esta relaca
o permanece v
alida quando colocamos +
n e 1 no lugar de n e 1 .
+
1
+
1
Logo, a hip
otese de que 1 L () implica que n L () para todo n. Alem
disso, a hip
otese de que (n )n e subaditiva implica que
Z
an = n d, n 1,

e uma sequencia subaditiva em [, +). Logo, pelo Lema 3.17, o limite


L = lim
n

an
an
= inf
[, ).
n n
n


CAPITULO 3. TEOREMAS ERGODICOS

88

existe. Defina : M [, ] e + : M [, ] por


(x) = lim inf
n

n
(x)
n

e + (x) = lim sup


n

n
(x).
n

claro que (x) + (x) para todo x M . Vamos provar que


E
Z
Z
d L + d,

(3.28)

DR
AF

desde que toda funca


o n seja limitada por baixo. Consequentemente, as duas
funco
es e + coincidem em -quase todo ponto e a sua integral e igual a L.
Desta forma o teorema ficar
a demonstrado neste caso. Ao final, removemos a
condica
o de limitaca
o usando um truque de truncagem.

3.3.2

Lema fundamental

Fixado > 0, defina, para cada k N,





Ek = x M : j (x) j (x) + para algum j {1, . . . , k} .

claro que Ek Ek+1 para todo k. Alem disso, a definica


E
o de (x) implica
que M = k Ek . Logo (Ek ) 1 quando k . Defina tambem

(x) + se x Ek
k (x) =
1 (x)
se x Ekc .
Segue da definica
o que k (x) (x) + para todo x M . O passo crucial
na prova do teorema e a seguinte estimativa:
Lema 3.18. Para todo n > k 1 e -quase todo x M ,
n (x)

nk1
X
i=0

k (f i (x)) +

n1
X

i=nk

max{k , 1 }(f i (x)).

Demonstraca
o. Tome x M tal que (x) = (f j (x)) para todo j 1 (isso
vale em -quase todo ponto, como convidamos o leitor a verificar no Exerccio 3.6). Considere a sequencia, possivelmente finita, de n
umero inteiros
m0 n 1 < m 1 n 2 < m 2 < . . .

(3.29)

definida indutivamente da seguinte forma (veja tambem a Figura 3.1).


Defina m0 = 0. Seja nj o menor inteiro maior ou igual a mj1 tal que
ao, pela definica
o de Ek , existe mj tal que
f nj (x) Ek (caso exista). Ent
1 m j nj k e
mj nj (f nj (x)) (mj nj )( (f nj (x)) + ).

(3.30)


3.3. TEOREMA ERGODICO
SUBADITIVO
PSfrag replacements
Ekc
Ekc
Ekc
n1

m1

Ekc
m0

nl

Ekc
n1

Ekc

m0

89

m1

ml

Ekc

Ekc

nl

ml

nl+1 n

DR
AF

Figura 3.1: Decomposica


o da trajet
oria de um ponto

Isto completa a definica


o da sequencia (3.29). Agora, dado n k, seja l 0 o
maior n
umero inteiro tal que ml n. Pela subaditividade,
nj 1

nj mj1 (f mj1 (x))

1 (f i (x))

i=mj1

para todo j = 1, . . . , l, e analogamente para nml (f ml (x)). Assim,


n (x)

1 (f i (x)) +

l
X

mj nj (f nj (x))

(3.31)

j=1

iI

onde I = lj=1 [mj1 , nj ) [ml , n). Observe que


1 (f i (x)) = k (f i (x))

para todo i lj=1 [mj1 , nj ) [ml , min{nl+1 , n}),

j
a que f i (x) Ekc em todos esses casos. Alem disso, como e constante em
o
rbitas (veja o Exerccio 3.6) e k + , a relaca
o (3.30) nos d
a que
mj 1

mj 1

mj nj (f nj (x))

i=nj

( (f i (x)) + )

k (f i (x))

i=nj

para todo j = 1, . . . , l. Deste modo, usando a equaca


o (3.31) conclumos que
min{nl+1 ,n}1

n (x)

k (f i (x)) +

i=0

n1
X

1 (f i (x)).

i=nl+1

Como nl+1 > n k, o lema est


a provado.

3.3.3

Estimativa da fun
c
ao

Na direca
o de provar (3.28), nesta seca
o provamos o seguinte lema:
R
Lema 3.19. d = L


CAPITULO 3. TEOREMAS ERGODICOS

90

Demonstraca
o. Suponha, por um instante, que n /n est
a uniformemente limitado por baixo, ou seja, que existe > 0 tal que n /n para todo n.
Aplicando o Lema de Fatou (Teorema 0.39) a
` sequencia de funco
es n
ao-negativas
n /n + , obtemos que e integr
avel e
Z
Z
n
d = L.
d lim
n
n

DR
AF

Para provar a outra desigualdade, observe que o Lema 3.18 implica que
Z
Z
Z
1
nk
k
n d
k d +
max{k , 1 } d
n
n
n

Quando n aR u
ltima parcela converge para zero. Ent
ao, fazendo n
obtemos que L k d para todo k. Logo, fazendo k , conclumos que
Z
L d +

R
Finalmente, fazendo 0 obtemos que L d. Isto prova o lema quando
n /n est
a uniformemente limitado por baixo.
Agora resta remover essa hip
otese. Defina, para cada > 0,
n = max{n , n} e = max{ , }.

Deixamos ao leitor o cuidado de verificar que = lim inf n (1/n)n . Ent


ao, o
argumento do par
agrafo anterior mostra que
Z
Z
1
d = inf
n d.
(3.32)
n n

Pelo teorema da convergencia mon


otona (Teorema 0.38), tambem temos que
Z
Z
Z
Z

n d = inf n d e
d = inf d.
(3.33)

Combinando as relaco
es (3.32) e (3.33), obtemos que
Z
Z
Z
Z
1
1
n d = inf
n d = L.
d = inf = inf inf
n n

n n
Isto completa a demonstraca
o do lema.

3.3.4

Majora
c
ao da fun
c
ao +

R
Para completar a prova de (3.28), vamos mostrar que + d L desde que
inf n seja finito para todo n. Comecamos por provar o seguinte resultado
auxiliar:
Lema 3.20. Para todo k fixado,
lim sup
n

kn
n
= k lim sup
.
n
n
n


3.3. TEOREMA ERGODICO
SUBADITIVO

91

Demonstraca
o. A desigualdade e clara, uma vez que kn /kn e subsequencia
de n /n. Para mostrar a desigualdade contr
aria, escrevemos n = kqn + rn com
rn {1, . . . , k}. Pela subaditividade,
n kqn + rn f kqn kqn + f kqn

+
onde = max{+
em disso,
1 , . . . , k }. Observe que n/qn k as n . Al
1
como L (), podemos usar o Lema 3.10 para ver que f n /n converge
para zero em -quase todo ponto. Assim, dividindo a relaca
o anterior por n e
tomando o lim sup quando n n
os obtemos que

1
1
1
1
1
n lim sup kqn + lim sup f kqn = lim sup kq ,
n
n
n
k
q
n
n
q

DR
AF

lim sup
n

como afirmado no lema.

Lema 3.21. Suponha que inf n > para todo n. Ent


ao

+ d L.
Pn1
Demonstraca
o. Para cada k fixado e n 1, considere n = j=0 k f jk .
Observe que
Z
Z
n d = n k d para todo n,
(3.34)
uma vez que f k preserva a medida . Como a sequencia (n )n e subaditiva,
n kn para todo n. Logo, usando o Lema 3.20,
= lim inf
n

e, portanto,

kn
n
n
lim sup
= k lim sup
= k+
n
n
n
n
n
Z

d k

+ d.

(3.35)

Observe tambem que a sequencia (n )n e aditiva: m+n = m + n f km para


todo m, n 1. Como 1 = k e majorada por inf k , tambem temos que a
funca
o 1+ e limitada e, por consequencia, integr
avel. Assim, podemos aplicar o
Lema 3.19, juntamente com a igualdade (3.34), para concluir que
Z
Z
Z
n
d = lim inf
d = k d.
(3.36)
n
n

Juntando as relaco
es (3.35) e (3.36) obtemos que
Z
Z
1
+ d
k d.
k

Finalmente, tomando o nfimo sobre k obtemos que

+ d L.

Os Lemas 3.19 e 3.21 provam a relaca


o (3.28) e, portanto, o Teorema 3.16
quando inf k > para todo k. No caso geral, defina
n = max{n , n} e = max{ , } e + = max{+ , }


CAPITULO 3. TEOREMAS ERGODICOS

92

3.3.5

para cada constante > 0. Os argumentos anteriores podem ser aplicados a


`
sequencia (n )n para todo > 0 fixado. Portanto, + = em -quase todo
ponto para todo > 0. Como e + + quando , segue que
= + em -quase todo ponto. A prova do Teorema 3.16 est
a completa.

Consequ
encias

Como observamos anteriormente, toda sequencia de somas orbitais


n =

n1
X

n1

DR
AF

j=0

fj,

e aditiva e, em particular, subaditiva. Portanto, o teorema erg


odico de Birkhoff
(Teorema 3.8) e um caso particular do Teorema 3.16.
Outra consequencia importante do teorema erg
odico subaditivo e o teorema
de Furstenberg-Kesten, que enunciamos a seguir.
Seja f : M M uma transformaca
o mensur
avel e seja uma probabilidade
invariante. Seja : M GL(d) uma funca
o mensur
avel com valores no conjunto
GL(d) das matrizes quadradas invertveis de dimens
ao d. Seja 1 : M GL(d)
a funca
o definida por 1 (x) = matriz inversa de (x). Defina
n (x) = A(f n1 (x)) A(f (x))A(x)

e n (x) = matriz inversa de n (x)

para todo n 1 e x M .

Teorema 3.22 (Furstenberg-Kesten). Se log+ kk L1 () ent


ao
max (x) = lim
n

1
log kn (x)k
n

1
existe em -quase todo ponto. Alem disso, +
max L () e
Z
Z
Z
1
1
log kn k d = inf
log kn k d
max d = lim
n n
n n

Se log+ k1 k L1 () ent
ao

min (x) = lim


n

1
log kn (x)k
n

1
existe em -quase todo ponto. Alem disso,
min L () e
Z
Z
Z
1
1
n
min d = lim
log k k d = sup
log kn k d.
n
n
n
n

Para deduzir este resultado do Teorema 3.16 basta observar que as sequencias
n
max
n (x) = log k (x)k

n
e min
(x)k
n (x) = log k

s
ao subaditivas (lembre do Exemplo 3.15). As funco
es max e min s
ao chamadas
expoentes de Laypunov extremais de relativamente a f .

3.4. EXERCICIOS

Exerccios

3.4

93

3.1. Mostre que um operador linear U : H H num espaco de Hilbert H e


uma isometria se, e somente se, kH(v)k = kvk para todo v H.
3.2. Um operador linear U : H H e dito unit
ario se e um isomorfismo e uma
isometria. Verfique que U e unit
ario se e somente se U U = id = U U .

DR
AF

3.3. Seja f : M M uma transformaca


o mensur
avel que preserva uma medida
finita e seja A M um conjunto mensur
avel com (A) > 0. Defina n1 <
n2 < como sendo a sequencia dos valores de n tais que (f n (A) A) > 0.
Mostre que existe C > 0 tal que ni+1 ni C para todo i. ??

3.4. Uma funca


o : Z R e dita uniformemente quase peri
odica se para cada
> 0 existe L() N tal que todo conjunto A Z da forma {n+1, . . . , n+L()}
contem algum elemento tal que k(k + ) (k)k < para todo k Z. O
Pn1
objetivo e mostrar que a media n1 k=0 (k) de toda funca
o uniformemente
quase peri
odica converge para algum n
umero real.
1. Prove que toda funca
o uniformemente quase peri
odica e limitada.

2. Seja uniformemente quase peri


odica e > 0 dado. Seja e L() como na
definica
o de funca
o uniformemente quase peri
odica e assuma que > L().
Ent
ao, para todo n
k

(n+1)
1
1 X
1X
(k)
(k)k < 2

k=n

k=0

3. Use os itens anteriores para mostrar que


uma funca
o uniformePdada
n1
mente quase peri
odica ent
ao a media n1 k=0 (f i (k)) converge para algum n
umero real quando n .
Pn1
4. Mais geralmente, prove que n1 k=0 (f i (x + k)) converge para algum
n
umero real quando n e e independente de x.

3.5. Seja : M R uma funca


o integr
avel e seja a sua media temporal,
dada pelo Teorema 3.8. Mostre que se Lp () para algum p > 1 ent
ao
Lp () e vale kk
p kkp . Alem disso,
n1
1X
fj
n j=0

converge para no espaco Lp ().

Dica: O caso p = 2 foi feito na Seca


o 3.2.3.


CAPITULO 3. TEOREMAS ERGODICOS

94

3.6. Dada uma sequencia subaditiva (n )n , mostre que as funco


es
= lim inf
n

n
n

e + = lim sup
n

n
n

s
ao invariantes, isto e, (x) = f (x) e + (x) = + f (x) para -quase
todo x M . Portanto, a funca
o no Teorema 3.16 tambem e invariante.

DR
AF

3.7. Seja X = {x1 , . . . , xr } um conjunto finito e seja : X X uma permutaca


o. A permutaca
o e chamada de cclica se ela admite uma (
unica)
o
rbita de cardinalidade r.
1. Dada uma permutaca
o cclica e uma funca
o : X R prove que
n1
1X
(x1 ) + + (xr )
( i (x)) =
.
n n
r
i=0

lim

2. Mais geralmente, prove que para toda permutaca


o e funca
o
lim

n1
(x) + ((x)) + + ( p1 (x))
1X
( i (x)) =
.
n
p
i=0

onde a o
rbita de x tem cardinalidade p.

Captulo 4

DR
AF

Ergodicidade

Os teoremas apresentados no captulo anterior d


ao plena justificativa a
` primeira
parte da hip
otese erg
odica de Boltzmann: o tempo medio de visita E (x) a um
dado conjunto mensur
avel E est
a bem definido para quase todo ponto x. A
segunda parte da hip
otese erg
odica, isto e, que o tempo medio de visita seja
igual a
` medida de E para quase todo ponto x, e um enunciado de natureza
diferente e ser
a o tema do presente captulo.
Diremos que um sistema (f, ) e erg
odico se, dado qualquer conjunto mensur
avel E, temos E (x) = (E) para -quase todo ponto x M . Vamos ver
que isto equivale a dizer que o sistema e dinamicamente indivsivel, no sentido
de que qualquer conjunto invariante tem medida nula ou medida total. Outras formulaco
es equivalentes da propriedade de ergodicidade ser
ao discutidas
na Seca
o 4.1. Nas Seco
es 4.2 e 4.3 apresentaremos alguns exemplos importantes
de sistemas erg
odicos e n
ao erg
odicos.
Na Seca
o 4.4 adotamos o seguinte ponto de vista: fixamos o sistema din
amico
e analisamos as propriedades das medidas erg
odicas dentro do espaco de todas
as medidas invariantes desse sistema din
amico. Isto tambem motiva o resultado
principal deste captulo, o teorema da decomposica
o erg
odica (Teorema 4.34),
segundo o qual toda medida invariante e uma combinaca
o linear (infinita, em
geral) de medidas erg
odicas. Provaremos este fato a partir de outro resultado
muito importante, o teorema da desintegraca
o de Rokhlin (Teorema 4.42).
Ao longo deste captulo sempre suporemos que e uma medida de probabilidade invariante por uma transformaca
o mensur
avel f : M M .

4.1

Sistemas erg
odicos

Conforme dissemos, a medida diz-se erg


odica para f (ou f diz-se erg
odica
relativamente a ) se o tempo medio de visita a qualquer conjunto mensur
avel
coincide, em -quase todo ponto, com a medida desse conjunto. Nas duas
subseco
es a seguir estudaremos diversas propriedades equivalentes a esta.
95

CAPITULO 4. ERGODICIDADE

96

Conjuntos e fun
co
es invariantes

4.1.1

Dizemos que uma funca


o mensur
avel : M R e invariante se = f
em -quase todo ponto. Ou seja, a menos de um conjunto com medida nula,
a funca
o e constante em toda trajet
oria de f . Alem disso, dizemos que um
conjunto mensur
avel B M e invariante se a sua funca
o caracterstica X B e
uma funca
o invariante. Em outras palavras, A e invariante se ele difere da sua
pre-imagem f 1 (B) por um conjunto de medida nula:
(Bf 1 (B)) = 0.

DR
AF

f
Veja no Exerccio 4.1 formulaco
es equivalentes desta propriedade. E
acil verificar que a famlia de todos os conjuntos invariantes e uma -
algebra, isto e, ela
e fechada para o complementar e para uni
oes e interseco
es enumer
aveis.
Exemplo 4.1. Seja f a transformaca
o expans
ao decimal, estudada na Seca
o 1.3.1,
e seja a medida de Lebesgue. Claramente, o conjunto A = Q [0, 1] dos
n
umeros racionais e invariante. Outro exemplo interessante e o conjunto dos
pontos x = 0, a0 a1 . . . em [0, 1] tais que a proporca
o de dgitos ai com cada
valor k {0, . . . , 9} e prescrita.
Ou
seja,
dado
qualquer
vetor p = (p 0 , . . . , p9 )
P
tal que pi 0 para todo i e i pi = 1, defina
Ap = {x : lim
n

1
#{0 i n 1 : ai = k} = pk para k = 0, . . . , 9}.
n

Para ver que Ap e invariante, observe que se x = 0, a0 a1 . . . ent


ao todo ponto
1

y f (x) se escreve na forma y = 0, ba0 a1 . . . para algum b {0, . . . , 9}. E


claro que o dgito extra b n
ao muda a frequencia dos diversos valores 0, . . . , 9
na expans
ao decimal. Portanto y Ap se, e somente se, x Ap .

Exemplo 4.2. Seja : [0, 1] R uma funca


o em L1 (). De acordo com o
teorema erg
odico de Birkhoff (Teorema 3.8), a sua media temporal e uma
funca
o invariante. Ent
ao, todo conjunto de nvel
Bc = {x [0, 1]; (x)

= c},

e invariante. Observe tambem que toda funca


o invariante e desta forma: e f
acil
ver que se e invariante ent
ao ela coincide em -quase todo ponto com a media
temporal .

A seguinte proposica
o coleta diversas maneiras equivalentes de definir ergodicidade. Dizemos que uma funca
o e constante em -quase todo ponto se
existe c R tal que (x) = c para -quase todo x M .

Proposi
c
ao 4.3. Seja uma probabilidade invariante de uma transformaca
o
mensur
avel f : M M . As seguintes condico
es s
ao equivalentes:
(a) Para todo conjunto mensur
avel B M tem-se B (x) = (B) para -quase
todo ponto.


4.1. SISTEMAS ERGODICOS

97

(b) Para todo conjunto mensur


avel B M a funca
o B e constante em quase todo ponto.
R
(c) Para todo funca
o integr
avel : M R tem-se (x)

= d para quase todo ponto.

DR
AF

(d) Para todo conjunto mensur


avel B M a media temporal R e constante em -quase todo ponto.
R
(e) Para toda funca
o integr
avel invariante : M R tem-se (x) = d
para -quase todo ponto.
(f ) Toda funca
o integr
avel invariante : M R e constante em -quase
todo ponto.

(g) Para todo subconjunto invariante A tem-se (A) = 0 ou (A) = 1.

imediato que (a) implica (b), que (c) implica (d) e que (e)
Demonstraca
o. E
implica (f). Tambem e claro que (e) implica (c) e (f) implica (d), porque a media
temporal e uma funca
o invariante (lembre da Proposica
o 3.9). Analogamente,
(c) implica (a) e (d) implica (b), porque o tempo medio de visita e uma media
temporal (da funca
o caracterstica de B). Agora basta provar as seguintes
implicaco
es:
(b) implica (g): Seja A um conjunto invariante. Ent
ao A (x) = 1 para quase todo x A e A (x) = 0 para -quase todo x Ac . Como A e constante
em -quase todo ponto, por hip
otese, segue que (A) = 0 ou (Ac ) = 1.
(g) implica (e): Seja uma funca
o integr
avels invariante. Ent
ao todo conjunto
Bc = {x M : (x) c}

e invariante. Logo, a hip


otese implica que (Bc ) {0, 1} para todo c R.
Como c 7 (Bc ) e n
ao -decrescente, segue que existe c R tal que (Bc ) = 0
para todo c <R c e (Bc ) = 1 para todo cR c. Ent
ao = c em -quase todo
ponto. Logo, d = c e, portanto, = d em -quase todo ponto.

4.1.2

Caracteriza
c
ao espectral

A pr
oxima proposica
o caracteriza a propriedade de ergodicidade por meio do
operador de Koopman Uf () = f :
Proposi
c
ao 4.4. Seja uma probabilidade invariante de uma transformaca
o
mensur
avel f : M M . As seguintes condico
es s
ao equivalentes:
(a) (f, ) e erg
odico.

(b) Para qualquer par de conjuntos mensur


aveis A e B vale
lim
n

n1
1X
(f j (A) B) = (A)(B).
n j=0

(4.1)

98

CAPITULO 4. ERGODICIDADE

(c) Para quaisquer funco


es Lp () e Lq (), com 1/p + 1/q = 1, vale
Z
Z
n1 Z
1X
lim
(Ufj ) d = d d.
(4.2)
n n
j=0
claro que (c) implica (b): basta tomar = XA e = XB .
Demonstraca
o. E
Para mostrar que (b) implica (a), suponha que A e um conjunto invariante.
Tomando A = B na hip
otese (b), obtemos que

DR
AF

n1
1X
(f j (A) A) = (A)2 .
(A) = lim
n n
j=0

Isto implica que (A) = 0 ou (A) = 1.


Agora resta provar que (a) implica (c). Considere Lp () e Lq ().
Por ergodicidade e pelo teorema erg
odico de Birkhoff (Teorema 3.8) temos que
Z
n1
1X j
Uf d
(4.3)
n j=0

em -quase todo ponto. Inicialmente, suponha que || k para algum k 1.


Ent
ao, para todo n N,
X j 
1 n1

U k||.
n j=0 f

Logo, como k|| L1 (), podemos usar o teorema da convergencia dominada


(Teorema 0.40) para concluir que
Z
Z
Z
n1
1X j
(
Uf ) d d d.
n j=0

Isto prova a afirmca


o (4.2) quando e limitada. Falta remover esta u
ltima
condica
o. Dado qualquer Lp () e dado k 1, defina

se (x) > k
k
(x) se (x) [k, k]
k (x) =

k
se (x) < k.
Fixemos > 0. Pelo argumento anterior, para todo k 1 vale que
Z
Z
Z
n1
X j


(1
Uf k ) d k d d <
n j=0

(4.4)

se n e suficientemente grande (dependendo de k). Em seguida, observe que


kk kp 0 quando k . Logo, usando a desigualdade de H
older (Teorema 0.49), temos que
Z
Z
Z




(k ) d d kk kp d < ,
(4.5)


4.1. SISTEMAS ERGODICOS

99

para todo k suficientemente grande. De modo semelhante,


Z
X j
X Z j
1 n1
1 n1


U (k ) d
Uf (k ) d
f
n j=0
n j=0

n1
1X
kU j (k )kp kkk d
n j=0 f

(4.6)

= kk kp kkq < ,

DR
AF

para todo n e todo k suficientemente grande, independente de n. Fixe k tal que


(4.5) e (4.6) sejam v
alidas e, em seguida, tome n suficientemente grande para
que (4.4) valha igualmente. Somando as tres relaco
es (4.4) a (4.6), obtemos que
Z
Z
Z
n1
X j


(1
Uf ) d d d < 3
n j=0

para todo n suficientemente grande. Isto conclui a prova da condica


o (c).

No caso p = q = 2, a condica
o (4.2) pode ser expressa em termos do produto
interno no espaco L2 (). Desta forma obtemos que (f, ) e erg
odico se, e
somente se:
n1

1 X n
lim
(Uf ) ( 1) = 0 para todo , L2 ().
n n
j=0

(4.7)

Corol
ario 4.5. Suponha que a condica
o (4.1) na Proposica
o 4.4 e satisfeita
para todo A e B em alguma a
lgebra A que gera a -
algebra dos conjuntos mensur
aveis. Ent
ao (f, ) e erg
odico.

Demonstraca
o. S
o precisamos mostrar que a condica
o (4.1) se estende a todo
par de borelianos. Sejam A e B conjuntos mensur
aveis quaisquer. Pelo teorema
de aproximaca
o (Teorema 0.16), dado qualquer > 0 existem A0 e B0 em A
tais que (AA0 ) < e (BB0 ) < . Observe que


(f j (A) B) (f j (A0 ) B0 ) (AA0 ) + (BB0 ) < 2

para todo j e |(A)(B) (A0 )(B0 )| (AA0 ) + (BB0 ) < 2. Ent


ao,
a hip
otese
n1
1X
lim
(f j (A0 ) B0 ) = (A0 )(B0 )
n n
j=0
implica que

4 lim inf
n

lim sup
n

n1
1X
(f j (A) B) (A)(B)
n j=0

n1
1X
(f j (A) B) (A)(B) 4.
n j=0

CAPITULO 4. ERGODICIDADE

100

Como e arbitr
ario, isto prova a nossa afirmaca
o.

De modo semelhante, basta verifica o item (c) da Proposica


o 4.4 em subconjuntos densos. A prova deste fato fica a cargo do leitor (Exerccio ??):
Corol
ario 4.6. Suponha que a condica
o (4.2) na Proposica
o 4.4 e satisfeita
para todo e em subconjuntos densos de Lp () e Lq (), respectivamente.
Ent
ao (f, ) e erg
odico.

Exemplos

DR
AF

4.2

Nesta seca
o apresentamos, por meio de exemplos, diversos metodos para verificar se um dado sistema e ou n
ao erg
odico.

4.2.1

Rota
co
es em toros

Consideremos inicialmente o caso de uma rotaca


o R : S 1 S 1 no crculo
S 1 = R/Z. Conforme observamos na Seca
o 1.3.3, a medida de Lebesgue m e
invariante por R . Queremos analisar o comportamento erg
odico do sistema
(R , m) para os diferentes valores de .
Se e racional, digamos = p/q em forma irredutvel, ent
ao Rq (x) = x para
todo x S 1 . Ent
ao, dado qualquer segmento I S 1 com comprimento menor
que 1/q, o conjunto
A = I R (I) Rq1 (I)

e invariante e a sua medida de Lebesgue satisfaz 0 < m(A) < 1. Assim, se


e racional a medida de Lebesgue n
ao e erg
odica. A recproca e muito mais
interessante:
Proposi
c
ao 4.7. Se e irracional, ent
ao R e erg
odica para a medida de
Lebesgue.

Vamos mencionar duas demonstraco


es diferentes deste fato. A primeira,
que detalharemos a seguir, usa fatos simples de An
alise de Fourier. A segunda,
que deixaremos como exerccio (Exerccio 4.8), e baseada num argumento de
ponto de densidade semelhante ao que usaremos na Seca
o 4.2.2 para provar a
ergodicidade da expans
ao decimal.
Como anteriormente, denotaremos por L2 (m) e o espaco de Hilbert das
funco
es mensur
aveis cujo quadrado e integr
avel, ou seja, tais que:
Z
||2 dm < .
Aqui e conveniente considerarmos funco
es com valores em C, e assim ser
a feito
ao longo da seca
o. Usaremos o fato bem conhecido de que a famlia de funco
es
k : S 1 C, x 7 e2ikx ,

kZ

101

4.2. EXEMPLOS

kZ

e uma base de Hilbert deste espaco: dado qualquer L2 (m) existe uma u
nica
sequencia (ak )kZ de n
umeros complexos tais que
X
(x) =
ak e2ikx para quase todo x S 1 .
(4.8)

Considere a expans
ao em serie de Fourier (4.8) de uma funca
o qualquer
L2 (m). Ent
ao
 X
R (x) =
ak e2ik e2ikx .
(4.9)
kZ

DR
AF

Suponha que e invariante. Ent


ao (4.8) e (4.9) coincidem. Pela unicidade dos
coeficientes da expans
ao de Fourier, isto acontece se, e somente se,
ak e2ik = ak

para todo k Z.

A hip
otese de que e irracional significa que e2ik 6= 1 para todo k 6= 0. Ent
ao
a relaca
o que acabamos de obter implica que ak = 0 para todo k 6= 0. Em
outras palavras, (z) = a0 para m-quase todo z S 1 . Em particular, a funca
o
caracterstica = XA de qualquer conjunto invariante A S 1 e constante em
m-quase todo ponto. Isto e o mesmo que dizer que A tem medida zero ou um.
Logo, pela Proposica
o 4.3, temos que m e erg
odica.
Estas observaco
es estendem-se naturalmente a
`s rotaco
es no d-toro T d , para
qualquer d 1:
Proposi
c
ao 4.8. Se = (1 , . . . , d ) e racionalmente independente ent
ao a
rotaca
o R : Td Td e erg
odica para a medida de Lebesgue.

Isto pode ser provado por um argumento an


alogo ao do caso d = 1, usando
o fato de que a famlia de funco
es
k1 ,...,kd : Td C, (x1 , . . . , xd ) 7 e2i(k1 x1 ++kd xd ) ,

(k1 , . . . , kd ) Zd

e uma base de Hilbert do espaco L2 (m) das funco


es : Td C com quadrado
som
avel. Deixamos esta tarefa ao cuidado do leitor (Exerccio 4.2).
De fato as rotaco
es irracionais no crculo ou, mais geralmente, nos toros
satisfazem uma propriedade muito mais forte do que ergodicidade: elas s
ao
unicamente erg
odicas, o que quer dizer que elas tem uma u
nica probabilidade
invariante (que e a medida de Lebesgue, claro). Sistemas unicamente erg
odicos
ser
ao estudados no Captulo 5.

4.2.2

Expans
ao decimal

Considere a transformaca
o f : [0, 1] [0, 1], f (x) = 10x [10x] que gera
a expans
ao decimal. Na Seca
o 1.3.1 verificamos que f preserva a medida de
Lebesgue m. Afirmamos:
Proposi
c
ao 4.9. A transformaca
o f e erg
odica para a medida de Lebesgue m.

CAPITULO 4. ERGODICIDADE

102

lim inf

Demonstraca
o. De acordo com a Proposica
o 4.3, basta provar que todo conjunto
invariante A tem medida total. O principal ingrediente e o teorema de derivaca
o
de Lebesgue (Teorema 0.42), segundo o qual quase todo ponto de A e ponto de
densidade de A. Mais precisamente (veja tambem o Exerccio 0.18), m-quase
todo ponto a A satisfaz
 m(I A)

: I intervalo tal que a I B(a, ) = 1 .
m(I)

(4.10)

DR
AF

Fixemos um ponto de densidade a A. Como o conjunto dos pontos da forma


m/10k , k N, 0 m 10k tem medida nula, podemos supor, sem qualquer restrica
o, que a n
ao e desta forma. Consideremos a sequencia famlia de
intervalos
I(k, m) =

m1 m 
,
,
10k 10k

k N,

m = 1, . . . , 10k .

claro que para cada k N existe um u


E
nico m = mk tal que I(k, mk ) contem
o ponto a. Denotaremos Ik = I(k, mk ). A propriedade (4.10) implica que
m(Ik A)
1 quando k .
m(Ik )

Observe tambem que cada f k e uma bijeca


o afim de Ik sobre o intervalo (0, 1).
Isso tem a seguinte consequencia, que e crucial para o nosso argumento:

Lema 4.10 (Distorca


o limitada). Para todo k N, vale
m(f k (E1 ))
m(E1 )
=
m(f k (E2 ))
m(E2 )

(4.11)

para quaisquer subconjuntos mensur


aveis E1 e E2 de Ik .

Aplicando este fato a E1 = Ik A e E2 = Ik obtemos que



m f k (Ik A)
m(Ik A)

=
.
m(Ik )
m (0, 1)


Claro que m (0, 1) = 1. Alem disso, como estamos supondo que A e invariante,
f k (Ik A) est
a contido em A. Deste modo obtemos que
m(A)

m(Ik A)
m(Ik )

para todo k.

Como a sequencia do lado direito converge para 1 quando k , segue que


m(A) = 1, como queramos demonstrar.
O Lema 4.10 depende do fato de que a transformaca
o f e afim em cada
intervalo (m 1)/10, m/10 e isso pode dar a impress
ao de que o metodo de

103

4.2. EXEMPLOS

DR
AF

demonstraca
o que acabamos de apresentar est
a restrito a uma classe muito particular de exemplos. De fato, n
ao e assim, muito pelo contr
ario. A raz
ao e que
existem muitas situaco
es interessantes nas quais e possvel obter uma vers
ao
apenas um pouco mais fraca do enunciado do Lema, mas que ainda e suficiente
para concluir a demonstraca
o da ergodicidade. Em poucas palavras, no lugar de
afirmar que os dois lados de (4.11) s
ao iguais, mostra-se, em muitos casos, que a
raz
ao entre os dois termos e limitada por alguma constante uniforme. Isso e chamado de propriedade de distorca
o limitada. Como exemplo de aplicaca
o destas
ideias, na Seca
o 4.2.4 provaremos que a transformaca
o de Gauss e erg
odica.
Em seguida vamos dar uma aplicaca
o da Proposica
o 4.9 no contexto da
Teoria dos N
umeros. Dizemos que um n
umero x R e balanceado (ou normal )
se todo dgito aparece com a mesma freq
uencia, 1/10, na sua expans
ao decimal.
f
E
acil dar exemplos de n
umeros balanceados ou n
ao-balanceados mas, em geral,
e muito difcil decidir se um dado n
umero irracional e balanceado ou n
ao. Por
exemplo, n
ao e sabido ate hoje se o n
umero e balanceado.
Por outro lado, a proposica
o anterior nos permite mostra facilmente que
quase todo n
umero e balanceado. Este resultado e conhecido como Teorema
Normal de Borel:
Proposi
c
ao 4.11. O conjunto dos n
umeros x R n
ao balanceados tem medida
de Lebesgue nula.

Demonstraca
o. Como o fato de ser balanceado e independente da parte inteira
do n
umero, s
o precisamos mostrar que quase todo x [0, 1] e balanceado.
Considere f : [0, 1] [0, 1] definida por f (x) = 10x [10x]. Para cada dgito
j {0, . . . , 9} considere o intervalo Ij = [j/10, (j + 1)/10). Recorde que se x =
0, a0 a1 ak ak+1 ent
ao f k (x) = 0, ak ak+1 para cada k 1. Portanto,
k
f (x) Ij se, e somente se, o j-esimo dgito da expans
ao decimal de x e igual a j.
Consequentemente, o tempo medio de visita (Ij , x) e exatamente a frequencia
do dgito j na expans
ao decimal de x. Usando o teorema erg
odico de Birkhoff,
e o fato de que a transformaca
o f e erg
odica para a medida de Lebesgue m,
conclumos que para cada j {0, . . . , 9} existe um subconjunto Bj de [0, 1] com
m(Bj ) = 1 tal que

1
para todo x Bj .
10
Ent
ao B = B0 B1 B9 tambem tem m(B) = 1, e todo n
umero x B e
balanceado.
(Ij , x) = m(Ij ) =

4.2.3

Deslocamentos de Bernoulli

Seja (X, C, ) um espaco de probabilidade qualquer. Nesta seca


o consideramos
o espaco produto = X N , munido da -
algebra produto B = C N e da medida
produto = N , que foram defindias na Seca
o 0.2.2. Isto quer dizer que M
e o conjunto de todas as sequencias (xn )nN com xn X para todo n. Por
definica
o, B e a -
algebra gerada pelos cilindros
[m; Am , . . . , An ] = {(xi )iI : xi Ai para m i n}

CAPITULO 4. ERGODICIDADE

104

onde m n e cada Ai e um elemento de C. Alem disso, e caracterizada por


([m; Am , . . . , An ]) =

n
Y

(Ai ).

(4.12)

i=m

DR
AF

Podemos pensar nos elementos de como representando os resultados de


sequencias de experimentos regidos por uma mesma distribuica
o de probabilidade : dado qualquer conjunto mensur
avel A X, a probabilidade de obtermos xi A e igual a (A), qualquer que seja i. Alem disso, os resultados dos
sucessivos experimentos s
ao independentes: de fato a relaca
o (4.12) signfica que
a probabilidade de xi Ai para todo m i n e o produto das probabilidades
de cada um dos eventos xi Ai separadamente.
Nesta seca
o introduzimos uma din
amica : no espaco , chamada
deslocamento (ou shift) de Bernoulli, que preserva a medida . O principal
resultado e que essa medida e erg
odica. Vale a pena observar que e possvel
substituir N por Z em toda a construca
o, ou seja, podemos considerar como
sendo o espaco das sequencias bilaterais (. . . , xn , . . . , x0 , . . . , xn , . . . ). A menos de pequenos ajustes, que deixamos a cargo do leitor, tudo o que vai ser
dito em seguida permanece v
alido nesse caso. Alem disso, no caso bilateral o
deslocamento de Bernoulli e uma aplicaca
o invertvel.
O deslocamento de Bernoulli e a dupla (, ) onde : e a aplicaca
o
definida por
(xn )n ) = (xn+1 ))n .
Ou seja, envia a sequencia (x0 , x1 , . . . , xn , . . . ) na sequencia (x1 , . . . , xn , . . . ).
Observe que a pre-imagem de qualquer cilindro ainda e um cilindro:
1 ([m; Am , . . . , An ]) = [m + 1; Am , . . . , An ].

(4.13)

Segue que e mensur


avel relativamente a
` -
algebra B. Alem disso,



1 ([m; Am , . . . , An ]) = (Am ) (An ) = [m; Am , . . . , An ]

e (usando o Lema 1.7) isso assegura que a medida e invariante por .


Proposi
c
ao 4.12. Todo deslocamento de Bernoulli (, ) e erg
odico.

Demonstraca
o. Seja A um conjunto mensur
avel invariante qualquer. Queremos
mostrar que (A) = 0 ou (A) = 1. Vamos usar o seguinte fato:
Lema 4.13. Se B e C s
ao uni
oes finitas de cilindros disjuntos dois-a-dois,
ent
ao tem-se
(B j (C)) = (B)( j (C)) = (B)(C),

para todo j suficientemente grande.

105

4.2. EXEMPLOS

Demonstraca
o. Para comecar, suponhamos que B e C s
ao ambos cilindros:
B = [k; Bk , . . . , Bl ] e C = [m; Cm , . . . , Cn ]. Ent
ao,
j (C) = [m + j; Cm , . . . , Cn ] para cada j.

Consider qualquer j suficientemente grande para que m + j > l. Ent


ao,

B j (C) = {(xn )n : xk Bk , . . . , xl Bl , xm+j Cm , . . . , xn+j Cn }


= [k; Bk , . . . , Bl , X, . . . , X, Cm , . . . , Cn ],

DR
AF

onde X aparece exatamente m + j l 1 vezes. Pela definica


o (4.12), isto d
a
que
l
n
Y
Y
(B j (C)) =
(Bi ) 1m+jl1
(Ci ) = (B)(C).
i=k

i=m

Isto prova a conclus


ao do lema quando os conjuntos envolvidos s
ao cilindros. O
caso geral segue imediatamente, pelo fato de ser finitamente aditiva.

Suponhamos, inicialmente, que o conjunto invariante A pertence a


`a
lgebra
B0 das uni
oes finitas de cilindros disjuntos. Nesse caso podemos aplicar o lema
anterior com B = C = A. Conclumos que (A j (A)) = (A)2 sempre que
tomemos j suficientemente grande. Mas, como A e invariante, o lado esquerdo
desta igualdade e (A). Desta forma obtemos que (A) = (A)2 , o que s
o pode
acontecer se (A) = 0 ou (A) = 1.
Agora vamos fazer a prova quando A e um conjunto invariante mensur
avel
qualquer. A ideia e aproximar o conjunto invariante por elementos da a
lgebra
B0 , usando o teorema de aproximaca
o (Teorema 0.16): dado qualquer > 0
existe B B0 tal que (AB) < . Fixemos j tal que
(B j (B)) = (B)( m (B)) = (B)2 .

(4.14)

Observe que a diferenca simetrica (A j (A))(B j (B)) est


a contida em
(AB) ( j (A) j (B)) = (AB) j (AB).

Isto, juntamente com o fato de que e invariante por f , implica que




(A j (A)) (B j (B)) 2(AB) < 2.

Alem disso,





(A)2 (B)2 2 (A) (B) < 2.

(4.15)

(4.16)

Juntando as relaco
es (4.14), (4.15), (4.16), conclumos que |(A) (A) | < 4.
Como e arbitr
ario, deduzimos que (A) = (A)2 e, portanto, ou (A) = 0 ou
(A) = 1.

Quando X e um espaco topol


ogico, e C e a sua -
algebra de Borel, podemos
munir com a topologia produto que e, por definica
o, a topologia gerada pelos
cilindros [m; Am , . . . , An ] onde os conjuntos Am , . . . , An s
ao abertos de X. A

CAPITULO 4. ERGODICIDADE

106

propriedade (4.13) implica que o deslocamento : e contnuo para esta


topologia. O teorema de Tychonoff (veja [Dug66]) afirma que e compacto se
X for compacto.
Um caso particular importante ocorre quando X e um conjunto finito munido
da topologia discreta, na qual todo subconjunto e aberto. Dizemos que uma
transformaca
o f : M M e transitiva se existe x M cuja trajet
oria f n (x),
n 0 e densa em . Deixamos a demonstraca
o do pr
oximo resultado a cargo
do leitor (Exerccio 4.3):

DR
AF

Proposi
c
ao 4.14. Seja X um conjunto finito e = X N ou = X Z . Ent
ao o
deslocamento : e uma aplicaca
o contnua e transitiva. Alem disso, o
conjunto dos pontos peri
odicos de e denso em .
O exemplo que apresentamos a seguir, conhecido como paradoxo do macaco,
ilustra o significado da ergodicidade de :
Exemplo 4.15. Se colocarmos um macaco para digitar texto durante um tempo
infinito ent
ao, com probabilidade total, ele acabar
a digitando Os Lusadas 1
e, de fato, o far
a infinitas vezes.
Para demonstrar esta afirmaca
o precisamos formular a situaca
o de modo
um pouco mais preciso. Consideramos que o macaco se encontra perante o
teclado, acertando uma tecla ap
os outra, ao acaso. O texto digitado e, portanto,
uma sequencia (xn )nN onde xn pertence ao conjunto (finito) X dos caracteres
no teclado: letras, espaco, hfen, sinais de pontuaca
o, etc. Supomos que cada
caracter i no teclado tem uma probabilidade positiva pi de ser digitado, a cada
vez. Isto corresponde a uma medida de probabilidade
X
=
p i i
iX

no conjunto X dos caracteres. Tambem supomos que a escolha de cada tecla e independente das teclas digitadas anteriormente. Isto quer dizer que as
possveis sequencias (xn )n s
ao regidas pela probabilidade de Bernoulli = N .
Denotamos por : a aplicaca
o deslocamento no espaco = X N .
O texto de Os Lusadas corresponde a uma certa sequencia finita (mas
longa) de caracteres (l0 , . . . , lN ). Consideremos o cilindro L = [0; l0 , . . . , lN ].
Ent
ao
N
Y
(L) =
plj > 0.
j=1

Uma sequencia (xn )n contem o texto


 de Os Lusadas, comecando no k-esimo
caracter, precisamente se k (xn )n L. Pelo teorema erg
odico de Birkhoff
e pela ergodicidade de (, ), com probabilidade total isso acontece para um
conjunto K de valores de k satisfazendo
lim
n

1
#(K [0, n 1]) = (L) > 0.
n

(4.17)

1 Poema
epico monumental, em 10 cantos, de autoria do poeta portugues Luis de Cam
oes,
falecido em Lisboa em 1580.

107

4.2. EXEMPLOS

4.2.4

Em particular, o conjunto K e infinito. Ou seja, a sequencia digitada contem infinitas c


opias de Os Lusadas, conforme afirmamos. Na verdade, (4.17) prova
ainda mais: sempre com probabilidade total, as c
opias do nosso poema ocupam
uma fraca
o positiva de todos os caracteres digitados. Em outras palavras, em
media, o macaco digita uma nova c
opia de Os Lusadas a cada tantos anos.

Transforma
c
ao de Gauss

DR
AF

Como vimos na Seca


o ??, a transformaca
o de Gauss G(x) = 1/x [1/x] admite
uma probabilidade invariante que e equivalente a
` medida de Lebesgue, a saber:
Z
1
dx
(E) =
.
(4.18)
log 2 E 1 + x
Proposi
c
ao 4.16. O sistema (G, ) e erg
odico.

Este fato pode ser demonstrado por uma vers


ao mais elaborada do metodo
que usamos na Seca
o 4.2.2. Vamos esbocar o argumento da demonstraca
o,
focando na principal dificuldade adicional.
Seja A um conjunto invariante com medida positiva. Queremos mostrar que
(A) = 1. Em primeiro lugar, continua sendo verdade que para quase todo
ponto a [0, 1] existe uma sequencia de intervalos Ik contendo a e tais que Gk
envia Ik bijetivamente e diferenciavelmente sobre (0, 1). Tais intervalos podem
ser encontrados da seguinte forma. Primeiramente, considere
1
1
I(1, m) =
,
,
m+1 m
para cada m 1. Em seguida defina, por recorrencia,

I(k, m1 , . . . , mk ) = I(1, m1 ) Gk+1 I(k, m2 , . . . , mk )

para m1 , . . . , mk 1. Ent
ao, basta tomar para Ik o intervalo I(k, m1 , . . . , mk )
que contem a. O di
ametro de Ik converge para zero quando k (isto ser
a
verificado a seguir). Logo, tomando para a um ponto de densidade de A, temos
que
(Ik A)
1 quando k .
(4.19)
(Ik )

Por outro lado, embora a restrica


o de Gk a cada Ik seja uma bijeca
o diferenci
avel, ela n
ao e afim. Por essa raz
ao, n
ao temos o an
alogo da relaca
o (4.11)
neste caso. Esta dificuldade e contornada por meio do seguinte resultado, que
e um exemplo de controle da distorca
o: e importante notar que a constante K
no enunciado e independente de Ik , E1 , E2 e, sobretudo, k.
Lema 4.17 (Distorca
o limitada). Existe uma constante K > 1 tal que para todo
k 1 e todo intervalo Ik tal que Gk restrita a Ik e uma bijeca
o diferenci
avel,
tem-se
(Gk (E1 ))
(E1 )
K
(Gk (E2 ))
(E2 )
para quaisquer subconjuntos mensur
aveis E1 e E2 de Ik .

CAPITULO 4. ERGODICIDADE

108

Antes de demonstrarmos o Lema 4.17, expliquemos como a ergodicidade de


(G, ) pode ser obtida a partir dele. Tomemos E1 = Ik Ac e E2 = Ik . Ent
ao,
(Gk (Ik Ac ))
(Ik Ac )

K
.
(Gk (Ik ))
(Ik )

Observe que Gk (Ik Ac ) = Ac , a menos de um conjunto com medida nula,


porque o conjunto A e invariante. Lembre tambem que Gk (Ik ) = (0, 1), que
tem medida total. Portanto, a desigualdade anterior pode ser escrita como
(Ik Ac )
.
(Ik )

DR
AF

(Ac ) K

De acordo com (4.19), a express


ao do lado direito converge para zero quando
k . Logo (Ac ) = 0, como queramos demonstrar.
Daremos agora a prova do Lema 4.17, com a ajuda de dois resultados auxiliares:
Lema 4.18. Para todo x (0, 1] vale que
|G0 (x)| 1

|(G2 )0 (x)| 2

|G00 (x)/G0 (x)2 | 2.

Demonstraca
o. Lembre que G(x) = 1/xm em cada intervalo (1/(m+1), 1/m].
Portanto
1
2
G0 (x) = 2 e G00 (x) = 3 .
x
x
A primeira igualdade implica |G0 (x)| 1 para todo x (0, 1]. Alem disso
|G0 (x)| 2 sempre que x 2/3. Por outro lado, x 2/3 implica que
G(x) = 1/x1 < 2/3 e, por consequencia, G0 (G(x)) 2. Combinando estas observaco
es obtemos que |(G2 )0 (x)| = |G0 (x)| |G0 (G(x))| 2 para todo x (0, 1].
Finalmente, |G00 (x)/G0 (x)2 | = 2|x| 2 tambem para todo x (0, 1].
Lema 4.19. Existe uma constante C > 1 tal que para todo k 1 e todo
intervalo Ik tal que Gk restrita a Ik e uma bijeca
o diferenci
avel, tem-se
|(Gk )0 (x)|
C
|(Gk )0 (y)|

para quaisquer x e y em Ik .

Demonstraca
o. Seja g um inversa local de G, isto e, uma funca
o diferenci
avel
definida em algum intervalo e tal que G(g(z)) = z para todo z no domnio de
definica
o. Note que


0 G00 (g(z)) g 0 (z)


G00 (g(z))
log |G0 g(z)| =
=
.
G0 (g(z))
G0 (g(z))2

Portanto, a u
ltima estimativa no Lema 4.18 implica que


log |G0 g(z)| 0 2 para todo g e todo z.

(4.20)

109

4.2. EXEMPLOS

k1

log

Em outras palavras, toda funca


o da forma log |G0 g| admite 2 como constante
de Lipschitz. Observe tambem que se x, y Ik ent
ao
|(Gk )0 (x)| X
=
log |G0 (Gj (x))| log |G0 (Gj (y))|
|(Gk )0 (y)|
j=0
=

k
X
j=1

log |G0 gj (Gj (x))| log |G0 gj (Gj (y))|

DR
AF

onde gj representa uma inversa local de G definida no intervalo [Gj (x), Gj (y)].
Usando a estimativa (4.20), obtemos que
log

k
k1
X
X
|(Gk )0 (x)|
j
j

2
|G
(x)

G
(y)|
=
2
|Gki (x) Gki (y)|.
|(Gk )0 (y)|
j=1
i=0

(4.21)

Agora, as duas primeiras estimativas no Lema 4.18 implicam que


|Gk (x) Gk (y)| 2[i/2] |Gki (x) Gki (y)|

para todo i = 0, . . . , k. Substituindo em (4.21), conclumos que


log

k1
X
|(Gk )0 (x)|

2
2[i/2] |Gk (x) Gk (y)| 8|Gk (x) Gk (y)| 8.
k
0
|(G ) (y)|
i=0

Agora basta tomar C = exp 8.

Demonstraca
o do Lema 4.17. Seja m a medida de Lebesgue em [0, 1]. O Lema 4.19
implica que
R
|(Gk )0 | dm
m(Gk (E1 ))
m(E1 )
E1
R
C
=
.
k )0 | dm
m(Gk (E2 ))
|(G
m(E
2)
E2
Por outro lado, a definica
o (4.18) implica que

1
1
m(E) (E)
m(E),
2 log 2
log 2

para todo conjunto mensur


avel E [0, 1]. Combinando estas duas relaco
es,
obtemos que
(Gk (E1 ))
m(Gk (E1 ))
m(E1 )
(E1 )
2
2C
4C
.
k
k
(G (E2 ))
m(G (E2 ))
m(E2 )
(E2 )

Assim, basta tomar K = 4C.

CAPITULO 4. ERGODICIDADE

110

Endomorfismos lineares do toro

4.2.5

DR
AF

Lembre que chamamos toro de dimens


ao d ao quociente Td = Rd /Zd , ou seja,
o espaco das classes de equivalencia da relaca
o de equivalencia definida em R d
d
por x y x y Z . Este quociente herda de Rd uma estrutura de
variedade diferenci
avel de dimens
ao d. No que segue supomos que Td tambem
est
a munido da metrica riemanniana plana, que o torna localmente isometrico
ao espaco euclideano Rd . Seja m a medida de Lebesgue associada a esta metrica
riemanniana.
Seja A uma matriz d-por-d com coeficientes inteiros e determinante diferente
de zero. Ent
ao A(Zd ) Zd e, por consequencia, A induz uma transformaca
o
f A : Td T d ,

fA ([x]) = [A(x)]

onde [x] denota a classe de equivalencia que contem x Rd . Chamamos tais


transformaco
es de endomorfismos lineares do toro. Note que fA e diferenci
avel
e a derivada DfA (x) em cada ponto est
a canonicamente identificada com A.
Em particular, o jacobiano det DfA ([x]) e constante igual a det A. Isso tambem
implica que o grau de f e igual a | det A|. Portanto, fA e invertvel se, e somente
se, | det A| = 1. Neste caso, a sua inversa e a transformaca
o fA1 induzida pela
matriz inversa A1 ; observe que A1 tambem e uma matriz com coeficientes
inteiros.
Em qualquer caso, fA preserva a medida de Lebesgue em Td . Isto pode ser
visto da seguinte forma. Como fA e um difeomorfismo local, a pre-imagem de
qualquer conjunto mensur
avel D com di
ametro suficientemente pequeno est
a
formada por | det A| (= grau de fA ) partes disjuntas Di , cada uma das quais
e enviada difeomorficamente sobre D. Pela f
ormula de mudanca de vari
avel,
m(D) = | det A| m(Di ) para todo i. Isto prova que m(D) = m(f 1 (D)) para
todo domnio D suficientemente pequeno. Logo f preserva a medida m. Agora
vamos provar o seguinte fato:
Teorema 4.20. O sistema (fA , m) e erg
odico se, e somente se, nenhum autovalor da matriz A e raiz da unidade.
Demonstraca
o. Considere qualquer funca
o L2 (m) e seja
X
ck e2i(kx)
([x]) =
kZd

a sua expans
ao em serie de Fourier. Observe que k x = k1 x1 + + kd xd . Os
coeficientes ck C satisfazem
X
|ck |2 = kk22 < .
(4.22)
kZd

Ent
ao, a expans
ao em serie de Fourier de fA e:
X
X

(fA ([x])) =
ck e2i(kA(x)) =
ck e2i(A (k)x) ,
kZd

kZd

111

4.2. EXEMPLOS

onde A representa a adjunta de A. Suponha que e funca


o invariante, isto
e, fA = em -quase todo ponto. Ent
ao, por unicidade da expans
ao de
Fourier, devemos ter
cA (k) = ck

para todo k Z.

(4.23)

DR
AF

Afirmamos que a trajet


oria de todo k 6= 0 pela transformaca
o A e infinita. De
fato, se a trajet
oria de algum k 6= 0 fosse finita ent
ao deveriam existir l, m Z
com m > 0 tais que A(l+m) (k) = Al (k). Isto s
o poderia acontecer se A tivesse
algum auto-valor tal que m = 1. Mas essa possibilidade est
a excluda, por
hip
otese, uma vez que A e A tem os mesmos autovalores. Logo, a trajet
oria
de todo k 6= 0 e infinita, como afirmamos. Ent
ao a igualdade (4.23) juntamente
com (4.22) implica que ck = 0 para todo k 6= 0. Portanto, = c0 em m-quase
todo ponto. Isto prova a ergodicidade.
Para provar a recproca, suponha que A admite algum autovalor que e uma
raz da unidade. Ent
ao o mesmo vale para A e, portanto, existe m 1 tal
que 1 e autovalor de Am . Como Am tem coeficientes inteiros, segue (veja o
Exerccio 4.12) que existe algum k Zd \ {0} tal que Am (k) = k. Fixe k e
considere a funca
o L2 (m) definida por
([x]) =

m1
X

e2i(xA

i=0

(k))

m1
X

e2i(A

(x)k)

i=0

Ent
ao e uma funca
o invariante por fA mas n
ao e constante. Logo, fA n
ao e
erg
odica.

4.2.6

Argumento de Hopf

Nesta seca
o vamos apresentar outro metodo, mais geometrico, para demonstrar a ergodicidade de certos endomorfismos lineares do toro. Este metodo se
aplica sempre que | det A| = 1 e a matriz A e hiperb
olica, ou seja, ela n
ao
tem autovalores de m
odulo 1. Mas a sua grande vantagem e que ele pode
ser estendido a sistemas diferenci
aveis muito mais gerais, n
ao necessariamente
lineares. Algumas dessas extens
oes ser
ao mencionadas na Seca
o 4.3.
A hip
otese de que a matriz A e hiperb
olica significa que o espaco Rd pode
d
s
ser escrito como uma soma direta R = E E u tal que:
1. A(E s ) = E s e todos os autovalores de A | E s tem m
odulo menor que 1;

2. A(E u ) = E u e todos os autovalores de A | E u tem m


odulo maior que 1.

Ent
ao existem constantes C > 0 e < 1 tais que

kAn (v s )k Cn kv s k para todo v s E s e todo n 0,

kAn (v u )k Cn kv u k para todo v u E u e todo n 0.

(4.24)

CAPITULO 4. ERGODICIDADE

112
2 1
1 1

. Os seus autovalores s
ao

Exemplo 4.21. Considere A =

3+ 5
3 5
u =
> 1 > u =
>0
2
2

e os respectivos autoespacos s
ao:

51
5+1
u
2
s
2
x} e E = {(x, y) R : y =
x}.
E = {(x, y) R : y =
2
2

DR
AF

A famlia de todos os subespacos afins de R da forma v + E s , com v Rd ,


define uma partica
o F s de Rd , que chamamos folheaca
o est
avel e cujos elementos
chamamos folhas est
aveis de A. Ela e invariante por A, ou, seja, a imagem de
qualquer folha est
avel e tambem uma folha est
avel. Alem disso, pela propriedade
(4.24), a transformaca
o A contrai dist
ancias, uniformemente, dentro de cada
folha. Analogamente, a famlia de todos os subespacos afins de R da forma
v + E u com v Rd define uma partica
o F u de Rd , chamada folheaca
o inst
avel.
Esta folheaca
o tambem e invariante e a transformaca
o A expande dist
ancias ao
longo das suas folhas.
W u (x)

W s (x)

PSfrag replacements

Figura 4.1: Folheaca


o est
avel e folheaca
o inst
avel no toro

Projetando F s e F u pela projeca


o can
onica : Rd Td obtemos folheaco
es
u
W e W do toro que chamamos folheaca
o est
avel e folheaca
o inst
avel da transformaca
o fA . Veja a Figura 4.1. As observaco
es anteriores mostram que estas
folheaco
es s
ao invariantes por fA . Alem disso:
s

(a) dados dois pontos quaisquer x e y na mesma folha est


avel, tem-se que
d(fAj (x), fAj (y)) 0 quando n +;

(b) dados dois pontos quaisquer y e z na mesma folha inst


avel, tem-se que
d(fAj (y), fAj (z)) 0 quando n .

Vamos utilizar esta informaca


o geometrica para provar que (f A , m) e erg
odica.
Para isso, considere qualquer funca
o contnua : T R e considere as medias

113

temporais
+ (x) = lim
n

4.2. EXEMPLOS

n1
1X
(fAj (x))
n j=0

e (x) = lim
n

n1
1X
(fAj (x)),
n j=0

definidas para m-quase todo x Td . Pelo Corol


ario 3.13, existe um conjunto
X Td com medida total tal que
+ (x) = (x)

para todo x X.

(4.25)

DR
AF

Denotaremos por W s (x) e W u (x), respectivamente, a folha est


avel e a folha
inst
avel de fA passando por cada ponto x Td .

Lema 4.22. A funca


o + e constante em toda folha de W s : se + (x) existe e
s
+
y W (x) ent
ao (y) existe e e igual a + (x). Analogamente, e constante
em toda folha de W u .

Demonstraca
o. De acordo com a propriedade (a) acima, d(fAj (x), fAj (y)) converge para zero quando j . Como e contnua (logo uniformemente
contnua, uma vez que o domnio e compacto) isso implica que
(fAj (x)) (fAj (y)) 0 quando j .

Por maioria de raz


ao, o limite Cesaro

n1
1X
lim
(fAj (x)) (fAj (y))
n n
j=0

tambem e zero. Isso implica + (y) existe e e igual a + (x). O argumento para
e inteiramente an
alogo.
Dado um subconjunto aberto R do toro e dado x R, denotamos por
W s (z, R) a componente conexa de W s (x) R que contem x e por W u (z, R) a
componente conexa de W u (x) R que contem x. Chamamos R de ret
angulo se
W s (x, R) intersecta W u (y, R) num u
nico ponto, para todo x e y em R. Veja a
Figura 4.2.

Lema 4.23. Dado qualquer ret


angulo R Td , existe um conjunto mensur
avel
YR X R tal que m(R \ YR ) = 0 e, dados quaisquer x e y em YR , existem
pontos x0 e y 0 em X R tais que x0 W s (x, R) e y 0 W s (y, R) e y 0 W u (x0 ).

Demonstraca
o. Representemos por msx a medida de Lebesgue na folha est
avel
s
W (x) de cada ponto x Td . Note que m(R \ X) = 0, uma vez que X tem
medida total em Td . Ent
ao, usando o teorema de Fubini,

msx W s (x, R) \ X = 0 para m-quase todo x R.

CAPITULO 4. ERGODICIDADE

114

W s (x)

PSfrag replacements

x0

W s (y)

DR
AF

y0

Figura 4.2: Ret


angulo em Td




Defina YR = x X R : msx W s (x, R) \ X = 0 . Ent
ao YR tem medida total
em R. Dados x, y R considere a aplicaca
o
: W s (x, R) W s (y, R),

(x0 ) = interseca
o entre W u (x0 , R) e W s (y, R).

Esta aplicaca
o e afim e, portanto, tem a seguinte propriedade, que chamamos
continuidade absoluta:
msx (E) = 0

msy ((E)) = 0.

Em particular, a imagem de W s (x, R) X tem medida total em W s (y, R) e,


consequentemente, ela intersecta W s (y, R) X. Em outras palavras, existir
x0 W s (x, R) X cuja imagem y 0 = (x0 ) est
a em W s (y, R) X. Observando
0
0
que x e y est
ao na mesma folha inst
avel, pela definica
o da , vemos que estes
pontos satisfazem as condico
es na conclus
ao do lema.
Considere um ret
angulo R qualquer. Dados quaisquer x, y em YR , considere
os pontos x0 , y 0 em X dados pelo Lema 4.23. Usando tambem o Lema 4.22,
obtemos:
(x) = + (x) = + (x0 ) = (x0 ) = (y 0 ) = + (y 0 ) = + (y) = (y).

Isto mostra que as funco


es + e coincidem uma com a outra e s
ao constantes
em YR . Agora seja R1 , . . . , RN uma cobertura finita do toro por ret
angulos.
Considere o conjunto
Y =

N
[

Yj ,

onde Yj = YRj .

j=1

Observe que m(Y ) = 1, uma vez que Y Rj Yj tem medida total em Ri


para todo j. Afirmamos que + = e constante em todo o Y . De fato, dados
quaisquer k, l {1, . . . , N } podemos encontrar j0 = k, j1 , . . . , jn1 , jn = l tais
que cada Rji intersecta Rji1 (isto e uma simples consequencia da conexidade


4.3. COMENTARIOS
SOBRE SISTEMAS CONSERVATIVOS

115

4.3

por arcos do toro). Lembrando que Rj e aberto e Xj e um subconjunto de medida total, obtemos que cada Xji intersecta Xji1 . Ent
ao, + = e constante
na uni
ao de todos os Xji . Isto prova a nossa afirmaca
o.
Desta forma, mostramos que as medias temporais de qualquer funca
o
contnua s
ao constantes em m-quase todo ponto. Consequentemente (veja o
Exerccio 4.7), o sistema (fA , m) e erg
odico.

Coment
arios sobre sistemas conservativos

DR
AF

O teorema erg
odico de Birkhoff, provado nos anos trinta do seculo 20, deu s
olida
fundamentaca
o matem
atica para a hip
otese erg
odica de Boltzmann, mas deixou
totalmente em aberto a quest
ao da veracidade da pr
opria hip
otese erg
odica.
Nesta seca
o vamos dar um panorama breve dos principais resultados obtidos
desde ent
ao nesta direca
o.

4.3.1

Teoria de Kolmogorov-Arnold-Moser

Os sistemas em que Boltzmann estava interessado, relativos ao movimento das


moleculas de gases podem, em princpio, ser descritos pelas leis da mec
anica
cl
assica newtoniana. No chamado formalismo hamiltoniano da mec
anica cl
assica,
os estados do sistema s
ao representados por meio das coordenadas generalizadas q1 , . . . , qd e dos momentos generalizados p1 , . . . , pd e a sua evoluca
o e
descrita pelas soluco
es das equaco
es de Hamilton-Jacobi:
dqi
H
=
dt
pi

dpi
H
=
,
dt
qi

i = 1, . . . , d,

onde H e a energia total do sistema. A energia e constante ao longo de trajet


orias
do fluxo, j
a que:
d
X
dH
dqi
dpi
=
+
0.
dt
q
dt
p
i
i dt
i=1

Portanto, podemos considerar a restrica


o do fluxo a cada hipersuperfcie de
energia Hc = {(q, p) : H(q, p) = c}. A medida de volume dq1 dqd dp1 dpd
e chamada medida de Liouville. Observando que o campo de vetores
F =

H
H H
H 
,...,
,
,...,
p1
pd q1
qd

tem divergente nulo (lembre a Seca


o 1.3.6), conclumos que o fluxo preserva a
medida de Liouville. Em consequencia (veja o Exerccio ??), a restrica
o do fluxo
a cada hipersuperfcie de energia Hc tambem tem uma medida invariante c ,
que e dada por
Z
ds
c (E) =
para todo conjunto mensur
avel E Hc
E kHk

116

CAPITULO 4. ERGODICIDADE

DR
AF

onde ds representa o elemento de volume na hipersuperfcie. Ent


ao e natural
perguntar se, em geral, sistemas hamiltonianos s
ao erg
odicos relativamente a
`
medida invariante em (quase) toda hipersuperfcie de energia.
O primeiro grande resultado nesta direca
o foi anunciado por Andrey Kolmogorov em 1954 e foi, logo em seguida, substanciado pelos trabalhos de Vladimir
Arnold e J
urgen Moser. Isto conduziu a uma teoria muito profunda, que e conhecida como Teoria KAM em homenagem aos seus fundadores, e para qual
contriburam de maneira decisiva diversos outros matem
aticos, com destaque
para ?? Haussmann, Michael Herman, Jean-Christophe Yoccoz e Eddy Zehnder, entre outros.
A afirmaca
o original de Kolmogorov pode ser apresentada da seguinte forma.
Suponha que e uma trajet
oria fechada do fluxo. Considere uma seca
o H c
transversal ao fluxo em algum ponto p e seja f a transformaca
o de Poincare,
ou seja, a trasformaca
o de primeiro retorno do fluxo a . Veja a Figura 4.3.
Observe que f (p) = p e que e uma variedade de dimens
ao 2d2. Dizemos que
a trajet
oria e elptica se todos os autovalores de Df (p) tem m
odulo 1. Ent
ao,
sob uma condic ao fraca de transversalidade, chamada condica
o de tors
ao, o
fluxo hamiltoniano n
ao e erg
odico.

Figura 4.3: Transformaca


o de Poincare

Para darmos um enunciado mais preciso, consideremos diretamente a transformaca


o de Poincare. Para simplificar, suporemos inicialmente que d = 2, ou
seja que e uma superfcie; em seguida comentaremos o caso geral.
Consideremos ent
ao uma transformaca
o f : U R2 de classe C , onde U
2
R e uma vizinhanca da origem, que preserva a medida de a
rea. Suponhamos
que f (0) = 0 e que os autovalores de Df (0) s
ao n
umeros complexos com m
odulo
1. Isto implica que Df (0) e linearmente conjugada a uma rotaca
o R . Ent
ao e
possvel escrever f na forma
f (, ) = ( + R(, ), + + T (, ))

onde ??.

Teorema 4.24. Suponha que T /(0) 6= 0 (condica


o de tors
ao). Ent
ao existe
um conjunto K U tal que
(a) K e uma uni
ao de crculos diferenci
aveis cada um dos quais e invariante
por f


4.3. COMENTARIOS
SOBRE SISTEMAS CONSERVATIVOS

117

(b) a restrica
o de f a cada um destes crculos e conjugada a uma rotaca
o
irracional em S 1 ;

(c) K tem medida de Lebesgue positiva e, de fato, a origem e um ponto de


densidade:

m K B(0, )
lim
.
0
B(0, )

DR
AF

Claramente, a existencia de tal conjunto K implica que a transformaca


o f
n
ao e erg
odica. Quando f corresponde a uma transformaca
o de Poincare de um
fluxo, os circulos invariantes d
ao origem a toros invariantes do fluxo, cuja uni
ao
e um conjunto com medida positiva. Novamente, a presenca de tal conjunto
implica que o fluxo n
ao e erg
odico.

Exemplo 4.25. Considere f0 : B(0, 1) R2 dada por f0 (, ) = (, + + c)


onde c 6= 0 e seja U uma pequena vizinhanca de f0 no espaco das transformaco
es
f : B(0, 1) R de classe C que preservam a medida de Lebesgue. Ent
ao
nenhuma f U e erg
odica. De fato, pode mostrar-se que a hip
otese implica que
f tem um u
nico ponto fixo p e ele est
a pr
oximo da origem. Ent
ao, a menos de
uma pequena translaca
o, podemos supor que p = 0. Ent
ao a afirmaca
o segue
do Teorema 4.24.
O Teorema 4.24 pode ser generalizado para transformaco
es f : U R d2
para qualquer d 2. Alem da condic ao de que todos os autovalores de Df (0)
tenham m
odulo 1 precisamos supor que a transformaca
o f e simpletica, uma
condica
o mais forte do que apenas presevar a medida de Lebesgue. A condica
o
de tors
ao tambem precisa ser formulada de modo adequado. A conclus
ao e que
existe um conjunto invariante K com medida de Lebesgue positiva formado por
toros invariantes de dimens
ao d 1. Isso d
a origem a um conjunto invariante
para o fluxo hamiltoniano, com medida de Lebesgue positiva, formado por toros
de dimens
ao d.
A condica
o de que f seja C e demasiado forte: os resultados que acabamos
de mencionar continuam validos para aplicaco
es finitamente deriv
aveis. Por
exemplo, no Teorema 4.24 basta supor que f e de classe C 3 com derivada H
older
contnua.
O leitor interessado poder
a obter informaca
o muito mais completa sobre a
teoria KAM nas seguintes referencias: [?].

4.3.2

Bilhares

Na seca
o anterior discutimos a quest
ao da ergodicidade no contexto geral de
sistemas hamiltonianos. Mas, na verdade, o contexto que interessava a Boltzmann era bem mais restrito. Os bilhares s
ao sistemas que visam modelar, de
modo mais especfico, o comportamento dos gases ideais. Nesta seca
o vamos
descrever esta noca
o e discutir brevemente algumas de suas propriedades.
Na sua forma mais simples, um bilhar e dado por um domnio conexo R2 ,
a mesa do bilhar, cujo bordo est
a formado por um n
umero finito de curvas

CAPITULO 4. ERGODICIDADE

118

diferenci
aveis. Chamamos cantos do bilhar aos pontos onde o bordo n
ao e diferenci
avel; por hip
otese eles formam um conjunto finito C . Consideramos
uma partcula pontual em movimento retilneo uniforme dentro de , com choques el
asticos com o bordo. Isto e, a cada encontro com \ C a partcula e
refletida, de tal forma que o a
ngulo de incidencia e igual ao a
ngulo de reflex
ao.
Veja a Figura 4.4. Quando a partcula acerta um dos cantos ela e absorvida: a
trajet
oria n
ao est
a definida a partir da.

DR
AF

PSfrag replacements

s0

Figura 4.4: Din


amica num bilhar

Consideremos cada componente conexa de orientada e parametrizada


claro que o movimento da partcula fica topelo comprimento de arco s. E
talmente caracterizado pela sequencia de choques com o bordo. Alem disso,
cada choque pode ser descrito pela posica
o s e pelo a
ngulo de incidencia
[0, ]. Portanto, a evoluca
o do bilhar e regida pela transformaca
o
f : ( \ C) (0, ) (0, ),

que a cada choque (s, ) associa o choque subsequente (s0 , 0 ). Veja a Figura 4.4.

Proposi
c
ao 4.26. A medida = sin dsd em (0, ) e invariante por f .

Demonstraca
o. A ideia e usar a construca
o da Seca
o 2.4.3: f pode ser vista como
uma transformaca
o de Poincare de um certo fluxo e a medida corresponde ao
transporte de uma certa medida invariante pelo fluxo. Vamos esbocar este
argumento, deixando ao leitor o cuidado de preenccher os detalhes.
o de
Considere o espaco M = S 1 / , onde S 1 = R/(2Z) e e a relaca
equivalencia:
(s, ) (s, + ) para cada s .
(4.26)
Considere tambem o fluxo (g t )t definido em M por
??

4.3.3

Fluxos geod
esicos

Seja M uma variedade Riemanniana compacta. O fibrado tangente unit


ario
T 1 M e o conjunto das duplas (x, v) em que x M e v e um vetor de norma

119

4.4. PROPRIEDADES DE MEDIDAS ERGODICAS

DR
AF

Figura 4.5: Bilhares dispersivos

1 tangente a
` variedade no ponto x. Para cada (x, v) T 1 M existe uma u
nica
geodesica : R M tal que ((0), 0 (0)) = (x, v). Alem disso, 0 (t) tem norma
1 para todo t. O fluxo geodesico e o fluxo definido em T 1 M por


(0), 0 (0) 7 (t), 0 (t) .
??

??

4.3.4

Sistemas parcialmente hiperb


olicos

??

4.4

Propriedades de medidas erg


odicas

Nesta seca
o consideramos que a transformaca
o f : M M est
a fixada e analisamos o espaco M1 (f ) das probabilidades invariantes por f , especialmente o
subconjunto Me (f ) das probabilidades erg
odicas.
Lembre que uma medida diz-se absolutamente contnua com relaca
o a
outra medida se (E) = 0 implica (E) = 0. Nesse caso escrevemos  .
Esta relaca
o e transitiva: se  e  ent
ao  . O primeiro resultado
afirma que probabilidades erg
odicas s
ao minimais para esta relaca
o de ordem:

Proposi
c
ao 4.27. Se e s
ao probabilidades invariantes tais que e erg
odica
e e absolutamente contnua com relaca
o a , ent
ao = .

Demonstraca
o. Seja : M R uma funca
o mensur
avel limitada qualquer.
Como e invariante e erg
odica, a media temporal
n1
1X
(f j (x))
n n
j=0

(x)

= lim

R
e constante: (x)

= d em -quase todo ponto. Segue que esta igualdade


tambem vale em -quase todo ponto, j
a que  . Em particular,
Z
Z
Z
d = d = d

CAPITULO 4. ERGODICIDADE

120

(a primeira igualdade e parte do teorema erg


odico de Birkhoff). Portanto, as
integrais de com relaca
o a e em relaca
o a coincidem, qualquer que seja
a funca
o mensur
avel limitada . Em particular, considerando funco
es caractersticas, conclumos que = .
claro que se 1 e 2 s
E
ao probabilidades invariantes com respeito a
` transformaca
o f ent
ao (1 t)1 + t2 tambem e probabilidade invariante, qualquer
que seja t (0, 1). Isto significa que o espaco M1 (f ) das probabilidades invariantes e convexo. A proposica
o que apresentamos a seguir afirma que as medidas
erg
odicas s
ao os elementos extremais deste convexo:

DR
AF

Proposi
c
ao 4.28. Uma probabilidade invariante e erg
odica se, e somente se,
n
ao e possvel escreve-la na forma = (1 t)1 + t2 com t (0, 1) e 1 , 2
probabilidades invariantes distintas.
Demonstraca
o. Para provar a parte se, suponha que n
ao e erg
odica. Ent
ao
existe algum conjunto invariante A com 0 < (A) < 1. Defina 1 e 2 como
sendo as restrico
es normalizadas de a A e ao seu complementar, respectivamente:
(E Ac )
(E A)
e
2 (E) =
.
1 (E) =
(A)
(Ac )
Como A e Ac s
ao conjuntos invariantes e e medida invariante, 1 e 2 s
ao
tambem probabilidades invariantes. Alem disso,
= (A)1 + (Ac )2

e portanto n
ao e extremal. Para provar a recproca, suponha que e erg
odica
claro que (E) = 0 implica
e temos = (1 t)1 + t2 com t (0, 1). E
1 (E) = 2 (E) = 0, ou seja, 1 e 2 s
ao absolutamente contnuas com relaca
o
a . Logo, pela Proposica
o 4.27, 1 = = 2 . Isto prova que e extremal.
Em seguida vamos mostrar que medidas erg
odicas distintas vivemem subconjuntos disjuntos do espaco M : ??

Lema 4.29. Seja {i : i I} uma famlia finita ou enumer


avel de probabilidades invariantes e erg
odicas, todas distintas. Ent
ao existem subconjuntos
mensur
aveis {Pi : i I} disjuntos dois-a-dois, tais que

1 se j = k
f 1 (Pi ) = Pi e j (Pk ) =
0 se j 6= k.
Demonstraca
o. Fixe qualquer par j, k de n
umeros distintos em {1, . . . , N }.
Pelo Proposica
o 4.27, a medida j n
ao pode ser absolutamente contnua com
relaca
o a k . Em outras palavras, existe algum subconjunto mensur
avel Aj,k
n
tal que j (Aj,k ) > 0 mas k (Aj,k ) = 0. Denote Bj,k =
f
(A
ao
j,k ). Ent
n=0
j (Bj,k ) > 0, uma vez que Bj,k contem Aj,k , e k (Bj,k ) = 0, uma vez que k e
invariante. Alem disso, e imediato da definica
o que
f 1 (Bj,k ) =

n=1

f n (Aj,k ) Bj,k .


4.4. PROPRIEDADES DE MEDIDAS ERGODICAS

121

n
Denote Cj,k =
(Bj,k ). Por um lado,
n=0 f

f 1 (Cj,k ) =

f n (Bj,k ) = Cj,k ,

(4.27)

n=1

uma vez que a sequencia f n (Bj,k ) e decrescente. Por outro lado, o Teorema 0.13 d
a que
j (Cj,k ) = lim j (f n (Bj,k )) = j (Bj,k ) > 0.
n

DR
AF

Logo, por ergodicidade, j (Cj,k ) = 1. Alem disso, k (Cj,k ) = 0 uma vez que
Cj,k Bj,k . Agora defina
\
[
Dj =
Cj,k e Pj = Dj \
Dk .
k6=j

k6=j

A propriedade (4.27) assegura que f 1 (Dj ) = Dj . Note tambem que j (Dj ) = 1


e k (Dj ) = 0 para todo k 6= j. Ent
ao, f 1 (Pj ) = Pj para todo j e j (Pj ) = 1
e k (Pj ) = 0 para todo k 6= j. Alem disso, os Pj s
ao disjuntos dois-a-dois.
Agora suponha que f : M M e uma aplicaca
o contnua num espaco
topol
ogico. Dizemos que a aplicaca
o f e transitiva se existe algum x M tal
que {f n (x) : n N} e denso em M . O lema a seguir d
a uma caracterizaca
o u
til
da transitividade. Lembre que um espaco topol
ogico M e chamado de espaco de
Baire se a interseca
o de qualquer famlia enumer
avel de abertos densos e densa
em M . Todo espaco metrico completo e um espaco de Baire e o mesmo vale
para todo espaco topol
ogico localmente compacto (veja [Dug66]).

Lema 4.30. Suponha que M e um espaco de Baire com base enumer


avel de
abertos. Ent
ao f : M M e transitiva se, e somente se, para todo par de
abertos U e V existe k 1 tal que f k (U ) intersecta V .

Demonstraca
o. Suponha que f e transitiva e seja x M um ponto cuja o
rbita
{f n (x) : n N} e densa em M . Ent
ao existe m 1 tal que f m (x) V e
(usando que {f n (x) : n > m} tambem e denso) existe n > m tal que f n (x) U .
Tome k = n m. Ent
ao f m (x) f k (U ) V . Isto prova a parte somente se
do enunciado.
Para provar a recproca, seja {Uj : j N} uma base enumer
avel de abertos
k
de M . A hip
otese garante que o aberto
f
(U
)

e
denso
em
M para todo
j
k=1
j N. Ent
ao a interseca
o
X=

[
\

f k (Uj )

j=1 k=1

e um subconjunto denso de M . Em particular, ele e n


ao vazio. Por outro
lado, por definica
o, se x X ent
ao para todo j N existe algum k 1 tal
que f k (x) Uj . Como os Uj constituem uma base de vizinhancas de M , isto
significa que {f k (x) : k N} e densa em M .

CAPITULO 4. ERGODICIDADE

122

Proposi
c
ao 4.31. Suponha que M e um espaco de Baire com base enumer
avel
de abertos. Ent
ao a restrica
o de f ao suporte de e transitiva.

DR
AF

Demonstraca
o. Comece por notar que supp tem base enumer
avel de abertos,
por ser um subespaco de M , e e um espaco de Baire, uma vez que e fechado
em M . Sejam U e V abertos de supp . Pela definica
o do suporte, (U ) > 0
k
e (V ) > 0. Defina B =
f
(U
).
Ent
a
o
(B)
> 0, porque B U , e
k=1
f 1 (B) B. Por ergodicidade (veja o Exerccio 4.1) segue que (B) = 1. Ent
ao
B deve intersectar V . Isto prova que existe k 1 tal que f k (U ) intersecta V .
Pelo Lema 4.30, segue que a transformaca
o f : supp supp e transitiva.

4.5

Teorema da decomposi
c
ao erg
odica

No caso de subconjuntos convexos em dimens


ao finita tem-se que todo elemento
do convexo pode ser escrito como combinaca
o convexa dos elementos extremais.
Por exemplo, todo ponto num tri
angulo no plano pode ser escrito como combinaca
o convexa dos vertices do tri
angulo.
Na sequencia dos resultados da Seca
o 4.4, e natural perguntar se a mesma
propriedade vale no espaco das probabilidades invariantes, ou seja, se toda medida invariante e uma combinaca
o linear de medidas erg
odicas. O teorema
que apresentamos nesta seca
o mostra que a resposta e afirmativa, exceto que
o n
umero de parcelas nesta combinaca
o n
ao e necessariamente finito, nem
mesmo enumer
avel. Veja os exemplos a seguir:
Exemplo 4.32. Considere f : [0, 1] [0, 1] dada por f (x) = x2 . As medidas
de Dirac 0 e 1 s
ao invariantes e erg
odicas para f . Tambem e claro que x = 0
e x = 1 s
ao os u
nicos pontos recorrentes por f e portanto toda probabilidade
invariante satisfaz ({0, 1}) = 1. Em particular, = ({0})0 + ({1})1 e
uma combinaca
o convexa (finita) de medidas erg
odicas.
Exemplo 4.33. Considere f : T2 T2 dada por f (x, y) = (x+y, y). A medida
de Lebesgue m no toro e preservada por f . Observe que todo crculo horizontal
Hy = S 1 {y} e invariante por f e a restrica
o f : Hy Hy e a rotaca
o Ry .
Seja my a medida de Lebesgue em Hy . Observe que my tambem e invariante
por f . Alem disso, my e erg
odica sempre que y e irracional. Por outro lado,
pelo teorema de Fubini,
Z
m(E) = my (E) dy para todo conjunto mensur
avel E.
(4.28)
A igualdade n
ao e afetada se considerarmos a integral restrita ao subconjunto
dos valores irracionais de y. Ent
ao (4.28) apresenta como uma combinaca
o
convexa (n
ao-enumer
avel) de medidas erg
odicas.

4.5.1

Enunciado do teorema

Antes de enunciarmos o teorema da decomposica


o erg
odica, precisamos introduzir alguma terminologia. No que segue (M, B, ) ser
a um espaco de probabilidade e P ser
a uma partica
o de M em conjuntos mensur
aveis. Denotaremos por

ERGODICA

4.5. TEOREMA DA DECOMPOSIC


AO

123

: M P a projeca
o natural que associa a cada ponto x M o elemento P(x)
da partica
o que o contem. Esta projeca
o permite munir P de uma estrutura de
espaco de probabilidade, da seguinte forma. Primeiramente, dizemos que um
subconjunto Q de P e mensur
avel se, e somente se, a pre-imagem
1 (Q) = uni
ao dos elementos P de P que pertencem a Q

f
e um subconjunto mensur
avel de M . E
acil ver que esta definica
o est
a correta:

a famlia B dos subconjuntos mensur


aveis e uma -
algebra em P. Em seguida,
definimos a medida quociente
por

para cada Q B.

DR
AF

(Q) = ( 1 (Q))

Teorema 4.34 (Decomposica


o erg
odica). Seja M um espaco completo separ
avel, f : M M uma transformaca
o mensur
avel e uma probabilidade
invariante. Ent
ao existe um conjunto mensur
avel M0 M com (M0 ) = 1,
uma partica
o P de M0 em subconjuntos mensur
aveis e uma famlia de probabilidades {P : P P} em M , satisfazendo
(a) P (P ) = 1 para
-quase todo P P;

(b) P 7 P (E) e mensur


avel, para todo conjunto mensur
avel E M ;

(c) P e invariante e erg


odica para
-quase todo P P;
R
(d) (E) = P (E) d
(P ), para todo conjunto mensur
avel E M .

A relaca
o (d) significa que e uma combinaca
o convexa das v
arias probabilidades erg
odicas P , em que cada P entra com coeficienteigual a
(P ).
O item (b) assegura que a integral em (d) est
a bem definida. Observe tambem
que a afirmaca
o em (b) equivale a dizer que a aplicaca
o P M1 (M ) dada por
P 7 P e mensur
avel (veja o Exerccio 4.17).

4.5.2

Desintegra
c
ao de uma medida

Vamos deduzir o Teorema 4.34 de um resultado de Teoria da Probabilidade, o


teorema da desintegraca
o de Rokhlin, que tem muitas outras aplicaco
es. Para
enunciar este teorema precisamos da seguinte noca
o.

Defini
c
ao 4.35. Uma desintegraca
o de relativamente a uma partica
o P e
uma famlia {P : P P} de probabilidades em M tal que, para todo conjunto
mensur
avel E M :
(a) P (P ) = 1 para
-quase todo P P;

(b) a aplicaca
o P R, P 7 P (E) e mensur
avel;
R
(c) (E) = P (E) d
(P ).

CAPITULO 4. ERGODICIDADE

124

Lembre que a partica


o P tem uma estrutura natural de espaco de probabilidade, com uma -
algebra B e uma probabilidade
. As P s
ao chamadas
probabilidades condicionais de relativamente a P.
??
Exemplo 4.36. Seja P = {P1 , . . . , Pn } uma partica
o finita de M em subconjuntos mensur
aveis com (Pi ) > 0 para todo i. A medida quociente
e dada
por
({Pi }) = (Pi ). Considere a restrica
o normalizada i de a cada Pi :
(E Pi )
(Pi )

para cada conjunto mensur


avel E M.

DR
AF

i (E) =

Ent
ao {
e uma desintegraca
o da medida relativamente a P, j
a que
1 , . . . , n }
P
n
(E) = i=1
({Pi })i (E) para todo conjunto mensur
avel E M .

Esta construca
o se estende imediatamente ao caso de partico
es enumer
aveis.
No pr
oximo exemplo tratamos um caso n
ao enumer
avel:

Exemplo 4.37. Seja M = T2 e seja P a partica


o de M em crculos horizontais
S 1 {y}, y S 1 . Seja m a medida de Lebesgue em T2 , seja m
a medida de Lebesgue em S 1 , e denote por my a medida de Lebesgue (medida de comprimento)
em cada crculo horizontal S 1 {y}. Pelo teorema de Fubini,
Z
m(E) = my (E) dm(y)

para todo conjunto mensur


avel E T2 .
Logo {my : y S 1 } e uma desintegraca
o de m relativamente a P.

A pr
oxima proposica
o mostra que desintegraco
es s
ao essencialmente u
nicas,
quando existem. A hip
otese da proposica
o e muito geral: ela e satisfeita, por
exemplo, sempre que M e um espaco topol
ogico com base enumer
avel de abertos
e B e a sua -
agebra de Borel:
Proposi
c
ao 4.38. Suponha que a -
algebra B admite algum gerador enumer
avel. Se {P : P P} e {0P : P P} s
ao desintegraco
es de com respeito a
P, ent
ao P = 0P para
-quase todo P P.

Demonstraca
o. Seja um gerador enumer
avel de B e seja A a a
lgebra gerada
por . Note que A e enumer
avel, uma vez que ela coincide com a uni
ao das
a
lgebras (finitas) geradas pelos subconjuntos finitos de . Para cada A A
considere os conjuntos
QA = {P P : P (A) > 0P (A)}

e RA = {P P : P (A) < 0P (A)}.

Pela propriedade (c) na definica


o de desintegraca
o,
R
R
1
(P ) = QP P (A) d
(P )
P P (A (QA )) d
(A 1 (QA )) =
R
R 0
(A 1 (QA )) d
(P ) = QP 0P (A) d
(P ).
P P

ERGODICA

4.5. TEOREMA DA DECOMPOSIC


AO

125

Atentando para a definica


o de QA , obtemos que
(QA ) = 0 para todo A A.
Um argumento an
alogo mostra que
(RA ) = 0 para todo A A. Ent
ao
[
QA R A
AA

tambem e um subconjunto de P com medida nula. Para todo P no complementar deste subconjunto, as medidas P e 0P coincidem na a
lgebra geradora A e,
portanto, coincidem em toda a -
algebra B.

DR
AF

Por outro lado, desintegraco


es podem n
ao existir:

Exemplo 4.39. Seja f : S 1 S 1 uma rotaca


o irracional e seja P a partica
o
de S 1 cujos elementos s
ao as o
rbitas {f n (x) : n Z} de f . Suponha que existe
uma desintegraca
o {P : P P} da medida de Lebesgue com relaca
o a P.
Considere os iterados {f P : P P} das probabilidades condicionais. Como
os elementos da partica
o s
ao conjuntos invariantes, f P (P ) = P (P ) = 1 para
claro que, dado qualquer conjunto mensur

-quase todo P . E
avel E M ,
P 7 f P (E) = P (f 1 (E))

e uma funca
o mensur
avel. Alem disso, como e uma medida invariante,
Z
Z
1
1
(E) = (f (E)) = P (f (E)) d
(P ) = f P (E) d
(P ).

Estas observaco
es mostram que {f P : P P} e uma desintegraca
o de
relativamente a P. Por unicidade (Proposica
o 4.38), segue que f P = P para

-quase todo P . Ou seja, quase toda probabilidade condicional P e invariante.


Isto e uma contradica
o, uma vez que P = {f n (x) : n Z} e um conjunto infinito
enumer
avel e, portanto, n
ao pode existir nenhuma probabilidade invariante que
de peso positivo a P .
O teorema de Rokhlin afirma que desintegraco
es sempre existem se a partica
o
P for o limite de uma sequencia crescente de partico
es enumer
aveis e se o espaco
M for razo
avel. O enunciado preciso ser
a dado na pr
oxima seca
o.

4.5.3

Parti
co
es mensur
aveis

Dizemos que P e uma partica


o mensur
avel se, restrita a algum subconjunto
de M com medida total, ela e o limite de uma sequencia n
ao-decrescente de
partico
es enumer
aveis. Mais precisamente, a partica
o e mensur
avel se existe
algum conjunto mensur
avel M0 M com medida total tal que, restrito a M0 ,
P=

n=1

Pn

para alguma sequencia n


ao-decrescente P1 P2 Pn de partico
es
enumer
aveis. Lembre que Pi Pi+1 significa que todo elemento de Pi+1 est
a

CAPITULO 4. ERGODICIDADE

126

contido em algum elemento de Pi . Ent


ao dizemos que Pi e menos fina do que
Pi+1 . Alem disso,
P

e
a
parti
c
a

o
menos fina tal que
n=1 n
Pn

n=1

Pn

para todo n.

DR
AF

Os seus elementos s
ao as interseco
es n
ao vazias da forma
n=1 Pn com Pn Pn
para todo n. Veja tambem o Exerccio 4.16.
imediato da definica
f
E
o que toda partica
o enumer
avel e mensur
avel. E
acil
dar exemplos de partico
es mensur
aveis n
ao enumer
aveis:
Exemplo 4.40. Seja M = T2 , munido da medida de Lebesgue m, e seja P
a partica
o de M nos crculos horizontais S 1 {y}. Ent
ao P e uma partica
o
mensur
avel. Para ver isso, considere
Pn = {S 1 I(i, n) : i = 1, . . . , 2n},

onde I(i, n), 1 i 2n e o segmento de S = R/Z correspondente ao intervalo


[(i 1)/2n , i/2n ) R. A sequencia (Pn )n e n
ao-decrescente e P =
n=1 Pn .
Por outro lado, nem todas as partico
es s
ao mensur
aveis:

Exemplo 4.41. Seja f : M M uma transformaca


o mensur
avel tal que (f, )
e erg
odica. Seja P a partica
o de M cujos elementos s
ao as o
rbitas de f . Ent
ao
P n
ao e mensur
avel, a menos que f possua alguma o
rbita com medida total. De
fato, suponha que existe uma sequencia P1 P2 Pn de partico
es
enumer
aveis tal que P =
P
restrito
a
algum
conjunto
com
medida
total.
n=1 n
Esta u
ltima condica
o implica que quase toda o
rbita de f est
a contida em algum
elemento Pn da partica
o Pn . Em outras palavras, a menos de um conjunto com
medida nula, todo elemento de Pn e invariante por f . Por ergodicidade, segue
que para cada n existe exatamente um Pn Pn tal que m(Pn ) = 1. Denote
P =
ao P e um elemento da partica
o
e uma
n=1 Pn . Ent
n=1 Pn = P, ou seja,
o
rbita de f e tem m(P ) = 1.
Teorema 4.42 (Desintegraca
o de Rokhlin). Suponha que o espaco metrico M
e completo separ
avel e que P e partica
o mensur
avel. Ent
ao a probabilidade
admite alguma desintegraca
o relativamente a P.
O Teorema 4.42 ser
a provado na Seca
o 4.6. Pode mostrar-se que a hip
otese
de que P e mensur
avel e tambem necess
aria para a conclus
ao do teorema (veja
o Exerccio 4.18).

4.5.4

Demonstra
c
ao do teorema

Neste momento vamos usar o Teorema 4.42 para provar o teorema da decomposica
o erg
odica. Seja U uma base enumer
avel de abertos de M e seja A a
a
lgebra gerada por U. Note que A e enumer
avel e que ela gera a -
algebra de
Borel de M . Pelo teorema erg
odico de Birkhoff, para cada A A existe um

ERGODICA

4.5. TEOREMA DA DECOMPOSIC


AO

127

DR
AF

conjunto MA M com (MA ) = 1 tal o tempo medio de visita (A, x) est


a bem
definido para todo x MA . Considere M0 = AA MA . Note que (M0 ) = 1,
uma vez que a interseca
o e enumer
avel.
Agora considere a partica
o P de M0 definida da seguinte forma: dois pontos
x, y M0 est
ao no mesmo elemento de P se, e somente se, (A, x) = (A, y)
para todo A A. Afirmamos que esta partica
o e mensur
avel. Para mostrar
esse fato, considere uma enumeraca
o qualquer {Ak : k N} dos elementos da
a
lgebra A e seja {qk : k N} uma enumeraca
o dos n
umeros racionais. Para
cada n N, considere a partica
o Pn de M0 definida da seguinte forma: dois
pontos x, y M0 est
ao no mesmo elemento de Pn se, e somente se, para todo
i, j {1, . . . , n},
ou (Ai , x) qj e (Ai , y) qj
ou (Ai , x) > qj e (Ai , y) > qj .

2
claro que cada Pn e uma partica
E
o finita (com n
ao mais de 2n elementos).
Segue imediatamente da definica
o que x e y est
ao no mesmo elemento de
n=1 Pn
se, e somente se, (Ai , x) = (Ai , y) para todo i. Em outras palavras,

P=

n=1

Pn .

Observe tambem que os elementos de P s


ao conjuntos invariantes por f , j
a que
os tempos medios de visita s
ao constantes ao longo de o
rbitas.
Ent
ao, pelo Teorema 4.42, existe alguma desintegraca
o {P : P P} de
relativamente a P. Os itens (a), (b) e (d) do Teorema 4.34 est
ao contidos
na definica
o de desintegraca
o. Para provar o item (c) basta mostrar que P e
invariante e erg
odica para
-quase todo P , que e o que faremos a seguir.
Considere a famlia de probabilidades {f P : P P}. Note que
f P (P ) = P (f 1 (P )) = P (P ) = 1

uma vez que todo P P e um conjunto invariante. Alem disso, dado qualquer
conjunto mensur
avel E M , a funca
o
P 7 f P (E) = P (f 1 (E))

e mensur
avel e, usando o fato de que e invariante por f ,
Z
Z
(E) = (f 1 (E)) = P (f 1 (E)) d
(P ) = f P (E) d
(P ).

Isto mostra que {f P : P P} e uma desintegraca


o de relativamente a P.
Por unicidade (Proposica
o 4.38), segue que f P = P para quase todo P .
Resta provar que P e erg
odica para quase todo P . Como (M0 ) = 1, temos
que P (M0 P ) = 1 para quase todo P . Logo, basta provar que, dado qualquer
P P e qualquer conjunto mensur
avel E M , o tempo medio de visita (E, x)
est
a bem definido para todo x M0 P e e constante nesse conjunto. Fixado

CAPITULO 4. ERGODICIDADE

128

P , denotemos por C a classe dos conjuntos mensur


aveis E para os quais valem
claro
estas propriedades. Por construca
o, C contem a a
lgebra geradora A. E
que C e fechado para diferencas: se E1 , E2 C ent
ao
(E1 \ E2 , x) = (E1 , x) (E2 , x)

est
a definido e e constante em M0 P . Analogamente, C e fechado para uni
oes
disjuntas enumer
aveis: se Ej C sao disjuntos dois-a-dois ent
ao
X
j Ej , x) =
(Ej , x)

DR
AF

est
a definido e e constante em M0 P . Estas observaco
es mostram que C e uma
-
algebra. Segue que ela contem a -
algebra de Borel de M .
Isto conclui a demonstraca
o do Teorema 4.34 a partir do Teorema 4.42.

4.6

Teorema da desintegra
c
ao de Rokhlin

Agora vamos demonstrar o Teorema 4.42. Fixe uma sequencia n


ao-decrescente
qualquer P1 P2 Pn de partico
es enumer
aveis tal que P =

n=1 Pn restrito a algum conjunto M0 M com medida total. Usaremos Pn (x)


para denotar o elemento de Pn que contem um dado ponto x M .

4.6.1

Esperan
cas condicionais

Seja : M R uma funca


o mensur
avel limitada qualquer. Para cada n 1,
defina en () : M R da seguinte forma:
Z

d se (Pn (x)) > 0


(Pn (x)) Pn (x)
en (, x) =
(4.29)

0
caso contr
ario.

Como as partico
es Pn s
ao enumer
aveis, o segundo caso da definica
o se aplica
somente num conjunto de pontos com medida igual a zero. Observe tambem
que en () e constante em cada Pn Pn ; denotamos por En (, Pn ) o valor desta
constante. Ent
ao,
Z
Z
XZ
X
d =
d =
(Pn )En (, Pn ) = en () d
(4.30)
Pn

Pn

Pn

para todo n N (as somas s


ao sobre todo Pn Pn com medida positiva).

Lema 4.43. Dada qualquer funca


o mensur
avel limitada : M R, existe um
subconjunto M de M com (M ) = 1 tal que
(a) e(, x) = limn en (, x) existe para todo x M .

(b) e() : M R e mensur


avel e e constante em cada P P.

(c)

d =

e() d.

129

DE ROKHLIN
4.6. TEOREMA DA DESINTEGRAC
AO

Demonstraca
o. Inicialmente, suponha que 0. Para cada < , seja S(, )
o conjunto dos pontos x M tais que
lim inf en (, x) < < < lim sup en (, x).
n

DR
AF

claro que a sequencia en (, x) diverge se, e somente se, x S(, ) para


E
algum par de n
umeros racionais e . Logo, para provar o lema, basta que
mostremos que S = S(, ) tem medida igual a zero para todo < . Dado
x S, fixe uma sequencia de inteiros 1 ax1 < bx1 < < axi < bxi < tais
que
eaxi (, x) < e ebxi (, x) > para todo i 1.

Defina Ai como sendo a uni


ao dos elementos Ai (x) = Paxi (x) e Bi como sendo a
uni
ao dos elementos Bi (x) = Pbxi (x) obtidos deste modo, para todos os pontos
x S. Por construca
o, S Ai+1 Bi Ai para todo i 1. Em particular, S
est
a contido no conjunto

\
\
Se =
Bi =
Ai .
i=1

i=1

Como a sequencia Pn , n 1, e n
ao-decrescente, dados dois quaisquer dos
conjuntos Ai (x) = Paxi (x) que formam Ai , ou eles s
ao disjuntos ou um deles
est
a contido no outro. Ent
ao os conjuntos Ai (x) maximais s
ao disjuntos dois-adois e, portanto, constituem uma partica
o de Ai . Logo, somando apenas sobre
estes conjuntos maximais com medida positiva,
Z
X
X Z
(Ai (x)) = (Ai ),
d
d =
Ai

Ai (x)

Ai (x)

Ai (x)

para qualquer i 1. Analogamente,


Z
X
X Z
(Bi (x)) = (Bi ).
d
d =
Bi

Bi (x)

Bi (x)

Bi (x)

Como Ai Bi e n
os estamos supondo que 0, segue que
Z
Z
(Ai )
d
d (Bi ),
Ai

Bi

e (S).
e
para todo i 1. Tomando o limite quando i , obtemos que (S)
e
Isto implica que (S) = 0 e, portanto, (S) = 0. Isto prova a afirmaca
o quando
e n
ao-negativa. O caso geral segue imediatamente, uma vez que sempre
podemos escrever = + , onde s
ao mensur
aveis, limitadas e n
aonegativas. Note que en () = en ( + ) en ( ) para todo n 1 e, portanto, a
conclus
ao do lema e verdadeira para se ela vale para + e . Isto conclui a
prova da afirmaca
o (a).

CAPITULO 4. ERGODICIDADE

130

As demais afirmaco
es s
ao consequencias simples da definica
o. A mensurabilidade de e() segue diretamente da Proposica
o 0.27. Dado que Pn e menos
fina que P, e claro que en () e constante em cada P P, restrito a um subconjunto de M com medida total. Logo o mesmo vale para e(). Isto prova (b).
Observe tambem que |en ()| sup || para todo n 1. Logo, podemos usar
o teorema da convergencia dominada para passar ao limite em (4.30). Desta
forma obtemos a afirmaca
o (c).

DR
AF

Estamos especialmente interessados no caso em que e uma funca


o caracterstica: = XA para algum conjunto mensur
avel A M . Neste caso a
definica
o significa que
e(, x) = lim
n

(Pn (x) A)
.
(Pn (x))

(4.31)

Denotamos por PA o conjunto dos elementos P da partica


o P que intersectam
M . Observe que
(PA ) = 1. Alem disso, definimos E(A) : PA R colocando
E(A, P ) = e(, x) para qualquer x M P . Observe que e() = E(A) .
Logo, a funca
o E(A) e mensur
avel e satisfaz:
Z
Z
Z
d = e() d = E(A) d
.
(4.32)

4.6.2

Constru
c
ao das medidas condicionais

Seja U = {Uk : k N} uma base de abertos de M e seja A a a


lgebra gerada
claro que A gera a -
por U. E
algebra de Borel de M . Observe tambem que
A e enumer
avel: ela coincide com a uni
ao das a
lgebras (finitas) geradas pelos
subconjuntos {Uk : 1 k n}, para cada n 1. Defina:
\
P =
PA
AA

Ent
ao
(P ) = 1, j
a que a interseca
o e enumer
avel. Para cada P P , defina:
P : A [0, 1],

P (A) = E(A, P ).

(4.33)

claro que P e uma funca


Em particular, P (M ) = E(M, P ) = 1. E
o aditiva:
a definica
o (4.31) d
a que
AB =

E(A B, P ) = E(A, P ) + E(B, P ) para todo P P .

O pr
oximo objetivo e mostrar que esta funca
o pode ser estendida a uma
medida de probabilidade (que ainda denotaremos por P ) definida na -
algebra
de Borel de M . A ideia da prova e a seguinte. Consideramos o espaco produto
= {0, 1}N, munido da topologia gerada pelos cilindros
[a1 , . . . , as ] = {(ik )kN : i1 = a1 , . . . , is = as },

s 1.

DE ROKHLIN
4.6. TEOREMA DA DESINTEGRAC
AO

131

Note que e um compacto (Exerccio 0.11). Usando o fato de que M e um


espaco metrico completo, mostraremos que a aplicaca
o

: M , (x) = XUk (x) kN

DR
AF

e um mergulho mensur
avel de M em . Alem disso, a funca
o P d
a origem a
uma funca
o aditiva P definida na a
lgebra gerada pelos cilindros de . Uma
propriedade importante e que todo elemento desta a
lgebra e um compacto.
Isto permite mostrar, sem dificuldade, que P se estende a uma medida de
probabilidade (que ainda denotaremos por P ) definida na -
algebra de Borel
de . Mostraremos que a imagem (M ) tem medida total para P . Ent
ao a
imagem 1 P e uma probabilidade em M ; tambem verificaremos que ela e
uma extens
ao da funca
o (4.33).
Passemos a detalhar estes argumentos. No que segue, dado qualquer conjunto boreliano A, denotaremos A1 = A e A0 = Ac .
Lema 4.44. A imagem (M ) e um subconjunto boreliano de .
claro que
Demonstraca
o. Seja x M e (ik )k = (x). E
Tk
i
(A) j=1 Uj j 6= para todo k N,

uma vez que x pertence a


` interseca
o. Tambem e claro que
(B) existe algum k tal que diam Uk 1 e ik = 1.

Alem disso, lembrando que os Uk s


ao subconjuntos abertos de M ,

(C) para todo k tal que ik = 1 existe l = l(k) > k tal que il = 1 e
l Uk
U

diam Ul diam Uk /2.

Reciprocamente, suponha que (ik )k satisfaz as condico


es (A), (B) e (C).
Vamos mostrar que existe x M tal que (x) = (ik )k . Para isso, defina
Fn = nk=1 Vk ,

l(k) se ik = 1. Ent
onde Vk = Ukc se ik = 0 e Vk = U
ao (Fn )n e uma sequencia
decrescente de conjuntos fechados. A condica
o (A) garante que Fn 6= para
todo n 1. As condico
es (B) e (C) implicam que o di
ametro de Fn converge
para zero. Ent
ao, como M e um espaco completo, a interseca
o n Fn contem
algum ponto x. Por construca
o, Fn est
a contido em nk=1 Ukik para todo n. Segue
que

\
x
Ukik ou seja (x) = (ik )k .
k=1

Desta forma, mostramos que a imagem de e caracterizada perfeitamente pelas


condico
es (A), (B), (C).
Para concluir a demonstraca
o basta mostrar que o subconjunto descrito por
cada uma destas condico
es pode ser construdo a partir dos cilindros por meio

CAPITULO 4. ERGODICIDADE

132

de uni
oes e interseco
es enumer
aveis. Dado k N, seja N (k) o conjunto das
k-uplas (a1 , . . . , ak ) em {0, 1} tais que U1a1 Ukak 6= . A condica
o (A)
corresponde ao subconjunto

[a1 , . . . , ak ].

k=1 (a1 ,...,ak )N (k)

Seja D = {k N : diam Uk 1}. Ent


ao a condica
o (B) corresponde a
[
[
[a1 , . . . , ak1 , 1].

DR
AF

kD (a1 ,...,ak1 )

l U k e
Finalmente, dado k N, seja L(k) o conjunto dos l > k tais que U
diam Ul diam Uk /2. A condica
o (C) corresponde ao subconjunto

k=1 a1 ,...,ak1

[a1 , . . . , ak1 , 0]

lL(k) ak+1 ,...,al1


[a1 , . . . , ak1 , 1, ak+1 , . . . , al1 , 1] .

Isto completa a demonstraca


o do lema.

Corol
ario 4.45. A aplicaca
o : M (M ) e uma bijeca
o mensur
avel com
inversa e mensur
avel.
Demonstraca
o. Dados quaisquer pontos x 6= y em M , existe algum k N tal
que Uk que contem um dos pontos mas n
ao o outro. Isto mostra que e injetiva.
Para todo s 1 e a1 , . . . , as {0, 1},
1 ([a1 , . . . , as ]) = U1a1 Usas .

(4.34)

Isto garante que a aplicaca


o e mensur
avel, j
a que os cilindros geram a -
algebra
de Borel de . Em seguida, observe que
(U1a1 Usas ) = [a1 , . . . , as ] (M ) para todo s, a1 , . . . , as .

(4.35)

Usando o Lema 4.44, segue que (U1a1 Usas ) e um boreliano de para


todo s, a1 , . . . , as . Isto mostra que a transformaca
o 1 e mensur
avel.
Usando este fato, vamos agora provar que P se estende a uma medida de
probabilidade na -
algebra de Borel de M . Para isso, consideremos a a
lgebra
A gerada pelos cilindros de . Note que os seus elementos s
ao as uni
oes finitas
disjuntas de cilindros. Em particular, todos os elementos de A s
ao compactos.
Defina
P ([a1 , . . . , as ]) = P (U1a1 Usas ),
(4.36)
para cada s 1 e a1 , . . . , as {0, 1}. Trata-se de uma funca
o aditiva no
conjunto dos cilindros, com valores em [0, 1]. Ela se estende de modo natural a

DE ROKHLIN
4.6. TEOREMA DA DESINTEGRAC
AO

133

 X

Cj =
P Cj = 1.
j

DR
AF

claro que
uma funca
o aditiva na a
lgebra A , que ainda denotamos por P . E
P () = 1.
Seja (An )n uma sequencia decrescente de elementos de A tal que n An = .
Por compacidade, existe k 1 tal que An = para todo n k. Em particular,
P (An ) = 0 para todo n k. De acordo com o Teorema 0.12, isto implica que
a funca
o P : A [0, 1] e -aditiva. Logo, pelo Teorema 0.11, P se estende a
uma medida de probabilidade definida na -
algebra de Borel de . A definica
o
(4.36) implica ?? que

para toda cobertura {Cj } de (M ) por cilindros disjuntos. Tomando o nfimo


sobre todas as coberturas, conclumos que P ((M )) = 1.
Ent
ao, pelo Corol
ario 4.45, a imagem 1 P e uma probabilidade boreliana
em M . Por definica
o e pela relaca
o (4.35)
1 P (U1a1 Usas ) = P ((U1a1 Usas )) = P ([a1 , . . . , as ] (M ))
= P ([a1 , . . . , as ]) = P (U1a1 Usas )

para todo s, a1 , . . . , as . Isto implica que 1 P e uma extens


ao da funcca
o
P : A [0, 1]. Isto termina a prova da nossa afirmaca
o.

4.6.3

Conclus
ao da demonstra
c
ao

Resta verificar que a famlia de medidas {P : P P } que acabamos de


construir satisfaz as condico
es na definica
o de desintegraca
o (Definica
o 4.35).
Comecemos pela condica
o (a). Seja P P e, para cada n N, seja Pn
o elemento da partica
o Pn que contem P . Observe que se A A e tal que
A Pn = para algum n, ent
ao,
P (A) = E(A, P ) = lim
m

(A Pm )
= 0,
(Pm )

j
a que Pm Pn para todo m n. Fixe n. Para cada s 1, seja (Cj )j a famlia
dos cilindros [a1 , . . . , as ] que intersectam Pn . Pela observaca
o que acabamos de
fazer,
X
P (Cj ) = 1.
j

Tomando o limite quando s , segue ?? que P (Pn ) = 1. Passando ao limite


quando n , obtemos que P (P ) = 1 para todo P P .
Agora tratamos das condico
es (b) e (c). Por construca
o (lembre o Lema 4.43),
dado qualquer A A, a funca
o P 7 P (A) = E(A, P ) e mensur
avel e satisfaz
Z
Z
(A) = E(A, P ) d
(P ) = P (A) d
(P ).

CAPITULO 4. ERGODICIDADE

134

A famlia dos subconjuntos de M para quais valem estas duas propriedades e


uma classe mon
otona. De fato, suponha que B e a uni
ao de uma sequencia
crescente (Bj )j de conjuntos para os quais estas s
ao propriedades s
ao v
alidas.
Ent
ao, pela Proposica
o 0.27
P 7 P (B) = sup P (Bj ) e uma funca
o mensur
avel
j

e, usando o teorema da convergencia mon


otona,
Z
Z
Z
(B) = lim (Bn ) = lim P (Bn ) d
= lim P (Bn ) d
= P (B).
n

DR
AF

Isto mostra ?? que as duas propriedades permanecem v


alidas em toda classe
mon
otona gerada por A, ou seja (Teorema 0.15), toda a -
algebra de Borel de
M.
A prova do Teorema 4.42 est
a completa.

4.7

Exerccios

4.1. Seja B M um conjunto mensur


avel que satisfaz qualquer uma das seguintes condico
es:
1. B f 1 (B)
2. f 1 (B) B
3. f (B) B

4. (Bf 1 (B)) = 0.

Mostre que existe C M tal que f 1 (C) = C e (BC) = 0.

4.2. Prove a Proposica


o 4.8: Se = (1 , . . . , d ) e racionalmente independente
ent
ao a rotaca
o R : Td Td e erg
odica para a medida de Lebesgue.

4.3. Prove a Proposica


o 4.14: Se X e um conjunto finito ent
ao o deslocamento
: em = X N ou = X Z e contnuo e transitivo. Alem disso, o
conjunto dos pontos peri
odicos e denso em .

4.4. Seja X um espaco topol


ogico, munido da sua -
algebra de Borel C, e seja
= X N . Mostre que se X tem base enumer
avel de abertos ent
ao a -
algebra
de Borel de (para a topologia produto) coincide com a -
algebra produto
B = C N . O mesmo vale para = X Z e B = C Z .
4.5. Seja uma probabilidade invariante, n
ao necessariamente erg
odica, de uma
transformaca
o mensur
avel f : M M . Mostre que dados quaisquer conjuntos
mensur
aveis A e B existe o limite
n1
1X
(f i (A) B).
lim
n n
i=0

Dica: Use o teorema de Birkhoff e a prova da Proposica


o 4.4.

4.7. EXERCICIOS

135

1. (f, ) e erg
odico;

4.6. Mostre que as seguintes condico


es s
ao equivalentes:

2. para todo A mensur


avel com (A) > 0 temos que (

f n (A)) = 1;

n0

3. para todos A, B mensur


 aveis com (A)(B) > 0 temos que existe n 1
tal que f n (A) B > 0;

DR
AF

4. a convergencia na condica
o (c) da Proposica
o 4.4 vale para alguma escolha
de p, q e algum subconjunto denso de funco
es Lp () e Lq ();

5. existe p [1, ] tal que toda funca


o invariante Lp () e constante em
-quase todo ponto;
6. toda funca
o mensur
avel com f em -quase todo ponto (ou
f em -quase todo ponto) e constante em -quase todo ponto.

4.7. Suponha que M e um espaco metrico. Prove que e erg


odica para f :
M M se, e somente se a media temporal de toda funca
o contnua limitada
: M R e constante em -quase todo ponto.

4.8. Neste exerccio a seguir propomos outra demonstraca


o para a Proposica
o
4.7. Suponha que e irracional.
1. Mostre que a o
rbita {Rn (z) : n Z} de todo z S 1 e densa em S 1 .

2. Seja A um conjunto invariante com medida positiva. Mostre que nenhum


ponto de S 1 e ponto de densidade de Ac . Conclua que (A) = 1.

4.9. Suponha que e irracional. Seja : S 1 R uma funca


o contnua qualquer.
Mostre que
n1
1X
(x)

= lim
(Rj (x))
(4.37)
n n
j=0

existe em todo ponto e, de fato, o limite e uniforme. Justifique que e constante


em todo ponto. Deduza que R tem uma u
nica probabilidade invariante.
Dica: Verifique que a sequencia do lado direito de (4.37) e equicontnua e
use o teorema de Ascoli-Arzel
a.

4.10. Seja f : M M uma aplicaca


o mensur
avel num espaco topol
ogico M
com base enumer
avel de abertos e seja uma medida de probabilidade erg
odica
para f . Mostre que a o
rbita {f n (x) : n 0} de -quase todo ponto x M e
densa no suporte de .

4.11. De exemplo de um par de transformaco


es f : X X e g : Y Y ,
preservando medidas erg
odicas e , respectivamente, tal que a transformaca
o
produto T = f g n
ao e erg
odica para a medida invariante = .

CAPITULO 4. ERGODICIDADE

136

4.12. Seja A uma matriz quadrada de dimens


ao d com coeficientes racionais e
seja um autovalor racional. Mostre que existe algum autovetor com coeficientes inteiros, ou seja, algum k Zd \ {0} tal que Ak = k.
4.13. Seja f : M M uma transformaca
o e seja uma medida invariante.
Seja g t : N N uma suspens
ao de f e seja a suspens
ao correspondente da
medida f (veja a Seca
o 2.4.2). Mostre que e erg
odica para g t se, e somente
se, e erg
odica para f . ??

DR
AF

??
??
PSfrag replacements

0
1/3
1/2
2/3
1

4.14. Seja I = [0, 1] e f : I I a funca


o definida por

se 0 x < 1/3

2x

2x 2/3 se 1/3 x < 1/2


f (x) =
2x 1/3 se 1/2 x < 2/3

2x 4/3 se 2/3 x 1.

Mostre que f e erg


odica relativamente a
` medida de Lebesgue m.

4.15. Seja uma probabilidade invariante para uma transformaca


o f e seja
k 2.

1. Mostre que se e erg


odica para f k ent
ao ela tambem e ergdica
para f .

2. Mostre que a recproca do item anterior e falsa.

3. Se e erg
odica para f , como e a sua decomposica
o erg
odica para f k ?

4.16. Uma partica


o P e mensur
avel se, e somente se, existem subconjuntos
mensur
aveis M0 , E1 , E2 , . . . , En , . . . tais que (M0 ) = 1 e, restrito a M0 ,
P=

n=1

{En , M \ En }.

4.17. Seja X um espaco metrico e seja : X M1 (M ), x 7 x uma aplicaca


o.
Mostre que as seguintes condico
es s
ao equivalentes:
1. e mensur
avel, relativamente a
`s -
algebras de Borel completadas de X e
de M1 (M );

4.7. EXERCICIOS
R

dx e mensur
avel, para toda funca
o contnua

2. a aplicaca
o M R, x 7
limitada : X R;

137

R
3. a aplicaca
o M R, x 7 dx e mensur
avel, para toda funca
o mensur
avel limitada : X R;
4. a aplicaca
o M R, x 7 x (E) e mensur
avel, para todo conjunto mensur
avel E M .

DR
AF

4.18. Seja M um espaco metrico completo separ


avel. Mostre que se P satisfaz a
conclus
ao do Teorema 4.42, isto e, se admite uma desintegraca
o relativamente
a P, ent
ao a partica
o P e mensur
avel.

Dica: Seja {P : P P} uma desintegraca


o. Considere a aplicaca
o mensur
avel M 7 M1 (M ), x 7 P (x) e observe que a partica
o de M1 (M ) e mensur
avel.
4.19. Mostre que se {P : P P} e uma desintegraca
o de relativamente a
uma partica
o PR ent
ao, dada qualquer funca
o mensur
a
vel
 : M R,
R
R limitada
R
a funca
o P 7 dP e mensur
avel e satisfaz d =
dP d
(P ).

CAPITULO 4. ERGODICIDADE

DR
AF

138

Captulo 5

DR
AF

Unicidade erg
odica

Este captulo e dedicado a uma classe especial de sistemas din


amicos, caracterizada pela propriedade de possuirem exatamente uma probabilidade invariante.
Inicialmente, daremos algumas formulaco
es equivalentes desta propriedade e
analisaremos as propriedades da u
nica medida invariante. Em seguida, apresentaremos diversos exemplos.
Um sistema din
amico diz-se minimal se toda o
rbita e densa no espaco ambiente. A relaca
o entre unicidade erg
odica e minimalidade e outro tema importante deste captulo. Veremos que todo sistema unicamente erg
odico e minimal
restrito ao suporte da medida invariante, mas a recproca n
ao e verdadeira em
geral.
Finalmente, provaremos o teorema de Hermann Weyl sobre equidistribuica
o
dos valores de funco
es polinomiais definidas nos n
umeros inteiros, que e uma
aplicaca
o espetacular destas ideias.
Ao longo do captulo, a menos de menca
o em contr
ario, suporemos que M
e um espaco metrico compacto e f : M M e uma transformaca
o contnua.

5.1

Unicidade erg
odica

Dizemos que uma transformaca


o f : M M e unicamente erg
odica se admite
exatamente uma medida de probabilidade invariante. Vale uma noca
o inteiramente an
aloga para fluxos. A raz
ao de ser da denominaca
o e que a probabilidade
invariante e necessariamente erg
odica. De fato, suponha que existisse A M
invariante com 0 < (A) < 1. Ent
ao a restricca
o normalizada de a A, definida
por
(E A)
A (E) =
para cada conjunto mensur
avel E A
(A)

seria uma probabilidade invariante, distinta de , o que estaria em contradica


o
com a unicidade de .
Proposi
c
ao 5.1. As seguintes condico
es s
ao equivalentes:
139


CAPITULO 5. UNICIDADE ERGODICA

140

(a) f admite uma u


nica probabilidade erg
odica;

(b) f admite uma u


nica probabilidade invariante;

(c) para toda funca


o contnua : M R, a sequencia das medias orbitais
Pn1
n1 j=0 f j converge uniformemente para uma constante;

(d) para toda funca


o contnua : M R, a sequencia das medias orbitais
Pn1
n1 j=0 (f j (x)) converge em todo ponto para uma constante.

DR
AF

claro que (c) implica (d), uma vez que convergencia uniforme
Demonstraca
o. E
implica convergencia pontual. Para ver que (d) implica (a), suponha que e
s
ao probabilidades erg
odicas de f . Ent
ao, dada qualquer funca
o contnua
: M R,
R
n1
d em -quase todo ponto
X
1
lim
(f j (x)) =
n n
R
j=0
d em -quase todo ponto.
Como, por hip
otese, o limite n
ao depende do ponto x, segue que
Z
Z
d = d

para toda funca


o contnua : M R. Pela Proposica
o 0.56, isso implica que
f
= . E
acil ver que (a) implica (b). De fato, como toda medida invariante e
uma combinaca
o convexa de medidas erg
odicas (Teorema 4.34), se existe uma
u
nica probabilidade erg
odica ent
ao a probabilidade invariante e, igualmente,
u
nica.
Resta mostrar que (b) implica (c). Comece por lembrar que f admite alguma
probabilidade invariante (pelo Teorema 2.1). A ideia e mostrar que se (c) n
ao
vale ent
ao existe outra probabilidade diferente de e, portanto, (b) tambem
n
ao vale. Suponha ent
ao que (c) n
ao vale, isto e, que existe alguma funca
o
Pn1
contnua : M R tal que n1 j=0
f j n
ao converge uniformemente para
R
nenhuma constante; em particular, n
ao converge uniformemente para d.
Por definica
o, isto significa que existe > 0 tal que para todo k 1 existe
nk k e existe xk M tal que
Z
k 1
1 nX

j

(f (xk )) d .
nk j=0

(5.1)

Consideremos a sequencia de probabilidades


k =

nk 1
1 X
f j (xk ) .
nk j=0

Como o espaco M1 (M ) das probabilidades em M e compacto para a topologia fraca (Teorema 2.6), a menos de substituir esta sequencia por uma subsequencia, podemos supor que ela converge para alguma probabilidade em

141

5.2. MINIMALIDADE

M . Pelo Lema 2.16 aplicado a


` medida de Dirac x , temos que a probabilidade
e invariante por f . Por outro lado, o fato de que (k )k converge para na
topologia fraca implica que
d = limk

dk = lim
k

nk 1
1 X
j
.
nk j=0 f (xk )

DR
AF

Ent
ao, lembrando (5.1), temos que
Z
Z


d d .

Em particular, 6= . Isto mostra que (b) n


ao vale, se (c) n
ao vale.

5.2

Minimalidade

Seja M um conjunto invariante fechado de f : M M . Dizemos que e


minimal se ele coincide com o fecho da o
rbita {f n (x) : n 0} de todo ponto
x . Dizemos que a transformaca
o f e minimal se o ambiente M for um
conjunto minimal.
Lembre que o suporte de uma medida e o conjunto dos pontos x M tais
que (V ) > 0 para toda vizinhanca V de x. Segue imediatamente da definica
o
que o complementar do suporte e um conjunto aberto: se x
/ supp ent
ao
existe uma vizinhanca aberta V tal que (V ) = 0; ent
ao V est
a toda contida
no complementar do suporte. Portanto supp e um conjunto fechado.
Tambem e f
acil ver que o suporte de qualquer medida invariante e um
conjunto invariante, no seguinte sentido: f (supp ) supp . De fato, seja
x supp e seja V uma vizinhanca qualquer de y = f (x). Como f e contnua,
f 1 (V ) e uma vizinhanca de x. Ent
ao (f 1 (V )) > 0 uma vez que x supp .
Logo, usando que e invariante, (V ) > 0. Isto prova que y supp .

Proposi
c
ao 5.2. Se f : M M e unicamente erg
odica ent
ao o suporte da
u
nica probabilidade invariante e minimal.

Demonstraca
o. Suponha que existe x supp cuja o
rbita {f j (x) : j 0} n
ao
e densa no suporte de . Isto significa que existe algum subconjunto aberto U
de M tal que U supp e n
ao vazio e
f j (x)
/ U supp para todo j 0.

(5.2)

Seja um ponto de acumulaca


o qualquer da sequencia de probabilidades
n = n1

n1
X
j=0

f j (x) ,

n1

relativamente a
` topologia fraca . Tais pontos de acumulaca
o existem, pelo Teorema 2.6, e e uma probabilidade invariante, pelo Lema ??. A condica
o (5.2)


CAPITULO 5. UNICIDADE ERGODICA

142

significa que n (U ) = 0 para todo n 1. Logo, usando o Teorema 2.3 (veja


tambem o item 3 do Exerccio 2.1) temos que (U ) = 0. Isto implica que nenhum ponto de U est
a no suporte de , contradizendo o fato de que U supp
e n
ao vazio.
A recproca da Proposica
o 5.2 e falsa em geral:

Teorema 5.3 (Furstenberg). Existe um difeomorfismo analtico f : T2 T2


que e minimal, preserva a medida de Lebesgue m no toro, mas n
ao e erg
odico
para m. Em particular, f n
ao e unicamente erg
odico.

DR
AF

A demonstraca
o deste resultado pode ser encontrada no artigo original de
Furstenberg [Fur61] ou no livro de Ma
ne [Ma
n87]. Na Seca
o 5.3.6 detalharemos
outro exemplo de transformaca
o minimal que n
ao e unicamente erg
odica. ??

5.3

Exemplos

Nesta seca
o discutiremos alguns exemplos de sistemas unicamente erg
odicos.

5.3.1

Rota
co
es em toros

Fixe d 1 e um vetor racionalmente independente = (1 , . . . , d ). Conforme


vimos na Seca
o 4.2.1, a rotaca
o R : Td Td e erg
odica para a medida de
Lebesgue m no toro. Agora o nosso objetivo e mostrar que, na verdade, R e
unicamente erg
odica.
De acordo com a Proposica
o 5.1, basta mostrar que para toda funca
o contnua
: Td R existe c R tal que
n =

n1
1X
Rj converge para c em todo ponto.
n j=0

(5.3)

R
Tomemos c = d. Por ergodicidade, a sequencia (n )n das medias orbitais
converge para c em m-quase todo ponto. Em particular, n (x) c para um
conjunto denso de valores de x Td .
Seja d a dist
ancia induzida no toro Td = Rd /Zd pela norma usual em Rd : a
dist
ancia entre dois pontos quaisquer do toro e o mnimo das dist
ancias entre
claro que a rotaca
os seus representantes em Rd . E
o R preserva esta dist
ancia:
d(R (x), R (y)) = d(x, y)

para todo x, y Td .

Ent
ao, usando que e contnua, dado qualquer > 0 podemos encontrar > 0
tal que
d(x, y) <

d(Rj (x), Rj (y)) <

|(Rj (x)) (Rj (y))| <

para todo j 0. Mas ent


ao,
d(x, y) <

|n (x) n (y)| < para todo n 1.

143

5.3. EXEMPLOS

DR
AF

Como n
ao depende de n, isto mostra que a sequencia (n )n e equicontnua.
Isto nos permite usar o Teorema de Ascoli para provar a afirmaca
o (5.3), do
seguinte modo. Suponha que existe x
Td tal que (n (
x))n n
ao converge para
c . Ent
ao existe c 6= c e alguma subsequencia (nk )k tal que nk (
x) converge
para c quando k . Pelo teorema de Ascoli, a menos de tomarmos uma
subsequencia, podemos supor que (nk )k e uniformemente convergente. Seja
o seu limite. Ent
ao e uma funca
o contnua tal que (x) = c para um
d
claro
conjunto denso de valores de x T mas (
x) = c e diferente de c . E
que tal funca
o n
ao existe. Esta contradica
o prova a nossa afirmaca
o de que R
e unicamente erg
odica.

5.3.2

Od
ometros

Os od
ometros, ou m
aquinas de somar, modelam sistemas tais como o contador
de quil
ometros percorridos de um autom
ovel. ou o registro de consumo de
eletricidade de um predio: a sua din
amica consiste em fazer avancar o contador
de uma unidade. A principal diferenca com relaca
o a
` realidade e que estes
contadores idealizados comportam um n
umero ilimitado de dgitos.
Fixe d 2, que representa a base de numeraca
o (por exemplo, d = 10).
Consideramos o espaco M de todas as seq
uencias
= (0 , 1 , 2 , . . . , k1 , k , k+1 , . . .)

com j {0, 1, . . . , d 1} e tais que n = 0 para todo n suficientemente grande.


Munimos este espaco da seguinte dist
ancia
0

d(, 0 ) = 2N (, )

onde N (, 0 ) = min{j 0 : j 6= j0 }.

(5.4)

Tambem consideramos a transformaca


o f : M M soma uma unidade,
definida do seguinte modo:
Se 0 < d 1, ent
ao
f (0 , 1 , 2 , . . . , k1 , k , k+1 , . . .) = (0 + 1, 1 , 2 , . . . , k1 , k , k+1 , . . .).
Se 0 = d 1 mas 1 < d 1, ent
ao
f (0 , 1 , 2 , . . . , k1 , k , k+1 , . . .) = (0, 1 + 1, 2 , . . . , k1 , k , k+1 , . . .).
Em geral, se 0 = = k1 = d 1 mas k < d 1, ent
ao
f (0 , 1 , 2 , . . . , k1 , k , k+1 , . . .) = (0, 0, 0, . . . , 0, k + 1, k+1 , . . .).

Observe que N (f (), f ( 0 )) = N (, 0 ) e, portanto,

d(f (), f ( 0 )) = d(, 0 ) para todo , 0 M.

Em particular, f e contnua relativamente a


` dist
ancia definida em (5.4).
Proposi
c
ao 5.4. A transformaca
o f : M M e unicamente erg
odica.

A prova desta proposica


o fica a cargo do leitor (veja o Exerccio 5.1).

(5.5)


CAPITULO 5. UNICIDADE ERGODICA

144

Grupos topol
ogicos e grupos de Lie

5.3.3

Lembre que um grupo topol


ogico e um grupo (G, ) munido de uma topologia
relativamente a
` qual as operaco
es
G G G, (g, h) 7 gh

G G, g 7 g 1

(5.6)

DR
AF

s
ao contnuas. Em tudo o que segue suporemos que a topologia e tal que todo
conjunto pontual e um conjunto fechado. Quando G e uma variedade e as
operaco
es em (5.6) s
ao diferenci
aveis, dizemos que (G, ) e um grupo de Lie.
Veja o Exerccio 5.2.
O espaco euclideano Rd e um grupo topol
ogico, e ate um grupo de Lie, para
a adica
o e o mesmo vale para o toro Td . Lembre que Td e o quociente de Rd pelo
seu subgrupo Zd . Esta construca
o pode ser generalizada da seguinte forma:
Exemplo 5.5. Subgrupos. ??

Exemplo 5.6. Dado qualquer subgrupo normal fechado H de um grupo topol


ogico G, seja G/H o conjunto das classes de equivalencia para a relaca
o de
equivalencia definida em G por x y x1 y H. Represente por xH a
classe de equivalencia que contem cada x G. Considere a seguinte operaca
o
de grupo em G/H:
xH yH = (x y)H.
A hip
otese de que H e subgrupo normal assegura que esta operaca
o est
a bem
definida. Seja : G 7 G/H a projeca
o can
onica, dada por (x) = xH.
Considere em G/H a topologia quociente, definida da seguinte forma: uma
funca
o : G/H X e contnua se, e somente se, : G X e contnua.
A hip
otese de que H e fechada assegura que todo subconjunto pontual e um
subconjunto fechado de G/H. Segue facilmente das definico
es que G/H e um
grupo topol
ogico. Lembre tambem que se G e abeliano ent
ao todos os seus
subgrupos s
ao normais.

Exemplo 5.7. O conjunto G = GL(d, R) das matrizes reais invertveis de dimens


ao d e um grupo de Lie para a operaca
o de multiplicaca
o de matrizes,
chamado grupo linear real de dimens
ao d. De fato, G pode ser identificado com
2
um aberto do espaco euclideano R(d ) e portanto tem uma estrutura natural
de variedade. Alem disso, segue diretamente das definico
es que a multiplicaca
o
de matrizes e a aplicaca
o A 7 A1 s
ao diferenci
aveis para esta estrutura diferenci
avel. G contem diversos subgrupos de Lie importantes, tais como o grupo
especial linear SL(d, R) das matrizes com determinante igual a 1, e o grupo
ortogonal O(d, R) formado pelas matrizes ortogonais.
Dado qualquer g G, chamamos g-translaca
o a
` esquerda e g-translaca
o a
`
direita, respectivamente, as aplicaco
es
Eg : G G, Eg (h) = gh e Dg : G G, Dg (h) = hg.

Um endomorfismo de G e uma aplicaca


o contnua : G G que tambem
preserva a operaca
o de grupo, isto e, tal que (gh) = (g)(h). Quando

145

5.3. EXEMPLOS

e invertvel, ou seja, uma bijeca


o cuja inversa tambem e um endomorfismo,
dizemos que se trata de um automorfismo.

Exemplo 5.8. Seja A GL(d, Z), isto e, uma matriz invertvel de dimens
ao
d com coeficientes inteiros. Ent
ao, como vimos na Seca
o 4.2.5, A induz um
endomorfismo fA : Td Td . Pode mostrar-se que todo endomorfismo do toro
e desta forma.

DR
AF

Um grupo topol
ogico e localmente compacto se todo g G possui alguma
vizinhanca compacta. Por exemplo, todo grupo de Lie e localmente compacto.
Por outro lado, o grupo aditivo dos racionais, considerado com a topologia
induzida pela reta, n
ao e localmente compacto.
O seguinte teorema e o ponto de partida da teoria erg
odica dos grupos topol
ogicos localmente compactos:
Teorema 5.9 (Haar). Seja G um grupo localmente compacto.

(a) Existe uma medida boreliana G em G que e invariante pelas translaco


es a
`
esquerda, finita em conjuntos compactos e positiva em conjuntos abertos;
(b) Se e uma medida com todas as propriedades no item (a), ent
ao = C G
para algum C > 0.
(c) G (G) < se, e somente se, G e compacto.

Vamos esbocar a demonstraca


o dos itens (a) e (b) do teorema no caso particular em que G e um grupo de Lie. A demonstraca
o do item (c), no caso geral,
e proposta no Exerccio 5.6.
??
Exemplo 5.10. Medida de Haar em O(d, R). Medida de Haar em GL(d, R).
??

No caso em que o grupo G e compacto, segue do Teorema 5.9 que existe


uma u
nica probabilidade que e invariante pelas translaco
es a
` esquerda, positiva
em abertos e finita em compactos. Esta probabilidade G e chamada medida de
Haar. Ela disfruta de algumas propriedades adicionais:

Corol
ario 5.11. Suponha que G e compacto. Ent
ao a medida de Haar G e
invariante pelas translaco
es a
` direita e por todo endomorfismo sobrejetivo de G.

Demonstraca
o. Dado qualquer g G, considere a probabilidade (Dg ) G . Observe que Eh Dg = Dg Eh para todo h G. Logo,
(Eh ) (Dg ) G = (Dg ) (Eh ) G = (Dg ) G .

Em outras palavras, (Dg ) G e invariante por toda a translaca


o a
` esquerda.
Por unicidade, segue que (Dg ) G = G para todo g G, tal como afirmado.


CAPITULO 5. UNICIDADE ERGODICA

146

Dado qualquer homomorfismo sobrejetivo : G G, considere a probabilidade G . Dado qualquer h G, escolha algum g 1 (h). Observe que
Eh = Eg . Logo,
(Eh ) G = (Eg ) G = G .

Em outras palavras, G e invariante por toda a translaca


o a
` esquerda. Por
unicidade, segue que G = G , tal como afirmado.

DR
AF

Mais geralmente, se n
ao suposermos, que G e compacto, o argumento do
Corol
ario 5.11 mostra que para cada g G existe (g) > 0 tal que
(Eg ) G = (g)G .

A aplicaca
o G (0, ), g 7 (g) e um homomorfismo de grupo.

5.3.4

Transla
co
es em grupos compactos

Nesta seca
o sempre suporemos que o grupo topol
ogico e compacto e metriz
avel.
Comecamos por observar que e sempre possvel escolher a dist
ancia de tal forma
que ela seja invariante por toda translaca
o:
Lema 5.12. Se G e um grupo topol
ogico compacto metriz
avel ent
ao existe alguma dist
ancia compatvel com a topologia de G relativamente a
` qual todas as
translaco
es, tanto a
` esquerda quanto a
` direita, s
ao isometrias.
Demonstraca
o. Seja (Un )n uma base de vizinhancas do elemento neutro 1 de
G. Pelo Lema 0.57, para cada n existe uma funca
o contnua n : G [0, 1] tal
que n (1) = 0 e (z) = 1 para todo z G \ Un . Defina
: G [0, 1],

(z) =

2n n (z).

n=1

Ent
ao, e contnua e (1) = 0 < (z) para todo z 6= 1. Agora defina
d(x, y) = sup{|(gxh) (gyh) : g, h G}

f
para cada x, y G. O supremo e finito, por compacidade de G. E
acil ver que d
e uma dist
ancia em G. De fato, note que se d(x, y) = 0 ent
ao (gxh) = (gyh)
para todo g, h G. Em particular, tomando g = 1 e h = y 1 , vem que
(xy 1 ) = (1). Pela construca
o de , isto implica que x = y. Os demais axiomas da noca
o de dist
ancia seguem diretamente da definica
o de d. Finalmente,
tambem e claro da definica
o que d e invariante por translaco
es a
` esquerda e a
`
direita.
Exemplo 5.13. Dist
ancia invariante em O(d, R). Dist
ancia invariante a
` esquerda em GL(d, R).??

Teorema 5.14. Seja G um grupo compacto metriz


avel e seja g G. Ent
ao s
ao
equivalentes:

147

5.3. EXEMPLOS

(a) Eg e unicamente erg


odica;

(b) Eg e erg
odica com respeito a G ;

(c) o subgrupo {g n : n Z} gerado por g e denso em G;

claro que (a) implica (b). Para provar que (b) implica (c),
Demonstraca
o. E
considere a dist
ancia invariante d dada pelo Teorema ??. Seja H o fecho do
{g n : n Z} e e considere a funca
o contnua

DR
AF

(x) = min{d(x, y); y H}.

Observe que esta funca


o e invariante para Eg : usando que gH = H, obtemos:
(x) = min{d(x, y) : y H} = min{d(gx, gy) : y H}
= min{d(gx, z) : z H} = (gx)

para todo x G.

Como H e fechado, (x) = 0 se, e somente se, x H. Se H 6= G ent


ao
G (H 6= G) > 0, j
a que a medida de Haar e positiva em abertos. Nesse caso,
a funca
o n
ao e constante em G -quase todo ponto e, portanto, Eg n
ao pode
ser erg
odica para G .
Finalmente, para mostrar que (c) implica (a), vamos mostrar que se e uma
probabilidade invariante por Eg , ent
ao = G . Para ver isso, basta verificar
que e invariante para toda translaca
o a
` esquerda em G. Fixe h G. Pela
invari
ancia de , temos
Z

(x) d(x) =

(g n x) d(x)

para todo n N e toda funca


o contnua : G R. Por outro lado, a hip
otese
garante que existe uma sequencia de n
umeros naturais nj tal que g nj h.
Dada qualquer funca
o contnua (logo, uniformemente contnua) : G R e
dado > 0, fixe > 0 tal que |(x) (y)| < semrpe que d(x, y) < . Se j e
suficientemente grande,
d(g nj x, hx) = d(g nj , h) <

para todo x G.

Logo, |(g nj x) (hx)| <  para todo x e, portanto,


|


(x) (hx) d| = |


(g nj x) (hx) d| < .

R
R
Como e arbitr
ario, segue que d = Eh d para toda funca
o contnua
e todo h G. Isto implica que e invariante por Eh para todo h G,
conforme afirmado.


CAPITULO 5. UNICIDADE ERGODICA

148

Figura 5.1: Interc


ambio de intervalos

Interc
ambios de intervalos

DR
AF

5.3.5

Por definica
o, um interc
ambio de intervalos e uma bijeca
o do intervalo [0, 1)
com a seguinte forma: existe uma partica
o finita do intervalo em subintervalos
tal que a a restrica
o da transformaca
o a cada subintervalo e uma translaca
o.
Veja a Figura 5.1. Para fixar ideias, tomaremos os subintervalos fechados a
`
esquerda e abertos a
` direita.
Como consequencia direta da definica
o, todo interc
ambio de intervalo preserva a medida de Lebesgue em [0, 1). Estas transformaco
es exibem uma din
amica
muito rica e tem conex
oes importantes com diversos outros sistemas, tais como
os bilhares em mesas poligonais, os fluxos conservativos em superfcies e os fluxos de Teichm
uller. Por exemplo, a construca
o que esbocamos a seguir mostra
que os interc
ambios de intervalos aparecem naturalmente como transformaco
es
de Poincare de campos de vetores conservativos em superfcies.
Exemplo 5.15. Seja S uma superfcie orient
avel e seja uma forma de a
rea
em S, ou seja, uma 2-forma diferencial que nunca se anula. Podemos associar a
todo campo de vetores X uma 1-forma diferencial , definida por
x (v) = x (X(x), v)

para cada vetor v Tx S.

Observe que X e tem os mesmos zeros e que nos demais pontos o n


ucleo
de coincide a direca
o do campo de vetores. A 1-forma permite definir um
comprimento transversal de curvas c : [a, b] S, da seguinte forma:
`(c) =

c(t) (c(t))

dt.

Note que as trajet


orias do fluxo tem comprimento transversal nulo mas para
curvas transversais ao fluxo, ` e equivalente a
` medida de Lebesgue na curva.
Pode mostrar-se que a 1-forma e fechada se, e somente se, X preserva a
rea.
Ent
ao, usando o teorema de Green, as transformaco
es de Poincare do fluxo
preservam o comprimento transversal. Com uma hip
otese adicional sobre os
zeros de X, a transformaca
o f : de primeiro retorno a uma seca
o
transversal qualquer est
a definida e e contnua exceto num n
umero finito de
pontos da seca
o . Ent
ao, parametrizando pelo comprimento transversal de
arco, f e um interc
ambio de intervalos. ??

149

5.3. EXEMPLOS

DR
AF

Cada interc
ambio de intervalos fica determinado por dois ingredientes. O
primeiro deles, de natureza combinat
oria, diz respeito ao n
umero de subintervalos e a
` ordem destes subintervalos e de suas imagens dentro do intervalo [0, 1).
Isso pode ser informado da seguinte forma: atribumos a cada subintervalo um
r
otulo (uma letra, por exemplo), atribumos a
` sua imagem o mesmo r
otulo e
listamos esses r
otulos em duas linhas horizontais, na ordem respectiva. Por
exemplo, no caso da Figura 5.1, obtemos


T C A M
=
.
M A C T

Note que a escolha dos r


otulos e arbitr
aria. Denotamos por A, e chamamos de
alfabeto, o conjunto dos r
otulos escolhidos.
O segundo ingrediente, de natureza metrica, diz respeito aos comprimentos
dos subintervalos. Ele pode ser informado por meio de um vetor de coordenadas
positivas, indexadas pelos r
otulos escolhidos e que determinam o comprimento
do intervalo respectivo (e tambem da sua imagem). No caso da Figura 5.1 este
vetor de comprimentos tem a forma
= (T , C , A , M ).

A soma das coordenadas do vetor de comprimentos e sempre igual a 1.


Ent
ao, o interc
ambio de intervalos f : [0, 1) [0, 1) associada a cada par
(, ) fica definida do seguinte modo. Para cada r
otulo A, represente
por I o respectivo subintervalo e defina w = v1 v0 , onde v0 e a soma
dos comprimentos correspondentes aos r
otulos a
` esquerda de na linha
superior de e v1 e a soma dos comprimentos correspondentes aos r
otulos
a
` esquerda de na linha inferior de . Ent
ao
f (x) = x + w

para todo x I .

O vetor w = (w )A e chamado vetor de translaco


es. Observe que, para cada
fixado ele e uma funca
o linear do vetor de comprimentos = ( )A .

Figura 5.2: Rotaca


o vista como interc
ambio de dois intervalos


CAPITULO 5. UNICIDADE ERGODICA

150

Exemplo 5.16. O caso mais simples de interc


ambio de intervalos ocorre quando
temos dois subintervalos. Veja a Figura 5.2. Escolhendo o alfabeto A = {A, B},
temos



x + B
para x IA
A B
e f (x) =
=
B A
x A = x + B 1 para x IB .
Esta transformaca
o corresponde precisamente a
` rotaca
o R A , se identificarmos
[0, 1) com o crculo S 1 do modo natural. Neste sentido, os interc
ambios de
intervalos s
ao uma generalizaca
o das rotaco
es do crculo.

Minimalidade e ergodicidade de interc


ambios

DR
AF

5.3.6

Como vimos anteriormente, uma rotaca


o R do crculo e minimal se, e somente
se, e irracional. Alem disso, nesse caso R tambem e unicamente erg
odica.
Dado que quase todo n
umero e irracional, isto significa que minimalidade e
unicidade erg
odica s
ao tpicas na famlia das rotaco
es. Nesta seca
o vamos discutir como estes fatos se estendem ao contexto mais amplo dos interc
ambios de
intervalos.
Comecamos por uma observaca
o que n
ao tem an
alogo no caso das rotaco
es.
Dizemos que uma combinat
oria e redutvel se existe alguma posica
o tal que
os r
otulos a
` esquerda dessa posica
o nas duas linhas de s
ao exatamente os
mesmos. Por exemplo,


B X O L F D
=
X O B F D L

e redutvel, pois os r
otulos a
` esquerda da quarta posica
o s
ao os mesmos nas duas
linhas: B, O e X. Como consequencia, qualquer que seja o vetor de comprimentos , o interc
ambio de intervalos f definido por (, ) deixa o subintervalo
IB IO IX invariante. Em particular, f n
ao pode ser minimal e nem sequer
transitivo. No que segue sempre suporemos que a combinat
oria e irredutvel.
Uma conjectura natural e que o interc
ambio de intervalos seja minimal sempre que o vetor de comprimentos = ( )A e racionalmente independente,
ou seja, se
X
n 6= 0
A

para todo vetor (n )A n


ao nulo com coordenadas inteiras. Isto e verdade
mas, de fato, a hip
otese de independencia racional e demasiado forte: vamos
apresentar uma condica
o um pouco mais geral que ainda implica minimalidade.
Denotemos por I o extremo inferior de cada subintervalo I . Dizemos que
um par (, ) satisfaz a condica
o de Keane se as trajet
orias destes pontos s
ao
disjuntas:
f m (I ) 6= I

para todo m 1 e quaisquer , A com I 6= 0

(5.7)

(note que sempre existem


e tais que f (I ) = 0 = I ). Deixamos a
demonstraca
o do seguinte lema ao cuidado do leitor (Exerccio 5.8).

151

5.3. EXEMPLOS

1. Se (, ) satisfaz a condica
o de Keane ent
ao e irredutvel.

Lema 5.17.

2. Se e irredutvel e e racionalmente independente ent


ao (, ) satisfaz
a condica
o de Keane.

Como o subconjunto dos vetores racionalmente independentes tem medida


de Lebesgue total, obtemos que a condica
o de Keane e satisfeita para quase
todo vetor de comprimentos , sempre que e irredutvel.

DR
AF

Exemplo 5.18. No caso de dois subintervalos (lembre o Exemplo 5.16), o


interc
ambio de intervalos tem a forma f m (x) = x + mB m
odulo n
umeros
inteiros. Ent
ao, a condica
o de Keane significa que
mB 6= A + n e A + mB 6= A + n

claro que isto acontece se, e somente se, o


para todo m N e todo n Z. E
vetor A , B ) e racionalmente independente.

Exemplo 5.19. Para interc


ambios de 3 ou mais intervalos a condica
o de Keane
e estritamente mais fraca do que a independencia racional do vetor de comprimentos. Considere, por exemplo,


A B C
=
.
C A B
Ent
ao f m (x) = x + mC m
odulo n
umeros inteiros e, portanto, a condica
o de
Keane significa que os n
umeros
{mC , A + mC , A + B + mC } e disjunto de {A + n, A + B + n}

para todo m N e n Z. De modo equivalente,

pC
/ {q, A + q} para todo p Z e q Z.

Isto pode valer mesmo quando (A , B , C ) e racionalmente dependente.


O seguinte resultado foi obtido por Michael Keane:

Teorema 5.20 (Keane). Se (, ) satisfaz a condica


o de Keane ent
ao o interc
ambio de intervalos f e minimal.

Exemplo 5.21. A condica


o de Keane n
ao e necess
aria para a minimalidade.
Por exemplo, considere o interc
ambio de intervalos definido por (, ), onde


A B C D
=
D C B A

A = C , B = D e A /B = C /D e irracional. Ent
ao (, ) n
ao satisfaz a
condica
o de Keane condition e, no entanto, f e minimal.


CAPITULO 5. UNICIDADE ERGODICA

152

Conforme observamos anteriormente, toda rotaca


o minimal e tambem unicamente erg
odica. Isto ainda e v
alido para interc
ambios de 3 intervalos, mas n
ao
no caso geral. De fato, Keane deu um exemplo de um interc
ambio de 4 intervalos
onde e irredutvel, e racionalmente independente e, no entanto, f tem duas
probabilidades erg
odicas. ?? Keane conjecturou que, assim mesmo, deveria ser
verdade que quase todo interc
ambio de intervalos e unicamente erg
odico. Um
resultado fundamental da teoria dos interc
ambios de intervalos, obtido independentemente por Howard Masur e William Veech, afirma que esta conjectura e
verdadeira:

DR
AF

Teorema 5.22 (Masur, Veech). Suponha que e irredutvel. Ent


ao para Lebesgue quase todo vetor de comprimentos o interc
ambio de intervalos definido
por (, ) e unicamente erg
odico.

Um pouco antes, Michael Keane and Gerard Rauzy provaram que unicidade
erg
odica vale para um conjunto residual (segunda categoria de Baire) de vetores
de comprimento sempre que a combinat
oria e irredutvel.

5.4

Teorema de Weyl

Nesta seca
o vamos utilizar ideias discutidas anteriormente para provar um belo
teorema de H. Weyl [Wey16] sobre a distribuica
o dos valores de funco
es polinomiais restritas aos n
umeros inteiros.
Considere qualquer funca
o polinomial P : R R com coeficientes reais e
grau d 1:
P (x) = a0 + a1 x + a2 x2 + + ad xd .

Compondo P com a projeca


o can
onica R S 1 , obtemos uma funca
o polinomial
1
P : R S com valores no crculo S 1 = R/Z. Defina:
zn = P (n),

para cada n 1.

Podemos pensar em zn como sendo a parte fracion


aria do n
umero real P (n).
Estamos interessados em entender como a sequencia (zn )n se distribui no crculo.

Defini
c
ao 5.23. Dizemos que uma sequencia (xn )n em S 1 e equidistribuda se
para qualquer funca
o contnua : S 1 R tem-se
n

1X
lim
(xj ) =
n n
j=1

(x) dx.

De acordo com o Exerccio 5.4, isto equivale a dizer que, para todo segmento
I S 1 , a fraca
o dos termos da sequencia que est
ao em I e igual ao comprimento
m(I) do segmento.
Teorema 5.24 (Weyl). Se algum dos coeficientes a1 , a2 , . . . , ad e irracional
ent
ao a sequencia zn = P (n), n N e equidistribuda.

153

5.4. TEOREMA DE WEYL

Para desenvolvermos a nossa intuica


o sobre este teorema, comecemos por
considerar o caso especial d = 1. Neste caso a funca
o polinomial resume-se a
P (x) = a0 + a1 x. Consideremos a transformaca
o
f : S1 S1,

f () = + a1 .

Por hip
otese, o coeficiente a1 e irracional. Portanto, como vimos na Seca
o 5.3.1,
esta transformaca
o admite uma u
nica probabilidade invariante, que e a medida
de Lebesgue m. Consequentemente, dada qualquer funca
o contnua : S 1 R
1
e dado qualquer ponto S ,
Z

DR
AF

lim

1X
(f j ()) =
n j=1

dm.

Considere = a0 . Ent
ao, f j () = a0 + a1 j = zj . Ent
ao a relaca
o anterior d
a
n

1X
lim
(zj ) =
n n
j=1

dm.

Isto e precisamente o que significa dizer que zj e equidistribuda.

5.4.1

Ergodicidade

Agora vamos estender os argumentos acima para qualquer grau d 1. Para


isso introduzimos a transformaca
o f : Td Td definida no toro d-dimensional
d
T pela seguinte express
ao:
f (1 , 2 , . . . , d ) = (1 + , 2 + 1 , . . . , d + d1 ),

(5.8)

onde e um n
umero irracional que ser
a escolhido mais tarde. Note que f e
invertvel: a inversa est
a dada por

f 1 (1 , 2 , . . . , d ) = (1 , 2 1 +, . . . , d d1 + +(1)d1 1 +(1)d ).
Note tambem que a derivada

1
1

de f em cada ponto e dada pela matriz

0
0
0
0
1
0
0
0

1
1
0
0


0
0
1
1

cujo determinante e 1. Portanto, o Lema 1.12 garante que f preserva a medida


de Lebesgue no toro.??
Proposi
c
ao 5.25. A medida de Lebesgue em Td e erg
odica para f .


CAPITULO 5. UNICIDADE ERGODICA

154

Demonstraca
o. Vamos usar um argumento de expans
ao em serie de Fourier,
an
alogo ao da Proposica
o 4.7. Seja : Td R uma funca
o em L2 (m). Escrevemos
X
() =
an e2in
nZd

onde = (1 , . . . , d ) e n = (n1 , . . . , nd ) e n = n1 1 + + nd d e
Z
X
|an |2 = |()|2 d1 dd < .

(5.9)

DR
AF

nZd

Observe que

(f ()) =

an e2i(n1 (1 +)+n2 (2 +1 )+nd (d +d1 ))

nZd

an e2in1 e2iL(n)

nZd

onde L(n) = (n1 + n2 , n2 + n3 , . . . , nd1 + nd , nd ). Suponhamos que a funca


o
e invariante, isto e, f = em quase todo ponto. Ent
ao,
an e2in1 = aL(n)

para todo n Zd .

(5.10)

Isto implica que an e aL(n) tem o mesmo valor absoluto. Por outro lado, a
relaca
o de integrabilidade (5.9) implica que existe no m
aximo um n
umero finito
de termos com um dado valor absoluto n
ao-nulo. Conclumos que an = 0 para
todo n Zd cuja o
rbita Lj (n), j Z seja infinita. Observando a express
ao de
L deduzimos que an = 0 exceto, possivelmente, se n2 = = nd = 0. Alem
disso, para os valores de n restantes, ou seja, para n = (n1 , 0, . . . , 0), tem-se que
L(n) = n e portanto a relaca
o (5.10) torna-se
an = an e2in1 .

Como e irracional, o u
ltimo fator e diferente de 1 sempre que n1 e n
ao-nulo.
Portanto esta relaca
o d
a que an = 0 tambem para n = (n1 , 0, . . . , 0) com n1 6= 0.
Deste modo, mostramos que se e uma funca
o invariante ent
ao todos os termos
da sua expans
ao em serie de Fourier se anulam exceto, possivelmente, o termo
constante. Isto mostra que e constante em quase todo ponto, e isso prova que
a medida de Lebesgue e erg
odica para f .

5.4.2

Unicidade erg
odica

O pr
oximo passo da demonstraca
o do Teorema 5.24 e o seguinte resultado:

Proposi
c
ao 5.26. A transformaca
o f e unicamente erg
odica: a medida de
Lebesgue no toro e a sua u
nica probabilidade invariante.

155

5.4. TEOREMA DE WEYL

Demonstraca
o. A demonstraca
o ser
a por induca
o no grau d do polin
omio P . O
caso de grau 1 foi tratado anteriormente. Portanto, s
o precisamos explicar como
o caso de grau d pode ser deduzido do caso de grau d 1. Para isso, escrevemos
Td = Td1 S 1 e
f : Td1 S 1 Td1 S 1 ,

f (0 , ) = (f0 (0 ), + d1 ),

(5.11)

onde 0 = (1 , . . . , d1 ) e f0 (0 ) = (1 + , 2 + 1 , . . . , d1 + d2 ). Por
induca
o, a transformaca
o
f0 : Td1 Td1

DR
AF

e unicamente erg
odica. Representamos por : Td Td1 a projeca
o () = 0 .
Lema 5.27. Se e uma probabilidade invariante por f ent
ao a projeca
o
coincide com a medida de Lebesgue m0 em Td1 .

Demonstraca
o. Dado qualquer conjunto mensur
avel E Td1 ,
( )(f01 (E)) = ( 1 f01 (E)).

Usando f = f0 e o fato de que e f -invariante, se verifica que a express


ao
do lado direito e igual a
(f 1 1 (E)) = ( 1 (E)) = ( )(E).

Portanto ( )(f01 (E)) = ( )(E) para todo subconjunto mensur


avel E, ou
seja, e probabilidade f0 -invariante. Como f0 e unicamente erg
odico, segue
que coincide com a medida de Lebesgue m0 em Td1 .
Agora suponhamos que , alem de invariante, tambem e erg
odica para f .
Pelo Teorema 3.11, e por ergodicidade, o conjunto G() M dos pontos T d
tais que
lim
n

Z
n1
1X
(f j ()) = d
n j=0

para toda funca


o contnua : Td R (5.12)

tem medida total. Seja G0 () o conjunto dos 0 Td1 tais que G() intersecta
claro que 1 (G0 ())
{0 } S 1 . Em outras palavras, G0 () = (G()). E
contem G() e, portanto, tem medida total. Logo, usando o Lema 5.27,
m0 (G0 ()) = ( 1 (G0 ())) = 1.

(5.13)

Pelas mesmas raz


oes, esta relaca
o tambem vale para a medida de Lebesgue:
m0 (G0 (m)) = m( 1 (G0 (m))) = 1.

(5.14)

Uma consequencia direta das igualdades (5.13) e (5.14) e que a intersecca


o de
G0 () e G0 (m) tem medida m0 total. Logo, em particular, estes conjuntos n
ao
podem ser disjuntos. Seja 0 um ponto qualquer na intersecca
o. Por definica
o,
G() intersecta {0 } S 1 . Mas o pr
oximo resultado afirma que G(m) contem
{0 } S 1 :


CAPITULO 5. UNICIDADE ERGODICA

156

Lema 5.28. Se 0 G0 (m) ent


ao {0 } S 1 est
a contido em G(m).

Demonstraca
o. A observaca
o crucial e que a medida m e invariante por toda a
transformaca
o da forma
R : Td1 S 1 Td1 S 1 ,

(, ) 7 (, + ).

DR
AF

A hip
otese 0 G0 (m) significa que existe algum S 1 tal que (0 , ) G(m),
ou seja,
Z
n1
1X
lim
(f j (0 , )) = dm
n n
j=0

para toda funca


o contnua : Td R. Qualquer outro ponto de {0 } S 1
pode ser escrito como (0 , + ) = R (0 , ) para algum S 1 . Recordando
(5.8), vemos que


f R (0 , ) = (1 + , 2 + 1 , . . . , d1 + d2 , + + d1 ) = R f (0 , )

para todo (0 , ) Td1 S 1 . Logo, por induca


o,



f j (0 , + ) = f j R (0 , ) = R f j (0 , )

para todo j 1. Portanto, dada qualquer funca


o contnua : Td R,
lim
n

n1
n1
1X
1X
(f j (0 , + )) = lim
( R )(f j (0 , ))
n j=0
n j=0
Z
Z
= ( R ) dm = dm.

Isto prova que (0 , + ) est


a em G(m) para todo S 1 , conforme afirmado.
Segue do que dissemos ate agora que G() e G(m) se intersectam em algum
ponto de {0 } S 1 . Tendo em vista a definica
o (5.12), isto implica que as duas
medidas tem a mesma integral para cada funca
o contnua. De acordo com a
Proposica
o 0.56, isto implica que = m, como queramos demonstrar.

Corol
ario 5.29. A o
rbita de todo ponto Td e equidistribuda no toro Td ,
ou seja, para toda funca
o contnua : Td R tem-se
lim
n

Z
n1
1X
(f j ()) = dm.
n j=0

Demonstraca
o. Isto segue imediatamente das Proposico
es 5.1 e 5.26.

157

5.4. TEOREMA DE WEYL

Demonstra
c
ao do teorema de Weyl

5.4.3

Para completarmos a demonstraca


o do Teorema 5.24, introduzimos as funco
es
polinomiais p1 , . . . , pd definidas por
pd (x) = P (x) e
pj1 (x) = pj (x + 1) pj (x)

para j = 2, . . . , d.

(5.15)

Lema 5.30. O polin


omio pj (x) tem grau j, para todo 1 j d. Alem disso,
p1 (x) = x + com = d!ad .

DR
AF

Demonstraca
o. Por definica
o, pd (x) = P (x) tem grau d. Logo, para mostrar a
primeira afirmaca
o basta mostrar que se pj (x) tem grau j ent
ao pj1 (x) tem
grau j 1. Para isso, escreva
pj (x) = bj xj + bj1 xj1 + + b0 ,

onde bj 6= 0. Ent
ao

pj (x + 1) = bj (x + 1)j + bj1 (x + 1)j1 + + b0


= bj xj + (jbj + bj1 )xj1 + + b0 .

Subtraindo uma express


ao da outra, obtemos que

pj1 (x) = (jbj )xj1 + b0j2 xj2 + + b00

tem grau j 1. Isto prova a primeira afirmaca


o no lema. Este c
alculo tambem
mostra que o coeficiente guia de cada pj1 (x) se obtem multiplicando por j o
coeficiente guia de pj (x). Consequentemente, o coeficiente guia de a1 deve ser
igual a d!aq . Isto prova a segunda afirmaca
o.
Lema 5.31. Para todo n 0,



f n p1 (0), p2 (0), . . . , pd (0) = p1 (n), p2 (n), . . . , pd (n) .

Demonstraca
o. A demonstraca
o ser
a por induca
o em n. Como o caso n = 0 e
o
bvio, s
o precisamos tratar do passo indutivo. Lembre que f foi definida em
(5.8). Se
f n1 (p1 (0), p2 (0), . . . , pd (0)) = (p1 (n 1), p2 (n 1), . . . , pd (n 1))

ent
ao f n (p1 (0), p2 (0), . . . , pd (0)) e igual a

(p1 (n 1) + , p2 (n 1) + p1 (n 1), . . . , pd (n 1) + pd1 (n 1)).

Usando a definica
o (5.15) e o Lema 5.30, obtemos que esta express
ao e igual a
(p1 (n), p2 (n), . . . , pd (n)),

e isto prova o lema.


CAPITULO 5. UNICIDADE ERGODICA

158

Finalmente, estamos prontos para provar que a sequencia zn = P (n), n N


e equidistribuda. Vamos tratar dois casos separadamente.
Em primeiro lugar, suponha que o coeficiente guia ad de P (x) e irracional.
Ent
ao o n
umero no Lema 5.30 e irracional e, portanto, os resultados da
Seca
o 5.4.2 s
ao v
alidos para a transformaca
o f : Td Td . Seja : S 1 R
uma funca
o contnua qualquer. Considere : Td R definida por
(1 , 2 , . . . , d ) = (d ).

DR
AF

Fixemos = (p1 (0), p2 (0), . . . , pd (0)). Usando o Lema 5.31 e o Corol


ario 5.29,
obtemos que
Z
Z
n1
n1
1X
1X
n
lim
(zn ) = lim
(f ()) = dm = dx.
n n
n n
j=0
j=0

Isto termina a demonstraca


o do Teorema 5.24 no caso em que ad e irracional.

Agora suponha que ad e racional, digamos ad = p/q com p Z e q N. E


claro que podemos escrever zn como uma soma
zn = x n + y n ,

xn = a d n d

e yn = Q (n)

onde Q(x) = a0 + a1 x + + ad1 xd1 e Q : R S 1 e dada por Q = Q.


Observe, em primeiro lugar, que
xn+q xn =

p
p
(n + q)d nd
q
q

e um n
umero inteiro, para todo n N. Isto significa que a sequencia xn , n N
e peri
odica de perodo q no crculo R/Z. Em particular, ela toma no m
aximo
q valores distintos. Observe tambem que, como ad e racional, a hip
otese do
teorema implica que algum dos coeficientes a1 , . . . , ad1 de Q e irracional.
Logo, por induca
o no grau, temos que yn , n N e equidistribuda. Mais do que
isso, as subsequencias
yqn+r = Q (qn + r),

nZ

s
ao equidistribudas para todo r {0, 1, . . . , q1}. Na verdade, estas sequencias
(r)
podem ser escritas como ynq+r = Q (n) para algum polin
omio Q(r) que
tambem tem grau d 1 (verifique) e, portanto, a hip
otese de induca
o se aplica a
elas tambem. Destas duas observaco
es segue que toda subsequencia z qn+r , n Z
e equidistribuda. Consequentemente, zn , n N tambem e equidistribuda. Isto
completa a prova do Teorema 5.24.

5.5

Exerccios

5.1. Seja f : M M um od
ometro, tal como foi definido na secca
o 5.3.2.

5.5. EXERCICIOS

159

1. Seja : M R uma funca


o contnua qualquer. Mostre que
n1
1X
(f j (z))
n n
j=0

(x)

= lim

existe em todo ponto e o limite e uniforme.

2. Justifique que e constante em todo ponto e deduza que f tem uma u


nica
probabilidade invariante.

DR
AF

3. Calcule essa probabilidade, encontrando uma express


ao explcita para a
medida de qualquer subconjunto [b0 , b1 , . . . , bk ] das seq
uencias com 0 =
b 0 , 1 = b 1 , . . . , k = b k .

5.2. Seja G uma variedade e seja uma operaca


o de grupo em G tal que a
aplicaca
o (g, h) 7 g h e diferenci
avel. Mostre que g 7 g 1 tambem e diferenci
avel.

5.3. Seja G um espaco topol


ogico compacto e seja uma operaca
o de grupo em
G tal que a aplicaca
o (g, h) 7 g h e contnua. Mostre que g 7 g 1 tambem e
contnua.

5.4. Mostre que uma sequencia e equidistribuda no crculo se, e somente se,
para todo segmento I S 1 tem-se
lim
n

1
#{1 j n : zj I} = m(I)
n

onde m(I) representa o comprimento de I.

5.5. Prove o Corol


ario ??, usando os argumentos das Proposico
es 5.25 e 4.7.

5.6. Prove o item (c) do Teorema 5.9: um grupo localmente compacto G e


compacto se, e somente se, a sua medida de Haar e finita.

Dica: Suponha que (xn )n e uma sequencia em G sem ponto de acumulaca


o
ent
ao para todo compacto K existe uma subsequencia (xnj )j tal que os conjunao disjuntos dois-a-dois.
tos xnj K = {xnj g : g K} s

5.7. Seja G um grupo compacto metriz


avel e seja g G. Mostre que s
ao
equivalentes:
1. Eg e unicamente erg
odica;

2. Eg e transitiva: existe x G tal que {g n x : n Z} e densa em G;


3. Eg e minimal: {g n y : n Z} e densa em G para todo y G.

5.8. Prove o Lema 5.17.


CAPITULO 5. UNICIDADE ERGODICA

DR
AF

160

Captulo 6

DR
AF

Correlaco
es

Os modelos de sistemas din


amicos em que estamos interessados mais diretamente, transformaco
es e fluxos, s
ao determinsticos: o estado do sistema em
qualquer momento determina toda a trajet
oria futura; quando o sistema e invertvel, a trajet
oria passada fica igualmente determinada. No entanto, estes sistemas podem apresentar tambem comportamento de tipo estoc
astico (ou seja,
aleat
orio): num nvel mais grosseiro que o das trajet
orias individuais, informaca
o sobre o passado vai sendo esquecida a
` medida que o sistema e iterado.
Este e o tema do presente captulo.
A sequencia de correlaco
es de duas funco
es mensur
aveis , : M R e
definida por

Cn (, ) =

( f ) d


d .

Podemos pensar em e como grandezas que medimos no sistema, tais como


a temperatura, o pH, a energia cinetica, etc. Ent
ao Cn (, ) mede como o valor
de em tempo n se correlaciona com o valor de em tempo zero, isto e, ate
que ponto um valor influencia o outro. Por exemplo, se = XA e = XB
s
ao funco
es caractersticas, ent
ao (x) d
a informaca
o sobre a posica
o do ponto
inicial x, enquanto que (f n (x)) informa sobre a posica
o do seu n-esimo iterado
f n (x). Se a correlaca
o Cn (, ) for pequena ent
ao a primeira informaca
o e de
pouca utilidade para fazer previs
oes quanto ao segundo evento. Como veremos,
esse tipo de comportamento, em que as correlaco
es diminuem a
` medida que n
aumenta, e bastante comum em modelos importantes.
Comecaremos por introduzir as noco
es de sistema (fortemente) misturador e
fracamente misturador e por estudar as suas propriedades b
asicas. Na Seca
o 6.2
discutimos estas noco
es no contexto dos deslocamentos de Markov, uma generalizaca
o importante dos deslocamentos de Bernoulli. Outros exemplos s
ao
analisados nas Seca
o 6.3. Na Seca
o 6.4 discutimos, em termos quantitativos, a
velocidade de decaimento das correlaco
es para certas classes de funco
es.
161


CAPITULO 6. CORRELAC
OES

162

Sistemas misturadores

6.1

Seja f uma transformaca


o f : M M uma transformaca
o mensur
avel e seja
uma probabilidade invariante. Dizemos que o sistema (f, ) e misturador, se
lim Cn (XA , XB ) = lim |(f n (A) B) (A)(B)| = 0,
n

(6.1)

DR
AF

para quaisquer conjuntos mensur


aveis A, B M . Em outras palavras, quando
n cresce, a probabilidade do evento {x B e f n (x) A} converge para o
produto das probabilidades dos eventos {x B} e {f n (x) A}.

6.1.1

Propriedades

Um sistema misturador e necessariamente erg


odico. De fato, suponha que existe
algum conjunto invariante A M com 0 < (A) < 1. Tomando B = Ac
vem que f n (A) B = para todo n. Logo, (f n (A) B) = 0 para todo
n, enquanto que (A)(B) 6= 0. Em particular, (f, ) n
ao e misturador. O
exemplo a seguir mostra que ergodicidade e uma propriedade estritamente mais
fraca:

Exemplo 6.1. Considere irracional. Como vimos anteriormente, a rotaca


o
R no crculo S 1 e erg
odica para a medida de Lebesgue m. No entanto, (R , m)
n
ao e misturador. De fato, se A, B S 1 s
ao dois intervalos pequenos (com
n
comprimento menor que 1/10, digamos) ent
ao R
(A) B e vazio e, portanto,
n
m(R (A) B) = 0 para infinitos valores de n. Como m(A)m(B) 6= 0, segue
que o limite em (6.1) n
ao se verifica.

claro da definica
E
o (6.1) que se (f, ) e misturador ent
ao (f k , ) e misturador, para todo k N. A afirmaca
o correspondente para ergodicidade e falsa: a
aplicaca
o f (x) = 1 x no conjunto {0, 1} e erg
odica para a medida ( 0 + 1 )/2
mas o segundo iterado f 2 n
ao e.

Lema 6.2. Suponha que limn (f n (A) B) = (A)(B) para todo par de
conjuntos A e B em alguma a
lgebra A geradora da -
algebra dos conjuntos
mensur
aveis. Ent
ao (f, ) e misturador.
Demonstraca
o. Seja C a famlia de todos os conjuntos mensur
aveis A tais que
(f n (A) B) (A)(B) para todo B A. Por hip
otese, C contem A.
Afirmamos que C e uma classe mon
otona. De fato, sejam A1 Ak
elementos de C e seja A = k Ak . Dado > 0, existe k0 1 tal que
(A) (Ak ) = (A \ Ak ) <

para todo k k0 . Alem disso, para todo n 1,

(f n (A) B) (f n (Ak ) B) = (f n (A \ Ak ) B)

(f n (A \ Ak )) = (A \ Ak ) < .

163

6.1. SISTEMAS MISTURADORES

Para k k0 fixado, o fato de que Ak C garante que existe n(k) tal que
|(f n (Ak ) B) (Ak )(B)| < para todo n n(k).
Somando estas tres desigualdades conclumos que

|(f n (A) B) (A)(B)| < 3 para todo n n(k0 ).

DR
AF

Como > 0 e arbitr


ario, isto mostra que A C. Da mesma forma se mostra
que a interseca
o de qualquer sequencia decrescente de elementos de C ainda e
um elemento de C. Portanto C e uma classe mon
otona, tal como afirmamos.
Pelo teorema das classes mon
otonas (Teorema 0.15), segue que C contem todo
o conjunto mensur
avel: para todo conjunto mensur
avel A tem-se
lim (f n (A) B) = (A)(B)
n

para todo B A.

Resta deduzir que esta propriedade vale para todo conjunto mensur
avel B. Isto
e inteiramente an
alogo aos argumentos que acabamos de detalhar, pelo que
deixamos a verificaca
o a cargo do leitor.

Exemplo 6.3. Todo deslocamento de Bernoulli (lembre da Seca


o 4.2.3) e misturador. De fato, dados dois cilindros A = [p; Ap , . . . , Aq ] e B = [r; Br , . . . , Bs ]
quaisquer, tem-se
(f n (A) B) = ([r; Br , . . . , Bs , X, . . . , X, Ap , . . . , Aq ])

= ([r; Br , . . . , Bs ])([p; Ap , . . . , Aq ]) = (A)(B)

para todo n > s p. Seja A a a


lgebra gerada pelos cilindros: os seus elementos
s
ao as uni
oes finitas disjuntas de cilindros. Segue do que acabamos de dizer que
(f n (A) B) = (A)(B) para todo par de conjuntos A, B A e todo n
suficientemente grande. Como A gera a -
algebra dos conjuntos mensur
aveis,
podemos usar o Lema 6.2 para concluir que o sistema e misturador, tal como
foi afirmado.

Exemplo 6.4. Seja f : S 1 S 1 a transformaca


o definida por g(x) = kx,
onde k 2 e um n
umero inteiro, e seja m a medida de Lebesgue m no crculo.
O sistema (g, m) e equivalente a um deslocamento de Bernoulli, no seguinte
sentido (estas ideias ser
ao analisadas em mais detalhe na Seca
o 7.1). Considere
X = {0, 1, . . . , k 1} e seja f : M M a aplicaca
o deslocamento em M = X N .
Considere a medida produto = N em M , onde e a probabilidade definida
por (A) = #A/k para todo A X. A aplicaca
o
h : M S1,

 X
an1
h (an )n =
kn
n=1

e uma bijeca
o, restrita a um subconjunto com medida total, e tanto ela quanto
a sua inversa s
ao mensur
aveis. Alem disso, h = m e h f = g h em quase
todo ponto. Dizemos que h e uma equivalencia erg
odica entre (g, m) e (f, ).


CAPITULO 6. CORRELAC
OES

164

Por meio dela, propriedades podem ser traduzidas de um sistema para o outro.
Em particular, lembrando do Exemplo 6.3, obtemos que (g, m) e misturador:
dados quaisquer conjuntos mensur
aveis A, B S 1 ,



m g n (A) B = h1 (g n (A) B) = g n (h1 (A)) h1 (B)
(h1 (A))(h1 (B)) = m(A)m(B)

quando n .

DR
AF

Vamos tambem discutir uma vers


ao topol
ogica de sistema misturador. Para
isso, suponha que o ambiente M e um espaco topol
ogico. Uma transformaca
o
f : M M e dita topologicamente misturadora se dados quaisquer abertos
n
ao-vazios U, V M , existe n0 N tal que f n (U ) V e n
ao vazio para todo
n n0 . Isto e parecido, mas estritamente mais forte do que a hip
otese do
Lema 4.30: l
a pedimos que f n (U ) intersecte V para algum n, enquanto que
agora queremos que isso aconteca para todo n suficientemente grande.

Proposi
c
ao 6.5. Se (f, ) e misturadora ent
ao a restrica
o de f ao suporte de
e topologicamente misturadora.
Demonstraca
o. Denote por X = supp(). Sejam A, B X conjuntos abertos. Temos que (A), (B) > 0, por definica
o de supp(). Assim, como e
misturadora, temos que existe n0 tal que n n0 vale que (f n (A) B) >
(A)(B)/2 > 0. Em particular, (f n (A) B) 6= , como queramos demonstrar.
Segue diretamente desta proposica
o que se f possui uma medida misturadora positiva em abertos, ent
ao f e topologicamente misturadora. Por exemplo,
dado qualquer conjunto finito X = {1, . . . , d}, o deslocamento
f : XZ XZ

(ou f : X N X N )

e topologicamente misturador. De fato, para qualquer probabilidade suportada em todo o X, a medida de Bernoulli = N (ou = Z ) e positiva
em abertos e misturadora, como vimos no Exemplo 6.3. Analogamente, pelo
Exemplo 6.4, toda transformaca
o f : S 1 S 1 da forma f (x) = kx com k 2
e topologicamente misturadora.

Exemplo 6.6. Translaco


es num grupo metriz
avel G nunca s
ao topologicamente
misturadoras. De fato considere qualquer translaca
o a
` esquerda E g (o caso de
translaco
es a
` direita e an
alogo). Podemos supor que g 6= 1, pois caso contr
ario
e evidente que Eg n
ao e topologicamente misturadora. Fixemos uma dist
ancia
d invariante pelas translaco
es do grupo G (lembre do Lema 5.12) e seja =
d(1, g 1 ). Considere U = V = bola de centro 1 e raio /4. Todo Egn (U ) e
uma bola de raio /4. Suponha que Egn (U ) intersecta V . Ent
ao Egn (U ) est
a
n1
contida na bola de raio 3/4 e, portanto, Eg
(U ) est
a contida na bola de
raio 3/4 em torno de g 1 . Consequentemente, Egn1 (U ) n
ao intersecta V .
Como n e arbitr
ario, isto mostra que Eg n
ao e topologicamente misturador.

6.1.2

Mistura fraca

165

6.1. SISTEMAS MISTURADORES

Dizemos que o sistema (f, ) e fracamente misturador, se dados quaisquer conjuntos mensur
aveis A, B M ent
ao:
lim
n

n1
n1
1X
1X
Cj (XA , XB ) = lim
|(f j (A) B) (A)(B)| = 0.
n n
n j=0
j=0

(6.2)

DR
AF

claro da definica
E
o que todo sistema misturador e tambem fracamente misturador. Por outro lado, todo sistema fracamente misturador e erg
odico. De fato,
se A M e conjunto invariante ent
ao
lim
n

n1
X
j=0

Cj (XA , XAc ) = (A)(Ac )

e, portanto, a hip
otese implica que (A) = 0 ou (Ac ) = 0.

Exemplo 6.7. Translaco


es em grupos compactos metriz
aveis nunca s
ao fracamente misturadoras, relativamente a
` medida de Haar (ou qualquer outra
medida invariante positiva em abertos). De fato, conforme observado no Exemplo 6.6, e sempre possvel escolher abertos U e V tais que f n (U ) V e vazio
para um em cada dois valores consecutivos de n. Ent
ao,
lim inf
n

n1
1
1X
|(f j (U ) V ) (U )(V )| (U )(V ) > 0.
n j=0
2

Desta forma obtemos diversos exemplos de sistemas erg


odicos, e ate unicamente
erg
odicos, que n
ao s
ao fracamente misturadores.

Exemplo 6.8. Os interc


ambios de intervalos (lembre a Seca
o 5.3.5) fornecem
muitos exemplos de sistemas fracamente misturadores que n
ao s
ao misturadores. Lembre que, pelo teorema de Masur-Veech (Teorema 5.22) quase todo
interc
ambio de intervalos e unicamente erg
odico: isso vale para quase todo vetor
de comprimentos , desde que a combinat
oria seja irredutvel. Outro teorema
profundo, devido a Avila-Forni [AF07], afirma que, se excetuarmos as rotaco
es
(mais precisamente: os interc
ambios de intervalos com uma u
nica descontinuidade), quase todo o interc
ambio de intervalos e fracamente misturador. A vers
ao
topol
ogica deste fato havia sido provada por Nogueira-Rudolph [NR97]. Por outro lado, um resultado de Katok (Teorema 6.29) que discutiremos na Seca
o 6.3.2
afirma que interc
ambios de intervalo nunca s
ao misturadores.
A demonstraca
o do resultado a seguir e an
aloga a
` do Lemma 6.2 e fica a
cargo do leitor:
Pn1
Lema 6.9. Suponha que limn n1 j=0
|(f j (A) B) (A)(B)| = 0 para
todo par de conjuntos A e B em alguma a
lgebra A geradora da -
algebra dos
conjuntos mensur
aveis. Ent
ao (f, ) e fracamente misturador.


CAPITULO 6. CORRELAC
OES

166

Exemplo 6.10. Dado um sistema (f, ), consideremos a transformaca


o produto
f
f2 : M M M M dado por f2 (x, y) = (f (x), f (y)). E
acil ver que f2
preserva a medida produto 2 = . Se (f2 , 2 ) e erg
odico ent
ao (f, ) e
erg
odico: basta notar que se A M e conjunto invariante para f com (A)
(0, 1) ent
ao A A e conjunto invariante para f2 com 2 (A A) (0, 1).
A recproca n
ao e verdadeira em geral, ou seja, (f2 , 2 ) pode n
ao ser erg
odico
mesmo que (f, ) seja erg
odico. Por exemplo, se f e uma rotaca
o irracional
em S 1 e d e uma dist
ancia invariante por rotaco
es, ent
ao qualquer vizinhanca
{(x, y) : d(x, y) < r} da diagonal e um conjunto invariante para f f .

DR
AF

O pr
oximo resultado mostra que este tipo de fen
omeno n
ao ocorre na categoria dos sistemas fracamente misturadores:
Proposi
c
ao 6.11. As seguintes condico
es s
ao equivalentes:
(a) (f, ) e fracamente misturador;

(b) (f2 , 2 ) e fracamente misturador;

(c) (f2 , 2 ) e erg


odico.

Demonstraca
o. Para provar que (a) implica (b), considere quaisquer conjuntos
mensur
aveis A, B, C, D M . Ent
ao:


2 (f j (A B) (C D)) 2 (A B)2 (C D)
2


= (f j (A) C)(f j (B) D) (A)(B)(C)(D)



(f j (A) C) (A)(C) + (f j (B) D) (B)(D) .
Portanto, a hip
otese (a) implica que
lim
n

n1

1 X
2 (f2j (A B) (C D)) 2 (A B)2 (C D) = 0.
n j=0

Segue que

lim
n

n1

1 X
2 (f2j (X) Y ) 2 (X)2 (Y ) = 0
n j=0

para quaisquer X, Y na a
lgebra gerada pelos produtos E F de subconjuntos mensur
aveis de M , ou seja, a a
lgebra das uni
oes finitas disjuntas de tais
produtos. Como esta a
lgebra gera a -
algebra dos subconjuntos mensur
aveis
de M M , podemos usar o Lema 6.9 para concluir que (f2 , 2 ) e fracamente
misturador.
imediato que (b) implica (c). Para provar que (c) implica (a), observe que
E
n1
X
j=0

(f j (A) B) (A)(B)
=

n1
X
j=0

2

(f j (A) B)2 2(A)(B)(f j (A) B) + (A)(B)2

167

Pode ser reescrito como


n1
X
j=0

6.1. SISTEMAS MISTURADORES




2 f2j (A A) (B B) 2 (A A)2 (B B)
2(A)(B)

n1
X
j=0



(f j (A) B) (A)(B) .

DR
AF

Como que (f2 , 2 ) e erg


odico e, consequentemente, (f, ) tambem e, conclumos
que
n1
2
1 X
lim
(f j (A) B) (A)(B) = 0
n n
j=0
para quaisquer conjuntos mensur
aveis A, B M . Usando o Exerccio 6.12,
obtemos que (f, ) e fracamente misturador.

6.1.3

Caracteriza
c
ao espectral

Nesta seca
o discutimos formulaco
es equivalentes das noco
es de sistema misturador e fracamente misturador, em termos do operador de Koopman.
Proposi
c
ao 6.12. As seguintes condico
es s
ao equivalentes:
(a) (f, ) e misturador.

(b) Cn (, ) 0 para quaisquer Lp () e Lq () com p, q [1, ] e


1/p + 1/q = 1.

(c) A condica
o do item (b) vale em algum subconjunto denso de L p () e algum
subconjunto denso de Lq ().

Demonstraca
o. A condica
o (a) e o caso particular de (b) para funco
es caractersticas. Como as funco
es
Z
Z
Z
(, ) 7 ( f n ) d d d

s
ao bilineares, a condica
o (a) implica que Cn (, ) 0 para quaisquer funco
es
simples e . Isto implica (c), uma vez que as funco
es simples formam um
subconjunto denso de Lr () para qualquer r 1.
Para mostrar que (c) implica (b), comecemos por observar que as correlac
oes
Cn (, ) s
ao funco
es equicontnuas de e . De fato, dadas 1 , 2 Lp () e
1 , 2 Lq (), as desigualdade de H
older (Teorema 0.49) d
a que
Z
Z


(1 f n )1 d (2 f n )2 d k1 2 kp k1 kq + k2 kp k1 2 kq .
Alem disso,
Z
Z
Z
Z


1 d 1 d 2 d 2 d k1 2 k1 k1 k1 + k2 k1 k1 2 k1 .


CAPITULO 6. CORRELAC
OES

168

Somando estas desigualdades, e notando que k k1 k kr para todo r 1,


obtemos que:


Cn (1 , 1 ) Cn (2 , 2 ) 2k1 2 kp k1 kq + 2k2 kp k1 2 kq (6.3)
para todo n 1. Ent
ao, dado > 0 e dados quaisquer Lp () e Lq (),
0
podemos tomar e 0 nos subconjuntos densos da mencionados na hip
otese
tais que
k 0 kp < e k 0 kq < .

DR
AF

Em particular, k0 kp < kkp + e k 0 kq < kkq + . Ent


ao, (6.3) d
a que
Cn (, ) Cn (0 , 0 ) + 2(kkp + kkq + 2) para todo n.

Alem disso, por hip


otese, temos Cn (0 , 0 ) < para todo n suficientemente
grande. Como e arbitr
ario, estas duas desigualdades implicam que Cn (, )
converge para zero quando n . Isto prova a propriedade (b).
O mesmo argumento prova a vers
ao da Proposica
o 6.12 para a propriedade
de mistura fraca:
Proposi
c
ao 6.13. As seguintes condico
es s
ao equivalentes:

(a) (f, ) e fracamente misturador.


P
(b) limn n1 nj=1 Cj (, ) 0 para quaisquer Lp () e Lq () com
p, q [1, ] e 1/p + 1/q = 1.
(c) A condica
o do item (b) vale em algum subconjunto denso de L p () e algum
subconjunto denso de Lq ().

No caso p = q = 2, podemos expressar as correlaco


es em termos do produto
interno no espaco de Hilbert L2 ():


Cn (, ) = Ufn ( 1) para todo , L2 ().

Portanto, a Proposica
o 6.12 d
a que (f, ) e misturador se, e somente se,
 n

lim Uf ( 1) = 0 para todo , L2 ()
(6.4)
n

e a Proposica
o 6.13 d
a que (f, ) e fracamente misturador se, e somente se,
n


1 X  j
lim
Uf ( 1) = 0 para todo , L2 ().
n n
j=1

(6.5)

R
A condica
o (6.4) significa que Ufn converge fracamente para 1 = d,
enquanto que (6.5) e uma vers
ao Cesaro dessa afirmaca
o. Compare as duas
condico
es com a caracterizaca
o da ergodicidade em (4.7).

169

6.2. DESLOCAMENTOS DE MARKOV

Deslocamentos de Markov

6.2

DR
AF

Nesta seca
o introduzimos uma importante classe de sistemas, que generaliza
a classe de deslocamentos de Bernoulli. Como vimos anteriormente, deslocamentos de Bernoulli modelam sequencias de experimentos identicos em que o
resultado de cada experimento e independente dos demais. Na definica
o dos
deslocamentos de Markov abandonamos essa condica
o de independencia, mas
supomos que cada resultado depende apenas dos resultado imediatamente anterior. De fato, como comentaremos na Seca
o 6.3.3, deslocamentos de Markov
podem ser usados para modelar os processos com mem
oria finita, isto e, tais que
existe k 1 tal que cada resultado depende apenas dos k resultados anteriores.
Para definir um deslocamento de Markov, consideremos um espaco mensur
avel (X, A) e seja M = X N (ou M = X Z ) o espaco das sequencias em X,
munido da -
algebra produto. Consideraremos o deslocamento

f : M M, f (xn )n = (xn+1 )n .

Suponha que e dada uma famlia {P (x, ) : x X} de probabilidades em X,


chamadas probabilidades de transica
o, dependendo mensuravelmente do ponto
x. Heuristicamente, dado um conjunto mensur
avel E X, o n
umero P (x, E)
representa a probabilidade de xn+1 E sabendo que xn = x. Uma probabilidade p em X e chamada medida estacion
aria, relativamente a
` famlia de
probabilidades de transica
o, se ela satisfaz
Z
P (x, E) dp(x) = p(E), para todo conjunto mensur
avel E X.
(6.6)
Heuristicamente, isto significa que, relativamente a p, a probabilidade de xn+1
E e igual a
` probabilidade de xn E.
Fixe uma medida estacion
aria p qualquer (supondo que exista) e ent
ao defina

[m; Am , . . . , An ] =
Z
Z
Z
(6.7)
=
dp(xm )
dP (xm , xm+1 )
dP (xn1 , xn )
Am

Am+1

An

para todo cilindro [m; Am , . . . , An ] de M . Pode mostrar-se (veja o Exerccio ??)


que esta funca
o se estende a uma probabilidade na -
algebra gerado pelos cilindros. Esta probabilidade e invariante pelo deslocamento f , uma vez que o
lado direito de (6.7) n
ao depende de m. Toda probabilidade obtida desta
forma e chamada medida de Markov ; alem disso o sistema (f, ) e chamado
deslocamento de Markov.

Exemplo 6.14. (medida de Bernoulli) Suponha que P (x, ) n


ao depende de x,
ou seja, existe uma probabilidade em X tal que P (x, ) = para todo x X.
Ent
ao
Z
Z
P (x, E) dp(x) =

(E) dp(x) = (E)


CAPITULO 6. CORRELAC
OES

170

para toda probabilidade p e todo conjunto mensur


avel E X. Portanto, existe
exatamente uma medida estacion
aria, a saber p = . A definica
o (6.7) d
a
Z
Z
Z

[m; Am , . . . , An ] =
d(xm )
d(xm+1 )
d(xn )
Am

Am+1

An

= (Am )(Am+1 ) (An ).

DR
AF

Exemplo 6.15. Suponha que o conjunto X e finito, digamos X = {1, . . . , d}


para algum d 2. Qualquer famlia de probabilidades de transica
o P (x, ) em
X fica completamente caracterizada pelos valores
Pi,j = P (i, {j}),

1 i, j d.

(6.8)

Alem disso, uma medida p em X fica completamente caracterizada pelos valores


pi = p({i}), 1 i d. Com esta notaca
o, a defini c
ao (6.6) traduz-se por
d
X
i=1

pi Pi,j = pj ,

para todo 1 j d.

Alem disso, a medida de Markov fica dada por



[m; am , . . . , an ] = pam Pam ,am+1 Pan1 ,an .

(6.9)

(6.10)

Na sequencia iremos nos restringir a deslocamentos de Markov finitos, ou


seja, ao contexto do Exemplo 6.15. Consideramos o conjunto X munido da
topologia discreta e da respectiva -
algebra de Borel. Observe que a matriz
P = (Pi,j )1i,jd

definida por (6.8) satisfaz as seguintes condico


es:
(i) Pi,j 0 para todo 1 i j;
Pd
(ii)
j=1 Pi,j = 1 para todo 1 i d.

Dizemos que P e uma matriz estoc


astica. Reciprocamente, qualquer matriz
satisfazendo (i) e (ii) define uma famlia de probabilidades de transica
o no conjunto X. Observe tambem que, denotando p = (p1 , . . . , pd ), a relaca
o (6.9)
corresponde a
P p = p,
(6.11)

onde P representa a transposta da matriz P . Em outras palavras, as medidas


estacion
arias correspondem precisamente aos autovetores da matriz transposta
para o autovalor 1. O seguinte resultado cl
assico permite mostrar que tais
autovalores sempre existem:

Teorema 6.16 (Perron-Fr


obenius). Seja A uma matriz d d com entradas
n
ao-negativas. Ent
ao existe 0 e existe algum vetor v 6= 0 com entradas
n
ao-negativas tal que Av = v e || para todo autovalor de A.

171

6.2. DESLOCAMENTOS DE MARKOV

Se A admite alguma potencia cujas entradas s


ao positivas ent
ao > 0 e
existe algum autovetor v com entradas postivas. De fato, > || para qualquer
outro autovalor de A. Alem disso, o autovalor tem multiplicidade 1 e e o
u
nico autovalor de A que admite algum autovetor com entradas n
ao-negativas.

Uma demonstraca
o do teorema de Perron-Fr
obenius pode ser encontrada no
livro de Meyers [Mey00], por exemplo. Aplicando este teorema a
` matriz A = P ,
conclumos que existem 0 e p 6= 0 com pi 0 para todo i, tais que
d
X

pi Pi,j = pj ,

para todo 1 j d.

DR
AF

i=1

Somando sobre i = 1, . . . , d obtemos que


d X
d
X

pi Pi,j =

j=1 i=1

d
X

pj .

j=1

Usando a propriedade (ii) da matriz estoc


astica, o lado esquerdo desta igualdade
pode ser escrito como
d
d
d
X
X
X
pi
Pi,j =
pi .
i=1

j=1

i=1

Comparando as duas u
ltimas igualdades, e lembrando que a soma das entradas
de p e um n
umero postivo, conclumos que = 1. Isto prova a nossa afirmaca
o
de que sempre existem vetores p 6= 0 satisfazendo (6.11).
Quando P n tem entradas positivas para algum n 1, segue do Teorema 6.16
que o autovetor e u
nico, a menos de produto por um escalar, e pode ser escolhido
com entradas positivas.

Exemplo 6.17. Em geral, p n


ao e u
nico e tambem pode n
ao existir nenhum
autovalor com entradas positivas. Por exemplo, considere:

1a
a
0
0
0
b
1b
0
0
0

0
0
1

c
c
0
P =

0
0
d
1d
0
e
0
0
0
1e

onde a, b, c, d, e (0, 1). Um vetor p = (p1 , p2 , p3 , p4 , p5 ) satisfaz P p = p se,


e somente se, ap1 = bp2 e cp3 = dp4 e p5 = 0. Portanto, o autoespaco tem
dimens
ao 2 e nenhum autovetor tem entradas positivas.

Por outro lado, suponha que p e tal que pi = 0 para algum i e seja a
respectiva medida de Markov. Seja Mi = (X \ {i})N (ou Mi = (X \ {i})Z).
Ent
ao (Mi ) = 1, uma vez que ([n; i]) = pi = 0 para todo n. Isto significa que
podemos eliminar o smbolo i, obtendo um sistema equivalente ao original. Portanto, a menos de remover um certo n
umero de smbolos superfluos do conjunto
X, sempre podemos considerar que o autovetor p tem entradas positivas.


CAPITULO 6. CORRELAC
OES

172

Dizemos que uma sequencia (xn )n M e P -admissvel se ela satisfaz


Pxn ,xn+1 > 0 para todo n.

(6.12)

Em outras palavras, todas as transico


es determinadas por x s
ao permitidas por
P . Denotamos por MP o conjunto das sequencias admissveis. Os subconjuntos
de M desta forma costumam ser chamados subshifts de tipo finito.

DR
AF

Lema 6.18. O subconjunto MP e fechado (logo, compacto) e e invariante pelo


deslocamento f . Alem disso, se p e uma soluca
o de P p = p com entradas
positivas e e a correspondente medida de Markov, ent
ao supp = M P .

Demonstraca
o.

Exemplo 6.19. Na situaca


o do Exemplo 6.17 h
a tres possibilidades para o
suporte de uma medida de Markov. Se p = (p1 , p2 , 0, 0, 0) com p1 , p2 > 0 ent
ao
podemos eliminar os smbolos 3, 4, 5. Todas as sequencias nos smbolos 1, 2 s
ao
admissveis. Logo supp = {1, 2}N . Analogamente, se p = (0, 0, p3 , p4 , 0) com
p3 , p4 > 0 ent
ao supp = {3, 4}N. Nos demais casos, p = (p1 , p2 , p3 , p4 , 0) com
p1 , p2 , p3 , p4 > 0. Eliminando o smbolo 5, temos que o conjunto das sequencias
admissveis e
MP = {1, 2}N {3, 4}N.

Ambos os conjuntos nesta uni


ao tem medida positiva. Portanto, neste caso
o deslocamento de Markov (f, ) n
ao e erg
odico. Mas segue da teoria que
apresentaremos na pr
oxima seca
o que nos dois primeiros casos o sistema (f, )
e erg
odico.
No pr
oximo lema colecionamos algumas propriedades simples de matrizes
estoc
asticas que ser
ao u
teis a seguir:
Lema 6.20. Seja P uma matriz estoc
astica e seja p = (p1 , . . . , pd ) uma soluca
o
n
de P p = p. Para cada n 0, denote por Pi,j
, 1 i, j d as entradas da
matriz P n . Ent
ao:
Pd
n
(a)
j=1 Pi,j = 1 para todo 1 i d e todo n 1;
(b)

Pd

i=1

n
pi Pi,j
= pj para todo 1 j d e todo n 1;

(c) o hiperplano H = {(h1 , . . . , hd ) : h1 + + hd = 0} e invariante por P .

Demonstraca
o. A condica
o (ii) na definica
o de matriz estoc
astica pode ser escrita como P u = u, onde u = (1, . . . , 1). Ent
ao P n u = u para todo n 1. Isto
e apenas outra maneira de escrever o item (a). Analogamente, P p = p implica
que (P )n p = p para todo n 1, o que e outra maneira de escrever o item (b).
Observe que H e o complemento ortogonal do vetor u. Como u e invariante por
P , segue que H e invariante pela matriz transposta P .

6.2.1

Ergodicidade

173

6.2. DESLOCAMENTOS DE MARKOV

Nesta seca
o sempre suporemos que p = (p1 , . . . , pd ) e uma P
soluca
o de P p = p
com pi > 0 para todo i, normalizada de tal forma que
i pi = 1. Seja
a respectiva medida de Markov. Queremos entender que condico
es a matriz
estoc
astica P deve satisfazer para que (f, ) seja erg
odico.
Dizemos que a matriz estoc
astica P e irredutvel se para todo 1 i, j d
n
existe n 0 tal que Pi,j
> 0. Em outras palavras, P e irredutvel se for possvel
passar de qualquer resultado i a qualquer resultado j num certo n
umero n de
passos (que depende de i e j).

DR
AF

Teorema 6.21. O deslocamento de Markov (f, ) e erg


odico se, e somente se,
a matriz P e irredutvel.

O restante da presente seca


o e dedicado a
` prova deste teorema. Comecamos
por provar a seguinte estimativa u
til:

Lema 6.22. Sejam A = [m; am , . . . , aq ] e B = [r; br , . . . , bs ] cilindros de M com


r > q. Ent
ao:
Parq
,b
(A B) = (A)(B) q r .
p br
Demonstraca
o. Podemos escrever A B como uma uni
ao disjunta
[
AB =
[m; am , . . . , aq , xn+1 , . . . , xr1 , br , . . . , bs ],
x

sobre todos os x = (xn+1 , . . . , xr1 ) X rn1 . Ent


ao,
X
(A B) =
pam Pam ,am+1 Paq1 ,aq Paq ,xn+1 . . . Pxr1 ,br Pbr ,br+1 Pbs1 ,bs
x

= (A)

Paq ,xn+1 . . . Pxr1 ,br

1
(B).
p br

A soma nesta u
ltima express
ao e igual a Parq
. Portanto,
q ,br
(A B) = (A)(B)Parq
/pbr ,
q ,br

tal como afirmado.

Lema 6.23. Uma matriz estoc


astica P e irredutvel se, e somente se,
lim
n

n1
1X l
Pi,j = pj
n
l=0

para todo 1 i, j d.

(6.13)

Demonstraca
o. Suponha que vale (6.13). Lembre que pj > 0 para todo j.
l
Ent
ao, dados quaisquer 1 i, j d, tem-se Pi,j
> 0 para infinitos valores de l.
Em particular, P e irredutvel.


CAPITULO 6. CORRELAC
OES

174

Para provar a recproca, considere A = [0; i] e B = [1; j]. Pelo Lema 6.22:
n1
n1
1X
1
1X l
(A f l (B)) = (A)(B)
Pi,j .
n
pj
n
l=0

l=0

De acordo com o Exerccio 4.5, o lado esquerdo desta igualdade converge quando
n . Portanto,
n1
1X l
Pi,j
Qi,j = lim
n n
l=0

DR
AF

existe para todo 1 i, j d. Considere a matriz Q = (Qi,j )i,j , ou seja,


Q = lim
n

n1
1X l
P .
n

(6.14)

l=0

Usando o Lema 6.20(b) e passando ao limite quando n , obtemos que


d
X

pi Qi,j = pj

i=1

para todo 1 j d.

(6.15)

Observe tambem que, dado qualquer k 1,


P k Q = lim
n

n1
n1
1 X k+l
1X l
P
P = Q.
= lim
n n
n
l=0

(6.16)

l=0

Segue que Qi,j n


ao depende de i. De fato, suponha que existem r e s tais que
Qr,j < Qs,j . Claro que podemos escolher s de modo que o lado direito desta
desigualdade tenha o valor m
aximo possvel. Como P e irredutvel, temos que
k
existe k tal que Ps,r
> 0. Logo, usando (6.16) seguido do Lema 6.20(a),
Qs,j =

d
X

k
Ps,i
Qi,j < (

i=1

d
X

k
Ps,i
)Qs,j = Qs,j ,

i=1

o que e uma contradica


o. Portanto Qi,j n
ao depende de i. Seja Qj = Qi,j para
qualquer i. A propriedade (6.15) d
a que
pj =

d
X

Qi,j pi = Qj (

i=1

d
X

pi ) = Q j ,

i=1

para todo j. Isto termina a prova do lema.

Demonstraca
o do Teorema 6.21. Suponhamos que e erg
odica. Seja A = [0; i]
e B = [1; j]. Pela Proposica
o 4.4,
lim
n

n1
1X
(A f l (B)) = (A)(B) = pi pj .
n
l=0

(6.17)

175

6.2. DESLOCAMENTOS DE MARKOV

l
Por outro lado, pelo Lema 6.22, temos que (Af l (B)) = pi Pi,j
. Substituindo
em (6.17) e cancelando pi em ambos os lados,

lim
n

n1
1X l
Pi,j = pj .
n
l=0

Note que j e arbitr


ario. Portanto, pelo Lema 6.23, isto prova que P e irredutvel.
Agora suponhamos que a matriz P e irredutvel. Queremos concluir que
e erg
odica. De acordo com o Corol
ario 4.5, basta provar que
n1
1X
(A f l (B)) = (A)(B)
n

DR
AF
lim
n

(6.18)

l=0

para quaisquer A e B na a
lgebra gerada pelos cilindros. Como os elementos desta
a
lgebra s
ao as uni
oes finitas disjuntas de cilindros, e suficiente considerar o caso
em que A e B s
ao cilindros, digamos A = [m; am , . . . , aq ] e B = [r; br , . . . , bs ].
Observe tambem que a validade de (6.18) n
ao muda se substituirmos B por
alguma pre-imagem f j (B). Portanto, n
ao e restrica
o supormos que r > q.
Ent
ao, pelo Lema 6.22,
n1
n1
1X
1 1 X rq+l
(A f l (B)) = (A)(B)
Paq ,br
n
p br n
l=0

l=0

para todo n. Pelo Lema 6.23,


lim
n

n1
n1
1X l
1 X rq+l
Paq ,br = lim
Paq ,br = pbr .
n n
n
l=0

l=0

Isto prova a propriedade (6.18) para os cilindros A e B.

6.2.2

Mistura

Nesta seca
o caracterizamos os deslocamentos de Markov misturadores, em termos da respectiva matriz estoc
astica P . Continuamos supondo que p e uma
soluca
o normalizada de P p = p com entradas positivas e que e a respectiva
medida de Markov.
n
Dizemos que a matriz estoc
astica P e aperi
odica se existe n 1 tal que P i,j
>
0 para todo 1 i, j d. Em outras palavras, P e aperi
odica se tem alguma
potencia P n com entradas positivas. A relaca
o entre as noco
es de aperiodicidade
e irreducibilidade e analisada no Exerccio 6.11.
Teorema 6.24. O deslocamento de Markov (f, ) e misturador se, e somente
se, a matriz P e aperi
odica.
Para a demonstraca
o do Teorema 6.24 precisamos do seguinte fato:


CAPITULO 6. CORRELAC
OES

176

Lema 6.25. Uma matriz estoc


astica P e aperi
odica se, e somente se,
l
lim Pi,j
= pj
l

para todo 1 i, j d.

(6.19)

DR
AF

Demonstraca
o. Como pj > 0 para todo j, por hip
otese, e claro que (6.19)
l
implica que Pi,j
> 0 para todo i, j e todo l suficientemente grande.
Agora suponha que P e aperi
odica. Ent
ao podemos aplicar o teorema de
Perron-Frobenius (Teorema 6.16) a
` matriz A = P . Como p e autovetor de A
com entradas positivas, obtemos que = 1 e todos os demais autovalores de A
s
ao menores que 1 em valor absoluto. Pelo Lema 6.20(c), o hiperplano H dos
claro que
vetores (h1 , . . . , hd ) tais que h1 + + hd = 0 e invariante por A. E
H e transversal a
` direca
o de p. Ent
ao a decomposica
o
Rd = Rp H

(6.20)

e invariante por A e a restrica


o de A ao hiperplano H e uma contraca
o, no
sentido de que o seu raio espectral e menor que 1. Segue deste fato que a
sequencia (Al )l converge para a projeca
o na primeira coordenada de (6.20), ou
seja, para a matriz B caracterizada por Bp = p e Bh = 0 para todo h H. Em
outras palavras, (P l )l converge para B . Observe que
Bi,j = pi

para todo 1 i, j d.

l
Portanto, limn Pi,j
= Bj,i = pj para todo i, j.

Demonstraca
o do Teorema 6.24. Suponhamos que a medida e misturadora.
l
Seja A = [0; i] e B = [1; j]. Pelo Lema 6.22, temos que (A f l (B)) = pi Pi,j
para todo l. Portanto,
l
pi lim Pi,j
= lim (A f l (B)) = (A)(B) = pi pj .
l

l
Cancelando pi em ambos os lados, obtemos que liml Pi,j
= pj . De acordo com
o Lema 6.25, isto prova que P e aperi
odica.
Agora suponhamos que a matriz P e aperi
odica. Queremos concluir que
e misturadora. De acordo com o Lema 6.2, basta provar que

lim (A f l (B)) = (A)(B)


l

(6.21)

para quaisquer A e B na a
lgebra gerada pelos cilindros. Uma vez que os elementos desta a
lgebra s
ao as uni
oes finitas disjuntas de cilindros, bastar tratar o caso
em que A e B s
ao cilindros, digamos A = [m; am , . . . , aq ] e B = [r; br , . . . , bs ].
Pelo Lema 6.22,
(A f l (B)) = (A)(B)

1 rq+l
P
pbr aq ,br

para todo l > q r. Ent


ao, usando o Lema 6.25,

1
lim P rq+l
pbr l aq ,br
1
= (A)(B)
lim P l
= (A)(B)
pbr l aq ,br

lim (A f l (B)) = (A)(B)


l

177

6.3. OUTROS EXEMPLOS

Isto prova a propriedade (6.21) para os cilindros A e B.

Exemplo 6.26. No Exemplo 6.17 obtivemos diversos tipos de medidas de Markov, dependendo da escolha do autovetor p. No primeiro, p = (p1 , p2 , 0, 0, 0) e a
medida est
a suportada em {1, 2}N. Uma vez removidos os smbolos superfluos
3, 4, 5, a matriz estoc
astica se reduz a


1a
a
P =
.
b
1b

DR
AF

Como esta matriz e irredutvel, a medida de Markov e misturadora. O segundo


tipo e inteiramente an
alogo. No terceiro caso p = (p1 , p2 , p3 , p4 , 0) e, removido
o smbolo superfluo 5, a matriz estoc
astica se reduz a

1a
a
0
0
b
1b
0
0
.
P =
0
0
1c
c
0
0
d
1d
Esta matriz n
ao e irredutvel e, portanto, as medidas de Markov que se obtem
neste caso n
ao s
ao erg
odicas (lembre tambem do Exemplo 6.19).

Exemplo 6.27. N
ao e difcil dar exemplos de matrizes irredutveis que n
ao s
ao
aperi
odicas:

0 1/2 0 1/2
1/2 0
1/2 0

P =
0 1/2 0 1/2 .
1/2 0
1/2 0

n
De fato Pi,j
> 0 se, e somente se, n tem a mesma paridade que i j. Note que

1/2 0 1/2 0
0 1/2 0 1/2

P2 =
1/2 0 1/2 0 .
0 1/2 0 1/2

O Exerccio 6.11 mostra que toda matriz irredutvel tem uma forma deste tipo.

6.3

6.3.1

Outros exemplos

Endomorfismos de Tn

Seja a medida de Haar em Td e fA : Td Td um endomorfismo sobrejetivo.

Teorema 6.28. O sistema (fA , m) e erg


odico se, e somente se, nenhum autovalor da matriz A e raiz da unidade.


CAPITULO 6. CORRELAC
OES

178

Interc
ambios de intervalos

DR
AF

6.3.2

Juntando este resultado com o Teorema 4.20 vemos que (fA , ) e misturador
se, e somente se, e erg
odico. A parte somente se do Teorema 6.28 e uma consequencia imediata do Teorema 4.20. Quanto a
` recproca, vamos provar apenas
no caso particular em que A e hiperb
olica (lembre da Seca
o 4.2.6). O leitor
interessado pode encontrar a prova do caso geral, bem como extens
oes destes
teoremas para endomorfismos de grupos compactos, nos livros de Petersen [?] e
Einsiedler, Ward [?].
??

Foi demonstrado por Katok [Kat80] que interc


ambios de intervalo nunca s
ao
misturadores:

Teorema 6.29. Seja f : [0, 1) [0, 1) um interc


ambio de intervalos e seja
uma probabilidade invariante. Ent
ao (f, ) n
ao e misturador.

claro que podemos supor que e erg


Demonstraca
o. E
odica, pois caso contr
ario
a conclus
ao e o
bvia. Se tem algum a
tomo ent
ao ela est
a suportada numa
o
rbita peri
odica e, portanto, n
ao e misturadora. Logo, podemos supor que e
n
ao at
omica. Denote por m a medida de Lebesgue no intervalo e considere a
aplicaca
o
h : [0, 1) [0, 1), h(x) = ([0, x]).

Ent
ao h e um homeomorfismo tal que h = m. Consequentemente, a aplicaca
o
g = h f h1 : [0, 1) [0, 1) tem um n
umero finito de pontos de descontinuidade e preserva a medida de Lebesgue. Em particular, a restrica
o de g a
cada intervalo de continuidade e uma translaca
o. Portanto, g tambem e um in claro que (f, ) e misturador se, e somente se, (g, m)
terc
ambio de intervalos. E
e misturador. Portanto, para provar o Teorema 6.29 n
ao e restrica
o supor que
e a medida de Lebesgue m. Faremos isso de ora em diante.
Nosso objetivo e achar um conjunto mensur
avel X tal que m(X f n (X))
2
n
ao converge para m(X) quando n . Seja d = #A.
Lema 6.30. Todo intervalo J = [a, b) contido em algum I admite uma partica
o
{J1 , . . . , Js } em n
ao mais que d + 2 subintervalos da forma Ji = [ai , bi ) e admite
n
umeros naturais t1 , . . . , ts 1 tais que
(a) f n (Ji ) J = para todo 0 < n < ti e 1 i s;
(b) f ti | Ji e uma translaca
o para todo 1 i s;
(c) {f t1 (J1 ), . . . , f ts (Js )} e uma partica
o de J;

(d) os intervalos f n (Ji ), 1 i s, 0 n < ti s


ao disjuntos dois-a-dois;
(e)

n=0

f n (J) =

Ss

i=1

Sti 1
n=0

f n (Ji ).

179

6.3. OUTROS EXEMPLOS

Demonstraca
o. Seja B o conjunto formado pelos pontos extremos a, b de J
juntamente com os pontos I , A excetuada a origem. Ent
ao #B d + 1.
Seja BJ J o conjunto dos pontos x J para os quais existe m 1 tal que
f m (x) B e f n (x)
/ J para todo 0 < n < m. O fato de que f e injetiva,
juntamente com a definica
o de m, implica que a aplicaca
o
BJ B,

x 7 f m (x)

DR
AF

e injetiva. Em particular, #BJ #B. Considere a partica


o de J em subintervalos Ji = [ai , bi ) com extremos ai , bi no conjunto BJ {a, b}. Esta partica
o
tem no m
aximo d + 2 elementos. Pelo teorema de recorrencia de Poincare, para
cada i existe ti 1 tal que f ti (Ji ) intersecta J. Tome ti mnimo com esta
propriedade. O item (a) do lema e uma consequencia imediata. Pela definica
o
de BJ , a restrica
o de f ti ao itervalo Ji e uma translaca
o, tal como afirmado no
item (b), e a sua imagem est
a contida em J. Alem disso, as imagens f ti (Ji ),
1 i s s
ao disjuntas duas-a-duas, uma vez que f e injetiva e os ti s
ao os
tempos de primeiro retorno a J. Em particular,
s
X

m(f ti (Ji )) =

i=1

s
X

m(Ji ) = m(J)

i=1

e portanto si=1 f ti (Ji ) = J. Isto prova o item (c). O item (d) tambem segue
diretamente do fato de que f e injetiva e os ti s
ao os tempos de primeiro retorno
a J. Finalmente, o item (e) e uma consequencia direta do item (c).

Considere um intervalo J qualquer contido em algum I . Por ergodicidade,


n
o conjunto invariante
n=0 f (J) tem medida total. Pelo item (e) do Lema ??,
este conjunto e uma uni
ao finita de intervalos fechados a
` esquerda e abertos a
`
direita. Portanto,

s t[
i 1
[
[
f n (J) =
f n (Ji ) = I
n=0

i=1 n=0

Logo, pelo item (d) do lema, a famlia PJ = {f n (Ji ) : 1 i s e 0 n < ti } e


uma partica
o de I.
Lema 6.31. Dados > 0 e N 1 podemos escolher o intervalo J de tal forma
que diam PJ < e ti N para todo i.

claro que diam f n (Ji ) = diam Ji diam J para todo i e todo


Demonstraca
o. E
n. Logo, diam PJ < desde que escolhamos J com di
ametro menor que . Para
obter a segunda propriedade no enunciado, tome qualquer ponto x I tal que
f n (x) 6= I para todo 0 n < N e todo A. Afirmamos que f n (x) 6= x
para todo 0 < n < N . Caso contr
ario, como f n e uma translaca
o na vizinhanca
de x, teramos f n (y) = y para todo ponto y nessa vizinhanca, contradizendo a
hip
otese de que (f, m) e erg
odica. Isto prova a nossa afirmaca
o. Agora basta
tomar J = [x, x + ) com < min0<n<N d(x, f n (x)) para garantir que ti N
para todo i.


CAPITULO 6. CORRELAC
OES

180

Lema 6.32. Para cada 1 i s existe si d + 2 e existem n


umeros naturais
{ti,1 , . . . , ti,si } tais que ti,j ti e, dado qualquer conjunto A na a
lgebra AJ
gerada por PJ , existe ti,j tal que
m(A f ti,j (A))

1
m(A).
(d + 2)2

(6.22)

DR
AF

Demonstraca
o. Aplicando o Lema 6.30 a cada um dos intervalos Ji , 1 i s
obtemos si d + 2, uma partica
o {Ji,j : 1 j si } do intervalo Ji e n
umeros
naturais ti,j tais que cada ti,j e o tempo de primeiro retorno dos pontos de Ji,j
claro que ti,j ti , j
a Ji . E
a que ti e o tempo de primeiro retorno de qualquer
ponto de Ji ao intervalo J. O fato de que Ji,j f ti,j (Ji ) implica que
f n (Ji ) =

si
[

j=1

f n (Ji,j )

si
[

f ti,j (f n (Ji ))

j=1

para todo n 0.

Como a a
lgebra AJ est
a formada pelas uni
oes disjuntas finitas dos intervalos
f n (Ji ), 0 n < ti , segue que
A

s [
si
[

f ti,j (A)

i=1 j=1

para todo A AJ .

Ps Psi
Em particular, m(A) i=1 j=1
m(A f ti,j (A)). Lembrando que s d + 2
e si d + 2 para todo i, isto implica (6.22).

Estamos prontos para concluir a prova do Teorema 6.29. Para isso, fixemos
um conjunto mensur
avel X [0, 1) com
0 < m(X) <

1
.
4(d + 2)2

Pelo Lema 6.31, dado qualquer N 1 podemos encontrar um intervalo J [0, 1)


tal que todos os tempos de retorno ti N e existe algum A AJ tal que
1
m(X)2 .
4
Aplicando o Lema 6.32, obtemos que existe ti,j ti N tal que:
m(XA) <

(6.23)

m(X f tij (X)) m(A f tij (A)) 2m(XA)


1
1

m(A) m(X)2
(d + 2)2
2

A relaca
o (6.23) implica que m(A) (3/4)m(X). Portanto,

3
1
1
m(X) m(X)2
4 (d + 2)2
2
1
3m(X)2 m(X)2 2m(X)2
2
Isto prova que lim supn m(X f n (X)) 2m(X)2 e, portanto, o sistema (f, m)
n
ao e misturador.
m(X f tij (X))


6.4. DECAIMENTO DE CORRELAC
OES

??

6.4

Processos com mem


oria finita

6.3.3

181

Decaimento de correla
co
es

DR
AF

Nesta seca
o discutimos a velocidade de decaimento das sequencias de correlaco
es
Cn (, ), num sistema misturador. N
ao e realista esperar estimativas interessantes que valham para funco
es arbitr
arias. Mas, como veremos, tais estimativas
existem em muitos casos importantes, se restringirmos , a subconjuntos adequados de funco
es. Dado que as correlaco
es (, ) 7 Cn (, ) s
ao funco
es
bilineares, e natural considerar subconjuntos que s
ao subespacos vetoriais.
Dizemos que (f, ) tem decaimento exponencial de correlaco
es num dado
espaco vetorial V se existe < 1 e para todo , V existe A(, ) > 0 tal
que
Cn (, ) A(, )n para todo n 1.
(6.24)

Temos noco
es similares em que a exponencial n e substituda por qualquer
outra sequencia convergindo para zero.
Para ilustrar a teoria vamos analisar estas quest
oes no contexto dos deslocamentos de Markov unilaterais. Isso nos permitir
a introduzir diversas ideias que
ser
ao utilizadas posteriormente (especialmente no Captulo ??) em situaco
es
muito mais gerais.
Seja f : M M o deslocamento em M = X N , onde X = {1, . . . , d} e
um conjunto finito. Seja P = (Pi,j )i,j uma matriz estoc
astica aperi
odica e seja
p = (pi )i o autovetor positivo de P , normalizado por p1 + + pd = 1. Seja
a medida de Markov definida em M por (6.7).
Considere L = G1 P G, onde G e a matriz diagonal cujas entradas s
ao
p1 , . . . , pd . As entradas de L s
ao dadas por:
pj
Li,j = Pj,i para cada 1 i, j d.
pi
Lembre que denotamos u = (1, . . . , 1) e H = {(h1 , . . . , hd ) : h1 + + hd = 0}.
Seja
V = {(v1 , . . . , vd ) : p1 v1 + + pd vd = 0}.
Ent
ao G(u) = p e G(V ) = H. Lembrando (6.20), segue que a decomposica
o
Rd = Ru V

(6.25)

e invariante por L e todos os autovalores da restrica


o de L a V s
ao menores que
1 em valor absoluto. Dizemos que o opeador L tem lacuna espectral : o maior
autovalor e simples e o restante do espectro est
a contido num disco fechado com
raio estritamente menor.
Chamamos operador de transferencia a
` aplicaca
o linear L que a cada funca
o
: M R associa a funca
o L : M R definida por
L(x1 , . . . , xn , . . . , ) =

d
X

x0 =1

Lx1 ,x0 (x0 , x1 , . . . , xn , . . . ).

(6.26)


CAPITULO 6. CORRELAC
OES

182

Este operador e dual do operador de Koopman Uf , no seguinte sentido:


Z
Z
(L) d = (Uf ) d
(6.27)

DR
AF

para quaisquer funco


es mensur
aveis limitadas , . Para provar este fato basta
considerar o caso em que e s
ao funco
es localmente constantes, isto e, funco
es
que dependem apenas de um n
umero finito de coordenadas. Isto e porque toda
funca
o mensur
avel limitada e limite uniforme de alguma sequencia de funco
es
localmente constantes. Ent
ao, considere funco
es e que dependem apenas
das primeiras n coordenadas. Pela definica
o da medida de Markov,
Z
X
(L) d =
pa1 Pa1 ,a2 Pan1 ,an (a1 , . . . , an )L(a1 , . . . , an ).
a1 ,...,an

Usando a definica
o do operador de transferencia, o lado direito desta express
ao
e igual a
X
pa0 Pa0 ,a1 Pa1 ,a2 Pan1 ,an (a1 , . . . , an )(a0 , a1 , . . . , an ).
a0 ,a1 ,...,an

Observe que (a1 , . . . , an ) = Uf (a0 , a1 , . . . , an ). Portanto, usando


R mais uma
vez a definica
o da medida de Markov, esta u
tima express
ao e igual a (Uf ) d.
Isto prova a propriedade de dualidade (6.27).
Como consequencia, podemos escrever a sequencia de correlaco
es em termos
dos iterados do operador de transferencia:
Z
Z
Z
Z
Z



n
n



Cn (, ) =
(Uf ) d d =
L d d . (6.28)

P
A propriedade Lu = u significa que j Li,j = 1 para todo j. Isto tem a seguinte
consequencia u
til:
sup |L| sup || para todo .
(6.29)

Tomando 1 em (6.27) obtemos o seguinte caso particular, que tambem ser


a
u
til a seguir:
Z
Z
L d =

d para todo .

(6.30)

Agora denotemos por E0 o conjunto das funco


es que dependem apenas da
primeira coordenada. A aplicaca
o 7 ((1), . . . , (d)) e um isomorfismo entre
E0 e o espaco euclideano Rd . Alem disso, a definica
o
L(x1 ) =

d
X

Lx1 ,x0 (x0 )

x0 =1

mostra que a restrica


o do operador de transferencia a E0 corresponde precisamente ao operador L : Rd Rd . Alem disso, o hiperplano V Rd corresponde


6.4. DECAIMENTO DE CORRELAC
OES

183

R
ao subconjunto dos E0 tais que d = 0. Considere em E0 a norma
definida por kk0 = sup ||.
Fixe qualquer n
umero entre 1 e o raio espectral de L restrito a V . Toda
funca
o E0 pode ser escrita:
Z
Z
= c + v com c = d Ru e v = d V.

DR
AF

Ent
ao a propriedade de lacuna espectral implica que existe B > 1 tal que
Z


sup Ln d Bkk0 n para todo n 1.
(6.31)

Usando (6.28), segue que

Cn (, ) Bkk0 kk0 n

para todo n 1.

Desta forma, provamos que o deslocamento de Markov tem decaimento exponencial de correlaco
es em E0 .
Com um pouco mais de esforco, e possvel melhorar este resultado, estendendo a conclus
ao a um espaco muito maior de funco
es. Considere em M a
dist
ancia definida por

d (xn )n , (yn )n = 2N (x,y) onde N (x, y) = min{n 0 : xn 6= yn }.
Fixe > 0 qualquer e denote por E o conjunto das funco
es que s
ao -H
older,
isto e, tais que
K() = sup

 |(x) (y)|

: x 6= y
e finito.

d(x, y)

claro que E contem todas as funco


E
es localmente constantes. Afirmamos:

Teorema 6.33. O deslocamento de Markov (f, ) tem decaimento exponencial


de correlaco
es no espaco E das funco
es -H
older, qualquer que seja > 0.

Observe que L(E) E. A funca


o kk = sup || + K() e uma norma
completa em E e o operador linear L : E E e contnuo relativamente a esta
norma. Um modo de provar o teorema e mostrando que este operador tem
lacuna espectral, com decomposica
o invariante
Z
E = Ru { E : d = 0}.

Feito isso, exatamente o mesmo argumento que utilizamos anteriormente para E 0


prova o decaimento exponencial de correlaco
es em E. Este metodo ser
a discutido
no Captulo ?? num contexto mais geral, pelo que n
ao o apresentaremos aqui.
Em vez disso, vamos dar uma prova direta de que (6.31) pode ser estendida ao
espaco E.


CAPITULO 6. CORRELAC
OES

184

Lk (x) =

Dado E e dado x = (x1 , . . . , xn , . . . ) M , temos


d
X

a1 ,...,ak =1

Lx1 ,ak La2 ,a1 (a1 , . . . , ak , x1 , . . . , xn , . . . )

para todo k 1. Ent


ao, dado y = (y1 , . . . , yn , . . . ) com x1 = y1 = j,
|Lk (x) Lk (y)|
Pd

a1 ,...,ak =1

Lj,ak La2 ,a1 K()2k d(x, y) .

Lj,i = 1, conclumos que

DR
AF

Usando a propriedade

d
X

i=1

|Lk (x) Lk (y)| K()2k d(x, y) K()2k .

(6.32)

Dada qualquer funca


o , denotamos por a funca
o que depende apenas da
primeira coordenada e coincide com a media de em cada cilindro [0; i]:
Z
1
(i) =
d.
pi [0;i]
R
R
claro que sup || sup || e d = d. A desigualdade (6.32)
E
implica que
sup |Lk (Lk )| K()2k

para todo k 1.

Ent
ao, usando a propriedade (6.29),

sup |Lk+l Ll (Lk )| K()2k

para todo k, l 1.

(6.33)

Alem disso, as propriedades (6.29) e (6.30) implicam que


Z
Z
k
k
sup |(L )| sup || e
(L ) d = d.
Portanto a propriedade (6.31) d
a que
Z


sup Ll (Lk ) d B sup ||l

para todo l 1.

Somando (6.33) e (6.34), obtemos que


Z


sup Lk+l d K()2k + B sup ||l

(6.34)

para todo k, l 1.

Fixe < 1 tal que 2 max{2 , }. Ent


ao a desigualdade anterior d
a
Z


sup Ln d Bkk n1 para todo n.
(6.35)
Agora o Teorema 6.33 segue do mesmo argumento que usamos anteriormente
para E0 , com (6.35) no lugar de (6.31).

6.5. EXERCICIOS

Exerccios

6.5

185

Defina o espectro de um sistema din


amico f preservando uma medida erg
odica
, como o espectro (f ) do operador Uf : L2 () L2 (). Do mesmo modo,
defina o espectro simples s (f ) como o conjunto dos autovalores do operador
Uf .
6.1. Prove que:
1. s (f ) S 1 .

DR
AF

2. s (f ) e um subgrupo de S 1 .

6.2. Seja f preservando uma medida erg


odica e Uf : L2 () L2 () o operador de Koopman associado.
1. Todo autovalor de Uf e de multiplicidade 1.

2. O m
odulo de toda autofunca
o e constante em -quase todo ponto.

6.3. Calcule o espectro de uma rotaca


o R : S 1 S 1 .

6.4. Prove que se e fracamente misturadora para f , ent


ao e tambem e
fracamente misturadora para f k , k 1.
6.5 (Orstein 1972). Prove que se e erg
odico para f n , com n N e existe
C > 0 com
lim sup (f n (A) B) C(A)(B),
n

ent
ao e fracamente misturadora.

6.6. Mostre que se f : Tn Tn e um endomorfismo linear, ent


ao a medida de
Lebesgue e erg
odica se, e somente se, e misturadora.

6.7. Prove que e fracamente misturadora se, e somente se, e erg


odica
para f f
6.8. Prove que se f e tal que s (f ) = (f ), ent
ao existe uma sequencia de
naturais nk tais que Ufnk I na topologia forte, isto e, kUfnk k2 0,
L2 ().
6.9. Prove que um deslocamento de Markov fracamente misturador e, de fato,
misturador.

6.10. Mostre que o espaco (F , k k ) munido com a norma H


older e um espaco
de Banach.

6.11. Seja P uma matriz estoc


astica irredutvel. O objetivo e mostrar que
existe 1 e uma partica
o de X em subconjuntos, tais que a restrica
o de
P a cada um destes subconjuntos e aperi
odica. Em particular,


CAPITULO 6. CORRELAC
OES

186

n
1. Para cada i X, defina R(i) = {n 1 : Pi,i
> 0}. Mostre que R(i) e
fechado para a adica
o: se n1 , n2 R(i) ent
ao n1 + n2 R(i).

2. Seja i 1 o m
aximo divisor comum dos elementos de R(i). Mostre que
existe m 1 tal que R(i) [m, ) = i N [m, ).
Dica: Lembre que se d e o m
aximo divisor comum de n
umeros naturais
n1 , . . . , ns ent
ao existem n
umeros inteiros a1 , . . . , as tais que
a1 n1 + + as ns = d.

DR
AF

Alem disso, dado qualquer 1 i s podemos escolher os coeficientes


a1 , . . . , as de tal forma que aj > 0 para todo j 6= i.

3. Mostre que i n
ao depende de i. Seja = i para qualquer i. Mostre que
P e aperi
odica se, e somente se, = 1.

4. Suponha que 2. Mostre que existe uma aplicaca


o t : X Z tal que
n
Pi,j
> 0 n t(j) t(i) mod , para todo 1 i, j d.
5. Fixe b Z e seja Q a restrica
o de P a Y = {i X : t(i) = b}. Ou seja,

Qi,j = Pi,j para cada i, j Y . Mostre que a matriz Q e aperi


odica.

6.12. Seja (an )n uma sequencia limitada de n


umeros reais. Mostre que
n

lim
n

1X
|aj | = 0
n j=1

lim
n

1X
(aj )2 = 0.
n j=1

Alem disso, isso acontece se e somente se existe um conjunto E N tal que


1
lim #(E {0, . . . , n 1}) = 0
n n

(dizemos que E tem densidade zero no infinito) e

1
an 0 quando n restrito a N \ E.
n

Captulo 7

DR
AF

Sistemas equivalentes

Neste captulo discutimos o problema da isomorfismo: quando e que dois sistemas (f, ) e (g, ) devem ser considerados essencialmente o mesmo e como
decidir, para sistemas dados, se esse e o caso?
A noca
o fundamental e chamada equivalencia erg
odica: dois sistemas s
ao
ergodicamente equivalentes se, restritas a subconjuntos com medida total, as
respectivas transformaco
es s
ao conjugadas por uma aplicaca
o invertvel que preserva as medidas invariantes. Tal aplicaca
o permite traduzir as propriedades de
qualquer dos sistemas para o outro sistema.
Embora esta seja uma noca
o natural de isomorfismo no contexto da Teoria
Erg
odica, ela n
ao e f
acil de manejar. Em geral, dados dois sistemas equivalentes,
au
nica forma de provar esse fato e exibindo a equivalencia de forma mais ou
menos explcita. Por outro lado, o modo mais usual de mostrar que dois sistemas
n
ao s
ao equivalentes e encontrando alguma propriedade que est
a presente num
deles mas n
ao no outro.
Neste contexto, e muito u
til considerar uma noca
o mais fraca, chamada de
equivalencia espectral : dois sistemas s
ao espectralmente equivalentes se os seus
operadores de Koopman s
ao conjugados por algum operador unit
ario. Dois
sistemas ergodicamente equivalentes s
ao, necessariamente, espectralmente equivalentes, mas a recproca n
ao e verdadeira.
A ideia de equivalencia espectral conduz a uma famlia rica de invariantes,
ligados ao espectro do operador de Koopman, que precisam ser iguais nos dois
sistemas para que eles possam ser equivalentes e que, portanto, podem ser usados
para excluir essa possibilidade. Outros invariantes, de natureza n
ao espectral,
tem igualmente um papel fundamental. O mais importante de todos, a entropia,
ser
a tratado no Captulo 8.
As noco
es de equivalencia erg
odica e equivalencia espectral, e as relaco
es entre elas, ser
ao estudadas nas Seco
es 7.1 e 7.2, respectivamente. Nas Seco
es 7.3
e 7.4 estudaremos duas classes de sistemas com caractersticas din
amicas opostas: as transformaco
es com espectro discreto, que incluem as translaco
es erg
odicas
em grupos abelianos compactos, e as transformaco
es com espectro de Lebesgue,
que tem os deslocamentos de Bernoulli como principal exemplo.
187

188

CAPITULO 7. SISTEMAS EQUIVALENTES

Equival
encia erg
odica

DR
AF

7.1

Estas duas classes de sistemas, bem como outras que introduzimos anteriormente (sistemas erg
odicos, fortemente misturadores, fracamente misturadores)
s
ao invariantes de equivalencia espectral e, portanto, tambem de equivalencia
erg
odica. Em contraste, a classe dos sistemas de Kolmogorov, que estudaremos
na Seca
o 7.5, e erg
odicamente invariante mas n
ao e espectralmente invariante:
e possvel encontrar sistemas espectralmente equivalentes tais que um deles e
de Kolmogorov e o outro n
ao e. Finalmente, na Seca
o 7.7 discutiremos uma
terceira noca
o de equivalencia, chamada conjugaca
o erg
odica, especialmente no
contexto dos espacos de Lebesgue.

Sejam e probabilidades invariantes por transformaco


es f : M M e
g : N N , respectivamente. Dizemos que os sistemas (f, ) e (g, ) s
ao
ergodicamente equivalentes se podemos escolher conjuntos mensur
aveis X M
e Y N com (M \X) = 0 e (N \Y ) = 0, e uma bijeca
o mensur
avel : X Y
com inversa mensur
avel, de tal forma que
=

e f = g .

Deixamos a cargo do leitor verificar que esta e, de fato, uma relaca


o de equivalencia, ou seja, reflexiva, simetrica e transitiva.
Observe tambem que os conjuntos X e Y na definica
o podem ser escolhidos
n
invariantes por f e g, respectivamente. De fato, considere X0 = +
(X).
n=0 f

E claro da definica
o que X0 X e f (X0 ) X0 . Como (X) = 1 e a interseca
o
n
e enumer
avel, temos que (X0 ) = 1. Analogamente, Y0 = +
g
(Y
)

e
subn=0
conjunto mensur
avel de Y tal que (Y0 ) = 1 e g(Y0 ) Y0 . Alem disso, por
construca
o, Y0 = (X0 ). Portanto, a restrica
o de a X0 ainda e uma bijeca
o
sobre Y0 .
Exemplo 7.1. Considere f : [0, 1] [0, 1] definida por f (x) = 10x [10x].
Como vimos anteriormente (Seca
o 1.3.1) esta transformaca
o preserva a medida
de Lebesgue m em [0, 1]. Escrevendo um n
umero x [0, 1] em sua expans
ao decimal x = 0, a0 a1 a2 . . . , a transformaca
o f corresponde simplesmente a deslocar
os dgitos de x uma unidade para a esquerda. Isso nos motiva a considerar:
: {0, 1, . . . , 9}N [0, 1],

 X
(an )n =

an
= 0, a0 a1 a2 . . . .
10n+1
n=0

claro que e sobrejetiva. Por outro lado, ela n


E
ao e injetiva, uma vez
que certos n
umeros reais possuem mais que uma expans
ao decimal: por exemplo, 0, 1000000 = 0, 099999 . . . . De fato, isso acontece somente se o n
umero
admite uma expans
ao decimal finita, ou seja, tal que todos os dgitos a partir de certa ordem s
ao nulos. Esses n
umeros formam um conjunto enumer
avel
e, portanto, s
ao irrelevantes do ponto de vista da medida de Lebesgue. Mais
precisamente, consideremos o conjunto X {0, 1, . . . , 9}N das sequencias com

7.1. EQUIVALENCIA
ERGODICA

189

DR
AF

um n
umero infinito de smbolos diferentes de zero e o conjunto Y [0, 1] dos
n
umeros cuja expans
ao decimal e infinita (logo, u
nica). Ent
ao a restrica
o de
a X e uma bijeca
o sobre Y .
f
E
acil verificar que tanto quanto a sua inversa s
ao mensur
aveis: use o
fato de que a imagem da interseca
o de X com cada cilindro [0; a0 , . . . , am1 ]
e a interseca
o de Y com um intervalo de comprimento 10m . Esta observaca
o
tambem mostra que m = , onde representa a medida de Bernoulli em
{0, 1, . . . , 9}N que d
a igual peso a todos os dgitos. Alem disso, se denotarmos
por g o deslocamento em {0, 1, . . . , 9}N , temos que


g (an )n = 0, a1 a2 . . . an = f (an )n
para todo (an )n X. Isto prova que (f, m) e ergodicamente equivalente ao
deslocamento de Bernoulli (g, ).

Suponha que (f, ) e (g, ) s


ao ergodicamente equivalentes. Um conjunto
mensur
avel A M e invariante para f : M M se, e somente se, (A) e
invariante para g : N N . Alem disso, ((A)) = (A). Portanto, (f, )
e erg
odico se, e somente se, (g, ) e erg
odico. As conclus
oes correspondentes
para as propriedades de mistura e mistura fraca s
ao igualmente f
aceis de obter.
De fato, praticamente todas as propriedades que estudamos neste curso s
ao
invariantes de equivalencia erg
odica, isto e, se elas valem para um sistema ent
ao
tambem valem para qualquer outro que seja ergodicamente equivalente a esse.
Uma exceca
o e a unicidade erg
odica, que tem uma natureza diferente, j
a que e
uma propriedade apenas da transformaca
o.
Isto tambem quer dizer que essas propriedades podem ser utilizadas para
tentar distinguir sistemas que n
ao sejam ergodicamente equivalentes. Ainda
assim, essa e usualmente uma tarefa difcil. Por exemplo, nada do que vimos
ate agora permitir responder a
` seguinte quest
ao: os deslocamentos
f : {1, 2}Z {1, 2}Z

e g : {1, 2, 3}Z {1, 2, 3}Z,

(7.1)

munidos das medidas de Bernoulli que d


ao pesos iguais a todos os smbolos,
f
s
ao ergodicamente equivalentes? E
acil ver que f e g n
ao s
ao topologicamente
conjugadas (por exemplo: g tem tres pontos fixos, enquanto que f tem apenas
dois) mas a existencia de uma equivalencia erg
odica e uma quest
ao muito mais
delicada. De fato, este tipo de pergunta motiva a maior parte do conte
udo do
presente captulo e acabar
a conduzindo a
` noca
o de entropia, que estudaremos
no Captulo 8.

Exemplo 7.2. Seja f : M M a transformaca


o de deslocamento em M =
M
a extens
X N e seja = N uma medida de Bernoulli. Seja f : M
ao
natural de f e seja
o levantamento de
(lembre da Seca
o 2.4.4). Alem disso,
M
o deslocamento em M
= X Z e seja
seja f : M
= Z a medida de

Bernoulli correspondente. Ent


ao, (f ,
) e ergodicamente equivalente a (f,
). A
equivalencia pode ser construda da seguinte forma.
e o espaco das pre-
Por definica
o, M
orbitas de f , ou seja, das sequencias
x
= (. . . , xn , . . . , x0 ) em M tais que f (xj ) = xj+1 para todo j 1. Alem

190

CAPITULO 7. SISTEMAS EQUIVALENTES

disso, cada xj e uma sequencia (xj,i )iN em X. Ent


ao, a relaca
o anterior
quer dizer que
xj,i+1 = xj+1,i para todo i, j N.
(7.2)
M,
x
Considere a aplicaca
o : M
7 x
dada por
xn = x0,n = x1,n+1 =

e x
n = xn,0 = xn1,1 = .

Deixamos ao cuidado do leitor verificar que e realmente uma equivalencia


erg
odica entre a extens
ao natural (f,
) e o deslocamento bilateral (f,
).

DR
AF

??

7.2

Equival
encia espectral

Sejam f : M M e g : N N transformaco
es preservando probabilidades e
, respectivamente. Sejam Uf : L2 () L2 () e Ug : L2 () L2 () os respectivos operadores de Koopman. Dizemos que (f, ) e (g, ) s
ao espectralmente
equivalentes se existe algum operador unit
ario L : L2 () L2 () tal que
Ug L = L U f .

(7.3)

Deixamos para o leitor verificar que a relaca


o definida desta forma e, de fato,
uma relaca
o de equivalencia.
f
E
acil ver que se dois sistemas s
ao ergodicamente equivalentes ent
ao eles s
ao
espectralmente equivalentes (veremos na Seca
o ?? que a recproca e falsa). De
fato, suponha que existe uma aplicaca
o invertvel h : M N tal que =
e f = g . Ent
ao, o operador de Koopman
U : L2 () L2 (),

U () =

e uma isometria e e invertvel: a inversa e o operador de Koopman associado a


1 . Em outras palavras, U e um operador unit
ario. Alem disso,
Uf U = Uf = Ug = U Ug .

Portanto, L = U e uma equivalencia espectral entre os dois sistemas.


igualmente f
E
acil ver que a recproca

7.2.1

Invariantes de equival
encia espectral

Lembre que o espectro spec(A) de um operador linear A : E E num espaco de


Banach complexo E e constitudo pelos n
umeros complexos tais que A id
n
ao e invertvel. Dizemos que spec(A) e um autovalor se A id n
ao e
injetiva, isto e, se existe v 6= 0 tal que Av = v. Nesse caso a dimens
ao do
n
ucleo de A id e chamada multiplicidade do autovalor.
Por definica
o, o espectro de um sistema (f, ) e o espectro do operador de
Koopman associado Uf : L2 () L2 (). Se (f, ) e espectralmente equivalente


7.2. EQUIVALENCIA
ESPECTRAL

191

a (g, ) ent
ao os dois sistemas tem o mesmo espectro: a relaca
o (7.3) implica
que
(Ug id ) = L (Uf id ) L1
(7.4)

DR
AF

e, portanto, Ug id e invertvel se, e somente se, Uf id e invertvel.


A relaca
o (7.3) tambem mostra que e autovalor de Uf se, e somente se, e
autovalor de Ug e, nesse caso, as duas multiplicidades s
ao iguais.
Observe que 1 e sempre um autovalor do operador de Koopman, uma vez que
Uf = para toda funca
o constante . Pela Proposica
o 4.3(e), o sistema (f, )
e erg
odico se, e somente se, os u
nicos autovetores s
ao as funco
es constantes, ou
seja, se este autovalor tem multiplicidade 1. Ent
ao, por (7.4) o autovalor 1 tem
multiplicidade 1 tambem para Ug , qualquer que seja o sistema (g, ) espectralmente equivalente a (f, ). Isto mostra que a ergodicidade e um invariante de
equivalencia espectral.
Analogamente, suponha que (f, ) e misturador. Ent
ao, pela Proposica
o 6.12,
Z
Z
lim Ufn = d d
n

para todo , L2 (). Agora suponha que (g, ) e espectralmente equivalente


a (f, ). O operador L em (7.3) envia autovetores do autovalor 1 de U f em
autovetores do autovalor 1 de Ug . Como os dois sistemas s
ao erg
odicos, isto
quer dizer que L envia funco
es constantes em funco
es constantes. Como L e um
operador unit
ario,
Ugn = L(Ugn ) L = Ufn (L) L
R
R
e, portanto, limn Ugn = L d L d. Alem disso,
Z
Z
L d = L 1 = L L1 = 1 = d
e, analogamente,

L d =

d. Deste modo, provamos que


Z
Z
n
lim Ug = d d,
n

ou seja, (g, ) tambem e misturador. Isto mostra que a propriedade de mistura


tambem e um invariante de equivalencia espectral.
O mesmo argumento pode ser usado para a propriedade de mistura fraca.
Mas o teorema que provaremos na Seca
o ?? d
a uma demonstraca
o mais interessante do fato de que esta propriedade e um invariante de equivalencia espectral.

7.2.2

Teorema espectral

Vamos lembrar alguns fatos fundamentais de Teoria Espectral que ser


ao u
teis
nas pr
oximas seco
es. Recorde que um operador linear L : H H num espaco
de Hilbert H e chamado de normal se ele satisfaz L L = LL . Estamos particularmente interessados no aso em que L e unit
ario, isto e, L L = id = LL .
Usaremos para representar a soma direta ortogonal de espacos de Hilbert. A
demonstraca
o do resultado a seguir pode ser encontrada em [?].

CAPITULO 7. SISTEMAS EQUIVALENTES

192

Teorema 7.3 (teorema espectral para operadores normais). Seja L : H H


um operador linear normal contnuo num espaco de Hilbert complexo H. Ent
ao
existem medidas borelianas 0  1   n  no plano complexo C e
2
existe um operador unit
ario U : H
i=0 L (i ), tal que
= U LU 1 :
L

M
i=0

L2 (i )

L2 (i )

(7.5)

i=0

DR
AF



(i )i = z 7 zi (z) . As medidas i s
est
a dado por L
ao u
nicas, a menos de
i
equivalencia, e est
ao suportadas no espectro de L. Em particular, se L e unit
ario
ent
ao o suporte de cada i est
a contido no ccrculo unit
ario {z C : |z| = 1}.
Para cada conjunto mensur
avel B C, considere o operador linear

E(B)
:

M
i=0

L (i )

M
i=0

L2 (i ),

(i )i 7 (XB i )i .

Observe que, dados quaisquer conjuntos mensur


aveis A, B C,

B).
E(A)
E(B)
= E(A

(7.6)

Em particular, cada E(B)


e uma projeca
o: E(B)
= E(B).
Alem disso, E(B)

2
e autoadjunto: dados quaisquer , i=0 L (i ),
Z
X

E(B) =
i i di = E(B).
(7.7)
i=0

claro que E()

E
= 0. Alem disso, a funca
o B 7 E(B)
e -aditiva:
[
X
n ) se os conjuntos Bn s

E(B
ao disjuntos dois-a-dois.
E(
Bn ) =
n

: B 7 E(B)

Dizemos que E
e uma medida com valores no espaco das projeco
es.
Ela pode ser manejada da seguinte forma. Para cada = (i )i e = (i )i
: B 7 E(B) e uma medida com valores em C. E

fixados, a funca
o E
P

f
acil ver de que medida se trata: a relaca
o (7.7) d
a que E = i=0 i i i .
Ent
ao, dado qualquer j 1,
Z
Z
X
j =

L
z j i (z)i (z) di (z) =
z j d(E(z)
)
(7.8)
i=0

conveniente escrever esta relaca


para todo , . E
o na seguinte forma sucinta:
Z
j =

L
z j dE(z)
para todo j 1.
(7.9)
C

Ent
ao E(B) = U E(B)U
define uma medida em C com valores no espaco
das projeco
es de H, tal que
Z
Lj =
z j dE(z) para todo j 1.
(7.10)
1


7.2. EQUIVALENCIA
ESPECTRAL

Lj =

ou seja

193

z j d(E(z) ) para todo j 1 e todo , L2 ().

(7.11)

Ela e chamada de medida espectral do operador L. As propriedades (7.6) e (7.7)


se traduzem para
E(A) E(B) = E(A B)

e E(B) = E(B)

(7.12)

DR
AF

para todo A, B C e todo , L2 (). Se L e unit


ario ent
ao a medida
espectral est
a suportada no crculo unit
ario.
claro que as medidas E e E
s
E
ao equivalentes, no sentido de que E(B) = 0

se, e somente se, E(B)


= 0. Alem disso, elas s
ao equivalentes a
` medida 0
no Teorema 7.3. De fato, como i  0 para todo i, temos que 0 (B) = 0
se, e somente se, i (B) = 0 para todo i. Esta u
ltima condica
o e equivalente a
XB i = 0 em L2 (i ), para todo i L2 (i ) e todo i. Em outras palavras, ela
2

e equivalente a E(B)
= 0 para todo
i=0 L (i ). Portanto, 0 (B) = 0 se,

e somente se, E(B)


= 0.
Dizemos que e um a
tomo da medida espectral se E({}) 6= 0 ou, equivalentemente, se existe L2 () tal que E({}) 6= 0. Ent
ao e necessariamente
um autovalor de L, com = E({}) como autovetor. De fato, a primeira parte
de (7.12) d
a que

E({}) = se B
E(B) = E(B {}) =
E() = 0
se
/ B.

Isto mostra que E = , onde os dois lados da igualdade s


ao entendidos como
medidas em C com valores no espaco L2 (). Logo, usando (7.10) com j = 1,
Z
Z
L = z d(E(z)) = z (z) = ,
(7.13)

conforme afirmado.

7.2.3

Autovetores e mistura fraca

Como vimos anteriormente, o operador de Koopman Uf : L2 () L2 () de um


sistema (f, ) e uma isometria, ou seja, ele satisfaz Uf Uf = id . Se f e invertvel
ent
ao o operador de Koopman e unit
ario, ou seja, temos Uf Uf = Uf Uf = id .
Em particular, Uf e normal. Neste caso, a propriedade de mistura fraca admite
a seguinte caracterizaca
o interessante:
Teorema 7.4. Um sistema invertvel (f, ) e fracamente misturador se, e somente se, as funco
es constantes s
ao os u
nicos autovetores do operador de Koopman.

Em particular, o sistema (f, ) e fracamente misturador se, e somente se, ele


e erg
odico e 1 e o u
nico autovalor de Uf .

CAPITULO 7. SISTEMAS EQUIVALENTES

194

e isto implica que

Demonstraca
o. Suponha que (f, ) e fracamente misturador. Seja L2 ()
qualquer autofunca
o (n
ao nula) de Uf e seja o respectivo autovalor. Ent
ao,
Z
Z
Z
d = Uf d = d
R

d = 0 ou = 1. No primeiro caso,
Z
Z
Z
Cj (, )
= | (Ufj ) d| = |j d| = ||2 d

DR
AF

para todo j 1 (lembrando que || = 1) . Mas ent


ao,
lim
n

Z
n1
1X
Cj (, )
= ||2 d > 0,
n j=0

contradizendo a hip
otese de que o sistema e fracamente misturador. No segundo
caso, usando que o sistema e erg
odico, obtemos que e constante em -quase
todo ponto. Isto mostra que se o sistema e fracamente misturador ent
ao os
u
nicos autovetores s
ao as funco
es constantes.
Agora suponha que os u
nicos autovetores de Uf s
ao as funco
es constantes.
Para concluir que (f, ) e fracamente misturador, devemos mostrar que
n1
1X
Cj (, )2 0 para quaisquer , L2 ()
n j=0

imediato da definica
(lembre do Exerccio 6.12). E
o que
Z
0
0
Cj (, ) = Cj ( , ) onde = d

R
e a integral de 0 e nula. Logo, n
ao constitui restrica
o supor que d = 0.
Ent
ao, usando a relaca
o (7.11) para o operador unit
ario L = U f , obtemos:
Z
Z

2
2
Cj (, )2 = (Ufj ) d = z j d(z) ,
C

onde = E . A express
ao a
` direita pode ser reescrita na seguinte forma:
Z
Z
Z Z
j
j

z d(z) z d(z) =
zj w
j d(z) d(w).
C

Portanto, dado qualquer n 1,

Z Z
n1
n1
1X
1X

Cj (, )2 =
(z w)
j d(z) d(w).
n j=0
n
C C
j=0

(7.14)

Afirmamos que a medida = E e n


ao at
omica. De fato, suponha que
existe C tal que ({}) 6= 0. Ent
ao, como vimos na Seca
o 7.2.2, a funca
o

195

7.3. ESPECTRO DISCRETO

E({}) e um autovetor de Uf . Pela hip


otese sobre o operador Uf , isto implica
que E({}) e constante em -quase todo ponto. Logo,
Z
E({}) = E({}) d = 0.
As propriedades em (7.12) tambem d
ao que

E({}) = E({})2 = E({}) E({}).

DR
AF

Juntando estas duas igualdades, conclumos que E({}) = 0, o qual contradiz


a hip
otese. Desta forma,
fica provada a nossa afirmaca
o.
Pn1
A sequencia n1 j=0 (z w)
j em (7.14) e limitada e (veja o Exerccio 7.7)
converge para zero no complementar da diagonal = {(z, w) : z = w}. Alem
disso, a diagonal tem medida nula:
Z

= 0.
( )()
= ({y}) d(y)
porque e n
ao at
omica. Ent
ao, podemos usar o teorema da convergencia dominada para concluir que (7.14) converge para zero quando n . Isto prova que
(f, ) e fracamente misturador se Uf n
ao tem autovetores n
ao constantes.

Suponha que M e um espaco topol


ogico. Dizemos que uma aplicaca
o contnua
f : M M e topologicamente fracamente misturadora se o operador de Koopman Uf n
ao possui autofunco
es contnuas n
ao constantes. O seguinte fato e
uma consequencia direta do Teorema 7.4:
Corol
ario 7.5. Se (f, ) e fracamente misturadora ent
ao a restrica
o de f ao
suporte de e topologicamente fracamente misturadora.

Demonstraca
o. Seja uma autofunca
o contnua de Uf . Pelo Teorema 7.4, a
funca
o e constante em -quase todo ponto. Logo, por continuidade, e
constante (em todo ponto) no suporte de .

7.3

Espectro discreto

Nesta seca
o e na pr
oxima estudaremos os dois casos extremos, no que se refere
ao tipo da medida espectral do operador de Koopman: sistemas com espectro
discreto, para os quais a medida espectral e puramente at
omica, e sistemas com
espectro de Lebesgue, ou seja, cuja medida espectral e absolutamente contnua
com relaca
o a
` medida de Lebesgue no crculo.
Comecamos por descrever algumas propriedades dos autovalores e autove claro que todo autovalor pertence ao crculo
tores do operador de Koopman. E
unit
ario, uma vez que Uf e uma isometria.

Proposi
c
ao 7.6. Se Uf 1 = 1 1 e Uf 2 = 2 2 com 1 6= 2 ent
ao 1 2 =
0. Alem disso, os autovalores de Uf constituem um subgrupo do crculo unit
ario.
Se o sistema e erg
odico ent
ao todo o autovalor de Uf e simples e o m
odulo
de toda autofunca
o e constante em -quase todo ponto.

CAPITULO 7. SISTEMAS EQUIVALENTES

196

Demonstraca
o. A primeira afirmaca
o segue da igualdade

2 (1 2 ) = 1 1 (1 2 ),
1 2 = U f 1 U f 2 = 1 1 2 2 = 1
2

DR
AF

uma vez que 1 1


6= 1. Essa igualdade tambem mostra que o conjunto dos
2
autovalores e fechado para a operaca
o (1 , 2 ) 7 1 1
2 . Lembrando que 1
sempre e um autovalor, segue que esse conjunto e um grupo.
Agora suponha que (f, ) e erg
odico. Suponha que Uf = . Ent
ao,
Uf (||) = |Uf | = || = || em -quase todo ponto. Por ergodicidade, isto
implica que || e constante em -quase todo ponto. Em seguida, suponha que
Uf 1 = 1 e Uf 2 = 2 e as funco
es 1 e 2 n
ao s
ao identicamente nulas.
Como |2 | e constante em -quase todo ponto, temos 2 (x) 6= 0 para -quase
todo x. Ent
ao 1 /2 est
a bem definida. Alem disso,
Uf

1  Uf (1 )
1
1
=
=
=
.
2
Uf (2 )
2
2

Por ergodicidade, segue que o quociente e constante em -quase todo ponto.


Ou seja, 1 = c2 para algum c C.
Pode mostrar-se que para todo subgrupo G do crculo unit
ario existe algum
sistema erg
odico com espectro discreto cujo grupo de autovalores e G. Veja o
Teorema 4.2 no livro de Petersen [Pet83].
Dizemos que um sistema (f, ) tem espectro discreto se os autovetores do
operador de Koopman Uf : L2 () L2 () geram o espaco L2 (). A terminologia e justificada pelo seguinte resultado:
Proposi
c
ao 7.7. Um sistema invertvel (f, ) te espectro discreto se, e somente se, a medida espectral E e puramente at
omica, ou seja, se ela admite um
conjunto enumer
avel com medida total.
Demonstraca
o. Suponhamos que existe um subconjunto enumer
avel {n } do
crculo unit
ario tal que o seu complementar tem medida nula para E. Como
vimos na Seca
o 7.2.2, cada n e um autovetor de Uf e a imagem de n =
E({n }) est
a contida no respectivo autoespaco. De acordo com (7.10),
Uf =

n n

e, portanto, a imagem de Uf e a soma direta das imagens das projeco


es n .
Como Uf e sobrejetiva (porque f e invertvel), segue que as imagens dos n
geram L2 (). Pela observaca
o precedente, isto mostra que (f, ) tem espectro
discreto.
??

Exemplo 7.8. Seja m a medida de Lebesgue no toro Td . Como sabemos, o


espaco L2 (m) e gerado pela famlia de Fourier {k (x) = e2ikx : k Zd }. Seja

197

7.3. ESPECTRO DISCRETO

f = R : Td Td a rotaca
o correspondente a um dado = (1 , . . . , d ) no toro
Td . Ent
ao,
Uf k (x) = k (x + ) = e2ik k (x)

para todo x .

Isto mostra que todo k e autovetor de Uf e, portanto, (f, m) tem espectro


discreto. Note que o grupo dos autovalores e
G = {e2ik : k Zd },

(7.15)

DR
AF

ou seja, o grupo gerado pelo conjunto {e2ij : j = 1, . . . , d}.

De fato toda a translaca


o erg
odica num grupo abeliano compacto tem espectro discreto. Reciprocamente, todo sistema erg
odico (f, ) com espectro discreto
e ergodicamente equivalente a alguma translaca
o erg
odica num grupo abeliano
compacto. Estes fatos s
ao provados na Seca
o 3.3 do livro de Walters [Wal82].
??
Teorema 7.9. Suponha que (f, ) e (g, ) s
ao erg
odicos e tem espectro discreto.
Ent
ao s
ao equivalentes as seguintes condico
es:
(a) (f, ) e (g, ) s
ao ergodicamente equivalentes.

(b) (f, ) e (g, ) s


ao espectralmente equivalentes.

(c) Uf : L2 () L2 () e Ug : L2 () L2 () tem os mesmos autovalores.

Demonstraca
o. Vimos na Seca
o 7.2 que (a) implica (b). O fato de que (b)
implica (c) e trivial. Resta provar que (c) implica (a).
??

Corol
ario 7.10. Se (f, ) e erg
odico, invertvel e tem espectro discreto ent
ao
(f, ) e ergodicamente equivalente a (f 1 , ).

claro que e autovalor de Uf se, e somente se, 1 e autovalor


Demonstraca
o. E
de Uf 1 . Como os conjuntos de autovalores s
ao grupos, segue que os dois
operadores tem os mesmos autovalores.
O Teorema 7.9 tambem nos permite classificar as rotaco
es irracionais do toro
a menos de equivaencia erg
odica:

Corol
ario 7.11. Sejam = (1 , . . . , d ) and = (1 , . . . , d ) vetores racionalmente independentes. Ent
ao as rotaco
es R e R s
ao ergodicamente equivalentes
se, e somente se, existe L SL(d, Z) tal que = L m
odulo Zd .

Demonstraca
o. Pelo Teorema 7.9 e a express
ao (7.15), as duas rotaco
es s
ao
equivalentes se, e somente se, {e2ik : k Zd } = {e2il : l Zd }. Isto
acontece se, e somente se, cada um dos grupos contem os geradores do outro
grupo:
e2ij G e e2ij G para todo j = 1, . . . , d.
(7.16)

CAPITULO 7. SISTEMAS EQUIVALENTES

198

A primeira condica
o quer dizer que para cada j existe Lj = (Lj,1 , . . . , Lj,d ) Zd
e existe lj Z tais que j = Lj + lj . Seja L a matriz (Lj,k )j,k e seja l o vetor
(lj )j . Ent
ao = L + l. Analogamente, a segunda condica
o em (7.16) significa
que existe uma matriz M GL(d, Z) e um vetor m Zd tais que = M + m.
Ent
ao,
= LM + (Lm + l) e = M L + (M l + m)

DR
AF

Como e s
ao racionalmente independentes, isto implica que LM = id = M L
e Lm + l = 0 = M l + m. Segue que det L = det M = 1, ou seja, as duas
matrizes est
ao em SL(d, Z).
No caso particular do crculo, obtemos que duas rotaco
es irracionais R e
R s
ao equivalentes se, e somente se, R = R ou ent
ao R = R1 .

7.4

Espectro de Lebesgue

Dizemos que um sistema (f, ) tem espectro de Lebesgue se existe algum subespaco E L2 () tal que
(a) Uf (E) E (e, portanto, Uf1 (E) E);
T
es constantes;
(b) n0 Ufn (E) coincide com o subespaco das funco
(c)

n0

Ufn (E) coincide com o espaco L2 ().

A raz
ao de ser da denominaca
o ser
a explicada mais tarde (veja a Proposica
o 7.16).
claro da definica
E
o que esta classe de sistemas e invariante por equivalencia
espectral: se um sistema tem espectro de Lebesgue ent
ao o mesmo acontece
para todo sistema que espectralmente equivalente a ele.

7.4.1

Exemplos e propriedades

Comecamos por observar que os deslocamentos de Bernoulli, tanto unilaterais


quanto bilaterais, tem espectro de Lebesgue:
Exemplo 7.12. Bernoulli uni e bilateral tem espectro de Lebesgue
Exemplo 7.13. Markov

Exemplo 7.14. Endomorfismos do toro

Proposi
c
ao 7.15. Se um sistema (f, ) tem espectro de Lebesgue ent
ao ele e
misturador.
Demonstraca
o. ??

A partir daqui suporemos que o sistema f, ) e invertvel.

7.5. SISTEMAS DE KOLMOGOROV

199

Demonstraca
o. ??

Proposi
c
ao 7.16. Seja f : M M uma transformaca
o invertvel e seja
uma probabilidade invariante. Ent
ao o sistema (f, ) tem espectro de Lebesgue
se, e somente se, a medida espectral do operador de Koopman e equivalente a
`
medida de Lebesgue no crculo unit
ario.

Proposi
c
ao 7.17. caracterizacao no caso invertivel
posto

DR
AF

Teorema 7.18. Todos os sistemas invertveis com espectro de Lebesgue enumer


avel s
ao espectralmente equivalentes.

Demonstraca
o.

Corol
ario 7.19. Todos os deslocamentos de Bernoulli bilaterais s
ao espectralmente equivalentes.
??

7.4.2

7.5

7.5.1

7.6

Deslocamentos gaussianos

Sistemas de Kolmogorov
Propriedades

Transforma
co
es expansoras do intervalo

Teorema 7.20.

7.6.1

Exatid
ao

7.7

Espa
cos de Lebesgue

7.8

Exerccios

7.1. Defina o espectro de um sistema din


amico f preservando uma medida
erg
odica , como o espectro (f ) do operador Uf : L2 () L2 (). Do mesmo
modo, defina o espectro simples s (f ) como o conjunto dos autovalores do operador Uf . Prove que:
1. s (f ) S 1 .

2. s (f ) e um subgrupo de S 1 .

7.2. Seja f preservando uma medida erg


odica e Uf : L2 () L2 () o operador de Koopman associado.

CAPITULO 7. SISTEMAS EQUIVALENTES

200

1. Todo autovalor de Uf e de multiplicidade 1.

2. O m
odulo de toda autofunca
o e constante em -quase todo ponto.
7.3. Calcule o espectro de uma rotaca
o R : S 1 S 1 .

7.4. Prove que se f e tal que s (f ) = (f ), ent


ao existe uma sequencia de
naturais nk tais que Ufnk I na topologia forte, isto e, kUfnk k2 0,
L2 ().

DR
AF

7.5. Suponha que a medida invariante n


ao tem a
tomos. Ent
ao o espectro
do operador de Koopman Uf : L2 () L2 () coincide com o crculo unit
ario
{z C : |z| = 1}.
Dica: Mostre que todo com m
odulo 1 e um autovalor aproximado: existe
alguma sequencia n na bola unit
aria de L2 () tal que kUf n n k 0.

7.6. Se (f, ) e invertvel e tem espectro discreto ent


ao existe uma sequencia
(nk )k convergindo para infinito tal que kUfnk k2 converge para zero quando
k , para toda L2 (). ??
7.7. Sejam z e w dois n
umeros complexos com m
odulo 1. Verifique que
1. lim
n

2. lim
n

n1
1X j
|z 1| = 0 se, e somente se, z = 1;
n j=0
n1
1X
(z w)
= 0 se z 6= w.
n j=0

DR
AF

Entropia

Captulo 8

A palavra entropia foi inventada em 1865 pelo fsico e matem


atico alem
ao Rudolf Clausius, um dos pioneiros fundadores da Termodin
amica. Na teoria dos
sistemas termodin
amicos em equilbrio, a entropia e uma medida do grau de desordem do sistema. A segunda lei da Termodin
amica afirma que, quando um
sistema isolado passa de um equilbrio a outro, a entropia do estado final e necessariamente maior do que a entropia do estado inicial. Por exemplo, quando juntamos dois recipientes contendo gases distintos, digamos oxigenio e nitrogenio,
os dois gases se misturam ate alcancar um novo equilbrio macrosc
opico no qual
ambos se encontram uniformemente distribudos no conjunto dos dois recipientes. A entropia deste novo estado e superior a
` entropia do equilbrio inicial, no
qual os dois gases estavam separados.
Esta noca
o desempenha um papel de destaque em diversas outras a
reas do
conhecimento. Um exemplo importante, que iremos explorar na nossa apresentaca
o, e a Teoria da Informaca
o, desenvolvida a partir dos trabalhos do
engenheiro americano Claude Shannon em meados do seculo 20. Mais ou menos
ao mesmo tempo, os matem
aticos sovieticos Andrey Kolmogorov e Yakov Sinai
estavam propondo uma definica
o de entropia de um sistema em Teoria Erg
odica.
O principal objetivo era fornecer um invariante de equivalencia erg
odica que, em
particular, permitisse distinguir dois deslocamentos de Bernoulli. Esta noca
o e
o tema do presente captulo.
Na Seca
o 8.1 definimos a entropia de uma transformaca
o relativamente a uma
probabilidade invariante, a partir de uma analogia com a Teoria da Informaca
o.
O teorema de Kolmogorov-Sinai, que discutimos na Seca
o 8.2, constitui uma
ferramenta fundamental para o c
alculo da entropia de sistemas especficos. Na
Seca
o 8.3 analisamos a entropia de um ponto de vista mais local, que se relaciona diretamente com a formulaca
o de Shannon. Em seguida, na Seca
o 8.4,
ilustramos alguns metodos de c
alculo da entropia por meio de exemplos concretos. Finalmente, na Seca
o 8.5 discutimos o papel da entropia como invariante de equivalencia erg
odica. O grande destaque e o teorema de Ornstein
(Teorema 8.36) segundo o qual dois deslocamentos de Bernoulli bilaterais s
ao
ergodicamente equivalentes se, e somente se, eles tem a mesma entropia.
201

CAPITULO 8. ENTROPIA

202

Defini
c
ao de entropia

8.1

DR
AF

Para motivar a definica


o de entropia de Kolmogorov-Sinai, vamos considerar a
seguinte situaca
o b
asica da Teoria da Informaca
o. Consideremos um canal de
comunicaca
o que transmite, sucessivamente, certos smbolos. Esse canal pode
ser um telegrafo transmitindo pontos e tracos, segundo o antigo c
odico Morse,
uma fibra o
tima, transmitindo zeros e uns, segundo o c
odigo bin
ario ASCII, ou
qualquer outro sistema de transmiss
ao sequencial de informaca
o. O objetivo e
medir a entropia do canal, ou seja, a quantidade de informaca
o transmitida, em
media, a cada unidade de tempo.

8.1.1

Entropia em Teoria da Informa


c
ao

Para formalizar esta ideia, suponhamos que os smbolos transmitidos pelo canal
pertencem a um certo alfabeto A previamente definido. Nem todos os caracteres deste alfabeto tem a mesma frequencia, ou seja, a mesma probabilidade
de serem utilizados. Por exemplo, se o canal est
a transmitindo mensagens na
lngua portuguesa a letra A er
a utilizada com muito maior probabilidade que a
letra Z. Portanto, nem todos os caracteres carregam a mesma quantidade de
informaca
o: quanto mais improv
avel e um caracter, menor e o n
umero de palavras que o contem e, portanto, mais informaca
o est
a associada a esse caracter.
Analogamente, quanto mais improv
avel for uma palavra, menor e o n
umero
de frases em que ela participa e, portanto, maior e a quantidade informaca
o
associada a essa palavra.
Convem observar que quantidade de informaca
o associada a cada caracter,
ou a cada palavra, depende dos demais caracteres ou palavras. Por exemplo,
se o canal est
a transmitindo em lngua portuguesa e gera, sucessivamente, os
caracteres I, N, V, A, R, I, A, N e T ent
ao o caracter seguinte dever
a ser um
E; neste caso, em vista dos caracteres transmitidos anteriormente, esta letra E
n
ao carrega informaca
o adicional.1
Por outro lado, quando os caracteres transmitidos sucessivamente s
ao independentes uns dos outros, ent
ao a informaca
o de cada um se soma a
` informaca
o
anterior. Por exemplo, se a transmiss
ao reflete os resultados de lancamentos sucessivos de uma moeda justa, a informaca
o correspondente ao resultado (Cara,
Coroa, Coroa) deve ser igual a
` soma das informaco
es correspondentes a cada
um dos caracteres Cara, Coroa e Coroa. Ora, por independencia, a probabilidade do evento (Cara, Coroa, Coroa) e o produto das probabilidades dos eventos
Cara, Coroa e Coroa. Isto sugere que a informaca
o deve ser definida em termos
do logaritmo da probabilidade.
Em Teoria da Informaca
o e usual considerar logaritmos na base 2, porque
essencialmente todos os canais de informaca
o que encontramos na pr
atica s
ao
1 Um dos autores participou uma vez num jogo que consistia em seguir pistas para adivinhar, sucessivamente, certas letras que formariam o nome de um objeto matem
atico.
Aconteceu que as tres primeiras letras obtidas foram Z, Z e Z. Essa circunst
ancia arruinou a
continuaca
o do jogo, pois as demais letras n
ao acrescentariam qualquer informaca
o: o u
nico
objeto matem
atico cuja nome inclui tres vezes a letra Z e o Puzzle de Yoccoz.

DE ENTROPIA
8.1. DEFINIC
AO

203

bin
arios. No entanto, em Teoria Erg
odica e mais comum considerar logaritmos naturais (base e), e n
os faremos o mesmo. Por definica
o, a quantidade de
informaca
o associada a um caracter a A est
a dada por
I(a) = log pa

(8.1)

onde pa e a probabilidade (frequencia) do caracter a. A informaca


o media
associada ao alfabeto A e dada por
X
X
I(A) =
pa I(a) =
pa log pa .
(8.2)
a

DR
AF

Mais geralmente, a informaca


o associada a uma palavra a1 . . . an e
I(a1 . . . an ) = log pa1 ...an

(8.3)

onde a probabilidade pa1 ...an da palavra e, usualmente, maior que o produto


pa1 . . . pan das probabilidades das suas letras (vale a igualdade no caso independente). Denotando por An o conjunto de todas as palavras de comprimento n,
definimos
X
X
pa1 ...an log pa1 ...an . (8.4)
pa1 ...an I(a1 , . . . , an ) =
I(An ) =
a1 ,...,an

a1 ,...,an

Finalmente, a entropia do canal de comunicaca


o e definida por:
I = lim
n

8.1.2

1
I(An ).
n

(8.5)

Entropia de uma parti


c
ao

Queremos adaptar estas ideias ao nosso contexto em Teoria Erg


odica. A principal diferenca e que, enquanto em Teoria da Informaca
o o alfabeto A e discreto
(finito), em geral, esse n
ao e necessariamente o caso para o espaco de estados
da maioria dos sistemas din
amicos interessantes. Esse ponto e resolvido fazendo
uso de partico
es, finitas ou enumer
aveis, do espaco de estados.
Seja (M, B, ) um espaco de probabilidade. Neste captulo, por partica
o
sempre entenderemos uma famlia finita ou enumer
avel P de subconjuntos mensur
aveis de M disjuntos dois-a-dois e cuja uni
ao tem medida total. Denotamos
por P(x) o elemento da partica
o que contem um ponto x. A soma P Q de
duas partico
es P e Q e a partica
o cujos elementos s
ao as interseco
es P Q
com P P e Q Q. Mais geralmente, dada qualquer famlia enumer
avel de
partico
es Pn , definimos
_
\

Pn =
Pn : Pn Pn para cada n
n

A cada partica
o P associamos a respectiva funca
o de informaca
o
IP : M R,

IP (x) = log (P(x)).

(8.6)

CAPITULO 8. ENTROPIA

204

claro que a funca


E
o IP e mensur
avel. Ent
ao chamamos entropia, ou informaca
o
media, da partica
o P ao n
umero
Z
X
H (P) = IP d =
(P ) log (P ).
(8.7)
P P

DR
AF

Como e usual na teoria da integral de Lebesgue, fazemos a convenca


o de que
0 log 0 = limx0 x log x = 0. Veja a Figura 8.1.

Figura 8.1: Gr
afico da func
ao (x) = x log x

Dizemos que duas partico


es P e Q s
ao independentes se (P Q) = (P )(Q)
para todo P P e todo Q Q. Nesse caso, IPQ = IP + IQ e, portanto,
H (P Q) = H (P) + H (Q). Em geral, vale a desigualdade como veremos.
Isso est
a ligado ao fato de que a funca
o (x) = x log x e c
oncava: 00 < 0 e,
consequentemente,

t(x) + (1 t)(y) tx + (1 t)y para todo x, y e todo t [0, 1].

Exemplo 8.1. Considere M = [0, 1] munido da medida de Lebesgue.  Para


cada n 1 considere a partica
o P n nos subintervalos (i 1)/10n , i/10n com
n
1 i 10 . Ent
ao
n

H (P ) =

10
X
i=1

10n log 10n = n log 10.

Exemplo 8.2. Seja M = {1, . . . , d}N munido de uma medida produto = N .


Denotamos pi = ({i}) para cada i {1, . . . , d}. Para cada n 1, seja P n a
partica
o de M em cilindros [0; a1 , . . . , an ] de comprimento n. A entropia de P n
e
X

H (P n ) =
pa1 . . . pan log(pa1 . . . pan
a1 ,...,an

X X
j

a1 ,...,an

XX
j

aj

pa1 . . . paj . . . pan log paj

paj log paj

ai ,i6=j

pa1 . . . paj1 paj+1 . . . pan .

DE ENTROPIA
8.1. DEFINIC
AO

205

H (P n ) =

d X
d
X

j=1 aj =1

pi = 1. Portanto,

Au
ltima soma e igual a 1, uma vez que
paj log paj =

d X
d
X
j=1 i=1

pi log pi = n

d
X

pi log pi .

i=1

Lema 8.3. Toda partica


o finita tem entropia finita. De fato, H (P) log #P
e vale a igualdade se, e somente se, (P ) = 1/#P para todo P P.

Demonstraca
o. Seja P = {P1 , P2 , . . . , Pn } e considere os n
umeros ti = 1/n e
xi = (Pi ). Pela desigualdade de Jensen (Teorema 0.51):

DR
AF

n
n
X
X

1
1  log n
H (P) =
ti (xi )
t i xi =
=
.
n
n
n
i=1
i=1

Portanto, H (P) log n. Alem disso, a igualdade ocorre se, e somente se,
(Pi ) = 1/n para todo i = 1, . . . , n.

O exemplo a seguir mostra que partico


es enumer
aveis podem ter entropia infinita. A partir daqui sempre consideraremos partico
es (finitas ou enumer
aveis)
com entropia finita.

Exemplo 8.4.
PConsidere M = [0, 1] munido da medida de Lebesgue . Observe
que a serie k=1 1/(k(log k)2 ) e convergente. Seja c o valor da soma. Ent
ao
podemos decompor [0, 1] em intervalos Pk com (Pk ) = 1/(ck(log k)2 ) para todo
k. Seja P a partica
o formada por estes intervalos. Ent
ao,
H (P) =

X
log c + log k + 2 log log k
k=1

ck(log k)2

Pelo criterio
raz
ao, a serie do lado direito tem o mesmo comportamento
Pda

que a serie k=1 1/(k log k) que, como sabemos, e divergente (use o criterio da
integral). Portanto, H (P) = .
Chamamos entropia condicional de uma partica
o P com respeito a uma
partica
o Q ao n
umero
H (P/Q) =

X X

P P QQ

(P Q) log

(P Q)
.
(Q)

(8.8)

Intuitivamente, ele mede a informaca


o adicional fornecida pela partica
o P uma
claro que H (P/M) = H (P)
vez conhecida a informaca
o da partica
o Q. E
para todo P, onde M denota a partica
o trivial M = {M }. Alem disso, se P e
Q s
ao independentes ent
ao H (P/Q) = H (P). Em geral, vale a desigualdade
como veremos num instante.
Dadas duas partico
es, P e Q dizemos que P e menos fina que Q, e escrevemos
P Q, se todo elemento de Q est
a contido em algum elemento de P, a menos de
medida nula. A soma P Q e, precisamente, a menos fina de todas as partico
es
R tais que P R e Q R.

CAPITULO 8. ENTROPIA

206

Lema 8.5. Sejam P, Q e R partico


es com entropia finita. Ent
ao,
(a) H (P Q/R) = H (P/R) + H (Q/P R);

(b) se P Q ent
ao H (P/R) H (Q/R) e H (R/P) H (R/Q).
(c) P Q se, e somente se, H (P/Q) = 0.

Demonstraca
o. Por definica
o,
X
(P Q R)
H (P Q/R) =
(P Q R) log
(R)
P,Q,R

(P Q R)
(P R)

DR
AF
=

P,Q,R

(P Q R) log
+

P,Q,R

(P Q R) log

A soma do lado direito pode ser reescrita como


X
X
(C Q)
+
(S Q) log
(S)

P P,RR

SPR,QQ

(P R)
.
(R)

(P R) log

(P R)
(R)

= H (Q/P R) + H (P/R).

Isto demonstra o item (a). Agora observe que se P Q ent


ao
H (P/R) =

XX X
P

R QP

XX X
P

R QP

(Q R) log

(P R)
(R)

(Q R) log

(Q R)
= H (Q/R).
(R)

Isto prova a primeira parte do item (b). Para provar a segunda parte, note que
para quaisquer P P e R R, tem-se
X (Q) (R Q)
(R P )
=
.
(P )
(P ) (Q)
QP

Claro que
rema 0.51),

QP

(Q)/(P ) = 1. Ent
ao, pela desigualdade de Jensen (Teo

X (Q) (R Q) 
(R P ) 

(P )
(P )
(Q)
QP

para todo P P e R R. Consequentemente,


X
X (Q) (R Q) 
(R P )  X
H (R/P) =
(P )

(P )

(P )
(P )
(Q)
P,R

Q,R

P,R

(Q)

QP

(R Q) 
= H (R/Q).
(Q)

DE ENTROPIA
8.1. DEFINIC
AO

207

Finalmente, segue da definica


o (8.8) que H (P/Q) = 0 se, e somente se, para
todo P P e todo Q Q,
(P Q) = 0 ou ent
ao

(P Q)
= 1.
(Q)

Em outras palavras, ou Q e disjunto de P (a menos de medida nula) ou Q est


a
contido em P (a menos de medida nula). Isto quer dizer que H (P/Q) = 0 se,
e somente se, P Q.

DR
AF

Em particular, tomando Q = M no item (b) do lema obtemos que


H (R/P) H (R)

para quaisquer partico


es R e P.

(8.9)

Alem disso, tomando R = M no item (a), vem que

H (P Q) = H (P) + H (Q/P) H (P) + H (Q).

(8.10)

Tambem precisaremos da seguinte propriedade de continuidade:

Lema 8.6. Dado k 1 e > 0 existe > 0 tal que, para quaisquer partico
es
finitas P = {P1 , . . . , Pk } e Q = {Q1 , . . . , Qk },
(Pi Qi ) < para todo i = 1, . . . , k

H (Q/P) < .

Demonstraca
o. Fixe > 0 e k 1. Pela continuidade da funca
o : [0, 1] R,
(x) = x log x, existe > 0 tal que (x) < /k 2 para todo x [0, )(1, 1].
Tome = /k. Dadas partico
es P e Q como no enunciado, denote por R a
partica
o cujos elementos s
ao as interseco
es Pi Qj com i 6= j e tambem o
conjunto ki=1 P Qi . Note que (Pi Qj ) (Pi Qi ) < para todo i 6= j e

k
[

i=1

k
k
X
 X
Pi Q i
(Pi ) (Pi Qi ) >
(Pi ) = 1
i=1

Portanto,

H (R) =

i=1

RR

((R)) < #R

.
k2

claro da definica
E
o que P Q = P R. Ent
ao, usando (8.10) e (8.9),
H (Q/P) = H (P Q) H (P) = H (P R) H (P)
= H (R/P) H (R) < .

Isto prova o lema.

CAPITULO 8. ENTROPIA

208

Entropia de um sistema din


amico

8.1.3

Seja f : M M uma transformaca


o mensur
avel preservando uma medida de
probabilidade . A noca
o de entropia do sistema (f, ), apresentada a seguir, e
inspirada pela ideia de entropia de um canal de comunicaca
o definida por (8.5).
Dada uma partica
o P de M com entropia finita, denotamos
Pn =

n1
_
i=0

f i (P) para cada n 1.

DR
AF

Observe que o elemento P n (x) que contem x M est


a dado por:

P n (x) = P(x) f 1 (P(f (x))) f n+1 (P(f n1 (x))).

claro que a sequencia P n e n


E
ao-crescente, ou seja, P n P n+1 para todo n.
Portanto, a sequencia das entropias H (P n ) tambem e n
ao-decrescente. Outro
fato importante e que esta sequencia e subaditiva:
Lema 8.7. H (P m+n ) H (P m ) + H (P n ) para todo m, n 1.

Demonstraca
o. Por definica
o, P m+n = m+n1
f i (P) = P m f m (P n ). Pori=0
tanto, uando (8.10),
H (P m+n ) H (P m ) + H (f m (P n )).

(8.11)

H (f 1 (Q)) = H (Q) para qualquer partica


o Q,

(8.12)

Por outro lado,

uma vez que a medida e invariante por f e, portanto, (f 1 (Q)) = (Q)


para todo Q Q. Em particular, H (f m (P n )) = H (P n ) para todo m, n.
Substituindo este fato em (8.11) obtemos a conclus
ao do lema.
Chamamos entropia de f com respeito a
` medida e a
` partica
o P o limite
h (f, P) = lim
n

1
1
H (P n ) = inf H (P n ).
n n
n

(8.13)

Observe que esta entropia e tanto maior quanto mais fina for a partica
o. De
fato, se P Q ent
ao P n Qn para todo o n. Usando o Lema 8.5, segue que
H (P n ) H (Qn ) para todo n. Consequentemente,
PQ

h (f, P) h (f, Q)

(8.14)

Finalmente, a entropia do sistema (f, ) e definida por


h (f ) = sup h (f, P),

(8.15)

onde o supremo e tomado sobre todas as partico


es com entropia finita. Uma
observaca
o u
til e que a definica
o n
ao e afetada se considerarmos o supremo
apenas sobre as partico
es finitas (veja o Exerccio 8.3).

DE ENTROPIA
8.1. DEFINIC
AO

209

Exemplo 8.8. Suponhamos que a medida invariante est


a suportada numa
o
rbita peri
odica. Em outras palavras, existe x em M e k 1 tal que f k (x) = x
e a medida e dada por

1
x + f (x) + + f k1 (x) .
k

DR
AF

Neste caso a medida s


o toma um n
umero finito de valores. Consequentemente,
a entropia H (P) tambem s
o toma um n
umero finito de valores quando consideramos todas as partico
es enumer
aveis P. Em particular, limn n1 H (P n ) = 0
para toda partica
o P. Isto prova que neste caso h (f ) = 0.

Exemplo 8.9. Considere a transformaca


o f : [0, 1] [0, 1] dada por f (x) =
10x [10x] munida da medida de Lebesgue. Seja P a partica
o de [0, 1] nos
intervalos da forma (i 1)/10, i/10] com i = 1, . . . , 10. Ent
ao P n e a partica
o
nos intervalos da forma (i 1)/10, i/10] com i = 1, . . . , 10n . Usando o c
alculo
do Exemplo 8.1, obtemos que
h (f, P) = lim
n

1
H (P n ) = log 10.
n

Usando a teoria que ser


a desenvolvida na Seca
o 8.2 veremos que este e tambem
o valor da entropia h (f ), ou seja, P realiza o supremo na definica
o (8.15).

Exemplo 8.10. Considere o deslocamento f : M M no conjunto M =


{1, . . . , d}N (ou M = {1, . . . , d}Z ), munido de uma medida de Bernoulli = N
(respectivamente, = N ). Seja P a partica
o de M em cilindros [0; a] com
a = 1, . . . , d. Ent
ao P n e a partica
o em cilindros [0; a1 , . . . , an ] de comprimento
n. Usando o c
alculo do Exemplo 8.2 conclumos que
d

h (f, P) = lim
n

X
1
H (P n ) =
pi log pi .
n
i=1

A teoria que apresentaremos na Seca


o 8.2 permitir
a concluir que este e tambem
o valor da entropia h (f ).

Lema 8.11. h (f, Q) h (f, P) + H (Q/P) para quaisquer partico


es P e Q
com entropia finita.

Demonstraca
o. Pelo Lema 8.5, para todo n 1 vale que


H Qn+1 /P n+1 = H Qn f n (Q)/P n f n (P)


H Qn /P n + H f n (Q)/f n (P)

O u
ltimo termo e igual a H(Q/P), porque a medida e invariante por f .
Portanto, a relaca
o anterior prova que


para todo n 1.
(8.16)
H Qn /P n nH Q/P

CAPITULO 8. ENTROPIA

210

Usando o Lema 8.5 uma vez mais, segue que

H (Qn ) H (P n Qn ) = H (P n ) + H (cQn /P n ) H (P n ) + nH (Q/P).

Dividindo por n e passando ao limite quando n obtemos a conclus


ao do
lema.
Wn
Lema 8.12. h (f, P) = limn H (P/ j=1 f j (P)) para qualquer partica
o P
com entropia finita.
Demonstraca
o. Usando o Lema 8.5(a) e o fato de que a medida e invariante:
n1
_

n1
n1
_
_



f j (P) = H
f j (P) + H P/
f j (P)

DR
AF
H

j=0

= H

j=1

j=1

n2
_

n1
_

j=0


f j (P) + H P/

f j (P)

j=1

para todo n. Por recorrencia, segue que


H

n1
_

(P) = H (P) +

j=0

n1
X
k=1

H P/

k
_

j=1


f j (P) .

Portanto, h (f, P) e dada pelo limite Cesaro


h (f, P) = lim
n

n1
n1
k
_
_


1
1X
f j (P) .
H
f j (P) = lim
H P/
n n
n
j=0
j=1
k=1

Por outro lado, o Lema 8.5(b) garante que a sequencia H (P/ nj=1 f j (P)) e
decrescente. Em particular, limn nj=1 f j (P) existe e, consequentemente, coincide com o limite Cesaro na igualdade anterior.
n1 j
Recorde que P n = j=0
f (P). Quando f : M M e invertvel, tambem
n1
n
consideramos P
= j=n f j (P).

Lema 8.13. Se P e partica


o com entropia finita ent
ao h (f, P) = h (f, P k )
para todo k 1. Se f e invertvel, tambem temos h (f, P) = h (f, P k ) para
todo k 1.
Demonstraca
o. Observe que, dado qualquer n 1,
n1
_
j=0

f j (P k ) =

n1
_
j=0

f j

k1
_
i=0

_
 n+k1
f i (P) =
f l (P) = P n+k .
l=0

Portanto,





1
1
h f, P k = lim H P n+k = lim H P n = h f, P .
n n
n n

211

8.2. TEOREMA DE KOLMOGOROV-SINAI

n1
_

f j (P k ) =

j=0

n1
_

f j

j=0

Isto prova a primeira parte do lema. Para provar a segunda parte, note que:
k1
_

i=k

_
 n+k1

f i (P) =
f l (P) = f k P n+2k
l=k

para todo n e todo k. Portanto,





1
1
h f, P k = lim H f k (P n+2k ) = lim H P n+2k = h f, P .
n n
n n

DR
AF

(a segunda igualdade usa o fato de que e invariante por f ).

Proposi
c
ao 8.14. Tem-se h (f k ) = kh (f ) para todo k N. Se f e invertvel
ent
ao h (f k ) = |k|h (f ) para todo k Z.

Demonstraca
o. Considere g = f i e seja P uma partica
o qualquer de M com
entropia finita. Lembrando que P k = P f 1 (P) f k+1 (P), vemos que
P km =

km
_

i=0

f j (P) =

m
_

i=0

f ki (P k ) =

m
_

g i (P k ).

i=0

Portanto,

m
_




1
1
kh f, P = lim H P km = lim H
g i (P k ) = h g, P k .
m m
m m
i=0

Usando o Lema 8.13, vem que kh (f, P) = h (g, P). Tomando o supremo sobre
estas partico
es P vem que kh (f ) = h (g), conforme afirmado.
Agora suponha que f e invertvel. Seja P uma partica
o qualquer de M com
entropia finita. Para qualquer n 1,



n1 i
n1 j
n1 i
f (P) ,
f (P) = H f n+1 i=0
f (P) = H i=0
H j=0

uma vez que a medida e invariante. Dividindo por n e passando ao limite


quando n , obtemos que h (f, P) = h (f 1 , P). Tomando o supremo
sobre estas partico
es P, vem que h (f ) = h (f 1 ). Substituindo f for f k e
usando o item (a), segue que h (f k ) = h (f k ) = kh (f ) para todo k N.
??

8.2

Teorema de Kolmogorov-Sinai

Em geral, a principal dificuldade no c


alculo da entropia reside no c
alculo do
supremo na definica
o (8.15). Os metodos que vamos desenvolver nesta seca
o
permitem simplicar a tarefa em muitos casos de interesse, identificando certas
partico
es P que realizam o supremo, isto e, tais que h (f, P) = h (f ). O
resultado principal e o seguinte:

CAPITULO 8. ENTROPIA

212

Teorema 8.15. Seja P1 Pn uma sequencia n


ao-decrescente de
partico
es com entropia finita tais que
P
gera
a
-
a
lgebra
dos conjuntos
n=1 n
mensur
aveis. Ent
ao
h (f ) = lim h (f, Pn ).
n

Demonstraca
o. O limite sempre existe, pois a propriedade (8.14) implica que a
sequencia h (f, Pn ) e n
ao decrescente. Vamos usar o seguinte fato:
Lema 8.16. limn H (Q/Pn ) = 0 para qualquer partica
o finita Q.

DR
AF

Demonstraca
o. Escreva Q = {Q1 , . . . , Qk }. Dado qualquer > 0, fixe > 0
como no Lema 8.6. Seja A a a
lgebra formada pelas uni
oes finitas de elementos
de n P n . Por hip
otese, A gera a -
algebra de todos os conjuntos mensur
aveis.
Logo, pelo teorema de aproximaca
o (Teorema 0.16), para cada i = 1, . . . , s existe
Ai A tal que
(Qi Ai ) < /(4k).
(8.17)

O fato de que os Qi s
ao uma cobertura de M garante que os Ai est
ao perto de
o serem tambem:


Ai (j6=i Aj ) nj=1 (Aj \ Qj ) < /4 para todo i
(8.18)


e M \ ki=1 Ai ki=1 (Qi \ Ai ) < /4.

(8.19)

A seguir, defina

A1
0
Ai \ i1
Qi =
j=1 Aj

k1
M \ j=1
Aj

para i = 1
para 1 < i < k
para i = k

Ent
ao Q0 = {Q01 , . . . , Q0k } e uma partica
o de M . Afirmamos que
(Ai Q0i ) < /2 para todo i = 1, . . . , k.

(8.20)

Isto e trivial para i = 1. Para i > 1 temos que Ai \ Q0i est


a contido em
Ai (j<i Aj ). Logo, usando (8.18), obtemos que (Ai \ Q0i ) < /4. Isto prova a
afirmaca
o para todo 1 < i < k, uma vez que nesse caso Q0i \ Ai = . Finalmente,
para i = k, temos que Q0k \ Ak est
a contido no complementar de ki=1 Ai . Logo,
0
usando (8.19), vemos que (Qk \ Ak ) < /4. Somando esta estimativa com a
anterior, vem que (Ak \ Q0k ) < /2. Isto completa a prova da afirmaca
o (8.20).
Combinando as desigualdades (8.17) e (8.20), obtemos que (Qi Q0i ) <
para todo i = 1, . . . , k. Agora, e claro que Q0i A para todo i. Ent
ao, como se
trata de uma famlia finita, podemos encontrar m 1 tal que todo Q0i e uma
uni
ao de elementos de Pm . Em outras palavras, a partica
o Q0 = {Q01 , . . . , Q0k }
e menos fina do que Pm . Ent
ao, pelos Lemas 8.5 e 8.6,
H (Q/Pn ) H (Q/Pm ) H (Q/Q0 ) < para todo n m.

Isto completa a demonstraca


o do teorema.

8.2. TEOREMA DE KOLMOGOROV-SINAI

213

Pelo Lema 8.11, tambem temos que

h (f, Q) h (f, Pn ) + H (Q/Pn ) para todo n.

Passando ao limite quando n obtemos a conclus


ao do teorema.

8.2.1

Parti
co
es geradoras

Agora vamos deduzir v


arias consequencias u
teis do teorema.

DR
AF

Corol
ario 8.17. Seja P uma partica
o com entropia finita tal que a uni
ao dos
n1 j
seus iterados P n = j=0
f (P), n 1 gera a -
algebra dos conjuntos mensur
aveis. Ent
ao h (f ) = h (f, P).

Demonstraca
o. Basta aplicar o Teorema 8.15 a
` sequencia P n , lembrando que
n
h (f, P ) = h (f, P) para todo n, de acordo com o Lema 8.13.

Corol
ario 8.18. Suponha que o sistema (f, ) e invertvel. Seja P uma partica
o
n1
com entropia finita tal que a uni
ao dos iterados P n = j=n
f j (P), n 1
gera a -
algebra dos conjuntos mensur
aveis. Ent
ao h (f ) = h (f, P).
Demonstraca
o. Basta aplicar o Teorema 8.15 a
` sequencia P n , lembrando que
n
h (f, P ) = h (f, P) para todo n, de acordo com o Lema 8.13.

Em particular, os Corol
arios 8.17 e 8.18 completam o c
alculo da entropia da
transformaca
o expans
ao decimal e dos deslocamentos de Bernoulli, que iniciamos nos Exemplos 8.9 e 8.10, respectivamente.
Em qualquer dos casos nos Corol
arios 8.17 e 8.18 dizemos que P e uma
partica
o geradora, ou um gerador do sistema. Note, no entanto, que isto contem
um certo abuso de linguagem, j
a que as condico
es nos dois corol
arios n
ao s
ao
equivalentes. Por exemplo, se tomarmos M = {1, . . . , d}Z ent
ao a partica
o P
em cilindros {[0; a] : a = 1, . . . , d} e tal que a uni
ao dos iterados bilaterais P n
gera a -
algebra mas a a uni
ao dos iterados unilaterais P n n
ao gera.
A este respeito tambem observamos que certos sistemas invertveis admitem
partico
es que s
ao geradoras no sentido do Corol
ario 8.17, ou seja, tais que a
uni
ao dos iterados unilaterais P n gera a -
algebra dos conjuntos mensur
aveis.
Por exemplo, se f : S 1 S 1 e uma rotaca
o irracional e P = {I, S 1 \ I} e uma
partica
o do crculo em dois intervalos complementares, ent
ao P e geradora nesse
sentido. No entanto, este tipo de comportamento s
o e possvel para sistemas
com entropia nula:

Corol
ario 8.19. Suponha que f : M M e invertvel e existe alguma partica
o
n
P com entropia finita tal que
gera a -
algebra dos conjuntos menn=1 P
sur
aveis de M . Ent
ao h (f ) = 0.

Demonstraca
o. Combinando o Lema 8.12 e o Corol
ario 8.17:
h (f ) = h (f, P) = lim H (P/f 1 (Pn )).
n

CAPITULO 8. ENTROPIA

214

Como n P n gera a -
algebra B dos conjuntos mensur
aveis, n f 1 (P n ) gera
a -
algebra f 1 (B). Mas f 1 (B) = B, uma vez que f e invertvel. Logo, o
Teorema 8.15 implica que H (P/f 1 (Pn )) converge para zero quando n .
Segue que h (f ) = 0.
Suponha que M e um espaco metrico, munido da sua -
algebra de Borel.

DR
AF

Corol
ario 8.20. Seja P1 Pn uma sequencia n
ao decrescente de
partico
es com entropia finita tais que diam Pn (x) 0 para -quase todo x M .
Ent
ao
h (f ) = lim h (f, Pn ).
n

Demonstraca
o. Seja U um aberto qualquer de M . A hip
otese garante que para

cada x existe n(x) tal que o conjunto Px = Pn(x) (x) est


a contido em U . E
claro que Px pertence a
`a
lgebra A gerada por n Pn . Observe tambem que esta
a
lgebra e enumer
avel, j
a que ela est
a formada pelas uni
oes finitas de elementos
das partico
es Pn . Em particular, o conjunto dos valores tomados por Px e
enumer
avel. Segue que U = xU Px tambem est
a na a
lgebra A. Isto prova que
a -
agebra gerada por A contem todos os abertos e, portanto, contem todos
os conjuntos borelianos. Agora, a conclus
ao segue de uma aplicac ao direta do
Teorema 8.15.
Exemplo 8.21. Seja f : S 1 S 1 um homeomorfismo e seja uma probabilidade invariante qualquer. Dada uma partica
o finita P de S 1 em subintervalos,
denotemos por x1 , . . . , xm os seus pontos extremos. Para qualquer j 1, a
partica
o f j (P) est
a formada pelo subintervalos de S 1 determinados pelos ponj
tos f (xi ). Isto implica que, para cada n 1, os elementos de P n tem os seus
pontos extremos no conjunto
{f j (xi ) : j = 0, . . . , n 1 e i = 1, . . . , m}.

Em particular, #P n mn. Ent


ao, usando o Lema 8.3,
h (f, P) = lim
n

1
1
1
H (P n ) lim #P n = lim log kn = 0.
n n
n n
n

Segue que h (f ) = 0: para isso basta considerar qualquer sequencia de partico


es
finitas em intervalos com di
ametro indo para zero e aplicar o Corol
ario 8.20.

Corol
ario 8.22. Seja P uma partica
o com entropia finita tal que, para -quase
todo x M , tem-se diam P n (x) 0. Ent
ao h (f ) = h (f, P).
Demonstraca
o. Basta aplicar o Corol
ario 8.20 a
` sequencia P n , lembrando que
n
h (f, P ) = h (f, P) para todo n.

Analogamente, se f e invertvel e P e uma partica


o com entropia finita tal
que diam P n (x) 0 para -quase todo x M , ent
ao h (f ) = h (f, P).

215

8.3. ENTROPIA LOCAL

Exemplo 8.23. Dizemos que uma transformaca


o contnua f : M M num
espaco metrico compacto M e expansiva se existe > 0 tal que duas trajet
orias
distintas n
ao podem permanecer a dist
ancia menor que em todos os iterados:
d(f j (x), f j (y)) para todo j 0

x = y.

Seja P uma partica


o qualquer de M tal que diam P = sup{diam P : P P}
e menor que . Ent
ao, diam P n (x) 0 para todo x M , como o leitor pode
verificar facilmente. Portanto, a partica
o P e geradora.

Entropia local

DR
AF

8.3

O teorema de Shannon-McMillan-Breiman, que vamos discutir nesta seca


o, fornece uma vis
ao complementar do conceito de entropia, mais detalhada e de natureza mais local. Tambem mencionaremos uma vers
ao topol
ogica dessa ideia,
que e devida a Brin-Katok.

Teorema 8.24 (Shannon-McMillan-Breiman). Dada qualquer partica


o P com
entropia finita, o limite
1
h (f, P, x) = lim log (P n (x)) existe em -quase todo ponto.
(8.21)
n
n
A funca
o x 7 h (f, P, x) e -integr
avel, e o limite tambem vale em L1 ().
Alem disso,
Z
h (f, P, x) d(x) = h (f, P).
Se (f, ) e erg
odico ent
ao h (f, P, x) = h (f, P) em -quase todo ponto.

Lembre que P n (x) = P(x)f 1 (P(f (x))) f n+1 (P(f n1 (x))), ou seja,
este conjunto est
a formado pelos pontos cuja trajet
oria se mantem pr
oxima
da trajet
oria de x durante n iterados, no sentido de que as duas visitam os
mesmos elementos de P. O Teorema 8.24 afirma que a medida deste conjunto
tem uma taxa exponencial de decaimento bem definida: em -quase todo ponto,
(P n (x)) enh(f,P,x)

para todo n grande.

A demonstraca
o do teorema ser
a apresentada na Seca
o 8.3.1.
O teorema de Brin-Katok, que enunciamos a seguir, pertence a
` mesma
famlia de resultados, mas usa uma noca
o distinta de proximidade. Suponhamos
que f : M M e uma aplicaca
o contnua num espaco metrico compacto. Dado
x M , n 1 e > 0, chamamos bola din
amica de comprimento n e raio em
torno de x ao conjunto:
B (n, x) = {y M : d(f j (x), f j (y)) < para todo j = 0, 1, . . . , n 1}.

n1 j
Em outras palavras, B (n, x) = j=0
f (B (f j (x))). Defina:

1
log (B (n, x))
n
n
1
h
(f, , x) = limninf log (B (n, x)).
n
h+
(f, , x) = lim sup

CAPITULO 8. ENTROPIA

216

Teorema 8.25 (Brin-Katok). Seja uma medida invariante por f . Os limites


lim h+
(f, , x)

lim h
(f, , x)

existem e s
ao iguais para -quase todo ponto. Denotando por h (f, x) o seu
valor comum, a funca
o h (f, ) e integr
avel e tem-se
Z
h (f ) = h (f, x)d(x).

DR
AF

A prova deste resultado pode ser encontrada no artigo original de Brin,


Katok [BK83] e n
ao ser
a apresentada aqui.

Exemplo 8.26 (Translaco


es em grupos compactos). Seja G um grupo compacto
metriz
avel e seja a respectiva medida de Haar. Toda translaca
o de G, a
`
esquerda ou a
` direita, tem entropia nula relativamente a . De fato, considere
em G uma dist
ancia d invariante por translaco
es (lembre do Lema 5.12). Ent
ao,
Egj (B (x)) = B (Eg (x))

para todo g G, x G e > 0. Consequentemente, B (n, x) = B (x) para


todo n 1. Ent
ao,
h
(Eg , , x) = lim
n

1
log (B (x)) = 0
n

para todo > 0 e x G. Pelo teorema de Brin-Katok, segue que h (Eg ) = 0.


O mesmo argumento se aplica para translaco
es Dg a
` direita.

8.3.1

Prova do teorema de Shannon-McMillan-Breiman

Considere a sequencia de funco


es n : M R definida por
n (x) = log

(P n (x))
.
(P n1 (f (x)))

Pela propriedade de cancelamento telesc


opico,

n1
1
1X
1
log (P n (x)) = log (P(f n1 (x))) +
nj (f j (x))
n
n
n j=0

(8.22)

para todo n e todo x.

Lema 8.27. A sequencia n1 log (P(f n1 (x))) converge para zero em -quase
todo ponto e em L1 ().

Demonstraca
o. Comece por observar que a funca
o x
7
log (P(x)) e integr
avel:
Z
Z
| log (P(x))| d(x) = log (P(x)) d(x) = H (P) < .

217

8.3. ENTROPIA LOCAL

Usando o Lema 3.10, segue que n1 log (P(f n (x))) converge para zero em claro que isto implica a convergencia em -quase todo
quase todo ponto. E
ponto no enunciado do lema.
Alem disso, usando o fato de que a medida e invariante,
Z
1
1
1
n1
k log (P(f
(x)))k1 =
log (P(f n1 (x))) d(x) = H (P).
n
n
n

converge para zero quando n , uma vez que H (P) < . Isto prova a
convergencia em L1 ().

DR
AF

A seguir, vamos mostrar que o u


ltimo termo de (8.22) tambem converge em
-quase todo ponto e em L1 ().
Lema 8.28. O limite (x) = limn n (x) existe em -quase todo ponto.

Demonstraca
o. Para cada n > 1, denote por Qn a partica
o de M definida por
Qn (x) = f 1 (Pn1 (f (x))) = f 1 (P(f (x))) f n+1 (P(f n1 (x))).

Note que (P n1 (f (x)) = (Qn (x)) e que P n (x) = P(x) Qn (x). Portanto,
(P(x) Qn (x))
(P n (x))
=
.
n1
(P
(f (x)))
(Qn (x))

(8.23)

Para cada P P e cada n > 1, considere a esperanca condicional (lembre da


Seca
o 4.6.1)
Z
1
(P Qn (x))
en (XP , x) =
XP d =
.
(Qn (x)) Qn (x)
(Qn (x))
Comparando com (8.23) vemos que
en (XP , x) =

(P n (x))
(P n1 (f (x)))

para todo x P.

Pelo Lema 4.43, o limite e(XP , x) = limn en (XP , x) existe para -quase todo
x M e, em particular, para -quase todo x P . Como P P e arbitr
ario,
isto prova que
(P n (x))
lim
n (P n1 (f (x)))

existe para -quase todo ponto. Tomando logaritmos, conclumos que lim n n (x)
existe para -quase todo ponto, conforme afirmado.
Lema 8.29. A funca
o = supn n e integr
avel.

Demonstraca
o. Tal como no lema anterior, vamos usar as partico
es Q n definidas
por Qn (x) = f 1 (P n1 (f (x))). Fixe qualquer P P. Dados x P e t > 0, e
claro que (x) > t se, e somente se, n (x) > t para algum n. Alem disso,
n (x) > t

(P Qn (x)) < et (Qn (x))

CAPITULO 8. ENTROPIA

218

e, nesse caso, n (y) > t para todo y P Qn (x). Portanto, podemos escrever
o conjunto {x P : (x) > t} como uma uni
ao disjunta j (P Qj ), onde cada
Qj pertence a alguma partica
o Qn(j) e
(P Qj ) < et (Qj ) para todo j.

Consequentemente, para todo t > 0 e todo P P,


X
X
({x P : (x) > t}) =
(P Qj ) < et
(Qj ) et .
Ent
ao (veja o Exerccio 8.4):
Z
XZ
XZ
d =
d =
P P

(8.24)

DR
AF

P P

XZ

P P

({x P : (x) > t}) dt

min{et , (P )} dt.

Au
ltima integral pode ser reescrita do seguinte modo:
Z

log (P )

(P ) dt +

log (P )

et dt = (P ) log (P ) + (P ).

Combinando estas duas relaco


es:
Z
X
d
(P ) log (P ) + (P ) = H (P) + 1 < .
P P

Isto prova o lema, uma vez que e n


ao negativa.

Lema 8.30. A funca


o e integr
avel e (n )n converge para em L1 ().

Demonstraca
o. Vimos no Lema 8.28 que (n )n converge para em -quase
todo ponto. Como 0 n para todo n, tambem temos 0 . Em
particular, e integr
avel. Alem disso, | n | para todo n e, portanto,
podemos usar o teorema da convergencia dominada (Teorema 0.40) para concluir
que
Z
Z
lim
n

| n | d =

lim | n | d = 0.
n

Isto prova a convergencia em L1 ().

Lema 8.31. Em -quase todo ponto e em L1 (),


lim
n

n1
n1
1X
1X
nj (f j (x)) = lim
(f j (x)).
n n
n j=0
j=0

219

8.3. ENTROPIA LOCAL

Demonstraca
o. O limite do lado direito existe em -quase todo ponto e em
L1 (), pelo teorema erg
odico de Birkhoff (Teorema 3.8). Portanto, basta mostrar que a diferenca
n1
1X
(nj ) f j
(8.25)
n j=0

converge para zero em -quase todo ponto e em L1 (). Como a medida e


invariante, k(nj ) f j k1 = knj k1 para todo j. Logo,
n1
n1
1X
1X
(nj ) f j k1
knj k1 .
n j=0
n j=0

DR
AF

Pelo Lema 8.30 a sequencia do lado direito converge para zero. Isto implica que
(8.25) converge para zero em L1 (). Resta provar a convergencia em -quase
todo ponto.
Para cada k fixado, considere k = supi>k |i |. Note que k e,
portanto, k L1 (). Alem disso:
n1
nk1
n1
1X
1 X
1 X
|nj | f j
|nj | f j =
|nj | f j +
n j=0
n j=0
n
j=nk

1
n

nk1
X
j=0

k f j +

1
n

n1
X

j=nk

fj.

Pelo teorema erg


odico de Birkhoff, o primeiro termo do lado direito converge
k em -quase todo ponto. Pelo Lema 3.10, o u
para a media temporal
ltimo
termo converge para zero em -quase todo ponto: o lema implica que n1 f ni
converge para zero para qualquer i fixado. Logo,
n1
1X
k (x)
lim sup
|nj |(f j (x))
n j=0
n

em -quase todo ponto.

(8.26)

k (x) = 0 em -quase todo ponto. Se fato, a sequencia


Afirmamos que limk
(k )k e n
ao-crescente e, pelo Lema 8.28, converge para zero em -quase todo
otona (Teorema 0.38), segue que
Rponto. Pelo teorema da convergencia mon
k )k e n
k d 0 quando k . Outra consequencia e que (
ao-crescente.
Logo, usando o teorema da convergencia mon
otona juntamente com o teorema
erg
odico de Birkhoff:
Z
Z
Z
k d = lim
k d = lim k d = 0.
lim
k

k e n
k = 0 em -quase todo ponto, tal
Como
ao negativa, segue que limk
como foi afirmado. Portanto, (8.26) implica que
lim
n

n1
1X
|nj | f j = 0
n j=0

CAPITULO 8. ENTROPIA

220

em -quase todo ponto. Isto completa a demonstraca


o do lema.
Segue da igualdade (8.22) e dos Lemas 8.27 e 8.31 que
h (f, P, x) = lim
n

1
log (P n (x))
n

DR
AF

existe em -quase todo ponto e em L1 (); de fato, ele coincide com a media
temporal (x)

da funca
o . Ent
ao, em particular,
Z
Z
1
h (f, P, x) d(x) = lim
log (P n (x)) d(x)
n n
1
= lim H (P n ) = h (f, P).
n n

Alem disso, se (f, ) e erg


odico ent
ao h(f, P, x) = (x)

e constante em -quase
todo ponto. Ou seja, nesse caso h (f, P, x) = h (f, P) para -quase todo ponto.
Isto encerra a demonstraca
o do Teorema 8.24.

8.4

Exemplos

Vamos agora ilustrar os resultados anteriores por meio de alguns exemplos.

8.4.1

Deslocamentos de Markov

Seja M = {1, . . . , d}N e seja f : M M a transformaca


o deslocamento. Seja
uma medida de Markov associada a uma matriz estoc
astica P = (Pi,j )i,j e um
vetor de probabilidades p = (pi )i . Vamos provar:
Pd
Ps
Proposi
c
ao 8.32. h (f ) = a=1 pa b=1 Pa,b log Pa,b .

Demonstraca
o. Considere a partica
o P de M em cilindros [0; a], a = 1, . . . , d.
Para cada n, o iterado P n e a partica
o em cilindros [0; a1 , . . . , an ] de comprimento n. Lembrando que ([0; a1 , . . . , an ]) = pa1 Pa1 ,a2 Pan1 ,an , vemos que
H (Pn ) =

a1 ,...,an

X
a1

pa1 Pa1 ,a2 Pan1 ,an log pa1 Pa1 ,a2 Pan1 ,an

pa1 log pa1


+

a2 ,...,an

n
X
X

j=1 aj ,aj+1

Pa1 ,a2 Pan1 ,an

log Paj ,aj+1


(8.27)

pa1 Pa1 ,a2 Pan1 ,an .

onde a u
ltima soma e sobre todos os valores de a1 , . . . , aj1 , aj+2 , . . . , an . Por
um lado,
X
X
Pan1 ,an = 1
Pa1 ,a2 Pan1 ,an =
a2 ,...,an

an

221

8.4. EXEMPLOS

uma vez que P n e uma matriz estoc


astica. De modo semelhante, lembrando
tambem que P p = p,
pa1 Pa1 ,a2 Pan1 ,an =
=

pa1 Paj1 ,aj Paj ,aj+1 Panj1


j+1 ,an

a1 ,an

pa1 Paj1 ,aj Paj ,aj+1 = paj Paj ,aj+1 .

a1

DR
AF

Lembrando que P p = p = p, vemos que a u


ltima express
ao e igual a paj .
Substituindo estas observaco
es em (8.27), obtemos que
H (Pn ) =

X
a1

pa1 +

= 1 + n

X
a,b

n
X
X

j=1 aj ,aj+1

paj Paj ,aj+1 log Paj ,aj+1

pa Pa,b log Pa,b .

P
Ent
ao h (f, P) = a,b pa Pa,b log Pa,b . Como a famlia de todos os cilindros
[0; a1 , . . . , an ] gera a -
algebra de M = {1, . . . , d}N , segue do Corol
ario 8.17 que
h (f ) = h (f, P). Isto completa a prova do teorema.

Esta conclus
ao permanece v
alida no caso de deslocamentos de Markov bilaterais, ou seja, em M = {1, . . . , d}Z . O argumento e an
alogo, usando o Corol
ario 8.18.

8.4.2

Transforma
c
ao de Gauss

Vamos calcular a entropia da transformaca


o de Gauss G(x) = (1/x) [1/x]
relativamente a
` probabilidade invariante
Z
1
dx
(E) =
(8.28)
log 2 E 1 + x

estudada nas Seco


es 1.3.2 e 4.2.4.
Seja P a partica
o nos intervalos (1/(m + 1), 1/m) para m 1. Como antes,
n1 j
denotamos P n = j=0
G (P). Os seguintes fatos ser
ao usados a seguir:
(A) Gn envia cada Pn P n difeomorficamente sobre (0, 1), para cada n 1.
(B) diam P n 0 quando n .

(C) Existe C > 1 tal que |(Gn )0 (y)|/|(Gn )0 (x)| C para todo n 1 e quaisquer x e y num mesmo elemento da partica
o P n .

(D) Existem c1 , c2 > 0 tal que c1 m(Pn ) (Pn ) c2 m(Pn ) para todo n 1
e todo Pn Pn , onde m representa a medida de Lebesgue.

CAPITULO 8. ENTROPIA

222

imediato da definica
E
o que cada P P e enviado por G difeomorficamente
sobre (0, 1). A propriedade (A) e uma consequencia, por induca
o em n. Usando
(A) e o Lema 4.18, obtemos que
diam Pn sup

xPn

1
2[n/2]
|(Gn )0 (x)|

DR
AF

para todo n 1 e todo Pn P n . Isto implica (B). A propriedade (C) est


a dada
pelo Lema 4.19. Finalmente, (D) segue diretamente de (8.28).
R
Proposi
c
ao 8.33. h (G) = log |G0 | d.

Demonstraca
o. Para cada n 1, consideremos a funca
o n (x) = log (Pn (x)).
Observe que:
Z
X
H (P n ) =
(Pn ) log (Pn ) = n (x) d(x).
Pn P n

A propriedade (D) d
a que

log c1 n (x) + log m(Pn (x)) log c2 .

Pela propriedade (A), temos que log m(Pn (x)) = log |(Gn )0 (y)| para algum
y Pn (x). Usando a propriedade (C), segue que
log c1 log C n (x) log |(Gn )0 (x)| log c2 + log C

para todo x e todo n. Por consequencia,


Z
n
log(Cc1 ) H (P ) log |(Gn )0 | d log(C/c2 )

(8.29)

para todo n. Uma vez que a medida e invariante por G,


Z

log |(Gn )0 | d =

n1
XZ
j=0

log |G0 | Gj d = n

|G0 | d.

Ent
ao dividindo (8.29) por n e passando ao limite quando n ,
Z
1
n
h (f, P) = lim H (P ) = log |G0 | d.
n n

Agora a propriedade (C) garante que podemos aplicar o Corol


ario 8.22 para
concluir que
Z
h (G) = h (G, P) = log |G0 | d.

Isto completa a demonstraca


o da proposica
o.

8.5. A ENTROPIA COMO INVARIANTE

223

A integral no enunciado da proposica


o pode ser calculada explicitamente:
deixamos ao cuidado do leitor verificar que
Z
Z 1
2 log x dx
log |G0 | d =
= 2.
0 (1 + x) log 2
Ent
ao, lembrando que (G, ) e erg
odico (Seca
o 4.2.4), segue do teorema de
Shannon-McMillan-Breiman (Teorema 8.24) que
lim
n

1
log (P n (x)) = 2 para -quase todo x.
n

DR
AF

Como a medida e compar


avel com a medida de Lebesgue, a menos de um
fator constante, isto quer dizer que
diam P n (x) e2n

para -quase todo x e para n suficientemente grande. Observe que P n (x) est
a
formada pelos pontos y cuja expans
ao em fraca
o contnua coincide com a expans
ao de x ate a ordem n.

8.4.3

Transforma
co
es expansoras do intervalo

A transformaca
o de Gauss e um exemplo da classe de transformaco
es expansoras
do intervalo que introduzimos na Seca
o 7.6. Como vimos no Teorema 7.20,
toda transformaca
o expansora do intervalo f admite uma u
nica probabilidade
invariante equivalente a
` medida de Lebesgue. Os argumentos da demonstraca
o
da Proposica
o 8.33 se estendem facilmente a estes sistemas (f, ), supondo que
a partica
o P na definica
o tem entropia finita para a medida . Deixamos ao
leitor o cuidado de verificar os detalhes dessa extens
ao. Desta forma obtemos:
Teorema 8.34 (f
ormula de Rokhlin). Se f : I I e uma transformaca
o
markoviana do intervalo e e a probabilidade invariante
absolutamente
cont

nua
R
relativamente a
` medida de Lebesgue, ent
ao h (f ) = log |f 0 | d.??

Alternativamente, o Teorema 8.34 pode ser deduzido do teorema de ShannonMcMillan-Breiman (veja o Exerccio 8.6).

8.4.4

Automorfismos do toro

??

8.5

A entropia como invariante

A entropia foi entroduzida em Teoria Erg


odica com o objetivo principal de
distinguir sistemas que n
ao s
ao ergodicamente equivalentes, especialmente no
caso de sistemas que s
ao espectralmente equivalentes e, portanto, n
ao podem
f
ser distinguidos por meio de invariantes espectrais. E
acil que a entropia e, de
fato, um invariante de equivalencia erg
odica:

CAPITULO 8. ENTROPIA

224

Proposi
c
ao 8.35. Sejam f : 1 : M1 M1 e f2 : M2 M2 transformaco
es
preservando probabilidades 1 em M1 e 2 em M2 . Se (f1 , 1 ) e ergodicamente
equivalente a (f2 , 2 ), ent
ao h1 (f1 ) = h2 (f2 ).

DR
AF

Demonstraca
o. Seja : M1 M2 uma equivalencia erg
odica entre os dois
sistemas. Isto significa que 1 = 2 e existem conjuntos X1 M1 e X2 M2
com medida total nos respectivos espacos, tais que h e uma bijeca
o de X 1
em X2 , mensur
avel com inversa mensur
avel. Alem disso, como observamos na
Seca
o 7.1, os conjuntos X1 e X2 podem ser escolhidos invariantes. Seja P1 uma
partica
o finita ou enumer
avel de (M1 , 1 ). A sua restrica
o a X1 e uma partica
o
de (X1 , 1 ). A respectiva imagem P2 = (P1 ) e uma partica
o de (X2 , 2 ) que,
naturalmente, tambem podemos ver como uma partica
o de (M2 , 2 ). Note que
X
X
H2 (P2 ) =
2 (P2 ) log 2 (P2 ) =
1 (P1 ) log 1 (P1 ) = H1 (P1 ).
P2 P2

P1 P1

n1 j
n1 j
Como P2n = j=0
f2 (P2 ) = (j=0
f1 (P1 )) = (P1n ) para todo n, tambem
segue que

h2 (f2 , P2 ) = lim
n

1
1
H2 (P2n ) = lim H1 (P1n ) = h1 (f1 , P1 ).
n
n
n

Tomando o supremo sobre todos os P1 , conclumos que h2 (f2 ) h1 (P1n ). A


desigualdade recproca e inteiramente an
aloga.

Usando este fato, Kolmogorov provou que nem todos os deslocamentos de


Bernoulli bilaterais s
ao ergodicamente equivalentes apesar de que, como vimos
no Corol
ario 7.19, todos s
ao espectralmente equivalentes. Isto tambem mostra
que a equivalencia espectral e estritamente mais fraca do que a equivalencia
erg
odica: e claro que para todo n
umero real positivo existe algum deslocamento de Bernoulli bilateral com essa entropia; portanto, a uma u
nica classe de
equivalencia espectral corresponde todo um contnuo de classes de equivalencia
erg
odica.
A recproca da Proposica
o 8.35 e falsa, em geral. Por exemplo, vimos no
Exemplo 8.21 (e no Corol
ario 8.19) que todas as rotaco
es do crculo tem entropia
nula. Mas e claro que uma rotaca
o irracional nunca e ergodicamente equivalente
a uma rotaca
o racional, uma vez que a primeira e erg
odica e a segunda n
ao
e. Ali
as, o Corol
ario 7.11 mostra que as rotaco
es irracionais tambem n
ao s
ao
ergodicamente equivalentes entre si, em geral. O caso das rotaco
es racionais e
tratado no Exerccio 8.13.
No entanto, um resultado not
avel devido a Daniel Ornstein [Orn70] afirma
que a entropia e um invariante completo para os deslocamentos de Bernoulli
bilaterais:
Teorema 8.36 (Orstein). Dois deslocamentos de Bernoulli bilaterais s
ao ergodicamente equivalentes se, e somente se, eles tem a mesma entropia.
Exemplo 8.37. O teorema de Ornstein n
ao se estende para deslocamentos de
Bernoulli unilaterais. De fato, no caso n
ao invertvel existem outros invariantes

8.6. EXERCICIOS

225

de equivalencia, tais como o grau da transformaca


o (o n
umero de pre-imagens).
Por exemplo, considere os deslocamentos
f : {1, 2, 3}N {1, 2, 3}N

e g : {1, 2}N {1, 2}N

DR
AF

munidos de medidas de Bernoulli e , respectivamente. Vamos ver que (f, )


e (g, ) nunca s
ao ergodicamente equivalentes (mesmo se escolhermos e de
tal forma a que h (f ) = h (g)).
Seja X {1, 2, 3}N um conjunto qualquer com f 1 (X) = X e (X) = 1.
Afirmamos que existe x X tal que #(X f 1 (x)) = 3. De fato, denote
Xi = X [0; i] e pi = ([0; i]), para cada i {1, 2, 3}. Ent
ao f (Xi ) e mensur
avel
e, como e uma medida de Bernoulli, (Xi ) = pi (f (Xi )). Portanto,
1 = (X) =

3
X

(Xi ) =

i=1

3
X

pi (f (Xi )).

i=1

Como p1 + p2 + p3 = 1, segue que (f (Xi )) = 1 para todo i. Consequentemente,


f (X1 ) f (X2 ) f (X3 ) tem medida total. Basta tomar x nessa interseca
o.
Agora suponha que os sistemas (f, ) e (g, ) s
ao ergodicamente equivalentes.
Ent
ao existe uma bijeca
o : X Y , definida entre subconjuntos invariantes
com medida total, e tal que f = g . Tome x X como no par
agrafo
anterior e sejam x1 , x2 , x3 X as suas pre-imagens. Ent
ao
g((xi )) = (f (xi )) = (x)

para i = 1, 2, 3.

Isto quer dizer que os tres pontos (xi ), i = 1, 2, 3 s


ao pre-imagens de (x) para
a transformaca
o f . Isso e uma contradica
o, pois todo ponto y tem apenas duas
pre-imagens para f . Portanto, os dois sistema n
ao podem ser ergodicamente
equivalentes.
A este respeito deve ser mencionado o seguinte resultado de Friedman e
Ornstein [FO70]:

Teorema 8.38 (Friedman-Ornstein). Todo deslocamento de Markov bilateral


misturador e ergodicamente equivalente a algum deslocamento de Bernoulli bilateral.

Portanto, a entropia ainda e um invariante completo de equivalencia erg


odica
no contexto mais amplo dos deslocamentos de Markov bilaterais misturadores.

8.6

Exerccios

8.1. Mostre que a funca


o h (f, x) no teorema de Brin-Katok (Teorema 8.25) e
f -invariante. Conclua que se e erg
odica, ent
ao h (f ) = h (f, x) para -quase
todo ponto x.

8.2. Mostre que se = (1 , . . . , n ) n e R : n n e a rotaca


o de a
ngulo
definida por R (x1 , . . . , xn ) = (x1 +n , . . . , xn +n ), ent
ao hm (R ) = 0, onde
m e a medida de Lebesgue.

CAPITULO 8. ENTROPIA

226

8.3. Mostre que o supremo de h (f, P) sobre todas as partico


es finitas coincide
com o supremo sobre todas as partico
es com entropia finita.
8.4. Para qualquer funca
o : M (0, ) tem-se
Z
Z
d =
t({x M : (x) > t}) d.
0

8.5. Mostre que se t [0, 1] e 1 , 2 s


ao medidas f -invariantes, ent
ao

DR
AF

ht1 +(1t)2 (f ) = th1 (f ) + (1 t)h2 (f )

??

8.6. Demonstre o Teorema 8.34 a partir do teorema de Shannon-McMillanBreiman (Teorema 8.24).

8.7. Sejam f : X X preservando e h : Y Y preservando a medida .


Defina F : X Y X Y como sendo o produto direto de f e h (veja a
Seca
o ??). Prove que
h (F ) = h (f ) + h (h).

8.8. Seja f : M M uma transformaca


o preservando uma probabilidade
em M . Seja B M um conjunto mensur
avel com (B) > 0, seja g : B B
a transformaca
o de primeiro retorno a B e seja a restrica
o normalizada de
ao conjunto B (lembre das Seco
es 1.4.1). Relacione a entropia h (g) com a
entropia h (f ). ??
8.9. Seja f : M M uma transformaca
o mensur
avel, seja B M um conjunto
mensur
avel e seja g : B B uma transformaca
o induzida por f , ou seja, uma
transformaca
o da forma g(x) = f (x) (x) para alguma funca
o mensur
avel com
valores em N (lembre das Seco
es 1.4.2). Dada uma probabilidade invariante
por f , seja a correspondente medida invariante por f , normalizada para ser
uma probabilidade. Relacione a entropia h (g) com a entropia h (f ). ??
??

8.10. Seja (f,


) a extens
ao natural de um sistema (f, ), tal como foi definida
na Seca
o 2.4.4. Dada uma partica
o P de M , considere P = { 1 (P ) : P P}
Claro que P e uma partica
.
de M.
o de M
1. Mostre que P n = 1 (P n ) e que H (P n ) = H (P n )(f) para todo n.

2. Conclua que h (f, P) = h (f, P n ) para toda partica


o P de M .

3. Deduza que h (f ) = h (f).

4. Mostre que se P e gerador para (f, ), no sentido do Corol


ario 8.17, ent
ao
P e gerador para (f,
), no sentido do Corol
ario 8.18.

8.6. EXERCICIOS

227

8.11. Seja f : M M uma transformaca


o preservando uma medida de
probabilidade . Suponha que existe um conjunto invariante A M com
(A) (0, 1). Sejam A e B as restrico
es normalizadas de aos conjuntos A
e B = Ac , respectivamente. Mostre que
h (f ) = max{hA (f | A), hB (f | B)}.

DR
AF

8.12. Considere transformaco


es f : M M e g : N N preservando medidas
de probabilidade e , respectivamente. Considere f g : M M N N ,
dada por f g(x, y) = (f (x), g(y)). Mostre que f g preserva a medida produto
e
h (f, g) = h (f ) + h (g).

8.13. Seja m a medida de Lebesgue no crculo S 1 . Sejam = p/q e =


r/s dois n
umeros racionais, onde mdc(p, q) = 1 = mdc(r, s). Mostre que as
rotaco
es (R , m) e (R , m) s
ao ergodicamente equivalentes se, e somente se, os
denominadores q = s.

CAPITULO 8. ENTROPIA

DR
AF

228

DR
AF

Bibliografia
[AB]

A. Avila and J. Bochi. Proof of the subadditive ergodic theorem.


Preprint www.mat.puc-rio.br/jairo/.

[AF07] A. Avila and G. Forni. Weak mixing for interval exchange transformations and translation flows. Ann. of Math., 165:637664, 2007.

[Bil68]

P. Billingsley. Convergence of probability measures. John Wiley & Sons


Inc., New York, 1968.

[BK83] M. Brin and A. Katok. On local entropy. In Geometric dynamics


(Rio de Janeiro, 1981), volume 1007 of Lecture Notes in Math., pages
3038. Springer, 1983.
[Cas04] A. A. Castro. Teoria da medida. Projeto Euclides. IMPA, 2004.

[Dei85] K. Deimling. Nonlinear functional analysis. Springer Verlag, 1985.

[Dug66] J. Dugundji. Topology. Allyn and Bacon Inc., 1966.

[Fer02] R. Fernandez. Introduca


o a
` teoria da medida. Projeto Euclides. IMPA,
2002.

[FO70] N. Friedman and D. Ornstein. On isomorphism of weak Bernoulli


transformations. Advances in Math., 5:365394, 1970.
[Fur61] H. Furstenberg. Strict ergodicity and transformation of the torus.
Amer. J. Math., 83:573601, 1961.

[Kat80] A. Katok. Lyapunov exponents, entropy and periodic points of diffeomorphisms. Publ. Math. IHES, 51:137173, 1980.

[Ma
n87] R. Ma
ne. Ergodic theory and differentiable dynamics. Springer Verlag,
1987.
[Mey00] C. Meyer. Matrix analysis and applied linear algebra. Society for Industrial and Applied Mathematics (SIAM), 2000.

[NR97] A. Nogueira and D. Rudolph. Topological weak-mixing of interval


exchange maps. Ergod. Th. & Dynam. Sys., 17:11831209, 1997.
229

230

BIBLIOGRAFIA

[Orn70] D. Ornstein. Bernoulli shifts with the same entropy are isomorphic.
Advances in Math., 4:337352 (1970), 1970.
[Pet83] K. Petersen. Ergodic theory. Cambridge Univ. Press, 1983.

[Rud87] W. Rudin. Real and complex analysis. McGraw-Hill, 3 edition, 1987.


[Ste58]

E. Sternberg. On the structure of local homeomorphisms of Euclidean


n-space - II. Amer. J. Math., 80:623631, 1958.

[Wal82] P. Walters. An introduction to ergodic theory. Springer Verlag, 1982.

DR
AF

[Wey16] H. Weyl. Uber die Gleichverteilungen von Zahlen mod Eins. Math.
Ann., 77:313352, 1916.

boreliano, 3
invariante, 96
justo de medidas, 58
mensur
avel, 2
transitivo, 121
continuidade
inferior, 4
no vazio, 4
superior, 4
absoluta, 7
continuidade absoluta, 114, 119
convergencia
em L2 (), 79
em distribuica
o, 71

DR
AF

B , 50
C 0 (M ), 55, 57
C 0 (M )+ , 70
Uf , 58, 69
Uf , 69
V (, , ), 51
Va (, A, ), 52
Vc (, B, ), 52
Vf (, F, ), 51
M(M ), 57
M1 (M ), 49, 50
M1 (f ), 119
M2 (f ), 119
-vizinhanca, 50
-
algebra, 2
de Borel, 3
gerada, 2
produto, 8, 103
d-toro, 40
f , 59
a
lgebra, 1

Indice

base de vizinhancas, 51, 52


Borel-Cantelli, 25

crculo, 39
cilindro, 9
classe mon
otona, 5
completamento de um espaco de medida, 5
condica
o de Keane, 150
cone, 70
dual, 70
normal, 70
conjunto
de continuidade de uma medida,
52

densidade de uma medida, 15


derivada de Rad
on-Nikodym, 15
desigualdade
de Cauchy-Schwartz, 16
de H
older, 17
de Jensen, 18
de Minkowski, 16
deslocamento
de Bernoulli, 104
deslocamento de Bernoulli, 103
distorca
o limitada, 102, 107, 108
domnio fundamental, 62
dualidade, 58

equaco
es de Hamilton-Jacobi, 115
ergodicidade
da expans
ao decimal, 101
da rotaca
o irracional, 100, 101
dos deslocamentos de Markov, 173
espaco
de Baire, 121
de medida, 3

231

INDICE

232
lema
de Borel-Cantelli, 25
de Borel-Cantelli, 25
de Fatou, 14

de medida completo, 5
de probabilidade, 3
mensur
avel, 1, 2
metriz
avel, 53
produto, 8, 9
separ
avel, 53, 55
topol
ogico, 2
vetorial topol
ogico, 59
expans
ao decimal, 32
extens
ao natural, 66

DR
AF

metrica
de Levy-Prohorov, 54
matriz hiperb
olica, 111
medida, 3
at
omica, 22
com sinal, 57
completa, 5
de Bernoulli, 9
de Dirac, 3, 50
de Lebesgue, 5
de Lebesgue no crculo, 39
finita, 3
invariante, 27, 59
justa, 20
n
ao a
omica, 22
produto, 8, 104
projeca
o, 123
regular, 18
transporte, 65, 72

f
ormula
de Rokhlin, 223
f
ormula de Liouville, 42
fluxo, 28, 41
folhas est
aveis, 112
folhas inst
aveis, 112
folheaca
o est
avel, 112
folheaca
o inst
avel, 112
forma de volume, 42
fraca
o contnua, 34, 35
funca
o
-aditiva, 4
caracterstica, 10
de distribuica
o, 71
finitamente aditiva, 4
invariante, 79, 96
localmente integr
avel, 15
mensur
avel, 10
simples, 11
funcional
positivo, 70
grupo
de Lie, 144
topol
ogico, 144

hip
otese erg
odica, 75
hipersuperfcie de energia, 115

integral
de Lebesgue, 12
de uma funca
o simples, 11
interc
ambio de intervalos, 148
isometria, 69, 93
iterado de uma medida, 59

n
umero
balanceado, 103
normal, 103
norma
Lp , 16
da convergencia uniforme, 55
de uma matriz, 86
operador
de Koopman, 58, 69
dual, 69
positivo, 55, 56, 69, 70
unit
ario, 93
ponto
de densidade, 14
recorrente, 31
probabilidade, 3
produto semi-direto, 61, 72
raio especctral, 70
rotaca
o, 3840

irracional, 39
racional, 39
serie de Fourier, 110
sequencia
subaditiva, 85
sistemas hamiltonianos, 115
suporte
de uma medida, 8

233
erg
odico de Birkhoff, 80, 81
erg
odico subaditivo, 76, 86
espectral, 192
Portmanteau, 52
recorrencia de Poincare, 32
topologia
discreta, 24, 106
fraca, 57
fraca , 50, 51, 57
mais forte, 52
mais fraca, 52
pontual, 71
produto, 105
uniforme, 71
toro de dimens
ao d, 40
transformaca
o
de Gauss, 36
de Poincare, 62, 64
de primeiro retorno, 43, 62, 64
expansiva, 215
induzida, 44
topologicamente fracamente misturadora, 195
topologicamente misturadora, 164
transitiva, 106
transitividade, 121

INDICE

DR
AF

tempo
de primeiro retorno, 30, 43
medio de retorno, 31
medio de visita, 80
tempo de primeiro retorno, 64
Teorema
de Keane, 151
de Lusin, 20, 22
de Masur e Veech, 152
KAM, 116
normal de Borel, 103
teorema
da convergencia dominada, 14
da convergencia mon
otona, 14
das classes mon
otonas, 5
de Banach-Alaoglu, 57
de Birkhoff, 76
vari
avel aleat
oria, 71
de Brin-Katok, 216
vetor
de derivaca
o de Lebesgue, 15
de comprimentos, 149
de existencia de medidas invarianvetor racionalmente independente, 40
tes, 49
de extens
ao de medidas, 4
de Friedman-Ornstein, 225
de Furstenberg-Kesten, 92
de Haar, 145
de Kac, 30
de Kingman, 76, 86
de Liouville, 43
de Prohorov, 58
de Rad
on-Nikodym, 15
de recorrencia de Birkhoff, 61
de recorrencia de Poincare, 29, 31
de Riesz-Markov, 56
de Schauder-Tychonoff, 60
de von Neumann, 76, 78
de Weyl, 152

Você também pode gostar