Você está na página 1de 150

Introducao a` Teoria Ergodica

Krerley Oliveira e Marcelo Viana

ii

Pref
acio
Em termos simples, a Teoria Erg
odica e a disciplina matematica que estuda
sistemas din
amicos munidos de medidas invariantes. Comecaremos por dar as
denicoes precisas destas nocoes e algumas das principais motivacoes para o
seu estudo. No nal deste prefacio faremos alguns comentarios sobre a hist
oria
desta disciplina.

Sistemas din
amicos
H
a v
arias denicoes, mais ou menos gerais, do que e um sistema dinamico. Nos
nos restringiremos a dois modelos principais. O primeiro deles, ao qual nos
referiremos na maior parte do tempo, s
ao as transformacoes f : M M em
algum espaco metrico ou topol
ogico M . Heuristicamente, pensamos em f como
associando a cada estado x M do sistema o estado f (x) M em que o sistema
se encontrar
a uma unidade de tempo depois. Trata-se portanto de um modelo
de din
amica com tempo discreto.
Tambem consideraremos uxos, que sao modelos de sistemas dinamicos a
tempo contnuo. Lembre que um uxo em M e uma famlia f t : M M , t R
de transformacoes satisfazendo
f 0 = identidade

f t f s = f t+s para todo t, s R.

(1)

Fluxos aparecem, por exemplo, associados a equacoes diferenciais: tome como


f t a transformacao que associa a cada ponto x o valor no tempo t da solucao
da equacao que passa por x no tempo zero.
Num caso e no outro, sempre iremos supor que o sistema din
amico e pelo
menos mensuravel: na maior parte dos casos ser
a ate contnuo, ou mesmo diferenciavel.

Medidas invariantes
Sempre consideraremos medidas denida na -algebra de Borel do espaco M .
Dizemos que e uma probabilidade se (M ) = 1. Na maior parte dos casos
trataremos com medidas nitas, isto e, tais que (M ) < . Neste caso sempre
podemos transformar numa probabilidade : para isso basta denir
(E) =

(E)
(M )

para cada conjunto mensur


avel E M.
iii

iv
Em geral, uma medida diz-se invariante pela transformacao f se
(E) = (f 1 (E))

para todo conjunto mensur


avel E M.

(2)

Heuristicamente, isto signica que a probabilidade de um ponto estar num dado


conjunto e a probabilidade de que a sua imagem esteja nesse conjunto s
ao
iguais. Note que a denicao (2) faz sentido, uma vez que a pre-imagem de um
conjunto mensur
avel por uma transformacao mensuravel ainda e um conjunto
mensuravel.
No caso de uxos, substitumos (2) por
(E) = (f t (E))

para todo mensuravel E M e todo t R.

(3)

Porque medidas invariantes ?


Como em todo ramo da Matematica, parte importante da motivacao e intrnseca
e estetica: estas estruturas matematicas tem propriedades profundas e surpreendentes que conduzem a` demonstracao de belssimos teoremas. Igualmente fascinante, ideias e resultados da Teoria Erg
odica se aplicam em outras areas da
Matematica que a priori nada tem de probabilstico, por exemplo a Combinat
oria e a Teoria dos N
umeros.
Outra raz
ao e que muitos fen
omenos importantes na Natureza e nas ciencias
experimentais sao modelados por sistemas dinamicos que deixam invariante alguma medida interessante. O exemplo mais importante, historicamente, veio
da Fsica: sistemas hamiltonianos, que descrevem a evolucao de sistemas conservativos na mec
anica newtoniana, s
ao descritos por uxos que preservam uma
medida natural, a medida de Liouville. Ali
as veremos que sistemas dinamicos
muito gerais possuem medidas invariantes.
Ainda outra motivacao fundamental para que nos interessemos por medidas
invariantes e que o seu estudo pode conduzir a informacao importante sobre
o comportamento din
amico do sistema, que dicilmente poderia ser obtida de
outro modo. O teorema de recorrencia de Poincare e uma excelente ilustracao
do que acabamos de dizer.

Breve apresentac
ao hist
orica
A palavra erg
odico e a concatenacao de duas palavras gregas, ergos = trabalho
e odos = caminho, e foi introduzida por Boltzmann, no seculo XIX, no seu
trabalho sobre a teoria cinetica dos gases. Os sistemas em que Boltzmann,
Maxwell, Gibbs, os principais fundadores da teoria cinetica, estavam interessados sao descritos por um uxo hamiltoniano, ou seja, uma equacao diferencial
da forma

 

dqn dp1
dpn
H
H
H
H
dq1
,...,
,
,...,
,...,
,
,...,
.
=
dt
dt dt
dt
p1
pn
q1
qn
Boltzmann acreditava que as orbitas tpicas do uxo preenchem toda a superfcie
otese erg
odica, ele deduzia
de energia H 1 (c) que as contem. A partir desta hip

v
que as medias temporais de grandezas observaveis (funcoes) ao longo de orbitas
tpicas coincidem com as respectivas medias espaciais na superfcie de energia,
um fato crucial para a sua formulacao da teoria cinetica.
De fato, esta hipotese e claramente falsa e, com o tempo, tornou-se usual
chamar hip
otese ergodica a sua consequencia de igualdade das medias temporais e espaciais. Sistemas para os quais esta igualdade vale foram chamados
erg
odicos. E pode dizer-se que uma boa parte da Teoria Erg
odica, tal como ela
se desenvolveu ao longo do seculo XX, foi motivada pelo problema de decidir se
a maioria dos sistemas hamiltonianos, especialmente aqueles que aparecem na
teoria cinetica dos gases, sao erg
odicos ou n
ao.
Um avanco fundamental ocorreu nos anos trinta, quando von Neumann e
Birkho provaram que medias temporais existem para quase toda orbita. Espetacularmente, em meados dos anos cinquenta, Kolmogorov provou que muitos
sistemas hamiltonianos n
ao s
ao erg
odicos. Este resultado foi muito expandido
por Arnold e por Moser, no que veio a ser chamado teoria KAM em homenagem
aos tres.
Por outro lado, ainda nos anos trinta, E. Hopf tinha dado os primeiros exemplos importantes de sistemas hamiltonianos ergodicos, os uxos geodesicos de
superfcies com curvatura negativa. O seu resultado foi generalizado por Anosov,
nos anos sessenta, para variedades de qualquer dimensao. De fato, Anosov
tratou uma classe bem mais geral de sistemas, tanto com tempo contnuo como
com tempo discreto, que sao chamados sistemas de Anosov, ou globalmente
hiperb
olicos.
Nos anos setenta, Sinai desenvolveu a teoria das medidas de Gibbs dos sistemas de Anosov, conservativos ou dissipativos, que foi logo em seguida estendida por Ruelle e por Bowen para sistemas chamados Axioma A, ou uniformemente hiperbolicos, constituindo uma das maiores realizacoes da teoria
erg
odica diferenciavel. N
ao podemos deixar de mencionar, nesta breve lista de
contribuicoes fundamentais, a introducao da nocao de entropia por Kolmogorov
e Sinai no nal dos anos cinquenta, e a demonstracao, por Ornstein cerca de
dez anos depois, de que a entropia e um invariante completo para deslocamentos
(shifts) de Bernoulli.

Krerley Oliveira

e Marcelo Viana

1 Departamento de Matem
atica, Universidade Federal de Alagoas, Campus A. C. Sim
oes
s/n, 57072-090 Macei
o, Brasil. krerley@mat.ufal.br.
2 IMPA, Estrada D. Castorina 110, 22460-320 Rio de Janeiro, Brasil viana@impa.br.

vi

Conte
udo
0 Elementos de Teoria da Medida
0.1 Espacos mensur
aveis . . . . . . .
0.2 Espacos de medida . . . . . . . .
0.3 Integracao em espacos de medida
0.4 Exerccios . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

1
1
2
6
10

1 Teorema de Recorr
encia de Poincar
e
1.1 Vers
ao mensuravel . . . . . . . . . .
1.2 Vers
ao topol
ogica . . . . . . . . . . .
1.3 Recorrencia para medidas innitas .
1.4 Exerccios . . . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

13
13
14
15
15

2 Exemplos de Medidas Invariantes


2.1 Expans
ao decimal . . . . . . . . . . .
2.2 Sistemas conservativos . . . . . . . . .
2.3 Deslocamentos (shifts) de Bernoulli
2.4 Transformacao de Gauss . . . . . . . .
2.5 Exerccios . . . . . . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

17
18
19
21
22
26

3 Exist
encia de Medidas Invariantes
3.1 Alguns exemplos simples . . . . . . . . . .
3.2 A topologia fraca no espaco das medidas
3.3 Demonstracao do Teorema de Existencia .
3.4 Exerccios . . . . . . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

27
27
28
32
34

.
.
.
.

4 Teorema Erg
odico de Birkho
37
4.1 Enunciados e coment
arios . . . . . . . . . . . . . . . . . . . . . . 37
4.2 Demonstracao do teorema ergodico . . . . . . . . . . . . . . . . . 39
4.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5 Ergodicidade
43
5.1 Exemplos e aplicacoes . . . . . . . . . . . . . . . . . . . . . . . . 44
5.2 Equivalencia Espectral . . . . . . . . . . . . . . . . . . . . . . . 51
5.3 Propriedades de medidas erg
odicas . . . . . . . . . . . . . . . . . 54
vii


CONTEUDO

viii
5.4
5.5
5.6

Teorema de decomposicao erg


odica . . . . . . . . . . . . . . . . .
Teorema de desintegracao . . . . . . . . . . . . . . . . . . . . . .
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

56
60
64

6 Sistemas Misturadores
67
6.1 Denicoes e exemplos . . . . . . . . . . . . . . . . . . . . . . . . 67
6.2 Deslocamentos de Markov . . . . . . . . . . . . . . . . . . . . . . 69
6.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
7 Entropia M
etrica
7.1 Entropia de uma particao . . . .
7.2 Entropia de um sistema erg
odico
7.3 Teorema de Kolmogorov-Sinai . .
7.4 Equivalencia ergodica . . . . . .
7.5 Equivalencia Espectral . . . . . .
7.6 A entropia como invariante . . .
7.7 Exerccios . . . . . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

77
77
80
83
83
84
85
86

8 Entropia Topol
ogica
8.1 Denicao via coberturas . . . . .
8.2 Denicao via conjuntos geradores
8.3 Entropia de uxos . . . . . . . .
8.4 Pressao topol
ogica . . . . . . . .
8.5 Princpio variacional . . . . . . .
8.6 Exerccios . . . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

89
89
91
92
93
94
96

9 Transforma
c
oes Expansoras
9.1 Lema de distorcao . . . . . . . .
9.2 Medidas absolutamente contnuas
9.3 Existencia de medidas erg
odicas .
9.4 Unicidade e conclusao da prova .
9.5 Exerccios . . . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

97
98
100
101
102
103

10 Estados de Equilbrio
10.1 Denicao de Estado de Equilbrio
10.2 Transformacoes expansivas . . . .
10.3 Transformacoes expansoras . . .
10.4 Exerccios . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

105
105
106
110
121

11 Aplica
c
oes em Teoria dos N
umeros
123
11.1 Teorema de Szemeredi . . . . . . . . . . . . . . . . . . . . . . . . 123
11.2 Teorema de Weyl . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
11.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136


CONTEUDO

ix

12 Resultados em Teoria Erg


odica Diferenci
avel
137
12.1 Fluxos geodesicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
12.2 Hiperbolicidade n
ao-uniforme . . . . . . . . . . . . . . . . . . . . 137
12.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

CONTEUDO

Captulo 0

Elementos de Teoria da
Medida
Neste captulo inicial recordamos algumas nocoes e resultados b
asicos da Teoria da Medida que s
ao u
teis para o que segue. As demonstracoes podem ser
encontradas nos livros de Castro [Cas04], Fernandez [Fer02] ou Rudin [Rud87].

0.1

Espacos mensur
aveis

Comecamos por introduzir as nocoes de algebra e -algebra de subconjuntos.


Em seguida denimos espacos mensur
aveis e apresentamos uma tecnica de
construcao de -algebras. Seja M um conjunto.
Deni
c
ao 0.1. Uma
algebra de subconjuntos de M e uma famlia B de subconjuntos que contem M e e fechada para as operacoes elementares de conjuntos:
A B implica Ac = M \ A B
A B e B B implica A B B.
Ent
ao A B = (Ac B c )c e A \ B = A B c tambem estao em B, quaisquer
que sejam A, B B. Alem disso, por associatividade, a uni
ao e a interseccao
de qualquer n
umero nito de elementos de B tambem estao em B.
Deni
c
ao 0.2. Uma algebra diz-se uma -
algebra de subconjuntos de M se
tambem for fechada para uni
oes enumer
aveis:
Aj B para j = 1, 2, . . . , n, . . . implica

Aj B.

j=1

Observa
c
ao. B tambem e fechada para interseccoes enumer
aveis: se Aj B




c
para j = 1, 2, . . . , n, . . . ent
ao
Aj =
Acj B.
j=1

j=1

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

Deni
c
ao 0.3. Um espaco mensur
avel e uma dupla (M, B) onde M e um
conjunto e B e uma -algebra de subconjuntos de M . Os elementos de B sao
chamados conjuntos mensur
aveis.
Em seguida apresentamos alguns exemplos de -algebras remetendo para os
exerccios o estudo de outros exemplos.
Exemplo 0.4. Seja M um conjunto qualquer.
ao
1. Denotemos por 2M a famlia de todos os subconjuntos de M . Ent
B = 2M e claramente uma -algebra.
2. B = {, M } e tambem uma -algebra.
Note que se B e uma algebra de um conjunto M ent
ao {, M } B 2M .
M
Portanto {, M } e a menor algebra e 2 e a maior algebra de um conjunto
M . Considere uma famlia n
ao-vazia {Bi : i I} qualquer de -algebras (I e
um conjunto qualquer, que serve apenas para indexar os elementos da famlia).
Ent
ao a interseccao

Bi
B=
iI

e tambem uma -algebra (veja o Exerccio 0.1). Agora, dado um conjunto


qualquer E de subconjuntos de M , podemos aplicar esta ideia `a famlia de todas
as -algebras que contem E. Note que esta famlia e nao vazia, uma vez que
contem a -algebra 2M , pelo menos. De acordo com a observacao anterior, a
interseccao de todas estas -algebras e tambem uma -algebra, e e claro que
contem E. Alem disso, do modo que e construda, ela esta contida em todas as
-algebras que contem E. Portanto e a menor -algebra que contem E.
Deni
c
ao 0.5. A -
algebra gerada por uma famlia E de subconjuntos de M e
a menor -algebra que contem a famlia E.
No caso em que M vem munido da estrutura de espaco topologico, h
a uma
escolha natural para E, nomeadamente, o conjunto dos subconjuntos abertos.
Isto nos conduz `a nocao de -
algebra de Borel.
Deni
c
ao 0.6. Seja (M, ) um espaco topologico, isto e, M um conjunto e
a famlia dos subconjuntos abertos de M . Ent
ao a -
algebra de Borel de M
e a -algebra gerada por , ou seja, a menor -algebra que contem todos os
subconjuntos abertos.

0.2

Espacos de medida

Agora introduzimos o conceito de medida e analisamos algumas das suas propriedades fundamentais. Em seguida apresentamos alguns resultados sobre
construcao de medidas. Finalmente, analisamos duas importantes classes de
medidas: medidas de Lebesgue em espacos euclideanos e medidas produto em
espaco de sequencias.

0.2. ESPAC
OS DE MEDIDA

Deni
c
ao 0.7. Uma medida num espaco mensuravel (M, B) e uma funcao
: B [0, +] que satisfaz:
1. () = 0;


2. ( j=1 Aj ) = j=1 (Aj ) para quaisquer Aj B disjuntos dois-a-dois.
A tripla (M, B, ) e chamada espaco de medida. Quando (M ) = 1 dizemos que
e uma medida de probabilidade e (M, B, ) e um espaco de probabilidade.
A segunda propriedade na denicao de medida e chamada a -aditividade.
Dizemos que uma funcao : B [0, +] e nitamente aditiva se:
(

N


Aj ) =

j=1

(Aj )

j=1

para qualquer famlia nita A1 , . . . , AN B de subconjuntos disjuntos dois-adois. Note que toda medida e, automaticamente, nitamente aditiva.
Exemplo 0.8. Seja M um conjunto e consideremos a -algebra B = 2M . Dado
qualquer p M , consideremos a funcao p : 2M [0, +] denida por:

1 , se p A
p (A) =
.
0 , se p
/A
Temos que p e uma medida, que e usualmente designada por delta de Dirac no
ponto p.
Em seguida apresentamos um resultado muito u
til na construcao de medidas.
lgebra de subconjuntos de M e seja
Teorema 0.9 (Extens
ao). Seja B0 uma a
0 : B0 [0, +] uma funca
o nita, nitamente aditiva. Ent
ao existe uma
u
nica func
ao nita, nitamente aditiva : B [0, +] que e uma extens
ao de
` -
algebra B gerada por B0 . Se 0
0 (isto e, restrita a B0 coincide com 0 ) a
e -aditiva ent
ao tambem o e.
Em geral, ao aplicar este resultado o mais difcil e vericar a -aditividade.
O criterio mais usado para esse efeito e expresso no seguinte resultado. A sua
demonstracao e proposta como Exerccio 0.7.
lgebra e seja 0 : B0 [0, +]
Teorema 0.10 (-aditividade). Seja B0 uma a
uma funca
o nitamente aditiva com 0 (M ) = 1. Suponha que
lim 0 (

n


Aj ) = 0

(1)

j=1

para
aveis tal que
toda a sequencia A1 Aj de conjuntos mensur
A
=
.
Ent
a
o

e
-aditiva.
j
0
j=1

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

O resultado seguinte nos diz que todo o elemento B da -algebra gerada por
uma algebra e aproximado por algum elemento B0 da algebra, no sentido em
que a medida da diferenca simetrica BB0 = B \ B0 B0 \ B e pequena.
Teorema 0.11 (Aproxima
c
ao). Seja (M, B, ) um espaco de probabilidade e
lgebra que gera a -
algebra B. Ent
ao para todo o > 0 e todo
seja B0 uma a
B B existe B0 B0 tal que (BB0 ) < .

0.2.1

Medida de Lebesgue

A medida de Lebesgue corresponde ao que entendemos por volume de subconjuntos de Rd . Para constru-la, recorremos ao Teorema de Extensao 0.9.
Consideremos M = [0, 1] e seja B0 a famlia de todos os subconjuntos da forma
f
B = I1 IN onde I1 , . . . , IN sao intervalos disjuntos dois-a-dois. E
acil ver
que B0 e uma algebra de subconjuntos de M . Alem disso, temos uma funcao
0 : B0 [0, 1] denida nesta algebra por


0 I1 IN = |I1 | + + |IN | ,
onde |Ij | representa o comprimento de Ij . Note que 0 (M ) = 1. Alem
disso, a -algebra gerada por B0 coincide com a -algebra de Borel de M , j
a
que todo aberto pode ser escrito como uni
ao enumer
avel de intervalos disjuntos
dois-a-dois. Pelo Teorema 0.9, existe uma u
nica probabilidade denida na
-algebra de [0, 1] que e uma extensao de 0 `a -algebra B gerada por B0 .
Chamamos de medida de Lebesgue em [0, 1]. Mais geralmente, denimos
ao d 1 da
medida de Lebesgue no cubo M = [0, 1]d de qualquer dimens
seguinte maneira: chamamos ret
angulo em M qualquer subconjunto da forma
R = I1 Id onde os Ij sao intervalos, e denimos
0 (R) = |I1 | |Id | .
Em seguida, consideramos a algebra B0 dos subconjuntos de [0, 1]d da forma
B = R1 RN , onde R1 , . . . , RN sao ret
angulos disjuntos dois-a-dois, e
denimos
0 (B) = 0 (R1 ) + 0 (RN )
para todo B nessa algebra. A medida de Lebesgue em M = [0, 1]d e a extensao
de 0 `
a -algebra gerada por B0 , que coincide com a -algebra de Borel de
M . Finalmente, denimos a medida de Lebesgue num espaco euclidiano Rd
decompondo o espaco em cubos de lado unit
ario



[m1 , m1 + 1) [md , md + 1)
Rd =
m1 Z

md Z

e denindo, para cada subconjunto mensur


avel E,




E [m1 , m1 + 1) [md , md + 1) .
(E) =
m1 Z

md Z

0.2. ESPAC
OS DE MEDIDA

Exemplo 0.12 (Medida de Volume em S 1 ). Considere a aplicacao sobrejetora : [0, 1] S 1 denida por:
(t) = e2it .
A medida de Lebesgue em S 1 e a medida denida por (A) = m( 1 (A)).
Observe que com esta denicao, a medida de A e igual a medida de R (A), onde
odulo multiplicacao
R : S 1 S 1 denota a rotacao de angulo . Na verdade, m
por um n
umero positivo, e a u
nica medida que satisfaz essa condicao para
todo .
Exemplo 0.13. Seja : [0, 1] R uma funcao contnua e positiva. Dena a
medida num intervalo [a, b] por:
b
([a, b]) =
(x) dx.
a

Observe que e aditiva e com o auxlio dos Teoremas 0.10 e 0.9 podemos
estender para toda -algebra dos Borelianos de [0, 1]. A medida tem
a seguinte propriedade especial: se um conjunto A [0, 1] tem medida de
Lebesgue 0 entao (A) = 0. Essa propriedade nos diz que e absolutamente
contnua com respeito `a medida de Lebesgue. A densidade de em relacao a
m e igual a . Estudaremos tais medidas com mais detalhes na Seccao 0.3.2.
Exemplo 0.14. Vamos agora exibir uma medida que, apesar de ser positiva
em qualquer aberto, n
ao e absolutamente contnua com respeito a medida de
Lebesgue. Para isso, considere uma enumeracao {r1 , r2 , . . . } do conjunto Q dos
racionais. Dena por:
1
(A) =
.
2i
ri A

Observe que a medida de qualquer aberto da reta e positiva, pois necessariamente A contem algum i, e, apesar disso, (Q) = 1. Em particular, n
ao e
absolutamente contnua com respeito a medida de Lebesgue.
O exemplo anterior nos motiva a denir o suporte de uma medida:
Deni
c
ao 0.15. Seja (M, B, ) um espaco de medida e M um espaco topologico.
O suporte da medida e o fecho do conjunto de pontos x M tais que para
qualquer vizinhanca aberta Vx contendo x, temos que (Vx ) > 0.
Fica como exerccio para o leitor mostrar que o suporte de uma medida e
sempre um conjunto fechado (10.6).

0.2.2

Medida produto no espa


co das sequ
encias

Consideremos os espacos de probabilidade (Mi , Bi , i ), com i Z. Vamos construir uma probabilidade no conjunto
M=


i=

Mi

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

das sequencias bilaterais (xi )


i= com xi Mi para cada i. Mais precisamente, a medida ser
a denida na -
algebra produto B das -algebras Bi , que
e caracterizada do seguinte modo: dados inteiros m n e conjuntos Aj Bj
para m j n, consideremos
[m; Am , . . . , An ] = {(xi )iZ : xj Aj para m j n}.
oes niEstes subconjuntos de M sao chamados cilindros. A famlia B0 das uni
tas de cilindros disjuntos dois-a-dois e uma algebra. Por denicao, a -algebra
produto B e a -algebra gerada por B0 . Para construir a medida procedemos do seguinte modo: primeiramente, consideramos a aplicacao denida na
famlia dos cilindros por
([m; Am , . . . , An ]) =

j (Aj ).

j=m

Em seguida estendemos `a algebra B0 , estipulando que a imagem de qualquer


uni
ao nita de cilindros disjuntos dois-a-dois e igual a` soma das imagens dos
cilindros. Esta extens
ao est
a bem denida e e nitamente aditiva. Ent
ao,
recorrendo aos Teoremas 0.10 e 0.9, obtemos uma medida de probabilidade
em (M, B) que estende .
Deni
c
ao 0.16. O espaco de probabilidade (M, B, ) construdo acima e designado produto direto dos espacos (Mi , Bi , i ).
Existe um caso particular importante, que corresponde a` situacao onde os
espacos (Mi , Bi , i ) sao todos iguais a um dado (X, C, ), em que X = {1, . . . , d}
e um conjunto nito e C = 2X e a -algebra de todos os subconjuntos de X.
Neste caso basta considerar apenas cilindros elementares, isto tais que cada Aj
consiste de um u
nico ponto de X. De fato, todo cilindro e uma uni
ao nita
disjunta de tais cilindros elementares. Obtemos entao subconjuntos de M da
forma
[m; am , . . . , an ] = {(xi )
i= M : xm = am , . . . , xn = an }
onde aj {1, . . . , d}. A medida e designada medida de Bernoulli denida por
e e caracterizada por ([m; am , . . . , an ]) = ({am }) ({an }).

0.3

Integra
c
ao em espacos de medida

Nesta secao denimos a nocao de integral de uma funcao em relacao a uma medida e apresentamos teoremas fundamentais da Teoria da Medida. Para tanto,
introduziremos algumas classes de funcoes. Ao longo desta secao (M, B, ) sera
sempre um espaco de medida.
Deni
c
ao 0.17. Seja B(R) a -algebra de Borel de R. Uma funcao f : M R
diz-se mensur
avel se f 1 (D) B para todo D B(R).

EM ESPAC
0.3. INTEGRAC
AO
OS DE MEDIDA

O espaco das funcoes mensuraveis possui diversas propriedades muito u


teis.
Vamos enuncia-las como proposicao:
Proposi
c
ao 0.18. Sejam f1 , f2 func
oes mensur
aveis e c1 , c2 R. Ent
ao
tambem s
ao mensur
aveis as seguintes func
oes:
1. ent
ao (c1 f1 + c2 f2 )(x) = c1 f1 (x) + c2 f2 (x)
2. (f1 f2 )(x) = f1 (x) f2 (x)
3. max{f1 , f2 }(x) = max{f1 (x), f2 (x)}
Dizemos que uma funcao s : M R e simples se existem constantes
1 , . . . , k R e conjuntos A1 , . . . , Ak B disjuntos dois-a-dois tais que
s=

k XAk ,

j=1

onde XA e a funcao caracterstica do conjunto A, isto e, XA (x) e igual a 1 se


x A e zero caso contr
ario. Introduzimos agora a nocao de integral. Para tal
comecamos por denir integral de uma funcao simples.
Deni
c
ao 0.19. Seja s uma funcao simples da forma acima. Ent
ao a integral
de s em relacao a e dado por:

s d =

k (Ak ).

j=1

f
E
acil vericar que esta denicao e coerente: se duas combinacoes lineares
de funcoes caractersticas denem uma mesma funcao simples, os valores das
integrais obtidos a partir das duas combinacoes coincidem. O pr
oximo passo
e denir integral de uma funcao mensuravel qualquer. Para isso, trataremos
primeiro do caso da funcao ser n
ao-negativa. Necessitamos do seguinte resultado, que nos diz que qualquer funcao mensuravel e o limite de uma sequencia
de funcoes simples mensuraveis:
Teorema 0.20. Seja f : M [, ] uma func
ao mensur
avel. Ent
ao existe
uma sequencia s1 , s2 , . . . de func
oes simples mensur
aveis tal que
lim sk (x) = f (x) para todo o x M.

Se f 0 ent
ao a sequencia pode ser escolhida de modo que 0 s1 s2 .
A demonstracao deste teorema e proposta como Exerccio 0.16. Ele torna
possvel a seguinte

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

Deni
c
ao 0.21. Seja f : M [0, ] uma funcao mensuravel n
ao-negativa.
Ent
ao


sn d,
f d = lim
n

onde s1 s2 . . . e uma sequencia de funcoes simples crescentes para f , isto


e, lim sn (x) = f (x) para todo x M .
n

f
E
acil vericar que o valor da integral n
ao depende da escolha da sequencia
de funcoes simples, e portanto esta denicao e coerente. Para estender a
denicao de integral a quaisquer funcoes mensuraveis, observemos que dada
uma funcao f : M R sempre podemos escrever f = f + f onde f + (x) =
max{f (x), 0} e f (x) = max{f (x), 0} sao n
ao-negativas. Mostra-se tambem
que f + e f sao mensuraveis se e so se, f e mensuravel.
Deni
c
ao 0.22. Seja f : M [0, ] uma funcao mensuravel. Ent
ao


f d =

f + d

f d,

desde que alguma das integrais do lado direito seja nita.


Deni
c
ao 0.23. Dizemos que uma funcao e integr
avel se for mensur
avel e tiver
integral nita. Denotamos o conjunto das funcoes integr
aveis por L1 (M, B, )
ou, mais simplesmente, por L1 (M, ).
Dada uma funcao mensuravel f : M R e um conjunto mensur
avel E
denimos a integral de f sobre E por

f XE d,

f d =
E

onde XE e a funcao caracterstica do conjunto E.


Exemplo 0.24. Sejam x1 , . . . , xm M e p1 , . . . , pm > 0 com p1 + + pm = 1.
Consideremos a medida de probabilidade : 2M [0, 1] dada por:
(A) =

pi .

xi A

m
Notemos que = i=1 pi xi , onde xi e a medida delta de Dirac em xi . Neste
caso temos que se f e uma funcao integr
avel entao

f d =

m

i=1

f (xi )pi .

EM ESPAC
0.3. INTEGRAC
AO
OS DE MEDIDA

0.3.1

Teorema de derivac
ao de Lebesgue

Comecemos por introduzir a nocao de quase em toda a parte em relacao a


uma medida. Dizemos que uma propriedade e valida em -quase todo ponto
se e valida em todo o M exceto, possivelmente, num conjunto de medida nula.
Por exemplo, dizemos que duas funcoes f, g sao iguais em -quase todo ponto
se existe um conjunto mensuravel N com (N ) = 0 tal que f (x) = g(x) para
todo x M \ N .
algebra de
Teorema 0.25 (Deriva
c
ao de Lebesgue). Seja M = Rd , B a -
Borel e a medida de Lebesgue em Rd . Seja f : M R uma func
ao localmente
avel para todo compacto K Rd . Ent
ao
integr
avel, isto e, tal que f XK e integr

1
|f (y) f (x)|d = 0.
lim
r0 (B(x, r)) B(x,r)
em -quase todo ponto x Rd . Em particular, em -quase todo o ponto x Rd
tem-se

1
lim
f (y)d = f (x).
r0 (B(x, r)) B(x,r)
Dado um subconjunto mensuravel A de Rd , dizemos que um ponto a A e
um ponto de densidade de A se este conjunto preenche a maior parte de qualquer
pequena vizinhanca de a, i.e,
lim

(B(a, ) A)
= 1.
(B(a, )

(2)

O pr
oximo resultado e uma consequencia direta do teorema de derivacao de
Lebesgue. No Exerccio 0.13 sugerimos uma demonstracao.
Teorema 0.26. Seja A um subconjunto mensur
avel de Rd com medida de
Lebesgue (A) maior que zero. Ent
ao -quase todo ponto a A e ponto de
densidade de A.
Muitos dos resultados envolvendo funcoes vao se apoiar no chamado Teorema da Convergencia Dominada, que garante que se uma sequencia de funcoes
convergente e menor que uma funcao integr
avel, ent
ao o limite das suas integrais
converge e podemos tomar o limite sob o sinal da integral. Mais precisamente:
Teorema 0.27 (Teorema da Converg
encia Dominada). Consideremos
oes mensur
aveis e g uma func
ao integr
avel
fn : M R uma sequencia de func
tal que |fn (x)| |g(x)| para -quase todo x em M. Se para -quase todo x M
ao a func
ao f e integr
avel e
a sequencia fn (x) converge para o valor f (x), ent
vale:


lim

fn d =

f d.

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

10

0.3.2

Teorema de Radon-Nikodym

Sejam e duas medidas num espaco mensuravel (M, B). Dizemos que e
absolutamente contnua em relacao a se (E) = 0 implica (E) = 0, qualquer
que seja o conjunto mensur
avel. Nesse caso escrevemos . O Teorema
de RadonNikodym arma que nesse caso a medida pode ser vista como
o produto de por alguma funcao mensuravel, que e chamada densidade ou
derivada de Radon-Nikodym de relativamente a .
Teorema 0.28 (Radon-Nikodym). Se e s
ao medidas nitas tais que
ent
ao existe uma func
ao mensur
avel : M [0, +] tal que = ,
ou seja, tal que

d para todo o conjunto mensur
avel E M.
(E) =
E

Alem disso, essa func


ao e essencialmente u
nica: duas quaisquer coincidem
quase em toda a parte.

0.4

Exerccios

0.1. Seja M um conjunto e, para cada i pertencente a um conjunto de ndices


I, seja Bi uma -algebra de subconjuntos de M . Mostre que

B=
Bi
iI

e uma -algebra.
0.2. Seja M um conjunto e considere a famlia de conjuntos
B0 = {A M : A e nito ou Ac e nito}.
Mostre que B0 e uma algebra. Alem disso, B0 e uma -algebra se e somente se
o conjunto M e nito.
0.3. Seja M um conjunto e considere a seguinte famlia de conjuntos
B1 = {A M : A e nito ou enumer
avel ou Ac e nito ou enumer
avel}.
Mostre que B1 e uma -algebra. De fato, B1 e a -algebra gerada pela algebra
B0 do Exerccio 0.2.
0.4. Seja E uma famlia de subconjuntos de um conjunto M . Mostre que existe
a menor
algebra B0 que contem E. Que relacao existe entre B0 e a -algebra B
gerada por E?
ao em B
0.5. Seja (M, B, ) um espaco de medida. Mostre que se A1 ,A2 , . . . est
ent
ao



(
Aj )
(Aj ).
j=1

j=1

0.4. EXERCICIOS

11

0.6. Seja B = 2M e considere : 2M [0, +] denido por:

#A , se A e nito
(A) =
.

se A e innito
Mostre que e uma medida. Esta medida e designada medida de contagem.
0.7. Demonstre o Teorema 0.10. Dica: Dados
 quaisquer conjuntos disjuntos
dois a dois B1 , . . . , Bn , . . . em B0 tais B = j=1 Bj tambem esta em B0 , dena
Cj = B1 Bj para cada j 1. Verique que os conjuntos Aj = B \ Cj
satisfazem a hipotese (1) no Teorema 0.10.
0.8. Seja (M, B) um espaco mensuravel.
1. Mostre que se : B [0, +] e uma medida entao
(

j=1

Aj ) = lim (Aj ).
j

para qualquer sequencia crescente A1 A2 An de elementos


de B.
2. Reciprocamente, mostre que se 0 : B [0, +] e uma funcao nitamente
aditiva que satisfaz a condicao do item anterior ent
ao 0 e -aditiva.
0.9. Seja (M, B) um espaco mensuravel, onde o conjunto M e nao-enumeravel
e a -algebra B e denida como no Exerccio 0.3. Mostre que : B [0, +]
denida por:

0 se A e nito ou enumer
avel
(A) =
c
avel
1 se A e nito ou enumer
e uma medida de probabilidade.
0.10. Sejam f e g funcoes mensuraveis. Mostre que f e integr
avel se e somente
se |f | e integr
avel e, nesse caso,




 f d |f | d.


Alem disso, se f e integr
avel e |f | |g| ent
ao g e integr
avel.
0.11. Seja E um conjunto mensur
avel com (E) = 0. Mostre que
para qualquer funcao mensuravel f .


E

f d = 0

0.12. Mostre que a e um ponto de densidade do conjunto A se e so se




(B A)
: B bola contida em B(a, ) e contendo a = 1
lim inf
0
(B)

12

CAPITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

0.13. Demonstre o Teorema 0.26.


0.14. Seja x1 , x2 M e p1 , p2 , q1 , q2 > 0 com p1 + p2 = q1 + q2 = 1. Considere
as medidas de probabilidade e dadas por


pi ,
(A) =
qi ,
(A) =
xi A

xi A

ou seja, = p1 x1 + p2 x2 e = q1 x1 + q2 x2 . Mostre que e e


calcule as respectivas derivadas de Radon-Nikodym.
ao
0.15. Seja f : M R. Mostre que se f 1 ((, c)) B para todo c R ent
f e mensuravel. Dica: Mostre que a famlia C = {A R : f 1 (A) B} e uma
-algebra e contem todos os subconjuntos abertos.
0.16. Prove o Teorema 0.20. Dica: Trate primeiro o caso onde f e nao-negativa.
0.17. Mostre que o suporte de uma medida e sempre um conjunto fechado.
Conclua que se M e compacto, o suporte de qualquer medida tambem e compacto.
0.18. Mostre que toda funcao f : Rm Rn contnua e mensuravel. De exemplo
de uma funcao mensuravel que n
ao e contnua em nenhum ponto.
0.19. Seja T : M M uma funcao mensuravel e uma medida. Dena
T (A) = (T 1 (A)). Mostre que T e uma medida.

Captulo 1

Teorema de Recorr
encia de
Poincar
e
Um ponto x M diz-se recorrente se a sua trajetoria pelo sistema din
amico
f : M M volta arbitrariamente perto de x quando o tempo vai para innito. A din
amica no conjunto dos pontos n
ao-recorrentes e, em certo sentido,
sempre a mesma, independentemente do sistema dinamico. Por isso, e fundamental compreender o conjunto dos pontos recorrentes, ja que ele contem toda
a din
amica interessante do sistema.
O resultado que estudaremos nesta captulo, enunciado por Poincare perto
do nal do seculo XIX, arma que quase todo ponto e recorrente, relativamente
a qualquer medida invariante nita do sistema din
amico. Daremos duas vers
oes
deste resultado, a primeira numa linguagem mensuravel e a segunda de natureza
mais topol
ogica. Tambem comentaremos que a hip
otese de nitude da medida
n
ao pode ser omitida.

1.1

Vers
ao mensur
avel

Teorema 1.1. Seja f : M M uma transformac


ao mensur
avel e uma
medida invariante nita. Seja E M qualquer conjunto mensur
avel com
(E) > 0. Ent
ao, -quase todo ponto x E tem algum iterado f n (x), n 1,
que tambem est
a em E.
Em outras palavras, o teorema arma que quase todo ponto de E regressa
a E no futuro. Antes mesmo de demonstrar este fato, podemos mostrar que ele
implica outro aparentemente mais forte: quase todo ponto de E regressa a E
innitas vezes:
Corol
ario 1.2. Nas condic
oes do Teorema 1.1, para -quase todo ponto x E
a em E.
existem innitos valores de n 1 tais que f n (x) est
Demonstrac
ao. Para cada k 1 vamos representar por Ek o conjunto dos
pontos x E que regressam a E exatamente k vezes: existem exatamente k
13

CAPITULO 1. TEOREMA DE RECORRENCIA


DE POINCARE

14

valores de n 1 tais que f n (x) E. Observe que o conjunto dos pontos que
regressam a E apenas um n
umero nito de vezes e precisamente

Ek .

k=1

Portanto, para provar o corol


ario, basta mostrar que (Ek ) = 0 para todo k 1.
A demonstracao ser
a por contradicao.
ao, aplicando o TeoSuponhamos que (Ek ) > 0 para algum k 1. Ent
rema 1.1 com este Ek no lugar de E, obtemos que quase todo ponto x Ek tem
algum iterado f n (x) que esta em Ek . Fixemos um tal x e denotemos y = f n (x).
Por denicao, y tem exatamente k iterados futuros que est
ao em E. Como y e
um iterado de x, isso implica que x tem k + 1 iterados futuros em E. Mas isso
contradiz o fato de que x Ek . Esta contradicao prova que Ek tem medida
nula, relativamente a , e portanto o corol
ario esta demonstrado.
Vamos agora dar a
Demonstrac
ao do Teorema 1.1. Representemos por E 0 o conjunto dos pontos
x E que nunca regressam a E. O nosso objetivo e provar que E 0 tem medida
nula. Para isso, comecamos por armar que as suas pre-imagens f n (E 0 ) sao
disjuntas duas-a-duas. De fato, suponhamos que existem m > n 1 tais que
f m (E 0 ) intersecta f n (E 0 ). Seja x um ponto na interseccao e seja y = f n (x).
Ent
ao y E 0 e f mn (y) = f m (x) E 0 , que esta contido em E. Isto quer
dizer que y volta pelo menos uma vez a E, o que contradiz a denicao de E 0 .
Esta contradicao, prova que as pre-imagens sao disjuntas duas-a-duas, como
armamos.
Isto implica que




f n (E 0 ) =
(f n (E 0 )) =
(E 0 ).

n=0

n=0

n=0

Na u
ltima igualdade usamos a hip
otese de que e invariante, que implica que
(f n (E 0 )) = (E 0 ) para todo n 1. Como supomos que a medida e nita,
a expressao do lado esquerdo e nita. Por outro lado, a` direita temos uma
soma de innitos termos, todos iguais. O u
nico jeito desta soma ser nita e
que as parcelas sejam nulas. Portanto, devemos ter (E 0 ) = 0, tal como foi
armado.

1.2

Vers
ao topol
ogica

Dizemos que um ponto x M e recorrente para uma transformacao f : M M


se, para toda vizinhanca U de x, existe algum iterado f n (x) que esta em U . A
denicao para uxos e analoga, apenas nesse caso o tempo n e um n
umero real.
Na formulacao topol
ogica do teorema de recorrencia supomos que o espaco
M admite uma base enumer
avel de abertos, ou seja, um famlia enumer
avel


1.3. RECORRENCIA
PARA MEDIDAS INFINITAS

15

{Uk : k N} de abertos tal que todo aberto de M pode ser escrito como
uni
ao de elementos Uk dessa famlia. Esta hip
otese e satisfeita na maioria dos
exemplos interessantes.
Teorema 1.3. Suponhamos que M admite uma base enumer
avel de abertos.
Seja f : M M uma transformac
ao mensur
avel e uma medida invariante
nita. Ent
ao, -quase todo ponto x M e recorrente para f .
Demonstrac
ao. Para cada k representamos por Uk0 o conjunto dos pontos x Uk
que nunca regressam a Uk . De acordo com o Teorema 1.1, todo Uk0 tem medida
nula. Consequentemente, a uni
ao enumer
avel

=
U
Uk0
kN

tem medida nula. Portanto, para demonstrar o teorema sera suciente que
e recorrente. Isso e f
mostremos que todo ponto x que n
ao est
a em U
acil, como
vamos ver.
e seja U uma vizinhanca qualquer de x. A denicao de
Seja x M \ U
base de abertos implica que existe algum k N tal que x Uk e Uk U .
, tambem x
Como x n
ao est
a em U
/ Uk0 . Em outras palavras, x tem algum
n
iterado f (x), n 1 que esta em Uk . Em particular, f n (x) tambem esta em
U . Como a vizinhanca U e arbitr
aria, isto prova que x e um ponto recorrente,
como havamos armado.

1.3

Recorr
encia para medidas innitas

As conclusoes dos Teoremas 1.1 e 1.3 nao sao verdadeiras, em geral, se omitirmos
a hip
otese de que a medida e nita. O exemplo mais simples e o seguinte:
Exemplo 1.4. Seja f : R R a translacao de 1 unidade, isto e, f (x) = x + 1
f
para todo x R. E
acil vericar que f deixa invariante a medida de Lebesgue
em R (que e innita). Por outro lado nenhum ponto e recorrente para f .
No entanto, e possvel estender estes enunciados para certos casos de medidas
innitas como, por exemplo, no exerccio que propomos a seguir.
Uma transformacao f : M M diz-se invertvel se e uma bijecao e a sua
inversa e tambem uma transformacao mensuravel. Uma medida diz-se -nita
se existe uma sequencia crescente de subconjuntos Mk cuja uniao e o espaco M
inteiro e tal que cada (Mk ) e nito. Neste caso, diremos que um ponto x vai
para innitose, para qualquer k, existe apenas um n
umero nito de iterados
de x que est
ao em Mk .

1.4

Exerccios

1.1. Mostre que o seguinte enunciado e equivalente ao Teorema 1.1, isto e,


qualquer um dos dois pode ser deduzido a partir do outro: Seja f : M M

16

CAPITULO 1. TEOREMA DE RECORRENCIA


DE POINCARE

uma transformacao mensuravel e uma medida invariante nita. Seja E M


qualquer conjunto mensur
avel com (E) > 0. Ent
ao existe N 1 e um conjunto
D E com medida positiva, tal que f N (x) E para todo ponto x D.
1.2. Suponha que f : M M e invertvel e que e uma medida -nita
invariante por f . Mostre que, dado qualquer conjunto mensuravel E M com
(E) > 0, quase todo ponto x E ou regressa a E ou vai para innito.
Dica: Considere o conjunto E 0,k dos pontos x E que nunca regressam a E
e tem um n
umero innito de iterados em Mk . Comece por mostrar que os seus
iterados f n (E 0,k ) sao dois-a-dois disjuntos. Usando que (Mk ) e nito, deduza
que (E k,0 ) = 0 para todo k.

Captulo 2

Exemplos de Medidas
Invariantes
Nesta captulo vamos descrever alguns exemplos simples de medidas invariantes
por transformacoes ou por uxos. Antes porem, vamos mostrar uma proposicao
caracterizando quando uma medida e invariante:
Proposi
c
ao 2.1. Seja f : M M uma transformac
ao e uma medida. Ent
ao
f preserva se, e somente se, para toda func
ao integr
avel : M R vale:


d = f d.
Demonstrac
ao. Assuma que f preserva a medida . Se e funcao caracterstica
de
algum
conjunto,
digamos = A , e imediato vericar que (f1 (A)) =

f d, j
a que f 1 (A) = f . Assim, ca provado que d = f d,
quando e uma funcao caracterstica. Observe que segue diretamente da linearidade da integral que se e uma funcao simples, ent
ao a igualdade ainda vale.
Finalmente, se e uma funcao integr
avel qualquer, pela denicao de integral


n d,
d = lim
n

onde n e uma sequencia de funcoes simples crescendo para . Por outro lado,
n f e uma sequencia de funcoes simples crescendo para f . Logo,


f d = lim
n f d.
n

Como

n d =

n f d, tomando o limite em ambos os lados, vem que



f d.

d =
17

18

CAPITULO 2. EXEMPLOS DE MEDIDAS INVARIANTES

ao
A recproca e imediata, desde que dado um boreliano A, tomando = A , ent


(A) = (f 1 (A)) d = f d.

2.1

Expans
ao decimal

O nosso primeiro exemplo e


f : [0, 1] [0, 1],

f (x) = 10x [10x]

onde [10x] representa o maior inteiro menor ou igual a 10x. Em outras palavras,
f associa a cada x [0, 1] a parte fracion
aria de 10x. O gr
aco da transformacao
f esta descrito na Figura 2.1.
1

2/5

4/5

6/5

8/5

Figura 2.1: Transformacao parte fracion


aria de 10x

Armamos que a medida de Lebesgue no intervalo e invariante pela transformacao f , isto e, satisfaz a condicao (2). Comecemos por supor que E e um
intervalo. Ent
ao, como ilustrado na Figura 2.1, a pre-imagem f 1 (E) consiste
de dez intervalos, cada um deles dez vezes mais curto do que E. Logo, a medida
de Lebesgue de f 1 (E) e igual a` medida de Lebesgue de E. Isto mostra que (2)
e satisfeita no caso de intervalos. Por outro lado, a famlia dos intervalos gera a
-algebra de Borel de [0, 1]. Portanto, para concluir a demonstracao basta usar
o seguinte fato geral (veja o Exerccio 2.1):
Lema 2.2. Seja f : M M uma transformac
ao mensur
avel e uma medida
nita em M . Suponha que existe uma sub-
algebra geradora I da -
algebra de
ao o mesmo vale para todo
M tal que (E) = (f 1 (E)) para todo E I. Ent
conjunto mensur
avel E, isto e, a medida e invariante por f .

2.2. SISTEMAS CONSERVATIVOS

19

Agora vamos explicar como, a partir do fato de que a medida de Lebesgue


e invariante pela transformacao f , podemos obter conclusoes interessantes e
n
ao-triviais usando o teorema de recorrencia de Poincare.
Comecemos por observar que f tem uma expressao muito simples em termos
de expansoes decimais: se x e dado por
x = 0, a0 a1 a2 a3
com ai {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, ent
ao a sua imagem e dada por
f (x) = 0, a1 a2 a3 .
Com isso, ca muito facil escrever a expressao do iterado n-esimo, para qualquer
n 1:
f n (x) = 0, an an+1 an+2
(2.1)
Agora, seja E o subconjunto dos x [0, 1] cuja expans
ao decimal comeca
ario 1.2, quase
com o dgito 7, ou seja, tais que a0 = 7. De acordo com o Corol
todo elemento de E tem innitos iterados que tambem estao em E. Levando
em conta a expressao (2.1), isto quer dizer que existem innitos valores de n
umero x cuja expans
ao
tais que an = 7. Portanto, provamos que quase todo n
decimal comeca por 7 tem innitos dgitos iguais a 7!
Claro que no lugar de 7 podemos considerar qualquer outro dgito. Alem
disso, podemos considerar blocos de dgitos mais complicados. Veja os Exerccios 2.22.3.
Mais tarde iremos provar resultados mais fortes: para quase todo n
umero
x [0, 1], todo dgito aparece com frequencia 1/10 na sua expans
ao decimal.
O enunciado preciso aparecera na Proposicao 5.2, que ser
a provada a partir do
teorema ergodico de Birkho.

2.2

Sistemas conservativos

Seja U um aberto em algum espaco euclidiano Rd , d 1 e seja f : U U


um difeomorsmo de classe C 1 . Isto quer dizer que f e uma bijecao e tanto ele
quanto a sua inversa sao deriv
aveis com derivada contnua.
Representaremos por vol a medida de Lebesgue, ou volume, em Rk . Em
outras palavras,



vol(B) =
dx1 . . . dxd e
d vol =
(x1 , . . . , xd ) dx1 . . . dxd
B

para qualquer conjunto mensur


avel B e qualquer funcao integr
avel .
A f
ormula de mudanca de variaveis arma que, para qualquer conjunto mensur
avel B U ,

| det Df | d vol

vol(f (B)) =
B

Daqui se deduz facilmente

(2.2)

20

CAPITULO 2. EXEMPLOS DE MEDIDAS INVARIANTES

Lema 2.3. Um difeomorsmo f : M M de classe C 1 deixa invariante o


volume se e somente se o valor absoluto | det Df | do seu jacobiano e constante
igual a 1.
Demonstraca
o. Suponha primeiro que o valor absoluto do jacobiano e igual 1
em todo ponto. Considere um conjunto mensur
avel E e seja B = f 1 (E). A
f
ormula (2.2) d
a que

vol(E) =
1 d vol = vol(B) = vol(f 1 (E)).
B

Isto signica que f deixa invariante o volume e, portanto, provamos a parte


sedo enunciado.
Para provar a parte somente se, suponha que | det Df | fosse maior que 1 em
algum ponto x. Ent
ao, como o jacobiano e contnuo, existiria uma vizinhanca
U de x e algum n
umero > 1 tais que
| det Df (y)|

para todo y U.

Ent
ao a f
ormula (2.2) aplicada a B = U daria

vol(f (U ))
d vol vol(U ).
U

ao
Denotando E = f (U ), isto implica que vol(E) > vol(f 1 (E)) e, portanto, f n
deixa invariante o volume. Do mesmo modo se mostra que se o valor absoluto
do jacobiano e menor que 1 em algum ponto ent
ao f n
ao deixa invariante o
volume.
Os Exerccios 2.42.5 estendem este lema para transformacoes nao necessariamente invertveis e tambem para uma classe mais ampla de medidas. As suas
conclus
oes nos ser
ao u
teis mais tarde.
Agora vamos considerar o caso de uxos f t : U U , t R. Suporemos que
o uxo e de classe C 1 . Claro que o Lema 2.3 se aplica neste contexto: o uxo
deixa invariante o volume se e somente se
det Df t (x) = 1 para todo x U e todo t R.

(2.3)

Facamos duas observacoes simples antes de prosseguirmos. A primeira e que


segue da denicao de uxo que todo f t e invertvel (um difeomorsmo, neste
caso): a sua inversa e f t . A segunda observacao e que o jacobiano de f t e
sempre positivo. Isso e claro quando t = 0 porque, outra vez por denicao de
uxo, f 0 e a identidade. Segue que o mesmo e verdade para todo t R, porque
o jacobiano varia continuamente com t e, como acabamos de ver, nunca se anula.
Embora a resposta que acabamos de dar esteja inteiramente correta, ela nao
e muito u
til na pr
atica porque em geral n
ao temos uma expressao explcita para
ao e claro como vericar a condicao (2.3). Felizmente, existe
f t , e portanto n
uma expressao razoavelmente explcita para o jacobiano, de que iremos falar em
seguida, que pode ser usada em muitas situacoes interessantes.

2.3. DESLOCAMENTOS (SHIFTS) DE BERNOULLI

21

orias de um campo de
Suponhamos que o uxo f t corresponde `as trajet
vetores F : U U de classe C 1 , quer dizer f t (x) e o valor no tempo t da
solucao da equacao diferencial
dx
= F (x)
dt

(2.4)

(quando tratando de equacoes diferenciaveis sempre suporemos que as suas


solucoes estao denidas para todo tempo). A f
ormula de Liouville exprime
o jacobiano de f t em termos do divergente div F do campo de vetores F :

 t

div F (f s (x)) ds .
det Df t (x) = exp
0

Lembre que o divergente de um campo de vetores F e o traco da sua matriz


jacobiana, isto e
F
F
div F =
+ +
.
(2.5)
x1
xd
Combinando esta formula com (2.3) obtemos
Lema 2.4. O uxo f t associado a um campo de vetores F de classe C 1 deixa
invariante o volume se e somente se o divergente de F e identicamente nulo.
O Exerccio 2.6 e uma aplicacao deste fato no caso, muito importante, de
uxos hamiltonianos.

2.3

Deslocamentos (shifts) de Bernoulli

Estes sistemas modelam sequencias de experimentos aleatorios em que o resultado de cada experimento e independente dos demais. Supoe-se que em
cada experimento ha um n
umero nito de resultados possveis, designados por
1, 2, . . . , d, com probabilidades p(1), p(2), . . . , p(d) de ocorrerem, sendo
p(1) + p(2) + + p(d) = 1 .
O conjunto M das sequencias = (n )nZ com cada n {1, 2, . . . , d} contem
os possveis resultados da sequencia de experimentos. Chamam-se cilindros os
subconjuntos da forma
[k, l; ak , . . . , al ] = { M : k = ak , . . . , l = al }
onde k, l Z, com k l, e cada aj {1, 2, . . . , d}. Denimos
([k, l; ak , . . . , al ]) = p(ak ) p(al )
Heuristicamente, isto signica que a probabilidade do evento composto
k = ak

k+1 = ak+1

l = al

(2.6)

CAPITULO 2. EXEMPLOS DE MEDIDAS INVARIANTES

22

e o produto das probabilidades de cada um deles. Isto traduz, precisamente,


que os resultados sucessivos sao independentes entre si.
Consideramos em M a -algebra B gerada pelos cilindros. A famlia B0 das
uni
oes disjuntas nitas dos cilindros e uma algebra (por convencao, M e um
cilindro e (M ) = 1). Estendemos de modo a que seja nitamente aditiva: se
ao disjunta de cilindros C1 , . . . , CN , denimos
E B0 e a uni
(E) = (C1 ) + + (CN ).
Verica-se que esta funcao e, de fato, -aditiva em B0 ; por exemplo, isso pode
ser feito usando o Teorema 0.10. Portanto existe uma u
nica probabilidade na
-algebra B gerada por B0 que e uma extensao de , isto e, que coincide com
ela restrita a B0 . Chamamos essa probabilidade medida de Bernoulli denida
por p(1), p(2), . . . , p(d) e, para n
ao complicar desnecessariamente a notacao, a
representamos tambem por .
No espaco M consideramos a transformacao deslocamento (shift) `a esquerda


f : M M f (n )nZ = (n+1 )nZ
que corresponde a fazer uma translacao no tempo. Observe que a medida de
Bernoulli e invariante por essa transformacao. De fato, se E = [k, l; ak , . . . , al ]
ent
ao f 1 (E) = [k + 1, l + 1; ak , . . . , al ] e a denicao (2.6) d
a que
(E) = (f 1 (E))
neste caso. Como a famlia dos cilindros gera a -algebra B, isto juntamente
com o Lema 2.2, prova que a medida e invariante para f .

2.4

Transformac
ao de Gauss

A transformacao de Gauss G : (0, 1] [0, 1] e denida por G(x) = parte


fracion
aria de 1/x, ou seja,
 
1
1
G(x) =
.
x
x
O gr
aco de G pode ser esbocado facilmente, a partir da seguinte observacao.
Se x (1/2, 1] ent
ao 1/x [1, 2) e portanto a sua parte inteira [1/x] e
igual a 1. Isto quer dizer que neste intervalo a transformacao e dada por
G(x) = (1/x) 1.
Mais geralmente, se x (1/(k + 1), 1/k) para algum k N ent
ao a parte
inteira de 1/x e igual a k, e tem-se G(x) = 1/x k. Veja tambem a
Figura 2.2.
Note que G n
ao est
a denida no ponto x = 0. Alem disso, G(1/k) = 0 para
ao est
a denido nestes pontos
todo k N e portanto o segundo iterado G2 (1/k) n

DE GAUSS
2.4. TRANSFORMAC
AO

23

...

1/4

1/3

1/2

Figura 2.2: Transformacao de Gauss

(e o terceiro iterado n
ao est
a denido nas suas pre-imagens, etc). Isto quer dizer,
a rigor, que G n
ao e um sistema dinamico segundo a denicao que demos antes.
No entanto, isto n
ao coloca nenhum problema para o que pretendemos fazer. De
fato, todos os iterados est
ao bem denidos no conjunto dos n
umeros irracionais:
basta observar que a imagem de um irracional tambem e irracional. Isto e
suciente para os nossos objetivos porque sempre tratamos de propriedade que
valem para quase todo ponto, e o conjunto dos n
umeros irracionais tem medida
de Lebesgue total no intervalo.
O que torna esta transformacao interessante do ponto de vista ergodico e que
G admite uma probabilidade invariante que e equivalente a` medida de Lebesgue
no intervalo. De fato, considere a medida denida por

c
dx para cada mensuravel E [0, 1]
(E) =
E 1+x
onde c e uma constante positiva. Note que a integral est
a bem denida, j
a que
a funcao integranda e contnua no intervalo [0, 1]. Note tambem que
c
m(E) (E) cm(E)
2

para todo mensur


avel E [0, 1].

Em particular, e de fato equivalente a` medida de Lebesgue m: as duas medidas


tem os mesmos conjuntos com medida nula.
Proposi
c
ao 2.5. A medida e invariante por G. Alem disso, se escolhermos
c = 1/log2 ent
ao e uma probabilidade.
Demonstrac
ao. Vamos usar o criterio dado pelo exerccio 2.5: a medida e
invariante por G se tivermos

xf 1 (y)

(x)
= (y)
|G (x)|

onde (x) =

c
1+x

(2.7)

CAPITULO 2. EXEMPLOS DE MEDIDAS INVARIANTES

24

para todo y. Comece por observar que cada y tem exatamente uma pre-imagem
xk em cada intervalo (1/(k + 1), 1/k], dada por
G(xk ) =

1
k =y
xk

xk =

1
.
y+k

Note tambem que G (x) = (1/x) = 1/x2 . Portanto, (2.7) se reescreve como


cx2k
c
=
1 + xk
1+y

k=1

k=1

c
1
=
(y + k)(y + k + 1)
1+y

(2.8)

Para vericar que esta igualdade e realmente satisfeita, observe que


1
1
1
=

.
(y + k)(y + k + 1)
y+k y+k+1
Isto quer dizer que a u
ltima soma em (2.8) pode ser escrita na forma telescopica: todos os termos, exceto o primeiro, aparecem duas vezes, com sinais
contr
arios, e portanto se cancelam. Logo a soma e igual ao primeiro termo, que
e precisamente o que se arma em (2.8). Isto prova a invariancia.
Finalmente, usando a primitiva c log(1 + x) da funcao (x) vemos que

([0, 1]) =
0

c
dx = c log 2.
1+x

Logo, escolhendo c = 1/ log 2 obtemos que e uma probabilidade.


A transformacao de Gauss tem um papel muito importante em teoria dos
n
umeros, devido a` sua relacao com o processo de expansao dos n
umeros em
fracao contnua. Recordemos do que se trata.
Dado um n
umero x0 (0, 1), seja
 
1
1
a1 = G(x0 ).
a1 =
e
x1 =
x0
x0
Note que a1 e um n
umero natural, x1 [0, 1) e tem-se
x0 =

1
.
a1 + x1

Agora, supondo que x1 seja diferente de zero, podemos repetir o processo,


denindo
 
1
1
a2 = G(x1 ).
a2 =
e
x2 =
x1
x1
Ent
ao
x1 =

1
a1 + x2

portanto x0 =
a1 +

1
a2 + x2

DE GAUSS
2.4. TRANSFORMAC
AO

25

Por recorrencia, para cada n 1 tal que xn1 (0, 1) se dene




1
1
an =
an = G(xn1 )
e
xn =
xn1
xn1
e tem-se

x0 =

a1 +
a2 +

(2.9)

1
+

1
an + xn

Nao e difcil mostrar (verique!) que a sequencia


1

zn =

a1 +
a2 +

1
+

1
an

converge para x0 quando n , e e usual traduzir este fato escrevendo


1

x0 =

a1 +
a2 +

(2.10)

1
+

1
an +

que e chamada expans


ao em frac
ao contnua de x0 .
umeros racionais. De fato se mostra que
Note que a sequencia zn consiste de n
estes sao os n
umeros racionais que melhor aproximam o n
umero x0 , no sentido
de que zn esta mais pr
oximo de x0 do que qualquer outro n
umero racional
com denominador menor ou igual que o denominador de zn (escrito em forma
irredutvel). Observe tambem que para obter (2.10) supusemos que xn (0, 1)
para todo n N. Se encontramos algum xn = 0, o processo para nesse momento
ltimo
e consideramos (2.9) a expansao em fracao contnua de x0 . Claro que este u
caso ocorre somente se x0 e um n
umero racional.
Estas ideias de Teoria Ergodica podem ser usadas para obter conclus
oes nao
triviais em Teoria dos N
umeros. Por exemplo (veja o Exerccio 2.7), para quase
umero 7 aparece innitas vezes na sua expans
ao
todo n
umero x0 (1/8, 1/7) o n
em fracao contnua, isto e, tem-se an = 7 para innitos valores de n N.
De fato, mais tarde provaremos um fato muito mais preciso: para quase todo
umero 7 aparece com frequencia
x0 (0, 1) o n
64
1
log
log 2
63
na sua expans
ao em fracao contnua. Tente intuir desde j
a de onde vem este
n
umero!

26

2.5

CAPITULO 2. EXEMPLOS DE MEDIDAS INVARIANTES

Exerccios

2.1. Demonstre o Lema 2.2. Dica: mostre que a famlia de todos os conjuntos
E tais que (E) = (f 1 (E)) e uma -algebra.
2.2. Prove que, para quase todo n
umero x [0, 1] cuja expans
ao decimal contem
o bloco 617 (por exemplo x = 0, 3375617264 ), esse bloco aparece innitas
vezes na expansao.
2.3. Prove que o dgito 7 aparece innitas vezes na expansao decimal de quase
todo n
umero x [0, 1]. Dica: Comece por mostrar que o conjunto dos n
umeros
cuja expans
ao decimal nunca exibe o dgito 7 tem medida nula.
2.4. Suponha que f : U U e um difeomorsmo local (isto e: o seu jacobiano
e n
ao nulo em todo ponto) de classe C 1 . Mostre que f deixa invariante o volume
se e somente se

1
= 1 para todo y U.
|
det
Df
(x)|
1
xf

(y)

2.5. Dada uma funcao : U [0, ), denotamos por = vol a medida


denida por (E) = E d vol. Suponha que f : U U e um difeomorsmo
local de classe C 1 e que e uma funcao contnua. Mostre que f deixa invariante
a medida = vol se e somente se

(x)
= (y) para todo y U.
|
det
Df (x)|
1
xf

(y)

Em particular, no caso em que f e invertvel, f deixa invariante a medida se


e somente se (x) = (f (x))| det Df |(x) para todo x U .
2.6. Seja U um aberto de R2d e H : U R uma funcao de classe C 2 . Denotamos as variaveis em R2d por (p1 , q1 , . . . , . . . , pd , qd ). O campo de vetores
hamiltoniano associado a H e denido por


H
H
H
H
,...,
,
,...,
F (p1 , . . . , pd , q1 , . . . , qd ) =
.
q1
qd
p1
pd
Verique que o uxo denido por F preserva o volume.
umero 7 aparece
2.7. Para (Lebesgue) quase todo n
umero x0 (1/8, 1/7) o n
innitas vezes na sua expans
ao em fracao contnua, isto e, tem-se an = 7 para
innitos valores de n N.
2.8. Considere a sequencia 1, 2, 4, 8, . . . , an = 2n , . . . . Mostre que dado um
dgito i 0, . . . , 9, existe uma quantidade innita de valores n tal que an comeca
com este dgito.
2.9. Mostre que se A e uma matriz n n com coecientes inteiros, entao a
preserva a
x) = A(x)
transformacao induzida [A] : n P in denida por [A](
n
medida de Lebesgue de .
2.10. Mostre que o deslocamento denido na Seccao 2.3 e transitivo e que o
conjunto de suas orbitas peri
odicas e denso.

Captulo 3

Exist
encia de Medidas
Invariantes
Nesta captulo provaremos o seguinte resultado, que garante a existencia de
medidas invariantes em grande generalidade:
Teorema 3.1. Seja f : M M uma transformac
ao contnua num espaco
metrico compacto. Ent
ao existe pelo menos uma probabilidade invariante por
f . O mesmo resultado vale para uxos.
Antes de demonstrarmos este resultado, mencionemos alguns exemplos que
mostram que nenhuma das duas hipoteses, continuidade e compacidade, podem
ser omitidas.

3.1

Alguns exemplos simples

Considere f : (0, 1] (0, 1] dada por f (x) = x/2. Suponha que f admite
alguma probabilidade invariante (o objetivo e mostrar que isso nao acontece).
Pelo Teorema de Recorrencia 1.3, relativamente a essa probabilidade quase todo
ponto de (0, 1] e recorrente. Mas e imediato que nao existe nenhum ponto recorrente: a orbita de qualquer x (0, 1] converge para zero e, em particular, n
ao
acumula no ponto inicial x. Isto mostra que f e um exemplo de transformacao
contnua num espaco nao compacto que n
ao admite nenhuma medida probabilidade invariante.
Modicando um pouco o exemplo, podemos mostrar que o mesmo fenomeno pode ocorrer em espacos compactos, se a transformacao n
ao e contnua.
Considere f : [0, 1] [0, 1] dada por f (x) = x/2 se x = 0 e f (0) = 1. Pela
mesma razao que antes, nenhum ponto x (0, 1] e recorrente. Portanto, se
existe alguma probabilidade invariante ela tem dar peso total ao u
nico ponto
recorrente que e x = 0. Em outras palavras, precisa ser a medida de Dirac 0
suportada em zero, que e denida por
0 (E) = 1 se 0 E

e
27

0 (E) = 0 se 0
/ E.

28

CAPITULO 3. EXISTENCIA
DE MEDIDAS INVARIANTES

ao e invariante por f : tomando E = {0} temos que E tem


Mas a medida 0 n
medida 1 mas a sua pre-imagem f 1 (E) e o conjunto vazio, que tem medida
nula. Portanto, esta transformacao tambem nao tem nenhuma probabilidade
invariante.
O nosso terceiro exemplo e de natureza um pouco diferente. Consideremos
f : [0, 1] [0, 1] dada por f (x) = x/2. Trata-se de uma transformacao contnua
num espaco compacto. Logo, pelo teorema que iremos demonstrar, admite
alguma probabilidade invariante. Pelos mesmos argumentos que usamos no
caso anterior, se conclui que de fato h
a uma u
nica probabilidade invariante, que
e a medida de Dirac 0 suportada no ponto zero. Note que neste caso 0 e de
fato invariante.
Mencionamos este u
ltimo caso para enfatizar as limitacoes do Teorema de
Existencia (que sao inerentes a` sua grande generalidade): as medidas que ele
garante existirem podem ser bastante triviais; por exemplo, neste caso quando
falamos de quase todo pontoestamos nos referindo apenas ao ponto x = 0. Por
isso, um objetivo importante e obter resultados mais sosticados de existencia
de medidas com propriedades adicionais que as tornem mais interessantes, por
exemplo serem equivalentes `a medida de Lebesgue.

3.2

A topologia fraca no espa


co das medidas

Nesta secao vamos introduzir uma topologia importante no conjunto M1 (M )


das probabilidades borelianas do espaco M , chamada topologia fraca , que
ser
a muito u
til para provar o Teorema 3.1. A ideia da denicao e a seguinte:
duas medidas est
ao pr
oximas se dao integrais pr
oximas para muitas funcoes
contnuas. Procuremos exprimir esta ideia de modo preciso.
Dada uma medida M1 (M ), um conjunto nito F = {1 , . . . , N } de
funcoes contnuas j : M R, e um n
umero > 0, denimos






V (, F, ) = { M1 (M ) :  j d j d < para todo j F }.
Ent
ao a topologia fraca e denida estipulando que estes conjuntos V (, F, ),
com F e vari
avel, constituem uma base de vizinhancas da medida . O seguinte
lema deveria ajudar a compreender o signicado desta topologia:
Lema 3.2. Uma sequencia (n )nN em M1 (M ) converge para uma medida
M1 (M ) na topologia fraca se e somente se


dn d para toda func
ao contnua : M R.
Demonstrac
ao. Para provar a parte somente se, considere qualquer funcao
contnua e forme o conjunto F = {}. Como n , temos que dado
qualquer > 0 existe uma ordem a partir n
da qual n esta na vizinhanca
V (, F, ). Mas isto signica, precisamente, que





 dn d <



3.2. A TOPOLOGIA FRACA NO ESPAC


O DAS MEDIDAS

29



para todo n n
. Em outras palavras,
a sequencia d

 n converge para d.
A recproca arma que se dn converge para d, para toda funcao
contnua, ent
ao dado qualquer F e existe uma ordem a partir da qual n
otese garante que
V (, F, ). Para ver isso, escrevemos F = {1 , . . . , N }. A hip
para cada 1 j N existe n
j tal que





 j dn d < para todo n n
j .


Tomando n
= max{
n1 , , . . . , n
N }, temos n V (, F, ) para n n
.
Outra proposicao muito u
til que caracteriza a convergencia de medidas e
dada na:
Proposi
c
ao 3.3. Assuma que a sequencia n converge para na topologia
fraca . Ent
ao:
1. lim sup n (K) (K) para cada conjunto compacto K M ;
n

2. lim inf n (U ) (U ) para cada conjunto aberto U M .


n

Em particular, se o bordo de A tem medida zero, temos que lim n (A) = (A).
n

Demonstraca
o. Seja U um aberto e vamos mostrar o item (b). Tome K um
compacto em U e escolha : [0, 1] uma funcao contnua qualquer tal que
|K 1 e |U c 0. Por exemplo, basta tomar (x) = d(x, U c )/(d(x, K) +
d(x, U c )). Ent
ao:


dn lim inf n (U ).
(K) d = lim
n

Como vale que (U ) = sup (K), onde o supremo e tomado sobre todos os
K

compactos K U provamos o item (b). O item (a) e inteiramente an


alogo,
observando que (K) = inf (U ), onde o nmo e tomado sobre todos os abertos
U contendo K.
As principais propriedades desta topologia de que necessitamos est
ao dadas
no seguinte
Teorema 3.4. M1 munido da topologia fraca e metriz
avel e compacto.
Vamos comecar por demonstrar a metrizabilidade, isto e, que existe uma
dist
ancia d que gera a topologia fraca em M1 (M ). Para isso usamos o resultado
seguinte, cuja prova pode ser encontrada em [Rud87]. Como e usual, denotamos
por C 0 (M ) o espaco das funcoes contnuas : M R, munido da norma da
convergencia uniforme:
1 2  = sup{|1 (x) 2 (x)| : x M }.

30

CAPITULO 3. EXISTENCIA
DE MEDIDAS INVARIANTES

Proposi
c
ao 3.5. Se M e um espaco metrico ent
ao C 0 (M ) tem subconjuntos
enumer
aveis densos.
Logo, podemos escolher um subconjunto enumer
avel F = {n : n N}
denso na bola unit
aria do espaco C 0 (M ). Feito isso, denimos





1 


(3.1)
d

d
d(1 , 2 ) =
n
1
n
2 ,

n
2
n=1
para qualquer par de medidas 1 e 2 .
Proposi
c
ao 3.6. A express
ao d est
a bem denida, e uma dist
ancia, e gera a
topologia fraca em M1 (M ).
Demonstraca
o. Como as funcoes estao na bola unit
aria de C 0 (M ), ou seja,
sup || 1, e as medidas i sao probabilidades, o termo geral da soma e limitado
por 2 2n . Isto garante que a serie em (3.1) converge.
Ou
nico passo n
ao trivial na prova de que d e uma dist
ancia e mostrar que
d(1 , 2 ) = 0

1 = 2 .

A hip
otese d(1 , 2 ) = 0 signica que j d1 = j d2 para toda j
F . Agora, dada qualquer na bola unit
aria de C 0 (M ) podemos encontrar
uma sequencia de elementos de F convergindo uniformemente para . Como
consequencia, a igualdade continua valendo para :


(3.2)
d1 = d2
para toda na bola unit
aria de C 0 (M ). Como todo elemento de C 0 (M ) tem
algum m
ultiplo na bola unit
aria, isto implica que a igualdade (3.2) e verdadeira
para toda funcao contnua . Isto quer dizer que 1 = 2 , como pretendamos
mostrar.
Para provar que d gera a topologia, devemos mostrar que toda bola B(, ) =
{ M1 (M ) : d(, ) < } contem alguma vizinhanca V (, F, ) e reciprocamente. Dado > 0 xemos N 1 sucientemente grande para que

2n <

n=N

e consideremos F = {1 , . . . , N } formado pelos primeiros N elementos do


subconjunto enumer
avel denso. Alem disso, consideremos = /2. Armamos
que V (, F, ) B(, ). De fato





V (, F, )
n d n d  < para todo 1 n N


2n 


n d


n d  <

n=1

<

N

n=1

2n +


n=N +1

2 2n < ,

3.2. A TOPOLOGIA FRACA NO ESPAC


O DAS MEDIDAS

31

o que prova a nossa armacao.


Reciprocamente, dado F = {1 , . . . , N } e > 0, selecionemos elementos
n1 , . . . , nN distintos de F tais que
nj j  <

para todo 1 j N.

Fixemos > 0 sucientemente pequeno para que 2nj < /4 para todo 1 j N .
Armamos que B(, ) V (, F, ). De fato
B(, )


2n 


n d


n d  <

n=1



nj d nj d  < 2nj para todo 1 j N






j d j d  < 2nj + < for all 1 n N,




e isto prova a nossa armacao.


Resta provar que (M1 , fraca ) e um espaco compacto. Na demonstracao
vamos utilizar o seguinte resultado classico, que diz que as integrais sao os u
nicos
operadores lineares positivos no espaco das funcoes contnuas. Um operador
linear diz-se positivo se () > 0 para toda funcao positiva em todo ponto.
Uma demonstracao deste resultado pode ser encontrada em [Rud87].
Teorema 3.7 (Riesz-Markov). Seja : C 0 (M ) R qualquer operador linear
positivo. Ent
ao existe uma u
nica medida boreliana em M tal que

() = d para toda C 0 (M ).
Observe que e uma probabilidade se e somente se (1) = 1, j
a que (M ) =
1 d = (1).
Vamos entao provar que o espaco M1 e compacto para esta topologia. Como
j
a sabemos que o espaco e metrizavel, basta provar


Proposi
c
ao 3.8. Toda sequencia (k )kN em M1 (M ) admite alguma subsequencia que e convergente na topologia fraca .
avel denso
Demonstrac
ao. Seja F = {n : n N} um subconjunto enumer
0
na
bola
unit
a
ria
de
C
(M
).
Para
cada
n

N,
a
sequ
e
ncia
de
n
u
meros
reais

n dk , k N e limitada por 1. Portanto, para cada n N existe uma
sequencia (kjn )jN tal que

umero n R quando j .
n dkjn converge para algum n
Alem disso, cada sequencia (kjn+1 )jN pode ser escolhida como subsequencia da
anterior (kjn )jN . Denamos j = kjj para cada j N. Por construcao, a menos

32

CAPITULO 3. EXISTENCIA
DE MEDIDAS INVARIANTES

de um n
umero nito de termos, (j )jN e uma subsequencia de cada uma das
(kjn )jN . Logo

n dnj n para todo n N.
Daqui se deduz facilmente que

() = lim dj existe, para toda funcao C 0 (M ).
j

(3.3)

De fato, suponha primeiro que esta na bola unit


aria de C 0 (M ). Dado qualquer
> 0 podemos encontrar n F tal que  n  . Ent
ao




 dj n dj 
para todo j. Como

n dj converge (para n ), seque que




lim sup dj lim inf dj 2.
j


Como e arbitr
ario, conclumos que limj dj existe. Isto prova (3.3) quando
a funcao est
a na bola unit
aria. O caso geral reduz-se imediatamente a esse,
substituindo por /. Assim, completamos a prova de (3.3).
Finalmente, e claro que o operador : C 0 (M ) R denido por (3.3) e
linear e positivo: () min > 0 para todo funcao C 0 (M ) positiva em
todo ponto. Alem disso, (1) = 1. Logo, peloTeorema 3.7, existe alguma probabilidade boreliana em M tal que () = d para toda funcao contnua
. Agora a igualdade em (3.3) pode ser reescrita


= lim dj para toda C 0 (M ).
j

De acordo com o Lema 3.2, isto quer dizer que a subsequencia (j )jN converge
para na topologia fraca . Isto completa a demonstracao do Teorema 3.4.

3.3

Demonstra
c
ao do Teorema de Exist
encia

Comecemos por introduzir uma notacao u


til. Dado f : M M e qualquer
medida em M denota-se por f e chama-se imagem de por f a medida
denida por
 


f E = f 1 (E) para cada conjunto mensur
avel E M .
Note que e invariante por f se e somente se f = .
Lema 3.9. A aplicac
ao f : M1 (M ) M1 (M ) e contnua relativamente `
a
topologia fraca .

DO TEOREMA DE EXISTENCIA

3.3. DEMONSTRAC
AO

33

Demonstrac
ao. Para mostrarmos o lema acima, basta mostrar que se n converge para na topologia fraca , ent
ao para toda funcao contnua temos
que

lim df n = df .
n

De fato, se uma medida qualquer, armamos que




df = f d.
Com efeito, podemos aproximar por uma sequencia de funcoes simples n com
n  . Observe que isso implica, em particular, que n f   f .
ao
Observe que se A e funcao caracterstica, ent


1
A df = (f (A)) = A f d.
Por linearidade, a igualdade acima se estende para as funcoes simples n . Para
nalizar, temos que pelo Teorema da Convergencia Dominada,




n df = lim
n f d = f d,
df = lim
n

o que termina a prova da armacao. Para completar a prova do Lema, basta


observar que a funcao f tambem e contnua, uma vez que f e contnua.
Assim,




df n = lim
f dn f d = df ,
lim
n

como queramos provar.


Voltando a prova do Teorema de Existencia, considere qualquer probabilidade em M : por exemplo, a medida de Dirac em um ponto qualquer. Forme
a sequencia de probabilidades
n =

n1
1 j
f
n j=0

(3.4)

onde fj e a imagem de pelo iterado f j . Pelo Teorema 3.4, esta sequencia


tem algum ponto de acumulacao: existe alguma subsequencia (nj )jN e alguma
probabilidade M1 (M ) tais que
= lim nk = lim
k

Agora e suciente provar o seguinte

nk 1
1
f j .
nk j=0

(3.5)


CAPITULO 3. EXISTENCIA
DE MEDIDAS INVARIANTES

34

Lema 3.10. Todo ponto de acumulac


ao de uma sequencia (n )nN e uma probabilidade invariante por f .
Demonstraca
o. A partir de (3.5), e usando o Lema 3.9, obtemos que
nk 1
nk
k 1

 1 n


1
1
f = f lim
fj = lim f
fj = lim
fj .
k nk
k
k nk
n
k
j=0
j=0
j=1

A expressao do lado direito pode ser reescrita como


lim
k

k 1
 1 n

fj + fnk .
nk j=0

1
1 nk
= 0 e lim
f = 0. A primeira armacao e obvia,
k
nk
nk
e para a segunda basta observar que
Armamos que lim
k

1
1
1 nk
f (E) =
(f nk (E))
nk
nk
nk
para todo conjunto mensur
avel E F . Deste modo obtemos que
f = lim
k

nk 1
1
f j =
nk j=0

e portanto e invariante por f .


Isto completa a demonstracao do Teorema de Existencia 3.1.
Corol
ario 3.11 (Teorema de Recorr
encia de Birkho ). Se f : M M e
uma transformac
ao contnua num espaco metrico compacto ent
ao f tem algum
ponto recorrente.
Demonstrac
ao. Pelo Teorema 3.1, existe alguma probabilidade f -invariante .
Por outro lado, todo espaco metrico compacto admite uma base enumeravel de
abertos (verique!). Portanto, podemos aplicar o Teorema 1.3, para concluir
que -quase todo ponto e recorrente. Em particular, o conjunto dos pontos
recorrentes e nao vazio, conforme foi armado.

3.4

Exerccios

3.1. Prove a seguinte generalizacao do Lema 3.10: Seja f : M M uma


transformacao contnua num espaco compacto, uma probabilidade em M e
(In )n uma sequencia de intervalos de n
umeros naturais tais que #In converge
para innito quando n vai para innito. Ent
ao qualquer ponto de acumulacao
da sequencia
1 j
n =
f
#In
jIn

e uma probabilidade f -invariante.

3.4. EXERCICIOS

35

3.2. Dizemos que uma sequencia (n )nN de probabilidades converge pontualmente (ou fortemente) para M1 (M )
avel E M.
n (E) (E) para todo conjunto mensur
1. Mostre que se (n )nN converge pontualmente para ent
ao tambem converge para na topologia fraca . Mostre, atraves de um exemplo, que a
recproca e falsa.
2. Mostre que (n )nN converge para na topologia fraca se e somente se
n (E) (E) para todo conjunto mensur
avel E M cujo bordo E
satisfaz (E) = 0.
Dica para (2): Dado o mensur
avel E e  > 0 encontre funcoes contnuas 1 e
2 tais que 1 XE 2 e 1 d 2 d < .
3.3. Fixe um subconjunto enumer
avel denso F = {n : n N} da bola unit
aria
de C 0 (M ). Mostre que uma sequencia (k )kN de probabilidades em M converge
na topologia fraca para alguma M1 (M ) se e somente se, para todo n N,


n d.
n dk converge para
3.4. Seja f1 , f2 , . . . , fN : M M uma famlia nita qualquer de transformacoes
contnuas num espaco metrico compacto que comutam entre si: fi fj = fj fi
para todo i e todo j em {1, 2, . . . , N }. Prove que existe alguma probabilidade
que e invariante por fi para todo i {1, 2, . . . , N }.
Deni
c
ao 3.12. Dizemos que uma transformacao f : M M e unicamente
erg
odica se admite exatamente uma probabilidade invariante.
Os exerccios a seguir tratam de transformacoes unicamente erg
odicas. Esta
terminologia e justicada pelo Exerccio 3.7 abaixo, que arma que nesse caso a
probabilidade invariante e necessariamente ergodica. No que segue suporemos
que M e um espaco metrico compacto e f : M M e contnua.
3.5. Seja R e uma rotacao irracional do crculo. Mostre que R e unicamente
erg
odica.
3.6. Seja f : M M uma transformacao unicamente erg
odica. Mostre que se
: S 1 R e uma funcao contnua qualquer, entao:
n1
1
j
(R
(x))
n n
j=0

(x)

= lim

existe em todo ponto e, de fato, o limite e uniforme. Justique que e constante


em todo ponto.
Dica: Verique que a sequencia do lado direito e equicontnua e use o teorema
de Ascoli-Arzela.

36

CAPITULO 3. EXISTENCIA
DE MEDIDAS INVARIANTES

3.7. Mostre que f e uma transformacao unicamente erg


odica se e somente se
lim


n1
1
(f j (x)) = d
n j=0

para toda funcao contnua : M R e todo x M . Obtenha que, se uma


transformacao e unicamente erg
odica ent
ao a sua probabilidade invariante e
erg
odica.

Captulo 4

Teorema Erg
odico de
Birkho
O teorema fundamental da Teoria Erg
odica arma que, para qualquer subconjunto mensur
avel e para quase todo ponto, existe um tempo medio de permanencia da orbita do ponto nesse conjunto. Este resultado e devido a von
Neumann, que provou um enunciado mais fraco, e sobretudo a Birkho, que o
provou na forma denitiva que iremos estudar.
Em muitos casos, esse tempo medio de permanencia e precisamente igual `a
medida do subconjunto, ou seja, orbitas tpicas passam em cada subconjunto um
tempo que e exatamente igual `a import
anciaque a probabilidade invariante
atribui ao conjunto. Isto e o que se chama de ergodicidade, uma propriedade
que remonta a Boltzmann, e que estudaremos mais tarde.

4.1

Enunciados e coment
arios

Comecemos por explicar o que entendemos por tempo medio de permanencia


de uma orbita num conjunto. Dado x M e um conjunto mensur
avel E M ,
vamos tomar um certo n
umero (grande) de iterados iniciais da orbita de x e
vamos considerar a fracao desses iterados que estao em E:
n (E, x) =


1 
# j {0, 1, . . . , n 1} : f j (x) E .
n

Observe que isto e o mesmo que


n (E, x) =

n1
1
XE (f j (x)),
n j=0

onde XE designa a funcao caracterstica do conjunto E, isto e, XE (x) = 1 se


ario.
x E e XE (x) = 0 caso contr
37

38

CAPITULO 4. TEOREMA ERGODICO


DE BIRKHOFF

Em seguida, fazemos n ir para innito e chamamos tempo medio de permanencia da orbita de x em E o limite destas fracoes:
(E, x) = lim n (E, x).
n

Em geral, este limite pode nao existir. Iremos ver um exemplo desse fato daqui
a pouco. No entanto, o teorema ergodico arma que, relativamente a qualquer
probabilidade invariante, o limite realmente existe para quase todo ponto:
Teorema 4.1. Seja f : M M uma transformac
ao mensur
avel e uma
probabilidade invariante por f . Dado qualquer conjunto mensur
avel E M ,
o tempo medio de permanencia (E, x) existe em -quase todo ponto x M .
Alem disso,

(E, x) d(x) = (E).
Antes de passarmos a` demonstracao deste resultado notavel, e a algumas
das suas aplicacoes, vamos fazer alguns comentarios relacionados. O primeiro
deles e que se (E, x) existe para um certo ponto x M ent
ao
(E, f (x)) = (E, x).

(4.1)

De fato, por denicao,


1
XE (f j (x))
(E, f (x)) = lim
n n
j=1
n

n1

1
1
= lim
XE (f j (x)) XE (x) XE (f n (x))
n n
n
j=0


1
XE (x) XE (f n (x))
n n

= (E, x) + lim

Como a funcao caracterstica e limitada, o u


ltimo limite e igual a zero. Isto
prova a igualdade (4.1).
O teorema ergodico pode ser enunciado de modo um pouco mais geral:
Teorema 4.2. Seja f : M M uma transformac
ao mensur
avel e uma
probabilidade invariante por f . Dada qualquer func
ao integr
avel : M R o
limite
n1
1
(x)

= lim
(f j (x))
n n
j=0
existe em -quase todo ponto x M . Alem disso,


(x)
d(x) = (x) d(x).
Observe que o Teorema 4.1 e o caso particular = funcao caracterstica XE
do conjunto E. Este enunciado mais geral pode ser provado usando uma vers
ao
um pouco mais elaborada do argumento da secao 4.2, que n
ao apresentaremos
aqui.

DO TEOREMA ERGODICO

4.2. DEMONSTRAC
AO

4.2

39

Demonstra
c
ao do teorema erg
odico

A estrategia da prova e a seguinte. Seja E M um conjunto mensur


avel
qualquer. Para cada x M , denimos

1 
(E, x) = lim sup # j {0, . . . , n 1} : f j (x) E
n

1 
(E, x) = lim inf # j {0, . . . , n 1} : f j (x) E .
n
Note que, para todo x M ,
(E, f (x)) = (E, x)

(E, f (x)) = (E, x)

(4.2)

A justicacao e analoga a` da relacao (4.1).


O principal passo da demonstracao consiste em mostrar que
(E, x) = (E, x)

para -quase todo ponto x.

(4.3)

claro que (E, x) e sempre maior ou igual que (E, x). Portanto, para mostrar
E
(4.3) sera suciente que provemos


(E, x) d(x) (E) (E, x) d(x).
(4.4)
Vamos provar a primeira desigualdade em (4.4). A segunda segue de um argumento inteiramente an
alogo 1 .
Fixemos qualquer > 0. Por denicao de lim sup, para cada x M existem
inteiros t 1 tais que

1 
# j {0, . . . , t 1} : f j (x) E (E, x) .
t

(4.5)

Representaremos por t(x) o menor inteiro com esta propriedade. Para tornar a
demonstracao mais transparente, consideraremos primeiro o caso particular em
que a funcao x  t(x) e limitada, isto e,
Caso particular: Existe T N tal que t(x) T para todo x M .
Dado qualquer x M , denimos uma sequencia x0 , x1 , . . . , xs de pontos em
umeros naturais, do seguinte modo:
M e uma sequencia t0 , t1 , . . . , ts de n
1. Primeiramente, tomamos x0 = x.
2. Supondo que xi j
a foi denido, tomamos ti = t(xi ) e xi+1 = f ti (xi ).
3. Terminamos quando encontramos xs tal que t0 + t1 + + ts1 + ts n.
1 Alternativamente, a segunda desigualdade pode ser deduzida da primeira, aplicada ao
complementar E c , observando que (E) = 1 (E c ) e (E, x) = 1 (E c , x).


CAPITULO 4. TEOREMA ERGODICO
DE BIRKHOFF

40

Note que todo xi e iterado do ponto x: de fato xi = f t0 ++ti1 (x). Aplicando (4.2) conclumos que (E, xi ) = (E, x) para todo i. A denicao de t(xi )
implica que, dos ti primeiros iterados de xi , pelo menos


ti (E, xi ) ) = ti (E, x) )
(4.6)
estao em E. Isto vale para cada i = 0, 1, . . . , s 1. Portanto, pelo menos
(t0 + t1 + + ts1 )( (E, x) )
dos n primeiros iterados de x, estao em E. Alem disso, a u
ltima regra na
denicao das nossas sequencias implica que
t0 + t1 + + ts1 n ts n T.
Deste modo, mostramos que pelo menos (n T )( (E, x) ) dos n primeiros
iterados de x estao em E. Em outras palavras,
n1

XE (f j (x)) (n T )( (E, x) )

(4.7)

j=0

para todo x M e todo n 1. Integrando a relacao (4.7), obtemos que


n1


XE (f (x)) d(x) (n T )
j

(E, x) d(x) (n T ).

j=0

Todas as parcelas no membro da esquerda sao iguais a (E), uma vez que a
probabilidade e invariante por f . Portanto, esta desigualdade pode ser escrita
como

n(E) (n T )

(E, x) d(x) (n T ).

Dividindo os dois termos por n e fazendo n ir para innito, conclumos que



(E) (E, x) d(x)
Como > 0 e qualquer, isto implica a primeira desigualdade em (4.4). Isto
termina a demonstracao neste caso.
Caso geral: Vamos indicar as modicacoes que devem ser feitas relativamente
ao caso particular.
Dado > 0, comecamos por xar T 1 sucientemente grande, de modo
que a medida do
B = {y M : t(y) > T }
seja menor que . Em seguida, na denicao das sequencias substitumos a regra
2 por

DO TEOREMA ERGODICO

4.2. DEMONSTRAC
AO

41

2a. Se t(xi ) T , tomamos ti = t(xi ) e xi+1 = f ti (xi ).


2b. Se t(xi ) > T , tomamos ti = 1 e xi+1 = f (xi ).
As regras 1 e 3 permanecem inalteradas. A estimativa referente a (4.6) continua
v
alida, para os valores de i aos quais se aplica a regra 2a:
t
i 1


XE (f j (xi )) ti (E, x) ).

j=0

claro que esta desigualdade implica a seguinte:


E
t
i 1

XE (f (xi )) ti (E, x) )
j

j=0

t
i 1

XB (f j (xi )).

(4.8)

j=0

A vantagem e que (4.8) e v


alida tambem para os valores de i aos quais se aplica
a regra 2b. De fato, nesse caso tem-se ti = 1, o membro da esquerda e maior ou
igual que zero e o membro da direita e menor que zero, uma vez que (E, x) e
sempre menor ou igual que 1. Isso signica que, no lugar de (4.7), tem-se
n1

XE (f j (x)) (n T )( (E, x) )

j=0

n1

XB (f j (x)).

j=0

Integrando, como zemos anteriormente, obtemos



n(E) (n T ) (E, x) d(x) (n T ) n(B).
Dividindo por n e fazendo n , deduzimos que (lembre que (B) < )


(E) (E, x) d(x) (B) (E, x) d(x) 2.
Como > 0 e arbitr
ario, segue que

(E)

(E, x) d(x).

Isto completa a demonstracao do Teorema 4.1.


CAPITULO 4. TEOREMA ERGODICO
DE BIRKHOFF

42

4.3

Exerccios

4.1. Considere a transformacao f : M M , f (x) = 10x [10x] introduzida


na secao 2.1. Considere
x = 0, 335533335555555533333333333333335 . . ..
Ou seja: a expansao decimal de x consiste de blocos de 3s e 5s, alternados, cada
bloco (exceto o segundo) com duas vezes mais dgitos que o anterior. Considere
tambem E = [0, 3, 0, 4). Mostre que
2 (E, x) = 1,

8 =

3
,
4

...

22k1 (E, x)

2
,
3

22k (E, x)

1
,
3

enquanto que
4 (E, x) =

1
,
2

16 =

3
,
8

...

e portanto o tempo medio de permanencia da orbita de x em E n


ao existe.
4.2. Mostre que, para qualquer funcao integr
avel , a media temporal satisfaz
f = em -quase todo ponto.

Captulo 5

Ergodicidade
Uma transformacao f : M M diz-se erg
odica para uma probabilidade invariante (tambem dizemos que a medida e ergodica para f , ou que o sistema
(f, ) e ergodico) se as medias temporais dadas pelo Teorema de Birkho 4.2
coincidem em quase todo ponto com as respectivas medias espaciais:

n1
1
j
(f (x)) = d ,
lim
n n
j=0
para toda funcao -integr
avel : M R e -quase todo x M .
Na pr
oxima proposicao vamos reescrever esta condicao de v
arias maneiras
equivalentes, para ajudar a entender o seu signicado. Um conjunto mensuravel
A M diz-se invariante se f 1 (A) = A. Uma funcao mensuravel : M R
diz-se invariante se f = .
Proposi
c
ao 5.1. Seja uma probabilidade invariante de uma transformac
ao
f : M M mensur
avel. As seguintes condic
oes s
ao equivalentes:
1. O sistema (f, ) e erg
odico.
2. Para todo subconjunto invariante A tem-se (A) = 0 ou (A) = 1.
3. Toda func
ao invariante e constante num conjunto de medida total.
Demonstrac
ao. (1) implica (2): Considere = XA . Por um lado, a hip
otese
(1) signica que

(x)

= d = (A)
para quase todo x M . Por outro lado, como A e invariante, temos que x A
se e somente se f (x) A. Isto implica que (f j (x)) = (x) para todo j 0 e
para todo x. Portanto,
(x)

= (x) = XA (x)
para todo x M . Como a funcao caracterstica s
o toma os valores 0 e 1, estas
duas igualdades implicam que (A) = 0 ou (A) = 1, como e armado em (2).
43

CAPITULO 5. ERGODICIDADE

44

(2) implica (3): Seja uma funcao invariante qualquer. Ent


ao, a preimagem 1 (I) de qualquer intervalo I R e um conjunto invariante. Portanto,
pela hip
otese (2), essa pre-imagem tem medida zero ou um. Como o intervalo
I e qualquer, isto prova que e constante num conjunto com probabilidade
total.
(3) implica (1): Seja uma funcao integr
avel qualquer. Como vimos no
exerccio 4.2, a media temporal e uma funcao invariante. Logo, pela hip
otese
(3), e constante em quase todo ponto. Ent
ao, usando o teorema erg
odico,


(x)

= d = d
em quase todo ponto. Isto e, o sistema e ergodico.

5.1

Exemplos e aplica
c
oes

Nesta secao descrevemos diversos exemplos de sistemas ergodicos.

5.1.1

Expans
ao decimal

Considere a transformacao f : [0, 1] [0, 1], f (x) = 10x [10x] da secao 2.1.
Armamos que f e ergodica para a medida de Lebesgue . Tendo em vista a
proposicao 5.1, para mostrar isto s
o temos que provar que se A e um conjunto
invariante com medida positiva ent
ao A tem medida total.
Suponhamos ent
ao que A e invariante e (A) > 0. O ingrediente principal
e o teorema de derivacao 0.25. No nosso caso, como estamos tratando com
subconjuntos de R, a condicao (2) torna-se
lim inf


 (I A)
: I (a , a + ) intervalo contendo a = 1 .
(I)

(5.1)

Fixemos um ponto de densidade a A qualquer. Consideremos a sequencia de


intervalos
 mk mk + 1 
Ik =
,
, mk Z, k N,
10k
10k
que contem o ponto a. Como a e um ponto de densidade de A, a propriedade
(5.1) implica que
(Ik A)
1 quando k .
(Ik )
Observe tambem que cada f k e uma bijecao am de Ik sobre o intervalo (0, 1).
Isso tem a seguinte consequencia, que e crucial para o nosso argumento:
(f k (E1 ))
(E1 )
=
k
(f (E2 ))
(E2 )

(5.2)


5.1. EXEMPLOS E APLICAC
OES

45

para quaisquer subconjuntos mensuraveis E1 e E2 de Ik . Aplicando este fato a


E1 = Ik A e E2 = Ik obtemos que


f k (Ik A)
(Ik A)


.
=
(Ik )
(0, 1)


Claro que (0, 1) = 1. Alem disso, como estamos supondo que A e invariante,
f k (Ik A) esta contido em A. Deste modo obtemos que
(A)

(Ik A)
.
(Ik )

Como a sequencia do lado direito converge para 1, segue que (A) = 1, como
queramos demonstrar. Ficou provado que a transformacao f e ergodica para a
medida de Lebesgue .
Em seguida vamos dar uma aplicacao deste fato no contexto da Teoria dos
N
umeros. Dizemos que um n
umero x R e balanceado se todo dgito aparece
f
com a mesma frequencia, 1/10, na sua expans
ao decimal. E
acil dar exemplos de
n
umeros balanceados. Mas em geral e muito difcil decidir se um dado n
umero
irracional e balanceado ou n
ao. Por exemplo, n
ao e sabido ate hoje se o n
umero
e balanceado.
No entanto, a conclus
ao da secao anterior nos permite deduzir que quase
todo n
umero e balanceado:
Proposi
c
ao 5.2. O conjunto dos n
umeros x R n
ao balanceados tem medida
de Lebesgue nula.
Demonstrac
ao. Como o fato de ser balanceado e independente da parte inteira
do n
umero, s
o precisamos mostrar que quase todo x [0, 1] e balanceado.
Considere f : [0, 1] [0, 1] denida por f (x) = 10x [10x]. Para cada dgito
j {0, 1, . . . , 9} considere o intervalo Ej = [j/10, (j + 1)/10). Recorde que
ao f k (x) = 0, ak ak+1 . Portanto, f k (x)
se x = 0, a0 a1 ak ak+1 ent
Ej se e somente se o k-esimo dgito da expans
ao decimal de x e igual a j.
Consequentemente, o tempo medio de permanencia (Ej , x) e exatamente a
frequencia do dgito j na expansao decimal de x. Usando o teorema ergodico e o
fato de que a transformacao e ergodica para a medida de Lebesgue , conclumos
que para cada j {0, 1, . . . , 9} existe um subconjunto Bj de M com (Bj ) = 1
tal que
1
(Ej , x) = (Ej ) =
para todo x Bj .
10
Ent
ao B = B0 B1 B9 tambem tem (B) = 1, e todo n
umero x B e
balanceado.

5.1.2

Deslocamentos (shifts) de Bernoulli

Vamos agora voltar a discussao dos deslocamentos de Bernoulli, introduzidos


na Seccao 2.3 do Captulo 2. Mostraremos que as medidas de Bernoulli s
ao
erg
odicas. Para isso, a seguinte propriedade das medidas de Bernoulli vai ser
u
til :

CAPITULO 5. ERGODICIDADE

46

oes nitas de
Lema 5.3. Se A e B s
ao elementos da
algebra B0 , isto e, uni
cilindros disjuntos, ent
ao tem-se
(A f m (B)) = (A)(f m (B)) = (A)(B),
para todo m sucientemente grande.
Demonstrac
ao. Expliquemos porque esta propriedade e verdadeira quando A e
B sao cilindros, A = [k, l; ak , . . . , al ] e B = [u, v; bu , . . . , bv ]. Para cada m temse f m (B) = [u + m, v + m; bu , . . . , bv ]. Escolhendo m sucientemente grande
garantimos que u + m > l e, entao,
A f m (B) = { : k = ak , . . . , l = al , u+m = bu , . . . , v+m = bv }

= [k, v + m; ak , . . . , al , cl+1 , . . . , cu+m1 , bu , . . . , bv ],
onde a uni
ao e sobre todos os valores possveis de cl+1 , . . . , cu+m1 . Usando
(2.6), conclumos que (A f m (B)) = (A)(B). Isto prova o lema quando
os conjuntos envolvidos s
ao cilindros. O caso geral segue pelo fato de ser
nitamente aditiva.
Proposi
c
ao 5.4. Seja f : M M um deslocamento e uma medida de
Bernoulli em M , como antes. Ent
ao o sistema (f, ) e erg
odico.
Demonstrac
ao. Seja A um conjunto mensur
avel invariante qualquer. Queremos
mostrar que (A) = 0 ou (A) = 1. Para tornar a ideia da prova mais clara,
comecemos por um caso particular: suponhamos que A esta na algebra B0 das
uni
oes nitas de cilindros disjuntos dois-a-dois. Nesse caso podemos aplicar o
lema anterior, com B = A. Conclumos que (Af m (A)) = (A)2 sempre que
tomemos m sucientemente grande. Mas, como A e invariante, f m (A) = A
para todo m. Ent
ao a igualdade anterior quer dizer que (A) = (A)2 , o que
so pode acontecer se (A) = 0 ou (A) = 1.
Agora vamos fazer a prova quando A B e um conjunto invariante qualquer.
A ideia e aproximar A por elementos da algebra B0 , usando o Teorema de
Aproximacao 0.11: dado qualquer > 0 existe A0 B0 tal que (AA0 ) < .
Escolha m como no caso anterior, de modo que
(A0 f m (A0 )) = (A0 )(f m (A0 )) = (A0 )2 .

(5.3)

Observe que
(A f m (A))(A0 f m (A0 )) (AA0 ) (f m (A)f m (A0 ))
(AA0 ) f m (AA0 ).
Isto, junto com o fato de que e invariante por f , implica que


(A f m (A)) (A0 f m (A0 )) 2(AA0 ) < 2.

(5.4)

Alem disso,



 

(A)2 (A0 )2  ((A) + (A0 ))((A) (A0 )) 2(A) (A0 ) < 2.
(5.5)


5.1. EXEMPLOS E APLICAC
OES

47

Juntando as relacoes (5.3), (5.4), (5.5), conclumos que |(A) (A)2 | < 4.
Como e arbitr
ario, deduzimos que (A) = (A)2 e entao, do mesmo modo que
antes, conclumos que (A) = 0 ou (A) = 1.

5.1.3

Rotac
ao irracional no crculo

Para n
os o crculo S 1 ser
a o conjunto dos n
umeros complexos com m
odulo igual
a 1. Dado R, a rotac
ao de angulo e a multiplicacao pelo n
umero complexo
ei
R : S 1 S 1 , R (z) = ei z .
claro que R preserva o comprimento dos intervalos (segmentos) de S 1 . UsE
ando o Lema 2.2 se deduz que a medida de Lebesgue (comprimento de arco) e
invariante por qualquer R .
O comportamento din
amico e erg
odico de R depende muito da natureza de
, como vamos ver. Dizemos que a rotacao e irracional se o n
umero /(2) e
irracional, e dizemos que a rotacao e racional no caso contr
ario.
A recproca e muito mais interessante:
ao irracional ent
ao R e erg
odica para a medida
Proposi
c
ao 5.5. Se R e rotac
de Lebesgue.
Vamos mencionar duas demonstracoes diferentes deste fato. A primeira, que
detalharemos a seguir, usa fatos simples de analise de Fourier. A segunda, que
deixaremos como exerccio, e baseada num argumento de ponto de densidade
semelhante ao que usamos no caso da expansao decimal.
Seja a medida de Lebesgue no crculo. Chama-se L2 () o espaco das
avel:
funcoes 1 mensuraveis : S 1 C cujo quadrado e integr

||2 d < .
claro que este espaco contem todas as funcoes mensuraveis limitadas e, em
E
particular, todas as funcoes caractersticas de conjuntos mensur
aveis. Outro
fato de que necessitamos e que a famlia de funcoes {k (z) = z k : k Z} e
nica
uma base (de Hilbert) desse espaco: dada qualquer L2 () existe uma u
sequencia (ck )kZ de n
umeros complexos tais que
(z) =

ck z k

para quase todo z S 1 .

kZ

Demonstrac
ao. Pela proposicao 5.1, basta mostrar que toda funcao integr
avel
que e invariante e constante em -quase todo ponto. Observe que se e
integr
avel, ent
ao automaticamente L2 () (verique! Utilize que e nita).
1 Quando lidamos com L2 () sempre identificamos fun
c
oes que diferem apenas num conjunto de medida nula.

CAPITULO 5. ERGODICIDADE

48


Usando a expans
ao de Fourier (z) = kZ ck z k , a condicao de ser invariante
R = se escreve


ck eki z k =
ck z k
kZ

kZ

Por unicidade dos coecientes da expansao em serie de Fourier, obtemos que


ck (eki 1) = 0

para todo k Z.

A hip
otese de que a rotacao e irracional signica que eki 1 = 0 para todo
k = 0, e portanto, ck = 0 para todo k = 0. Ou seja, (z) = c0 para -quase
todo z S 1 , como queramos provar.
De fato as rotacoes irracionais satisfazem uma propriedade muito mais forte
do que ergodicidade: elas s
ao unicamente erg
odicas, o que quer dizer que tem
uma u
nica probabilidade invariante (que e a medida de Lebesgue, claro).
Observa
c
ao 5.6. A nocao de rotacao irracional se estende para dimensoes
maiores. Dado qualquer d 1 chamamos d-toro o produto Td = S 1 S 1
do crculo por si mesmo d vezes. A rotacao de angulo = (1 , . . . , d ) e a
aplicacao R : Td Td , R (z1 , . . . , zd ) = (ei1 z1 , . . . , eid zd ). A rotacao e
irracional se os n
umeros j /(2) sao incomensur
aveis:
m0 + m1

1
d
+ + md
=0
2
2

m0 = m1 = = md = 0,

quaisquer que sejam os inteiros m0 , m1 , . . . , md . Usando uma vers


ao multidimensional das ideias anteriores, se prova que uma rotacao e ergodica se e
somente se ela e irracional.

5.1.4

Transformac
ao de Gauss

Como vimos na secao 2.4, a transformacao de Gauss G(x) = 1/x [1/x] admite uma probabilidade invariante que e equivalente a` medida de Lebesgue,
nomeadamente,

dx
1
(E) =
log 2 E 1 + x
Temos tambem que o sistema (G, ) e ergodico. Este fato pode ser demonstrado
pelo mesmo tipo de argumento que usamos na secao 5.1.1. Vamos esbocar o
argumento neste caso, explicando qual e a principal diculdade adicional.
Seja A um conjunto invariante com medida positiva. Em primeiro lugar, continua sendo verdade que para quase todo ponto a [0, 1] existe uma sequencia
de intervalos Ik contendo a e tais que f k envia Ik bijetivamente e diferenciavelmente sobre (0, 1). O di
ametro desses intervalos converge para zero. Logo,
tomando para a um ponto de densidade qualquer de A, temos que
(Ik A)
1
(Ik )

quando k +.

(5.6)


5.1. EXEMPLOS E APLICAC
OES

49

ao e am.
Por outro lado embora f k seja uma bijecao restrita a cada Ik , ela n
Por essa razao n
ao temos o analogo da relacao (5.2) neste caso. Esta diculdade
e contornada atraves do seguinte resultado, que e um exemplo de controle de
distorca
o: e muito importante notar que a constante K e independente de k,
Ik , E1 , e E2 .
Lema 5.7. Existe uma constante K > 1 tal que para todo k 1, todo intervalo
ao diferenci
avel, tem-se
Ik tal que G restrita a Ik e uma bijec
(f k (E1 ))
(E1 )
K
k
(f (E2 ))
(E2 )
para quaisquer subconjuntos mensur
aveis E1 e E2 de Ik .
Antes de demonstrarmos o Lema 5.7, explicamos como a ergodicidade de
(G, ) pode ser obtida a partir dele. Observe que f k (Ik Ac ) = Ac , porque o
conjunto A e invariante. Lembre tambem que f k (Ik ) = (0, 1), que tem medida
total. Tomando E1 = Ik Ac e E2 = Ik no lema 5.7, conclumos que
(Ac )

(Ik Ac )
(f k (Ik Ac )

K
.
(Ac )
(Ik

De acordo com (5.6), a express


ao do lado direito converge para zero quando
k . Logo (Ac ) = 0, como queramos demonstrar.
Daremos agora a prova do Lema 5.7. As linhas gerais da demonstracao,
servir
ao para concluir um resultado mais geral,apresentado na secao 9.1.
Prova do Lema 5.7. Usaremos os seguintes fatos sobre a transformacao f que
podem ser facilmente vericados pelo leitor:
1. Para todo x (0, 1) vale que |f  (x)| > 1 e |(f 2 ) (x)| 4.


(x)
| < C1 .
2. Existe C1 > 0 tal que | ff  (x)

Observe que a partir do item (1) acima, podemos mostrar que se x, y Ik


ent
ao
1
|f i (x) f i (y)| ki |f k (x) f k (y)| se i = 0, 1, 2, . . . k.
(5.7)
2
Observe tambem que se x, y Ik temos que

(f k ) (x)
|
| log f  (f i (x)) log f  (f i (y))|.
k

(f ) (y)
i=0
k1

| log

O item (2) nos garante que a funcao x log f  (x) tem derivada limitada por C,
logo pelo Teorema do Valor Medio temos que | log f  (a) log f  (b)| C1 |a b|.
Aplicando este fato na desigualdade acima e observando a equacao 5.7:

1
(f k ) (x)
| C1
|f i (x) f i (y)|
C |f k (x) f k (y)| C2 ,
k

ki 1
(f ) (y)
2
i=0
i=0
k1

| log

k1

CAPITULO 5. ERGODICIDADE

50

onde C2 e uma constante propriamente escolhida. Logo, tomando K = exp C2 ,


vem que para todos x, y Ik vale:
(f k ) (x)
< C3 .
(f k ) (y)
Note que a constante C3 escolhida n
ao depende de k nem de Ik . Observe ainda
que se A [0, 1] e um conjunto mensur
avel, ent
ao
1
1
m(A) (A)
m(A),
2 log 2
log 2
onde m representa a medida de Lebesgue de [0,1].
Assim, para concluir a prova do Lema 5.7, basta observar que se E1 e E2
sao subconjuntos mensur
aveis de Ik , ent
ao:

k
(f k ) (x) dm
m(f
(E
))
(f k (E1 ))
1
2
E1
=
2(log
2)

(f k (E2 ))
m(f k (E2 ))
(f k ) (y) dm
E2
2(log 2)2 (C3 )2

m(E1 )
(E1 )
4(log 2)4 C3
.
m(E2 )
(E2 )

Assim, basta tomar K = 4(log 2)4 (C3 )2 e o lema esta provado.

5.1.5

M
aquina de somar (adding machine)

A maquina de somar modela sistemas tais como o contador de quilometragem


de um carro ou o registro de consumo de gas (em algumas cidades): a dinamica
consiste em fazer avancar o contador de uma unidade. A principal diferenca com
relacao `
a realidade e que este contador idealizado comporta innitos dgitos.
Fixe d 2, que representa a base de numeracao (por exemplo, d = 10).
Consideramos o espaco M de todas as sequencias
= (0 , 1 , 2 , . . . , k1 , k , . . .)
com j {0, 1, . . . , d 1}. Munimos este espaco da seguinte distancia


d(,  ) = 2N (, )

onde N (,  ) = min{j 0 : j = j }.

Tambem consideramos a transformacao f : M M soma uma unidade:


Para toda sequencia com 0 < d 1, denimos
f (0 , 1 , 2 , . . . , k1 , k , . . .) = (0 + 1, 1 , 2 , . . . , k1 , k , . . .).
Se 0 = d 1 mas 1 < d 1, denimos
f (0 , 1 , 2 , . . . , k1 , k , . . .) = (0, 1 + 1, 2 , . . . , k1 , k , . . .).


5.2. EQUIVALENCIA
ESPECTRAL

51

Mais geralmente, se 0 = = k1 = d 1 mas k < d 1, denimos


f (0 , 1 , 2 , . . . , k1 , k , . . .) = (0, 0, 0, . . . , 0, k + 1, . . .).
Se j = d 1 para todo j 0, denimos
f (0 , 1 , 2 , . . . , k1 , k , . . .) = (0, 0, 0, . . . , 0, 0, . . .).
M munido da dist
ancia denida em (3.1) e um espaco metrico compacto, e
a transformacao f e contnua nesse espaco. O exerccio 5.7 pede para mostrar
que f e unicamente erg
odica e para calcular a (
unica) probabilidade invariante.

5.2

Equival
encia Espectral

Esta subsecao trata da caracterizacao das propriedades din


amicas de uma me
dida como propriedades de Algebra
Linear, relacionadas a um certo operador
Uf que iremos denir. Iremos ver, por exemplo, que a invari
ancia da medida
equivale ao fato do operador preservar dist
ancias num espaco adequado de
funcoes. Veremos tambem a ergodicidade como uma propriedade espectral do
sistema (f, ), no sentido de que ela pode ser caracterizada pelos auto-valores
do operador Uf .

5.2.1

O Espa
co L2 ()

Para denir o operador Uf , precisamos primeiro denir seu domnio, o espaco


de funcoes L2 ():
Deni
c
ao 5.8. O espaco vetorial L2 () e denido como o conjunto

L2 () = { : M R; ||2 d < },
onde duas funcoes sao identicadas se elas coincidem em quase todo ponto com
respeito `a medida .
Podemos munir este espaco vetorial com um produto interno dado por:

< , >= . d.
Segue da desigualdade de Holder e das propriedades da integral que a expressao
acima de fato dene um produto interno em L2 (). Naturalmente, uma vez que
temos um produto interno em L2 (), podemos denir uma norma por:

2 = < , >.


Alem disso, podemos munir L2 () com a metrica que provem do produto interno
<, > denida por:

 12
2
d(, ) =  2 =
| | d
.
(5.8)

CAPITULO 5. ERGODICIDADE

52

cl
E
assico da Analise Funcional que o espaco L2 () com a metrica d e
um espaco metrico completo. Deixaremos tal vericacao para o leitor no exerccio ??.
Deremos agora a transformacao linear que carrega algumas propriedades
metricas do sistema (f, ). Considere Uf : L2 () L2 () denida simplesmente como:
Uf () = f.
imediato vericar que Uf e uma transformacao linear. A pr
E
oxima proposicao
traz a primeira traducao entre propriedades de (f, ) e propriedades da transformacao Uf .
Proposi
c
ao 5.9. Seja f uma transformac
ao e uma medida em M . f preserva
se, e s
o se, para toda L2 ():
Uf 2 = 2 .

(5.9)

Demonstrac
ao. De fato, primeiramente observe que se f preserva a medida
ent
ao para todo Boreliano A vale (A) = (f 1 (A)). Em particular, a
igualdade (5.9) vale se for uma funcao caracterstica de um boreliano. Utilizando a linearidade da integral, podemos estender nossa conclus
ao para todas
funcoes simples. Para concluir a demonstracao da propriedade (5.9) observe
a desigualdade de
que L2 () L1 (). Com efeito, se  L2 (), aplicando

H
older a`s funcoes  e 1, temos que  d 2 d < . Como toda
funcao em L1 () pode ser aproximada por uma sequencia monotona n de
funcoes simples, dada L2 (), tomando uma sequencia de funcoes simples
sn convergindo monotonamente para e utilizando o Teorema da Convergencia
Mon
otona para as sequencia sn e sn f , temos que:




f d = lim
sn f d = lim
sn d = d.
n

Reciprocamente, provaremos este fato primeiramente para as funcoes contnuas

n
ao-negativas. Se 0 e funcao contnua, tomando = temos que
L2 (), pois e limitada e e uma probabilidade. Como estamos assumindo que  f 2 = 2 , temos que:




2
 f  d = f d = d = 2 d.
Para provarmos que a igualdade acima vale quanto e uma funcao contnua
qualquer, basta observarmos que toda funcao contnua se escreve como diferenca
de duas funcoes positivas limitadas e aplicarmos a igualdade obtida a estas
funcoes. Assim, utilizando a Proposicao 2.1, temos que f preserva .

Em palavras da Algebra
Linear, a igualdade (5.9) acima, signica que Uf
e uma isometria do espaco L2 (). Em particular, esta propriedade implica
diretamente que Uf e uma transformacao linear injetiva, pois se
2 > 0 Uf 2 = 2 > 0.


5.2. EQUIVALENCIA
ESPECTRAL

53

Porem, Uf so e sobrejetiva se f for invertvel (veja o Exerccio ??).


Observe que 1 e sempre um autovalor de Uf e a esse autovalor temos associado um auto-espaco que sempre contem as funcoes constantes. A Proposicao 5.1
diz que a propriedade da medida ser ergodica equivale ao fato de que as u
nicas
funcoes invariantes por Uf sao as funcoes constantes ou, em outros termos, a
dimensao do auto-espaco associado ao auto-valor 1 e igual a um. Isso justica
a armacao de que a ergodicidade e uma propriedade espectral.
Vamos estabelecer quando duas tranformacoes f : M M e g : N N
preservando medidas e sao equivalentes do ponto de vista espectral. Isto
nos permitir
a extrair informacoes sobre as propriedades espectrais do sistema
(f, ) a partir das propriedades espectrais do sistema (g, ) e vice-versa.
Deni
c
ao 5.10. Sejam f : M M preservando e g : N N preservando
. Dizemos que (f, ) e (g, ) sao espectralmente equivalentes se existir uma
transformacao linear invertvel A : L2 () L2 () tal que:
1. < A, A >=< , >;
2. AUf = Ug A.
Deixaremos para o leitor no Exerccio ?? a vericacao de que a relacao
denida acima e de fato uma relacao de equivalencia.
Se (f, ) e (g, ) sao espectralmente equivalentes e A e uma equivalencia
ao A e autoespectral, se e auto-funcao de Uf associada ao auto-valor , ent
funcao de Ug associada ao auto-valor . De fato, Uf () = Ug A() =
AUf () = A.
Assim, o auto-espaco F1 associado ao auto-valor 1 para operador Ug e simplesmente a imagem por A do auto-espaco E1 associado ao auto-valor 1 para
Uf . Como A e um isomorsmo linear, a dimens
ao de F1 e igual dimens
ao de
E1 . Segundo a observacao que (f, ) e ergodica se a dimensao do auto-espaco
associado ao auto-valor 1 e igual a 1, podemos armar que se (f, ) e (g, )
sao espectralmente equivalentes, entao (f, ) e um sistema ergodico se, e so se,
(g, ) e ergodico.
Exemplo 5.11. Considere f : [0, 1] [0, 1] a funcao denida por f (x) = 2x
+
mod 1 preservando a medida de Lebesgue m e seja : +
2 2 o deslocamento
+
Z
no espaco 2 = {0, 1} preservando a medida de Bernoulli associada ao vetor
(1/2, 1/2). Mostraremos que (f, m) e (, ) sao espectralmente equivalentes.
Realmente, para cada funcao L2 (m) associaremos uma funcao = A
2
L () denida por
(a0 , a1 , a2 , . . . ) = (0, a0 a1 a2 . . . )
Claramente A e uma transformacao linear. A tambem e invertvel, pois podemos
denir A1 por
A1 (0, a0 a1 a2 , . . . ) = (a0 , a1 , a2 , . . . ).
Estritamente, para que A1 esteja bem denida, devemos fazer uma escolha
do valor de A1 nos pontos x que podem ser escritos de dois modos distintos

CAPITULO 5. ERGODICIDADE

54

na base dois. Por exemplo, o ponto x = 0, 01111 . . . tambem pode se escrever


como x = 0, 1. Porem, como o conjunto dos pontos que podem ser escritos de
dois modos distintos e enumeravel, e portanto, com medida de Lebesgue igual
ario nestes pontos, uma vez
a zero, podemos denir A1 de um modo arbitr
`
que duas funcoes em L2 (m) sao iguais se elas coincidem em quase todo ponto.
Assim, A1 esta bem denida.
Para mostrar que A e uma equivalencia espectral, note que segue da denicao
de que



AA d =

d =

dm.

Finalmente, a condicao de que AUf = U A e imediata, a partir da denicao


de A. De fato, se L2 (m), temos que Uf (0, a0 a1 a2 . . . ) = (0, a1 a2 a3 . . . ).
Logo,
AUf (0, a0 a1 a2 . . . ) = A(0, a1 a2 . . . ) = (a1 , a2 , . . . ) =
((a0 , a1 , . . . )) = U (a0 , a1 , . . . ) = U A(a0 , a1 , . . . ).

5.3

Propriedades de medidas erg


odicas

Fixemos uma transformacao f : M M qualquer. Lembre que uma medida


diz-se absolutamente contnua com relacao a outra medida se (E) = 0
implica (E) = 0. O pr
oximo lema arma que probabilidades erg
odicas sao
minimais para a relacao :
Lema 5.12. Se e s
ao probabilidades invariantes tais que e erg
odica e
e absolutamente contnua com relac
ao a ent
ao = .
Demonstraca
o. Seja : M R uma funcao mensuravel limitada qualquer, e
seja
n1
1
(f j (x))
(x)

= lim
n n
j=0
a sua media temporal. Como e invariante e erg
odica, a media temporal e
constante

(x)

= d
para -quase todo ponto. Segue que isto e verdade para -quase todo ponto, j
a
que . Em particular,


d = d .
Por outro lado, pelo teorema erg
odico,


d = d .


5.3. PROPRIEDADES DE MEDIDAS ERGODICAS

55

Portanto, as integrais de com relacao a e em relacao a coincidem, qualquer que seja a funcao mensuravel limitada . Logo, considerando funcoes
caractersticas, = .
Naturalmente, se 1 e 2 sao probabilidades invariantes com respeito a` f a
probabilidade 1 +t(2 1 ) ainda e invariante. Isso siginca que o conjunto das
probabilidades invariantes e um conjunto convexo. Veremos que dentro deste
conjunto, as medidas erg
odicas desempenham um papel destacado:
Deni
c
ao 5.13. Seja X um conjunto convexo. Um ponto p X e dito extremal, se para quaisquer x, y X e t [0, 1], x + t(y x) = p implica que t = 0
ou 1.
O lema seguinte arma que uma probabilidade invariante e ergodica se e
somente se e ponto extremal no conjunto das probabilidades invariantes:
Lema 5.14. Uma probabilidade invariante e erg
odica se e somente se n
ao e
possvel escreve-la na forma
= c1 1 + c2 2
com c1 , c2 maiores que zero e 1 , 2 probabilidades invariantes distintas.
Demonstraca
o. Para provar a parte se, suponha que n
ao seja erg
odica.
Ent
ao existe algum conjunto invariante A com 0 < (A) < 1. Dena 1 e
2 como sendo as restricoes normalizadas de a A e ao seu complementar,
respectivamente:
1 (E) =

(E A)
(A)

2 (E) =

(E Ac )
.
(Ac )

Como A e Ac sao conjuntos invariantes e e medida invariante, 1 e 2 sao


tambem probabilidades invariantes. Alem disso, = (A)1 + (Ac )2 e portanto n
ao e extremal.
Para provar a recproca, suponha que e ergodica e temos = c1 1 + c2 2
claro que (E) = 0 implica 1 (E) = 2 (E) = 0, ou seja,
com c1 , c2 > 0. E
1 e 2 sao absolutamente contnuas com relacao a . Logo, pelo lema 5.12,
1 = = 2 . Isto prova que e extremal.
Em seguida vamos mostrar que medidas erg
odicas distintas vivemem subconjuntos disjuntos do espaco M :
odicas, todas
Lema 5.15. Sejam 1 , . . . , N probabilidades invariantes e erg
distintas. Ent
ao existem subconjuntos mensur
aveis P1 , . . . , PN invariantes disjuntos tais que

1 se j = k
j (Pk ) =
0 se j = k

CAPITULO 5. ERGODICIDADE

56

Demonstraca
o. Fixe qualquer par j, k de n
umeros distintos em {1, . . . , N }. Pelo
ao pode ser absolutamente contnua em relacao a k .
lema 5.12, a medida j n
Em outras palavras, existe algum subconjunto mensur
avel E tal que j (E) > 0
ao
mas k (E) = 0. Ent
j




f j (E) j (E) > 0. e

j=0




f j (E) = 0

j=0

Dena Pj,k = m=0


e decrescente com m,

j=m

f j (E). Como a sequencia de conjuntos na intersecao



 

j Pj,k = lim j
f j (E)
m

(5.10)

j=m

e, analogamente para k . Como as medidas j e k sao invariantes, e

f j (E) = f m

j=m




f j (E) ,

j=0

a sequencia no lado direito de (5.10) e constante. Conclumos que


j (Pj,k ) = j




f j (E) > 0 e

k (Pj,k ) = k

j=0




f j (E) = 0.

j=0

Alem disso, Pj,k e um conjunto invariante por f . Portanto j (Pj,k ) = 1, uma


vez que j e ergodica. Agora dena


Pk .
Pj =
Pj,k e Pj = Pj \
k=j

k=j

Primeiramente, j (Pj ) = 1 e k (Pj ) = 0 para todo k = j. Segue que j (Pj ) = 1


e k (Pj ) = 0 para todo k = j. Alem disso, os Pj sao disjuntos dois-a-dois.

5.4

Teorema de decomposi
c
ao erg
odica

Na sequencia dos resultados da secao anterior, e natural perguntar se toda


medida invariante e uma combinacao linear de medidas erg
odicas. O teorema
que vamos enunciar nesta secao arma que a resposta e armativa, exceto que
o n
umero de parcelas nesta combinacao n
ao e necessariamente nito, nem
mesmo enumeravel, em geral.
Teorema 5.16. Seja f : M M uma transformac
ao contnua num espaco
compacto. Ent
ao existe um conjunto mensur
avel M0 M , uma partic
ao P de
M0 e uma famlia de probabilidades {P : P P} satisfazendo
P (P ) = 1 para todo elemento P de P;

ERGODICA

5.4. TEOREMA DE DECOMPOSIC


AO

57

avel;
a aplicac
ao P  P e mensur
toda P e invariante e erg
odica para f ;
tais que, dada qualquer probabilidade f -invariante , o conjunto M0 satisfaz
(M0 ) = 1 e, alem disso,

(E) = P (E) d
(P ) para todo conjunto mensur
avel E M
(5.11)
onde
e a medida projec
ao de em P.
A relacao (5.11) signica que e uma combinacao convexa das v
arias prob(P ).
abilidades erg
odicas P , em que cada P entra com coecienteigual a
Dada qualquer particao P de M ca denida a projecao natural : M P
que associa a cada ponto x M o elemento P (x) da particao que o contem.
Isto permite denir o que e um subconjunto mensur
avel da particao: Q P e
mensuravel se e somente
1 (Q) = uni
ao dos P Q
f
e um subconjunto mensur
avel de M . E
acil ver que esta denicao est
a correta:
a famlia dos subconjuntos mensur
aveis e uma -algebra em P. A medida
projecao de esta denida nesta -algebra, por

(Q) = ( 1 (Q)).
Corol
ario 5.17. Uma transformac
ao f e unicamente erg
odica se e somente se
admite exatamente uma medida invariante erg
odica.
Demonstrac
ao. De acordo com o Corolario ??, se f e unicamente erg
odica ent
ao
a sua probabilidade invariante e ergodica. Isto prova a parte somente sedo
enunciado. Por outro lado, o Teorema 5.16 mostra que a recproca tambem e
verdadeira: se f admite apenas uma probabilidade invariante erg
odica, ent
ao
essa e a u
nica probabilidade invariante.

5.4.1

Prova do teorema de decomposi


c
ao erg
odica

Nesta secao vamos deduzir o Teorema 5.16 de um resultado de Teoria da Probabilidade, o teorema de desintegracao de Rokhlin [Rok66], que tem muitas outras
aplicacoes.
Seja Z um espaco metrico compacto, uma probabilidade em Z, e P uma
particao de Z em subconjuntos mensur
aveis. Seja : Z P a aplicacao
que associa a cada z Z o atomo P P que o contem. Por denicao, Q e
um subconjunto mensur
avel de P se e somente se 1 (Q) e um subconjunto
mensuravel de Z. Seja
o iterado de por , ou seja,
e a probabilidade em
avel Q P.
P denida por
(Q) = ( 1 (Q)) para cada conjunto mensur
Deni
c
ao 5.18. Uma famlia de medidas condicionais de relativamente a P
e uma famlia (P )P P de probabilidades em Z tais que

CAPITULO 5. ERGODICIDADE

58
-quase todo P P;
1. P (P ) = 1 para

2. dada qualquer funcao contnua : Z R,


 a funcao P  P 
(P ).
mensuravel e tem-se d =
dP d

dP e

Lema 5.19. Se (P )P P e uma famlia de medidas condicionais de relativaavel e


mente `
a partic
ao P, ent
ao P  P  dP e mensur



d =


dP

d
(P ),

para toda func


ao mensur
avel limitada : Z R.

AQUI

Demonstrac
ao. Denote por C a classe de funcoes mensuraveis limitadas que
satisfazem a conclusao do lema. Pela denicao de sistema de medidas condicionais, essa classe contem todas as funcoes contnuas. Alem disso, suponha que
n : Z R, n N e uma sequencia de funcoes em C convergindo pontualmente
para alguma funcao : Z R. Suponha ainda que essa sequencia e uniformemente limitada, isto e, existe K > 0 tal que |n (z)| K para todo z Z e
todo n N. Armamos que a funcao limite tambem esta em C. Admita, por
um instante, que esta armacao e verdadeira.
Em particular, P  P (E) e mensuravel, e (E) =
qualquer conjunto mesur
avel E Z.

P (E) d
(P ), para

Medidas condicionais, quando existem, s


ao u
nicas em quase todo ponto:
Proposi
c
ao 5.20. Se (P )P P e (P )P P s
ao dois sistemas de medidas condi-almost every P P.
cionais de com respeito a
` P, ent
ao P = P para
Demonstrac
ao. Suponha o contr
ario, isto e, existe um conjunto mensuravel
(Q0 ) > 0 tal que P = P for every P Q0 . Seja {k : k N}
Q0 P with
um conjunto enumer
avel e denso de C 0 (Z, R), e dena


Ak = {P Q0 : k dP = k dP }.
Q de Q0 tal
Notando que k Ak = Q0 , existe C 0 (Z, R) e um subconjunto

que
(Q) > 0 e (trocando os papeis de P e P , se necessario) dP > dP
para todo P Q. Ent
ao




dP d
(P ) >
dP d
(P ).
(5.12)
Q

De outro modo, pelo Lema 5.19,





(X1 (Q) ) dP d
(P ).
(X1 (Q) ) d =

ERGODICA

5.4. TEOREMA DE DECOMPOSIC


AO

59

quase todo P P. Para cada um destes P ,


Por hip
otese P (P ) = 1 para
temos que


(X1 (Q) ) dP = XQ (P ) dP .
Assim,






XQ (P ) dP d
(X1 (Q) ) d =
(P ) =
dP d
(P ).
Q

Analogamente, temos



(X1 (Q) ) d =
dP d
(P ).
Q

Essas duas u
ltimas igualdadades contradizem (5.12). Logo, P = P para
quase todo P , como armamos.
Deni
c
ao 5.21. P e uma partic
ao mesur
avel se existem conjuntos mensur
aveis
E1 , E2 , . . . , En , . . . de Z tais que
P = {E1 , Z \ E1 } {E2 , Z \ E2 } {En , Z \ En }

mod 0.

Em outras palavras, existe um conjunto de medida total F0 Z tal que, dado


qualquer atomo P de P podemos escrever
P F0 = E1 E2 En F0

(5.13)

onde Ej e Ej ou seu complemento Z \ Ej , para todo j 1.


Exemplo 5.22. Toda particao nita ou enumer
avel e mesuravel. De fato, P e
mensuravel se e so se existe uma sequencia n
ao-decrescente de particoes nitas
ou enumer
aveis P1 P2 Pn tais que P =
n=1 Pn mod 0.
Exemplo 5.23. Seja Z = X Y , onde X e Y espacos metricos compactos, e
P e a particao de Z em linhas horizontais X {y}, y Y . Ent
ao P e uma
particao mensuravel de Z.
Teorema 5.24 (desintegra
c
ao). Se P e partic
ao mensur
avel ent
ao a probabilidade admite alguma famlia de medidas condicionais relativamente a P.
Este resultado ser
a provado na Secao 5.5. De momento vamos usa-lo para
dar a
Demonstrac
ao do Teorema 5.16. Seja f : Z Z uma transformacao contnua
num espaco metrico compacto Z, e seja Bf o subconjunto dos pontos z Z
tais que as medias temporais estao bem denidas na orbita de z: dada qualquer
funcao contnua : Z R, a sequencia
n1
1
(f j (z))
n j=0

converge para algum (z)

R quando n . Seja P a particao de Z denida


por

CAPITULO 5. ERGODICIDADE

60
1. Z \ Bf e um elemento de P e

2. dois pontos z1 e z2 de Bf estao no mesmo elemento de P se e somente


2 ) para toda funcao
se tem as mesmas medias temporais: (z
1 ) = (z
continua .
Ent
ao P e uma particao mensuravel, com respeito a qualquer probabilidade
em Z. Se e f -invariant ent
ao (Z \ Bf ) = 0 e qualquer famlia de medidas
odica
condicionais (P )P de relativamente a P e tal que P e f -invariante e erg
para
-quase todo P P.

5.5

Teorema de desintegra
c
ao

No intuito de provar o Teorema, podemos trocar o espaco Z por qualquer conjunto de medida nula. Logo, n
ao h
a perda de generalidade supor que F0 em
(5.13) coincide exatamente com Z, e iremos assumir isso no que se segue. Seja
qualquer funcao mensuravel limitada em Z. Para cada n 1 seja
Pn = {E1 , Z \ E1 } {E2 , Z \ E2 } {En , Z \ En }
isto e, Pn e a particao de Z cujo os atomos sao os conjuntos E1 En , with
Ej = Ej or Ej = Z \ Ej , para cada 1 j n. Dena n : Z R como se
segue. Se o atomo Pn (z) de Pn que contem z tem medida (Pn (z)) positiva,
then

1
d.
(5.14)
n (z) =
(Pn (z)) Pn (z)
Caso contrario, n (z) = 0. Claramente, o segundo caso na denicao de n se
aplica somente num conjunto de pontos de medida igual a zero.
Lema 5.25. Dada qualquer func
ao mensur
avel limitada : Z R, existe um
subconjunto de medida total F = F () de Z tal que n (z), n 1, converge

para algum n
umero real (z),
para todo z F .
Demonstrac
ao. Observe que sempre podemos escrever = + , onde
sao measur
aveis, limitadas e n
ao-negativas: por exemplo, = (|| )/2.
+

Ent
ao n = n n para n 1, e entao a conclusao e verdadeira para se
ela vale para + e . Isto mostra que nao h
a restricao em assumir que e
n
ao-negativa. Iremos assumir isso de agora em diante.
Para todo < , seja S(, ) o conjunto dos pontos z Z tais que
lim inf n (z) < < < lim sup n (z).
claro que dado z Z, a sequencia n (z) diverge se, e so se, z S(, ) para
E
algum para de n
umeros racionais e . Logo, o lema segue-se se mostrarmos
que S = S(, ) tem medida igual a zero para todo e .
Para cada z S, xe uma sequencia de inteiros 1 az1 < bz1 < < azi <
z
bi < tais que
azi (z) < and bzi (z) >

for every i 1.


5.5. TEOREMA DE DESINTEGRAC
AO

61

ao dos elementos Pazi (z), e Bi como a uni


ao dos eleDena Ai como sendo a uni
mentos Pbzi (z) obtidos deste modo, para todos os pontos z S. Por construcao,
S Ai+1 Bi Ai

para todo i 1.

Em particular, S esta contido no conjunto


S =

Bi =

i=1

Ai .

i=1

Dados dois entre os conjuntos Pazi (z) que formam Ai , ou eles sao disjuntos ou
coincidem. isto porque Pn , n 1, e uma sequencia n
ao-decrescente de particoes.
Consequentemente, Ai pode ser escrito como uma uniao de conjuntos Pazi (z)
dois-a-dois disjuntos. Assim,



d =
d <
(Pazi ) = (Ai ),
Ai

Paz (z)

Paz

Paz (z)

para qualquer i 1 (as somas sao sobre uni


oes disjuntas). Analogamente,



d =
d >
(Pbzi ) = (Bi ).
Bi

Pbz (z)

Pbz

Pbz (z)

Desde que Ai Bi e observando que estamos assumindo que 0, segue-se


que


d
d > (Bi ),
(Ai ) >
Ai

Bi

para todo i 1. Tomando o limite quando i , temos que


 (S).

(S)
 = 0, e logo S S tambem e um conjunto com medida
Isto implica que (S)
igual a zero.
Dada qualquer funcao limitada mensur
avel : Z R, iremos representar por en (), e(), respectivamente, as funcoes n , denidas por(5.14) e o
Lema 5.25.
avel e denso de C 0 (Z, R), e seja
Seja {k : k N} algum conjunto enumer
F =

F (k ),

k=1

where F (k ) como dado pelo Lema 5.25.


Lema 5.26. Dada qualquer func
ao contnua : Z R, a seuquencia en ()(z)
converge para e()(z) quando n , para todo z F .

CAPITULO 5. ERGODICIDADE

62

claro que  en ()(z) e um funcional linear


Demonstraca
o. Fixe z F . E
limitado em C 0 (Z, R), com norma 1, e o mesmo e verdade para  e()(z).
Para todo > 0, escolha k tal que  k 0 < /3. Ent
ao, se n e grande o
suciente,
|en ()(z) e()(z)|
|en ()(z) en (k )(z)| + |en (k )(z) e(k )(z)| + |e(k )(z) e()(z)|
2 k 0 + /3 < .
isto mostra a armacao.
Seja : Z R contnua. Por construcao, en () e constante em cada
Pn Pn , e logo e constante tambem em cada atomo P de P, para todo n 1.
Assim, e() e constante em P F para cada P P. Seja en ()(Pn ) o valor
de en () em cada Pn Pn . Similarmente, e()(P ) representa o valor de e()
ltimo conjunto seja nao-vazio. Ent
ao, desde que (5.14)
on P F desde que o u
dene en () em um subconjunto de medida total de Z,




d =
d =
(Pn ) en ()(Pn ) = en () d.
(Pn )>0

Pn

(Pn )>0

Observe tambem que |en ()| sup || < para cada n 1. Assim, n
os
podemos usar o Teorema da Convergencia Dominada para concluir que


d = e() d.
(5.15)
Agora, estamos em condicoes de construir um sistema de medidas condi f
cionais para . Seja P qualquer atomo de P tal que P F e nao-vazio. E
acil
de ver que
C 0 (Z, R)  e()(P ) R
e um funcional n
ao-negativo de C 0 (Z, R). Do fato que en (1)(P ) = 1 e do
Teorema de Riez-Markov, existe uma u
nica medida de probabilidade P em Z
tal que

dP = e()(P ).

(5.16)

Devemos denir P mesmo quando P n


ao intersecta F . neste caso tomaremos
P como qualquer probabilidade em Z: desde que o conjunto de todos esses
atomos P tem medida

igual a zero em P (em outras palavras, sua uni


ao tem
medida igual a zero em Z), a escolha nao e relevante. De acordo com essas
denicoes, (5.15) pode ser reescrito como



d =
dP d
(P ),

o fato que P  P  dP e uma funcao mensuravel e uma consequencia direta de (5.16). Assim, para concluir que (P )P P forma um sistema de medidas
condicionais de com respeito a P resta-nos provar que


5.5. TEOREMA DE DESINTEGRAC
AO

63

-quase todo P P.
Lema 5.27. P (P ) = 1 para
Usaremos o seguinte resultado auxiliar:
Lema 5.28. dada uma func
ao mensur
avel limitada : Z R existe um
conjunto
de
medida

total
F
()

P
tal
que o conjunto P F e n
ao vazio

ent
ao dP = e()(P ), para qualquer P F().
Demonstraca
o. A classe das funcoes que satisfazem o lema contem o conjunto
das funcoes contnuas e e fechado por convergencia pontual dominada.Assim,
contem todas as funcoes mensuraveis limitadas.
Podemos provar o Lema 5.27:
Demonstrac
ao. Dena F = k,Pk F (XPk ), onde a interseccao e tomada sobre o
conjunto de todos os atomos Pk Pk , e todo k 1. Desde que esse conjunto e
enumer
avel, F tem medida
total. Armamos que a conclusao do lema vale
para todo P F . De fato, seja k 1 e Pk elemento Pk que contem P . Pela
denicao de F

P (Pk ) = XPk dP = e(XPk )(P ).
(5.17)
Para cada n 1, seja Pn o
atomo de Pn que contem P . Dado qualquer z
P F ,

1
XP d.
en (XPk )(z) =
(Pn ) Pn k
ltimo termo e igual a 1.
Agora, para cada n k temos que Pn Pk , e entao o u
Assim,
e(XPk )(P ) = e(XPk )(z) = lim en (XPk )(z) = 1.
n

Substituindo isso em (5.17) obtemos que P (Pk ) = 1 para todo k 1. Finalmente,


P (P ) = lim P (Pk ) = 1
k

pois Pk , k 1, e uma sequencia decrescente cuja interseccao e P .


A prova do Teorema 5.24 esta completa.
Exemplo 5.29. Seja Z o toro bi-dimensional, um n
umero irracional, e P a
particao de Z em linhas retas de inclinacao . Ent
ao P n
ao e uma particao . Um
modo de ver isso e observar que a medida de Haar (Lebesgue) em Z n
ao admite
sistema de medidas condicionais com respeito `a P. De fato, pela unicidade
da desintegracao, quase toda medida condicional teria que ser invariante por
translacoes ao longo das linhas retas, e e claro que estas translacoes nao tem
probabilidades invariantes.

CAPITULO 5. ERGODICIDADE

64

5.6

Exerccios

5.1. Considere o espaco M = {1, 2, . . . , d}Z das sequencias com valores num
conjunto {1, 2, . . . , d}. Fixe qualquer n
umero (0, 1). Para cada = (n )nZ
e = (n )nZ em M , dena


N (, ) = max N 0 : n = n para todo n Z com |n| < N
e d(, ) = N (, ) . Verique que d e uma metrica em M e gera a mesma
topologia que a famlia dos cilindros. Em particular, (M, d) e um espaco metrico
compacto. Tem-se um resultado analogo para M = {1, 2, . . . , d}N .
5.2. Suponha que R e uma rotacao irracional.
n
(z) : n Z} de todo z S 1 e densa em S 1 .
1. Mostre que a orbita {R

2. Seja A um conjunto invariante com medida positiva. Mostre que nenhum


ponto de S 1 e ponto de densidade de Ac . Conclua que (A) = 1.
Dica: considere um ponto de densidade de A e use o item (1).
5.3. A rotacao R e racional se e somente se ei e uma raiz da unidade, isto e,
se existe k = 0 tal que eki = 1.
5.4. Se R e rotacao racional entao R n
ao e ergodica para a medida de
Lebesgue.
No exerccio a seguir propomos outra demonstracao para a proposicao 5.5:
5.5. Suponha que R e uma rotacao irracional.
n
(z) : n Z} de todo z S 1 e densa em S 1 .
1. Mostre que a orbita {R

2. Seja A um conjunto invariante com medida positiva. Mostre que nenhum


ponto de S 1 e ponto de densidade de Ac . Conclua que (A) = 1.
Dica: considere um ponto de densidade de A e use o item (1).
5.6. Suponha que R e uma rotacao irracional.
1. Seja : S 1 R uma funcao contnua qualquer. Mostre que
n1
1
j
(R
(z))
n n
j=0

(x)

= lim

existe em todo ponto e, de fato, o limite e uniforme. Justique que e


constante em todo ponto.
Dica: Verique que a sequencia do lado direito e equicontnua e use o
teorema de Ascoli-Arzela.
2. Deduza que R tem uma u
nica probabilidade invariante.

5.6. EXERCICIOS

65

5.7. Seja f : M M uma maquina de somar, denida na seccao 5.1.5.


1. Seja : M R uma funcao contnua qualquer. Mostre que
n1
1
(f j (z))
n n
j=0

(x)

= lim

existe em todo ponto e o limite e uniforme.


2. Justique que e constante em todo ponto e deduza que f tem uma u
nica
probabilidade invariante.
3. Calcule essa probabilidade, encontrando uma express
ao explcita para a
medida de qualquer subconjunto [b0 , b1 , . . . , bk ] das sequencias com 0 =
b 0 , 1 = b 1 , . . . , k = b k .
5.8 (Teorema de Kac). Seja uma medida erg
odica para uma transformacao
f : M M e A um conjunto com (A) > 0. Considere nA : A N {+}
umero n
ao
como o menor n
umero nA (x) > 0 tal que f nA (x) (x) A. Caso este n
exista, denimos nA (x) = +.
avel com respeito a .
1. Mostre que nA e integr
2. Mostre que se A (B) =

(AB)
(A)

ent
ao:


nA (x) dA (x) =
A

1
.
(A)

5.9. Seja f : M M denida no espaco topologico M tal que existe alguma


medida erg
odica tal que para todo A aberto, (A) > 0. Mostre que f e
transitiva e a orbita de -quase todo ponto e densa.

66

CAPITULO 5. ERGODICIDADE

Captulo 6

Sistemas Misturadores
Neste captulo estudaremos mais uma propriedade das transformacoes que preservam medida, a saber, a propriedade de misturar conjuntos. Introduziremos os
deslocamentos de Markov, que generalizam os deslocamentos de Bernoulli, introduzidos no Captulo ??. Estudaremos sob que condicoes estas transformacoes
sao erg
odicas ou misturadoras.

6.1

Deni
c
oes e exemplos

Comecaremos este captulo, mostrando uma proposicao que estabelece uma


condicao equivalente a` condicao de ergodicidade de uma medida:
Proposi
c
ao 6.1. Seja f : M M uma transformac
ao que preserva uma
medida . S
ao equivalentes:
1. e erg
odica
2. Para quaisquer par de conjuntos mensur
aveis A, B ent
ao
n1
1
(f i (A) B) = (A)(B).
n n
i=0

lim

(6.1)

Demonstrac
ao. Primeiramente, se vale a igualdade como no item 2 acima, dado
um conjunto invariante A qualquer, temos que
n1
1
(f i (A) A) = (A)2 .
n n
i=0

(A) = lim

Logo, (A) = 0 ou 1, donde e ergodica.


Por outro lado, se e ergodica temos, pelo teorema de Birkho aplicado a
funcao = A , que a sequencia de funcoes
n (x) =

n1
1
(f i (x)
n i=0

67

CAPITULO 6. SISTEMAS MISTURADORES

68

converge em quase todo x para o valor constante (A). Assim, tomando


= B pelo teorema da convergencia dominada:


n1
1
i
lim
n d = (A) d = (A)(B),
(f (A) B) = lim
n n
n
i=0
e isto encerra a prova da Proposicao.
Observa
c
ao 6.2. Podemos extrair um pouco mais da proposicao anterior.
Mesmo que seja somente invariante, podemos mostrar utilizando o Teorema de
n1

Birkho e a prova da Proposicao 6.1 que a sequencia lim n1
(f i (A) B)
n

i=0

converge para quaisquer borelianos A e B. A adaptacao e canonica e ca a


cargo do leitor.
Deni
c
ao 6.3. Seja f uma transformacao f : M M preservando uma medida . Dizemos que o sistema (f, ) e misturador, se dados quaisquer conjuntos
mensuraveis A, B M ent
ao:
lim (f n (A) B) = (A)(B).

(6.2)

Em muitos casos, especialmente nos que consideramos f xada e onde n


ao
houver perigo de confus
ao, diremos simplesmente que a medida e misturadora,
imediato a partir da Proposicao 6.1 que
sem mencionar a transformacao f . E
toda medida erg
odica e misturadora. Em geral, o contr
ario n
ao vale como
veremos agora:
ario S 1
Exemplo 6.4. A rotacao R de angulo irracional do crculo unit
preservando a medida de Lebesgue m. Observe que como e irracional, a
propriedade de ergodicidade se verica para este sistema, como ja vimos no
exemplo ??. Porem a medida de Lebesgue nao e misturadora. Para provar
isto, observe que dados dois intervalos A, B S 1 sucientemente pequenos,
para innitos valores de n temos que f n (A) n
ao interssecta B. Em particular,
ao se verica, j
a que m(A)m(B) > 0.
m(f n (A) B) = 0 e o limite em (6.2) n
Em geral, quando desejamos mostrar que uma medida e misturadora, precisamos vericar a condicao 6.2 para todos pares de conjuntos mensur
aveis A, B.
Para nosso auxlio nesta tarefa, na proposicao a seguir mostraremos que basta
fazer tal vericacao para uma classe especial de subconjuntos gerando a algebra:

Proposi
c
ao 6.5. Sejam (M, , A) um espaco de medida, f : M M uma
transformac
ao preservando a medida e B uma semi-
algebra que gera A. Se
para todos A, B B vale
lim (f n (A) B) = (A)(B),

ent
ao e misturadora.

6.2. DESLOCAMENTOS DE MARKOV

69

Exemplo 6.6. Todo deslocamento de Bernoulli e uma transformacao misturadora. De fato, para provar isso considere o deslocamento denido no espaco
das sequencias de k smbolos {1, 2, . . . , k}N e seja uma medida de Bernoulli
associada ao vetor de probabilidades p = (p1 , . . . , pk ). Precisamos mostrar que
a condicao 6.2 vale para todo par A, B de conjuntos mensuraveis. Utilizando a
Proposicao ??, basta mostrar que esta condicao vale no caso particular em que
A e B sao cilindros. De fato, se A = [m; am , . . . , an ] e B = [r; br , . . . , bs ] sao
cilindros ent
ao, para l sucientemente grande as restricoes nas coordenadas de
l (A) sao independentes das restricoes nas coordenadas de B, de onde segue-se
que ( l (A) B) = (A)(B). Deste modo, os deslocamentos de Bernoulli
sao transformacoes misturadoras.
Em termos de Teoria das Probabilidades, dizer que ( l (A)B) = (A)(B),
signica dizer que os eventos l (A) e B sao independentes, ou seja, a ocorrencia
de B no presente nao inui na possibilidade de ocorrencia de A ap
os l unidades
de tempo passadas.

6.2

Deslocamentos de Markov

Os deslocamentos de Markov sao uma classe de transformacoes preservando


medida que surgem naturalmente na Teoria das Probabilidades e em algumas
aplicacoes dos Sistemas Dinamicos. Elas podem ser vistas como uma generalizacao do conceito de deslocamento de Bernoulli com k smbolos, onde os
lancamentos n
ao sao mais independentes. Alem da perda de independencia,
uma diferenca entre os deslocamentos de Bernoulli e os de Markov e que, em
geral, o domnio dos deslocamentos de Markov serao subconjuntos pr
oprios de
.
+
k
Para denirmos um deslocamento de Markov com k smbolos, antes de mais
nada, e necessario xar uma matriz A = (aij ) de tamanho k k e com entradas
iguais a 0 ou 1, chamada matriz de transic
ao. A partir desta matriz, podemos
+
de

das
sequencias admissveis do seguinte
construir um subconjunto +
A
k
modo:
+
+
A = {(x1 , x2 , . . . ) k ; axi xi+1 = 1}.
ao (x) tambem pertence `a
Note que se x = (x1 , x2 . . . ) pertence `a +
A ent
Chamaremos de deslocamento de Markov associado `a matriz de transicao
A a restricao de ao conjunto +
A.
Esta transformacao admite uma classe especial de medidas, chamadas medidas de Markov. Para construir uma destas medidas, consideraremos uma
matriz P = (pij ) e um vetor p = (p1 , . . . , pk ) com todas as coordenadas pi > 0,
satisfazendo as seguintes propriedades:

+
A.

0 pij 1

k

j=1

pij = 1.

CAPITULO 6. SISTEMAS MISTURADORES

70
pP = p, ou seja:

k


pi pij = pj , para todo j = 1, . . . , k.

i=1

Esta matriz e chamada matriz estoc


astica e determina a probabilidade da transicao
do sistema do estado i para o estado j. Analogamente, podemos interpretar a
(n)
entrada Pij da matriz P n , como sendo a chance de transicao do estado i para
o estado j em n passos. Com estes elementos em maos, denimos a medida de
Markov no cilindro [m; bm , . . . , bn ] como:
([m; bm , . . . , bn ]) = pbm pbm bm+1 . . . pbn1 bn

(6.3)

e estendemos a denicao de para a algebra das uni


oes disjuntas A = A1
Al de cilindros por
(A) = (A1 ) + + (Al ).
Pelo Teorema 0.9, segue-se que pode ser estendida para toda -algebra. Para
mostrar a invari
ancia de com respeito `a , basta provar que ( 1 (C)) =
(C), onde C e um cilindro. Ora, isso segue diretamente da express
ao de (C)
ao depende do ndice m.
acima, uma vez que a medida ([m; bm , . . . , bn ]) n
Observe que, ao contr
ario dos deslocamentos de Bernoulli, se A e B sao
cilindros disjuntos entao (A B) n
ao e necessariamente (A)(B). Para ver
isto, basta por exemplo considerar o cilindro A = [1; i] e o cilindro B = [2; j].
ao e necessariamente igual a`
Claramente, (A B) = ([1; i, j]) = pi pij que n
(A)(B) = pi pj . Apesar disto, ainda podemos calcular, atraves de um fator
corretivo, a medida de A B:
Lema 6.7. Sejam A = [m; m , . . . , n ] e B = [r; r , . . . , s ] cilindros com
r > n. Ent
ao:
(rn)
Pn r
(A B) = (A)(B)
.
p r
Demonstraca
o. Podemos escrever A B como a uni
ao disjunta

AB =
[m; m . . . , n1 , x(n), . . . , x(r), r+1 , . . . , bs ],
xF

onde x varia no conjunto F das funcoes w : {n, . . . , r} {1, . . . , k} tais que


w(n) = n e w(r) = r . Deste modo, temos que:
(A B) = (A)(B)

pn x(n+1) . . . pxr1 r
.
p r

xF

o que conclui a demonstracao do nosso lema, uma vez que



(rn)
Pn r =
pn x(n+1) . . . pxr1 r .
xF

6.2. DESLOCAMENTOS DE MARKOV

71

Iremos agora estudar condicoes que a matriz estocastica P deve satisfazer


para que uma medida de Markov seja erg
odica ou misturadora.
Deni
c
ao 6.8. Uma matriz estocastica P se diz irredutvel se dados i, j
(n)
{1, . . . , k} ent
ao existe n N tal que Pij > 0.
Podemos interpretar a irredutibilidade de uma matriz estoc
astica P do seguinte
modo: dizer que uma matriz P e irredutvel equivale a dizer que sempre e
possvel a partir de um estado i do sistema, chegar a um estado j com um
certo n
umero n (que depende de i e j) de passos. Como veremos, a condicao de
irredutibilidade e necessaria e suciente para que uma medida de Markov seja
erg
odica. Um primeiro passo nessa direcao e o seguinte lema:
Lema 6.9. Seja P uma matriz estoc
astica irredutvel. Ent
ao, dados i e j temos
que:
n1
1 (l)
Pij = pj .
n
l=0

Demonstrac
ao. Primeiramente, provaremos que

1
n

n1


P l converge. De fato,

l=0

observe que se A = [1; j] e B = [0; i] ent


ao, pelo Lema 6.7:
n1
n1
1
1
1 (l)
( l (A) B) = (A)(B)
Pij .
n
pj
n
l=0

l=0

Assim, para mostrar a convergencia de


sequencia

1
n

n1


1
n

n1


P l , e suciente observar que a

l=0

( l (A) B) converge, de acordo com a observacao 6.2.

l=0

Se v e o vetor v = (1, 1, . . . , 1), as igualdades

k


pij = 1, para i = 1, 2, . . . , k

j=1

na denicao de matriz estocastica podem ser escritas como P v = v. Deste


ao
modo, e simples vericar que Qv = v, ou em outros termos, se Q = (qij ), ent
k

qij = 1, para i = 1, 2, . . . , k. De modo an
alogo, como pP = p, temos que
j=1

pQ = p, ou
k

pi qij = pj , para todo j = 1, . . . , k.

i=1

Alem disso, uma facil vericacao a partir da denicao de Q mostra que P n Q =


ao
Q, para todo n N. Utilizaremos estas propriedades para concluir que qij n
depende de i.
De fato, assuma por absurdo que existem r tal que qrj < qsj , onde s e
escolhido de modo que qsj = supi qij . Como P e irredutvel, temos que existe n

CAPITULO 6. SISTEMAS MISTURADORES

72
(n)

tal que Psr > 0. Assim,


qsj =

(n)
Psi qij

i=1

k

(n)
<(
Psi )qsj = qsj ,
i=1

ao depende de i. Seja qj = qij este valor


o que e uma contradicao. Logo, qij n
comum. Como pQ = p, temos que:
pj =

k

pi qij = (
pi )qj = qj ,

i=1

i=1

terminando a prova do Lema.


Uma observacao simples e que a condicao do lema anterior e equivalente a
(l)
irredutibilidade de P . De fato, se caso contr
ario existiriam i, j tais que Pij = 0
n1
 (l)
Pij = 0.
para todo l N, onde n1
l=0

O teorema a seguir mostra que a irredutibilidade e uma condicao necess


aria
e suciente para que uma medida de Markov seja erg
odica:
Teorema 6.10. Seja uma medida de Markov relativa a uma matriz estoc
astica
P . Ent
ao e erg
odica se, e s
o se, P e irredutvel.
Demonstrac
ao. Primeiramente, vamos assumir que e ergodica e mostraremos
que P e irredutvel. De fato, tendo em vista a Proposicao 6.1, como e ergodica,
se considerarmos os cilindros de comprimento 1, A = [1; j] e B = [0; i], temos
que:
n1
1
( l (A) B) = (A)(B) = pi pj .
(6.4)
lim
n n
l=0

Por outro lado, de acordo com o Lema 6.7 temos que


(l)

( l (A) B) = ([0; i] [l; j]) = pi Pij

Substituindo na equacao 6.4 e cancelando pi em ambos os lados,


n1
1 (l)
Pij = pj .
n
l=0

(n)

Em particular, existe n tal que Pij > 0.


Agora, mostraremos que se P e irredutvel, ent
ao e ergodica. Apelando
n1

(l)
Pij = pj .
para o Lema 6.9, podemos assumir que lim n1
n

l=0

Utilizando a Proposicao 6.1, para mostrar que e ergodica, basta mostrar


que para todos A, B mensuraveis vale:
n1
1
( l (A) B) = (A)(B).
n
l=0

6.2. DESLOCAMENTOS DE MARKOV

73

Mostraremos isto em dois passos: inicialmente, veremos que basta mostrar no


caso em que A e B sao uni
oes disjuntas de cilindros. A seguir, mostraremos
essa propriedade para uni
oes disjuntas de cilindros. De fato, assumindo que
a equacao 6.1 vale para uni
oes disjuntas de cilindros, dados A e B borelianos
oes disjuntas de cilindros de modo que
quaisquer e  > 0, escolha A0 e B0 uni
(AA0 )  e (BB0 ) . Assim,
n1
n1
1
1
( l (A)B)(A)(B)
( l (A)B)( l (A0 )B0 )+
n
n
l=0

l=0

n1
n1
1
1
( l (A0 ) B0 ) (A0 )(B0 ) +
(A0 )(B0 ) (A)(B).
n
n
l=0

l=0

Fazendo  arbitrariamente pequeno e n arbitrariamente grande, temos que os


termos acima sao arbitrariamente pequenos, mostrando nossa armacao.
Resta-nos mostrar que a equacao 6.1 vale para uni
oes de cilindros disjuntos.
Deixaremos para o leitor a vericacao de que basta mostrar que essa equacao
vale para cilindros. Vericaremos para o caso em que A = [m; am , . . . , an ] e
B = [r; br , . . . , bs ] sao cilindros com m > r. Assim:
( l (A) B) =

1
(m+lr)
(A)(B)Pbr am
.
pam

Logo, segue diretamente que


n1
n1
1
1 (m+lr)
1
( l (A) B) =
(A)(B)
Pbr am
.
n
pam
n
l=0

l=0

Como

n1
1 (l)
Pij = pj ,
n
l=0

acabamos a prova do teorema.


A seguir, mostraremos que uma condicao necess
aria e suciente para que
uma medida de Markov seja misturadora e que exista algum n
umero n N tal
que Pijn > 0 para todos i e j. Ou seja, mostraremos o seguinte teorema:
Teorema 6.11. S
ao equivalentes:
1. e misturadora
(n)

2. lim Pij = pj
n

(n)

3. Existe n N tal que Pij > 0 para todos i e j.

CAPITULO 6. SISTEMAS MISTURADORES

74

Demonstrac
ao. 1 implica 2: Assim como no Teorema 6.10, se considerarmos
os cilindros de comprimento 1 A = [1; j] e B = [0; i], como e misturadora,
temos que:
lim ( l (A) B) = (A)(B) = pi pj .
l

Por outro lado,


(l)

lim ( l (A) B) = ([0; i] [l; j]) = pi Pij .

Cancelando o termo pi nas equacoes acima, obtemos o item 2.


2 implica 3: Trivial.
3 implica 1: Essa e a parte mais difcil de nosso teorema. Para mostrar que
e misturadora, utilizando o Proposicao 6.5, basta mostrar que a equacao ??
vale para cilindros. De fato, como j
a vimos, se A = [m; am , . . . , an ] e B =
[r; br , . . . , bs ] sao cilindros com m > r, ent
ao:
( l (A) B) =

1
pam

(m+lr)

(A)(B)Pbr am

Logo, e suciente mostrar que


(n)

lim Pij = pj .

De fato, assuma por um instante que a sequencia de matrizes P (n) converge


para uma matriz Q. Em particular,
n1
1 (i)
P = Q.
n n
i=0

lim

ao depende de i e qij = pj . Neste


Assim, de acordo com o Lema 6.9, Q = (qij ) n
ponto, recorreremos a o seguinte teorema (para uma prova do teorema, veja ??):
Teorema 6.12 (Perron-Fr
obenius). Seja A uma matriz k k tal que alguma
de suas potencias tem todas as entradas maiores que zero. Ent
ao:
1. Existe algum auto-valor de A tal que > , para todo auto-valor
de A
2. O auto-espaco associado a tem dimens
ao 1.
A partir do Teorema de Perr
on, vamos mostrar agora que P (n) de fato converge, quando n . Primeiramente, mostraremos que o auto-valor dominante de P obtido pelo Teorema de Perr
on e, de fato, igual a um. Para
mostrar isso, utilizaremos a adjunta P de P e o fato que os auto-valores de
P e de sua adjunta coincidem. Assim, podemos escolher v = (v1 , . . . , vk ) um
auto-vetor com vi > 0 associado ao auto-valor maximal para a adjunta P ,
k

tal que
vi = 1, obtido como no Teorema de Perr
on. Logo:
i=1

P v = v

k

i=1

Pji vi = vj ,

6.3. EXERCICIOS

75

Somando com respeito `a j e observando que

k


Pji = 1,

j=1

1=

k

i=1

vi =

k
k
k


(
Pji )vi =
vj = .
i=1 j=1

j=1

Para concluir a demonstracao, denote por V o subespaco de Rk denido por


k

W2 = {(x1 , . . . , xk );
= 0. Observe que P deixa invariante W2 , ou seja,
i=1

P W2 = W2 e que o auto-espaco W1 associado ao auto-valor 1 de P intersecta W2


somente na origem, uma vez que pelo Teorema de Perron, W1 e unidimensional
e tem algum vetor com todas as coordenadas positivas. Logo, pelo item 1 do
Teorema de Perr
on, o m
odulo de todos os auto-valores de P |W2 sao menores
que um, de onde obtemos que lim P (n) |W2  = 0. Finalmente, dado um vetor
n

x Rk , podemos escreve-lo como x = x1 + x2 , com x1 W1 e x2 W2 . Isto


implica automaticamente que lim P (n) x = x1 , concluindo a prova da armacao
de que a sequencia P n era convergente.

6.3

Exerccios

76

CAPITULO 6. SISTEMAS MISTURADORES

Captulo 7

Entropia M
etrica
Este captulo e dedicado ao estudo da entropia de uma medida invariante,
um conceito que contem diversas informacoes ergodicas do sistema dinamico.
Por exemplo, podemos ve-lo como um n
umero que mede qu
ao desordenada a
din
amica de uma transformacao que preserva uma medida pode ser. Outro aspecto interessante refere-se a distinguir duas transformacoes que preservam medida do ponto de vista de sua estrutura erg
odica: se as suas entropias diferem,
as transformacoes sao denitivamente diferentes do ponto de vista erg
odico.
Finalmente, veremos a relacao entre esse invariante metrico e um invariante
topol
ogico para o sistema dinamico: a entropia topol
ogica.

7.1

Entropia de uma parti


c
ao

A denicao intuitiva de entropia topol


ogica, htop (f ), e de entropia de uma medida invariante, h (f ), e motivada pela necessidade de medir o crescimento
de possibilidades para um certo evento. Vamos tentar tornar isso mais claro,
considerando um exemplo muito familiar: o shift nito com 2 smbolos + .
Por exemplo, podemos pensar nessa transformacao modelando o lancamento
de uma moeda viciada (0 para cara e 1 para coroa). Ao jogar uma moeda n
vezes, o n
umero de sequencias diferentes de cara ou coroa que podemos obter
cresce exponencialmente, a uma taxa exponencial htop (f ) = log 2. Por outro
lado, se nossa moeda viciada atribui probabilidade p para cara e probabilidade
(1 p) para coroa e razo
avel, pelo teorema de Birkho, que a media de caras
que aparecem em n lancamentos seja pn. Ou seja, se n e grande, a medida das
sequencias tpicas com pn caras e muito proxima de 1. Adiantamos que neste
caso a entropia da medida de Bernoulli que atribui probabilidade p ao evento
cara e probabilidade (1 p) para coroa e h (f ) = (p log p + (1 p) log(1 p)).
Um motivo intuitivo para esta denicao e o que se segue: a medida de uma
sequencia tpica e exatamente igual a
ppn (1 p)(1p)n = e(p log p+(1p) log(1p))n = eh (f )n .
77


CAPITULO 7. ENTROPIA METRICA

78

Assim, o n
umero de sequencias tpicas diferentes (que realmente s
ao as que
importam no sentido de medida) e exponencial da ordem eh (f )n .
Vamos agora tornar um pouco mais rigorosos os conceitos intuitivos que
denimos anteriormente, comecando pela denicao de entropia metrica. Existem varias denicoes possveis de entropia metrica e um consenso: sob hip
oteses
razoaveis elas coincidem. Nos concentraremos na denicao de Kolmogorov, via
entropia de particoes:
Deni
c
ao 7.1. Seja f : X  X uma transformacao que preserva a probabilidade . Dada uma particao Q enumer
avel de X, a entropia da particao Q com
respeito `a e o n
umero,

(Q) log (Q),
H (Q) =
QQ

onde se convenciona que 0 log 0 = 0.


Uma vez xado o n
umero de elementos, para obtermos uma particao com
entropia maior possvel, temos que tentar escolher seus elementos de modo que
suas medida com respeito `a seja o mais igualpossvel (veja o Exerccio 7.1.)
Em outros termos, se o n
umero de elementos das particoes e xado, ent
ao a
particao que tem maior entropia possvel e aquela em que a medida de seus
elementos e melhor distribuida.
Isso nos motiva a ilustrar a denicao de entropia com o seguinte exemplo:
foi acertado um classico entre os principais times de um estado (para dar nomes,
digamos CSA x CRB). O tecnico do CSA tem no seu plantel cerca de 22 jogadores, podendo organizar seu time de 28.158.588.057.600 modos diferentes.
Denotaremos o conjunto dessas conguracoes por X e a cada conguracao x
do time do CSA associaremos um ndice tecnico t(x) e um ndice fsico f (x),
que sao obtidos de acordo com algum padr
ao de medicao xado (por exemplo,
atribudo pelo comentarista do jogo, Gavi
ao Boemio, tomando valores inteiros
de 0 a 10). Classicaremos uma conguracao x do time de acordo com sua
qualidade tecnica como
otima, se t(x) 9, boa, se 7 t(x) < 9, regular, se
6 t(x) < 7 e ruim, se t(x) 6. Isso gera uma particao T do espaco das
conguracoes X em quatro subconjuntos,
T = {T1 , T2 , T3 , T4 }.
Como o time referido e o CSA, a medida do conjunto das conguracoes otimas
e quase igual a 1. Assim, a entropia e muito pequena, pois (Ti ) log (Ti ) e
muito pr
oxima de 0 para cada i. Aqui n
os estamos pensando em como sendo
a medida da contagem, denida por
(A) =

#A
.
#X

Por outro lado, se tivessemos considerado o CRB, as medidas dos conjuntos


T1 , T2 , T3 e T4 seriam quase iguais a 14 e a entropia seria bem proxima de log 4.


7.1. ENTROPIA DE UMA PARTIC
AO

79

Logo, se houvesse um aposta na loteria consistindo em adivinhar a condicao


tecnica do time do CSA no dia do confronto (assuma que o treinador faltou e que
os times estao sendo escolhidos por meio de um sorteio, para tornar o processo
aleat
orio) essa aposta devera pagar muito menos que a aposta consistindo em
adivinhar a condicao tecnica do time do CRB. Assim, a entropia pode ser vista
como uma certa medida da diculdade em se ganhar essa aposta.
Vamos agora calcular a entropia de algumas particoes que ja estudamos:
Exemplo 7.2. Seja f dada por
f : [0, 1] [0, 1],

f (x) = 10x [10x].

k k+1
, 10 ] com k = 0, . . . , 9, ent
ao a
Se P e a particao por intervalos Pk = ( 10
entropia da particao P com respeito `a medida de Lebesgue m de [0, 1] e dada
9
1
1
log 10
= log 10.
por Hm (P) = i=0 10

Exemplo 7.3. Consideremos o deslocamento unilateral com d smbolos {1, . . . , d}


e a particao Pl formada pelos cilindros de comprimento n, ou seja, Pl e formada pelos conjuntos C = [0, l; a0 , . . . , al ] = {(x0 , . . . , xn , . . . ) + ; ai =
xi para i = 0, . . . , l 1}. A entropia de Pl com respeito `a medida de Bernoulli
m relativa ao vetor de probabilidades p = (p1 , . . . , pd ) e dada por Hm (P l ) =

l di=1 pi log pi (veja exerccio 7.3.)
Porem, nem sempre a entropia de uma particao e nita. Realmente, vamos
dar agora um exemplo de uma parti
 cao1 com entropia innita. Para tanto,
usaremos os fatos de que a serie
e convergente com soma igual a
n(log n)2
n1
 c
e divergente.
um certo n
umero c > 0, enquanto que a serie
n log n
n1

Exemplo 7.4. Considere a transformacao f (x) = 10x [10x] acima. Claramente a medida de Lebesgue e invariante para f . Para construir a particao, de1
componha o intervalo [0, 1] em subintervalos An de modo que m(An ) = cn log
n2 .
Deste modo, se A = {A1 , . . . , An , . . . } segue que
Hm (A) =

+
+

log c + log n + 2 log(log n) 1
=

cn(log n)2
n log n
n=1
n=1

Dadas duas particoes P e Q podemos denir uma nova particao P Q de


X do seguinte modo:
P Q = {A B; A P e B Q}.
Dada a particao P, denotaremos por P n a particao
Pn =

n1


f i (P).

i=0

ario
Observe que se P = {P1 , . . . , Pd }, cada elemento de P n e dado por um itiner
(a0 , . . . , an1 ), ai {1, . . . , p}. Quer dizer, cada elemento de P n e formado pelos
pontos x M tais que f i (x) Pai .


CAPITULO 7. ENTROPIA METRICA

80

7.2

Entropia de um sistema erg


odico

Novamente, voltando ao exemplo CSA contra CRB, vamos agora considerar a


particao das conguracoes do time do CSA de acordo com o nvel de preparacao
fsica dos jogadores como
Ruim: F1 = {x X; f (x) 5}
Regular: F2 = {x X; 6 f (x) 7}
Boa: F3 = {x X; f (x) = 8}

Otima:
se F4 = {x X; f (x) 9}.
Se denotamos F = {F1 , . . . , F4 }, ent
ao
P = T F = {Ti Fj X; i, j = 1, 2, 3, 4},
representa as possibilidades para o time do CSA, de acordo com a nossa classicacao tecnica e fsica. Digamos agora que o time do CSA est
a participando da
Super Copa Nordeste, consistindo de 200 jogos no sistema de pontos corridos.
Para otimizar os resultados e diminuir os custos com treinador, cada jogador
tem seu perl instalado num computador que, a partir da conguracao x da
u
ltima partida disputada, escolhe a conguracao f (x) para a partida seguinte.
Deste modo, se escolhemos ao acaso a conguracao do time para a primeira partida do campeonato, as demais estarao determinadas pelo computador. Assim,
podemos considerar a particao
P 200 = P f 1 (P) . . . , f 199 (P),
que representa as possveis conguracoes do time do CSA ao longo do campeonato, de acordo com a classicacao tecnica e fsica adotada. Claramente, essa
particao depende da programacao feita no computador. Por exemplo, se o computador a partir de uma conguracao qualquer, escolhe sempre um certo time,
ao se Pf denota
por exemplo o time xf formado pelos lhos dos dirigentes, ent
o elemento da particao P que contem xf , vem que
f i (P) = {X},
logo

P 200 = P {X} {X} = P.

Assim, descobrir a conguracao do time ao longo do campeonato e tao difcil


quanto descobrir que time jogar
a no dia da abertura; a partir da, o time que
entrara em campo sera sempre o mesmo, escolhido pelo computador. Vamos
agora introduzir o conceito de entropia de uma particao. A entropia da particao
P com respeito `a transformacao f e `a medida e o n
umero:
H(P n )
n+
n

h (f, P) = lim


7.2. ENTROPIA DE UM SISTEMA ERGODICO

81

)
Devemos mostrar que a sequencia H(P
e convergente para que o limite
n
acima faca sentido. Deixaremos esta demonstracao a cargo do leitor (veja os
Exerccios 7.4 e 7.5.)
Assim, no nosso exemplo futebolstico, dada uma programacao f do computador, a entropia da particao P representa a diculdade em descobrir qual
ser
a a conguracao, de acordo com a nossa classicacao do time do CSA, ao
longo da Super Copa Nordeste, dado que o time inicial e determinado por um
sorteio. Por exemplo, se para cada conguracao x o computador associa para o
pr
oximo jogo uma certa conguracao xada que maximiza a qualidade do time
(por exemplo, a soma de t(x) com f (x)), ent
ao n
ao e difcil ver que a entropia da
ao e nada difcil para um aposparticao P 200 e igual a` entropia de P. Ou seja, n
tador, descobrir a conguracao do time do CSA ao longo de todo campeonato:
basta descobrir a conguracao no primeiro dia. Observe que neste caso:
n

1
H (P 200 ) H (P)
H (P n )
=
= 0.
=
n n
200
200

h (f, P) = lim

Ou seja, a aposta descobrir a congurac


ao do time do CSA ao longo da Super
Copa Nordeste e muito previsvel e devemos pagar pouco ao vencedor dela. Claro
que isso s
o acontece se nossa programacao for, em certo sentido, previsvel. Se,
por exemplo, o time do CSA for escolhido a cada rodada por meio de um sorteio,
ent
ao descobrir a sua conguracao ao longo do campeonato se torna muito mais
complicado. Neste caso, a entropia da particao P depender
a da medida de seus
atomos, ou seja, da medida de cada elemento Pi . Deniremos agora uma forma

global de medir a complexidade de uma transformacao, no sentido metrico.


A palavra global aqui refere-se que ela n
ao depender
a de nenhuma particao
especca.
Deni
c
ao 7.5. A entropia de f com respeito `a medida e:
h (f ) = sup h (f, P),
P

onde o supremo e tomado sobre todas as particoes nitas de X.


Vamos agora ilustrar um pouco a denicao com alguns exemplos:
Exemplo 7.6. Seja f : X uma transformacao e p X um ponto xo para
f , i.e., tal que f (p) = p. Deste modo, a medida p denida por:
p (A) =

0 , se p
/A
1 , se p A,

e uma medida invariante por f . Vamos calcular sua entropia: claramente, a


entropia de qualquer particao e zero, j
a que a medida de um conjunto A e zero
ou um. Em ambos os casos, p (A) log p (A) = 0. Assim, segue-se diretamente
que a entropia hp (f ) e zero.
Um fato interessante que podemos extrair diretamente do exemplo acima
e que a funcao entropia  h (f ) pode ser descontnua: de fato, a medida


CAPITULO 7. ENTROPIA METRICA

82

SRB absolutamente contnua com respeito `a medida de Lebesgue para uma


transformacao expansora, construda no Captulo 9, pode ser obtida como limite
de medidas
odicos. Porem, sua entropia
 de Dirac concentradas nos pontos peri
e igual a log | det Df |dSRB > 0, como mostra o Teorema 8.18.
+
Exemplo 7.7. Considere o shift completo com d smbolos + : +
d  d . Se
+
tomarmos a particao P de d dada pelos cilindros de comprimento 1 podemos
vericar que P n e simplesmente a particao por cilindros de comprimento n. No
exemplo 7.3 calculamos a entropia de P n com respeito `a medida de Bernoulli p

com vetor de probabilidades p = (p1 , . . . , pd ), obtendo n di=1 pi log pi . Assim,

hp ( + , P) =

pi log pi .

i=1

De fato, este n
umero e a entropia da transformacao + com respeito `a medida
p : isso e consequencia do fato de que P e uma particao geradora e do Teorema
de Kolmogorov-Sinai. Veja a Secao 7.3
Exemplo 7.8. Vamos calcular a entropia da medida de Lebesgue de [0, 1] para
a transformacao dada por f (x) = 10x [10x]. Se considerarmos a particao P
como no exemplo 7.2, note que existem exatamente 10n elementos em P n e cada
um deles e um intervalo de comprimento 10n . Assim, m(C) = 10n para todo
C P n . Donde
hm (f, P) = lim

1
log 10n
= log 10.
m(C) log m(C) = lim
n
n
n
CP

Alem disso, a entropia desta particao e a entropia da medida de Lebesgue.


Isso e consequencia novamente do Teorema de Kolmogorov-Sinai.
Exemplo 7.9. Esse exemplo e dedicado a calcular a entropia de uma rotacao
R de angulo do crculo S 1 com respeito `a medida de Lebesgue m. Na
verdade, o argumento que usaremos abaixo se aplica a qualquer bijecao mensur
avel f : S 1 S 1 (ou f : [0, 1] [0, 1]) que preserve uma dada medida
. Primeiramente, observe que uma particao do crculo P com k elementos e determinada por uma sequencia p1 , . . . , pk de pontos de S 1 . Observe
tambem que se denotamos por pji = f j (pi ) ent
ao P n e determinada pelo conj
1
junto de pontos Cn = {(pi ) S ; i = 1, . . . , k e j = 0, . . . , n 1}. Note que
#Cn #Cn1 + k, pois Cn Cn1 = {pn1 , . . . , pnk }. Assim, e facil deduzir por
inducao que #P n kn. Deste modo:
h (f, P) = lim

#P n
log kn
H (P n )

= lim
= 0.
n
n
n

Como a escolha de P foi arbitr


aria, temos que h (f ) = 0.

7.3. TEOREMA DE KOLMOGOROV-SINAI

7.3

83

Teorema de Kolmogorov-Sinai

Deni
c
ao 7.10. Seja f : X X uma transformacao invertvel preservando
uma probabilidade no espaco de probabilidade (X, A, ). Uma particao P e
+

dita geradora se
f n P gera a -algebra A. No caso que f e nao-invertvel,
n=

ent
ao P e geradora se

+


f n P gera a -algebra.

n=0

Teorema 7.11. Seja P uma partic


ao geradora para f : X X preservando
uma probabilidade no espaco de probabilidade (X, A, ). Ent
ao:
h (f ) = h (f, P).

7.4

Equival
encia erg
odica

Vamos agora denir uma relacao de equivalencia do ponto de vista ergodico


entre as transformacoes que preservam medida. Duas transformacoes serao
equivalentes se, apos retirarmos conjuntos de medida zero, suas din
amicas sao
conjugadas. Mais precisamente:
Deni
c
ao 7.12. Sejam f1 : X1 X1 preservando a medida 1 e f2 : X2 X2
preservando a medida 2 . Diremos que o sistema (f1 , 1 ) e equivalente a` (f2 , 2 )
se podemos escolher conjuntos Y1 e Y2 com 1 (X1 Y1 ) = 0 e 2 (X2 Y2 ) = 0,
e uma bijecao mensuravel : Y1 Y2 com inversa mensur
avel tal que:
1. 1 (1 (A)) = 2 (A) para todo A Y2 mensuravel;
2. f1 = f2 .
Muitas vezes a relacao de equivalencia acima e chamada de conjugacao
erg
odica entre (f1 , 1 ) e (f2 , 2 ) e e dita a conjugac
ao.
Observa
c
ao 7.13. Observe que os conjuntos Y1 e Y2 acima podem ser tomados
ao
de modo que f1 (Y1 ) Y1 e f2 (Y2 ) Y2 . De fato, se B1 = X1 Y1 n
+
 i
1 =
f (B1 ). Como 1 (B1 ) = 0, temos que
e invariante por f1 , tome B
i=0

1 ). Analogamente para
1 (f i (B1 )) = 1 (B1 ) = 0, donde segue-se que 1 (B
B2 = X2 Y2 .
Claramente a relacao acima e de equivalencia (prove isto!). Vamos agora ver
alguns exemplos de transformacoes equivalentes do ponto de vista ergodico:
Exemplo 7.14. Considere a transformacao do intervalo f : [0, 1]  [0, 1] tal
que f (x) = 2x [2x] preservando a medida de Lebesgue m, onde [x] e o menor
inteiro menor ou igual a x. Observe que, escrevendo um n
umero x [0, 1]
em sua expans
ao bin
aria x = 0, a1 a2 a3 . . .2 , a transformacao f e simplesmente


CAPITULO 7. ENTROPIA METRICA

84

deslocarum dgito de x para esquerda. Isso nos motiva a considerar a aplicacao


N
: [0, 1] +
2 = {0, 1} denida por
x = (0, a1 a2 a3 . . . )2 (x) = (a1 , a2 , a3 , . . . ).
Observe que em alguns pontos n
ao est
a bem denida. Por exemplo, podemos
escrever (0, 1)2 de outro modo, a saber, como (0, 1)2 = (0, 01111 . . . )2 . Porem,
isso nao gera maiores problemas: o conjunto B dos pontos que se escrevem
de dois modos diferentes e enumeravel (prove isso!) e, logo, tem medida de
Lebesgue nula. Eventualmente, um ponto de [0, 1] pode ser mapeado por f em
um ponto de B. Observe que como cada f i (B) e enumeravel, conjunto
B =

f i (B)

i=0

e enumeravel. Em particular o conjunto B tem medida de Lebesgue zero.


Assim, considerando o conjunto Y1 = [0, 1] B e Y2 +
2 denido como
sendo o conjunto enumer
avel dos itiner
arios obtidos a partir dos elementos de
B podemos denir a tranformacao , que faz com que (f1 , m) seja ergodicamente equivalente ao shift completo com 2 smbolos, equipado com a medida de
Bernoulli associada ao vetor (1/2, 1/2).
Facilmente, podemos generalizar esse exemplo para uma transformacao do
intervalo [0, 1] dada por f (x) = nx mod1. Neste caso, f ser
a conjugada a um
shift completo com n smbolos munido da medida de Bernoulli associada ao
vetor (1/n, . . . , 1/n).

7.5

Equival
encia Espectral

Uma denicao mais fraca de equivalencia, levando em conta somente as propriedades espectrais da transformacao e pode ser formulada como se segue:
Deni
c
ao 7.15. Seja f : M M transformacao preservando uma medida
e g : N N uma transformacao preservando uma medida . Dizemos
que (f, ) e espectralmente equivalente a` (g, ) se existe uma bijecao linear
T : L2 (M, ) L2 (N, ) contnua tal que:
Ug T = T circUf .
Esta denicao garante se (f, ) e espectralmente equivalente `a (g, ) ent
ao
todas as propriedades espectrais de (f, ) tambem valem para (g, ). Em
particular, se (f, ) e ergodica, entao (g, ) tambem e ergodica. Veremos no
Captulo 10.28 uma nocao mais geral de equivalencia entre duas transformacoes
preservando medida, que negligencia conjuntos que tem medida zero.
umeros naturais e 1 e 2 deslocamentos de
Proposi
c
ao 7.16. Sejam d1 e d2 n
Bernoulli com d1 e d2 smbolos, respectivamente. Ent
ao, 1 e 2 s
ao espectralmente equivalentes.

7.6. A ENTROPIA COMO INVARIANTE

7.6

85

A entropia como invariante

Como veremos na proposicao abaixo, a entropia e um invariante com respeito a


essa relacao de equivalencia. Isso torna a entropia bastante u
til em identicar
quando duas transformacoes preservando medida nao sao equivalentes.
ao
Proposi
c
ao 7.17. Se (f1 , 1 ) e ergodicamente equivalente a (f2 , 2 ), ent
h1 (f1 ) = h2 (f2 ).
Demonstrac
ao. Seja P1 uma particao de X1 . Desprezando um conjunto de
medida 1 nula podemos supor, sem perda de generalidade, que P1 e uma
particao em Y1 . Dena
P2 = (P1 ) = {(P ) X2 ; P P1 }.
Observe que como e uma bijecao mensuravel, temos que P2 e de fato uma
particao de X2 . Alem disso, utilizando que f1 = f2 vem que (P1n ) =
(P1 )n = P2n . Assim, existe uma bijecao entre os elementos de P1n e os elementos
de P2n de modo que cada elemento P P1n e levado por num elemento (P )
de P2n . Como 1 (P ) = 2 ((P )) para cada P P1n temos que
H1 (P1n ) =
=


P P1n

QP2n

1 (P ) log 1 (P ) =


P P1n

2 ((P )) log 2 ((P ))

2 (Q) log 2 (Q) = H2 (P2n ).

Assim, vem diretamente que


h1 (f1 , P1 ) = h2 (f2 , P2 ).
Como a particao P1 de X1 foi escolhida de modo arbitrario, tomando o supremo
no lado esquerdo da igualdade acima, vem que h1 (f1 ) h2 (f2 ). Aplicando o
mesmo argumento com f2 no lugar de f1 , vem que h2 (f2 ) h1 (f1 ), o que
encerra a prova.
Apesar da utilidade clara do teorema acima em determinar quando duas
transformacoes preservando medida n
ao sao equivalentes, a entropia metrica
tem a limitacao de n
ao ser um invariante completo para a relacao de equivalencia
que denimos acima. Por exemplo, j
a vimos que a entropia da medida de
Lebesgue de uma rotacao e sempre igual a zero. Porem, rotacoes irracionais
n
ao podem ser equivalentes a rotacoes racionais. De fato, todas as orbitas de
uma rotacao racional sao peri
odicas, enquanto todas as orbitas de uma rotacao
irracional sao densas. Porem, nem tudo esta perdido: se nos restringirmos a
classe dos shifts de Bernoulli a entropia e de fato um invariante completo. Esse
resultado e o famoso:
Teorema 7.18 (Orstein[Orn70]). Dois shifts de Bernoulli com a mesma entropia s
ao necessariamente equivalentes.


CAPITULO 7. ENTROPIA METRICA

86

Vamos agora introduzir uma nova forma de calcular a entropia de uma medida invariante, devida a Brin e Katok [BK83], com um certo sabor topol
ogico.
Primeiramente, vamos denir o conceito de bola din
amica:
Deni
c
ao 7.19. A bola din
amica de tamanho n e raio  em torno do ponto x
e o conjunto:
B
(n, x) = {y M ; d(f i (x), f i (y)) < , i = 0, 1, . . . , n 1},
ou equivalentemente,
B
(n, x) =

n1


f k (B
(f k (x))).

k=0

A entropia de e a media da taxa exponencial de decrescimento da medida


das bolas din
amicas. Tornando a frase anterior mais clara, dena as funcoes:
h(x, ) = lim sup
n

1
log (B
(n, x))
n

e
h(x) = lim h(x, ).

O Teorema de Brin-Katok arma que:


Teorema 7.20 (Brin-Katok [BK83]). A func
ao h(x) denida acima e integr
avel e, alem disso, vale:

h (f ) = h(x)d.

7.7

Exerccios

7.1. Mostre que se Q = {Q1 , . . . , Qd }, ent


ao H (Q) log d. (dica:Use calculo
n
e mostre que se x1 , . . . , xd 0 sao n
umeros reais positivos tais que i=1 xi = 1,
d
ent
ao i=1 xi log xi e maximo quando x1 = x2 = = xd = 1/d.)
7.2. Mostre que a funcao h(x) e f -invariante. Conclua da que se e ergodica,
ent
ao h (f ) = h(x) para quase todo ponto x.
7.3. Mostre que se P e a particao por cilindros de comprimento 1, ent
ao a
entropia de P n com respeito `a medida de Bernoulli m 
relativa ao vetor de
d
probabilidades p = (p1 , . . . , pd ) e dada por Hm (P n ) = n i=1 pi log pi .
7.4. Uma sequencia de n
umeros reais an e dita subaditiva se an+m an + am .
Mostre que se an 0 e subaditiva ent
ao o limite limn ann existe.
7.5. Mostre que dada uma particao nita P de X ent
ao a sequencia H (P n ) e
subaditiva.

7.7. EXERCICIOS

87

7.6. Mostre que se = (1 , . . . , n ) n e R : n n e a rotacao de angulo


denida por R (x1 , . . . , xn ) = (x1 +n , . . . , xn +n ), ent
ao hm (R ) = 0, onde
m e a medida de Lebesgue.
7.7. Dena A : 2 2 por A(x, y) = (2x, 12 y). Mostre que a entropia de A
com respeito `a medida de Lebesgue m e hm (A) = log 2.
7.8. Mostre as seguintes propriedades da entropia:
1. Para n N, h (f n ) = nh (f );
ao
2. Se t [0, 1] e 1 , 2 sao medidas f -invariantes, ent
ht1 +(1t)2 (f ) = th1 (f ) + (1 t)h2 (f )
3. Se p e um ponto peri
odico de perodo n e =

1
n

n1

i=0

f i (p) , ent
ao h (f ) = 0

88

CAPITULO 7. ENTROPIA METRICA

Captulo 8

Entropia Topol
ogica
Introduziremos agora um importante conceito topologico com conexao com a
denicao de entropia metrica, estudada anteriormente. Este invariante ser
a um
n
umero que, como veremos, coincide com o supremo das entropias metricas
quando percorremos o conjunto de todas as medidas invariantes. Estudaremos
tambem sua relacao com a taxa de crescimento do n
umero de pontos peri
odicos
e sua versao para uxos.

8.1

Deni
c
ao via coberturas

Daremos primeiramente uma denicao de entropia topol


ogica com o sabor da
denicao de entropia via particoes. Neste caso, o ingrediente que utilizaremos
e a nocao de entropia de uma cobertura (note que aqui n
ao iremos nos reportar
a nenhuma medida invariante.)
Deni
c
ao 8.1. Seja X um espaco metrico e uma cobertura de X. Deniremos
N () o n
umero da cobertura como a menor cardinalidade possvel de uma
subcobertura de , ou seja,
N () = inf{#; e subcobertura de X}.
A entropia de e simplesmente o n
umero H() = log N ().
Se U e V sao coberturas tais que dado qualquer U U existe algum V V
isso por tal que U V , ent
ao dizemos que U rena V e denotamos isso por
V U.
Do mesmo modo como foi feito para particoes, dadas duas coberturas e
podemos denir uma nova cobertura de X do seguinte modo:
= {A B; A e B }.
Dada uma particao , denimos n por
n = f n+1 ().
89


CAPITULO 8. ENTROPIA TOPOLOGICA

90

Deixaremos para o leitor a tarefa de mostrar que H(n ) e uma sequencia subaditiva (Exerccio 8.2.)
Assim, dada uma funcao contnua f : X X, denimos a entropia de f
com respeito a cobertura , como sendo o n
umero
h(f, ) = lim

1
H(n ).
n

Finalmente, a entropia topol


ogica de f e
htop (f ) = sup{h(f, ); e cobertura aberta nita de X}.
Exemplo 8.2. Vamos agora calcular a entropia topologica de uma bijecao
mensuravel f : S 1 S 1 (ou f : [0, 1] [0, 1]). Primeiramente, dada uma
cobertura do crculo podemos supor, sem perda de generalidade, que e formada por intervalos abertos. Sejam p1 , p2 , . . . , pk os extremos desses intervalos.
Observe que se denotamos por pji = f j (pi ) ent
ao n e determinada pelo conj
1
junto de pontos Cn = {(pi ) S ; i = 1, . . . , k e j = 0, . . . , n 1}. Note que
#Cn #Cn1 + k, pois Cn Cn1 = {pn1 , . . . , pnk }. Assim, e facil deduzir por
inducao que #n kn. Deste modo:
h (f, ) = lim

#n
log kn
H (n )

= lim
= 0.
n
n
n

Como a escolha de foi arbitr


aria, temos que h (f ) = 0.
Exemplo 8.3. Como consequencia do exemplo anterior, a entropia de uma
rotacao R de angulo do crculo S 1 e sempre igual a zero.
Vamos agora mostrar a seguinte proposicao, u
til para calcular a entropia
topol
ogica de uma transformacao.
Proposi
c
ao 8.4. Seja n uma sequencia de coberturas nitas tais que os seus
ao para zero quando n vai para innito. Ent
ao,
di
ametros diam n v
htop (f ) = sup h(f, n ) = lim h(f, n ).
n

nN

Demonstrac
ao. Observe primeiramente que dada uma cobertura nita V, podemos escolher N sucientemente grande de modo que se n > N ent
ao diamn e
menor que o n
umero de Lebesgue da cobertura V. Relembrando a denicao,
e um n
umero de Lebesgue de V se, dado qualquer conjunto C com diamC ,
ent
ao existe V V tal que C V . Logo, como diamn , temos que todo
elemento B de n esta contido em algum V V. Logo, V n , o que implica
diretamente que h(f, V) h(f, n ), pois V k nk , para todo N. Em particular, h(f, V) sup h(f, n ). Logo, tomando o supremo sobre todas as coberturas
nN

nitas no lado esquerdo da igualdade anterior:


htop (f ) = sup h(f, V) sup h(f, n ) htop (f ).
nN

VIA CONJUNTOS GERADORES


8.2. DEFINIC
AO

91

Para mostrar que a sequencia h(f, n ) e convergente, suponha que uma subsequencia ni satisfazendo lim h(f, ni ) = h. Vamos mostrar que h = htop (f ).
i

De fato, dado  > 0, podemos escolher N grande de modo que se i > N , ent
ao
a mostramos `a
h  h(f, ni h + . Deste modo, aplicando a parte que j
sequencia i = ni+N , temos que
htop (f ) = sup h(f, i ) (h , h + ).
iN

Como  e arbitr
ario, vem que htop (f ) = h, provando que a sequencia h(f, n ) e
convergente.
Corol
ario 8.5. Se e uma cobertura tal que lim diam n = 0, ent
ao
n

htop (f ) = h(f, ).

8.2

Deni
c
ao via conjuntos geradores

Vamos agora denir de uma outra forma o conceito de entropia topol


ogica,
utilizando a denicao de conjunto gerador.
Deni
c
ao 8.6. Seja f : X X uma aplicacao contnua do espaco metrico
(X, d) e E
 X. Dado  > 0 e n N, dizemos que E e um (n, )-gerador de X,,
B
(n, x).
se X =
xE

Consideraremos daqui por diante X compacto para que sempre exista um


conjunto (n, )-gerador nito. Isso decorre diretamente da denicao de conjuntos
compactos, pois sempre podemos cobrir X por bolas din
amicas de raio  e
tamanho n. Para cada par (n, ), associaremos um n
umero Sn () denido por
Sn () = inf{#E; E X e (n, )-gerador }.
Deixaremos para o leitor a tarefa de vericar que a sequencia log Sn () e subaditiva (Exerccio 8.3.)
Assim, podemos considerar o limite
h(f, ) = lim

1
log Sn ().
n

Observando que a funcao   h() e monotona decrescente, temos que o


limite h(f ) = lim h(f, ) existe. De fato, temos que

Proposi
c
ao 8.7. Com as denic
oes anteriores vale
h(f ) = htop (f ).


CAPITULO 8. ENTROPIA TOPOLOGICA

92

8.3

Entropia de uxos

Com as ferramentas introduzidas vamos facilmente denir o conceito de entropia


topol
ogica para um uxo de uma variedade compacta t : M M. Primeiramente, vamos denir o an
alogo da bola din
amica B
(n, x). Para isso, para cada
T > 0 dena a dist
ancia:
dT (x, y) = max d(t (x), t (y))
t[0,T ]

Denimos B
(T, x) = {y M ; dT (x, y) } a bola de raio  na 
dist
ancia dT .
B
(n, x).
Um conjunto E Xser
a chamado de (T, )-gerador de X , se =
xE

Assim, de forma analoga ao que zemos no caso de aplicacoes, denimos


ST () = inf{#E; E X e (T, ) gerador } e
h(, ) = lim

1
log ST ().
T

Finalmente, a entropia topol


ogica do uxo e denida como sendo o n
umero:
htop () = lim h(, ).

Uma primeira conex


ao entre a entropia topol
ogica de uxos e aplicacoes e:
Teorema 8.8. A entropia topol
ogica htop () do uxo t coincide com a entropia
topol
ogica htop (1 ) da aplicac
ao 1 .
Um importante resultado (cuja prova foge ao ambito deste texto) e:
Teorema 8.9 (Princpio Variacional). Seja f : X X uma func
ao contnua do espaco metrico compacto X. Denote por I o conjunto das medidas (de
probabilidade) invariantes por f . Ent
ao vale a igualdade:
htop (f ) = sup h (f ).
I

Podemos tirar algumas conclus


oes u
teis do teorema acima. A primeira delas
e que se para alguma medida invariante a entropia metrica e positiva ent
ao, a
entropia topol
ogica tambem o e. Em contrapartida, se a entropia de toda as
medida invariantes e igual a zero, ent
ao a entropia topol
ogica tambem e igual
a zero. Como consequencia disso e do exemplo 7.9, reobtemos que a entropia
topol
ogica de qualquer bijecao do intervalo ou de S 1 e zero, j
a que a entropia
metrica de qualquer medida invariante e igual a zero.
Uma das boas propriedades da entropia topol
ogica e que ela e um invariante topol
ogico: se duas transformacoes sao equivalentes do ponto de vista
topol
ogico, ent
ao sua entropia topol
ogica e a mesma. Como zemos no captulo
anterior, vamos tornar preciso o que entendemos por transformacoes equivalentes (agora no sentido topologico):

TOPOLOGICA

8.4. PRESSAO

93

Deni
c
ao 8.10. Sejam f1 : X1 X1 e f2 : X2 X2 funcoes contnuas dos
espacos metricos X1 e X2 . Diremos que f1 e topologicamente equivalente `a f2
se existe um homeomorsmo h : X1 X2 tal que:
h f1 = f2 h.
Neste caso dizemos que f1 e topologicamente conjugado a f2 e h e dita uma
conjugac
ao entre f1 e f2 .
ao
Observa
c
ao 8.11. Observe que se o ponto p X1 e tal que f1n (p) = p, ent
f2n ((p)) = (f1n (p)) = (p). Em palavras, leva pontos peri
odicos de f1 em
pontos peri
odicos de f2 . De modo an
alogo, n
ao e difcil ver que leva pontos
de X1 com orbita por f1 densa, em pontos de X2 com orbita por f2 densa.
Deixamos a prova da proposicao abaixo para o leitor:
ao htop (f1 ) =
Proposi
c
ao 8.12. Se f1 e topologicamente equivalente a f2 , ent
htop (f2 ).
Como no caso da entropia metrica, a entropia topologica tem a limitacao de
n
ao ser um invariante completo. Por exemplo, duas rotacoes quaisquer do circulo
tem sempre a mesma entropia topologica, igual a zero. Porem, uma rotacao
irracional tem todos os pontos com orbita densa, enquanto uma rotacao racional
n
ao possui nenhum com esta propriedade, j
a que todos s
ao peri
odicos. De acordo
com a observacao acima, isso torna impossvel que haja uma conjugacao entre
elas.

8.4

Press
ao topol
ogica

Vamos agora denir uma generalizacao do conceito de entropia topologica, introduzindo o conceito de press
ao topol
ogica de uma funcao : X R com
respeito a transformacao f : X  X. Esse conceito (oriundo da Fsica, como
o pr
oprio nome indica) ser
a tambem um invariante topol
ogico de f , no sentido
de que duas transformacoes topologicamente equivalentes atribuem a mesma
pressao a uma funcao . Suporemos que o espaco X e compacto para que as
quantidades tratadas sejam sempre nitas, mas os conceitos expostos sao de
car
ater geral e nao dependem desta condicao.

i
Deni
c
ao 8.13. Dado n N vamos denotar n (x) = n1
i=0 (f (x)). Dado
um conjunto C X ent
ao n (C) = maxxC n (x).
Dada uma cobertura de X denimos a pressao de com respeito a cobertura como:

1
log inf n {
en (U) },
P (, ) = lim
n+ n
U
UU

onde o nmo e tomado sobre todas subcoberturas U de n .


Fica como exerccio para o leitor diligente mostrar que o limite acima existe
(a essa altura o caminho a ser percorrido e standard: mostre que a sequencia e
subaditiva).


CAPITULO 8. ENTROPIA TOPOLOGICA

94

Deni
c
ao 8.14. A press
ao P (, f ) de com respeito a f e o supremo dos
valores de P (, ) sobre todas as coberturas abertas de X.
ao:
Proposi
c
ao 8.15. Sejam , C 0 (X) e C R. Ent
1. P (0, f ) = htop (f )
2. P ( + C, f ) = P (, f ) + C
3. Se existir func
ao limitada u : X R tal que se escreve como =
+ u f u ( e neste caso diremos que a func
ao e cohomologa a ),
ent
ao P (, f ) = P (, f ).
Demonstraca
o. Para o item 1, xada uma cobertura
que como =
 observe
n (U)
e
=
#U. Logo,
0, ent
ao dada uma subcobertura U de n vale
UU
P (0, ) = h(f, ) para cada cobertura de X.
No item 2, observe que se denotamos = + C ent
ao n (x) = n (x) +
Cn.
Logo,
xada
uma
cobertura
,
para
qualquer
subcobertura
U de n vale


n (U)
Cn
n (U)
= e
. Assim, segue diretamente que P (, ) =
UU e
UU e
P (, ) + C e, por conseguinte, que P (, f ) = P (, f ) + C
Para o u
ltimo item, inicialmente
= + u f u valeque n (x) =
como n (U)
n
e
= eu(f (x))u(x) UU en (U) .
n (x) + u(f n (x)) u(x). Assim,
UU
Logo, como u e limitada, digamos |u(x)| K, ent
ao vale que

en (U) = e2K

UU

en (U) .

UU

Segue diretamente que P (, ) = P (, ) e, consequentemente, P (, f ) =


P (, f ).

8.5

Princpio variacional

Denotaremos tambem a press


 ao da medida com respeito a como sendo o
n
umero P () = h (f ) + d. Para simplicar nossa notacao, sempre que f
estiver xada e nao houver perigo de confus
ao, utilizaremos P () para indicar
P (, f ).
simples ver que se t [0, 1] e 1 , 2 I ent
ao (veja exerccio 7.8):
E
Pt1 +(1t)2 () = tP1 () + (1 t)P2 ().
Como ja observamos, se tomarmos = 0 ent
ao a pressao de e exatamente
a entropia topol
ogica. Podemos nos perguntar se a press
ao topol
ogica de um
potencial contnuo qualquer admite uma caracterizacao via supremo no conjunto
de medidas, como obtivemos para = 0. A resposta para esta pergunta e sim
e forma o importante teorema conhecido como Princpio Variacional para a
pressao:

8.5. PRINCIPIO VARIACIONAL

95

Teorema 8.16 (Princpio Variacional). Se I e o conjunto das probabilidades


invariantes para uma transformaca
o contnua f : X X do espaco compacto
X e : X R e contnua, ent
ao

(8.1)
P (, f ) = sup P () = sup h (f ) + d
I

Outra boa propriedade da press


ao e que ela e uma funcao contnua com o
potencial. Mostraremos, sem muito esforco, que
Proposi
c
ao 8.17. P : C 0 (X) R e Lipschitz com constante de Lipschitz igual
a 1.
Demonstrac
ao. De fato, dados os potenciais e C 0 (X) vale que:
  +  
De onde , para cada I:



h (f ) + d   h (f ) + d h (f ) + d +  
Tomando o supremo em nas desigualdades acima:
P ()   P () P () +  
Ou equivalentemente, P () P ()  .
Agora vamos estudar a press
ao de um potencial particular, a saber, (x) =
log | det Df (x)| e tirar conclus
oes quando f e uma transformacao expansora
de classe C 2 , estudada no Captulo 9 anterior. Na prova da proposicao a seguir,
vamos utilizar alguns resultados classicos de teoria ergodica. O leitor que os
desconhece pode recorrer `a Secao 12.2.
Proposi
c
ao 8.18. Seja M d uma variedade compacta de dimens
ao d. Se f e
uma transformac
ao expansora de classe C 2 , ent
ao P ( log | det Df (x)|) = 0.
Demonstrac
ao. Observe primeiramente que se e uma probabilidade invariante
para f , pela desigualdade de Ruelle (veja o Teorema 12.3) se (x) e a soma dos
expoentes de Lyapunov positivos de x, ent
ao a entropia de satisfaz:

h (f ) i (x) d(x).
Por outro lado, como a transformacao f e expansora, todos os expoentes de
Lyapunov de f sao positivos e, pelo teorema de Oseledets, a soma de todos os
expoentes de Lyapunov i (x) e
d

i=1

i (x) = i (x) = log | det Df (x)|.


CAPITULO 8. ENTROPIA TOPOLOGICA

96

Consequentemente, a pressao P () satisfaz:



P ( log | det Df |) = sup{h (f ) log | det Df (x)| d(x)} 0.
I

De fato, P ( log | det Df |) = 0. Para ver isso, basta calcularmos a entropia da


medida SRB construda no captulo 9. Note que essa medida tem a propriedade
de ser absolutamente contnua com respeito a medida de Lebesgue de M . Isso
nos coloca em condicoes de aplicar a f
ormula de Pesin, que nos garante que:


hSRB (f ) = i (x) dSRB (x) = log | det Df (x)| dSRB .

8.6

Exerccios

8.1. Se U e V sao coberturas tais que U V, ent


ao H(V) H(U).
8.2. Mostre que H(n ) e uma sequencia subaditiva.
8.3. Mostre que xado , ent
ao a sequencia log Sn () e subaditiva.
8.4. Mostre que o maximo da funcao h : Rd R dada por h(x1 , . . . , xd ) =
d
i=1 xi log xi restrita ao simplexo {xi 0; x1 + + xd = 1} e igual a log d
e e obtido exatamente quando x1 = x2 = = xd = d1 . Conclua que entre as
medidas de Bernoulli do Shift completo com d smbolos, a de maior entropia e
dada pelo vetor de probabilidade ( d1 , . . . , d1 ).
umeros
8.5. Este exerccio e uma generalizacao do anterior: sejam a1 , . . . , ad n
reais. Mostre que o m
aximo da funcao F : Rd R dada por
F (x1 , . . . , xd ) =

xi log xi + xi ai

i=1

restrita ao simplexo {xi 0; x1 + + xd = 1} e obtido exatamente quando


xj =

eaj
.
d

eai
i=1

Captulo 9

Transforma
co
es Expansoras
Nesta secao provamos que para qualquer transformacao expansora cujo jaco nica probabilidade invariante absolutabiano det Df e Holder 1 existe uma u
mente contnua com relacao `
a medida de Lebesgue. Essa probabilidade e positiva em todos os subconjuntos abertos de M , e ergodica, e a sua bacia de atracao
tem medida de Lebesgue total em M .
Deni
c
ao 9.1. Seja M uma variedade compacta e f : M M uma transformacao de classe C 1 . Dizemos que f e expansora se existe > 1 e alguma
metrica riemanniana   em M tais que
Df (x)v v

para todo x M e v Tx M .

(9.1)

Exemplo 9.2. Seja F : Rd Rd , d 1 um isomorsmo linear satisfazendo


F (Zd ) Zd . Ent
ao existe uma u
nica transformacao f : Td Td no toro
d
d-dimensional M = T tal que f = F , onde


: Rd Td , (x1 , . . . , xd ) = e2ix1 , . . . , e2ixd
e a projecao can
onica. Se todos os autovalores 1 , . . . , d de F tem norma
maior que 1 ent
ao a transformacao f e expansora: podemos tomar qualquer
1 < < inf i |i | em (9.1).
Chamamos suporte de uma probabilidade o conjunto dos pontos tais que
toda vizinhanca tem medida positiva para . Note que o suporte de e o espaco
M inteiro se e somente se e positiva em todo aberto de M .
Quando e invariante para f , chamamos bacia de o conjunto B() dos
pontos x M tais que

n1
1
(f j (x)) = d
n n
j=0
lim

1 Dado > 0, dizemos que : M R


e -H
older se existe alguma constante C > 0 tal que
|(x1 ) (x2 )| Cd(x1 , x2 ) para todo x1 , x2 em M .

97

98

CAPITULO 9. TRANSFORMAC
OES
EXPANSORAS

para toda funcao contnua : M R. Note que a bacia sempre e um conjunto


invariante. Se e ergodica ent
ao B() tem -medida total.
Teorema 9.3. Seja f : M M uma transformac
ao expansora numa variedade
compacta conexa M . Assuma que o logaritmo
M  x  log | det Df (x)|
do jacobiano de f e -H
older, para algum > 0. Ent
ao f admite uma u
nica
probabilidade invariante absolutamente contnua com relac
ao `
a medida de
Lebesgue m. Alem disso, e erg
odica, o seu suporte coincide com M e a sua
bacia tem medida de Lebesgue total na variedade.
f
A estrategia da demonstracao do Teorema 9.3 e a seguinte. E
acil ver
que a pre-imagem por f de um conjunto com medida de Lebesgue m nula
tambem tem medida de Lebesgue nula. Isto signica que a imagem f por
f de qualquer medida absolutamente contnua com relacao a m tambem e
absolutamente contnua com relacao a m. Em particular, a nesima imagem
fn m e absolutamente contnua com relacao `a medida de Lebesgue m para todo
n 1.
Provaremos na Proposicao 9.6 que a derivada de Radon-Nikodym de cada
fn m com relacao a m (tambem chamada densidade) e limitada por alguma
constante independente de n 1. Deduziremos que todo ponto de acumulacao,
na topologia fraca , da sequencia
n1
1 j
f m
n j=0

e uma probabilidade invariante absolutamente contnua com relacao `a medida


de Lebesgue, com densidade limitada pela mesma constante.
Um argumento adicional provar
a que tal ponto de acumulacao e u
nico e
satisfaz todas as propriedades no enunciado do teorema.

9.1

Lema de distor
c
ao

A hip
otese de que a transformacao f : M M e expansora serve para obter a
seguinte proposicao:
Lema 9.4. Existe k 1 tal que todo ponto y M tem exatamente k preimagens por f . Alem disso, existe 0 > 0 tal que, para qualquer pre-imagem x
de um ponto y M , existe uma aplicac
ao h : B(y, 0 ) M de classe C 1 tal
que f h = id , h(y) = x e
d(h(y1 ), h(y2 )) 1 d(y1 , y2 )

para todo y1 , y2 B(y, 0 ).

Demonstrac
ao. A condicao (9.1) implica que a derivada Df e um isomorsmo
em todo ponto. Logo, dado qualquer x M existe 0 > 0 tal que f envia


9.1. LEMA DE DISTORC
AO

99

alguma vizinhanca V (x) de x difeomorcamente sobre a bola de raio 0 em


torno de y = f (x). Por compacidade, podemos tomar 0 independente de x.
Ent
ao o n
umero de pre-imagens de qualquer y M deve ser limitado. Alem
disso, o conjunto dos pontos que tem exatamente n pre-imagens e aberto, para
todo n 0. Portanto, por conexidade, o n
umero de pre-imagens deve ser o
mesmo para todo y M . Finalmente, seja h = (f | V (x))1 . Pela condicao
(9.1),
Dh(z) = Df (h(z))1  1
para todo z no domnio de h, e portanto h contrai distancias `a taxa 1 como
enunciamos.
Transformacoes h como neste enunciado sao chamadas ramos inversos de f .
Mais geralmente, podemos denir ramos inversos hn de f n , n 1, da seguinte
maneira. Dado y M e x f n (y), sejam h1 , . . . , hn ramos inversos de f com
hj (f nj+1 (x)) = f nj (x)
para todo 1 j n. Como cada hj e uma contracao, a sua imagem esta contida
numa bola de raio menor que 0 em torno de f nj (x). Ent
a o hn = hn h1

esta bem denida na bola de raio 0 em torno de y. E claro que f n hn = id e


hn (y) = x.
O pr
oximo resultado fornece um bom controle da distorcao de iterados de f
e seus ramos inversos, que e crucial para a demonstracao do teorema. Este e o
u
nico lugar onde se usa a hip
otese de que o jacobiano e Holder.
Proposi
c
ao 9.5 (lema de distor
c
ao). Existe C1 > 0 tal que, dado qualquer
n 1, qualquer y M , e qualquer ramo inverso hn : B(y, 0 ) M de f n ,
tem-se
| det Dhn (y1 )|
exp(C1 d(y1 , y2 ) ) exp(C1 (20 ) )
| det Dhn (y2 )|
para todo y1 , y2 B(y, 0 ).
Demonstraca
o. Escrevamos hn como composicao hn = hn h1 de ramos
inversos de f . Tambem escrevemos hi = hi h1 para 1 i < n, bem como
h0 = id . Ent
ao
| det Dhn (y1 )|
=
log | det Dhi (hi1 (y1 ))| log | det Dhi (hi1 (y2 ))| .
| det Dhn (y2 )|
i=1
n

log

Note que log | det Dhi | = log | det Df | hi e, por hip


otese, log | det Df | is
(C0 , )-Holder for some C0 > 0. Alem disso, pelo Lema 9.4, cada hj e uma
1 -contracao. Logo,

| det Dhn (y1 )|
i
i

log

C
d(h
(y
),
h
(y
))

C0 i d(y1 , y2 ) .
0
1
2
| det Dhn (y2 )|
i=1
i=1
n

Portanto, para provar o lema basta tomar C1 = C0


i=1

i .

100

9.2

CAPITULO 9. TRANSFORMAC
OES
EXPANSORAS

Medidas absolutamente contnuas

O pr
oximo resultado, que e uma consequencia do lema de distorcao, mostra que
as imagens fn m tem densidades uniformemente limitadas:
Proposi
c
ao 9.6. Existe C2 > 0 tal que (fn m)(B) C2 m(B) para todo conjunto mensur
avel B M e todo n 1.
Demonstrac
ao. Podemos, sem restricao, supor que B esta contido em alguma
bola B0 = B(z, 0 ) de raio 0 centrada em algum ponto z M . Usando a
Proposicao 9.5 vemos que

| det Dhn | dm
m(hn (B))
m(B)
B
=
,
exp(C1 (20 ) )
n
n
m(h (B0 ))
m(B0 )
B0 | det Dh | dm
para todo ramo inverso hn de f n no ponto z. Alem disso, tambem temos que
(fn m)(B) = m(f n (B)) e a soma de m(hn (B)) sobre todos os ramos inversos,
e analogamente para B0 . Deste modo, obtemos que
(fn m)(B)
m(B)
exp(C1 (20 ) )
.
n
(f m)(B0 )
m(B0 )
Claro que (fn m)(B0 ) (fn m)(M ) = 1. Alem disso, a medida de Lebesgue das
bolas com um raio xado 0 esta limitada de zero por alguma constante 0 > 0
que so depende de 0 . Ent
ao, para obter a conclus
ao da proposicao basta tomar
C2 = exp(C1 (20 ) )/0 .
Tambem precisamos do seguinte resultado auxiliar:
Lema 9.7. Seja uma probabilidade num espaco metrico compacto X, e seja
: X [0, +) uma func
ao integr
avel com respeito a . Seja i , i 1,
uma sequencia de probabilidades em X convergindo para uma probabilidade
ao .
na topologia fraca . Se i para todo i 1 ent
Demonstraca
o. Seja B um conjunto mensur
avel qualquer. Para cada > 0,
seja K um subconjunto compacto de B tal que (B \ K ) e ()(B \ K )
sao ambos menores que . Ent
ao seja A uma vizinhanca aberta de K da
forma A = {z : d(z, K ) < r}, com r > 0 sucientemente pequeno para que a
medida de A \ K seja menor que , tanto para como para . Mudando r
ligeiramente, caso necessario, podemos supor que o bordo de A tem -medida
zero: ha no m
aximo uma quantidade enumer
avel de valores de r para os quais
isso nao acontece. Ent
ao, = lim i implica (A ) = lim i (A ) ()(A ).
Fazendo 0 obtemos que (B) ()(B).
Aplicando este lema na nossa situacao, obtemos
n1
Corol
ario 9.8. Todo ponto de acumulac
ao da sequencia n1 j=0 fj m e
uma probabilidade invariante para f absolutamente contnua com relac
ao `
a medida de Lebesgue.

9.3. EXISTENCIA
DE MEDIDAS ERGODICAS

101

Demonstra
c
ao. Tomemos constante igual a C2 e = m. Tomemos tambem

ni 1 j
i = n1
encia (ni )i tal que (i )i converge
i
j=0 f m, para qualquer subsequ
para uma medida . A Proposicao 9.6 garante que i . Ent
ao tambem
temos = C2 m, pelo Lema 9.7. Isto implica que m, com densidade
limitada por C2 .

9.3

Exist
encia de medidas erg
odicas

Agora vamos mostrar que a medida que acabamos de construir e a u


nica probabilidade invariante absolutamente contnua com relacao `a medida de Lebesgue
e, alem disso, e ergodica para f .
Comecamos por xar uma particao P0 = {U1 , . . . , Us } de M em regioes com
ao, para cada n 1, denimos
interior n
ao vazio e di
ametro menor que 0 . Ent
Pn como sendo a particao de M que consiste das imagens de cada um dos Ui ,
1 i s, pelos respectivos ramos inversos de f n . O di
ametro da particao Pn ,
ou seja, o supremo dos diametros dos seus elementos, e menor que 0 n .
oes num espaco metrico
Lema 9.9. Seja Pn , n 1, uma sequencia de partic
compacto com di
ametros convergindo para zero quando n . Seja uma
probabilidade nesse espaco, e seja B qualquer conjunto mensur
avel com (B) >
0. Ent
ao existem Vn Pn , para n 1, tais que
(Vn ) > 0

(B Vn )
1
(Vn )

quando n .

Demonstrac
ao. Dado qualquer 0 < < (B), seja K um subconjunto compacto de B com (B \ K ) < . Como o di
ametro das particoes converge para
zero, a medida da uni
ao A,n de todos os elementos de Pn que intersectam K
satisfaz (A,n \ K ) < para todo n sucientemente grande. Se tivessemos
(K Vn )

(B)
(Vn )
(B) +

para todo Vn Pn que intersecta K , deduziramos que


(K )

(B)
(B)
(A,n )
((K ) + ) (B) ,
(B) +
(B) +

o que e uma contradicao. Portanto, deve existir algum Vn Pn tal que


(B Vn ) (K Vn ) >

(B)
(Vn )
(B) +

e isto implica (Vn ) > 0. Fazendo 0 obtemos a conclusao do lema.


Lembre que A M e um conjunto invariante para f : M M se f 1 (A) =
A. Mais geralmente, dizemos que A e positivamente invariante se f (A) = A.
Note que conjuntos invariantes sempre s
ao positivamente invariantes, porque f
e sobrejetiva.

102

CAPITULO 9. TRANSFORMAC
OES
EXPANSORAS

Lema 9.10. Se A M um conjunto positivamente invariante para f com


medida de Lebesgue m(A) > 0, ent
ao A tem medida de Lebesgue total em algum
Ui P0 , ou seja, existe 1 i s tal que m(Ui \ A) = 0.
Demonstrac
ao. Pelo Lema 9.9, existe Vn Pn tal que
m(Vn \ A)
m(Vn )
converge para zero quando n . Seja Ui(n) = f n (Vn ). Pela Proposicao 9.5
aplicada ao ramo inverso de f n que envia Ui(n) em Vn , conclumos que

 m(Vn \ A)
m(Ui(n) \ A)
m(f n (Vn \ A))

exp C1 (20 )
m(Ui(n) )
m(f n (Vn ))
m(Vn )
tambem converge para zero. Como P0 e nito, deve existir 1 i s tal que
i(n) = i para innitos valores de n. Logo, m(Ui \ A) = 0.
Corol
ario 9.11. A transformac
ao f : M M admite alguma probabilidade
invariante erg
odica e absolutamente contnua com relac
ao `
a medida de Lebesgue.
Demonstrac
ao. Como consequencia do lema anterior, existem no m
aximo #P0
conjuntos invariantes com medida de Lebesgue positiva disjuntos dois-a-dois.
Portanto, M pode ser particionado num n
umero nito de conjuntos invariantes
A1 , . . . , As , s #P0 com medida de Lebesgue positiva e que sao minimais
no seguinte sentido de que nao existem subconjuntos invariantes Bi Ai com
0 < m(Bi ) < m(Ai ). Dada qualquer medida invariante absolutamente contnua
, existe algum i tal que (Ai ) > 0. Ent
ao a restricao normalizada i de a
Ai ,
(B Ai )
i (B) =
(Ai )
e invariante e absolutamente contnua. Alem disso, i e ergodica, porque Ai e
minimal.

9.4

Unicidade e conclus
ao da prova

O argumento anterior tambem mostra que existe apenas um n


umero nito de
probabilidades erg
odicas e absolutamente contnuas. O u
ltimo passo da demonstracao e mostrar que, de fato, tal probabilidade e u
nica. Para isso usamos o
fato de que f e topologicamente misturadora:
Lema 9.12. Dado qualquer aberto n
ao vazio U M , existe N 1 tal que
f N (U ) = M .
Demonstrac
ao. Seja x U e r > 0 tais que a bola de raio r centrada em
ao cobre
x esta contida em U . Dado qualquer n 1, suponha que f n (U ) n
toda a variedade. Entao existe alguma curva ligando f n (x) a um ponto

9.5. EXERCICIOS

103

y M \ f n (U ), e essa curva pode ser tomada com comprimento menor que


diam M + 1. Levantando pelo difeomorsmo local f n , obtemos uma curva n
ligando x a um ponto yn M \ U . Ent
ao r comp(n ) n (diam M + 1).
Isto da uma cota superior para o valor possvel de n. Logo, f n (U ) = M para
todo n sucientemente grande, como armamos.
Corol
ario 9.13. Se A M e um conjunto positivamente invariante com medida de Lebesgue positiva, ent
ao A tem medida de Lebesgue total na variedade
M.
Demonstrac
ao. Seja U o interior de um conjunto Ui como no Lema 9.10, e
seja N 1 tal que f N (U ) = M . Ent
ao m(U \ A) = 0, e portanto M \ A =
f N (U ) \ f N (A) f N (U \ A) tambem tem medida de Lebesgue zero.
O pr
oximo enunciado completa a demonstracao do Teorema 9.3:
Corol
ario 9.14. Seja qualquer probabilidade invariante absolutamente contnua. Ent
ao e erg
odica e a sua bacia B() tem medida de Lebesgue total em
M . Alem disso, o suporte de e toda a variedade M .
Demonstraca
o. Se A e um subconjunto invariante qualquer ent
ao, pelo corol
ario
anterior, A tem medida de Lebesgue zero ou Ac tem medida de Lebesgue zero.
Uma vez que e absolutamente contnua, segue que (A) = 0 ou (Ac ) = 0.
Isto prova que e ergodica. Ent
ao B() e um conjunto invariante com medida
de Lebesgue positiva e, consequentemente, deve ter medida de Lebesgue total.Analogamente, como o suporte de e um conjunto compacto positivamente
invariante, ele tem que coincidir com M .
possvel mostrar que a derivada d/dm e Holder e limObserva
c
ao 9.15. E
itada de zero. Em particular, a probabilidade e equivalente a` medida de
Lebesgue m, no sentido de que elas tem os mesmos conjuntos com medida nula.
A conclusao do Teorema 9.3 e falsa, em geral, se omitirmos a hip
otese de que o
jacobiano e Holder.

9.5

Exerccios

104

CAPITULO 9. TRANSFORMAC
OES
EXPANSORAS

Captulo 10

Estados de Equilbrio
Estudaremos neste captulo uma classe especialmente importante de medidas
invariantes, a saber, os estados de equilbrio. A denicao destas medidas, atraves
de um princpio variacional, tem uma forte motivacao fsica e encontra aplicacoes
em varias areas tais como teoria da dimensao de conjuntos invariantes, estudo de
recorrencias do sistema din
amico, crescimento do n
umero de pontos peri
odicos,
uxos geodesicos, medidas fsicas, etc. Estaremos interessados em estudar que
hip
oteses sao relevantes para que perguntas tais como a existencia, unicidade,
ergodicidade destas medidas, possam ter respostas positivas. Como veremos,
este estudo pode ser feito para uma ampla classe de difeomorsmos locais em
variedades compactas.

10.1

Deni
c
ao de Estado de Equilbrio

Neste captulo consideraremos uma funcao f : X  X denida em um espaco


metrico X e : X  R uma funcao contnua (que daqui por diante chamaremos
de potencial, invocando o termo fsico). O conjunto das medidas (de probabilidade) invariantes por f designaremos pela letra I.
Deni
c
ao 10.1. Uma medida invariante e dita um estado de equilbrio para
o potencial se

h (f ) +

d = P (, f ).

Ou seja: e um
 maximo para a funcao P = P () : I  R denida por
P () = h (f ) + d.
Exemplo 10.2. Observe que os estados de equilbrio para o potencial = 0
sao aquelas medidas que maximizam a entropia. Como vimos no exemplo 7.7,
no caso do deslocamento completo com d smbolos 1, . . . , d, a u
nica medida que
maximiza a entropia e bem conhecida: e a medida de Bernoulli associada ao
vetor de probabilidade ( d1 , . . . , d1 ).
105

106

CAPITULO 10. ESTADOS DE EQUILIBRIO

Exemplo 10.3. Ainda para a transformacao deslocamentocom d smbolos,


xados n
umeros a1 , . . . , ad podemos considerar o potencial (x) = ax0 que e
constante
nos cilindros [0; i] de comprimento 1. Observe neste caso que a integral

d se escreve como

d

d =
([0; i])ai
i=1

Assim, a funcao P numa medida


Bernoulli dada pelo vetor de probabilidades
de
d
(p1 , . . . , pd ) nada mais e que i=1 pi log pi + pi ai . Logo, utilizando o exerccio
8.5 temos que entre todas as medidasa de Bernoulli a que maximiza a P e a que
j
.
tem vetor de probabilidades pj = de
eai

i=1

Exemplo 10.4. Se f e uma transformacao expansora de classe C 2 em uma


variedade compacta M , como ja vimos no Teorema 8.18, a pressao da funcao
(x) = log | det Df (x)| e P (, f ) = 0. Alem disso, foi mostrado que se e a
medida SRB de f construda no captulo 9, ent
ao e um estado de equilbrio
para j
a que P () = 0. Nao por acaso, essa medida e de certa forma a
medida invariante com maior dimensao possvel. N
ao explicaremos o conceito
de dimensao, mas sugerimos que o leitor interessado consulte [Fal90].
Nosso pr
oximo passo sera introduzir uma classe ampla de transformacoes
com a propriedade de que todo potencial contnuo admite algum estado de
equilbrio.

10.2

Transforma
c
oes expansivas

Em linhas gerais, as transformacoes expansivas sao aquelas tais que duas orbitas
diferentes s
ao distinguidas, em algum momento, de forma macrosc
opica. Em
outras palavras, duas condicoes iniciais diferentes do sistema, mesmo aquelas
muito pr
oximas, produzem efeitos a longo prazo que diferem por uma constante
xa. Veremos que essa propriedade das orbitas implica uma certa regularidade
da funcao P e nos permitir
a mostrar a existencia de estados de equilbrio para
potenciais contnuos. Denamos de modo preciso:
Deni
c
ao 10.5. Uma transformacao f : M M e dita expansiva se existir
uma constante 0 (chamada constante de expansividade) tal que: dados x, y M
com x = y, ent
ao existe n N tal que d(f n (x), f n (y)) 0 .
Exemplo 10.6. Um primeiro exemplo de transformacao expansiva e a transformacao
f : [0, 1] [0, 1], f (x) = 10x [10x]
onde [10x] representa o maior inteiro menor ou igual a 10x, vista na Secao 2.1.
Note que se dois pontos x, y [0, 1] sao distintos, ent
ao em algum momento n,


10.2. TRANSFORMAC
OES
EXPANSIVAS

107

o n-esimo dgito an da expansao decimal de x difere do n-esimo dgito bn da


expansao decimal de y. Deste modo,
|f n (x) f n (y)| >

1
|an bn |
>
,
10
10

provando que f e expansiva com constante de expansividade

1
10 .

Exemplo 10.7. Inspirados no exemplo anterior, n


ao e difcil concluir que o
deslocamento introduzido em 5.1.2 e uma transformacao expansiva no espaco
das sequencias. De fato, o mesmo argumento do exemplo anterior se aplica neste
ao an = bn para algum
caso: se a = (an ) e b = (bn ) sao sequencias distintas, ent
ndice n. Assim, d( n (a), n (b)) > 20 = 1 (lembre-se que a dist
ancia no espaco
das sequencias e denida como em 5.1.2), onde podemos tomar a constante de
expansividade igual a 1.
Mais geralmente, os dois exemplos acima fazem parte da classe de transformacoes que expandem distancias a uma taxa uniforme, estudadas no captulo
9. De fato, podemos mostrar o seguinte lema
Lema 10.8. Se f e expansora, ou seja, existe > 1 tal que
Df (x)v v
ao f e expansiva.
para todo x M e v Tx M , ent
Demonstrac
ao. Pelo lema 9.4, existe 0 > 0 tal que, para qualquer pre-imagem
x de um ponto y M , existe uma aplicacao h : B(y, 0 ) M de classe C 1 tal
que f h = id , h(y) = x e
d(h(y1 ), h(y2 )) 1 d(y1 , y2 ) para todo y1 , y2 B(y, 0 ).
Assim, se d(f n (x), f n (y)) para todo n 0, conclumos que d(x, y)
n d(f n (x), f n (y)) n , o que implica imediatamente que x = y.
Para ilustrar a propriedade de expansividade, vamos provar uma proposicao
conectando o crescimento do n
umero de pontos peri
odicos de f com a sua entropia topol
ogica. Denotaremos o conjunto P er(n) = {x M ; f n (x) = x}.
Ent
ao:
Proposi
c
ao 10.9. Se f e expansiva ent
ao
lim sup

1
log #P er(n) htop (f ).
n

Demonstrac
ao. Seja uma cobertura de M de di
ametro menor que constante
de expansividade de f . Observe que em um elemento de n so pode existir
no m
aximo um ponto de P er(n): de fato, se x, y P er(n) estao no mesmo
ao d(f i (x), f i (y) <  para i = 0, . . . , n 1. Como f n (x) = x
elemento de n , ent

CAPITULO 10. ESTADOS DE EQUILIBRIO

108

e f n (y) = y, a desigualdade d(f i (x), f i (y) <  vale para todo i N. Logo, pela
expansividade de f , x = y. Assim,
lim sup

1
1
log #P er(n) lim sup log #N (n ) = htop (f, ).
n
n

Tomando o limite quando o di


ametro de vai a zero, temos a desigualdade
requerida.
N
ao e difcil obter transformacoes que nao satisfazem a propriedade de expansividade. Por exemplo, uma isometria da variedade nunca satisfaz a condicao
de expansividade. Se a transformacao admitir um ponto xo do tipo sela, ent
ao
(pelo Teorema da Variedade Estavel) a transformacao tambem nao e expansiva.
Iremos agora tratar as transformacoes expansivas do ponto de vista ergodico.
Mais precisamente, mostraremos o seguinte teorema:
Teorema 10.10. Seja f : M M uma transformac
ao expansiva denida
oes : M R
na variedade compacta M e seja C 0 (M ) o conjunto das func
contnuas. Dado qualquer C 0 (M ) existe algum estado de equilbrio para .
Para o conforto do leitor iremos dividir a demonstracao do teorema anterior
em um conjunto de lemas. O primeiro deles diz que se P e uma particao com
di
ametro menor que a constante de expansividade e e uma medida, entao P
e necessariamente uma particao geradora.
Lema 10.11. Seja P = {P1 , . . . , Pk } uma partic
ao tal que para todo i = 1, . . . , k
vale diamPi . Ent
ao, P e geradora com respeito a qualquer medida invariante
.
Demonstrac
ao. Dena
P (n) = {C (n) = Pi0 f n+1 (Pin1 )},

para cada n 1.

Nos precisamos mostrar que dado um conjunto mensur


avel A e  > 0, existem
(n)
(n)
borelianos C1 , . . . , Cm of P (n) tal que
 (n)
( Ci A) .
Primeiramente, observe que se P n (x) denota o elemento da particao P n que
contem x, ent
ao limn diamP n (x) = 0. De fato, se existe uma sequencia de
pontos yn P n (x) tais que d(yn , x) > > 0, por compacidade de M , existe o
limite y = limn+ yn (passando a uma subsequencia se necessario). Assim,
temos por um lado que d(y, x) > > 0 e por outro que y P n (x) para todo
n, o que implica que d(f n (y), f n (x)) < , o que contradiz a hip
otese de f ser
expansiva.
Considere ent
ao K1 A e K2 Ac compactos tais que (K1 A) e
c
(K2 A ) . Seja r = d(K1 , K2 ) > 0. Temos que se n e sucientemente


10.2. TRANSFORMAC
OES
EXPANSIVAS

109
(n)

(n)

grande diamP (n) (x) r2 , para todo x M . Considere C1 , . . . , Cm P (n)


aqueles que intersectam K1 . Ent
ao
 (n)
 (n)
 (n)
( Ci A) = ( Ci A) + (A Ci )
(A K1 ) + (Ac K2 ) 2.
O que prova o lema.

Observa
c
ao 10.12. Relembrando a denicao de entropia com respeito a uma
particao Q,

(Q) log (Q),
H (Q) =
QQ

temos que se Q e tal que 0 (Q) = 0, para cada Q Q e uma medida 0 xada,
ent
ao a funcao H (Q) e contnua em 0 . Isso implica diretamente que
1
H (P (n) ).
n n

 h (f, P) = inf
e semi-contnua superiormente em 0 .

Como consequencia do lema 10.11 e da observacao 10.12 podemos obter o


seguinte lema:

Lema 10.13. Dado C 0 (M ), a func
ao  P = P () = h (f ) + d e
semicontnua superiormente.

Demonstrac
ao. Como a funcao  d e contnua (logo semicontnua superiormente), basta mostrar que a transformacao H denida por  H() =
h (f ) e semicontnua superiormente. Para tanto, xe uma medida 0 e escolha
uma particao P = {P1 , . . . , Pk } tal que 0 (Pi ) = 0 para todo i = 1, . . . , k e
diamPi < , para todo i = 1, . . . , k. Por um lado, o Lema 10.11 nos garante que
P e uma particao geradora para toda medida e como consequencia do teorema
de Kolmogorov-Sinai, vale h (f ) = h (f, P). Por outro lado, a observacao 10.12
garante que a funcao  h (f, P) e semicontnua superiormente em 0 . Logo,
H e semicontnua superiormente em 0 .
Para provar o Teorema 10.10, basta unirmos os resultados que obtivemos:
Prova do Teorema 10.10. Pelo lema anterior, dada contnua, a funcao P e
semicontnua superiormente. Como vimos no Captulo 3, M1 (M ) e compacto,
logo P admite um maximo, o qual e por denicao um estado de equilbrio para
.
Observa
c
ao 10.14. Podemos selecionar um conjunto residual (interseccao enumeravel de conjuntos abertos e densos) C 0 (M ) tal que se entao o
estado de equilbrio para e u
nico.

110

CAPITULO 10. ESTADOS DE EQUILIBRIO

Uma pergunta que surge naturalmente e se existe estado de equilbrio especial, ou ate mesmo sob que condicoes para garantem que admite um u
nico
estado de equilbrio. Claramente precisamos supor que o sistema f : M M
seja indecomponvel no sentido ergodico pois, caso contr
ario, poderamos simplesmente construir contra-exemplos da seguinte forma: tomando duas c
opias
M

da variedade M , digamos M1 e M2 , disjuntas e consideraramos f : M


= M1 M2 como sendo f em cada componente Mi . Neste
atuando na uni
ao M
caso, um estado de equilbrio para f : M M produz uma innidade de estados de equilbrio para f, via combinacao convexa dos estados de equilbrio em
M1 e M2 . O que falta a f e a condicao de transitividade. O grande teorema do
pr
oximo captulo dir
a que se f e expansora e M e uma variedade compacta e
conexa (neste caso f e transitiva), ent
ao todo potencial H older contnuo admite
um u
nico estado de equilbrio.

10.3

Transforma
c
oes expansoras

Nesta subsecao, generalizaremos a construcao feita no Captulo 9 num contexto


mais abstrato e com alguns novos ingredientes. Porem, a essencia das ideias e
a mesma e tentaremos tracar um parelelo entre os conceitos e teoremas demonstrados aqui com os do Captulo 9, ressaltando suas semelhancas.

10.3.1

O operador de transfer
encia

Fixados f e phi, deniremos agora um operador que desempenhar


a um importante papel na nossa construcao.
Deni
c
ao 10.15. O operador de Ruelle-Perron-Frobenius ou operador de transferencia e o operador L : C 0 (M ) C 0 (M ) denido no espaco C 0 (M ) das
funcoes contnuas g : M R por

L g(x) =
e(y) g(y).
f (y)=x

O seu dual L e o operador L : M M denido no espaco M das medidas


nitas de M , do seguinte modo: para toda funcao contnua g : M R


gd L = L g d.
ao dadas na proposicao
Algumas propriedades importantes de L e do seu dual s
abaixo:
Proposi
c
ao 10.16. Valem as seguintes propriedades:
ao depende de
1. L e um operador linear contnuo L  Ce

, onde C n
.


10.3. TRANSFORMAC
OES
EXPANSORAS

111

ao L g(x) 0 para todo


2. L e positivo: se g(x) 0 para todo x M , ent
x M;
3. L admite alguma auto-medida com (M ) = 1
Demonstrac
ao. Os items 1 e 2 sao imediatos a partir da denicao de L e deixamos as vericacoes para o leitor. Para mostrar o item 3 usaremos o Teorema
de Tychono-Schauder para pontos xos que arma o seguinte: uma funcao
contnua denida num espaco compacto e convexo admite necessariamente um
ponto xo. Claramente M1 o espaco das medidas de probabilidade em M e
convexo, pois a combinacao de duas medidas de probabilidade tambem e uma
medida de probabilidade. Como foi provado na Secao 3.2, temos que M1 e
compacto. Logo, se denimos a funcao contnua G : M1 M1 por:
G() = 

L ()
L 1 d

existe M1 tal que G() = , o que implica que L = , onde =



L 1 d.
As auto-medidas para o dual do operador de transferencia sao chamadas
medidas conformes. Por exemplo, a medida de Lebesgue e uma medida conforme
para o potencial = log | det Df , como o leitor pode vericar empregando
diretamente a formula de mudanca de variaveis. Em geral, as medidas nao sao
invariantes pela transformacao f .
Deni
c
ao 10.17. O jacobiano de uma medida com respeito a f (quando
existe) e uma funcao J f tal que se A e um boreliano tal que f |A e injetiva,
ent
ao:

(f (A)) =
J f d.
A

Nem sempre o jacobiano de uma medida invariante existe. Quando cada


ponto de M admite somente um n
umero nito de pre-imagens por f , ent
ao
J f existe para toda medida invariante. Neste caso, o jacobiano e u
nicamente
denido, exceto talvez por um conjunto de medida zero. Podemos mostrar,
ao
aplicando sucessivas vezes a denicao do jacobiano, que se f n |A e injetiva, ent
J f n (x) =

n1

J f (f i (x)).

i=0

Deixaremos isso como exerccio para o leitor (veja 10.4


Uma das importantes propriedades das medidas conformes e o fato de que
seu jacobiano e bem determinado pela funcao e que vale a f
ormula de mudanca
de vari
aveis:
ao
Lema 10.18. Se L = , ent
1. O jacobiano de com respeito a f e dado por J f (x) = e(x) .

CAPITULO 10. ESTADOS DE EQUILIBRIO

112

ao
2. Se u C 0 (M ) ent


u f d =

(J f (y))1 u(x) d(x).

f (y)=x

Demonstrac
ao. Comecaremos mostrado a f
ormula de mudanca de variaveis do
item 2. Ora,



1
1

u f d =
u f dL () =
L (u f ) d.


Por outro lado, L (u f ) =
(e(y) u(x), de onde:
f (y)=x


u f d =

1 e(y) u(x) d(x) =

f (y)=x

(J f (y))1 u(x)d(x)).

f (y)=x

Para mostrar o item 1, considere um conjunto mensur


avel A tal que f |A e
injetiva. Tome uma sequencia {gn } C 0 (M ) tal que gn A em -q.t.p. e
ao,
sup |gn | 2 para todo n. Ent


L (e gn )(x) =
e(y) e(y) gn (y) =
gn (y).
f (y)=x

f (y)=x

Observe que a u
ltima expressao converge para f (A) (x) em -quase todo ponto.
Assim, pelo Teorema da Convergencia Dominada,



e gn d = e gn d(L ) = L (e gn ) d (f (A)).

Como o lado esquedo tambem converge para A e d, concluimos que

(f (A)) =
e d,
A

terminando a prova do lema.


Lembre-se que B
(n, x) denota a bola din
amica de raio  e tamanho n centrada em x, como denida em 7.19 e Sn (x) = (x) + + (f n1 (x)).
Enunciaremos agora o principal teorema deste captulo, devido a Ruelle ([]),
generalizando o teorema 9.3 do Captulo 9:
Teorema 10.19. Seja f : M M uma transformac
ao expansora numa variedade compacta conexa M e : M R um potencial -H
older, para algum
> 0. Ent
ao, se denota uma medida conforme para , ent
ao
1. Existe uma u
nica probabilidade invariante absolutamente contnua com
respeito a
` ;


10.3. TRANSFORMAC
OES
EXPANSORAS

113

nico estado de equilbrio para (f, );


2. e o u
3. Alem disso, e erg
odica, o seu suporte coincide com M e vale a condic
ao
de Gibbs: Existe K > 0 tal que para todo x M
K 1

(B
(n, x))
K.
eSn (x)nP ()

(10.1)

Antes de iniciarmos a prova do Teorema 10.19 vamos fazer alguns comentarios


a respeito de sua relacao com Teorema 9.3.
A primeira observacao e que o Teorema 9.3 e uma caso particular do Teorema 10.19, tomando-se = log | det Df . Neste caso, a pressao de e igual
a zero. Uma segunda observacao e que a medida conforme , obtida como na
proposicao 10.16,desempenha aqui o mesmo papel que a medida de Lebesgue
desempenha no Teorema 9.3.
Apesar disso, nosso conhecimento `
a priori da medida e mnimo, se resumindo ao seu jacobiano e a f
ormula de mudanca de variaveis, obtidos no
Lema 10.18. Observe tambem que a conexidade do domnio M e um ingrea da
diente indispens
avel para mostrar a unicidade de . Alem disso, seguir
prova do Teorema que a medida conforme e u
nica, m
odulo multiplicacao por
uma funcao.
O trabalho para mostrar o Teorema 10.19 seguir
a o seguinte roteiro:
Fixada uma medida conforme associada a um auto-valor de L ,
mostraremos que existe uma funcao contnua h tal que L h = h e alem
disso, h(x) > 0, para todo x M ;
Mostraremos que satisfaz a equacao 10.1 com a constante P = log ;
Construiremos = h e mostraremos que e invariante, satisfaz a
equacao 10.1 e que e o unico estado de equilbrio para absolutamente
contnu com respeito `a .
Finalmente, mostraremos que qualquer estado de equilbrio para e absolutamente contnuo com respeito `a .
Uma vez explicada a nossa linha geral de acao, vamos comecar a construir os
alicerces para a prova do Teorema. A pr
oxima proposicao e fundamental para
nossa construcao e e o analogo do Lema de distorcao ( prop. 9.5), substituindose o jacobiano com respeito a` medida de Lebesgue pelo jacobiano da medida
.
Proposi
c
ao 10.20. Existe uma constante A tal que para todos x, y M tais
ao
que d(f n (x), f n (y)) < , ent
Ad(f n (x), f n (y)) Sn (x) Sn (y) Ad(f n (x), f n (y)) .
Demonstraca
o. Observe que como d(f n (x), f n (y)) < , segue-se pelo Lema 9.4
que

CAPITULO 10. ESTADOS DE EQUILIBRIO

114

d(f ni (x), f ni (y)) < i d(f n (x), f n (y)).

(10.2)

Logo,
Sn (y) Sn (x)

n1

(f i (x)) (f i (y))

i=0

n1

i d(f n (x), f n (y)) Ad(f n (x), f n (y))

i=0

onde A e escolhido sucientemente grande.


Como uma consequencia direta da proposicao acima, podemos mostrar que:
Corol
ario 10.21. Existe uma constante K tal que para todos x, y M tais que
ao
d(f n (x), f n (y)) < , ent
K21

J f n (x)
K2 .
J f n (y)

Demonstraca
o. Como J f (x) = 1 e(x) , segue-se diretamente da denicao que
J f n (x) = n eSn (x) .
Como d(f n (x), f n (y)) < , segue-se pelo Proposicao 10.20 que
n
n

J f n (x)
= eSn (y)Sn (x) eAd(f (x),f (y)) ,
n
J f (y)

Assim, nos so precisamos escolher K = eAD , onde D = .


Tendo em maos esses resultados, mostraremos agora a propriedade de Gibbs
para a medida conforme.
Lema 10.22. Se e uma medida satisfazendo a equac
ao L = e  e
pequeno, ent
ao tomando P = log e x pertence ao suporte de existe algum
n
umero K > 0, dependendo somente de , tal que vale:
K 1

(B
(n, x))
K.
eSn (x)nP

Demonstrac
ao. De fato, como f n |cB (n,x) e injetiva e J f (x) = 1 e(x) , temos
que J f n = n eSn (x) , onde

n
J f n (y)d(y).
(f (B
(n, x)) =
B (n,x)


10.3. TRANSFORMAC
OES
EXPANSORAS

115

De acordo com a Proposicao 2.3, o valor de J f n num ponto qualquer y


B
(n, x) difere do valor de J f n em x pela multiplicacao por uma constante K,
que n
ao depende de x ou n. Logo:
K21 (f n (B
(n, x)) J f n (x)(B
(n, x)) K2 (f n (B
(n, x)).
Para concluir, como qualquer ramo inverso de f e uma contracao, de acordo
com o que foi provado no lema 9.4, temos que f n (B
(n, x)) = f (B (f n1 (x)).
Assim, como f e um difeomorsmo local, podemos escolher independente de
n ou x sucientemente pequeno de modo que B (f n (x)) f n (B
(n, x)). Deixamos para o leitor a prova do seguinte fato (exerccio 10.6): Dado > 0, existe
a > 0 tal que (B (x)) > a > 0 para todo x no suporte de . Assim, tomando
K = sup{K2 a, K2 }, P = log e observando que (J f n (x))1 = eSn (x)nP
temos que
(B
(n, x))
K 1 S (x)nP K,
e n
como queriamos provar.
Lema 10.23. Existe uma constante K > 0 such



 Ln (x1 )


1 Kd(x1 , x2 )
 n

 L (x2 )
para todos x1 e x2 com d(x1 , x2 ) < . Em particular, existe A tal que para todos
x, y M :
Ln (x)
A.
Ln (y)
Demonstraca
o. Fixada uma pre-imagem y1 de x1 por f n , como d(x1 , x2 ) <
nica pre-imagem por f n na mesma bola din
amica
ent
ao temos que x2 tem uma u
de comprimento n+1 e raio , que iremos denotar por y2 . Pela proposicao 10.20,
existe uma constante uniforme K tal que
Aed(x1 ,x2 )

|eSn (y1 )Sn (y2 ) | Aed(x1 ,x2 )

Ent
ao,
e

Ad(x1 ,x2 )


Sn (y1 )
Ln (x1 )

f n (y1 )=x1 e
= 
n
eAd(x1 ,x2 )
Sn (y2 )
L (x2 )
e
n
f (y2 )=x2

Agora e suciente observar que para todo x1 e x2 ,


|eAd(x1 ,x2 ) 1| Kd(x1 , x2 )

se K e escolhido sucientemente grande com respeito `a A. O resto do lema e


imediato, cobrindo M por um n
umero k de bolas de raio .

116

CAPITULO 10. ESTADOS DE EQUILIBRIO

Para mostrar que L admite alguma auto-funcao, mostraremos que a sequencia


de funcoes i Li 1 forma uma sequencia limitada e equicontnua. Isso sera o
trabalho dos dois pr
oximos lemas:
Lema 10.24. A sequencia de func
oes n Ln 1 e limitada. Alem disso, existe
n n
c > 0 tal que L 1(x) > c > 0, para todo x M .

Demonstrac
ao. Observe que n Ln 1 d = 1. Logo, existem pontos zn e yn
tais que n Ln 1(zn ) 1 e n Ln 1(yn ) 1. De acordo com o Lema 10.23,
temos que para todo x M vale:
n Ln (x) ALn (zn ) A
e

1
1
n Ln (yn ) Ln (x),
A
A
o que termina a prova do Lema.
Lema 10.25. A sequencia n Ln 1 e equicontnua.
Demonstrac
ao. Para mostrar que sequencia de funcoes n Ln 1 e equicontnua,
observe que para todos x, y com d(x, y) < , pelo Lema 10.23:
n Ln 1(x) n Ln 1(y)
Kd(x, y)
n Ln 1(x)
ou seja,
n Ln 1(x) n Ln 1(y) Kn Ln 1(x)d(x, y) .
Pelo lema 10.24, a sequencia de funcoes n Ln 1 e limitada uniformemente em
M . Utilizando esse fato na equacao acima, acabamos a prova do Lema 10.25
Baseado nas informacoes obtidas sobre a sequencia de funcoes n Ln 1,
vamos agora mostrar que existe alguma auto-funcao h para o operador L.
Primeiramente, observe que pelos lemas 10.24 e 10.25 a sequencia n Ln 1 e
limitada e equicontnua. Naturalmente, isso implica que a media dessas funcoes
hn =

n1
1 i i
L 1,
n i=0

ainda e uma sequencia limitada e equicontnua. Como M e compacto, pelo


Teorema de Ascoli-Arzela, segue-se que a sequencia hn possui uma subsequencia
hni convergindo uniformemente para uma certa funcao contnua h. Mostraremos
que esta funcao h e que h e de fato uma auto-funcao de L .


10.3. TRANSFORMAC
OES
EXPANSORAS

117

ao, como L e
Ora, se hni h para uma certa subsequencia ni ent
contnua
ni 1
1
k Lk+1
L h = lim L hni = lim
1=
ni
ni ni
k=0

nk 1
n1

(k) k
1 ni Lni 1
(k+1) Lk+1
1
=
lim

L 1
.

ni ni
ni n
ni

= lim

k=0

k=0

Como ni Lni 1 e uma sequencia limitada, de acordo com o Lema 10.24, o


segundo termo da u
ltima igualdade acima vai para zero e o primeiro converge
para h, provando que L h = h.
Observe ainda que, utilizando o fato que e uma medida conforme, que
 n
i
Lni 1 d = 1, para todo n N. Deste modo, segue-se diretamente
que



hn d = 1 e como h lim hni , tomando o limite mostramos que h d = 1.
Resumindo, mostramos que:
Proposi
c
ao 10.26. Existe alguma func
ao contnua h : M R tal que:
1. L h = h;
2. h > 0;

3. h d = 1.
Como a funcao h e contnua e n
ao-negativa, podemos denir uma medida
por


h d.

(A) =
A

Da Proposi
 cao 10.26 vem que e uma medida de probabilidade, uma vez que
(M ) = h d = 1. Observe tambem que como existe c > 0 tal que 1/c h c,
temos que para todo boreliano A M , vale
c1 (A) (A) (A)c.

(10.3)

Alem disso, a medida e invariante, como veremos no:


Lema 10.27. Sejam tal que L = e h uma func
ao n
ao-negativa satisfazendo L h = h. Denindo por = h, ent
ao temos que e uma
probabilidade f -invariante. Alem disso, existe K tal que para todo x M e
n N vale:
(B
(n, x))
(10.4)
K 1 S (x)nP K,
e n
Demonstrac
ao. Para mostrar que e f invariante, de acordo com a Proposicao ??
basta mostramos que para toda funcao contnua g : M R vale:


g f d = g d.

CAPITULO 10. ESTADOS DE EQUILIBRIO

118

Primeiro, observe que L (g f h)(x) = g(x)L h. Assim,





g f d = g f h d = 1 g f h dL () =




1 L (g f h) d = 1 gL h d = gh d = g d.
A equacao 10.4 vem diretamente da equacao 10.3.

Vamos agora utilizar a equacao 10.4 para calcular o valor de h (f ) + d.
Corol
ario 10.28. Se = h construida anteriormente, ent
ao

h (f ) + d = P.
Demonstrac
ao. O Teorema de Brin-Katok arma que a funcao h dada por
H(x) = lim lim

0 n

1
log (B
(n, x)),
n

esta bem denida para quase todo x M , e -integr


avel e vale:

h (f ) = H d.
Observe que a equacao 10.4 fornece que H(x) = lim n1 Sn (x) + P . Subn
stituindo acima, vem que:

1
lim Sn d + P.
h (f ) =
n n
Logo, usando o Teorema de Birkho


1
h (f ) =
lim Sn d + P = d + P,
n n
como era nosso intuito inicial.
Para completar a prova do Teorema 10.19 resta-nos duas tarefas. A primeira
delas e mostrar que de fato o n
umero P na equacao 10.4 e igual a` P (),
mostrando que e um estado de equilbrio e de Gibbs. Outra tarefa referese `a mostrar que e u
nico. Faremos isso no seguinte lema :
ao
Lema 10.29. Seja tal que existe e h com L = e L h = h. Ent
P ()
.
=e
Na proposicao a seguir utilizaremos o seguinte lema de c
alculo:
Lema
xi (i = 1, 2, . . . , n) n
u
meros reais tais que pi > 0, xi > 0,
n 10.30. Sejam pi ,
n
n
e i=1 pi = 1. Ent
ao i=1 pi log xi log( i=1 pi xi ) e a igualdade acontece
ao iguais.
se, e s
o se, os n
umeros xi s


10.3. TRANSFORMAC
OES
EXPANSORAS

119

Deixaremos como exerccio para o leitor (exerccio ??) a prova deste fato.
Proposi
c
ao 10.31. Vale o seguinte:
1. P = P (f, );
2. Se e um estado de equilbrio para , ent
ao L (h1 ) = h1 .
Demonstraca
o. Dena g : M (0, ) por
g(x) = 1 e(x)

h(x)
,
h(f (x))

e seja g = (J f )1 . Observe que:



(y)

h(y)
L h(x)
f (y)=x e
=
=1
g(y) =
h(x)
h(x)

(10.5)

f (y)=x

Vamos mostrar que g = g para -quase todo ponto. Primeiramente, usando


a denicao de g segue que h (f ) + g d 0, pois:


h (f ) + log gd = h (f ) log + ( + log h log h f ) d 0.

Usaremos agora o fato que h (f ) = log J f d. O roteiro para a prova
desse fato esta no exerccio ??. Combinando a f
ormula anterior para a entropia
de com a desigualdade acima:


g(y)
g
d,
d =
g (y) log
0 log
g
g (y)
f (y)=x

onde a segunda igualdade segue do fato que g = 1/J f. De acordo com a


equacao (10.5), a primeira armacao do Lema 10.30 nos d
a:
0


f (y)=x

g (y) log




g(y)
g(y) 
log
g (y)
g(y) = 0
= log
g (y)
g (y)
f (y)=x

f (y)=x

em -quase todo ponto. Uma vez em que a express


 ao na esquerda e nao-negativa,
segue-se a igualdade. Assim, temos que h (f ) + d log = 0, o que implica
log = P (f, )
Para mostrar que g = g , observe que pela segunda armacao no Lema 10.30
os valores de log g(y)/g (y) sao os mesmos para todos y f 1 (x). Em outras
palavras, para -quase todo x M existe um n
umero c(x) tal que
g(y)
= c(x)
g (y)

para todo y f 1 (x).

A hip
otese de ser invariante implica que

g (x) = 1
f (y)=x

120

CAPITULO 10. ESTADOS DE EQUILIBRIO

para -quase todo x M . Combinando isso com (10.5), conclumos que



f (y)=x g(y)
= 1.
c(x) = 
f (y)=x g (y)
Finalmente, vamos mostrar que L (h1 ) = h1 . Dada uma funcao
contnua



1
1
e(y) h(f (y))1 (y) d(x).
d(L h ) = (L )(x)h(x) d(x) =
f (y)=x

usando a denicao de g e , temos que


e(y) h(f (y))1 = g(y)h(y)1 = g (y)h(y)1 .
Substituindo na f
ormula anterior,






log
g (y)(y)h(y)1 d(x) = h1 d.
d(L (h1 )) =
f (y)=x

Uma vez que e arbitr


ario, temos que L (h1 ) = (h1 ), como armamos.
O lema a seguir mostra que duas medidas conformes sao necessariamente
equivalentes:
ao 1 e 2
Lema 10.32. Sejam 1 e 2 tais que L i = i , para i = 1, 2. Ent
s
ao equivalentes.
Demonstrac
ao. Pela equacao 10.1, dado x M e n N, temos que
A1 2 (B
(n, x)) 1 (B
(n, x)) A2 (B
(n, x)).
Como a sequencia de coberturas
amica de raio  e comprimento n}
U
n = {U ; U e bola din
tem di
ametro decrescendo a` zero, U
n e geradora. Deste modo, aproximando
por bolas din
amicas, podemos estender a equacao anterior para todo boreliano
A de M . Isso mostra que 1 e 2 sao equivalentes.
Observando o que ja mostramos no Lema 10.27, o Corol
ario 10.28 e a
Proposicao 10.31, para nalizar a prova do Teorema 10.19, basta mostrar que
se e um estado de equilbrio, ent
ao = , construido como no Lema 10.27.
Prova do Teorema 10.19. Suponha que e um estado de equilbrio erg
odico
de e seja a medida construda como no Lema 10.27. De acordo com
a Proposicao 10.31, denotando = h1 , temos que L = . Pelo

10.4. EXERCICIOS

121

Lema 10.32 e sao equivalentes, o que implica que e tambem sao


equivalentes: = , para alguma funcao -integrable . Desde que e
sao invariantes,
= f = ( f )f = ( f ).
Como a derivada de Radon-Nikodym essencialmente u
nica, temos que = f
em -quase todo ponto. Observando
que

e
erg
o
dica,
segue-se que e constante.


Usando que 1 = (M ) = d = c d = c, n
os temos que = . Observe que
isso termina a prova, desde que qualquer componente erg
odica de um estado de
equilbrio tambem e um estado de equilbrio.

10.4

Exerccios

10.1. Seja uma medida em M . Dado > 0, mostre que existe a > 0 tal que
(B (x)) > a > 0 para todo x no suporte de .
10.2. Seja f : M M uma transformacao expansora e M uma variedade
conexa. Mostre que se uma
10.3. Seja f : M M uma transformacao tal que cada ponto admite somente
um n
umero nito de pre-imagens. Mostre que J f existe para toda medida
invariante .
10.4. Seja uma medida e J f seu jacobiano. Mostre que se f n |A e injetiva,
ent
ao
n1

J f (f i (x)).
J f n (x) =
i=0

10.5. Seja f uma transformacao expansora e uma medida invariante. Mostre


ao
que para -quase todo x existe n0 = n0 (x) e K = K(x) tais que se n > n0 ent
K 1 < J f n (x)(B
(n, x)) < K.
10.6. (F
ormula de Rokhlin) Seja f uma transformacao expansora e uma
medida invariante. Mostre que:

h (f ) = log J f d.
Dica: Use o exerccio 10.5 e o Teorema de Brin-Katok.

122

CAPITULO 10. ESTADOS DE EQUILIBRIO

Captulo 11

Aplica
co
es em Teoria dos
N
umeros
Neste captulo apresentamos duas aplicacoes da Teoria Erg
odica no domnio
da Teoria dos N
umeros: o Teorema de S. Szemeredi [Sze75] sobre existencia
de progressoes aritmeticas dentro de subconjuntos sucientemente densos do
conjunto Z dos n
umeros inteiros, e o teorema de H. Weyl [Wey16] sobre equidistribuicao da parte fracion
aria dos valores de funcoes polinomiais restritas a Z.

11.1

Teorema de Szemer
edi

A nossa apresentacao e inspirada por Furstenberg [Fur81], onde o leitor pode


encontrar muita informacao adicional sobre este tema.

11.1.1

Densidade superior

Chamamos intervalo do conjunto Z dos n


umeros inteiros qualquer subconjunto
I da forma {n Z : a n < b}, para quaisquer a b em Z. O seu cardinal e
#I = b a.
Deni
c
ao 11.1. A densidade superior Ds (S) de um subconjunto S de Z e
Ds (S) = lim sup
#I

#(S I)
#I

onde I representa qualquer intervalo em Z. Do mesmo modo se dene a densidade inferior Di (S), trocando limite superior por limite inferior.
Em outras palavras, Ds (I) e o maior n
umero D tal que existe uma sequencia
de intervalos Ij Z tais que
#Ij e

#(S Ij )
D
#Ij
123

CAPITULO 11. APLICAC


OES
EM TEORIA DOS NUMEROS

124

umero nessas condicoes. Note que 0 Di (S) Ds (S) 1.


e Di (S) e o menor n
No Exerccio 11.1 tambem veremos que Di (S) = Ds (Z \ S) para todo S Z.
Exemplo 11.2. Seja S o conjunto dos n
umeros pares. Dado qualquer intervalo
I Z, temos que #(S I) = #I/2 se o cardinal de I e par e #(S I) =
#(I 1)/2 se o cardinal de I e mpar, onde o sinal e positivo se o menor
elemento de I e um n
umero par, e e negativo caso contr
ario. Desta observacao
segue, imediatamente, que Ds (S) = Di (S) = 1/2.
Exemplo 11.3. Seja S o seguinte subconjunto de Z:
{1, 3, 4, 7, 8, 9, 13, 14, 15, 16, 21, 22, 23, 24, 25, 31, 32, 33, 34, 35, 36, 42, . . .}.
Isto e, para cada k 1 inclumos em S um bloco de k inteiros consecutivos e
omitimos os k inteiros seguintes. Este conjunto contem intervalos com comprimento arbitrariamente grande. Portanto Ds (S) = 1. Por outro lado, o complementar de S tambem contem intervalos com comprimento arbitrariamente
grande. Portanto, Di (S) = 1 Ds (Z \ S) = 0.
Exemplo 11.4. Seja S o seguinte subconjunto de Z:
{1, 3, 4, 5, 6,9, 10, 11, 12, 14, 15, 16, 17, 18,
22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 42, . . .}.
Ou seja, para cada k 1 inclumos em S um bloco de k 2 inteiros consecutivos
e depois exclumos os k inteiros seguintes. Neste caso temos
lim

#(S [1, 2, . . . , n])


= 1.
n

Isto implica Ds (S) = 1. Mas, tal como no caso anterior, Di (S) = 0.

11.1.2

Enunciados

Nos anos 30, Erd


os e Turan [ET36] conjecturaram que todo subconjunto de
Z com densidade superior positiva contem sequencias aritmeticas nitas com
comprimento arbitrariamente grande. Esta conjectura foi demonstrada por Szemeredi [Sze75], quase quatro decadas mais tarde:
Teorema 11.5 (Szemer
edi). Se S e um subconjunto de Z com densidade
superior positiva, ent
ao para todo k N existem m Z e n N tais que m,
m + n, m + 2n, . . . , m + kn pertencem a S.
Em geral, n
ao podemos esperar que S contenha progressoes aritmeticas com
comprimento innito, como mostram os Exemplos 11.3 e 11.4.
A demonstracao original do Teorema 11.5 usa argumentos combinat
orios
bastante intrincados. No entanto, poucos anos depois Furstenberg [Fur77] deu
uma nova demonstracao, utilizando ideias de Teoria Ergodica. Na verdade, ele
deduziu o Teorema 11.5 de uma generalizacao do Teorema 1.1 para famlias de
transformacoes que comutam entre si:


11.1. TEOREMA DE SZEMEREDI

125

Teorema 11.6 (Recorr


encia Simult
anea de Poincar
e). Sejam fi : M
M , i = 1, 2, . . . , k transformac
oes que preservam uma probabilidade em M
e tais que fi fj = fj fi para todo i, j = 1, 2, . . . , k. Ent
ao, para qualquer
conjunto E M tal que (E) > 0, existe algum n 1 tal que


E f1n (E) f2n (E) fkn (E) > 0.
Em outras palavras, este teorema arma que existe algum tempo n tal que
os iterados de um subconjunto com medida positiva de pontos de E, por todas
as transformacoes fi , regressam a E simultaneamente nesse momento n.
A demonstracao do Teorema 11.6 escapa ao ambito deste texto. Mas, na
Secao 11.1.6, explicaremos porque ele implica o Teorema 11.5. Alem disso,
vamos discutir vers
oes um pouco mais fracas destes resultados, que chamamos
teorema de van der Waerden e teorema de Recorrencia Simultanea de Birkho,
respectivamente.
O teorema de van der Waerden [vdW27] arma que dada qualquer particao
do conjunto Z num n
umero nito de subconjuntos, algum desses subconjuntos
deve conter progressoes aritmeticas com comprimento arbitrariamente grande:
Teorema 11.7 (van der Waerden). Sejam S1 , S2 , . . . , Sq subconjuntos doisa-dois disjuntos de Z tais que S1 S2 Sq = Z. Dado qualquer k 1 existe
ao aritmetica com comprimento k + 1. Em
algum Si que contem alguma progress
particular, algum elemento Sj da partic
ao contem progress
oes aritmeticas com
comprimento arbitrariamente grande.
Na Secao 11.1.3 veremos que este resultado e uma consequencia simples do
Teorema 11.5. Tambem veremos, na Secao 11.1.4, que ele pode ser deduzido da
seguinte extensao do Teorema 3.11:
Teorema 11.8 (Recorr
encia Simult
anea de Birkho ). Seja M um espaco
oes contnuas tais
metrico compacto e fi : M M , i = 1, 2, . . . , k transformac
que fi fj = fj fi para todo i, j = 1, 2, . . . , k. Ent
ao existe algum x M e
alguma sequencia nj tal que
n

fi j (x) x quando j , para todo i = 1, 2, . . . , k.


Em outras palavras, as trajet
orias de x por todas as transformacoes recorrem
para x simultaneamente nos momentos nj .
Na Secao 11.1.5 veremos que o Teorema 11.8 e uma consequencia simples
do Teorema 11.6. Alias, como veremos na Secao 11.1.6, este u
ltimo teorema
tambem implica o Teorema 11.5. Portanto, o diagrama a seguir resume as
relacoes logicas entre os quatro enunciados, que ser
ao discutidas nas pr
oximas
secoes:
T. Szemeredi 11.5
T. R. S. Poincare 11.6

T. van der Waerden 11.7 T. R. S. Birkho 11.8.

126

11.1.3

CAPITULO 11. APLICAC


OES
EM TEORIA DOS NUMEROS

T. de Szemer
edi implica T. van der Waerden

Seja S1 , S2 , . . . , SN uma particao nita de Z qualquer. De acordo com o


Exerccio 11.1, pelo menos um dos elementos Si da particao deve ter densidade
superior positiva. Aplicando o Teorema 11.5 a S = Si conclumos que ele contem
progressoes aritmeticas com comprimento arbitrariamente grande. Isto prova o
Teorema 11.7.

11.1.4

T. de Birkho implica T. de van der Waerden

Vamos comecar por traduzir o Teorema 11.7 num enunciado sobre o deslocamento (shift) f : M M no espaco M = {1, 2, . . . , q}Z das sequencias bilaterais com valores em {1, 2, . . . , q}. Observe que cada sequencia = (n )nZ
em M dene uma particao de Z em subconjuntos
Si = {n Z : n = i},

i = 1, 2, . . . , q

e, reciprocamente, toda particao de Z em q subconjuntos determine uma sequencia M . Portanto, o teorema pode ser reformulado do seguinte modo:
para todo M e todo k 1, existem m Z e n 1 tais que
m = m+n = = m+nk .

(11.1)

Para provarmos este fato, vamos munir M da metrica d(, ) = N (, ) ,




N (, ) = max N 0 : n = n para todo n Z com |n| < N ,
que foi denida no Exerccio 5.1, sendo um n
umero qualquer em (0, 1). Note
que
d(, ) < 1 se e somente se 0 = 0 .
(11.2)


Como o espaco metrico (M, d) e compacto, o fecho A = f n () : n Z da
trajetoria de e tambem um compacto, para a metrica induzida. Lembre que
o deslocamento f : M M e denido por
f ((n )nZ ) = (n+1 )nZ .

(11.3)

Consideremos as transformacoes f1 = f , f2 = f 2 , . . . , fk = f k denidas de


claro que as fi comutam entre si. Portanto, podemos aplicar
A em A. E
o Teorema 11.8 e concluir desta maneira que existe A e uma sequencia
nj tal que
n

fi j ()

para todo i = 1, 2, . . . , k.

Observe que fi j = f i nj . Em particular, podemos xar n = nj tal que os


iterados f n (), f 2n (), . . . , f kn () estao todos a distancia menor que 1/3 do
ponto . Logo, os pontos
, f n (), f 2n (), . . . , f kn ()


11.1. TEOREMA DE SZEMEREDI

127

estao todos a distancia menor que 2/3 uns dos outros. Ent
ao, como esta
no fecho A da orbita de , podemos encontrar m Z tal que f m () esta t
ao
pr
oximo de que os pontos
f m (), f m+n (), f m+2n (), . . . , f m+kn ()
estao a dist
ancia menor que 1 uns dos outros. Tendo em conta a observacao
(11.2) e a denicao (11.3) da transformacao f , isto quer dizer que
m = m+n = = m+kn ,
como pretendamos provar. Isto completa a demonstracao do teorema de van
der Waerden a partir do teorema de Recorrencia Simultanea de Birkho.
De fato, a conclusao do Teorema 11.7 ainda vale para particoes de subconjuntos nitos de Z, desde que sejam sucientemente grandes:
Teorema 11.9 (van der Waerden). Dados k 1 e q 2 existe N 1 tal
que, dada qualquer partic
ao do intervalo {1, 2, . . . , N } em q subconjuntos, algum
desses subconjuntos contem progress
oes aritmeticas com comprimento k + 1.
f
E
acil ver que o Teorema 11.9 implica o Teorema 11.7. No Exerccio 11.2
veremos que a recproca tambem e verdadeira.

11.1.5

T. de Poincar
e implica T. de Birkho

Comecemos por lembrar (Exerccio 3.4) que se fi : M M , i = 1, 2, . . . , k


sao transformacoes contnuas num espaco metrico compacto que comutam entre si, entao existe alguma probabilidade invariante comum a todas essas
transformacoes.
Em seguida, observemos que o Teorema 11.6 tem a seguinte consequencia:
oes que
Corol
ario 11.10. Sejam fi : M M , i = 1, 2, . . . , k transformac
preservam uma probabilidade em M e tais que fi fj = fj fi para todo
i, j = 1, 2, . . . , k. Ent
ao, para qualquer conjunto E M tal que (E) > 0, e
n
para quase todo x E existe uma sequencia nj tal que fi j (x) E para
todo i = 1, . . . , k e todo j 1.
Deixaremos a prova desta proposicao como exerccio para o leitor (Exerccio 11.6). Compare tambem com o Exerccio 1.1. Este corolario ser
a u
til
na:
Prova do Teorema de Recorrencia M
ultipla de Birkho. Considere uma base enumeravel de abertos Uj de M com o diametro de Uj indo a zero quando j .
Seja alguma medida invariante simultaneamente para todos os fi (note que o
Exerccio 3.4 nos garante a existencia de alguma destas medidas).
Para cada j representamos por Dj o conjunto dos pontos x Uj tais que
existe n > j tal que fin (x) Uj para todo i = 1, 2, . . . , k. Observe que de
acordo com o Corolario 11.10, o conjunto Uj \ Dj tem medida igual a zero,

128

CAPITULO 11. APLICAC


OES
EM TEORIA DOS NUMEROS

uma vez que quase todo ponto retorna simutaneamente a Uj em algum momento.
Consequentemente, como {Uj }jN e uma cobertura de M , temos que o conjunto:



D=

Dm ,

n=1 mn

tem medida (D) = 1. Em particular, D = .


Mostraremos que todo ponto x D e simultaneamente
recorrente para as

transformacoes f1 , f2 , . . . , fk . Ora, se x D x mn Dm para todo n N.
Logo, existe m n tal que x Dm . De acordo com a denicao de Dm ,
existe algum nm > m tal que finm (x) Um para todo i = 1, 2, . . . , k. Logo,
d(x, finm (x)) 0, uma vez que os pontos x e fimn (x) pertencem a Um e o
di
ametro de Um vai a zero quando m . Isto encerra a prova do Teorema de
Recorrencia M
ultipla de Birkho.

11.1.6

Prova do Teorema de Szemer


edi

Mostraremos nesta seccao como deduzir o Teorema de Szemeredi (Teorema 11.5)


a partir do Teorema de Recorrencia Simultanea (Teorema 11.6). Novamente,
utilizaremos o dicionario entre particoes de Z e sequencias de inteiros, como ja
zemos na prova do Teorema de Van der Waerden (Teorema 11.7).
Prova do Teorema de Szemeredi. Considere S um conjunto com densidade superior positiva qualquer. Vamos associar a S uma sequencia = (n )nZ
M = {0, 1}Z denida por:
n = 1 n S.
Como S possui densidade superior positiva, existe c > 0 e uma sequencia de
intervalos In = [an , bn ) de Z com lim #In = e tais que
Ds (S) =

lim

#In

#(S In )
> c > 0.
#In

Considere o deslocamento f : M M e dena o subconjunto A M por


A = {y M ; y0 = 1}.
Note que o fato de f j () A equivale a dizer que j = 1, ou seja, j S.
Resumindo,
f j () A j S
(11.4)
O conjunto A e um aberto e ao mesmo tempo um fechado de M , considerando
a topologia dada onde os cilindros s
ao abertos, pois A e um cilindro de comprimento 1 em M e seu complementar e uma uni
ao de cilindros. Deste modo, tendo
em vista (11.4), mostrar que m + in S equivale a mostrar que f m+in () A.
Logo, para mostrar o Teorema de Szemeredi, basta provar que para todo k N
existem m Z e n N tais que
f m (), f m+n (), f m+2n (), . . . , f m+kn () A.

11.2. TEOREMA DE WEYL

129

Para mostrar este fato, vamos denir a sequencia n de probabilidades em


M por:
bn 1
1
n =
i
(11.5)
#In i=a f ()
n

Como ja vimos no Teorema 3.4, o conjunto das probabilidades M1 (M ) munido com a topologia fraca e compacto. Assim, podemos garantir que alguma
subsequencia ni converge para uma probabilidade de M . Para n
ao carregar a
notacao, vamos supor que a pr
opria sequencia n converge para na topologia
fraca . Observe que e uma probabilidade f -invariante, pois para toda funcao
contnua : M R, vale

bn 1
1
(f i ())
n
n #In
i=an


bn
an
(f ()) (f ())
+ lim
= lim
dn = d.
n
n
#In

f d = lim

f dn = lim

Para utilizar o Teorema de Recorrencia Simultanea de Poincare para o conjunto A, precisamos mostrar inicialmente que (A) > 0. De fato, observe que
A e um conjunto fechado e aberto de M . Logo, pela Proposicao 3.3 temos que
(A) n (A) =

#(S In )
> c > 0.
#In
#In
lim

Dado k N, considerando as funcoes f, f 2 , f 3 , . . . , f k (que claramente comutam


entre si) o Teorema de Recorrencia Simultanea de Poincare nos garante que
existe algum n 1 tal que


A f n (A) f 2n (A) fkkn (A) > 0.
Em particular, como A e aberto, existe algum l tal que


l A f n (A) f 2n (A) f kn (A) > 0.
bl 1
f i () , podemos garantir que pelo menos para algum
Como l = (1/#Il ) i=a
l
an m bl 1, o ponto f m () pertence a A f n (A) f kn (A). Assim,
f m+in () A, para i = 0, 1, . . . , k, como queramos provar.

11.2

Teorema de Weyl

Vamos descrever outra bela aplicacao da Teoria Erg


odica a` Teoria dos N
umeros,
devida a H. Weyl [Wey16]. Consideramos funcoes polinomiais
P (x) = a0 + a1 x + a2 x2 + + ad xd ,

130

CAPITULO 11. APLICAC


OES
EM TEORIA DOS NUMEROS

com coecientes reais e grau d 1. Para cada inteiro positivo n, calculamos o


aria do valor P (n) obtido.
valor da funcao P em n e chamamos zn a parte fracion
De maneira mais formal,
zn = {P (n)} = P (n) [P (n)]
onde {x} = parte fracion
aria e [x] = parte inteira de x. Observe que zn [0, 1)
para cada n. Mas podemos, igualmente, considerar que a sequencia toma valores
no crculo S 1 = R/Z, e faremos isso no que segue. Estamos interessados em
entender como se distribui a sequencia zn no crculo.
Deni
c
ao 11.11. Dizemos que uma sequencia xn S 1 e equidistribuda se
para qualquer funcao contnua : S 1 R tem-se
1
(xj ) =
n n
j=1
n

lim


(x) dx.

Veremos no Exerccio 11.4 que isto equivale a dizer que, para todo intervalo
I S 1 , a fracao dos termos da sequencia que estao em I e igual ao comprimento
m(I) desse intervalo.
Teorema 11.12 (Weyl). Se algum dos coecientes a1 , a2 , . . . , ad e irracional
ent
ao a sequencia zn = {P (n)} e equidistribuda.
Podemos, sem restricao, supor que o coeciente ad e irracional. De fato, a
sequencia zn sempre pode ser decomposta numa soma
zn = xn + yn ,

xn = {ad nd },

yn = {Q(n)}

onde Q(x) = a0 + a1 x + + ad1 xd1 . Suponha que ad e racional, isto e, que


existem inteiros p e q tais que ad = p/q. Ent
ao a primeira parcela xn toma no
maximo q valores distintos. De fato esta sequencia e peri
odica com perodo q:
xn+p =

  p d
p
(n + q)d =
n = xn
q
q

para todo n Z.

Por outro lado, a segunda parcela yn e do mesmo tipo que zn , exceto que o
polin
omio Q que lhe esta associado tem grau d 1. Portanto, por inducao no
grau, podemos supor que yn e equidistribuda. Mais que isso, podemos supor
que as subsequencias
yqn+r = {Q(qn + r)}, n Z
sao equidistribudas para todo r {0, 1, . . . , q1}. Na verdade, estas sequencias
podem ser escritas como ynq+r = {Qr (n)} para algum polin
omio Qr com o
mesmo grau que Q (verique), e portanto a hip
otese de inducao se aplica a
elas tambem. Destas duas observacoes segue que a soma zn tambem e equidistribuda, porque cada uma das subsequencias zqn+r , n Z e equidistribuda.

11.2. TEOREMA DE WEYL

11.2.1

131

O caso am

Para desenvolvermos alguma intuicao sobre o problema, comecemos por considerar o caso especial d = 1. Neste caso a funcao polinomial resume-se a
P (x) = a0 + a1 x. Estamos supondo que o coeciente a1 e irracional. Consideremos a transformacao
f : S1 S1,

f () = + a1 mod Z.

Foi visto na Proposicao 3.6 que esta transformacao f admite uma u


nica probabilidade invariante, que e a medida de Lebesgue m. Consequentemente, dada
qualquer funcao contnua : S 1 R, e dado qualquer ponto S 1 ,
1
(f j ()) =
lim
n n
j=1
n


dm.

Considere = a0 mod Z. Ent


ao, f j () = a0 + a1 j mod Z = P (j) mod Z e
isto signica que podemos identicar zj = {P (j)} com a sequencia dos iterados
f j (a0 ). Ent
ao a relacao anterior d
a
1
(zj ) =
lim
n n
j=1
n


dm.

Isto e precisamente o que signica dizer que zj e equidistribuda.

11.2.2

Ergodicidade

Vamos estender os argumentos acima para provar o caso geral do Teorema 11.8.
Seja Td o toro d-dimensional, isto e,
Td = Rd /Zd = S 1 S 1

(d vezes).

Introduzimos a transformacao f : Td Td
f (1 , 2 , . . . , d ) = (1 + , 2 + 1 , . . . , d + d1 ),

(11.6)

onde e um n
umero irracional que ser
a escolhido mais tarde. Observe que f
preserva a medida de Lebesgue m em Td . Isto pode ser visto usando as ideias
da Secao 2.2: a derivada de f em cada ponto vem dada pela matriz

1
0
0
0
0
1
1
0
0
0

0
1
1
0
0


0
0
0
1
1
cujo determinante e 1. Observe que a transformacao f e invertvel.

132

CAPITULO 11. APLICAC


OES
EM TEORIA DOS NUMEROS

Proposi
c
ao 11.13. A transformac
ao f e erg
odica relativamente a
` medida de
Lebesgue no toro Td .
Demonstraca
o. O metodo e analogo ao da Proposicao 5.5, baseado em an
alise
de Fourier. Seja : Td R uma funcao em L2 (m). Escrevemos

() =
an e2in
nZd

onde = (1 , . . . , d ), n = (n1 , . . . , nd ), n = n1 1 + + nd d , e


|an |2 = |()|2 d1 dd < .

(11.7)

nZd

Suponhamos que a funcao e invariante, isto e, f = em quase todo ponto.


Observe que

an e2i(n1 (1 +)+n2 (2 +1 )+nd (d +d1 ))
(f ()) =
nZd

an e2in1 e2iL(n)

nZd

onde L(n) = (n1 + n2 , n2 + n3 , . . . , nd1 + nd , nd ). Portanto, a relacao de


invari
ancia f = se traduz por
an e2in1 = aL(n)

para todo n Zd .

(11.8)

Isto implica que an e aL(n) tem o mesmo valor absoluto. Por outro lado, a
relacao de integrabilidade (11.7) implica que existe no maximo um n
umero nito
de termos com um dado valor absoluto n
ao-nulo. Conclumos que an = 0 para
todo n Zd cuja orbita Lj (n), j Z seja innita. Observando a expressao de
L deduzimos que an = 0 exceto, possivelmente, se n2 = = nd = 0. Alem
disso, para os valores de n restantes, ou seja, para n = (n1 , 0, . . . , 0), tem-se que
L(n) = n e portanto a relacao (11.8) torna-se
an = an e2in1 .
Como e irracional, o u
ltimo fator e diferente de 1 sempre que n1 e nao-nulo.
Portanto esta relacao d
a que an = 0 tambem para n = (n1 , 0, . . . , 0) com n1 = 0.
Deste modo, mostramos que se e uma funcao invariante ent
ao todos os termos
da sua expans
ao de Fourier se anulam exceto, possivelmente, o termo constante.
Isto mostra que e constante, e isso prova que f e ergodica.

11.2.3

Unicidade erg
odica

O pr
oximo passo da demonstracao do Teorema 11.12 e a seguinte
Proposi
c
ao 11.14. A transformac
ao f e unicamente erg
odica, isto e, a medida
de Lebesgue no toro e a sua u
nica medida invariante.

11.2. TEOREMA DE WEYL

133

Demonstrac
ao. A demonstracao ser
a por inducao no grau d do polin
omio P . O
caso de grau 1 j
a foi tratado na Secao 11.2.1, portanto s
o precisamos explicar
como o caso de grau d pode ser deduzido do caso de grau d 1. Para isso,
escrevemos Td = Td1 S 1 e
f : Td1 S 1 Td1 S 1

f (0 , ) = (f0 (0 ), + d1 )

(11.9)

onde 0 = (1 , . . . , d1 ) e f0 (0 ) = (1 + , 2 + 1 , . . . , d1 + d2 ). Vamos
representar por : Td Td1 a projecao () = 0 . Por inducao, a transformacao
f0 : Td1 Td1
e unicamente erg
odica. Para mostrar que f e unicamente erg
odica so precisamos
mostrar que a medida de Lebesgue m e a sua u
nica probabilidade invariante
erg
odica.
Lema 11.15. Se e uma probabilidade invariante por f ent
ao a projec
ao
coincide com a medida de Lebesgue m0 em Td1 .
Demonstrac
ao. Dado qualquer conjunto mensur
avel E Td1 ,
( )(f01 (E)) = ( 1 f01 (E)).
Usando f = f0 e o fato de que e f -invariante, se verica que a expressao
do lado direito e igual a
(f 1 1 (E)) = ( 1 (E)) = ( )(E).
Portanto ( )(f01 (E)) = ( )(E) para todo subconjunto mensur
avel E, ou
seja, e probabilidade f0 -invariante. Como supomos que f0 e unicamente
erg
odico, segue que coincide com a medida de Lebesgue m0 em Td1 .
Agora suponhamos que e ergodica. Pelo Teorema de Birkho 4.2, o conjunto G dos pontos Td tais que
lim


n1
1
(f j ()) = d para toda funcao contnua : Td R (11.10)
n j=0

tem medida total. Seja G0 () o conjunto dos 0 Td1 tais que G() intersecta
claro que 1 (G0 ()) contem
{0 }S 1 . Em outras palavras, G0 () = (G ). E
G e portanto tem medida igual a 1. Logo, usando o Lema 11.15,
m0 (G0 ()) = ( 1 (G0 ())) = 1.
Em particular, isto vale para a medida de Lebesgue:
m0 (G0 (m)) = m( 1 (G0 (m))) = 1.
Uma consequencia direta destas relacoes e que a interseccao de G0 () e G0 (m)
ao podem ser disjuntos. Seja
tem medida m0 total e, portanto, estes conjuntos n
0 um ponto qualquer na interseccao. Por denicao, G() intersecta {0 } S 1 .
Mas o pr
oximo resultado arma que G(m) contem {0 } S 1 :

134

CAPITULO 11. APLICAC


OES
EM TEORIA DOS NUMEROS

ao {0 } S 1 est
a contido em G(m).
Lema 11.16. Se 0 G0 (m) ent
Demonstrac
ao. A observacao crucial e que a medida m e invariante por toda a
transformacao da forma
R : Td1 S 1 Td1 S 1 ,

(, )  (, + ).

A hip
otese 0 G0 (m) signica que existe algum S 1 tal que (0 , ) G(m),
ou seja,

n1
1
(f j (0 , )) = dm
lim
n j=0
para toda funcao contnua : Td R. Qualquer outro ponto de {0 } S 1
pode ser escrito como (0 , + ) = R (0 , ) para algum S 1 . Recordando
(11.6), vemos que




f R (0 , ) = (1 + , 2 + 1 , . . . , d1 + d2 , + + d1 ) = R f (0 , )
para todo (0 , ) Td1 S 1 . Logo, por inducao,




f j (0 , + ) = f j R (0 , ) = R f j (0 , )
para todo j 1. Portanto, dada qualquer funcao contnua : Td R,
lim

n1
n1
1
1
(f j (0 , + )) = lim
( R )(f j (0 , ))
n j=0
n j=0


= ( R ) dm = dm.

Isto prova que (0 , + ) esta em Gm para todo S 1 , conforme armado.


Segue do que dissemos ate agora que G() e G(m) se intersectam em algum
ponto de {0 } S 1 . Tendo em vista a denicao (11.10), isto implica que as
duas medidas tem a mesma integral para cada funcao contnua. De acordo
com o Teorema de Riesz-Markov 3.7, isto implica que = m, como queramos
demonstrar.
Corol
ario 11.17. A
orbita de todo ponto Td e equidistribuda no toro: para
toda funca
o contnua : Td R tem-se
lim


n1
1
(f j ()) = dm.
n j=0

Demonstrac
ao. Isto e uma consequencia imediata da Proposicao 11.14 e da
Proposicao 3.7.

11.2. TEOREMA DE WEYL

11.2.4

135

Demonstra
c
ao do Teorema de Weyl

Para completarmos a demonstracao do Teorema 11.12, introduzimos os polin


omios denidos por pd (x) = P (x) e
pj1 (x) = pj (x + 1) pj (x)
Lema 11.18.

for j = 2, . . . , d.

(11.11)

1. O polin
omio pj (x) tem grau j, para todo 1 j d.

2. p1 (x) = x + onde = ad d! e irracional.


Deixamos a demonstracao deste lema para o Exerccio 11.5.
Lema 11.19. Para todo n 0,

 

f n p1 (0), p2 (0), . . . , pd (0) = p1 (n), p2 (n), . . . , pd (n) .
Demonstraca
o. A demonstracao ser
a por inducao em n. Como o caso n = 0 e
bvio, s
o
o precisamos tratar do passo indutivo. Lembre que f foi denida em
(11.6). Se
f n1 (p1 (0), p2 (0), . . . , pd (0)) = (p1 (n 1), p2 (n 1), . . . , pd (n 1))
ent
ao f n (p1 (0), p2 (0), . . . , pd (0)) e igual a
(p1 (n 1) + , p2 (n 1) + p1 (n 1), . . . , pd (n 1) + pd1 (n 1)).
Usando a denicao (11.11) e o Lema 11.18, obtemos que esta express
ao e igual
a
(p1 (n), p2 (n), . . . , pd (n)),
e isto prova o lema.
Finalmente, estamos prontos para provar que a sequencia zn = {P (n)} e
equidistribuda, conforme arma o Teorema 11.12. Seja : S 1 R uma funcao
contnua qualquer. Considere : Td R denida por
(1 , 2 , . . . , d ) = (d ).
Fixemos = (p1 (0), p2 (0), . . . , pd (0)). Usando o Lema 11.19 e o Corolario 11.17,
lim



n1
n1
1
1
(zn ) = lim
(f n ()) = dm = dx.
n j=0
n j=0

Isto termina a demonstracao do Teorema 11.12.

136

11.3

CAPITULO 11. APLICAC


OES
EM TEORIA DOS NUMEROS

Exerccios

11.1. Prove que


1. Di (S) = Ds (Z \ S) para qualquer subconjunto S de Z.
ao
2. Se S1 , S 2, . . . , SN e uma particao de Z ent
Ds (S1 ) + Ds (S2 ) + + Ds (SN ) 1.
11.2. Deduza o Teorema 11.9 a partir do Teorema 11.7.
11.3. Mostre que dadas quaisquer transformacoes contnuas fi : M M ,
i = 1, 2, . . . , k num espaco metrico compacto M , tais que fi fj = fj fi para
todo i, j = 1, 2, . . . , k, existe alguma medida de probabilidade que e invariante
por todas essas transformacoes.
11.4. Mostre que uma sequencia xn e equidistribuda se e somente se, dado
qualquer intervalo I [0, 1], tem-se
lim

1
#{j = 1, 2, . . . , n : xj I} = m(I)
n

onde m representa a medida de Lebesgue em [0, 1].


11.5. Demonstre o Lema 11.18.
11.6. Sejam fi : M M , i = 1, 2, . . . , k transformacoes que preservam uma
probabilidade em M e tais que fi fj = fj fi para todo i, j = 1, 2, . . . , k.
Ent
ao, para qualquer conjunto E M tal que (E) > 0, e para quase todo
n
x E existe uma sequencia nj tal que fi j (x) E para todo i = 1, . . . , k
e todo j 1.

Captulo 12

Resultados em Teoria
Erg
odica Diferenci
avel
12.1

Fluxos geod
esicos

12.2

Hiperbolicidade n
ao-uniforme

Nesta secao enunciar sem provas alguns resultados centrais da Teoria Erg
odica
diferenci
avel. Para os interessados em suas provas, recomendamos a leitura de
[Ma
n87].
Deni
c
ao 12.1. Seja f : M d M d um difeomorsmo da variedade M . Um
ponto x M e dito regular se existe n
umeros 1 < 2 < l (x) e uma
decomposicao E1 (x) El (x) = Tx M tal que em cada subespaco Ei vale:
1
log Df n (x)v = i (x),
n n
lim

para todo v Ei (x).


Denotaremos por o conjunto dos pontos regulares. O n
umeros i (x) sao
chamados os expoentes de Lyapunov de x e dimEi (x) e a multiplicidade de i (x).
Observe que se x e regular, ent
ao f n (x) e regular e seus expoentes coincidem
com os expoentes de x. Para ver isso, basta denir Ei (f n (x)) = Df n (x)Ei (x).
Vale o seguinte teorema:
Teorema 12.2 (Oseledets). Seja f um difeomorsmo C 1 de uma variedade
compacta M . Ent
ao () = 1 para toda medida invariante . Ou seja, o
conjunto dos pontos regulares e um conjunto com medida total. Alem disso:
ao constantes para -quase
1. Se e erg
odica, ent
ao l(x) e 1 (x), . . . , l (x) s
todo ponto x M.
137

138CAPITULO 12. RESULTADOS EM TEORIA ERGODICA


DIFERENCIAVEL
2.

log | det Df (x)|d(x) =

l


(x)i (x)d(x).

i=0

Deniremos a funcao : R por



(x) =
lim i (x)dimEi (x).
i (x)>0

Ent
ao,
Teorema 12.3 (desigualdade de Ruelle). Se e uma medida invariante
para um difeomorsmo (ou endomorsmo) C 1 de uma variedade compacta M ,
ent
ao:

h (f ) (x)d(x).
Teorema 12.4 (f
ormula de Pesin). Se e uma medida invariante absolutamente contnua com respeito a
` medida de Lebesgue para um difeomorsmo (ou
ao:
endomorsmo) C 1+ de uma variedade compacta M , ent

h (f ) = (x)d(x).

12.3

Exerccios

Bibliograa
[BK83]

M. Brin and A. Katok. On local entropy. In Geometric dynamics


(Rio de Janeiro, 1981), volume 1007 of Lecture Notes in Math., pages
3038. Springer, 1983.

[Cas04] A. A. Castro. Teoria da medida. Projeto Euclides. IMPA, 2004.


[ET36]

P. Erd
os and P. Tur
an. On some sequences of integers. J. London.
Math. Soc., 11:261264, 1936.

[Fal90]

K. Falconer. Fractal geometry. John Wiley & Sons Ltd., 1990. Mathematical foundations and applications.

[Fer02]

R. Fernandez. Introduca
o `
a teoria da medida. Projeto Euclides. IMPA,
2002.

[Fur77]

H. Furstenberg. Ergodic behavior and a theorem of Szemeredi on


arithmetic progressions. J. dAnalyse Math., 31:204256, 1977.

[Fur81]

H. Furstenberg. Recurrence in ergodic theory and combinatorial number theory. Princeton Univertsity Press, 1981.

[Ma
n87] R. Ma
ne. Ergodic theory and dierentiable dynamics. Springer Verlag,
1987.
[Orn70] D. Ornstein. Bernoulli shifts with the same entropy are isomorphic.
Advances in Math., 4:337352 (1970), 1970.
[Rok66] V.A. Rokhlin. Selected topics from the metric theory of dynamical
systems. A. M. S. Transl., 49:171240, 1966. Transl. from Uspekhi
Mat. Nauk. 4 - 2 (1949), 57128.
[Rud87] W. Rudin. Real and complex analysis. McGraw-Hill, 3 edition, 1987.
[Sze75]

S. Szemeredi. On sets of integers containing no k elements in arithmetic progression. Acta Arith., 27:199245, 1975.

[vdW27] B. van der Waerden. Beweis eibe Baudetschen Vermutung. Nieuw


Arch. Wisk., 15:212216, 1927.
139

140

BIBLIOGRAFIA

[Wey16] H. Weyl. Uber die Gleichverteilungen von Zahlen mod Eins. Math.
Ann., 77:313352, 1916.

Você também pode gostar