Escolar Documentos
Profissional Documentos
Cultura Documentos
Sistemas dinâmicos
Há várias definições, mais ou menos gerais, do que é um sistema dinâmico. Nós
nos restringiremos a dois modelos principais. O primeiro deles, ao qual nos
referiremos na maior parte do tempo, são as transformações f : M → M em
algum espaço métrico ou topológico M . Heuristicamente, pensamos em f como
associando a cada estado x ∈ M do sistema o estado f (x) ∈ M em que o sistema
se encontrará uma unidade de tempo depois. Trata-se portanto de um modelo
de dinâmica com tempo discreto.
Também consideraremos fluxos, que são modelos de sistemas dinâmicos a
tempo contı́nuo. Lembre que um fluxo em M é uma famı́lia f t : M → M , t ∈ R
de transformações satisfazendo
f 0 = identidade e f t ◦ f s = f t+s para todo t, s ∈ R. (1)
Fluxos aparecem, por exemplo, associados a equações diferenciais: tome como
f t a transformação que associa a cada ponto x o valor no tempo t da solução
da equação que passa por x no tempo zero.
Num caso e no outro, sempre iremos supor que o sistema dinâmico é pelo
menos mensurável: na maior parte dos casos será até contı́nuo, ou mesmo difer-
enciável.
Medidas invariantes
Sempre consideraremos medidas µ definida na σ-álgebra de Borel do espaço M .
Dizemos que µ é uma probabilidade se µ(M ) = 1. Na maior parte dos casos
trataremos com medidas finitas, isto é, tais que µ(M ) < ∞. Neste caso sempre
podemos transformar µ numa probabilidade ν: para isso basta definir
µ(E)
ν(E) = para cada conjunto mensurável E ⊂ M.
µ(M )
iv
1 2
Krerley Oliveira e Marcelo Viana
5 Ergodicidade 43
5.1 Exemplos e aplicações . . . . . . . . . . . . . . . . . . . . . . . . 44
5.2 Equivalência Espectral . . . . . . . . . . . . . . . . . . . . . . . 51
5.3 Propriedades de medidas ergódicas . . . . . . . . . . . . . . . . . 54
viii CONTEÚDO
6 Sistemas Misturadores 67
6.1 Definições e exemplos . . . . . . . . . . . . . . . . . . . . . . . . 67
6.2 Deslocamentos de Markov . . . . . . . . . . . . . . . . . . . . . . 69
6.3 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
7 Entropia Métrica 77
7.1 Entropia de uma partição . . . . . . . . . . . . . . . . . . . . . . 77
7.2 Entropia de um sistema ergódico . . . . . . . . . . . . . . . . . . 80
7.3 Teorema de Kolmogorov-Sinai . . . . . . . . . . . . . . . . . . . . 83
7.4 Equivalência ergódica . . . . . . . . . . . . . . . . . . . . . . . . 83
7.5 Equivalência Espectral . . . . . . . . . . . . . . . . . . . . . . . . 84
7.6 A entropia como invariante . . . . . . . . . . . . . . . . . . . . . 85
7.7 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
8 Entropia Topológica 89
8.1 Definição via coberturas . . . . . . . . . . . . . . . . . . . . . . . 89
8.2 Definição via conjuntos geradores . . . . . . . . . . . . . . . . . . 91
8.3 Entropia de fluxos . . . . . . . . . . . . . . . . . . . . . . . . . . 92
8.4 Pressão topológica . . . . . . . . . . . . . . . . . . . . . . . . . . 93
8.5 Princı́pio variacional . . . . . . . . . . . . . . . . . . . . . . . . . 94
8.6 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
9 Transformações Expansoras 97
9.1 Lema de distorção . . . . . . . . . . . . . . . . . . . . . . . . . . 98
9.2 Medidas absolutamente contı́nuas . . . . . . . . . . . . . . . . . . 100
9.3 Existência de medidas ergódicas . . . . . . . . . . . . . . . . . . . 101
9.4 Unicidade e conclusão da prova . . . . . . . . . . . . . . . . . . . 102
9.5 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Elementos de Teoria da
Medida
Definição 0.7. Uma medida num espaço mensurável (M, B) é uma função
µ : B → [0, +∞] que satisfaz:
1. µ(∅) = 0;
∞ ∞
2. µ( j=1 Aj ) = j=1 µ(Aj ) para quaisquer Aj ∈ B disjuntos dois-a-dois.
N
N
µ( Aj ) = µ(Aj )
j=1 j=1
1 , se p ∈ A
δp (A) = .
0 , se p ∈ /A
Temos que δp é uma medida, que é usualmente designada por delta de Dirac no
ponto p.
n
lim µ0 ( Aj ) = 0 (1)
n→∞
j=1
O resultado seguinte nos diz que todo o elemento B da σ-álgebra gerada por
uma álgebra é aproximado por algum elemento B0 da álgebra, no sentido em
que a medida da diferença simétrica B∆B0 = B \ B0 ∪ B0 \ B é pequena.
Teorema 0.11 (Aproximação). Seja (M, B, µ) um espaço de probabilidade e
seja B0 uma álgebra que gera a σ-álgebra B. Então para todo o ε > 0 e todo
B ∈ B existe B0 ∈ B0 tal que µ(B∆B0 ) < ε.
Observe que µφ é aditiva e com o auxı́lio dos Teoremas 0.10 e 0.9 podemos
estender µφ para toda σ-álgebra dos Borelianos de [0, 1]. A medida µφ tem
a seguinte propriedade especial: se um conjunto A ⊂ [0, 1] tem medida de
Lebesgue 0 então µφ (A) = 0. Essa propriedade nos diz que µφ é absolutamente
contı́nua com respeito à medida de Lebesgue. A densidade de µφ em relação a
m é igual a φ. Estudaremos tais medidas com mais detalhes na Secção 0.3.2.
Exemplo 0.14. Vamos agora exibir uma medida que, apesar de ser positiva
em qualquer aberto, não é absolutamente contı́nua com respeito a medida de
Lebesgue. Para isso, considere uma enumeração {r1 , r2 , . . . } do conjunto Q dos
racionais. Defina µ por:
1
µ(A) = .
2i
ri ∈A
[m; am , . . . , an ] = {(xi )∞
i=−∞ ∈ M : xm = am , . . . , xn = an }
k
s= αk XAk ,
j=1
Definição 0.19. Seja s uma função simples da forma acima. Então a integral
de s em relação a µ é dado por:
k
s dµ = αk µ(Ak ).
j=1
Definição 0.23. Dizemos que uma função é integrável se for mensurável e tiver
integral finita. Denotamos o conjunto das funções integráveis por L1 (M, B, µ)
ou, mais simplesmente, por L1 (M, µ).
m
Notemos que µ = i=1 pi δxi , onde δxi é a medida delta de Dirac em xi . Neste
caso temos que se f é uma função integrável então
m
f dµ = f (xi )pi .
i=1
0.3. INTEGRAÇÃO EM ESPAÇOS DE MEDIDA 9
µ(B(a, ε) ∩ A)
lim = 1. (2)
ε→0 µ(B(a, ε)
0.4 Exercı́cios
0.1. Seja M um conjunto e, para cada i pertencente a um conjunto de ı́ndices
I, seja Bi uma σ-álgebra de subconjuntos de M . Mostre que
B= Bi
i∈I
é uma σ-álgebra.
0.2. Seja M um conjunto e considere a famı́lia de conjuntos
B0 = {A ⊂ M : A é finito ou Ac é finito}.
Mostre que B0 é uma álgebra. Além disso, B0 é uma σ-álgebra se e somente se
o conjunto M é finito.
0.3. Seja M um conjunto e considere a seguinte famı́lia de conjuntos
B1 = {A ⊂ M : A é finito ou enumerável ou Ac é finito ou enumerável}.
Mostre que B1 é uma σ-álgebra. De fato, B1 é a σ-álgebra gerada pela álgebra
B0 do Exercı́cio 0.2.
0.4. Seja E uma famı́lia de subconjuntos de um conjunto M . Mostre que existe
a menor álgebra B0 que contém E. Que relação existe entre B0 e a σ-álgebra B
gerada por E?
0.5. Seja (M, B, µ) um espaço de medida. Mostre que se A1 ,A2 , . . . estão em B
então ∞ ∞
µ( Aj ) ≤ µ(Aj ).
j=1 j=1
0.4. EXERCÍCIOS 11
#A , se A é finito
µ(A) = .
∞ se A é infinito
0 se A é finito ou enumerável
µ(A) =
1 se Ac é finito ou enumerável
é uma medida de probabilidade.
Teorema de Recorrência de
Poincaré
valores de n ≥ 1 tais que f n (x) ∈ E. Observe que o conjunto dos pontos que
regressam a E apenas um número finito de vezes é precisamente
∞
Ek .
k=1
Portanto, para provar o corolário, basta mostrar que µ(Ek ) = 0 para todo k ≥ 1.
A demonstração será por contradição.
Suponhamos que µ(Ek ) > 0 para algum k ≥ 1. Então, aplicando o Teo-
rema 1.1 com este Ek no lugar de E, obtemos que quase todo ponto x ∈ Ek tem
algum iterado f n (x) que está em Ek . Fixemos um tal x e denotemos y = f n (x).
Por definição, y tem exatamente k iterados futuros que estão em E. Como y é
um iterado de x, isso implica que x tem k + 1 iterados futuros em E. Mas isso
contradiz o fato de que x ∈ Ek . Esta contradição prova que Ek tem medida
nula, relativamente a µ, e portanto o corolário está demonstrado.
Vamos agora dar a
Demonstração do Teorema 1.1. Representemos por E 0 o conjunto dos pontos
x ∈ E que nunca regressam a E. O nosso objetivo é provar que E 0 tem medida
nula. Para isso, começamos por afirmar que as suas pré-imagens f −n (E 0 ) são
disjuntas duas-a-duas. De fato, suponhamos que existem m > n ≥ 1 tais que
f −m (E 0 ) intersecta f −n (E 0 ). Seja x um ponto na intersecção e seja y = f n (x).
Então y ∈ E 0 e f m−n (y) = f m (x) ∈ E 0 , que está contido em E. Isto quer
dizer que y volta pelo menos uma vez a E, o que contradiz a definição de E 0 .
Esta contradição, prova que as pré-imagens são disjuntas duas-a-duas, como
afirmamos.
Isto implica que
∞ ∞ ∞
−n 0
−n 0
µ f (E ) = µ(f (E )) = µ(E 0 ).
n=0 n=0 n=0
{Uk : k ∈ N} de abertos tal que todo aberto de M pode ser escrito como
união de elementos Uk dessa famı́lia. Esta hipótese é satisfeita na maioria dos
exemplos interessantes.
Teorema 1.3. Suponhamos que M admite uma base enumerável de abertos.
Seja f : M → M uma transformação mensurável e µ uma medida invariante
finita. Então, µ-quase todo ponto x ∈ M é recorrente para f .
Demonstração. Para cada k representamos por Uk0 o conjunto dos pontos x ∈ Uk
que nunca regressam a Uk . De acordo com o Teorema 1.1, todo Uk0 tem medida
nula. Consequentemente, a união enumerável
Ũ = Uk0
k∈N
tem medida nula. Portanto, para demonstrar o teorema será suficiente que
mostremos que todo ponto x que não está em Ũ é recorrente. Isso é fácil, como
vamos ver.
Seja x ∈ M \ Ũ e seja U uma vizinhança qualquer de x. A definição de
base de abertos implica que existe algum k ∈ N tal que x ∈ Uk e Uk ⊂ U .
Como x não está em Ũ , também x ∈ / Uk0 . Em outras palavras, x tem algum
iterado f (x), n ≥ 1 que está em Uk . Em particular, f n (x) também está em
n
1.4 Exercı́cios
1.1. Mostre que o seguinte enunciado é equivalente ao Teorema 1.1, isto é,
qualquer um dos dois pode ser deduzido a partir do outro: Seja f : M → M
16 CAPÍTULO 1. TEOREMA DE RECORRÊNCIA DE POINCARÉ
Exemplos de Medidas
Invariantes
onde φn é uma sequência de funções simples crescendo para φ. Por outro lado,
φn ◦ f é uma sequência de funções simples crescendo para φ ◦ f . Logo,
φ ◦ f dµ = lim φn ◦ f dµ.
n→∞
Como φn dµ = φn ◦ f dµ, tomando o limite em ambos os lados, vem que
φ dµ = φ ◦ f dµ.
18 CAPÍTULO 2. EXEMPLOS DE MEDIDAS INVARIANTES
onde [10x] representa o maior inteiro menor ou igual a 10x. Em outras palavras,
f associa a cada x ∈ [0, 1] a parte fracionária de 10x. O gráfico da transformação
f está descrito na Figura 2.1.
x = 0, a0 a1 a2 a3 · · ·
f (x) = 0, a1 a2 a3 · · · .
Com isso, fica muito fácil escrever a expressão do iterado n-ésimo, para qualquer
n ≥ 1:
f n (x) = 0, an an+1 an+2 · · · (2.1)
Agora, seja E o subconjunto dos x ∈ [0, 1] cuja expansão decimal começa
com o dı́gito 7, ou seja, tais que a0 = 7. De acordo com o Corolário 1.2, quase
todo elemento de E tem infinitos iterados que também estão em E. Levando
em conta a expressão (2.1), isto quer dizer que existem infinitos valores de n
tais que an = 7. Portanto, provamos que quase todo número x cuja expansão
decimal começa por 7 tem infinitos dı́gitos iguais a 7!
Claro que no lugar de 7 podemos considerar qualquer outro dı́gito. Além
disso, podemos considerar blocos de dı́gitos mais complicados. Veja os Ex-
ercı́cios 2.2–2.3.
Mais tarde iremos provar resultados mais fortes: para quase todo número
x ∈ [0, 1], todo dı́gito aparece com frequência 1/10 na sua expansão decimal.
O enunciado preciso aparecerá na Proposição 5.2, que será provada a partir do
teorema ergódico de Birkhoff.
Denotando E = f (U ), isto implica que vol(E) > vol(f −1 (E)) e, portanto, f não
deixa invariante o volume. Do mesmo modo se mostra que se o valor absoluto
do jacobiano é menor que 1 em algum ponto então f não deixa invariante o
volume.
Os Exercı́cios 2.4–2.5 estendem este lema para transformações não necessari-
amente invertı́veis e também para uma classe mais ampla de medidas. As suas
conclusões nos serão úteis mais tarde.
Agora vamos considerar o caso de fluxos f t : U → U , t ∈ R. Suporemos que
o fluxo é de classe C 1 . Claro que o Lema 2.3 se aplica neste contexto: o fluxo
deixa invariante o volume se e somente se
[k, l; ak , . . . , al ] = {α ∈ M : αk = ak , . . . , αl = al }
Verifica-se que esta função µ é, de fato, σ-aditiva em B0 ; por exemplo, isso pode
ser feito usando o Teorema 0.10. Portanto existe uma única probabilidade na
σ-álgebra B gerada por B0 que é uma extensão de µ, isto é, que coincide com
ela restrita a B0 . Chamamos essa probabilidade medida de Bernoulli definida
por p(1), p(2), . . . , p(d) e, para não complicar desnecessariamente a notação, a
representamos também por µ.
No espaço M consideramos a transformação deslocamento (“shift”) à es-
querda
f : M → M f (αn )n∈Z = (αn+1 )n∈Z
que corresponde a fazer uma translação no tempo. Observe que a medida de
Bernoulli é invariante por essa transformação. De fato, se E = [k, l; ak , . . . , al ]
então f −1 (E) = [k + 1, l + 1; ak , . . . , al ] e a definição (2.6) dá que
neste caso. Como a famı́lia dos cilindros gera a σ-álgebra B, isto juntamente
com o Lema 2.2, prova que a medida µ é invariante para f .
Note que G não está definida no ponto x = 0. Além disso, G(1/k) = 0 para
todo k ∈ N e portanto o segundo iterado G2 (1/k) não está definido nestes pontos
2.4. TRANSFORMAÇÃO DE GAUSS 23
...
(e o terceiro iterado não está definido nas suas pré-imagens, etc). Isto quer dizer,
a rigor, que G não é um sistema dinâmico segundo a definição que demos antes.
No entanto, isto não coloca nenhum problema para o que pretendemos fazer. De
fato, todos os iterados estão bem definidos no conjunto dos números irracionais:
basta observar que a imagem de um irracional também é irracional. Isto é
suficiente para os nossos objetivos porque sempre tratamos de propriedade que
valem para quase todo ponto, e o conjunto dos números irracionais tem medida
de Lebesgue total no intervalo.
O que torna esta transformação interessante do ponto de vista ergódico é que
G admite uma probabilidade invariante que é equivalente à medida de Lebesgue
no intervalo. De fato, considere a medida definida por
c
µ(E) = dx para cada mensurável E ⊂ [0, 1]
E 1+x
onde c é uma constante positiva. Note que a integral está bem definida, já que
a função integranda é contı́nua no intervalo [0, 1]. Note também que
c
m(E) ≤ µ(E) ≤ cm(E) para todo mensurável E ⊂ [0, 1].
2
Em particular, µ é de fato equivalente à medida de Lebesgue m: as duas medidas
têm os mesmos conjuntos com medida nula.
Proposição 2.5. A medida µ é invariante por G. Além disso, se escolhermos
c = 1/log2 então µ é uma probabilidade.
Demonstração. Vamos usar o critério dado pelo exercı́cio 2.5: a medida µ é
invariante por G se tivermos
ρ(x) c
= ρ(y) onde ρ(x) = (2.7)
|G (x)| 1+x
x∈f −1 (y)
24 CAPÍTULO 2. EXEMPLOS DE MEDIDAS INVARIANTES
para todo y. Comece por observar que cada y tem exatamente uma pré-imagem
xk em cada intervalo (1/(k + 1), 1/k], dada por
1 1
G(xk ) = −k =y ⇔ xk = .
xk y+k
Note também que G (x) = (1/x) = −1/x2 . Portanto, (2.7) se reescreve como
∞
∞
cx2k c 1 c
= ⇔ = (2.8)
1 + xk 1+y (y + k)(y + k + 1) 1+y
k=1 k=1
Isto quer dizer que a última soma em (2.8) pode ser escrita na forma teles-
cópica: todos os termos, exceto o primeiro, aparecem duas vezes, com sinais
contrários, e portanto se cancelam. Logo a soma é igual ao primeiro termo, que
é precisamente o que se afirma em (2.8). Isto prova a invariância.
Finalmente, usando a primitiva c log(1 + x) da função ρ(x) vemos que
1
c
µ([0, 1]) = dx = c log 2.
0 1+x
1
x0 = .
a1 + x1
Agora, supondo que x1 seja diferente de zero, podemos repetir o processo,
definindo
1 1
a2 = e x2 = − a2 = G(x1 ).
x1 x1
Então
1 1
x1 = portanto x0 = .
a1 + x2 1
a1 +
a2 + x2
2.4. TRANSFORMAÇÃO DE GAUSS 25
2.5 Exercı́cios
2.1. Demonstre o Lema 2.2. Dica: mostre que a famı́lia de todos os conjuntos
E tais que µ(E) = µ(f −1 (E)) é uma σ-álgebra.
2.2. Prove que, para quase todo número x ∈ [0, 1] cuja expansão decimal contém
o bloco 617 (por exemplo x = 0, 3375617264 · · · ), esse bloco aparece infinitas
vezes na expansão.
2.3. Prove que o dı́gito 7 aparece infinitas vezes na expansão decimal de quase
todo número x ∈ [0, 1]. Dica: Comece por mostrar que o conjunto dos números
cuja expansão decimal nunca exibe o dı́gito 7 tem medida nula.
2.4. Suponha que f : U → U é um difeomorfismo local (isto é: o seu jacobiano
é não nulo em todo ponto) de classe C 1 . Mostre que f deixa invariante o volume
se e somente se
1
= 1 para todo y ∈ U.
−1
| det Df (x)|
x∈f (y)
2.5. Dada uma função ρ : U → [0, ∞), denotamos por µ = ρ vol a medida
definida por µ(E) = E ρ d vol. Suponha que f : U → U é um difeomorfismo
local de classe C 1 e que ρ é uma função contı́nua. Mostre que f deixa invariante
a medida µ = ρ vol se e somente se
ρ(x)
= ρ(y) para todo y ∈ U.
−1
| det Df (x)|
x∈f (y)
Existência de Medidas
Invariantes
Mas a medida δ0 não é invariante por f : tomando E = {0} temos que E tem
medida 1 mas a sua pré-imagem f −1 (E) é o conjunto vazio, que tem medida
nula. Portanto, esta transformação também não tem nenhuma probabilidade
invariante.
O nosso terceiro exemplo é de natureza um pouco diferente. Consideremos
f : [0, 1] → [0, 1] dada por f (x) = x/2. Trata-se de uma transformação contı́nua
num espaço compacto. Logo, pelo teorema que iremos demonstrar, admite
alguma probabilidade invariante. Pelos mesmos argumentos que usamos no
caso anterior, se conclui que de fato há uma única probabilidade invariante, que
é a medida de Dirac δ0 suportada no ponto zero. Note que neste caso δ0 é de
fato invariante.
Mencionamos este último caso para enfatizar as limitações do Teorema de
Existência (que são inerentes à sua grande generalidade): as medidas que ele
garante existirem podem ser bastante triviais; por exemplo, neste caso quando
falamos de “quase todo ponto”estamos nos referindo apenas ao ponto x = 0. Por
isso, um objetivo importante é obter resultados mais sofisticados de existência
de medidas com propriedades adicionais que as tornem mais interessantes, por
exemplo serem equivalentes à medida de Lebesgue.
Então a topologia fraca∗ é definida estipulando que estes conjuntos V (µ, F, ε),
com F e ε variável, constituem uma base de vizinhanças da medida µ. O seguinte
lema deveria ajudar a compreender o significado desta topologia:
Lema 3.2. Uma sequência (µn )n∈N em M1 (M ) converge para uma medida
µ ∈ M1 (M ) na topologia fraca∗ se e somente se
φ dµn → φ dµ para toda função contı́nua φ : M → R.
Em particular, se o bordo de A tem medida zero, temos que lim µn (A) = µ(A).
n→∞
Como vale que µ(U ) = sup µ(K), onde o supremo é tomado sobre todos os
K
compactos K ⊂ U provamos o item (b). O item (a) é inteiramente análogo,
observando que µ(K) = inf µ(U ), onde o ı́nfimo é tomado sobre todos os abertos
U contendo K.
∞
ν ∈ B(µ, δ) ⇒ 2−n φn dµ − φn dν < δ
n=1
⇒ φnj dµ − φnj dν < 2nj δ para todo 1 ≤ j ≤ N
ε
⇒ ψj dµ − ψj dν < 2nj δ + < ε for all 1 ≤ n ≤ N,
2
e isto prova a nossa afirmação.
Resta provar que (M1 , fraca∗ ) é um espaço compacto. Na demonstração
vamos utilizar o seguinte resultado clássico, que diz que as integrais são os únicos
operadores lineares positivos no espaço das funções contı́nuas. Um operador
linear diz-se positivo se Φ(ϕ) > 0 para toda função φ positiva em todo ponto.
Uma demonstração deste resultado pode ser encontrada em [Rud87].
Teorema 3.7 (Riesz-Markov). Seja Φ : C 0 (M ) → R qualquer operador linear
positivo. Então existe uma única medida boreliana µ em M tal que
Φ(ϕ) = ϕ dµ para toda ϕ ∈ C 0 (M ).
Além disso, cada sequência (kjn+1 )j∈N pode ser escolhida como subsequência da
anterior (kjn )j∈N . Definamos j = kjj para cada j ∈ N. Por construção, a menos
32 CAPÍTULO 3. EXISTÊNCIA DE MEDIDAS INVARIANTES
de um número finito de termos, (j )j∈N é uma subsequência de cada uma das
(kjn )j∈N . Logo
φn dµnj → Φn para todo n ∈ N.
para todo j. Como φn dµj converge (para Φn ), seque que
lim sup ϕ dµj − lim inf ϕ dµj ≤ 2ε.
j j
Como ε é arbitrário, concluı́mos que limj ϕ dµj existe. Isto prova (3.3) quando
a função está na bola unitária. O caso geral reduz-se imediatamente a esse,
substituindo ϕ por ϕ/ϕ. Assim, completamos a prova de (3.3).
Finalmente, é claro que o operador Φ : C 0 (M ) → R definido por (3.3) é
linear e positivo: Φ(ϕ) ≥ min ϕ > 0 para todo função ϕ ∈ C 0 (M ) positiva em
todo ponto. Além disso, Φ(1) = 1. Logo, peloTeorema 3.7, existe alguma prob-
abilidade boreliana µ em M tal que Φ(ϕ) = ϕ dµ para toda função contı́nua
ϕ. Agora a igualdade em (3.3) pode ser reescrita
ϕ = lim ϕ dµj para toda ϕ ∈ C 0 (M ).
j
De acordo com o Lema 3.2, isto quer dizer que a subsequência (µj )j∈N converge
para µ na topologia fraca∗ . Isto completa a demonstração do Teorema 3.4.
Com efeito, podemos aproximar φ por uma sequência de funções simples φn com
φn ≤ φ. Observe que isso implica, em particular, que φn ◦ f ≤ φ ◦ f .
Observe que se χA é função caracterı́stica, então
−1
χA df∗ η = η(f (A)) = χA ◦ f dη.
1 j
n−1
µn = f ν (3.4)
n j=0 ∗
onde f∗j ν é a imagem de ν pelo iterado f j . Pelo Teorema 3.4, esta sequência
tem algum ponto de acumulação: existe alguma subsequência (nj )j∈N e alguma
probabilidade µ ∈ M1 (M ) tais que
nk −1
1
µ = lim µnk = lim f jν . (3.5)
k k nk j=0 ∗
Lema 3.10. Todo ponto de acumulação de uma sequência (µn )n∈N é uma prob-
abilidade invariante por f .
Demonstração. A partir de (3.5), e usando o Lema 3.9, obtemos que
nk −1 k −1
1 1 n 1
nk
f∗ µ = f∗ lim f∗j ν = lim f∗ f∗j ν = lim f∗j ν .
k nk k n k k nk
j=0 j=0 j=1
1 1 nk
Afirmamos que lim ν = 0 e lim f∗ ν = 0. A primeira afirmação é óbvia,
nk
k k nk
e para a segunda basta observar que
1 nk 1 1
f ν(E) = ν(f −nk (E)) ≤
nk ∗ nk nk
para todo conjunto mensurável E ⊂ F . Deste modo obtemos que
nk −1
1
f∗ µ = lim f jν = µ
k nk j=0 ∗
3.4 Exercı́cios
3.1. Prove a seguinte generalização do Lema 3.10: Seja f : M → M uma
transformação contı́nua num espaço compacto, ν uma probabilidade em M e
(In )n uma sequência de intervalos de números naturais tais que #In converge
para infinito quando n vai para infinito. Então qualquer ponto de acumulação
da sequência
1 j
µn = f∗ ν
#In
j∈In
3.2. Dizemos que uma sequência (µn )n∈N de probabilidades converge pontual-
mente (ou fortemente) para µ ∈ M1 (M )
1. Mostre que se (µn )n∈N converge pontualmente para µ então também con-
verge para µ na topologia fraca∗ . Mostre, através de um exemplo, que a
recı́proca é falsa.
2. Mostre que (µn )n∈N converge para µ na topologia fraca∗ se e somente se
µn (E) → µ(E) para todo conjunto mensurável E ⊂ M cujo bordo ∂E
satisfaz µ(∂E) = 0.
Dica para (2): Dado o mensurável
E e ε > 0 encontre funções contı́nuas ϕ1 e
ϕ2 tais que ϕ1 ≥ XE ≥ ϕ2 e ϕ1 dµ − ϕ2 dµ < ε.
3.3. Fixe um subconjunto enumerável denso F = {φn : n ∈ N} da bola unitária
de C 0 (M ). Mostre que uma sequência (µk )k∈N de probabilidades em M converge
na topologia fraca para alguma µ ∈ M1 (M ) se e somente se, para todo n ∈ N,
φn dµk converge para φn dµ.
1
n−1
j
ϕ̃(x) = lim ϕ(Rα (x))
n→∞ n
j=0
Teorema Ergódico de
Birkhoff
1
τn (E, x) = # j ∈ {0, 1, . . . , n − 1} : f j (x) ∈ E .
n
Observe que isto é o mesmo que
1
n−1
τn (E, x) = XE (f j (x)),
n j=0
Em geral, este limite pode não existir. Iremos ver um exemplo desse fato daqui
a pouco. No entanto, o teorema ergódico afirma que, relativamente a qualquer
probabilidade invariante, o limite realmente existe para quase todo ponto:
Teorema 4.1. Seja f : M → M uma transformação mensurável e µ uma
probabilidade invariante por f . Dado qualquer conjunto mensurável E ⊂ M ,
o tempo médio de permanência τ (E, x) existe em µ-quase todo ponto x ∈ M .
Além disso,
τ (E, x) dµ(x) = µ(E).
1 1
n−1
= lim XE (f j (x)) − XE (x) − XE (f n (x))
n→∞ n n
j=0
1
= τ (E, x) + lim XE (x) − XE (f n (x))
n→∞ n
1
τ (E, x) = lim sup # j ∈ {0, . . . , n − 1} : f j (x) ∈ E
n
1
τ (E, x) = lim inf # j ∈ {0, . . . , n − 1} : f j (x) ∈ E .
n
Note que, para todo x ∈ M ,
É claro que τ (E, x) é sempre maior ou igual que τ (E, x). Portanto, para mostrar
(4.3) será suficiente que provemos
τ (E, x) dµ(x) ≤ µ(E) ≤ τ (E, x) dµ(x). (4.4)
1
# j ∈ {0, . . . , t − 1} : f j (x) ∈ E ≥ τ (E, x) − ε. (4.5)
t
Representaremos por t(x) o menor inteiro com esta propriedade. Para tornar a
demonstração mais transparente, consideraremos primeiro o caso particular em
que a função x → t(x) é limitada, isto é,
Caso particular: Existe T ∈ N tal que t(x) ≤ T para todo x ∈ M .
Dado qualquer x ∈ M , definimos uma sequência x0 , x1 , . . . , xs de pontos em
M e uma sequência t0 , t1 , . . . , ts de números naturais, do seguinte modo:
1. Primeiramente, tomamos x0 = x.
t0 + t1 + · · · + ts−1 ≥ n − ts ≥ n − T.
Deste modo, mostramos que pelo menos (n − T )(τ (E, x) − ε) dos n primeiros
iterados de x estão em E. Em outras palavras,
n−1
XE (f j (x)) ≥ (n − T )(τ (E, x) − ε) (4.7)
j=0
n−1
XE (f j (x)) dµ(x) ≥ (n − T ) τ (E, x) dµ(x) − (n − T )ε.
j=0
Todas as parcelas no membro da esquerda são iguais a µ(E), uma vez que a
probabilidade µ é invariante por f . Portanto, esta desigualdade pode ser escrita
como
nµ(E) ≥ (n − T ) τ (E, x) dµ(x) − (n − T )ε.
A vantagem é que (4.8) é válida também para os valores de i aos quais se aplica
a regra 2b. De fato, nesse caso tem-se ti = 1, o membro da esquerda é maior ou
igual que zero e o membro da direita é menor que zero, uma vez que τ (E, x) é
sempre menor ou igual que 1. Isso significa que, no lugar de (4.7), tem-se
n−1
n−1
XE (f j (x)) ≥ (n − T )(τ (E, x) − ε) − XB (f j (x)).
j=0 j=0
4.3 Exercı́cios
4.1. Considere a transformação f : M → M , f (x) = 10x − [10x] introduzida
na seção 2.1. Considere
x = 0, 335533335555555533333333333333335 . . ..
4.2. Mostre que, para qualquer função integrável ϕ, a média temporal ϕ̃ satisfaz
ϕ̃ ◦ f = ϕ̃ em µ-quase todo ponto.
Capı́tulo 5
Ergodicidade
para quase todo x ∈ M . Por outro lado, como A é invariante, temos que x ∈ A
se e somente se f (x) ∈ A. Isto implica que ϕ(f j (x)) = ϕ(x) para todo j ≥ 0 e
para todo x. Portanto,
ϕ̃(x) = ϕ(x) = XA (x)
para todo x ∈ M . Como a função caracterı́stica só toma os valores 0 e 1, estas
duas igualdades implicam que µ(A) = 0 ou µ(A) = 1, como é afirmado em (2).
44 CAPÍTULO 5. ERGODICIDADE
(2) implica (3): Seja ψ uma função invariante qualquer. Então, a pré-
imagem ψ −1 (I) de qualquer intervalo I ⊂ R é um conjunto invariante. Portanto,
pela hipótese (2), essa pré-imagem tem medida zero ou um. Como o intervalo
I é qualquer, isto prova que ψ é constante num conjunto com probabilidade µ
total.
(3) implica (1): Seja ϕ uma função integrável qualquer. Como vimos no
exercı́cio 4.2, a média temporal ϕ̃ é uma função invariante. Logo, pela hipótese
(3), ϕ̃ é constante em quase todo ponto. Então, usando o teorema ergódico,
ϕ̃(x) = ϕ̃ dµ = ϕ dµ
µ(I ∩ A)
lim inf : I ⊂ (a − ε, a + ε) intervalo contendo a = 1 . (5.1)
ε→0 µ(I)
Observe também que cada f k é uma bijeção afim de Ik sobre o intervalo (0, 1).
Isso tem a seguinte consequência, que é crucial para o nosso argumento:
Juntando as relações (5.3), (5.4), (5.5), concluı́mos que |µ(A) − µ(A)2 | < 4ε.
Como ε é arbitrário, deduzimos que µ(A) = µ(A)2 e então, do mesmo modo que
antes, concluı́mos que µ(A) = 0 ou µ(A) = 1.
Demonstração. Pela proposição 5.1, basta mostrar que toda função integrável
ϕ que é invariante é constante em µ-quase todo ponto. Observe que se ϕ é
integrável, então automaticamente ϕ ∈ L2 (µ) (verifique! Utilize que µ é finita).
1 Quando lidamos com L2 (µ) sempre identificamos funções que diferem apenas num con-
Usando a expansão de Fourier ϕ(z) = k∈Z ck z k , a condição de ser invariante
ϕ ◦ Rα = ϕ se escreve
ck ekiα z k = ck z k
k∈Z k∈Z
µ(Ik ∩ A)
→1 quando k → +∞. (5.6)
µ(Ik )
5.1. EXEMPLOS E APLICAÇÕES 49
Por outro lado embora f k seja uma bijeção restrita a cada Ik , ela não é afim.
Por essa razão não temos o análogo da relação (5.2) neste caso. Esta dificuldade
é contornada através do seguinte resultado, que é um exemplo de controle de
distorção: é muito importante notar que a constante K é independente de k,
Ik , E1 , e E2 .
Lema 5.7. Existe uma constante K > 1 tal que para todo k ≥ 1, todo intervalo
Ik tal que G restrita a Ik é uma bijeção diferenciável, tem-se
(f k ) (x) k−1
| log k
|≤ | log f (f i (x)) − log f (f i (y))|.
(f ) (y) i=0
O item (2) nos garante que a função x → log f (x) tem derivada limitada por C,
logo pelo Teorema do Valor Médio temos que | log f (a) − log f (b)| ≤ C1 |a − b|.
Aplicando este fato na desigualdade acima e observando a equação 5.7:
(f k ) (x)
< C3 .
(f k ) (y)
Note que a constante C3 escolhida não depende de k nem de Ik . Observe ainda
que se A ⊂ [0, 1] é um conjunto mensurável, então
1 1
m(A) ≤ µ(A) ≤ m(A),
2 log 2 log 2
onde m representa a medida de Lebesgue de [0,1].
Assim, para concluir a prova do Lema 5.7, basta observar que se E1 e E2
são subconjuntos mensuráveis de Ik , então:
µ(f k (E1 )) k
2 m(f (E1 ))
(f k ) (x) dm
= 2(log 2) ≤ E1 ≤
µ(f k (E2 )) m(f k (E2 )) E2
(f k ) (y) dm
m(E1 ) µ(E1 )
2(log 2)2 (C3 )2 ≤ 4(log 2)4 C3 .
m(E2 ) µ(E2 )
β = (β0 , β1 , β2 , . . . , βk−1 , βk , . . .)
onde duas funções são identificadas se elas coincidem em quase todo ponto com
respeito à medida µ.
Podemos munir este espaço vetorial com um produto interno dado por:
< ϕ, ψ >= ϕ.ψ dµ.
Para provarmos que a igualdade acima vale quanto ϕ é uma função contı́nua
qualquer, basta observarmos que toda função contı́nua se escreve como diferença
de duas funções positivas limitadas e aplicarmos a igualdade obtida a estas
funções. Assim, utilizando a Proposição 2.1, temos que f preserva µ.
para µ-quase todo ponto. Segue que isto é verdade para ν-quase todo ponto, já
que ν µ. Em particular,
ϕ̃ dν = ϕ dµ .
µ = c1 µ1 + c2 µ2
Demonstração. Para provar a parte “se”, suponha que µ não seja ergódica.
Então existe algum conjunto invariante A com 0 < µ(A) < 1. Defina µ1 e
µ2 como sendo as restrições normalizadas de µ a A e ao seu complementar,
respectivamente:
µ(E ∩ A) µ(E ∩ Ac )
µ1 (E) = µ2 (E) = .
µ(A) µ(Ac )
• a aplicação P → νP é mensurável;
• toda νP é invariante e ergódica para f ;
tais que, dada qualquer probabilidade f -invariante µ, o conjunto M0 satisfaz
µ(M0 ) = 1 e, além disso,
µ(E) = νP (E) dµ̂(P ) para todo conjunto mensurável E ⊂ M (5.11)
Em particular, P → µP (E) é mensurável, e µ(E) = µP (E) dµ̂(P ), para
qualquer conjunto mesurável E ⊂ Z.
Medidas condicionais, quando existem, são únicas em quase todo ponto:
Assim,
(ϕXπ−1 (Q) ) dµ = XQ (P ) ϕ dµP dµ̂(P ) = ϕ dµP dµ̂(P ).
Q
Analogamente, temos
(ϕXπ−1 (Q) ) dµ = ϕ dνP dµ̂(P ).
Q
1
n−1
ϕ(f j (z))
n j=0
1. Z \ Bf é um elemento de P e
2. dois pontos z1 e z2 de Bf estão no mesmo elemento de P se e somente
se têm as mesmas médias temporais: ϕ̃(z1 ) = ϕ̃(z2 ) para toda função
continua ϕ.
Então P é uma partição mensurável, com respeito a qualquer probabilidade µ
em Z. Se µ é f -invariant então µ(Z \ Bf ) = 0 e qualquer famı́lia de medidas
condicionais (µP )P de µ relativamente a P é tal que µP é f -invariante e ergódica
para µ̂-quase todo P ∈ P.
Defina Ai como sendo a união dos elementos Pazi (z), e Bi como a união dos ele-
mentos Pbzi (z) obtidos deste modo, para todos os pontos z ∈ S. Por construção,
Dados dois entre os conjuntos Pazi (z) que formam Ai , ou eles são disjuntos ou
coincidem. isto porque Pn , n ≥ 1, é uma sequência não-decrescente de partições.
Consequentemente, Ai pode ser escrito como uma união de conjuntos Pazi (z)
dois-a-dois disjuntos. Assim,
ψ dµ = ψ dµ < αµ(Pazi ) = αµ(Ai ),
Ai Paz (z) Paz Paz (z)
i
i i
Observe também que |en (ϕ)| ≤ sup |ϕ| < ∞ para cada n ≥ 1. Assim, nós
podemos usar o Teorema da Convergência Dominada para concluir que
ϕ dµ = e(ϕ) dµ. (5.15)
5.6 Exercı́cios
5.1. Considere o espaço M = {1, 2, . . . , d}Z das sequências com valores num
conjunto {1, 2, . . . , d}. Fixe qualquer número θ ∈ (0, 1). Para cada β = (βn )n∈Z
e γ = (γn )n∈Z em M , defina
N (β, γ ) = max N ≥ 0 : βn = γn para todo n ∈ Z com |n| < N
1
n−1
j
ϕ̃(x) = lim ϕ(Rα (z))
n→∞ n
j=0
1
n−1
ϕ̃(x) = lim ϕ(f j (z))
n→∞ n
j=0
Sistemas Misturadores
Neste capı́tulo estudaremos mais uma propriedade das transformações que preser-
vam medida, a saber, a propriedade de misturar conjuntos. Introduziremos os
deslocamentos de Markov, que generalizam os deslocamentos de Bernoulli, in-
troduzidos no Capı́tulo ??. Estudaremos sob que condições estas transformações
são ergódicas ou misturadoras.
1
n−1
lim µ(f −i (A) ∩ B) = µ(A)µ(B). (6.1)
n→∞ n
i=0
1
n−1
µ(A) = lim µ(f −i (A) ∩ A) = µ(A)2 .
n→∞ n
i=0
1
n−1
φn (x) = φ(f i (x)
n i=0
68 CAPÍTULO 6. SISTEMAS MISTURADORES
então µ é misturadora.
6.2. DESLOCAMENTOS DE MARKOV 69
• 0 ≤ pij ≤ 1
k
• pij = 1.
j=1
70 CAPÍTULO 6. SISTEMAS MISTURADORES
k
• pP = p, ou seja: pi pij = pj , para todo j = 1, . . . , k.
i=1
Pelo Teorema 0.9, segue-se que µ pode ser estendida para toda σ-álgebra. Para
mostrar a invariância de µ com respeito à σ, basta provar que µ(σ −1 (C)) =
µ(C), onde C é um cilindro. Ora, isso segue diretamente da expressão de µ(C)
acima, uma vez que a medida µ([m; bm , . . . , bn ]) não depende do ı́ndice m.
Observe que, ao contrário dos deslocamentos de Bernoulli, se A e B são
cilindros disjuntos então µ(A ∩ B) não é necessariamente µ(A)µ(B). Para ver
isto, basta por exemplo considerar o cilindro A = [1; i] e o cilindro B = [2; j].
Claramente, µ(A ∩ B) = µ([1; i, j]) = pi pij que não é necessáriamente igual à
µ(A)µ(B) = pi pj . Apesar disto, ainda podemos calcular, através de um fator
corretivo, a medida de A ∩ B:
Lema 6.7. Sejam A = [m; αm , . . . , αn ] e B = [r; βr , . . . , βs ] cilindros com
r > n. Então:
(r−n)
Pα β
µ(A ∩ B) = µ(A)µ(B) n r .
pβ r
Demonstração. Podemos escrever A ∩ B como a união disjunta
A∩B = [m; αm . . . , αn−1 , x(n), . . . , x(r), βr+1 , . . . , bs ],
x∈F
Lema 6.9. Seja P uma matriz estocástica irredutı́vel. Então, dados i e j temos
que:
1 (l)
n−1
Pij = pj .
n
l=0
1
n−1
Demonstração. Primeiramente, provaremos que n P l converge. De fato,
l=0
observe que se A = [1; j] e B = [0; i] então, pelo Lema 6.7:
1 1 (l)
n−1 n−1
1
µ(σ −l (A) ∩ B) = µ(A)µ(B) Pij .
n pj n
l=0 l=0
1
n−1
Assim, para mostrar a convergência de n P l , é suficiente observar que a
l=0
1
n−1
sequência n µ(σ −l (A) ∩ B) converge, de acordo com a observação 6.2.
l=0
k
Se v é o vetor v = (1, 1, . . . , 1), as igualdades pij = 1, para i = 1, 2, . . . , k
j=1
na definição de matriz estocástica podem ser escritas como P v = v. Deste
modo, é simples verificar que Qv = v, ou em outros termos, se Q = (qij ), então
k
qij = 1, para i = 1, 2, . . . , k. De modo análogo, como pP = p, temos que
j=1
pQ = p, ou
k
pi qij = pj , para todo j = 1, . . . , k.
i=1
(n)
tal que Psr > 0. Assim,
k
(n)
k
(n)
qsj = Psi qij < ( Psi )qsj = qsj ,
i=1 i=1
o que é uma contradição. Logo, qij não depende de i. Seja qj = qij este valor
comum. Como pQ = p, temos que:
k k
pj = pi qij = ( pi )qj = qj ,
i=1 i=1
1 (l)
n−1
Pij = pj .
n
l=0
(n)
Em particular, existe n tal que Pij > 0.
Agora, mostraremos que se P é irredutı́vel, então µ é ergódica. Apelando
(l)
n−1
para o Lema 6.9, podemos assumir que lim n1 Pij = pj .
n→∞ l=0
Utilizando a Proposição 6.1, para mostrar que µ é ergódica, basta mostrar
que para todos A, B mensuráveis vale:
1
n−1
µ(σ −l (A) ∩ B) = µ(A)µ(B).
n
l=0
6.2. DESLOCAMENTOS DE MARKOV 73
1 1
n−1 n−1
µ(σ −l (A)∩B)−µ(A)µ(B) ≤ µ(σ −l (A)∩B)−µ(σ −l (A0 )∩B0 )+
n n
l=0 l=0
1 1
n−1 n−1
+ µ(σ −l (A0 ) ∩ B0 ) − µ(A0 )µ(B0 ) + µ(A0 )µ(B0 ) − µ(A)µ(B).
n n
l=0 l=0
1 (m+l−r)
µ(σ −l (A) ∩ B) = µ(A)µ(B)Pbr am .
pam
1 1 (m+l−r)
n−1 n−1
1
µ(σ −l (A) ∩ B) = µ(A)µ(B) Pbr am .
n pam n
l=0 l=0
Como
1 (l)
n−1
Pij = pj ,
n
l=0
1. µ é misturadora
(n)
2. lim Pij = pj
n→∞
(n)
3. Existe n ∈ N tal que Pij > 0 para todos i e j.
74 CAPÍTULO 6. SISTEMAS MISTURADORES
1 (i)
n−1
lim P = Q.
n→∞ n
i=0
Assim, de acordo com o Lema 6.9, Q = (qij ) não depende de i e qij = pj . Neste
ponto, recorreremos a o seguinte teorema (para uma prova do teorema, veja ??):
Teorema 6.12 (Perron-Fröbenius). Seja A uma matriz k × k tal que alguma
de suas potências tem todas as entradas maiores que zero. Então:
1. Existe algum auto-valor λ de A tal que λ > µ, para todo auto-valor µ
de A
2. O auto-espaço associado a λ tem dimensão 1.
A partir do Teorema de Perrón, vamos mostrar agora que P (n) de fato con-
verge, quando n → ∞. Primeiramente, mostraremos que o auto-valor dom-
inante λ de P obtido pelo Teorema de Perrón é, de fato, igual a um. Para
mostrar isso, utilizaremos a adjunta P ∗ de P e o fato que os auto-valores de
P e de sua adjunta coincidem. Assim, podemos escolher v = (v1 , . . . , vk ) um
auto-vetor com vi > 0 associado ao auto-valor λ maximal para a adjunta P ∗ ,
k
tal que vi = 1, obtido como no Teorema de Perrón. Logo:
i=1
k
P ∗ v = λv ⇒ Pji vi = λvj ,
i=1
6.3. EXERCÍCIOS 75
k
Somando com respeito à j e observando que Pji = 1,
j=1
k
k k
k
1= vi = ( Pji )vi = λ vj = λ.
i=1 i=1 j=1 j=1
6.3 Exercı́cios
76 CAPÍTULO 6. SISTEMAS MISTURADORES
Capı́tulo 7
Entropia Métrica
T = {T1 , T2 , T3 , T4 }.
• Ruim: F1 = {x ∈ X; f (x) ≤ 5}
• Regular: F2 = {x ∈ X; 6 ≤ f (x) ≤ 7}
• Boa: F3 = {x ∈ X; f (x) = 8}
• Ótima: se F4 = {x ∈ X; f (x) ≥ 9}.
P = T ∨ F = {Ti ∩ Fj ⊂ X; i, j = 1, 2, 3, 4},
f −i (P) = {X},
logo
P 200 = P ∨ {X} ∨ · · · ∨ {X} = P.
Assim, descobrir a configuração do time ao longo do campeonato é tão difı́cil
quanto descobrir que time jogará no dia da abertura; a partir daı́, o time que
entrará em campo será sempre o mesmo, escolhido pelo computador. Vamos
agora introduzir o conceito de entropia de uma partição. A entropia da partição
P com respeito à transformação f e à medida µ é o número:
H(P n )
hµ (f, P) = lim
n→+∞ n
7.2. ENTROPIA DE UM SISTEMA ERGÓDICO 81
n
)
Devemos mostrar que a sequência H(P n é convergente para que o limite
acima faça sentido. Deixaremos esta demonstração a cargo do leitor (veja os
Exercı́cios 7.4 e 7.5.)
Assim, no nosso exemplo futebolı́stico, dada uma programação f do com-
putador, a entropia da partição P representa a dificuldade em descobrir qual
será a configuração, de acordo com a nossa classificação do time do CSA, ao
longo da Super Copa Nordeste, dado que o time inicial é determinado por um
sorteio. Por exemplo, se para cada configuração x o computador associa para o
próximo jogo uma certa configuração fixada que maximiza a qualidade do time
(por exemplo, a soma de t(x) com f (x)), então não é difı́cil ver que a entropia da
partição P 200 é igual à entropia de P. Ou seja, não é nada difı́cil para um apos-
tador, descobrir a configuração do time do CSA ao longo de todo campeonato:
basta descobrir a configuração no primeiro dia. Observe que neste caso:
1 Hµ (P 200 ) ∼ Hµ (P) ∼
hµ (f, P) = lim Hµ (P n ) ∼
= = = 0.
n→∞ n 200 200
Ou seja, a aposta descobrir a configuração do time do CSA ao longo da Super
Copa Nordeste é muito previsı́vel e devemos pagar pouco ao vencedor dela. Claro
que isso só acontece se nossa programação for, em certo sentido, previsı́vel. Se,
por exemplo, o time do CSA for escolhido a cada rodada por meio de um sorteio,
então descobrir a sua configuração ao longo do campeonato se torna muito mais
complicado. Neste caso, a entropia da partição P dependerá da medida de seus
átomos, ou seja, da medida de cada elemento Pi . Definiremos agora uma forma
global de medir a complexidade de uma transformação, no sentido métrico.
A palavra global aqui refere-se que ela não dependerá de nenhuma partição
especı́fica.
Definição 7.5. A entropia de f com respeito à medida µ é:
δp (A) = 0 , se p ∈
/A
1 , se p ∈ A,
d
hµp (σ + , P) = − pi log pi .
i=1
1 log 10−n
hm (f, P) = lim −m(C) log m(C) = lim − = log 10.
n n
n
C∈P
Hµ (P n ) #P n log kn
hµ (f, P) = lim ≤ = lim = 0.
n n n
hµ (f ) = hµ (f, P).
2. φ ◦ f1 = f2 ◦ φ.
Observe que em alguns pontos φ não está bem definida. Por exemplo, podemos
escrever (0, 1)2 de outro modo, a saber, como (0, 1)2 = (0, 01111 . . . )2 . Porém,
isso não gera maiores problemas: o conjunto B dos pontos que se escrevem
de dois modos diferentes é enumerável (prove isso!) e, logo, tem medida de
Lebesgue nula. Eventualmente, um ponto de [0, 1] pode ser mapeado por f em
um ponto de B. Observe que como cada f −i (B) é enumerável, conjunto
∞
B∞ = f −i (B)
i=0
Ug ◦ T = T circUf .
P2 = φ(P1 ) = {φ(P ) ⊂ X2 ; P ∈ P1 }.
Observe que como φ é uma bijeção mensurável, temos que P2 é de fato uma
partição de X2 . Além disso, utilizando que φ ◦ f1 = f2 ◦ φ vem que φ(P1n ) =
φ(P1 )n = P2n . Assim, existe uma bijeção entre os elementos de P1n e os elementos
de P2n de modo que cada elemento P ∈ P1n é levado por φ num elemento φ(P )
de P2n . Como µ1 (P ) = µ2 (φ(P )) para cada P ∈ P1n temos que
Hµ1 (P1n ) = −µ1 (P ) log µ1 (P ) = −µ2 (φ(P )) log µ2 (φ(P ))
P ∈P1n P ∈P1n
= −µ2 (Q) log µ2 (Q) = Hµ2 (P2n ).
Q∈P2n
Vamos agora introduzir uma nova forma de calcular a entropia de uma me-
dida invariante, devida a Brin e Katok [BK83], com um certo sabor topológico.
Primeiramente, vamos definir o conceito de bola dinâmica:
Definição 7.19. A bola dinâmica de tamanho n e raio em torno do ponto x
é o conjunto:
B
(n, x) = {y ∈ M ; d(f i (x), f i (y)) < , i = 0, 1, . . . , n − 1},
ou equivalentemente,
n−1
B
(n, x) = f −k (B
(f k (x))).
k=0
7.7 Exercı́cios
7.1. Mostre que se Q = {Q1 , . . . , Qd }, então Hµ (Q) ≤ log d. (dica:Use cálculo
n
e mostre que se x1 , . . . , xd ≥ 0 são números reais positivos tais que i=1 xi = 1,
d
então − i=1 xi log xi é máximo quando x1 = x2 = · · · = xd = 1/d.)
7.2. Mostre que a função h(x) é f -invariante. Conclua daı́ que se µ é ergódica,
então hµ (f ) = h(x) para µ quase todo ponto x.
1
n−1
3. Se p é um ponto periódico de perı́odo n e µ = n δf i (p) , então hµ (f ) = 0
i=0
88 CAPÍTULO 7. ENTROPIA MÉTRICA
Capı́tulo 8
Entropia Topológica
α ∨ β = {A ∩ B; A ∈ α e B ∈ β}.
αn = α ∨ · · · ∨ f −n+1 (α).
90 CAPÍTULO 8. ENTROPIA TOPOLÓGICA
Deixaremos para o leitor a tarefa de mostrar que H(αn ) é uma sequência sub-
aditiva (Exercı́cio 8.2.)
Assim, dada uma função contı́nua f : X → X, definimos a entropia de f
com respeito a cobertura α, como sendo o número
1
h(f, α) = lim H(αn ).
n→∞ n
Finalmente, a entropia topológica de f é
Para mostrar que a sequência h(f, βn ) é convergente, suponha que uma sub-
sequência βni satisfazendo lim h(f, βni ) = h. Vamos mostrar que h = htop (f ).
i→∞
De fato, dado > 0, podemos escolher N grande de modo que se i > N , então
h − ≤ h(f, βni ≤ h + . Deste modo, aplicando a parte que já mostramos à
sequência ωi = βni+N , temos que
Deixaremos para o leitor a tarefa de verificar que a sequência log Sn () é suba-
ditiva (Exercı́cio 8.3.)
Assim, podemos considerar o limite
1
h(f, ) = lim log Sn ().
n→∞ n
h(f ) = htop (f ).
92 CAPÍTULO 8. ENTROPIA TOPOLÓGICA
Definimos B
(T, x) = {y ∈ M ; dT (x, y) ≤ } a bola de raio na
distância dT .
Um conjunto E ⊂ Xserá chamado de (T, )-gerador de X , se = B
(n, x).
x∈E
Assim, de forma análoga ao que fizemos no caso de aplicações, definimos
ST () = inf{#E; E ⊂ X é (T, ) − gerador } e
1
h(φ, ) = lim log ST ().
T →∞ T
Finalmente, a entropia topológica do fluxo φ é definida como sendo o número:
Teorema 8.8. A entropia topológica htop (φ) do fluxo φt coincide com a entropia
topológica htop (φ1 ) da aplicação φ1 .
htop (f ) = sup hµ (f ).
µ∈I
1. P (0, f ) = htop (f )
2. P (φ + C, f ) = P (φ, f ) + C
Outra boa propriedade da pressão é que ela é uma função contı́nua com o
potencial. Mostraremos, sem muito esforço, que
Proposição 8.17. P : C 0 (X) → R é Lipschitz com constante de Lipschitz igual
a 1.
Demonstração. De fato, dados os potenciais φ e ψ ∈ C 0 (X) vale que:
ψ − φ − ψ ≤ φ ≤ ψ + φ − ψ
d
λi (x) = χi (x) = log | det Df (x)|.
i=1
96 CAPÍTULO 8. ENTROPIA TOPOLÓGICA
8.6 Exercı́cios
8.1. Se U e V são coberturas tais que U ≺ V, então H(V) ≤ H(U).
8.2. Mostre que H(αn ) é uma sequência subaditiva.
8.3. Mostre que fixado , então a sequência log Sn () é subaditiva.
8.4. Mostre que o máximo da função h : Rd → R dada por h(x1 , . . . , xd ) =
d
− i=1 xi log xi restrita ao simplexo {xi ≥ 0; x1 + · · · + xd = 1} é igual a log d
e é obtido exatamente quando x1 = x2 = · · · = xd = d1 . Conclua que entre as
medidas de Bernoulli do Shift completo com d sı́mbolos, a de maior entropia é
dada pelo vetor de probabilidade ( d1 , . . . , d1 ).
8.5. Este exercı́cio é uma generalização do anterior: sejam a1 , . . . , ad números
reais. Mostre que o máximo da função F : Rd → R dada por
d
F (x1 , . . . , xd ) = −xi log xi + xi ai
i=1
eaj
xj = .
d
eai
i=1
Capı́tulo 9
Transformações Expansoras
Nesta seção provamos que para qualquer transformação expansora cujo jaco-
biano det Df é Hölder 1 existe uma única probabilidade invariante absoluta-
mente contı́nua com relação à medida de Lebesgue. Essa probabilidade é posi-
tiva em todos os subconjuntos abertos de M , é ergódica, e a sua bacia de atração
tem medida de Lebesgue total em M .
Definição 9.1. Seja M uma variedade compacta e f : M → M uma trans-
formação de classe C 1 . Dizemos que f é expansora se existe σ > 1 e alguma
métrica riemanniana · em M tais que
1 Dado ν > 0, dizemos que φ : M → R é ν-Hölder se existe alguma constante C > 0 tal que
1 j
n−1
f m
n j=0 ∗
para todo 1 ≤ j ≤ n. Como cada hj é uma contração, a sua imagem está contida
numa bola de raio menor que ρ0 em torno de f n−j (x). Então hn = hn ◦ · · · ◦ h1
está bem definida na bola de raio ρ0 em torno de y. É claro que f n ◦ hn = id e
hn (y) = x.
O próximo resultado fornece um bom controle da distorção de iterados de f
e seus ramos inversos, que é crucial para a demonstração do teorema. Este é o
único lugar onde se usa a hipótese de que o jacobiano é Hölder.
Proposição 9.5 (lema de distorção). Existe C1 > 0 tal que, dado qualquer
n ≥ 1, qualquer y ∈ M , e qualquer ramo inverso hn : B(y, ρ0 ) → M de f n ,
tem-se
| det Dhn (y1 )|
≤ exp(C1 d(y1 , y2 )ν ) ≤ exp(C1 (2ρ0 )ν )
| det Dhn (y2 )|
para todo y1 , y2 ∈ B(y, ρ0 ).
Demonstração. Escrevamos hn como composição hn = hn ◦ · · · ◦ h1 de ramos
inversos de f . Também escrevemos hi = hi ◦ · · · ◦ h1 para 1 ≤ i < n, bem como
h0 = id . Então
| det Dhn (y1 )|
n
log = log | det Dhi (hi−1 (y1 ))| − log | det Dhi (hi−1 (y2 ))| .
| det Dhn (y2 )| i=1
Note que log | det Dhi | = − log | det Df | ◦ hi e, por hipótese, log | det Df | is
(C0 , ν)-Hölder for some C0 > 0. Além disso, pelo Lema 9.4, cada hj é uma
σ −1 -contração. Logo,
para todo ramo inverso hn de f n no ponto z. Além disso, também temos que
(f∗n m)(B) = m(f −n (B)) é a soma de m(hn (B)) sobre todos os ramos inversos,
e analogamente para B0 . Deste modo, obtemos que
Claro que (f∗n m)(B0 ) ≤ (f∗n m)(M ) = 1. Além disso, a medida de Lebesgue das
bolas com um raio fixado ρ0 está limitada de zero por alguma constante α0 > 0
que só depende de ρ0 . Então, para obter a conclusão da proposição basta tomar
C2 = exp(C1 (2ρ0 )ν )/α0 .
Também precisamos do seguinte resultado auxiliar:
Lema 9.7. Seja ν uma probabilidade num espaço métrico compacto X, e seja
ϕ : X → [0, +∞) uma função integrável com respeito a ν. Seja µi , i ≥ 1,
uma sequência de probabilidades em X convergindo para uma probabilidade µ
na topologia fraca∗ . Se µi ≤ ϕν para todo i ≥ 1 então µ ≤ ϕν.
Demonstração. Seja B um conjunto mensurável qualquer. Para cada ε > 0,
seja Kε um subconjunto compacto de B tal que µ(B \ Kε ) e (ϕν)(B \ Kε )
são ambos menores que ε. Então seja Aε uma vizinhança aberta de Kε da
forma Aε = {z : d(z, Kε ) < r}, com r > 0 suficientemente pequeno para que a
medida de Aε \ Kε seja menor que ε, tanto para µ como para ϕν. Mudando r
ligeiramente, caso necessário, podemos supor que o bordo de Aε tem µ-medida
zero: há no máximo uma quantidade enumerável de valores de r para os quais
isso não acontece. Então, µ = lim µi implica µ(Aε ) = lim µi (Aε ) ≤ (ϕν)(Aε ).
Fazendo ε → 0 obtemos que µ(B) ≤ (ϕν)(B).
Aplicando este lema na nossa situação, obtemos
n−1
Corolário 9.8. Todo ponto de acumulação µ da sequência n−1 j=0 f∗j m é
uma probabilidade invariante para f absolutamente contı́nua com relação à me-
dida de Lebesgue.
9.3. EXISTÊNCIA DE MEDIDAS ERGÓDICAS 101
Demonstração.
ni −1Tomemos ϕ constante igual a C2 e ν = m. Tomemos também
µi = n−1
i j=0 f j
∗ m, para qualquer subsequência (ni )i tal que (µi )i converge
para uma medida µ. A Proposição 9.6 garante que νi ≤ ϕν. Então também
temos µ ≤ ϕν = C2 m, pelo Lema 9.7. Isto implica que µ m, com densidade
limitada por C2 .
m(Vn \ A)
m(Vn )
converge para zero quando n → ∞. Seja Ui(n) = f n (Vn ). Pela Proposição 9.5
aplicada ao ramo inverso de f n que envia Ui(n) em Vn , concluı́mos que
também converge para zero. Como P0 é finito, deve existir 1 ≤ i ≤ s tal que
i(n) = i para infinitos valores de n. Logo, m(Ui \ A) = 0.
Lema 9.12. Dado qualquer aberto não vazio U ⊂ M , existe N ≥ 1 tal que
f N (U ) = M .
9.5 Exercı́cios
104 CAPÍTULO 9. TRANSFORMAÇÕES EXPANSORAS
Capı́tulo 10
Estados de Equilı́brio
Assim, a função P numa medida de Bernoulli dada pelo vetor de probabilidades
d
(p1 , . . . , pd ) nada mais é que − i=1 pi log pi + pi ai . Logo, utilizando o exercı́cio
8.5 temos que entre todas as medidasa de Bernoulli a que maximiza a P é a que
j
tem vetor de probabilidades pj = de .
eai
i=1
onde [10x] representa o maior inteiro menor ou igual a 10x, vista na Seção 2.1.
Note que se dois pontos x, y ∈ [0, 1] são distintos, então em algum momento n,
10.2. TRANSFORMAÇÕES EXPANSIVAS 107
|an − bn | 1
|f n (x) − f n (y)| > > ,
10 10
1
provando que f é expansiva com constante de expansividade 10 .
Demonstração. Pelo lema 9.4, existe ρ0 > 0 tal que, para qualquer pré-imagem
x de um ponto y ∈ M , existe uma aplicação h : B(y, ρ0 ) → M de classe C 1 tal
que f ◦ h = id , h(y) = x e
e f n (y) = y, a desigualdade d(f i (x), f i (y) < vale para todo i ∈ N. Logo, pela
expansividade de f , x = y. Assim,
1 1
lim sup log #P er(n) ≤ lim sup log #N (αn ) = htop (f, α).
n n
Tomando o limite quando o diâmetro de α vai a zero, temos a desigualdade
requerida.
Lema 10.11. Seja P = {P1 , . . . , Pk } uma partição tal que para todo i = 1, . . . , k
vale diamPi ≤ ρ. Então, P é geradora com respeito a qualquer medida invariante
µ.
Demonstração. Defina
(n) (n)
grande diamP (n) (x) ≤ r2 , para todo x ∈ M . Considere C1 , . . . , Cm ∈ P (n)
aqueles que intersectam K1 . Então
(n) (n) (n)
µ( Ci ∆A) = µ( Ci − A) + µ(A − Ci )
≤ µ(A − K1 ) + µ(Ac − K2 ) ≤ 2δ.
temos que se Q é tal que µ0 (∂Q) = 0, para cada Q ∈ Q e uma medida µ0 fixada,
então a função µ → Hµ (Q) é contı́nua em µ0 . Isso implica diretamente que
1
µ → hµ (f, P) = inf Hµ (P (n) ).
n→∞ n
é semi-contı́nua superiormente em µ0 .
n−1
Jµ f n (x) = Jµ f (f i (x)).
i=0
2. Se u ∈ C 0 (M ) então
u ◦ f dν = (Jν f (y))−1 u(x) dν(x).
f (y)=x
Observe que a última expressão converge para χf (A) (x) em ν-quase todo ponto.
Assim, pelo Teorema da Convergência Dominada,
λe−φ gn dν = e−φ gn d(L
φ ν) = Lφ (e−φ gn ) dν → ν(f (A)).
Como o lado esquedo também converge para A λe−φ dν, concluimos que
ν(f (A)) = λe−φ dν,
A
Lembre-se que B
(n, x) denota a bola dinâmica de raio e tamanho n cen-
trada em x, como definida em 7.19 e Sn φ(x) = φ(x) + · · · + φ(f n−1 (x)).
Enunciaremos agora o principal teorema deste capı́tulo, devido a Ruelle ([]),
generalizando o teorema 9.3 do Capı́tulo 9:
Teorema 10.19. Seja f : M → M uma transformação expansora numa var-
iedade compacta conexa M e φ : M → R um potencial α-Hölder, para algum
ν > 0. Então, se ν denota uma medida conforme para φ, então
1. Existe uma única probabilidade invariante µφ absolutamente contı́nua com
respeito à ν;
10.3. TRANSFORMAÇÕES EXPANSORAS 113
µφ (B
(n, x))
K −1 ≤ ≤ K. (10.1)
eSn φ(x)−nP (φ)
Demonstração. Observe que como d(f n (x), f n (y)) < δ, segue-se pelo Lema 9.4
que
114 CAPÍTULO 10. ESTADOS DE EQUILÍBRIO
d(f n−i (x), f n−i (y)) < σ −i d(f n (x), f n (y)). (10.2)
Logo,
n−1
Sn φ(y) − Sn φ(x) ≤ φ(f i (x)) − φ(f i (y)) ≤
i=0
n−1
≤ σ −i d(f n (x), f n (y))α ≤ Ad(f n (x), f n (y))α
i=0
Corolário 10.21. Existe uma constante K tal que para todos x, y ∈ M tais que
d(f n (x), f n (y)) < δ, então
Jν f n (x)
K2−1 ≤ ≤ K2 .
Jν f n (y)
Como d(f n (x), f n (y)) < δ, segue-se pelo Proposição 10.20 que
Jν f n (x)
= eSn φ(y)−Sn φ(x) ≤ eAd(f (x),f (y)) ,
n n α
n
Jν f (y)
ν(B
(n, x))
K −1 ≤ ≤ K.
eSn φ(x)−nP
Demonstração. De fato, como f n |cB (n,x) é injetiva e Jν f (x) = λ−1 eφ(x) , temos
que Jµ f n = λ−n eSn φ(x) , onde
ν(f n (B
(n, x)) = Jν f n (y)dν(y).
B (n,x)
10.3. TRANSFORMAÇÕES EXPANSORAS 115
K2−1 ν(f n (B
(n, x)) ≤ Jµ f n (x)ν(B
(n, x)) ≤ K2 ν(f n (B
(n, x)).
para todos x1 e x2 com d(x1 , x2 ) < δ. Em particular, existe A tal que para todos
x, y ∈ M :
Lnφ (x)
≤ A.
Lnφ (y)
Então,
Sn φ(y1 )
−Ad(x1 ,x2 )α
Lnφ (x1 ) f n (y1 )=x1 e
≤ eAd(x1 ,x2 )
α
e ≤ n =
Lφ (x2 ) f (y2 )=x2
n e Sn φ(y2 )
Lema 10.24. A sequência de funções λ−n Lnφ 1 é limitada. Além disso, existe
c > 0 tal que λ−n Lnφ 1(x) > c > 0, para todo x ∈ M .
Demonstração. Observe que λ−n Lnφ 1 dν = 1. Logo, existem pontos zn e yn
tais que λ−n Lnφ 1(zn ) ≤ 1 e λ−n Lnφ 1(yn ) ≥ 1. De acordo com o Lema 10.23,
temos que para todo x ∈ M vale:
e
1 1
≤ λ−n Lnφ (yn ) ≤ Lnφ (x),
A A
o que termina a prova do Lema.
ou seja,
λ−n Lnφ 1(x) − λ−n Lnφ 1(y) ≤ Kλ−n Lnφ 1(x)d(x, y)α .
Pelo lema 10.24, a sequência de funções λ−n Lnφ 1 é limitada uniformemente em
M . Utilizando esse fato na equação acima, acabamos a prova do Lema 10.25
1 −i i
n−1
hn = λ Lφ 1,
n i=0
nk −1
λ λ −(k) k
n−1
1 − λ−ni Lni 1
= lim λ−(k+1) Lk+1
φ 1 = lim λ Lφ 1 − .
ni →∞ ni ni →∞ n ni
k=0 k=0
Como λ−ni Lni 1 é uma sequência limitada, de acordo com o Lema 10.24, o
segundo termo da última igualdade acima vai para zero e o primeiro converge
para λh, provando que Lφ h = λh.
−nObserve ainda que, utilizando o fato que ν é uma medida conforme, que
λ i
Lni 1 dν = 1, para todo n ∈ N. Deste modo, segue-se diretamente
que
hn dν = 1 e como h lim hni , tomando o limite mostramos que h dν = 1.
Resumindo, mostramos que:
1. Lφ h = λh;
2. h > 0;
3. h dν = 1.
Da Proposição
10.26 vem que µ é uma medida de probabilidade, uma vez que
µ(M ) = h dν = 1. Observe também que como existe c > 0 tal que 1/c ≤ h ≤ c,
temos que para todo boreliano A ⊂ M , vale
Observe que a equação 10.4 fornece que H(x) = − lim n1 Sn φ(x) + P . Sub-
n→∞
stituindo acima, vem que:
1
hµ (f ) = − lim Sn φ dµ + P.
n→∞ n
Deixaremos como exercı́cio para o leitor (exercı́cio ??) a prova deste fato.
Proposição 10.31. Vale o seguinte:
1. P = P (f, φ);
2. Se η é um estado de equilı́brio para φ, então L
φ (h−1 η) = λh−1 η.
Demonstração. Defina g : M → (0, ∞) por
h(x)
g(x) = λ−1 eφ(x) ,
h(f (x))
e seja gη = (Jη f )−1 . Observe que:
f (y)=x e
φ(y)
h(y) Lφ h(x)
g(y) = = =1 (10.5)
λh(x) λh(x)
f (y)=x
Uma vez que ξ é arbitrário, temos que L φ (h−1 η) = λ(h−1 η), como afirmamos.
A−1 ν2 (B
(n, x)) ≤ ν1 (B
(n, x)) ≤ Aν2 (B
(n, x)).
U
n = {U ; U é bola dinâmica de raio e comprimento n}
10.4 Exercı́cios
10.1. Seja ν uma medida em M . Dado γ > 0, mostre que existe a > 0 tal que
ν(Bγ (x)) > a > 0 para todo x no suporte de ν.
10.2. Seja f : M → M uma transformação expansora e M uma variedade
conexa. Mostre que se uma
10.3. Seja f : M → M uma transformação tal que cada ponto admite somente
um número finito de pré-imagens. Mostre que Jµ f existe para toda medida
invariante µ.
10.4. Seja µ uma medida e Jµ f seu jacobiano. Mostre que se f n |A é injetiva,
então
n−1
Jµ f n (x) = Jµ f (f i (x)).
i=0
K −1 < Jµ f n (x)µ(B
(n, x)) < K.
#(S ∩ Ij )
#Ij → ∞ e →D
#Ij
124 CAPÍTULO 11. APLICAÇÕES EM TEORIA DOS NÚMEROS
{1, 3, 4, 7, 8, 9, 13, 14, 15, 16, 21, 22, 23, 24, 25, 31, 32, 33, 34, 35, 36, 42, . . .}.
11.1.2 Enunciados
Nos anos 30, Erdös e Turan [ET36] conjecturaram que todo subconjunto de
Z com densidade superior positiva contém sequências aritméticas finitas com
comprimento arbitrariamente grande. Esta conjectura foi demonstrada por Sze-
merédi [Sze75], quase quatro décadas mais tarde:
Teorema 11.5 (Szemerédi). Se S é um subconjunto de Z com densidade
superior positiva, então para todo k ∈ N existem m ∈ Z e n ∈ N tais que m,
m + n, m + 2n, . . . , m + kn pertencem a S.
Em geral, não podemos esperar que S contenha progressões aritméticas com
comprimento infinito, como mostram os Exemplos 11.3 e 11.4.
A demonstração original do Teorema 11.5 usa argumentos combinatórios
bastante intrincados. No entanto, poucos anos depois Furstenberg [Fur77] deu
uma nova demonstração, utilizando idéias de Teoria Ergódica. Na verdade, ele
deduziu o Teorema 11.5 de uma generalização do Teorema 1.1 para famı́lias de
transformações que comutam entre si:
11.1. TEOREMA DE SZEMERÉDI 125
Em outras palavras, este teorema afirma que existe algum tempo n tal que
os iterados de um subconjunto com medida positiva de pontos de E, por todas
as transformações fi , regressam a E simultaneamente nesse momento n.
A demonstração do Teorema 11.6 escapa ao âmbito deste texto. Mas, na
Seção 11.1.6, explicaremos porquê ele implica o Teorema 11.5. Além disso,
vamos discutir versões um pouco mais fracas destes resultados, que chamamos
teorema de van der Waerden e teorema de Recorrência Simultânea de Birkhoff,
respectivamente.
O teorema de van der Waerden [vdW27] afirma que dada qualquer partição
do conjunto Z num número finito de subconjuntos, algum desses subconjuntos
deve conter progressões aritméticas com comprimento arbitrariamente grande:
Si = {n ∈ Z : αn = i}, i = 1, 2, . . . , q
Para provarmos este fato, vamos munir M da métrica d(β, γ) = θ−N (β,γ ) ,
N (β, γ ) = max N ≥ 0 : βn = γn para todo n ∈ Z com |n| < N ,
que foi definida no Exercı́cio 5.1, sendo θ um número qualquer em (0, 1). Note
que
d(β, γ) < 1 se e somente se α0 = β0 . (11.2)
Como o espaço métrico (M, d) é compacto, o fecho A = f n (α) : n ∈ Z da
trajetória de α é também um compacto, para a métrica induzida. Lembre que
o deslocamento f : M → M é definido por
estão todos a distância menor que 2/3 uns dos outros. Então, como σ está
no fecho A da órbita de α, podemos encontrar m ∈ Z tal que f m (α) está tão
próximo de σ que os pontos
estão a distância menor que 1 uns dos outros. Tendo em conta a observação
(11.2) e a definição (11.3) da transformação f , isto quer dizer que
αm = αm+n = · · · = αm+kn ,
É fácil ver que o Teorema 11.9 implica o Teorema 11.7. No Exercı́cio 11.2
veremos que a recı́proca também é verdadeira.
uma vez que quase todo ponto retorna simutaneamente a Uj em algum momento.
Consequentemente, como {Uj }j∈N é uma cobertura de M , temos que o conjunto:
∞
D= Dm ,
n=1 m≥n
#(S ∩ In )
µ(A) ≥ µn (A) = lim > c > 0.
#In →∞ #In
P (x) = a0 + a1 x + a2 x2 + · · · + ad xd ,
130 CAPÍTULO 11. APLICAÇÕES EM TEORIA DOS NÚMEROS
onde {x} = parte fracionária e [x] = parte inteira de x. Observe que zn ∈ [0, 1)
para cada n. Mas podemos, igualmente, considerar que a sequência toma valores
no cı́rculo S 1 = R/Z, e faremos isso no que segue. Estamos interessados em
entender como se distribui a sequência zn no cı́rculo.
Veremos no Exercı́cio 11.4 que isto equivale a dizer que, para todo intervalo
I ⊂ S 1 , a fração dos termos da sequência que estão em I é igual ao comprimento
m(I) desse intervalo.
zn = xn + yn , xn = {ad nd }, yn = {Q(n)}
onde Q(x) = a0 + a1 x + · · · + ad−1 xd−1 . Suponha que ad é racional, isto é, que
existem inteiros p e q tais que ad = p/q. Então a primeira parcela xn toma no
máximo q valores distintos. De fato esta sequência é periódica com perı́odo q:
p p d
xn+p = (n + q)d = n = xn para todo n ∈ Z.
q q
Por outro lado, a segunda parcela yn é do mesmo tipo que zn , exceto que o
polinômio Q que lhe está associado tem grau d − 1. Portanto, por indução no
grau, podemos supor que yn é equidistribuı́da. Mais que isso, podemos supor
que as subsequências
Foi visto na Proposição 3.6 que esta transformação f admite uma única prob-
abilidade invariante, que é a medida de Lebesgue m. Consequentemente, dada
qualquer função contı́nua ϕ : S 1 → R, e dado qualquer ponto θ ∈ S 1 ,
1
n
lim ϕ(f j (θ)) = ϕ dm.
n→∞ n
j=1
11.2.2 Ergodicidade
Vamos estender os argumentos acima para provar o caso geral do Teorema 11.8.
Seja Td o toro d-dimensional, isto é,
Td = Rd /Zd = S 1 × · · · × S 1 (d vezes).
Introduzimos a transformação f : Td → Td
onde α é um número irracional que será escolhido mais tarde. Observe que f
preserva a medida de Lebesgue m em Td . Isto pode ser visto usando as idéias
da Seção 2.2: a derivada de f em cada ponto vem dada pela matriz
1 0 0 ··· 0 0
1 1 0 ··· 0 0
0 1 1 ··· 0 0
··· ··· ··· ··· ··· ···
0 0 0 ··· 1 1
Isto implica que an e aL(n) têm o mesmo valor absoluto. Por outro lado, a
relação de integrabilidade (11.7) implica que existe no máximo um número finito
de termos com um dado valor absoluto não-nulo. Concluı́mos que an = 0 para
todo n ∈ Zd cuja órbita Lj (n), j ∈ Z seja infinita. Observando a expressão de
L deduzimos que an = 0 exceto, possivelmente, se n2 = · · · = nd = 0. Além
disso, para os valores de n restantes, ou seja, para n = (n1 , 0, . . . , 0), tem-se que
L(n) = n e portanto a relação (11.8) torna-se
an = an e2πin1 α .
tem medida total. Seja G0 (µ) o conjunto dos θ0 ∈ Td−1 tais que G(µ) intersecta
{θ0 }×S 1 . Em outras palavras, G0 (µ) = π(Gµ ). É claro que π −1 (G0 (µ)) contém
Gµ e portanto tem medida µ igual a 1. Logo, usando o Lema 11.15,
m0 (G0 (µ)) = µ(π −1 (G0 (µ))) = 1.
Em particular, isto vale para a medida de Lebesgue:
m0 (G0 (m)) = m(π −1 (G0 (m))) = 1.
Uma consequência direta destas relações é que a intersecção de G0 (µ) e G0 (m)
tem medida m0 total e, portanto, estes conjuntos não podem ser disjuntos. Seja
θ0 um ponto qualquer na intersecção. Por definição, G(µ) intersecta {θ0 } × S 1 .
Mas o próximo resultado afirma que G(m) contém {θ0 } × S 1 :
134 CAPÍTULO 11. APLICAÇÕES EM TEORIA DOS NÚMEROS
A hipótese θ0 ∈ G0 (m) significa que existe algum η ∈ S 1 tal que (θ0 , η) ∈ G(m),
ou seja,
1
n−1
lim ϕ(f j (θ0 , η)) = ϕ dm
n j=0
1 1
n−1 n−1
lim ϕ(f j (θ0 , η + β)) = lim (ϕ ◦ Rβ )(f j (θ0 , η))
n j=0 n j=0
= (ϕ ◦ Rβ ) dm = ϕ dm.
Segue do que dissemos até agora que G(µ) e G(m) se intersectam em algum
ponto de {θ0 } × S 1 . Tendo em vista a definição (11.10), isto implica que as
duas medidas têm a mesma integral para cada função contı́nua. De acordo
com o Teorema de Riesz-Markov 3.7, isto implica que µ = m, como querı́amos
demonstrar.
Usando a definição (11.11) e o Lema 11.18, obtemos que esta expressão é igual
a
(p1 (n), p2 (n), . . . , pd (n)),
ψ(θ1 , θ2 , . . . , θd ) = ϕ(θd ).
Fixemos θ = (p1 (0), p2 (0), . . . , pd (0)). Usando o Lema 11.19 e o Corolário 11.17,
1 1
n−1 n−1
lim ϕ(zn ) = lim ψ(f n (θ)) = ψ dm = ϕ dx.
n j=0 n j=0
11.3 Exercı́cios
11.1. Prove que
1. Di (S) = Ds (Z \ S) para qualquer subconjunto S de Z.
2. Se S1 , S − 2, . . . , SN é uma partição de Z então
Resultados em Teoria
Ergódica Diferenciável
1
lim log Df n (x)v = λi (x),
n→±∞ n
l
2. log | det Df (x)|dµ(x) = (x)λi (x)dµ(x).
i=0
Então,
12.3 Exercı́cios
Bibliografia
[Fal90] K. Falconer. Fractal geometry. John Wiley & Sons Ltd., 1990. Math-
ematical foundations and applications.
[Orn70] D. Ornstein. Bernoulli shifts with the same entropy are isomorphic.
Advances in Math., 4:337–352 (1970), 1970.
[Rok66] V.A. Rokhlin. Selected topics from the metric theory of dynamical
systems. A. M. S. Transl., 49:171–240, 1966. Transl. from Uspekhi
Mat. Nauk. 4 - 2 (1949), 57–128.
[Wey16] H. Weyl. Uber die Gleichverteilungen von Zahlen mod Eins. Math.
Ann., 77:313–352, 1916.