Você está na página 1de 185

Universidade Estadual de Campinas

Faculdade de Engenharia Elétrica e de Computação


Departamento de Telemática

Sistemas Dinâmicos de Eventos Discretos com Aplicação


ao Fluxo Geodésico em Superfı́cies Hiperbólicas

Autor: Daniel Pedro Bezerra Chaves


Orientador: Prof. Dr Reginaldo Palazzo Júnior

Tese de Doutorado apresentada à Faculdade de


Engenharia Elétrica e de Computação como parte
dos requisitos para obtenção do tı́tulo de Doutor
em Engenharia Elétrica. Área de concentração:
Telecomunicações e Telemática.

Banca Examinadora
Prof. Dr Reginaldo Palazzo Júnior UNICAMP
Prof. Dr. José Roberto Rios Leite UFPE
Prof. Dr. Cecilio José Lins Pimentel UFPE
Prof. Dr. Henrique Lazari UNESP
Prof. Dr. Carlos Eduardo Câmara FATEC-AM

Campinas, SP
2011
FICHA CATALOGRÁFICA ELABORADA PELA
BIBLIOTECA DA ÁREA DE ENGENHARIA E ARQUITETURA- BAE - UNICAMP

Chaves, Daniel Pedro Bezerra


C398S Sistemas dinâmicos de eventos discretos com
aplicação ao fluxo geodésico em superfı́cies hiperbólicas
/Daniel Pedro Bezerra Chaves. – Campinas, SP:[s.n.],
2011.

Orientadore: Reginaldo Palazzo Júnior.


Tese de Doutorado - Universidade Estadual de Campinas,
Faculdade de Engenharia Elétrica e de Computação.

1. Sistemas dinâmicos. 2. Grupos fuchsianos.


3. Geometria hiperbólica. 4. Teoria da informação.
5. Teoria dos autômatos. I. Palazzo Júnior, Reginaldo.
II. Universidade Estadual de Campinas. Faculdade de
Engenharia Elétrica e de Computação. III. Tı́tulo

Tı́tulo em Inglês: Discrete event dynamical systems with application to the


geodesic flow on hyperbolic surfaces
Palavras-chave em Inglês: Dynamical systems, Fuchsian groups, Hyperbolic
geometry, Information theory, Automata theory
Área de concentração: Telecomunicações e Telemática
Titulação: Doutor em Engenharia Elétrica
Banca Examinadora: José Roberto Rios Leite, Cecilio José Lins Pimentel,
Henrique Lazari, Carlos Eduardo Câmara
Data da defesa: 05/12/2011
Programa de Pós Graduação: Engenharia Elétrica

ii
iii
iv
Resumo
Neste trabalho apresentamos um método de descrição combinatorial para o fluxo geodésico sobre uma
região hiperbólica compacta, tendo como objetivo associar a sequências de codificação, parâmetros
topológicos oriundos destas superfı́cies. Isto permite conjugar conceitos topológicos e combinatoriais
oriundos das superfı́cies estudadas com conceitos de teoria da informação e codificação.
Demonstramos como a propriedade de completude de um sistema dinâmico de eventos discretos
invariantes no tempo se reflete na topologia do espaço de trajetórias do sistema, quando especificadas
por sequências bi-infinitas e descritas sobre um alfabeto finito. A mesma estrutura obtida pelo pro-
cesso de codificação do fluxo geodésico, e a qual passamos a chamar de sistema simbólico fechado
(ssf).
Identificamos como um ssf pode ser caracterizado globalmente, através do seu conjunto de res-
trições irredutı́veis, ou localmente, por conjuntos de restrições dependentes do contexto. Ambas
derivadas de relações de ordem parcial. Disto determinamos métodos de representação do ssf.
Através da relação entre os métodos de codificação aritmético e geométrico, propomos processos
de codificação sobre superfı́cies hiperbólicas, determinando como as representações mı́nimas das
sequências código do fluxo geodésico podem ser construı́das a partir das propriedades topológicas e
combinatoriais da superfı́cie.
Palavras-chave: Sistemas Dinâmicos, Dinâmica Simbólica, Linguagem Formal, Conjunto de
Restrições, Grafos Direcionados, Fluxo Geodésico.

Abstract
In this work we present methods for a combinatorial description of the geodesic flow on a hyper-
bolic compact surface, with the intent of identifying how the topological parameters of the surface
may be associated with discrete sequences. This approach allows to conjugate the topological and
combinatorial properties of a surface with concepts of information theory and coding.
We determine the intrinsic topological property of complete and time-invariant discrete dynami-
cal systems whose trajectories are bi-infinite sequences over a finite alphabet. The same structure
generated by the geodesic flow coding methods, that we call shift space.
We show how a shift space can be completely characterized by the irreducible forbidden set and
locally by the constraint sets, and how both can be obtained through partial order relations. As
consequence of these results, some constructions to represent the shift spaces are proposed.
Methods for coding source sequences on hyperbolic surfaces are proposed, based on Γ-piecewise
and common-sets relations that exist between these methods. We conclude by specifying a construc-
tion procedure for presentations of arithmetic codes that is related with the topological and combina-
torial properties of the hyperbolic surface.
Keywords: Dynamical Systems, Symbolic Dynamics, Formal Language, Constraints Set, Direc-
ted Graph, Geodesic Flow.

v
vi
Agradecimentos

Ao meu orientador Professor Doutor Reginaldo Palazzo Júnior pela oportunidade e incentivo para o
desenvolvimento deste trabalho.

A Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) pelo apoio financeiro (Bolsa
DR-II, processo 06/60976-8) concedido durante o perı́odo de março de 2007 a fevereiro de 2011, sem
o qual não seria possı́vel a realização do Programa de Doutoramento em Engenharia Elétrica.

A receptividade e acolhimento da FEEC / UNICAMP.

Aos Professores Cecilio José Lins Pimentel e José Roberto Rios Leite pela parceria e comentários
relevantes durante a realização do trabalho.

Aos membros da banca pelos comentários e sugestões para o enriquecimento deste trabalho.

Aos colegas de pós-graduação pelo apoio.

Pela ajuda e estı́mulo constante dos meus pais.

vii
viii
Aos meus pais e irmãs
DEDICO

ix
x
Sumário

Lista de Figuras xv

Lista de Tabelas xvii

Lista de Sı́mbolos xix

Trabalhos Publicados Pelo Autor xxi

1 Introdução 1

2 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica 5


2.1 Estrutura Básica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.1 Linearidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.2 Invariante no tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.3 Simetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 O Conceito de Memória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.1 Concatenação e mapa não-antecipativo . . . . . . . . . . . . . . . . . . . . 11
2.2.2 Completude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2.3 Extensão da memória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.4 Dividindo variáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2.5 Sistema de variáveis de estado . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2.6 Sistemas autônomos, controláveis e essenciais . . . . . . . . . . . . . . . . 16
2.3 Leis de Evolução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3.1 A lei de evolução induzida por uma representação via espaço de estados . . . 19
2.3.2 Lei de evolução de um sistema determinı́stico . . . . . . . . . . . . . . . . . 20
2.3.3 Fluxos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.4 Exemplos de casos contı́nuos e discretos . . . . . . . . . . . . . . . . . . . . 24
2.4 A Topologia de Sistemas Dinâmicos Discretos Invariantes no Tempo e Completos . . 29
2.4.1 Homeomorfismo e codificação . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.5 A Dinâmica Simbólica dos Sistemas Dinâmicos . . . . . . . . . . . . . . . . . . . . 34

3 Dinâmica Simbólica e Autômatos 37


3.1 Monoide e Semigrupo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2 Relações e Congruências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.3 Cálculo de Divisão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

xi
xii SUMÁRIO

3.4 Linguagens Regulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47


3.5 Autômato Mı́nimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.6 Morfismo Sintático e Monoide Sintático . . . . . . . . . . . . . . . . . . . . . . . . 55
3.7 Conceitos sobre Relação de Ordem Parcial . . . . . . . . . . . . . . . . . . . . . . . 58
3.8 Alguns Conceitos Sobre Linguagem Formal . . . . . . . . . . . . . . . . . . . . . . 59
3.9 Conjuntos Proibidos e Conjuntos de Restrição . . . . . . . . . . . . . . . . . . . . . 60
3.10 Cálculo dos Conjuntos Proibidos e Conjuntos de Restrições . . . . . . . . . . . . . . 67
3.11 Obtenção da Estrutura Algébrica através dos Conjuntos de Proibições e Restrições . 71
3.12 O Autômato Minimal de uma Linguagem FPR . . . . . . . . . . . . . . . . . . . . . 83

4 Geometria Hiperbólica 87
4.1 Conceitos Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.2 O Plano Hiperbólico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.3 Grupo de Isometrias do Plano Hiperbólico . . . . . . . . . . . . . . . . . . . . . . . 92
4.4 Grupo Fuchsiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.5 Superfı́cies Hiperbólicas e Regiões Fundamentais . . . . . . . . . . . . . . . . . . . 97

5 Códigos Geodésicos 105


5.1 Conceitos Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
5.2 Códigos de Koebe-Morse e Artin: Estudo de caso . . . . . . . . . . . . . . . . . . . 110
5.2.1 O método de codificação de Koebe-Morse . . . . . . . . . . . . . . . . . . . 111
5.2.2 O método de expansão do bordo . . . . . . . . . . . . . . . . . . . . . . . . 112
5.2.3 Representação do fluxo geodésico . . . . . . . . . . . . . . . . . . . . . . . 113
5.2.4 Aplicando os conceitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
5.3 Codificação do Fluxo Geodésico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
5.3.1 Determinando uma região fundamental apropriada . . . . . . . . . . . . . . 116
5.3.2 Código de Koebe-Morse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
5.3.3 Código de Artin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
5.4 Representação Geométrica e Aritmética do Fluxo Geodésico . . . . . . . . . . . . . 122
5.4.1 Estendendo o conjunto de sequências código . . . . . . . . . . . . . . . . . 124
5.5 Estrutura e Entropia do SFT Inerente ao Código Aritmético . . . . . . . . . . . . . . 126
5.5.1 Definindo a estrutura da região fundamental . . . . . . . . . . . . . . . . . . 127
5.5.2 Maior ssf-completo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
5.5.3 Entropia Topológica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

6 Representação de Códigos Geodésicos 133


6.1 Ciclos de Vértices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
6.2 Representação Simbólica de Pontos sobre ∂D2 . . . . . . . . . . . . . . . . . . . . . 136
6.3 Códigos de Artin para o Caso da Tesselação {12, 4} . . . . . . . . . . . . . . . . . . 145

7 Conclusões 153
7.1 Encaminhamentos e Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . 154

Referências Bibliográfica 157


SUMÁRIO xiii

Índice Remissivo 161


xiv SUMÁRIO
Lista de Figuras

2.1 Modelo apresentado por Willems. . . . . . . . . . . . . . . . . . . . . . . . . . . . 6


2.2 Modelo Clássico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 Modelo do comportamento térmico do circuito elétrico. . . . . . . . . . . . . . . . . 7
2.4 Relação entre as posições w
~1 e w
~ 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.5 Representação de um sistema controlável. . . . . . . . . . . . . . . . . . . . . . . . 16
2.6 Somador completo serial representado via espaço de estados. . . . . . . . . . . . . . 27
2.7 Autômato do sistema de eventos discretos associado ao somador completo serial. . . 28

3.1 Diagramas de comutação das expressões RC RB = RBC , LX RC = RC LX , e LXB =


LX LB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.2 A C-trie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.3 A D-trie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.4 Autômato Σ(O) obtido através do algoritmo L-AUTOMATON. . . . . . . . . . . . . 78
3.5 O autômato M(O). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

4.1 Exemplo de geodésicas em H2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90


4.2 Exemplo de geodésicas em D2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.3 Ângulo hiperbólico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.4 Triângulos hiperbólicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.5 Tesselação {8, 4}, mostrando a identificação de arestas realizada pelos geradores. . . 103
4.6 Tesselação {8, 4}, mostrando ação transitiva de Γ, onde ḡ = g −1. . . . . . . . . . . . 104

5.1 Fluxo geodésico sobre D2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107


5.2 Região fundamental. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.3 Curvas fechadas em M. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.4 Codificação do fluxo geodésico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
5.5 Esfera com três buracos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.6 Cobertura de M em D2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
5.7 Imagem das arestas de F , com vértices pares, sobre a superfı́cie associada. . . . . . . 118
5.8 Geodésica através de um vértice. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
5.9 Geodésica em T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
5.10 Possı́veis deformações de uma geodésica orientada quando intercepta um vértice. . . 122
5.11 Possı́veis discrepâncias entre os conjuntos A e R. . . . . . . . . . . . . . . . . . . . 123
5.12 Modelo de sistema para sequências código restritas a A ∩ R. . . . . . . . . . . . . . 124
5.13 Modelo de sistema para sequências em R. . . . . . . . . . . . . . . . . . . . . . . . 126

xv
xvi LISTA DE FIGURAS

5.14 Região fundamental. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

6.1 Relação entre ciclo de vértices e sequência de geradores. . . . . . . . . . . . . . . . 135


6.2 L-ciclo consecutivos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
6.3 R-ciclo consecutivos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
6.4 Configuração ao considerar-se um R-ciclo como fator de uma L-cadeia. . . . . . . . 139
6.5 Configuração ao considerar-se uma sequência gg −1 como fator de uma L-cadeia. . . 139
6.6 Região fundamental e identificação de arestas da tesselação {12, 4}. . . . . . . . . . 146
6.7 Autômata inicial parcial do código para tesselação {12, 4}. . . . . . . . . . . . . . . 149
6.8 Representação determinı́stica mı́nima parcial do código para a tesselação {12, 4}. . . 151
Lista de Tabelas

2.1 R ELACIONANDO C ONCEITOS DE M EM ÓRIA . . . . . . . . . . . . . . . . . . . . . . . . 14


2.2 F ORMAS APRESENTADAS PARA REPRESENTAÇ ÃO DE SISTEMAS DIN ÂMICOS . . . . . . . 29

3.1 C LASSES DE E QUIVAL ÊNCIA À D IREITA . . . . . . . . . . . . . . . . . . . . . . . . . 74


3.2 C LASSES DE E QUIVAL ÊNCIA À E SQUERDA . . . . . . . . . . . . . . . . . . . . . . . . 74
3.3 R EPRESENTANTES DAS CLASSES N ÃO NULAS E PARES ORDENADOS (ij) ASSOCIADOS . . 82

xvii
xviii LISTA DE TABELAS
Lista de Sı́mbolos

Σ - Sistema dinâmico
B - Comportamento de um sistema dinâmico
Σa - Sistema dinâmico com variáveis latentes
ΣS - Sistema dinâmico na forma de espaço de estados
Σ∂ - Sistema dinâmico descrito por lei de evolução
Bcompl - Complementação de B
(X, σ) - Sistema simbólico fechado (ssf)
X - Conjunto de sequências bi-infinitas de um ssf
σ - Função deslocamento
(w)i - Conteúdo da posição i de w
d(x, y) - Distância entre os pontos x, y em um espaço métrico M
Z
CkA (u) - Conjunto cilindro
B(X) - Linguagem de X
(S, ·) - Semigrupo com operação “·”
1 - Elemento identidade de um monoide
A∗ - Monoide livre com base A
ϕ - Morfismo
r - Relação de equivalência
∼r - Relação de equivalencia r
X/r - Conjunto quociente de X por r
Σa - Autômato acessı́vel
L - Linguagem ou comportamento de um autômato
ϕL - Morfismo sintático de L
(X, )
V - Conjunto parcialmente ordenado
WY - Maior limite inferior de Y , se existir
Y - Menor limite superior de Y , se existir
FPR - Fatorial prolongável e regular
FTR - Fatorial transitiva e regular
S(·) - Conjunto de sufixos
P(·) - Conjunto de prefixos
O - Conjunto proibido irredutı́vel
Ow - Conjunto minimal de w-proibições
R(w, L) - Contexto à direita de w com relação a linguagem L
L(w, L) - Contexto à esquerda de w com relação a linguagem L

xix
xx LISTA DE SÍMBOLOS

Cw - Conjunto de restrições à direita de w


Dw - Conjunto de restrições à esquerda de w
Ci - i-ésima C-classe de equivalência
Di - i-ésima D-classe de equivalência
T - trie (tree like automaton)
(G, ·) - Grupo com operação “·”
G1 × G2 - Produto direto dos grupos G1 com G2
G1 × G2 - Produto semi-direto de G1 por G2 com homomorfismo σ
σ
X/G - Conjunto de órbitas de X sobre ação de G
H2 - Modelo do semi-plano superior do plano hiperbólico
D2 - Modelo do disco de Poincaré do plano hiperbólico
∂H2 - Fronteira de H2
∂D2 - Fronteira de D2
µ(A) - Área hiperbólica de uma região A contida em H2 ou D2
SL(2, R) - Grupo especial linear
PSL(2, R) - Grupo especial linear projetivo
Isom(H2 ) - Grupo de isometrias de H2
Tr(T ) - Traço de uma transformação de Möbios T
Γ - Grupo fuchsiano Γ
Λ(Γ) - Conjunto limite de Γ
Dp (Γ) - Região de Dirichlet para Γ com centro em p
Γ0 - Conjunto simétrico de geradores de Γ
SM - Fibrado tangente unitário de uma superfı́cie M
T - Tesselação
LD - Conjunto de L D-ciclos
LH - Conjunto de L H-ciclos
RH - Conjunto de R H-ciclos
LS - Conjunto de L S-ciclos
LHC - Conjunto de L H-cadeias
Trabalhos Publicados Pelo Autor

1. D. P. B. Chaves, R. Palazzo Jr., J. R. R. Leite. “Properties of an Arithmetic Code for Geodesic Flows”.
Journal of Physics: Conference Series, vol. 285, pp. 1-10, 2011.

2. D. P. B. Chaves, R. Palazzo Júnior. “Presentations of Constrained Control Sequences for Symbolic Models
of Systems”. Anais of The 2nd International Multi-Conference on Complexity, Informatics and Cybernetics
(IMCIC 2011), Orlando, EUA, pp. 72-77, Março 2011.

3. D. P. B. Chaves, R. Palazzo Júnior. “Properties of an arithmetic code for geodesic flows”. Proceedings of
the Dynamics Days South America, São José dos Campos: INPE, Brasil, Julho 2010.

4. D. P. B. Chaves, R. Palazzo Júnior. “About the syntatic monoid of FP-languages”. Proceedings of The XXI
School of Algebra, Brası́lia: UNB, Brasil, Julho 2010.

xxi
xxii
Capı́tulo 1

Introdução

Ao restringirmos as propriedades de uma estrutura matemática, ou equivalentemente, tornarmos seu


comportamento mais rı́gido e suas propriedades mais inflexı́veis, muitas vezes abrimos caminho
para resultados que descrevem-na com uma riqueza de detalhes estonteante, conduzindo o obser-
vador à perplexidade e contemplação que muitas vezes o inibem de perceber de forma imparcial as
implicações inexoráveis, a saber, a rigidez do modelo e a limitação de sua abrangência.
Este fato foi reconhecido por Willems, sendo o elemento motivador para a proposição de uma
abordagem mais geral para sistemas dinâmicos [1], que tem como premissa reconhece-los como es-
truturas que apresentam comportamento e propriedades especı́ficos, o que torna meritório os esforços
visando seu entendimento e aplicação, mas que não faz uso de pré-suposições que visam estabelecer
condições de necessidade para aplicação de ferramentas analı́ticas poderosas.
Empregando a abordagem de Willems, Forney e Trott interpretaram um código sobre grupo C
como um sistema dinâmico [2] (o código C pode ser um código de bloco, código convolucional,
reticulado, código de treliça, código geometricamente uniforme, sistema linear discreto no tempo,
entre outros), que quando completo, permite a caracterização consistente do código a partir de um
diagrama de treliça ou codificador minimal. Como decorrência dessa abordagem, os autores determi-
naram métodos sistemáticos para construção de codificadores, além de especificarem parâmetros bem
definidos para avaliação do desempenho e complexidade do código e do codificador. Esta abordagem
também permitiu que fossem generalizados alguns resultados para um maior conjunto de tipos de
códigos, que antes só haviam sido determinados para sistemas sobre corpos e invariantes no tempo.
Um ponto fundamental ressaltado em [2] é a necessidade da completude dos códigos sobre grupo
para a efetiva construção dos codificadores. Este fato foi reconhecido por Rossin, Sindhushayana
e Heegard em [3], ao proporem a extensão dos códigos de Slepian [4] para códigos sobre treliça.
Neste trabalho os autores partem do caso introduzido por Slepian, a saber, consideram uma semente
x0 ∈ Rn e um grupo finito de transformações lineares G a partir do qual definem o código de grupo

1
2 Introdução

de Slepian G(x0 ). Como extensão natural para o caso de uma treliça bi-infinita, consideram o produto
direto bi-infinito G Z de G, gerando o código de grupo sobre treliça G Z (x0 ). Os grupos de treliça não
triviais surgem quando consideramos a ação sobre x0 de subgrupos próprios Λ de G Z , neste caso,
para que possamos garantir a determinação de codificadores para Λ(x0 ) e respectivos decodificadores
não catastróficos, como demonstrado em [3], é necessário que Λ seja um sistema simbólico fechado
sobre grupo, o caso central abordado em [2]. Entre os vários problemas em aberto identificados pelos
autores, destacamos a necessidade de métodos algorı́tmicos para a construção de sistemas simbólicos
fechados sobre grupos que representem todas as simetrias de um código de grupo sobre treliça.
Assim como os códigos de Slepian estabeleceram os elementos geminais para posterior introdução
por Forney dos códigos geometricamente uniformes [5], os conceitos apresentados em [3] formam
a base para a generalização dos códigos geometricamente uniformes para espaços de sequências em
[6]. A generalização dá-se pela substituição da estrutura euclidiana por um sistema simbólico fechado
homogêneo Y que sofre a ação de um sistema simbólico fechado sobre grupo X, nesse caso dizemos
que X é o sistema simétrico de Y.
Muitos dos resultados relevantes em [2, 3, 6] são estabelecidos pela aplicação de representações
minimais canônicas através de grafos direcionados dos sistemas simbólicos fechados sobre análise.
Essa é uma abordagem comum no desenvolvimento da teoria de dinâmica simbólica, que com a ex-
tensão de seu escopo para aplicações de natureza combinatorial, passou a adotar resultados e métodos
oriundos da teoria de autômato para abordar problemas de natureza algorı́tmica, e a adotar álgebra
linear como ferramenta para determinar parâmetros globais invariantes a conjugação dos sistemas
simbólicos fechados, como a entropia topológica. Nesse contexto, como primeira contribuição, in-
troduzimos no Capı́tulo 3 um método combinatorial derivado da estrutura topológica dos sistemas
simbólicos fechados, obtido pela aplicação de relações de ordem parcial. Ao contrário dos métodos
anteriores, que aplicam ferramentas oriundas da teoria de autômato em dinâmica simbólica, deriva-
mos uma ferramenta combinatorial baseada na teoria de autômata e linguagens formais a partir das
propriedades topológicas intrı́nsecas dos sistemas simbólicos fechados. Como resultados dos concei-
tos apresentados, além de propormos novos métodos para a determinação de representações canônicas
minimais, pudemos especificar o monóide sintático do sistema simbólico fechado e um método para
implementarmos sua operação a partir de autômatos. Acreditamos que a maior relevância deste re-
sultado reside tanto no potencial das ferramentas introduzidas para análise e determinação de sis-
temas simbólicos fechados com propriedades especı́ficas estabelecidas pelas aplicações citadas nos
parágrafos anteriores, como para construção de codificadores para estes sistemas.
Em seguida, consideramos a possibilidade de associar às sequências código especificadas por um
sistema simbólico fechado propriedades topológicas herdadas possivelmente da estrutura algébrica
subsequente à topologia da superfı́cie. Essa abordagem é motivada pelos trabalhos desenvolvidos no
3

grupo de pesquisa que visam estabelecer um modelo para sistema de comunicação concebido sobre
um espaço hiperbólico. Como referência inicial, citamos a extensão do conceito de códigos geo-
metricamente uniformes para espaços hiperbólicos [7]. A partir desse trabalho, vários outros foram
desenvolvidos que estenderam os resultados, ou inovaram com a aplicação da geometria hiperbólica a
outros elementos constituintes de um sistema de comunicação tı́pico. Em nosso trabalho, procuramos
identificar formas de atribuir a nossas sequências código propriedades topológicas de uma superfı́cie
hiperbólica (de gênero maior que dois). Estas propriedades se refletem nas classes homotópicas ob-
tidas a partir de uma dada superfı́cie, que por sua vez deverão induzir padrões nas sequências código
obtidas a partir dessas curvas. Estas relações são verificadas no processo de codificação geométrico,
aqui denominado código de Koebe-Morse [8]. No entanto, as sequências códigos obtidas por este
processo são demasiadamente complexas, no sentido de não possuirem uma representação através
de grafo direcionado. Como alternativa, há os códigos aritméticos, aqui denominados códigos de
Artin, que apesar de não refletirem de forma tão evidente as propriedades topológicas da superfı́cie,
é sabido (apesar de não determinado na literatura) que possuem uma representação através de grafos
direcionados. A partir de resultados apresentados em [8], propomos no Capı́tulo 5 duas possı́veis
abordagens que conduzam a representações de sequências código do fluxo geodésico, ambas basea-
das na determinação de uma representação para o código de Artin. Assim, no Capı́tulo 6 desenvolve-
mos um método baseado unicamente nos ciclos de geradores da região fundamental para construção
de uma representação minimal para o código de Artin, exemplificando nosso método através dos
códigos propostos em [9]. Estes resultados estabelecem elementos iniciais necessários a aplicação
da abordagem de Willems e teoria de dinâmica simbólica, assim como realizado em [2, 3, 6], para
análise e proposição de códigos e codificadores aos quais possamos atribuir propriedades de natureza
topológica.
A seguir apresentamos uma breve descrição dos tópicos e resultados apresentados nos capı́tulos
que compõem a tese. Onde todos os resultados não referenciados explicitamente, decorrem do desen-
volvimento do nosso trabalho.
No Capı́tulo 2 empregando a abordagem topológica para dinâmica simbólica, na Proposição 6
formalizamos a equivalência entre sistemas dinâmicos invariantes no tempo e completos, introduzidos
em [1], e sistemas dinâmicos simbólicos fechados (ssf), este último o objeto central de estudo da teoria
de dinâmica simbólica.
No Capı́tulo 3 demonstramos como as propriedades topológicas de um ssf podem ser representa-
das combinatorialmente através de um conjunto irredutı́vel de sequências proibidas, especificado por
uma relação de ordem parcial apropriada. A mesma idéia que permite-nos determinar um conjunto
irredutı́vel de sequências proibidas para o ssf pode ser estendido para a determinação de um conjunto
irredutı́vel de sequências proibidas para qualquer fator de uma sequência em ssf. Demonstramos
4 Introdução

como essas caracterizações combinatórias global e local, respectivamente, podem ser empregadas
para a construção de estruturas algébricas (monóide sintático) e representações mı́nimas (autômato
mı́nimo) para o ssf. Resultados que estabelecem os fundamentos para aplicação dos ssf em sistemas
de codificação realizáveis.
No Capı́tulo 4 apresentamos os elementos necessários para apreciação dos resultados posteriores
sobre códigos geodésicos. Em particular, apresentamos os conceitos fundamentais sobre geometria
hiperbólica bidimensional, com ênfase no modelo do disco de Poincaré. Explicitamos a relação que
há entre as propriedades algébricas e topológicas dos elementos do grupo fuchsiano e as propriedades
topológicas da superfı́cie hiperbólica associada.
No Capı́tulo 5 apresentamos as duas classes de códigos do fluxo geodésico, os aritméticos e os
geométricos. Explicitamos a diferença entre estas e o reflexo dessa nas propriedades do código, prin-
cipalmente na complexidade do código gerado, o que é transcrito na capacidade ou não de representar-
se o código através de um grafo direcionado rotulado. Nossa abordagem é baseada em [8], que
permite uma clara comparação entre estes métodos de codificação. Nas Seção 5.5 derivamos propri-
edades estruturais e determinamos a topologia do caso particular apresentado em [9], a saber, de uma
tesselação regular {8g − 4, 4}, onde g é o gênero da superfı́cie. Cuja importância deve-se a possibili-
dade de especificar-se explicitamente a medida invariante do fluxo geodésico associado às respectivas
superfı́cies.
No Capı́tulo 6, empregando os resultados apresentados no Capı́tulo 3, derivamos um método sim-
ples, baseado nas propriedades topológicas do grupo fuchsiano associado a superfı́cie, para gerar uma
representação mı́nima para o código do fluxo geodésico discutido no Capı́tulo 5. É sabido que esse
código possui uma representação, contudo, até onde sabemos, sua determinação (não necessariamente
mı́nima) empregando os métodos disponibilizados na literatura envolve etapas cuja complexidade é
exponencial em relação ao número de estados. Nosso método de determinação de uma representação
mı́nima não necessita de cálculos adicionais, a não ser a determinação de um subconjunto finito de
sequências proibidas decorrentes das propriedades topológicas do grupo fuchsiano associado à su-
perfı́cie, seguido pela determinação dos vértices e ramos da apresentação derivados diretamente do
conjunto de proibições.
Finalmente, no Capı́tulo 7 apresentamos as conclusões e os trabalhos futuros.
Capı́tulo 2

Sistemas Dinâmicos, Códigos e Dinâmica


Simbólica

Considerando uma abordagem clássica, a descrição dos sistemas dinâmicos é realizada pela especi-
ficação da evolução do seu espaço de estados. Como exemplo notório e importante, têm-se o estudo
dos sistemas dinâmicos no contexto de equações diferenciais. Nesta abordagem é pressuposto que o
estado evolui de maneira autônoma, ou seja, o caminho descrito no espaço de estado só depende do
estado inicial e das leis de movimento. Portanto, a não ser para algumas situações bem definidas em
sistemas mecânicos e elétricos, a abordagem clássica não deixa claro como as variáveis de estado de-
vem ser especificadas. Além do que, esta abordagem não formaliza como influências externas devem
ser incorporadas, equivalendo a uma evolução do sistema com base unicamente nas forças internas.
Decorre da suposição que o estado evolui de forma determinı́stica, que o sistema encontra-se iso-
lado do ambiente, contudo não existem sistemas isolados. A abordagem clássica assume que a forma
como o ambiente influencia o sistema é conhecida, como também as condições de contorno e como
são geradas as influências externas. Em sı́ntese, ao modelar-se um sistema dinâmico real através de
uma abordagem clássica, em última instância, deparamo-nos com a impossı́vel suposição de termos
que modelar o ambiente.
Um contraponto aos métodos clássicos é apresentado por Willems em [1]. Inspirado em abor-
dagens tı́picas de teoria de circuitos, controle e processamento digital de sinais, como também de
ciência da computação; sua abordagem considera o sistema dinâmico como uma caixa preta que re-
cebe estı́mulos do meio (entradas), e como reação a estes produz uma saı́da. O conceito é similar
ao empregado em teoria de controle, incorporando variáveis de estado a estrutura especificada pelas
entradas e saı́das. O sistema dinâmico passa a ser visto como um objeto que está inserido em seu meio
e interage com este, no entanto é abstraı́do deste, como ilustrado na Figura 2.1. Nesta abordagem,
desejamos determinar a evolução de certos atributos em função do tempo, para isso o conjunto de ins-

5
6 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica

Modelo do w Meio
Sistema Modelo do w Modelo do
Desconhecido
Dinâmico Σ Variáveis de Sistema Meio
Interação Dinâmico Σ Variáveis de
Interação

Figura 2.1: Modelo apresentado por


Figura 2.2: Modelo Clássico.
Willems.

tantes de tempo relevantes T é selecionado e o conjunto W onde os valores de tais atributos podem
ser observados. As leis que regem a evolução da dinâmica no tempo determinam quais trajetórias
podem ocorrer e quais não podem, especificando o comportamento do sistema.
Nesta abordagem, quaisquer relações que especifiquem a dinâmica (e.g., as equações do modelo)
são empregadas como os elementos básicos para o processo de análise, determinando as considerações
iniciais a partir das quais a análise deve prosseguir, e que devem ser empregados na fundamentação
teórica do sistema dinâmico. Quaisquer pré-considerações sobre o modelo devem ser justificadas pelo
aparato teórico empregado na modelagem. Esta visão contrasta com a clássica, onde o meio também
é visto como um sistema dinâmico especı́fico, o que torna possı́vel considerar-se o sistema dinâmico
sobre análise como autônomo, como consequência o meio deve ser modelado, como ilustrado na
Figura 2.2.
Em consonância com a proposta apresentada, um sistema dinâmico é interpretado como uma
famı́lia de regras que restringem o conjunto de sinais produzidos pelo sistema dinâmico, e por-
tanto, que determinam o comportamento do sistema. O conjunto de todos os sinais compatı́veis
com estas regras definem o comportamento do sistema. No entanto, regras e modelos derivados de
princı́pios fundamentais conterão invariavelmente variáveis adicionais àquelas modeladas, denomi-
nadas de variáveis latentes. Algumas variáveis latentes podem ter propriedades importantes relacio-
nadas a captura da estrutura da memória do sistema, o que conduz ao importante conceito de estado
do sistema dinâmico. Estes elementos são ilustrados no Exemplo 1.

Definição 1. Um sistema dinâmico Σ é definido por uma tripla

Σ = (T, W, B)

onde T ⊆ R é o tempo; W é um conjunto abstrato chamado de alfabeto de sinais; e B ⊆ W T é o


comportamento.

O conjunto T refere-se aos instantes de tempo relevantes para o problema considerado. Usual-
7

w
~1
m
I RC RL

L F~
V ~1z

C L
Sistema w
~2
Meio

Figura 2.3: Modelo do comportamento Figura 2.4: Relação entre as posições w


~1
térmico do circuito elétrico. ew~ 2.

mente, T é igual a R ou R+ no caso de sistemas em tempo contı́nuo, e Z ou Z+ no caso de sistemas em


tempo discreto, também sendo definido em intervalos de R e Z. O conjunto W especifica os atributos
do sistema dinâmico que são formalizados como elementos de um conjunto, sendo estes atributos
as variáveis cujas evoluções no tempo estão sendo descritas. Tais atributos são uma combinação de
variáveis observadas e das variáveis que propiciam a interação do sistema com o meio. O comporta-
mento B constitui a famı́lia de trajetórias descritas no tempo com valores no alfabeto W . Assim, os
elementos de B são as trajetórias compatı́veis com as regras ou leis que governam o sistema, de outra
forma, são sinais definidos no tempo compatı́veis com o modelo do sistema dinâmico. Em muitas
aplicações B é determinado através de equações diferenciais, a diferença ou integrais. Neste caso,
podemos considerar um mapa b : W T → E com E = {0, 1}, ou ainda, de forma mais geral, um
espaço vetorial onde B = b−1 (0). Denotando as equações que especificam o sistema por equações de
comportamento.

Exemplo 1. A análise do comportamento térmico de um circuito elétrico é um caso tı́pico de constru-


ção de um modelo dinâmico a partir de princı́pios fı́sicos fundamentais ou princı́pios primeiros1 . O
circuito interage com o meio externo através de suas portas externas, o que é descrito pela corrente I
através do circuito e a tensão V nos seus terminais externos. Desta forma, obtemos que W = R2 e
T = R. Para especificar o comportamento térmico do circuito, serão introduzidas a corrente através
dos ramos e a tensão sobre os ramos do circuito Figura 2.3, de forma a serem satisfeitas as equações
constituintes em (2.1).

VRC = RC IRC ; VRL = RL IRL ; C V̇C = IC ; L IL = VL (2.1)

1
e.g., sistema axiomático ou leis fundamentais da fı́sica.
8 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica

Além de satisfazer a lei de Kirchhoff para corrente (2.2) e a lei de Kirchhoff para tensão (2.3).

I = IRC + IRL ; IRC = IC ; IRL = IL (2.2)

V = VC + VRC = VL + VRL (2.3)

Portanto, o comportamento da porta é formalmente definido em (2.4).

B ={(I, V) : R → R2 |∃ (IRC , VRC , IRL , VRL , IC , VC , IL , VL ) : R → R8


(2.4)
satisfazendo as equações de comportamento (2.1), (2.2) e (2.3)}.

Após a eliminação das variáveis IRC , VRC , IRL , VRL , IC , VC , IL , VL , obtém-se como equação de
comportamento a equação diferencial (2.5).

RC LC Ï + (L + RC RL C)İ + RL I = LC V̈ + (RC + RL )C V̇ + V (2.5)

Permitindo a especificação explı́cita do comportamento em (2.6).

B = {(I, V) : R → R2 | satisfazendo a equação (2.5)} (2.6)

No Exemplo 1 a descrição das variáveis básicas V, I foi obtida a partir de princı́pios fundamentais.
Contudo, o processo de modelagem envolveu variáveis auxiliares adicionais àquelas descritas, neste
caso IRC , VRC , IRL , VRL , IC , VC , IL , VL , correspondendo às variáveis latentes. A inserção destas
variáveis ocorre essencialmente por tornarem-se convenientes na escrita das equações de movimento,
ou por serem essenciais ao expressar as leis de constituição2 ou de conservação3 que definem o com-
portamento do sistema. Variáveis latentes ocorrem invariavelmente quando o sistema modelado for
tratado como uma interconexão de subsistemas, uma abordagem comum na determinação de mode-
los. Este procedimento é mais uma vez exemplificado no Exemplo 2, onde as variáveis externas dos
subsistemas tornam-se variáveis latentes para o sistema interconectado.

Exemplo 2. Considerando o pêndulo da Figura 2.4. Deseja-se modelar a relação entre as posições
w
~ 1 da massa e w
~ 2 do suporte do pêndulo, podendo ser interpretado como o passo inicial no projeto de
um controlador que estabilize w
~ 1 em uma dada trajetória pelo emprego de w
~ 2 como controle. Como
2
Expressas por relações entre quantidades fı́sicas que são especı́ficas de um material ou substância, aproximando
a resposta do material a forças externas. Ao serem combinadas com equações que expressam leis fı́sicas, permitem a
solução de problemas fı́sicos como a resposta de um cristal a um campo elétrico. Em muitos casos são expressas por
proporções simples, como é o caso da condutividade elétrica ou constante de elasticidade de uma mola.
3
Especifica quando uma propriedade mensurável de um sistema fı́sico isolado não muda enquanto o sistema evolui,
e.g., conservação da massa-energia e da carga elétrica do sistema.
9

ocorre quando w~ 1 representa o centro de massa de um veı́culo lançador de satélites e w


~ 2 a saı́da do
sistema de propulsão. Para obtenção de um modelo para este sistema, inserimos a força F~ na barra
de comprimento L e o fator de proporcionalidade a entre F~ e w
~1 − w
~ 2 como variáveis auxiliares.
Obtém-se as equações de comportamento (2.7).

d2 w
~1
m = mg~1z + F~
dt2
||w
~1 − w
~ 2 || = L (2.7)

F~ = a(w
~1 − w
~ 2)

Onde m e a massa do pêndulo, g é a constante gravitacional e ~1z é o vetor unitário na direção z. As


equações em (2.7) especificam completamente o comportamento definido em (2.8).

B = {(w
~ 1, w ~ : R → R3 e a : R → R satisfazendo (2.7)}.
~ 2) : R → R3 × R3 |∃ F (2.8)

Assim como as tensões e correntes sobre os elementos resistivos, capacitivos e indutivos do Exem-
~ na barra
plo 1 foram empregados como variáveis auxiliares à determinação de um modelo, a força F
do pêndulo e o fator de proporcionalidade a cumpre papel similar. Novamente, a análise do sistema
envolve a interconexão de seus componentes constituintes, cujas especificações dos comportamentos
através das relações entre variáveis de entrada e saı́da sabemos descrever, cujas descrições parciais
envolvem variáveis latentes empregadas na determinação da solução global.

Não só na análise de sistemas reais, como também em abordagens puramente teóricas, as variáveis
latentes assumem um papel relevante. Pois, assim como as variáveis de estado ou as variáveis livres,
são necessárias na redução de equações de movimento à expressões puramente locais no tempo.
Em uma primeira análise, podemos considerar dois tipos de variáveis: as diretamente observáveis
(explı́citas) e as latentes (implı́citas). Como exemplo, em termodinâmica a pressão, temperatura e
volume são variáveis explı́citas, enquanto a energia interna e entropia podem ser consideradas como
variáveis latentes, cujo valor é deduzido a partir das variáveis explı́citas. Em um contexto econômico,
o número de vendas pode ser visto como uma variável explı́cita, enquanto a demanda dos consu-
midores como uma variável latente. Especificar que variáveis são observáveis ou mensuráveis está
relacionado a disponibilidade instrumental e tecnológica, sendo um conceito flexı́vel que adequa-se
aos objetivos da análise. O conceito de variáveis latentes é formalmente estabelecido na Definição 2.

Definição 2. O sistema dinâmico com variáveis latentes é uma quádrupla

Σa = (T, W, A, Ba )
10 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica

com T, W já especificados na Definição 1; A é o conjunto de variáveis latentes e Ba ⊆ (W × A)T o


comportamento (estendido).

O sistema Σa é chamado de um modelo com variáveis latentes para o sistema dinâmico induzido
Σ = (T, W, Pw Ba ), onde Pw : (W × A)T → W T satisfaz (Pw w)(t) = Pw (w(t)), reduzindo-se a
uma projeção quando aplicado a um elemento de W × A, ou seja, Pw (w, a) := w. Na abordagem
considerada, pode-se interpretar Ba como o comportamento interno do sistema, enquanto Pw Ba como
o comportamento externo.

2.1 Estrutura Básica


Muitos conceitos gerais em matemática podem ser aplicados a sistemas dinâmicos quando introduzi-
dos através da Definição 1.

2.1.1 Linearidade
Um sistema dinâmico Σ = (T, W, B) é dito linear se W é um espaço vetorial e B é um subespaço
linear de W T , este último um espaço vetorial obtido pela adição ponto-a-ponto e multiplicação por
escalar.

2.1.2 Invariante no tempo


Um sistema dinâmico Σ = (T, W, B) é dito invariante no tempo se T é um semigrupo aditivo em R
(∀ t1 , t2 ∈ T ⇒ t1 + t2 ∈ T ) e σ t B ⊆ B para todo t ∈ T , onde σ t é o t-deslocamento à esquerda,
ou seja, (σ t f )(t′ ) := f (t′ + t). Ambos os exemplos introduzidos acima são casos tı́picos de sistemas
invariantes no tempo.

2.1.3 Simetria
Seja Σ uma famı́lia de sistemas dinâmicos. Cada elemento em Σ é um sistema dinâmico de acordo
com a Definição 1. Seja G um grupo e G = (Sg , g ∈ G) um grupo de transformações em Σ, ou
seja, cada Sg : Σ → Σ é uma bijeção com Sg1 ◦g2 = Sg1 ◦ Sg2 . O par ordenado (Σ, G) é chamado
de estrutura de simetria. Um elemento Σ ∈ Σ é dito G-simétrico se Sg Σ = Σ para todo g ∈ G.
De modo informal, diz-se que Σ possui G como uma simetria. Como exemplo de simetrias comuns,
pode-se citar:
2.2 O Conceito de Memória 11

(1) Seja T = G um subgrupo aditivo de R e Sg (T, W, B) = (T + g, W, σ g B). Neste caso, os sistemas


simétricos são aqueles invariantes no tempo.

(2) Seja (Sgw , g ∈ G) um grupo de transformações sobre W e Sg (T, W, B) = (T, W, Sg B), onde
Sg B = {Sg (w(·)) : T → W |w ∈ B}. A simetria resultante sugere um comportamento que
é invariante sobre algumas mudanças de sinal ou permutações dos componentes das variáveis
externas, e.g., a permutação de partı́culas em um sistema com n partı́culas idênticas.

(3) Seja G = {0, 1} e considere S1 (T, W, B) = (−T, W, RB) onde R é a inversão do eixo do tempo:
(Rf )(t) := f (−t). O sistema de simetria resultante é dito inversı́vel no tempo, como exemplos,
têm-se os sistemas descritos por equações diferenciais contendo só derivados de ordem par.

(4) Seja J uma involução sobre W (i.e., J = J−1 ). Considerando G = {0, 1} e S1 (T, W, B) =
(−T, W, JRB). A simetria resultante é algumas vezes chamada de reversão do tempo. A
involução J é empregado para expressar que pode ser necessário alterar o sinal da velocidade,
em alguns sistemas mecânicos, quando realiza-se uma reversão no tempo.

Nas considerações que seguem, nos restringiremos a explanação de sistemas invariantes no tempo,
particularmente nos casos T = R ou Z. Esta consideração deve-se principalmente ao enfoque em
dinâmica simbólica e a caracterı́stica conceitual do texto, o que faz destes casos mais adequados para
apresentação dos resultados.

2.2 O Conceito de Memória


Um dos aspectos dos sistemas dinâmicos que justificam o grande esforço a estes dedicado pela co-
munidade cientı́fica é o fato de apresentarem memória, ou seja, a evolução futura do sistema ser
influenciada pela sua evolução até o presente. Este aspecto é o que o diferencia de mapas e relações
arbitrárias. As propriedades da estrutura de memória do sistema, nos permite classificá-lo em quatro
tipos não excludentes.

2.2.1 Concatenação e mapa não-antecipativo


Quanto ao estudo de sistemas dinâmicos, o conceito de interação entre o passado e o futuro de famı́lias
de funções temporais assume papel fundamental, pela concatenação do passado e do futuro, e pelo
modo como o passado e o futuro interagem com mapas.
12 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica

Sejam T ⊂ R e W conjuntos. Para um dado mapa w : T → W definem-se os mapas:

w − := w|T ∩(−∞,0) (o passado estrito de w)


w −0 := w|T ∩(−∞,0] (o passado e presente de w)
w + := w|T ∩[0,∞) (o futuro estrito de w)
w 0+ := w|T ∩(0,∞) (o presente e futuro de w)

Para B ⊆ W T , estes conceitos conduzem às extensões B− , B−0 , B0+ , e B+ de significado imediato.
Sejam w1 , w2 : T → W e t ∈ T . As concatenações em t de w1 , w2 : T → W , representadas por
w1 Λ− w2 e w1 Λ+ w2 , são definidas como
t t


  w (t′ ) para t′ <t
′ 1
w1 Λ− w2 (t ) :=
t w (t′ ) para t′ ≥t
2

  w (t′ ) para t′ ≤t
′ 1
w1 Λ+ w2 (t ) :=
t  w (t′ ) para t′
2 >t

Para B1 , B2 ⊆ W T obtêm-se as extensões B1 Λ− B2 e B1 Λ+ B2 de significado imediato.


t t
Estas definições podem ser facilmente estendidas para os casos em que os mapas considerados já
possuem restrições. Assim, w1− Λ− w20+ := w1 Λ− w2 e w1−0 Λ+ w2+ := w1 Λ+ w2 , etc. Sendo pertinente sali-
0 0 0 0
entar que para o caso discreto (T = Z) observa-se Λ − = Λ+ , de tal forma que não há a necessidade
(t+1) t
de introduzirem-se ambos Λ− e Λ+ . Ressaltando a necessidade de ambos no caso contı́nuo.
t t

Seja T ⊆ R, W1 e W2 conjuntos, como também B1 ⊆ W1T , B2 ⊆ W2T . Consideremos o mapa F :


B1 → B2 . O mapa F seja denominado não-antecipativo se w1′ , w1′′ ∈ B1 , t ∈ T, e w1′ (t′ ) = w2′′ (t′ )


para t′ ≤ t ⇒ (F w1′ )(t′ ) para t′ ≤ t . O mapa F será chamado estritamente não-antecipativo se



 ′ ′′
w1 , w1 ∈ B1 , t ∈ T, e w1′ (t′ ) = w1′′ (t′ ) para t′ < t ⇒ (F w1′ )(t′ ) = (F w1′′)(t′ ) para t′ ≤ t .


2.2.2 Completude
Relacionado com a possibilidade das equações de comportamento serem escritas através de equações
a diferença, portanto, as equações de comportamento não podem se estender indefinidamente para
o passado, no sentido −∞, como também para o futuro, no sentido +∞. Dito isso, um sistema
dinâmico Σ = (T, W, B) é dito completo se,

{w ∈ B} ⇔ {w|[t0,t1 ] ∈ B|[t0 ,t1 ] : t0 , t1 ∈ R tal que − ∞ < t0 ≤ t1 < ∞}.


2.2 O Conceito de Memória 13

Sendo chamado de L-completo se,

{w ∈ B} ⇔ {w|[t,t+L] ∈ B|[t,t+L] : ∀ t ∈ T }.

Se um sistema é L-completo para todo L > 0, será chamado especificado localmente. Se um sistema
é 0-completo, será chamado especificado instantâneamente. Estas noções conduzem a interpretações
intuitivas. Um sistema dinâmico discreto no tempo é governado pelo conjunto de equações a diferença

f (w(t + L), w(t + L − 1), . . . , w(t)) = 0, t ∈ Z,

se, e somente se, ele é L-completo. Para o mapa f : W L → R pode-se tomar qualquer um que
satisfaça f −1 (0) = B|[0,L] ∈ W L , o que formalmente equivale a especificar uma equação a diferença
que defina o comportamento B = {w : Z → W | a equação a diferença é satisfeita para todo t ∈ Z}.
Neste contexto, o inteiro L ∈ Z+ é dito a latência. Similarmente, desconsiderando inicialmente
maiores considerações sobre a continuidade da variedade considerada, um sistema contı́nuo no tempo
governado por um conjunto de equações diferenciais

dn w dn−1 w
 
f (t), (t), . . . , w(t) = 0, t ∈ R,
dtn dtn−1

também é localmente especificado. Como é de se esperar, um sistema é especificado instantâneamente


se, e somente se, ele é governado por leis não-dinâmicas, ou seja, se ele é governado por equações de
comportamento da forma f (w(t)) = 0, t ∈ T .

2.2.3 Extensão da memória

Extensão de memória expressa o intervalo de tempo no qual há uma conexão entre o passado e o
futuro. Mais formalmente, diz-se que um sistema dinâmico Σ = (T, W, B) possui memória ∆-finita
(ou que sua memória possui extensão ∆) se
 n o
w1 , w2 ∈ B, e w1 |[0,∆) = w2 |[0,∆) ⇒ w1 Λ− w2 ∈ B ,
0

sendo dito de memória finita se possui memória ∆-finita para algum ∆ > 0; ou memória local se pos-
sui memória ∆-finita para todo ∆ > 0. Ao nos referirmos a extensão da memória, como geralmente
adotado, referimo-nos implicitamente a ∆min , o mı́nimo ∆ ∈ Z+ apresentando a propriedade acima.
Quando a memória só é constituı́da do valor presente, ela recebe uma denominação proveniente da
14 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica

Tabela 2.1: R ELACIONANDO C ONCEITOS DE M EM ÓRIA .


Especificação Especificação
=⇒ ⇒ t-completo ⇒ Completo
Instantânea Local
⇓ ⇓ ⇓
Sem Memória Memória Memória
⇒ Markoviano ⇒ ⇒ ⇒
Memória Local t-finita Finita

teoria de processos estocásticos: Σ é dito Markoviano se


 
w1 , w2 ∈ B, w1 (0) = w2 (0) ⇒ w1 Λ− w2 ∈ B .
0

O sistema é dito sem memória se B é fechado sobre concatenação, i.e., se


 
w1 , w2 ∈ B ⇒ w1 Λ− w2 ∈ B .
0

Para o caso de sistemas dinâmicos discretos no tempo, os conceitos de completude e extensão


de memória estão intimamente relacionados. Considerando um tal sistema Σ = (Z, W, B), se Σ
é t-completo então, segue dos conceitos de completude e expansão de memória, este é completo e
possui memória t-finita, o que estabelece uma relação de implicação direta. Agora, com o objetivo
de estabelecer a relação de implicação contrária, assuma que Σ possui memória t-finita e que w :
T → W possui a propriedade w|[t′ ,t′ +t) ∈ B|[t′ ,t′ +t) para todo t′ ∈ Z. Neste caso, há w1 , w2 , w3, w4
satisfazendo w1 ′ Λ − w ′ Λ − w2 ∈ B e w3 Λ
′ −
w Λ w4 ∈ B. Segue de supormos que o sistema
(t −1) (t +t) (t ) (t′ +t+1)−

é de memória t-finita que w1 ′ Λ − w Λ w4 ∈ B. Logo, w|[t′ ,t′ +t+1) ∈ B|[t′ ,t′ +t+1) para todo
(t −1) (t′ +t+1)−

t′ ∈ Z, consequentemente w|[t′ ,t′ +t] ∈ B|[t′ ,t′ +t] para todo t′ ∈ Z. Segue da definição de um sistema
L-completo que Σ é t-completo. Este resultado é resumido na Proposição 1.

Proposição 1. [1] Seja Σ = (Z, W, B) um sistema dinâmico discreto. Então


 
Σ é t-completo ⇔ Σ é completo e possui memória t-finita .

Podendo ser demonstradas implicações associadas a conceitos distintos de memória, como espe-
cificado na Tabela 2.1.
Se T = Z, e se Σ é completo, então as setas verticais da Tabela 2.1 também podem ser revertidas, o
que seguirá da Proposição 1. Destes resultados, a nı́vel de aplicação temos o resultado: Um sistema
discreto no tempo pode ser descrito através de uma equação a diferença com latência L se, e somente
se, ele é completo e possui memória L-finita.
2.2 O Conceito de Memória 15

2.2.4 Dividindo variáveis


A interação entre as variáveis latentes e a estrutura da memória de um sistema propicia elementos
relevantes à análise dos sistemas dinâmicos. Inicialmente, consideramos o conceito onde o valor
presente das variáveis latentes determinam o comportamento futuro da variável associada ao sinal ex-
terno. Seja Σa = (T, W, A, Ba ) um sistema dinâmico com variáveis latentes. Diz-se que as variáveis
latentes dividem o comportamento externo se
 n o
(w1 , a1 ), (w2 , a2 ) ∈ Ba , e a1 (0) = a2 (0) ⇒ w1 Λ− w2 ∈ Pw Ba .
0

2.2.5 Sistema de variáveis de estado


Refere-se a variáveis latentes que parametrizam o conteúdo da memória do sistema. Se combinarmos
a propriedade de divisão introduzida na Seção 2.2.4 com a Markoviana da Seção 2.2.3, obtém-se a
importante classe de sistemas apresentada na Definição 3.
Definição 3. Seja ΣS = (T, W, X, BS ) um sistema dinâmico com variáveis latentes. Este será cha-
mado um sistema dinâmico na forma de espaço de estados, com espaço de estados X, se o com-
portamento BS ⊆ (W × X)T satisfaz o que é chamado de axioma de estado. Significando que a
 
implicação (w1 , x1 ), (w2 , x2 ) ∈ BS , e x1 (0) = x2 (0) ⇒ (w1 , x1 )Λ− (w2 , x2 ) ∈ BS é verificada.
0

Neste caso Pw BS é chamado de comportamento externo de ΣS , enquanto (T, W, Pw BS ) o sistema


induzido por ΣS . Reciprocamente, ΣS = (T, W, X, BS ) é chamado de uma representação via espaço
de estados (ou realização via espaço de estados) de Σ = (T, W, Pw BS ). Por fim, Bx = Px BS será
chamado de comportamento dos estados, onde Px : (W × X) → X é a projeção Px (w, x) = x. Em
ocasiões onde for necessário considerar todos os estados de um sistema, considerar-se-a o sistema de
estados Σx = (T, X, Bx ).
Pode-se verificar que em um sistema de espaço de estados x divide w, que (T, W, X, BS ) é Mar-
koviano, e que o sistema de estados Σx = (T, W, Bx ) também é Markoviano. Percebe-se que em
um sitema de espaço de estados x divide conjuntamente w e x. Os conceitos até então apresenta-
dos, encontram-se entre os que apresentam-se como os mais profı́cuos para análise e modelagem de
sistemas dinâmicos. A maioria dos modelos encontrados na fı́sica, economia, simulação dinâmica,
controle e estimação dinâmicos, etc., são apresentados na forma de espaço de estados. Valendo res-
saltar que o conceito de estado, de acordo com o meu entendimento, não deve ser interpretado como
um princı́pio fundamental, mas com uma variável que deve ser construı́da de acordo com o modelo
apresentado, ou seja, baseada em seu comportamento externo, ou do modelo que incorpora variáveis
latentes. Esta é uma forma que conduz a determinação de modelos matemáticos a partir de princı́pios
fı́sicos ou econômicos, portanto, o ponto de partida para de uma teoria matemática para dinâmica.
16 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica

W
σ−t w20+
w

0 t T

w1−

Figura 2.5: Representação de um sistema controlável.

2.2.6 Sistemas autônomos, controláveis e essenciais


As noções de sistemas autônomos e controláveis têm como objetivo classificar com que extensão o
passado influencia o futuro. Em sistemas autônomos o passado especifica o futuro. Em sistemas
controláveis o passado não influência o futuro “distante”.
Seja Σ = (T, W, B) um sistema invariante no tempo com T = R ou Z. Ele é dito autônomo se
+
há um mapa f : B− → B0+ tal que para todo w ∈ W T tem-se que {w = w − Λ− w 0 ∈ B} ⇔ {w − ∈
0
B e w 0+ = f (w − )}. O sistema Σ é dito controlável se para todo w1 , w2 ∈ B há um t ∈ T , t ≥ 0, e
um w : T ∩ [0, t) → W tal que w1 Λ− wΛ− σ −t w2 ∈ B, como mostrado na Figura 2.5. Como definições
0 t
+
equivalentes, poderı́amos ter definido f : B−0 → B0 para sistemas autônomos, e quaisquer das
concatenações w1 Λ− wΛ+ σ −t w2 , w1 Λ+ wΛ− σ −t w2 ou w1 Λ+ wΛ− σ −t w2 para sistemas controláveis.
0 t 0 t 0 t
Nesta abordagem, o conceito de controlabilidade é uma propriedade do comportamento externo
do sistema dinâmico. Em um sistema dinâmico controlável é possı́vel direcionar o sistema para seguir
qualquer trajetória futura, independentemente da trajetória passada.
Considerando as especificações comuns de sistemas a dinâmicos através de equações diferença e
diferenciais. Se uma equação a diferença possui uma solução para um valor de latência máximo, i.e.,
se é da forma
w(t + L) = f ′ (w(t + L − 1), . . . , w(t)),

então o sistema dinâmico resultante será autônomo. No caso contı́nuo, um sistema dinâmico descrito
pela equação diferencial
dn w
 n−1 
′ d w
(t) = f (t), . . . , w(t) ,
dtn dtn−1
será autônomo (assumindo que f ′ é suficiente contı́nuo), tal que, a equação diferencial possui solução
única para toda a condição inicial

dn−1 w
 
dw
w(0), (0), . . . , n−1 (0) .
dt dt
2.3 Leis de Evolução 17

Os conceitos de linearidade, simetria, autonomia, controlabilidade, etc., inicialmente apresentados


para sistemas dinâmicos definidos em função do seu comportamento externo, podem ser natural-
mente extendidos para uma representação via espaço de estados de um sistema dinâmico, ou sistemas
envolvendo variáveis latentes. Neste contexto, pode-se provar que um sistema ΣS = (T, W, X, BS )
é autônomo se, e somente se, há um mapa f˜ : X → B0 tal que {(w, x) ∈ BS } ⇒ {(w, x)0+ =
+
S
f˜(x(0))}. Este resultado é apresentado na Proposição 2.

Proposição 2. [1] Um sistema representado por um espaço de estados ΣS = (T, W, X, BS ) é


autônomo se, e somente se, existe um mapa f˜ : X → BS0+ tal que {(w, x) ∈ BS } ⇒ {(w, x)0+ =
f˜(x(0))}.

Considerando um sistema dinâmico invariante no tempo Σ = (T, W, B) com T = Z ou R. Ele


será dito essencial se para todo w ∈ W há um w ∈ B tal que w(0) = w. Em um sistema essen-
cial todos os valores ou atributos externos ocorrerão. Como exemplo comparativo, em um sistema
especificado instantâneamente, não ser um sistema essencial é o que determina as propriedades ou
regras do sistema. Este conceito pode ser generalizado para o caso de sistemas com variáveis latentes.
Neste caso, diz-se que um sistema é essencial nas variáveis latentes quando o sistema (T, W, Pa Ba )
é essencial. Como as variáveis latentes são variáveis auxiliares, é natural assumir que o comporta-
mento interno (nas variáveis latentes) é essencial, caso contrário, só precisamos redefinir o conjunto
A. Quando as variáveis latentes são variáveis de estado, falaremos em sistemas que possuem espaço
de estados essencial.
Retornando ao caso de um sistema controlável. O conceito apresentado aqui e o caso clássico
de controlabilidade do espaço de estado são intrinsecamente relacionados. Seja Σx = (T, X, Bx ) o
sistema de estados de um sistema. Ou seja, assumiremos que ele é Markoviano. Diz-se que Σx é
estado controlável se, para todo x0 , x1 ∈ X, há um x ∈ Bx e um t ∈ T , t ≥ 0, tal que x(0) = x0
e x(t) = x1 . O conceito de controlabilidade, como usualmente empregado na literatura de teoria de
controle, de forma geral, corresponde ao conceito de estado controlável de um sistema de estados. O
que é formalizado na Proposição 3.

Proposição 3. [1] Seja Σx essencial. Então ele é controlável se, e somente se, é estado controlável.
Além disso, se Σx é estado controlável, então Σ é controlável.

2.3 Leis de Evolução


A maioria dos modelos práticos de sistemas dinâmicos estão na forma de equações a diferença ou
diferencial. Sendo que equações a diferença ou diferenciais de maior ordem podem ser reduzidas a
equações de ordem um pela redefinição das variáveis de latência ou derivadas como novas variáveis.
18 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica

Portanto, restringir nossa abordagem ao caso de equações a diferença e diferenciais de primeira ordem
não limita o escopo dos resultados aqui apresentados. Tais modelos são definidos automaticamente
quando o sistema é representado na forma de espaço de estados.

Definição 4. Uma lei de evolução discreta no tempo é definida como uma quádrupla

Σ∂ = (T, W, X, ∂)

onde T ⊆ Z o eixo do tempo, sendo que comumente T = Z; W é o alfabeto de sinais; X o espaço


de estados; e ∂ ⊆ X × W × X a relação próximo-estado.

A interpretação intuitiva de ∂ é dada por: (x0 , w, x1 ) ∈ ∂ implica que se o sistema está no


estado x0 , então ele pode prosseguir para o estado x1 enquanto produz o valor de sinal externo w. O
comportamento induzido por ∂ é definido como B∂ := {(w, x) : Z → W ×X| (x(t), w(t), x(t+1)) ∈
∂ para todo t ∈ Z}. Podendo ser verificado que B∂ satisfaz o axioma de estado e que é invariante no
tempo. Obtém-se de B∂ : O sistema na forma de espaço de estado ΣS = (Z, W, X, B∂ ) induzido por
Σ∂ ; o comportamento externo B = Pw B∂ ; e o sistema dinâmico Σ = (Z, W, Pw B∂ ) induzido por Σ∂ .
O que é denotado por
∂ ⇒ B∂ ⇒ B e Σ∂ ⇒ ΣS ⇒ Σ.

A versão contı́nua no tempo análoga a uma relação próximo-estado é uma relação diferencial de
primeira-ordem. Neste caso, no lugar do próximo estado onde o sistema é permitido estar, especifica-
se em que direção e com que velocidade ele pode prosseguir.

Definição 5. Uma lei de evolução contı́nua no tempo é definida pela quádrupla

Σ∂ = (T, W, X, ∂)

onde T ⊆ R é um intervalo, o eixo do tempo, sendo que comumente T = R; W é o alfabeto de


sinais; X o espaço de estados, uma variedade contı́nua; e ∂ ⊆ T X × W a relação campo-vetorial,
onde T X é o fibrado tangente de X.

Como caso mais comum, X pode ser pensado como um subconjunto aberto do Rn e identificar
T X com X × Rn . A interpretação a ser dada para tal estrutura é que ((x, v), w) ∈ ∂ significa
que quando o sistema está no estado x, ele poderá prosseguir com velocidade v enquanto produz o
valor de sinal externo w. Definindo o comportamento induzido por ∂ como B∂ := {(w, x) : R →
W × X| x é absolutamente contı́nuo e ((x(t), ẋ(t)), w(t)) ∈ ∂ para todo t ∈ R onde ẋ(t) existe}.
Portanto, o comportamento de uma lei de evolução discreta no tempo pode ser vista como o conjunto
de soluções de uma equação a diferença que é de primeira ordem em x e de ordem zero em w:
2.3 Leis de Evolução 19

f (x(t), w(t), x(t + 1) = 0 (∂ = f −1 (0)). Enquanto uma lei de evolução contı́nua no tempo pode ser
vista como descrita por equações diferenciais que são de primeira ordem em x e de ordem zero em
w: f (x(t), ẋ(t), w(t)) = 0 (∂ := f −1 (0)).
Como no caso discreto, B∂ satisfaz o axioma de estado, além do que também verifica-se que:

∂ ⇒ B∂ ⇒ B e Σ∂ ⇒ ΣS ⇒ Σ.

Ao definir-se um sistema em termos de seu comportamento, em essencia, se estabelece uma regra,


uma especificação, uma lei, através da qual pode-se verificar se uma trajetória em particular no tempo
sobre W é ou não compatı́vel com o sistema. Uma lei de evolução ∂, por outro lado, fornece uma
gramática, um procedimento, um algoritmo através do qual elementos de B podem ser gerados4 .
Portanto, se um por (w, x) é compatı́vel com o comportamento, isso pode ser verificado completa-
mente através dos valores dos pontos adjacentes, ou seja, em função do comportamento local (onde o
conceito de localidade foi considerado em relação ao tempo, no entanto, conceitos e idéias similares
podem ser considerados no contexto espacial).

2.3.1 A lei de evolução induzida por uma representação via espaço de estados

Construção de leis de evolução que simulam um sistema representado via espaço de estados. Consi-
derando, inicialmente, o caso discreto. Seja ΣS = (Z, W, X, BS ) um sistema representado via espaço
de estados, discreto no tempo e invariante no tempo. A lei de evolução induzida por ΣS é definida
por Σ∂ = (Z, W, X, ∂), onde

∂ := {(x0 , w, x1) ∈ X × W × X|∃ (w, x) ∈ BS


(2.9)
tal que x(0) = x0 , x(1) = x1 , e w(0) = w}.

Decorrendo do discutido na Seção 2.3 que ∂ induz um sistema via espaço de estados, o qual terá
o comportamento representado por B̄S , observamos que BS ⊆ B̄S . Um caso tı́pico onde ocorre a
inclusão estrita é o das Rq -sequências cuja soma dos quadrados existe, l2 (Z, Rq ) (podendo ser escrita
como o sistema (Z, Rq , 0, l2(Z, Rq )). Neste caso B̄S é igual a (Rq )Z , o que inclui l2 (Z, Rq ) como
um subconjunto estrito. Este caso conduz a questão: Quando BS = B̄S ? Para um sistema dinâmico
Σ = (T, W, B) a complementação de seu comportamento é definida por

Bcompl := {w : T → W | w|[t0,t1 ] ∈ B|[t0 ,t1 ] para todo − ∞ < t0 ≤ t1 < ∞}.

4
Estes conceitos serão explorados (exemplificados) no Capı́tulo 3 e Capı́tulo 6.
20 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica

Podendo ser demonstrado que Bcompl é o menor subconjunto de W T que é completo e contém B.
Sendo uma consequência direta que Bcompl será invariante no tempo e/ou linear se B for. Estes
conceitos definem os elementos necessários para a demonstração do Teorema 4.

Teorema 4. [1] Seja ΣS = (Z, W, X, BS ) um sistema representado via espaço de estados e B̄S o
comportamento da lei de evolução induzida por ele. Portanto, B̄S = BScompl . Têm-se como con-
sequência que {BS = B̄S } ⇔ {ΣS é completo}. Ou seja, um comportamento BS só é integralmente
representado por uma lei de evolução se, e somente se, ele é completo.

Demonstração: Como consequência de ΣS ser uma representação via espaço de estados, o com-
portamento BS é Markoviano. Portanto, BScompl possui memória 1. Considerando os conceitos da
Seção 2.2 e a Proposição 1, BScompl pode ser descrito por equações de comportamento com latência
de primeira ordem. Seja f (x(t), w(t), x(t + 1), w(t + 1)) = 0, e f −1 (0) = BScompl |[0,1] = BS |[0,1] tal
equação. Decorrendo do axioma de estado que {(x(t), w(t), x(t + 1)) ∈ ∂ e (x(t + 1), w(t + 1), x(t +
2)) ∈ ∂} ⇒ {(w(t), x(t)), (w(t + 1), x(t + 1)) ∈ BS |[0,1] }.
Segue o resultado final do fato que ∂ = {(x0 , w0 , x1 )|∃ w1 tal que f (x0 , w0 , x1 , w1 ) = 0}. 

Seja ΣS = (R, W, X, BS ) um sistema dinâmico invariante e contı́nuo no tempo, representado


via espaço de estados, sendo X uma variedade diferenciável satisfazendo a implicação {(w, x) ∈
BS } ⇒ {x é absolutamente contı́nuo}. A lei de evolução induzida por ΣS é definida por ∂ :=
{((x, v), w) ∈ T X × W | ∃(w, x) ∈ BS tal que (x(0), ẋ(0)) = (x, v) e w(0) = w}. Com a definição
de B̄S sendo análoga àquele do caso discreto, valendo também a relação BS ⊆ BScompl ⊆ B̄S , contanto
que condições relacionadas a continuidade também sejam satisfeitas, completando as de completude.

2.3.2 Lei de evolução de um sistema determinı́stico


Um sistema representado por um espaço de estados ΣS = (T, W, XBS ) é dito determinı́stico (com
relação ao espaço de estados) se {(w1 , x1 ), (w2 , x2 ) ∈ BS , x1 (0) = x2 (0), t ∈ T , e w1 |[0,t) =
w2 |[0,t) } ⇒ {x1 (t) = x2 (t)}. Ou seja, nos sistemas determinı́sticos trajetórias de estados só podem
bifurcar em decorrência da bifurcação da trajetória externa.
Uma consequência extensivamente aplicada no Capı́tulo 3 decorrente do conceito de determi-
nismo restrito a sistemas descritos por leis de evolução discretas no tempo, sendo esta a representação
de ∂ pelo grafo de uma função parcial5 δ : X × W → X, significando que {(a, w, b) ∈ ∂} ⇔
{(a, w) ∈ Dom(δ) e b = δ(a, w)}. Podemos introduzir dois mapas f : X × W → X e c : X × W →
R tal que c(x, w) = 0 define o domı́nio de δ e f corresponde a ação de δ no seu domı́nio. O que
fica explı́cito neste caso, é que uma lei de evolução discreta no tempo de um sistema determinı́stico é
5
Estes conceitos são abordados no Capı́tulo 3.
2.3 Leis de Evolução 21

descrito por dois mapas f : X × W → X (próximo estado) e c : X × W → R (equação de restrição)


tal que seu comportamento pode ser especificado por

σx = f ◦ (x, w) e c ◦ (x, w) = 0.

No caso de um sistema contı́nuo, isto conduz as equações

ẋ = f ◦ (x, w) e c ◦ (x, w) = 0.

Estas equações apresentam um meio conveniente para pensar-se sobre sistema dinâmicos represen-
tados via espaço de estados. Elas representam sistemas determinı́sticos e completos. A primeira
equação diz como uma realização das variáveis associadas ao sinal externo conduzirá à evolução do
estado, enquanto a segunda equação diz que variáveis externas w podem, de fato, ocorrer quando o
sistema está no estado x.

2.3.3 Fluxos

Intrinsecamente relacionado com a abordagem considerada no Capı́tulo 5 e no Capı́tulo 6, o conceito


de fluxo emerge quando da descrição por leis de evolução de sistemas dinâmicos que evoluem de
forma autônoma. Um fluxo discreto no tempo (X, f ) é definido por um espaço de estados X e um
mapa de próximo-estado f : X → X. Um fluxo contı́nuo no tempo (X, f ) é definido por um espaço
de estados X, uma variedade diferenciável e um campo vetorial f : X → T X sobre ela. Fluxos
definem casos especiais de leis de evolução com W = X e

∂ = {(x0 , w, x1)| w = x0 e x1 = f (x0 )} (discreto no tempo)


(2.10)
equação de comportamento: σx = f ◦ (x),

e
∂ = {((x, v), w)| w = x e (x, v) = f (x)} (contı́nuo no tempo)
(2.11)
equação de comportamento: ẋ = f ◦ (x),
onde foi realizada a associação (não natural) do sinal externo com o estado. Também é necessário
assumir que para qualquer condição inicial, a equação diferencial ẋ = f ◦ (x), x(0) = x0 , possui uma
única solução. Como resultado de (2.10) e (2.11), fluxos definem sistemas autônomos (sendo inter-
pretados como uma propriedade de comportamento BS ). Sendo Markovianos, e portanto, sistemas
representados via espaço de estados.
Segue da Proposição 2 que um sistema autônomo representado via espaço de estados sempre é
22 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica

determinı́stico. Possuindo lei de evolução expressa por (2.12) ou (2.13).

σx = f ◦ (x), w = r ◦ (x) (discreto no tempo), (2.12)


ẋ = f ◦ (x), w = r ◦ (x) (contı́nuo no tempo). (2.13)

Portanto, a lei de evolução para um sistema representado via espaço de estados pode ser interpretada
como um fluxo associado com um mapa r : X → W , que permite a “observação do fluxo”.
A abordagem considerando fluxos sobre variedades têm sido empregada como a base para mode-
los dinâmicos em fı́sica. De fato, a mecânica Hamiltoniana6 como também as equações de Schrödin-
ger da mecânica quântica definem fluxos sobre variedades (contudo, os mapas r para observação do
fluxo são definidos implicitamente e de forma não trivial). Apesar de em muitos casos extensiva-
mente abordados, como aqueles tı́picos da mecânica, possa parecer natural considerar fluxos como
a base para a dinâmica. Em um aspecto generalista, podem ser citados pelo menos dois pontos de
inconsistência:

• Dado que os sistemas definidos são autônomos, fluxos consideram o sistema isolado do ambi-
ente ou meio. Neste caso, o procedimento não só apresenta limitações no contexto prático, onde
precisamente a ação e reação do sistema com o ambiente é o elemento de importância central. Ca-
racterı́stica evidente em teoria de controle e ciência da computação. Como também na fı́sica há
várias situações desta natureza. Uma abordagem baseada completamente em fluxos, requer, im-
plicitamente, o isolamento do sistema do seu ambiente, o que demanda a modelagem da ação do
ambiente sobre o sistema, forçando à situação indesejada de ter-se que modelar o ambiente;

• Modelos que começam com fluxos sobre variedades consideram o espaço de estados como dado,
ao passo que na abordagem considerada neste trabalho o comportamento externo é o elemento
essencial e o espaço de estado um objeto matemático conveniente a ser construı́do a partir das
equações dinâmicos que descrevem o comportamento externo. O estado de um sistema não é
uma propriedade fı́sica do sistema real, é uma propriedade do modelo. Como exemplo, enquanto
um modelo do sistema solar considerando os planetas como elementos pontuais com massa gera
um espaço de estados de dimensão finita. Se o mesmo sistema é modelado considerando-se um
dos planetas como uma esfera levemente elástica, então o espaço de estados obtido apresentará
dimensão infinita. Portanto, ao modelar-se através do fluxo sobre uma variedade, o procedimento
é iniciado pela especificação do espaço de estado X, seguido pela determinação das equações
dinâmicas, ou seja, o campo vetorial f . Contudo, isso gera uma lógica circular, já que as equações
dinâmicas é que devem determinar qual será o espaço de estados. Pelo modelamento através do
6
O artigo [10] que além de explicitar este processo, aborda as sistemas Hamiltonianos por uma rica perspectiva
geométrica.
2.3 Leis de Evolução 23

comportamento do sistema, primeiro é especificado o objeto a ser modelado, em seguida é escolhido


um W , por fim especifica-se B, então, se for necessário um espaço de estados X é determinado.

Consideradas as observações acima, objetivando uma maior clareza sobre o que significa isolar
um “sistema” de seu “ambiente ou meio”, consideremos um exemplo qualitativo que evidencie como
o método e abordagem considerados para o estudo de um sistema dinâmico influenciam na complexi-
dade do método e relevância do modelo obtido. Consideremos a modelagem da posição de um corpo
em movimento enquanto exposto a influências do meio. Como exemplos temos a posição de um
pássaro voando, de uma pessoa se movendo em meio a uma multidão ou de um barco navegando em
um mar agitado. Considerando o primeiro caso, sendo a posição do pássaro a variável de interesse,
para descrever sua evolução será necessário introduzirmos como variáveis adicionais, pelo menos, o
movimento de suas asas e as condições atmosféricas em torno do pássaro, o que poderá ser descrito
pela velocidade e direção do vento. A interação entre estas variáveis descreverá o comportamento
do pássaro, sendo especificado por uma “relação de compatibilidade” entre as variáveis envolvidas.
Este seria um ponto de parada adequado para o modelo considerado, já que explica o posicionamento
do pássaro no ambiente constituı́do pelo movimento de suas asas e as propriedades do vento. Um
ponto a observar é que o modelo obtido envolve variáveis não conhecidas - o movimento das asas e a
caracterı́stica do vento.
Caso deseje-se inferir mais sobre a posição do pássaro, será necessário um maior conhecimento
dos elementos envolvidos no processo de modelagem, ou seja, maiores certezas e menos “variáveis”.
Neste caso, pode-se tentar incluir um modelo para a atmosfera, talvez supondo que a velocidade e
direção do vento são constantes, ou que são uma função da altura. Essas considerações reduziriam
as variáveis do modelo à posição do pássaro e ao movimento de suas asas. Como modelo pretendido
para a posição do pássaro, esse é um ponto adequado de parada, já que explica a relação entre a
posição do pássaro e o ambiente onde está inserido, formado pelo movimento de suas asas.
Se ainda assim desejarmos um modelo mais completo, poderemos tentar explicar o movimento
das asas do pássaro. Nos deparamos com a necessidade de refletirmos em nosso modelo a resposta
dada pelo sistema neural do pássaro aos estı́mulos externos conjugados a trajetória “pretendida pelo
mesmo”. Neste contexto, nossas pretensões vão além dos elementos descritivos disponibilizados
pela fı́sica teórica. Vendo-nos compelidos a empregar elementos de ciências prescritivos, tais com
cibernética e inteligência artificial. Ou seja, de alguma forma teremos de descrever por que as asas
do pássaro movem-se como o fazem. Uma forma de abordar o problema seria realizar hipóteses
a cerca das “caracterı́sticas” ou propriedades do fenômeno estudado, tais como a periodicidade do
movimento. Embora empı́rica, trata-se de uma afirmação plausı́vel e que conduziria a uma maior
compreensão do fenômeno estudado, portanto válida.
Uma abordagem alternativa para o estudo exploratório do fenômeno é inseri-lo em um contexto.
24 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica

No caso em particular, poderı́amos supor que o nosso pássaro é uma ave de rapina, e que seu movi-
mento é motivado por capturar uma presa no menor tempo possı́vel. O modelo resultante será uma
relação de compatibilidade associando a posição do pássaro àquela da presa. Tal resultado é o mo-
delo almejado, já que explica a posição do pássaro no seu meio, especificado pela posição da presa.
No entanto, ainda há espaço para o aprimoramento desse modelo. Poderı́amos modelar a posição
da presa. Supondo-a um quadrúpede, sua posição seria determinada pelo movimento de suas patas
e pelo terreno. Inicialmente, poderı́amos modelar o terreno e contextualizar o movimento da presa,
supondo que o movimento de suas patas é determinado pela maximização da distância deste para o
predador. Teremos, neste caso, um modelo para a posição da presa com relação ao seu meio, cons-
tituı́do pelo predador. Como resultado final, obteremos duas relações de compatibilidade descrevendo
o comportamento descrito pelas posições do pássaro e da presa. Conjuntamente, elas nos fornecerão
possivelmente um sistema fechado de equações que determinarão a posição do pássaro como uma
função das condições iniciais.
Este caso acima exemplifica o que significa “um sistema isolado do seu meio mas interagindo
com esse”. O que fica evidente é que isso implicará invariavelmente na ocorrência de variáveis não
explicadas ou não determinadas explicitamente, são estabelecidas de fora para dentro, e portanto,
sendo arbitrárias. De fato, tais funções matemáticas definidas no tempo são partes da modelagem
matemática de sistemas dinâmicos, e que, na maioria das situações de interesse, são constituintes
compulsórios. Além disso, fica claro que propriedades ou caracterı́sticas inerentes ao sistema invi-
abilizam a aplicação de ferramentas teóricas descritivas no estudo deste como um todo, requerendo
invariavelmente o emprego de métodos prescritivos.
Apesar do exemplo apresentado envolver a descrição de fenômenos associados a organismos vi-
vos complexos, o que erroneamente poderia ser empregado como explicação absoluta para os desafios
encontrados, obstáculos não menos desafiadores são descritos em fenômenos de natureza econômica,
social, ou mesmo puramente fı́sica. Isto se deve ao fato de depararmo-nos em muitos casos com sis-
temas que envolvem parâmetros distribuı́dos e onde não há evidências que conduzam a um processo
plausı́vel de simplificação.

2.3.4 Exemplos de casos contı́nuos e discretos

A abordagem considerada neste material para descrição de sistemas dinâmicos é evidentemente bas-
tante geral, o que compactua com nossos objetivos de descrever os diversos sistemas empregando
uma linguagem comum, que permita extrair e aplicar conceitos e métodos úteis em um determinado
contexto associado a um sistema dinâmico especı́fico, em outro até então não explorado. Seguem
alguns exemplos tı́picos e importantes descritos através dos elementos até então apresentados.
2.3 Leis de Evolução 25

Mecânica Hamiltoniana

Nessa abordagem consideraremos um caso particular, não considerando abordagens que empre-
gam conceitos geométricos mais sofisticados [10]. Vamos nos limitar ao caso em que o espaço de
configuração Q é um subconjunto aberto de Rm . De acordo com os postulados da mecânica Hamilto-
niana, o movimento de um sistema mecânico pode ser descrito por uma função H : P × Q → R, com
P = Rm , o espaço momento. Essa função H é o Hamiltoniano, determinando as leis de movimento
através das equações canônicas (2.14) e (2.15).

∂H
q̇ = (p, q), (2.14)
∂p
∂H
ṗ = − (p, q). (2.15)
∂q

onde p denota momento e q posição. Assumindo a existência e unicidade de uma solução para este
conjunto de equações diferencias, para qualquer condição inicial p(0) = p0 ∈ Rm e q(0) = q0 ∈ Q.
As equações (2.14) e (2.15) definem um fluxo sobre uma variedade contı́nua P × Q. Formalmente
T = R (ou R+ ), X = P × Q e  
∂H ∂H
f= − , .
∂q ∂p
Se, contudo, estas equações são interpretadas como uma forma conveniente de descrever a evolução
da posição q, com o momento p considerado como uma variável auxiliar, então obtém-se um sistema
com variáveis latentes, tal que, T = R, W = Q, A = P , e Ba = {(q, p)| as equações (2.14) e (2.15)
são satisfeitas}. Este sistema é invariante no tempo. Ele é inversı́vel no tempo se H(p, q) = H(−p, q).
A definição de B implica que a posição q é a variável de interesse. Caso também haja interesse na
velocidade então pode-se adicionar (2.16).

v = q̇, (2.16)

o que conduz a especificação do comportamento B = {(q, v) : R → Q × Rn | ∃p : R → Rn tal que


(2.14), (2.15) e (2.16) são satisfeitas}.

Sistemas de Eventos Discretos

De forma geral, sistemas de eventos discretos descrevem situações onde a ocorrência de um evento
permite ou bloqueia a ocorrência de eventos subsequentes. Como exemplos tı́picos, pode-se citar
a linguagem natural, códigos de computadores, sistemas produtivos, etc. Esta definição confere
elementos novos em relação a interpretação usual de um sistema de eventos discretos como uma
26 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica

sequência ordenada de eventos. Com relação a Definição 1, podemos dizer que um sistema de even-
tos discretos é um sistema dinâmico (T, W, B) com T = Z e W um conjunto finito, adicionalmente,
quando o sistema é representado via espaço de estados (ou é definido através de variáveis latentes),
com X (ou o conjunto de variáveis latentes) finito. Estes elementos formam a base para interpretar-se
o conceito de linguagem formal como um sistema dinâmico.

Considera-se um conjunto finito A, chamado de alfabeto, cujos elementos são chamados de


sı́mbolos. Uma sequência de sı́mbolos (podendo ser vazia) é chamada de palavra. Seja A∗ o conjunto
de todas as palavras formadas por sı́mbolos do alfabeto A. Uma linguagem formal, L, é simplesmente
um subconjunto de A∗7 . Os elementos de L são interpretados como as palavras permitidas, ou seja,
aquelas compatı́veis com as regras, a gramática, as leis, que governam a linguagem. O conjunto A
também poderia ser chamado de conjunto de eventos, os elementos de A de eventos elementares, ele-
mentos de A∗ de sequências de eventos, enquanto L corresponderia a coleção de todas as sequências
finitas possı́veis de eventos. Uma linguagem formal basicamente define um sistema dinâmico no
sentido da Definição 1, com L correspondendo ao comportamento de B. Contudo, para tornar essa
correspondência mais rigorosa, através de uma modificação adequada, é necessário garantir que todas
as palavras possuem a mesma extensão e que novas palavras não são introduzidas no processo. Com
tal objetivo, podemos introduzir um novo sı́mbolo  ao conjunto A, definindo W := A ∪ {} e B
dado por (2.17).

B = {w : Z → W | t−1, t1 ∈ Z, t−1 ≤ t1 , tal que w|[t−1 ,t1 ) ∈ L e w(t) = 


(2.17)
para t < t−1 e t ≥ t1 }.

Neste caso (Z, W, B) especifica um sistema dinâmico invariante no tempo no sentido apresentado
na Definição 1, onde determina-se a forma como B é especificado a partir de L. O procedimento
adotado foi adicionar um número infinito de sı́mbolos  “antes” e “depois” de cada palavra em L.
Implicando que a interpretação de uma linguagem formal como um sistema dinâmico de eventos
discretos constitui uma generalização da noção de linguagem formal, dado que passa-se a considerar
a possibilidade de palavras infinitas.

Procedimentos comuns para geração de linguagens formais são por meio de gramáticas (po-
dendo ser interpretada como uma forma de descrever sistemas por meio de variáveis latentes) e por
autômatos (que correspondem basicamente às leis de evolução).

7
Estes conceitos serão melhor abordados no Capı́tulo 3.
2.3 Leis de Evolução 27

ai bi
ci−1
((1, 0), 1) ((1, 0), 0)
((1, 1), 0)
Somador
completo ((0, 0), 0) 0 1 ((1, 1), 1)
serial ((0, 0), 1)
((0, 1), 1) ((0, 1), 0)
ci
si

Figura 2.6: Somador completo serial representado via espaço de estados.

Autômatos

Autômatos são uma ferramenta para representação de linguagens, e no contexto considerado são a
forma de representar um sistema de eventos discretos via espaço de estados. Um autômato é uma
quı́ntupla (Q, A, E, I, T ), ou uma quádrupla quando o conjunto A esta subentendido, onde Q é um
conjunto finito chamado espaço de estados; A também é um conjunto finito chamado de alfabeto,
cujos elementos são chamados de sı́mbolos ou eventos externos elementares; E é a regra de transição,
sendo um subconjunto de Q × A × Q e cujos elementos são chamados de transições ou eventos
internos elementares; I ⊆ Q é o conjunto de estados iniciais; T ⊆ Q é o conjunto de estados
terminais. Uma sequência (s0 , a0 , s1 , a1 , . . . , sn−1, an−1 , sn ), com (si , ai , si+1 ) ∈ E para i + 1 ∈ n e
chamado de caminho, sendo um caminho possı́vel se s0 ∈ I e sn ∈ T .
Autômatos são comumente representados por grafos direcionados tendo os estados como nós,
as transições como ramos com rótulos, estados iniciais como nós acompanhados de uma seta apon-
tando para seu interior e estados terminais como nós com uma seta apontando para fora dele. Es-
tes conceitos e elementos são ilustrados através de um somador completo serial como apresentado
na Figura 2.6. Este autômato realiza a soma de dois números binários, representados por ai e
bi , mais o bit vai-um do estágio anterior, representado por ci−1 no diagrama em bloco e associ-
ado ao estado 0 e 1 do autômato. O bit si é o resultado da operação de soma, mais o bit vai-
um do estágio, que dependendo do valor, implicará em uma transição ou não de estado. Neste
contexto, o rótulo dos ramos é codificado como ((ai , bi ), si ) enquanto ci e ci−1 estão associados a
memória para realização da adição sequencial. Considerando a apresentação anterior sobre siste-
mas de eventos discretos, para tornar a correspondência rigorosa, torna-se necessário introduzir o
elemento  ao conjunto A, gerando W := A ∪ {}; adicionar um estado fonte Ω e um estado
terminal Ψ a Q, gerando X := Q ∪ {Ψ, Ω}; e definir a lei de evolução ∂ ⊆ X × W × X como
∂ := E ∪{(Ω, , Ω), (Ω, , 0), (1, , Ψ), (Ψ, , Ψ)}. Estas modificações geram o autômato apresen-
tado na Figura 2.7. O comportamento determinado pelo autômato da Figura 2.7 passa a ser definido
como BQ = {(w, x) : Z → W × X| (x(t), w(t), x(t + 1)) ∈ ∂ para todo t ∈ Z e ∃t−1 , t1 , t−1 ≤ t1 ,
28 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica

((1, 0), 1) ((1, 0), 0)


((1, 1), 0)

((0, 0), 0) 0 1 ((1, 1), 1)


((0, 0), 1)
((0, 1), 1) ((0, 1), 0)
 

Ω Ψ
 

Figura 2.7: Autômato do sistema de eventos discretos associado ao somador completo serial.

tal que x(t) = Ψ para t < t − 1 e x(t) = Ω para t ≥ t1 }. Desta forma, BQ é constituı́do basica-
mente de caminhos prováveis antecedidos por uma sequência infinita de pares (, Ω), e precedidos
por uma sequência infinita de pares (, Ψ). O que demonstra uma equivalência biunı́voca entre
BQ e a coleção de caminhos possı́veis. Uma palavra a1 a2 . . . an com ai ∈ A, i ∈ n, é represen-
tada por um autômato se há uma sequência s0 , s1 , . . . , sn com si ∈ Q, i = 0, 1, . . . , n, tal que
(s0 , a0 , s1 , a1 , . . . , sn−1 , an−1 , sn ) um caminho possı́vel. O conjunto de todas as palavras representa-
das por um autômato forma uma linguagem formal. Dados estes elementos, uma questão central na
teoria de linguagens formal é como determinar um autômato que represente uma dada linguagem. No
contexto de linguagens formal o desafio está em mostrar que condições L ∈ A∗ deve satisfazer para
que possa ser representado por um autômato com um número finito de estados. Tratando-se de uma
versão do problema de representação via espaço de estados. No Capı́tulo 3 esta questão é respondida
empregando o conceito, lá introduzido, de conjunto de restrições.
Por hora, podemos compreender um pouco mais das propriedades de um sistema de eventos dis-
cretos geral a partir das propriedades de uma representação via espaço de estados (autômato) para
este. Seja (Q, A, E, I, T ) um autômato no qual, para todo s ∈ Q, há um caminho (s0 , a0 , s1 , . . . , sn−1 ,
an−1 , sn ) com s0 ∈ I e sn = s. Se além disso, de forma similar, para todo s ∈ Q podemos determi-
nar um tal caminho satisfazendo s = s0 e sn ∈ T , então o autômato é dito essencial. Um caminho
(s0 , a0 , s1 , . . . , sn−1 , an−1 , sn ) é dito um ciclo se s0 = sn . Dado um autômato que representa o com-
portamento de um sistema de eventos discretos (como aquele da Figura 2.7), pode-se demonstrar que
comp
o fato dele ser essencial implica que o sistema é completo (i.e., BQ = BQ ) se, e somente se, o
autômato não contém ciclos. Em termos da linguagem formal reconhecida pelo autômato, isto im-
plica que um autômato essencial pode ser associado a um sistema de eventos discretos completo se, e
somente se, a linguagem reconhecida por este é finita (i.e., L contain um número finito de palavras).
Observe que todo elemento em BQ é precedido e seguido por uma sequência infinita de sı́mbolos
. Considerando o conceito de completude apresentado na Seção 2.2.2, a ocorrência de ciclos em
2.4 A Topologia de Sistemas Dinâmicos Discretos Invariantes no Tempo e Completos 29

Tabela 2.2: F ORMAS APRESENTADAS PARA REPRESENTAÇ ÃO DE SISTEMAS DIN ÂMICOS .

Peculiaridade da Descrição Representação Caracterização


- Σ = (T, W, B) B ⊆ WT
Variáveis Latentes Σa = (T, W, A, Ba ) Ba ⊆ (W × A)T
Espaço de Estados ΣS = (T, W, X, BS ) BS ⊆ (W × X)T
Lei de Evolução Σ∂ = (T, W, X, ∂) ∂ ⊆ X × W × X

um autômato essencial permite que sejam determinadas palavras de comprimento arbitrário em L,


compl
possibilitando a inclusão em BQ de sequências bi-infinitas que não sejam precedidas ou seguidas
por sequências infinitas dos sı́mbolos .
Fica clara a excepcionalidade do conceito de completude no contexto de autômato. No entanto,
isso é uma consequência do emprego da teoria de sistema dinâmico para modelagem da linguagem
reconhecida por um autômato. Como iniciado na Seção 2.4 e desenvolvido no Capı́tulo 3, a aborda-
gem reversa (estudar o comportamento de sistemas de eventos discretos através da teoria de lingua-
gens formais) conduz a determinação de propriedades e desenvolvimento de métodos relacionados a
representação dos sistemas via espaço de estados, além da determinação de uma estrutura algébrica
associada ao comportamento do sistema. Ao considerarmos o estudo de sistemas dinâmicos de even-
tos discretos especificados pelo seu comportamento B (ou seja, sequências bi-infinitas), poderemos
focar nossa abordagem em sistemas que possuam propriedades desejadas da dinâmica para os fins de
aplicação almejada. Ao optarmos por essa abordagem, possibilitamos a estudo de diversos “sistemas”
de interesse empregando os conceitos da teoria de sistemas dinâmicos, e.g., contadores, controle de
tráfico, códigos convolucionais, processamento digital de sinais, etc.

2.4 A Topologia de Sistemas Dinâmicos Discretos Invariantes no


Tempo e Completos
O conceito de lei de evolução introduzido na Seção 2.3 marca uma transição do até então “estático
e abstrato” para o “dinâmico e realizável”. Para tornar essa afirmação compreensı́vel, comparamos
na Tabela 2.2 as diversas definições apresentadas de um sistema dinâmico. Isso possibilita verificar
que enquanto os comportamentos B, Ba e BS descrevem o sistema dinâmico através do conceito de
subconjunto (estático), a lei de evolução ∂ especifica a relação entre “domı́nio” e “imagem”, ou seja,
descreve o sistema através de sua dinâmica.
A importância desta constatação é ressaltada quando deseja-se: Construir a lei de evolução que
simule um sistema dinâmico discreto invariante no tempo e representado via espaço de estados. Essa
30 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica

construção pode ser obtida por diversos métodos, seja com equações a diferença, máquinas de estado
finito, etc. Contudo, independente do método empregado nesta construção, decorre do Teorema 4 que
a representação obtida é completa, e portanto, que só será fidedigna ao comportamento do sistema
simulado se esse também for completo. Em uma perspectiva prática, a importância desse resultado
decorre da identificação das limitações inerentes a qualquer processo de simulação de um sistema
dinâmico discreto (o que inclui aqueles obtidos através de discretização), descrita por um conjunto
finito de relação (um conjunto finito de equações a diferença ou por um autômato com Q = I =
T ), sendo esta limitação a invariável completude do sistema obtido. O que inclui, por exemplo,
simulações computacionais de sistemas fı́sicos, já que os atuais computadores digitais são máquinas
de estado finito complexas.
No processo de formalização deste resultado, consideremos um sistema dinâmico discreto repre-
sentado via espaço de estados ΣS = (Z, W, X, BS ). Que como observado na Seção 2.3, é um sistema
invariante no tempo. Ao estabelecermos uma representação para este sistema, poderemos faze-lo
através das formas equivalentes: Equação a diferença (2.18), ou pela especificação da lei de evolução
induzida, como em (2.9).

f (x(t + L), w(t + L)), (x(t + L − 1), w(t + L − 1)), . . . , (x(t), w(t)) = 0, t ∈ Z (2.18)

Em ambos os casos, obteremos como resultado de nossa representação um sistema completo especifi-
cado pelo comportamento BScompl , já que, de acordo com o Teorema 4, o comportamento BScompl é igual
ao comportamento B̄S da lei de evolução induzida pelo sistema ΣS . Portanto, qualquer representação
discreta de nosso sistema é necessariamente invariante no tempo e completa.
Em nossa abordagem, consideramos que a única informação inicial é um sistema Σ = (Z, W, B) e
que qualquer estrutura adicional é obtida pelo processo de modelagem, como a inserção de variáveis
latentes ou um espaço de estados. Na procura por métodos que possibilitem a determinação de uma
estrutura, particularmente uma que reflita a “memória” do sistema, consideraremos que Σ é completo.
A forte implicação disso é que ao considerarmos uma representação via espaço de estados ΣS da qual
o comportamento BS seja formado por todas as sequências (w, x) satisfazendo Pw (w, x) = w, então
ΣS é completa. Como consequência, há a possibilidade, como comentado acima, de determinar-
mos uma representação para Σ através de equações a diferença ou pela determinação de uma lei de
evolução para o sistema. Antes de prosseguirmos, nós formalizamos essa implicação na Proposição 5.

Proposição 5. Seja Σ = (Z, W, B) um sistema dinâmico completo. A representação via espaço de


estados ΣS = (Z, W, X, BS ) de Σ é um sistema dinâmico completo.

Demonstração: Como ΣS é uma representação de Σ, então Pw (BS ) = B. Referindo-nos ao conceito


de completude, segue que BScompl |[t0 ,t1 ] = BS |[t0 ,t1 ] para todo −∞ < t0 ≤ t1 < ∞. Além disso, como
2.4 A Topologia de Sistemas Dinâmicos Discretos Invariantes no Tempo e Completos 31

Σ é completo segue a relação Pw (BScompl ) = B. Portanto, conclui-se que BScompl = BS . 

Podemos introduzir ainda mais estrutura à nossa abordagem se considerarmos o conjunto W fi-
nito. Para efeitos práticos esta consideração não restringe o escopo de aplicações dos resultados
obtidos, já que em qualquer simulação digital ou amostragem de um sistema dinâmico o espaço W
resultante é finito, ou ainda, esta já é uma propriedade do sistema original. Neste caso, o com-
portamento do sistema é composto por um conjunto de sequências bi-infinitas em W Z , o que será
representado por w = (wi )i∈Z = . . . w−1 w0 w1 . . ., onde wi ∈ W é a i-ésima coordenada de w.
A partir das considerações até então estabelecidas, a saber: sistema dinâmicos discretos, in-
variância no tempo, completude e conjunto W finito. Para facilitar a exposição, restabeleceremos
nossa nomenclatura como forma de evitar ambiguidades. Representaremos um sistema dinâmico dis-
creto, completo e invariante no tempo Σ = (Z, W, B) pela dupla (X, σ), onde X ⊂ W Z representa o
comportamento, ou seja, X = B e σ : W Z → W Z é uma ação chamada de função deslocamento, que
reflete a invariância no tempo de Σ, sendo caracterizada por (2.19).

= wi+1 , para todo w ∈ W Z e i ∈ Z.



σ(w) i
(2.19)

Considerar (X, σ) como um sistema que evolui discretamente, com a sequência em que os eventos
ocorrem associada a Z, permite que interpretemos σ como o mapeamento adjacente que provê a
dinâmica sobre o conjunto X. Ainda podendo ser vista como o gerador do grupo {σ n | n ∈ Z} que
representa a ação transitiva do grupo infinito (Z, +) sobre W Z .
Ao considerarmos W um conjunto finito, possibilitamos a determinação de uma topologia a W Z
decorrente da métrica discreta associada a W , especificada em (2.20).

0 se α = β,
ρ(α, β) = (2.20)
1 se α 6= β.

Sendo a métrica do espaço discreto associado a i-ésima coordenada do espaço de dimensão infinita
W Z dada por (2.21).
ρ(α, β)
ρi (α, β) = . (2.21)
2|i|−1
A métrica do espaço produto W Z formado pelos espaços discretos associados as suas coordenadas é
dada em (2.22).
d(x, y) = max ρi (xi , yi ), (2.22)
−∞<i<∞

o que permite a definição da métrica (2.22) por d(x, y) = 2−e(x,y) , onde e(x, y) = max{n ≥ 0| xi =
yi , −n ≤ i ≤ n}, convencionando-se e(x, y) = ∞ se x = y e e(x, y) = −1 se x0 6= y0 . As-
32 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica

sim, de acordo com a métrica (2.22) dois pontos em W Z são tão mais próximos quanto mais longa
a sequência central (com centro associado à coordenada 0) na qual coincidem. Munidos com uma
métrica, podemos considerar uma estrutura onde dispomos de conjuntos abertos e fechados. Consi-
derando o espaço métrico (W Z , d), nós demonstramos na Proposição 6 que os conjuntos fechados em
(W Z , d) correspondem exatamente aos sistemas dinâmicos completos definidos em W Z .

Proposição 6. X é um sistema dinâmico completo em W Z se, e somente se, X é um conjunto fechado


no espaço métrico (W Z , d).

Demonstração: Suponha que X é um sistema dinâmico completo em (W Z , d) e que existe a ∈ W Z


satisfazendo d(a, X) = 0. Isso implica que a|[t0 ,t1 ] ∈ X|[t0 ,t1 ] , −∞ < t0 ≤ t1 < ∞, decorrendo da
completude de X que a ∈ X. Concluı́mos que X é fechado, uma vez que X é igual ao seu fecho.
Do fato de X ser fechado, a equação X = {a ∈ W Z | d(a, X) = 0} é observada. Suponha
que w ∈ W Z satisfaz w|[t0 ,t1 ] ∈ X|[t0 ,t1 ] , −∞ < t0 ≤ t1 < ∞. Portanto, existe x ∈ X tal que
w|[−n,n] = x|[−n,n] para n > 0 arbitrário, o que implica que d(w, X) = 0. Segue do fechamento de X
que w ∈ X. 

Agora, temos como descrever um sistema dinâmico completo em um conjunto finito W de forma
puramente topológica, quando associado ao espaço métrico (W Z , d). Fazemos isso na Definição 6,
onde dá-se o nome de sistema simbólico fechado a tal sistema.

Definição 6. Um subconjunto X de um espaço métrico discreto (W Z , d) é um sistema simbólico


fechado (ssf) se X é fechado e invariante por deslocamento, i.e., σ(X) = X.

Na verdade os ssf são conhecidos e extensivamente estudados na literatura cientı́fica, sendo o


principal objeto de estudo na teoria de dinâmica simbólica, encontrando diversas aplicações tanto
em casos de interesse teórico quanto prático. A novidade aqui decorre de demonstrarmos explicita-
mente serem estes os sistemas discretos sobre conjuntos finitos que possibilitam a determinação de
representações através de equações a diferença e leis de evolução.
Empregando uma variação do “argumento diagonal de Cantor”, podemos demonstrar que o con-
junto W Z é compacto. Para isso, consideremos uma sequência {wn } em W Z . De forma indutiva,
para k ≥ 1 determina-se uma sequência S1 ⊃ S2 ⊃ S3 . . . de subconjuntos infinitos de inteiros po-
sitivos, tal que, todos os blocos wm |[−k,k] são iguais para todo m ∈ Sk . Define-se x como o ponto
com x|[−k,k] = wm |[−k,k] para todo m ∈ Sk , e de forma indutiva define-se mk com o menor inteiro
de Sk que excede mk−1 . Assim, x ∈ X e a sequência {wmk } converge para x quando k → ∞.
Concluı́mos que toda sequência em (W Z , d) possui uma subsequência que converge em (W Z , d), o
que o caracteriza como um espaço métrico compacto. Como um subconjunto fechado de um espaço
métrico compacto é compacto, então um ssf X é compacto.
2.4 A Topologia de Sistemas Dinâmicos Discretos Invariantes no Tempo e Completos 33

2.4.1 Homeomorfismo e codificação

Como caso de estudo na teoria de dinâmica simbólica que encontra aplicações no estudo de códigos,
podemos citar os sistemas dinâmicos simbólicos definidos par (M, φ), onde M é um espaço métrico
compacto e φ : M → M é uma função contı́nua. Quando φ for um homeomorfismo (uma função
contı́nua, sobrejetiva, injetiva e seu inverso φ−1 é contı́nuo), então (M, φ) é chamado de um sistema
dinâmico inversı́vel. Um exemplo importante de homeomorfismo é (X, σ), onde X é um ssf e σ é a
função deslocamento.
O processo de comparação de sistemas dinâmicos simbólicos é formalizado pelo conceito de
homomorfismo, sendo este um mapeamento θ : (M, φ) → (N, ϕ) contı́nuo que satisfaz a propriedade
comutativa ϕ ◦ θ = θ ◦ φ, como representado no seguinte diagrama.

φ
M −−−→ M
 
 
θy yθ
N −−−→ N
ϕ

Se θ for injetivo e sobrejetivo, como M é compacto, então o mapeamento θ−1 também é contı́nuo.
Neste caso, θ é chamado de conjugado topológico e é escrito como θ : (M, ϕ) ∼
= (N, φ). Quando
há um conjugado topológico entre dois sistemas dinâmicos, estes são chamados de topologicamente
conjugado.
Consideremos o importante caso quando ϕ e φ são funções deslocamento. Dado os sistemas
dinâmicos fechados (X, σX ) e (Y, σY ), onde σX , σY são as funções deslocamentos associadas aos con-
juntos W Z e V Z , respectivamente. Como W Z é compacto e X é fechado, então θ é uniformemente
contı́nua. Consequentemente, há um inteiro k tal que para todo x ∈ X, o elemento (θ(x))0 é deter-
minado pelo bloco x|[−k,k]. Como θ comuta com a função deslocamento, então qualquer sı́mbolo de
θ(x) é determinado por um bloco de comprimento (2k + 1).
Este resultado apresenta os elementos necessários para conectar a teoria de dinâmica simbólica à
de codificação. O código é obtido por uma função especial chamada código de bloco deslizante ou
sbc (do termo em inglês sliding block codes). Um sbc φ mapeia sequências . . . x−1 x0 x1 . . . de um
ssf X sobre W em uma sequência . . . y−1 y0 y1 . . . sobre V , de forma definida por um mapeamento de
blocos Φ : X|[0,m+n] → V , ou seja, de todos os blocos de comprimento m + n + 1 em sequências
de X para sı́mbolos em V . Assim, dado um sbc φ : X → V Z tem-se que y = φ(x) se, e somente se,
yi = Φ(xi−m · · · xi+n ) = Φ(x|[i−m,i+n] ), sendo φ um sbc de memória m e antecipação n induzido por
Φ.
Agora, se considerarmos x, x′ ∈ X tal que e(x, x′ ) ≥ m+n+1, então e φ(x), φ(x′ ) ≥ e(x, x′ )−

34 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica

(m + n). Portanto, considerando uma sequência de pontos {xk }∞ em X, se limk→∞ d(x, xk ) = 0


k=1
(i.e., se {xk }k=1 converse para x), então limn→∞ d φ(x), φ(xk ) = limk→∞ d(x, xk ) · 2m+n = 0.

Assim, um sbc é uma função contı́nua. Se agora considerarmos que y = φ(x), então φ(σX (x))i
 
= Φ x|[i+1−m,i+1+n] = yi+1 = σY φ(x) i , portanto φ · σX = σY · φ, implicando que um sbc comuta
com a função deslocamento. Dessas observações, podemos concluir que uma função θ : (X, σX ) →
(Y, σY ) é um sbc se, e somente se, θ é um homomorfismo. Este resultado conecta os elementos de
teoria de códigos às estruturas topológicas abordadas na teoria de dinâmica simbólica.

2.5 A Dinâmica Simbólica dos Sistemas Dinâmicos


Nesta subseção consideramos possı́veis aplicações da abordagem de Willems para sistemas dinâmicos
e o conceito de dinâmica simbólica. Observamos que ao interpretarmos problemas das mais diver-
sas matizes empregando os conceitos de sistema dinâmico apresentados aqui, podemos estabelecer
relações entre estruturas antes consideradas distintas, e apreciar possı́veis aplicações para conceitos
até então restritos a áreas especı́ficas da fı́sica ou matemática.

A Dinâmica de Códigos sobre Grupos

Empregando a abordagem de Willems, é possı́vel especificar propriedades, parâmetros e relações em


comum a diversas estruturas tı́picas da teoria de códigos [2]. De outra forma, todo código linear
convencional (bloco, convolucional, reticulado, ou treliça) é um código sobre grupo. Além disso, a
maioria dos bons códigos geometricamente uniformes são gerados por códigos sobre grupo.

Definição 7. Um espaço de sequências sobre grupo é um grupo gerado por produto direto W =
Πk∈I Gk , onde o eixo I é qualquer subconjunto de Z, e o alfabeto de sı́mbolos Gk , k ∈ I, são grupos
arbitrários. Um código sobre grupo ou sistema sobre grupo, é qualquer subgrupo C de um espaço de
sequências sobre grupo. Se todos os sı́mbolos dos alfabetos Gk são iguais ao de um grupo comum
G, então o espaço de sequências é denotado por W = GI , e C é chamado de um código sobre grupo
sobre G definido em I.

A partir da Definição 7, os conceitos e métodos de representação abordados nas Seções 2.1, 2.2 e
2.3 são estendidos à teoria de códigos. Em particular, como observado em [2], um código sobre grupo
C só poderá ser completamente caracterizado ou gerado por sua treliça (igual a todas as sequências
geradas por caminhos na treliça), se C for completo. Caso contrário, dada a treliça de um código C
incompleto, será necessário uma especificação adicional para C através de restrições globais.
Em particular, quando C for completo, podemos interpreta-lo como um ssf, agregando a sua
estrutura elementos de topologia, que como demonstrado no Capı́tulo 3, permite-nos abordar o pro-
2.5 A Dinâmica Simbólica dos Sistemas Dinâmicos 35

blema de geração de códigos e codificação por uma perspectiva combinatorial, empregando teoria de
linguagens formais e conceitos algébricos mais gerais que o de grupo.

Imagens Simbólicas de Sistemas Dinâmicos

Ao considerarmos sistemas dinâmicos determinados por difeomorfismos, é possı́vel estabelecer uma


clara relação entre sistemas discretos e contı́nuos. Sendo possı́vel derivar dos sistemas contı́nuos
os discretos, como também determinar o sistema contı́nuo a partir do discreto, empregando uma
correspondência natural entre as órbitas destes sistemas [11].
Uma forma natural de estabelecermos uma relação entre um sistema contı́nuo e um correspon-
dente discreto dar-se-a pela determinação de uma imagem simbólica, podendo ser considerada como
uma aproximação finita de um homeomorfismo f : M → M definido sobre uma variedade contı́nua
compacta M. A ideia é estabelecer um cobertura finita C = {M(1), . . . , M(n)} de M, onde os
M(i) são conjuntos fechados chamados de células. Para cada célula M(i) estabelece-se a imagem
f (M(i)), para a qual é estabelecida uma cobertura C(i) composta pelas células M(j) ∈ C que pos-
suem interseção não vazia com f (M(i)), ou seja, C(i) = {M(j) : M(j) ∩ f (M(i)) 6= ∅}. Portanto,
as células de C(i) são chamadas de imagens de M(i) por f . Considerando o conjunto de ı́ndices
c(i) = {j : M(j) ∩ f (M(i)) 6= ∅}, podemos definir um grafo direcionado G composto por vértices
{i} associados naturalmente as células {M(i)}. Dois vértices i e j de G são conectados por um ramo
i → j se, e somente se, j ∈ c(i), i.e., a célula M(j) está contida na cobertura de f (M(i)).
Fica claro que uma imagem simbólica é uma aproximação do sistema contı́nuo e que não é única,
podendo ser considerada como uma quantização do sistema. De fato, existem ferramentas que permi-
tem o refinamento progressivo e controlado (com relação a evolução da complexidade das sucessivas
imagens) de uma imagem simbólica, de forma a aproximar seu comportamento daquele do sistema
contı́nuo [11]. Tais representações constituem uma ferramenta valiosa na análise de sistemas reais,
não só pela relação que há entre as órbitas dos sistemas contı́nuos e caminhos em G, mas também por
que constituem um meio de determinar-se informações sobre a estrutura global de um sistema, como
a entropia e o expoente de Lyapunov. No presente contexto, as imagens simbólicas são sistemas
dinâmicos intrinsecamente relacionados a abordagem de Willems, cuja completude decorre direta-
mente do método de construção, portanto, imagens simbólicas são exemplos de sistemas simbólicos
fechados.

Particionamento Markoviano

O processo de expansão n-ário dos reais é o mais simples exemplo de métodos de representação
simbólica de órbitas de sistemas dinâmicos. Estes métodos se baseiam na representação das órbitas
36 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica

de um sistema dinâmico por sequências de sı́mbolos determinados por um particionamento adequado


do domı́nio do sistema. Particionamentos Markovianos constituem uma forma de obter-se sequências
de sı́mbolos úteis para representação de órbitas do sistema, ou seja, que refletem caracterı́sticas glo-
bais do sistema dinâmico [12]. De fato, particionamentos Markovianos são um tipo de particiona-
mento topológico, contudo satisfazem uma condição de necessidade relacionada ao comportamento
de um sistema dinâmico especı́fico, ou seja, entende-se que um particionamento Markoviano está
relacionado a um sistema dinâmico subjacente.
Uma famı́lia finita de conjuntos R = {R0 , R1 , . . . , RN −1 } é dito um particionamento topológico
para um espaço compacto X se satisfaz as seguintes condições.

1. cada Ri é aberto;

2. Ri ∩ Rj = ∅, i 6= j;

3. X = R0 ∪ R1 ∪ · · · RN −1 .

Se X é o domı́nio de um sistema dinâmico especificado por (X, φ), a partição R é dita gerador8
Markoviano se a condição (2.23) é satisfeita.
n
\
−1
Rsk ∩ φ Rsk+1 6= ∅, 1 ≤ k ≤ n − 1 ⇒ φ−k Rsk 6= ∅. (2.23)
k=1

Para R um gerador Markoviano e (X, φ) um sistema dinâmico expansivo, podemos representar sua
dinâmica por um ssf determinado por um grafo G com vértices A = {0, 1, . . . , N −1} e uma transição
do vértice i para o vértice j sempre que Ri ∩ φ−1 Rsn 6= ∅. Novamente um ssf é empregado como
representação simbólica do comportamento de um sistema dinâmico. No Capı́tulo 5 consideraremos
o método de codificação do fluxo geodésico de Artin, que é um caso concreto onde esse método de
representação simbólica é utilizado.

8
A definição de uma partição topológica que é um gerador, está fora do escopo desse trabalho, mas pode ser encontrada
em [12], como também outros tópicos relacionados.
Capı́tulo 3

Dinâmica Simbólica e Autômatos

Neste capı́tulo mostraremos como as propriedades topológicas, descritas na Seção 2.4, inerentes a
um ssf X devem ser utilizados para determinação de uma representação combinatorial de X pelo
emprego de conceito tı́picos de linguagem formal. Identificaremos as propriedades das linguagens
associadas a X, empregando-as para a determinação de leis de evolução e grafos direcionados finitos
associados (quando a linguagem de X for regular) que apresentem as sequências bi-infinitas de X.
Estes resultados são obtidos pela introdução dos conceitos de conjuntos proibidos e conjunto de
restrições irredutı́veis, que ainda nos possibilitam especificar procedimentos que permitem identificar
a estrutura algébrica associada à linguagem de X.
Como consequência das propriedades de um sistema simbólico fechado X ⊆ AZ , assim como
para os sistemas de eventos discretos abordados na Seção 2.3.4, podemos determina-lo a partir de um
subconjunto do monoide livre A∗1 , ou seja, a partir de uma linguagem que especifique-o unicamente.
Z
Para tanto, inicialmente, vamos definir o conjunto cilindro CkA (u), como sendo o subconjunto de
Z
A∗ formado pelos pontos x para os quais u é um fator iniciando na coordenada k, i.e., CkA (u) =
{ x ∈ X | u = x|[k,k+|u|−1]}. Como X é um conjunto fechado, então seu complemento em relação a
A∗ é aberto, ou seja, o conjunto A∗\X. Portanto, para todo y ∈ AZ \X existe k = k(y), tal que, se
A Z A Z
uy = y|[−k,k] observa-se C−k (uy ) ⊆ AZ \X. Podendo-se verificar que C−k (uy ) = B2−(k−1) (y), onde
B2−(k−1) (y) é a bola aberta de raio 2−(k−1) em torno de y. Segue disto que o conjunto F = {uy | y ∈
AZ \X} é suficiente para determinar X. Sendo X o conjunto de todas as sequências em AZ que não
possuem fatores em F. Para verificar esta afirmação, suponha que para um dado uy ∈ F existe x ∈ X
Z
satisfazendo uy = x|[i,j] , então σ (i+k) (x) ∈ C−k
A
(uy ), o que é uma contradição, já que X é invariante
por deslocamento.
Assim, podemos especificar X como o conjunto de sequências em AZ que não possuem fatores
em F, ou seja, para quaisquer inteiros i ≤ j temos que x|[i,j] ∈
/ F. O que nos permite especificar a
1
Conjunto de todas as sequências possı́veis com elementos em A, incluindo a de comprimento zero ε.

37
38 Dinâmica Simbólica e Autômatos

linguagem de X; se Bn (X) é o conjunto de todas as sequências de comprimento n que são fatores de


algum elemento de X, então a linguagem de X é dada por B(X) = ∞
S
n=0 Bn (X). Desta forma, po-
demos empregar métodos complementares para determinarmos se uma sequência bi-infinita pertence
a X, o que ocorre se nenhum de seus fatores pertencem a F ou, equivalentemente, se todos os seus
fatores pertencem a B(X).
Da Seção 3.1 até a Seção 3.7, seguimos a abordagem apresentada em [13, 14] para apresentar
os conceitos de semigrupo, linguagem, autômato e monoide sintático. O motivo da escolha desta
abordagem, deve-se a estreita relação que ela guarda com elementos tı́picos da teoria de sistemas
dinâmicos e estruturas algébricas. Como exemplo, quando faz-se uso da ação das funções parciais
definidas sobre vértices do autômato minimal associado a uma linguagem qualquer L para definir
o monoide sintático associado a L, ver Seção 3.6. Como alternativa, os mesmos conceitos podem
ser apresentados através de uma perspectiva essencialmente de teoria da computação [15, 16, 17].
Na Seção 3.8 são apresentados alguns conceitos necessários ao estudo das linguagens dos sistemas
simbólicos fechados. Nas demais seções apresentamos uma série de novos conceitos e resultados,
como também algumas conclusões e métodos derivados destes.

3.1 Monoide e Semigrupo


O conceito de linguagem está intrinsecamente relacionado com a estrutura algébrica de monoide.
Esta última relacionada com a ação de uma função parcial definida sobre os estados de uma máquina
de estados representando a linguagem (autômato). Este monoide incorpora uma estrutura algébrica
ao estudo de linguagens formais.
De forma geral, o conceito de monoide é decorrente daquela de semigrupo definido como um
conjunto S juntamente com uma operação binária “·” (comumente omitida nas expressões), satisfa-
zendo as propriedades de fechamento e associatividade. Ou seja, para todo a, b, c ∈ S são satisfeitas
as relações (3.1).
ab ∈ S fechamento
(3.1)
(ab)c = a(bc) associatividade
Rigorosamente um semigrupo é representado como o par (S, ·), deixando claro a existência de um
conjunto e uma operação, no entanto, é comum referir-se a um semigrupo pelo conjunto que o
compõe. O monoide surge como um caso particular de um semigrupo, importante em diversas
aplicações deste conceito. Também conhecido como um semigrupo com identidade, um monoide
possui um elemento 1, chamado de identidade, satisfazendo a relação (3.2).

a1 = 1a = a, ∀a ∈ S (3.2)
3.1 Monoide e Semigrupo 39

Supor a existência de dois elementos identidade 1, 1′ em um monoide S implica que 1 = 11′ = 1′ já
que 1 é uma identidade, conclui-se que só há um elemento identidade em um monoide.
Sejam M, M ′ dois monoides, um morfismo ϕ : M → M ′ é uma função satisfazendo as condições:

ϕ(ab) = ϕ(a)ϕ(b), ∀ a, b ∈ M (3.3)


ϕ(1M ) = 1M ′ (3.4)

onde 1M , 1M ′ são os elementos identidade de M, M ′ respectivamente, ambos sendo representados


por 1 quando não há confusão.
A composição de dois morfismos

ϕ ϕ′
M −→ M ′ −→ M ′′

também é um morfismo
ϕϕ′
M −→ M ′′ .

Dados dois subconjuntos X, Y de um monoide M, o conjunto XY é definido por

XY = {xy| x ∈ X, y ∈ Y }.

Um sub-monoide T de um monoide M é um subconjunto de M tal que

1 ∈ T and T 2 ⊂ T,

onde T 2 = T T . Em geral, tem-se T 0 = 1 e T n+1 = (T n )T . Portanto, para qualquer subconjunto A


de um monoide M, o conjunto

A∗ = 1 ∪ A ∪ A2 ∪ . . . ∪ An ∪ . . .

é um sub-monoide de M e é o menor sub-monoide de M contendo A.


Um exemplo de um monoide é o conjunto FX de todas as funções sobre um conjunto X. Como um
sub-monoide, podemos citar o subconjunto de FX cujas funções são bijeções, sendo este subconjunto
um grupo. Quando X é finito, este sub-monoide é o grupo de permutação de X.
Um monoide de maior importância para os objetivos deste texto é o monoide livre. Dado qualquer
conjunto A, o monoide livre A∗ com base A é definido como o conjunto de todas as n-uplas s =
(a1 , . . . , an ), n ≥ 0, formadas por elementos em A. O inteiro n é chamado de comprimento de s
sendo denotado por |s|. Se t = (b1 , . . . , bm ) é outro elemento de A∗ , o produto st é uma justaposição,
40 Dinâmica Simbólica e Autômatos

i.e.,
st = (a1 , . . . , an , b1 , . . . , bm ).

O que acarreta no elemento identidade 1 = ( ). A operação de justaposição, ou concatenação, pode


ser explicitada por s · t. Pode-se verificar que |st| = |s| + |t| and |1| = 0. Para simplificar a notação,
os parênteses e vı́rgulas são suprimidos. Logo, emprega-se s = a1 a2 . . . an como substituição a
s = (a1 , a2 , . . . , an ) para n > 0. Como consequência dessa notação, o elemento s é chamado uma
palavra de comprimento n, enquanto a ∈ A é chamado uma letra, e A o alfabeto.
Uma propriedade básica de um monoide livre A∗ é que qualquer função α : A → M, onde M é
um monoide, admite uma única extensão para um morfismo α : A∗ → M. A respectiva prova segue
por indução. Seja β outra extensão para um morfismo de α, tal que β(w) = α(w) para todo w ∈ A∗
e |w| ≤ n para algum inteiro positivo n. Como ambos β e α são extensões de α então β(a) = α(a)
para todo a ∈ A, ou w tal que |w| = 1. A partir da definição de um morfismo, β(1) = α(1) = 1.
Agora, seja w = uv e 0 ≤ |u|, |v| ≤ n, então β(uv) = β(u)β(v) = α(u)α(v) = α(uv), do que
conclui-se que há uma única extensão de α para um morfismo.
Seja s ∈ A∗ . Um elemento t ∈ A∗ é um segmento ou fator de s se s = utv para algum u, v ∈ A∗ .
Se u = 1 então t é um prefixo, se v = 1 então t é um sufixo.
Seja f : A∗ → B∗ um morfismo de um monoide livre com base A para um monoide livre
com base B, respectivamente. Como f admite uma única extensão, este morfismo é completamente
determinado pelos elementos f (a) ∈ A∗ para todo a ∈ A. Se f (a) ∈ 1 ∪ B para todo a ∈ A, então
f é chamado morfismo fino; em um morfismo fino letras de A são mapeadas em letras de B ou em 1.
Se f (a) ∈ B para todo a ∈ A, então f é dito muito fino.
Considerando a estrutura algébrica dos semigrupos. Como especificado anteriormente, semi-
grupos são uma estrutura algébrica mais geral que monoide, pois ao contrário deste não requer a
existência de um elemento identidade. Logo, todo monoide é um semigrupo, enquanto a implicação
reversa não é verdadeira.
Se A é um subconjunto de um semigrupo S então

A+ = A ∪ A2 ∪ . . . ∪ An ∪ . . .

é o menor semigrupo de S contendo A. Em particular

A+ = A∗ \{1},

i.e., A+ é formado por todas as palavras de comprimento estritamente positivo. A notação de um


morfismo para um semigrupo é definido como aquela para um monoide, contudo sem requerer (3.4).
3.2 Relações e Congruências 41

Sejam Q e A dois conjuntos, sendo o último finito, define-se a função parcial2

Θ : Q × A∗ → Q, (3.5)

onde A∗ é o monoide livre com base A, satisfazendo as condições

Θ(Θ(q, s), t) = Θ(q, st) (3.6)


Θ(q, 1) = q (3.7)

Com o intuito de simplificar a notação, quando não houver possibilidade de gerar-se confusão Θ(q, s)
será escrito como qs. Assim, as condições (3.6) e (3.7) podem ser escritas como

q1 = q, (qs)t = q(st). (3.8)

Sempre que uma função parcial (3.5) satisfazendo (3.8) é dada, diz-se que Q é um A-módulo (à
direita) com (3.5) como ação. Se (3.5) é uma função, então o módulo é dito ser completo.

3.2 Relações e Congruências


Uma relação de um conjunto X para um conjunto Y , é comumente definida como um subconjunto
do produto cartesiano X × X, sendo alternativamente descrita como uma função

f : 2X → 2Y , (3.9)

onde 2X e 2Y são os conjuntos formados por todos os subconjuntos de X e Y , respectivamente.


Adicionalmente, f deve ser completamente aditiva, i.e.,
[  [ 
f Ai =f Ai ,
I I

onde {Ai | i ∈ I} é a famı́lia de subconjuntos de X indexados por I. Disto segue que f (∅) = ∅.
Como decorrência da aditividade, f é completamente determinada pelos seus valores nos singletons,
tal que f pode ser vista como uma função

f : X → 2Y .

2
Se f : A → B é uma função parcial, então f (a) possui no máximo um elemento, para todo a ∈ A.
42 Dinâmica Simbólica e Autômatos

Composição de funções é facilmente determinada a partir de (3.9). As duas descrições alternati-


vas para uma relação dadas acima, diferenciam-se essencialmente pelos fundamentos nos quais são
estruturadas, enquanto a primeira é baseada em teoria de conjuntos, a segunda emprega conceitos
afins à teoria de categorias, permitindo a interpretação de uma relação como uma estrutura que apre-
senta uma dinâmica derivada da função que a define. Podemos relacionar estas abordagens con-
siderando que uma relação f : X → Y é definida como um subconjunto rf de X × Y tal que
rf = {(x, y)| y ∈ f (x)}.
Para toda relação f : X → Y , a relação inversa f −1 : Y → X é definida por

f −1 (y) = {x| y ∈ f (x)}.

O domı́nio de uma relação f : X → Y é definida como

Domf = {x| x ∈ X, f (x) 6= ∅}.

Uma relação f : X → Y é chamada uma função parcial se para cada x ∈ X o conjunto f (x) possui
no máximo um elemento. Se f (x) possui exatamente um elemento, então f é uma função.
A relação r : X → X é chamada uma relação de equivalência se satisfaz as condições

1X ⊂ r, r −1 ⊂ r, rr ⊂ r,

onde 1X : X → X representa a função identidade. Uma relação satisfazendo a primeira destas


condições é dita reflexiva, a segunda é dita simétrica e a terceira é dita transitiva.
A expressão x2 ∈ r(x1 ) é escrita como x1 ∼r x2 , ou x1 ∼ x2 se isso não implicar em uma
confusão. Isto conduz a forma mais familiar de descrever as propriedades de reflexão, simetria e
transitividade, respectivamente.

x∼x
x1 ∼ x2 implica x2 ∼ x1
x1 ∼ x2 e x2 ∼ x3 implica x1 ∼ x3

Destas condições segue que para quaisquer dois elementos x1 , x2 de X os subconjuntos r(x1 ) e
r(x2 ) são ambos iguais ou diferentes. Estas são as classes de equivalência ou r-classes de X mod r.
O conjunto de todas as classes de equivalência é representado por X/r e chamado de quociente de
X mod r. É de conhecimento comum em algébrica que qualquer cobertura de X por conjuntos
disjuntos não vazios determina uma única relação de equivalência em X, para a qual tais conjuntos
3.2 Relações e Congruências 43

são exatamente as classes de equivalência.

Seja f : X → Y uma função. Os subconjuntos não vazios de X da forma f −1 (y) determinam


uma relação de equivalência em X chamada de kernel ou núcleo de f , representada por kerf . Assim,
x1 ∼ x2 mod (kerf ) se, e somente se, f (x1 ) = f (x2 ). Portanto, a função f admite uma única
fatoração
π g
X −→ X/kerf −→ Y

onde g é uma função. Além disso, a função g é injetiva. A função f é injetiva se, e somente se, kerf
é a relação identidade 1X , o que implica que X/1X = X.

Seja r uma relação de equivalência em um monoide M. Diz-se que r é uma congruência em M


se
r(a)r(b) ⊂ r(ab)

para todo a, b ∈ M. Formulações equivalentes são

a ∼ b e c ∼ d implica ac ∼ bd,

e
a ∼ b implica ca ∼ cb e ac ∼ bc.

O fato do produto r(a)r(b) de duas classes de equivalência estar contido em uma única classe de
equivalência r(ab) pode ser usado para definir uma multiplicação em X/r. Com essa multiplicação,
o conjunto quociente X/r torna-se um monoide e π : X → X/r é um morfismo entre monoides.

Se f : M → M ′ é um morfismo entre monoides, então kerf é uma congruência em M e na


fatoração
π g
M −→ M/kerf −→ M ′

g é um morfismo injetivo.

Quando M é um grupo, então a congruência r em M é completamente determinada pela classe


de equivalência 1r contendo o elemento identidade de M. Na perspectiva de teoria de conjuntos, 1r
é um subgrupo invariante (normal) H de M. O morfismo π : M → M/r cede lugar à congruência r
em M cuja classe de equivalência 1r = H é um subgrupo normal de M. Estes comentários ressaltam
dois aspectos importantes de grupos normais: como um subgrupo invariante do grupo M; e como
uma relação de congruência em M. Estes aspectos estão relacionados com teoria de conjunto e teoria
de categorias, respectivamente.
44 Dinâmica Simbólica e Autômatos

3.3 Cálculo de Divisão

Seja M um monoide. Para cada a ∈ M as funções

La : M → M e Ra : M → M

chamadas multiplicação à esquerda por a e multiplicação à direita por a, respectivamente, são defi-
nidas por
La (b) = ab e Ra (b) = ba.

Se A é um subconjunto de M, estas funções resultam nas relações

LA : M → M e RA : M → M

tal que
[ [
LA = La e RA = Ra .
a∈A a∈A

Segue que para qualquer B ⊂ M

LA (B) = AB e RA (B) = BA

onde
AB = {ab|a ∈ A, b ∈ B}.

As relações inversas correspondentes também são de interesse

L−1 −1 −1 −1
a , LA , Ra , RA : M → M

referentes a

L−1
a (b) = {x| x ∈ M, ax = b}

Ra−1 (b) = {x| x ∈ M, xa = b}


L−1
A (B) = {x| x ∈ M, Ax ∩ B 6= ∅}
−1
RA (B) = {x| x ∈ M, xA ∩ B 6= ∅}

Quando M é um grupo então L−1 −1 −1 −1


a (b) = a b e Ra (b) = ba , o que induz à notação

L−1 −1 −1
A (B) = A B e RA (B) = BA
−1
3.3 Cálculo de Divisão 45

mesmo quando M não é um grupo.

Se M é um monoide livre, então L−1


a é uma função parcial, já que para qualquer b ∈ M há no
máximo um x ∈ M tal que ax = b. Assim, a−1 b = L−1
a (b) é no máximo um elemento. Se M é um
grupo, L−1
a = La−1 é uma função. Em um monoide arbitrário M, a equação ax = b pode ter qualquer
número de soluções e L−1
a é uma relação.

A formula associativa (AB)C = A(BC) para A, B, C ⊂ M é equivalente a cada uma das


identidades em (3.10).

RC RB = RBC , LA RC = RC LA , LAB = LA LB . (3.10)

Com inversos correspondentes

−1 −1 −1
RB RC = RBC , RC−1 L−1 −1 −1
A = LA RC , L−1 −1 −1
AB = LB LA ,

que podem ser reescritos como

(AC −1 )B −1 = A(BC)−1
(A−1 B)C −1 = A−1 (BC −1 )
(AB)−1 C = B −1 (A−1 C).

Estendendo este formalismo para módulos, obtém-se: Seja Q um A-módulo. Para cada a ∈ A∗
tem-se uma função parcial definida em (3.11).

Ra : Q −→ Q
(3.11)
q −→ qa

Para cada q ∈ Q tem-se uma função parcial

Lq : A∗ → Q,

dada por
Lq (a) = qa.

Como antes, derivam-se as relações

LX : A∗ → Q, RA : Q → Q
46 Dinâmica Simbólica e Autômatos

definidas para X ⊂ Q, A ⊂ A∗ por


[ [
LX = Lq , RA = Ra .
q∈X a∈A

Assim
LX (A) = XA = RA (X),

onde
XA = {qa| q ∈ X, a ∈ A}.

Determinando-se as relações inversas, tem-se

X −1 Y = L−1 ∗
X (Y ) = {a| a ∈ Σ , Xa ∩ Y 6= ∅}

XA−1 = RA
−1
(X) = {q| q ∈ Q, qA ∩ X 6= ∅}

para X, Y ⊂ Q, A ⊂ A∗ .
A equação associativa (XB)C = X(BC) para X ∈ Q e B, C ⊂ A∗ implica nas equações
apresentadas em (3.12).

RC RB = RBC , LX RC = RC LX , LXB = LX LB . (3.12)

É importante salientar que na segunda equação em (3.12) o RC no lado esquerdo é uma relação
RC : Q → Q enquanto no lado direito é uma relação RC : A∗ → A∗ . Similarmente, LB no lado
direito da terceira equação é uma relação LB : A∗ → A∗ . As três identidades são expressas por
diagramas de comutação na forma apresentada na Figure 3.1.
RB LX LB
Q❃ / Q Σ∗ / Q Σ∗❅ / Σ∗
❃❃ ❅❅ ⑦⑦
❃❃ ❅❅ ⑦⑦
RC RC ❅ ⑦⑦ LX
RBC ❃❃ RC   LXB ❅❅ ⑦
  LX ~⑦
Q Σ∗ / Q Q

Figura 3.1: Diagramas de comutação das expressões RC RB = RBC , LX RC = RC LX , e LXB =


LX LB .

Os inversos das identidades expressas em (3.12) são, respectivamente,

(XC −1 )B −1 = X(BC)−1 ,
(X −1 Y )C −1 = X −1 (Y C −1 ), (3.13)
(XB)−1 Y = B −1 (X −1 Y ),
3.4 Linguagens Regulares 47

onde X, Y ⊂ Q e B, C ⊂ A∗ .

3.4 Linguagens Regulares


Seja A um conjunto finito chamado alfabeto. Um autômato Σ sobre A (ou A-autômato) é formado
por quatro elementos:

Estados: Um conjunto finito Q chamado de estados.

Estados Iniciais: Os elementos de um subconjunto I ⊆ Q.

Estados Terminais: Um subconjunto T ⊆ Q.

Ramos: Um subconjunto E ⊆ Q × A × Q. Logo, um ramo do autômato é uma tripla (p, a, q) em


E, onde são definidas as funções i : E → Q, t : E → Q e L : E → A especificadas por
i(p, a, q) = p, t(p, a, q) = q e L(p, a, q) = a, respectivamente. O conjunto E também pode
ser representado pela função parcial δ : Q × A → Q, tal que δ(p, a) pode ser escrito como
(p, a, δ(p, a)) na notação anterior.

Quando L é uma bijeção, então é comum representar E pelos elementos em A. O que é bem definido
quando associado com as funções i e t, uma vez que um ramo e representa a tripla (i(e), e, t(e)).
a
Outras maneiras de representar um ramo são a : p → q e p −→ q. Mesmo que a função L : E → A
não seja bijetiva, sempre é possı́vel associar E com os elementos de um conjunto A′ através de uma
função L′ : E → A′ , e os elementos em A′ com aqueles em A através da função L′′ : A′ → A,
satisfazendo L′′ (e) = L(L′−1 (e)), tal que L = L′′ L′ .
Um caminho em Σ é uma sequencia w = e1 e2 . . . en de ramos satisfazendo t(ej ) = i(ej+1 ),
1 ≤ j ≤ n, e |w| = n é o comprimento de w. Conceitos importantes são o de caminho nulo e palavra
nula, ambos escritos como ε e possuindo comprimento zero. Adicionalmente temos que i(w) = i(e1 )
e t(w) = t(en ), L(w) = L(e1 . . . en−1 ) L(en ) é o rótulo de w, |L(w)| = |w| é o comprimento da
L(w)
palavra L(w), e i(w) −→ t(w) ou L(w) : i(w) → t(w) são caminhos em Σ com rótulo L(w) de
i(w) para t(w). Um caminho w : i → t com i ∈ I e t ∈ T é chamado realizável. O subconjunto de
A∗ descrito por {L(w)| w é um caminho realizável em Σ} = |Σ| é chamado o comportamento de Σ
ou a linguagem representada por Σ, conceitos herdados da teoria de sistemas dinâmicos.
Neste contexto, uma operação natural é a concatenação de caminhos:

w : p → q, v : q → r
48 Dinâmica Simbólica e Autômatos

Então,
wv : p → r

conceito que juntamente com o de função de rotulação L permite a especificação da operação de


concatenação de palavras. A operação de concatenação de caminhos pode ser pensada como a
concatenação de funções parciais de Q para Q, associadas por um morfismo com os caminhos em
Σ.
Um subconjunto L de A∗ é dito regular se há um A-autômato Σ tal que |Σ| = L. Assim, quando
um conjunto L ⊆ A∗ é dito regular, há um autômato Σ tal que |Σ| = L.
Seja Σ = (Q, I, T ) um A-autômato, X um subconjunto de Q, e s ∈ A∗ . O subconjunto Xs ⊆ Q
é definido pelas propriedades:

(1) X(st) = (Xs)t.

(2) Xε = X.

(3) ∅s = ∅.

(4) (X1 ∪ X2 )s = X1 s ∪ X2 s.

(5) qa = {p | a : q → p é um ramo em Σ}.

Do que segue que:

Xs = {q | existe um caminho w : p → q com p ∈ X e L(w) = s} (3.14)

Para qualquer subconjunto A ⊂ A∗ define-se


[
XA = Xs
s∈A

A partir de (3.14) o conjunto regular de um autômato Σ é dado por:

|Σ| = {s|Is ∩ T 6= ∅} (3.15)

O autômato Σ é dito ser acessı́vel se para todo estado q há um caminho w : i → q com i ∈ I. Assim,
A é acessı́vel se, e somente se, IA∗ = Q. A partir de (3.15) tem-se que o comportamento de Σ e
aquele do autômato obtido de Σ pela remoção dos estados Q − IA∗ e dos ramos que emergem destes,
ou seja, dos ramos e satisfazendo i(e) ∈ Q − IA∗ . A última operação conduz ao autômato acessı́vel

Σa = (Qa , I, T a),
3.4 Linguagens Regulares 49

Qa = IA∗ , T a = T ∩ Qa , tal que |Σ| = |Σa |, sendo chamada de parte acessı́vel de Σ.


A noção dual à de acessibilidade é a de co-acessibilidade. Seja A ⊆ A∗ e X ⊆ Q, então

XA−1 = {q | existe um caminho w : q → p com p ∈ X e wL ∈ A}.

Do que podem ser obtidas propriedades análogas às (1)-(5). Observando-se que

|Σ| = {s|I ∩ T s−1 6= ∅}.

O autômato Σ é dito co-acessı́vel se


T A∗ −1 = Q.

Removendo-se os estados Q−T A∗ −1 de Σ obtém-se o autômato co-acessı́vel Σb com |Σb | = |A|. Um


autômato Σ é dito essencial se ele é acessı́vel e co-acessı́vel. Dado um autômato Σ, sua componente
essencial é Σt , e Σt = (Σb )a = (Σa )b .
Um A-autômato Σ = (Q, I, T ) é dito determinı́stico se satisfaz as condições:

(1) Σ possui no máximo um estado inicial.

(2) Para todo q ∈ Q e a ∈ A há no máximo um ramo a : q → p em Σ.

Se em (1) e (2) “no máximo um” é substituı́do por “exatamente um” então o autômato determinı́stico
A é dito ser um autômato completo. Dado um autômato determinı́stico Σ = (Q, i, T ), um autômato
completo Σc = (Qc , ic , T ) chamado de complementação de Σ é determinado pelas operações: Se
Σ é completo, então Σc = Σ. Se Σ não é completo, então i = ∅ ou qa = ∅ para algum par
q ∈ Q, a ∈ A. Ao conjunto Q é associado um novo estado denotado por ♦. Assim, Qc = Q ∪ ♦.
Se i = ∅, então ic = ♦, caso contrário ic = i. Se a ação de A sobre Qc é representada por “·”, então:
q · a = qa se qa 6= ∅ em Q, q · a = ♦ se qa = ∅ em Q, e ♦ · a = ♦. Como ♦ não é terminal,
ele não está contido em um caminho de Σc e, portanto, |Σc | = |Σ|.
Aplicando os conceitos apresentados na Seção 3.3 obtém-se que o comportamento de um autômato
determinı́stico Σ = (Q, i, T ) é
|Σ| = i−1 T (3.16)

A aplicação desta formula conduz a Proposição 7.

Proposição 7. [13] Se A é um subconjunto regular de A∗ , então para qualquer subconjunto B de A∗


os subconjuntos B −1 A e AB −1 são regulares.
50 Dinâmica Simbólica e Autômatos

Demonstração: Seja Σ = (Q, i, T ) um autômato determinı́stico representando A. Segue de (3.16)


que o comportamento do autômato (Q, i, T B −1 ) é

i−1 (T B −1 ).

Como pelas equações (3.13) e (3.16)

i−1 (T B −1 ) = (i−1 T )B −1 = AB −1 ,

segue que AB −1 é regular.

Se s ∈ A∗ e q = is ∈ Q, então o comportamento do autômato Σq = (Q, q, T ) é

|Σq | = q −1 T = (is)−1 T = s−1 (i−1 T ) = s−1 A.

Portanto,
[
B −1 A = |Σq |,
q∈iB

e B −1 A são regulares, já que a união de conjuntos regulares é regular. 

Para finalizarmos a seção, é relevante comentarmos sobre uma representação alternativa para um
autômato finito, comumente encontrada em texto sobre teoria da computação [15, 16]. Neste caso,
um autômato é representado por uma quádrupla Σ = (Q, A, I, T, δ), onde Q é o conjunto finito de
estados, A o alfabeto finito, I ⊆ Q o conjunto de estados iniciais, T ⊆ Q o conjunto finito de estados
terminais, e δ a função parcial de transição de estados. Outras variantes podem ser possı́veis de acordo
com o uso pretendido para o autômato, devendo ser devidamente definida.

3.5 Autômato Mı́nimo

O conceito de autômato mı́nimo está relacionado com a propriedade de uma função parcial chamada
morfismo ou mapeamento de estados. O mapeamento de estados ψ : Q → Q′ mapeia os estados
de um A-autômato determinı́stico Σ = (Q, i, T ) sobre aqueles de um A-autômato determinı́stico
Σ′ = (Q′ , i′ , T ′ ) satisfazendo as relações (3.17).
3.5 Autômato Mı́nimo 51

i′ ⊂ ψ(i), (3.17i)
(ψ(q))σ ⊂ ψ(qσ), (3.17ii)
ψ −1 (T ′ ) ⊂ T. (3.17iii)

Segue de (3.17i) que


(ψ(q))s ⊂ ψ(qs) para todo s ∈ A∗ ,

de imediata verificação por indução.


Da definição de mapeamento de estados, segue que a composição de dois mapeamentos de es-
ψ ψ′ ψψ′
tados, A −→ A′ −→ A′′ gera um mapeamento de estados A −→ A′′ , e que toda composição
de mapeamentos de estados, quando bem definida, é associativa, ou seja, (ψψ ′ )ψ ′′ = ψ(ψ ′ ψ ′′ ). A
identidade 1A : Q → Q é um caso de mapeamento de estados.
O mapeamento de estado ψ é dito próprio se as condições (3.18) são verificadas. Aplicando os
conceitos de mapeamento de estados, obtém-se o resultado apresentado no Teorema 8.

i 6= ∅ ⇒ i′ 6= ∅, (3.18i)
qσ 6= ∅ e ψ(q) 6= ∅ ⇒ ψ(q)σ 6= ∅, (3.18ii)
ψ(T ) ⊂ T ′ . (3.18iii)

Teorema 8. [13] Sejam Σ and Σ′ A-autômatos essenciais satisfazendo |A| = |A′ |. Há no máximo
um mapeamento de estados ψ : Σ → Σ′ . Sendo que ψ é próprio e é uma função sobrejetiva.

Segue do Teorema 8 que se Σ e Σ′ são autômatos determinı́sticos essenciais e |Σ| = |Σ′ | = L,


então existe no máximo um mapeamento de estados ψ : Σ → Σ′ . Se escrevermos Σ′ ≤ Σ sempre que
tal mapeamento de estados existir, obtemos uma relação de ordem parcial sobre o conjunto de todos
os autômatos determinı́sticos essenciais com comportamento L.
Sejam Σ e Σ′ autômatos determinı́sticos essenciais, logo se há mapeamentos de estados ϕ : Σ →
Σ′ e ψ : Σ′ → Σ, então segue que ψ ◦ ϕ : Σ → Σ. Pelo Teorema 8, ψ ◦ ϕ = 1Σ , de forma semelhante
ϕ ◦ ψ = 1′Σ . Assim ϕ é um isomorfismo com ψ como inverso. Portanto, o conjunto dos autômatos
determinı́sticos essenciais pode ser particionado em classes isomorfas com comportamento L onde
pode-se definir um relação de ordem parcial.
Ao considerarmos o contexto de mapeamento de estados, estas conclusões permitem-nos forma-
lizar o conceito de minimalidade no contexto da teoria de autômatos. Consideremos a existência
de um autômato determinı́stico essencial Σ◦ com comportamento L, tal que, para qualquer outro
52 Dinâmica Simbólica e Autômatos

autômato Σ satisfazendo |Σ| = L existe um mapeamento de estados de Σ para Σ◦ . Um autômato Σ◦


com tal propriedade é unicamente determinado, a menos de um isomorfismo, sendo chamado mini-
mal. No processo de determinação de um autômato minimal com comportamento |L|, aplicaremos a
Proposição 9.

Proposição 9. [13] Seja Σ = (Q, i, T ) um A-autômato determinı́stico com comportamento L. Se


is = q ∈ Q, então
q −1 T = |(Q, q, T )| = s−1 L.

Além disso, q é co-acessı́vel se, e somente se, s−1 L 6= ∅; e portanto se, e somente se,

sA∗ ∩ L 6= ∅.

Demonstração: O resultado segue do desenvolvimento do termo q −1 T , sendo

q −1 T = (is)−1 T = s−1 (i−1 T ) = s−1 L.

Permitindo a conclusão imediata de que q é co-acessı́vel se, e somente se, q −1 T 6= ∅. 

Para prosseguirmos no desenvolvimento de novos resultados, faz-se necessário a introdução de


novos conceitos, entre os quais o da operação algébrica A-módulo. A operação algébrica A-módulo

à direita definida sobre o conjunto 2A de todos os subconjuntos de A∗ é obtido pela representação

X · s = s−1 X,

para qualquer X ⊂ A∗ e s ∈ A∗ , do que segue que

X · ε = ε−1 X = X e X · (st) = (st)−1 X = t−1 (s−1 X) = (X · s) · t,

∗ ∗ ∗
o que faz de 2A o conjunto 2A A-módulo. Considerando o subconjunto de 2A dado por


E = {X| X ∈ 2A , ε ∈ X},


notamos que para 2A A-module obtém-se (3.19).


X −1 E = X para todo X ∈ 2A (3.19)
3.5 Autômato Mı́nimo 53

A expressão (3.19) segue pelo desenvolvimento

X −1 E = {s| X · s ∈ E}
= {s| s−1 X ∈ E}
= {s| ε ∈ s−1 X}
= {s| s ∈ X} = X.

Para qualquer subconjunto L de A∗ consideramos o A-autômato completo


Σ◦L = (2A , L, E),

do que segue de (3.19) que


|Σ◦L | = L.

Sejam Σ◦L t = ΣL = (QL , iL , TL ) a componente essencial de Σ◦L , e Σ = (Q, i, T ) qualquer A-


autômato determinı́stico essencial com comportamento L. Considerando a função parcial

ϕ : Q −→ QL
ϕ(q) = q −1 T.

Inicialmente, é necessário demonstrar que ϕ é bem definida para todo q ∈ Q. Para qualquer q ∈ Q
existe s ∈ A∗ , tal que, i · s = q, e portanto q −1 T = s−1 L, o que pode ser escrito como L · s a partir
da notação adotada. Como ΣL também é determinı́stico e essencial com comportamento L, e s é um
prefixo de uma palavra em L, então L · s = s−1 L = q −1 T ∈ QL .

Segue das equações (3.20) que ϕ : Σ → ΣL é um mapeamento de estados.

ϕ(i) = i−1 T = |Σ| = L, (3.20i)


ϕ(qs) = (qs)−1 T = s−1 (q −1 T ) = s−1 (ϕ(q)) = ϕ(q) · s, (3.20ii)
q ∈ T ⇔ ε ∈ q −1 T ⇔ ε ∈ ϕ(q) ⇔ ϕ(q) ∈ TL . (3.20iii)

Como Σ e ΣL são A-autômatos determinı́sticos e essenciais com comportamento L, aplicando o


Teorema 8, concluı́-se que ΣL é um autômato mı́nimo para L.

No autômato Σ◦L um estado X é acessı́vel se, e somente se, X = L · s = s−1 L para algum s ∈ A∗ .
O estado X é co-acessı́vel se, e somente se, X · u ∈ E para algum u ∈ A∗ , o que é equivalente a
54 Dinâmica Simbólica e Autômatos

ε ∈ X ·u ⇒ ε ∈ u−1 X ⇒ u ∈ X. Assim, obtém-se a descrição dada em (3.21) de ΣL = (QL , iL , TL ).

QL = {s−1 L| s ∈ A∗ , s−1 L 6= ∅},


iL = L, (3.21)
−1
TL = {s L| s ∈ L},

onde a última linha de (3.21) segue do fato de ε ∈ s−1 L se, e somente se, s ∈ L.

Teorema 10. [13] Para qualquer subconjunto L de A∗ , o autômato ΣL é minimal. Se Σ = (Q, i, T )


é um A-autômato determinı́stico e essencial com comportamento L, então o único mapeamento de
estados
ϕ : Σ → ΣL ,

é dado por
ϕ(q) = q −1 T,

para q ∈ Q. Além disso, ϕ é uma função própria e sobrejetiva.

A demostração de que ϕ no Teorema 10 é própria, segue de uma comparação direta entre (3.20) e
(3.18).
Nos referimos ao A-autômato ΣL como uma representação minimal ou dos contextos à direita de
L. Qualquer autômato isomorfo a ΣL é chamado um autômato minimal para L.
O núcleo da função ϕ : Q → QL no Teorema 10 é determinado pela relação de equivalência

q1 ∼ q2 ⇔ q1−1 T = q2−1 T.

Se esta relação de equivalência é a identidade, o autômato Σ é reduzido. Assim, Σ é reduzido se

q1−1 T = q2−1 T ⇒ q1 = q2 .

Do que decorre que Σ é reduzido se, e somente se, ϕ é injetiva. Como ϕ é própria e é uma função
sobrejetiva, obtém-se o Corolário 11.

Corolário 11. [13] Um autômato determinı́stico Σ com comportamento L é minimal se, e somente
se, Σ é reduzido e essencial.
3.6 Morfismo Sintático e Monoide Sintático 55

3.6 Morfismo Sintático e Monoide Sintático


Seja Q um A-módulo. Para cada palavra s ∈ A∗ , a função parcial Q → Q que mapeia q em qs é
denotada por α(s). Isso resulta em um morfismo

α : A∗ → PF(Q),

onde PF(Q) é o monoide gerado por todas as funções parciais Q → Q. A imagem M do morfismo
α é chamada de monoide da ação de A-módulo Q. Neste caso, M é o sub-monoide de PF(Q)
gerado pelas funções parciais q → qσ para σ ∈ A. O morfismo sobrejetivo α : A∗ → M está
associado ao monoide da ação de Q. Como uma extensão natural, se Σ = (Q, i, T ) é um A-autômato
determinı́stico, então Q é um A-módulo, sendo o monoide da ação de Q denotada por MΣ . Este é o
monoide da ação do autômato Σ.
Seja ΣL = (QL , iL , TL ) o autômato minimal de um subconjunto L de A∗ . O monoide da ação de
ΣL é denotado por ML , sendo chamado do monoide sintático de L. O morfismo sobrejetivo

ϕL : A∗ → ML ,

associado a L é chamado de morfismo sintático de L.


Proposição 12. [13] Para qualquer subconjunto L de A∗ as seguintes propriedades são equivalentes:
(1) L é regular;
(2) O monoide sintático ML é finito;
(3) Há um monoide finito M, um morfismo ϕ : A∗ → M, e um subconjunto B de M satisfazendo
L = ϕ−1 (B).

Demonstração: (1) ⇒ (2): A validade de (1) implica que o autômato minimal ΣL é finito, portanto
ML é finito.
(2) ⇒ (3): É uma consequência direta de monoide ML , o morfismo sintático ϕL : A∗ → ML , e
do subconjunto ϕL (L) de ML satisfazerem a condições em (3).
(3) ⇒ (1): Considere o A-autômato

Σ = (M, 1, B),

com M interpretado como um A-módulo especificado por m ∈ M, w ∈ A∗

m · w = m · ϕ(w).
56 Dinâmica Simbólica e Autômatos

Então

|Σ| = {w| 1 · w ∈ B}
= {w| ϕ(w) ∈ B} = ϕ−1 (B) = L,

o que faz de L um conjunto regular. 

Observamos que o monoide da ação do autômato Σ permanece inalterado se considerarmos o seu


complemento Σc . Se Σ é completo, conclui-se diretamente que Σ = Σc . Se Σ não é completo, então
Qc = Q ∪ ♦, onde ♦ é denominado um estado sorvedouro. O monoide PF(Q) é então isomorfo
ao monoide de todas as funções Qc → Qc que mapeiam ♦ em ♦. Portanto, o monoide da ação é
o mesmo (neste caso, o monoide da ação pode ser considerado como um sub-monoide do monoide
F(Qc ) de todas as funções Qc → Qc ).

Proposição 13. [13] Sejam L um subconjunto de A∗ e ϕL : A∗ → ML seu morfismo sintático. Então


para todo s, t ∈ A∗ as seguintes condições são equivalentes:

(1) ϕL (s) = ϕL (t);


(2) (us)−1 L = (ut)−1 L para todo u ∈ A∗ ;
(3) usv ∈ L ⇔ utv ∈ L para todo u, v ∈ A∗ .

Demonstração: (1) ⇔ (2): A partir da definição de ML como um monoide formado pelas funções
QcL → QcL segue que

(u−1 L)(ϕL (s)) = (u−1 L) · s = s−1 u−1 L = (us)−1L.

Assim (1) e (2) são equivalentes.


(2) ⇔ (3): Segue diretamente da definição de (us)−1 L. 

A condição (3) define uma relação de equivalência em A∗ , especificada por

s ≈L t,

sempre que esta condição for satisfeita. De fato, ≈L é uma congruência, chamada congruência
sintática de L. A equivalência de (1) e (3) mostra que esta congruência é o núcleo do morfismo ϕL .
Como ϕL é sobrejetivo, segue que ML pode ser identificado com o monoide quociente A∗ / ≈L e ϕL
pode ser identificado com o morfismo decorrente da fatoração natural A∗ → A∗ / ≈L . Comumente, a
3.6 Morfismo Sintático e Monoide Sintático 57

classe de congruência que contém um elemento x ∈ A∗ é representada por [x], comum aos elementos
do conjunto ϕ−1 ∗
L (x) ⊆ A . Quanto a operação do monoide, segue da relação de congruência que
[x][y] = [xy].
A condição (3) implica que: Se s ≈L t e s ∈ L, então t ∈ L, logo L é fechado com respeito a ≈L .
O que pode ser reescrito como
ϕ−1
L (ϕL (L)) = L,

ou também como
L = ϕ−1
L (B) para algum B ⊂ ML .

Como consequência destas observações, segue a identidade

ML = MA∗ \L .

De fato, L e A∗ \L possuem a mesma congruência sintática.


Um conceito importante relacionado com o estudo de operações sobre autômatos é o autômato
reverso. Dado um A-autômato Σ = (Q, I, T ), o autômato reverso é

Σ̺ = (Q, T, I),

σ σ
com um ramo p −→ q para todo ramo q −→ p em Σ. Portanto, um caminho π em Σ com L(π) =
σ1 . . . σk . implica na existência de um caminho π ̺ em Σ̺ com

L(π ̺ ) = σk · · · σ1

Do que segue que


|Σ̺ | = ̺(|Σ|),

onde ̺ : A∗ → A∗ é a função reversa definida por

̺(1) = 1, ̺(σ) = σ, ̺(st) = ̺(t)̺(s). (3.22)

Comparando-se as relações de equivalência ≈L com ≈L̺ , encontra-se

s ≈L t ⇔ s̺ ≈L̺ t̺ .

O que implica que os monoides sintáticos ML and ML̺ são anti-isomorfos, i.e., há uma bijeção
ϕ : ML → ML̺ tal que ϕ(xy) = ϕ(y)ϕ(x) para todo x, y ∈ ML . Em outras palavras, ML̺ pode ser
58 Dinâmica Simbólica e Autômatos

obtido de ML pela reversão do produto em ML . Assim, podemos escrever ML̺ = (ML )̺ .


O item (3) da Proposição 13 relacionada a uma congruência sintática pode ser estendida para
subconjuntos A de um monoide arbitrário M. Consequentemente, é possı́vel definir-se o monoide
sintático MA como M/ ≈A e o morfismo sintático ̺A : M → MA como o morfismo associado a
fatoração natural.

3.7 Conceitos sobre Relação de Ordem Parcial


Uma relação binária r sobre um conjunto X (ou seja, um subconjunto r de X × X) é chamada uma
ordem (parcial) se
1. (x, x) ∈ r para todo x ∈ X. Ou seja, r é reflexiva;
2. ∀x, y ∈ X, (x, y) ∈ X e (y, x) ∈ X implica que x = y. Ou seja, r é anti-simétrica;
3. ∀x, y ∈ X, (x, y) ∈ r e (y, z) ∈ r implica que (x, z) ∈ r. Ou seja, r é transitiva.
É comum escrever x  y ao invés de (x, y) ∈ r. Seguindo esta convenção, temos que x  y,
x ≺ y e x ≻ y representando (y, x) ∈ r, (x, y) ∈ r e x 6= y, e (y, x) ∈ r e x 6= y, respectivamente.
Com o objetivo de simplificar a notação, iremos nos referir a r como uma ordem parcial r , quando
não houver dúvidas quanto a propriedades de r. Uma relação apresentando a propriedade extra
4. ∀ x, y ∈ X, x  y ou y  x.
será chamada uma ordem total. O conjunto (X, ), ou simplesmente X quando não houver con-
fusão, será chamado um conjunto (parcialmente) ordenado. Como exemplo de uma relação de ordem

parcial, consideremos I especificada por Y I X sempre que Y ⊆ X, onde Y, X ⊆ 2A . Ou seja,
o conjunto Y está contido ou é igual ao conjunto X. Chamamos a atenção para a importância da
relação de ordem I , pois iremos emprega-la sistematicamente na Seção 3.9.
Seja Y um subconjunto não vazio de um conjunto ordenado (X, ). Um elemento a de Y é cha-
mado minimal se não há elementos em Y que sejam estritamente menores que a, o que é equivalente
a dizer que,
∀y ∈ Y, y  a ⇒ y = a.

Um elemento b de Y é chamado minimum se

∀y ∈ Y, b  y.

Segue da definição que um elemento minimum é minimal, contudo em um conjunto parcialmente


ordenado, se possı́vel ter-se elementos minimais que não são minimums. Há uma definição análoga
para elemento maximal e maximum. Segue destes conceitos a Proposição 14.
3.8 Alguns Conceitos Sobre Linguagem Formal 59

Proposição 14. [14] Seja Y um subconjunto não vazio de um conjunto parcialmente ordenado X.
Então

1. Y possui no máximo um minimum;


2. Se Y é totalmente ordenado, então os termos minimal e minimum são equivalentes.
Se Y é um subconjunto não vazio de (X, ), um elemento c de X é um limite inferior de Y se
c  y para todo y ∈ Y . Se o conjunto de limites inferiores de Y é não vazio e tem um elemento
maximum d, então d é o maior limite inferior de Y (ou glb - greatest lower bound). Caso exista, o
elemento d é único; sendo denotado por
^
d= {y : y ∈ Y }.

Analogamente, define-se menor limite superior (ou lub - least upper bound), sendo denotado por
_
{y : y ∈ Y }.

3.8 Alguns Conceitos Sobre Linguagem Formal


Estamos interessados no estudo da classe de linguagens formais associadas a sistemas simbólicos
fechados. Como demonstrado em [18], um subconjunto L ⊂ A∗ é a linguagem de um sistema
simbólico fechado X se, e somente se, ela satisfaz as propriedades (i) e (ii) abaixo, se além destas ela
satisfaz a propriedade (iii), então L passa estar associada a uma classe de sistemas de maior interesse
prático.
Uma linguagem L ⊆ A∗ é:

(1) fatorial: se ∀x, y, z ∈ A∗ então xyz ∈ L ⇔ y ∈ L;


(2) prolongável: se ∀x ∈ L, ∃ y, z ∈ A+ yxz ∈ L;
(3) transitiva: se x, y ∈ L, ∃ z ∈ A∗ xzy ∈ L.

Há duas classes destas linguagens cujas propriedades merecem destaque, são as linguagens fatoriais
prolongáveis e regulares (FPR - factorial prolongable and regular), e as linguagens fatoriais transi-
tivas e regulares (FTR - factorial transitive and regular). A importância destas classes decorre da
relação que possuem com os sistemas simbólicos fechados regulares (ssr - ou do inglês sofic shift),
sendo destes os ssf que permitem uma representação através de um grafo direcionado. Essa relação
é expressa como: A linguagem de um ssr é FPR, e a linguagem de um ssr irredutı́vel é FTR, [19].
Sendo um ssr irredutı́vel aquele cuja linguagem satisfaz a propriedade (iii) acima, o que implica que
60 Dinâmica Simbólica e Autômatos

esta linguagem pode ser representada por um grafo direcionado no qual existe um caminho entre
qualquer par ordenado de vértices.
O fato de uma linguagem ser FPR ou FTR reflete nas propriedades do monoide sintático associado
à linguagem. Tais propriedades são apresentadas na Proposição 15, Proposição 16 e na Proposição 17.

Proposição 15. [20] A linguagem L ∈ A∗ é fatorial se, e somente se, ML possui um zero, além de
ϕ−1
L (ML \{0}) = L.

Proposição 16. [19] Uma linguagem L ⊂ A∗ é FPR se, e somente se, ML possui as propriedades:

1. ML possui um número finito de elementos;


2. ML possui um 0, tal que, ϕ−1
L (ML \{0}) = L;

3. Para todos os elementos não nulos [x] ∈ ML , x ∈ L, há elementos y1 , y2 ∈ L distintos de 1, tal
que, [y1 xy2 ] 6= 0.

Como em teoria de grupo e anéis [21], no âmbito da teoria de semigrupos o conceito de ideal
revela propriedades importantes do monoide sintático com reflexos na estrutura da linguagem e
representações associadas. Um subconjunto I de um semigrupo S é chamado um ideal (resp. à
direita, à esquerda), se SIS ⊂ I (resp. IS ⊂ I, SI ⊂ I). Se um monoide possui um elemento nulo
(x0 = 0x = 0), então {0} é um ideal de S. Um ideal I é dito 0-minimal em um semigrupo S, se I
é minimal no conjunto de todos os ideais não-nulos, ou seja, o ideal I em S é 0-minimal se I 6= 0 e
para qualquer outro ideal J ⊆ I tem-se J = I ou J = 0.

Proposição 17. [19] Uma linguagem L ⊂ A∗ é FTR se, e somente se, ML possui as propriedades:

1. ML possui um número finito de elementos;


2. ML possui um 0, tal que, ϕ−1
L (ML \{0}) = L;

3. ML possui um ideal 0-minimal à direita I, tal que, para todo elemento não nulo a ∈ ML , Ia 6= 0.

3.9 Conjuntos Proibidos e Conjuntos de Restrição


A partir desta seção, até o final do capı́tulo, apresentaremos os nossos resultados quanto ao de-
senvolvimento de conceitos e procedimentos combinatoriais para representação e análise de siste-
mas simbólicos fechados, que podem ser distinguidos dos demais por não virem acompanhados de
uma referência explı́cita. Nesta seção demonstraremos como as propriedades inerentes a um ssf X
(particularmente, o fato de possuir uma linguagem fatorial), dão origem a conceitos que definem
X unicamente, além de conduzirem à determinação de algoritmos que permitem a especificação de
representações finitas para a linguagem B(X) de X (grafos direcionados mı́nimos), como também
3.9 Conjuntos Proibidos e Conjuntos de Restrição 61

para o monoide sintático de B(X). Para facilitar a notação, consideremos L = B(X) e L′ seu com-
plemento com relação a A∗ . Podemos interpretar L′ como a restrição global de X, ou seja, o conjunto
de palavras em A∗ que não ocorrem em sequências bi-infinitas de X. De fato, o conjunto F defi-
nido no inı́cio deste capı́tulo está contido em L′ . Apesar de especificado através das propriedades
topológicas de X, o conjunto F manterá sua função de especificar unicamente X se a ele for incluı́do
qualquer elemento em A∗ que possua um fator em L′ . A seguir demonstraremos que só precisamos de
um subconjunto O de L′ para especificarmos se uma palavra pertence ou não a L, que O especifica
unicamente X, assim como X especifica unicamente O, além de demonstrarmos que O é mı́nimo.
Como ficará claro pelo desenvolvimento que segue, o conceito de relação de ordem parcial tem papel
essencial na determinação destes resultados, cujo emprego já inicia-se com a Definição 8.

Definição 8. Seja (X, SP ) um conjunto ordenado induzido pela relação de ordem parcial SP dada
por
u SP w ⇔ u ∈ S(P(w)), onde u, w ∈ X.

O que significa que u é um fator de w.

Definição 9. O conjunto proibido irredutı́vel O de L é a coleção de todos os elementos minimais do


conjunto parcialmente ordenado (L′ , SP ).

Lema 18. Seja L uma linguagem fatorial, então L′ = A∗ · O · A∗ . O que permite-nos interpretar O
como um gerador de L′ .

Demonstração: Como L é fatorial e O ⊆ L′ , então A∗ · O · A∗ ⊆ L′ . Consideremos agora u ∈ L′ .


Então há um elemento v ∈ (L′ , SP ) tal que v SP u. Ressaltamos que como uma relação de ordem
parcial é reflexiva, então u pode ser igual a v. Uma vez que o conjunto O é a coleção de todos os
elementos minimais em (L′ , SP ), então t SP u para pelo menos um elemento t ∈ O. Pode-se
escrever u como u1 tu2 , onde necessariamente u1 , u2 ∈ A∗ , então u ∈ A∗ · O · A∗ , e finalmente,
L′ ⊆ A∗ · O · A∗ . 

Teorema 19. Seja L uma linguagem fatorial em A∗ . Consideremos o conjunto ΨL = {X ⊆

A∗ | L′ = A∗ · X · A∗ } dos geradores de L′ , e o conjunto ordenado (2A , I ). Então,
^
O= {X ⊆ A∗ : L′ = A∗ · X · A∗ }.

′ ∗
Ou seja, o conjunto O é o glb do conjunto ΨL em (2A , I ).

Demonstração: Seja X ⊆ A∗ um gerador de L′ , ou seja L′ = A∗ · X · A∗ . Então, aplicando o


Lema 18, O = {ε} · O · {ε} ⊆ A∗ · O · A∗ = A∗ · X · A∗ , logo O ⊆ Σ∗ · X · Σ∗ . Do que segue que
62 Dinâmica Simbólica e Autômatos

para todo u ∈ O há pelo menos um v ∈ X que satisfaz v SP u. Como O é a coleção de todos os
elemento minimais, há t ∈ O tal que t SP v. Observações que nos permitem afirmar que u = u1 vu2
and v = v1 tv2 , vi , ui ∈ A∗ . Disto segue que u = u1 v1 tv2 u2 , decorrendo da minimalidade de u e t
que u = t. Portanto, u = v e u ∈ X. Do que conclui-se que O ⊆ X. 

Na Definição 10 apresentamos um tipo de restrição que é dependente do contexto, em outras


palavras, uma palavra s (u) só está proibida de seguir (anteceder) uma palavra w, dado que w é
antecedido (seguido) pela palavra u (s). Como um exemplo, se uws ∈ O então uw, ws ∈ L e
uws ∈ L′ , portanto s é proibida de seguir w quando esta é precedida por u. Como consequência
da Definição 10, demonstraremos no Lema 20 que um conjunto de restrições condicionais é um
subconjunto de O, o que é empregado na Proposição 21 juntamente com uma relação de ordem
apropriada para demonstrar que este conjunto (como definido) é o elemento minimum do conjunto de
geradores.

Definição 10. O conjunto Ow de w-proibições associado a L é a coleção de elementos minimais do


conjunto ordenado (Ow , SP ), onde Ow = {L · w · L}\{L ∪ (L · w · Cw ) ∪ (Dw · w · L)}.

Como uma breve explicação para a expressão de Ow apresentada na Definição 10, consideraremos
os dois casos possı́veis: (i) uwv ∈ L ou (ii) uwv ∈ L′ . O caso (i) é eliminado pela exclusão
dos elementos de A∗ no conjunto L. No caso (ii) estamos interessados em selecionar as palavras
que satisfazem uw, wv ∈ L; quando incluı́mos o termo L · w · Cw eliminamos todas as palavras
satisfazendo wv ∈
/ L, enquanto a inclusão de Dw · w · L elimina todas as palavras satisfazendo
uw ∈
/ L. Desta forma, o conjunto resultante só contém os termos desejados. Como uma observação
adicional, se w ∈
/ L então Ow é trivialmente determinado. Portanto, este caso será excluı́do das
análises subsequentes.

Lema 20. Para todo u = u1 . . . un ∈ Ow , u ∈ Ow se, e somente se, u ∈ O e w SP (u2 . . . un−1 ).

Demonstração: Seja swt ∈ Ow , como resultado do Teorema 19 há v ∈ O satisfazendo v SP swt,
sendo que para v = v1 . . . vn , decorre de sw, wt ∈ L que w SP (v2 . . . vn−1 ). Assim v = s′ wt′ ,
onde s′ , t′ ∈ A+ , o que permite-nos concluir que v ∈ Ow . Como supomos que swt é um elemento
minimal de Ow e v = s′ wt′ ∈ Ow , podemos concluir que v = swt uma vez que s′ wt′ SP swt, como
consequência Ow ⊆ O. Por fim, para todo u ∈ O e w SP (u2 . . . un−1 ) temos necessariamente que
u ∈ Ow , já que u é minimal em L′ e Ow ⊆ L′ , podemos concluir que u ∈ Ow . 

Teorema 21. Seja L uma linguagem fatorial em A∗ . Consideraremos o conjunto ΨOw = {X ⊆ A∗ :



Ow = L · X · L} dos geradores de Ow , e o conjunto ordenado (2A , I ). Então
^
Ow = {X ⊆ A∗ : Ow = L · X · L}.
3.9 Conjuntos Proibidos e Conjuntos de Restrição 63


Ou seja, o conjunto Ow é o glb do conjunto ΨOw em (2A , I ).

Demonstração: Seja v ∈ O e w SP v, então decorre do Lema 20 que v ∈ Ow e portanto para todo
K satisfazendo Ow = L · K · L, há pelo menos um elemento u, tal que, u SP v. Como K ⊆ L′ e v
é minimal em L′ , concluı́mos que v = u. Do que decorre que Ow ⊆ K. 

A Proposição 17 evidencia como a existência de um elemento algébrico com propriedades es-


pecı́ficas tem implicações na estrutura da linguagem. A seguir demonstraremos como uma classe de
ideais pode ser empregada para construção de representações combinatoriais e na determinação do
próprio monoide sintático. Inicialmente, podemos especificar um ideal à direita no monoide sintático
de uma linguagem L (fatorial e com um elemento nulo) para todo elemento a ∈ ML , como especifi-
cado em (3.23).
Ia = {x ∈ ML : ax = 0}. (3.23)

O fato de Ia ser um ideal à direita segue de considerarmos L uma linguagem fatorial. De forma
complementar, a existência de um elemento nulo é garantida ao considerarmos que L não é uma
linguagem livre, o que, caso contrário, implicaria que para quaisquer x, w ∈ L seria verificado que
xw ∈ L. Apesar de sua relevância em muitos casos de interesse (e.g., quando A é um grupo), quando
estamos interessados em estudar as restrições do sistema (no contexto apresentado neste trabalho) as
linguagens livres tornam-se um caso trivial. A seguir avaliaremos os reflexos do conceito algébrico
de ideal à direita Ia sobre a linguagem L associada.

Definição 11. Seja X uma linguagem arbitrária e w ∈ A∗ . O contexto à direita (resp., à esquerda) de
w com relação a linguagem X é definido como sendo o conjunto

R(w, X) = {u ∈ A∗ : wu ∈ X} (resp., L(w, X) = {u ∈ A∗ : uw ∈ X})

Considerando L uma linguagem fatorial, no Lema 22 demonstramos com o contexto à direita


R(w, L′ ) de uma palavra w ∈ A∗ sobre a linguagem complementar L′ = A∗ \L está relacionado com
o ideal à direita I[w] de um elemento ϕ(w) do monoide sintático de L.

Lema 22. Seja a ∈ ML , então ϕ−1 ′


L (a) ⊆ R(w, L ) se, e somente se, a ∈ I[w] .

Demonstração: Seja u ∈ ϕ−1 ′


L (a) ⊆ R(w, L ), segue da definição de contexto à direita que wu ∈
/L
e portanto [w][u] = [wu] = 0, seguindo-se que a ∈ I[w] . Consideremos agora que a = [u] ∈ I[w] ,
segue da definição de I[w] apresentada em (3.23) que [w][u] = [wu] = 0 e portanto u ∈ R(w, L′ ),
seguindo-se que ϕ−1 ′
L (a) ⊆ R(w, L ). 

Como consequência de (3.23) o elemento nulo do monoide sintático de uma linguagem fatorial
sempre pertencerá ao ideal à direita I[w] de uma palavra w ∈ A∗ . Contudo, sabemos da Proposição 15
64 Dinâmica Simbólica e Autômatos

que o elemento nulo de ML corresponde ao complemento de L em A∗ , o que implica necessariamente


na inclusão ϕ−1 ′ ′ ∗ ′
L (0) = L ⊆ R(w, L ), para qualquer w ∈ A . O que nos permite particionar R(w, L )
em um conjunto trivial, a saber L′ , comum a todas as palavras w ∈ A∗ , e Cw = R(w, L′ )\L′
/ L tem-se Cw ∪L′ = A∗ ,
constituı́do por palavras da linguagem L. Segue desta definição que para w ∈
/ L para todo v ∈ A∗ . Desconsiderando
e portanto Cw = L, sendo uma consequência direta de wv ∈
este caso trivial, para todo v ∈ Cw observa-se wv ∈ L′ e v ∈ L, decorrendo do fato de L ser fatorial
que sempre existirá uma palavra u ∈ L′ satisfazendo u ∈ (S(w)\{ε}) · (P (v)\{ε}), ou seja, u não é
fator de w nem de v. Seguindo um desenvolvimento similar àquele empregado na determinação dos
conjuntos O e Ow , demonstramos que Cw pode ser unicamente caracterizado por um subconjunto
minimum definido através de uma relação de ordem parcial adequada.

Definição 12. Seja (X, P ) um conjunto ordenado induzido pela relação de ordem parcial P dada
por
u P w ⇔ u ∈ P(w), onde u, w ∈ X.

O que significa que u é um prefixo de w.

Definição 13. O conjunto de restrições à direita Cw de uma palavra w ∈ A∗ é formado por todos os
elementos minimais do conjunto ordenado (Cw , P ).

Lema 23. Para w ∈ A∗ , tem-se que Cw = {Cw · L}\L′ . Portanto Cw é um gerador de Cw .

Demonstração: Consideremos u ∈ {Cw · L}\L′ , assim u = tv para algum t ∈ Cw , como as


linguagens consideradas são fatoriais e wt ∈
/ L então wu ∈
/ L, seguindo-se que u ∈ Cw , e portanto
{Cw · L}\L′ ⊆ Cw . Agora, consideremos que u ∈ Cw , como a relação P é reflexiva, o conjunto
{t ∈ Cw : t P u sobre (Cw , P )} possui pelo menos um elemento, e portanto, com pelo menos um
elemento minimal. Concluı́mos que u ∈ {Cw · L}\L′ , o que implica na inclusão Cw ⊆ {Cw · L}\L′ .


Na Proposição 24 é estabelecida a relação entre o ideal à direita I[w] de uma palavra w ∈ A∗ e o


conjunto de restrições à direita Cw da mesma palavra. Em sı́ntese, fica demonstrado que a imagem de
Cw por ϕL pode ser interpretada como um conjunto de geradores I[w].

Proposição 24. Para todo w ∈ A∗ , tem-se que ϕL (Cw ) · ML = I[w] .

Demonstração: Consideremos u ∈ C(w), do que decorre a inclusão {u·L}\L′ ⊆ Cw , e empregando


o Lema 22 obtemos ϕL ({u · L}\L′ ) = {ϕL (u) · ML }\{0} ⊆ I[w] . Como o elemento nulo 0 pertence
a I[w] , para todo w ∈ A∗ , concluı́mos que ϕL (Cw ) · ML ⊆ I[w] . Agora, consideremos que a ∈
I[w] \{0}, o que implica na inclusão ϕ−1 ′ ′
L (a) ⊆ R(w, L )\L = Cw , que por sua vez, juntamente com
3.9 Conjuntos Proibidos e Conjuntos de Restrição 65

o Lema 23, permite-nos concluir que para todo u ∈ ϕ−1


L (a) observa-se P(u) ∩ Cw 6= ∅. Portanto,
{ϕL (u) · ML }\{0} = ϕL ({u · L}\L′) ⊆ ϕL ({Cw · L}\L′) = {ϕL (Cw ) · ML }\{0}. Do que concluı́mos
que I[w] ⊆ ϕL (Cw ) · ML . 

Teorema 25. Consideremos w ∈ A∗ e Cw seu conjunto de restrições à direita. Consideremos o


conjunto ΨCw = {X ⊆ A∗ : Cw = {X · L}\L′ } dos geradores de Cw , e o conjunto ordenado

(2A , I ). Então
^
Cw = {X ⊆ A∗ : Cw = {X · L}\L′ }.

Ou seja, Cw é o glb do conjunto ΨCw em (2A , I ).

Demonstração: Seja X ∈ A∗ satisfazendo Cw = {X · L}\L′ . Como ε ∈ L então Cw = Cw · {ε} ⊆


{Cw · L}\L′ = {X · L}\L′ . O que permite-nos concluir que se u ∈ Cw então u ∈ {X · L}\L′ ,
havendo necessariamente t ∈ X e v ∈ L satisfazendo u = tv. Reciprocamente, observa-se que
X\L′ = X ·{ε}\L′ ⊆ {X ·L}\L′ = {Cw ·L}\L′ , havendo, dessa forma, t′ ∈ Cw e v ′ ∈ L satisfazendo
t = t′ v ′ e u = t′ v ′ v. Como Cw é o conjunto de todos os elementos minimais em (Cw , P ), temos que
u = t′ e portanto v ′ v = ε, seguindo-se imediatamente que t = u. Concluı́mos que u ∈ X, e portanto
Cw ⊆ X. 

De maneira similar, podemos considerar um ideal à esquerda Ja no monoide sintático da lingua-


gem para todo a ∈ ML . Sendo dado por

Ja = {y ∈ ML : ya = 0}. (3.24)

Como desenvolvido para o caso de restrições à direta, partindo de (3.24) (com evidente semelhança a
(3.23)), podemos introduzir os conceitos recı́procos, mas agora com referência “ à esquerda ”, àqueles
introduzidos a priori. Este processo torna-se ainda mais evidente se considerarmos a linguagem
reversa de L, determinada por L̺ = ̺(L), onde ̺ é a função reversa definida em (3.22). Neste
caso, o desenvolvimento e métodos são idênticos, mas agora considerando palavras w ̺ em A∗ , o que
permite-nos especificar o ideal à direita [w ̺ ] no monoide sintático ML̺ = (ML )̺ , como realizado
na Seção 3.6. Desta forma, iremos definir o contexto à direita de w ̺ com respeito a linguagem L̺
ou L′̺ . Esta abordagem permite-nos importar os resultados desenvolvidos para w ∈ A∗ , derivando
conclusões recı́procas para o ideal à esquerda J[w] no monoide ML , como também seu contexto à
esquerda com respeito as linguagens L e L′ .
Como realizado anteriormente para o caso do contexto à direita, podemos particionar o contexto
à esquerda L(w, L′ ) em um conjunto trivial L′ , comum a todo w ∈ A∗ , e um conjunto que depende
de w, especificado como Dw = L(w, L′ )\L′ . Como antes, desta definição segue que para v ∈ Dw
tem-se vw ∈ L′ e v ∈ L. Como L é fatorial, existe uma palavra u ∈ L′ satisfazendo u ∈ (S(v)\{ε}) ·
66 Dinâmica Simbólica e Autômatos

(P (w)\{ε}), e portanto u não é fator de w nem de v. De maneira recı́proca ao caso “ à direita ”, a


seguir enunciamos os resultados que têm como implicação a caracterização do conjunto de restrições
à esquerda Dw como o elemento minimum do conjunto de geradores de Dw considerando o conjunto

ordenado (2A , I ), com exceção da Proposição 26 onde é estabelecida a relação entre os conjuntos
de restrições à direita e à esquerda. A seguir, as definições recı́procas a Definição 12 e Definição 13
são apresentadas, respectivamente.

Definição 14. Seja (X, S ) um conjunto ordenado induzido pela relação de ordem parcial S dada
por
u S w ⇔ u ∈ S(w), onde u, w ∈ X.

O que significa que u é um sufixo de w.

Definição 15. O conjunto de restrições à esquerda Dw de uma palavra w ∈ A∗ é formado por todos
os elementos minimais do conjunto ordenado (Dw , S ).

Na Proposição 26 estabelecemos a relação entre os conjuntos de restrição Dw e Cw̺ , associados às


linguagens L e L̺ , respectivamente. Em termos computacionais, este resultado permite-nos analisar
o mapeamento inverso de uma função bijetiva empregando as ferramentas desenvolvidas para análise
de seu mapeamento direto, esta abordagem será exemplificada nos capı́tulos que versam sobre a
codificação do fluxo geodésico.

Proposição 26. Seja u ∈ A∗ , então u ∈ Dw com relação a L se, e somente se, u̺ ∈ Cw̺ com relação
a L̺ .

Demonstração: Segue diretamente da definição de linguagem reversa que vw ∈ L se, e somente


se, w ̺ v ̺ ∈ L̺ . Portanto, para estabelecermos o resultado só precisamos demonstrar que u é um
elemento minimal de Dw se, e somente se, u̺ é um elemento minimal de Cw̺ , considerando as
relações de ordem parcial S e P , respectivamente.
Seja u ∈ Dw , do que segue que u̺ ∈ Cw̺ . Se supusermos que u̺ não é um elemento minimal de
Cw̺ , então deverá existir v ̺ ∈ Cw̺ , v ̺ P u̺ . Do que decorre que v S u, além do que v ∈ Dw . Da
suposição inicial que u̺ não é um elemento minimal de Cw̺ , segue que v ̺ é um prefixo próprio de u̺.
Consequentemente, v também é um prefixo próprio de u, implicando que u ∈
/ Dw , uma contradição.
Concluı́mos que (Dw )̺ ⊆ Cw̺ . De maneira análogo, (Cw̺ )̺ ⊆ Dw . 

Os resultados que seguem são recı́procos aos Lemas 22 e 23, a Proposição 24, e ao Teorema 25,
respectivamente.

Lema 27. Seja a ∈ ML , então ϕ−1 (a) ⊆ L(w, L′ ) se, e somente se, a ∈ J[w] .
3.10 Cálculo dos Conjuntos Proibidos e Conjuntos de Restrições 67

Lema 28. Para w ∈ A∗ , tem-se que Dw = {L · Dw }\L′ . Portanto Dw é um gerador de Dw .

Proposição 29. Para todo w ∈ A∗, tem-se que ML · ϕ(Cw ) = J[w] .

Teorema 30. Consideremos w ∈ A∗ e Dw seu conjunto de restrições à esquerda. Consideremos o


conjunto ΨDw = {X ⊂ A∗ : Dw = {L · X}\L′ } dos geradores de Dw , e o conjunto ordenado

(2A , I ). Então
^
Dw = {X ⊆ A∗ : Dw = {L · X}\L′ }.

Ou seja, Dw é o glb do conjunto ΨDw em (2A , I ).

3.10 Cálculo dos Conjuntos Proibidos e Conjuntos de Restrições


Nesta seção demonstramos propriedades relacionadas aos conjuntos de restrições que possibilitam o
emprego dos conceitos teóricos previamente apresentados na determinação de estruturas concretas,
como grafos direcionados mı́nimos (em termos do número de estados) que representem a linguagem
L do ssf, como também representações do monoide sintático relacionado, o que, até onde sabemos,
não possui um procedimento alternativo na literatura.
Como demonstrado no Teorema 19, o conjunto proibido irredutı́vel O é único e bem definido
(é o glb de um conjunto), tendo seus elementos determinados como especificado na Definição 9, a
saber, conjunto de todas as palavras em L′ (ou qualquer outro conjunto de geradores de L′ ) cujos
fatores próprios pertencem à linguagem L, ou seja, para todo w = w1 . . . wn ∈ O tem-se que seus
fatores próprios w2 . . . wn e w1 . . . wn−1 pertencem a L. Determinar O é simplesmente identificar os
elementos minimais de um conjunto de geradores, para isso podem ser empregados algoritmos base-
ados naqueles utilizados para otimização de circuitos e sistemas digitais, busca lexicográfica, etc. Já
no caso dos conjuntos de restrições à direita e à esquerda, para que tornem-se atraentes em termos
práticos, faz-se necessário identificarmos propriedades adicionais que possibilitem o emprego destes
como ferramentas para o determinação de métodos computacionais destinadas ao estudo da lingua-
gem e estrutura algébrica do ssf. Essa tarefa é iniciada nesta seção e continua até o fim do capı́tulo.
Em particular, podemos citar a proposições demonstradas neste seção, cujas implicações permitem-
nos identificar quando uma linguagem é regular e como especificar os conjuntos de restrições, entre
outras.
Inicialmente, lembremos que Cw é o conjunto minimum em L satisfazendo Cw = {Cw · L}\L′ .
Neste contexto, caso w ∈
/ L então para todo v ∈ L, wv ∈
/ L, o que implicará que Cw = {ε}. A
princı́pio, para o caso em que w ∈ L a determinação do conjunto Cw poderia requerer um proce-
dimento de busca exaustiva. A seguir demonstramos que este não é o caso, o que é realizado pela
especificação de um procedimento sistemático para determinação do conjunto Cw quando w ∈ L.
68 Dinâmica Simbólica e Autômatos

Antes, contudo, iremos estabelecer alguns resultados preliminares, no Lema 31 e Proposição 32


demonstra-se a relação entre os conjuntos Cw e S(P(O)). Estes resultados estão associados ao con-
texto à direita de uma palavra, no Lema 33 e Proposição 34 as versões associadas ao contexto à
esquerda são apresentadas.
Lema 31. Consideremos w ∈ L e u ∈ Cw , onde consideramos Cw um conjunto não nulo. Portanto,
há um, e somente um, fator v de wu em O satisfazendo vu−1 ∈ S(w)\{ε}.
Demonstração: Uma vez que w e u pertencem a uma linguagem fatorial, seus fatores também
pertencem à linguagem. Portanto, podemos concluir a partir do Teorema 19 que wu possui pelo
menos um fator v ∈ L′ , permitindo-nos dividi-lo em um sufixo próprio q pertencendo ao conjunto
P (u)\{ε} e um prefixo próprio p pertencente ao conjunto S(w)\{ε}, satisfazendo pq = v.
Sejam vi ∈ O, 1 ≤ i ≤ n, fatores de wu não necessariamente distintos que, de acordo com a
observação acima, possuem qi ∈ P (u)\{ε}, pi ∈ S(w)\{ε} satisfazendo pi qi = vi . Uma vez que u
é um elemento minimal em (Cw , P ), então qi = u para todo i. Consideremos que pi S pj , então
pi u SP pj u, contudo para todo i a palavra vi é minimal em (L′ , SP ), o que leva-nos a concluir que
pi = pj . Por fim, temos necessariamente que vi = vj , 1 ≤ i, j ≤ n. 
Proposição 32. Consideremos w ∈ L, então Cw = Cv para
_
v= {u ∈ S(w) ∩ P(OA−1 )},

considerando a relação de ordem parcial S em L.


Demonstração: A afirmação segue diretamente para w ∈ P(OA−1 ). Além do que, para v, t ∈
P(OA−1 ) e t S v, podemos afirmar que vs ∈ L′ sempre que ts ∈ L′ , como consequência da
linguagem L ser fatorial. Portanto, como v S w, sempre que vp ∈ L′ então wp ∈ L′ , e conse-
quentemente R(v, L′ ) ⊆ R(w, L′ ). Por outro lado, do Lema 31 sempre que wq ∈ L′ então existe
u ∈ S(w) ∩ P(OA−1 ) satisfazendo uq ∈ L′ , como supomos que v é a palavra de maior comprimento
em S(w) ∩ P(OA−1 ), então u S v, e portanto vq ∈ L′ , decorrendo que R(w, L′ ) ⊆ R(v, L′ ). Estes
resultados permitem-nos concluir que R(w, L′ ) = R(v, L′ ), seguindo-se do Teorema 25 que Cw = Cv .

O Lema 33 e a Proposição 34 são recı́procos ao Lema 31 e a Proposição 32, respectivamente.
Contudo relacionados ao contexto à esquerda. As demonstrações podem ser realizadas de forma
similar às anteriores, realizando-se as devidas alterações. Alternativamente, pode ser considerada a
linguagem reversa L̺ e a Proposição 26.
Lema 33. Consideremos w ∈ L e u ∈ Dw o conjunto não vazio de restrições a esquerda associado,
então há um, e somente um, fator v de uw em O satisfazendo u−1v ∈ P (w)\{ε}.
3.10 Cálculo dos Conjuntos Proibidos e Conjuntos de Restrições 69

Proposição 34. Consideremos w ∈ L, então Dw = Dv para


_
v= {u ∈ P(w) ∩ S(A−1 O)},

considerando a relação de ordem parcial P em L.


A partir do Lema 31, para todo w ∈ L segue que Cw ⊆ S(O)\{ε} e OCw−1 ⊆ S(w)\{ε}. Por-
tanto, o conjunto Cw pode ser determinado a partir do conjunto de elementos em O cujos prefixos
próprios são sufixos de w. Inicialmente terı́amos que determinar tais elementos, em seguida seria
necessário especificar o conjunto de elementos minimais do conjunto formado pela união dos corres-
pondentes conjuntos de restrições à direita. Portanto, devemos procurar os elementos do conjunto Cw
em (S(w)\{ε})−1O.
Essa procura não precisa ser exaustiva, como iremos demonstrar na Proposição 35, há um pro-
cedimento recursivo para a determinação de Cw . Inicialmente, a equação (3.25) esboça o procedi-
mento empregando algumas operações básicas de cálculo de divisão sobre os sufixos mais longos
v = a1 a2 . . . an da palavra w (entre aqueles contidos no conjunto P(OA−1 )), o que decorre do
resultado apresentado na Proposição 32, ou seja, Cw = Cv . O procedimento começa calculando
Kvj = (S(a1 . . . aj )\{ε})−1 O para o prefixo mais curto de v contida em P(v)\{ε}, até o próprio v
(seu prefixo mais longo).

Kv1 = a−1
1 O,

Kv2 = a−1 1 −1
2 Kv ∪ a2 O,
.. (3.25)
.
Kvn = a−1 (n−1)
n Kv ∪ a−1
n O.

(n−1)
Proposição 35. Seja v ∈ P(OA−1 ), v = a1 a2 . . . an , então Kvn = a−1
n Kv ∪ a−1
n O.

Demonstração:
Kvn = (S(v)\{ε})−1O
= (S(a1 . . . an−1 )an )−1 O
= (S(a1 . . . an−1 )an ∪ an )−1 O
= a−1 −1 −1
n S(a1 . . . an−1 ) O ∪ an O

= a−1 −1 −1 −1
n ((S(a1 . . . an−1 )\{ε}) O) ∪ an O ∪ an O

= a−1 −1 −1
n ((S(a1 . . . an−1 )\{ε}) O) ∪ an O

= a−1 (n−1)
n Kv ∪ a−1
n O.


70 Dinâmica Simbólica e Autômatos

Por fim, uma vez que o conjunto Kvn foi obtido, o conjunto de restrições à direita Cw é simples-
mente a coleção de todos os elementos minimais em (Kvn , P ).
O conjunto de restrições à esquerda Dw pode ser obtido através de um procedimento similar.
Neste caso Dw é um subconjunto de O(P(w)\{ε})−1. A equação (3.26) é recı́proca a equação
(3.25). Continuando o processo comparativo, consideremos u = b1 . . . bn como sendo o prefixo
mais longo de w pertencente ao conjunto S(A−1 O), escolha justificada pelo resultado apresentado
na Proposição 34, de onde temos que Dw = Du . No presente caso, o procedimento de cálculo
Tuj = O(P (bj . . . bn )\{ε})−1 inicia-se pelo sufixo mais curto de u que é um elemento de S(u)\{ε}
até o próprio u (seu sufixo mais longo). A partir da Proposição 36 e empregando indução, assim como
no caso dos conjuntos de restrições à direita, é possı́vel demonstrar a efetividade do procedimento.

Tun = Ob−1
n ,

Tu(n−1) = Tun b−1 −1


n−1 ∪ Obn−1 ,
.. (3.26)
.
Tu1 = Tu2 b−1 −1
1 ∪ Ob1 .

Proposição 36. Seja u ∈ S(A−1 O), u = b1 b2 . . . bn , então Tu1 = Tu2 b−1 −1


1 ∪ Ob1 .

Demonstração:

Tu1 = O(P(u)\{ε})−1
= O(b1 P(b2 . . . bn ))−1
= O(b1 ∪ b1 P(b2 . . . bn ))−1
= OP(b2 . . . bn )−1 b−1 −1
1 ∪ Ob1

= (O(P(b2 . . . bn )\{ε})−1)b−1 −1 −1
1 ∪ Ob1 ∪ Ob1

= (O(P(b2 . . . bn )\{ε})−1)b−1 −1
1 ∪ Ob1

= Tu2 b−1 −1
1 ∪ Ob1 .

Como antes, uma vez que o conjunto Tu1 foi determinado, o conjunto de restrições à esquerda Dw
é a coleção do elementos minimais em (Tu1 , S ).
3.11 Obtenção da Estrutura Algébrica através dos Conjuntos de Proibições e Restrições 71

3.11 Obtenção da Estrutura Algébrica através dos Conjuntos de


Proibições e Restrições
Nesta seção será demonstrado como os conjuntos de restrições e proibições podem ser empregados
para a determinação do monoide sintático de uma linguagem FPR com conjunto de proibições O
finito. O método emprega elementos de teoria de autômato, sendo esta máquina de estados finitos
empregada como “máquina de cálculo” para determinação do monoide sintático e implementação de
operação associada a este.
Inicialmente, observemos que R(w, L) = R(v, L) ⇔ w −1 L = v −1 L, somando-se a isso a
aplicação direta do Teorema 25, pode-se concluir que R(w, L′) = R(v, L′ ) ⇔ Cw = Cv . De forma
similar, a igualdade L(w, L) = L(v, L) é observada se, e somente se, ε ∈ (uw)−1L ⇔ ε ∈ (uv)−1 L
para todo u ∈ A∗ , que quando associado ao Teorema 30 permite-nos concluir que L(w, L′ ) =
L(v, L′ ) ⇔ Dw = Dv .

Proposição 37. Seja L ⊆ A∗ uma linguagem fatorial e u, w ∈ A∗ . Então ϕL (w) = ϕL (v) se, e
somente se, as seguintes condições são satisfeitas:

(1) Cw = Cv ;

(2) Dw = Dv ;

(3) (uw)−1Ow = (uv)−1 Ov , para todo u ∈ L.

Demonstração: Como estamos considerando linguagens fatoriais, podemos reescrever o item (2) da
Proposição 13 como:
(uw)−1L = (uv)−1L, para todo u ∈ L.

Empregando esta equação, podemos provar que ϕL (w) = ϕL (v) implica em (1)-(3). Inicialmente,
observamos que ao considerarmos u = ε teremos que w −1L = v −1 L ⇔ (1). De forma similar,
temos que (2) ⇔ (uw)−1L = (uv)−1L para todo u ∈ L. Por fim, consideremos que pwq ∈ Ow ,
o que nos permite afirmar, empregando o item (3) da Proposition 13, que pvq ∈ L′ . A partir da
Definição 10 temos que pw, wq ∈ L, portanto pv, vq ∈ L o que implica necessariamente na existência
de p′ vq ′ ∈ Ov satisfazendo p′ S p e q ′ P q. Contudo, teremos que p′ wq ′ ∈ L′ , e portanto
p′ wq ′ SP pwq, permitindo-nos concluir que p′ = p, q ′ = q e consequentemente pvq ∈ Ov . Dessa
forma, a igualdade ϕL (w) = ϕL (v) implica que (uw)−1Ow = (uv)−1Ov .
Dado o desenvolvimento apresentado no inı́cio do parágrafo anterior, resta-nos provar que a
condição uwt ∈ L ⇔ uvt ∈ L para u, t ∈ L\{ε} é satisfeita, ou de forma similar, que uwt ∈
/
72 Dinâmica Simbólica e Autômatos

/ L para u, t ∈ L\{ε}. Suponhamos que pwq ∈ L′ contudo pw, wq ∈ L. Empregando


L ⇔ uvt ∈
a Proposição 21, deve existir p′ wq ′ ∈ Ow satisfazendo p′ S p e q ′ P q, seguindo-se de (3) que
p′ vq ′ ∈ Ov e portanto pvq ∈ L′ . Podemos concluir que (1)-(3) implica em ϕL (w) = ϕL (v). 

A descrição de como estes resultados podem ser empregados para a determinação do monoide
sintático de uma linguagem F P R denotada por L, especificada através de um conjunto de proibições
irredutı́veis finito é demonstrado através de um exemplo, acompanhado de detalhado comentário.
Consideremos um alfabeto A = {0, 1, 2}. A linguagem L é especificada através do conjunto de
proibições irredutı́veis O = {20, 002, 100, 111, 112, 211, 212, 1011, 1012}. Com essa informação
podemos especificar os conjuntos de prefixos, sufixos e as w-proibições, como apresentado em (3.27)
e (3.28), respectivamente.

P(OA−1 ) = {ε, 0, 00, 1, 10, 101, 11, 2, 21}
Prefixos e Sufixos: (3.27)
S(A−1 O) = {ε, 0, 1, 2, 00, 02, 11, 12, 011, 012}

 O = {002, 100, 1011, 1012}
 0


Possı́veis w-proibições: O1 = {111, 112, 211, 212, 1011, 1012} (3.28)


O = {1011, 1012}

01

Essa informação é suficiente para determinarmos as classes de equivalência das palavras em L com
mesmo contexto à direita, e as classes de equivalência das palavras com mesmo contexto à esquerda.
Com essa informação podemos determinar as classes sintáticas, que como especificado na Seção 3.6,
podem ser mapeadas através de um morfismo bijetivo com os elementos do monoide sintático. Apli-
cando as Proposições 32 e 34, sabemos que essas classes de equivalência só precisam ser deter-
minadas para os elementos em P(OA−1 ) e S(A−1 O). No caso das palavras w com conjuntos
de w-proibições não vazios, de acordo com o Lema 20, essas são exatamente os fatores não nulos
em A−1 OA−1 e são apresentadas em (3.28). Podendo ser observado destas equações, e como con-
sequência do item (3) da Proposition 37, que cada uma destas palavras determina uma classe sintática
distinta, dado que cada uma delas possui o conjunto Ow distinto.
Prosseguindo, passamos a determinar os possı́veis conjuntos Cw e Dw . Aplicando (3.25) aos
elementos em P(OA−1 ) obtemos: K01 = {02}, K00
2
= {2, 02}, K11 = {00, 011, 012, 11, 12},
2 3 2
K10 = {0, 11, 12, 02}, K101 = {1, 2, 00, 011, 012, 11, 12}, K11 = {1, 2, 00, 011, 012, 11, 12}, K21 =
2
{0, 11, 12}, K21 = {1, 2, 00, 011, 012, 11, 12}. Aplicando (3.26) aos elementos em S(A−1 O) obte-
mos: T01 = {10, 2}, T11 = {11, 21, 101}, T21 = {00, 11, 21, 101}, T00
1 1
= {1, 2, 10}, T02 = {0, 2, 10},
1 1 1 1
T11 = {1, 2, 10, 11, 21, 101}, T12 = {1, 2, 10, 11, 21, 101}, T011 = {1, 2, 10}, T012 = {1, 2, 10}.
3 1
O procedimento de cálculo é explicitando em (3.29) para os casos K101 e T012 , observando-se que
3.11 Obtenção da Estrutura Algébrica através dos Conjuntos de Proibições e Restrições 73

K11 = K101
1 2
, K10 2
= K101 e T21 = T012
3 2
, T012 1
= T12 .

1
K101 = 1−1 O;
2
K101 = 0−1 K101
1
∪ 0−1 O = 0−1 K11 ∪ 0−1 O;
3
K101 = 1−1 K101
2
∪ 1−1 O = 1−1 K10
2
∪ 1−1 O.
(3.29)
3
T012 = O2−1 ;
2 3
T012 = T012 1−1 ∪ O1−1 = T21 1−1 ∪ O1−1 ;
1 2
T012 = T012 0−1 ∪ O0−1 = T12
1 −1
0 ∪ O0−1 .

Neste momento é necessário realizarmos algumas observações relevantes para o emprego desta ferra-
menta em alguns casos. Para toda linguagem ε · L = L, portanto Cε = ∅ é um conjunto trivial, e por-
tanto não é necessário calcula-lo explicitamente. Contudo, este conjunto deve ser considerado quando
da determinação do monoide sintático, sendo representado por [ε] = 1. O conjunto Cε também é im-
portante na determinação da apresentação por contexto à direita de uma linguagem FPR, tema abor-
dado na Seção 3.12. Vamos rever com mais cuidado (3.25), se escolhermos um inteiro positivo j > 1
e uma palavra v ∈ P(OA−1 ) satisfazendo |v| ≥ 2, para determinarmos Kvj é necessário determinar
previamente Kvj−1 = Kvj−1
′ onde v ′ = vA−1, ou seja, uma vez que P(v) ⊆ P(OA−1 ) os cálculos
necessários para a determinação de Kvj−1 não constituem unicamente procedimentos intermediários
com a única finalidade de determinar o conjunto de restrições à direta Cv de v. A mesma conclusão
pode ser estendida para os conjuntos Dw , quando da realização dos cálculos para a determinação
dos conjuntos Twi , com a modificação de Twi ser calculado após a determinação de Twi+1 = Tw1 ′ onde
w ′ = A−1 w, e S(w) ⊆ S(A−1 O).

Na Tabela 3.1 a primeira coluna apresenta o conjunto de classes de equivalência à direita, com
relação de equivalência dada por w ∼ v se, e somente se, Cw = Cv . Denotaremos por C tal relação de
equivalência. A segunda coluna contém os elementos equivalentes de P(OA−1 ), enquanto a terceira
coluna contém os conjuntos respectivos de restrições à direita. De forma recı́proca, a Tabela 3.2 apre-
senta as classes de equivalência à esquerda decorrentes da relação de equivalência D, os elementos
em S(A−1 O) que as formam, e os conjuntos respectivos de restrições à esquerda. Pode ser facilmente
verificado, que a terceira coluna, em ambas as tabelas, são determinadas pela especificação dos ele-
mentos minimais dos conjuntos Kwi e Tw1 já calculados, considerando-se as relações de ordem parcial
P e S , respectivamente.

Temos os elementos teóricos para especificar, de forma algorı́tmica, a que elemento do monoide
sintático pertence uma palavra w ∈ A∗ , equivalentemente, ao conjunto do particionamento de A∗
74 Dinâmica Simbólica e Autômatos

Tabela 3.1: C LASSES DE E QUIVAL ÊNCIA À D IREITA .


C-classes w ∈ P(OA−1 ) Cw
C1 ε ∅
C2 0 {02}
C3 1 {00, 11, 12, 011, 012}
C4 2, 10 {0, 11, 12}
C5 00 {2, 02}
C6 11, 21, 101 {1, 2, 00, 011, 012}

Tabela 3.2: C LASSES DE E QUIVAL ÊNCIA À E SQUERDA .


D-classes w ∈ S(A−1 O) Dw
D1 ε ∅
D2 0 {2, 10}
D3 1 {11, 21, 101}
D4 2 {00, 11, 21, 101}
D5 00, 11, 12, 011, 012 {1, 2, 10}
D6 02 {0, 2}

nas classes de equivalência estabelecidas pelos itens da Proposição 37. Nosso método decorre da
própria Proposição 37, da Proposição 32 e da Proposição 34, que permitem a redução da verificação
à determinação dos sufixos e prefixos mais longos da palavra analisada em P(OA−1 ) e S(A−1 O),
respectivamente. Seguindo-se a isso a especificação, quando necessário, do conjunto Ow .
Prosseguiremos, nesta seção, com o desenvolvimento de um procedimento para a determinação
do monoide sintático associado a uma linguagem FPL. O que implica na determinação dos elementos
que o compõe e da implementação da sua operação. Para isso empregaremos sistematicamente o con-
ceito de autômato, particularmente de um tipo de autômato similar a uma árvore n-ária, apresentado
formalmente na Definição 16 e chamado de trie (acrônico para tree-like automaton, [22]). De forma
a facilitar o entendimento, a seguir faremos uso da relação bijetiva que há entre palavras de uma lin-
guagem apresentada por um autômato determinı́stico e os caminhos sobre esse quando é fixado um
estado de “partida” de referência, podendo ser o próprio estado inicial. De forma mais formal, seja
Σ = (Q, A, i, T, δ) um autômato determinı́stico. Considerando q ∈ Q, se há um caminho π em Σ
com rótulo w partindo de q, então π é único, ou seja, não há outro caminho π ′ satisfazendo i(π ′ ) = q
e L(π ′ ) = w. Portanto, especificado um estado de partida como referência, podemos estender um
pouco a nossa notação, aplicando-a a elementos em A′ , e.g., se L é uma linguagem apresentada por
3.11 Obtenção da Estrutura Algébrica através dos Conjuntos de Proibições e Restrições 75

Σ e w ∈ L, então faz sentido escrevermos t(w) sabendo-se que o estado de partida é o estado inicial
i, como seria de esperar, teremos que t(w) = t(π), onde i(π) = i e L(π) = w. Esta terminologia
permite-nos ir um pouco além, como partindo do estado inicial i, quando existir, só há um caminho
com rótulo w, podemos referir o estado t(w) simplesmente como w, uma vez que este estado está
bem definido. Assim, como fazemos na Definição 16, podemos falar no estado t(w) ou ainda no
estado w, sendo este último o estado alcançado que possui rótulo w, parte do estado inicial i e possui
t(w) como estado terminal. Esta aparente recorrência de definições é realizada com o propósito de
facilitar o entendimento e apresentação dos resultados que seguem.

Definição 16. Um trie é um autômato determinı́stico T = (Q, A, i, T, δ), que aceita um conjunto
M ⊆ A∗ , tal que:

(1) Q é o conjunto de estados {w|w é uma palavra em P(M)}, sendo w é o rótulo de um caminho
partindo de i para o estado t(w);

(2) A é o alfabeto;

(3) O estado inicial i é a palavra de comprimento nulo ε (indicado na representação gráfica por uma
seta);

(4) δ é uma função parcial de Q × A para Q definida como:

δ(u, a) = ua,

portanto, só determinado quando ua é uma palavra em P(M);

(5) T é o conjunto de estados terminais, podendo ser qualquer subconjunto de Q.

O emprego original das trie decorre de algoritmos sobre sequências empregados para reconhe-
cimento de padrão, codificação, compressão e indexação [22, 23, 24]. O emprego que faremos da
estrutura trie possui estreita relação com estas aplicações, o empregaremos para identificar máximos
prefixos e sufixos dentre um conjunto finito de possibilidades, como também para determinar se uma
palavra possui pelo menos um fator em um conjunto finito especı́fico, no nosso caso, o conjunto de
sequências proibidas.
Inicialmente iremos estabelecer um processo de rotulação dos estados de T determinado por uma
relação de equivalência sobre as sequências P(M) que especificam estes estados. Considerando uma
relação de equivalência r sobre P(M), podemos particionar os estados de T de acordo com r pelo
emprego da relação bijetiva que há entre os estados e as sequências em P(M). Tomemos a partição
P(M)/r, a qual podemos associar uma indexação que possibilita representá-la como {ei }, onde
ei ∈ P(M)/r e ei ∩ ej = ∅ para i 6= j.
76 Dinâmica Simbólica e Autômatos

0 2
2 5 O 0 5
0 1 5
O 1
0 0 4 1 O 2 2
1 6 2 5
3 2 O 0 2 6
ε 1 1
1 O
1 ε
6 1 1 5
2 O 1
2 2 3
1 O 5
2
1 6 4
4 2 O
0 O

Figura 3.2: A C-trie. Figura 3.3: A D-trie.

(6) Seja w ∈ P(M) uma sequência para a qual r(w) = ej , onde ej ∈ P(M)/r. Então, o estado w é
rotulado por j, o que identifica a classe de equivalência em P(M)/r a qual a sequência associada
pertence.

Um trie munido com um processo de rotulação de seus estados estabelecido por uma relação
de equivalência é especificado por uma breve modificação da nomenclatura, sendo chamado de uma
r-trie. Em nosso caso, estamos interessados nas D-trie e C-trie, sendo definidas como:

D-trie: Denotada por TD onde r = D, M = S(A−1 O), e T = Q.

C-trie: Denotada por TC onde r = C, M = O, e T = Q\O = P(OA−1 ).

Empregaremos as D-trie e C-trie na determinação dos elementos do monoide sintático e como forma
de realizar a operação associada a esse. Para o conjunto O que já vı́nhamos empregando, determi-
namos as C-trie e D-trie, apresentando-as na Figura 3.2 e Figura 3.3, onde os estados terminais são
representados por cı́rculos. Exclusivamente para a C-trie, os vértices não terminais possuem rótulo
O.
Considerando uma palavra w ∈ A∗ , podemos determinar a qual classe de equivalência em
S(A−1 O)/D seu prefixo mais longo em S(A−1 O) pertence pela determinação do estado final al-
cançado pelo caminho mais longo na D-trie quando carregada a partir dos dı́gitos mais a esquerda de
w.
Seguindo a mesma idéia, mas com as devidas modificações, pode-se determinar a classe de equi-
valência em P(O)/C a qual pertence o sufixo mais longo em P (O) de uma sequência w ∈ A∗ . Con-
tudo, há a necessidade de considerarmos o caso em que w não pertence a linguagem, ou seja, w pode
3.11 Obtenção da Estrutura Algébrica através dos Conjuntos de Proibições e Restrições 77

conter um fator em O que não seja um prefixo. Esse caso é devidamente tratado ao considerarmos
uma expansão da funcionalidade da C-trie pela aplicação do algoritmo L-AUTOMATON apresentado
em [22]. Tendo como entrada a C-trie, esse algoritmo gera um autômato que apresentação uma lin-
guagem FPR L especificada através de um conjunto finito de palavras proibidas O. Com função de
transição definida de forma a sempre manter a informação de qual é o máximo sufixo no conjunto
P(O) da palavra analisada. De maneira mais formal, fornecido um C-trie gerado a partir de um
conjunto de palavras proibidas O, o algoritmo L-AUTOMATON determina um autômato completo
Σ(O) = (Q, A, i, T, δ) que representa a linguagem FPR L = A∗ \(A∗ OA∗ ), onde Q = P(O) e
T = P(OA−1 ). Sucintamente, esse algoritmo estende a função parcial de transição apresentada na
Definição 16, para uma função de transição apresentada na Definição 17, ou seja, enquanto a pri-
meira é definida em um subconjunto de Q × A, a segunda é definida para todo o conjunto Q × A,
especificando as transições ainda não definidas.

Definição 17. Consideremos a partição de Q × A em três subconjuntos disjuntos, apresentados em


(1)-(3). A função de transição δ de Σ(O) é definida como:

(1) δ = {(u, a, ua) : ua ∈ Q, a ∈ A} (transição direta);

(2) δ = {(u, a, v) : u ∈ Q\O, a ∈ A, ua ∈


/ Q, v é o sufixo mais longo de ua em Q } (transição de
retorno);

(3) δ = {(u, a, u) : u ∈ O, a ∈ A} (estado sorvedouro).

Assim, se o estado terminal de uma palavra w ∈ A∗ é o estado u ∈ T , então u é o sufixo mais


longo de w ∈ L no conjunto P(OA−1 ), permitindo-nos concluir que w pertence a mesma classe
de equivalência em P(OA−1 ) que u. Se o estado terminal de w pertence a O, então w possui uma
palavra proibida como fator, e portanto pertence a linguagem complementar L′ . O autômato Σ(O)
do exemplo considerado é apresentado na Figura 3.4, onde os estados com contornos tracejados
representam dois estados e os respectivos ramos de entrada, um para cada rótulo do ramo de entrada
proveniente de um estado terminal.
No Teorema 38 demonstramos que Σ(O) apresenta a linguagem FPR L = A∗ \A∗OA∗ , sendo a
prova uma alternativa àquela apresentada em [22].

Teorema 38. [22] Seja L uma linguagem FPR com conjunto de palavras proibidas irredutı́veis O.
Então |Σ(O)| = L.

Demonstração: Empregando indução no comprimento de w ∈ L, é possı́vel provar que se v é


a palavra de maior comprimento em {S(w) ∩ P(OA−1 )} então t(w) = v. O que é observado
facilmente ser verdadeiro para |w| = 0. Assumindo que também seja verdadeiro para todo w ∈ L
satisfazendo |w| ≤ n, consideraremos a seguir que t(w) é o sufixo mais longo u de w em P(OA−1 ).
78 Dinâmica Simbólica e Autômatos

0
0 2 0, 1, 2
2 5 O
1 1, 2
1 6 O 0, 1, 2
0 1
3 0 0, 1, 2
ε 0 O
1 1
0 4 1 1, 2 0, 1, 2
2 6 O
2 2 0
2 0
1 6 O 0, 1, 2
1, 2
4
0 O 0, 1, 2
2

Figura 3.4: Autômato Σ(O) obtido através do algoritmo L-AUTOMATON.

(i) Se wa ∈ P (O), então do item (1) da Definição 17, relacionado às transições diretas, t(wa) ∈
P(OA−1 ) se, e somente se, wa ∈ L. Caso contrário, wa ∈ O dada a suposição de que wa ∈ P(O).

(ii) Se wa ∈
/ P(O), então o prefixo mais longo de wa e ua é o mesmo, caso contrário, u não é o sufixo
mais longo de w em P(OA−1 ), o que é contrário a nossa suposição. Do item (2) da Definição 17,
se wa ∈ 6 ∅ uma vez que u ∈ P(OA−1 ), e portanto wa ∈
/ L então S(ua) ∩ O = / |Σ(O)| pois seu
sufixo mais longo em P(O) pertence a O; caso contrário, t(ua) é o sufixo mais longo de ua em
P(OA−1 ).

Consideremos o caso w ∈
/ L. Assim, podemos decompor w como w = qup, satisfazendo a condição
q ∈ L é o menor prefixo de w condicionado a u ∈ O. Então (qu)A−1 ∈ L (de outra forma, como
consequência da nossa suposição sobre q, u possui um fator próprio em O), uma vez que u ∈ O e da
Definição 17 temos que t(qu) = u é um estado sorvedouro (não terminal), então w ∈
/ |Σ(O)|. Do
que concluı́mos que L = |Σ(O)|. 

Consideremos ML o monoide sintático da linguagem L. A seguir empregaremos os autômatos


Σ(O), C-trie e D-trie para determinar os elementos de ML e especificar um procedimento sobre
autômatos para realizar a operação do monoide. Empregando uma analogia, podemos dizer que essas
estruturas são empregadas como nossa “máquina de calcular” sobre a estrutura algébrica de ML .
Nossa abordagem desdobra-se sobre dois casos que merecem distinção:

(1) Os conjuntos Ow dos elementos da respectiva classe de equivalência não são vazios;
(2) Os conjuntos Ow dos elementos da respectiva classe de equivalência são vazios.

Uma recapitulação necessária e breve do resultado apresentado na Proposição 37 será feita a seguir.
Sabemos que se v, w ∈ A∗ então [v] = [w] se, e somente se, Cv = Cw , Dv = Dw e (uw)−1Ow =
3.11 Obtenção da Estrutura Algébrica através dos Conjuntos de Proibições e Restrições 79

(uw)−1Ov para todo u ∈ L. O método para determinar se um conjunto de palavras está contido
na linguagem, e em caso afirmativo, quais as respectivas classes de equivalência em P(OA−1 )/C e
S(A−1 O)/D será discutido quando abordarmos o caso (2). Inicialmente abordamos como determinar
a terceira condição da Proposição 37 empregando o C-trie. A partir do Lema 20, as palavras w ∈ L
que enquadram-se no caso (1) pertencem ao conjunto S(P(A−1 OA−1 ))\{ε}, além do que Ow ⊆ O.
Para cada palavra em P(O), o autômato C-trie possui um único caminho do estado inicial i com
o rótulo correspondente. Assim, dados quaisquer w, v ∈ S(P(A−1 OA−1 ))\{ε} para que tenhamos
Ow = Ov , é necessário que de cada estado terminal u ∈ P(OA−1 )\{ε} pertencente a C-trie as duas
condições que seguem sejam satisfeitas: (i) uw ∈ P(OA−1 ) se, e somente se, uv ∈ P(OA−1 ),
como também (ii) (uwa)−1 O = (uva)−1 O para todo a ∈ A. Apesar de não abordarmos neste texto,
com toda a profundidade possı́vel, questões referentes a implementação algorı́tmica, estas últimas
observações evidenciam dois pontos relevantes. Em primeiro lugar, a condição (ii) deve ser satisfeita
para quaisquer extensões de uw e uv para palavras em OA−1 , e a condição (i) deve ser verificada para
todo prefixo de uw e uv. Esses elementos podem ser empregados na determinação dos conjuntos não
vazios Ow a partir das palavras de comprimento maior, pertencentes ao conjunto A−1 OA−1 , até as
de comprimento menor. Podendo ser empregado na determinação recursiva de palavras com mesmo
conjunto Ow .
No exemplo que estamos considerando, as palavras com conjunto Ow não vazio são S(P(A−1
OA−1 ))\{ε} = {0, 1, 01}. A partir da Figura 3.2, podemos observar que do estado 0 emana só um
ramo, cujo rótulo é 0, implicando que O0 6= O1 . Do estado 00 emana só um ramo, cujo rótulo é 2,
implicando que O0 6= O01 . Analisando as palavras 1 e 01, observamos que do estado 2 emana um
ramo com rótulo 1, contudo não emana um ramo com rótulo 01, portanto O1 6= O01 . Os processos
apresentados para determinação das classes P(OA−1 )/C e S(A−1 O)/D de uma palavra em L são
mais simples que aqueles utilizados para comparar conjuntos Ow . Assim, julgamos que é melhor
determinar se palavras no conjunto S(P(A−1 OA−1 ))\{ε} são C e D equivalentes, antes de comparar
seus conjuntos Ow . Adicionalmente, observamos que todo elemento em ML cujos representantes
em A∗ possuem conjuntos Ow não vazios, podem ser interpretados como elementos “transitórios”,
sempre que O é finito. Esses representantes pertencem ao conjunto S(P(A−1 OA−1 ))\{ε}, logo
se M + 1 é o maior comprimento de um elemento em O, sendo M a memória do ssf (o conceito
de memória é extensivamente abordado em [18]), a operação de no máximo M elementos distintos
da identidade em ML \{ε} é suficiente para garantir que os representantes do elemento resultante
possuem conjunto Ow vazio.
Analisando o caso (2), representaremos os elementos em ML através do par ordenado (ij), tal
que, para w ∈ L, [w] = (ij) se, e somente se, w ∈ Di , w ∈ Cj , e Ow = ∅; onde Di e Cj são classes
de equivalência nos conjuntos quocientes L/D e L/C, respectivamente.
80 Dinâmica Simbólica e Autômatos

Como resultado do Teorema 38, sabemos que w ∈ L se, e somente se, t(w) é um estado terminal
de Σ(O). Portanto, como procedimento para determinarmos se uma palavra w ∈ A∗ pertence a
linguagem L, e em caso afirmativo, a que classe de equivalência em L/C, só precisamos identificar o
estado alcançado em Σ(O) ao percorrermos o caminho cujo rótulo é w a partir do estado inicial. Se
w ∈ L, então a palavra que identifica o estado t(w), é a mais longa do conjunto S(w) ∩ P(OA−1 ),
sendo o rótulo do estado t(w) a classe de equivalência a qual pertence w. Este fato pode ser verificado
brevemente pelo emprego de um raciocı́nio indutivo. Essa afirmação é verificada facilmente como
verdadeira para |w| = 0, consideremos que ela também é verdadeira para |w| ≤ n. Suponhamos
que t(w) = u (assim, u é a palavra mais longa em S(w) ∩ P(OA−1 ), portanto t(wa) = t(ua) e
dos itens (1) e (2) da Definição 17 concluı́mos que t(ua) é o sufixo de ua mais longo no conjunto
Q, seguindo disso que t(ua) também é o sufixo mais longo de wa em Q. De forma a esclarecermos
esta última afirmação, se há outra opção que não o mais longo sufixo de ua, então ela terá que ser
mais longa que o próprio ua (pois ua é sufixo de wa), vamos chamá-la de v. Então |v| > |ua|,
e portanto |vA−1 | > |uaA−1| ⇒ |vA−1| > |u|. Do que seguiria que v é o mais longo sufixo de
w e não u, como supusemos inicialmente. Como exemplo, consideremos a sequência 010120 e o
autômato da Figura 3.4, percorrendo o caminho associado em Σ(O) observamos que t(010120) ∈ O,
não pertencendo a linguagem. Por outro lado, se considerarmos a sequência 110210 teremos que
t(110210) = 10, do que concluı́mos que 110210 ∈ L e 110210 ∈ C4 .
Para qualquer palavra w ∈ A∗ possuı́mos um método para determinar se ela pertence à linguagem
e, em caso afirmativo, especificar a que classe de equivalência L/C ela pertence. Agora, determina-
remos a que classe de equivalência L/D a palavra w pertence. Para tanto empregaremos a D-trie.
A classe de equivalência procurada é dada pelo rótulo do estado terminal do caminho mais longo
em D-trie que seja um prefixo de w. Para identifica-lo, só precisamos determinar o rótulo do estado
terminal do caminho mais longo em D-trie que começa no estado inicial e cujo rótulo é um prefixo
de w. A partir da construção da D-trie, o rótulo de tal caminho é o prefixo mais longo de w em
S(A−1 O), seguindo da Proposição 34 que o rótulo do estado terminal identifica a classe a qual w
pertence. Como exemplo, a partir da Figura 3.3 e considerando a palavra 110210, seu prefixo mais
longo em S(A−1 O) é 11, portanto ela pertence à classe de equivalência D5 .
Sumarizando nossa análise sobre w = 110210, como o conjunto Ow é vazio, podemos represen-
tar o elemento respectivo do monoide sintático por [110210] = (54). Uma vez que [w][v] = [wv],
o método apresentado disponibiliza uma forma de realizarmos a operação do monoide, dado que
sabemos quais são os elementos de ML , ou seja, sabemos que pares (ij) correspondem a elemen-
tos do monoide e os elementos que possuem conjunto Ow não vazio. Seguindo o procedimento já
apresentado, dados dois elementos [w] e [v], para realizarmos a operação do monoide devemos em-
pregar os autômatos Σ(O) e D-trie, “carregando-os” com wv. Se sabemos que |w| ≥ M então
3.11 Obtenção da Estrutura Algébrica através dos Conjuntos de Proibições e Restrições 81

Dwv = Dw , de forma similar se |v| ≥ M então Cwv = Cv . Considerando que estas restrições de
comprimento são satisfeitas, se sabemos que um elemento de ML possui um representante w tal
que |w| ≥ M, então podemos simplificar o cálculo envolvendo esse elemento. Para tanto, obser-
vamos que [w][v] ∈ S(P(A−1 OA−1 ))\{ε} se, e somente se, [w], [v] ∈ S(P(A−1 OA−1 ))\{ε}
ou ainda podemos ter os casos em que [w] ou [v] é a identidade. Desenvolvendo o exemplo já
iniciado, [0][1] = [01] ∈ S(P(A−1 OA−1 ))\{ε}, contudo [01][w] ou [w][01] possuem represen-
tantes com conjuntos Ow vazios sempre que [w] 6= 1. Se considerarmos um comportamento a
“longo prazo” (operação entre mais que M − 1 elementos de ML diferentes da identidade), para
w ∈ S(P(A−1 OA−1 ))\{ε}, [w] também poderá ser representado a partir de um par ordenado (ij),
desconsiderando o conjunto Ow , uma vez que o resultado da operação realizada certamente será um
elemento em ML cujos representantes possuem conjunto Ow vazio. Portanto, as especificidades lo-
cais de algumas classes do monoide sintático são eliminadas quando considerado o comportamento a
longo prazo.
Já dispomos dos elementos necessários para realizarmos a operação do monoide sintático ML
empregando os autômatos apresentados, sendo necessário iniciarmos pela determinação dos pares
ordenados (ij) associados a elementos de ML . Como as classes de equivalência das palavras com
conjuntos Ow não vazios são obtidos diretamente de O (estas classes possuem representantes no con-
junto S(P(A−1 OA−1 )) ), nos concentraremos na determinação das classes com Ow vazio, referentes
ao caso (2). Claramente, o número máximo destas classes é #(L/D) × #(L/C).
Considerando um par ordenado (ij) especı́fico, 1 ≤ i ≤ #(L/D) e 1 ≤ j ≤ #(L/C), em-
pregando os elementos desenvolvidos até aqui, podemos afirmar que há um elemento do monoide
sintático associado a esse par ordenado se, e somente se, para alguma palavra w ∈ P(S(A−1 O)) o
estado w no D-trie possui rótulo i, além de ser possı́vel estender o estado t(w) em Σ(O) para um
estado com rótulo j empregando uma palavra v, ou seja, t(wv) possui rótulo j, devendo ser satisfeita
a restrição que o rótulo do estado obtido ao carregarmos wv na D-trie também possui rótulo i. Como
exemplo, na Figura 3.3 o estado 0 possui rótulo 2, contudo se o estendermos empregando uma palavra
de rótulo 0 ou 2, as classes resultantes em L/D serão D5 ou D6 , respectivamente. Portanto, as ex-
tensões de 0 só pertencerão a classe D2 se a palavra resultante for 01 ou possui a forma 010u, tal que
010u ∈ L. Todas essas conclusões podem ser verificadas empregando-se os autômatos Σ(O) e D-trie.
Como procedimento geral, empregando o autômato D-trie determina-se o conjunto de palavras com
classe Di e cuja extensão é uma palavra em L que também pertence a classe Di . Empregando-se esse
conjunto, utilizando o autômato Σ(O) determina-se os pares (ij), onde 1 ≤ j ≤ #(L/C). De forma
natural, podemos começar esse processo de determinação dos possı́veis pares (ij), especificando-os
para os elementos dos conjuntos P(OA−1 ) e S(A−1 O), uma vez que metade do cálculo necessário
já foi realizado quando foram determinadas as classes de equivalência L/C e L/D, respectivamente.
82 Dinâmica Simbólica e Autômatos

Portanto, considerando a Tabela 3.1 e a Tabela 3.2, podemos determinar a Tabela 3.3. Para o nosso
caso, há #(L/D)×#(L/C) = 36 pares ordenados (ij) que são candidatos a representarem elementos
de ML , muitos não estão relacionados a elementos em ML , uma determinação que em alguns casos
pode ser realizada a partir de observações simples.
Inicialmente, consideremos uma linguagem FPR L sobre um conjunto finito A com conjunto de
restrições O finito. Se para qualquer w em Σ∗ de comprimento positivo, há pelo menos um prefixo de
comprimento positivo contido no conjunto S(A−1 O), o que significa que P(w)\{ε}∩S(A−1O) 6= ∅,
então podemos concluir que w ∈
/ D1 para todo w não nulo, do que resulta não haver classes em ML
cujo par ordenado (ij) associado possua i = 1, a não ser a classe com representante ε. Colocando de
outra forma, não haverá w ∈ A∗ , |w| > 0, cujo estado alcançado quando w é “carregada” no D-trie
seja ε. De forma similar, se para todo w ∈ A∗ , |w| > 0, a desigualdade S(w)\{ε} ∩ P(OA−1 ) 6= ∅
é verificada, então w ∈
/ C1 , assim não há classes sintáticas com j = 1 em seus respectivos pares
ordenados (ij), a não ser o elemento que possui ε como representante, o que é equivalente a não
haver caminhos de comprimento positivo tendo ε como estado inicial e terminal em Σ(O).
Como exemplo, consideremos a identificação dos possı́veis pares ordenados (ij) com i = 3. Só
há a palavra 1 em S(A−1 O) nessa classe. A única extensão por um dı́gito cuja palavra resultante
permanece na classe D3 e o conjunto Ow seja vazio é 10. Dessa forma, empregaremos a palavra
10 para determinar os possı́veis j, ou seja, especificar u tal que os possı́veis valores de j sejam
determinados mantendo-se a restrição 10u ∈ L. Especificamos os possı́veis casos em (3.30), obtidos
ao “carregarmos” 10u em Σ(O). 
4, u = ε.
j: (3.30)
6, u = 1.

Do que concluı́mos que só temos as classes (34) e (36) em ML , cujos representantes 10 e 101,
respectivamente, possuem conjuntos Ow vazios.

Tabela 3.3: R EPRESENTANTES DAS CLASSES N ÃO NULAS E PARES ORDENADOS (ij) ASSOCIADOS .

w (ij) w (ij) w (ij) w (ij)


ε (11) 21 (46) 11 (56) 021 (66)
2 (44) 101 (36) 02 (64) 0∗ (22)
10 (34) 001 (53) 010 (24) 1∗ (33)
00 (55) 12 (54) 0101 (26) 01∗ (23)
* Palavras com conjunto Ow não vazio.
3.12 O Autômato Minimal de uma Linguagem FPR 83

3.12 O Autômato Minimal de uma Linguagem FPR


Nesta seção aplicaremos os conceitos apresentados nas Seções 3.9, Seção 3.10 e Seção 3.11 para gerar
uma apresentação reduzida e determinı́stica de uma linguagem FPR L com conjunto de restrições ir-
redutı́veis O. Inicialmente, consideraremos a obtenção de uma versão reduzida de Σ(O), apresentada
na Definição 18 e gerada pela fusão de estados contidos em uma mesma classe de equivalência3.

Definição 18. O autômato M(O) é derivado da versão rotulada de Σ(O), com todos os seus estados
sendo terminais, além de seus ramos e estado inicial satisfazerem as condições que seguem.

• Dois estados terminais I, J de Σ(O) são ditos equivalentes, se possuem o mesmo rótulo (estados
com rótulo O não são considerados na determinação dos estados de M(O)). Tal relação particiona
o conjunto de estados terminais de Σ(O) em conjuntos denotados por e1 , e2 , . . . , er , onde r é o
número de classes em L/C. Cada classe de equivalência ei constitui um estado de M(O).

• Há um ramo em M(O) com rótulo a de ei para ej se, e somente se, há estados I ∈ ei e J ∈ ej e
um ramo em Σ(O) com rótulo a de I para J;

• Se i ∈ ei então ei é o estado inicial de M(O).

Os resultados que seguem demonstram que M(O) é uma apresentação reduzida e determinı́stica
de L. Como resultado preliminar essencial, no Lema 39 demonstramos que ao estendermos palavras
equivalentes com relação a C por elementos de A, a equivalência é preservada. Ou seja, a relação de
equivalência C é uma relação de congruência quando consideramos a operação de concatenação de
elementos em A∗ .

Lema 39. Seja w, v ∈ L satisfazendo C(w) = C(v), então C(wa) = C(va), onde wa ∈ L e a ∈ A.

Demonstração: Do Teorema 25, se wu ∈ L então vu ∈ L para qualquer u ∈ L. Escolhendo-se


u = at então (wa)t ∈ L ⇔ (va)t ∈ L, e portanto C(wa) = C(va). 

O resultado apresentado no Lema 39 é essencial para que possamos determinar a linguagem apre-
sentada por M(O).

Proposição 40. Seja L uma linguagem FPR com conjunto de proibições irredutı́veis O. Então M(O)
é uma apresentação determinı́stica de L.
3
Em [25] apresentamos um algoritmo para construir o autômato minimum de uma ssf a partir de classes de restrições
à direita; contudo, os conjuntos de restrições são derivados de um conjunto de proibições irredutı́veis necessariamente
finito, e não como apresentado neste material, a saber, como uma propriedade intrı́nseca de uma linguagem fatorial e
prolongável. Também não são realizadas conexões com o conceito de monoide sintático.
84 Dinâmica Simbólica e Autômatos

Demonstração: Do Lema 39 e Proposição 32, para C(w) = C(v) e w, v ∈ L então o sufixo mais
longo de wa e va em P(OA−1 ) pertence a mesma classe de equivalência em L/C quaisquer que
sejam wa, va ∈ L, decorrendo da Definição 17 que M(O) é determinı́stico.
a a
Da Definição 18, se ei −→ ej então para todo I ∈ ei existe J ∈ ej , satisfazendo I −→ J
em Σ(O), para todo a ∈ A. Considerando que isso é satisfeito para qualquer v com comprimento
va v a
|v| ≤ n. Se ei −→ ej , e portanto va ∈ |M(O)|, então deve existir ek tal que ei −→ ek −→ ej .
v
Portanto, para todo I ∈ ei haverá K ∈ ek satisfazendo I −→ K, sendo possı́vel determinar um
a va
J ∈ ej , tal que, K −→ J. Do que decorre que I −→ J e va ∈ |A(O)|, o que permite-nos concluir
que |M(O)| ⊆ |Σ(O)|.
a a
Se I ∈ ei , J ∈ ej e I −→ J, então ei −→ ej . Consideremos que isso é satisfeito para toda a
v v va
palavra v com |v| < n, tal que, I −→ J implica que ei −→ ej . Para qualquer va, tal que, I −→ K
v a
teremos va ∈ |Σ(O)|. Logo, observa-se necessariamente que I −→ J −→ K onde K ∈ ek , portanto
v a
deve-se também observar ei −→ ej −→ ek , permitindo-nos concluir que va ∈ |M(O)|. Do que
conclui-se que |Σ(O)| ⊆ |M(O)|.
Por fim, ficam estabelecidas as igualdades |M(O)| = |A(O)| = L. 

Na Definição 19 apresentamos uma extensão necessária da Definição 11 para que os resultados


que seguem possam ser demonstrados.

Definição 19. Sejam Σ = (Q, A, i, T, δ) um autômato e I ∈ Q um estado qualquer. Os contextos à


direita e à esquerda de I com relação a Σ são, respectivamente, os conjuntos

R(I, Σ) = {u ∈ A∗ : I · u ∈ T } e L(I, Σ) = {u ∈ A∗ : i · u = I}.

Lema 41. Sejam iv = I, v ∈ P(OA−1 ) e I um estado terminal de Σ(O). Então R(I, Σ(O)) =
R(v, L).

Demonstração: Do Teorema 38 sabemos que Σ(O) é uma apresentação de L, então R(I, Σ(O))
⊆ R(v, L), uma vez que iv = I. Se vu ∈ L, então i(vu) é um estado terminal J, e portanto
v u
i −→ I −→ J, permitindo-nos concluir que R(v, L) ⊆ R(I, Σ(O)). 

Como resultado do Lema 41, o contexto à direita de estados com rótulo i em Σ(O) são iguais aos
das palavras em L pertencentes as classes Ci . Na Proposição 42 demonstramos que M(O) também
satisfaz esta propriedade, permitindo-nos concluir que ele é uma apresentação reduzida.

Proposição 42. Sejam I ∈ ei , onde I e um estado de Σ(O) e ei é um estado de M(O). Então


R(I, Σ(O)) = R(ei , M(O)).
3.12 O Autômato Minimal de uma Linguagem FPR 85

2 0 5
0 1 1
2 ε 1 1 3
0 1
2
2 1
4 6
0
2
Figura 3.5: O autômato M(O).

a a
Demonstração: A partir da Definição 18 temos que I −→ J ⇒ ei −→ ej , que conjuntamente com
a a
o Lema 39, caso ei −→ ej então para qualquer I ∈ ei existe J ∈ ej satisfazendo I −→ J, portanto
a a v
ei −→ ej ⇒ I −→ J. Agora, para todo |v| ≤ n, suponhamos que ei −→ ej se, e somente se, há
v v a
I ∈ ei e J ∈ ej , tal que, I −→ J. Então, para todo a ∈ A, I −→ J −→ K se, e somente se,
v a
ei −→ ej −→ ek , K ∈ ek . Do que concluı́mos que R(I, A(O)) = R(ei , M(O)). 

Corolário 43. M(O) é o autômato minimal de L.

Demonstração: Por construção, todos os estados de M(O) são terminais e alcançados a partir do
estado inicial. Como o estado inicial de Σ(O) alcança qualquer outro dos seus estados, então ele é
um autômato essencial. Da Proposição 40 o autômato M(O) é uma apresentação determinı́stica de
L, e do Lema 41 e Proposição 42 ele também é reduzido (ver Corolário 11). 

Considerando a Figura 3.4, o autômato correspondente M(O) é apresentado na Figura 3.5. Como
o autômato M(O) apresenta a mesma informação que A(O) (a mesma linguagem), então ele pode
ser empregado para realizar a operação do monoide e a identificação das restrições à direita no lugar
do autômato A(O), que é mais complexo (maior número de estados). Realizando essa substituição
de representações, reduzimos a complexidade dos algoritmos empregados, pois, como pode ser de-
monstrado, ela está relacionada com o número de estados e ramos do autômato empregado.
86 Dinâmica Simbólica e Autômatos
Capı́tulo 4

Geometria Hiperbólica

O objetivo deste capı́tulo é introduzir os conceitos matemáticos básicos (algébricos, geométricos


e topológicos) necessários para a apreciação dos próximos capı́tulos, que versam sobre processos
de codificação de geodésicas. O objetivo é ressaltar os elementos fundamentais sobre geometria
hiperbólica empregados na fundamentação dos resultados, procurando deixar clara a relação entre os
elementos algébricos, geométricos e topológicos relevantes.
Como resultado maior, construı́do no decorrer dos capı́tulos que seguem, estabelecemos uma
apresentação mı́nima para o ssf decorrente do processo de codificação do fluxo geodésico restrito a
um subconjunto compacto de uma superfı́cie hiperbólica. Tal apresentação guarda estreita relação
com as propriedades geométricas da região fundamental empregada na construção da superfı́cie.

4.1 Conceitos Preliminares


A seguir introduzimos alguns conceitos que são empregados nas demais seções deste capı́tulo e no
decorrer dos capı́tulos que seguem. Basicamente, introduziremos conceitos básicos de álgebra e
espaços métricos, como também alguns casos ondes esses surgem conjuntamente.

Definição 20. Um grupo (G, ·) é um conjunto G sobre o qual define-se um operação ·, que associa a
cada par ordenado (a, b) de elementos de G um elemento ab ∈ G, satisfazendo as condições:

1. associatividade: dados a, b, c ∈ G, então (ab)c = a(bc);

2. identidade: há um único elemento e ∈ G tal que ea = a = ae para todo elemento a ∈ G;

3. inverso: dado a ∈ G há um elemento a−1 ∈ G tal que a−1 a = e = aa−1 .

Um exemplo tı́pico de grupo com G finito, é o conjunto das simetrias (reflexão e rotação) de um
polı́gono regular . E de grupo com G infinito, o conjunto dos inteiros com operação de soma. Um

87
88 Geometria Hiperbólica

grupo é dito cı́clico se possui um elemento tal que G = {ak | k ∈ Z}, onde a é dito gerador. Como
exemplo de grupo cı́clico finito, temos as classes de resı́duos Zm = Z/mZ de Z módulo um inteiro
m com operação de adição (Zm , ⊕). Nesse caso, o elemento 1̄ ∈ Zm , com 1 ∈ 1̄, é um gerador, não
m
sendo único, pois qualquer elemento ā tal que a, m são relativamente primos também é um gerador
[26, 21].

Definição 21. Consideremos os grupos (G1 , · ), (G2 , · ) e o conjunto de pares ordenados G1 × G2 =


1 2
{(g1 , g2 ) | g1 ∈ G1 e g2 ∈ G2 }, a este último é dada a estrutura de grupo, chamada de produto direto
de G1 com G2 , ao definir-se a operação (g1 , g2) · (g1′ , g2′ ) = (g1 · g1′ , g1 · g2′ ). Este conceito pode ser
1 2
naturalmente estendido para o produto direto de n grupos.

Como uma extensão do caso anterior, temos que ao conjunto Z2 = Z × Z pode-se dar a estrutura
de grupo quando considerada a operação de soma por coordenada, gerando um reticulado em R2 .
Como caso finito, consideramos o conjunto (Zm , Zn ) com as operações de soma naturais.

Definição 22. Sejam (G1 , · ), (G2 , · ) dois grupos e σ : G1 → Aut(G2 ) um homomorfismo de G1 no


1 2
grupo de automorfismos de G2 . Então, G1 × G2 é chamado de produto semi-direto de G1 por G2 com
σ
homomorfismo σ, com operação definida por

(g1 , g2 ) · (g1′ , g2′ ) := (g1 · g1′ , g2 · σ(g1 )(g2′ )).


σ 1 2

Definição 23. Um espaço métrico é um par (M, d) onde M é um conjunto e d é uma métrica 1 em M.
Sejam M, N espaços métricos. Uma transformação f : M → N é chamada uma imersão isométrica
quando d(f (x), f (y)) = d(x, y) para quaisquer x, y ∈ M, ou seja, f preserva distâncias. Segue da
definição que uma imersão isométrica é sempre injetora. Uma isometria é uma imersão isométrica
sobrejetora.
Os conceitos relacionados de ação de grupo sobre conjunto, órbita e estabilizadores são centrais
no desenvolvimento que segue. Um grupo G atua sobre um conjunto X (via transformações) se para
todo (g, x) ∈ G × X está associado um elemento g(x) ∈ X tal que

1. ação transitiva: g(h(x)) = (gh)(x) para todos g, h ∈ G e x ∈ X.

2. identidade: e(x) = x para todo x ∈ X e e a identidade de G.

Esses elementos nos permitem definir uma relação de equivalência ∼ sobre X dada por x ∼ y se, e
somente se, y = g(x) para algum g ∈ G. Uma classe de equivalência sobre ∼ é chamada de órbita ,
sendo dada, para x ∈ X, por G(x) = {y ∈ X | y = g(x), para algum g ∈ G}. O conjunto quociente
1
Uma função d : M × M → R, que para quaisquer x, y, z ∈ M satisfaz as condições: (1) d(x, x) = 0; (2) se x 6= y
então d(x, y) > 0; (3) d(x, y) = d(y, x); (4) d(x, z) ≤ d(x, y) + d(y, z).
4.2 O Plano Hiperbólico 89

X/ ∼ ou X/G é chamado de conjunto de órbitas de X sobre ação de G . Para cada x ∈ X, o


conjunto Gx = {g ∈ G | g(x) = x} é um subgrupo de G chamado estabilizador de x.
Dado um espaço métrico M e X ⊂ M, dizemos que X é um subconjunto discreto quando o
subespaço X (métrica induzida) é discreto, ou seja, para todo a ∈ X existe uma bola aberta B(a; r)
com raio r > 0 em torno de a tal que B(a; r) ∩ X = {a} [27].

4.2 O Plano Hiperbólico


O estudo do plano hiperbólico pode ser realizado pelo emprego de diferentes modelos. Entre os mais
conhecidos temos o modelo do semiplano superior ou plano de Lobatchevski, denotado por H2 , o
modelo do disco unitário ou disco de Poincaré, denotado por D2 , e o modelo do disco projetivo ou
de Klein, denotado por P2 . Esses modelos se interrelacionam através de isometrias, o que permite
a extensão dos resultados obtidos considerando-se qualquer um deles para os demais. Portanto, a
escolha de um modelo especı́fico deve-se a conveniência que esse proporciona para realização do es-
tudo pretendido. De forma geral, o modelo H2 é preferencialmente empregado em análises algébrica,
enquanto o modelo D2 em análises geométricas.
Quanto aos conceitos básicos de geometria hiperbólica e grupos discretos, nossa abordagem é
expositiva. Sendo nosso objetivo a apresentação dos conceitos algébricos, geométricos e topológicos
relevantes, identificando como estes se relacionam. Para uma abordagem dedutiva, que deriva a
geométrica hiperbólica planar a partir de conceitos básicos e premissas estruturais, sugerimos [28,
29], complementados por [30, 31].
O semiplano superior é formado pelos pontos H2 = {z = x + iy | Im(z) > 0}, decorrendo que
∂H2 = R∪{∞}. O espaço H2 é dotado com a métrica hiperbólica (4.1) expressa através do elemento
diferencial ds, onde z = x + iy.
p
|ds| dx2 + dy 2
ds = = (4.1)
Im(z) y

Portanto, dado I = [0, 1] e γ : I → H2 um caminho diferenciável por partes γ = {z(t) = x(t) +


iy(t) ∈ H2 | t ∈ I}, podemos determinar o comprimento hiperbólico h(γ) de γ através da integral
q
Z 1 ( dx
dt
)2 + ( dy
dt
)2 Z 1
| dz |
dt
h(γ) = dt = dt,
0 y(t) 0 y(t)

permitindo-nos determinar as geodésicas do plano hiperbólico (curvas de menor comprimento com


relação a métrica) como as curvas que minimizam a comprimento hiperbólico h(·) entre quaisquer de
90 Geometria Hiperbólica

γ4 γ2
γ1 α
b

γ3

Figura 4.1: Exemplo de geodésicas em H2 .

seus pontos. Portanto, a distância hiperbólica dH2 (z, w) entre dois pontos z, w ∈ H2 é definido em
(4.2), para todo caminho γ de z para w.

dH2 (z, w) = inf h(γ) (4.2)

De maneira alternativa, podemos determinar a métrica hiperbólica através da expressão algébrica


dH2 (z, w) = log |z− w̄|+|z−w|
|z−w̄|−|z−w|
. Por fim, o par (H2 , dH2 ) constitui um espaço métrico. Em H2 são
geodésicas os semicı́rculos e semi-retas ortogonais a ∂H2 , como exemplificado na Figura 4.1, onde
fica evidente que, ao contrário da geometria euclidiana, é possı́vel termos duas geodésicas distintas γ1
e γ2 passando por um mesmo ponto α, paralelas a uma terceira geodésica γ3 . De fato, podemos dada
uma geodésica qualquer γ e um ponto α fora desta, temos infinitas geodésicas paralelas a γ passando
por α.

O disco unitário é formado pelos pontos D2 = {z ∈ C | |z| < 1}, decorrendo que ∂D2 =
{z ∈ C | |z| = 1}. Como dito, os modelos D2 e H2 encontram-se relacionados através de um
homeomorfismo f (z) : H2 → D2 , apresentado em (4.3).

iz + 1
f (z) = (4.3)
z+i

O mapeamento f (z) é uma isometria, a distância entre w1 , w2 ∈ D2 pode ser estabelecida a partir da
iz+1 −iw+1
distância já conhecida entre f −1 (w1 ), f −1(w2 ) ∈ H2 . Para w = f (z) = z+i
temos que z = w−i
,
seguindo a determinação da distância em D2 como apresentado em (4.4).

|dz|
= d −iw+1 Im −iw+1
 
Im(z) w−i w−i
−2dw
 (1−iw)(w̄−ī)
= (w−i) 2 Im (w−i)(w̄−ī)
(4.4)
|2dw| 
= |w−i|2 Im (1−iw)( w̄+i)
|w−i|2
|2dw|
= (1−|w|2 )
.
4.2 O Plano Hiperbólico 91

D2

Figura 4.2: Exemplo de geodésicas em D2 .

Ficando estabelecido o espaço métrico (D2 , dD2 ), com métrica especificada pelo elemento diferencial
derivado em (4.4). Neste modelo as geodésicas são arcos de cı́rculos ortogonais a ∂D2 e os diâmetros
de D2 , como apresentado na Figura 4.2. Munidos com as métrica dD2 (dH2 ), observamos que a
distância entre qualquer ponto em D2 (H2 ) e um ponto sobre o bordo ∂D2 (∂H2 ) é infinita. Logo, os
pontos do bordo são ditos pontos no infinito. De forma equivalente
 aodo modelo H2 , a distância em
|1−z w̄|+|z−w|
D2 pode ser expressa algebricamente por dD2 (z, w) = ln |1−z w̄|−|z−w|
.
Dado um subconjunto A ⊂ H2 , a área hiperbólica µ(A) de A é dada pela integral (4.5), sempre
que esta existir, onde z = x + iy.
dxdy
Z
µ(A) = . (4.5)
A y2
Empregando (4.3) pode-se demonstrar que para o modelo D2 a área hiperbólica é dada por (4.6), onde
agora A ⊂ D2 e z = x + iy.
4 dxdy
Z
µ(A) = . (4.6)
A (1 − |z|2 )2
Uma diferença marcante entre a geometria hiperbólica e a euclidiana está relacionada a determinação
da área de polı́gonos. A definição de um polı́gono em qualquer uma destas geometrias é semelhante,
contudo a forma como a área pode ser determinada revela, mais uma vez, distinções fundamentais
entre estas geometrias. Inicialmente, consideremos a Definição 24.

Definição 24. Dada duas geodésicas que se interceptam em um ponto z ∈ H2 ∪ ∂H2 , o ângulo
hiperbólico entre elas é igual ao ângulo entre os vetores tangentes (no sentido euclidiano) no ponto
z. Na Figura 4.3 o ângulo θ entre os vetores tangentes às geodésicas γ1 e γ2 é igual ao ângulo
hiperbólico.

Um polı́gono hiperbólico com n arestas é uma região fechada em H2 ∪∂H2 (D2 ∪∂D2 ) delimitada
por n segmentos de geodésicas. Se duas geodésicas se interceptam em um ponto, este é denominado
um vértice do polı́gono. São permitidos vértices em ∂H2 (∂D2 ), contudo segmentos de ∂H2 (∂D2 ) não
podem pertencer ao polı́gono. Na Figura 4.4 são apresentados exemplos de triângulos em H2 ∪ ∂H2
e D2 , respectivamente. Possuı́mos elementos suficientes para enunciarmos o Teorema 44.
92 Geometria Hiperbólica

H2

θ
D2

Figura 4.3: Ângulo hiperbólico. Figura 4.4: Triângulos hiperbólicos.

Teorema 44. (Teorema de Gauss-Bonnet para triângulos hiperbólicos) Seja ∆ um triângulo hi-
perbólico com ângulos α, β, γ. Então,

µ(∆) = π − α − β − γ.

Podendo ser estendido para o caso de um polı́gono qualquer, resultando no Teorema 45.

Teorema 45. (Teorema de Gauss-Bonnet para polı́gonos hiperbólicos) Seja ∆ um polı́gono de n


lados com vértices v1 , . . . , vn e respectivos ângulos internos α1 , . . . , αn . Então,

µ(∆) = (n − 2)π − (α1 + · · · + αn ).

4.3 Grupo de Isometrias do Plano Hiperbólico


 
a b
Inicialmente consideremos o grupo de matrizes g = sobre R, que satisfazem det(g) =
c d
ab − bc = 1. Consideraremos, como é usual, tr(g) = a + d o traço da matriz g. Esse grupo é
chamado grupo especial linear , sendo denotado por SL(2, R). Além disso, sabemos que o conjunto
de transformações de Möbius γ : C → C da forma

az + b
γ(z) = , (4.7)
cz + d

onde a, b, c, d ∈ R e ad−cd = 1, formam um grupo cujo produto de duas transformações corresponde


ao produto das matrizes correspondentes e o elemento inverso corresponde a matriz inversa. Cada
transformação T realizada por equação da forma (4.7) pode ser representada por um par de matrizes
±g ∈ SL(2, R). Portanto, denomina-se por PSL(2, R) o grupo de transformações da forma (4.7)

isomorfo a SL(2, R) {±12 }, onde 12 é a matriz identidade 2 × 2. Essa relação é representada por

PSL(2, R) ≡ SL(2, R) {±12 } , com elemento identidade do grupo PSL(2, R) denominada por Id.
O traço continua sendo uma função bem definida para os elementos de PSL(2, R), observamos que
4.3 Grupo de Isometrias do Plano Hiperbólico 93

tr(−g) = −tr(g), permitindo-nos especificar

tr2 (T ) = tr2 (g) e Tr(T ) = |tr(g)|.

Ressaltamos que os elementos de PSL(2, R) podem ser interpretados como classes de equivalência
contendo transformações de Möbius ou matrizes em SL(2, R) que realizam a mesma transformação
az+b
em C. Portanto, PSL(2, R) contém todas as transformações ∆ da forma z → com a, b, c, d ∈
cz+d√
R e det(∆) > 0, uma vez que dividindo o numerador e denominador da transformação por ∆
obtém-se uma nova matriz com determinante unitário. Em particular, PSL(2, R) contém todas as
transformações da forma z → az + b (a, b ∈ R, a > 0), e da forma z → − z1 .
É um resultado bem conhecido que PSL(2, R) ⊂ Isom(H2 ), onde Isom(H2 ) representa o grupo de
isometrias de H2 . Contudo, apesar de só considerarmos em nosso desenvolvimento esse conjunto, ele
não perfaz todas as possı́veis isometrias de H2 . Consideremos uma extensão imediata dos conjuntos
anteriores, a saber, o grupo PS∗ L(2, R) = S∗ L(2, R) {±12 } onde S∗ L(2, R) é um grupo de matrizes

 
a b
reais g = com det(g) = ±1. Portanto, o grupo PS∗ L(2, R) contém o grupo PSL(2, R)
c d
como um subgrupo de ı́ndice dois. Dito isso, no Teorema 46 especificamos o conjunto de isometrias
de H2 .

Teorema 46. [30] O grupo Isom(H2 ) é gerado pelas transformações de Möbius (4.7) em PSL(2, R)
juntamente com a transformação z → −z̄, sendo isomorfo a PS∗ L(2, R). O grupo PSL(2, R) é o
subgrupo de Isom(H2 ) de ı́ndice dois.

A distinção expressa no Teorema 46 faz-se relevante quando analisamos a influencia na orientação


das imagens de curvas hiperbólicas pela ação das isometrias de H2 , logo também curvas hiperbólicas.
Neste contexto, denominamos uma transformação T : H2 → H2 conforme se ela preserva ângulos, e
anti-conforme se ela preserva o valor absoluto dos ângulos mas inverte a orientação (ou sinal).

Teorema 47. [30] Qualquer transformação em PSL(2, R) é conforme, enquanto qualquer transfor-
mação em PS∗ L(2, R)\PSL(2, R) é anti-conforme.
az+b
Como expresso no Teorema 46, consideremos a função φ(z) = −z̄ e o elemento T (z) = cz+d

−az̄+b
PSL(2, R), então T ◦ φ(z) = T (−z̄) = −cz̄+d
, observando que agora o determinante da matriz
associada a transformação T ◦ φ é dado por −ad + bc = −1. Permitindo-nos concluir que toda
az̄+b
transformação dada pela composição T ◦ φ, onde T ∈ PSL(2, R), é do tipo U(z) = cz̄+d
com
ad − bc = −1. Pode-se ver que φ gera um grupo isomorfo a Z2 , dado que φ ◦ φ = Id. Dessa
forma, o grupo das isometrias de PS∗ L(2, R) é isomorfo a PSL(2, R) × Z2 , onde σ(T ) = Id para
σ
todo T ∈ PSL(2, R).
94 Geometria Hiperbólica

As isometrias em D2 são obtidas daquelas em H2 por conjugação, empregando a isometria (4.3).


Considerando o caso das isometrias conformes, como demonstrado em [28], TD2 é uma isometria de
1
D2 se, e somente se, existe uma isometria TH2 de H2 satisfazendo TD2 (z) = 4
· f ◦ TH2 ◦ f −1 (z),
devendo assumir a forma apresentada em (4.8).

az + b
TD2 (z) = , a, b ∈ C e |a|2 − |b|2 = 1. (4.8)
b̄z + ā

Há três tipos de elementos em PSL(2, R), distinguı́veis pelos valores do traço das isometrias associ-
az+b
adas, dados por Tr(T ) = |a + d|, onde T (z) = cz+d
.

(1) Isometria hiperbólica: Se Tr(T ) > 2, neste caso a matriz associada em SL(2, R) pode ser
 
λ 0
diagonalizável em R, sendo conjugada a uma matriz da forma , onde λ 6= 1. Equi-
0 1/λ
valentemente, é conjugada a uma transformação de Möbius da forma z 7→ kz, onde k > 0,
portanto, uma dilatação. A transformação T possui dois pontos fixos em ∂H2 ∪ {∞} (em ∂D2
para transformação conjugada sobre D2 ), um repulsor e outro atrator.

(2) Isometria elı́pticas: Se Tr(T ) < 2, neste caso a matriz associada em SL(2, R) é conjugada a
cos θ sin θ
 
uma matriz da forma . Equivalentemente, é conjugada a uma transformação de
− sin θ cos θ
Möbius sobre D2 da forma z 7→ zeiθ , portanto, uma rotação em torno da origem por um ângulo θ.
A transformação T possui um par de pontos complexos conjugados fixos, dessa forma um ponto
fixo em H2 (em D2 para transformação conjugada sobre D2 ).

(3) Isometria parabólicas: Se Tr(T ) = 2, é interpretada com um caso intermediário entre o hi-
perbólico e elı́ptico, sendo conjugada a uma transformação de Möbius da forma z 7→ z + 1,
portanto, uma translação. A transformação T possui um ponto fixo em ∂H2 ∪ {∞} (em ∂D2 para
transformação conjugada sobre D2 ).

As propriedades dos diferentes tipos de isometrias com relação aos seus pontos fixos reserva co-
mentários quantitativos quanto ao comportamento geométrico decorrente da ação deles sobre H2 ou
D2 . Considerando γ uma isometria hiperbólica, como dois pontos sobre ∂H2 ou ∂D2 são fixados,
a geodésica que os têm como pontos terminais permanece inalterada pela ação de γ, pois a ação de
isometrias leva geodésicas em geodésicas e dois pontos definem uma única geodésica. Quando γ for
elı́ptica, teremos um único ponto fixo em H2 ou D2 , como o conjunto de geodésicas que passam por
este ponto é invariante pela ação de γ, as geodésicas desse conjunto são mapeadas entre si realizando
um movimento de rotação em torno do ponto. Quando γ é parabólica, neste caso as geodésicas com
4.4 Grupo Fuchsiano 95

um ponto fixo em um ponto em H2 ou D2 formam uma famı́lia invariante pela ação de γ, onde um
dos extremos permanece fixo enquanto o outro é deslocado sobre pontos distintos do bordo.
 
a b
Consideremos uma transformação T (z) = em PSL(2, R). Com T ′ (z) = (cz + d)−2 ,
c d
as medidas euclidianas são multiplicadas por |T (z)| = |cz + d|−2. Neste caso, os comprimentos

euclidianos não são alterados no locus determinado pela equação algébrica |cz + d| = 1. No caso
em que c 6= 0, o locus é o cı́rculo |z + dc | = 1
|c|
com centro em − dc e raio 1
|c|
, denominado cı́rculo
isométrico . Representaremos o cı́rculo isométrico associado a uma transformação T por I(T ). O
Teorema 48 e o Teorema 49 apresentam fatos geométricos relevantes para o entendimento da ação de
T sobre H2 e D2 .

Teorema 48. [30] A transformação T expande comprimentos e áreas euclidianas no interior de I(T ),
e comprime-os fora deste.

Teorema 49. [30] Os cı́rculos isométricos I(T ) e I(T −1 ) possuem o mesmo raio, e I(T ) e mapeado
sobre I(T −1 ) pela transformação T .

Como todos os semi-cı́rculos em H2 com centros em ∂H2 são geodésicas hiperbólicas, podemos
concluir que os cı́rculos isométricos são, na verdade, geodésicas em H2 e em D2 .

4.4 Grupo Fuchsiano


Podemos induzir uma métrica no grupo de isometrias PSL(2, R), considerado como transformações
az+b
z → cz+d
, pela identificação destas transformações com pontos (a, b, c, d) ∈ R4 . Portanto, esta-
mos identificando PSL(2, R), como um espaço topológico, com o subconjunto de R4 que satisfaz a
restrição {(a, b, c, d) ∈ R4 | ad − bc = 1}. A norma sobre PSL(2, R) provém da norma no R4 como
especificado em (4.9). Seja

az + b 1
T (z) = ∈ PSL(2, R), então kT k = (a2 + b2 + c2 + d2 ) 2 . (4.9)
cz + d

Munido com a métrica d(T, S) = kT − Sk, consideramos PSL(2, R) como um grupo topológico.
De forma similar podemos associar uma métrica a Isom(H2 ), de forma que o grupo de isometrias
hiperbólicas também é um grupo topológico.

Definição 25. Um subgrupo Γ de Isom(H2 ) é chamado discreto se a topologia induzida sobre Γ é


uma topologia discreta, ou seja, se Γ é um conjunto discreto no espaço topológico Isom(H2 ).

Na Definição 26 apresentamos um dos conceitos centrais na teoria de superfı́cies geométricas com


métrica hiperbólica, considerada na Seção 4.5.
96 Geometria Hiperbólica

Definição 26. Um subgrupo discreto de Isom(H2 ) é dito fuchsiano se é composto por isometrias
conformes, ou seja, é um subgrupo discreto de PSL(2, R).
Subgrupos discretos de grupos de Lie2 são comumente ditos reticulados por analogia com os
reticulados no Rn que são grupos discretos de isometrias de Rn , tendo como propriedade importante
a ação descontı́nua sobre Rn , ou seja, todo ponto do Rn possui uma vizinhança que é mapeada fora
deste pelos elementos do reticulado, exceto a identidade. Como vimos, isometrias podem ter pontos
fixos, o que impede o cumprimento total destas condições. Contudo, os grupos de isometrias podem
satisfazer uma condição de descontinuidade mais fraca, como apresentado na Definição 27.
Definição 27. Um grupo G atua de forma propriamente descontı́nua sobre um espaço métrico X, se
a G-órbita de qualquer ponto x ∈ X é localmente finita, ou seja, a orbita G(x) é discreta sobre X e o
grupo de estabilizadores Gx de x é finito.
A partir da Definição 27, o Teorema 50 pode ser demonstrado empregando conceitos elementares
de espaços topológicos.
Teorema 50. [30] Um grupo G possui ação propriamente descontı́nua sobre um espaço topológico
X se, e somente se, cada ponto x ∈ X possui uma vizinhança V tal que

T (V ) ∩ V 6= ∅ só para um conjunto finito de elementos T ∈ G.

No Teorema 51 são estabelecidas as condições de necessidade e suficiência para que um subcon-


junto de PSL(2, R) seja fuchsiano.
Teorema 51. [30] Se Γ é um subgrupo de PSL(2, R), então Γ é um grupo fuchsiano se, e somente se,
a ação de Γ sobre H2 é propriamente descontı́nua.
Como consequência imediata dos resultados acima, um subgrupo Γ ⊂ PSL(2, R) atua de forma
propriamente descontı́nua sobre H2 se, e somente se, para todo z ∈ H2 a Γ-orbita de z por Γ é um
subconjunto discreto de H2 .
Definição 28. O conjunto de todos os pontos limites de Γ-orbitas Γz, z ∈ H2 , é chamado o conjunto
limite de Γ e denotado por Λ(Γ).
O conceito de conjunto limite é central para o entendimento dos processos de codificação aritméti-
ca do fluxo geodésico discutido nos próximos capı́tulos. Sendo empregado o fato que para todo
grupo fuchsiano Γ tem-se que Λ(Γ) ⊆ ∂H2 no modelo H2 , e Λ(Γ) ⊆ ∂D2 no modelo D2 . A seguir
apresentamos alguns resultados adicionais.
2
Como estamos tratando de espaços métricos, é suficiente o conceito de grupo metrizável , sendo um espaço métrico
G, munido de uma estrutura de grupo tal que as operações m : G × G → G, m(x, y) = x · y e f : G → G, f (x) = x−1 ,
são contı́nuas.
4.5 Superfı́cies Hiperbólicas e Regiões Fundamentais 97

Teorema 52. [30] O conjunto limite Λ(Γ) é Γ-invariante.

Teorema 53. [30] Se o conjunto limite Λ(Γ) contém mais que dois elementos, então

(1) Λ(Γ) = ∂D2 , ou

(2) Λ(Γ) é um subconjunto perfeito de ∂D2 denso em nenhuma parte3.

Esses resultados fundamentam a seguinte classificação dos conjuntos limites, temos especial in-
teresse em grupos fuchsianos do primeiro tipo.

1. Em um grupo fuchsiano de primeiro tipo , todo ponto em ∂D2 é um ponto limite.

2. Em um grupo fuchsiano de segundo tipo , os pontos limites são densos em nenhuma parte em ∂D2 .

4.5 Superfı́cies Hiperbólicas e Regiões Fundamentais


Uma superfı́cie hiperbólica S (assim como uma superfı́cie euclidiana) é um conjunto munido com
uma métrica dS , tal que, todo P ∈ S possui uma vizinhança isométrica a uma bola aberta em H2 . Essa
definição envolve diversos resultados relacionando a topologia e a geometria de superfı́cies. Particu-
larmente, o teorema de Killing-Hopf diz que toda superfı́cie geométrica (a qual pode ser associada
uma geometria) possui geometria euclidiana, hiperbólica ou esférica [28]. Essa geometria é herdada
do método de construção dessas superfı́cies, decorrendo do quociente K/ΓK do espaço de cobertura
K por um subgrupo de isometrias ΓK possuindo propriedades que garantam que o resultado do quo-
ciente é uma superfı́cie, onde K é R2 (plano euclidiano), H2 (plano hiperbólico) ou S2 (Esfera). Na
Definição 29 apresentamos um conceito instrumental para a construção de superfı́cies.

Definição 29. Uma identificação de arestas de um polı́gono hiperbólico Π é uma partição dos seus
ramos em pares {e, e′ } de igual comprimento hiperbólico (possivelmente infinito), com uma isometria
Te,e′ : e → e′ em PSL(2, R) para cada par. Esse conceito é formalmente estabelecido empregando
conceitos de geometria riemanniana [32, 33].

Os pontos w ∈ e e Te,e′ (w) = w ′ ∈ e′ são ditos identificados. Quando w é identificado com w ′


e w ′ com w ′′ , então w é também é dito identificado com w ′′ . Essa sequência de identificações pode
ocorrer com vértices , com um conjunto maximal de vértices identificados {v1 , . . . , vn } denominado
ciclo de vértices . Uma identificação de arestas de um polı́gono hiperbólico especifica um espaço de
identificação SΠ formado pelos pontos descritos a seguir.
3
Do inglês, nowhere dense.
98 Geometria Hiperbólica

1. Pontos internos u ∈ Π;

2. Pares de pontos {w, w ′} internos a arestas de Π;

3. Ciclos de vértices {v1 , . . . , vn } de Π em H2 .

No Teorema 54 é estabelecida a condição para que uma superfı́cie obtida pelo processo de identi-
ficação descrito acima seja uma superfı́cie hiperbólica. Seguiremos demonstrando quando um espaço
de identificação existe, como este está relacionado com o grupo de isometrias, culminando no Teo-
rema de Poincaré, que determina uma condição de necessidade e suficiência para que uma região de
identificação possa ser associada a uma superfı́cie geométrica.

Teorema 54. [28] O espaço de identificação S = SΠ possui uma métrica (concordando com a
métrica hiperbólica para regiões suficientemente pequenas no interior de Π), tornando-o uma su-
perfı́cie hiperbólica, quando a soma dos ângulos de um ciclo de vértices for igual a 2π.

Espaços de identificação, grupos de isometrias e superfı́cies geométricas relacionam-se através


do conceito de região fundamental, apresentado na Definição 30 em um contexto mais geral que o
hiperbólico.

Definição 30. Uma região fechada F ⊂ X (i.e. o fecho de um conjunto aberto F̊ , chamado interior
de F ) é definida como uma região fundamental para G se
S
1. T (F ) = X;
T ∈G

2. F̊ ∩ T (F̊ ) = ∅ para todo T ∈ G\{Id}.

O conjunto ∂F = F \F̊ é chamado fronteira de F , e a famı́lia {T (F ) | T ∈ G} é chamada


tesselação de X. Podemos fazer uso da ação propriamente descontı́nua de um grupo fuchsiano
sobre H2 como premissa para a determinação de uma região fundamental conectada e convexa para
esse. Formalizamos esta propriedade no Lema 55.

Lema 55. [30] Seja Γ um subgrupo de PSL(2, R) com ação propriamente descontı́nua sobre H2 ,
e p ∈ H2 um ponto fixo por algum elemento de Γ. Então há uma vizinhança W de p para a qual
nenhum outro ponto de W é fixado por um outro elemento de Γ que não a identidade.

Definição 31. Seja Γ um grupo fuchsiano arbitrário e p ∈ D2 não fixado por qualquer elemento de
Γ, a não ser a identidade, o que é factı́vel pelo Lema 55. Uma região de Dirichlet para um grupo
fuchsiano Γ, com centro em p é o conjunto

Dp (Γ) = {z ∈ H2 | dD2 (z, p) ≤ dD2 (z, T (p)) para todo T ∈ Γ}.


4.5 Superfı́cies Hiperbólicas e Regiões Fundamentais 99

Para cada T1 ∈ PSL(2, R), o conjunto apresentado em (4.10) é formado pelos pontos z mais
próximos ou com igual distância, em relação a métrica hiperbólica, de p com relação a T1 (p).

Pp (T1 ) = {z ∈ H2 | dD2 (z, p) ≤ dD2 (z, T1 (p))}. (4.10)

T
Como a Γ-órbita de p é discreta, temos que o conjunto Pp (Γ) = Pp (T ) possui área hiperbólica
T ∈Γ
positiva. Além disso, os conjuntos dD2 (z, p) = dD2 (T (z), p) são geodésicas que particionam H2 em
semiplanos hiperbólicos, um dos quais contém p. Portanto, Pp (Γ) é uma região hiperbólica conexa,
podendo ser observado por comparação que Pp (Γ) = Dp (Γ). O Teorema 56 estabelece a importância
das regiões Dp (Γ).

Teorema 56. [30] Se p não é um ponto fixo para qualquer elemento Γ\{Id}, então Dp (Γ) é uma
região fundamental conexa para Γ.

Os segmentos de geodésicas que formam a fronteira de Dp (Γ) são denominadas arestas , os


pontas de intersecção das arestas são denominados vértices . Quando um vértice é comum a arestas
não contidas em uma mesma geodésica, é dito ordinário . No caso em que um vértice v é comum
a arestas contidas em uma mesma geodésica, então v é dito singular , neste caso v é ponto fixo de
uma isometria elı́ptica de ordem dois. As regiões de Dirichlet podem assumir formas diversas, sendo
delimitadas por segmentos de geodésicas (em quantidade finita ou infinita) e de ∂D2 .

Definição 32. Uma região fundamental F para um grupo fuchsiano Γ é dita localmente finita se a
tesselação {T (F ) | T ∈ Γ} é localmente finita.

Ainda como consequência da propriedade de descontinuidade de um grupo fuchsiano, segue o


Teorema 57.

Teorema 57. [30] Uma região de Dirichlet é localmente finita.

Alguns pontos merecem destaque. Inicialmente, estabelecemos uma tesselação do espaço métrico
hiperbólico por regiões Dp (Γ) decorrentes da ação propriamente descontı́nua de isometrias (homeo-
morfismos conformes), portanto, formada por regiões hiperbolicamente iguais. Propriedades adicio-
nais decorrentes deste processo são apresentadas na Proposição 58.

Proposição 58. Seja Γ um grupo fuchsiano, p ∈ D2 que não é ponto fixo para qualquer Γ\{Id}, e
Dp (Γ) a região de Dirichlet associada.

1. Dado x ∈ ∂Dp (Γ), existe T ∈ Γ\{Id} tal que T (x) ∈ ∂Dp (Γ).

2. Dada uma aresta e ∈ Dp (Γ), existe uma única T ∈ Γ\{Id} tal que e = Dp (Γ) ∩ T (Dp (Γ)).
100 Geometria Hiperbólica

3. Temos que v é um vértice ordinário de Dp (Γ) se, e somente se, existem T, T ′ ∈ Γ\{Id} tais que
v = Dp (Γ) ∩ T (Dp (Γ)) ∩ T ′ (Dp (Γ)).

Obtemos da Proposição 58 (2)-(3) o processo de identificação de arestas para Dp (Γ). Como o


grupo Γ possui ação propriamente descontı́nua em D2 , sempre podemos determinar uma vizinhança
para p ∈ D̊p (Γ) isométrica a um aberto em D2 . Sempre que Dp (Γ) possuir um número finito de
arestas, podemos estender a métrica aos pontos da fronteira através de uma adequada definição dessa
na vizinhança desses pontos [28]. Tal extensão é realizada empregando-se o fato de que a cada
aresta e em Dp (Γ) podemos identificar unicamente uma outra e′ e um elemento T ∈ Γ\{Id} tal que
e = T (e′ ). Essa identificação induz uma relação de equivalência natural do conjunto de aresta, onde
cada classe de equivalência possui exatamente dois elementos.
Voltando a construção de superfı́cies geométricas, e agora sabendo que ∂Dp (Γ) é mapeado em
T (∂Dp (Γ)) para todo T ∈ Γ, e similarmente para o interior de Dp (Γ). Podemos definir uma relação
de equivalência em D2 , com classes de equivalência iguais as Γ-órbitas dos pontos de Dp (Γ). A
estrutura resultante é o espaço de identificação D2 /Γ com geometria herdada de D2 , onde a cada
ponto é associada uma Γ-órbita que contém, de maneira excludente, um ponto interior de Dp (Γ), dois
pontos em ∂Dp (Γ) ou vértices Γ-congruentes4 de Dp (Γ) (ciclo de vértices) .

Teorema 59. [30] Suponha Dp (Γ) é uma região de Dirichlet para Γ.

1. Sejam θ1 , θ2 , . . . , θt os ângulos internos de vértices Γ-congruentes de Dp (Γ). Seja m a ordem do



estabilizador em Γ de um desses vértices. Então, θ1 + · · · + θt = m
;

2. Seja {Ti } o subconjunto de Γ constituı́do pelos elementos que identificam lados de Dp (Γ). Então
{Ti } é um conjunto de geradores para Γ.

O conceito de Γ-congruência de vértices expõe propriedades de Γ que transcendem uma região


fundamental especı́fica, revelando propriedades algébricas (e geométricas induzidas) dos elementos
elı́pticos de Γ. Inicialmente, a Γ-congruência determina uma relação de equivalência no conjunto de
vértices da região fundamental, onde as classes de equivalências correspondem aos ciclos de vértices.
Se u ∈ D2 é fixado por um elemento elı́ptico de S, então v = T (u) é fixado pelo elemento elı́ptico
conjugado T ST −1. Portanto, se um vértice de um ciclo é fixado por um elemento elı́ptico, todos
os demais vértices do ciclo são fixados for elementos elı́pticos conjugados. Tais ciclos são ditos
ciclos elı́pticos e os vértices vértices elı́pticos . Como uma região de Dirichlet Dp (Γ) é uma região
fundamental, então todo ponto w ∈ D2 fixado por um elemento elı́ptico S ′ de Γ pertence a fronteira
de T (Dp (Γ)) para algum T ∈ Γ. Assim, u = T −1 (w) pertence a fronteira de Dp (Γ) e é fixado por
um elemento elı́ptico S = T −1 S ′ T . Empregando o Teorema 51, a ordem do elemento S deve ser
4
Dois pontos p, q ∈ D2 são Γ-congruentes se existe T ∈ Γ tal que p = T (q).
4.5 Superfı́cies Hiperbólicas e Regiões Fundamentais 101

finita, portanto, se um ponto possui um estabilizador não-trivial em Γ, este é um subgrupo cı́clico


finito maximal 5 de Γ. No outro sentido, todo subgrupo cı́clico finito maximal de Γ é o estabilizador
de um único ponto em D2 .

Teorema 60. [30] Há uma correspondência bijetiva entre os ciclos elı́pticos de Dp (Γ) e as classes
conjugadas de subgrupos cı́clicos finitos maximais não-triviais de Γ .

Definição 33. As ordens dos subgrupos cı́clicos finitos maximais não-conjugados de Γ são chamadas
perı́odos de Γ.

Colocados esses elementos iniciais quanto à relação entre propriedades algébricas de Γ e as pro-
priedades geométricas da tesselação associada, passaremos a verificar quais as consequências dessas
sobre a estrutura da superfı́cie hiperbólica associada.

Definição 34. Um grupo fuchsiano Γ é dito geometricamente finito se há uma região fundamental
convexa para Γ com número finito de lados.

Teorema 61. (Teorema de Siegel) Se Γ satisfaz µ(D2 /Γ) < ∞ então Γ é geometricamente finito.

Algumas denominações atribuı́das a um grupo fuchsiano refletem as propriedades topológicas in-


duzidas às superfı́cies obtidas pelo quociente D2 /Γ. Acima vimos como a propriedade algébrica da
tesselação influencia na cardinalidade dos subgrupos elı́pticos de Γ, agora veremos como a proprie-
dade algébrica dos elementos de Γ determina invariavelmente a propriedade topológica da superfı́cie
obtida a partir desse.

Definição 35. Um grupo fuchsiano Γ é dito co-compacto se o espaço quociente D2 /Γ é compacto.

Como apresentado no Teorema 62, a propriedade de co-compacticidade é um reflexo da estrutura


topológica de Dp (Γ), que por sua vez depende das propriedades algébricas de Γ. Podemos concluir
deste resultado que o espaço quociente D2 /Γ é compacto se, e somente se, a região Dp (Γ) é compacta.

Teorema 62. [30] Seja Γ um grupo fuchsiano com região de Dirichlet Dp (Γ).

1. Se Dp (Γ) é uma região compacta, então Γ não possui elementos parabólicos.

2. Se Dp (Γ) é uma região não-compacta, então o espaço quociente D2 /Γ não é compacto.

3. Se µ(Dp (Γ)) < ∞ mas Dp (Γ) é não-compacta, então Dp (Γ) possui pelo menos um vértice no
infinito.
5
Não há outro subgrupo cı́clico do qual ele seja subgrupo próprio.
102 Geometria Hiperbólica

Com relação a existência de elementos parabólicos em Γ, ainda temos.

Teorema 63. [30] Seja Γ um grupo fuchsiano com região não-compacta de Dirichlet Dp (Γ) satisfa-
zendo µ(Dp (Γ)) < ∞.

1. Cada vértice no infinito é o ponto fixo de uma transformação parabólica T ∈ Γ.

2. Se ξ é o ponto fixo de alguma transformação parabólica em Γ, então existe T ∈ Γ tal que T (ξ) ∈
∂Dp (Γ).

Nos próximos capı́tulos estaremos interessados em superfı́cies compactas, no Teorema 64 es-


tabelecemos a estrutura algébrica de Γ necessária e suficiente para nossa abordagem, obtida como
corolário dos Teorema 61, Teorema 62 e Teorema 63.

Teorema 64. [30] Um grupo fuchsiano Γ é co-compacto se, e somente se, µ(D2 /Γ) < ∞ e Γ não
possui elementos parabólicos.

Estabelecidos os elementos anteriores, consideremos F uma região fundamental compacta de Γ.


Portanto, pode ser demonstrado que F possui um número finito de lados, consequentemente com um
número finito de vértices e ciclos elı́pticos, com perı́odos m1 , m2 , . . . , mt associados a estes. Desta
forma, o espaço quociente D2 /Γ é uma superfı́cie compacta e orientada de gênero g , sendo esse
um invariante topológico da superfı́cie correspondendo ao número de “argolas” que compõem sua
representação gráfica. Neste caso, Γ possui assinatura (g; m1 , m2 , . . . , mt ).

Teorema 65. [30] Seja Γ um grupo fuchsiano com região fundamental compacta, possuindo assina-
tura (g; m1 , m2 , . . . , mt ). Então
 t  
2
X 1
µ(D /Γ) = 2π (2g − 2) + 1− .
i=1
m i

A implicação reversa do Teorema 65, atribuı́da a Poincaré, possibilita a verificação da existência


de uma dada região fundamental, especificada pelos seus perı́odos, associada a uma superfı́cie carac-
terizada pelo seu gênero.

Teorema 66. (Teorema de Poincaré) Se g ≥ 0, t ≥ 0 e mi ≥ 2 (1 ≤ i ≤ t) são inteiros satisfazendo

t  
X 1
(2g − 2) + 1− > 0,
i=1
mi

então há um grupo fuchsiano com assinatura (g; m1, m2 , . . . , mt ).


4.5 Superfı́cies Hiperbólicas e Regiões Fundamentais 103

v5
b

v6
b

b
v4

g3 g1

v7 b
g2
b v3

b
g4
v8 b
v2
b

v1

Figura 4.5: Tesselação {8, 4}, mostrando a identificação de arestas realizada pelos geradores.

Consideremos alguns dos conceitos apresentados através de um exemplo. Inicialmente, empre-


garemos a nomenclatura {p, q} para descrever uma tesselação formada por polı́gonos regulares com
p arestas, com vértices recobertos por q polı́gonos hiperbólicos idênticos. Na Figura 4.5 apresen-
tamos uma tesselação {8, 4}, onde destacamos os vértices vi e os geradores gi . Através de um
processo de projeção (empregando geradores) e reflexão (denotado por ∗) de arestas em torno de
vértices podemos determinar os ciclos de vértices. Como exemplo, seja s1 a aresta delimitada
pelos vértices v1 e v2 , considerando uma nomenclatura similar para as demais arestas, obtemos
g1 ∗ g3 1∗ g −1 4 ∗ g −1
(v1 , s1 ) −→ (v6 , s5 ) −→ (v6 , s6 ) −→ (v5 , s4 ) −→ (v5 , s5 ) −→ (v2 , s1 ) −→ (v2 , s2 ) −→ (v1 , s8 ),
resultando no ciclo de vértices {v1 , v6 , v5 , v2 }. Nesse processo F é rotacionado em torno de v1 , por
geradores de Γ, até retornar a sua posição original. Portanto, a sequência de transformações realiza-
das é igual a identidade, ou seja, g4−1 g1−1 g3 g1 = Id. De forma similar, podemos obter os ciclos de
vértices {v7 , v4 } e {v8 , v3 }, contudo a sequência de geradores resulta em um elemento elı́ptico de Γ
ao invés de uma relação equivalente a identidade.
Na Figura 4.6 enfatizamos a ação transitiva dos geradores de Γ sobre a tesselação, com a cor-
respondente translação de uma região fundamental indicada. Esses rótulos não foram atribuı́dos
aleatoriamente, eles representam uma “possı́vel” sequência de ações dos geradores sobre D2 , que
resulta no deslocamento de uma região da periferia para a região central de D. Observamos que todas
essas ações não alteram a percepção do espaço de alguém que encontra-se nele, já que se trata de
isometrias. Considerando a região g2 g3−1F transladada, observamos que a sequência de geradores
que empregamos para desloca-la para o centro do disco é igual ao inverso (algébrico) da sequência de
104 Geometria Hiperbólica

g3 g1 F
g1 F
g1 ḡ4 F g3 F
g2 ḡ3 F

ḡ3 F ḡ2
g2 F

ḡ3 g2 F
g3
F g4 ḡ2 F

ḡ2 F
g4 F

ḡ2 g4 F
g4 ḡ1 F
ḡ4 F
ḡ1 F
ḡ4 ḡ1 F

Figura 4.6: Tesselação {8, 4}, mostrando ação transitiva de Γ, onde ḡ = g −1 .

geradores que antecede o rótulo, ou seja, g3 g2−1. No entanto, há infinitas possibilidades para realizar-
mos essa translação, contudo a que exemplificamos é a mı́nima, em termos do número de geradores
empregados. Como observação adicional, percebemos a redução exponencial da área euclidiana das
imagens de F quando essas aproximam-se da fronteira de D2 . Esse fenômeno é essencial no processo
de codificação aritmética do fluxo geodésico, juntamente com o fato das topologias induzidas pelas
métricas euclidiana e hiperbólica serem a mesma [30]. Estes conceitos ajudam no entendimento dos
métodos de codificação aritmético e geométrico apresentados no Capı́tulo 5.
Capı́tulo 5

Códigos Geodésicos

O Fluxo geodésico sobre uma variedades riemanniana de curvatura seccional negativa está entre os
exemplos mais difundidos de comportamento caótico de um sistema dinâmico, para o qual a dinâmica
simbólica está entre as ferramentas mais importantes para o estudo [10, 34, 35]. Como esse exemplo
envolve um objeto matemático, dispomos para sua análise de ferramentas e métodos analı́ticos de
natureza algébrica, geométrica e topológica que nos permitem inferir sobre sua estrutura (elementos
estáticos, e.g. topologia) e comportamento (elementos dinâmicos, e.g. fluxo geodésico). Acredita-
mos que as variedades riemannianas possam servir de arquétipo para o desenvolvimento de métodos
analı́ticos para o estudo e aplicação de sistemas dinâmicos com comportamento caótico. Tendo como
interesse principal aqueles cujas caracterı́sticas fı́sicas e comportamento possam ser aplicados à sis-
temas de comunicação [36, 37, 38].

Devido a caracterı́sticas como custo, confiabilidade e flexibilidade, sistemas de eventos discretos


(entre os quais os digitais) despontam entre os mais importantes pela massiva aplicação tecnológica
que se faz desses. Para identifica-los a variedades riemannianas, precisamos determinar um método de
relacionar a natureza discreta destes sistemas com o comportamento contı́nuo das variedades. Como
meio para efetivar essa conexão, propomos o emprego de códigos do fluxo geodésico. Nesse capı́tulo
apresentamos a motivação e objetivos para o estudo destes códigos. Comentamos as principais clas-
ses de códigos propostos na literatura (geométricos e aritmético). Apresentamos e relacionamos tais
métodos empregando a abordagem apresentada em [8]. Como um caso particular, introduzimos o
código aritmético apresentado em [9], baseado em uma extensão do particionamento empregado em
processos generalizados de codificação aritmética do fluxo geodésico em D2 , aplicando-os para o
“estudo de caso” onde determinamos as propriedades das sequências código do fluxo geodésico de
uma superfı́cie hiperbólica obtida a partir da tesselação {8g − 4, 4}. Na exposição que segue, empre-
garemos ā para representar o inverso de um elemento a de um grupo fuchsiano, ou seja, ā = a−1 .

105
106 Códigos Geodésicos

5.1 Conceitos Preliminares

A geometria riemanniana nos mune com ferramentas que permite-nos estender os conceitos de dife-
renciação, tı́picos de espaços euclidianos, para estruturas denominadas de variedades contı́nuas. As
superfı́cies hiperbólicas que abordamos pertencem a esse conjunto, sendo variedades bidimensionais
com curvatura negativa. A estrutura adicionada às variedades riemannianas que permite essa extensão
é a de fibrado tangente, sendo o espaço natural de se trabalhar quando tratamos de questões que
envolvam “posição” e “velocidade”.

Aqui introduziremos a ideia que possibilite-nos apreciar o conceito de fibrado tangente. Inici-
almente, consideremos um ponto p ∈ M, onde M é uma superfı́cie riemanniana diferenciável ou
variedade diferenciável bidimensional1[32]. Uma parametrização em torno de p é definido como
o par (Uα , xα ), onde Uα ⊂ R2 é um aberto e xα uma aplicação biunı́voca de Uα sobre M, ou
seja, xα : Uα ⊂ R2 → M, satisfazendo p ∈ xα (Uα ). Dada qualquer outra parametrização
xβ : Uβ ⊂ R2 → M em torno de p, para o conjunto xα (Uα ) ∩ xβ (Uβ ) = W 6= ∅ em M, temos
que xα −1 (W ) e xβ −1 (W ) são abertos em R2 e a aplicação xβ −1 ◦ xα é um difeomorfimo2. O par
(Uα , xα ) também é chamado de um sistema de coordenadas de M em p, com xα (Uα ) sendo uma
vizinhança coordenada em p. Observadas algumas condições quanto a extensão por uma famı́lia
{(Uα , xα )} de parametrizações satisfazendo
[
xα (Uα ) = M,
α

esta é dita uma estrutura diferenciável em M. Consideremos uma curva α : (−ǫ, ǫ) → M dife-
renciável em M. Suponhamos que α(0) = p ∈ M, e seja D o conjunto das funções de M dife-
renciáveis em p. O vetor tangente à curva α em t = 0 é a função α′ (0) : D → R dada por

d(f ◦ α)
α′ (0)(f ) = , f ∈ D.
dt t=0

Um vetor tangente em p é o vetor tangente em t = 0 de alguma curva α : (−ǫ, ǫ) → M com


α(0) = p. O conjunto de todos estes vetores tangentes é denotado por Tp M, chamado de espaço
tangente. Dada uma parametrização x : U → M, podemos obter uma “projeção” de α sobre R2 por
x−1 ◦α(t) = x1 (t), x2 (t) , permitindo-nos definir a relação x(0) = p. Empregando esses elementos,


1
Poderı́amos considerar uma dimensão qualquer, mas não precisamos desse grau de generalidade.
2
Um homeomorfismo diferenciável, função bijetiva e contı́nuo com inversa também contı́nua, ambas diferenciáveis.
5.1 Conceitos Preliminares 107

η
us+t

F
t

us

Figura 5.1: Fluxo geodésico sobre D2 .

pode-se demonstrar que a função α′ é dada por (5.1).


   
′ ∂ ∂
α (0) = x′1 (0) + x′2 (0) , (5.1)
∂x1 0 ∂x2 0

∂ ∂
 
onde ∂x1 0
e são os vetores tangentes em p às curvas coordenadas x1 → x(x1 , 0) e x2 →
∂x2 0
x(0, x2 ), respectivamente. Portanto, ∂x∂ 1 0 , ∂x∂ 2 0 forma uma base em Tp M. Dada uma variedade
  

diferenciável o conjunto T M = {(p, v)|p ∈ M, v ∈ Tp M} é denominado fibrado tangente de


M, sendo formado por todas as associações possı́veis de pontos sobre M aos respectivos espaços
tangentes Tp M. O fibrado tangente é dito unitário quando restringimo-o ao conjunto de vetores
tangentes com norma unitária, com relação a norma induzida pela métrica riemanniana da superfı́cie
M.
Seja SD2 o fibrado tangente unitário de D2 . O fluxo geodésico {ϕ̃t } sobre D2 é definido como a
ação de R sobre o fibrado tangente unitário SD2 cujo locus gerado pelo deslocamento com velocidade
unitária de um vetor tangente unitário entre os pontos p, q ∈ D2 é o segmento de geodésica entre p
e q, ou seja, é a curva de menor comprimento entre p e q. Um exemplo do fluxo de um elemento
do fibrado em D2 é apresentada na Figura 5.1, onde o vetor ϕ̃s (u) = us percorre o segmento de
geodésica interno a região F em um intervalo hiperbólico t, resultando no vetor ϕ̃s+t (u) = us+t .
Consideraremos M como uma superfı́cie bem comportada, pelo menos em quase todos os seus
pontos3. Nesse caso, considerando que M = D2 /Γ, o grupo fuchsiano Γ induz uma projeção na-
3
Podendo conter pontos ausentes, decorrentes de vértices de F fixados por elementos elı́pticos de Γ.
108 Códigos Geodésicos

7
8 6
g1
9 5
F
10 4

γ1
γ2 6
11 3 5 8 7
9 3 1
12 2 11
1 10 12 γ4
4 2
M γ3

Figura 5.2: Região fundamental. Figura 5.3: Curvas fechadas em M.

tural (contı́nua e aberta) π : D2 → D2 /Γ, sendo os pontos de M as Γ-órbitas de pontos de D2 4 .


Ainda podemos estender π, projetando SD2 em SM. Além disso, o bordo ∂F da região fundamen-
tal F é projetado em curvas fechadas γi em M. Na Figura 5.3 mostramos as curvas γi decorrentes
da projeção de ∂F sobre M, com F e os respectivas identificações de arrestas gi apresentadas na
Figura 5.2. Naturalmente, o fluxo geodésico em SD2 possui seu equivalente em SM pela projeção
natural. Contudo, esse fluxo geodésico é contı́nuo, como comentamos, ele é parametrizado por R,
decorrendo da ação desse sobre SD2 . Assim, com o processo de codificação do fluxo geodésico pre-
cisamos estabelecer um método de “discretização”, através do qual possamos defini-lo como ação de
Z sobre SM e não mais de R sobre SM. Em seguida devemos “quantificar” a sequência discreta,
de forma que possamos representa-lo por sequências bi-infinitas sobre um alfabeto finito. Por fim,
o sistema dinâmico simbólico resultante deve ser completo e a dinâmica no espaço de sequências
bi-infinitas deve refletir a dinâmica do fluxo geodésico.
O processo de discretização é obtido pela determinação de uma seção transversal para o fluxo
SM, sendo essa um subconjunto de SM que é interceptada pelo fluxo geodésico indefinidamente,
ou seja, para valores arbitrariamente grandes do parâmetro R (positivos e negativos). Referindo-nos
à Figura 5.3, a seção transversal C é formada por elementos (p, v) ∈ SM, onde p é um ponto
pertencente a uma das curvas fechadas γi e o vetor unitário v não é tangente a γi . Quando o par (p, v)
for mapeado na região F pelo inverso π −1 , então p será mapeado em um ponto p′ ∈ ∂F e v em um
vetor v ′ sobre p′ que aponta para fora de F , no caso da Figura 5.1 o vetor us+t é determinado pela
restrição de π −1 à seção transversal [39, 9, 34]. Agora nosso fluxo geodésico contı́nuo é reduzido
a uma sequência de eventos discretos com dinâmica determinada pelo mapa da seção transversal,
representado por TC : C → C tal que TC (π(us+t)) = π(u′′ ), fazendo referência à Figura 5.4. Os
4
Com essa interpretação M recebe a denominação de orbifold, ou espaço das órbitas.
5.1 Conceitos Preliminares 109

g3 g1 F
g1 F
g1 ḡ4 F g3 F
u′′ g2 ḡ3 F

ḡ3 F
us+t
g2 F

ḡ3 g2 F

u′
F g4 ḡ2 F

ḡ2 F g4 F
us
ḡ2 g4 F
g4 ḡ1 F
ḡ4 F
ḡ1 F
ḡ4 ḡ1 F

Figura 5.4: Codificação do fluxo geodésico.

vetores π(us+t ) e π(u′′) são elementos de C interceptados sucessivamente pelo fluxo geodésico em
SM. Em D2 , temos que ḡ2 us+t = u′ , sendo que u′ define unicamente uma geodésica e, portanto, o
vetor u′′ .
Com o emprego da seção transversal, temos uma forma de “capturar” a dinâmica do nosso fluxo
geodésico através de um sistema discreto de eventos. Contudo, o valor assumido em cada instante de
tempo ainda é não enumerável. Nosso próximo passo consiste em determinar um particionamento fi-
nito de C (que induzirá nossa quantização) que, apesar da perda de detalhamento, nos permitirá inferir
sobre as caracterı́sticas do fluxo geodésico através do locus (ou geodésica) gerado pelo deslocamento
dos vetores em SD2 ou SM. A descrição do processo de codificação fica mais clara quando consi-
deramos o fluxo em SD2 . O código é determinado pela sequência de sı́mbolos definida pelo mapa
de retorno, especificado pelo gerador de Γ cuja ação sobre (p, v) ∈ SD2 , onde p ∈ ∂F e v aponta
para fora de F , é o elemento (p′ , v ′ ) com p′ ∈ SD2 e v ′ apontando para dentro de F . Referindo-nos
à Figura 5.4, quando a geodésica definida por (ps , us ) intercepta ∂F em (ps+t , us+t), a ação de ḡ2
sobre SD2 e D2 gera as translações (ps+t , us+t ) → (p′ , u′) e g2 F → F , respectivamente. Neste caso
g2 é armazenado como um sı́mbolo de nossa sequência, e a operação é repetida para a geração dos
sı́mbolos subsequentes.
Esse processo de codificação é conhecido como codificação geométrica (método de codificação
de Koebe-Morse), possuindo estreita relação com a geometria da região fundamental e superfı́cie
associada. O processo de codificação também pode ser realizado de forma aritmética (método de
codificação de Artin), empregando métodos generalizados de expansão dos pontos terminais da
110 Códigos Geodésicos

P1 P2

ā a b̄ b

Figura 5.5: Esfera com três buracos.

geodésica (ou pontos limites da geodésica sobre ∂D2 ), de forma similar a expansões n-árias e em
frações contı́nuas, essa última relacionada a processos de codificação do fluxo geodésico em H2
empregando a superfı́cie modular [35, 39]. Na próxima seção descreveremos esses processos de
codificação para uma superfı́cie em particular, cujas peculiaridades evidenciem propriedades e con-
ceitos necessários para posterior apresentação do método geral.

5.2 Códigos de Koebe-Morse e Artin: Estudo de caso


Peculiaridades e relações entre os métodos de codificação de Koebe-Morse e Artin tornam-se mais
claras quando ressaltadas por um caso ilustrativo. Este é o papel exercido pela esfera com três bu-
racos apresentada na Figura 5.5, indicada aqui como a superfı́cie M. A estrutura topológica desta
superfı́cie, juntamente com as propriedades da cobertura associada em D2 , exemplifica os métodos e
os elementos conceituais envolvidos no processo. Como particularidade desse caso, os métodos de
codificação de Koebe-Morse e Artin coincidem, o que não é válido para o caso geral, abordado na
Seção 5.3. O método que esse exemplo procura evidenciar, é a representação do fluxo geodésico em
SM (associado às sequências cortantes, relacionadas a topologia da superfı́cie) através de um fluxo
especial sobre um ssf (relacionado ao processo de codificação aritmético).
Consideremos M∞ uma superfı́cie hiperbólica completa com três prolongamentos infinitos (ad
infinitum) e M a parte compacta de M∞ , delimitada pelas geodésicas fechadas unicamente determi-
nadas que isolam M dos prolongamentos. Qualquer geodésica que cortar uma destas curvas fechadas
perde-se no infinito através do prolongamento e, portanto, não retornam para a região compacta M.
Cortando M ao longo das linhas perpendiculares ao bordo P1 e P2 que conectam uma das curvas
fechadas as outras duas, obtêm-se a cobertura de M em D2 apresentada na Figura 5.6. Denotamos
5.2 Códigos de Koebe-Morse e Artin: Estudo de caso 111

R∞

a

R∞ ā a R b b̄ R∞


b

R∞

Figura 5.6: Cobertura de M em D2 .

por π o homeomorfismo D2 → M∞ , que também pode ser interpretado como uma projeção.
A região fechada R na Figura 5.6, que compõe a cobertura de M, é prolongada para a região
infinita R∞ que é projetada em M∞ através de π. Sem comprometimento da generalidade da análise,
podemos supor que 0 ∈ R. As linhas Pi são prolongadas para as linhas P̃i , que formam os lados da
região R∞ e são identificadas por isometrias a, b de D2 . Pode-se observar que o grupo Fuchsiano Γ
associado a R∞ não possui elementos elı́pticos, logo Γ é um grupo livre e pode ser presentado por
ha, b| i. As cópias de R que lhe são adjacentes são da forma eR, onde e ∈ Γ0 = {a, ā, b, b̄}. O lado
s comum a R e eR é rotulado por e no lado de eR, no lado de R ele recebe o rótulo ē. De forma
equivalente, o lado de s interior a R é rotulado pela isometria que o mapeia em outro lado de R.
Essa rotulação é estendida por translação através da aplicação de Γ sobre R∞ para a tesselação de D2
constituı́da pelas imagens de R∞ , como também induz uma rotulação nas linhas orientadas P1 e P2
sobre M.

5.2.1 O método de codificação de Koebe-Morse


Qualquer geodésica orientada γ em M intercepta repetidamente as linhas Pi . Como as linhas Pi
possuem um rótulo para cada um dos seus lados, pode-se atribuir uma orientação à intersecção. Re-
ferindo a Figura 5.5, a geodésica pode interceptar a linha P1 entrando no lado ā e saindo no lado
a, ou entrando no lado a e saindo no lado ā. Desta forma, à geodésica γ é associada a sequência
. . . e0 e1 e2 . . . , ei ∈ Γ0 , de rótulos dos lados das linhas Pi nos quais a geodésica saı́, na ordem em que
esse processo dinâmico ocorre. Estabelecendo-se e0 como a referência, sendo este o rótulo exterior
ao lado de R através do qual γ sai, entrando na região e0 R. De forma geral, ei é o rótulo exterior
112 Códigos Geodésicos

ao lado de e0 . . . ei−1 R através do qual γ sai, entrando na região e0 . . . ei−1 ei R. Essa é a sequência
cortante de γ. Portanto, quando analisado a partir da cobertura universal U ⊆ D2 de M, se um
arco direcionado α em U passa pela região R2 a partir da região R1 , possuindo sequência cortante
e1 . . . en , então R2 = e1 . . . en R1 . A sequência cortante de γ é infinita se, e somente se, γ está contida
em M, implicando que esta nunca intercepta ∂M. Pelo processo de construção, nota-se que em uma
sequência cortante não há fatores do tipo eē, e ∈ Γ0 , caso contrário γ interceptaria Pi duas vezes
seguidas em direções opostas, o que é impossı́vel. Sequências onde tais fatores não ocorrem são ditas
reduzidas.

5.2.2 O método de expansão do bordo

Associado ao método de codificação de Artin, este método requer a definição do processo de expansão
do bordo ∂D2 associado ao grupo Fuchsiano Γ. O que é feito para o caso particular de um toro
puncionado em [40]. Segue uma descrição similar, mas para o caso da esfera com três buracos. A
curva C(e) corresponde ao lado de R∞ cujo rótulo exterior é e, e ∈ Γ0 , sendo A(e) o arco sobre ∂D2
definido por C(e) associado ao semi-plano hiperbólico He (R∞ ) oposto ao qual encontra-se a região
R∞ . Define-se o mapeamento f : A → ∂D2 , f |A(e) (x) = ēx, onde A = {A(e) : e ∈ Γ0 } é o
S

domı́nio de f . Segue desta definição e das propriedades da cobertura U de M em D2 que qualquer


ponto ξ ∈ ∂D2 possui expansão finita ou infinita e0 e1 . . . , ei ∈ Γ0 , definido por f n (ξ) ∈ A(en ), n ≥
0, onde a sequência finda em en se, e somente se, f n (ξ) ∈ A mas f n+1 (ξ) ∈
/ A.
Como consequência das propriedades de Γ, obtêm-se que f (A(e)) ∩ A(ē) = ∅ para todo e ∈ Γ0 ,
do que segue que uma sequência obtida pelo método de expansão do bordo é reduzida. Por outro
lado, qualquer sequência reduzida e0 e1 . . . ocorre como a órbita de um ponto ∞ −n
T
n=1 f (A(en )), com
interseção não vazia, dado que f (A(e)) ⊃ A(e′ ) sempre que e′ 6= ē.
Para entendermos melhor a relação entre o método de codificação de Koebe-Morse e o de Artin,
para o caso particular da esfera com três buracos, analisemos as sequências código obtidas para um
arco de geodésica β conectando o ponto P ∈ R a ξ ∈ A. Seja e0 e1 . . . a sequência obtida pelo método
de Koebe-Morse e ξ0 ξ1 . . . pelo método de Artin aplicado ao ponto ξ. Inicialmente observa-se que β
deixa R através de C(ξ0 ), portanto ξ0 = e0 . Se considerarmos que ξi = ei , i ≤ n, então é possı́vel
provar por indução que os dois métodos geram a mesma sequência. Tomando a (n + 2)-ésima região
e0 e1 . . . en R que β intercepta, definido-se g = e0 e1 . . . en então ḡβ ∩ R 6= ∅, e a sequência cortante
de ḡβ a partir do ponto onde esta curva deixa R é en+1 en+2 . . .. Analisando pelo método de expansão
do bordo, têm-se que f i ξ ∈ A(ei ), i ≤ n, e portanto ḡξ = f n+1 (ξ), do que segue que f n+1(ξ) possui
expansão ξn+1 ξn+2 . . .. Ao aplicar-se o argumento original a ḡβ e ḡξ obtêm-se que en+1 = ξn+1 , o
que estabelece [8, Lema 2.1]. Este resultado nos diz que para o caso da esfera com três buracos a
5.2 Códigos de Koebe-Morse e Artin: Estudo de caso 113

sequência obtida por expansão do bordo para ξ é igual a sequência cortante para β. Decorre deste
fato que as conclusões decorrentes de um método podem ser estendidas para o outro, como será visto,
isto permite representar o fluxo geodésico em M associado ao conjunto de sequências cortantes, com
o ssf obtido pelo método de expansão do bordo.
Inicialmente, observamos que uma geodésica estende-se ao infinito, logo as geodésicas, que po-
dem ser identificadas unicamente através do processo de expansão do bordo, são aquelas que têm
os pontos limites no conjunto ∞ −n
S
n=0 f A. Pois, dada uma geodésica direcionada β, podemos de-
terminar unicamente a expansão dos seus pontos inicial e terminal, portanto determinamos a própria
geodésica. No entanto, tomando ξ como um ponto terminal de β e supondo que β∩R 6= ∅, caso ξ pos-
sua expansão do bordo infinita, ou seja, ξ ∈ ∞ −n
S
n=0 f A, segue do parágrafo acima que a sequência
cortante associada a β também é infinita, implicando que π(β) está integralmente contida na região
compacta M de M∞ e, portanto, mantem-se a uma distância limitada da órbita Γ0 do ponto 0 ∈ D2 ,
assim β converge para um ponto do conjunto limite Λ de Γ, segue que ∞ −n
S
n=0 f A ⊆ Λ. Além disso,
como Λ ⊂ A, se ξ ∈ Λ então f n ξ ∈ ΓΛ = Λ ⊂ A para todo n, uma vez que Λ é Γ-invariante. Por-
tanto, ξ ∈ ∞ −n
A. Fica assim estabelecido o resultado [8, Lema 2.2], a saber, Λ = ∞ −n
T T
n=0 f n=0 f A.
Isto permite estabelecer uma bijeção entre o espaço das sequências reduzidas infinitas Σ+ em Γ0 e o
conjunto limite de Γ, ou seja, há uma bijeção p+ : Σ+ → Λ que associa a cada ponto e0 e1 . . . ∈ Σ+ o
ponto ∞ −1
T
n=1 (e0 · · · en ) A(en+1 ). Como caracterı́stica adicional, as sequências obtidas por expansão
do bordo ou as sequências cortantes só possuem como restrição os fatores ef onde f = ē. Logo, o
conjunto de sequências Σ+ pode ser especificado por uma matriz adjacente M = (mef ), e, f ∈ Γ0 ,
com mef = 0 se f = ē e mef = 1 caso contrário. Isto implica que Σ+ é igual ao conjunto de
sequências (ei )∞
i=0 satisfazendo mei ei+1 = 1 para todo i ≥ 0 e, portanto, é um SF T (possui conjunto
de proibições irredutı́veis finito).

5.2.3 Representação do fluxo geodésico

O processo de representação de geodésica pelas sequências cortantes é claramente recorrente. As


geodésicas são codificadas pelas sequências ordenadas de sı́mbolos que são determinados pela in-
terseção recorrente da geodésica com a seção transversal especificada sobre a superfı́cie. Portanto, o
processo de codificação é gerado de forma recursiva baseado em um fenômeno de recorrência, além
disso só se aplica aos objetos que interceptam infinitamente a seção transversal. Estas propriedades
são um reflexo do objeto codificado, no caso, o fluxo geodésico. No entanto, o locus associado ao
fluxo geodésico são as geodésicas, consequentemente especificar um procedimento de codificação
para o primeiro se estende ao segundo. E as propriedades dinâmicas do fluxo geodésico terão seu
reflexo nas geodésicas associadas e nas sequências código geradas.
114 Códigos Geodésicos

Dados ξ, η ∈ ∂D2 , ξ 6= η, define-se γ = γ(ξ, η) como a geodésica orientada conectando ξ a η. Das


observações realizadas nos parágrafos acima, se γ ⊂ ΓR então os pontos sobre γ permanecem a uma
distância limitada de Γ0, consequentemente ξ, η ∈ Λ. Por outro lado, se supusermos que ξ, η ∈ Λ
S
teremos necessariamente que γ = g∈Γ (γ ∩ gR∞ ), portanto segue da Γ-invariância do conjunto Λ
que ao provar-se a relação γ ∩ R∞ ⊂ γ ∩ R fica estabelecido que γ está limitada a região compacta M
de M∞ . Ressaltamos que a Γ-invariância do conjunto Λ implica que a relação apresentada independe
da escolha da região R escolhida como referência. Referenciando a Figura 5.6, os arcos em ∂D2
delimitados pelas geodésicas cujas imagens por π formam o bordo de M não compõem o conjunto
Λ, consequentemente se ξ, η ∈ Λ têm-se necessariamente que γ ∩ R∞ ⊂ γ ∩ R. Um vetor unitário u
pertencente ao subconjunto recorrente (do inglês, non-wandering set) do fibrado associado ao fluxo
geodésico φt em M∞ se, e somente se, φt (u) retorna indefinidamente a uma distância limitada de
um vetor unitário fixo localizado em π(0). O que acontece se, e somente se, a geodésica definida
por u mantém-se a uma distância limitada de Γ0, e portanto possui pontos terminais no conjunto
Λ. Como sı́ntese destas observações, uma geodésica γ(ξ, η) possui pontos terminais ξ, η ∈ Λ se, e
somente se, γ ∈ ΓR, e além disso o conjunto recorrente do fibrado associado ao fluxo geodésico em
M corresponde ao conjunto de vetores unitários direcionados ao longo destas geodésicas. Fica assim
estabelecido o resultado [8, Lema 2.5].

Seja Σ o conjunto de sequências bi-infinitas reduzidas em Γ0 , com elementos descritos por . . . f1 f0


e0 e1 . . . , ei , fi ∈ Γ0 , onde e0 é interpretado como coordenada inicial. Podemos dispor de uma
representação análoga para geodésicas com pontos terminais em Λ, a saber, dados ξ, η ∈ Λ com
expansão do bordo ξ = ξ0 ξ1 . . . e η = η0 η1 . . ., escrevemos ξ ∗ η = . . . ξ¯1 ξ¯0 η0 η1 . . .. Definindo-se

A = {γ = γ(ξ, η) : ξ, η ∈ Λ and ξ ∗ η ∈ Σ},


R = {γ = γ(ξ, η) : ξ, η ∈ Λ and γ ∩ R 6= ∅}.

Fica claramente determinada uma bijeção p : Σ → A que associa a sequência . . . f1 f0 e0 e1 . . . a


geodésica γ = γ(p+ (f¯0 f¯1 . . .), p+ (e0 e1 . . .)). Como realizado acima, podemos descrever Σ através de
uma matriz adjacente, sendo Σ um SF T com mapa deslocamento σ : Σ → Σ que induz naturalmente
um mapa deslocamento, também denotado por σ, sobre A. Ao conjunto R também está associado
um mapeamento natural τ : R → R, dado por τ (γ) = ē0 γ, onde e0 é o primeiro termo da sequência
cortante de γ iniciando onde γ deixa a região R. Estas observações constituem o primeiro passo para
estabelecer a relação entre os métodos de codificação de Koebe-Morse e Artin para o caso da esfera
com três furos.

Observamos inicialmente que dados ξ, η ∈ Λ tal que ξ 6= η, a geodésica γ(ξ, η) pertence a A


se, e somente se, ξ0 6= η0 , uma vez que a sequências bi-infinita associada a esta geodésica deve
5.2 Códigos de Koebe-Morse e Artin: Estudo de caso 115

ser reduzida. Para o caso ξ0 = η0 , a geodésica γ(ξ, η) estaria contida integralmente no semi-plano
hiperbólico limitado por C(ξ0 ) no lado aposto àquele onde encontra-se a região R, assim γ ∈
/ R. Se
ξ0 6= η0 então γ ∩ R∞ 6= ∅, implicando que γ ∩ R 6= ∅ e, portanto, γ ∈ R. Fica assim estabelecido o
resultado [8, Teorema I0 ], a saber, A = R.
Seguindo com a determinação da relação entre estas estruturas, consideremos ξ ′ ∗ η ′ = σ(ξ ∗ η),
do que segue que η ′ = η1 η2 . . . e ξ ′ = η̄0 ξ0 ξ1 . . .. Como f (η) = η̄0 (η) possui expansão η1 η2 . . . e
f (ξ ′) = η0 (ξ ′ ) possui expansão ξ0 ξ1 . . ., têm-se que η ′ = η̄0 (η) e η0 (ξ ′ ) = ξ. Portanto, σ(ξ ∗ η)
corresponde a geodésica η̄0 (γ). Como as sequências cortantes e aquelas obtidas por expansão do
bordo são iguais, então e0 = η0 e, portanto, τ (γ) = ē0 γ = σ(γ). Fica assim estabelecido o resultado
[8, Teorema II0 ], a saber, τ = σ.

5.2.4 Aplicando os conceitos

Um fluxo geodésico φt corresponde a um fluxo sobre o fibrado SM de M. Neste contexto, o conjunto


recorrente V ⊂ SM é invariante, e a análise da ação do fluxo sobre este revela as propriedades de
ergodicidade da dinâmica, que constituem aquelas de maior interesse. Aplicando os resultados acima,
é possı́vel determinar uma representação do fluxo ψt = φt |V através de um ssf, em outras palavras,
uma representação simbólica do fluxo.
Referindo-nos a Figura 5.5, seja W o subconjunto de vetores de V sobre pontos nas linhas Pi .
Como vetores na direção de Pi não pertencem a V , então podemos empregar W como uma seção
transversal ao fluxo ψt . Como por um ponto z ∈ D2 , na direção de um vetor unitário u ∈ SD2 sobre
z passa uma única geodésica, podemos identificar os conjuntos R e W . Identificamos γ ∈ R com
a projeção em M do vetor unitário u(γ) tangente a γ no ponto onde γ entre em R. Dos resultados
apresentados, temos que R = A e que há uma bijeção de A com Σ, do que segue a identificação entre
os conjuntos W e Σ. No entanto, este mapeamento é mais que uma bijeção, podendo-se demonstrar
que ele respeita a dinâmica do sistema.
O mapa de retorno P : W → W pode ser estendido para o mapa P̂ sobre SD2 , de forma que
P̂ (u(γ)) = v(γ) onde v(γ) é o ponto onde γ ∈ R deixa a região R. O tempo transcorrido para
retornar para W é h(γ), que representa a distância hiperbólica de γ ∩ R. Considerando o mapa
já definido τ : R → R, dado por τ (γ) = ḡγ sempre que γ deixa a região R através de C(g).
Então, o vetor unitário tangente a geodésica ḡγ no ponto em que esta adentra a região R é ḡv(γ).
Agora, projetando estes vetores em W e realizando a identificação de W com R, obtêm-se a relação
P (γ) = τ (γ). Sabendo que τ = σ, concluı́mos que o sistema (W, P ) é conjugado ao sistema (Σ, σ).
Além disso, o fluxo determinado sobre (Σ, σ) considerando-se a função deslocamento h é conjugado
ao fluxo geodésico (V, ψ). Sendo o primeiro uma representação simples do segundo.
116 Códigos Geodésicos

Acima apresentamos o procedimento para determinação de uma representação simbólica simples


para o fluxo geodésico sobre uma superfı́cie. No entanto a análise foi restringida para o caso particular
de uma esfera com três furos. De forma análogo, é possı́vel determinar representações tão simples
quanto a obtida acima para casos mais gerais, ou seja, representar o fluxo geodésico através de um
ssf. Contudo, uma serie de detalhes adicionais devem ser considerados. É sobre a generalização do
resultado acima que concentra-se a maior parte do material apresentado nas próximas seções.

5.3 Codificação do Fluxo Geodésico


Apresentaremos os métodos de codificação do fluxo geodésico geométrico e aritmético, a aborda-
gem é geral e visa estabelecer os elementos que nos permita relaciona-los. Um aspecto a ressaltar
diz respeito a necessidade de dois métodos de codificação de natureza distinta, como também qual é
o objetivo dessa relação. Na Seção 5.2 pudemos associar biunivocamente a qualquer sequência bi-
infinita reduzida sobre os geradores de Γ uma geodésica em M. Portanto, a descrição do código do
fluxo geodésico fica caracterizado simplesmente pelos pares proibidos ḡg, g ∈ Γ0 , como decorrência
do grupo Γ ser livre. O exemplo da esfera com três buracos é um contraponto à complexidade do caso
geral, quando são consideradas regiões fundamentais com vértices em D2 . Para termos uma pers-
pectiva do grau dessa complexidade, mesmo para o grupo Γ = P SL(2, Z) com região fundamental
tı́pica
1
F = {z ∈ H2 | |z| ≥ 1, |Re(z)| ≤ },
2
o ssf obtido pelo método de Koebe-Morse não é regular, não sendo possı́vel representa-lo através de
um grafo ou autômato [41]. A expectativa com relação ao caso geral não é diferente [35].
A intensão inicial de associarmos às sequências código uma topologia possui na constatação
acima um primeiro obstáculo. Para contorná-lo empregaremos os códigos aritméticos. Ao contrário
dos geométricos, o código obtido com o método de codificação aritmética é um fator de um SFT,
logo é um ssr. A despeito da possı́vel complexidade para determinação de uma representação para
esse ssr (tratado no próximo capı́tulo), comparando-o com o ssf gerado pelo código geométrico, po-
demos especificar meios de representar parcialmente esse último, ou seja, um subconjunto do código
geométrico. Para relacionar e descrever esses métodos de codificação, empregaremos a abordagem
apresentada em [8, 39].

5.3.1 Determinando uma região fundamental apropriada


Ao considerarmos na Seção 5.2 uma região fundamental R sem vértices em D2 , foi possı́vel relaci-
onar os códigos geométrico e algébrico do fluxo geodésico através de uma identidade, ou seja, os
5.3 Codificação do Fluxo Geodésico 117

códigos coincidem e são iguais ao conjunto de sequências reduzidas sobre os geradores do grupo
fuchsiano associado. O mesmo não é observado no caso geral. Pelo teorema de Poincaré, a presença
de vértices de F em D2 introduz relações entre os geradores de Γ que implicam na não observância
de propriedades essenciais, listadas abaixo.

• Não é mais verdadeiro que qualquer geodésica conectando um ponto em F a um ponto em A(g)
possui sequência cortante iniciando com g.

• Dois arcos A(g), g ∈ ΓF , podem possuir interseção não vazia.

Como consequência, o conjunto de sequências cortantes já não é mais um SFT. Podemos minorar
as dificuldades surgidas se considerarmos regiões fundamentais com a propriedade de cantos pares,
ou seja, as arestas de F podem ser estendidas para geodésicas completas em D2 que continuam a
pertencer a tesselação T de D2 obtida por Γ(∂F ). A observância da propriedade de cantos pares tem
implicações essenciais na estrutura do código obtido pelo emprego das sequências cortantes, espe-
cificado no Teorema 67, e pelo emprego da expansão do bordo, especificado no Teorema 70. Nas
próximas seções desenvolveremos os conceitos apresentados no Teorema 67 e Teorema 70, explici-
tando o emprego destes nos processos de codificação do fluxo geodésico.

5.3.2 Código de Koebe-Morse


No que segue, consideraremos um grupo Fuchsiano Γ com conjunto finito de geradores Γ0 agindo
sobre o disco de Poincaré D2 através de isometrias da métrica hiperbólica. Chamaremos de F uma
região fundamental para Γ, sendo um polı́gono hiperbólico com número finito de lados. Os lados de
F são identificados em pares por elementos de Γ0 , um conjunto simétrico de geradores. Cada lado de
F é rotulado pelo gerador correspondente no lado interior a F . Sendo T a imagem em D2 de ∂F pela
aplicação de Γ, cada lado orientado em T é rotulado pelo mesmo gerador do lado correspondente em
F . Portanto, se tomarmos gF , hF imagens de F adjacentes pelo lado s, então o lado de s interior a
hF é rotulado com ḡh.
Consideraremos que a região F satisfaz a propriedade dos cantos pares, dessa forma T é a união
de geodésicas completas em D2 . Portanto, o número de imagens de F que encontram-se em um
vértice é par. Considerando nosso objetivo de codificação de geodésicas sobre superfı́cies, esta
condição não implica em uma restrição, uma vez que toda superfı́cie possui regiões fundamentais
com essa propriedade [42, 9]. As curvas fechadas γi na superfı́cie M que correspondem às arestas de
F são dispostas como demonstrado na Figura 5.7 para o caso de uma superfı́cie de gênero dois. Sem
comprometimento a generalidade dos resultados, assumiremos como referência que 0 ∈ F .
118 Códigos Geodésicos

γ1
γ2

γ4
M γ3

Figura 5.7: Imagem das arestas de F , com vértices pares, sobre a superfı́cie associada.

γ
γ

Figura 5.8: Geodésica através de um


Figura 5.9: Geodésica em T .
vértice.

Qualquer arco orientado γ em D2 intercepta uma sequência de lados . . . s1 s2 . . . sk . . . em T , o que


permite associa-los à sequência correspondente de rótulos . . . e1 e2 . . . ek . . ., onde ei ∈ Γ0 , com rótulo
ei correspondendo ao lado de si onde o arco adentra a região fundamental. A sequência e1 . . . ek é dita
a sequência cortante de γ. Se γ passa através de um vértice em T ou coincide com um geodésica em
T , então γ é modificado de forma a obter-se uma sequência aproximada [8, 42, 9], Figuras 5.8 e 5.9.
Também podemos realizar a associação reversa. Considerando a região inicial gF , g ∈ Γ, a toda
palavra w = e1 . . . ek , ei ∈ Γ0 está vinculada uma sequência de segmentos de geodésica conectando
as imagens do ponto 0 ∈ D2 , g0, e1 g0, . . . , e1 . . . ek g0, pelos elementos g, e1g, . . . , e1 . . . ek g ∈ Γ,
chamada de sequência de arestas. Esta sequência está associada a uma sequência de polı́gonos,
consistindo de regiões adjacentes gF, e1gF, . . . , e1 . . . ek gF . A sequência cortante deste caminho é
exatamente e1 . . . ek .
Como consideramos que F possui a propriedade de arestas pares, a sequência cortante associada
a um arco circundando um vértice v de T terá a forma e1 . . . e2n(v) , além disso e1 e2 . . . e2n(v) = 1
constitui uma das relações que definem Γ. Segue que, todas as relações terão comprimento par. Qual-
quer sequência de geradores dispostos na mesma ordem em que aparecem nas relações são chamadas
de ciclos. Uma sequência e1 e2 . . . en(v) que é fator de um ciclo, mas possui metade do seu compri-
mento, é chamado de H-ciclo (decorrente de half), qualquer outro fator com comprimento maior é
dito um ciclo longo. Um ciclo pode ser horário ou anti-horário, dependendo do sentido da sequência
5.3 Codificação do Fluxo Geodésico 119

de arestas correspondente. Se a sequência de arestas circunda o vértice no sentido horário, temos um


ciclo horário ou L-ciclo (decorrente de left-hand cycle), caso contrário temos um ciclo anti-horário
ou R-ciclo (decorrente de right-hand cycle).
Consideremos v1 , . . . , vt vértices sucessivos em T sobre uma geodésica direcionada γ ∈ T . Seja
ρ uma curva aproximadamente paralela e próxima a γ em um de seus lados, podendo intercepta-la
antes de v1 e depois de vt . A sequência cortante de ρ é constituı́da por ciclos em v1 , . . . , vt , sendo
os ciclos nos vértices intermediários vi , 1 < i < t, de comprimento n(vi ) − 1 [42, Lema 2.4]. Estes
ciclos são ditos consecutivos, e sequências de ciclos consecutivos formam uma cadeia. Observamos
que a definição de cadeia permite a existência de cadeias infinitas. Uma cadeia é dita longa se é
formada por ciclos de comprimento n(v1 ), n(v2 ) − 1, . . . , n(vk−1) − 1, n(vk ). Segue da definição que
a sequência cortante de uma curva ρ′ conectando os pontos inicial e terminal de ρ, mas disposta no
lado oposto de γ também é uma cadeia, complementar àquela definida por ρ.
O comprimento |w| de uma sequência de arestas w é igual ao número de elementos que a compõ-
em, sendo equivalente a um elemento em Γ e formado por uma sequência de elementos em Γ0 . Uma
palavra w é reduzida se não contém fatores gḡ, g ∈ Γ0 . Uma sequência de arrestas é mı́nima se a
palavra correspondente é a menor representação do elemento em Γ definido pela palavra, para g ∈ Γ
escrevemos como |g| o comprimento da menor representação de g (essa definição estende-se para
sequência de polı́gonos).

Teorema 67. [42] Seja Γ um grupo fuchsiano e F uma região fundamental associada com a propri-
edade dos cantos pares. Para os interesses desse trabalho, supomos que F possui mais que quatro
lados.

• Uma sequência de arestas é mı́nima se, e somente se, é reduzida e não contém ciclos longos ou
cadeias longas.

• As sequências cortantes de arcos de geodésica são mı́nimas.

Dado uma sequência de polı́gonos mı́nima P que contém o vértice v, diz-se que o ângulo em P
sobre o vértice v é π, π + ou π − , se o número de regiões em P que interceptam v é n(v), n(v) + 1 ou
n(v) − 1, respectivamente.

5.3.3 Código de Artin


Esse processo guarda estreita relação com os processos de expansão numérica, que têm como exem-
plos mais conhecidos, o processo de expansão n-ário e o por frações contı́nuas, esse último é es-
treitamente relacionada com o grupo PSL(2, Z) [35, 43]. Contudo, o método que apresentamos está
associado a conceitos bem mais gerais, que decorrem da teoria de deformações quase-conformes [39].
120 Códigos Geodésicos

Portanto, é comumente referenciado como um processo generalizado de expansão dos pontos em ∂D2
[44, 45].

Expansão do Bordo

Consideraremos a rotulação dos lados externos a F por g1 , . . . , gk em sentido anti-horário, sendo estes
o conjunto simétrico Γ0 de geradores de Γ. Denotamos por C(gi ) a geodésica completa em T pela
extensão do lado de rótulo gi , e por A(gi ) = [Pi , Qi ] o arco delimitado por C(gi ) sobre ∂D2 , onde Pi
precede Qi em sentido anti-horário. Em nossa abordagem, consideramos que Γ é de primeira espécie5 ,
portanto, o conjunto g∈Γ0 A(g) recobre ∂D2 . Estabelecidos estes elementos, segue a definição da
S

função de expansão do bordo.

Definição 36. A função de expansão do bordo f : ∂D2 → ∂D2 é dada por f |[Pi,Pi+1 ) (ξ) = ḡi (ξ), ou
seja, é igual por partes ao conjunto de geradores Γ0 do grupo fuchsiano Γ com região fundamental F .

Quando Γ não possui elementos parabólicos, portanto, F não possui vértices em ∂D2 fixados
por elementos de Γ, então a partição induzida em ∂D2 pelos pontos Pi , Qi constitui uma partição
Markoviana finita para f , [44, Teorema 2.1]. A f -expansão6 de ξ ∈ ∂D2 é a sequência ξf = gi0 gi1 . . .,
onde gij ∈ Γ0 , satisfazendo f n (ξ) ∈ [Pin , Pin +1 ), n ∈ N. O conjunto de sequências infinitas que são
expansões de pontos em ∂D2 é denotado por Σ+ = {ξf : ξ ∈ ∂D2 } ⊂ ∞
Q
i=0 Γ0 .
O conjunto de pontos em ∂D2 formado pelos pontos terminais das geodésicas em T que passam
por um vértice de F é denotado por W . Então W induz um particionamento B finito em ∂D2 ,
cujos elementos são os conjuntos de intervalos disjuntos limitados por pontos em W . Segue de [44,
Lema 2.3] que f (W ) ⊆ W , com igualdade seguindo diretamente quando W é finito e sabendo-
se que f é Γ-equivalente por partes. Essas propriedades permitem-nos associar à ação de f sobre
o particionamento B um ssf de memória um, que denotaremos por ΣB ⊂ ∞
Q
i=0 B, onde B é um
alfabeto finito com elementos a ∈ B associados biunivocamente a intervalos B(a) ∈ B, e portanto
S
a∈B B(a) = B.
Como cada intervalo [Pi , Pi+1 ) é uma união de intervalos em B, pode-se definir um mapeamento
natural β : B → Γ0 que associa a um intervalo J ∈ B o gerador gi quando J ⊂ [Pi , Pi+1 ), do
que segue que o mapeamento induzido β̄ : ΣB → Σ+ é sobrejetivo e injetivo exceto em um número
contável de pontos onde ele é 2 para 1, um fenômeno similar a dubiedade na expansão decimal dos
números reais, no entanto decorrente das propriedades da ação da função f sobre ∂D2 [45]. Como
5
Com relação ao processo de codificação por expansão do bordo, o objetivo dessa restrição é facilitar a compreensão
do método, não sendo inerente a esse.
6
A f -expansão é introduzida e extensivamente analisada em [44], sendo a principal ferramenta para codificação por
expansão do bordo.
5.3 Codificação do Fluxo Geodésico 121

Σ+ é a imagem de um mapa fator sobre um SFT de memória um, temos que Σ+ é um ssr [18]. Devido
a relevância desse resultado para nossa abordagem, iremos referencia-lo através do Lema 68.

Lema 68. [8, 44] O ssf Σ+ é um ssr obtido como imagem do SFT ΣB pelo mapa fator β̄.

De fato, os fatores ou linguagem B(Σ+ ) que ocorrem em Σ+ correspondem às representações de


menor comprimento dos elementos em Γ, com cada elemento possuindo uma única representação. De
outra forma, todo elemento em Γ possui uma única expressão como palavra de comprimento mı́nimo
que não contenha H-ciclos anti-horários, expresso no Teorema 69.

Teorema 69. [8] Uma palavra w pertence a B(Σ+ ) se, e somente se, não contém H-ciclos anti-
horários.

Como veremos na próxima seção, o processo de codificação do fluxo geodésico através de códigos
aritméticos está relacionado com a expansão dos pontos sobre ∂D2 para os quais a geodésica cor-
respondente ao locus do fluxo geodésico codificado converge. Chamados de pontos terminais da
geodésica. Especificada uma direção para a geodésica, de acordo com o sentido do fluxo, o ponto
contrário ao sentido do fluxo é denominado repulsor (ξ), enquanto o outro de atrator (η), como mostra
a Figura 5.1. A Definição 36 é empregada no processo de expansão do atrator. Para a expansão do
repulsor empregamos a função apresentada na Definição 37. Essa mudança tem como objetivo tornar
o processo de codificação aritmética do fluxo geodésico consistente, ou seja, uma representação do
fluxo geodésico através de um fluxo especial sobre um ssf.

Definição 37. A função de expansão do bordo f¯ : ∂D2 → ∂D2 é dada por f¯|(Qi−1 ,Qi] (ξ) = ḡi (ξ), ou
seja, é igual por partes ao conjunto de geradores Γ0 do grupo fuchsiano Γ com região fundamental F .

Como resultado desse duplo processo de expansão, a extensão de Σ+ (conjunto de sequências in-
finitas) para um conjunto Σ (conjunto de sequências bi-infinitas) corresponde a extensão do processo
de codificação de um ponto para uma geodésica. A inversão da assimetria apresentada na definição de
f permite representar a ação do fluxo sobre as geodésicas na superfı́cie, através da ação do mapa des-
locamento sobre Σ. A função f¯ satisfaz todas as propriedades de f , a não ser pela inversão dos termos
+
“anti-horário” e “horário”. Em particular, ei . . . ei+r ∈ B(Σ+ ) se, e somente se, ēi+r . . . ēi ∈ B(Σ ),
+
onde Σ = {ξf¯ : ξ ∈ ∂D2 }.
As funções f e f¯ bem definidas (equivalentes por parte a Γ0 ), permitem-nos associar uma estrutura
Markoviana a ação do fluxo geodésico sobre ∂D2 , como expresso no Teorema 70. Estas funções são
extensivamente estudadas em [45, 9].

Teorema 70. [44] Seja Γ um grupo fuchsiano de primeira espécie finitamente gerado, com uma
região fundamental F que satisfaz a propriedade dos cantos pares. Então há um mapeamento Mar-
122 Códigos Geodésicos

γ γ

γ∈R γ ∈R
/
(1) (2)

Figura 5.10: Possı́veis deformações de uma geodésica orientada quando intercepta um vértice.

koviano f : ∂D2 → ∂D2 cuja ação sobre ∂D2 é equivalente a ação de Γ sobre ∂D2 , ou seja, geram
as mesmas órbitas.

5.4 Representação Geométrica e Aritmética do Fluxo Geodésico


Nesta seção veremos como as sequências cortantes e expansão do bordo são aplicados na codificação
do fluxo geodésico (ou geodésicas). Em qualquer instante do processo de codificação, seja o geométri-
co ou o aritmético, a região fundamental é nosso parâmetro de referência, empregada em cada instante
para determinação dos dı́gitos das sequências cortantes ou da expansão dos pontos do bordo. Se γ
é uma geodésica orientada que intercepta um vértice v de T , então convenciona-se que γ será subs-
tituı́do por uma curva deformada para direita em torno de v (considerando-se a orientação de γ), como
mostra a Figura 5.10. Essa convenção deve-se a escolha da função de expansão do bordo apresentada
na Definição 36.
Consideremos ξ, η ∈ ∂D2 , ξ 6= η, com expansões ξf¯ = ξ0 ξ−1 . . . e ηf = η0 η1 . . .. Como na
Seção 5.2.3, escreveremos ξ ∗η = · · · ξ¯−1 ξ¯0 η0 η1 · · · , com γ = γ(ξ, η), onde ξ é o atrator e η o repulsor
de γ, fica assim estabelecida uma orientação para as geodésicas em D2 . Diz-se que ξ ∗ η é mı́nimo
se todos os seus blocos são mı́nimos. Denomina-se por E(ξ ∗ η) a sequência de arestas conectando
os pontos . . . , ξ0 ξ1 0, ξ00, 0, η0 0, η0 η1 0, . . ., e E(η), E(ξ) as sequências de arestas 0, η0 0, η0 η1 0, . . . e
. . . ξ0 ξ1 0, ξ00, 0. A sequência de arestas de γ é denotada por E(γ). Uma sequência (ei )∞
i=−∞ , ei ∈ Γ0 ,
pode iniciar ou terminar em uma cadeia infinita de ciclos, tendo comprimentos n(v1 )−1, n(v2 )−1, . . .
em vértices v1 , v2 , . . . consecutivos sobre uma geodésica em T .
Uma geodésica γ(ξ, η) passa próximo a um vértice v ∈ T se ξ, η encontram-se em setores opos-
tos do particionamento de D2 determinado pelas geodésicas T (v) em T que interceptam v. Con-
sideremos a Figura 5.11 como exemplo, todas as geodésicas γ apresentadas passam próximo ao
único vértice apresentado explicitamente, pois seus pontos terminais encontram-se em setores opos-
5.4 Representação Geométrica e Aritmética do Fluxo Geodésico 123

γ γ

γ∈R∩A γ∈A−R
(1) (2)

γ γ

γ∈R−A γ ∈A∪R
/
(3) (4)

Figura 5.11: Possı́veis discrepâncias entre os conjuntos A e R.

tos desse. Se γ passa próximo a um vértice v ∈ F e γ ∩ F 6= ∅, então diz-se que γ corta v em F se os


pontos terminais de γ não pertencem ao setor de v que contém F . Suponhamos ξ¯0 η0 associados a ξ, η
fazem parte de um ciclo ou cadeia. Então os lados C(ξ0), C(η0 ) de F encontram-se em um vértice de
F denotado por v(ξ, η) ou são separados por um lado de F denotado por s(ξ, η).

Definição 38. Seja Σ = {(ei )∞ +


i=−∞ | ei . . . ei+k ∈ B(Σ ), com 0 < k e (ei ) não começa ou termina
com cadeias infinitas de ciclos anti-horários}. Então,

A = {γ = γ(ξ, η)| ξ ∗ η ∈ Σ} e R = {γ = γ(ξ, η)| γ ∩ IntF 6= ∅}.

Deve-se ressaltar que o processo de codificação que gera A e R em cada instante de tempo (ou
ı́ndice dos sı́mbolos das sequências código) emprega uma região F especı́fica para comparação desses
conjuntos (uma referência), associada ao conjunto R.

Ao contrário do caso particular abordado na Seção 5.2, já não é observada a igualdade A = R.
A disparidade entre os conjuntos A e R surge com relação às geodésicas que passam próximo a
vértices de F [8]. Podendo ser de quatro tipos, dependendo da direção da geodésica e sua posição em
relação a F . Os possı́veis casos são apresentados na Figura 5.11. Se queremos que nosso conjunto
de sequências código reflita propriedades de um espaço topológico, podendo ser associadas a uma
superfı́cie, devemos trabalhar com o conjunto R. Contudo, precisamos projetar codificadores que
124 Códigos Geodésicos

Codifica em Estima em
A∩R Superfı́cie M A∩R

Figura 5.12: Modelo de sistema para sequências código restritas a A ∩ R.

associem sequências código às sequências de informação de nossa fonte, e o código associado a R
é demasiadamente complexo para que consigamos determinar até mesmo uma representação finita
desse. Ao contrário, o código associado a A é um ssr, portanto possui uma representação finita
através de um grafo direcionado e rotulado.
Propomos duas alternativas para tratar com esse dilema. A primeira restringe o conjunto de
sequências efetivamente aplicadas no processo de codificação àquelas contidas no conjunto A ∩ R,
com condição a ser satisfazer para isso expressa na primeira implicação da Proposição 71 e repre-
sentada no caso (1) da Figura 5.11. Um modelo para o nosso sistema resultante é apresentado na
Figura 5.12. A segunda alternativa será tratada na próxima seção.
Proposição 71. [8] Suponha que ξ¯0 η0 pertença a um ciclo ou cadeia e que γ passe próximo ao vértice
v(ξ, η). Então,

ξ ∗ η ∈ A ⇒ (γ passa por v em sentido horário ⇔ γ ∈ R),


ξ∗η ∈
/ A ⇒ (γ passa por v em sentido anti-horário ⇔ γ ∈ R).

5.4.1 Estendendo o conjunto de sequências código


Podemos fazer uso de todo o conjunto R, continuando a empregar as boas propriedades apresen-
tadas pelo conjunto A para implementação de codificadores, se conseguirmos relacionar de forma
biunı́voca as sequências desses conjuntos. De fato, isso é possı́vel pelo emprego de mapas de
conjugação T : R → A e S : A → R, definidos a seguir com base nos casos apresentados na
Figura 5.11. Antes, precisamos de alguns conceitos adicionais.
Procedimento 1. Sejam P = (Ri )∞ ′ ′ ∞
i=−∞ e P = (Ri )i=−∞ sequências de polı́gonos mı́nimas e orien-
tadas, com pontos terminais no infinito iguais. As regiões de P e P ′ podem ser associadas de acordo
com as seguintes regras.
1. Se a região S é comum às duas sequências, S = Ri = Rj′ , então Ri é associada a Rj′ .

2. Suponhamos que Ri , Ri+1 , . . . , Rp e Rj′ , Rj+1



, . . . , Rq′ sejam sequências de regiões em P e P ′ que
não possuem regiões em comum mas que compartilham os vértices v−k , . . . , v0 , . . . , vl , tal que o
5.4 Representação Geométrica e Aritmética do Fluxo Geodésico 125

ângulo vi é π para i 6= 0, seguindo-se que o ângulo sobre P em v0 é π + . Suponhamos também


que Rs , Rt′ sejam regiões em P, P ′ com v0 ∈ Rs e v0 ∈ Rt′ . Então, Rt+r

é associada a Rs+r+1 para
max(i − s − 1, j − t) ≤ r ≤ min(q − t, p − s − 1).
Além disso, se o ângulo sobre P em v0 é π − então Rt+r+1

é associada a Rs+r para max(i − s, j −
r − 1) ≤ r ≤ min(p − s, q − t − 1). Sendo associações relativas ao vértice v0 .

3. Suponhamos que P e P ′ não possuem regiões em comum e possuem ângulo π em todos os vértices
comuns. Sejam Ri , . . . , Ri+p e Rj′ , . . . , Rj+p

sequências de regiões em P e P ′ que compartilham
os vértices v1 , . . . , vk . Suponhamos também que Ri e Rj′ possuam um lado em comum. Então

Ri+r é associada a Rj+r para 0 ≤ r ≤ p.

O Procedimento 1 de associação de sequências de polı́gonos é empregado na explicitação do


Procedimento 2 para descrever as bijeções entre as sequências em A e R. Além desse conceito,
será empregado o conceito de caminho complementar, esta definição envolve diversos conceitos não
abordados neste texto, além de resultados de lemas, não sendo explicitada aqui mas podendo ser
consultada em [8, Definição 5.5].

Procedimento 2. O procedimento de associação de sequências de polı́gonos é empregado na explici-


tação do procedimento de conjugação entre os conjuntos de A e R.

1. T (γ) = S(γ) = γ, se γ ∈ R ∩ A.

2. Definição de S sobre A − R. Suponha que γ = γ(ξ, η) ∈ A − R. As sequências de arestas


E(ξ ∗ η), E(γ) interceptam-se em ∂D2 e são mı́nimas, assim é possı́vel aplicar o Procedimento 1
para combinar as sequências. Temos que 0 ∈ E(ξ ∗ η) mas 0 ∈
/ E(γ), já que γ ∈
/ R. Seja hF a
região associada a F , então S(γ) = h̄γ.

3. Definição de T sobre R − A. Suponha inicialmente que ξ ∗ η não é mı́nimo. Assim, γ é um lado


de T , e 0 ∈ E(γ) uma vez que γ ∈ R [8]. Seja gF a região associada a F no lado oposto de γ,
então T (γ) = ḡγ.
Considerando o caso em que ξ ∗η é mı́nima. Neste caso γ passa próximo de v(ξ, η) e as sequências
E(γ), E(ξ ∗ η) interceptam R. Consideremos E ∗ (ξ ∗ η) a sequência complementar a E(ξ ∗ η) em
v(ξ, η). É possı́vel aplicar o Procedimento 1 para combinar as sequências E(γ) e E ∗ (ξ ∗ η). Seja
gF a região associada a F , então T (γ) = ḡγ.

Salientamos que pela definição acima, os mapas S, T são iguais por partes aos elementos de Γ,
além disso, pode ser verificado geometricamente que as regiões onde S e T são iguais a um g ∈ Γ
fixo podem ter suas fronteiras determinadas explicitamente. O Teorema 72 especifica a importância
desses mapeamentos.
126 Códigos Geodésicos

Codifica em
S(·)
A

Superfı́cie M

Decodifica
T (·)
em A

Figura 5.13: Modelo de sistema para sequências em R.

Teorema 72. [8] O mapa T é uma bijeção R → A. De fato, T e S são inversos um do outro.

Além de poder relacionar biunivocamente as sequências em A e R, é necessário garantir que o


comportamento dinâmico do sistema seja preservado. O que é estabelecido no Teorema 73.

Teorema 73. [8] O mapa T conjuga as ações de σ sobre A e τ sobre R. Portanto, os seguintes
diagramas comutativos são válidos.

τ σ
R −−−→ R A −−−→ A
   
   
Ty yT Sy yS
A −−−→ A R −−−→ R
σ τ

Agora, o segundo sistema proposto emprega todo o conjunto de sequências em A no processo


de codificação, seguido por um processo posterior de mapeamento em R. Nesse caso, as sequências
referentes a segunda implicação da Proposição 71 são integradas no processo de codificação, repre-
sentando o caso (3) da Figura 5.11. Um modelo para o nosso sistema resultante é apresentado na
Figura 5.13.

5.5 Estrutura e Entropia do SFT Inerente ao Código Aritmético


Nesta seção consideraremos o resultado apresentado no Lema 68 para o caso de uma tesselação
{(8g − 4), 4}, onde g é o gênero da superfı́cie. Essa condição não impõe de fato uma restrição, pois
como é provado em [9], a qualquer superfı́cie com g ≥ 2 pode ser associada uma região fundamental
que satisfaça essa condição. A importância desse caso está em podermos apresentar explicitamente
a medida invariante associada as funções de expansão do bordo f e f¯, o que permite-nos realizar
5.5 Estrutura e Entropia do SFT Inerente ao Código Aritmético 127

análises estatı́sticas quantitativas sobre o código aritmético decorrente dessas funções de expansão do
bordo [34].

5.5.1 Definindo a estrutura da região fundamental

Consideraremos como região fundamental um polı́gono hiperbólico F com (8g−4) lados, e tesselação
associada {(8g − 4), 4}. Rotularemos as arestas consecutivas por s1 , . . . , s8g−4 em sentido anti-
horário. A identificação de arestas é especificada pela permutação de ordem 2 sobre 1, . . . , 8g − 4
definida em (5.2). 
4g − 4 mod (8g − 4), i ı́mpar,
σ(i) = (5.2)
2 − i mod (8g − 4), i par.
Uma representação para o caso de um polı́gono com 12 arestas (g = 2) é apresentado na Figura 5.14,
onde destacamos as arestas identificadas através das retas tracejadas. Os rótulos 11 , 12 , 21 , 22, . . . na
base da figura identificam os elementos do particionamento B apresentado na Seção 5.3.3, especifica-
dos pelos pontos terminais das geodésicas em T que passam por vértices de F . Os pontos terminais
das geodésicas obtidas como prolongamento da aresta si de F são rotulados por ai e bi , com ai prece-
dendo bi quando considerando o sentido anti-horário. Representamos o caso a7 e b7 na Figura 5.14.
Portanto, como decorrência da ação de g1 o ponto a1 é mapeado em b7 , b1 é mapeado em a7 , b12 é
mapeado em b8 e a2 é mapeado em a6 . O caso geral é apresentado no Lema 74.

Lema 74. [9] A transformação gi mapeia os pontos ai−1 , ai , bi−1 , ai+1 , bi , bi+1 , respectivamente, nos
pontos aσ(i)+1 , bσ(i) , bσ(i)+1 , aσ(i)−1 , aσ(i) , bσ(i)−1 .

Sabendo que as funções de expansão do bordo f e f¯ são Γ-equivalentes, podemos empregar


o Lema 74 para determinar as regras de transição que especificam o SFT subjacente ao código
aritmético associado a essa tesselação [9], apresentadas em (5.3). Portanto, a região 11 é mapeada por
f (ou g1 ) nos intervalos 82 , 91 , enquanto 12 é mapeado por f em 92 , 101 , . . . , 51 , 52 .

i → (σ(i) + 1) , (σ(i) + 2) ,
1 2 1
(5.3)
i → (σ(i) + 2) , (σ(i) + 3) , . . . , (σ(i) − 2) , (σ(i) − 2) .
2 2 1 1 2

De forma similar, as regras de transição que definem o SFT subjacente ao código aritmético podem
ser determinadas para um tesselação qualquer que satisfaça a propriedade dos cantos pares [45].
128 Códigos Geodésicos

b7 a7

g1 F
7
8 6
g1
9 5
F
10 4

11 3

12 2
1
D
22
11 12 21

Figura 5.14: Região fundamental.

5.5.2 Maior ssf-completo


Nesta seção abordaremos uma questão estrutural do SFT, que denotaremos por Xg , definido pelas
regras de transição (5.3). Inicialmente, podemos verificar a partir de (5.3) que a cardinalidade do
alfabeto associado a Xg é 2(8g − 4). A seguir especificaremos a maior cardinalidade do alfabeto de
um ssf-completo contido em Xg , ou seja, o conjunto de proibições é vazio.
Como um ssf-completo não possui sequências proibidas, deve ser possı́vel a transição entre quais-
quer elementos do seu alfabeto. A partir das regras de transição (5.3), observamos que um elemento
de sub-ı́ndice um não pode ocorrer sucessivamente em uma sequência. Portanto, para a análise a
seguir omitiremos o sub-ı́ndice, estabelecendo previamente que trata-se do sub-ı́ndice dois.

Lema 75. Seja L = {1, . . . , k}, onde k ≥ 4 é um inteiro par, e σ : L → L uma permutação
S
arbitrária. Suponhamos uma partição {C, P} de L, tal que, P = i∈C P(i) onde P(i) = {(σ(i) −
1), σ(i), (σ(i) + 1)}. Logo, o maior valor de |C| é obtido quando |P| = |C| + 2 e os elementos
{σ(i)}i∈C são consecutivos.

Demonstração: Inicialmente, i, j ∈ L são consecutivos se |i − j mod k| = 1, relembrando que


(k − 1) ≡ −1 mod k e, portanto, |(k − 1) mod k| = 1. A seguir demonstramos que não há σ(·)
que satisfaça |P| = |C| e |P| = |C| + 1, e que |P| = |C| + 2 só é satisfeita quando {σ(i)}i∈C é um
conjunto consecutivo de elementos.
Consideremos verdade que |P| = |C|, assim há i ∈ C e j1 , l ∈ C satisfazendo σ(j1 ) = (σ(i) − 1) e
σ(l) = (σ(i)+1). De outra forma, deve existir t1 , t2 ∈ C satisfazendo σ(t1 ) = σ(t2 ) e t1 6= t2 , o que é
uma contradição. Como j1 ∈ C e σ(j1 ) = (σ(i) − 1) então há j2 ∈ C satisfazendo σ(j2 ) = (σ(i) − 2),
e portanto existe j3 ∈ C tal que σ(j3 ) = (σ(i) − 3), etc. O que nos leva a concluir que L = P.
5.5 Estrutura e Entropia do SFT Inerente ao Código Aritmético 129

Agora, suponhamos que |P| = |C| + 1, implicando em dois possı́veis casos σ −1 (σ(i) − 1) ∈
/ C
ou σ −1 (σ(i) + 1) ∈
/ C para algum i ∈ C. Consideraremos aqui um dos casos, a análise do outro
segue pari passu. Seja σ(j1 ) = (σ(i) + 1) para algum j1 ∈ C, então existe j2 ∈ C satisfazendo
σ(j2 ) = (σ(i) + 2), e assim por diante. Novamente, concluı́mos que L = P.
Se |P| = |C| + 2 e {σ(i)}i∈C não é um conjunto de elementos consecutivos, então C possui pelo
menos três elementos j1 , j2 , j3 satisfazendo (σ(jl ) + 1) ∈
/ {σ(i)}i∈C ou (σ(jl ) − 1) ∈
/ {σ(i)}i∈C ,
1 ≤ l ≤ 3. Portanto, |P| = |{P(i)}i∈C | ≥ |C| + 3. Concluı́mos que |P| = |C| + 2 só ocorre se os
elementos do conjunto {P(i)}i∈C são consecutivos, sendo simples verificar que só há dois elementos
no conjunto P que não pertencem a {P(i)}i∈C . Neste caso obtemos |C| = k/2 − 1 e |P| = k/2 + 1.


Para prova do Teorema 76 novamente referenciaremos (5.3), chamando a atenção que as transições
i → (σ(i) − 1), σ(i), (σ(i) + 1) são exatamente as transições proibidas, o que nos permitirá empregar
o Lema 75.

Teorema 76. O máximo ssf-completo contido no ssf Xg , possui alfabeto C com cardinalidade 4(g−1),
ou seja, |C| = 4(g − 1).

Demonstração: Para a permutação σ(·) apresentada em (5.2), iremos demonstrar que não há um
partição {C, P} de L = {1, . . . , 8g − 4} satisfazendo |P| = |C| + 2, especificando em seguida uma
partição que satisfaz |P| = |C| + 4.
Como resultado do Lema 75, existe uma partição satisfazendo |P| = |C| + 2 se, e somente se,
os elementos em {σ(i)}i∈C são consecutivos. Portanto, os elementos em C também são consecutivos,
além disso |L| = |C| + |P| = 2|C| + 2 = 8g − 4, logo |C| = 4g − 3. Complementando, |L|/4 =
(8g − 4)/4 = 2g − 1 e assim |C| − |L|/4 = 2g − 4, o que para g ≥ 2 é pelo menos dois. Portanto,
o conjunto C possui pelo menos um dos elementos “cardinais” {1, 2g, 4g − 1, 6g − 2}. De (5.2), o
vizinho de um elemento cardinal é a imagem um do outro. Assim, para |P| = |C| + 2 existe i ∈ L
satisfazendo i, σ(i) ∈ C, o que é uma contradição.
Como não há uma partição com |C| = (4g−3), prosseguimos com a análise do caso |C| = (4g−4).
Considerando a partição {C1 , C2 } de C onde C1 = {2, 3, . . . , 2g −1} e C2 = {4g, 4g +1, . . . , 6g −3}.
Portanto, |C| = |C1 | + |C2 | = 4(g − 1). A partir de (5.2), segue que para

2g + 1 ≤ σ(i) ≤ 4g − 3, i ı́mpar,
i ∈ C1 :
6g ≤ σ(i) ≤ 8g − 4, i par.

6g − 1 ≤ σ(i) ≤ 8g − 5, i ı́mpar,
i ∈ C2 :
2g + 2 ≤ σ(i) ≤ 4g − 2, i par.
130 Códigos Geodésicos

Assim, P = {2g, 2g + 1, . . . , 4g − 1} ∪ {6g − 2, 6g − 1, . . . , 1}, onde σ −1 (i) ∈


/ C para i ∈ {1, 2g, 4g −
1, 6g − 2}. Podendo ser verificado que C ∩ P = ∅ e L = C ∪ P. 

5.5.3 Entropia Topológica

Em processos de codificação de fonte e codificação conjunta, a entropia topológica das palavras ou


sequências código é de suma importância, pois representa a quantidade de informação que pode
ser codificada através dessas. A seguir definiremos esse parâmetro para Xg , iniciando com alguns
conceitos necessários sobre grafos direcionados. Como na Seção 5.5.2, o valor obtido é uma função
do gênero da superfı́cie associada a região fundamental.

Grafos Direcionados

Um grafo G = (V, E) é definido por um conjunto finito de vértices V e um conjunto finito de ramos
E, tal que, para todo ramo e ∈ E é associado um estado inicial i(e) e um estado terminal t(e). Um
caminho π em G é um conjunto de ramos consecutivos, ou seja, se π = e1 . . . en então t(ei ) = i(ei+1 )
para 1 ≤ i < n. Um grafo rotulado é um par G = (G, L) tal que G e um grafo e L : E → A é a
função de rotulação onde A é um conjunto finito chamado de alfabeto. Um grafo rotulado G é
determinı́stico se para qualquer e1 , e2 ∈ E satisfazendo i(e1 ) = i(e1 ) então L(e1 ) 6= L(e2 ). Um grafo
G pode ser considerado um grafo rotulado ao considerarmos L igual a função identidade. Seja Aij
igual ao número de ramos em G com estado inicial i e estado terminal j, para qualquer i, j ∈ V. A
matriz adjacência de G é A = [Aij ]. A matriz adjacência associada ao grafo G é denotada por AG .
Para um grafo rotulado G = (G, L), a matriz adjacência é denotada por AG = AG . Um ssr XG é
determinado pela leitura dos rótulos de ramos consecutivos em um grafo rotulado G. Neste caso G
é uma representação de XG . Para um SFT com memória um, ou seja, que pode ser determinado por
um conjunto F de palavras proibidas de comprimento dois, há um procedimento simplificado para a
determinação de uma representação G = (G, L). Um grafo inicial G = (V, E) é especificado que
satisfaça V = A e E = {ij ∈ A × A| ij ∈
/ F}, tal que i(ij) = i e t(ij) = j, com função rotulação
especificada por L(ij) = j para todo ij ∈ E [18].

Entropia topológica de Xg

Uma apresentação GXg = (G, LXg ) do código do fluxo geodésico possui o grafo G como dado em
(5.4), onde P é o conjunto de sequências permitidas de comprimento dois especificadas em (5.3), e a
5.5 Estrutura e Entropia do SFT Inerente ao Código Aritmético 131

função de rotulação é dada por LX (ik il ) = il para todo ik il ∈ E.



 V = {i | 1 ≤ i ≤ 8g − 4 and k ∈ {1, 2}};
k
G: (5.4)
 E = {i i | i i ∈ P for 1 ≤ i, j ≤ 8g − 4 and k, l ∈ {1, 2}}.
k l k l

Empregamos a simetria de GXg para determinar dois outros grafos rotulados com a mesma entropia to-
pológica de Xg , no entanto que permitam a obtenção de expressões algébricas para essa. Inicialmente,
GY = (G, LY ) possui o mesmo grafo G que GXg e função de rotulação dada em (5.5).



 LY (i2 (σ(i) + 2)2 ) = b1 , LY (i2 (σ(i) + 3)2 ) = b2 , . . . ,


 L (i (σ(i) − 2) ) = b
(k−3) ;

Y 2 2
(5.5)


 LY (i2 (σ(i) + 3)1 ) = c1 , . . . , LY(i2 (σ(i) − 2)1 ) = c(k−4) ;


 L (i (σ(i) + 1) ) = d , L (i (σ(i) + 2) ) = a .

Y 1 2 1 Y 1 1 1

O outro grafo rotulado GZ = (GZ , LZ ) possui o grafo GZ como especificado em (5.6), onde k = 8g −4
e LZ é a identidade.

 V = {1, 2};
Z
GZ : (5.6)
 E = {a } ∪ {d } ∪ {c , . . . , c
Z 1 1 1 (k−4) } ∪ {b1 , . . . b(k−3) },

tal que 
 t(a ) = i(a ) = 1, e t(b ) = i(b ) = 2 para 1 ≤ l ≤ (k − 3);
1 1 l l
(5.7)
 i(d ) = 1, t(d ) = 2, e i(c ) = 2, t(c ) = 1 para 1 ≤ t ≤ (k − 4).
1 1 t t

Lema 77. Os grafos rotulados GY e GZ são apresentações do mesmo ssr, ou seja, B(Y) = B(Z).

Demonstração: A partir das definições de GY e GX , para qualquer i ∈ {1, . . . , 8g − 4} e n, m ∈


{1, 2}, há um caminho π em GY satisfazendo LY (π) = w, i(π) = in e t(π) = im se, e somente se,
há um caminho ̟ em GZ satisfazendo LZ (̟) = n, i(̟) = n e t(̟) = m, ou seja, sempre que os
caminhos possuem comprimento |π| = |̟| = 1.
Empregando um raciocı́nio indutivo, suponhamos que a observação acima seja verificada sempre
que os comprimentos |π| = |̟| = n sejam menores ou iguais a um inteiro positivo n. A seguir
demonstraremos que ela também é verificada quando |π| = |̟| = n + 1.
Suponha que πe é um caminho em GY satisfazendo LY (πe) = LY (π)LY (e) = wa para e ∈ EY ,
i(π) = in e t(π) = im . Seguindo da hipótese indutiva que há um caminho ̟ ∈ GZ satisfazendo
|̟| = |π|, LZ (̟) = w, i(̟) = n e t(̟) = m. Além disso, há um caminho f em GZ satisfazendo
132 Códigos Geodésicos

|f | = 1, LZ (f ) = LY (e) = a e i(f ) = m, além do que t(f ) = p se, e somente se, t(e) = ip .


Dessa forma, L(̟f ) = wa e, portanto, B(Y) ⊆ B(Z). De forma similar, pode ser demonstrado que
B(Z) ⊆ B(Y). 
Para a demonstração do Teorema 80 são necessários alguns resultados a cerca da entropia de gra-
fos direcionados e dos grafos rotulados associados. Para nossos fins, a Proposição 78 e a Proposição 79
são necessários. Esses resultados fazem parte do capı́tulo sobre entropia de [18], onde são apresen-
tados diversos resultados sobre a determinação dessa para um ssr. Entre os resultados mais relevan-
tes, por tratar da determinação do autovalor de matrizes não negativas, podemos citar o teorema de
Perron-Frobenius, do qual decorre a Proposição 79.
Proposição 78. [18] Seja G = (G, L) um grafo rotulado determinı́stico. Então h(XG ) = h(XG ).
Proposição 79. [18] Seja G um grafo com matriz adjacência A. Então h(XG ) = log λA , onde λA é o
maior autovalor de A.
Teorema 80. A entropia topológica do código Xg está relacionada com a região fundamental Πg
através do gênero da superfı́cie associada, sendo dada por
" #
p
h(X) = log (4g − 3) + (4g − 3)2 − 1 (5.8)

Demonstração: Como os grafos rotulados GX e GY são determinados a partir do mesmo grafo G,


e são ambos determinı́sticos, segue da Proposição 78 que h(X) = h(Y). Do Lema 77, já sabemos
que h(Y) = h(Z). Portanto, da Proposição 79 podemos aplicar a matriz adjacência AGZ de GZ para
determinar a entropia topológica de X. Como AGZ possui ordem dois, independentemente da região
empregada na codificação Πg , com entradas só dependendo do gênero g, temos como determinar
uma equação algébrica para h(Z) e, consequentemente, teremos uma equação algébrica para h(X). A
partir de (5.6) e (5.7), a matriz adjacência associada AGZ é dada por (5.9).
" #
1 1
AGY = (5.9)
8g − 8 8g − 7

O maior autovalor λAGY de AGY é igual a maior raiz do polinômio caracterı́stico λ2 + λ (6 − 8g) + 1
de AGY . Assim,
p
(8g − 6) + (6 − 8g)2 − 4 p
λAGY = = (4g − 3) + (4g − 3)2 − 1.
2

Dessa forma h(X) = h(Y) = log λAGY , do que segue (5.8). 


Capı́tulo 6

Representação de Códigos Geodésicos

No Capı́tulo 5 abordamos os métodos de codificação do fluxo geodésico. Dois métodos foram consi-
derados, um que captura a topologia da superfı́cie da qual o fluxo geodésico é codificado, denominado
geométrico. O outro, baseado em métodos de expansão dos pontos em ∂D2 , emprega mapeamentos
Markovianos, sendo denominado aritmético. Para nossos objetivos de determinar representações
do fluxo geodésico a serem empregadas no projeto de codificadores casados com a topologia de
uma superfı́cie (especificada pelo gênero da superfı́cie), a impossibilidade de determinar-se uma
representação finita para o código geométrico constitui um desafio a ser contornado, já que é esse
o método que captura a topologia da superfı́cie. Como apresentado no Seção 5.4, há pelo menos duas
abordagens possı́veis para contornarmos esse obstáculo, uma é representar a interseção do código
geométrico com o aritmético, enquanto a outra é fazermos uso de conjugados bem definidos entre os
códigos. Para qualquer escolha que façamos, saber representar o código aritmético é uma necessidade
inicial.
Neste capı́tulo demonstramos como, a partir de um conjunto infinito de restrições bem definidas
para o código aritmético, especificadas na Proposição 84, podemos empregar os conceitos e métodos
desenvolvidos no Capı́tulo 3 para gerar de forma sistemática uma representação determinı́stica e
mı́nima para o código. Em nosso desenvolvimento fica claro como a riqueza de propriedades das
palavras proibidas conduzem à simplificação, sistematização e generalidade (com relação a topologia
da superfı́cie) do método. Essas propriedades decorrem da estrutura topológica da superfı́cie, a saber,
dos possı́veis ciclos completos de geradores.
Nosso desenvolvimento é baseada nos resultados apresentados em [8, 45], que por sua vez fa-
zem suposições iniciais estabelecidas em [42, 44]. Portanto, iniciamos a Seção 6.1 estabelecendo as
propriedades necessárias da região fundamental para aplicação destes resultados. Em seguida detalha-
mos o método de geração de ciclos de vértices e sequências de geradores apresentado inicialmente na
Seção 4.5. Finalizamos a seção com a demonstração de propriedades necessárias subsequentemente.

133
134 Representação de Códigos Geodésicos

Empregando as propriedades das sequências de geradores, demonstramos no Teorema 86 da


Seção 6.2 que o conjunto de restrições O que especificam o código de Artin é irredutı́vel e que o
procedimento para determinar o conjunto de restrições à direita é facilitado, não requerendo cálculos
ou comparações além daquelas necessárias para especificar o conjunto finito de prefixos obtidos di-
retamente de um subconjunto finito e bem especificado de O.
Na Seção 6.3 exemplificamos o emprego dos resultados apresentados na Seção 6.2 para construir
uma apresentação minimal para o código de Artin, obtido a partir da tesselação {12, 4} estudada
em [9]. O procedimento é geral, e a escolha desta tesselação deve-se a clareza que propicia para
apreciação do método.

6.1 Ciclos de Vértices


Dado um grupo Fuchsiano Γ com região fundamental F , um polı́gono hiperbólico não triangular sa-
tisfazendo a propriedade dos cantos pares, com conjunto simétrico de geradores Γ0 . Consideraremos
que Γ não possui elementos parabólicos e que vértices elı́pticos não são interiores a segmentos de
geodésicas contidos em ∂F . Como apresentado na Seção 4.5, cada vértice v de F é identificado com
um outro vértice pela aplicação de um gerador em Γ0 . Cada vértice v é ponto terminal de duas ares-
tas s e ∗s de F . Neste caso, denotamos por (v, s) e (v, ∗s) os possı́veis pares de arestas com ponto
terminal v, de outra forma, s e ∗s possuem v como ponto de interseção. Consideraremos a seguinte
convenção para a denominação de arestas e vértices:

• Os vértices são enumerados em sentido anti-horário;

• Os pontos terminais da aresta si de F são os vértices vi e vi+1 , fazendo-se i + 1 = 1 caso i = N e


F seja um polı́gono com N arestas.

Seja g(s) o gerador associado a aresta s de F . Especificado um par (v1 , s1 ), então v2 = g(s1 )(v1 ) e
s2 = g(s1 )(s1 ) formam um par (v2 , s2 ). O processo é repetido, mas agora considerando a reflexão em
torno de v2 , ou seja, o par (v2 , ∗s2). De forma similar obtemos o par (v3 , ∗s3 ) para o qual g(∗s2)(v2 ) =
v3 e g(∗s2)(∗s2 ) = s3 . Portanto, através da sequência de ações: (i) Aplicar a transformação g(s)
associada ao lado s ao par (v, s), (ii) Refletir em torno de g(s)(v); determina-se a sequência de pares
(v1 , s1 ) → (v2 , ∗s2) → · · · → (vn , ∗sn ) → (vn+1 , ∗sn+1 ), onde eventualmente (vn+1 , ∗sn+1 ) =
(v1 , s1 ) já que o número de pares (v, s) é finito. A sequência de vértices v1 , v2 , . . . , vn é chamada
ciclo de vértices, enquanto a sequência g1 = g(s1 ), g2 = g(∗s2 ), . . . , gn = g(∗sn ) é chamada ciclo
de geradores ou sequência de geradores que especifica a transformação gv1 ,s1 = gn gn−1 . . . g1 , tendo
(v1 , s1 ) como par inicial. Pela convenção estabelecida quanto ao rótulo de vértices e arestas de F ,
especificado um par (vi , si ), o ciclo de vértices e de geradores obtidos são ditos L-ciclo e L-sequência,
6.1 Ciclos de Vértices 135

vi 1
gi1 b

gi2
b

vi 2

Figura 6.1: Relação entre ciclo de vértices e sequência de geradores.

respectivamente. Analogamente, no caso (vi+1 , si ), o ciclo de vértices e de geradores obtidos são ditos
R-ciclos e R-sequências, respectivamente. A transformação gn . . . g1 , associada a uma sequência
de geradores obtida a partir de um vértice v em D2 é uma transformação elı́ptica ou identidade e,
necessariamente, (gn . . . g1 )ν = 1 para algum inteiro ν. Neste caso v é um ponto elı́ptico de ordem ν.
Se v ∈ ∂D2 então gn . . . g1 é uma transformação parabólica [30, 46].

Proposição 81. A um ciclo de geradores está associada um único ciclo de vértices e vice-versa, a
não ser para ciclos de comprimento um e dois, quando pode-se associar os ciclos g, h e h−1 , g −1.

Demonstração: A cada elemento gi de Γ0 , como ao seu inverso, está associado uma única aresta
si da região fundamental e a esta um único par de vértices {vi , ui }. Dado o ciclo de geradores
gi1 , gi2 , . . . , gin , obtém-se que {gi−1
1
(vi2 ), gi−1
1
(ui2 )} ∩ {vi1 , ui1 } = {vi1 }. Portanto, o par inicial
(vi1 , si1 ) que determina unicamente o ciclo de vértices a partir do qual o ciclo de geradores gi1 , gi2 , . . . ,
gin é especificada e unicamente determinado.
Dado um ciclo de vértices, definido o primeiro elemento do ciclo de geradores associada fica defi-
nida toda a sequência, pois o par (vi1 , si1 ) inicial fica determinado. Supondo que há uma ambiguidade,
então os dois geradores associados aos lados adjacentes a vi1 mapeiam este em vi2 . Sejam estes ge-
radores gi1 e gi2 , a Figura 6.1 mostra a geração dos únicos ciclos de geradores possı́veis gi1 , gi−1
2
e
gi2 , gi−1
1
, que são o L-ciclo e R-ciclo associados ao ciclo de vértices vi1 → vi2 , respectivamente. 

Corolário 82. Seja gi1 . . . gin e hj1 . . . hjm um L-ciclo e R-ciclo, respectivamente. Logo, se u ∈
S(P(g)) ∩ S(P(h)) então |u| ≤ 1, ou seja, L-ciclos e R-ciclos não possuem fatores em comum de
comprimento maior que um.

Demonstração: Segue da Proposição 81 que a um ciclo de geradores está associada um único ci-
clo de vértices. Portanto, o vértice associado a cada um dos geradores na sequência gi1 gi2 . . . gin é
unicamente determinado, e consequentemente se é um R-ciclo ou um L-ciclo. 
136 Representação de Códigos Geodésicos

No Lema 83 estabelecemos relações entre sequências de geradores obtidas a partir de vértices que
pertencem a um mesmo ciclo de vértices. As relações estabelecidas contemplam os possı́veis casos,
uma vez que são considerados todas as possı́veis combinações de vértices e lados adjacentes tomados
a partir de um ciclo de vértices de referência. Ou seja, para o ciclo v1 → · · · → vn consideram-se os
casos (vi , si ) e (vi , ∗si ) para 1 ≤ i ≤ n.

Lema 83. Sejam os ciclos de vértices v1 → · · · vn e v1′ → · · · vm



com respectivas sequências de

geradores gv1 ,s1 = gn . . . g1 e gv1′ ,s′1 = gm . . . g1′ , com gi associado ao lodo si e gi′ ao lado s′i . Se gv1 ,s1
e gv1′ ,s′1 possuem dois elementos consecutivos iguais, a não ser pelas operações de permutação cı́clica
e inversão, então:

1. gv1 ,s1 = gv1′ ,s′1 se, e somente se, (v1 , s1 ) = (v1′ , s′1 );

2. gv1 ,s1 = Ti gv1′ ,s′1 Ti−1 se, e somente se, (v1 , s1 ) = (vi+1

, s′i+1 ) e Ti = gi′ . . . g1′ ;

3. gv1 ,s1 = gv−1 ′ ′


′ ,s′ se, e somente se, (v1 , s1 ) = (v1 , ∗s1 );
1 1

4. gv1 ,s1 = Ti gv−1


′ ,s′ Ti
−1
se, e somente se, (v1 , s1 ) = (vi′ , ∗s′i ) e Ti = gi′ . . . g1′ .
1 1

Demonstração: A análise que segue é baseada no resultado da Proposição 81, a saber, a uma
sequência de geradores está associado um único ciclo de vértices e a um par (v, s) está associada
uma única sequência de geradores, do que decorre diretamente o caso 1. Para o caso 2, temos que

(vi+1 , s′i+1 ) transita para (vi+2

, ∗s′i+2 ) pela aplicação de gi+1

, seguindo o procedimento para obtenção
′ ′ ′ ′ ′ ′ −1
dos ciclos de vértices obtém-se que gvi+1
′ ,s′i+1 = gi . . . g1 gn . . . gi+1 = Ti (gn . . . g1 )Ti . Para o caso 3,

temos que (v1′ , ∗s′1 ) transita para (vm



, s′m ) pela aplicação de (gm
′ −1
) , seguindo o procedimento para
obtenção dos ciclos de vértices obtém-se que gv1′ ,∗s′1 = (g1′ )−1 . . . (gm ) = gv−1
′ −1
′ ,s′ . O caso 4 é estabe-
1 1
lecida pela aplicação em gv1′ ,s′1 de uma inversão seguida pela determinação do conjugado em relação
a transformação Ti . 

Do Lema 83 conclui-se que o conjunto de vértices de uma região fundamental é particionado em


subconjuntos contendo os vértices que pertencem a um mesmo ciclo de vértices. Pois especificado
um vértice inicial, o ciclo de vértices é preservado a não ser por permutação cı́clica e inversão de
ordem.

6.2 Representação Simbólica de Pontos sobre ∂D2


Iniciando em um vértice vi e lado si associado ao gerador gi , consideremos o ciclo de vértices
vi = w1 , . . . , wn e sequência de geradores associada gi = h1 , . . . , hp . A sequência h−1 −1 −1
1 h2 . . . hp
6.2 Representação Simbólica de Pontos sobre ∂D2 137

horária está em ordem cı́clica à esquerda (L), qualquer sequência de geradores respeitando esta ordem
é denominado um L-ciclo. De outro modo, iniciando no vértice vi+1 e lado si associado ao gerador
gi , obtém-se o ciclo vi+1 = z1 , z2 , . . . , zq e geradores gi = j1 , j2 , . . . , jq . Neste caso, a sequência
j1−1 j2−1 . . . jq−1 anti-horária está em ordem cı́clica à direita (R), qualquer sequência de geradores res-
peitando esta ordem é denominado um R-ciclo. Há inteiros µ, ν satisfazendo (h−1 −1 −1 µ
1 h2 . . . hp ) =
(j1−1 j2−1 . . . jq−1 )ν = Id [30, 46]. Os inteiros pµ e qν representam os números de lados de F que
encontram-se nos vértices vi e vi+1 , respectivamente. Segue da condição de cantos pares que pµ = 2l
e qν = 2k são pares [44]. Os L-ciclo e R-ciclo compostos por 2l e 2k elementos, respectivamente,
são ditos completos, sendo iguais a identidade em Γ.

Definição 39. Dado um L-ciclo completo w de comprimento 2l, os L-ciclos de comprimento l − 1, l


e l + 1 obtidos a partir de w são ditos L D-ciclos, L H-ciclos e L S-ciclos, respectivamente.

Definição 40. Dado um R-ciclo completo w de comprimento 2k, os R-ciclos de comprimento k − 1,


k e k + 1 obtidos a partir de w são ditos R D-ciclos, R H-ciclos e R S-ciclos, respectivamente.

Seguindo a nomenclatura adotada em [45], as denominações acima referem-se a deficient (D),


half (H) e superfluous (S).

Definição 41. O conjunto de todos os L D-ciclos, L H-ciclos e L S-ciclos associados a um conjunto


de geradores simétricos Γ0 de um grupo Fuchsiano Γ são denotados por L D, L H e L S, respecti-
vamente. De forma análoga, o conjunto de R D-ciclos, R H-ciclos e R S-ciclos são denotados por
R D, R H e R S.

Seja h = gi , então definiremos h+ = gi+1 e h− = gi−1 . Se B = b1 . . . br , B 1 = b1 . . . br+1


e C = c1 . . . cs são L-ciclos com c−1
1 = (b−1 +
r+1 ) , B e C são L-ciclos adjacentes ou consecutivas,
Figura 6.2. Analogamente, se B, B 1 e C são R-ciclos e c−1 −1 −
1 = (br+1 ) , então B e C são R-ciclos
consecutivos, Figura 6.3. Uma sequência B1 . . . Br é dita uma L-cadeia se Bi , Bi+1 são L-ciclos
consecutivos, 1 ≤ i < r. Quando B1 e Br são L H-ciclos e B2 , . . . , Br−1 são L D-ciclos, então
B1 . . . Br é chamada uma L H-cadeia. Caso B1 seja um L D-ciclo então B1 . . . Br é dita uma
L D-cadeia. As L H-cadeias são representadas por HD . . . DH, e as L D-cadeias por D . . . DH.
Analogamente, uma cadeia com um L-ciclo inicial arbitrária p seguida por uma cadeia de L D-ciclos
e terminando com um L H-ciclo é representada por pDD . . . DH, seguindo-se uma representação
análoga para L-cadeias formadas por L-ciclos arbitrárias.

Definição 42. O conjunto de todas as L H-cadeias associadas a um conjunto de geradores simétricos


Γ0 de um grupo Fuchsiano Γ são denominados L H C.
138 Representação de Códigos Geodésicos

−1 +
c−1
1 = (br+1 ) b−1
r

b−1
r+1 b−1
r+1

b−1
r c−1 −1 −
1 = (br+1 )

Figura 6.2: L-ciclo consecutivos. Figura 6.3: R-ciclo consecutivos.

Como decorrência do emprego da teoria de linguagem formal ao estudo dos códigos geodésicos,
interpretaremos o conjunto de geradores Γ0 do grupo Fuchsiano como um alfabeto finito, especifican-
do-o por A, quando for adequado (análises envolvendo essencialmente teoria de linguagens formais).
Proposição 84. [45] Uma sequência e1 . . . ep , ei ∈ Γ0 , é admissı́vel se, e somente se, não possui
fatores no conjunto O formado pelas sequências finitas
1. gg −1, g ∈ Γ0 ;
2. Todos os R H-ciclos;
3. Todos os L S-ciclos;
4. Todas as L H-cadeias.
A Proposição 84 especifica um conjunto de proibições O associado às expansões simbólicas de
pontos no bordo ∂D2 . No Teorema 86 demonstramos que este conjunto é irredutı́vel, para isso preci-
saremos do resultado apresentado no Lema 85. Enfatizamos as considerações sobre a região funda-
mental e expressas na Seção 6.1, temos que pµ e qν são iguais ou maiores que quatro.

Lema 85. R-ciclos não possuem fatores de comprimento maior que um em comum com L-ciclos e
L-cadeias.

Demonstração: Do Corolário 82 um R-ciclo não poderá ter fatores em comum com um L-ciclo de
comprimento maior que um. Logo, resta provar que dados B e C, dois L-ciclos, tais que, BC forma
uma cadeia, BC não possui um R-ciclo de comprimento maior que um como fator.
Sejam B = b1 . . . br e C = c1 . . . cs L-ciclos com os geradores c−1 −1 + −1
1 = (br+1 ) , br , br+1 associados
aos lados s1 , s2 , s3 , respectivamente. Como mostra a Figura 6.4, se essa concatenação gera um R-
ciclo, então o lado s1 está a esquerda de s2 , s3 está a direita de s2 , além disso s1 e s3 são adjacentes
pela definição de b−1 −1 +
r+1 e (br+1 ) . Portanto, os lados s1 , s2 , s3 formam um triângulo, contrariando a
hipótese sobre a região fundamental. 
6.2 Representação Simbólica de Pontos sobre ∂D2 139

b−1 (b−1 +
r+1 b r+1 ) b

br s3 b−1
r+1 s3
b b
(b−1 +
r+1 ) br
s2 s2
b b

b s1 b s1

Figura 6.4: Configuração ao Figura 6.5: Configuração ao


considerar-se um R-ciclo como considerar-se uma sequência gg −1
fator de uma L-cadeia. como fator de uma L-cadeia.

Teorema 86. O conjunto de proibições O é irredutı́vel.

Demonstração: A condição de necessidade e suficiência expressa na Proposição 84 implica que é


suficiente demonstrar que nenhuma das sequências em O é fator próprio de outra.
Como vértices de F não são interiores a segmentos de geodésicas em ∂F e pµ e qν são números
pares, segue que os ciclos completos têm comprimento maior ou igual a quatro. Portanto, os R H-
ciclos, L S-ciclos e as L H-cadeias têm comprimento pelo menos dois, não existindo sequências
proibidas de comprimento um, logo as restrições gg −1 não possuem fatores próprios em O, g ∈ Γ0 .
Além disso, como os ciclos de geradores não possuem fatores da forma gg −1, então os R H-ciclos
e L S-ciclos também não os possuem. No caso das L H-cadeias o fator gg −1 só poderia ocorrer
entre L-ciclos que compõem as L H-cadeias HD . . . DH. Neste caso, na concatenação dos L-ciclos
B = b1 . . . br e C = c1 . . . cs ocorreria c−1
1 = (b−1
r+1 )
+
= br . Como mostra a Figura 6.5, se os
geradores br , b−1 −1 +
r+1 , (br+1 ) estão associados aos lados s1 , s2 , s3 , respectivamente, então s1 = s3 e,
portando, a região fundamental só teria dois lados, uma contradição.
Segue do Lema 85 que R H-ciclos não podem ser fatores de L S-ciclos e L H-cadeias, e vice-
versa. Portanto, resta provar que L S-ciclos e L H-cadeias não podem ser fator uns dos outros. O
que segue da relação entre seus comprimentos e da definição de uma L H-cadeia.
Uma L H-cadeia não pode ser fator de um L S-ciclo. Caso contrário, como decorrência da
Proposição 81, a L H-cadeia e o L S-ciclo estão associados ao mesmo ciclo completo. No entanto a
L H-cadeia é da forma HDD . . . H, logo seu comprimento é pelo menos o comprimento do L S-ciclo
mais um (referente ao L H-ciclo terminal), não podendo ser fator deste.
Um L S-ciclo não pode ser fator de uma L H-cadeia. Caso contrário, isso implicaria que a
concatenação de um L H-ciclo com um L D-ciclo, ou a concatenação de L D-ciclos, forma o fator
de um L-ciclo completo. O que contradiz a definição de uma L H-cadeia, pois terı́amos que na
concatenação BC dos L-ciclos B = b1 . . . br e C = c1 . . . cs , ocorreria b−1 −1 +
r+1 = (br+1 ) = c−1
1 e,
portanto, que b−1 −1 +
r+1 e (br+1 ) estão associados ao mesmo lado da região fundamental, contrariando o
processo de construção das cadeias de ciclos. 

A propriedade de ciclicidade dos ciclos de geradores possibilita a obtenção de resultados relevan-


140 Representação de Códigos Geodésicos

tes quando do estudo das sequências de geradores através dos conceitos de conjuntos de proibições.
A noção de ciclicidade faz-se precisa pelo conceito de permutação cı́clica, seja c = c1 . . . ck uma
sequência qualquer, a permutação cı́clica de ordem n de c é dada por ln = l1 · ln−1 (c), onde l1 (c) =
c2 c3 . . . ck c1 .
Particularmente, dado um conjunto proibido irredutı́vel F associado ao ssf XF sobre um alfabeto
A, para todo v ∈ B(XF ) uma condição de necessidade para q ∈ Cv é que q ∈ S(A−1 F) e exista
p ∈ S(v) tal que pq ∈ F, satisfeito isso, a condição de suficiência requer que q não possua fatores
próprios em Cv . Se F possui um elemento w cı́clico, ou seja, para todo n ∈ Z tem-se que ln (w) ∈ F,
demonstramos no Lema 87 que a determinação dos elementos de Cv pode ser simplificada.

Lema 87. Suponha w ∈ F tal que ln (w) ∈ F para todo n ≥ 0. Seja v ∈ P(wA−1), |v| > 0. Se
p ∈ S(A−1 v), |p| > 0, então v −1 w é prefixo de p−1 ln (w), onde n = |v| − |p|.

Demonstração: Como p ∈ S(v), então existe u ∈ P(v) tal que v = up, logo v −1 w = (up)−1 w =
p−1 (u−1w), do que segue que v −1 w é prefixo de p−1 ln (w) uma vez que u−1 w é prefixo de ln (w). 

Segue do Lema 87 que para todo w ∈ F, um elemento cı́clico, para qualquer v ∈ P(wA−1) não
nulo e p ∈ S(A−1 v), a sequência p−1 ln (w) não pertence a Cv .

Proposição 88. O conjunto de restrições de w = w1 w2 . . . wn ∈ P(R H · A−1 ), |w| > 0, é dado por
Cw = {wn−1, w −1 R H, wn−1L S, wn−1L H C}.

Demonstração: Como gg −1 ∈ O, g ∈ Γ0 , então wn−1 ∈ Cw . Segue do Lema 87 que para todo


v ∈ S(w), |v| > 0, w −1 R H é prefixo de v −1 R H e como o conjunto O é irredutı́vel, w −1 R H não
possui prefixos nos conjuntos (S(w))−1 L S e (S(w))−1 L H C. Do que segue que w −1R H ∈ Cw .
Do Corolário 82 obtém-se que S(w) ∩ P(L H ∪ L H C) = {ε, wn }. Seja wn−1 L S = H
e wn−1 L H C = {D1 D2 . . . Di Hi+1 }∞ −1
i=1 . Isto implica que wn L S não pode ser prefixo de uma
sequência em wn−1L H C, pois, tomado um ciclo de vértices como referência, |H| > |D1 | e |H| ≤
|D1 D2 |, caso contrário haveria H-ciclos contendo cadeias de L-ciclos como fator. De forma mais
direta, pelo mesmo motivo L-ciclos em wn−1 L S não podem ter prefixos em wn−1 L H C. Concluimos
que {wn−1 L S, wn−1 L H C} ⊆ Cw . 

Proposição 89. O conjunto de restrições de w = w1 w2 . . . wn ∈ P(L S · A−1 ), |w| > 0, é dado por
Cw = {wn−1, wn−1 R H, w −1L S, w −1L H C}.

Demonstração: Como gg −1 ∈ O para todo g ∈ Γ0 , então wn−1 ∈ Cw . Do Corolário 82, S(w) ∩


P(R H) = {ε, wn }, e do Lema 85 wn−1R H não possui prefixos em S(w)−1 L S e S(w)−1 L H C.
Como ciclos não possuem fatores gg −1, g ∈ Γ0 , então wn−1 R H ∈ Cw .
6.2 Representação Simbólica de Pontos sobre ∂D2 141

Segue do Lema 87 que w −1 L S é prefixo de v −1 L S para todo v ∈ S(w), |v| > 0. Além
disso, como o conjunto O é irredutı́vel, w −1 L S não pode ser fator dos elementos em w −1 L H C
e vice-versa. No entanto w −1 L S é fator de todo elemento em v −1 L H C tal que v ∈ S(A−1 w),
|v| > 0. O que decorre de w(w −1L S) ser prefixo de (wv −1 ) · v(v −1 L H) já que |w(w −1L S)| =
|H| + 1 −|w| + |w| = |H| + 1 e |(wv −1) · v(v −1 L H)| = |H| −|v| + |v| + (|w| −|v|) = |H| + |w| −|v|,
onde |w| − |v| ≥ 1. Como gg −1 ∈ O, g ∈ Γ0 , não pode ser fator das sequências em L S e L H C.
Conclui-se que {w −1 L S, w −1 L H C} ⊆ Cw . 

Referenciando a Proposição 88, notamos que os elementos wn−1, w −1 R H, wn−1 L S e wn−1 L H C


não são só suficientes para determinação do conjunto Cw , mas necessários. Como exemplo, temos que
Cw \{wn−1L H C} = {wn−1 , wn−1R H, wn−1 L S} o que permanece válido se wn−1L H C for permutado
com quaisquer dos elementos à direita na expressão. Considerando w = w1 . . . wn ∈ P(R H · A−1 ),
como O é irredutı́vel então wn−1 não é igual a w −1 R H, wn−1 L S ou pertence a wn−1L H C, caso
contrário wn wn−1 seria igual a wn (w −1R H), wn (wn−1 L S) ou pertenceria a wn (wn−1 L H C). Segue
do Corolário 82 que w −1 R H não pode pertencer a wn−1 L S ∪ wn−1L H C, caso contrário o R-
ciclo wn (w −1 R H) de comprimento maior que um pertenceria ao conjunto de L S-ciclos e L-cadeias
wn (wn−1L S ∪ wn−1 L H C). Por fim, wn−1 L S ∈
/ wn−1L H C, caso contrário o L S-ciclo wn (wn−1 L S)
conteria cadeias de L-ciclos.
De forma análoga, mas agora referenciando a Proposição 89, consideremos w = w1 . . . wn ∈
P(L S · A−1 ). Como O é irredutı́vel, temos que wn−1 não é igual a wn−1R H, w −1L S ou pertence a
w −1 L H C. Segue do Corolário 82 que wn−1R H não pertence a w −1 L S ∪ w −1 L H C. Finalmente,
w −1 L S ∈
/ w −1 L H C, caso contrário o L S-ciclo w(w −1L S) conteria cadeias de L-ciclos.
Sabendo que o conjunto O é irredutı́vel, uma forma de estabelecer o resultado que o código
geodésico gera um ssr é provar que existe um número finito de possı́veis conjuntos de restrições
{Cw }w∈B(Xg ) . Há duas formas de {Cw }w∈B(Xg ) ser finito, a primeira é trivial, e ocorre quando P(OA−1 )
é finito. Neste caso os conjuntos de restrições também são finitos já que são subconjuntos de S(A−1 O).
No segundo caso, apesar do conjunto O ser infinito, suas propriedades estruturais podem ser aplicadas
para determinar-se o conjunto {Cw }w∈B(Xg ) finito. É este o princı́pio do Teorema 92.
Como consequência das restrições decorrentes das L H-cadeias, para todo w ∈ B(Xg ), o conjunto
Cw é infinito. Contudo, o sub-conjunto de Cw formado pelas sequências decorrentes das restrições
gg −1, g ∈ Γ0 , dos R H-ciclos e dos L S-ciclos é finito, já que a união destas sequências gera
um conjunto finito. Associado a isso, a despeito do conjunto de L H-cadeias ser infinito, pode-se
demonstrar como decorrência do Lema 90 que os possı́veis conjuntos de restrições determinados por
este é finito. Estabelecido isso, temos que o conjunto de restrições {Cw }w∈B(Xg ) é finito.
A seguir faremos uso das nomenclaturas {L H C, L S, R H}-prefix, sufixo, restrições para de-
nominar prefixos, sufixos e restrições associados aos elementos dos conjuntos L H C, L S, R H,
142 Representação de Códigos Geodésicos

respectivamente.

Lema 90. Seja v um L H C-prefixo, v = H1 D1 . . . Dn p, |p| > 0. As L H C-restrições de v em Cv


são da forma

pq = H,
q: (6.1)
pq = D . . . DH.

Demonstração: Estabelecemos inicialmente que u−1 L H C ∈ Cv onde u ∈ S(v), somente se u = v.


Suponha que v possui um sufixo próprio não nulo u, satisfazendo uq ∈ L H C para um q inicialmente
arbitrário. Quanto a forma de u, consideramos os dois possı́veis casos: (i) u é uma L H-cadeia
satisfazendo u = sDj . . . Dn p tal que s ∈ S(A−1 H1 ) ou s ∈ S(Di ), onde 1 ≤ i, j ≤ n; (ii) u é um
L-ciclo satisfazendo u ∈ S(p), |u| > 0. Considerando inicialmente o caso (i).

(i) Supondo que sDD . . . Dpq = HDD . . . DH, isto implica que o primeiro L H-ciclo é formado
por cadeias de L-ciclos de comprimento menor que o seu, uma contradição;

(ii) Neste caso, existe q ′ satisfazendo uq ′ = H, permitindo a formação da cadeia (uq ′ )DD . . . DH ∈
L H C. Portanto, como há w tal que pw é um L H-ciclo, ou seja, vw ∈ L H C, têm-se que
w ∈ P(q ′ ) e portanto q ′ DD . . . DH ∈
/ Cv .

Segue de (i) e (ii) que se q é uma L H C-restrição de v então vq ∈ L H C. Portanto, q só poderá ser
da forma especificada em (6.1). Como O é irredutı́vel, as R H-restrições de v não são prefixos de
suas L H C-restrições. Além disso, como |p−1 L S| > |p−1 L H| > |p−1 L D| então as L S-restrições
de v não são prefixos de q. Já que q não possui prefixos próprios entre as sequências satisfazendo
(6.1), como consequência de O ser irredutı́vel, conclui-se que q ∈ Cv . 

Proposição 91. Seja v = HD . . . Dp, |p| > 0, um L H C-prefixo próprio e w um L S-prefixo


satisfazendo p = A−1 w, então Cv = Cw .

Demonstração: Inicialmente observe que, em decorrência da ciclicidade das L S sequências con-


tidas em O, o fato de p ser um fator não nulo de um L S-prefixo implica que ele também é um
L S-prefixo, portanto possuindo as propriedades comuns aos elementos deste conjunto.
Segue da Proposição 89 e do fato de p ser um sufixo não nulo do L S-prefixo w = w1 . . . wn
que {wn−1 , wn−1 R H} ⊆ Cv , pois do Lema 85 wn−1 R H não possui prefixos entre as L S-restrições e
L H C-restrições. Além disso as L H C-restrições de w contidas no conjunto Cw formam o conjunto
w −1 L H C = {qD . . . DH}, tal que wq ∈ L H. Como p é sufixo de w e |w| = |p| + 1, se qD . . . DH
é uma L H C-restrição de w então HD . . . D(pq)D . . . DH ∈ L H C pois pq ∈ L D, decorrendo do
Lema 90 que qD . . . DH é uma L H C-restrição de v em Cv .
6.2 Representação Simbólica de Pontos sobre ∂D2 143

Por outro lado, considerando s ∈ Cv uma L H C-restrição de v, de acordo com o Lema 90,
podemos ter dois casos:

(i) Se s é um L-ciclo satisfazendo ps ∈ L H, então ws ∈ L S uma vez que p−1 L H = (A−1 w)−1 L H
= w −1 [(A · L H) ∩ L S] = w −1L S, consequentemente s ∈ Cw é uma L S-restrição de w;

(ii) Se s = qD . . . DH é uma L-cadeia satisfazendo pq ∈ L D, então wq ∈ L H e, portanto, s é uma


L H C-restrição de w.

Finalmente, segue do Lema 87 que w −1L S é um prefixo próprio de p−1 L S, como p−1 L H =
w −1 L S é uma L H C-restrição de v então p−1 L S ∈
/ Cv . Conclui-se que o conjunto formado pelas
L S-restrições, L H C-restrições e R H-restrições de v e w são iguais, portanto Cv = Cw . 

Na Proposição 91, como cada gerador do grupo fuchsiano está associado a um único L-ciclo,
especificado p a sequência w fica unicamente determinada e sempre vai existir por ser o fator de um
L-ciclo completo.

Teorema 92. Dado um código geodésico Xg , o conjunto {Cw }w∈B(Xg ) é finito.

Demonstração: Como em cada vértice da região fundamental F encontra-se um número finito de


suas imagens {gF }g∈Γ (não há elementos parabólicos), então há um número finito de conjuntos de
restrições Cw associados aos prefixos próprios w das sequências em R H ∪ L S ∪ {gg −1}g∈Γ0 , uma
vez que cada um dos conjuntos que compõem esta união é finito.
Da Proposição 91, os possı́veis conjuntos de restrições gerados pelos L H C-prefixos é finito, uma
vez que o conjunto de restrições Cv de um L H C-prefixo v = HD . . . Dp é determinado por p, como
o conjunto P(L D) de possı́veis prefixos de L D-ciclos é finito, então o conjunto {Cv }v∈P(LHCA−1 )
também é finito. Além disso, decorre da mesma proposição que este conjunto de restrições está
contido naquele dos L S-prefixos próprios de comprimento maior que um. 

Proposição 93. R H-prefixos próprios distintos possuem conjuntos de restrições distintos.

Demonstração: Dados os R H-prefixos próprios distintos v = v1 . . . vn e w = w1 . . . wm , serão


considerados os dois únicos casos possı́veis, a saber, (i) vn = wm e (ii) vn 6= wm .

(i) Como w 6= v então w −1 R H =


6 v −1 R H. No entanto wm
−1
= vn−1 , wm
−1
L S = vn−1 L S e
−1
wm L H C = vn−1 L H C, do que segue que Cw 6= Cv .
−1
(ii) Inicialmente, observe que |wm L S|, |vn−1L S| ≥ 2, uma vez que ciclos completos possuem com-
−1
primento pelo menos quatro, disso segue que wm 6 vn−1 . Além disso, do Corolário 82 segue
LS =
−1
que wm L S 6= v −1 R H, caso contrário essas sequências possuiriam fatores de comprimento maior
144 Representação de Códigos Geodésicos

−1
que dois em comum. Finalmente, wm / {vn−1 L S, vn−1 L H C}, pois especificada uma posição
LS ∈
−1
em um L-ciclo e o elemento associado, o ciclo é unicamente determinado. Como wm L S ∈ Cw e,
−1
no entanto, wm LS ∈
/ Cv , conclui-se da Proposição 88 que Cw 6= Cv .

Proposição 94. L S-prefixos próprios distintos possuem conjuntos de restrições distintos.

Demonstração: Dados os L S-prefixos próprios distintos v = v1 . . . vn e w = w1 . . . wm , serão


considerados os dois únicos casos possı́veis, a saber, (i) vn = wm e (ii) vn 6= wm .
−1
(i) Neste caso temos que wm = vn−1 e wm
−1
R H = vn−1 R H, portanto, resta provar que v −1 L S ∈
/
(w −1 L S ∪ w −1 L H C) o que da Proposição 89 implica que Cv 6= Cw . Como w e v estão associados
ao mesmo L-ciclo, pois possuem os elementos un e wm iguais, temos necessariamente que para
serem distintos é preciso que |w| =
6 |v|. Consideramos, sem perda de generalidade, que |w| < |v|,
logo v −1 L S =
6 w −1 L S pois |w(w −1L S)| = |v(v −1L S)|. Como as sequências em w −1L H C
sempre conterão L-cadeias, pois |w| < |w(w −1L H)|, então v −1 L S ∈
/ w −1 L H C. Concluı́mos
que v −1 L S ∈
/ Cw .

(ii) Supondo o subconjunto A = {pD . . . DH} de L H C-restrições com sequências satisfazendo


a condição |p| > 0 e |L D · p−1 | > 0, ou seja, p é um sufixo próprio não nulo de um L D-
ciclo. Portanto, há um único L S-prefixo possı́vel w ∈ P(L H) ∩ L H C · (pD . . . DH)−1 . Sendo
caracterizado pela propriedade wp ∈ L H.
Novamente considerando o subconjunto A = {pDD . . . DH} de L H C-restrições, mas agora su-
pondo que p ∈ L D, então P(L H) ∩ (L H C · (pD . . . DH)−1 ) = {w, v}, sendo os dois casos
possı́veis determinados pelas relações w ∈ L H e vp ∈ L H, o que implica que |v| = 1. Por-
tanto, segue da Proposição 89 que o conjunto Cv é composto pelas restrições v −1 L S ∈ L H, vn−1 ,
vn−1 R H e v −1 L H C, esta última formada por L-cadeias da forma {D . . . DH}. Desta forma, as
restrições podem ser separadas em quatro tipos: um L H-ciclo, uma sequência de comprimento
um (o inverso de vn ), um R-ciclo (podendo ter comprimento um), e um conjunto de L-cadeias com
número infinito de elementos.
Já Cw é composto por um total de cinco tipos de restrições, sendo estas: w −1 L S = wm+1 ,
−1 −1
wm , wm R H, L H ∩ w −1 L H C e w −1 L H C\L H, esta última formada por L-cadeias da forma
{D . . . DH}. Portanto, as restrições podem ser separadas em cinco tipos: o elemento wm+1 subse-
quente a wm em um L-ciclo, o inverso de wm , uma R-sequência (podendo ter comprimento um),
um L H-ciclo e um conjunto de L-cadeias com número infinito de elementos.
Para que Cv = Cw é necessário que os subconjuntos infinitos de L-cadeias correspondentes sejam
iguais. Sendo as outras restrições associadas aos conjuntos Cv e Cw dadas por {vn−1 , vn−1 R H,
6.3 Códigos de Artin para o Caso da Tesselação {12, 4} 145

v −1 L S} e {wm
−1 −1
, wm R H, w −1L S, w −1 L H C ∩ L H}, respectivamente. Como estes conjuntos
possuem cardinalidades distintas, conclui-se que Cv e Cw são distintos.

Proposição 95. Sejam w = w1 . . . wm ∈ P(L S · A−1) e v = v1 . . . vn ∈ P(R H · A−1 ) sequências


não nulas. Então Cw = Cv se, e somente se, w = v.

Demonstração: As L-cadeias pertencentes ao conjunto Cv são da forma D . . . DH, tal que, vn D . . .


DH ∈ L H C. Sendo as demais restrições dadas por vn−1 L S, v −1 R H e vn−1 . Portanto, para que
Cw possua o mesmo conjunto de L-cadeias, deve-se ter (i) w ∈ L H ou (ii) |w| = 1, pois são os
dois únicos casos onde as L H C-restrições são da forma D . . . DH. Neste caso, considerando-se a
Proposição 89 e a Proposição 88, tem-se:

(i) Além das L-cadeias, o conjunto Cw possui os elementos w −1 L H C ∩ L H, wm


−1 −1
, wm R H,
w −1L S. Portanto, Cw é distinto de Cv já que este último só possui três restrições além das L-
cadeias, enquanto o primeiro possui quatro.

(ii) Como os subconjuntos das restrições formados pelas L-cadeias são iguais e |w| = 1, então
vn = w. Seque que os conjuntos {vn−1 , vn−1 L S, v −1 R H} e {w −1, w −1 L S, w −1 R H} das demais
restrições em Cv e Cw , respectivamente, devem ser iguais. Como vn−1 = w −1 e vn−1 L S = w −1 L S
(pois vn−1 L S e w −1 L S são as únicas L-sequências de comprimento maior que um em Cv e Cw ,
respectivamente), deve-se ter v −1 R H = w −1 R H para que Cv = Cw , do que segue que |v| =
|w| = 1 e v = w.

6.3 Códigos de Artin para o Caso da Tesselação {12, 4}


O objetivo desta seção é exemplificar a determinação dos conjuntos definidos nas seções anteriores
e demonstrar como os resultados obtidos podem ser aplicados na construção de uma representação
determinı́stica e com número mı́nimo de vértices para o código de Artin, apresentado no Capı́tulo 5.
Faremos uso da tesselação {12, 4}, que refere-se ao caso {8g − 4, 4} estudado em [9], para g =
2. Apresentamos na Figura 6.6 a região fundamental e identificação de arrestas associadas a essa
tesselação.
Inicialmente devemos especificar os conjuntos relevantes de ciclos de geradores para determinação
do conjunto O, do qual determinaremos os possı́veis conjuntos de restrições {Cw }w∈B(Xg ) e, portanto,
como demonstrado no Capı́tulo 3, o conjunto de estados de nossa representação.
146 Representação de Códigos Geodésicos

g1 F
7
8 6
g1
9 5
F
10 4

11 3

12 2
1
D

Figura 6.6: Região fundamental e identificação de arestas da tesselação {12, 4}.

Sequências de geradores associadas aos L-ciclos de vértices gerados a partir dos pares de vértices
e lados (v1 , s1 ), (v10 , s10 ) e (v6 , s6 ) são especificados em (6.2), respectivamente. Exemplificando o
processo para o par (v1 , s1 ) pela aplicação do método apresentado na Seção 6.1, onde “∗” denota
g1 ∗ g8
a reflexão de uma aresta em torno de um vértice, obtemos, (v1 , s1 ) −→ (v8 , s7 ) −→ (v8 , s8 ) −→
∗ g7 ∗ g2
(v7 , s6 ) −→ (v7 , s7 ) −→ (v2 , s1 ) −→ (v2 , s2 ) −→ (v1 , s12 ), com os demais determinados de forma
análogo.
{g1 g8 g7 g2 , g10 g5 g4 g11 , g6 g9 g12 g3 }. (6.2)

Observamos que todos os elementos do conjunto simétrico de geradores Γ0 ocorrem em uma, e só
uma, das sequências em (6.2). Portanto, este conjunto contém todas as sequências possı́veis, a não
ser por uma permutação cı́clica. De forma similar, em (6.3) apresentamos as possı́veis sequências
de geradores associadas aos R-ciclos de vértices, considerando os pares de vértices e lados (v2 , s1 ),
(v11 , s10 ) e (v3 , s2 ), respectivamente. Exemplificando o processo para o par (v2 , s1 ) obtemos, (v2 , s1 )
g1 ∗ g6 ∗ g7 ∗ g12
−→ (v7 , s7 ) −→ (v7 , s6 ) −→ (v8 , s8 ) −→ (v8 , s7 ) −→ (v1 , s1 ) −→ (v1 , s12 ) −→ (v2 , s2 ), com os
demais determinados de forma análogo.

{g1 g6 g7 g12 , g10 g3 g4 g9 , g2 g11 g8 g5 }. (6.3)

Com relação a (6.2), observamos que às transformações associadas as sequências de geradores apre-
sentadas são iguais a identidade, ou seja, g2 g7 g8 g1 = g11 g4 g5 g10 = g3 g12 g9 g6 = Id. Portanto,
de acordo com a Definição 39, essas sequências podem ser empregadas diretamente na determinação
dos L-ciclos completos, só sendo necessária a troca de cada um dos dı́gitos da sequência pelo seu
inverso em Γ0 e subsequente especificação das possı́veis permutações cı́clicas. Aplicando essas
transformações em (6.2) listamos os possı́veis L-ciclos completos em (6.4). Para exemplificação,
6.3 Códigos de Artin para o Caso da Tesselação {12, 4} 147

tomemos a sequência de geradores g1 g8 g7 g2 , tracando cada um dos elementos por seu inverso em
Γ0 obtemos a sequência g7 g6 g1 g12 , todas as permutações cı́clicas desta sequência gera a primeira
linha em (6.4).
{g7 g6 g1 g12 , g6 g1 g12 g7 , g1 g12 g7 g6 , g12 g7 g6 g1 }
{g8 g11 g2 g5 , g5 g8 g11 g2 , g2 g5 g8 g11 , g11 g2 g5 g8 } (6.4)
{g4 g3 g10 g9 , g9 g4 g3 g10 , g10 g9 g4 g3 , g3 g10 g9 g4 }
Empregando o mesmo procedimento com relação às sequências em (6.3), mas agora utilizando a
Definição 40, listamos todas os possı́veis R-ciclos completos em (6.5).

{g7 g8 g1 g2 , g8 g1 g2 g7 , g1 g2 g7 g8 , g2 g7 g8 g1 }
{g4 g5 g10 g11 , g5 g10 g11 g4 , g10 g11 g4 g5 , g11 g4 g5 g10 } (6.5)
{g12 g9 g6 g3 , g9 g6 g3 g12 , g6 g3 g12 g9 , g3 g12 g9 g6 }

Como os L-ciclos e R-ciclos completos possuem comprimento quatro, os L H-ciclos são formados
por todos os prefixos (ou fatores) de comprimento dois em (6.4), os L S-ciclos pelos prefixos (ou
fatores) de comprimento três e os L D-ciclos pelos prefixos (ou fatores) de comprimento um. De
forma similar definimos R-ciclos relevantes a partir dos ciclos em (6.5). A partir da Proposição 84, o
ssf gerado pelo código aritmético do fluxo geodésico Xg é determinado pelo conjunto de proibições
irredutı́veis O = L S ∪ L H C ∪ R H ∪ {gg −1}g∈Γ0 . Em (6.6) apresentamos o conjunto de L S-
ciclos, em (6.7) o conjunto de R H-ciclos e em (6.8) alguns elementos do conjunto de L H-cadeias,
lembrando que esse conjunto é infinito.

 g g g, g g g , g g g, g g g ,
 7 6 1 6 1 12 1 12 7 12 7 6


LS = g8 g11 g2 , g5 g8 g11 , g2 g5 g8 , g11 g2 g5 , (6.6)


 g g g , g g g, g g g, g g g

4 3 10 9 4 3 10 9 4 3 10 9


 g g, g g, g g, g g,
 7 8 8 1 1 2 2 7


RH= g4 g5 , g5 g10 , g10 g11 , g11 g4 , (6.7)


 g g, g g, g g, g g

12 9 9 6 6 3 3 12
148 Representação de Códigos Geodésicos




 g7 g6 g6 g6 g1 ,


g7 g6 g6 g6 g6 g1 ,






g g g12 g12 g12 g7 ,


 1 12


..
LHC = . (6.8)


g2 g5 g1 g5 g1 g5 g1 g12 ,






g4 g3 g3 g3 g3 g3 g3 g10




 ...


Nosso objetivo é determinar o conjunto {Cw }w∈P(OA−1 ) , a partir do qual determinaremos uma apresen-
tação determinı́stica mı́nima para o código, como apresentado na Seção 3.12. Para isso faremos uso
dos resultados da Seção 6.2, empregando-os para guiar-nos na especificação de um método simples
de obter a representação.

1. A partir da Proposição 94, para quaisquer v, w ∈ P(L S · A−1 ) satisfazendo v 6= w, temos que
Cv 6= Cw . Listamos em (6.9) os prefixos próprios desse conjunto, empregando (6.6).



 g7 g6 , g6 g1 , g1 g12 , g12 g7 ,


g g , g g , g g, g g,


 8 11 5 8 2 5 11 2


P(L S · A−1 ) = g4 g3 , g9 g4 , g10 g9 , g3 g10 , (6.9)


g1 , g2 , g3 , g4 , g5 , g6 , g7 , g8 ,






 g , g , g , g ,ε

9 10 11 12

2. A partir da Proposição 93, para quaisquer v, w ∈ P(R H · A−1) satisfazendo v 6= w, temos


que Cv 6= Cw . Além disso, a partir da Proposição 95, como os elementos em R H possuem
comprimento dois, então P(R H · A−1) ⊂ P(L S · A−1). Portanto, até o momento, as sequências
relevantes já encontram-se presentes em (6.9).

3. A partir da Proposição 91, para todo v = HD . . . Dp, |p| > 0, um L H C-prefixo próprio, o
conjunto Cv é igual ao de uma das sequências em (6.9).

4. O conjunto dos prefixos próprios de {gg −1}g∈Γ0 sempre estará contido no conjunto de prefixos
próprios de L S, ou seja, independente do conjunto O.

Assim, temos em (6.9) o conjunto de sequências necessárias e suficientes para determinar o conjunto
{Cw }w∈B(Xg ) , formando o nosso conjunto V de estados. Para a construção do grafo, precisamos
determinar seus ramos e respectivos rótulos, fazendo uso da construção apresentada na Seção 3.12.
6.3 Códigos de Artin para o Caso da Tesselação {12, 4} 149

g7 g6
g8 g11 g6 g1
g6
g7 g6
g11 g1
g8 g7 g5
g9 g4 g5 g8
g8 g6
g4 g8
g9 g9 g7 g5 g4
g8 g6
g9 g5
g10 g9 g9 g10 g10 g4 g4 g3
ε g4 g3
g10 g11
g3 g3
g11 g12 g2 g3
g1
g2
g12 g2 g10
g11 g2 g1 g2 g3 g10
g11
g7 g5
g12
g12 g1
g12 g7 g2 g5
g1 g12

Figura 6.7: Autômata inicial parcial do código para tesselação {12, 4}.

Portanto, para w, v ∈ P(L S · A−1 ) e a ∈ A (com A = {a}a∈Γ0 sendo o alfabeto da linguagem do


código), existe um ramo do estado Cv para o estado Cw com rótulo a, se Cva = Cw . Na determinação
dos ramos do grafo, é necessário destacar o caso em que v ∈ L H e va forma uma L-cadeia, pois a
determinação do estado terminal do ramo é baseado na Proposição 91. Neste caso w ∈ P(L S · A−1 ),
|w| = 2, deve satisfazer a equação a = A−1w.
Para facilitar a visualização, representaremos as classes de equivalência determinadas a partir dos
conjuntos de restrições à direita pela única sequência em (6.9) que pertence à classe. Na Figura 6.7
apresentamos o autômato inicial parcial, onde é apresentado o estado inicial ε, as transições a partir
g1
desse (e.g., ε −→ g1 ), as transições de estados cujo rótulo são sequências de comprimento um para
g12
aqueles cujo rótulo são sequências de comprimento dois (e.g., g1 −→ g1 g12 ), por fim, as transições
dos estados cujos rótulos pertencem ao conjunto P(L S · A−1 ) e que quando concatenados com o
rótulo do ramo geram uma L-cadeia, portanto, o próximo estado é determinado pela aplicação da
g12
Proposição 91 (e.g., g1 g12 −→ g12 ). As demais transições podem ser determinadas de forma direta
pelo emprego da Proposição 89, não apresentadas pela complexidade resultante que isso acarretaria à
figura.
Para fins de exemplificação, consideremos a determinação dos ramos, rótulos e vértices terminais,
150 Representação de Códigos Geodésicos

respectivos, associados aos vértices g6 e g4 g3 . Escolhemos estados cujos rótulos são sequências de
comprimento distinto, no caso um e dois, pois a estrutura das transições a partir de estados com
rótulos de mesmo comprimento são semelhantes. No caso do estado g6 temos que g6−1 · R H = g3
e g6−1 · {gg −1}g∈Γ0 = g8 , sendo os únicos sı́mbolos proibidos a partir do estado g6 , o conjunto de
transições possı́veis é apresentado em (6.10).

g1
 −→ g2 g4 g5 g6
g6 g1 , −→ g2 , −→ g4 , −→ g5 , −→ g6 ,
g6 g7 g9 g10 g11 g12
(6.10)
 −→ g , −→ g , −→ g , −→ g , −→ g .
7 9 10 11 12

No caso do estado g4 g3 temos que g3−1 ·R H = g12 , (g4 g3 )−1 L S = g10 e g3−1 ·{gg −1}g∈Γ0 = g5 , sendo
os únicos sı́mbolos proibidos a partir do estado g4 g3 , o conjunto de transições possı́veis é apresentado
em (6.11). 
g1
 −→ g2 g3 g4 g6
g1 , −→ g2 , −→ g3 , −→ g4 , −→ g6 ,
g4 g3 g7 g8 g9 g11
(6.11)
 −→ g7 , −→ g8 , −→ g9 , −→ g11 .
g3
Com a transição g4 g3 −→ g3 sendo especificada pelo emprego da Proposição 91. O grafo essencial
final, obtido pela eliminação de vértices isolados (não é vértice inicial ou terminal de ramos, só há o
vértice ε), é apresentado na Figura 6.8, com a explicitação das transições partindo dos vértices g6 e
g4 g3 .
6.3 Códigos de Artin para o Caso da Tesselação {12, 4} 151

g7 g7 g6
g11 g8 g11 g7 g6 g6 g6
g8 g8 g7 g6 g1

g9 g4 g6 g1
g9
g4 g5
g5
g9 g5
g10 g4
g9 g7 g8
g10 g9 g8 g6 g5 g8
g11
g9 g4
g9
g10 g12 g2 g4

g10 g10 g4 g3

g11 g2 g4 g3
g11
g2 g3
g11 g3
g2
g11 g10
g1
g12 g7 g3 g10

g7 g12 g2 g2

g12 g1 g12 g2 g5 g5
g12 g1 g1
Figura 6.8: Representação determinı́stica mı́nima parcial do código para a tesselação {12, 4}.
152 Representação de Códigos Geodésicos
Capı́tulo 7

Conclusões

A proposta do presente trabalho foi de obter descrições combinatoriais para os fluxos geodésicos
sobre regiões compactas de superfı́cies hiperbólicas, como meio para associar às sequências código
quaisquer, parâmetros topológicos oriundos destas superfı́cies. O encaminhamento para o estabe-
lecimento deste objetivo é caracterizado pelas etapas: (1) Identificação de um procedimento ade-
quado de codificação do fluxo geodésico que reflita a topologia da superfı́cie; (2) Desenvolvimento
de ferramentas de análise do código; (3) Identificação de possı́veis métodos para implementação de
representações; (4) Determinação de representações para o código. Cada uma destas etapas foi abor-
dada na tese, com ordem de exposição refletindo a relação de dependência dos resultados e conceitos
desenvolvidos em cada capı́tulo.
No Capı́tulo 2, determinamos na Seção 2.4 como a propriedade de completude de um sistema
dinâmico de eventos discretos invariante no tempo se reflete na topologia das trajetórias do sistema,
quando especificadas por sequências bi-infinitas e descritas sobre um alfabeto finito, passando a
denomina-los de ssf. Tal relevância decorre de serem os sistemas completos aqueles para os quais
é possı́vel determinar uma representação finita (e.g., através de grafos ou equações a diferença).
No Capı́tulo 3 determinamos uma descrição combinatorial para um ssf, baseada no conceito de
relação de ordem parcial. Estendemos o conceito na Seção 3.9, demonstrando como um ssf pode ser
caracterizado globalmente, através do seu conjunto de restrições irredutı́veis, ou localmente, por con-
juntos de restrições dependentes do contexto ou palavra da linguagem. Na Seção 3.11 demonstramos
como os diversos conceitos de restrição podem ser aplicados na determinação do monoide sintático da
linguagem. Por fim, na Seção 3.12 demonstramos como a coleção de possı́veis conjuntos de restrições
à direita de uma linguagem podem ser empregados na determinação de uma representação minimal
para esta, fato utilizado no Capı́tulo 6.
No Capı́tulo 5 foram apresentados os conceitos e procedimentos sobre os métodos de codificação
aritmético e geométrico do fluxo geodésico, relevantes para a apreciação do trabalho. A partir

153
154 Conclusões

da conjugação Γ por partes que relaciona os códigos aritméticos e geométricos, especificamos na


Seção 5.4 dois métodos para codificação do fluxo geodésico cujas sequências código refletem a topo-
logia da superfı́cie associada. Empregando um particionamento markoviano estendido do bordo do
disco de Poincaré ∂D2 para o método de codificação aritmético associado a uma superfı́cie {8g−4, 4},
na Seção 5.5, determinamos o máximo ssf-completo contido no código resultante e a entropia to-
pológica do código, onde g é o gênero da superfı́cie.
No Capı́tulo 6, empregamos os métodos e conceitos desenvolvidos no Capı́tulo 3 e Capı́tulo 5, de-
terminamos uma representação para o código aritmético ou códigos de Artin, empregando o conceito
de ciclo de geradores, que por sua vez está relacionado a estrutura topológica da superfı́cie. Devido a
estrutura das sequências de restrição associadas ao processo de codificação de Artin, a apresentação
resultante revela considerável regularidade, além de seu método de determinação ser bastante simples.

7.1 Encaminhamentos e Trabalhos Futuros


Durante a realização de nosso trabalho, ficou claro o interesse no emprego de dinâmica simbólica para
abordar problemas que permitem duplicidade de interpretação, por um lado podem ser vistos como
sistemas dinâmicos e por outro como códigos. Neste contexto, há diversos problemas que podem ser
abordados empregando os conceitos de conjuntos de restrição, os quais pretendemos desenvolver em
trabalhos futuros.

1. Extensão do método para PFT’s (Periodic Shifts of Finite-Type);

2. Caracterizar outros tipos de representações minimais a partir dos conceitos propostos;

3. Procurar identificar critérios de necessidade sobre o conjunto de restrições irredutı́veis para geração
de apresentações mı́nimas;

4. Estabelecer métodos para construção de codificadores de linha e para codificação conjunta;

5. Caracterização de ssf’s homogêneos através dos respectivos conjuntos de restrições, como também
a sı́ntese dos codificadores. Contribuindo na determinação de códigos em treliça que também são
sistemas de órbitas e na caracterização de códigos de treliça sobre grupo empregando dinâmica
simbólica.

Quanto aos códigos do fluxo geodésico, duas possı́veis linhas de desenvolvimento são de nosso
maior interesse, com as possibilidades não estando restritas só a estas.

1. Especificação de códigos sobre árvores puramente topológicos, empregando as classes homotópicas


e conceitos de distância topológica;
7.1 Encaminhamentos e Trabalhos Futuros 155

2. Identificação de possı́veis códigos topológicos a serem empregados para codificação das UPO’s
de sistemas dinâmicos em estado caótico sobre atratores de baixa dimensão;

3. Identificação de classes de códigos topológicos aos quais possam ser associados codificadores de
baixa complexidade, empregando descrições dos códigos via conjuntos de restrições.
156 Conclusões
Referências Bibliográficas

[1] Jan C. Willems. Models for dynamics. Dynamics Reported, 2:171–269, 1989.

[2] G. David Forney, Jr. and Mitchell D. Trott. The dynamics of group codes: State spaces, trellis
diagrams, and canonical encoders. IEEE Trans. Inform. Theory, 39(9):1491–1513, September
1993.

[3] Eric J. Rossin, N. T. Sindhushayana, and Chris D. Heegard. Trellis group codes for the gaussian
channel. IEEE Trans. Inform. Theory, 41(5):1217–1245, September 1995.

[4] David Slepian. Group codes for the gaussian channel. Bell Syst. Tech. J., 47:575–602, April
1968.

[5] G. David Forney, Jr. Geometrically uniform codes. IEEE Trans. Inform. Theory, 37:1241–1260,
September 1991.

[6] N. T. Sindhushayana, Brian Marcus, and Mitchell Trott. Homogeneous shifts. IMA Journal of
Mathematical Control & Information, 41:255–287, 1997.

[7] Henrique Lazari. Uma contribuição à teoria dos códigos geometricamente uniformes hi-
perbólicos. Tese de Doutorado, FEEC-Unicamp, 2000.

[8] C. Series. Geometrical markov coding of geodesics on surfaces of constant negative curvature.
Ergodic Theory and Dynamical Systems, 6:601–625, 1986.

[9] Roy L. Adler and Leopold Flatto. Geodesic flows, interval maps, and symbolic dynamics. Bull.
Amer. Math. Soc., 25(2):229–334, October 1991.

[10] Lapo Casetti, Marco Pettini, and E.G.D. Cohen. Geometric approach to hamiltonian dynamics
and statistial mechanics. Physics Reports, 337:237–341, 2000.

[11] George Osipenko. Dynamical Systems, Graphs, and Algorithms. Springer, 2007.

157
158 REFERÊNCIAS BIBLIOGRÁFICAS

[12] Roy L. Adler. Symbolic dynamics and markov partitions. Bull. Amer. Math. Soc., 35(1):1–56,
January 1998.

[13] Samuel Eilenberg. Automata, Languages, and Machines, volume A. Academic Press, 1974.

[14] John M. Howie. Fundamentals of Semigroup Theory. Oxford University Press, 1995.

[15] John E. Hopcroft and Jeffrey D. Ullman. Introduction to Automata Theory, Languages, and
Computation. Addison-Wesley, 1979.

[16] Mark V. Lawson. Finite Automata. Chapman & Hall/CRC, 2004.

[17] Nagabhushana T. Sindhushayana. Symbolic dynamics, automata theory and the theory of co-
ding: A comparative study and applications. Master’s thesis, Cornell University, 1992.

[18] Douglas Lind and Brian H. Marcus. An Introduction to Symbolic Dynamics and Coding. Cam-
bridge University Press, 1995.

[19] Nataša Jonoska. Sofic shifts with synchronizing presentations. Theoret. Comput. Sci., (158):81–
115, 1996.

[20] F. Blanchard and G. Hansel. Languages and subshifts, automata on infinite words. Lecture
Notes in Computer Science, 192:138–146, 1984.

[21] Allan Clark. Elements of Abstract Algebra. Dover Publications, 1984.

[22] M. Crochemore, F. Mignosi, and A. Restivo. Automata and forbidden words. Information
Processing Letters, (67):111–117, 1998.

[23] M.-P. Béal, M. Crochemore, and G. Fici. Presentations of constrained systems with unconstrai-
ned positions. IEEE Trans. Inform. Theory, 51(5):1891–1900, May 2005.

[24] M.-P. Béal, M. Crochemore, B. E. Moision, and P. H. Siegel. Periodic-finite-type shift spaces.
IEEE Trans. Inform. Theory, 57(6):3677–3691, June 2011.

[25] Daniel P. B. Chaves and Cecilio Pimentel. A new algorithm for finding the Shannon cover of
shifts of finite type. In Proceedings of the VI International Telecommunications Symposium -
ITS2006, pages 694–699, 2006.

[26] Arnaldo Garcia and Yves Lequain. Elementos de Álgebra. Projeto Euclides. IMPA, Rio de
Janeiro, second edition, 2003.
REFERÊNCIAS BIBLIOGRÁFICAS 159

[27] Elon Lages Lima. Espaços Métricos. Projeto Euclides. IMPA, Rio de Janeiro, fourth edition,
2007.

[28] John Stillwell. Geometry of Surfaces. Springer-Verlag, 1992.

[29] Peter A. Firby and Cyril F. Gardiner. Surface Topology. Horwood Publishing Limited, third
edition, 2001.

[30] Svetlana Katok. Fuchsian Groups. Chicago Lectures in Mathematics, 1992.

[31] A. Beardon. The Geometry of Discrete Groups. Springer-Verlag, 1983.

[32] Manfredo Perdigão do Carmo. Geometria Riemanniana. Projeto Euclides. IMPA, Rio de Ja-
neiro, third edition, 2005.

[33] Manfredo Perdigão do Carmo. Differential Geometry of Curves and Surfaces. Prentice-Hall,
New Jersey, 1976.

[34] Anatole Katok and Boris Hasselblatt. Introduction to the Modern Theory of Dynamical Systems.
Cambridge University Press, 1995.

[35] Svetlana Katok and Ilie Ugarcovici. Symbolic dynamics for the modular surface and beyond.
Bull. Amer. Math. Soc., 44(1):87–132, January 1991.

[36] Daniel P. B. Chaves, Reginaldo Palazzo Jr., and José R. Rios Leite. Properties of an arithmetic
code for geodesic flows. J. Phys.: Conf. Ser., 285:1–10, 2011.

[37] Gian Mario Maggio and Zbigniew Galias. Applications of symbolic dynamics to differential
chaos shift keying. IEEE Trans. Circuits Syst.-I, 49(12):1729–1735, 2002.

[38] J. Schweizer and Thomas Schimming. Symbolic dynamics for processing chaotic signals-I:
Noise reduction of chaotic sequences. IEEE Trans. Circuits Syst.-I, 48:1269–1282, 2001.

[39] Tim Bedford, Michael Keane, and Caroline Series, editors. Ergodic Theory, Symbolic Dynamics
and Hyperbolic Spaces. Oxford Science Publications, 1991.

[40] C. Series. The infinite word problem and limit sets in fuchsian groups. Ergodic Theory and
Dynamical Systems, 1:337–360, 1981.

[41] D. J. Grabiner and J. C. Lagarias. Cutting sequences for geodesic flow on the modular surface
and continue fractions. Monatsh. Math., 133(4):295–339, 2001.
160 REFERÊNCIAS BIBLIOGRÁFICAS

[42] Joan S. Birman and C. Series. Dehn’s algorithm revisited, with applications to simple curves
on surfaces. In S. M. Gersten and John R. Stallings, editors, Combinatorial Group Theory and
Topology, pages 451–478. Princeton University Press, New Jersey, United States, 1987.

[43] Svetlana Katok and Ilie Ugarcovici. Arithmetic coding of geodesics on the modular surface via
continued fractions. CWI Tract, 135:59–77, 2005.

[44] R. Bowen and C. Series. Markov maps for fuchsian groups. Inst. Hautes Études Sci. Publ.
Math., 50:153–170, 1979.

[45] C. Series. Symbolic dynamics for geodesic flow. Acta Math., 146:103–128, 1981.

[46] Lester R. Ford. Automorphic Functions. AMS, second edition, 1957.


Índice Remissivo

ação de grupo, 88 de geradores, 134


conjunto de orbitas, 89 de vértices, 134
estabilizador, 89 ciclos elı́pticos, 100
orbita, 88 vértices elı́pticos, veja vértice
propriamente descontı́nua, 96 classes de equivalência, 42
autômato, 47 codificação do fluxo geodésico, 116
acessı́vel, 48 congruência, 43
caminho, 47 conjunto de restrições
completo, 49 w-proibições Ow , 62
comportamento, 47 à direita Cw , 64
determinı́stico, 49 à esquerda Dw , 66
essencial, 28, 49 conjunto limite Λ(Γ) de Γ, 96
estados, 47 conjunto proibido irredutı́vel O, 61
estados iniciais, 47
estados terminais, 47 dinâmica simbólica
linguagem representada, 47 código de bloco deslizante,sbc, 33
ramos, 47 domı́nio, 42
trie, 75
equivalência
quociente, 42
cálculo de divisão, 44
espaço de identificação, 100
código aritmético, 119
espaço de sequências sobre grupo, 34
expansão do bordo, 120
espaço métrico, 88
mı́nimo, 122
subconjunto discreto, 89
código de Artin, veja código aritmético
código de Koebe-Morse, veja código geométrico função parcial, 42
código geométrico, 117 função reversa, 57
sequências cortantes, 118 linguagem reversa, 65
sequências de arestas, 118
sequências de polı́gonos, 118 grafo, 130
código sobre grupo, 34 arestas, 130
cı́rculo isométrico, 95 caminho, 130
ciclo estado inicial, 130
L-ciclo, 134 estado terminal, 130
L-sequência, 134 matriz adjacência, 130
R-ciclo, 135 representação, 130
R-sequência, 135 vértices, 130

161
162 ÍNDICE REMISSIVO

grupo, 87 região fundamental, 98


Isom(H2 ) de isometrias de H2 , 93 arestas de Dp (Γ), 99
cı́clico, 88 cantos pares, 117
de estabilizadores, 88 fronteira, 98
discreto, 95 localmente finita, 99
especial linear SL(2, R), 92 mapa de retorno, 109
especial linear projetivo PSL(2, R), 92 região de Dirichlet Dp (Γ), 98
fuchsiano Γ, 96 tesselação, 98
fuchsiano de primeiro tipo, 97 vértices de Dp (Γ), 99
fuchsiano de segundo tipo, 97 relação, 41
metrizável, 96 relação de equivalência, 42
poduto direto, 88 kernel, 43
produto semi-direto, 88 núcleo, 43
subgrupo cı́clico maximal, 101 reflexiva, 42
topológico, 88 simétrica, 42
grupo fuchsiano, 96 transitiva, 42
Γ-congruência, 100 reticulados, 96
assinatura, 102
co-compacto, 101 seção transversal, 108
geometricamente finito, 101 mapa da seção transversal, 108
perı́odos de Γ, 101 semigrupo, 38
sequência de geradores, 134
identificação de arestas, 97 sequências cortantes
linguagem H-ciclos, 118
regular, 48 cadeia, 119
linguagem reversa, veja função reversa cadeia complementar, 119
linguagens regulares, 47 ciclos, 118
ciclos anti-horário, 119
monoide, 38 ciclos horário, 119
A-módulo, 41 ciclos longos, 118
livre A∗ , 39 palavra reduzida, 119
sub-monoide, 39 sequência mı́nima, 119
morfismo, 39 sistema dinâmico, 6
fino, 40 ssf-completo, 128
com variáveis latentes, 9
palavra, 40
comportamento induzido, 18
alfabeto, 40
conjugado topológico, 33
fator, 40
conjunto de restrições, 28
letra, 40
prefixo, 40 especificado instantâneamente, 13
segmento, 40 especificado localmente, 13
sufixo, 40 eventos elementares, 26
produto direto e semi-direto, veja grupo fluxo contı́nuo no tempo, 21
fluxo discreto no tempo, 21
região de Dirichlet, veja região fundamental homeomorfismo, 33
ÍNDICE REMISSIVO 163

homomorfismo, 33 singular, 99
invariante no tempo, 10
inversı́vel, 33
latência, 13
lei de evolução discreta no tempo, 18
linear, 10
memória finita, 13
memória local, 13
na forma de espaço de estados, 15
sequências de eventos, 26
SFT (shift of finite type), 113
simetria, 10
sistema dinâmico fechado, ssf, 32
topologicamente conjugado, 33
superfı́cie, 97
fibrado tangente, 107
gênero, 102
hiperbólica, 97
superfı́cie riemanniana, 106
espaço tangente, 106
estrutura diferenciável, 106
fibrado tangente unitário, 107
parametrização, 106
projeção natural, 108
vetor tangente, 106
vizinhança coordenada, 106
teorema
de Gauss-Bonnet, 92
de Killing-Hopf, 97
de Poincaré, 102
de Siegel, 101
tesselação, veja região fundamental
transformação
anti-conforme, 93
conforme, 93
isométria, 88
trie (tree-like automaton), veja autômato
vértice, 97, 99
Γ-congruente, 100
ciclo de, 97, 134
elı́pticos, 100
ordinário, 99
ponto elı́ptico, 135

Você também pode gostar