Chaves DanielPedroBezerra D

Universidade Estadual de Campinas
Faculdade de Engenharia Elétrica e de Computação

Departamento de Telemática
Sistemas Dinâmicos de Eventos Discretos com Aplicação

ao Fluxo Geodésico em Superfı́cies Hiperbólicas
Autor: Daniel Pedro Bezerra Chaves

Orientador: Prof. Dr Reginaldo Palazzo Júnior
Tese de Doutorado apresentada à Faculdade de

Engenharia Elétrica e de Computação como parte
dos requisitos para obtenção do tı́tulo de Doutor
em Engenharia Elétrica. Área de concentração:
Telecomunicações e Telemática.
Banca Examinadora
Prof. Dr Reginaldo Palazzo Júnior UNICAMP
Prof. Dr. José Roberto Rios Leite UFPE
Prof. Dr. Cecilio José Lins Pimentel UFPE
Prof. Dr. Henrique Lazari UNESP
Prof. Dr. Carlos Eduardo Câmara FATEC-AM
Campinas, SP
2011
FICHA CATALOGRÁFICA ELABORADA PELA
BIBLIOTECA DA ÁREA DE ENGENHARIA E ARQUITETURA- BAE - UNICAMP
Chaves, Daniel Pedro Bezerra

C398S Sistemas dinâmicos de eventos discretos com
aplicação ao fluxo geodésico em superfı́cies hiperbólicas
/Daniel Pedro Bezerra Chaves. – Campinas, SP:[s.n.],
2011.
Orientadore: Reginaldo Palazzo Júnior.

Tese de Doutorado - Universidade Estadual de Campinas,
Faculdade de Engenharia Elétrica e de Computação.
1. Sistemas dinâmicos. 2. Grupos fuchsianos.

3. Geometria hiperbólica. 4. Teoria da informação.
5. Teoria dos autômatos. I. Palazzo Júnior, Reginaldo.
II. Universidade Estadual de Campinas. Faculdade de
Engenharia Elétrica e de Computação. III. Tı́tulo
Tı́tulo em Inglês: Discrete event dynamical systems with application to the

geodesic flow on hyperbolic surfaces
Palavras-chave em Inglês: Dynamical systems, Fuchsian groups, Hyperbolic
geometry, Information theory, Automata theory
Área de concentração: Telecomunicações e Telemática
Titulação: Doutor em Engenharia Elétrica
Banca Examinadora: José Roberto Rios Leite, Cecilio José Lins Pimentel,
Henrique Lazari, Carlos Eduardo Câmara
Data da defesa: 05/12/2011
Programa de Pós Graduação: Engenharia Elétrica
ii
iii
iv
Resumo
Neste trabalho apresentamos um método de descrição combinatorial para o fluxo geodésico sobre uma
região hiperbólica compacta, tendo como objetivo associar a sequências de codificação, parâmetros
topológicos oriundos destas superfı́cies. Isto permite conjugar conceitos topológicos e combinatoriais
oriundos das superfı́cies estudadas com conceitos de teoria da informação e codificação.
Demonstramos como a propriedade de completude de um sistema dinâmico de eventos discretos
invariantes no tempo se reflete na topologia do espaço de trajetórias do sistema, quando especificadas
por sequências bi-infinitas e descritas sobre um alfabeto finito. A mesma estrutura obtida pelo pro-
cesso de codificação do fluxo geodésico, e a qual passamos a chamar de sistema simbólico fechado
(ssf).
Identificamos como um ssf pode ser caracterizado globalmente, através do seu conjunto de res-
trições irredutı́veis, ou localmente, por conjuntos de restrições dependentes do contexto. Ambas
derivadas de relações de ordem parcial. Disto determinamos métodos de representação do ssf.
Através da relação entre os métodos de codificação aritmético e geométrico, propomos processos
de codificação sobre superfı́cies hiperbólicas, determinando como as representações mı́nimas das
sequências código do fluxo geodésico podem ser construı́das a partir das propriedades topológicas e
combinatoriais da superfı́cie.
Palavras-chave: Sistemas Dinâmicos, Dinâmica Simbólica, Linguagem Formal, Conjunto de
Restrições, Grafos Direcionados, Fluxo Geodésico.
Abstract
In this work we present methods for a combinatorial description of the geodesic flow on a hyper-
bolic compact surface, with the intent of identifying how the topological parameters of the surface
may be associated with discrete sequences. This approach allows to conjugate the topological and
combinatorial properties of a surface with concepts of information theory and coding.
We determine the intrinsic topological property of complete and time-invariant discrete dynami-
cal systems whose trajectories are bi-infinite sequences over a finite alphabet. The same structure
generated by the geodesic flow coding methods, that we call shift space.
We show how a shift space can be completely characterized by the irreducible forbidden set and
locally by the constraint sets, and how both can be obtained through partial order relations. As
consequence of these results, some constructions to represent the shift spaces are proposed.
Methods for coding source sequences on hyperbolic surfaces are proposed, based on Γ-piecewise
and common-sets relations that exist between these methods. We conclude by specifying a construc-
tion procedure for presentations of arithmetic codes that is related with the topological and combina-
torial properties of the hyperbolic surface.
Keywords: Dynamical Systems, Symbolic Dynamics, Formal Language, Constraints Set, Direc-
ted Graph, Geodesic Flow.
v
vi
Agradecimentos
Ao meu orientador Professor Doutor Reginaldo Palazzo Júnior pela oportunidade e incentivo para o
desenvolvimento deste trabalho.
A Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) pelo apoio financeiro (Bolsa
DR-II, processo 06/60976-8) concedido durante o perı́odo de março de 2007 a fevereiro de 2011, sem
o qual não seria possı́vel a realização do Programa de Doutoramento em Engenharia Elétrica.
A receptividade e acolhimento da FEEC / UNICAMP.
Aos Professores Cecilio José Lins Pimentel e José Roberto Rios Leite pela parceria e comentários
relevantes durante a realização do trabalho.
Aos membros da banca pelos comentários e sugestões para o enriquecimento deste trabalho.
Aos colegas de pós-graduação pelo apoio.
Pela ajuda e estı́mulo constante dos meus pais.
vii
viii
Aos meus pais e irmãs
DEDICO
ix
x
Sumário
Lista de Figuras xv
Lista de Tabelas xvii
Lista de Sı́mbolos xix
Trabalhos Publicados Pelo Autor xxi
1 Introdução 1
2 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica 5

2.1 Estrutura Básica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.1 Linearidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.2 Invariante no tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.3 Simetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 O Conceito de Memória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.1 Concatenação e mapa não-antecipativo . . . . . . . . . . . . . . . . . . . . 11
2.2.2 Completude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2.3 Extensão da memória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.4 Dividindo variáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2.5 Sistema de variáveis de estado . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2.6 Sistemas autônomos, controláveis e essenciais . . . . . . . . . . . . . . . . 16
2.3 Leis de Evolução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3.1 A lei de evolução induzida por uma representação via espaço de estados . . . 19
2.3.2 Lei de evolução de um sistema determinı́stico . . . . . . . . . . . . . . . . . 20
2.3.3 Fluxos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.4 Exemplos de casos contı́nuos e discretos . . . . . . . . . . . . . . . . . . . . 24
2.4 A Topologia de Sistemas Dinâmicos Discretos Invariantes no Tempo e Completos . . 29
2.4.1 Homeomorfismo e codificação . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.5 A Dinâmica Simbólica dos Sistemas Dinâmicos . . . . . . . . . . . . . . . . . . . . 34
3 Dinâmica Simbólica e Autômatos 37

3.1 Monoide e Semigrupo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2 Relações e Congruências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.3 Cálculo de Divisão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
xi
xii SUMÁRIO
3.4 Linguagens Regulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

3.5 Autômato Mı́nimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.6 Morfismo Sintático e Monoide Sintático . . . . . . . . . . . . . . . . . . . . . . . . 55
3.7 Conceitos sobre Relação de Ordem Parcial . . . . . . . . . . . . . . . . . . . . . . . 58
3.8 Alguns Conceitos Sobre Linguagem Formal . . . . . . . . . . . . . . . . . . . . . . 59
3.9 Conjuntos Proibidos e Conjuntos de Restrição . . . . . . . . . . . . . . . . . . . . . 60
3.10 Cálculo dos Conjuntos Proibidos e Conjuntos de Restrições . . . . . . . . . . . . . . 67
3.11 Obtenção da Estrutura Algébrica através dos Conjuntos de Proibições e Restrições . 71
3.12 O Autômato Minimal de uma Linguagem FPR . . . . . . . . . . . . . . . . . . . . . 83
4 Geometria Hiperbólica 87
4.1 Conceitos Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.2 O Plano Hiperbólico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.3 Grupo de Isometrias do Plano Hiperbólico . . . . . . . . . . . . . . . . . . . . . . . 92
4.4 Grupo Fuchsiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.5 Superfı́cies Hiperbólicas e Regiões Fundamentais . . . . . . . . . . . . . . . . . . . 97
5 Códigos Geodésicos 105

5.1 Conceitos Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
5.2 Códigos de Koebe-Morse e Artin: Estudo de caso . . . . . . . . . . . . . . . . . . . 110
5.2.1 O método de codificação de Koebe-Morse . . . . . . . . . . . . . . . . . . . 111
5.2.2 O método de expansão do bordo . . . . . . . . . . . . . . . . . . . . . . . . 112
5.2.3 Representação do fluxo geodésico . . . . . . . . . . . . . . . . . . . . . . . 113
5.2.4 Aplicando os conceitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
5.3 Codificação do Fluxo Geodésico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
5.3.1 Determinando uma região fundamental apropriada . . . . . . . . . . . . . . 116
5.3.2 Código de Koebe-Morse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
5.3.3 Código de Artin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
5.4 Representação Geométrica e Aritmética do Fluxo Geodésico . . . . . . . . . . . . . 122
5.4.1 Estendendo o conjunto de sequências código . . . . . . . . . . . . . . . . . 124
5.5 Estrutura e Entropia do SFT Inerente ao Código Aritmético . . . . . . . . . . . . . . 126
5.5.1 Definindo a estrutura da região fundamental . . . . . . . . . . . . . . . . . . 127
5.5.2 Maior ssf-completo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
5.5.3 Entropia Topológica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
6 Representação de Códigos Geodésicos 133

6.1 Ciclos de Vértices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
6.2 Representação Simbólica de Pontos sobre ∂D2 . . . . . . . . . . . . . . . . . . . . . 136
6.3 Códigos de Artin para o Caso da Tesselação {12, 4} . . . . . . . . . . . . . . . . . . 145
7 Conclusões 153
7.1 Encaminhamentos e Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . 154
Referências Bibliográfica 157

SUMÁRIO xiii
Índice Remissivo 161

xiv SUMÁRIO
Lista de Figuras
2.1 Modelo apresentado por Willems. . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.2 Modelo Clássico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 Modelo do comportamento térmico do circuito elétrico. . . . . . . . . . . . . . . . . 7
2.4 Relação entre as posições w
~1 e w
~ 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.5 Representação de um sistema controlável. . . . . . . . . . . . . . . . . . . . . . . . 16
2.6 Somador completo serial representado via espaço de estados. . . . . . . . . . . . . . 27
2.7 Autômato do sistema de eventos discretos associado ao somador completo serial. . . 28
3.1 Diagramas de comutação das expressões RC RB = RBC , LX RC = RC LX , e LXB =

LX LB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.2 A C-trie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.3 A D-trie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.4 Autômato Σ(O) obtido através do algoritmo L-AUTOMATON. . . . . . . . . . . . . 78
3.5 O autômato M(O). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.1 Exemplo de geodésicas em H2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

4.2 Exemplo de geodésicas em D2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.3 Ângulo hiperbólico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.4 Triângulos hiperbólicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.5 Tesselação {8, 4}, mostrando a identificação de arestas realizada pelos geradores. . . 103
4.6 Tesselação {8, 4}, mostrando ação transitiva de Γ, onde ḡ = g −1. . . . . . . . . . . . 104
5.1 Fluxo geodésico sobre D2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

5.2 Região fundamental. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.3 Curvas fechadas em M. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.4 Codificação do fluxo geodésico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
5.5 Esfera com três buracos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.6 Cobertura de M em D2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
5.7 Imagem das arestas de F , com vértices pares, sobre a superfı́cie associada. . . . . . . 118
5.8 Geodésica através de um vértice. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
5.9 Geodésica em T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
5.10 Possı́veis deformações de uma geodésica orientada quando intercepta um vértice. . . 122
5.11 Possı́veis discrepâncias entre os conjuntos A e R. . . . . . . . . . . . . . . . . . . . 123
5.12 Modelo de sistema para sequências código restritas a A ∩ R. . . . . . . . . . . . . . 124
5.13 Modelo de sistema para sequências em R. . . . . . . . . . . . . . . . . . . . . . . . 126
xv
xvi LISTA DE FIGURAS
5.14 Região fundamental. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
6.1 Relação entre ciclo de vértices e sequência de geradores. . . . . . . . . . . . . . . . 135

6.2 L-ciclo consecutivos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
6.3 R-ciclo consecutivos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
6.4 Configuração ao considerar-se um R-ciclo como fator de uma L-cadeia. . . . . . . . 139
6.5 Configuração ao considerar-se uma sequência gg −1 como fator de uma L-cadeia. . . 139
6.6 Região fundamental e identificação de arestas da tesselação {12, 4}. . . . . . . . . . 146
6.7 Autômata inicial parcial do código para tesselação {12, 4}. . . . . . . . . . . . . . . 149
6.8 Representação determinı́stica mı́nima parcial do código para a tesselação {12, 4}. . . 151
Lista de Tabelas
2.1 R ELACIONANDO C ONCEITOS DE M EM ÓRIA . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2 F ORMAS APRESENTADAS PARA REPRESENTAÇ ÃO DE SISTEMAS DIN ÂMICOS . . . . . . . 29
3.1 C LASSES DE E QUIVAL ÊNCIA À D IREITA . . . . . . . . . . . . . . . . . . . . . . . . . 74

3.2 C LASSES DE E QUIVAL ÊNCIA À E SQUERDA . . . . . . . . . . . . . . . . . . . . . . . . 74
3.3 R EPRESENTANTES DAS CLASSES N ÃO NULAS E PARES ORDENADOS (ij) ASSOCIADOS . . 82
xvii
xviii LISTA DE TABELAS
Lista de Sı́mbolos
Σ - Sistema dinâmico
B - Comportamento de um sistema dinâmico
Σa - Sistema dinâmico com variáveis latentes
ΣS - Sistema dinâmico na forma de espaço de estados
Σ∂ - Sistema dinâmico descrito por lei de evolução
Bcompl - Complementação de B
(X, σ) - Sistema simbólico fechado (ssf)
X - Conjunto de sequências bi-infinitas de um ssf
σ - Função deslocamento
(w)i - Conteúdo da posição i de w
d(x, y) - Distância entre os pontos x, y em um espaço métrico M
Z
CkA (u) - Conjunto cilindro
B(X) - Linguagem de X
(S, ·) - Semigrupo com operação “·”
1 - Elemento identidade de um monoide
A∗ - Monoide livre com base A
ϕ - Morfismo
r - Relação de equivalência
∼r - Relação de equivalencia r
X/r - Conjunto quociente de X por r
Σa - Autômato acessı́vel
L - Linguagem ou comportamento de um autômato
ϕL - Morfismo sintático de L
(X, )
V - Conjunto parcialmente ordenado
WY - Maior limite inferior de Y , se existir
Y - Menor limite superior de Y , se existir
FPR - Fatorial prolongável e regular
FTR - Fatorial transitiva e regular
S(·) - Conjunto de sufixos
P(·) - Conjunto de prefixos
O - Conjunto proibido irredutı́vel
Ow - Conjunto minimal de w-proibições
R(w, L) - Contexto à direita de w com relação a linguagem L
L(w, L) - Contexto à esquerda de w com relação a linguagem L
xix
xx LISTA DE SÍMBOLOS
Cw - Conjunto de restrições à direita de w

Dw - Conjunto de restrições à esquerda de w
Ci - i-ésima C-classe de equivalência
Di - i-ésima D-classe de equivalência
T - trie (tree like automaton)
(G, ·) - Grupo com operação “·”
G1 × G2 - Produto direto dos grupos G1 com G2
G1 × G2 - Produto semi-direto de G1 por G2 com homomorfismo σ
σ
X/G - Conjunto de órbitas de X sobre ação de G
H2 - Modelo do semi-plano superior do plano hiperbólico
D2 - Modelo do disco de Poincaré do plano hiperbólico
∂H2 - Fronteira de H2
∂D2 - Fronteira de D2
µ(A) - Área hiperbólica de uma região A contida em H2 ou D2
SL(2, R) - Grupo especial linear
PSL(2, R) - Grupo especial linear projetivo
Isom(H2 ) - Grupo de isometrias de H2
Tr(T ) - Traço de uma transformação de Möbios T
Γ - Grupo fuchsiano Γ
Λ(Γ) - Conjunto limite de Γ
Dp (Γ) - Região de Dirichlet para Γ com centro em p
Γ0 - Conjunto simétrico de geradores de Γ
SM - Fibrado tangente unitário de uma superfı́cie M
T - Tesselação
LD - Conjunto de L D-ciclos
LH - Conjunto de L H-ciclos
RH - Conjunto de R H-ciclos
LS - Conjunto de L S-ciclos
LHC - Conjunto de L H-cadeias
Trabalhos Publicados Pelo Autor
1. D. P. B. Chaves, R. Palazzo Jr., J. R. R. Leite. “Properties of an Arithmetic Code for Geodesic Flows”.
Journal of Physics: Conference Series, vol. 285, pp. 1-10, 2011.
2. D. P. B. Chaves, R. Palazzo Júnior. “Presentations of Constrained Control Sequences for Symbolic Models
of Systems”. Anais of The 2nd International Multi-Conference on Complexity, Informatics and Cybernetics
(IMCIC 2011), Orlando, EUA, pp. 72-77, Março 2011.
3. D. P. B. Chaves, R. Palazzo Júnior. “Properties of an arithmetic code for geodesic flows”. Proceedings of
the Dynamics Days South America, São José dos Campos: INPE, Brasil, Julho 2010.
4. D. P. B. Chaves, R. Palazzo Júnior. “About the syntatic monoid of FP-languages”. Proceedings of The XXI
School of Algebra, Brası́lia: UNB, Brasil, Julho 2010.
xxi
xxii
Capı́tulo 1
Introdução
Ao restringirmos as propriedades de uma estrutura matemática, ou equivalentemente, tornarmos seu

comportamento mais rı́gido e suas propriedades mais inflexı́veis, muitas vezes abrimos caminho
para resultados que descrevem-na com uma riqueza de detalhes estonteante, conduzindo o obser-
vador à perplexidade e contemplação que muitas vezes o inibem de perceber de forma imparcial as
implicações inexoráveis, a saber, a rigidez do modelo e a limitação de sua abrangência.
Este fato foi reconhecido por Willems, sendo o elemento motivador para a proposição de uma
abordagem mais geral para sistemas dinâmicos [1], que tem como premissa reconhece-los como es-
truturas que apresentam comportamento e propriedades especı́ficos, o que torna meritório os esforços
visando seu entendimento e aplicação, mas que não faz uso de pré-suposições que visam estabelecer
condições de necessidade para aplicação de ferramentas analı́ticas poderosas.
Empregando a abordagem de Willems, Forney e Trott interpretaram um código sobre grupo C
como um sistema dinâmico [2] (o código C pode ser um código de bloco, código convolucional,
reticulado, código de treliça, código geometricamente uniforme, sistema linear discreto no tempo,
entre outros), que quando completo, permite a caracterização consistente do código a partir de um
diagrama de treliça ou codificador minimal. Como decorrência dessa abordagem, os autores determi-
naram métodos sistemáticos para construção de codificadores, além de especificarem parâmetros bem
definidos para avaliação do desempenho e complexidade do código e do codificador. Esta abordagem
também permitiu que fossem generalizados alguns resultados para um maior conjunto de tipos de
códigos, que antes só haviam sido determinados para sistemas sobre corpos e invariantes no tempo.
Um ponto fundamental ressaltado em [2] é a necessidade da completude dos códigos sobre grupo
para a efetiva construção dos codificadores. Este fato foi reconhecido por Rossin, Sindhushayana
e Heegard em [3], ao proporem a extensão dos códigos de Slepian [4] para códigos sobre treliça.
Neste trabalho os autores partem do caso introduzido por Slepian, a saber, consideram uma semente
x0 ∈ Rn e um grupo finito de transformações lineares G a partir do qual definem o código de grupo
1
2 Introdução
de Slepian G(x0 ). Como extensão natural para o caso de uma treliça bi-infinita, consideram o produto
direto bi-infinito G Z de G, gerando o código de grupo sobre treliça G Z (x0 ). Os grupos de treliça não
triviais surgem quando consideramos a ação sobre x0 de subgrupos próprios Λ de G Z , neste caso,
para que possamos garantir a determinação de codificadores para Λ(x0 ) e respectivos decodificadores
não catastróficos, como demonstrado em [3], é necessário que Λ seja um sistema simbólico fechado
sobre grupo, o caso central abordado em [2]. Entre os vários problemas em aberto identificados pelos
autores, destacamos a necessidade de métodos algorı́tmicos para a construção de sistemas simbólicos
fechados sobre grupos que representem todas as simetrias de um código de grupo sobre treliça.
Assim como os códigos de Slepian estabeleceram os elementos geminais para posterior introdução
por Forney dos códigos geometricamente uniformes [5], os conceitos apresentados em [3] formam
a base para a generalização dos códigos geometricamente uniformes para espaços de sequências em
[6]. A generalização dá-se pela substituição da estrutura euclidiana por um sistema simbólico fechado
homogêneo Y que sofre a ação de um sistema simbólico fechado sobre grupo X, nesse caso dizemos
que X é o sistema simétrico de Y.
Muitos dos resultados relevantes em [2, 3, 6] são estabelecidos pela aplicação de representações
minimais canônicas através de grafos direcionados dos sistemas simbólicos fechados sobre análise.
Essa é uma abordagem comum no desenvolvimento da teoria de dinâmica simbólica, que com a ex-
tensão de seu escopo para aplicações de natureza combinatorial, passou a adotar resultados e métodos
oriundos da teoria de autômato para abordar problemas de natureza algorı́tmica, e a adotar álgebra
linear como ferramenta para determinar parâmetros globais invariantes a conjugação dos sistemas
simbólicos fechados, como a entropia topológica. Nesse contexto, como primeira contribuição, in-
troduzimos no Capı́tulo 3 um método combinatorial derivado da estrutura topológica dos sistemas
simbólicos fechados, obtido pela aplicação de relações de ordem parcial. Ao contrário dos métodos
anteriores, que aplicam ferramentas oriundas da teoria de autômato em dinâmica simbólica, deriva-
mos uma ferramenta combinatorial baseada na teoria de autômata e linguagens formais a partir das
propriedades topológicas intrı́nsecas dos sistemas simbólicos fechados. Como resultados dos concei-
tos apresentados, além de propormos novos métodos para a determinação de representações canônicas
minimais, pudemos especificar o monóide sintático do sistema simbólico fechado e um método para
implementarmos sua operação a partir de autômatos. Acreditamos que a maior relevância deste re-
sultado reside tanto no potencial das ferramentas introduzidas para análise e determinação de sis-
temas simbólicos fechados com propriedades especı́ficas estabelecidas pelas aplicações citadas nos
parágrafos anteriores, como para construção de codificadores para estes sistemas.
Em seguida, consideramos a possibilidade de associar às sequências código especificadas por um
sistema simbólico fechado propriedades topológicas herdadas possivelmente da estrutura algébrica
subsequente à topologia da superfı́cie. Essa abordagem é motivada pelos trabalhos desenvolvidos no
3
grupo de pesquisa que visam estabelecer um modelo para sistema de comunicação concebido sobre
um espaço hiperbólico. Como referência inicial, citamos a extensão do conceito de códigos geo-
metricamente uniformes para espaços hiperbólicos [7]. A partir desse trabalho, vários outros foram
desenvolvidos que estenderam os resultados, ou inovaram com a aplicação da geometria hiperbólica a
outros elementos constituintes de um sistema de comunicação tı́pico. Em nosso trabalho, procuramos
identificar formas de atribuir a nossas sequências código propriedades topológicas de uma superfı́cie
hiperbólica (de gênero maior que dois). Estas propriedades se refletem nas classes homotópicas ob-
tidas a partir de uma dada superfı́cie, que por sua vez deverão induzir padrões nas sequências código
obtidas a partir dessas curvas. Estas relações são verificadas no processo de codificação geométrico,
aqui denominado código de Koebe-Morse [8]. No entanto, as sequências códigos obtidas por este
processo são demasiadamente complexas, no sentido de não possuirem uma representação através
de grafo direcionado. Como alternativa, há os códigos aritméticos, aqui denominados códigos de
Artin, que apesar de não refletirem de forma tão evidente as propriedades topológicas da superfı́cie,
é sabido (apesar de não determinado na literatura) que possuem uma representação através de grafos
direcionados. A partir de resultados apresentados em [8], propomos no Capı́tulo 5 duas possı́veis
abordagens que conduzam a representações de sequências código do fluxo geodésico, ambas basea-
das na determinação de uma representação para o código de Artin. Assim, no Capı́tulo 6 desenvolve-
mos um método baseado unicamente nos ciclos de geradores da região fundamental para construção
de uma representação minimal para o código de Artin, exemplificando nosso método através dos
códigos propostos em [9]. Estes resultados estabelecem elementos iniciais necessários a aplicação
da abordagem de Willems e teoria de dinâmica simbólica, assim como realizado em [2, 3, 6], para
análise e proposição de códigos e codificadores aos quais possamos atribuir propriedades de natureza
topológica.
A seguir apresentamos uma breve descrição dos tópicos e resultados apresentados nos capı́tulos
que compõem a tese. Onde todos os resultados não referenciados explicitamente, decorrem do desen-
volvimento do nosso trabalho.
No Capı́tulo 2 empregando a abordagem topológica para dinâmica simbólica, na Proposição 6
formalizamos a equivalência entre sistemas dinâmicos invariantes no tempo e completos, introduzidos
em [1], e sistemas dinâmicos simbólicos fechados (ssf), este último o objeto central de estudo da teoria
de dinâmica simbólica.
No Capı́tulo 3 demonstramos como as propriedades topológicas de um ssf podem ser representa-
das combinatorialmente através de um conjunto irredutı́vel de sequências proibidas, especificado por
uma relação de ordem parcial apropriada. A mesma idéia que permite-nos determinar um conjunto
irredutı́vel de sequências proibidas para o ssf pode ser estendido para a determinação de um conjunto
irredutı́vel de sequências proibidas para qualquer fator de uma sequência em ssf. Demonstramos
4 Introdução
como essas caracterizações combinatórias global e local, respectivamente, podem ser empregadas
para a construção de estruturas algébricas (monóide sintático) e representações mı́nimas (autômato
mı́nimo) para o ssf. Resultados que estabelecem os fundamentos para aplicação dos ssf em sistemas
de codificação realizáveis.
No Capı́tulo 4 apresentamos os elementos necessários para apreciação dos resultados posteriores
sobre códigos geodésicos. Em particular, apresentamos os conceitos fundamentais sobre geometria
hiperbólica bidimensional, com ênfase no modelo do disco de Poincaré. Explicitamos a relação que
há entre as propriedades algébricas e topológicas dos elementos do grupo fuchsiano e as propriedades
topológicas da superfı́cie hiperbólica associada.
No Capı́tulo 5 apresentamos as duas classes de códigos do fluxo geodésico, os aritméticos e os
geométricos. Explicitamos a diferença entre estas e o reflexo dessa nas propriedades do código, prin-
cipalmente na complexidade do código gerado, o que é transcrito na capacidade ou não de representar-
se o código através de um grafo direcionado rotulado. Nossa abordagem é baseada em [8], que
permite uma clara comparação entre estes métodos de codificação. Nas Seção 5.5 derivamos propri-
edades estruturais e determinamos a topologia do caso particular apresentado em [9], a saber, de uma
tesselação regular {8g − 4, 4}, onde g é o gênero da superfı́cie. Cuja importância deve-se a possibili-
dade de especificar-se explicitamente a medida invariante do fluxo geodésico associado às respectivas
superfı́cies.
No Capı́tulo 6, empregando os resultados apresentados no Capı́tulo 3, derivamos um método sim-
ples, baseado nas propriedades topológicas do grupo fuchsiano associado a superfı́cie, para gerar uma
representação mı́nima para o código do fluxo geodésico discutido no Capı́tulo 5. É sabido que esse
código possui uma representação, contudo, até onde sabemos, sua determinação (não necessariamente
mı́nima) empregando os métodos disponibilizados na literatura envolve etapas cuja complexidade é
exponencial em relação ao número de estados. Nosso método de determinação de uma representação
mı́nima não necessita de cálculos adicionais, a não ser a determinação de um subconjunto finito de
sequências proibidas decorrentes das propriedades topológicas do grupo fuchsiano associado à su-
perfı́cie, seguido pela determinação dos vértices e ramos da apresentação derivados diretamente do
conjunto de proibições.
Finalmente, no Capı́tulo 7 apresentamos as conclusões e os trabalhos futuros.
Capı́tulo 2
Sistemas Dinâmicos, Códigos e Dinâmica

Simbólica
Considerando uma abordagem clássica, a descrição dos sistemas dinâmicos é realizada pela especi-
ficação da evolução do seu espaço de estados. Como exemplo notório e importante, têm-se o estudo
dos sistemas dinâmicos no contexto de equações diferenciais. Nesta abordagem é pressuposto que o
estado evolui de maneira autônoma, ou seja, o caminho descrito no espaço de estado só depende do
estado inicial e das leis de movimento. Portanto, a não ser para algumas situações bem definidas em
sistemas mecânicos e elétricos, a abordagem clássica não deixa claro como as variáveis de estado de-
vem ser especificadas. Além do que, esta abordagem não formaliza como influências externas devem
ser incorporadas, equivalendo a uma evolução do sistema com base unicamente nas forças internas.
Decorre da suposição que o estado evolui de forma determinı́stica, que o sistema encontra-se iso-
lado do ambiente, contudo não existem sistemas isolados. A abordagem clássica assume que a forma
como o ambiente influencia o sistema é conhecida, como também as condições de contorno e como
são geradas as influências externas. Em sı́ntese, ao modelar-se um sistema dinâmico real através de
uma abordagem clássica, em última instância, deparamo-nos com a impossı́vel suposição de termos
que modelar o ambiente.
Um contraponto aos métodos clássicos é apresentado por Willems em [1]. Inspirado em abor-
dagens tı́picas de teoria de circuitos, controle e processamento digital de sinais, como também de
ciência da computação; sua abordagem considera o sistema dinâmico como uma caixa preta que re-
cebe estı́mulos do meio (entradas), e como reação a estes produz uma saı́da. O conceito é similar
ao empregado em teoria de controle, incorporando variáveis de estado a estrutura especificada pelas
entradas e saı́das. O sistema dinâmico passa a ser visto como um objeto que está inserido em seu meio
e interage com este, no entanto é abstraı́do deste, como ilustrado na Figura 2.1. Nesta abordagem,
desejamos determinar a evolução de certos atributos em função do tempo, para isso o conjunto de ins-
5
6 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica
Modelo do w Meio
Sistema Modelo do w Modelo do
Desconhecido
Dinâmico Σ Variáveis de Sistema Meio
Interação Dinâmico Σ Variáveis de
Interação
Figura 2.1: Modelo apresentado por

Figura 2.2: Modelo Clássico.
Willems.
tantes de tempo relevantes T é selecionado e o conjunto W onde os valores de tais atributos podem
ser observados. As leis que regem a evolução da dinâmica no tempo determinam quais trajetórias
podem ocorrer e quais não podem, especificando o comportamento do sistema.
Nesta abordagem, quaisquer relações que especifiquem a dinâmica (e.g., as equações do modelo)
são empregadas como os elementos básicos para o processo de análise, determinando as considerações
iniciais a partir das quais a análise deve prosseguir, e que devem ser empregados na fundamentação
teórica do sistema dinâmico. Quaisquer pré-considerações sobre o modelo devem ser justificadas pelo
aparato teórico empregado na modelagem. Esta visão contrasta com a clássica, onde o meio também
é visto como um sistema dinâmico especı́fico, o que torna possı́vel considerar-se o sistema dinâmico
sobre análise como autônomo, como consequência o meio deve ser modelado, como ilustrado na
Figura 2.2.
Em consonância com a proposta apresentada, um sistema dinâmico é interpretado como uma
famı́lia de regras que restringem o conjunto de sinais produzidos pelo sistema dinâmico, e por-
tanto, que determinam o comportamento do sistema. O conjunto de todos os sinais compatı́veis
com estas regras definem o comportamento do sistema. No entanto, regras e modelos derivados de
princı́pios fundamentais conterão invariavelmente variáveis adicionais àquelas modeladas, denomi-
nadas de variáveis latentes. Algumas variáveis latentes podem ter propriedades importantes relacio-
nadas a captura da estrutura da memória do sistema, o que conduz ao importante conceito de estado
do sistema dinâmico. Estes elementos são ilustrados no Exemplo 1.
Definição 1. Um sistema dinâmico Σ é definido por uma tripla
Σ = (T, W, B)
onde T ⊆ R é o tempo; W é um conjunto abstrato chamado de alfabeto de sinais; e B ⊆ W T é o

comportamento.
O conjunto T refere-se aos instantes de tempo relevantes para o problema considerado. Usual-
7
w
~1
m
I RC RL
L F~
V ~1z
C L
Sistema w
~2
Meio
Figura 2.3: Modelo do comportamento Figura 2.4: Relação entre as posições w

~1
térmico do circuito elétrico. ew~ 2.
mente, T é igual a R ou R+ no caso de sistemas em tempo contı́nuo, e Z ou Z+ no caso de sistemas em

tempo discreto, também sendo definido em intervalos de R e Z. O conjunto W especifica os atributos
do sistema dinâmico que são formalizados como elementos de um conjunto, sendo estes atributos
as variáveis cujas evoluções no tempo estão sendo descritas. Tais atributos são uma combinação de
variáveis observadas e das variáveis que propiciam a interação do sistema com o meio. O comporta-
mento B constitui a famı́lia de trajetórias descritas no tempo com valores no alfabeto W . Assim, os
elementos de B são as trajetórias compatı́veis com as regras ou leis que governam o sistema, de outra
forma, são sinais definidos no tempo compatı́veis com o modelo do sistema dinâmico. Em muitas
aplicações B é determinado através de equações diferenciais, a diferença ou integrais. Neste caso,
podemos considerar um mapa b : W T → E com E = {0, 1}, ou ainda, de forma mais geral, um
espaço vetorial onde B = b−1 (0). Denotando as equações que especificam o sistema por equações de
comportamento.
Exemplo 1. A análise do comportamento térmico de um circuito elétrico é um caso tı́pico de constru-

ção de um modelo dinâmico a partir de princı́pios fı́sicos fundamentais ou princı́pios primeiros1 . O
circuito interage com o meio externo através de suas portas externas, o que é descrito pela corrente I
através do circuito e a tensão V nos seus terminais externos. Desta forma, obtemos que W = R2 e
T = R. Para especificar o comportamento térmico do circuito, serão introduzidas a corrente através
dos ramos e a tensão sobre os ramos do circuito Figura 2.3, de forma a serem satisfeitas as equações
constituintes em (2.1).
VRC = RC IRC ; VRL = RL IRL ; C V̇C = IC ; L IL = VL (2.1)
1
e.g., sistema axiomático ou leis fundamentais da fı́sica.
Além de satisfazer a lei de Kirchhoff para corrente (2.2) e a lei de Kirchhoff para tensão (2.3).
I = IRC + IRL ; IRC = IC ; IRL = IL (2.2)
V = VC + VRC = VL + VRL (2.3)
Portanto, o comportamento da porta é formalmente definido em (2.4).
B ={(I, V) : R → R2 |∃ (IRC , VRC , IRL , VRL , IC , VC , IL , VL ) : R → R8

(2.4)
satisfazendo as equações de comportamento (2.1), (2.2) e (2.3)}.
Após a eliminação das variáveis IRC , VRC , IRL , VRL , IC , VC , IL , VL , obtém-se como equação de
comportamento a equação diferencial (2.5).
RC LC Ï + (L + RC RL C)İ + RL I = LC V̈ + (RC + RL )C V̇ + V (2.5)
Permitindo a especificação explı́cita do comportamento em (2.6).
B = {(I, V) : R → R2 | satisfazendo a equação (2.5)} (2.6)
No Exemplo 1 a descrição das variáveis básicas V, I foi obtida a partir de princı́pios fundamentais.
Contudo, o processo de modelagem envolveu variáveis auxiliares adicionais àquelas descritas, neste
caso IRC , VRC , IRL , VRL , IC , VC , IL , VL , correspondendo às variáveis latentes. A inserção destas
variáveis ocorre essencialmente por tornarem-se convenientes na escrita das equações de movimento,
ou por serem essenciais ao expressar as leis de constituição2 ou de conservação3 que definem o com-
portamento do sistema. Variáveis latentes ocorrem invariavelmente quando o sistema modelado for
tratado como uma interconexão de subsistemas, uma abordagem comum na determinação de mode-
los. Este procedimento é mais uma vez exemplificado no Exemplo 2, onde as variáveis externas dos
subsistemas tornam-se variáveis latentes para o sistema interconectado.
Exemplo 2. Considerando o pêndulo da Figura 2.4. Deseja-se modelar a relação entre as posições
w
~ 1 da massa e w
~ 2 do suporte do pêndulo, podendo ser interpretado como o passo inicial no projeto de
um controlador que estabilize w
~ 1 em uma dada trajetória pelo emprego de w
~ 2 como controle. Como
2
Expressas por relações entre quantidades fı́sicas que são especı́ficas de um material ou substância, aproximando
a resposta do material a forças externas. Ao serem combinadas com equações que expressam leis fı́sicas, permitem a
solução de problemas fı́sicos como a resposta de um cristal a um campo elétrico. Em muitos casos são expressas por
proporções simples, como é o caso da condutividade elétrica ou constante de elasticidade de uma mola.
3
Especifica quando uma propriedade mensurável de um sistema fı́sico isolado não muda enquanto o sistema evolui,
e.g., conservação da massa-energia e da carga elétrica do sistema.
9
ocorre quando w~ 1 representa o centro de massa de um veı́culo lançador de satélites e w

~ 2 a saı́da do
sistema de propulsão. Para obtenção de um modelo para este sistema, inserimos a força F~ na barra
de comprimento L e o fator de proporcionalidade a entre F~ e w
~1 − w
~ 2 como variáveis auxiliares.
Obtém-se as equações de comportamento (2.7).
d2 w
~1
m = mg~1z + F~
dt2
||w
~1 − w
~ 2 || = L (2.7)
F~ = a(w
~1 − w
~ 2)
Onde m e a massa do pêndulo, g é a constante gravitacional e ~1z é o vetor unitário na direção z. As

equações em (2.7) especificam completamente o comportamento definido em (2.8).
B = {(w
~ 1, w ~ : R → R3 e a : R → R satisfazendo (2.7)}.
~ 2) : R → R3 × R3 |∃ F (2.8)
Assim como as tensões e correntes sobre os elementos resistivos, capacitivos e indutivos do Exem-
~ na barra
plo 1 foram empregados como variáveis auxiliares à determinação de um modelo, a força F
do pêndulo e o fator de proporcionalidade a cumpre papel similar. Novamente, a análise do sistema
envolve a interconexão de seus componentes constituintes, cujas especificações dos comportamentos
através das relações entre variáveis de entrada e saı́da sabemos descrever, cujas descrições parciais
envolvem variáveis latentes empregadas na determinação da solução global.
Não só na análise de sistemas reais, como também em abordagens puramente teóricas, as variáveis
latentes assumem um papel relevante. Pois, assim como as variáveis de estado ou as variáveis livres,
são necessárias na redução de equações de movimento à expressões puramente locais no tempo.
Em uma primeira análise, podemos considerar dois tipos de variáveis: as diretamente observáveis
(explı́citas) e as latentes (implı́citas). Como exemplo, em termodinâmica a pressão, temperatura e
volume são variáveis explı́citas, enquanto a energia interna e entropia podem ser consideradas como
variáveis latentes, cujo valor é deduzido a partir das variáveis explı́citas. Em um contexto econômico,
o número de vendas pode ser visto como uma variável explı́cita, enquanto a demanda dos consu-
midores como uma variável latente. Especificar que variáveis são observáveis ou mensuráveis está
relacionado a disponibilidade instrumental e tecnológica, sendo um conceito flexı́vel que adequa-se
aos objetivos da análise. O conceito de variáveis latentes é formalmente estabelecido na Definição 2.
Definição 2. O sistema dinâmico com variáveis latentes é uma quádrupla
Σa = (T, W, A, Ba )
com T, W já especificados na Definição 1; A é o conjunto de variáveis latentes e Ba ⊆ (W × A)T o

comportamento (estendido).
O sistema Σa é chamado de um modelo com variáveis latentes para o sistema dinâmico induzido
Σ = (T, W, Pw Ba ), onde Pw : (W × A)T → W T satisfaz (Pw w)(t) = Pw (w(t)), reduzindo-se a
uma projeção quando aplicado a um elemento de W × A, ou seja, Pw (w, a) := w. Na abordagem
considerada, pode-se interpretar Ba como o comportamento interno do sistema, enquanto Pw Ba como
o comportamento externo.
2.1 Estrutura Básica

Muitos conceitos gerais em matemática podem ser aplicados a sistemas dinâmicos quando introduzi-
dos através da Definição 1.
2.1.1 Linearidade
Um sistema dinâmico Σ = (T, W, B) é dito linear se W é um espaço vetorial e B é um subespaço
linear de W T , este último um espaço vetorial obtido pela adição ponto-a-ponto e multiplicação por
escalar.
2.1.2 Invariante no tempo

Um sistema dinâmico Σ = (T, W, B) é dito invariante no tempo se T é um semigrupo aditivo em R
(∀ t1 , t2 ∈ T ⇒ t1 + t2 ∈ T ) e σ t B ⊆ B para todo t ∈ T , onde σ t é o t-deslocamento à esquerda,
ou seja, (σ t f )(t′ ) := f (t′ + t). Ambos os exemplos introduzidos acima são casos tı́picos de sistemas
invariantes no tempo.
2.1.3 Simetria
Seja Σ uma famı́lia de sistemas dinâmicos. Cada elemento em Σ é um sistema dinâmico de acordo
com a Definição 1. Seja G um grupo e G = (Sg , g ∈ G) um grupo de transformações em Σ, ou
seja, cada Sg : Σ → Σ é uma bijeção com Sg1 ◦g2 = Sg1 ◦ Sg2 . O par ordenado (Σ, G) é chamado
de estrutura de simetria. Um elemento Σ ∈ Σ é dito G-simétrico se Sg Σ = Σ para todo g ∈ G.
De modo informal, diz-se que Σ possui G como uma simetria. Como exemplo de simetrias comuns,
pode-se citar:
2.2 O Conceito de Memória 11
(1) Seja T = G um subgrupo aditivo de R e Sg (T, W, B) = (T + g, W, σ g B). Neste caso, os sistemas

simétricos são aqueles invariantes no tempo.
(2) Seja (Sgw , g ∈ G) um grupo de transformações sobre W e Sg (T, W, B) = (T, W, Sg B), onde
Sg B = {Sg (w(·)) : T → W |w ∈ B}. A simetria resultante sugere um comportamento que
é invariante sobre algumas mudanças de sinal ou permutações dos componentes das variáveis
externas, e.g., a permutação de partı́culas em um sistema com n partı́culas idênticas.
(3) Seja G = {0, 1} e considere S1 (T, W, B) = (−T, W, RB) onde R é a inversão do eixo do tempo:
(Rf )(t) := f (−t). O sistema de simetria resultante é dito inversı́vel no tempo, como exemplos,
têm-se os sistemas descritos por equações diferenciais contendo só derivados de ordem par.
(4) Seja J uma involução sobre W (i.e., J = J−1 ). Considerando G = {0, 1} e S1 (T, W, B) =
(−T, W, JRB). A simetria resultante é algumas vezes chamada de reversão do tempo. A
involução J é empregado para expressar que pode ser necessário alterar o sinal da velocidade,
em alguns sistemas mecânicos, quando realiza-se uma reversão no tempo.
Nas considerações que seguem, nos restringiremos a explanação de sistemas invariantes no tempo,
particularmente nos casos T = R ou Z. Esta consideração deve-se principalmente ao enfoque em
dinâmica simbólica e a caracterı́stica conceitual do texto, o que faz destes casos mais adequados para
apresentação dos resultados.
2.2 O Conceito de Memória

Um dos aspectos dos sistemas dinâmicos que justificam o grande esforço a estes dedicado pela co-
munidade cientı́fica é o fato de apresentarem memória, ou seja, a evolução futura do sistema ser
influenciada pela sua evolução até o presente. Este aspecto é o que o diferencia de mapas e relações
arbitrárias. As propriedades da estrutura de memória do sistema, nos permite classificá-lo em quatro
tipos não excludentes.
2.2.1 Concatenação e mapa não-antecipativo

Quanto ao estudo de sistemas dinâmicos, o conceito de interação entre o passado e o futuro de famı́lias
de funções temporais assume papel fundamental, pela concatenação do passado e do futuro, e pelo
modo como o passado e o futuro interagem com mapas.
Sejam T ⊂ R e W conjuntos. Para um dado mapa w : T → W definem-se os mapas:
w − := w|T ∩(−∞,0) (o passado estrito de w)

w −0 := w|T ∩(−∞,0] (o passado e presente de w)
w + := w|T ∩[0,∞) (o futuro estrito de w)
w 0+ := w|T ∩(0,∞) (o presente e futuro de w)
Para B ⊆ W T , estes conceitos conduzem às extensões B− , B−0 , B0+ , e B+ de significado imediato.
Sejam w1 , w2 : T → W e t ∈ T . As concatenações em t de w1 , w2 : T → W , representadas por
w1 Λ− w2 e w1 Λ+ w2 , são definidas como
t t

w (t′ ) para t′ <t
′ 1
w1 Λ− w2 (t ) :=
t w (t′ ) para t′ ≥t
2

w (t′ ) para t′ ≤t
′ 1
w1 Λ+ w2 (t ) :=
t  w (t′ ) para t′
2 >t
Para B1 , B2 ⊆ W T obtêm-se as extensões B1 Λ− B2 e B1 Λ+ B2 de significado imediato.

t t
Estas definições podem ser facilmente estendidas para os casos em que os mapas considerados já
possuem restrições. Assim, w1− Λ− w20+ := w1 Λ− w2 e w1−0 Λ+ w2+ := w1 Λ+ w2 , etc. Sendo pertinente sali-
0 0 0 0
entar que para o caso discreto (T = Z) observa-se Λ − = Λ+ , de tal forma que não há a necessidade
(t+1) t
de introduzirem-se ambos Λ− e Λ+ . Ressaltando a necessidade de ambos no caso contı́nuo.
t t
Seja T ⊆ R, W1 e W2 conjuntos, como também B1 ⊆ W1T , B2 ⊆ W2T . Consideremos o mapa F :

B1 → B2 . O mapa F seja denominado não-antecipativo se w1′ , w1′′ ∈ B1 , t ∈ T, e w1′ (t′ ) = w2′′ (t′ )

para t′ ≤ t ⇒ (F w1′ )(t′ ) para t′ ≤ t . O mapa F será chamado estritamente não-antecipativo se

′ ′′
w1 , w1 ∈ B1 , t ∈ T, e w1′ (t′ ) = w1′′ (t′ ) para t′ < t ⇒ (F w1′ )(t′ ) = (F w1′′)(t′ ) para t′ ≤ t .

2.2.2 Completude
Relacionado com a possibilidade das equações de comportamento serem escritas através de equações
a diferença, portanto, as equações de comportamento não podem se estender indefinidamente para
o passado, no sentido −∞, como também para o futuro, no sentido +∞. Dito isso, um sistema
dinâmico Σ = (T, W, B) é dito completo se,
{w ∈ B} ⇔ {w|[t0,t1 ] ∈ B|[t0 ,t1 ] : t0 , t1 ∈ R tal que − ∞ < t0 ≤ t1 < ∞}.

Sendo chamado de L-completo se,
{w ∈ B} ⇔ {w|[t,t+L] ∈ B|[t,t+L] : ∀ t ∈ T }.
Se um sistema é L-completo para todo L > 0, será chamado especificado localmente. Se um sistema
é 0-completo, será chamado especificado instantâneamente. Estas noções conduzem a interpretações
intuitivas. Um sistema dinâmico discreto no tempo é governado pelo conjunto de equações a diferença
f (w(t + L), w(t + L − 1), . . . , w(t)) = 0, t ∈ Z,
se, e somente se, ele é L-completo. Para o mapa f : W L → R pode-se tomar qualquer um que
satisfaça f −1 (0) = B|[0,L] ∈ W L , o que formalmente equivale a especificar uma equação a diferença
que defina o comportamento B = {w : Z → W | a equação a diferença é satisfeita para todo t ∈ Z}.
Neste contexto, o inteiro L ∈ Z+ é dito a latência. Similarmente, desconsiderando inicialmente
maiores considerações sobre a continuidade da variedade considerada, um sistema contı́nuo no tempo
governado por um conjunto de equações diferenciais
dn w dn−1 w

f (t), (t), . . . , w(t) = 0, t ∈ R,
dtn dtn−1
também é localmente especificado. Como é de se esperar, um sistema é especificado instantâneamente

se, e somente se, ele é governado por leis não-dinâmicas, ou seja, se ele é governado por equações de
comportamento da forma f (w(t)) = 0, t ∈ T .
2.2.3 Extensão da memória
Extensão de memória expressa o intervalo de tempo no qual há uma conexão entre o passado e o
futuro. Mais formalmente, diz-se que um sistema dinâmico Σ = (T, W, B) possui memória ∆-finita
(ou que sua memória possui extensão ∆) se
n o
w1 , w2 ∈ B, e w1 |[0,∆) = w2 |[0,∆) ⇒ w1 Λ− w2 ∈ B ,
0
sendo dito de memória finita se possui memória ∆-finita para algum ∆ > 0; ou memória local se pos-
sui memória ∆-finita para todo ∆ > 0. Ao nos referirmos a extensão da memória, como geralmente
adotado, referimo-nos implicitamente a ∆min , o mı́nimo ∆ ∈ Z+ apresentando a propriedade acima.
Quando a memória só é constituı́da do valor presente, ela recebe uma denominação proveniente da
Tabela 2.1: R ELACIONANDO C ONCEITOS DE M EM ÓRIA .

Especificação Especificação
=⇒ ⇒ t-completo ⇒ Completo
Instantânea Local
⇓ ⇓ ⇓
Sem Memória Memória Memória
⇒ Markoviano ⇒ ⇒ ⇒
Memória Local t-finita Finita
teoria de processos estocásticos: Σ é dito Markoviano se

w1 , w2 ∈ B, w1 (0) = w2 (0) ⇒ w1 Λ− w2 ∈ B .
0
O sistema é dito sem memória se B é fechado sobre concatenação, i.e., se

w1 , w2 ∈ B ⇒ w1 Λ− w2 ∈ B .
0
Para o caso de sistemas dinâmicos discretos no tempo, os conceitos de completude e extensão

de memória estão intimamente relacionados. Considerando um tal sistema Σ = (Z, W, B), se Σ
é t-completo então, segue dos conceitos de completude e expansão de memória, este é completo e
possui memória t-finita, o que estabelece uma relação de implicação direta. Agora, com o objetivo
de estabelecer a relação de implicação contrária, assuma que Σ possui memória t-finita e que w :
T → W possui a propriedade w|[t′ ,t′ +t) ∈ B|[t′ ,t′ +t) para todo t′ ∈ Z. Neste caso, há w1 , w2 , w3, w4
satisfazendo w1 ′ Λ − w ′ Λ − w2 ∈ B e w3 Λ
′ −
w Λ w4 ∈ B. Segue de supormos que o sistema
(t −1) (t +t) (t ) (t′ +t+1)−
é de memória t-finita que w1 ′ Λ − w Λ w4 ∈ B. Logo, w|[t′ ,t′ +t+1) ∈ B|[t′ ,t′ +t+1) para todo
(t −1) (t′ +t+1)−
t′ ∈ Z, consequentemente w|[t′ ,t′ +t] ∈ B|[t′ ,t′ +t] para todo t′ ∈ Z. Segue da definição de um sistema
L-completo que Σ é t-completo. Este resultado é resumido na Proposição 1.
Proposição 1. [1] Seja Σ = (Z, W, B) um sistema dinâmico discreto. Então

Σ é t-completo ⇔ Σ é completo e possui memória t-finita .
Podendo ser demonstradas implicações associadas a conceitos distintos de memória, como espe-
cificado na Tabela 2.1.
Se T = Z, e se Σ é completo, então as setas verticais da Tabela 2.1 também podem ser revertidas, o
que seguirá da Proposição 1. Destes resultados, a nı́vel de aplicação temos o resultado: Um sistema
discreto no tempo pode ser descrito através de uma equação a diferença com latência L se, e somente
se, ele é completo e possui memória L-finita.
2.2.4 Dividindo variáveis

A interação entre as variáveis latentes e a estrutura da memória de um sistema propicia elementos
relevantes à análise dos sistemas dinâmicos. Inicialmente, consideramos o conceito onde o valor
presente das variáveis latentes determinam o comportamento futuro da variável associada ao sinal ex-
terno. Seja Σa = (T, W, A, Ba ) um sistema dinâmico com variáveis latentes. Diz-se que as variáveis
latentes dividem o comportamento externo se
n o
(w1 , a1 ), (w2 , a2 ) ∈ Ba , e a1 (0) = a2 (0) ⇒ w1 Λ− w2 ∈ Pw Ba .
0
2.2.5 Sistema de variáveis de estado

Refere-se a variáveis latentes que parametrizam o conteúdo da memória do sistema. Se combinarmos
a propriedade de divisão introduzida na Seção 2.2.4 com a Markoviana da Seção 2.2.3, obtém-se a
importante classe de sistemas apresentada na Definição 3.
Definição 3. Seja ΣS = (T, W, X, BS ) um sistema dinâmico com variáveis latentes. Este será cha-
mado um sistema dinâmico na forma de espaço de estados, com espaço de estados X, se o com-
portamento BS ⊆ (W × X)T satisfaz o que é chamado de axioma de estado. Significando que a

implicação (w1 , x1 ), (w2 , x2 ) ∈ BS , e x1 (0) = x2 (0) ⇒ (w1 , x1 )Λ− (w2 , x2 ) ∈ BS é verificada.
0
Neste caso Pw BS é chamado de comportamento externo de ΣS , enquanto (T, W, Pw BS ) o sistema

induzido por ΣS . Reciprocamente, ΣS = (T, W, X, BS ) é chamado de uma representação via espaço
de estados (ou realização via espaço de estados) de Σ = (T, W, Pw BS ). Por fim, Bx = Px BS será
chamado de comportamento dos estados, onde Px : (W × X) → X é a projeção Px (w, x) = x. Em
ocasiões onde for necessário considerar todos os estados de um sistema, considerar-se-a o sistema de
estados Σx = (T, X, Bx ).
Pode-se verificar que em um sistema de espaço de estados x divide w, que (T, W, X, BS ) é Mar-
koviano, e que o sistema de estados Σx = (T, W, Bx ) também é Markoviano. Percebe-se que em
um sitema de espaço de estados x divide conjuntamente w e x. Os conceitos até então apresenta-
dos, encontram-se entre os que apresentam-se como os mais profı́cuos para análise e modelagem de
sistemas dinâmicos. A maioria dos modelos encontrados na fı́sica, economia, simulação dinâmica,
controle e estimação dinâmicos, etc., são apresentados na forma de espaço de estados. Valendo res-
saltar que o conceito de estado, de acordo com o meu entendimento, não deve ser interpretado como
um princı́pio fundamental, mas com uma variável que deve ser construı́da de acordo com o modelo
apresentado, ou seja, baseada em seu comportamento externo, ou do modelo que incorpora variáveis
latentes. Esta é uma forma que conduz a determinação de modelos matemáticos a partir de princı́pios
fı́sicos ou econômicos, portanto, o ponto de partida para de uma teoria matemática para dinâmica.
W
σ−t w20+
w
0 t T
w1−
Figura 2.5: Representação de um sistema controlável.
2.2.6 Sistemas autônomos, controláveis e essenciais

As noções de sistemas autônomos e controláveis têm como objetivo classificar com que extensão o
passado influencia o futuro. Em sistemas autônomos o passado especifica o futuro. Em sistemas
controláveis o passado não influência o futuro “distante”.
Seja Σ = (T, W, B) um sistema invariante no tempo com T = R ou Z. Ele é dito autônomo se
+
há um mapa f : B− → B0+ tal que para todo w ∈ W T tem-se que {w = w − Λ− w 0 ∈ B} ⇔ {w − ∈
0
B e w 0+ = f (w − )}. O sistema Σ é dito controlável se para todo w1 , w2 ∈ B há um t ∈ T , t ≥ 0, e
um w : T ∩ [0, t) → W tal que w1 Λ− wΛ− σ −t w2 ∈ B, como mostrado na Figura 2.5. Como definições
0 t
+
equivalentes, poderı́amos ter definido f : B−0 → B0 para sistemas autônomos, e quaisquer das
concatenações w1 Λ− wΛ+ σ −t w2 , w1 Λ+ wΛ− σ −t w2 ou w1 Λ+ wΛ− σ −t w2 para sistemas controláveis.
0 t 0 t 0 t
Nesta abordagem, o conceito de controlabilidade é uma propriedade do comportamento externo
do sistema dinâmico. Em um sistema dinâmico controlável é possı́vel direcionar o sistema para seguir
qualquer trajetória futura, independentemente da trajetória passada.
Considerando as especificações comuns de sistemas a dinâmicos através de equações diferença e
diferenciais. Se uma equação a diferença possui uma solução para um valor de latência máximo, i.e.,
se é da forma
w(t + L) = f ′ (w(t + L − 1), . . . , w(t)),
então o sistema dinâmico resultante será autônomo. No caso contı́nuo, um sistema dinâmico descrito
pela equação diferencial
dn w
n−1
′ d w
(t) = f (t), . . . , w(t) ,
dtn dtn−1
será autônomo (assumindo que f ′ é suficiente contı́nuo), tal que, a equação diferencial possui solução
única para toda a condição inicial
dn−1 w

dw
w(0), (0), . . . , n−1 (0) .
dt dt
2.3 Leis de Evolução 17
Os conceitos de linearidade, simetria, autonomia, controlabilidade, etc., inicialmente apresentados

para sistemas dinâmicos definidos em função do seu comportamento externo, podem ser natural-
mente extendidos para uma representação via espaço de estados de um sistema dinâmico, ou sistemas
envolvendo variáveis latentes. Neste contexto, pode-se provar que um sistema ΣS = (T, W, X, BS )
é autônomo se, e somente se, há um mapa f˜ : X → B0 tal que {(w, x) ∈ BS } ⇒ {(w, x)0+ =
+
S
f˜(x(0))}. Este resultado é apresentado na Proposição 2.
Proposição 2. [1] Um sistema representado por um espaço de estados ΣS = (T, W, X, BS ) é

autônomo se, e somente se, existe um mapa f˜ : X → BS0+ tal que {(w, x) ∈ BS } ⇒ {(w, x)0+ =
f˜(x(0))}.
Considerando um sistema dinâmico invariante no tempo Σ = (T, W, B) com T = Z ou R. Ele

será dito essencial se para todo w ∈ W há um w ∈ B tal que w(0) = w. Em um sistema essen-
cial todos os valores ou atributos externos ocorrerão. Como exemplo comparativo, em um sistema
especificado instantâneamente, não ser um sistema essencial é o que determina as propriedades ou
regras do sistema. Este conceito pode ser generalizado para o caso de sistemas com variáveis latentes.
Neste caso, diz-se que um sistema é essencial nas variáveis latentes quando o sistema (T, W, Pa Ba )
é essencial. Como as variáveis latentes são variáveis auxiliares, é natural assumir que o comporta-
mento interno (nas variáveis latentes) é essencial, caso contrário, só precisamos redefinir o conjunto
A. Quando as variáveis latentes são variáveis de estado, falaremos em sistemas que possuem espaço
de estados essencial.
Retornando ao caso de um sistema controlável. O conceito apresentado aqui e o caso clássico
de controlabilidade do espaço de estado são intrinsecamente relacionados. Seja Σx = (T, X, Bx ) o
sistema de estados de um sistema. Ou seja, assumiremos que ele é Markoviano. Diz-se que Σx é
estado controlável se, para todo x0 , x1 ∈ X, há um x ∈ Bx e um t ∈ T , t ≥ 0, tal que x(0) = x0
e x(t) = x1 . O conceito de controlabilidade, como usualmente empregado na literatura de teoria de
controle, de forma geral, corresponde ao conceito de estado controlável de um sistema de estados. O
que é formalizado na Proposição 3.
Proposição 3. [1] Seja Σx essencial. Então ele é controlável se, e somente se, é estado controlável.
Além disso, se Σx é estado controlável, então Σ é controlável.
2.3 Leis de Evolução

A maioria dos modelos práticos de sistemas dinâmicos estão na forma de equações a diferença ou
diferencial. Sendo que equações a diferença ou diferenciais de maior ordem podem ser reduzidas a
equações de ordem um pela redefinição das variáveis de latência ou derivadas como novas variáveis.
Portanto, restringir nossa abordagem ao caso de equações a diferença e diferenciais de primeira ordem
não limita o escopo dos resultados aqui apresentados. Tais modelos são definidos automaticamente
quando o sistema é representado na forma de espaço de estados.
Definição 4. Uma lei de evolução discreta no tempo é definida como uma quádrupla
Σ∂ = (T, W, X, ∂)
onde T ⊆ Z o eixo do tempo, sendo que comumente T = Z; W é o alfabeto de sinais; X o espaço

de estados; e ∂ ⊆ X × W × X a relação próximo-estado.
A interpretação intuitiva de ∂ é dada por: (x0 , w, x1 ) ∈ ∂ implica que se o sistema está no

estado x0 , então ele pode prosseguir para o estado x1 enquanto produz o valor de sinal externo w. O
comportamento induzido por ∂ é definido como B∂ := {(w, x) : Z → W ×X| (x(t), w(t), x(t+1)) ∈
∂ para todo t ∈ Z}. Podendo ser verificado que B∂ satisfaz o axioma de estado e que é invariante no
tempo. Obtém-se de B∂ : O sistema na forma de espaço de estado ΣS = (Z, W, X, B∂ ) induzido por
Σ∂ ; o comportamento externo B = Pw B∂ ; e o sistema dinâmico Σ = (Z, W, Pw B∂ ) induzido por Σ∂ .
O que é denotado por
∂ ⇒ B∂ ⇒ B e Σ∂ ⇒ ΣS ⇒ Σ.
A versão contı́nua no tempo análoga a uma relação próximo-estado é uma relação diferencial de
primeira-ordem. Neste caso, no lugar do próximo estado onde o sistema é permitido estar, especifica-
se em que direção e com que velocidade ele pode prosseguir.
Definição 5. Uma lei de evolução contı́nua no tempo é definida pela quádrupla
Σ∂ = (T, W, X, ∂)
onde T ⊆ R é um intervalo, o eixo do tempo, sendo que comumente T = R; W é o alfabeto de

sinais; X o espaço de estados, uma variedade contı́nua; e ∂ ⊆ T X × W a relação campo-vetorial,
onde T X é o fibrado tangente de X.
Como caso mais comum, X pode ser pensado como um subconjunto aberto do Rn e identificar
T X com X × Rn . A interpretação a ser dada para tal estrutura é que ((x, v), w) ∈ ∂ significa
que quando o sistema está no estado x, ele poderá prosseguir com velocidade v enquanto produz o
valor de sinal externo w. Definindo o comportamento induzido por ∂ como B∂ := {(w, x) : R →
W × X| x é absolutamente contı́nuo e ((x(t), ẋ(t)), w(t)) ∈ ∂ para todo t ∈ R onde ẋ(t) existe}.
Portanto, o comportamento de uma lei de evolução discreta no tempo pode ser vista como o conjunto
de soluções de uma equação a diferença que é de primeira ordem em x e de ordem zero em w:
f (x(t), w(t), x(t + 1) = 0 (∂ = f −1 (0)). Enquanto uma lei de evolução contı́nua no tempo pode ser
vista como descrita por equações diferenciais que são de primeira ordem em x e de ordem zero em
w: f (x(t), ẋ(t), w(t)) = 0 (∂ := f −1 (0)).
Como no caso discreto, B∂ satisfaz o axioma de estado, além do que também verifica-se que:
∂ ⇒ B∂ ⇒ B e Σ∂ ⇒ ΣS ⇒ Σ.
Ao definir-se um sistema em termos de seu comportamento, em essencia, se estabelece uma regra,

uma especificação, uma lei, através da qual pode-se verificar se uma trajetória em particular no tempo
sobre W é ou não compatı́vel com o sistema. Uma lei de evolução ∂, por outro lado, fornece uma
gramática, um procedimento, um algoritmo através do qual elementos de B podem ser gerados4 .
Portanto, se um por (w, x) é compatı́vel com o comportamento, isso pode ser verificado completa-
mente através dos valores dos pontos adjacentes, ou seja, em função do comportamento local (onde o
conceito de localidade foi considerado em relação ao tempo, no entanto, conceitos e idéias similares
podem ser considerados no contexto espacial).
2.3.1 A lei de evolução induzida por uma representação via espaço de estados
Construção de leis de evolução que simulam um sistema representado via espaço de estados. Consi-
derando, inicialmente, o caso discreto. Seja ΣS = (Z, W, X, BS ) um sistema representado via espaço
de estados, discreto no tempo e invariante no tempo. A lei de evolução induzida por ΣS é definida
por Σ∂ = (Z, W, X, ∂), onde
∂ := {(x0 , w, x1) ∈ X × W × X|∃ (w, x) ∈ BS

(2.9)
tal que x(0) = x0 , x(1) = x1 , e w(0) = w}.
Decorrendo do discutido na Seção 2.3 que ∂ induz um sistema via espaço de estados, o qual terá
o comportamento representado por B̄S , observamos que BS ⊆ B̄S . Um caso tı́pico onde ocorre a
inclusão estrita é o das Rq -sequências cuja soma dos quadrados existe, l2 (Z, Rq ) (podendo ser escrita
como o sistema (Z, Rq , 0, l2(Z, Rq )). Neste caso B̄S é igual a (Rq )Z , o que inclui l2 (Z, Rq ) como
um subconjunto estrito. Este caso conduz a questão: Quando BS = B̄S ? Para um sistema dinâmico
Σ = (T, W, B) a complementação de seu comportamento é definida por
Bcompl := {w : T → W | w|[t0,t1 ] ∈ B|[t0 ,t1 ] para todo − ∞ < t0 ≤ t1 < ∞}.
4
Estes conceitos serão explorados (exemplificados) no Capı́tulo 3 e Capı́tulo 6.
Podendo ser demonstrado que Bcompl é o menor subconjunto de W T que é completo e contém B.
Sendo uma consequência direta que Bcompl será invariante no tempo e/ou linear se B for. Estes
conceitos definem os elementos necessários para a demonstração do Teorema 4.
Teorema 4. [1] Seja ΣS = (Z, W, X, BS ) um sistema representado via espaço de estados e B̄S o
comportamento da lei de evolução induzida por ele. Portanto, B̄S = BScompl . Têm-se como con-
sequência que {BS = B̄S } ⇔ {ΣS é completo}. Ou seja, um comportamento BS só é integralmente
representado por uma lei de evolução se, e somente se, ele é completo.
Demonstração: Como consequência de ΣS ser uma representação via espaço de estados, o com-
portamento BS é Markoviano. Portanto, BScompl possui memória 1. Considerando os conceitos da
Seção 2.2 e a Proposição 1, BScompl pode ser descrito por equações de comportamento com latência
de primeira ordem. Seja f (x(t), w(t), x(t + 1), w(t + 1)) = 0, e f −1 (0) = BScompl |[0,1] = BS |[0,1] tal
equação. Decorrendo do axioma de estado que {(x(t), w(t), x(t + 1)) ∈ ∂ e (x(t + 1), w(t + 1), x(t +
2)) ∈ ∂} ⇒ {(w(t), x(t)), (w(t + 1), x(t + 1)) ∈ BS |[0,1] }.
Segue o resultado final do fato que ∂ = {(x0 , w0 , x1 )|∃ w1 tal que f (x0 , w0 , x1 , w1 ) = 0}.
Seja ΣS = (R, W, X, BS ) um sistema dinâmico invariante e contı́nuo no tempo, representado

via espaço de estados, sendo X uma variedade diferenciável satisfazendo a implicação {(w, x) ∈
BS } ⇒ {x é absolutamente contı́nuo}. A lei de evolução induzida por ΣS é definida por ∂ :=
{((x, v), w) ∈ T X × W | ∃(w, x) ∈ BS tal que (x(0), ẋ(0)) = (x, v) e w(0) = w}. Com a definição
de B̄S sendo análoga àquele do caso discreto, valendo também a relação BS ⊆ BScompl ⊆ B̄S , contanto
que condições relacionadas a continuidade também sejam satisfeitas, completando as de completude.
2.3.2 Lei de evolução de um sistema determinı́stico

Um sistema representado por um espaço de estados ΣS = (T, W, XBS ) é dito determinı́stico (com
relação ao espaço de estados) se {(w1 , x1 ), (w2 , x2 ) ∈ BS , x1 (0) = x2 (0), t ∈ T , e w1 |[0,t) =
w2 |[0,t) } ⇒ {x1 (t) = x2 (t)}. Ou seja, nos sistemas determinı́sticos trajetórias de estados só podem
bifurcar em decorrência da bifurcação da trajetória externa.
Uma consequência extensivamente aplicada no Capı́tulo 3 decorrente do conceito de determi-
nismo restrito a sistemas descritos por leis de evolução discretas no tempo, sendo esta a representação
de ∂ pelo grafo de uma função parcial5 δ : X × W → X, significando que {(a, w, b) ∈ ∂} ⇔
{(a, w) ∈ Dom(δ) e b = δ(a, w)}. Podemos introduzir dois mapas f : X × W → X e c : X × W →
R tal que c(x, w) = 0 define o domı́nio de δ e f corresponde a ação de δ no seu domı́nio. O que
fica explı́cito neste caso, é que uma lei de evolução discreta no tempo de um sistema determinı́stico é
5
Estes conceitos são abordados no Capı́tulo 3.
descrito por dois mapas f : X × W → X (próximo estado) e c : X × W → R (equação de restrição)

tal que seu comportamento pode ser especificado por
σx = f ◦ (x, w) e c ◦ (x, w) = 0.
No caso de um sistema contı́nuo, isto conduz as equações
ẋ = f ◦ (x, w) e c ◦ (x, w) = 0.
Estas equações apresentam um meio conveniente para pensar-se sobre sistema dinâmicos represen-
tados via espaço de estados. Elas representam sistemas determinı́sticos e completos. A primeira
equação diz como uma realização das variáveis associadas ao sinal externo conduzirá à evolução do
estado, enquanto a segunda equação diz que variáveis externas w podem, de fato, ocorrer quando o
sistema está no estado x.
2.3.3 Fluxos
Intrinsecamente relacionado com a abordagem considerada no Capı́tulo 5 e no Capı́tulo 6, o conceito

de fluxo emerge quando da descrição por leis de evolução de sistemas dinâmicos que evoluem de
forma autônoma. Um fluxo discreto no tempo (X, f ) é definido por um espaço de estados X e um
mapa de próximo-estado f : X → X. Um fluxo contı́nuo no tempo (X, f ) é definido por um espaço
de estados X, uma variedade diferenciável e um campo vetorial f : X → T X sobre ela. Fluxos
definem casos especiais de leis de evolução com W = X e
∂ = {(x0 , w, x1)| w = x0 e x1 = f (x0 )} (discreto no tempo)

(2.10)
equação de comportamento: σx = f ◦ (x),
e
∂ = {((x, v), w)| w = x e (x, v) = f (x)} (contı́nuo no tempo)
(2.11)
equação de comportamento: ẋ = f ◦ (x),
onde foi realizada a associação (não natural) do sinal externo com o estado. Também é necessário
assumir que para qualquer condição inicial, a equação diferencial ẋ = f ◦ (x), x(0) = x0 , possui uma
única solução. Como resultado de (2.10) e (2.11), fluxos definem sistemas autônomos (sendo inter-
pretados como uma propriedade de comportamento BS ). Sendo Markovianos, e portanto, sistemas
representados via espaço de estados.
Segue da Proposição 2 que um sistema autônomo representado via espaço de estados sempre é
determinı́stico. Possuindo lei de evolução expressa por (2.12) ou (2.13).
σx = f ◦ (x), w = r ◦ (x) (discreto no tempo), (2.12)

ẋ = f ◦ (x), w = r ◦ (x) (contı́nuo no tempo). (2.13)
Portanto, a lei de evolução para um sistema representado via espaço de estados pode ser interpretada
como um fluxo associado com um mapa r : X → W , que permite a “observação do fluxo”.
A abordagem considerando fluxos sobre variedades têm sido empregada como a base para mode-
los dinâmicos em fı́sica. De fato, a mecânica Hamiltoniana6 como também as equações de Schrödin-
ger da mecânica quântica definem fluxos sobre variedades (contudo, os mapas r para observação do
fluxo são definidos implicitamente e de forma não trivial). Apesar de em muitos casos extensiva-
mente abordados, como aqueles tı́picos da mecânica, possa parecer natural considerar fluxos como
a base para a dinâmica. Em um aspecto generalista, podem ser citados pelo menos dois pontos de
inconsistência:
• Dado que os sistemas definidos são autônomos, fluxos consideram o sistema isolado do ambi-
ente ou meio. Neste caso, o procedimento não só apresenta limitações no contexto prático, onde
precisamente a ação e reação do sistema com o ambiente é o elemento de importância central. Ca-
racterı́stica evidente em teoria de controle e ciência da computação. Como também na fı́sica há
várias situações desta natureza. Uma abordagem baseada completamente em fluxos, requer, im-
plicitamente, o isolamento do sistema do seu ambiente, o que demanda a modelagem da ação do
ambiente sobre o sistema, forçando à situação indesejada de ter-se que modelar o ambiente;
• Modelos que começam com fluxos sobre variedades consideram o espaço de estados como dado,
ao passo que na abordagem considerada neste trabalho o comportamento externo é o elemento
essencial e o espaço de estado um objeto matemático conveniente a ser construı́do a partir das
equações dinâmicos que descrevem o comportamento externo. O estado de um sistema não é
uma propriedade fı́sica do sistema real, é uma propriedade do modelo. Como exemplo, enquanto
um modelo do sistema solar considerando os planetas como elementos pontuais com massa gera
um espaço de estados de dimensão finita. Se o mesmo sistema é modelado considerando-se um
dos planetas como uma esfera levemente elástica, então o espaço de estados obtido apresentará
dimensão infinita. Portanto, ao modelar-se através do fluxo sobre uma variedade, o procedimento
é iniciado pela especificação do espaço de estado X, seguido pela determinação das equações
dinâmicas, ou seja, o campo vetorial f . Contudo, isso gera uma lógica circular, já que as equações
dinâmicas é que devem determinar qual será o espaço de estados. Pelo modelamento através do
6
O artigo [10] que além de explicitar este processo, aborda as sistemas Hamiltonianos por uma rica perspectiva
geométrica.
comportamento do sistema, primeiro é especificado o objeto a ser modelado, em seguida é escolhido

um W , por fim especifica-se B, então, se for necessário um espaço de estados X é determinado.
Consideradas as observações acima, objetivando uma maior clareza sobre o que significa isolar
um “sistema” de seu “ambiente ou meio”, consideremos um exemplo qualitativo que evidencie como
o método e abordagem considerados para o estudo de um sistema dinâmico influenciam na complexi-
dade do método e relevância do modelo obtido. Consideremos a modelagem da posição de um corpo
em movimento enquanto exposto a influências do meio. Como exemplos temos a posição de um
pássaro voando, de uma pessoa se movendo em meio a uma multidão ou de um barco navegando em
um mar agitado. Considerando o primeiro caso, sendo a posição do pássaro a variável de interesse,
para descrever sua evolução será necessário introduzirmos como variáveis adicionais, pelo menos, o
movimento de suas asas e as condições atmosféricas em torno do pássaro, o que poderá ser descrito
pela velocidade e direção do vento. A interação entre estas variáveis descreverá o comportamento
do pássaro, sendo especificado por uma “relação de compatibilidade” entre as variáveis envolvidas.
Este seria um ponto de parada adequado para o modelo considerado, já que explica o posicionamento
do pássaro no ambiente constituı́do pelo movimento de suas asas e as propriedades do vento. Um
ponto a observar é que o modelo obtido envolve variáveis não conhecidas - o movimento das asas e a
caracterı́stica do vento.
Caso deseje-se inferir mais sobre a posição do pássaro, será necessário um maior conhecimento
dos elementos envolvidos no processo de modelagem, ou seja, maiores certezas e menos “variáveis”.
Neste caso, pode-se tentar incluir um modelo para a atmosfera, talvez supondo que a velocidade e
direção do vento são constantes, ou que são uma função da altura. Essas considerações reduziriam
as variáveis do modelo à posição do pássaro e ao movimento de suas asas. Como modelo pretendido
para a posição do pássaro, esse é um ponto adequado de parada, já que explica a relação entre a
posição do pássaro e o ambiente onde está inserido, formado pelo movimento de suas asas.
Se ainda assim desejarmos um modelo mais completo, poderemos tentar explicar o movimento
das asas do pássaro. Nos deparamos com a necessidade de refletirmos em nosso modelo a resposta
dada pelo sistema neural do pássaro aos estı́mulos externos conjugados a trajetória “pretendida pelo
mesmo”. Neste contexto, nossas pretensões vão além dos elementos descritivos disponibilizados
pela fı́sica teórica. Vendo-nos compelidos a empregar elementos de ciências prescritivos, tais com
cibernética e inteligência artificial. Ou seja, de alguma forma teremos de descrever por que as asas
do pássaro movem-se como o fazem. Uma forma de abordar o problema seria realizar hipóteses
a cerca das “caracterı́sticas” ou propriedades do fenômeno estudado, tais como a periodicidade do
movimento. Embora empı́rica, trata-se de uma afirmação plausı́vel e que conduziria a uma maior
compreensão do fenômeno estudado, portanto válida.
Uma abordagem alternativa para o estudo exploratório do fenômeno é inseri-lo em um contexto.
No caso em particular, poderı́amos supor que o nosso pássaro é uma ave de rapina, e que seu movi-
mento é motivado por capturar uma presa no menor tempo possı́vel. O modelo resultante será uma
relação de compatibilidade associando a posição do pássaro àquela da presa. Tal resultado é o mo-
delo almejado, já que explica a posição do pássaro no seu meio, especificado pela posição da presa.
No entanto, ainda há espaço para o aprimoramento desse modelo. Poderı́amos modelar a posição
da presa. Supondo-a um quadrúpede, sua posição seria determinada pelo movimento de suas patas
e pelo terreno. Inicialmente, poderı́amos modelar o terreno e contextualizar o movimento da presa,
supondo que o movimento de suas patas é determinado pela maximização da distância deste para o
predador. Teremos, neste caso, um modelo para a posição da presa com relação ao seu meio, cons-
tituı́do pelo predador. Como resultado final, obteremos duas relações de compatibilidade descrevendo
o comportamento descrito pelas posições do pássaro e da presa. Conjuntamente, elas nos fornecerão
possivelmente um sistema fechado de equações que determinarão a posição do pássaro como uma
função das condições iniciais.
Este caso acima exemplifica o que significa “um sistema isolado do seu meio mas interagindo
com esse”. O que fica evidente é que isso implicará invariavelmente na ocorrência de variáveis não
explicadas ou não determinadas explicitamente, são estabelecidas de fora para dentro, e portanto,
sendo arbitrárias. De fato, tais funções matemáticas definidas no tempo são partes da modelagem
matemática de sistemas dinâmicos, e que, na maioria das situações de interesse, são constituintes
compulsórios. Além disso, fica claro que propriedades ou caracterı́sticas inerentes ao sistema invi-
abilizam a aplicação de ferramentas teóricas descritivas no estudo deste como um todo, requerendo
invariavelmente o emprego de métodos prescritivos.
Apesar do exemplo apresentado envolver a descrição de fenômenos associados a organismos vi-
vos complexos, o que erroneamente poderia ser empregado como explicação absoluta para os desafios
encontrados, obstáculos não menos desafiadores são descritos em fenômenos de natureza econômica,
social, ou mesmo puramente fı́sica. Isto se deve ao fato de depararmo-nos em muitos casos com sis-
temas que envolvem parâmetros distribuı́dos e onde não há evidências que conduzam a um processo
plausı́vel de simplificação.
2.3.4 Exemplos de casos contı́nuos e discretos
A abordagem considerada neste material para descrição de sistemas dinâmicos é evidentemente bas-
tante geral, o que compactua com nossos objetivos de descrever os diversos sistemas empregando
uma linguagem comum, que permita extrair e aplicar conceitos e métodos úteis em um determinado
contexto associado a um sistema dinâmico especı́fico, em outro até então não explorado. Seguem
alguns exemplos tı́picos e importantes descritos através dos elementos até então apresentados.
Mecânica Hamiltoniana
Nessa abordagem consideraremos um caso particular, não considerando abordagens que empre-
gam conceitos geométricos mais sofisticados [10]. Vamos nos limitar ao caso em que o espaço de
configuração Q é um subconjunto aberto de Rm . De acordo com os postulados da mecânica Hamilto-
niana, o movimento de um sistema mecânico pode ser descrito por uma função H : P × Q → R, com
P = Rm , o espaço momento. Essa função H é o Hamiltoniano, determinando as leis de movimento
através das equações canônicas (2.14) e (2.15).
∂H
q̇ = (p, q), (2.14)
∂p
∂H
ṗ = − (p, q). (2.15)
∂q
onde p denota momento e q posição. Assumindo a existência e unicidade de uma solução para este
conjunto de equações diferencias, para qualquer condição inicial p(0) = p0 ∈ Rm e q(0) = q0 ∈ Q.
As equações (2.14) e (2.15) definem um fluxo sobre uma variedade contı́nua P × Q. Formalmente
T = R (ou R+ ), X = P × Q e
∂H ∂H
f= − , .
∂q ∂p
Se, contudo, estas equações são interpretadas como uma forma conveniente de descrever a evolução
da posição q, com o momento p considerado como uma variável auxiliar, então obtém-se um sistema
com variáveis latentes, tal que, T = R, W = Q, A = P , e Ba = {(q, p)| as equações (2.14) e (2.15)
são satisfeitas}. Este sistema é invariante no tempo. Ele é inversı́vel no tempo se H(p, q) = H(−p, q).
A definição de B implica que a posição q é a variável de interesse. Caso também haja interesse na
velocidade então pode-se adicionar (2.16).
v = q̇, (2.16)
o que conduz a especificação do comportamento B = {(q, v) : R → Q × Rn | ∃p : R → Rn tal que

(2.14), (2.15) e (2.16) são satisfeitas}.
Sistemas de Eventos Discretos
De forma geral, sistemas de eventos discretos descrevem situações onde a ocorrência de um evento
permite ou bloqueia a ocorrência de eventos subsequentes. Como exemplos tı́picos, pode-se citar
a linguagem natural, códigos de computadores, sistemas produtivos, etc. Esta definição confere
elementos novos em relação a interpretação usual de um sistema de eventos discretos como uma
sequência ordenada de eventos. Com relação a Definição 1, podemos dizer que um sistema de even-
tos discretos é um sistema dinâmico (T, W, B) com T = Z e W um conjunto finito, adicionalmente,
quando o sistema é representado via espaço de estados (ou é definido através de variáveis latentes),
com X (ou o conjunto de variáveis latentes) finito. Estes elementos formam a base para interpretar-se
o conceito de linguagem formal como um sistema dinâmico.
Considera-se um conjunto finito A, chamado de alfabeto, cujos elementos são chamados de

sı́mbolos. Uma sequência de sı́mbolos (podendo ser vazia) é chamada de palavra. Seja A∗ o conjunto
de todas as palavras formadas por sı́mbolos do alfabeto A. Uma linguagem formal, L, é simplesmente
um subconjunto de A∗7 . Os elementos de L são interpretados como as palavras permitidas, ou seja,
aquelas compatı́veis com as regras, a gramática, as leis, que governam a linguagem. O conjunto A
também poderia ser chamado de conjunto de eventos, os elementos de A de eventos elementares, ele-
mentos de A∗ de sequências de eventos, enquanto L corresponderia a coleção de todas as sequências
finitas possı́veis de eventos. Uma linguagem formal basicamente define um sistema dinâmico no
sentido da Definição 1, com L correspondendo ao comportamento de B. Contudo, para tornar essa
correspondência mais rigorosa, através de uma modificação adequada, é necessário garantir que todas
as palavras possuem a mesma extensão e que novas palavras não são introduzidas no processo. Com
tal objetivo, podemos introduzir um novo sı́mbolo ao conjunto A, definindo W := A ∪ {} e B
dado por (2.17).
B = {w : Z → W | t−1, t1 ∈ Z, t−1 ≤ t1 , tal que w|[t−1 ,t1 ) ∈ L e w(t) =

(2.17)
para t < t−1 e t ≥ t1 }.
Neste caso (Z, W, B) especifica um sistema dinâmico invariante no tempo no sentido apresentado
na Definição 1, onde determina-se a forma como B é especificado a partir de L. O procedimento
adotado foi adicionar um número infinito de sı́mbolos “antes” e “depois” de cada palavra em L.
Implicando que a interpretação de uma linguagem formal como um sistema dinâmico de eventos
discretos constitui uma generalização da noção de linguagem formal, dado que passa-se a considerar
a possibilidade de palavras infinitas.
Procedimentos comuns para geração de linguagens formais são por meio de gramáticas (po-
dendo ser interpretada como uma forma de descrever sistemas por meio de variáveis latentes) e por
autômatos (que correspondem basicamente às leis de evolução).
7
Estes conceitos serão melhor abordados no Capı́tulo 3.
ai bi
ci−1
((1, 0), 1) ((1, 0), 0)
((1, 1), 0)
Somador
completo ((0, 0), 0) 0 1 ((1, 1), 1)
serial ((0, 0), 1)
((0, 1), 1) ((0, 1), 0)
ci
si
Figura 2.6: Somador completo serial representado via espaço de estados.
Autômatos
Autômatos são uma ferramenta para representação de linguagens, e no contexto considerado são a
forma de representar um sistema de eventos discretos via espaço de estados. Um autômato é uma
quı́ntupla (Q, A, E, I, T ), ou uma quádrupla quando o conjunto A esta subentendido, onde Q é um
conjunto finito chamado espaço de estados; A também é um conjunto finito chamado de alfabeto,
cujos elementos são chamados de sı́mbolos ou eventos externos elementares; E é a regra de transição,
sendo um subconjunto de Q × A × Q e cujos elementos são chamados de transições ou eventos
internos elementares; I ⊆ Q é o conjunto de estados iniciais; T ⊆ Q é o conjunto de estados
terminais. Uma sequência (s0 , a0 , s1 , a1 , . . . , sn−1, an−1 , sn ), com (si , ai , si+1 ) ∈ E para i + 1 ∈ n e
chamado de caminho, sendo um caminho possı́vel se s0 ∈ I e sn ∈ T .
Autômatos são comumente representados por grafos direcionados tendo os estados como nós,
as transições como ramos com rótulos, estados iniciais como nós acompanhados de uma seta apon-
tando para seu interior e estados terminais como nós com uma seta apontando para fora dele. Es-
tes conceitos e elementos são ilustrados através de um somador completo serial como apresentado
na Figura 2.6. Este autômato realiza a soma de dois números binários, representados por ai e
bi , mais o bit vai-um do estágio anterior, representado por ci−1 no diagrama em bloco e associ-
ado ao estado 0 e 1 do autômato. O bit si é o resultado da operação de soma, mais o bit vai-
um do estágio, que dependendo do valor, implicará em uma transição ou não de estado. Neste
contexto, o rótulo dos ramos é codificado como ((ai , bi ), si ) enquanto ci e ci−1 estão associados a
memória para realização da adição sequencial. Considerando a apresentação anterior sobre siste-
mas de eventos discretos, para tornar a correspondência rigorosa, torna-se necessário introduzir o
elemento ao conjunto A, gerando W := A ∪ {}; adicionar um estado fonte Ω e um estado
terminal Ψ a Q, gerando X := Q ∪ {Ψ, Ω}; e definir a lei de evolução ∂ ⊆ X × W × X como
∂ := E ∪{(Ω, , Ω), (Ω, , 0), (1, , Ψ), (Ψ, , Ψ)}. Estas modificações geram o autômato apresen-
tado na Figura 2.7. O comportamento determinado pelo autômato da Figura 2.7 passa a ser definido
como BQ = {(w, x) : Z → W × X| (x(t), w(t), x(t + 1)) ∈ ∂ para todo t ∈ Z e ∃t−1 , t1 , t−1 ≤ t1 ,
((1, 0), 1) ((1, 0), 0)

((1, 1), 0)
((0, 0), 0) 0 1 ((1, 1), 1)

((0, 0), 1)
((0, 1), 1) ((0, 1), 0)

Ω Ψ

Figura 2.7: Autômato do sistema de eventos discretos associado ao somador completo serial.
tal que x(t) = Ψ para t < t − 1 e x(t) = Ω para t ≥ t1 }. Desta forma, BQ é constituı́do basica-
mente de caminhos prováveis antecedidos por uma sequência infinita de pares (, Ω), e precedidos
por uma sequência infinita de pares (, Ψ). O que demonstra uma equivalência biunı́voca entre
BQ e a coleção de caminhos possı́veis. Uma palavra a1 a2 . . . an com ai ∈ A, i ∈ n, é represen-
tada por um autômato se há uma sequência s0 , s1 , . . . , sn com si ∈ Q, i = 0, 1, . . . , n, tal que
(s0 , a0 , s1 , a1 , . . . , sn−1 , an−1 , sn ) um caminho possı́vel. O conjunto de todas as palavras representa-
das por um autômato forma uma linguagem formal. Dados estes elementos, uma questão central na
teoria de linguagens formal é como determinar um autômato que represente uma dada linguagem. No
contexto de linguagens formal o desafio está em mostrar que condições L ∈ A∗ deve satisfazer para
que possa ser representado por um autômato com um número finito de estados. Tratando-se de uma
versão do problema de representação via espaço de estados. No Capı́tulo 3 esta questão é respondida
empregando o conceito, lá introduzido, de conjunto de restrições.
Por hora, podemos compreender um pouco mais das propriedades de um sistema de eventos dis-
cretos geral a partir das propriedades de uma representação via espaço de estados (autômato) para
este. Seja (Q, A, E, I, T ) um autômato no qual, para todo s ∈ Q, há um caminho (s0 , a0 , s1 , . . . , sn−1 ,
an−1 , sn ) com s0 ∈ I e sn = s. Se além disso, de forma similar, para todo s ∈ Q podemos determi-
nar um tal caminho satisfazendo s = s0 e sn ∈ T , então o autômato é dito essencial. Um caminho
(s0 , a0 , s1 , . . . , sn−1 , an−1 , sn ) é dito um ciclo se s0 = sn . Dado um autômato que representa o com-
portamento de um sistema de eventos discretos (como aquele da Figura 2.7), pode-se demonstrar que
comp
o fato dele ser essencial implica que o sistema é completo (i.e., BQ = BQ ) se, e somente se, o
autômato não contém ciclos. Em termos da linguagem formal reconhecida pelo autômato, isto im-
plica que um autômato essencial pode ser associado a um sistema de eventos discretos completo se, e
somente se, a linguagem reconhecida por este é finita (i.e., L contain um número finito de palavras).
Observe que todo elemento em BQ é precedido e seguido por uma sequência infinita de sı́mbolos
. Considerando o conceito de completude apresentado na Seção 2.2.2, a ocorrência de ciclos em
2.4 A Topologia de Sistemas Dinâmicos Discretos Invariantes no Tempo e Completos 29
Tabela 2.2: F ORMAS APRESENTADAS PARA REPRESENTAÇ ÃO DE SISTEMAS DIN ÂMICOS .
Peculiaridade da Descrição Representação Caracterização

- Σ = (T, W, B) B ⊆ WT
Variáveis Latentes Σa = (T, W, A, Ba ) Ba ⊆ (W × A)T
Espaço de Estados ΣS = (T, W, X, BS ) BS ⊆ (W × X)T
Lei de Evolução Σ∂ = (T, W, X, ∂) ∂ ⊆ X × W × X
um autômato essencial permite que sejam determinadas palavras de comprimento arbitrário em L,

compl
possibilitando a inclusão em BQ de sequências bi-infinitas que não sejam precedidas ou seguidas
por sequências infinitas dos sı́mbolos .
Fica clara a excepcionalidade do conceito de completude no contexto de autômato. No entanto,
isso é uma consequência do emprego da teoria de sistema dinâmico para modelagem da linguagem
reconhecida por um autômato. Como iniciado na Seção 2.4 e desenvolvido no Capı́tulo 3, a aborda-
gem reversa (estudar o comportamento de sistemas de eventos discretos através da teoria de lingua-
gens formais) conduz a determinação de propriedades e desenvolvimento de métodos relacionados a
representação dos sistemas via espaço de estados, além da determinação de uma estrutura algébrica
associada ao comportamento do sistema. Ao considerarmos o estudo de sistemas dinâmicos de even-
tos discretos especificados pelo seu comportamento B (ou seja, sequências bi-infinitas), poderemos
focar nossa abordagem em sistemas que possuam propriedades desejadas da dinâmica para os fins de
aplicação almejada. Ao optarmos por essa abordagem, possibilitamos a estudo de diversos “sistemas”
de interesse empregando os conceitos da teoria de sistemas dinâmicos, e.g., contadores, controle de
tráfico, códigos convolucionais, processamento digital de sinais, etc.
2.4 A Topologia de Sistemas Dinâmicos Discretos Invariantes no

Tempo e Completos
O conceito de lei de evolução introduzido na Seção 2.3 marca uma transição do até então “estático
e abstrato” para o “dinâmico e realizável”. Para tornar essa afirmação compreensı́vel, comparamos
na Tabela 2.2 as diversas definições apresentadas de um sistema dinâmico. Isso possibilita verificar
que enquanto os comportamentos B, Ba e BS descrevem o sistema dinâmico através do conceito de
subconjunto (estático), a lei de evolução ∂ especifica a relação entre “domı́nio” e “imagem”, ou seja,
descreve o sistema através de sua dinâmica.
A importância desta constatação é ressaltada quando deseja-se: Construir a lei de evolução que
simule um sistema dinâmico discreto invariante no tempo e representado via espaço de estados. Essa
construção pode ser obtida por diversos métodos, seja com equações a diferença, máquinas de estado
finito, etc. Contudo, independente do método empregado nesta construção, decorre do Teorema 4 que
a representação obtida é completa, e portanto, que só será fidedigna ao comportamento do sistema
simulado se esse também for completo. Em uma perspectiva prática, a importância desse resultado
decorre da identificação das limitações inerentes a qualquer processo de simulação de um sistema
dinâmico discreto (o que inclui aqueles obtidos através de discretização), descrita por um conjunto
finito de relação (um conjunto finito de equações a diferença ou por um autômato com Q = I =
T ), sendo esta limitação a invariável completude do sistema obtido. O que inclui, por exemplo,
simulações computacionais de sistemas fı́sicos, já que os atuais computadores digitais são máquinas
de estado finito complexas.
No processo de formalização deste resultado, consideremos um sistema dinâmico discreto repre-
sentado via espaço de estados ΣS = (Z, W, X, BS ). Que como observado na Seção 2.3, é um sistema
invariante no tempo. Ao estabelecermos uma representação para este sistema, poderemos faze-lo
através das formas equivalentes: Equação a diferença (2.18), ou pela especificação da lei de evolução
induzida, como em (2.9).

f (x(t + L), w(t + L)), (x(t + L − 1), w(t + L − 1)), . . . , (x(t), w(t)) = 0, t ∈ Z (2.18)
Em ambos os casos, obteremos como resultado de nossa representação um sistema completo especifi-
cado pelo comportamento BScompl , já que, de acordo com o Teorema 4, o comportamento BScompl é igual
ao comportamento B̄S da lei de evolução induzida pelo sistema ΣS . Portanto, qualquer representação
discreta de nosso sistema é necessariamente invariante no tempo e completa.
Em nossa abordagem, consideramos que a única informação inicial é um sistema Σ = (Z, W, B) e
que qualquer estrutura adicional é obtida pelo processo de modelagem, como a inserção de variáveis
latentes ou um espaço de estados. Na procura por métodos que possibilitem a determinação de uma
estrutura, particularmente uma que reflita a “memória” do sistema, consideraremos que Σ é completo.
A forte implicação disso é que ao considerarmos uma representação via espaço de estados ΣS da qual
o comportamento BS seja formado por todas as sequências (w, x) satisfazendo Pw (w, x) = w, então
ΣS é completa. Como consequência, há a possibilidade, como comentado acima, de determinar-
mos uma representação para Σ através de equações a diferença ou pela determinação de uma lei de
evolução para o sistema. Antes de prosseguirmos, nós formalizamos essa implicação na Proposição 5.
Proposição 5. Seja Σ = (Z, W, B) um sistema dinâmico completo. A representação via espaço de

estados ΣS = (Z, W, X, BS ) de Σ é um sistema dinâmico completo.
Demonstração: Como ΣS é uma representação de Σ, então Pw (BS ) = B. Referindo-nos ao conceito

de completude, segue que BScompl |[t0 ,t1 ] = BS |[t0 ,t1 ] para todo −∞ < t0 ≤ t1 < ∞. Além disso, como
Σ é completo segue a relação Pw (BScompl ) = B. Portanto, conclui-se que BScompl = BS .
Podemos introduzir ainda mais estrutura à nossa abordagem se considerarmos o conjunto W fi-
nito. Para efeitos práticos esta consideração não restringe o escopo de aplicações dos resultados
obtidos, já que em qualquer simulação digital ou amostragem de um sistema dinâmico o espaço W
resultante é finito, ou ainda, esta já é uma propriedade do sistema original. Neste caso, o com-
portamento do sistema é composto por um conjunto de sequências bi-infinitas em W Z , o que será
representado por w = (wi )i∈Z = . . . w−1 w0 w1 . . ., onde wi ∈ W é a i-ésima coordenada de w.
A partir das considerações até então estabelecidas, a saber: sistema dinâmicos discretos, in-
variância no tempo, completude e conjunto W finito. Para facilitar a exposição, restabeleceremos
nossa nomenclatura como forma de evitar ambiguidades. Representaremos um sistema dinâmico dis-
creto, completo e invariante no tempo Σ = (Z, W, B) pela dupla (X, σ), onde X ⊂ W Z representa o
comportamento, ou seja, X = B e σ : W Z → W Z é uma ação chamada de função deslocamento, que
reflete a invariância no tempo de Σ, sendo caracterizada por (2.19).
= wi+1 , para todo w ∈ W Z e i ∈ Z.

σ(w) i
(2.19)
Considerar (X, σ) como um sistema que evolui discretamente, com a sequência em que os eventos
ocorrem associada a Z, permite que interpretemos σ como o mapeamento adjacente que provê a
dinâmica sobre o conjunto X. Ainda podendo ser vista como o gerador do grupo {σ n | n ∈ Z} que
representa a ação transitiva do grupo infinito (Z, +) sobre W Z .
Ao considerarmos W um conjunto finito, possibilitamos a determinação de uma topologia a W Z
decorrente da métrica discreta associada a W , especificada em (2.20).

0 se α = β,
ρ(α, β) = (2.20)
1 se α 6= β.
Sendo a métrica do espaço discreto associado a i-ésima coordenada do espaço de dimensão infinita
W Z dada por (2.21).
ρ(α, β)
ρi (α, β) = . (2.21)
2|i|−1
A métrica do espaço produto W Z formado pelos espaços discretos associados as suas coordenadas é
dada em (2.22).
d(x, y) = max ρi (xi , yi ), (2.22)
−∞<i<∞
o que permite a definição da métrica (2.22) por d(x, y) = 2−e(x,y) , onde e(x, y) = max{n ≥ 0| xi =
yi , −n ≤ i ≤ n}, convencionando-se e(x, y) = ∞ se x = y e e(x, y) = −1 se x0 6= y0 . As-
sim, de acordo com a métrica (2.22) dois pontos em W Z são tão mais próximos quanto mais longa
a sequência central (com centro associado à coordenada 0) na qual coincidem. Munidos com uma
métrica, podemos considerar uma estrutura onde dispomos de conjuntos abertos e fechados. Consi-
derando o espaço métrico (W Z , d), nós demonstramos na Proposição 6 que os conjuntos fechados em
(W Z , d) correspondem exatamente aos sistemas dinâmicos completos definidos em W Z .
Proposição 6. X é um sistema dinâmico completo em W Z se, e somente se, X é um conjunto fechado

no espaço métrico (W Z , d).
Demonstração: Suponha que X é um sistema dinâmico completo em (W Z , d) e que existe a ∈ W Z

satisfazendo d(a, X) = 0. Isso implica que a|[t0 ,t1 ] ∈ X|[t0 ,t1 ] , −∞ < t0 ≤ t1 < ∞, decorrendo da
completude de X que a ∈ X. Concluı́mos que X é fechado, uma vez que X é igual ao seu fecho.
Do fato de X ser fechado, a equação X = {a ∈ W Z | d(a, X) = 0} é observada. Suponha
que w ∈ W Z satisfaz w|[t0 ,t1 ] ∈ X|[t0 ,t1 ] , −∞ < t0 ≤ t1 < ∞. Portanto, existe x ∈ X tal que
w|[−n,n] = x|[−n,n] para n > 0 arbitrário, o que implica que d(w, X) = 0. Segue do fechamento de X
que w ∈ X.
Agora, temos como descrever um sistema dinâmico completo em um conjunto finito W de forma
puramente topológica, quando associado ao espaço métrico (W Z , d). Fazemos isso na Definição 6,
onde dá-se o nome de sistema simbólico fechado a tal sistema.
Definição 6. Um subconjunto X de um espaço métrico discreto (W Z , d) é um sistema simbólico

fechado (ssf) se X é fechado e invariante por deslocamento, i.e., σ(X) = X.
Na verdade os ssf são conhecidos e extensivamente estudados na literatura cientı́fica, sendo o

principal objeto de estudo na teoria de dinâmica simbólica, encontrando diversas aplicações tanto
em casos de interesse teórico quanto prático. A novidade aqui decorre de demonstrarmos explicita-
mente serem estes os sistemas discretos sobre conjuntos finitos que possibilitam a determinação de
representações através de equações a diferença e leis de evolução.
Empregando uma variação do “argumento diagonal de Cantor”, podemos demonstrar que o con-
junto W Z é compacto. Para isso, consideremos uma sequência {wn } em W Z . De forma indutiva,
para k ≥ 1 determina-se uma sequência S1 ⊃ S2 ⊃ S3 . . . de subconjuntos infinitos de inteiros po-
sitivos, tal que, todos os blocos wm |[−k,k] são iguais para todo m ∈ Sk . Define-se x como o ponto
com x|[−k,k] = wm |[−k,k] para todo m ∈ Sk , e de forma indutiva define-se mk com o menor inteiro
de Sk que excede mk−1 . Assim, x ∈ X e a sequência {wmk } converge para x quando k → ∞.
Concluı́mos que toda sequência em (W Z , d) possui uma subsequência que converge em (W Z , d), o
que o caracteriza como um espaço métrico compacto. Como um subconjunto fechado de um espaço
métrico compacto é compacto, então um ssf X é compacto.
2.4.1 Homeomorfismo e codificação
Como caso de estudo na teoria de dinâmica simbólica que encontra aplicações no estudo de códigos,
podemos citar os sistemas dinâmicos simbólicos definidos par (M, φ), onde M é um espaço métrico
compacto e φ : M → M é uma função contı́nua. Quando φ for um homeomorfismo (uma função
contı́nua, sobrejetiva, injetiva e seu inverso φ−1 é contı́nuo), então (M, φ) é chamado de um sistema
dinâmico inversı́vel. Um exemplo importante de homeomorfismo é (X, σ), onde X é um ssf e σ é a
função deslocamento.
O processo de comparação de sistemas dinâmicos simbólicos é formalizado pelo conceito de
homomorfismo, sendo este um mapeamento θ : (M, φ) → (N, ϕ) contı́nuo que satisfaz a propriedade
comutativa ϕ ◦ θ = θ ◦ φ, como representado no seguinte diagrama.
φ
M −−−→ M
 
 
θy yθ
N −−−→ N
ϕ
Se θ for injetivo e sobrejetivo, como M é compacto, então o mapeamento θ−1 também é contı́nuo.
Neste caso, θ é chamado de conjugado topológico e é escrito como θ : (M, ϕ) ∼
= (N, φ). Quando
há um conjugado topológico entre dois sistemas dinâmicos, estes são chamados de topologicamente
conjugado.
Consideremos o importante caso quando ϕ e φ são funções deslocamento. Dado os sistemas
dinâmicos fechados (X, σX ) e (Y, σY ), onde σX , σY são as funções deslocamentos associadas aos con-
juntos W Z e V Z , respectivamente. Como W Z é compacto e X é fechado, então θ é uniformemente
contı́nua. Consequentemente, há um inteiro k tal que para todo x ∈ X, o elemento (θ(x))0 é deter-
minado pelo bloco x|[−k,k]. Como θ comuta com a função deslocamento, então qualquer sı́mbolo de
θ(x) é determinado por um bloco de comprimento (2k + 1).
Este resultado apresenta os elementos necessários para conectar a teoria de dinâmica simbólica à
de codificação. O código é obtido por uma função especial chamada código de bloco deslizante ou
sbc (do termo em inglês sliding block codes). Um sbc φ mapeia sequências . . . x−1 x0 x1 . . . de um
ssf X sobre W em uma sequência . . . y−1 y0 y1 . . . sobre V , de forma definida por um mapeamento de
blocos Φ : X|[0,m+n] → V , ou seja, de todos os blocos de comprimento m + n + 1 em sequências
de X para sı́mbolos em V . Assim, dado um sbc φ : X → V Z tem-se que y = φ(x) se, e somente se,
yi = Φ(xi−m · · · xi+n ) = Φ(x|[i−m,i+n] ), sendo φ um sbc de memória m e antecipação n induzido por
Φ.
Agora, se considerarmos x, x′ ∈ X tal que e(x, x′ ) ≥ m+n+1, então e φ(x), φ(x′ ) ≥ e(x, x′ )−

(m + n). Portanto, considerando uma sequência de pontos {xk }∞ em X, se limk→∞ d(x, xk ) = 0

k=1
(i.e., se {xk }k=1 converse para x), então limn→∞ d φ(x), φ(xk ) = limk→∞ d(x, xk ) · 2m+n = 0.
∞
Assim, um sbc é uma função contı́nua. Se agora considerarmos que y = φ(x), então φ(σX (x))i

= Φ x|[i+1−m,i+1+n] = yi+1 = σY φ(x) i , portanto φ · σX = σY · φ, implicando que um sbc comuta
com a função deslocamento. Dessas observações, podemos concluir que uma função θ : (X, σX ) →
(Y, σY ) é um sbc se, e somente se, θ é um homomorfismo. Este resultado conecta os elementos de
teoria de códigos às estruturas topológicas abordadas na teoria de dinâmica simbólica.
2.5 A Dinâmica Simbólica dos Sistemas Dinâmicos

Nesta subseção consideramos possı́veis aplicações da abordagem de Willems para sistemas dinâmicos
e o conceito de dinâmica simbólica. Observamos que ao interpretarmos problemas das mais diver-
sas matizes empregando os conceitos de sistema dinâmico apresentados aqui, podemos estabelecer
relações entre estruturas antes consideradas distintas, e apreciar possı́veis aplicações para conceitos
até então restritos a áreas especı́ficas da fı́sica ou matemática.
A Dinâmica de Códigos sobre Grupos
Empregando a abordagem de Willems, é possı́vel especificar propriedades, parâmetros e relações em

comum a diversas estruturas tı́picas da teoria de códigos [2]. De outra forma, todo código linear
convencional (bloco, convolucional, reticulado, ou treliça) é um código sobre grupo. Além disso, a
maioria dos bons códigos geometricamente uniformes são gerados por códigos sobre grupo.
Definição 7. Um espaço de sequências sobre grupo é um grupo gerado por produto direto W =
Πk∈I Gk , onde o eixo I é qualquer subconjunto de Z, e o alfabeto de sı́mbolos Gk , k ∈ I, são grupos
arbitrários. Um código sobre grupo ou sistema sobre grupo, é qualquer subgrupo C de um espaço de
sequências sobre grupo. Se todos os sı́mbolos dos alfabetos Gk são iguais ao de um grupo comum
G, então o espaço de sequências é denotado por W = GI , e C é chamado de um código sobre grupo
sobre G definido em I.
A partir da Definição 7, os conceitos e métodos de representação abordados nas Seções 2.1, 2.2 e
2.3 são estendidos à teoria de códigos. Em particular, como observado em [2], um código sobre grupo
C só poderá ser completamente caracterizado ou gerado por sua treliça (igual a todas as sequências
geradas por caminhos na treliça), se C for completo. Caso contrário, dada a treliça de um código C
incompleto, será necessário uma especificação adicional para C através de restrições globais.
Em particular, quando C for completo, podemos interpreta-lo como um ssf, agregando a sua
estrutura elementos de topologia, que como demonstrado no Capı́tulo 3, permite-nos abordar o pro-
2.5 A Dinâmica Simbólica dos Sistemas Dinâmicos 35
blema de geração de códigos e codificação por uma perspectiva combinatorial, empregando teoria de
linguagens formais e conceitos algébricos mais gerais que o de grupo.
Imagens Simbólicas de Sistemas Dinâmicos
Ao considerarmos sistemas dinâmicos determinados por difeomorfismos, é possı́vel estabelecer uma

clara relação entre sistemas discretos e contı́nuos. Sendo possı́vel derivar dos sistemas contı́nuos
os discretos, como também determinar o sistema contı́nuo a partir do discreto, empregando uma
correspondência natural entre as órbitas destes sistemas [11].
Uma forma natural de estabelecermos uma relação entre um sistema contı́nuo e um correspon-
dente discreto dar-se-a pela determinação de uma imagem simbólica, podendo ser considerada como
uma aproximação finita de um homeomorfismo f : M → M definido sobre uma variedade contı́nua
compacta M. A ideia é estabelecer um cobertura finita C = {M(1), . . . , M(n)} de M, onde os
M(i) são conjuntos fechados chamados de células. Para cada célula M(i) estabelece-se a imagem
f (M(i)), para a qual é estabelecida uma cobertura C(i) composta pelas células M(j) ∈ C que pos-
suem interseção não vazia com f (M(i)), ou seja, C(i) = {M(j) : M(j) ∩ f (M(i)) 6= ∅}. Portanto,
as células de C(i) são chamadas de imagens de M(i) por f . Considerando o conjunto de ı́ndices
c(i) = {j : M(j) ∩ f (M(i)) 6= ∅}, podemos definir um grafo direcionado G composto por vértices
{i} associados naturalmente as células {M(i)}. Dois vértices i e j de G são conectados por um ramo
i → j se, e somente se, j ∈ c(i), i.e., a célula M(j) está contida na cobertura de f (M(i)).
Fica claro que uma imagem simbólica é uma aproximação do sistema contı́nuo e que não é única,
podendo ser considerada como uma quantização do sistema. De fato, existem ferramentas que permi-
tem o refinamento progressivo e controlado (com relação a evolução da complexidade das sucessivas
imagens) de uma imagem simbólica, de forma a aproximar seu comportamento daquele do sistema
contı́nuo [11]. Tais representações constituem uma ferramenta valiosa na análise de sistemas reais,
não só pela relação que há entre as órbitas dos sistemas contı́nuos e caminhos em G, mas também por
que constituem um meio de determinar-se informações sobre a estrutura global de um sistema, como
a entropia e o expoente de Lyapunov. No presente contexto, as imagens simbólicas são sistemas
dinâmicos intrinsecamente relacionados a abordagem de Willems, cuja completude decorre direta-
mente do método de construção, portanto, imagens simbólicas são exemplos de sistemas simbólicos
fechados.
Particionamento Markoviano
O processo de expansão n-ário dos reais é o mais simples exemplo de métodos de representação
simbólica de órbitas de sistemas dinâmicos. Estes métodos se baseiam na representação das órbitas
de um sistema dinâmico por sequências de sı́mbolos determinados por um particionamento adequado

do domı́nio do sistema. Particionamentos Markovianos constituem uma forma de obter-se sequências
de sı́mbolos úteis para representação de órbitas do sistema, ou seja, que refletem caracterı́sticas glo-
bais do sistema dinâmico [12]. De fato, particionamentos Markovianos são um tipo de particiona-
mento topológico, contudo satisfazem uma condição de necessidade relacionada ao comportamento
de um sistema dinâmico especı́fico, ou seja, entende-se que um particionamento Markoviano está
relacionado a um sistema dinâmico subjacente.
Uma famı́lia finita de conjuntos R = {R0 , R1 , . . . , RN −1 } é dito um particionamento topológico
para um espaço compacto X se satisfaz as seguintes condições.
1. cada Ri é aberto;
2. Ri ∩ Rj = ∅, i 6= j;
3. X = R0 ∪ R1 ∪ · · · RN −1 .
Se X é o domı́nio de um sistema dinâmico especificado por (X, φ), a partição R é dita gerador8
Markoviano se a condição (2.23) é satisfeita.
n
\
−1
Rsk ∩ φ Rsk+1 6= ∅, 1 ≤ k ≤ n − 1 ⇒ φ−k Rsk 6= ∅. (2.23)
k=1
Para R um gerador Markoviano e (X, φ) um sistema dinâmico expansivo, podemos representar sua
dinâmica por um ssf determinado por um grafo G com vértices A = {0, 1, . . . , N −1} e uma transição
do vértice i para o vértice j sempre que Ri ∩ φ−1 Rsn 6= ∅. Novamente um ssf é empregado como
representação simbólica do comportamento de um sistema dinâmico. No Capı́tulo 5 consideraremos
o método de codificação do fluxo geodésico de Artin, que é um caso concreto onde esse método de
representação simbólica é utilizado.
8
A definição de uma partição topológica que é um gerador, está fora do escopo desse trabalho, mas pode ser encontrada
em [12], como também outros tópicos relacionados.
Capı́tulo 3
Dinâmica Simbólica e Autômatos
Neste capı́tulo mostraremos como as propriedades topológicas, descritas na Seção 2.4, inerentes a
um ssf X devem ser utilizados para determinação de uma representação combinatorial de X pelo
emprego de conceito tı́picos de linguagem formal. Identificaremos as propriedades das linguagens
associadas a X, empregando-as para a determinação de leis de evolução e grafos direcionados finitos
associados (quando a linguagem de X for regular) que apresentem as sequências bi-infinitas de X.
Estes resultados são obtidos pela introdução dos conceitos de conjuntos proibidos e conjunto de
restrições irredutı́veis, que ainda nos possibilitam especificar procedimentos que permitem identificar
a estrutura algébrica associada à linguagem de X.
Como consequência das propriedades de um sistema simbólico fechado X ⊆ AZ , assim como
para os sistemas de eventos discretos abordados na Seção 2.3.4, podemos determina-lo a partir de um
subconjunto do monoide livre A∗1 , ou seja, a partir de uma linguagem que especifique-o unicamente.
Z
Para tanto, inicialmente, vamos definir o conjunto cilindro CkA (u), como sendo o subconjunto de
Z
A∗ formado pelos pontos x para os quais u é um fator iniciando na coordenada k, i.e., CkA (u) =
{ x ∈ X | u = x|[k,k+|u|−1]}. Como X é um conjunto fechado, então seu complemento em relação a
A∗ é aberto, ou seja, o conjunto A∗\X. Portanto, para todo y ∈ AZ \X existe k = k(y), tal que, se
A Z A Z
uy = y|[−k,k] observa-se C−k (uy ) ⊆ AZ \X. Podendo-se verificar que C−k (uy ) = B2−(k−1) (y), onde
B2−(k−1) (y) é a bola aberta de raio 2−(k−1) em torno de y. Segue disto que o conjunto F = {uy | y ∈
AZ \X} é suficiente para determinar X. Sendo X o conjunto de todas as sequências em AZ que não
possuem fatores em F. Para verificar esta afirmação, suponha que para um dado uy ∈ F existe x ∈ X
Z
satisfazendo uy = x|[i,j] , então σ (i+k) (x) ∈ C−k
A
(uy ), o que é uma contradição, já que X é invariante
por deslocamento.
Assim, podemos especificar X como o conjunto de sequências em AZ que não possuem fatores
em F, ou seja, para quaisquer inteiros i ≤ j temos que x|[i,j] ∈
/ F. O que nos permite especificar a
1
Conjunto de todas as sequências possı́veis com elementos em A, incluindo a de comprimento zero ε.
37
38 Dinâmica Simbólica e Autômatos
linguagem de X; se Bn (X) é o conjunto de todas as sequências de comprimento n que são fatores de

algum elemento de X, então a linguagem de X é dada por B(X) = ∞
S
n=0 Bn (X). Desta forma, po-
demos empregar métodos complementares para determinarmos se uma sequência bi-infinita pertence
a X, o que ocorre se nenhum de seus fatores pertencem a F ou, equivalentemente, se todos os seus
fatores pertencem a B(X).
Da Seção 3.1 até a Seção 3.7, seguimos a abordagem apresentada em [13, 14] para apresentar
os conceitos de semigrupo, linguagem, autômato e monoide sintático. O motivo da escolha desta
abordagem, deve-se a estreita relação que ela guarda com elementos tı́picos da teoria de sistemas
dinâmicos e estruturas algébricas. Como exemplo, quando faz-se uso da ação das funções parciais
definidas sobre vértices do autômato minimal associado a uma linguagem qualquer L para definir
o monoide sintático associado a L, ver Seção 3.6. Como alternativa, os mesmos conceitos podem
ser apresentados através de uma perspectiva essencialmente de teoria da computação [15, 16, 17].
Na Seção 3.8 são apresentados alguns conceitos necessários ao estudo das linguagens dos sistemas
simbólicos fechados. Nas demais seções apresentamos uma série de novos conceitos e resultados,
como também algumas conclusões e métodos derivados destes.
3.1 Monoide e Semigrupo

O conceito de linguagem está intrinsecamente relacionado com a estrutura algébrica de monoide.
Esta última relacionada com a ação de uma função parcial definida sobre os estados de uma máquina
de estados representando a linguagem (autômato). Este monoide incorpora uma estrutura algébrica
ao estudo de linguagens formais.
De forma geral, o conceito de monoide é decorrente daquela de semigrupo definido como um
conjunto S juntamente com uma operação binária “·” (comumente omitida nas expressões), satisfa-
zendo as propriedades de fechamento e associatividade. Ou seja, para todo a, b, c ∈ S são satisfeitas
as relações (3.1).
ab ∈ S fechamento
(3.1)
(ab)c = a(bc) associatividade
Rigorosamente um semigrupo é representado como o par (S, ·), deixando claro a existência de um
conjunto e uma operação, no entanto, é comum referir-se a um semigrupo pelo conjunto que o
compõe. O monoide surge como um caso particular de um semigrupo, importante em diversas
aplicações deste conceito. Também conhecido como um semigrupo com identidade, um monoide
possui um elemento 1, chamado de identidade, satisfazendo a relação (3.2).
a1 = 1a = a, ∀a ∈ S (3.2)
3.1 Monoide e Semigrupo 39
Supor a existência de dois elementos identidade 1, 1′ em um monoide S implica que 1 = 11′ = 1′ já
que 1 é uma identidade, conclui-se que só há um elemento identidade em um monoide.
Sejam M, M ′ dois monoides, um morfismo ϕ : M → M ′ é uma função satisfazendo as condições:
ϕ(ab) = ϕ(a)ϕ(b), ∀ a, b ∈ M (3.3)

ϕ(1M ) = 1M ′ (3.4)
onde 1M , 1M ′ são os elementos identidade de M, M ′ respectivamente, ambos sendo representados

por 1 quando não há confusão.
A composição de dois morfismos
ϕ ϕ′
M −→ M ′ −→ M ′′
também é um morfismo
ϕϕ′
M −→ M ′′ .
Dados dois subconjuntos X, Y de um monoide M, o conjunto XY é definido por
XY = {xy| x ∈ X, y ∈ Y }.
Um sub-monoide T de um monoide M é um subconjunto de M tal que
1 ∈ T and T 2 ⊂ T,
onde T 2 = T T . Em geral, tem-se T 0 = 1 e T n+1 = (T n )T . Portanto, para qualquer subconjunto A

de um monoide M, o conjunto
A∗ = 1 ∪ A ∪ A2 ∪ . . . ∪ An ∪ . . .
é um sub-monoide de M e é o menor sub-monoide de M contendo A.

Um exemplo de um monoide é o conjunto FX de todas as funções sobre um conjunto X. Como um
sub-monoide, podemos citar o subconjunto de FX cujas funções são bijeções, sendo este subconjunto
um grupo. Quando X é finito, este sub-monoide é o grupo de permutação de X.
Um monoide de maior importância para os objetivos deste texto é o monoide livre. Dado qualquer
conjunto A, o monoide livre A∗ com base A é definido como o conjunto de todas as n-uplas s =
(a1 , . . . , an ), n ≥ 0, formadas por elementos em A. O inteiro n é chamado de comprimento de s
sendo denotado por |s|. Se t = (b1 , . . . , bm ) é outro elemento de A∗ , o produto st é uma justaposição,
i.e.,
st = (a1 , . . . , an , b1 , . . . , bm ).
O que acarreta no elemento identidade 1 = ( ). A operação de justaposição, ou concatenação, pode

ser explicitada por s · t. Pode-se verificar que |st| = |s| + |t| and |1| = 0. Para simplificar a notação,
os parênteses e vı́rgulas são suprimidos. Logo, emprega-se s = a1 a2 . . . an como substituição a
s = (a1 , a2 , . . . , an ) para n > 0. Como consequência dessa notação, o elemento s é chamado uma
palavra de comprimento n, enquanto a ∈ A é chamado uma letra, e A o alfabeto.
Uma propriedade básica de um monoide livre A∗ é que qualquer função α : A → M, onde M é
um monoide, admite uma única extensão para um morfismo α : A∗ → M. A respectiva prova segue
por indução. Seja β outra extensão para um morfismo de α, tal que β(w) = α(w) para todo w ∈ A∗
e |w| ≤ n para algum inteiro positivo n. Como ambos β e α são extensões de α então β(a) = α(a)
para todo a ∈ A, ou w tal que |w| = 1. A partir da definição de um morfismo, β(1) = α(1) = 1.
Agora, seja w = uv e 0 ≤ |u|, |v| ≤ n, então β(uv) = β(u)β(v) = α(u)α(v) = α(uv), do que
conclui-se que há uma única extensão de α para um morfismo.
Seja s ∈ A∗ . Um elemento t ∈ A∗ é um segmento ou fator de s se s = utv para algum u, v ∈ A∗ .
Se u = 1 então t é um prefixo, se v = 1 então t é um sufixo.
Seja f : A∗ → B∗ um morfismo de um monoide livre com base A para um monoide livre
com base B, respectivamente. Como f admite uma única extensão, este morfismo é completamente
determinado pelos elementos f (a) ∈ A∗ para todo a ∈ A. Se f (a) ∈ 1 ∪ B para todo a ∈ A, então
f é chamado morfismo fino; em um morfismo fino letras de A são mapeadas em letras de B ou em 1.
Se f (a) ∈ B para todo a ∈ A, então f é dito muito fino.
Considerando a estrutura algébrica dos semigrupos. Como especificado anteriormente, semi-
grupos são uma estrutura algébrica mais geral que monoide, pois ao contrário deste não requer a
existência de um elemento identidade. Logo, todo monoide é um semigrupo, enquanto a implicação
reversa não é verdadeira.
Se A é um subconjunto de um semigrupo S então
A+ = A ∪ A2 ∪ . . . ∪ An ∪ . . .
é o menor semigrupo de S contendo A. Em particular
A+ = A∗ \{1},
i.e., A+ é formado por todas as palavras de comprimento estritamente positivo. A notação de um

morfismo para um semigrupo é definido como aquela para um monoide, contudo sem requerer (3.4).
3.2 Relações e Congruências 41
Sejam Q e A dois conjuntos, sendo o último finito, define-se a função parcial2
Θ : Q × A∗ → Q, (3.5)
onde A∗ é o monoide livre com base A, satisfazendo as condições
Θ(Θ(q, s), t) = Θ(q, st) (3.6)

Θ(q, 1) = q (3.7)
Com o intuito de simplificar a notação, quando não houver possibilidade de gerar-se confusão Θ(q, s)
será escrito como qs. Assim, as condições (3.6) e (3.7) podem ser escritas como
q1 = q, (qs)t = q(st). (3.8)
Sempre que uma função parcial (3.5) satisfazendo (3.8) é dada, diz-se que Q é um A-módulo (à
direita) com (3.5) como ação. Se (3.5) é uma função, então o módulo é dito ser completo.
3.2 Relações e Congruências

Uma relação de um conjunto X para um conjunto Y , é comumente definida como um subconjunto
do produto cartesiano X × X, sendo alternativamente descrita como uma função
f : 2X → 2Y , (3.9)
onde 2X e 2Y são os conjuntos formados por todos os subconjuntos de X e Y , respectivamente.

Adicionalmente, f deve ser completamente aditiva, i.e.,
[ [
f Ai =f Ai ,
I I
onde {Ai | i ∈ I} é a famı́lia de subconjuntos de X indexados por I. Disto segue que f (∅) = ∅.
Como decorrência da aditividade, f é completamente determinada pelos seus valores nos singletons,
tal que f pode ser vista como uma função
f : X → 2Y .
2
Se f : A → B é uma função parcial, então f (a) possui no máximo um elemento, para todo a ∈ A.
Composição de funções é facilmente determinada a partir de (3.9). As duas descrições alternati-

vas para uma relação dadas acima, diferenciam-se essencialmente pelos fundamentos nos quais são
estruturadas, enquanto a primeira é baseada em teoria de conjuntos, a segunda emprega conceitos
afins à teoria de categorias, permitindo a interpretação de uma relação como uma estrutura que apre-
senta uma dinâmica derivada da função que a define. Podemos relacionar estas abordagens con-
siderando que uma relação f : X → Y é definida como um subconjunto rf de X × Y tal que
rf = {(x, y)| y ∈ f (x)}.
Para toda relação f : X → Y , a relação inversa f −1 : Y → X é definida por
f −1 (y) = {x| y ∈ f (x)}.
O domı́nio de uma relação f : X → Y é definida como
Domf = {x| x ∈ X, f (x) 6= ∅}.
Uma relação f : X → Y é chamada uma função parcial se para cada x ∈ X o conjunto f (x) possui
no máximo um elemento. Se f (x) possui exatamente um elemento, então f é uma função.
A relação r : X → X é chamada uma relação de equivalência se satisfaz as condições
1X ⊂ r, r −1 ⊂ r, rr ⊂ r,
onde 1X : X → X representa a função identidade. Uma relação satisfazendo a primeira destas

condições é dita reflexiva, a segunda é dita simétrica e a terceira é dita transitiva.
A expressão x2 ∈ r(x1 ) é escrita como x1 ∼r x2 , ou x1 ∼ x2 se isso não implicar em uma
confusão. Isto conduz a forma mais familiar de descrever as propriedades de reflexão, simetria e
transitividade, respectivamente.
x∼x
x1 ∼ x2 implica x2 ∼ x1
x1 ∼ x2 e x2 ∼ x3 implica x1 ∼ x3
Destas condições segue que para quaisquer dois elementos x1 , x2 de X os subconjuntos r(x1 ) e
r(x2 ) são ambos iguais ou diferentes. Estas são as classes de equivalência ou r-classes de X mod r.
O conjunto de todas as classes de equivalência é representado por X/r e chamado de quociente de
X mod r. É de conhecimento comum em algébrica que qualquer cobertura de X por conjuntos
disjuntos não vazios determina uma única relação de equivalência em X, para a qual tais conjuntos
3.2 Relações e Congruências 43
são exatamente as classes de equivalência.
Seja f : X → Y uma função. Os subconjuntos não vazios de X da forma f −1 (y) determinam

uma relação de equivalência em X chamada de kernel ou núcleo de f , representada por kerf . Assim,
x1 ∼ x2 mod (kerf ) se, e somente se, f (x1 ) = f (x2 ). Portanto, a função f admite uma única
fatoração
π g
X −→ X/kerf −→ Y
onde g é uma função. Além disso, a função g é injetiva. A função f é injetiva se, e somente se, kerf
é a relação identidade 1X , o que implica que X/1X = X.
Seja r uma relação de equivalência em um monoide M. Diz-se que r é uma congruência em M

se
r(a)r(b) ⊂ r(ab)
para todo a, b ∈ M. Formulações equivalentes são
a ∼ b e c ∼ d implica ac ∼ bd,
e
a ∼ b implica ca ∼ cb e ac ∼ bc.
O fato do produto r(a)r(b) de duas classes de equivalência estar contido em uma única classe de
equivalência r(ab) pode ser usado para definir uma multiplicação em X/r. Com essa multiplicação,
o conjunto quociente X/r torna-se um monoide e π : X → X/r é um morfismo entre monoides.
Se f : M → M ′ é um morfismo entre monoides, então kerf é uma congruência em M e na

fatoração
π g
M −→ M/kerf −→ M ′
g é um morfismo injetivo.
Quando M é um grupo, então a congruência r em M é completamente determinada pela classe

de equivalência 1r contendo o elemento identidade de M. Na perspectiva de teoria de conjuntos, 1r
é um subgrupo invariante (normal) H de M. O morfismo π : M → M/r cede lugar à congruência r
em M cuja classe de equivalência 1r = H é um subgrupo normal de M. Estes comentários ressaltam
dois aspectos importantes de grupos normais: como um subgrupo invariante do grupo M; e como
uma relação de congruência em M. Estes aspectos estão relacionados com teoria de conjunto e teoria
de categorias, respectivamente.
3.3 Cálculo de Divisão
Seja M um monoide. Para cada a ∈ M as funções
La : M → M e Ra : M → M
chamadas multiplicação à esquerda por a e multiplicação à direita por a, respectivamente, são defi-
nidas por
La (b) = ab e Ra (b) = ba.
Se A é um subconjunto de M, estas funções resultam nas relações
LA : M → M e RA : M → M
tal que
[ [
LA = La e RA = Ra .
a∈A a∈A
Segue que para qualquer B ⊂ M
LA (B) = AB e RA (B) = BA
onde
AB = {ab|a ∈ A, b ∈ B}.
As relações inversas correspondentes também são de interesse
L−1 −1 −1 −1
a , LA , Ra , RA : M → M
referentes a
L−1
a (b) = {x| x ∈ M, ax = b}
Ra−1 (b) = {x| x ∈ M, xa = b}

L−1
A (B) = {x| x ∈ M, Ax ∩ B 6= ∅}
−1
RA (B) = {x| x ∈ M, xA ∩ B 6= ∅}
Quando M é um grupo então L−1 −1 −1 −1

a (b) = a b e Ra (b) = ba , o que induz à notação
L−1 −1 −1
A (B) = A B e RA (B) = BA
−1
3.3 Cálculo de Divisão 45
mesmo quando M não é um grupo.
Se M é um monoide livre, então L−1

a é uma função parcial, já que para qualquer b ∈ M há no
máximo um x ∈ M tal que ax = b. Assim, a−1 b = L−1
a (b) é no máximo um elemento. Se M é um
grupo, L−1
a = La−1 é uma função. Em um monoide arbitrário M, a equação ax = b pode ter qualquer
número de soluções e L−1
a é uma relação.
A formula associativa (AB)C = A(BC) para A, B, C ⊂ M é equivalente a cada uma das

identidades em (3.10).
RC RB = RBC , LA RC = RC LA , LAB = LA LB . (3.10)
Com inversos correspondentes
−1 −1 −1
RB RC = RBC , RC−1 L−1 −1 −1
A = LA RC , L−1 −1 −1
AB = LB LA ,
que podem ser reescritos como
(AC −1 )B −1 = A(BC)−1
(A−1 B)C −1 = A−1 (BC −1 )
(AB)−1 C = B −1 (A−1 C).
Estendendo este formalismo para módulos, obtém-se: Seja Q um A-módulo. Para cada a ∈ A∗
tem-se uma função parcial definida em (3.11).
Ra : Q −→ Q
(3.11)
q −→ qa
Para cada q ∈ Q tem-se uma função parcial
Lq : A∗ → Q,
dada por
Lq (a) = qa.
Como antes, derivam-se as relações
LX : A∗ → Q, RA : Q → Q
definidas para X ⊂ Q, A ⊂ A∗ por

[ [
LX = Lq , RA = Ra .
q∈X a∈A
Assim
LX (A) = XA = RA (X),
onde
XA = {qa| q ∈ X, a ∈ A}.
Determinando-se as relações inversas, tem-se
X −1 Y = L−1 ∗
X (Y ) = {a| a ∈ Σ , Xa ∩ Y 6= ∅}
XA−1 = RA
−1
(X) = {q| q ∈ Q, qA ∩ X 6= ∅}
para X, Y ⊂ Q, A ⊂ A∗ .
A equação associativa (XB)C = X(BC) para X ∈ Q e B, C ⊂ A∗ implica nas equações
apresentadas em (3.12).
RC RB = RBC , LX RC = RC LX , LXB = LX LB . (3.12)
É importante salientar que na segunda equação em (3.12) o RC no lado esquerdo é uma relação
RC : Q → Q enquanto no lado direito é uma relação RC : A∗ → A∗ . Similarmente, LB no lado
direito da terceira equação é uma relação LB : A∗ → A∗ . As três identidades são expressas por
diagramas de comutação na forma apresentada na Figure 3.1.
RB LX LB
Q❃ / Q Σ∗ / Q Σ∗❅ / Σ∗
❃❃ ❅❅ ⑦⑦
❃❃ ❅❅ ⑦⑦
RC RC ❅ ⑦⑦ LX
RBC ❃❃ RC LXB ❅❅ ⑦
LX ~⑦
Q Σ∗ / Q Q
Figura 3.1: Diagramas de comutação das expressões RC RB = RBC , LX RC = RC LX , e LXB =

LX LB .
Os inversos das identidades expressas em (3.12) são, respectivamente,
(XC −1 )B −1 = X(BC)−1 ,
(X −1 Y )C −1 = X −1 (Y C −1 ), (3.13)
(XB)−1 Y = B −1 (X −1 Y ),
3.4 Linguagens Regulares 47
onde X, Y ⊂ Q e B, C ⊂ A∗ .
3.4 Linguagens Regulares

Seja A um conjunto finito chamado alfabeto. Um autômato Σ sobre A (ou A-autômato) é formado
por quatro elementos:
Estados: Um conjunto finito Q chamado de estados.
Estados Iniciais: Os elementos de um subconjunto I ⊆ Q.
Estados Terminais: Um subconjunto T ⊆ Q.
Ramos: Um subconjunto E ⊆ Q × A × Q. Logo, um ramo do autômato é uma tripla (p, a, q) em

E, onde são definidas as funções i : E → Q, t : E → Q e L : E → A especificadas por
i(p, a, q) = p, t(p, a, q) = q e L(p, a, q) = a, respectivamente. O conjunto E também pode
ser representado pela função parcial δ : Q × A → Q, tal que δ(p, a) pode ser escrito como
(p, a, δ(p, a)) na notação anterior.
Quando L é uma bijeção, então é comum representar E pelos elementos em A. O que é bem definido
quando associado com as funções i e t, uma vez que um ramo e representa a tripla (i(e), e, t(e)).
a
Outras maneiras de representar um ramo são a : p → q e p −→ q. Mesmo que a função L : E → A
não seja bijetiva, sempre é possı́vel associar E com os elementos de um conjunto A′ através de uma
função L′ : E → A′ , e os elementos em A′ com aqueles em A através da função L′′ : A′ → A,
satisfazendo L′′ (e) = L(L′−1 (e)), tal que L = L′′ L′ .
Um caminho em Σ é uma sequencia w = e1 e2 . . . en de ramos satisfazendo t(ej ) = i(ej+1 ),
1 ≤ j ≤ n, e |w| = n é o comprimento de w. Conceitos importantes são o de caminho nulo e palavra
nula, ambos escritos como ε e possuindo comprimento zero. Adicionalmente temos que i(w) = i(e1 )
e t(w) = t(en ), L(w) = L(e1 . . . en−1 ) L(en ) é o rótulo de w, |L(w)| = |w| é o comprimento da
L(w)
palavra L(w), e i(w) −→ t(w) ou L(w) : i(w) → t(w) são caminhos em Σ com rótulo L(w) de
i(w) para t(w). Um caminho w : i → t com i ∈ I e t ∈ T é chamado realizável. O subconjunto de
A∗ descrito por {L(w)| w é um caminho realizável em Σ} = |Σ| é chamado o comportamento de Σ
ou a linguagem representada por Σ, conceitos herdados da teoria de sistemas dinâmicos.
Neste contexto, uma operação natural é a concatenação de caminhos:
w : p → q, v : q → r
Então,
wv : p → r
conceito que juntamente com o de função de rotulação L permite a especificação da operação de

concatenação de palavras. A operação de concatenação de caminhos pode ser pensada como a
concatenação de funções parciais de Q para Q, associadas por um morfismo com os caminhos em
Σ.
Um subconjunto L de A∗ é dito regular se há um A-autômato Σ tal que |Σ| = L. Assim, quando
um conjunto L ⊆ A∗ é dito regular, há um autômato Σ tal que |Σ| = L.
Seja Σ = (Q, I, T ) um A-autômato, X um subconjunto de Q, e s ∈ A∗ . O subconjunto Xs ⊆ Q
é definido pelas propriedades:
(1) X(st) = (Xs)t.
(2) Xε = X.
(3) ∅s = ∅.
(4) (X1 ∪ X2 )s = X1 s ∪ X2 s.
(5) qa = {p | a : q → p é um ramo em Σ}.
Do que segue que:
Xs = {q | existe um caminho w : p → q com p ∈ X e L(w) = s} (3.14)
Para qualquer subconjunto A ⊂ A∗ define-se

[
XA = Xs
s∈A
A partir de (3.14) o conjunto regular de um autômato Σ é dado por:
|Σ| = {s|Is ∩ T 6= ∅} (3.15)
O autômato Σ é dito ser acessı́vel se para todo estado q há um caminho w : i → q com i ∈ I. Assim,
A é acessı́vel se, e somente se, IA∗ = Q. A partir de (3.15) tem-se que o comportamento de Σ e
aquele do autômato obtido de Σ pela remoção dos estados Q − IA∗ e dos ramos que emergem destes,
ou seja, dos ramos e satisfazendo i(e) ∈ Q − IA∗ . A última operação conduz ao autômato acessı́vel
Σa = (Qa , I, T a),
3.4 Linguagens Regulares 49
Qa = IA∗ , T a = T ∩ Qa , tal que |Σ| = |Σa |, sendo chamada de parte acessı́vel de Σ.

A noção dual à de acessibilidade é a de co-acessibilidade. Seja A ⊆ A∗ e X ⊆ Q, então
XA−1 = {q | existe um caminho w : q → p com p ∈ X e wL ∈ A}.
Do que podem ser obtidas propriedades análogas às (1)-(5). Observando-se que
|Σ| = {s|I ∩ T s−1 6= ∅}.
O autômato Σ é dito co-acessı́vel se

T A∗ −1 = Q.
Removendo-se os estados Q−T A∗ −1 de Σ obtém-se o autômato co-acessı́vel Σb com |Σb | = |A|. Um

autômato Σ é dito essencial se ele é acessı́vel e co-acessı́vel. Dado um autômato Σ, sua componente
essencial é Σt , e Σt = (Σb )a = (Σa )b .
Um A-autômato Σ = (Q, I, T ) é dito determinı́stico se satisfaz as condições:
(1) Σ possui no máximo um estado inicial.
(2) Para todo q ∈ Q e a ∈ A há no máximo um ramo a : q → p em Σ.
Se em (1) e (2) “no máximo um” é substituı́do por “exatamente um” então o autômato determinı́stico
A é dito ser um autômato completo. Dado um autômato determinı́stico Σ = (Q, i, T ), um autômato
completo Σc = (Qc , ic , T ) chamado de complementação de Σ é determinado pelas operações: Se
Σ é completo, então Σc = Σ. Se Σ não é completo, então i = ∅ ou qa = ∅ para algum par
q ∈ Q, a ∈ A. Ao conjunto Q é associado um novo estado denotado por ♦. Assim, Qc = Q ∪ ♦.
Se i = ∅, então ic = ♦, caso contrário ic = i. Se a ação de A sobre Qc é representada por “·”, então:
q · a = qa se qa 6= ∅ em Q, q · a = ♦ se qa = ∅ em Q, e ♦ · a = ♦. Como ♦ não é terminal,
ele não está contido em um caminho de Σc e, portanto, |Σc | = |Σ|.
Aplicando os conceitos apresentados na Seção 3.3 obtém-se que o comportamento de um autômato
determinı́stico Σ = (Q, i, T ) é
|Σ| = i−1 T (3.16)
A aplicação desta formula conduz a Proposição 7.
Proposição 7. [13] Se A é um subconjunto regular de A∗ , então para qualquer subconjunto B de A∗

os subconjuntos B −1 A e AB −1 são regulares.
Demonstração: Seja Σ = (Q, i, T ) um autômato determinı́stico representando A. Segue de (3.16)

que o comportamento do autômato (Q, i, T B −1 ) é
i−1 (T B −1 ).
Como pelas equações (3.13) e (3.16)
i−1 (T B −1 ) = (i−1 T )B −1 = AB −1 ,
segue que AB −1 é regular.
Se s ∈ A∗ e q = is ∈ Q, então o comportamento do autômato Σq = (Q, q, T ) é
|Σq | = q −1 T = (is)−1 T = s−1 (i−1 T ) = s−1 A.
Portanto,
[
B −1 A = |Σq |,
q∈iB
e B −1 A são regulares, já que a união de conjuntos regulares é regular.
Para finalizarmos a seção, é relevante comentarmos sobre uma representação alternativa para um
autômato finito, comumente encontrada em texto sobre teoria da computação [15, 16]. Neste caso,
um autômato é representado por uma quádrupla Σ = (Q, A, I, T, δ), onde Q é o conjunto finito de
estados, A o alfabeto finito, I ⊆ Q o conjunto de estados iniciais, T ⊆ Q o conjunto finito de estados
terminais, e δ a função parcial de transição de estados. Outras variantes podem ser possı́veis de acordo
com o uso pretendido para o autômato, devendo ser devidamente definida.
3.5 Autômato Mı́nimo
O conceito de autômato mı́nimo está relacionado com a propriedade de uma função parcial chamada
morfismo ou mapeamento de estados. O mapeamento de estados ψ : Q → Q′ mapeia os estados
de um A-autômato determinı́stico Σ = (Q, i, T ) sobre aqueles de um A-autômato determinı́stico
Σ′ = (Q′ , i′ , T ′ ) satisfazendo as relações (3.17).
3.5 Autômato Mı́nimo 51
i′ ⊂ ψ(i), (3.17i)
(ψ(q))σ ⊂ ψ(qσ), (3.17ii)
ψ −1 (T ′ ) ⊂ T. (3.17iii)
Segue de (3.17i) que

(ψ(q))s ⊂ ψ(qs) para todo s ∈ A∗ ,
de imediata verificação por indução.

Da definição de mapeamento de estados, segue que a composição de dois mapeamentos de es-
ψ ψ′ ψψ′
tados, A −→ A′ −→ A′′ gera um mapeamento de estados A −→ A′′ , e que toda composição
de mapeamentos de estados, quando bem definida, é associativa, ou seja, (ψψ ′ )ψ ′′ = ψ(ψ ′ ψ ′′ ). A
identidade 1A : Q → Q é um caso de mapeamento de estados.
O mapeamento de estado ψ é dito próprio se as condições (3.18) são verificadas. Aplicando os
conceitos de mapeamento de estados, obtém-se o resultado apresentado no Teorema 8.
i 6= ∅ ⇒ i′ 6= ∅, (3.18i)
qσ 6= ∅ e ψ(q) 6= ∅ ⇒ ψ(q)σ 6= ∅, (3.18ii)
ψ(T ) ⊂ T ′ . (3.18iii)
Teorema 8. [13] Sejam Σ and Σ′ A-autômatos essenciais satisfazendo |A| = |A′ |. Há no máximo
um mapeamento de estados ψ : Σ → Σ′ . Sendo que ψ é próprio e é uma função sobrejetiva.
Segue do Teorema 8 que se Σ e Σ′ são autômatos determinı́sticos essenciais e |Σ| = |Σ′ | = L,

então existe no máximo um mapeamento de estados ψ : Σ → Σ′ . Se escrevermos Σ′ ≤ Σ sempre que
tal mapeamento de estados existir, obtemos uma relação de ordem parcial sobre o conjunto de todos
os autômatos determinı́sticos essenciais com comportamento L.
Sejam Σ e Σ′ autômatos determinı́sticos essenciais, logo se há mapeamentos de estados ϕ : Σ →
Σ′ e ψ : Σ′ → Σ, então segue que ψ ◦ ϕ : Σ → Σ. Pelo Teorema 8, ψ ◦ ϕ = 1Σ , de forma semelhante
ϕ ◦ ψ = 1′Σ . Assim ϕ é um isomorfismo com ψ como inverso. Portanto, o conjunto dos autômatos
determinı́sticos essenciais pode ser particionado em classes isomorfas com comportamento L onde
pode-se definir um relação de ordem parcial.
Ao considerarmos o contexto de mapeamento de estados, estas conclusões permitem-nos forma-
lizar o conceito de minimalidade no contexto da teoria de autômatos. Consideremos a existência
de um autômato determinı́stico essencial Σ◦ com comportamento L, tal que, para qualquer outro
autômato Σ satisfazendo |Σ| = L existe um mapeamento de estados de Σ para Σ◦ . Um autômato Σ◦

com tal propriedade é unicamente determinado, a menos de um isomorfismo, sendo chamado mini-
mal. No processo de determinação de um autômato minimal com comportamento |L|, aplicaremos a
Proposição 9.
Proposição 9. [13] Seja Σ = (Q, i, T ) um A-autômato determinı́stico com comportamento L. Se

is = q ∈ Q, então
q −1 T = |(Q, q, T )| = s−1 L.
Além disso, q é co-acessı́vel se, e somente se, s−1 L 6= ∅; e portanto se, e somente se,
sA∗ ∩ L 6= ∅.
Demonstração: O resultado segue do desenvolvimento do termo q −1 T , sendo
q −1 T = (is)−1 T = s−1 (i−1 T ) = s−1 L.
Permitindo a conclusão imediata de que q é co-acessı́vel se, e somente se, q −1 T 6= ∅.
Para prosseguirmos no desenvolvimento de novos resultados, faz-se necessário a introdução de

novos conceitos, entre os quais o da operação algébrica A-módulo. A operação algébrica A-módulo
∗
à direita definida sobre o conjunto 2A de todos os subconjuntos de A∗ é obtido pela representação
X · s = s−1 X,
para qualquer X ⊂ A∗ e s ∈ A∗ , do que segue que
X · ε = ε−1 X = X e X · (st) = (st)−1 X = t−1 (s−1 X) = (X · s) · t,
∗ ∗ ∗
o que faz de 2A o conjunto 2A A-módulo. Considerando o subconjunto de 2A dado por
∗
E = {X| X ∈ 2A , ε ∈ X},
∗
notamos que para 2A A-module obtém-se (3.19).
∗
X −1 E = X para todo X ∈ 2A (3.19)
3.5 Autômato Mı́nimo 53
A expressão (3.19) segue pelo desenvolvimento
X −1 E = {s| X · s ∈ E}
= {s| s−1 X ∈ E}
= {s| ε ∈ s−1 X}
= {s| s ∈ X} = X.
Para qualquer subconjunto L de A∗ consideramos o A-autômato completo
∗
Σ◦L = (2A , L, E),
do que segue de (3.19) que

|Σ◦L | = L.
Sejam Σ◦L t = ΣL = (QL , iL , TL ) a componente essencial de Σ◦L , e Σ = (Q, i, T ) qualquer A-

autômato determinı́stico essencial com comportamento L. Considerando a função parcial
ϕ : Q −→ QL
ϕ(q) = q −1 T.
Inicialmente, é necessário demonstrar que ϕ é bem definida para todo q ∈ Q. Para qualquer q ∈ Q
existe s ∈ A∗ , tal que, i · s = q, e portanto q −1 T = s−1 L, o que pode ser escrito como L · s a partir
da notação adotada. Como ΣL também é determinı́stico e essencial com comportamento L, e s é um
prefixo de uma palavra em L, então L · s = s−1 L = q −1 T ∈ QL .
Segue das equações (3.20) que ϕ : Σ → ΣL é um mapeamento de estados.
ϕ(i) = i−1 T = |Σ| = L, (3.20i)

ϕ(qs) = (qs)−1 T = s−1 (q −1 T ) = s−1 (ϕ(q)) = ϕ(q) · s, (3.20ii)
q ∈ T ⇔ ε ∈ q −1 T ⇔ ε ∈ ϕ(q) ⇔ ϕ(q) ∈ TL . (3.20iii)
Como Σ e ΣL são A-autômatos determinı́sticos e essenciais com comportamento L, aplicando o

Teorema 8, concluı́-se que ΣL é um autômato mı́nimo para L.
No autômato Σ◦L um estado X é acessı́vel se, e somente se, X = L · s = s−1 L para algum s ∈ A∗ .
O estado X é co-acessı́vel se, e somente se, X · u ∈ E para algum u ∈ A∗ , o que é equivalente a
ε ∈ X ·u ⇒ ε ∈ u−1 X ⇒ u ∈ X. Assim, obtém-se a descrição dada em (3.21) de ΣL = (QL , iL , TL ).
QL = {s−1 L| s ∈ A∗ , s−1 L 6= ∅},

iL = L, (3.21)
−1
TL = {s L| s ∈ L},
onde a última linha de (3.21) segue do fato de ε ∈ s−1 L se, e somente se, s ∈ L.
Teorema 10. [13] Para qualquer subconjunto L de A∗ , o autômato ΣL é minimal. Se Σ = (Q, i, T )

é um A-autômato determinı́stico e essencial com comportamento L, então o único mapeamento de
estados
ϕ : Σ → ΣL ,
é dado por
ϕ(q) = q −1 T,
para q ∈ Q. Além disso, ϕ é uma função própria e sobrejetiva.
A demostração de que ϕ no Teorema 10 é própria, segue de uma comparação direta entre (3.20) e
(3.18).
Nos referimos ao A-autômato ΣL como uma representação minimal ou dos contextos à direita de
L. Qualquer autômato isomorfo a ΣL é chamado um autômato minimal para L.
O núcleo da função ϕ : Q → QL no Teorema 10 é determinado pela relação de equivalência
q1 ∼ q2 ⇔ q1−1 T = q2−1 T.
Se esta relação de equivalência é a identidade, o autômato Σ é reduzido. Assim, Σ é reduzido se
q1−1 T = q2−1 T ⇒ q1 = q2 .
Do que decorre que Σ é reduzido se, e somente se, ϕ é injetiva. Como ϕ é própria e é uma função
sobrejetiva, obtém-se o Corolário 11.
Corolário 11. [13] Um autômato determinı́stico Σ com comportamento L é minimal se, e somente
se, Σ é reduzido e essencial.
3.6 Morfismo Sintático e Monoide Sintático 55
3.6 Morfismo Sintático e Monoide Sintático

Seja Q um A-módulo. Para cada palavra s ∈ A∗ , a função parcial Q → Q que mapeia q em qs é
denotada por α(s). Isso resulta em um morfismo
α : A∗ → PF(Q),
onde PF(Q) é o monoide gerado por todas as funções parciais Q → Q. A imagem M do morfismo
α é chamada de monoide da ação de A-módulo Q. Neste caso, M é o sub-monoide de PF(Q)
gerado pelas funções parciais q → qσ para σ ∈ A. O morfismo sobrejetivo α : A∗ → M está
associado ao monoide da ação de Q. Como uma extensão natural, se Σ = (Q, i, T ) é um A-autômato
determinı́stico, então Q é um A-módulo, sendo o monoide da ação de Q denotada por MΣ . Este é o
monoide da ação do autômato Σ.
Seja ΣL = (QL , iL , TL ) o autômato minimal de um subconjunto L de A∗ . O monoide da ação de
ΣL é denotado por ML , sendo chamado do monoide sintático de L. O morfismo sobrejetivo
ϕL : A∗ → ML ,
associado a L é chamado de morfismo sintático de L.

Proposição 12. [13] Para qualquer subconjunto L de A∗ as seguintes propriedades são equivalentes:
(1) L é regular;
(2) O monoide sintático ML é finito;
(3) Há um monoide finito M, um morfismo ϕ : A∗ → M, e um subconjunto B de M satisfazendo
L = ϕ−1 (B).
Demonstração: (1) ⇒ (2): A validade de (1) implica que o autômato minimal ΣL é finito, portanto
ML é finito.
(2) ⇒ (3): É uma consequência direta de monoide ML , o morfismo sintático ϕL : A∗ → ML , e
do subconjunto ϕL (L) de ML satisfazerem a condições em (3).
(3) ⇒ (1): Considere o A-autômato
Σ = (M, 1, B),
com M interpretado como um A-módulo especificado por m ∈ M, w ∈ A∗
m · w = m · ϕ(w).
Então
|Σ| = {w| 1 · w ∈ B}
= {w| ϕ(w) ∈ B} = ϕ−1 (B) = L,
o que faz de L um conjunto regular.
Observamos que o monoide da ação do autômato Σ permanece inalterado se considerarmos o seu

complemento Σc . Se Σ é completo, conclui-se diretamente que Σ = Σc . Se Σ não é completo, então
Qc = Q ∪ ♦, onde ♦ é denominado um estado sorvedouro. O monoide PF(Q) é então isomorfo
ao monoide de todas as funções Qc → Qc que mapeiam ♦ em ♦. Portanto, o monoide da ação é
o mesmo (neste caso, o monoide da ação pode ser considerado como um sub-monoide do monoide
F(Qc ) de todas as funções Qc → Qc ).
Proposição 13. [13] Sejam L um subconjunto de A∗ e ϕL : A∗ → ML seu morfismo sintático. Então

para todo s, t ∈ A∗ as seguintes condições são equivalentes:
(1) ϕL (s) = ϕL (t);

(2) (us)−1 L = (ut)−1 L para todo u ∈ A∗ ;
(3) usv ∈ L ⇔ utv ∈ L para todo u, v ∈ A∗ .
Demonstração: (1) ⇔ (2): A partir da definição de ML como um monoide formado pelas funções
QcL → QcL segue que
(u−1 L)(ϕL (s)) = (u−1 L) · s = s−1 u−1 L = (us)−1L.
Assim (1) e (2) são equivalentes.

(2) ⇔ (3): Segue diretamente da definição de (us)−1 L.
A condição (3) define uma relação de equivalência em A∗ , especificada por
s ≈L t,
sempre que esta condição for satisfeita. De fato, ≈L é uma congruência, chamada congruência
sintática de L. A equivalência de (1) e (3) mostra que esta congruência é o núcleo do morfismo ϕL .
Como ϕL é sobrejetivo, segue que ML pode ser identificado com o monoide quociente A∗ / ≈L e ϕL
pode ser identificado com o morfismo decorrente da fatoração natural A∗ → A∗ / ≈L . Comumente, a
3.6 Morfismo Sintático e Monoide Sintático 57
classe de congruência que contém um elemento x ∈ A∗ é representada por [x], comum aos elementos
do conjunto ϕ−1 ∗
L (x) ⊆ A . Quanto a operação do monoide, segue da relação de congruência que
[x][y] = [xy].
A condição (3) implica que: Se s ≈L t e s ∈ L, então t ∈ L, logo L é fechado com respeito a ≈L .
O que pode ser reescrito como
ϕ−1
L (ϕL (L)) = L,
ou também como
L = ϕ−1
L (B) para algum B ⊂ ML .
Como consequência destas observações, segue a identidade
ML = MA∗ \L .
De fato, L e A∗ \L possuem a mesma congruência sintática.

Um conceito importante relacionado com o estudo de operações sobre autômatos é o autômato
reverso. Dado um A-autômato Σ = (Q, I, T ), o autômato reverso é
Σ̺ = (Q, T, I),
σ σ
com um ramo p −→ q para todo ramo q −→ p em Σ. Portanto, um caminho π em Σ com L(π) =
σ1 . . . σk . implica na existência de um caminho π ̺ em Σ̺ com
L(π ̺ ) = σk · · · σ1
Do que segue que

|Σ̺ | = ̺(|Σ|),
onde ̺ : A∗ → A∗ é a função reversa definida por
̺(1) = 1, ̺(σ) = σ, ̺(st) = ̺(t)̺(s). (3.22)
Comparando-se as relações de equivalência ≈L com ≈L̺ , encontra-se
s ≈L t ⇔ s̺ ≈L̺ t̺ .
O que implica que os monoides sintáticos ML and ML̺ são anti-isomorfos, i.e., há uma bijeção
ϕ : ML → ML̺ tal que ϕ(xy) = ϕ(y)ϕ(x) para todo x, y ∈ ML . Em outras palavras, ML̺ pode ser
obtido de ML pela reversão do produto em ML . Assim, podemos escrever ML̺ = (ML )̺ .

O item (3) da Proposição 13 relacionada a uma congruência sintática pode ser estendida para
subconjuntos A de um monoide arbitrário M. Consequentemente, é possı́vel definir-se o monoide
sintático MA como M/ ≈A e o morfismo sintático ̺A : M → MA como o morfismo associado a
fatoração natural.
3.7 Conceitos sobre Relação de Ordem Parcial

Uma relação binária r sobre um conjunto X (ou seja, um subconjunto r de X × X) é chamada uma
ordem (parcial) se
1. (x, x) ∈ r para todo x ∈ X. Ou seja, r é reflexiva;
2. ∀x, y ∈ X, (x, y) ∈ X e (y, x) ∈ X implica que x = y. Ou seja, r é anti-simétrica;
3. ∀x, y ∈ X, (x, y) ∈ r e (y, z) ∈ r implica que (x, z) ∈ r. Ou seja, r é transitiva.
É comum escrever x y ao invés de (x, y) ∈ r. Seguindo esta convenção, temos que x y,
x ≺ y e x ≻ y representando (y, x) ∈ r, (x, y) ∈ r e x 6= y, e (y, x) ∈ r e x 6= y, respectivamente.
Com o objetivo de simplificar a notação, iremos nos referir a r como uma ordem parcial r , quando
não houver dúvidas quanto a propriedades de r. Uma relação apresentando a propriedade extra
4. ∀ x, y ∈ X, x y ou y x.
será chamada uma ordem total. O conjunto (X, ), ou simplesmente X quando não houver con-
fusão, será chamado um conjunto (parcialmente) ordenado. Como exemplo de uma relação de ordem
∗
parcial, consideremos I especificada por Y I X sempre que Y ⊆ X, onde Y, X ⊆ 2A . Ou seja,
o conjunto Y está contido ou é igual ao conjunto X. Chamamos a atenção para a importância da
relação de ordem I , pois iremos emprega-la sistematicamente na Seção 3.9.
Seja Y um subconjunto não vazio de um conjunto ordenado (X, ). Um elemento a de Y é cha-
mado minimal se não há elementos em Y que sejam estritamente menores que a, o que é equivalente
a dizer que,
∀y ∈ Y, y a ⇒ y = a.
Um elemento b de Y é chamado minimum se
∀y ∈ Y, b y.
Segue da definição que um elemento minimum é minimal, contudo em um conjunto parcialmente

ordenado, se possı́vel ter-se elementos minimais que não são minimums. Há uma definição análoga
para elemento maximal e maximum. Segue destes conceitos a Proposição 14.
3.8 Alguns Conceitos Sobre Linguagem Formal 59
Proposição 14. [14] Seja Y um subconjunto não vazio de um conjunto parcialmente ordenado X.
Então
1. Y possui no máximo um minimum;

2. Se Y é totalmente ordenado, então os termos minimal e minimum são equivalentes.
Se Y é um subconjunto não vazio de (X, ), um elemento c de X é um limite inferior de Y se
c y para todo y ∈ Y . Se o conjunto de limites inferiores de Y é não vazio e tem um elemento
maximum d, então d é o maior limite inferior de Y (ou glb - greatest lower bound). Caso exista, o
elemento d é único; sendo denotado por
^
d= {y : y ∈ Y }.
Analogamente, define-se menor limite superior (ou lub - least upper bound), sendo denotado por
_
{y : y ∈ Y }.
3.8 Alguns Conceitos Sobre Linguagem Formal

Estamos interessados no estudo da classe de linguagens formais associadas a sistemas simbólicos
fechados. Como demonstrado em [18], um subconjunto L ⊂ A∗ é a linguagem de um sistema
simbólico fechado X se, e somente se, ela satisfaz as propriedades (i) e (ii) abaixo, se além destas ela
satisfaz a propriedade (iii), então L passa estar associada a uma classe de sistemas de maior interesse
prático.
Uma linguagem L ⊆ A∗ é:
(1) fatorial: se ∀x, y, z ∈ A∗ então xyz ∈ L ⇔ y ∈ L;

(2) prolongável: se ∀x ∈ L, ∃ y, z ∈ A+ yxz ∈ L;
(3) transitiva: se x, y ∈ L, ∃ z ∈ A∗ xzy ∈ L.
Há duas classes destas linguagens cujas propriedades merecem destaque, são as linguagens fatoriais
prolongáveis e regulares (FPR - factorial prolongable and regular), e as linguagens fatoriais transi-
tivas e regulares (FTR - factorial transitive and regular). A importância destas classes decorre da
relação que possuem com os sistemas simbólicos fechados regulares (ssr - ou do inglês sofic shift),
sendo destes os ssf que permitem uma representação através de um grafo direcionado. Essa relação
é expressa como: A linguagem de um ssr é FPR, e a linguagem de um ssr irredutı́vel é FTR, [19].
Sendo um ssr irredutı́vel aquele cuja linguagem satisfaz a propriedade (iii) acima, o que implica que
esta linguagem pode ser representada por um grafo direcionado no qual existe um caminho entre
qualquer par ordenado de vértices.
O fato de uma linguagem ser FPR ou FTR reflete nas propriedades do monoide sintático associado
à linguagem. Tais propriedades são apresentadas na Proposição 15, Proposição 16 e na Proposição 17.
Proposição 15. [20] A linguagem L ∈ A∗ é fatorial se, e somente se, ML possui um zero, além de
ϕ−1
L (ML \{0}) = L.
Proposição 16. [19] Uma linguagem L ⊂ A∗ é FPR se, e somente se, ML possui as propriedades:
1. ML possui um número finito de elementos;

2. ML possui um 0, tal que, ϕ−1
L (ML \{0}) = L;
3. Para todos os elementos não nulos [x] ∈ ML , x ∈ L, há elementos y1 , y2 ∈ L distintos de 1, tal
que, [y1 xy2 ] 6= 0.
Como em teoria de grupo e anéis [21], no âmbito da teoria de semigrupos o conceito de ideal
revela propriedades importantes do monoide sintático com reflexos na estrutura da linguagem e
representações associadas. Um subconjunto I de um semigrupo S é chamado um ideal (resp. à
direita, à esquerda), se SIS ⊂ I (resp. IS ⊂ I, SI ⊂ I). Se um monoide possui um elemento nulo
(x0 = 0x = 0), então {0} é um ideal de S. Um ideal I é dito 0-minimal em um semigrupo S, se I
é minimal no conjunto de todos os ideais não-nulos, ou seja, o ideal I em S é 0-minimal se I 6= 0 e
para qualquer outro ideal J ⊆ I tem-se J = I ou J = 0.
Proposição 17. [19] Uma linguagem L ⊂ A∗ é FTR se, e somente se, ML possui as propriedades:
1. ML possui um número finito de elementos;

2. ML possui um 0, tal que, ϕ−1
L (ML \{0}) = L;
3. ML possui um ideal 0-minimal à direita I, tal que, para todo elemento não nulo a ∈ ML , Ia 6= 0.
3.9 Conjuntos Proibidos e Conjuntos de Restrição

A partir desta seção, até o final do capı́tulo, apresentaremos os nossos resultados quanto ao de-
senvolvimento de conceitos e procedimentos combinatoriais para representação e análise de siste-
mas simbólicos fechados, que podem ser distinguidos dos demais por não virem acompanhados de
uma referência explı́cita. Nesta seção demonstraremos como as propriedades inerentes a um ssf X
(particularmente, o fato de possuir uma linguagem fatorial), dão origem a conceitos que definem
X unicamente, além de conduzirem à determinação de algoritmos que permitem a especificação de
representações finitas para a linguagem B(X) de X (grafos direcionados mı́nimos), como também
3.9 Conjuntos Proibidos e Conjuntos de Restrição 61
para o monoide sintático de B(X). Para facilitar a notação, consideremos L = B(X) e L′ seu com-
plemento com relação a A∗ . Podemos interpretar L′ como a restrição global de X, ou seja, o conjunto
de palavras em A∗ que não ocorrem em sequências bi-infinitas de X. De fato, o conjunto F defi-
nido no inı́cio deste capı́tulo está contido em L′ . Apesar de especificado através das propriedades
topológicas de X, o conjunto F manterá sua função de especificar unicamente X se a ele for incluı́do
qualquer elemento em A∗ que possua um fator em L′ . A seguir demonstraremos que só precisamos de
um subconjunto O de L′ para especificarmos se uma palavra pertence ou não a L, que O especifica
unicamente X, assim como X especifica unicamente O, além de demonstrarmos que O é mı́nimo.
Como ficará claro pelo desenvolvimento que segue, o conceito de relação de ordem parcial tem papel
essencial na determinação destes resultados, cujo emprego já inicia-se com a Definição 8.
Definição 8. Seja (X, SP ) um conjunto ordenado induzido pela relação de ordem parcial SP dada
por
u SP w ⇔ u ∈ S(P(w)), onde u, w ∈ X.
O que significa que u é um fator de w.
Definição 9. O conjunto proibido irredutı́vel O de L é a coleção de todos os elementos minimais do

conjunto parcialmente ordenado (L′ , SP ).
Lema 18. Seja L uma linguagem fatorial, então L′ = A∗ · O · A∗ . O que permite-nos interpretar O
como um gerador de L′ .
Demonstração: Como L é fatorial e O ⊆ L′ , então A∗ · O · A∗ ⊆ L′ . Consideremos agora u ∈ L′ .

Então há um elemento v ∈ (L′ , SP ) tal que v SP u. Ressaltamos que como uma relação de ordem
parcial é reflexiva, então u pode ser igual a v. Uma vez que o conjunto O é a coleção de todos os
elementos minimais em (L′ , SP ), então t SP u para pelo menos um elemento t ∈ O. Pode-se
escrever u como u1 tu2 , onde necessariamente u1 , u2 ∈ A∗ , então u ∈ A∗ · O · A∗ , e finalmente,
L′ ⊆ A∗ · O · A∗ .
′
Teorema 19. Seja L uma linguagem fatorial em A∗ . Consideremos o conjunto ΨL = {X ⊆
∗
A∗ | L′ = A∗ · X · A∗ } dos geradores de L′ , e o conjunto ordenado (2A , I ). Então,
^
O= {X ⊆ A∗ : L′ = A∗ · X · A∗ }.
′ ∗
Ou seja, o conjunto O é o glb do conjunto ΨL em (2A , I ).
Demonstração: Seja X ⊆ A∗ um gerador de L′ , ou seja L′ = A∗ · X · A∗ . Então, aplicando o

Lema 18, O = {ε} · O · {ε} ⊆ A∗ · O · A∗ = A∗ · X · A∗ , logo O ⊆ Σ∗ · X · Σ∗ . Do que segue que
para todo u ∈ O há pelo menos um v ∈ X que satisfaz v SP u. Como O é a coleção de todos os
elemento minimais, há t ∈ O tal que t SP v. Observações que nos permitem afirmar que u = u1 vu2
and v = v1 tv2 , vi , ui ∈ A∗ . Disto segue que u = u1 v1 tv2 u2 , decorrendo da minimalidade de u e t
que u = t. Portanto, u = v e u ∈ X. Do que conclui-se que O ⊆ X.
Na Definição 10 apresentamos um tipo de restrição que é dependente do contexto, em outras

palavras, uma palavra s (u) só está proibida de seguir (anteceder) uma palavra w, dado que w é
antecedido (seguido) pela palavra u (s). Como um exemplo, se uws ∈ O então uw, ws ∈ L e
uws ∈ L′ , portanto s é proibida de seguir w quando esta é precedida por u. Como consequência
da Definição 10, demonstraremos no Lema 20 que um conjunto de restrições condicionais é um
subconjunto de O, o que é empregado na Proposição 21 juntamente com uma relação de ordem
apropriada para demonstrar que este conjunto (como definido) é o elemento minimum do conjunto de
geradores.
Definição 10. O conjunto Ow de w-proibições associado a L é a coleção de elementos minimais do

conjunto ordenado (Ow , SP ), onde Ow = {L · w · L}\{L ∪ (L · w · Cw ) ∪ (Dw · w · L)}.
Como uma breve explicação para a expressão de Ow apresentada na Definição 10, consideraremos
os dois casos possı́veis: (i) uwv ∈ L ou (ii) uwv ∈ L′ . O caso (i) é eliminado pela exclusão
dos elementos de A∗ no conjunto L. No caso (ii) estamos interessados em selecionar as palavras
que satisfazem uw, wv ∈ L; quando incluı́mos o termo L · w · Cw eliminamos todas as palavras
satisfazendo wv ∈
/ L, enquanto a inclusão de Dw · w · L elimina todas as palavras satisfazendo
uw ∈
/ L. Desta forma, o conjunto resultante só contém os termos desejados. Como uma observação
adicional, se w ∈
/ L então Ow é trivialmente determinado. Portanto, este caso será excluı́do das
análises subsequentes.
Lema 20. Para todo u = u1 . . . un ∈ Ow , u ∈ Ow se, e somente se, u ∈ O e w SP (u2 . . . un−1 ).
Demonstração: Seja swt ∈ Ow , como resultado do Teorema 19 há v ∈ O satisfazendo v SP swt,
sendo que para v = v1 . . . vn , decorre de sw, wt ∈ L que w SP (v2 . . . vn−1 ). Assim v = s′ wt′ ,
onde s′ , t′ ∈ A+ , o que permite-nos concluir que v ∈ Ow . Como supomos que swt é um elemento
minimal de Ow e v = s′ wt′ ∈ Ow , podemos concluir que v = swt uma vez que s′ wt′ SP swt, como
consequência Ow ⊆ O. Por fim, para todo u ∈ O e w SP (u2 . . . un−1 ) temos necessariamente que
u ∈ Ow , já que u é minimal em L′ e Ow ⊆ L′ , podemos concluir que u ∈ Ow .
Teorema 21. Seja L uma linguagem fatorial em A∗ . Consideraremos o conjunto ΨOw = {X ⊆ A∗ :

∗
Ow = L · X · L} dos geradores de Ow , e o conjunto ordenado (2A , I ). Então
^
Ow = {X ⊆ A∗ : Ow = L · X · L}.
∗
Ou seja, o conjunto Ow é o glb do conjunto ΨOw em (2A , I ).
Demonstração: Seja v ∈ O e w SP v, então decorre do Lema 20 que v ∈ Ow e portanto para todo
K satisfazendo Ow = L · K · L, há pelo menos um elemento u, tal que, u SP v. Como K ⊆ L′ e v
é minimal em L′ , concluı́mos que v = u. Do que decorre que Ow ⊆ K.
A Proposição 17 evidencia como a existência de um elemento algébrico com propriedades es-

pecı́ficas tem implicações na estrutura da linguagem. A seguir demonstraremos como uma classe de
ideais pode ser empregada para construção de representações combinatoriais e na determinação do
próprio monoide sintático. Inicialmente, podemos especificar um ideal à direita no monoide sintático
de uma linguagem L (fatorial e com um elemento nulo) para todo elemento a ∈ ML , como especifi-
cado em (3.23).
Ia = {x ∈ ML : ax = 0}. (3.23)
O fato de Ia ser um ideal à direita segue de considerarmos L uma linguagem fatorial. De forma
complementar, a existência de um elemento nulo é garantida ao considerarmos que L não é uma
linguagem livre, o que, caso contrário, implicaria que para quaisquer x, w ∈ L seria verificado que
xw ∈ L. Apesar de sua relevância em muitos casos de interesse (e.g., quando A é um grupo), quando
estamos interessados em estudar as restrições do sistema (no contexto apresentado neste trabalho) as
linguagens livres tornam-se um caso trivial. A seguir avaliaremos os reflexos do conceito algébrico
de ideal à direita Ia sobre a linguagem L associada.
Definição 11. Seja X uma linguagem arbitrária e w ∈ A∗ . O contexto à direita (resp., à esquerda) de
w com relação a linguagem X é definido como sendo o conjunto
R(w, X) = {u ∈ A∗ : wu ∈ X} (resp., L(w, X) = {u ∈ A∗ : uw ∈ X})
Considerando L uma linguagem fatorial, no Lema 22 demonstramos com o contexto à direita

R(w, L′ ) de uma palavra w ∈ A∗ sobre a linguagem complementar L′ = A∗ \L está relacionado com
o ideal à direita I[w] de um elemento ϕ(w) do monoide sintático de L.
Lema 22. Seja a ∈ ML , então ϕ−1 ′

L (a) ⊆ R(w, L ) se, e somente se, a ∈ I[w] .
Demonstração: Seja u ∈ ϕ−1 ′

L (a) ⊆ R(w, L ), segue da definição de contexto à direita que wu ∈
/L
e portanto [w][u] = [wu] = 0, seguindo-se que a ∈ I[w] . Consideremos agora que a = [u] ∈ I[w] ,
segue da definição de I[w] apresentada em (3.23) que [w][u] = [wu] = 0 e portanto u ∈ R(w, L′ ),
seguindo-se que ϕ−1 ′
L (a) ⊆ R(w, L ).
Como consequência de (3.23) o elemento nulo do monoide sintático de uma linguagem fatorial
sempre pertencerá ao ideal à direita I[w] de uma palavra w ∈ A∗ . Contudo, sabemos da Proposição 15
que o elemento nulo de ML corresponde ao complemento de L em A∗ , o que implica necessariamente

na inclusão ϕ−1 ′ ′ ∗ ′
L (0) = L ⊆ R(w, L ), para qualquer w ∈ A . O que nos permite particionar R(w, L )
em um conjunto trivial, a saber L′ , comum a todas as palavras w ∈ A∗ , e Cw = R(w, L′ )\L′
/ L tem-se Cw ∪L′ = A∗ ,
constituı́do por palavras da linguagem L. Segue desta definição que para w ∈
/ L para todo v ∈ A∗ . Desconsiderando
e portanto Cw = L, sendo uma consequência direta de wv ∈
este caso trivial, para todo v ∈ Cw observa-se wv ∈ L′ e v ∈ L, decorrendo do fato de L ser fatorial
que sempre existirá uma palavra u ∈ L′ satisfazendo u ∈ (S(w)\{ε}) · (P (v)\{ε}), ou seja, u não é
fator de w nem de v. Seguindo um desenvolvimento similar àquele empregado na determinação dos
conjuntos O e Ow , demonstramos que Cw pode ser unicamente caracterizado por um subconjunto
minimum definido através de uma relação de ordem parcial adequada.
Definição 12. Seja (X, P ) um conjunto ordenado induzido pela relação de ordem parcial P dada
por
u P w ⇔ u ∈ P(w), onde u, w ∈ X.
O que significa que u é um prefixo de w.
Definição 13. O conjunto de restrições à direita Cw de uma palavra w ∈ A∗ é formado por todos os
elementos minimais do conjunto ordenado (Cw , P ).
Lema 23. Para w ∈ A∗ , tem-se que Cw = {Cw · L}\L′ . Portanto Cw é um gerador de Cw .
Demonstração: Consideremos u ∈ {Cw · L}\L′ , assim u = tv para algum t ∈ Cw , como as

linguagens consideradas são fatoriais e wt ∈
/ L então wu ∈
/ L, seguindo-se que u ∈ Cw , e portanto
{Cw · L}\L′ ⊆ Cw . Agora, consideremos que u ∈ Cw , como a relação P é reflexiva, o conjunto
{t ∈ Cw : t P u sobre (Cw , P )} possui pelo menos um elemento, e portanto, com pelo menos um
elemento minimal. Concluı́mos que u ∈ {Cw · L}\L′ , o que implica na inclusão Cw ⊆ {Cw · L}\L′ .

Na Proposição 24 é estabelecida a relação entre o ideal à direita I[w] de uma palavra w ∈ A∗ e o

conjunto de restrições à direita Cw da mesma palavra. Em sı́ntese, fica demonstrado que a imagem de
Cw por ϕL pode ser interpretada como um conjunto de geradores I[w].
Proposição 24. Para todo w ∈ A∗ , tem-se que ϕL (Cw ) · ML = I[w] .
Demonstração: Consideremos u ∈ C(w), do que decorre a inclusão {u·L}\L′ ⊆ Cw , e empregando

o Lema 22 obtemos ϕL ({u · L}\L′ ) = {ϕL (u) · ML }\{0} ⊆ I[w] . Como o elemento nulo 0 pertence
a I[w] , para todo w ∈ A∗ , concluı́mos que ϕL (Cw ) · ML ⊆ I[w] . Agora, consideremos que a ∈
I[w] \{0}, o que implica na inclusão ϕ−1 ′ ′
L (a) ⊆ R(w, L )\L = Cw , que por sua vez, juntamente com
o Lema 23, permite-nos concluir que para todo u ∈ ϕ−1

L (a) observa-se P(u) ∩ Cw 6= ∅. Portanto,
{ϕL (u) · ML }\{0} = ϕL ({u · L}\L′) ⊆ ϕL ({Cw · L}\L′) = {ϕL (Cw ) · ML }\{0}. Do que concluı́mos
que I[w] ⊆ ϕL (Cw ) · ML .
Teorema 25. Consideremos w ∈ A∗ e Cw seu conjunto de restrições à direita. Consideremos o

conjunto ΨCw = {X ⊆ A∗ : Cw = {X · L}\L′ } dos geradores de Cw , e o conjunto ordenado
∗
(2A , I ). Então
^
Cw = {X ⊆ A∗ : Cw = {X · L}\L′ }.
∗
Ou seja, Cw é o glb do conjunto ΨCw em (2A , I ).
Demonstração: Seja X ∈ A∗ satisfazendo Cw = {X · L}\L′ . Como ε ∈ L então Cw = Cw · {ε} ⊆

{Cw · L}\L′ = {X · L}\L′ . O que permite-nos concluir que se u ∈ Cw então u ∈ {X · L}\L′ ,
havendo necessariamente t ∈ X e v ∈ L satisfazendo u = tv. Reciprocamente, observa-se que
X\L′ = X ·{ε}\L′ ⊆ {X ·L}\L′ = {Cw ·L}\L′ , havendo, dessa forma, t′ ∈ Cw e v ′ ∈ L satisfazendo
t = t′ v ′ e u = t′ v ′ v. Como Cw é o conjunto de todos os elementos minimais em (Cw , P ), temos que
u = t′ e portanto v ′ v = ε, seguindo-se imediatamente que t = u. Concluı́mos que u ∈ X, e portanto
Cw ⊆ X.
De maneira similar, podemos considerar um ideal à esquerda Ja no monoide sintático da lingua-

gem para todo a ∈ ML . Sendo dado por
Ja = {y ∈ ML : ya = 0}. (3.24)
Como desenvolvido para o caso de restrições à direta, partindo de (3.24) (com evidente semelhança a
(3.23)), podemos introduzir os conceitos recı́procos, mas agora com referência “ à esquerda ”, àqueles
introduzidos a priori. Este processo torna-se ainda mais evidente se considerarmos a linguagem
reversa de L, determinada por L̺ = ̺(L), onde ̺ é a função reversa definida em (3.22). Neste
caso, o desenvolvimento e métodos são idênticos, mas agora considerando palavras w ̺ em A∗ , o que
permite-nos especificar o ideal à direita [w ̺ ] no monoide sintático ML̺ = (ML )̺ , como realizado
na Seção 3.6. Desta forma, iremos definir o contexto à direita de w ̺ com respeito a linguagem L̺
ou L′̺ . Esta abordagem permite-nos importar os resultados desenvolvidos para w ∈ A∗ , derivando
conclusões recı́procas para o ideal à esquerda J[w] no monoide ML , como também seu contexto à
esquerda com respeito as linguagens L e L′ .
Como realizado anteriormente para o caso do contexto à direita, podemos particionar o contexto
à esquerda L(w, L′ ) em um conjunto trivial L′ , comum a todo w ∈ A∗ , e um conjunto que depende
de w, especificado como Dw = L(w, L′ )\L′ . Como antes, desta definição segue que para v ∈ Dw
tem-se vw ∈ L′ e v ∈ L. Como L é fatorial, existe uma palavra u ∈ L′ satisfazendo u ∈ (S(v)\{ε}) ·
(P (w)\{ε}), e portanto u não é fator de w nem de v. De maneira recı́proca ao caso “ à direita ”, a

seguir enunciamos os resultados que têm como implicação a caracterização do conjunto de restrições
à esquerda Dw como o elemento minimum do conjunto de geradores de Dw considerando o conjunto
∗
ordenado (2A , I ), com exceção da Proposição 26 onde é estabelecida a relação entre os conjuntos
de restrições à direita e à esquerda. A seguir, as definições recı́procas a Definição 12 e Definição 13
são apresentadas, respectivamente.
Definição 14. Seja (X, S ) um conjunto ordenado induzido pela relação de ordem parcial S dada
por
u S w ⇔ u ∈ S(w), onde u, w ∈ X.
O que significa que u é um sufixo de w.
Definição 15. O conjunto de restrições à esquerda Dw de uma palavra w ∈ A∗ é formado por todos
os elementos minimais do conjunto ordenado (Dw , S ).
Na Proposição 26 estabelecemos a relação entre os conjuntos de restrição Dw e Cw̺ , associados às

linguagens L e L̺ , respectivamente. Em termos computacionais, este resultado permite-nos analisar
o mapeamento inverso de uma função bijetiva empregando as ferramentas desenvolvidas para análise
de seu mapeamento direto, esta abordagem será exemplificada nos capı́tulos que versam sobre a
codificação do fluxo geodésico.
Proposição 26. Seja u ∈ A∗ , então u ∈ Dw com relação a L se, e somente se, u̺ ∈ Cw̺ com relação
a L̺ .
Demonstração: Segue diretamente da definição de linguagem reversa que vw ∈ L se, e somente

se, w ̺ v ̺ ∈ L̺ . Portanto, para estabelecermos o resultado só precisamos demonstrar que u é um
elemento minimal de Dw se, e somente se, u̺ é um elemento minimal de Cw̺ , considerando as
relações de ordem parcial S e P , respectivamente.
Seja u ∈ Dw , do que segue que u̺ ∈ Cw̺ . Se supusermos que u̺ não é um elemento minimal de
Cw̺ , então deverá existir v ̺ ∈ Cw̺ , v ̺ P u̺ . Do que decorre que v S u, além do que v ∈ Dw . Da
suposição inicial que u̺ não é um elemento minimal de Cw̺ , segue que v ̺ é um prefixo próprio de u̺.
Consequentemente, v também é um prefixo próprio de u, implicando que u ∈
/ Dw , uma contradição.
Concluı́mos que (Dw )̺ ⊆ Cw̺ . De maneira análogo, (Cw̺ )̺ ⊆ Dw .
Os resultados que seguem são recı́procos aos Lemas 22 e 23, a Proposição 24, e ao Teorema 25,
respectivamente.
Lema 27. Seja a ∈ ML , então ϕ−1 (a) ⊆ L(w, L′ ) se, e somente se, a ∈ J[w] .
3.10 Cálculo dos Conjuntos Proibidos e Conjuntos de Restrições 67
Lema 28. Para w ∈ A∗ , tem-se que Dw = {L · Dw }\L′ . Portanto Dw é um gerador de Dw .
Proposição 29. Para todo w ∈ A∗, tem-se que ML · ϕ(Cw ) = J[w] .
Teorema 30. Consideremos w ∈ A∗ e Dw seu conjunto de restrições à esquerda. Consideremos o

conjunto ΨDw = {X ⊂ A∗ : Dw = {L · X}\L′ } dos geradores de Dw , e o conjunto ordenado
∗
(2A , I ). Então
^
Dw = {X ⊆ A∗ : Dw = {L · X}\L′ }.
∗
Ou seja, Dw é o glb do conjunto ΨDw em (2A , I ).
3.10 Cálculo dos Conjuntos Proibidos e Conjuntos de Restrições

Nesta seção demonstramos propriedades relacionadas aos conjuntos de restrições que possibilitam o
emprego dos conceitos teóricos previamente apresentados na determinação de estruturas concretas,
como grafos direcionados mı́nimos (em termos do número de estados) que representem a linguagem
L do ssf, como também representações do monoide sintático relacionado, o que, até onde sabemos,
não possui um procedimento alternativo na literatura.
Como demonstrado no Teorema 19, o conjunto proibido irredutı́vel O é único e bem definido
(é o glb de um conjunto), tendo seus elementos determinados como especificado na Definição 9, a
saber, conjunto de todas as palavras em L′ (ou qualquer outro conjunto de geradores de L′ ) cujos
fatores próprios pertencem à linguagem L, ou seja, para todo w = w1 . . . wn ∈ O tem-se que seus
fatores próprios w2 . . . wn e w1 . . . wn−1 pertencem a L. Determinar O é simplesmente identificar os
elementos minimais de um conjunto de geradores, para isso podem ser empregados algoritmos base-
ados naqueles utilizados para otimização de circuitos e sistemas digitais, busca lexicográfica, etc. Já
no caso dos conjuntos de restrições à direita e à esquerda, para que tornem-se atraentes em termos
práticos, faz-se necessário identificarmos propriedades adicionais que possibilitem o emprego destes
como ferramentas para o determinação de métodos computacionais destinadas ao estudo da lingua-
gem e estrutura algébrica do ssf. Essa tarefa é iniciada nesta seção e continua até o fim do capı́tulo.
Em particular, podemos citar a proposições demonstradas neste seção, cujas implicações permitem-
nos identificar quando uma linguagem é regular e como especificar os conjuntos de restrições, entre
outras.
Inicialmente, lembremos que Cw é o conjunto minimum em L satisfazendo Cw = {Cw · L}\L′ .
Neste contexto, caso w ∈
/ L então para todo v ∈ L, wv ∈
/ L, o que implicará que Cw = {ε}. A
princı́pio, para o caso em que w ∈ L a determinação do conjunto Cw poderia requerer um proce-
dimento de busca exaustiva. A seguir demonstramos que este não é o caso, o que é realizado pela
especificação de um procedimento sistemático para determinação do conjunto Cw quando w ∈ L.
Antes, contudo, iremos estabelecer alguns resultados preliminares, no Lema 31 e Proposição 32

demonstra-se a relação entre os conjuntos Cw e S(P(O)). Estes resultados estão associados ao con-
texto à direita de uma palavra, no Lema 33 e Proposição 34 as versões associadas ao contexto à
esquerda são apresentadas.
Lema 31. Consideremos w ∈ L e u ∈ Cw , onde consideramos Cw um conjunto não nulo. Portanto,
há um, e somente um, fator v de wu em O satisfazendo vu−1 ∈ S(w)\{ε}.
Demonstração: Uma vez que w e u pertencem a uma linguagem fatorial, seus fatores também
pertencem à linguagem. Portanto, podemos concluir a partir do Teorema 19 que wu possui pelo
menos um fator v ∈ L′ , permitindo-nos dividi-lo em um sufixo próprio q pertencendo ao conjunto
P (u)\{ε} e um prefixo próprio p pertencente ao conjunto S(w)\{ε}, satisfazendo pq = v.
Sejam vi ∈ O, 1 ≤ i ≤ n, fatores de wu não necessariamente distintos que, de acordo com a
observação acima, possuem qi ∈ P (u)\{ε}, pi ∈ S(w)\{ε} satisfazendo pi qi = vi . Uma vez que u
é um elemento minimal em (Cw , P ), então qi = u para todo i. Consideremos que pi S pj , então
pi u SP pj u, contudo para todo i a palavra vi é minimal em (L′ , SP ), o que leva-nos a concluir que
pi = pj . Por fim, temos necessariamente que vi = vj , 1 ≤ i, j ≤ n.
Proposição 32. Consideremos w ∈ L, então Cw = Cv para
_
v= {u ∈ S(w) ∩ P(OA−1 )},
considerando a relação de ordem parcial S em L.

Demonstração: A afirmação segue diretamente para w ∈ P(OA−1 ). Além do que, para v, t ∈
P(OA−1 ) e t S v, podemos afirmar que vs ∈ L′ sempre que ts ∈ L′ , como consequência da
linguagem L ser fatorial. Portanto, como v S w, sempre que vp ∈ L′ então wp ∈ L′ , e conse-
quentemente R(v, L′ ) ⊆ R(w, L′ ). Por outro lado, do Lema 31 sempre que wq ∈ L′ então existe
u ∈ S(w) ∩ P(OA−1 ) satisfazendo uq ∈ L′ , como supomos que v é a palavra de maior comprimento
em S(w) ∩ P(OA−1 ), então u S v, e portanto vq ∈ L′ , decorrendo que R(w, L′ ) ⊆ R(v, L′ ). Estes
resultados permitem-nos concluir que R(w, L′ ) = R(v, L′ ), seguindo-se do Teorema 25 que Cw = Cv .

O Lema 33 e a Proposição 34 são recı́procos ao Lema 31 e a Proposição 32, respectivamente.
Contudo relacionados ao contexto à esquerda. As demonstrações podem ser realizadas de forma
similar às anteriores, realizando-se as devidas alterações. Alternativamente, pode ser considerada a
linguagem reversa L̺ e a Proposição 26.
Lema 33. Consideremos w ∈ L e u ∈ Dw o conjunto não vazio de restrições a esquerda associado,
então há um, e somente um, fator v de uw em O satisfazendo u−1v ∈ P (w)\{ε}.
3.10 Cálculo dos Conjuntos Proibidos e Conjuntos de Restrições 69
Proposição 34. Consideremos w ∈ L, então Dw = Dv para

_
v= {u ∈ P(w) ∩ S(A−1 O)},
considerando a relação de ordem parcial P em L.

A partir do Lema 31, para todo w ∈ L segue que Cw ⊆ S(O)\{ε} e OCw−1 ⊆ S(w)\{ε}. Por-
tanto, o conjunto Cw pode ser determinado a partir do conjunto de elementos em O cujos prefixos
próprios são sufixos de w. Inicialmente terı́amos que determinar tais elementos, em seguida seria
necessário especificar o conjunto de elementos minimais do conjunto formado pela união dos corres-
pondentes conjuntos de restrições à direita. Portanto, devemos procurar os elementos do conjunto Cw
em (S(w)\{ε})−1O.
Essa procura não precisa ser exaustiva, como iremos demonstrar na Proposição 35, há um pro-
cedimento recursivo para a determinação de Cw . Inicialmente, a equação (3.25) esboça o procedi-
mento empregando algumas operações básicas de cálculo de divisão sobre os sufixos mais longos
v = a1 a2 . . . an da palavra w (entre aqueles contidos no conjunto P(OA−1 )), o que decorre do
resultado apresentado na Proposição 32, ou seja, Cw = Cv . O procedimento começa calculando
Kvj = (S(a1 . . . aj )\{ε})−1 O para o prefixo mais curto de v contida em P(v)\{ε}, até o próprio v
(seu prefixo mais longo).
Kv1 = a−1
1 O,
Kv2 = a−1 1 −1
2 Kv ∪ a2 O,
.. (3.25)
.
Kvn = a−1 (n−1)
n Kv ∪ a−1
n O.
(n−1)
Proposição 35. Seja v ∈ P(OA−1 ), v = a1 a2 . . . an , então Kvn = a−1
n Kv ∪ a−1
n O.
Demonstração:
Kvn = (S(v)\{ε})−1O
= (S(a1 . . . an−1 )an )−1 O
= (S(a1 . . . an−1 )an ∪ an )−1 O
= a−1 −1 −1
n S(a1 . . . an−1 ) O ∪ an O
= a−1 −1 −1 −1
n ((S(a1 . . . an−1 )\{ε}) O) ∪ an O ∪ an O
= a−1 −1 −1
n ((S(a1 . . . an−1 )\{ε}) O) ∪ an O
= a−1 (n−1)
n Kv ∪ a−1
n O.

Por fim, uma vez que o conjunto Kvn foi obtido, o conjunto de restrições à direita Cw é simples-
mente a coleção de todos os elementos minimais em (Kvn , P ).
O conjunto de restrições à esquerda Dw pode ser obtido através de um procedimento similar.
Neste caso Dw é um subconjunto de O(P(w)\{ε})−1. A equação (3.26) é recı́proca a equação
(3.25). Continuando o processo comparativo, consideremos u = b1 . . . bn como sendo o prefixo
mais longo de w pertencente ao conjunto S(A−1 O), escolha justificada pelo resultado apresentado
na Proposição 34, de onde temos que Dw = Du . No presente caso, o procedimento de cálculo
Tuj = O(P (bj . . . bn )\{ε})−1 inicia-se pelo sufixo mais curto de u que é um elemento de S(u)\{ε}
até o próprio u (seu sufixo mais longo). A partir da Proposição 36 e empregando indução, assim como
no caso dos conjuntos de restrições à direita, é possı́vel demonstrar a efetividade do procedimento.
Tun = Ob−1
n ,
Tu(n−1) = Tun b−1 −1

n−1 ∪ Obn−1 ,
.. (3.26)
.
Tu1 = Tu2 b−1 −1
1 ∪ Ob1 .
Proposição 36. Seja u ∈ S(A−1 O), u = b1 b2 . . . bn , então Tu1 = Tu2 b−1 −1

1 ∪ Ob1 .
Demonstração:
Tu1 = O(P(u)\{ε})−1
= O(b1 P(b2 . . . bn ))−1
= O(b1 ∪ b1 P(b2 . . . bn ))−1
= OP(b2 . . . bn )−1 b−1 −1
1 ∪ Ob1
= (O(P(b2 . . . bn )\{ε})−1)b−1 −1 −1
1 ∪ Ob1 ∪ Ob1
= (O(P(b2 . . . bn )\{ε})−1)b−1 −1
1 ∪ Ob1
= Tu2 b−1 −1
1 ∪ Ob1 .
Como antes, uma vez que o conjunto Tu1 foi determinado, o conjunto de restrições à esquerda Dw
é a coleção do elementos minimais em (Tu1 , S ).
3.11 Obtenção da Estrutura Algébrica através dos Conjuntos de Proibições e Restrições 71
3.11 Obtenção da Estrutura Algébrica através dos Conjuntos de

Proibições e Restrições
Nesta seção será demonstrado como os conjuntos de restrições e proibições podem ser empregados
para a determinação do monoide sintático de uma linguagem FPR com conjunto de proibições O
finito. O método emprega elementos de teoria de autômato, sendo esta máquina de estados finitos
empregada como “máquina de cálculo” para determinação do monoide sintático e implementação de
operação associada a este.
Inicialmente, observemos que R(w, L) = R(v, L) ⇔ w −1 L = v −1 L, somando-se a isso a
aplicação direta do Teorema 25, pode-se concluir que R(w, L′) = R(v, L′ ) ⇔ Cw = Cv . De forma
similar, a igualdade L(w, L) = L(v, L) é observada se, e somente se, ε ∈ (uw)−1L ⇔ ε ∈ (uv)−1 L
para todo u ∈ A∗ , que quando associado ao Teorema 30 permite-nos concluir que L(w, L′ ) =
L(v, L′ ) ⇔ Dw = Dv .
Proposição 37. Seja L ⊆ A∗ uma linguagem fatorial e u, w ∈ A∗ . Então ϕL (w) = ϕL (v) se, e
somente se, as seguintes condições são satisfeitas:
(1) Cw = Cv ;
(2) Dw = Dv ;
(3) (uw)−1Ow = (uv)−1 Ov , para todo u ∈ L.
Demonstração: Como estamos considerando linguagens fatoriais, podemos reescrever o item (2) da
Proposição 13 como:
(uw)−1L = (uv)−1L, para todo u ∈ L.
Empregando esta equação, podemos provar que ϕL (w) = ϕL (v) implica em (1)-(3). Inicialmente,
observamos que ao considerarmos u = ε teremos que w −1L = v −1 L ⇔ (1). De forma similar,
temos que (2) ⇔ (uw)−1L = (uv)−1L para todo u ∈ L. Por fim, consideremos que pwq ∈ Ow ,
o que nos permite afirmar, empregando o item (3) da Proposition 13, que pvq ∈ L′ . A partir da
Definição 10 temos que pw, wq ∈ L, portanto pv, vq ∈ L o que implica necessariamente na existência
de p′ vq ′ ∈ Ov satisfazendo p′ S p e q ′ P q. Contudo, teremos que p′ wq ′ ∈ L′ , e portanto
p′ wq ′ SP pwq, permitindo-nos concluir que p′ = p, q ′ = q e consequentemente pvq ∈ Ov . Dessa
forma, a igualdade ϕL (w) = ϕL (v) implica que (uw)−1Ow = (uv)−1Ov .
Dado o desenvolvimento apresentado no inı́cio do parágrafo anterior, resta-nos provar que a
condição uwt ∈ L ⇔ uvt ∈ L para u, t ∈ L\{ε} é satisfeita, ou de forma similar, que uwt ∈
/
/ L para u, t ∈ L\{ε}. Suponhamos que pwq ∈ L′ contudo pw, wq ∈ L. Empregando

L ⇔ uvt ∈
a Proposição 21, deve existir p′ wq ′ ∈ Ow satisfazendo p′ S p e q ′ P q, seguindo-se de (3) que
p′ vq ′ ∈ Ov e portanto pvq ∈ L′ . Podemos concluir que (1)-(3) implica em ϕL (w) = ϕL (v).
A descrição de como estes resultados podem ser empregados para a determinação do monoide
sintático de uma linguagem F P R denotada por L, especificada através de um conjunto de proibições
irredutı́veis finito é demonstrado através de um exemplo, acompanhado de detalhado comentário.
Consideremos um alfabeto A = {0, 1, 2}. A linguagem L é especificada através do conjunto de
proibições irredutı́veis O = {20, 002, 100, 111, 112, 211, 212, 1011, 1012}. Com essa informação
podemos especificar os conjuntos de prefixos, sufixos e as w-proibições, como apresentado em (3.27)
e (3.28), respectivamente.

P(OA−1 ) = {ε, 0, 00, 1, 10, 101, 11, 2, 21}
Prefixos e Sufixos: (3.27)
S(A−1 O) = {ε, 0, 1, 2, 00, 02, 11, 12, 011, 012}

 O = {002, 100, 1011, 1012}
 0


Possı́veis w-proibições: O1 = {111, 112, 211, 212, 1011, 1012} (3.28)


O = {1011, 1012}

01
Essa informação é suficiente para determinarmos as classes de equivalência das palavras em L com
mesmo contexto à direita, e as classes de equivalência das palavras com mesmo contexto à esquerda.
Com essa informação podemos determinar as classes sintáticas, que como especificado na Seção 3.6,
podem ser mapeadas através de um morfismo bijetivo com os elementos do monoide sintático. Apli-
cando as Proposições 32 e 34, sabemos que essas classes de equivalência só precisam ser deter-
minadas para os elementos em P(OA−1 ) e S(A−1 O). No caso das palavras w com conjuntos
de w-proibições não vazios, de acordo com o Lema 20, essas são exatamente os fatores não nulos
em A−1 OA−1 e são apresentadas em (3.28). Podendo ser observado destas equações, e como con-
sequência do item (3) da Proposition 37, que cada uma destas palavras determina uma classe sintática
distinta, dado que cada uma delas possui o conjunto Ow distinto.
Prosseguindo, passamos a determinar os possı́veis conjuntos Cw e Dw . Aplicando (3.25) aos
elementos em P(OA−1 ) obtemos: K01 = {02}, K00
2
= {2, 02}, K11 = {00, 011, 012, 11, 12},
2 3 2
K10 = {0, 11, 12, 02}, K101 = {1, 2, 00, 011, 012, 11, 12}, K11 = {1, 2, 00, 011, 012, 11, 12}, K21 =
2
{0, 11, 12}, K21 = {1, 2, 00, 011, 012, 11, 12}. Aplicando (3.26) aos elementos em S(A−1 O) obte-
mos: T01 = {10, 2}, T11 = {11, 21, 101}, T21 = {00, 11, 21, 101}, T00
1 1
= {1, 2, 10}, T02 = {0, 2, 10},
1 1 1 1
T11 = {1, 2, 10, 11, 21, 101}, T12 = {1, 2, 10, 11, 21, 101}, T011 = {1, 2, 10}, T012 = {1, 2, 10}.
3 1
O procedimento de cálculo é explicitando em (3.29) para os casos K101 e T012 , observando-se que
K11 = K101
1 2
, K10 2
= K101 e T21 = T012
3 2
, T012 1
= T12 .
1
K101 = 1−1 O;
2
K101 = 0−1 K101
1
∪ 0−1 O = 0−1 K11 ∪ 0−1 O;
3
K101 = 1−1 K101
2
∪ 1−1 O = 1−1 K10
2
∪ 1−1 O.
(3.29)
3
T012 = O2−1 ;
2 3
T012 = T012 1−1 ∪ O1−1 = T21 1−1 ∪ O1−1 ;
1 2
T012 = T012 0−1 ∪ O0−1 = T12
1 −1
0 ∪ O0−1 .
Neste momento é necessário realizarmos algumas observações relevantes para o emprego desta ferra-
menta em alguns casos. Para toda linguagem ε · L = L, portanto Cε = ∅ é um conjunto trivial, e por-
tanto não é necessário calcula-lo explicitamente. Contudo, este conjunto deve ser considerado quando
da determinação do monoide sintático, sendo representado por [ε] = 1. O conjunto Cε também é im-
portante na determinação da apresentação por contexto à direita de uma linguagem FPR, tema abor-
dado na Seção 3.12. Vamos rever com mais cuidado (3.25), se escolhermos um inteiro positivo j > 1
e uma palavra v ∈ P(OA−1 ) satisfazendo |v| ≥ 2, para determinarmos Kvj é necessário determinar
previamente Kvj−1 = Kvj−1
′ onde v ′ = vA−1, ou seja, uma vez que P(v) ⊆ P(OA−1 ) os cálculos
necessários para a determinação de Kvj−1 não constituem unicamente procedimentos intermediários
com a única finalidade de determinar o conjunto de restrições à direta Cv de v. A mesma conclusão
pode ser estendida para os conjuntos Dw , quando da realização dos cálculos para a determinação
dos conjuntos Twi , com a modificação de Twi ser calculado após a determinação de Twi+1 = Tw1 ′ onde
w ′ = A−1 w, e S(w) ⊆ S(A−1 O).
Na Tabela 3.1 a primeira coluna apresenta o conjunto de classes de equivalência à direita, com
relação de equivalência dada por w ∼ v se, e somente se, Cw = Cv . Denotaremos por C tal relação de
equivalência. A segunda coluna contém os elementos equivalentes de P(OA−1 ), enquanto a terceira
coluna contém os conjuntos respectivos de restrições à direita. De forma recı́proca, a Tabela 3.2 apre-
senta as classes de equivalência à esquerda decorrentes da relação de equivalência D, os elementos
em S(A−1 O) que as formam, e os conjuntos respectivos de restrições à esquerda. Pode ser facilmente
verificado, que a terceira coluna, em ambas as tabelas, são determinadas pela especificação dos ele-
mentos minimais dos conjuntos Kwi e Tw1 já calculados, considerando-se as relações de ordem parcial
P e S , respectivamente.
Temos os elementos teóricos para especificar, de forma algorı́tmica, a que elemento do monoide
sintático pertence uma palavra w ∈ A∗ , equivalentemente, ao conjunto do particionamento de A∗
Tabela 3.1: C LASSES DE E QUIVAL ÊNCIA À D IREITA .

C-classes w ∈ P(OA−1 ) Cw
C1 ε ∅
C2 0 {02}
C3 1 {00, 11, 12, 011, 012}
C4 2, 10 {0, 11, 12}
C5 00 {2, 02}
C6 11, 21, 101 {1, 2, 00, 011, 012}
Tabela 3.2: C LASSES DE E QUIVAL ÊNCIA À E SQUERDA .

D-classes w ∈ S(A−1 O) Dw
D1 ε ∅
D2 0 {2, 10}
D3 1 {11, 21, 101}
D4 2 {00, 11, 21, 101}
D5 00, 11, 12, 011, 012 {1, 2, 10}
D6 02 {0, 2}
nas classes de equivalência estabelecidas pelos itens da Proposição 37. Nosso método decorre da
própria Proposição 37, da Proposição 32 e da Proposição 34, que permitem a redução da verificação
à determinação dos sufixos e prefixos mais longos da palavra analisada em P(OA−1 ) e S(A−1 O),
respectivamente. Seguindo-se a isso a especificação, quando necessário, do conjunto Ow .
Prosseguiremos, nesta seção, com o desenvolvimento de um procedimento para a determinação
do monoide sintático associado a uma linguagem FPL. O que implica na determinação dos elementos
que o compõe e da implementação da sua operação. Para isso empregaremos sistematicamente o con-
ceito de autômato, particularmente de um tipo de autômato similar a uma árvore n-ária, apresentado
formalmente na Definição 16 e chamado de trie (acrônico para tree-like automaton, [22]). De forma
a facilitar o entendimento, a seguir faremos uso da relação bijetiva que há entre palavras de uma lin-
guagem apresentada por um autômato determinı́stico e os caminhos sobre esse quando é fixado um
estado de “partida” de referência, podendo ser o próprio estado inicial. De forma mais formal, seja
Σ = (Q, A, i, T, δ) um autômato determinı́stico. Considerando q ∈ Q, se há um caminho π em Σ
com rótulo w partindo de q, então π é único, ou seja, não há outro caminho π ′ satisfazendo i(π ′ ) = q
e L(π ′ ) = w. Portanto, especificado um estado de partida como referência, podemos estender um
pouco a nossa notação, aplicando-a a elementos em A′ , e.g., se L é uma linguagem apresentada por
Σ e w ∈ L, então faz sentido escrevermos t(w) sabendo-se que o estado de partida é o estado inicial
i, como seria de esperar, teremos que t(w) = t(π), onde i(π) = i e L(π) = w. Esta terminologia
permite-nos ir um pouco além, como partindo do estado inicial i, quando existir, só há um caminho
com rótulo w, podemos referir o estado t(w) simplesmente como w, uma vez que este estado está
bem definido. Assim, como fazemos na Definição 16, podemos falar no estado t(w) ou ainda no
estado w, sendo este último o estado alcançado que possui rótulo w, parte do estado inicial i e possui
t(w) como estado terminal. Esta aparente recorrência de definições é realizada com o propósito de
facilitar o entendimento e apresentação dos resultados que seguem.
Definição 16. Um trie é um autômato determinı́stico T = (Q, A, i, T, δ), que aceita um conjunto
M ⊆ A∗ , tal que:
(1) Q é o conjunto de estados {w|w é uma palavra em P(M)}, sendo w é o rótulo de um caminho
partindo de i para o estado t(w);
(2) A é o alfabeto;
(3) O estado inicial i é a palavra de comprimento nulo ε (indicado na representação gráfica por uma
seta);
(4) δ é uma função parcial de Q × A para Q definida como:
δ(u, a) = ua,
portanto, só determinado quando ua é uma palavra em P(M);
(5) T é o conjunto de estados terminais, podendo ser qualquer subconjunto de Q.
O emprego original das trie decorre de algoritmos sobre sequências empregados para reconhe-
cimento de padrão, codificação, compressão e indexação [22, 23, 24]. O emprego que faremos da
estrutura trie possui estreita relação com estas aplicações, o empregaremos para identificar máximos
prefixos e sufixos dentre um conjunto finito de possibilidades, como também para determinar se uma
palavra possui pelo menos um fator em um conjunto finito especı́fico, no nosso caso, o conjunto de
sequências proibidas.
Inicialmente iremos estabelecer um processo de rotulação dos estados de T determinado por uma
relação de equivalência sobre as sequências P(M) que especificam estes estados. Considerando uma
relação de equivalência r sobre P(M), podemos particionar os estados de T de acordo com r pelo
emprego da relação bijetiva que há entre os estados e as sequências em P(M). Tomemos a partição
P(M)/r, a qual podemos associar uma indexação que possibilita representá-la como {ei }, onde
ei ∈ P(M)/r e ei ∩ ej = ∅ para i 6= j.
0 2
2 5 O 0 5
0 1 5
O 1
0 0 4 1 O 2 2
1 6 2 5
3 2 O 0 2 6
ε 1 1
1 O
1 ε
6 1 1 5
2 O 1
2 2 3
1 O 5
2
1 6 4
4 2 O
0 O
Figura 3.2: A C-trie. Figura 3.3: A D-trie.
(6) Seja w ∈ P(M) uma sequência para a qual r(w) = ej , onde ej ∈ P(M)/r. Então, o estado w é
rotulado por j, o que identifica a classe de equivalência em P(M)/r a qual a sequência associada
pertence.
Um trie munido com um processo de rotulação de seus estados estabelecido por uma relação
de equivalência é especificado por uma breve modificação da nomenclatura, sendo chamado de uma
r-trie. Em nosso caso, estamos interessados nas D-trie e C-trie, sendo definidas como:
D-trie: Denotada por TD onde r = D, M = S(A−1 O), e T = Q.
C-trie: Denotada por TC onde r = C, M = O, e T = Q\O = P(OA−1 ).
Empregaremos as D-trie e C-trie na determinação dos elementos do monoide sintático e como forma
de realizar a operação associada a esse. Para o conjunto O que já vı́nhamos empregando, determi-
namos as C-trie e D-trie, apresentando-as na Figura 3.2 e Figura 3.3, onde os estados terminais são
representados por cı́rculos. Exclusivamente para a C-trie, os vértices não terminais possuem rótulo
O.
Considerando uma palavra w ∈ A∗ , podemos determinar a qual classe de equivalência em
S(A−1 O)/D seu prefixo mais longo em S(A−1 O) pertence pela determinação do estado final al-
cançado pelo caminho mais longo na D-trie quando carregada a partir dos dı́gitos mais a esquerda de
w.
Seguindo a mesma idéia, mas com as devidas modificações, pode-se determinar a classe de equi-
valência em P(O)/C a qual pertence o sufixo mais longo em P (O) de uma sequência w ∈ A∗ . Con-
tudo, há a necessidade de considerarmos o caso em que w não pertence a linguagem, ou seja, w pode
conter um fator em O que não seja um prefixo. Esse caso é devidamente tratado ao considerarmos
uma expansão da funcionalidade da C-trie pela aplicação do algoritmo L-AUTOMATON apresentado
em [22]. Tendo como entrada a C-trie, esse algoritmo gera um autômato que apresentação uma lin-
guagem FPR L especificada através de um conjunto finito de palavras proibidas O. Com função de
transição definida de forma a sempre manter a informação de qual é o máximo sufixo no conjunto
P(O) da palavra analisada. De maneira mais formal, fornecido um C-trie gerado a partir de um
conjunto de palavras proibidas O, o algoritmo L-AUTOMATON determina um autômato completo
Σ(O) = (Q, A, i, T, δ) que representa a linguagem FPR L = A∗ \(A∗ OA∗ ), onde Q = P(O) e
T = P(OA−1 ). Sucintamente, esse algoritmo estende a função parcial de transição apresentada na
Definição 16, para uma função de transição apresentada na Definição 17, ou seja, enquanto a pri-
meira é definida em um subconjunto de Q × A, a segunda é definida para todo o conjunto Q × A,
especificando as transições ainda não definidas.
Definição 17. Consideremos a partição de Q × A em três subconjuntos disjuntos, apresentados em

(1)-(3). A função de transição δ de Σ(O) é definida como:
(1) δ = {(u, a, ua) : ua ∈ Q, a ∈ A} (transição direta);
(2) δ = {(u, a, v) : u ∈ Q\O, a ∈ A, ua ∈

/ Q, v é o sufixo mais longo de ua em Q } (transição de
retorno);
(3) δ = {(u, a, u) : u ∈ O, a ∈ A} (estado sorvedouro).
Assim, se o estado terminal de uma palavra w ∈ A∗ é o estado u ∈ T , então u é o sufixo mais

longo de w ∈ L no conjunto P(OA−1 ), permitindo-nos concluir que w pertence a mesma classe
de equivalência em P(OA−1 ) que u. Se o estado terminal de w pertence a O, então w possui uma
palavra proibida como fator, e portanto pertence a linguagem complementar L′ . O autômato Σ(O)
do exemplo considerado é apresentado na Figura 3.4, onde os estados com contornos tracejados
representam dois estados e os respectivos ramos de entrada, um para cada rótulo do ramo de entrada
proveniente de um estado terminal.
No Teorema 38 demonstramos que Σ(O) apresenta a linguagem FPR L = A∗ \A∗OA∗ , sendo a
prova uma alternativa àquela apresentada em [22].
Teorema 38. [22] Seja L uma linguagem FPR com conjunto de palavras proibidas irredutı́veis O.
Então |Σ(O)| = L.
Demonstração: Empregando indução no comprimento de w ∈ L, é possı́vel provar que se v é

a palavra de maior comprimento em {S(w) ∩ P(OA−1 )} então t(w) = v. O que é observado
facilmente ser verdadeiro para |w| = 0. Assumindo que também seja verdadeiro para todo w ∈ L
satisfazendo |w| ≤ n, consideraremos a seguir que t(w) é o sufixo mais longo u de w em P(OA−1 ).
0
0 2 0, 1, 2
2 5 O
1 1, 2
1 6 O 0, 1, 2
0 1
3 0 0, 1, 2
ε 0 O
1 1
0 4 1 1, 2 0, 1, 2
2 6 O
2 2 0
2 0
1 6 O 0, 1, 2
1, 2
4
0 O 0, 1, 2
2
Figura 3.4: Autômato Σ(O) obtido através do algoritmo L-AUTOMATON.
(i) Se wa ∈ P (O), então do item (1) da Definição 17, relacionado às transições diretas, t(wa) ∈
P(OA−1 ) se, e somente se, wa ∈ L. Caso contrário, wa ∈ O dada a suposição de que wa ∈ P(O).
(ii) Se wa ∈
/ P(O), então o prefixo mais longo de wa e ua é o mesmo, caso contrário, u não é o sufixo
mais longo de w em P(OA−1 ), o que é contrário a nossa suposição. Do item (2) da Definição 17,
se wa ∈ 6 ∅ uma vez que u ∈ P(OA−1 ), e portanto wa ∈
/ L então S(ua) ∩ O = / |Σ(O)| pois seu
sufixo mais longo em P(O) pertence a O; caso contrário, t(ua) é o sufixo mais longo de ua em
P(OA−1 ).
Consideremos o caso w ∈
/ L. Assim, podemos decompor w como w = qup, satisfazendo a condição
q ∈ L é o menor prefixo de w condicionado a u ∈ O. Então (qu)A−1 ∈ L (de outra forma, como
consequência da nossa suposição sobre q, u possui um fator próprio em O), uma vez que u ∈ O e da
Definição 17 temos que t(qu) = u é um estado sorvedouro (não terminal), então w ∈
/ |Σ(O)|. Do
que concluı́mos que L = |Σ(O)|.
Consideremos ML o monoide sintático da linguagem L. A seguir empregaremos os autômatos

Σ(O), C-trie e D-trie para determinar os elementos de ML e especificar um procedimento sobre
autômatos para realizar a operação do monoide. Empregando uma analogia, podemos dizer que essas
estruturas são empregadas como nossa “máquina de calcular” sobre a estrutura algébrica de ML .
Nossa abordagem desdobra-se sobre dois casos que merecem distinção:
(1) Os conjuntos Ow dos elementos da respectiva classe de equivalência não são vazios;
(2) Os conjuntos Ow dos elementos da respectiva classe de equivalência são vazios.
Uma recapitulação necessária e breve do resultado apresentado na Proposição 37 será feita a seguir.
Sabemos que se v, w ∈ A∗ então [v] = [w] se, e somente se, Cv = Cw , Dv = Dw e (uw)−1Ow =
(uw)−1Ov para todo u ∈ L. O método para determinar se um conjunto de palavras está contido
na linguagem, e em caso afirmativo, quais as respectivas classes de equivalência em P(OA−1 )/C e
S(A−1 O)/D será discutido quando abordarmos o caso (2). Inicialmente abordamos como determinar
a terceira condição da Proposição 37 empregando o C-trie. A partir do Lema 20, as palavras w ∈ L
que enquadram-se no caso (1) pertencem ao conjunto S(P(A−1 OA−1 ))\{ε}, além do que Ow ⊆ O.
Para cada palavra em P(O), o autômato C-trie possui um único caminho do estado inicial i com
o rótulo correspondente. Assim, dados quaisquer w, v ∈ S(P(A−1 OA−1 ))\{ε} para que tenhamos
Ow = Ov , é necessário que de cada estado terminal u ∈ P(OA−1 )\{ε} pertencente a C-trie as duas
condições que seguem sejam satisfeitas: (i) uw ∈ P(OA−1 ) se, e somente se, uv ∈ P(OA−1 ),
como também (ii) (uwa)−1 O = (uva)−1 O para todo a ∈ A. Apesar de não abordarmos neste texto,
com toda a profundidade possı́vel, questões referentes a implementação algorı́tmica, estas últimas
observações evidenciam dois pontos relevantes. Em primeiro lugar, a condição (ii) deve ser satisfeita
para quaisquer extensões de uw e uv para palavras em OA−1 , e a condição (i) deve ser verificada para
todo prefixo de uw e uv. Esses elementos podem ser empregados na determinação dos conjuntos não
vazios Ow a partir das palavras de comprimento maior, pertencentes ao conjunto A−1 OA−1 , até as
de comprimento menor. Podendo ser empregado na determinação recursiva de palavras com mesmo
conjunto Ow .
No exemplo que estamos considerando, as palavras com conjunto Ow não vazio são S(P(A−1
OA−1 ))\{ε} = {0, 1, 01}. A partir da Figura 3.2, podemos observar que do estado 0 emana só um
ramo, cujo rótulo é 0, implicando que O0 6= O1 . Do estado 00 emana só um ramo, cujo rótulo é 2,
implicando que O0 6= O01 . Analisando as palavras 1 e 01, observamos que do estado 2 emana um
ramo com rótulo 1, contudo não emana um ramo com rótulo 01, portanto O1 6= O01 . Os processos
apresentados para determinação das classes P(OA−1 )/C e S(A−1 O)/D de uma palavra em L são
mais simples que aqueles utilizados para comparar conjuntos Ow . Assim, julgamos que é melhor
determinar se palavras no conjunto S(P(A−1 OA−1 ))\{ε} são C e D equivalentes, antes de comparar
seus conjuntos Ow . Adicionalmente, observamos que todo elemento em ML cujos representantes
em A∗ possuem conjuntos Ow não vazios, podem ser interpretados como elementos “transitórios”,
sempre que O é finito. Esses representantes pertencem ao conjunto S(P(A−1 OA−1 ))\{ε}, logo
se M + 1 é o maior comprimento de um elemento em O, sendo M a memória do ssf (o conceito
de memória é extensivamente abordado em [18]), a operação de no máximo M elementos distintos
da identidade em ML \{ε} é suficiente para garantir que os representantes do elemento resultante
possuem conjunto Ow vazio.
Analisando o caso (2), representaremos os elementos em ML através do par ordenado (ij), tal
que, para w ∈ L, [w] = (ij) se, e somente se, w ∈ Di , w ∈ Cj , e Ow = ∅; onde Di e Cj são classes
de equivalência nos conjuntos quocientes L/D e L/C, respectivamente.
Como resultado do Teorema 38, sabemos que w ∈ L se, e somente se, t(w) é um estado terminal
de Σ(O). Portanto, como procedimento para determinarmos se uma palavra w ∈ A∗ pertence a
linguagem L, e em caso afirmativo, a que classe de equivalência em L/C, só precisamos identificar o
estado alcançado em Σ(O) ao percorrermos o caminho cujo rótulo é w a partir do estado inicial. Se
w ∈ L, então a palavra que identifica o estado t(w), é a mais longa do conjunto S(w) ∩ P(OA−1 ),
sendo o rótulo do estado t(w) a classe de equivalência a qual pertence w. Este fato pode ser verificado
brevemente pelo emprego de um raciocı́nio indutivo. Essa afirmação é verificada facilmente como
verdadeira para |w| = 0, consideremos que ela também é verdadeira para |w| ≤ n. Suponhamos
que t(w) = u (assim, u é a palavra mais longa em S(w) ∩ P(OA−1 ), portanto t(wa) = t(ua) e
dos itens (1) e (2) da Definição 17 concluı́mos que t(ua) é o sufixo de ua mais longo no conjunto
Q, seguindo disso que t(ua) também é o sufixo mais longo de wa em Q. De forma a esclarecermos
esta última afirmação, se há outra opção que não o mais longo sufixo de ua, então ela terá que ser
mais longa que o próprio ua (pois ua é sufixo de wa), vamos chamá-la de v. Então |v| > |ua|,
e portanto |vA−1 | > |uaA−1| ⇒ |vA−1| > |u|. Do que seguiria que v é o mais longo sufixo de
w e não u, como supusemos inicialmente. Como exemplo, consideremos a sequência 010120 e o
autômato da Figura 3.4, percorrendo o caminho associado em Σ(O) observamos que t(010120) ∈ O,
não pertencendo a linguagem. Por outro lado, se considerarmos a sequência 110210 teremos que
t(110210) = 10, do que concluı́mos que 110210 ∈ L e 110210 ∈ C4 .
Para qualquer palavra w ∈ A∗ possuı́mos um método para determinar se ela pertence à linguagem
e, em caso afirmativo, especificar a que classe de equivalência L/C ela pertence. Agora, determina-
remos a que classe de equivalência L/D a palavra w pertence. Para tanto empregaremos a D-trie.
A classe de equivalência procurada é dada pelo rótulo do estado terminal do caminho mais longo
em D-trie que seja um prefixo de w. Para identifica-lo, só precisamos determinar o rótulo do estado
terminal do caminho mais longo em D-trie que começa no estado inicial e cujo rótulo é um prefixo
de w. A partir da construção da D-trie, o rótulo de tal caminho é o prefixo mais longo de w em
S(A−1 O), seguindo da Proposição 34 que o rótulo do estado terminal identifica a classe a qual w
pertence. Como exemplo, a partir da Figura 3.3 e considerando a palavra 110210, seu prefixo mais
longo em S(A−1 O) é 11, portanto ela pertence à classe de equivalência D5 .
Sumarizando nossa análise sobre w = 110210, como o conjunto Ow é vazio, podemos represen-
tar o elemento respectivo do monoide sintático por [110210] = (54). Uma vez que [w][v] = [wv],
o método apresentado disponibiliza uma forma de realizarmos a operação do monoide, dado que
sabemos quais são os elementos de ML , ou seja, sabemos que pares (ij) correspondem a elemen-
tos do monoide e os elementos que possuem conjunto Ow não vazio. Seguindo o procedimento já
apresentado, dados dois elementos [w] e [v], para realizarmos a operação do monoide devemos em-
pregar os autômatos Σ(O) e D-trie, “carregando-os” com wv. Se sabemos que |w| ≥ M então
Dwv = Dw , de forma similar se |v| ≥ M então Cwv = Cv . Considerando que estas restrições de
comprimento são satisfeitas, se sabemos que um elemento de ML possui um representante w tal
que |w| ≥ M, então podemos simplificar o cálculo envolvendo esse elemento. Para tanto, obser-
vamos que [w][v] ∈ S(P(A−1 OA−1 ))\{ε} se, e somente se, [w], [v] ∈ S(P(A−1 OA−1 ))\{ε}
ou ainda podemos ter os casos em que [w] ou [v] é a identidade. Desenvolvendo o exemplo já
iniciado, [0][1] = [01] ∈ S(P(A−1 OA−1 ))\{ε}, contudo [01][w] ou [w][01] possuem represen-
tantes com conjuntos Ow vazios sempre que [w] 6= 1. Se considerarmos um comportamento a
“longo prazo” (operação entre mais que M − 1 elementos de ML diferentes da identidade), para
w ∈ S(P(A−1 OA−1 ))\{ε}, [w] também poderá ser representado a partir de um par ordenado (ij),
desconsiderando o conjunto Ow , uma vez que o resultado da operação realizada certamente será um
elemento em ML cujos representantes possuem conjunto Ow vazio. Portanto, as especificidades lo-
cais de algumas classes do monoide sintático são eliminadas quando considerado o comportamento a
longo prazo.
Já dispomos dos elementos necessários para realizarmos a operação do monoide sintático ML
empregando os autômatos apresentados, sendo necessário iniciarmos pela determinação dos pares
ordenados (ij) associados a elementos de ML . Como as classes de equivalência das palavras com
conjuntos Ow não vazios são obtidos diretamente de O (estas classes possuem representantes no con-
junto S(P(A−1 OA−1 )) ), nos concentraremos na determinação das classes com Ow vazio, referentes
ao caso (2). Claramente, o número máximo destas classes é #(L/D) × #(L/C).
Considerando um par ordenado (ij) especı́fico, 1 ≤ i ≤ #(L/D) e 1 ≤ j ≤ #(L/C), em-
pregando os elementos desenvolvidos até aqui, podemos afirmar que há um elemento do monoide
sintático associado a esse par ordenado se, e somente se, para alguma palavra w ∈ P(S(A−1 O)) o
estado w no D-trie possui rótulo i, além de ser possı́vel estender o estado t(w) em Σ(O) para um
estado com rótulo j empregando uma palavra v, ou seja, t(wv) possui rótulo j, devendo ser satisfeita
a restrição que o rótulo do estado obtido ao carregarmos wv na D-trie também possui rótulo i. Como
exemplo, na Figura 3.3 o estado 0 possui rótulo 2, contudo se o estendermos empregando uma palavra
de rótulo 0 ou 2, as classes resultantes em L/D serão D5 ou D6 , respectivamente. Portanto, as ex-
tensões de 0 só pertencerão a classe D2 se a palavra resultante for 01 ou possui a forma 010u, tal que
010u ∈ L. Todas essas conclusões podem ser verificadas empregando-se os autômatos Σ(O) e D-trie.
Como procedimento geral, empregando o autômato D-trie determina-se o conjunto de palavras com
classe Di e cuja extensão é uma palavra em L que também pertence a classe Di . Empregando-se esse
conjunto, utilizando o autômato Σ(O) determina-se os pares (ij), onde 1 ≤ j ≤ #(L/C). De forma
natural, podemos começar esse processo de determinação dos possı́veis pares (ij), especificando-os
para os elementos dos conjuntos P(OA−1 ) e S(A−1 O), uma vez que metade do cálculo necessário
já foi realizado quando foram determinadas as classes de equivalência L/C e L/D, respectivamente.
Portanto, considerando a Tabela 3.1 e a Tabela 3.2, podemos determinar a Tabela 3.3. Para o nosso
caso, há #(L/D)×#(L/C) = 36 pares ordenados (ij) que são candidatos a representarem elementos
de ML , muitos não estão relacionados a elementos em ML , uma determinação que em alguns casos
pode ser realizada a partir de observações simples.
Inicialmente, consideremos uma linguagem FPR L sobre um conjunto finito A com conjunto de
restrições O finito. Se para qualquer w em Σ∗ de comprimento positivo, há pelo menos um prefixo de
comprimento positivo contido no conjunto S(A−1 O), o que significa que P(w)\{ε}∩S(A−1O) 6= ∅,
então podemos concluir que w ∈
/ D1 para todo w não nulo, do que resulta não haver classes em ML
cujo par ordenado (ij) associado possua i = 1, a não ser a classe com representante ε. Colocando de
outra forma, não haverá w ∈ A∗ , |w| > 0, cujo estado alcançado quando w é “carregada” no D-trie
seja ε. De forma similar, se para todo w ∈ A∗ , |w| > 0, a desigualdade S(w)\{ε} ∩ P(OA−1 ) 6= ∅
é verificada, então w ∈
/ C1 , assim não há classes sintáticas com j = 1 em seus respectivos pares
ordenados (ij), a não ser o elemento que possui ε como representante, o que é equivalente a não
haver caminhos de comprimento positivo tendo ε como estado inicial e terminal em Σ(O).
Como exemplo, consideremos a identificação dos possı́veis pares ordenados (ij) com i = 3. Só
há a palavra 1 em S(A−1 O) nessa classe. A única extensão por um dı́gito cuja palavra resultante
permanece na classe D3 e o conjunto Ow seja vazio é 10. Dessa forma, empregaremos a palavra
10 para determinar os possı́veis j, ou seja, especificar u tal que os possı́veis valores de j sejam
determinados mantendo-se a restrição 10u ∈ L. Especificamos os possı́veis casos em (3.30), obtidos
ao “carregarmos” 10u em Σ(O). 
4, u = ε.
j: (3.30)
6, u = 1.
Do que concluı́mos que só temos as classes (34) e (36) em ML , cujos representantes 10 e 101,
respectivamente, possuem conjuntos Ow vazios.
Tabela 3.3: R EPRESENTANTES DAS CLASSES N ÃO NULAS E PARES ORDENADOS (ij) ASSOCIADOS .
w (ij) w (ij) w (ij) w (ij)

ε (11) 21 (46) 11 (56) 021 (66)
2 (44) 101 (36) 02 (64) 0∗ (22)
10 (34) 001 (53) 010 (24) 1∗ (33)
00 (55) 12 (54) 0101 (26) 01∗ (23)
* Palavras com conjunto Ow não vazio.
3.12 O Autômato Minimal de uma Linguagem FPR 83
3.12 O Autômato Minimal de uma Linguagem FPR

Nesta seção aplicaremos os conceitos apresentados nas Seções 3.9, Seção 3.10 e Seção 3.11 para gerar
uma apresentação reduzida e determinı́stica de uma linguagem FPR L com conjunto de restrições ir-
redutı́veis O. Inicialmente, consideraremos a obtenção de uma versão reduzida de Σ(O), apresentada
na Definição 18 e gerada pela fusão de estados contidos em uma mesma classe de equivalência3.
Definição 18. O autômato M(O) é derivado da versão rotulada de Σ(O), com todos os seus estados
sendo terminais, além de seus ramos e estado inicial satisfazerem as condições que seguem.
• Dois estados terminais I, J de Σ(O) são ditos equivalentes, se possuem o mesmo rótulo (estados
com rótulo O não são considerados na determinação dos estados de M(O)). Tal relação particiona
o conjunto de estados terminais de Σ(O) em conjuntos denotados por e1 , e2 , . . . , er , onde r é o
número de classes em L/C. Cada classe de equivalência ei constitui um estado de M(O).
• Há um ramo em M(O) com rótulo a de ei para ej se, e somente se, há estados I ∈ ei e J ∈ ej e
um ramo em Σ(O) com rótulo a de I para J;
• Se i ∈ ei então ei é o estado inicial de M(O).
Os resultados que seguem demonstram que M(O) é uma apresentação reduzida e determinı́stica
de L. Como resultado preliminar essencial, no Lema 39 demonstramos que ao estendermos palavras
equivalentes com relação a C por elementos de A, a equivalência é preservada. Ou seja, a relação de
equivalência C é uma relação de congruência quando consideramos a operação de concatenação de
elementos em A∗ .
Lema 39. Seja w, v ∈ L satisfazendo C(w) = C(v), então C(wa) = C(va), onde wa ∈ L e a ∈ A.
Demonstração: Do Teorema 25, se wu ∈ L então vu ∈ L para qualquer u ∈ L. Escolhendo-se

u = at então (wa)t ∈ L ⇔ (va)t ∈ L, e portanto C(wa) = C(va).
O resultado apresentado no Lema 39 é essencial para que possamos determinar a linguagem apre-
sentada por M(O).
Proposição 40. Seja L uma linguagem FPR com conjunto de proibições irredutı́veis O. Então M(O)
é uma apresentação determinı́stica de L.
3
Em [25] apresentamos um algoritmo para construir o autômato minimum de uma ssf a partir de classes de restrições
à direita; contudo, os conjuntos de restrições são derivados de um conjunto de proibições irredutı́veis necessariamente
finito, e não como apresentado neste material, a saber, como uma propriedade intrı́nseca de uma linguagem fatorial e
prolongável. Também não são realizadas conexões com o conceito de monoide sintático.
Demonstração: Do Lema 39 e Proposição 32, para C(w) = C(v) e w, v ∈ L então o sufixo mais
longo de wa e va em P(OA−1 ) pertence a mesma classe de equivalência em L/C quaisquer que
sejam wa, va ∈ L, decorrendo da Definição 17 que M(O) é determinı́stico.
a a
Da Definição 18, se ei −→ ej então para todo I ∈ ei existe J ∈ ej , satisfazendo I −→ J
em Σ(O), para todo a ∈ A. Considerando que isso é satisfeito para qualquer v com comprimento
va v a
|v| ≤ n. Se ei −→ ej , e portanto va ∈ |M(O)|, então deve existir ek tal que ei −→ ek −→ ej .
v
Portanto, para todo I ∈ ei haverá K ∈ ek satisfazendo I −→ K, sendo possı́vel determinar um
a va
J ∈ ej , tal que, K −→ J. Do que decorre que I −→ J e va ∈ |A(O)|, o que permite-nos concluir
que |M(O)| ⊆ |Σ(O)|.
a a
Se I ∈ ei , J ∈ ej e I −→ J, então ei −→ ej . Consideremos que isso é satisfeito para toda a
v v va
palavra v com |v| < n, tal que, I −→ J implica que ei −→ ej . Para qualquer va, tal que, I −→ K
v a
teremos va ∈ |Σ(O)|. Logo, observa-se necessariamente que I −→ J −→ K onde K ∈ ek , portanto
v a
deve-se também observar ei −→ ej −→ ek , permitindo-nos concluir que va ∈ |M(O)|. Do que
conclui-se que |Σ(O)| ⊆ |M(O)|.
Por fim, ficam estabelecidas as igualdades |M(O)| = |A(O)| = L.
Na Definição 19 apresentamos uma extensão necessária da Definição 11 para que os resultados

que seguem possam ser demonstrados.
Definição 19. Sejam Σ = (Q, A, i, T, δ) um autômato e I ∈ Q um estado qualquer. Os contextos à

direita e à esquerda de I com relação a Σ são, respectivamente, os conjuntos
R(I, Σ) = {u ∈ A∗ : I · u ∈ T } e L(I, Σ) = {u ∈ A∗ : i · u = I}.
Lema 41. Sejam iv = I, v ∈ P(OA−1 ) e I um estado terminal de Σ(O). Então R(I, Σ(O)) =
R(v, L).
Demonstração: Do Teorema 38 sabemos que Σ(O) é uma apresentação de L, então R(I, Σ(O))
⊆ R(v, L), uma vez que iv = I. Se vu ∈ L, então i(vu) é um estado terminal J, e portanto
v u
i −→ I −→ J, permitindo-nos concluir que R(v, L) ⊆ R(I, Σ(O)).
Como resultado do Lema 41, o contexto à direita de estados com rótulo i em Σ(O) são iguais aos
das palavras em L pertencentes as classes Ci . Na Proposição 42 demonstramos que M(O) também
satisfaz esta propriedade, permitindo-nos concluir que ele é uma apresentação reduzida.
Proposição 42. Sejam I ∈ ei , onde I e um estado de Σ(O) e ei é um estado de M(O). Então

R(I, Σ(O)) = R(ei , M(O)).
3.12 O Autômato Minimal de uma Linguagem FPR 85
2 0 5
0 1 1
2 ε 1 1 3
0 1
2
2 1
4 6
0
2
Figura 3.5: O autômato M(O).
a a
Demonstração: A partir da Definição 18 temos que I −→ J ⇒ ei −→ ej , que conjuntamente com
a a
o Lema 39, caso ei −→ ej então para qualquer I ∈ ei existe J ∈ ej satisfazendo I −→ J, portanto
a a v
ei −→ ej ⇒ I −→ J. Agora, para todo |v| ≤ n, suponhamos que ei −→ ej se, e somente se, há
v v a
I ∈ ei e J ∈ ej , tal que, I −→ J. Então, para todo a ∈ A, I −→ J −→ K se, e somente se,
v a
ei −→ ej −→ ek , K ∈ ek . Do que concluı́mos que R(I, A(O)) = R(ei , M(O)).
Corolário 43. M(O) é o autômato minimal de L.
Demonstração: Por construção, todos os estados de M(O) são terminais e alcançados a partir do
estado inicial. Como o estado inicial de Σ(O) alcança qualquer outro dos seus estados, então ele é
um autômato essencial. Da Proposição 40 o autômato M(O) é uma apresentação determinı́stica de
L, e do Lema 41 e Proposição 42 ele também é reduzido (ver Corolário 11).
Considerando a Figura 3.4, o autômato correspondente M(O) é apresentado na Figura 3.5. Como
o autômato M(O) apresenta a mesma informação que A(O) (a mesma linguagem), então ele pode
ser empregado para realizar a operação do monoide e a identificação das restrições à direita no lugar
do autômato A(O), que é mais complexo (maior número de estados). Realizando essa substituição
de representações, reduzimos a complexidade dos algoritmos empregados, pois, como pode ser de-
monstrado, ela está relacionada com o número de estados e ramos do autômato empregado.
Capı́tulo 4
Geometria Hiperbólica
O objetivo deste capı́tulo é introduzir os conceitos matemáticos básicos (algébricos, geométricos

e topológicos) necessários para a apreciação dos próximos capı́tulos, que versam sobre processos
de codificação de geodésicas. O objetivo é ressaltar os elementos fundamentais sobre geometria
hiperbólica empregados na fundamentação dos resultados, procurando deixar clara a relação entre os
elementos algébricos, geométricos e topológicos relevantes.
Como resultado maior, construı́do no decorrer dos capı́tulos que seguem, estabelecemos uma
apresentação mı́nima para o ssf decorrente do processo de codificação do fluxo geodésico restrito a
um subconjunto compacto de uma superfı́cie hiperbólica. Tal apresentação guarda estreita relação
com as propriedades geométricas da região fundamental empregada na construção da superfı́cie.
4.1 Conceitos Preliminares

A seguir introduzimos alguns conceitos que são empregados nas demais seções deste capı́tulo e no
decorrer dos capı́tulos que seguem. Basicamente, introduziremos conceitos básicos de álgebra e
espaços métricos, como também alguns casos ondes esses surgem conjuntamente.
Definição 20. Um grupo (G, ·) é um conjunto G sobre o qual define-se um operação ·, que associa a
cada par ordenado (a, b) de elementos de G um elemento ab ∈ G, satisfazendo as condições:
1. associatividade: dados a, b, c ∈ G, então (ab)c = a(bc);
2. identidade: há um único elemento e ∈ G tal que ea = a = ae para todo elemento a ∈ G;
3. inverso: dado a ∈ G há um elemento a−1 ∈ G tal que a−1 a = e = aa−1 .
Um exemplo tı́pico de grupo com G finito, é o conjunto das simetrias (reflexão e rotação) de um
polı́gono regular . E de grupo com G infinito, o conjunto dos inteiros com operação de soma. Um
87
88 Geometria Hiperbólica
grupo é dito cı́clico se possui um elemento tal que G = {ak | k ∈ Z}, onde a é dito gerador. Como
exemplo de grupo cı́clico finito, temos as classes de resı́duos Zm = Z/mZ de Z módulo um inteiro
m com operação de adição (Zm , ⊕). Nesse caso, o elemento 1̄ ∈ Zm , com 1 ∈ 1̄, é um gerador, não
m
sendo único, pois qualquer elemento ā tal que a, m são relativamente primos também é um gerador
[26, 21].
Definição 21. Consideremos os grupos (G1 , · ), (G2 , · ) e o conjunto de pares ordenados G1 × G2 =

1 2
{(g1 , g2 ) | g1 ∈ G1 e g2 ∈ G2 }, a este último é dada a estrutura de grupo, chamada de produto direto
de G1 com G2 , ao definir-se a operação (g1 , g2) · (g1′ , g2′ ) = (g1 · g1′ , g1 · g2′ ). Este conceito pode ser
1 2
naturalmente estendido para o produto direto de n grupos.
Como uma extensão do caso anterior, temos que ao conjunto Z2 = Z × Z pode-se dar a estrutura
de grupo quando considerada a operação de soma por coordenada, gerando um reticulado em R2 .
Como caso finito, consideramos o conjunto (Zm , Zn ) com as operações de soma naturais.
Definição 22. Sejam (G1 , · ), (G2 , · ) dois grupos e σ : G1 → Aut(G2 ) um homomorfismo de G1 no

1 2
grupo de automorfismos de G2 . Então, G1 × G2 é chamado de produto semi-direto de G1 por G2 com
σ
homomorfismo σ, com operação definida por
(g1 , g2 ) · (g1′ , g2′ ) := (g1 · g1′ , g2 · σ(g1 )(g2′ )).

σ 1 2
Definição 23. Um espaço métrico é um par (M, d) onde M é um conjunto e d é uma métrica 1 em M.
Sejam M, N espaços métricos. Uma transformação f : M → N é chamada uma imersão isométrica
quando d(f (x), f (y)) = d(x, y) para quaisquer x, y ∈ M, ou seja, f preserva distâncias. Segue da
definição que uma imersão isométrica é sempre injetora. Uma isometria é uma imersão isométrica
sobrejetora.
Os conceitos relacionados de ação de grupo sobre conjunto, órbita e estabilizadores são centrais
no desenvolvimento que segue. Um grupo G atua sobre um conjunto X (via transformações) se para
todo (g, x) ∈ G × X está associado um elemento g(x) ∈ X tal que
1. ação transitiva: g(h(x)) = (gh)(x) para todos g, h ∈ G e x ∈ X.
2. identidade: e(x) = x para todo x ∈ X e e a identidade de G.
Esses elementos nos permitem definir uma relação de equivalência ∼ sobre X dada por x ∼ y se, e
somente se, y = g(x) para algum g ∈ G. Uma classe de equivalência sobre ∼ é chamada de órbita ,
sendo dada, para x ∈ X, por G(x) = {y ∈ X | y = g(x), para algum g ∈ G}. O conjunto quociente
1
Uma função d : M × M → R, que para quaisquer x, y, z ∈ M satisfaz as condições: (1) d(x, x) = 0; (2) se x 6= y
então d(x, y) > 0; (3) d(x, y) = d(y, x); (4) d(x, z) ≤ d(x, y) + d(y, z).
4.2 O Plano Hiperbólico 89
X/ ∼ ou X/G é chamado de conjunto de órbitas de X sobre ação de G . Para cada x ∈ X, o

conjunto Gx = {g ∈ G | g(x) = x} é um subgrupo de G chamado estabilizador de x.
Dado um espaço métrico M e X ⊂ M, dizemos que X é um subconjunto discreto quando o
subespaço X (métrica induzida) é discreto, ou seja, para todo a ∈ X existe uma bola aberta B(a; r)
com raio r > 0 em torno de a tal que B(a; r) ∩ X = {a} [27].
4.2 O Plano Hiperbólico

O estudo do plano hiperbólico pode ser realizado pelo emprego de diferentes modelos. Entre os mais
conhecidos temos o modelo do semiplano superior ou plano de Lobatchevski, denotado por H2 , o
modelo do disco unitário ou disco de Poincaré, denotado por D2 , e o modelo do disco projetivo ou
de Klein, denotado por P2 . Esses modelos se interrelacionam através de isometrias, o que permite
a extensão dos resultados obtidos considerando-se qualquer um deles para os demais. Portanto, a
escolha de um modelo especı́fico deve-se a conveniência que esse proporciona para realização do es-
tudo pretendido. De forma geral, o modelo H2 é preferencialmente empregado em análises algébrica,
enquanto o modelo D2 em análises geométricas.
Quanto aos conceitos básicos de geometria hiperbólica e grupos discretos, nossa abordagem é
expositiva. Sendo nosso objetivo a apresentação dos conceitos algébricos, geométricos e topológicos
relevantes, identificando como estes se relacionam. Para uma abordagem dedutiva, que deriva a
geométrica hiperbólica planar a partir de conceitos básicos e premissas estruturais, sugerimos [28,
29], complementados por [30, 31].
O semiplano superior é formado pelos pontos H2 = {z = x + iy | Im(z) > 0}, decorrendo que
∂H2 = R∪{∞}. O espaço H2 é dotado com a métrica hiperbólica (4.1) expressa através do elemento
diferencial ds, onde z = x + iy.
p
|ds| dx2 + dy 2
ds = = (4.1)
Im(z) y
Portanto, dado I = [0, 1] e γ : I → H2 um caminho diferenciável por partes γ = {z(t) = x(t) +

iy(t) ∈ H2 | t ∈ I}, podemos determinar o comprimento hiperbólico h(γ) de γ através da integral
q
Z 1 ( dx
dt
)2 + ( dy
dt
)2 Z 1
| dz |
dt
h(γ) = dt = dt,
0 y(t) 0 y(t)
permitindo-nos determinar as geodésicas do plano hiperbólico (curvas de menor comprimento com

relação a métrica) como as curvas que minimizam a comprimento hiperbólico h(·) entre quaisquer de
γ4 γ2
γ1 α
b
γ3
Figura 4.1: Exemplo de geodésicas em H2 .
seus pontos. Portanto, a distância hiperbólica dH2 (z, w) entre dois pontos z, w ∈ H2 é definido em
(4.2), para todo caminho γ de z para w.
dH2 (z, w) = inf h(γ) (4.2)
De maneira alternativa, podemos determinar a métrica hiperbólica através da expressão algébrica

dH2 (z, w) = log |z− w̄|+|z−w|
|z−w̄|−|z−w|
. Por fim, o par (H2 , dH2 ) constitui um espaço métrico. Em H2 são
geodésicas os semicı́rculos e semi-retas ortogonais a ∂H2 , como exemplificado na Figura 4.1, onde
fica evidente que, ao contrário da geometria euclidiana, é possı́vel termos duas geodésicas distintas γ1
e γ2 passando por um mesmo ponto α, paralelas a uma terceira geodésica γ3 . De fato, podemos dada
uma geodésica qualquer γ e um ponto α fora desta, temos infinitas geodésicas paralelas a γ passando
por α.
O disco unitário é formado pelos pontos D2 = {z ∈ C | |z| < 1}, decorrendo que ∂D2 =
{z ∈ C | |z| = 1}. Como dito, os modelos D2 e H2 encontram-se relacionados através de um
homeomorfismo f (z) : H2 → D2 , apresentado em (4.3).
iz + 1
f (z) = (4.3)
z+i
O mapeamento f (z) é uma isometria, a distância entre w1 , w2 ∈ D2 pode ser estabelecida a partir da
iz+1 −iw+1
distância já conhecida entre f −1 (w1 ), f −1(w2 ) ∈ H2 . Para w = f (z) = z+i
temos que z = w−i
,
seguindo a determinação da distância em D2 como apresentado em (4.4).
|dz|
= d −iw+1 Im −iw+1

Im(z) w−i w−i
−2dw
(1−iw)(w̄−ī)
= (w−i) 2 Im (w−i)(w̄−ī)
(4.4)
|2dw|
= |w−i|2 Im (1−iw)( w̄+i)
|w−i|2
|2dw|
= (1−|w|2 )
.
4.2 O Plano Hiperbólico 91
D2
Figura 4.2: Exemplo de geodésicas em D2 .
Ficando estabelecido o espaço métrico (D2 , dD2 ), com métrica especificada pelo elemento diferencial
derivado em (4.4). Neste modelo as geodésicas são arcos de cı́rculos ortogonais a ∂D2 e os diâmetros
de D2 , como apresentado na Figura 4.2. Munidos com as métrica dD2 (dH2 ), observamos que a
distância entre qualquer ponto em D2 (H2 ) e um ponto sobre o bordo ∂D2 (∂H2 ) é infinita. Logo, os
pontos do bordo são ditos pontos no infinito. De forma equivalente
aodo modelo H2 , a distância em
|1−z w̄|+|z−w|
D2 pode ser expressa algebricamente por dD2 (z, w) = ln |1−z w̄|−|z−w|
.
Dado um subconjunto A ⊂ H2 , a área hiperbólica µ(A) de A é dada pela integral (4.5), sempre
que esta existir, onde z = x + iy.
dxdy
Z
µ(A) = . (4.5)
A y2
Empregando (4.3) pode-se demonstrar que para o modelo D2 a área hiperbólica é dada por (4.6), onde
agora A ⊂ D2 e z = x + iy.
4 dxdy
Z
µ(A) = . (4.6)
A (1 − |z|2 )2
Uma diferença marcante entre a geometria hiperbólica e a euclidiana está relacionada a determinação
da área de polı́gonos. A definição de um polı́gono em qualquer uma destas geometrias é semelhante,
contudo a forma como a área pode ser determinada revela, mais uma vez, distinções fundamentais
entre estas geometrias. Inicialmente, consideremos a Definição 24.
Definição 24. Dada duas geodésicas que se interceptam em um ponto z ∈ H2 ∪ ∂H2 , o ângulo
hiperbólico entre elas é igual ao ângulo entre os vetores tangentes (no sentido euclidiano) no ponto
z. Na Figura 4.3 o ângulo θ entre os vetores tangentes às geodésicas γ1 e γ2 é igual ao ângulo
hiperbólico.
Um polı́gono hiperbólico com n arestas é uma região fechada em H2 ∪∂H2 (D2 ∪∂D2 ) delimitada
por n segmentos de geodésicas. Se duas geodésicas se interceptam em um ponto, este é denominado
um vértice do polı́gono. São permitidos vértices em ∂H2 (∂D2 ), contudo segmentos de ∂H2 (∂D2 ) não
podem pertencer ao polı́gono. Na Figura 4.4 são apresentados exemplos de triângulos em H2 ∪ ∂H2
e D2 , respectivamente. Possuı́mos elementos suficientes para enunciarmos o Teorema 44.
H2
θ
D2
Figura 4.3: Ângulo hiperbólico. Figura 4.4: Triângulos hiperbólicos.
Teorema 44. (Teorema de Gauss-Bonnet para triângulos hiperbólicos) Seja ∆ um triângulo hi-
perbólico com ângulos α, β, γ. Então,
µ(∆) = π − α − β − γ.
Podendo ser estendido para o caso de um polı́gono qualquer, resultando no Teorema 45.
Teorema 45. (Teorema de Gauss-Bonnet para polı́gonos hiperbólicos) Seja ∆ um polı́gono de n

lados com vértices v1 , . . . , vn e respectivos ângulos internos α1 , . . . , αn . Então,
µ(∆) = (n − 2)π − (α1 + · · · + αn ).
4.3 Grupo de Isometrias do Plano Hiperbólico

a b
Inicialmente consideremos o grupo de matrizes g = sobre R, que satisfazem det(g) =
c d
ab − bc = 1. Consideraremos, como é usual, tr(g) = a + d o traço da matriz g. Esse grupo é
chamado grupo especial linear , sendo denotado por SL(2, R). Além disso, sabemos que o conjunto
de transformações de Möbius γ : C → C da forma
az + b
γ(z) = , (4.7)
cz + d
onde a, b, c, d ∈ R e ad−cd = 1, formam um grupo cujo produto de duas transformações corresponde

ao produto das matrizes correspondentes e o elemento inverso corresponde a matriz inversa. Cada
transformação T realizada por equação da forma (4.7) pode ser representada por um par de matrizes
±g ∈ SL(2, R). Portanto, denomina-se por PSL(2, R) o grupo de transformações da forma (4.7)

isomorfo a SL(2, R) {±12 }, onde 12 é a matriz identidade 2 × 2. Essa relação é representada por

PSL(2, R) ≡ SL(2, R) {±12 } , com elemento identidade do grupo PSL(2, R) denominada por Id.
O traço continua sendo uma função bem definida para os elementos de PSL(2, R), observamos que
4.3 Grupo de Isometrias do Plano Hiperbólico 93
tr(−g) = −tr(g), permitindo-nos especificar
tr2 (T ) = tr2 (g) e Tr(T ) = |tr(g)|.
Ressaltamos que os elementos de PSL(2, R) podem ser interpretados como classes de equivalência
contendo transformações de Möbius ou matrizes em SL(2, R) que realizam a mesma transformação
az+b
em C. Portanto, PSL(2, R) contém todas as transformações ∆ da forma z → com a, b, c, d ∈
cz+d√
R e det(∆) > 0, uma vez que dividindo o numerador e denominador da transformação por ∆
obtém-se uma nova matriz com determinante unitário. Em particular, PSL(2, R) contém todas as
transformações da forma z → az + b (a, b ∈ R, a > 0), e da forma z → − z1 .
É um resultado bem conhecido que PSL(2, R) ⊂ Isom(H2 ), onde Isom(H2 ) representa o grupo de
isometrias de H2 . Contudo, apesar de só considerarmos em nosso desenvolvimento esse conjunto, ele
não perfaz todas as possı́veis isometrias de H2 . Consideremos uma extensão imediata dos conjuntos
anteriores, a saber, o grupo PS∗ L(2, R) = S∗ L(2, R) {±12 } onde S∗ L(2, R) é um grupo de matrizes

a b
reais g = com det(g) = ±1. Portanto, o grupo PS∗ L(2, R) contém o grupo PSL(2, R)
c d
como um subgrupo de ı́ndice dois. Dito isso, no Teorema 46 especificamos o conjunto de isometrias
de H2 .
Teorema 46. [30] O grupo Isom(H2 ) é gerado pelas transformações de Möbius (4.7) em PSL(2, R)
juntamente com a transformação z → −z̄, sendo isomorfo a PS∗ L(2, R). O grupo PSL(2, R) é o
subgrupo de Isom(H2 ) de ı́ndice dois.
A distinção expressa no Teorema 46 faz-se relevante quando analisamos a influencia na orientação

das imagens de curvas hiperbólicas pela ação das isometrias de H2 , logo também curvas hiperbólicas.
Neste contexto, denominamos uma transformação T : H2 → H2 conforme se ela preserva ângulos, e
anti-conforme se ela preserva o valor absoluto dos ângulos mas inverte a orientação (ou sinal).
Teorema 47. [30] Qualquer transformação em PSL(2, R) é conforme, enquanto qualquer transfor-
mação em PS∗ L(2, R)\PSL(2, R) é anti-conforme.
az+b
Como expresso no Teorema 46, consideremos a função φ(z) = −z̄ e o elemento T (z) = cz+d
∈
−az̄+b
PSL(2, R), então T ◦ φ(z) = T (−z̄) = −cz̄+d
, observando que agora o determinante da matriz
associada a transformação T ◦ φ é dado por −ad + bc = −1. Permitindo-nos concluir que toda
az̄+b
transformação dada pela composição T ◦ φ, onde T ∈ PSL(2, R), é do tipo U(z) = cz̄+d
com
ad − bc = −1. Pode-se ver que φ gera um grupo isomorfo a Z2 , dado que φ ◦ φ = Id. Dessa
forma, o grupo das isometrias de PS∗ L(2, R) é isomorfo a PSL(2, R) × Z2 , onde σ(T ) = Id para
σ
todo T ∈ PSL(2, R).
As isometrias em D2 são obtidas daquelas em H2 por conjugação, empregando a isometria (4.3).

Considerando o caso das isometrias conformes, como demonstrado em [28], TD2 é uma isometria de
1
D2 se, e somente se, existe uma isometria TH2 de H2 satisfazendo TD2 (z) = 4
· f ◦ TH2 ◦ f −1 (z),
devendo assumir a forma apresentada em (4.8).
az + b
TD2 (z) = , a, b ∈ C e |a|2 − |b|2 = 1. (4.8)
b̄z + ā
Há três tipos de elementos em PSL(2, R), distinguı́veis pelos valores do traço das isometrias associ-
az+b
adas, dados por Tr(T ) = |a + d|, onde T (z) = cz+d
.
(1) Isometria hiperbólica: Se Tr(T ) > 2, neste caso a matriz associada em SL(2, R) pode ser

λ 0
diagonalizável em R, sendo conjugada a uma matriz da forma , onde λ 6= 1. Equi-
0 1/λ
valentemente, é conjugada a uma transformação de Möbius da forma z 7→ kz, onde k > 0,
portanto, uma dilatação. A transformação T possui dois pontos fixos em ∂H2 ∪ {∞} (em ∂D2
para transformação conjugada sobre D2 ), um repulsor e outro atrator.
(2) Isometria elı́pticas: Se Tr(T ) < 2, neste caso a matriz associada em SL(2, R) é conjugada a
cos θ sin θ

uma matriz da forma . Equivalentemente, é conjugada a uma transformação de
− sin θ cos θ
Möbius sobre D2 da forma z 7→ zeiθ , portanto, uma rotação em torno da origem por um ângulo θ.
A transformação T possui um par de pontos complexos conjugados fixos, dessa forma um ponto
fixo em H2 (em D2 para transformação conjugada sobre D2 ).
(3) Isometria parabólicas: Se Tr(T ) = 2, é interpretada com um caso intermediário entre o hi-
perbólico e elı́ptico, sendo conjugada a uma transformação de Möbius da forma z 7→ z + 1,
portanto, uma translação. A transformação T possui um ponto fixo em ∂H2 ∪ {∞} (em ∂D2 para
transformação conjugada sobre D2 ).
As propriedades dos diferentes tipos de isometrias com relação aos seus pontos fixos reserva co-
mentários quantitativos quanto ao comportamento geométrico decorrente da ação deles sobre H2 ou
D2 . Considerando γ uma isometria hiperbólica, como dois pontos sobre ∂H2 ou ∂D2 são fixados,
a geodésica que os têm como pontos terminais permanece inalterada pela ação de γ, pois a ação de
isometrias leva geodésicas em geodésicas e dois pontos definem uma única geodésica. Quando γ for
elı́ptica, teremos um único ponto fixo em H2 ou D2 , como o conjunto de geodésicas que passam por
este ponto é invariante pela ação de γ, as geodésicas desse conjunto são mapeadas entre si realizando
um movimento de rotação em torno do ponto. Quando γ é parabólica, neste caso as geodésicas com
4.4 Grupo Fuchsiano 95
um ponto fixo em um ponto em H2 ou D2 formam uma famı́lia invariante pela ação de γ, onde um
dos extremos permanece fixo enquanto o outro é deslocado sobre pontos distintos do bordo.

a b
Consideremos uma transformação T (z) = em PSL(2, R). Com T ′ (z) = (cz + d)−2 ,
c d
as medidas euclidianas são multiplicadas por |T (z)| = |cz + d|−2. Neste caso, os comprimentos
′
euclidianos não são alterados no locus determinado pela equação algébrica |cz + d| = 1. No caso
em que c 6= 0, o locus é o cı́rculo |z + dc | = 1
|c|
com centro em − dc e raio 1
|c|
, denominado cı́rculo
isométrico . Representaremos o cı́rculo isométrico associado a uma transformação T por I(T ). O
Teorema 48 e o Teorema 49 apresentam fatos geométricos relevantes para o entendimento da ação de
T sobre H2 e D2 .
Teorema 48. [30] A transformação T expande comprimentos e áreas euclidianas no interior de I(T ),
e comprime-os fora deste.
Teorema 49. [30] Os cı́rculos isométricos I(T ) e I(T −1 ) possuem o mesmo raio, e I(T ) e mapeado
sobre I(T −1 ) pela transformação T .
Como todos os semi-cı́rculos em H2 com centros em ∂H2 são geodésicas hiperbólicas, podemos
concluir que os cı́rculos isométricos são, na verdade, geodésicas em H2 e em D2 .
4.4 Grupo Fuchsiano

Podemos induzir uma métrica no grupo de isometrias PSL(2, R), considerado como transformações
az+b
z → cz+d
, pela identificação destas transformações com pontos (a, b, c, d) ∈ R4 . Portanto, esta-
mos identificando PSL(2, R), como um espaço topológico, com o subconjunto de R4 que satisfaz a
restrição {(a, b, c, d) ∈ R4 | ad − bc = 1}. A norma sobre PSL(2, R) provém da norma no R4 como
especificado em (4.9). Seja
az + b 1
T (z) = ∈ PSL(2, R), então kT k = (a2 + b2 + c2 + d2 ) 2 . (4.9)
cz + d
Munido com a métrica d(T, S) = kT − Sk, consideramos PSL(2, R) como um grupo topológico.
De forma similar podemos associar uma métrica a Isom(H2 ), de forma que o grupo de isometrias
hiperbólicas também é um grupo topológico.
Definição 25. Um subgrupo Γ de Isom(H2 ) é chamado discreto se a topologia induzida sobre Γ é

uma topologia discreta, ou seja, se Γ é um conjunto discreto no espaço topológico Isom(H2 ).
Na Definição 26 apresentamos um dos conceitos centrais na teoria de superfı́cies geométricas com

métrica hiperbólica, considerada na Seção 4.5.
Definição 26. Um subgrupo discreto de Isom(H2 ) é dito fuchsiano se é composto por isometrias
conformes, ou seja, é um subgrupo discreto de PSL(2, R).
Subgrupos discretos de grupos de Lie2 são comumente ditos reticulados por analogia com os
reticulados no Rn que são grupos discretos de isometrias de Rn , tendo como propriedade importante
a ação descontı́nua sobre Rn , ou seja, todo ponto do Rn possui uma vizinhança que é mapeada fora
deste pelos elementos do reticulado, exceto a identidade. Como vimos, isometrias podem ter pontos
fixos, o que impede o cumprimento total destas condições. Contudo, os grupos de isometrias podem
satisfazer uma condição de descontinuidade mais fraca, como apresentado na Definição 27.
Definição 27. Um grupo G atua de forma propriamente descontı́nua sobre um espaço métrico X, se
a G-órbita de qualquer ponto x ∈ X é localmente finita, ou seja, a orbita G(x) é discreta sobre X e o
grupo de estabilizadores Gx de x é finito.
A partir da Definição 27, o Teorema 50 pode ser demonstrado empregando conceitos elementares
de espaços topológicos.
Teorema 50. [30] Um grupo G possui ação propriamente descontı́nua sobre um espaço topológico
X se, e somente se, cada ponto x ∈ X possui uma vizinhança V tal que
T (V ) ∩ V 6= ∅ só para um conjunto finito de elementos T ∈ G.
No Teorema 51 são estabelecidas as condições de necessidade e suficiência para que um subcon-

junto de PSL(2, R) seja fuchsiano.
Teorema 51. [30] Se Γ é um subgrupo de PSL(2, R), então Γ é um grupo fuchsiano se, e somente se,
a ação de Γ sobre H2 é propriamente descontı́nua.
Como consequência imediata dos resultados acima, um subgrupo Γ ⊂ PSL(2, R) atua de forma
propriamente descontı́nua sobre H2 se, e somente se, para todo z ∈ H2 a Γ-orbita de z por Γ é um
subconjunto discreto de H2 .
Definição 28. O conjunto de todos os pontos limites de Γ-orbitas Γz, z ∈ H2 , é chamado o conjunto
limite de Γ e denotado por Λ(Γ).
O conceito de conjunto limite é central para o entendimento dos processos de codificação aritméti-
ca do fluxo geodésico discutido nos próximos capı́tulos. Sendo empregado o fato que para todo
grupo fuchsiano Γ tem-se que Λ(Γ) ⊆ ∂H2 no modelo H2 , e Λ(Γ) ⊆ ∂D2 no modelo D2 . A seguir
apresentamos alguns resultados adicionais.
2
Como estamos tratando de espaços métricos, é suficiente o conceito de grupo metrizável , sendo um espaço métrico
G, munido de uma estrutura de grupo tal que as operações m : G × G → G, m(x, y) = x · y e f : G → G, f (x) = x−1 ,
são contı́nuas.
4.5 Superfı́cies Hiperbólicas e Regiões Fundamentais 97
Teorema 52. [30] O conjunto limite Λ(Γ) é Γ-invariante.
Teorema 53. [30] Se o conjunto limite Λ(Γ) contém mais que dois elementos, então
(1) Λ(Γ) = ∂D2 , ou
(2) Λ(Γ) é um subconjunto perfeito de ∂D2 denso em nenhuma parte3.
Esses resultados fundamentam a seguinte classificação dos conjuntos limites, temos especial in-
teresse em grupos fuchsianos do primeiro tipo.
1. Em um grupo fuchsiano de primeiro tipo , todo ponto em ∂D2 é um ponto limite.
2. Em um grupo fuchsiano de segundo tipo , os pontos limites são densos em nenhuma parte em ∂D2 .
4.5 Superfı́cies Hiperbólicas e Regiões Fundamentais

Uma superfı́cie hiperbólica S (assim como uma superfı́cie euclidiana) é um conjunto munido com
uma métrica dS , tal que, todo P ∈ S possui uma vizinhança isométrica a uma bola aberta em H2 . Essa
definição envolve diversos resultados relacionando a topologia e a geometria de superfı́cies. Particu-
larmente, o teorema de Killing-Hopf diz que toda superfı́cie geométrica (a qual pode ser associada
uma geometria) possui geometria euclidiana, hiperbólica ou esférica [28]. Essa geometria é herdada
do método de construção dessas superfı́cies, decorrendo do quociente K/ΓK do espaço de cobertura
K por um subgrupo de isometrias ΓK possuindo propriedades que garantam que o resultado do quo-
ciente é uma superfı́cie, onde K é R2 (plano euclidiano), H2 (plano hiperbólico) ou S2 (Esfera). Na
Definição 29 apresentamos um conceito instrumental para a construção de superfı́cies.
Definição 29. Uma identificação de arestas de um polı́gono hiperbólico Π é uma partição dos seus
ramos em pares {e, e′ } de igual comprimento hiperbólico (possivelmente infinito), com uma isometria
Te,e′ : e → e′ em PSL(2, R) para cada par. Esse conceito é formalmente estabelecido empregando
conceitos de geometria riemanniana [32, 33].
Os pontos w ∈ e e Te,e′ (w) = w ′ ∈ e′ são ditos identificados. Quando w é identificado com w ′

e w ′ com w ′′ , então w é também é dito identificado com w ′′ . Essa sequência de identificações pode
ocorrer com vértices , com um conjunto maximal de vértices identificados {v1 , . . . , vn } denominado
ciclo de vértices . Uma identificação de arestas de um polı́gono hiperbólico especifica um espaço de
identificação SΠ formado pelos pontos descritos a seguir.
3
Do inglês, nowhere dense.
1. Pontos internos u ∈ Π;
2. Pares de pontos {w, w ′} internos a arestas de Π;
3. Ciclos de vértices {v1 , . . . , vn } de Π em H2 .
No Teorema 54 é estabelecida a condição para que uma superfı́cie obtida pelo processo de identi-
ficação descrito acima seja uma superfı́cie hiperbólica. Seguiremos demonstrando quando um espaço
de identificação existe, como este está relacionado com o grupo de isometrias, culminando no Teo-
rema de Poincaré, que determina uma condição de necessidade e suficiência para que uma região de
identificação possa ser associada a uma superfı́cie geométrica.
Teorema 54. [28] O espaço de identificação S = SΠ possui uma métrica (concordando com a
métrica hiperbólica para regiões suficientemente pequenas no interior de Π), tornando-o uma su-
perfı́cie hiperbólica, quando a soma dos ângulos de um ciclo de vértices for igual a 2π.
Espaços de identificação, grupos de isometrias e superfı́cies geométricas relacionam-se através

do conceito de região fundamental, apresentado na Definição 30 em um contexto mais geral que o
hiperbólico.
Definição 30. Uma região fechada F ⊂ X (i.e. o fecho de um conjunto aberto F̊ , chamado interior
de F ) é definida como uma região fundamental para G se
S
1. T (F ) = X;
T ∈G
2. F̊ ∩ T (F̊ ) = ∅ para todo T ∈ G\{Id}.
O conjunto ∂F = F \F̊ é chamado fronteira de F , e a famı́lia {T (F ) | T ∈ G} é chamada

tesselação de X. Podemos fazer uso da ação propriamente descontı́nua de um grupo fuchsiano
sobre H2 como premissa para a determinação de uma região fundamental conectada e convexa para
esse. Formalizamos esta propriedade no Lema 55.
Lema 55. [30] Seja Γ um subgrupo de PSL(2, R) com ação propriamente descontı́nua sobre H2 ,
e p ∈ H2 um ponto fixo por algum elemento de Γ. Então há uma vizinhança W de p para a qual
nenhum outro ponto de W é fixado por um outro elemento de Γ que não a identidade.
Definição 31. Seja Γ um grupo fuchsiano arbitrário e p ∈ D2 não fixado por qualquer elemento de
Γ, a não ser a identidade, o que é factı́vel pelo Lema 55. Uma região de Dirichlet para um grupo
fuchsiano Γ, com centro em p é o conjunto
Dp (Γ) = {z ∈ H2 | dD2 (z, p) ≤ dD2 (z, T (p)) para todo T ∈ Γ}.

Para cada T1 ∈ PSL(2, R), o conjunto apresentado em (4.10) é formado pelos pontos z mais
próximos ou com igual distância, em relação a métrica hiperbólica, de p com relação a T1 (p).
Pp (T1 ) = {z ∈ H2 | dD2 (z, p) ≤ dD2 (z, T1 (p))}. (4.10)
T
Como a Γ-órbita de p é discreta, temos que o conjunto Pp (Γ) = Pp (T ) possui área hiperbólica
T ∈Γ
positiva. Além disso, os conjuntos dD2 (z, p) = dD2 (T (z), p) são geodésicas que particionam H2 em
semiplanos hiperbólicos, um dos quais contém p. Portanto, Pp (Γ) é uma região hiperbólica conexa,
podendo ser observado por comparação que Pp (Γ) = Dp (Γ). O Teorema 56 estabelece a importância
das regiões Dp (Γ).
Teorema 56. [30] Se p não é um ponto fixo para qualquer elemento Γ\{Id}, então Dp (Γ) é uma
região fundamental conexa para Γ.
Os segmentos de geodésicas que formam a fronteira de Dp (Γ) são denominadas arestas , os

pontas de intersecção das arestas são denominados vértices . Quando um vértice é comum a arestas
não contidas em uma mesma geodésica, é dito ordinário . No caso em que um vértice v é comum
a arestas contidas em uma mesma geodésica, então v é dito singular , neste caso v é ponto fixo de
uma isometria elı́ptica de ordem dois. As regiões de Dirichlet podem assumir formas diversas, sendo
delimitadas por segmentos de geodésicas (em quantidade finita ou infinita) e de ∂D2 .
Definição 32. Uma região fundamental F para um grupo fuchsiano Γ é dita localmente finita se a
tesselação {T (F ) | T ∈ Γ} é localmente finita.
Ainda como consequência da propriedade de descontinuidade de um grupo fuchsiano, segue o

Teorema 57.
Teorema 57. [30] Uma região de Dirichlet é localmente finita.
Alguns pontos merecem destaque. Inicialmente, estabelecemos uma tesselação do espaço métrico
hiperbólico por regiões Dp (Γ) decorrentes da ação propriamente descontı́nua de isometrias (homeo-
morfismos conformes), portanto, formada por regiões hiperbolicamente iguais. Propriedades adicio-
nais decorrentes deste processo são apresentadas na Proposição 58.
Proposição 58. Seja Γ um grupo fuchsiano, p ∈ D2 que não é ponto fixo para qualquer Γ\{Id}, e
Dp (Γ) a região de Dirichlet associada.
1. Dado x ∈ ∂Dp (Γ), existe T ∈ Γ\{Id} tal que T (x) ∈ ∂Dp (Γ).
2. Dada uma aresta e ∈ Dp (Γ), existe uma única T ∈ Γ\{Id} tal que e = Dp (Γ) ∩ T (Dp (Γ)).
3. Temos que v é um vértice ordinário de Dp (Γ) se, e somente se, existem T, T ′ ∈ Γ\{Id} tais que
v = Dp (Γ) ∩ T (Dp (Γ)) ∩ T ′ (Dp (Γ)).
Obtemos da Proposição 58 (2)-(3) o processo de identificação de arestas para Dp (Γ). Como o

grupo Γ possui ação propriamente descontı́nua em D2 , sempre podemos determinar uma vizinhança
para p ∈ D̊p (Γ) isométrica a um aberto em D2 . Sempre que Dp (Γ) possuir um número finito de
arestas, podemos estender a métrica aos pontos da fronteira através de uma adequada definição dessa
na vizinhança desses pontos [28]. Tal extensão é realizada empregando-se o fato de que a cada
aresta e em Dp (Γ) podemos identificar unicamente uma outra e′ e um elemento T ∈ Γ\{Id} tal que
e = T (e′ ). Essa identificação induz uma relação de equivalência natural do conjunto de aresta, onde
cada classe de equivalência possui exatamente dois elementos.
Voltando a construção de superfı́cies geométricas, e agora sabendo que ∂Dp (Γ) é mapeado em
T (∂Dp (Γ)) para todo T ∈ Γ, e similarmente para o interior de Dp (Γ). Podemos definir uma relação
de equivalência em D2 , com classes de equivalência iguais as Γ-órbitas dos pontos de Dp (Γ). A
estrutura resultante é o espaço de identificação D2 /Γ com geometria herdada de D2 , onde a cada
ponto é associada uma Γ-órbita que contém, de maneira excludente, um ponto interior de Dp (Γ), dois
pontos em ∂Dp (Γ) ou vértices Γ-congruentes4 de Dp (Γ) (ciclo de vértices) .
Teorema 59. [30] Suponha Dp (Γ) é uma região de Dirichlet para Γ.
1. Sejam θ1 , θ2 , . . . , θt os ângulos internos de vértices Γ-congruentes de Dp (Γ). Seja m a ordem do

2π
estabilizador em Γ de um desses vértices. Então, θ1 + · · · + θt = m
;
2. Seja {Ti } o subconjunto de Γ constituı́do pelos elementos que identificam lados de Dp (Γ). Então
{Ti } é um conjunto de geradores para Γ.
O conceito de Γ-congruência de vértices expõe propriedades de Γ que transcendem uma região

fundamental especı́fica, revelando propriedades algébricas (e geométricas induzidas) dos elementos
elı́pticos de Γ. Inicialmente, a Γ-congruência determina uma relação de equivalência no conjunto de
vértices da região fundamental, onde as classes de equivalências correspondem aos ciclos de vértices.
Se u ∈ D2 é fixado por um elemento elı́ptico de S, então v = T (u) é fixado pelo elemento elı́ptico
conjugado T ST −1. Portanto, se um vértice de um ciclo é fixado por um elemento elı́ptico, todos
os demais vértices do ciclo são fixados for elementos elı́pticos conjugados. Tais ciclos são ditos
ciclos elı́pticos e os vértices vértices elı́pticos . Como uma região de Dirichlet Dp (Γ) é uma região
fundamental, então todo ponto w ∈ D2 fixado por um elemento elı́ptico S ′ de Γ pertence a fronteira
de T (Dp (Γ)) para algum T ∈ Γ. Assim, u = T −1 (w) pertence a fronteira de Dp (Γ) e é fixado por
um elemento elı́ptico S = T −1 S ′ T . Empregando o Teorema 51, a ordem do elemento S deve ser
4
Dois pontos p, q ∈ D2 são Γ-congruentes se existe T ∈ Γ tal que p = T (q).
finita, portanto, se um ponto possui um estabilizador não-trivial em Γ, este é um subgrupo cı́clico

finito maximal 5 de Γ. No outro sentido, todo subgrupo cı́clico finito maximal de Γ é o estabilizador
de um único ponto em D2 .
Teorema 60. [30] Há uma correspondência bijetiva entre os ciclos elı́pticos de Dp (Γ) e as classes
conjugadas de subgrupos cı́clicos finitos maximais não-triviais de Γ .
Definição 33. As ordens dos subgrupos cı́clicos finitos maximais não-conjugados de Γ são chamadas
perı́odos de Γ.
Colocados esses elementos iniciais quanto à relação entre propriedades algébricas de Γ e as pro-
priedades geométricas da tesselação associada, passaremos a verificar quais as consequências dessas
sobre a estrutura da superfı́cie hiperbólica associada.
Definição 34. Um grupo fuchsiano Γ é dito geometricamente finito se há uma região fundamental
convexa para Γ com número finito de lados.
Teorema 61. (Teorema de Siegel) Se Γ satisfaz µ(D2 /Γ) < ∞ então Γ é geometricamente finito.
Algumas denominações atribuı́das a um grupo fuchsiano refletem as propriedades topológicas in-

duzidas às superfı́cies obtidas pelo quociente D2 /Γ. Acima vimos como a propriedade algébrica da
tesselação influencia na cardinalidade dos subgrupos elı́pticos de Γ, agora veremos como a proprie-
dade algébrica dos elementos de Γ determina invariavelmente a propriedade topológica da superfı́cie
obtida a partir desse.
Definição 35. Um grupo fuchsiano Γ é dito co-compacto se o espaço quociente D2 /Γ é compacto.
Como apresentado no Teorema 62, a propriedade de co-compacticidade é um reflexo da estrutura

topológica de Dp (Γ), que por sua vez depende das propriedades algébricas de Γ. Podemos concluir
deste resultado que o espaço quociente D2 /Γ é compacto se, e somente se, a região Dp (Γ) é compacta.
Teorema 62. [30] Seja Γ um grupo fuchsiano com região de Dirichlet Dp (Γ).
1. Se Dp (Γ) é uma região compacta, então Γ não possui elementos parabólicos.
2. Se Dp (Γ) é uma região não-compacta, então o espaço quociente D2 /Γ não é compacto.
3. Se µ(Dp (Γ)) < ∞ mas Dp (Γ) é não-compacta, então Dp (Γ) possui pelo menos um vértice no
infinito.
5
Não há outro subgrupo cı́clico do qual ele seja subgrupo próprio.
Com relação a existência de elementos parabólicos em Γ, ainda temos.
Teorema 63. [30] Seja Γ um grupo fuchsiano com região não-compacta de Dirichlet Dp (Γ) satisfa-
zendo µ(Dp (Γ)) < ∞.
1. Cada vértice no infinito é o ponto fixo de uma transformação parabólica T ∈ Γ.
2. Se ξ é o ponto fixo de alguma transformação parabólica em Γ, então existe T ∈ Γ tal que T (ξ) ∈
∂Dp (Γ).
Nos próximos capı́tulos estaremos interessados em superfı́cies compactas, no Teorema 64 es-

tabelecemos a estrutura algébrica de Γ necessária e suficiente para nossa abordagem, obtida como
corolário dos Teorema 61, Teorema 62 e Teorema 63.
Teorema 64. [30] Um grupo fuchsiano Γ é co-compacto se, e somente se, µ(D2 /Γ) < ∞ e Γ não
possui elementos parabólicos.
Estabelecidos os elementos anteriores, consideremos F uma região fundamental compacta de Γ.

Portanto, pode ser demonstrado que F possui um número finito de lados, consequentemente com um
número finito de vértices e ciclos elı́pticos, com perı́odos m1 , m2 , . . . , mt associados a estes. Desta
forma, o espaço quociente D2 /Γ é uma superfı́cie compacta e orientada de gênero g , sendo esse
um invariante topológico da superfı́cie correspondendo ao número de “argolas” que compõem sua
representação gráfica. Neste caso, Γ possui assinatura (g; m1 , m2 , . . . , mt ).
Teorema 65. [30] Seja Γ um grupo fuchsiano com região fundamental compacta, possuindo assina-
tura (g; m1 , m2 , . . . , mt ). Então
t
2
X 1
µ(D /Γ) = 2π (2g − 2) + 1− .
i=1
m i
A implicação reversa do Teorema 65, atribuı́da a Poincaré, possibilita a verificação da existência

de uma dada região fundamental, especificada pelos seus perı́odos, associada a uma superfı́cie carac-
terizada pelo seu gênero.
Teorema 66. (Teorema de Poincaré) Se g ≥ 0, t ≥ 0 e mi ≥ 2 (1 ≤ i ≤ t) são inteiros satisfazendo
t
X 1
(2g − 2) + 1− > 0,
i=1
mi
então há um grupo fuchsiano com assinatura (g; m1, m2 , . . . , mt ).

v5
b
v6
b
b
v4
g3 g1
v7 b
g2
b v3
b
g4
v8 b
v2
b
v1
Figura 4.5: Tesselação {8, 4}, mostrando a identificação de arestas realizada pelos geradores.
Consideremos alguns dos conceitos apresentados através de um exemplo. Inicialmente, empre-

garemos a nomenclatura {p, q} para descrever uma tesselação formada por polı́gonos regulares com
p arestas, com vértices recobertos por q polı́gonos hiperbólicos idênticos. Na Figura 4.5 apresen-
tamos uma tesselação {8, 4}, onde destacamos os vértices vi e os geradores gi . Através de um
processo de projeção (empregando geradores) e reflexão (denotado por ∗) de arestas em torno de
vértices podemos determinar os ciclos de vértices. Como exemplo, seja s1 a aresta delimitada
pelos vértices v1 e v2 , considerando uma nomenclatura similar para as demais arestas, obtemos
g1 ∗ g3 1∗ g −1 4 ∗ g −1
(v1 , s1 ) −→ (v6 , s5 ) −→ (v6 , s6 ) −→ (v5 , s4 ) −→ (v5 , s5 ) −→ (v2 , s1 ) −→ (v2 , s2 ) −→ (v1 , s8 ),
resultando no ciclo de vértices {v1 , v6 , v5 , v2 }. Nesse processo F é rotacionado em torno de v1 , por
geradores de Γ, até retornar a sua posição original. Portanto, a sequência de transformações realiza-
das é igual a identidade, ou seja, g4−1 g1−1 g3 g1 = Id. De forma similar, podemos obter os ciclos de
vértices {v7 , v4 } e {v8 , v3 }, contudo a sequência de geradores resulta em um elemento elı́ptico de Γ
ao invés de uma relação equivalente a identidade.
Na Figura 4.6 enfatizamos a ação transitiva dos geradores de Γ sobre a tesselação, com a cor-
respondente translação de uma região fundamental indicada. Esses rótulos não foram atribuı́dos
aleatoriamente, eles representam uma “possı́vel” sequência de ações dos geradores sobre D2 , que
resulta no deslocamento de uma região da periferia para a região central de D. Observamos que todas
essas ações não alteram a percepção do espaço de alguém que encontra-se nele, já que se trata de
isometrias. Considerando a região g2 g3−1F transladada, observamos que a sequência de geradores
que empregamos para desloca-la para o centro do disco é igual ao inverso (algébrico) da sequência de
g3 g1 F
g1 F
g1 ḡ4 F g3 F
g2 ḡ3 F
ḡ3 F ḡ2
g2 F
ḡ3 g2 F
g3
F g4 ḡ2 F
ḡ2 F
g4 F
ḡ2 g4 F
g4 ḡ1 F
ḡ4 F
ḡ1 F
ḡ4 ḡ1 F
Figura 4.6: Tesselação {8, 4}, mostrando ação transitiva de Γ, onde ḡ = g −1 .
geradores que antecede o rótulo, ou seja, g3 g2−1. No entanto, há infinitas possibilidades para realizar-
mos essa translação, contudo a que exemplificamos é a mı́nima, em termos do número de geradores
empregados. Como observação adicional, percebemos a redução exponencial da área euclidiana das
imagens de F quando essas aproximam-se da fronteira de D2 . Esse fenômeno é essencial no processo
de codificação aritmética do fluxo geodésico, juntamente com o fato das topologias induzidas pelas
métricas euclidiana e hiperbólica serem a mesma [30]. Estes conceitos ajudam no entendimento dos
métodos de codificação aritmético e geométrico apresentados no Capı́tulo 5.
Capı́tulo 5
Códigos Geodésicos
O Fluxo geodésico sobre uma variedades riemanniana de curvatura seccional negativa está entre os
exemplos mais difundidos de comportamento caótico de um sistema dinâmico, para o qual a dinâmica
simbólica está entre as ferramentas mais importantes para o estudo [10, 34, 35]. Como esse exemplo
envolve um objeto matemático, dispomos para sua análise de ferramentas e métodos analı́ticos de
natureza algébrica, geométrica e topológica que nos permitem inferir sobre sua estrutura (elementos
estáticos, e.g. topologia) e comportamento (elementos dinâmicos, e.g. fluxo geodésico). Acredita-
mos que as variedades riemannianas possam servir de arquétipo para o desenvolvimento de métodos
analı́ticos para o estudo e aplicação de sistemas dinâmicos com comportamento caótico. Tendo como
interesse principal aqueles cujas caracterı́sticas fı́sicas e comportamento possam ser aplicados à sis-
temas de comunicação [36, 37, 38].
Devido a caracterı́sticas como custo, confiabilidade e flexibilidade, sistemas de eventos discretos

(entre os quais os digitais) despontam entre os mais importantes pela massiva aplicação tecnológica
que se faz desses. Para identifica-los a variedades riemannianas, precisamos determinar um método de
relacionar a natureza discreta destes sistemas com o comportamento contı́nuo das variedades. Como
meio para efetivar essa conexão, propomos o emprego de códigos do fluxo geodésico. Nesse capı́tulo
apresentamos a motivação e objetivos para o estudo destes códigos. Comentamos as principais clas-
ses de códigos propostos na literatura (geométricos e aritmético). Apresentamos e relacionamos tais
métodos empregando a abordagem apresentada em [8]. Como um caso particular, introduzimos o
código aritmético apresentado em [9], baseado em uma extensão do particionamento empregado em
processos generalizados de codificação aritmética do fluxo geodésico em D2 , aplicando-os para o
“estudo de caso” onde determinamos as propriedades das sequências código do fluxo geodésico de
uma superfı́cie hiperbólica obtida a partir da tesselação {8g − 4, 4}. Na exposição que segue, empre-
garemos ā para representar o inverso de um elemento a de um grupo fuchsiano, ou seja, ā = a−1 .
105
106 Códigos Geodésicos
5.1 Conceitos Preliminares
A geometria riemanniana nos mune com ferramentas que permite-nos estender os conceitos de dife-
renciação, tı́picos de espaços euclidianos, para estruturas denominadas de variedades contı́nuas. As
superfı́cies hiperbólicas que abordamos pertencem a esse conjunto, sendo variedades bidimensionais
com curvatura negativa. A estrutura adicionada às variedades riemannianas que permite essa extensão
é a de fibrado tangente, sendo o espaço natural de se trabalhar quando tratamos de questões que
envolvam “posição” e “velocidade”.
Aqui introduziremos a ideia que possibilite-nos apreciar o conceito de fibrado tangente. Inici-
almente, consideremos um ponto p ∈ M, onde M é uma superfı́cie riemanniana diferenciável ou
variedade diferenciável bidimensional1[32]. Uma parametrização em torno de p é definido como
o par (Uα , xα ), onde Uα ⊂ R2 é um aberto e xα uma aplicação biunı́voca de Uα sobre M, ou
seja, xα : Uα ⊂ R2 → M, satisfazendo p ∈ xα (Uα ). Dada qualquer outra parametrização
xβ : Uβ ⊂ R2 → M em torno de p, para o conjunto xα (Uα ) ∩ xβ (Uβ ) = W 6= ∅ em M, temos
que xα −1 (W ) e xβ −1 (W ) são abertos em R2 e a aplicação xβ −1 ◦ xα é um difeomorfimo2. O par
(Uα , xα ) também é chamado de um sistema de coordenadas de M em p, com xα (Uα ) sendo uma
vizinhança coordenada em p. Observadas algumas condições quanto a extensão por uma famı́lia
{(Uα , xα )} de parametrizações satisfazendo
[
xα (Uα ) = M,
α
esta é dita uma estrutura diferenciável em M. Consideremos uma curva α : (−ǫ, ǫ) → M dife-
renciável em M. Suponhamos que α(0) = p ∈ M, e seja D o conjunto das funções de M dife-
renciáveis em p. O vetor tangente à curva α em t = 0 é a função α′ (0) : D → R dada por
d(f ◦ α)
α′ (0)(f ) = , f ∈ D.
dt t=0
Um vetor tangente em p é o vetor tangente em t = 0 de alguma curva α : (−ǫ, ǫ) → M com

α(0) = p. O conjunto de todos estes vetores tangentes é denotado por Tp M, chamado de espaço
tangente. Dada uma parametrização x : U → M, podemos obter uma “projeção” de α sobre R2 por
x−1 ◦α(t) = x1 (t), x2 (t) , permitindo-nos definir a relação x(0) = p. Empregando esses elementos,

1
Poderı́amos considerar uma dimensão qualquer, mas não precisamos desse grau de generalidade.
2
Um homeomorfismo diferenciável, função bijetiva e contı́nuo com inversa também contı́nua, ambas diferenciáveis.
5.1 Conceitos Preliminares 107
η
us+t
F
t
us
Figura 5.1: Fluxo geodésico sobre D2 .
pode-se demonstrar que a função α′ é dada por (5.1).

′ ∂ ∂
α (0) = x′1 (0) + x′2 (0) , (5.1)
∂x1 0 ∂x2 0
∂ ∂

onde ∂x1 0
e são os vetores tangentes em p às curvas coordenadas x1 → x(x1 , 0) e x2 →
∂x2 0
x(0, x2 ), respectivamente. Portanto, ∂x∂ 1 0 , ∂x∂ 2 0 forma uma base em Tp M. Dada uma variedade

diferenciável o conjunto T M = {(p, v)|p ∈ M, v ∈ Tp M} é denominado fibrado tangente de

M, sendo formado por todas as associações possı́veis de pontos sobre M aos respectivos espaços
tangentes Tp M. O fibrado tangente é dito unitário quando restringimo-o ao conjunto de vetores
tangentes com norma unitária, com relação a norma induzida pela métrica riemanniana da superfı́cie
M.
Seja SD2 o fibrado tangente unitário de D2 . O fluxo geodésico {ϕ̃t } sobre D2 é definido como a
ação de R sobre o fibrado tangente unitário SD2 cujo locus gerado pelo deslocamento com velocidade
unitária de um vetor tangente unitário entre os pontos p, q ∈ D2 é o segmento de geodésica entre p
e q, ou seja, é a curva de menor comprimento entre p e q. Um exemplo do fluxo de um elemento
do fibrado em D2 é apresentada na Figura 5.1, onde o vetor ϕ̃s (u) = us percorre o segmento de
geodésica interno a região F em um intervalo hiperbólico t, resultando no vetor ϕ̃s+t (u) = us+t .
Consideraremos M como uma superfı́cie bem comportada, pelo menos em quase todos os seus
pontos3. Nesse caso, considerando que M = D2 /Γ, o grupo fuchsiano Γ induz uma projeção na-
3
Podendo conter pontos ausentes, decorrentes de vértices de F fixados por elementos elı́pticos de Γ.
7
8 6
g1
9 5
F
10 4
γ1
γ2 6
11 3 5 8 7
9 3 1
12 2 11
1 10 12 γ4
4 2
M γ3
Figura 5.2: Região fundamental. Figura 5.3: Curvas fechadas em M.
tural (contı́nua e aberta) π : D2 → D2 /Γ, sendo os pontos de M as Γ-órbitas de pontos de D2 4 .

Ainda podemos estender π, projetando SD2 em SM. Além disso, o bordo ∂F da região fundamen-
tal F é projetado em curvas fechadas γi em M. Na Figura 5.3 mostramos as curvas γi decorrentes
da projeção de ∂F sobre M, com F e os respectivas identificações de arrestas gi apresentadas na
Figura 5.2. Naturalmente, o fluxo geodésico em SD2 possui seu equivalente em SM pela projeção
natural. Contudo, esse fluxo geodésico é contı́nuo, como comentamos, ele é parametrizado por R,
decorrendo da ação desse sobre SD2 . Assim, com o processo de codificação do fluxo geodésico pre-
cisamos estabelecer um método de “discretização”, através do qual possamos defini-lo como ação de
Z sobre SM e não mais de R sobre SM. Em seguida devemos “quantificar” a sequência discreta,
de forma que possamos representa-lo por sequências bi-infinitas sobre um alfabeto finito. Por fim,
o sistema dinâmico simbólico resultante deve ser completo e a dinâmica no espaço de sequências
bi-infinitas deve refletir a dinâmica do fluxo geodésico.
O processo de discretização é obtido pela determinação de uma seção transversal para o fluxo
SM, sendo essa um subconjunto de SM que é interceptada pelo fluxo geodésico indefinidamente,
ou seja, para valores arbitrariamente grandes do parâmetro R (positivos e negativos). Referindo-nos
à Figura 5.3, a seção transversal C é formada por elementos (p, v) ∈ SM, onde p é um ponto
pertencente a uma das curvas fechadas γi e o vetor unitário v não é tangente a γi . Quando o par (p, v)
for mapeado na região F pelo inverso π −1 , então p será mapeado em um ponto p′ ∈ ∂F e v em um
vetor v ′ sobre p′ que aponta para fora de F , no caso da Figura 5.1 o vetor us+t é determinado pela
restrição de π −1 à seção transversal [39, 9, 34]. Agora nosso fluxo geodésico contı́nuo é reduzido
a uma sequência de eventos discretos com dinâmica determinada pelo mapa da seção transversal,
representado por TC : C → C tal que TC (π(us+t)) = π(u′′ ), fazendo referência à Figura 5.4. Os
4
Com essa interpretação M recebe a denominação de orbifold, ou espaço das órbitas.
5.1 Conceitos Preliminares 109
g3 g1 F
g1 F
g1 ḡ4 F g3 F
u′′ g2 ḡ3 F
ḡ3 F
us+t
g2 F
ḡ3 g2 F
u′
F g4 ḡ2 F
ḡ2 F g4 F
us
ḡ2 g4 F
g4 ḡ1 F
ḡ4 F
ḡ1 F
ḡ4 ḡ1 F
Figura 5.4: Codificação do fluxo geodésico.
vetores π(us+t ) e π(u′′) são elementos de C interceptados sucessivamente pelo fluxo geodésico em
SM. Em D2 , temos que ḡ2 us+t = u′ , sendo que u′ define unicamente uma geodésica e, portanto, o
vetor u′′ .
Com o emprego da seção transversal, temos uma forma de “capturar” a dinâmica do nosso fluxo
geodésico através de um sistema discreto de eventos. Contudo, o valor assumido em cada instante de
tempo ainda é não enumerável. Nosso próximo passo consiste em determinar um particionamento fi-
nito de C (que induzirá nossa quantização) que, apesar da perda de detalhamento, nos permitirá inferir
sobre as caracterı́sticas do fluxo geodésico através do locus (ou geodésica) gerado pelo deslocamento
dos vetores em SD2 ou SM. A descrição do processo de codificação fica mais clara quando consi-
deramos o fluxo em SD2 . O código é determinado pela sequência de sı́mbolos definida pelo mapa
de retorno, especificado pelo gerador de Γ cuja ação sobre (p, v) ∈ SD2 , onde p ∈ ∂F e v aponta
para fora de F , é o elemento (p′ , v ′ ) com p′ ∈ SD2 e v ′ apontando para dentro de F . Referindo-nos
à Figura 5.4, quando a geodésica definida por (ps , us ) intercepta ∂F em (ps+t , us+t), a ação de ḡ2
sobre SD2 e D2 gera as translações (ps+t , us+t ) → (p′ , u′) e g2 F → F , respectivamente. Neste caso
g2 é armazenado como um sı́mbolo de nossa sequência, e a operação é repetida para a geração dos
sı́mbolos subsequentes.
Esse processo de codificação é conhecido como codificação geométrica (método de codificação
de Koebe-Morse), possuindo estreita relação com a geometria da região fundamental e superfı́cie
associada. O processo de codificação também pode ser realizado de forma aritmética (método de
codificação de Artin), empregando métodos generalizados de expansão dos pontos terminais da
P1 P2
ā a b̄ b
Figura 5.5: Esfera com três buracos.
geodésica (ou pontos limites da geodésica sobre ∂D2 ), de forma similar a expansões n-árias e em
frações contı́nuas, essa última relacionada a processos de codificação do fluxo geodésico em H2
empregando a superfı́cie modular [35, 39]. Na próxima seção descreveremos esses processos de
codificação para uma superfı́cie em particular, cujas peculiaridades evidenciem propriedades e con-
ceitos necessários para posterior apresentação do método geral.
5.2 Códigos de Koebe-Morse e Artin: Estudo de caso

Peculiaridades e relações entre os métodos de codificação de Koebe-Morse e Artin tornam-se mais
claras quando ressaltadas por um caso ilustrativo. Este é o papel exercido pela esfera com três bu-
racos apresentada na Figura 5.5, indicada aqui como a superfı́cie M. A estrutura topológica desta
superfı́cie, juntamente com as propriedades da cobertura associada em D2 , exemplifica os métodos e
os elementos conceituais envolvidos no processo. Como particularidade desse caso, os métodos de
codificação de Koebe-Morse e Artin coincidem, o que não é válido para o caso geral, abordado na
Seção 5.3. O método que esse exemplo procura evidenciar, é a representação do fluxo geodésico em
SM (associado às sequências cortantes, relacionadas a topologia da superfı́cie) através de um fluxo
especial sobre um ssf (relacionado ao processo de codificação aritmético).
Consideremos M∞ uma superfı́cie hiperbólica completa com três prolongamentos infinitos (ad
infinitum) e M a parte compacta de M∞ , delimitada pelas geodésicas fechadas unicamente determi-
nadas que isolam M dos prolongamentos. Qualquer geodésica que cortar uma destas curvas fechadas
perde-se no infinito através do prolongamento e, portanto, não retornam para a região compacta M.
Cortando M ao longo das linhas perpendiculares ao bordo P1 e P2 que conectam uma das curvas
fechadas as outras duas, obtêm-se a cobertura de M em D2 apresentada na Figura 5.6. Denotamos
5.2 Códigos de Koebe-Morse e Artin: Estudo de caso 111
R∞
a
ā
R∞ ā a R b b̄ R∞
b̄
b̄
b
R∞
Figura 5.6: Cobertura de M em D2 .
por π o homeomorfismo D2 → M∞ , que também pode ser interpretado como uma projeção.
A região fechada R na Figura 5.6, que compõe a cobertura de M, é prolongada para a região
infinita R∞ que é projetada em M∞ através de π. Sem comprometimento da generalidade da análise,
podemos supor que 0 ∈ R. As linhas Pi são prolongadas para as linhas P̃i , que formam os lados da
região R∞ e são identificadas por isometrias a, b de D2 . Pode-se observar que o grupo Fuchsiano Γ
associado a R∞ não possui elementos elı́pticos, logo Γ é um grupo livre e pode ser presentado por
ha, b| i. As cópias de R que lhe são adjacentes são da forma eR, onde e ∈ Γ0 = {a, ā, b, b̄}. O lado
s comum a R e eR é rotulado por e no lado de eR, no lado de R ele recebe o rótulo ē. De forma
equivalente, o lado de s interior a R é rotulado pela isometria que o mapeia em outro lado de R.
Essa rotulação é estendida por translação através da aplicação de Γ sobre R∞ para a tesselação de D2
constituı́da pelas imagens de R∞ , como também induz uma rotulação nas linhas orientadas P1 e P2
sobre M.
5.2.1 O método de codificação de Koebe-Morse

Qualquer geodésica orientada γ em M intercepta repetidamente as linhas Pi . Como as linhas Pi
possuem um rótulo para cada um dos seus lados, pode-se atribuir uma orientação à intersecção. Re-
ferindo a Figura 5.5, a geodésica pode interceptar a linha P1 entrando no lado ā e saindo no lado
a, ou entrando no lado a e saindo no lado ā. Desta forma, à geodésica γ é associada a sequência
. . . e0 e1 e2 . . . , ei ∈ Γ0 , de rótulos dos lados das linhas Pi nos quais a geodésica saı́, na ordem em que
esse processo dinâmico ocorre. Estabelecendo-se e0 como a referência, sendo este o rótulo exterior
ao lado de R através do qual γ sai, entrando na região e0 R. De forma geral, ei é o rótulo exterior
ao lado de e0 . . . ei−1 R através do qual γ sai, entrando na região e0 . . . ei−1 ei R. Essa é a sequência
cortante de γ. Portanto, quando analisado a partir da cobertura universal U ⊆ D2 de M, se um
arco direcionado α em U passa pela região R2 a partir da região R1 , possuindo sequência cortante
e1 . . . en , então R2 = e1 . . . en R1 . A sequência cortante de γ é infinita se, e somente se, γ está contida
em M, implicando que esta nunca intercepta ∂M. Pelo processo de construção, nota-se que em uma
sequência cortante não há fatores do tipo eē, e ∈ Γ0 , caso contrário γ interceptaria Pi duas vezes
seguidas em direções opostas, o que é impossı́vel. Sequências onde tais fatores não ocorrem são ditas
reduzidas.
5.2.2 O método de expansão do bordo
Associado ao método de codificação de Artin, este método requer a definição do processo de expansão
do bordo ∂D2 associado ao grupo Fuchsiano Γ. O que é feito para o caso particular de um toro
puncionado em [40]. Segue uma descrição similar, mas para o caso da esfera com três buracos. A
curva C(e) corresponde ao lado de R∞ cujo rótulo exterior é e, e ∈ Γ0 , sendo A(e) o arco sobre ∂D2
definido por C(e) associado ao semi-plano hiperbólico He (R∞ ) oposto ao qual encontra-se a região
R∞ . Define-se o mapeamento f : A → ∂D2 , f |A(e) (x) = ēx, onde A = {A(e) : e ∈ Γ0 } é o
S
domı́nio de f . Segue desta definição e das propriedades da cobertura U de M em D2 que qualquer

ponto ξ ∈ ∂D2 possui expansão finita ou infinita e0 e1 . . . , ei ∈ Γ0 , definido por f n (ξ) ∈ A(en ), n ≥
0, onde a sequência finda em en se, e somente se, f n (ξ) ∈ A mas f n+1 (ξ) ∈
/ A.
Como consequência das propriedades de Γ, obtêm-se que f (A(e)) ∩ A(ē) = ∅ para todo e ∈ Γ0 ,
do que segue que uma sequência obtida pelo método de expansão do bordo é reduzida. Por outro
lado, qualquer sequência reduzida e0 e1 . . . ocorre como a órbita de um ponto ∞ −n
T
n=1 f (A(en )), com
interseção não vazia, dado que f (A(e)) ⊃ A(e′ ) sempre que e′ 6= ē.
Para entendermos melhor a relação entre o método de codificação de Koebe-Morse e o de Artin,
para o caso particular da esfera com três buracos, analisemos as sequências código obtidas para um
arco de geodésica β conectando o ponto P ∈ R a ξ ∈ A. Seja e0 e1 . . . a sequência obtida pelo método
de Koebe-Morse e ξ0 ξ1 . . . pelo método de Artin aplicado ao ponto ξ. Inicialmente observa-se que β
deixa R através de C(ξ0 ), portanto ξ0 = e0 . Se considerarmos que ξi = ei , i ≤ n, então é possı́vel
provar por indução que os dois métodos geram a mesma sequência. Tomando a (n + 2)-ésima região
e0 e1 . . . en R que β intercepta, definido-se g = e0 e1 . . . en então ḡβ ∩ R 6= ∅, e a sequência cortante
de ḡβ a partir do ponto onde esta curva deixa R é en+1 en+2 . . .. Analisando pelo método de expansão
do bordo, têm-se que f i ξ ∈ A(ei ), i ≤ n, e portanto ḡξ = f n+1 (ξ), do que segue que f n+1(ξ) possui
expansão ξn+1 ξn+2 . . .. Ao aplicar-se o argumento original a ḡβ e ḡξ obtêm-se que en+1 = ξn+1 , o
que estabelece [8, Lema 2.1]. Este resultado nos diz que para o caso da esfera com três buracos a
sequência obtida por expansão do bordo para ξ é igual a sequência cortante para β. Decorre deste
fato que as conclusões decorrentes de um método podem ser estendidas para o outro, como será visto,
isto permite representar o fluxo geodésico em M associado ao conjunto de sequências cortantes, com
o ssf obtido pelo método de expansão do bordo.
Inicialmente, observamos que uma geodésica estende-se ao infinito, logo as geodésicas, que po-
dem ser identificadas unicamente através do processo de expansão do bordo, são aquelas que têm
os pontos limites no conjunto ∞ −n
S
n=0 f A. Pois, dada uma geodésica direcionada β, podemos de-
terminar unicamente a expansão dos seus pontos inicial e terminal, portanto determinamos a própria
geodésica. No entanto, tomando ξ como um ponto terminal de β e supondo que β∩R 6= ∅, caso ξ pos-
sua expansão do bordo infinita, ou seja, ξ ∈ ∞ −n
S
n=0 f A, segue do parágrafo acima que a sequência
cortante associada a β também é infinita, implicando que π(β) está integralmente contida na região
compacta M de M∞ e, portanto, mantem-se a uma distância limitada da órbita Γ0 do ponto 0 ∈ D2 ,
assim β converge para um ponto do conjunto limite Λ de Γ, segue que ∞ −n
S
n=0 f A ⊆ Λ. Além disso,
como Λ ⊂ A, se ξ ∈ Λ então f n ξ ∈ ΓΛ = Λ ⊂ A para todo n, uma vez que Λ é Γ-invariante. Por-
tanto, ξ ∈ ∞ −n
A. Fica assim estabelecido o resultado [8, Lema 2.2], a saber, Λ = ∞ −n
T T
n=0 f n=0 f A.
Isto permite estabelecer uma bijeção entre o espaço das sequências reduzidas infinitas Σ+ em Γ0 e o
conjunto limite de Γ, ou seja, há uma bijeção p+ : Σ+ → Λ que associa a cada ponto e0 e1 . . . ∈ Σ+ o
ponto ∞ −1
T
n=1 (e0 · · · en ) A(en+1 ). Como caracterı́stica adicional, as sequências obtidas por expansão
do bordo ou as sequências cortantes só possuem como restrição os fatores ef onde f = ē. Logo, o
conjunto de sequências Σ+ pode ser especificado por uma matriz adjacente M = (mef ), e, f ∈ Γ0 ,
com mef = 0 se f = ē e mef = 1 caso contrário. Isto implica que Σ+ é igual ao conjunto de
sequências (ei )∞
i=0 satisfazendo mei ei+1 = 1 para todo i ≥ 0 e, portanto, é um SF T (possui conjunto
de proibições irredutı́veis finito).
5.2.3 Representação do fluxo geodésico
O processo de representação de geodésica pelas sequências cortantes é claramente recorrente. As

geodésicas são codificadas pelas sequências ordenadas de sı́mbolos que são determinados pela in-
terseção recorrente da geodésica com a seção transversal especificada sobre a superfı́cie. Portanto, o
processo de codificação é gerado de forma recursiva baseado em um fenômeno de recorrência, além
disso só se aplica aos objetos que interceptam infinitamente a seção transversal. Estas propriedades
são um reflexo do objeto codificado, no caso, o fluxo geodésico. No entanto, o locus associado ao
fluxo geodésico são as geodésicas, consequentemente especificar um procedimento de codificação
para o primeiro se estende ao segundo. E as propriedades dinâmicas do fluxo geodésico terão seu
reflexo nas geodésicas associadas e nas sequências código geradas.
Dados ξ, η ∈ ∂D2 , ξ 6= η, define-se γ = γ(ξ, η) como a geodésica orientada conectando ξ a η. Das

observações realizadas nos parágrafos acima, se γ ⊂ ΓR então os pontos sobre γ permanecem a uma
distância limitada de Γ0, consequentemente ξ, η ∈ Λ. Por outro lado, se supusermos que ξ, η ∈ Λ
S
teremos necessariamente que γ = g∈Γ (γ ∩ gR∞ ), portanto segue da Γ-invariância do conjunto Λ
que ao provar-se a relação γ ∩ R∞ ⊂ γ ∩ R fica estabelecido que γ está limitada a região compacta M
de M∞ . Ressaltamos que a Γ-invariância do conjunto Λ implica que a relação apresentada independe
da escolha da região R escolhida como referência. Referenciando a Figura 5.6, os arcos em ∂D2
delimitados pelas geodésicas cujas imagens por π formam o bordo de M não compõem o conjunto
Λ, consequentemente se ξ, η ∈ Λ têm-se necessariamente que γ ∩ R∞ ⊂ γ ∩ R. Um vetor unitário u
pertencente ao subconjunto recorrente (do inglês, non-wandering set) do fibrado associado ao fluxo
geodésico φt em M∞ se, e somente se, φt (u) retorna indefinidamente a uma distância limitada de
um vetor unitário fixo localizado em π(0). O que acontece se, e somente se, a geodésica definida
por u mantém-se a uma distância limitada de Γ0, e portanto possui pontos terminais no conjunto
Λ. Como sı́ntese destas observações, uma geodésica γ(ξ, η) possui pontos terminais ξ, η ∈ Λ se, e
somente se, γ ∈ ΓR, e além disso o conjunto recorrente do fibrado associado ao fluxo geodésico em
M corresponde ao conjunto de vetores unitários direcionados ao longo destas geodésicas. Fica assim
estabelecido o resultado [8, Lema 2.5].
Seja Σ o conjunto de sequências bi-infinitas reduzidas em Γ0 , com elementos descritos por . . . f1 f0

e0 e1 . . . , ei , fi ∈ Γ0 , onde e0 é interpretado como coordenada inicial. Podemos dispor de uma
representação análoga para geodésicas com pontos terminais em Λ, a saber, dados ξ, η ∈ Λ com
expansão do bordo ξ = ξ0 ξ1 . . . e η = η0 η1 . . ., escrevemos ξ ∗ η = . . . ξ¯1 ξ¯0 η0 η1 . . .. Definindo-se
A = {γ = γ(ξ, η) : ξ, η ∈ Λ and ξ ∗ η ∈ Σ},

R = {γ = γ(ξ, η) : ξ, η ∈ Λ and γ ∩ R 6= ∅}.
Fica claramente determinada uma bijeção p : Σ → A que associa a sequência . . . f1 f0 e0 e1 . . . a

geodésica γ = γ(p+ (f¯0 f¯1 . . .), p+ (e0 e1 . . .)). Como realizado acima, podemos descrever Σ através de
uma matriz adjacente, sendo Σ um SF T com mapa deslocamento σ : Σ → Σ que induz naturalmente
um mapa deslocamento, também denotado por σ, sobre A. Ao conjunto R também está associado
um mapeamento natural τ : R → R, dado por τ (γ) = ē0 γ, onde e0 é o primeiro termo da sequência
cortante de γ iniciando onde γ deixa a região R. Estas observações constituem o primeiro passo para
estabelecer a relação entre os métodos de codificação de Koebe-Morse e Artin para o caso da esfera
com três furos.
Observamos inicialmente que dados ξ, η ∈ Λ tal que ξ 6= η, a geodésica γ(ξ, η) pertence a A

se, e somente se, ξ0 6= η0 , uma vez que a sequências bi-infinita associada a esta geodésica deve
ser reduzida. Para o caso ξ0 = η0 , a geodésica γ(ξ, η) estaria contida integralmente no semi-plano
hiperbólico limitado por C(ξ0 ) no lado aposto àquele onde encontra-se a região R, assim γ ∈
/ R. Se
ξ0 6= η0 então γ ∩ R∞ 6= ∅, implicando que γ ∩ R 6= ∅ e, portanto, γ ∈ R. Fica assim estabelecido o
resultado [8, Teorema I0 ], a saber, A = R.
Seguindo com a determinação da relação entre estas estruturas, consideremos ξ ′ ∗ η ′ = σ(ξ ∗ η),
do que segue que η ′ = η1 η2 . . . e ξ ′ = η̄0 ξ0 ξ1 . . .. Como f (η) = η̄0 (η) possui expansão η1 η2 . . . e
f (ξ ′) = η0 (ξ ′ ) possui expansão ξ0 ξ1 . . ., têm-se que η ′ = η̄0 (η) e η0 (ξ ′ ) = ξ. Portanto, σ(ξ ∗ η)
corresponde a geodésica η̄0 (γ). Como as sequências cortantes e aquelas obtidas por expansão do
bordo são iguais, então e0 = η0 e, portanto, τ (γ) = ē0 γ = σ(γ). Fica assim estabelecido o resultado
[8, Teorema II0 ], a saber, τ = σ.
5.2.4 Aplicando os conceitos
Um fluxo geodésico φt corresponde a um fluxo sobre o fibrado SM de M. Neste contexto, o conjunto

recorrente V ⊂ SM é invariante, e a análise da ação do fluxo sobre este revela as propriedades de
ergodicidade da dinâmica, que constituem aquelas de maior interesse. Aplicando os resultados acima,
é possı́vel determinar uma representação do fluxo ψt = φt |V através de um ssf, em outras palavras,
uma representação simbólica do fluxo.
Referindo-nos a Figura 5.5, seja W o subconjunto de vetores de V sobre pontos nas linhas Pi .
Como vetores na direção de Pi não pertencem a V , então podemos empregar W como uma seção
transversal ao fluxo ψt . Como por um ponto z ∈ D2 , na direção de um vetor unitário u ∈ SD2 sobre
z passa uma única geodésica, podemos identificar os conjuntos R e W . Identificamos γ ∈ R com
a projeção em M do vetor unitário u(γ) tangente a γ no ponto onde γ entre em R. Dos resultados
apresentados, temos que R = A e que há uma bijeção de A com Σ, do que segue a identificação entre
os conjuntos W e Σ. No entanto, este mapeamento é mais que uma bijeção, podendo-se demonstrar
que ele respeita a dinâmica do sistema.
O mapa de retorno P : W → W pode ser estendido para o mapa P̂ sobre SD2 , de forma que
P̂ (u(γ)) = v(γ) onde v(γ) é o ponto onde γ ∈ R deixa a região R. O tempo transcorrido para
retornar para W é h(γ), que representa a distância hiperbólica de γ ∩ R. Considerando o mapa
já definido τ : R → R, dado por τ (γ) = ḡγ sempre que γ deixa a região R através de C(g).
Então, o vetor unitário tangente a geodésica ḡγ no ponto em que esta adentra a região R é ḡv(γ).
Agora, projetando estes vetores em W e realizando a identificação de W com R, obtêm-se a relação
P (γ) = τ (γ). Sabendo que τ = σ, concluı́mos que o sistema (W, P ) é conjugado ao sistema (Σ, σ).
Além disso, o fluxo determinado sobre (Σ, σ) considerando-se a função deslocamento h é conjugado
ao fluxo geodésico (V, ψ). Sendo o primeiro uma representação simples do segundo.
Acima apresentamos o procedimento para determinação de uma representação simbólica simples

para o fluxo geodésico sobre uma superfı́cie. No entanto a análise foi restringida para o caso particular
de uma esfera com três furos. De forma análogo, é possı́vel determinar representações tão simples
quanto a obtida acima para casos mais gerais, ou seja, representar o fluxo geodésico através de um
ssf. Contudo, uma serie de detalhes adicionais devem ser considerados. É sobre a generalização do
resultado acima que concentra-se a maior parte do material apresentado nas próximas seções.
5.3 Codificação do Fluxo Geodésico

Apresentaremos os métodos de codificação do fluxo geodésico geométrico e aritmético, a aborda-
gem é geral e visa estabelecer os elementos que nos permita relaciona-los. Um aspecto a ressaltar
diz respeito a necessidade de dois métodos de codificação de natureza distinta, como também qual é
o objetivo dessa relação. Na Seção 5.2 pudemos associar biunivocamente a qualquer sequência bi-
infinita reduzida sobre os geradores de Γ uma geodésica em M. Portanto, a descrição do código do
fluxo geodésico fica caracterizado simplesmente pelos pares proibidos ḡg, g ∈ Γ0 , como decorrência
do grupo Γ ser livre. O exemplo da esfera com três buracos é um contraponto à complexidade do caso
geral, quando são consideradas regiões fundamentais com vértices em D2 . Para termos uma pers-
pectiva do grau dessa complexidade, mesmo para o grupo Γ = P SL(2, Z) com região fundamental
tı́pica
1
F = {z ∈ H2 | |z| ≥ 1, |Re(z)| ≤ },
2
o ssf obtido pelo método de Koebe-Morse não é regular, não sendo possı́vel representa-lo através de
um grafo ou autômato [41]. A expectativa com relação ao caso geral não é diferente [35].
A intensão inicial de associarmos às sequências código uma topologia possui na constatação
acima um primeiro obstáculo. Para contorná-lo empregaremos os códigos aritméticos. Ao contrário
dos geométricos, o código obtido com o método de codificação aritmética é um fator de um SFT,
logo é um ssr. A despeito da possı́vel complexidade para determinação de uma representação para
esse ssr (tratado no próximo capı́tulo), comparando-o com o ssf gerado pelo código geométrico, po-
demos especificar meios de representar parcialmente esse último, ou seja, um subconjunto do código
geométrico. Para relacionar e descrever esses métodos de codificação, empregaremos a abordagem
apresentada em [8, 39].
5.3.1 Determinando uma região fundamental apropriada

Ao considerarmos na Seção 5.2 uma região fundamental R sem vértices em D2 , foi possı́vel relaci-
onar os códigos geométrico e algébrico do fluxo geodésico através de uma identidade, ou seja, os
5.3 Codificação do Fluxo Geodésico 117
códigos coincidem e são iguais ao conjunto de sequências reduzidas sobre os geradores do grupo
fuchsiano associado. O mesmo não é observado no caso geral. Pelo teorema de Poincaré, a presença
de vértices de F em D2 introduz relações entre os geradores de Γ que implicam na não observância
de propriedades essenciais, listadas abaixo.
• Não é mais verdadeiro que qualquer geodésica conectando um ponto em F a um ponto em A(g)
possui sequência cortante iniciando com g.
• Dois arcos A(g), g ∈ ΓF , podem possuir interseção não vazia.
Como consequência, o conjunto de sequências cortantes já não é mais um SFT. Podemos minorar
as dificuldades surgidas se considerarmos regiões fundamentais com a propriedade de cantos pares,
ou seja, as arestas de F podem ser estendidas para geodésicas completas em D2 que continuam a
pertencer a tesselação T de D2 obtida por Γ(∂F ). A observância da propriedade de cantos pares tem
implicações essenciais na estrutura do código obtido pelo emprego das sequências cortantes, espe-
cificado no Teorema 67, e pelo emprego da expansão do bordo, especificado no Teorema 70. Nas
próximas seções desenvolveremos os conceitos apresentados no Teorema 67 e Teorema 70, explici-
tando o emprego destes nos processos de codificação do fluxo geodésico.
5.3.2 Código de Koebe-Morse

No que segue, consideraremos um grupo Fuchsiano Γ com conjunto finito de geradores Γ0 agindo
sobre o disco de Poincaré D2 através de isometrias da métrica hiperbólica. Chamaremos de F uma
região fundamental para Γ, sendo um polı́gono hiperbólico com número finito de lados. Os lados de
F são identificados em pares por elementos de Γ0 , um conjunto simétrico de geradores. Cada lado de
F é rotulado pelo gerador correspondente no lado interior a F . Sendo T a imagem em D2 de ∂F pela
aplicação de Γ, cada lado orientado em T é rotulado pelo mesmo gerador do lado correspondente em
F . Portanto, se tomarmos gF , hF imagens de F adjacentes pelo lado s, então o lado de s interior a
hF é rotulado com ḡh.
Consideraremos que a região F satisfaz a propriedade dos cantos pares, dessa forma T é a união
de geodésicas completas em D2 . Portanto, o número de imagens de F que encontram-se em um
vértice é par. Considerando nosso objetivo de codificação de geodésicas sobre superfı́cies, esta
condição não implica em uma restrição, uma vez que toda superfı́cie possui regiões fundamentais
com essa propriedade [42, 9]. As curvas fechadas γi na superfı́cie M que correspondem às arestas de
F são dispostas como demonstrado na Figura 5.7 para o caso de uma superfı́cie de gênero dois. Sem
comprometimento a generalidade dos resultados, assumiremos como referência que 0 ∈ F .
γ1
γ2
γ4
M γ3
Figura 5.7: Imagem das arestas de F , com vértices pares, sobre a superfı́cie associada.
γ
γ
Figura 5.8: Geodésica através de um

Figura 5.9: Geodésica em T .
vértice.
Qualquer arco orientado γ em D2 intercepta uma sequência de lados . . . s1 s2 . . . sk . . . em T , o que

permite associa-los à sequência correspondente de rótulos . . . e1 e2 . . . ek . . ., onde ei ∈ Γ0 , com rótulo
ei correspondendo ao lado de si onde o arco adentra a região fundamental. A sequência e1 . . . ek é dita
a sequência cortante de γ. Se γ passa através de um vértice em T ou coincide com um geodésica em
T , então γ é modificado de forma a obter-se uma sequência aproximada [8, 42, 9], Figuras 5.8 e 5.9.
Também podemos realizar a associação reversa. Considerando a região inicial gF , g ∈ Γ, a toda
palavra w = e1 . . . ek , ei ∈ Γ0 está vinculada uma sequência de segmentos de geodésica conectando
as imagens do ponto 0 ∈ D2 , g0, e1 g0, . . . , e1 . . . ek g0, pelos elementos g, e1g, . . . , e1 . . . ek g ∈ Γ,
chamada de sequência de arestas. Esta sequência está associada a uma sequência de polı́gonos,
consistindo de regiões adjacentes gF, e1gF, . . . , e1 . . . ek gF . A sequência cortante deste caminho é
exatamente e1 . . . ek .
Como consideramos que F possui a propriedade de arestas pares, a sequência cortante associada
a um arco circundando um vértice v de T terá a forma e1 . . . e2n(v) , além disso e1 e2 . . . e2n(v) = 1
constitui uma das relações que definem Γ. Segue que, todas as relações terão comprimento par. Qual-
quer sequência de geradores dispostos na mesma ordem em que aparecem nas relações são chamadas
de ciclos. Uma sequência e1 e2 . . . en(v) que é fator de um ciclo, mas possui metade do seu compri-
mento, é chamado de H-ciclo (decorrente de half), qualquer outro fator com comprimento maior é
dito um ciclo longo. Um ciclo pode ser horário ou anti-horário, dependendo do sentido da sequência
de arestas correspondente. Se a sequência de arestas circunda o vértice no sentido horário, temos um

ciclo horário ou L-ciclo (decorrente de left-hand cycle), caso contrário temos um ciclo anti-horário
ou R-ciclo (decorrente de right-hand cycle).
Consideremos v1 , . . . , vt vértices sucessivos em T sobre uma geodésica direcionada γ ∈ T . Seja
ρ uma curva aproximadamente paralela e próxima a γ em um de seus lados, podendo intercepta-la
antes de v1 e depois de vt . A sequência cortante de ρ é constituı́da por ciclos em v1 , . . . , vt , sendo
os ciclos nos vértices intermediários vi , 1 < i < t, de comprimento n(vi ) − 1 [42, Lema 2.4]. Estes
ciclos são ditos consecutivos, e sequências de ciclos consecutivos formam uma cadeia. Observamos
que a definição de cadeia permite a existência de cadeias infinitas. Uma cadeia é dita longa se é
formada por ciclos de comprimento n(v1 ), n(v2 ) − 1, . . . , n(vk−1) − 1, n(vk ). Segue da definição que
a sequência cortante de uma curva ρ′ conectando os pontos inicial e terminal de ρ, mas disposta no
lado oposto de γ também é uma cadeia, complementar àquela definida por ρ.
O comprimento |w| de uma sequência de arestas w é igual ao número de elementos que a compõ-
em, sendo equivalente a um elemento em Γ e formado por uma sequência de elementos em Γ0 . Uma
palavra w é reduzida se não contém fatores gḡ, g ∈ Γ0 . Uma sequência de arrestas é mı́nima se a
palavra correspondente é a menor representação do elemento em Γ definido pela palavra, para g ∈ Γ
escrevemos como |g| o comprimento da menor representação de g (essa definição estende-se para
sequência de polı́gonos).
Teorema 67. [42] Seja Γ um grupo fuchsiano e F uma região fundamental associada com a propri-
edade dos cantos pares. Para os interesses desse trabalho, supomos que F possui mais que quatro
lados.
• Uma sequência de arestas é mı́nima se, e somente se, é reduzida e não contém ciclos longos ou
cadeias longas.
• As sequências cortantes de arcos de geodésica são mı́nimas.
Dado uma sequência de polı́gonos mı́nima P que contém o vértice v, diz-se que o ângulo em P
sobre o vértice v é π, π + ou π − , se o número de regiões em P que interceptam v é n(v), n(v) + 1 ou
n(v) − 1, respectivamente.
5.3.3 Código de Artin

Esse processo guarda estreita relação com os processos de expansão numérica, que têm como exem-
plos mais conhecidos, o processo de expansão n-ário e o por frações contı́nuas, esse último é es-
treitamente relacionada com o grupo PSL(2, Z) [35, 43]. Contudo, o método que apresentamos está
associado a conceitos bem mais gerais, que decorrem da teoria de deformações quase-conformes [39].
Portanto, é comumente referenciado como um processo generalizado de expansão dos pontos em ∂D2
[44, 45].
Expansão do Bordo
Consideraremos a rotulação dos lados externos a F por g1 , . . . , gk em sentido anti-horário, sendo estes
o conjunto simétrico Γ0 de geradores de Γ. Denotamos por C(gi ) a geodésica completa em T pela
extensão do lado de rótulo gi , e por A(gi ) = [Pi , Qi ] o arco delimitado por C(gi ) sobre ∂D2 , onde Pi
precede Qi em sentido anti-horário. Em nossa abordagem, consideramos que Γ é de primeira espécie5 ,
portanto, o conjunto g∈Γ0 A(g) recobre ∂D2 . Estabelecidos estes elementos, segue a definição da
S
função de expansão do bordo.
Definição 36. A função de expansão do bordo f : ∂D2 → ∂D2 é dada por f |[Pi,Pi+1 ) (ξ) = ḡi (ξ), ou
seja, é igual por partes ao conjunto de geradores Γ0 do grupo fuchsiano Γ com região fundamental F .
Quando Γ não possui elementos parabólicos, portanto, F não possui vértices em ∂D2 fixados
por elementos de Γ, então a partição induzida em ∂D2 pelos pontos Pi , Qi constitui uma partição
Markoviana finita para f , [44, Teorema 2.1]. A f -expansão6 de ξ ∈ ∂D2 é a sequência ξf = gi0 gi1 . . .,
onde gij ∈ Γ0 , satisfazendo f n (ξ) ∈ [Pin , Pin +1 ), n ∈ N. O conjunto de sequências infinitas que são
expansões de pontos em ∂D2 é denotado por Σ+ = {ξf : ξ ∈ ∂D2 } ⊂ ∞
Q
i=0 Γ0 .
O conjunto de pontos em ∂D2 formado pelos pontos terminais das geodésicas em T que passam
por um vértice de F é denotado por W . Então W induz um particionamento B finito em ∂D2 ,
cujos elementos são os conjuntos de intervalos disjuntos limitados por pontos em W . Segue de [44,
Lema 2.3] que f (W ) ⊆ W , com igualdade seguindo diretamente quando W é finito e sabendo-
se que f é Γ-equivalente por partes. Essas propriedades permitem-nos associar à ação de f sobre
o particionamento B um ssf de memória um, que denotaremos por ΣB ⊂ ∞
Q
i=0 B, onde B é um
alfabeto finito com elementos a ∈ B associados biunivocamente a intervalos B(a) ∈ B, e portanto
S
a∈B B(a) = B.
Como cada intervalo [Pi , Pi+1 ) é uma união de intervalos em B, pode-se definir um mapeamento
natural β : B → Γ0 que associa a um intervalo J ∈ B o gerador gi quando J ⊂ [Pi , Pi+1 ), do
que segue que o mapeamento induzido β̄ : ΣB → Σ+ é sobrejetivo e injetivo exceto em um número
contável de pontos onde ele é 2 para 1, um fenômeno similar a dubiedade na expansão decimal dos
números reais, no entanto decorrente das propriedades da ação da função f sobre ∂D2 [45]. Como
5
Com relação ao processo de codificação por expansão do bordo, o objetivo dessa restrição é facilitar a compreensão
do método, não sendo inerente a esse.
6
A f -expansão é introduzida e extensivamente analisada em [44], sendo a principal ferramenta para codificação por
expansão do bordo.
Σ+ é a imagem de um mapa fator sobre um SFT de memória um, temos que Σ+ é um ssr [18]. Devido
a relevância desse resultado para nossa abordagem, iremos referencia-lo através do Lema 68.
Lema 68. [8, 44] O ssf Σ+ é um ssr obtido como imagem do SFT ΣB pelo mapa fator β̄.
De fato, os fatores ou linguagem B(Σ+ ) que ocorrem em Σ+ correspondem às representações de

menor comprimento dos elementos em Γ, com cada elemento possuindo uma única representação. De
outra forma, todo elemento em Γ possui uma única expressão como palavra de comprimento mı́nimo
que não contenha H-ciclos anti-horários, expresso no Teorema 69.
Teorema 69. [8] Uma palavra w pertence a B(Σ+ ) se, e somente se, não contém H-ciclos anti-
horários.
Como veremos na próxima seção, o processo de codificação do fluxo geodésico através de códigos
aritméticos está relacionado com a expansão dos pontos sobre ∂D2 para os quais a geodésica cor-
respondente ao locus do fluxo geodésico codificado converge. Chamados de pontos terminais da
geodésica. Especificada uma direção para a geodésica, de acordo com o sentido do fluxo, o ponto
contrário ao sentido do fluxo é denominado repulsor (ξ), enquanto o outro de atrator (η), como mostra
a Figura 5.1. A Definição 36 é empregada no processo de expansão do atrator. Para a expansão do
repulsor empregamos a função apresentada na Definição 37. Essa mudança tem como objetivo tornar
o processo de codificação aritmética do fluxo geodésico consistente, ou seja, uma representação do
fluxo geodésico através de um fluxo especial sobre um ssf.
Definição 37. A função de expansão do bordo f¯ : ∂D2 → ∂D2 é dada por f¯|(Qi−1 ,Qi] (ξ) = ḡi (ξ), ou
seja, é igual por partes ao conjunto de geradores Γ0 do grupo fuchsiano Γ com região fundamental F .
Como resultado desse duplo processo de expansão, a extensão de Σ+ (conjunto de sequências in-
finitas) para um conjunto Σ (conjunto de sequências bi-infinitas) corresponde a extensão do processo
de codificação de um ponto para uma geodésica. A inversão da assimetria apresentada na definição de
f permite representar a ação do fluxo sobre as geodésicas na superfı́cie, através da ação do mapa des-
locamento sobre Σ. A função f¯ satisfaz todas as propriedades de f , a não ser pela inversão dos termos
+
“anti-horário” e “horário”. Em particular, ei . . . ei+r ∈ B(Σ+ ) se, e somente se, ēi+r . . . ēi ∈ B(Σ ),
+
onde Σ = {ξf¯ : ξ ∈ ∂D2 }.
As funções f e f¯ bem definidas (equivalentes por parte a Γ0 ), permitem-nos associar uma estrutura
Markoviana a ação do fluxo geodésico sobre ∂D2 , como expresso no Teorema 70. Estas funções são
extensivamente estudadas em [45, 9].
Teorema 70. [44] Seja Γ um grupo fuchsiano de primeira espécie finitamente gerado, com uma
região fundamental F que satisfaz a propriedade dos cantos pares. Então há um mapeamento Mar-
γ γ
γ∈R γ ∈R
/
(1) (2)
Figura 5.10: Possı́veis deformações de uma geodésica orientada quando intercepta um vértice.
koviano f : ∂D2 → ∂D2 cuja ação sobre ∂D2 é equivalente a ação de Γ sobre ∂D2 , ou seja, geram
as mesmas órbitas.
5.4 Representação Geométrica e Aritmética do Fluxo Geodésico

Nesta seção veremos como as sequências cortantes e expansão do bordo são aplicados na codificação
do fluxo geodésico (ou geodésicas). Em qualquer instante do processo de codificação, seja o geométri-
co ou o aritmético, a região fundamental é nosso parâmetro de referência, empregada em cada instante
para determinação dos dı́gitos das sequências cortantes ou da expansão dos pontos do bordo. Se γ
é uma geodésica orientada que intercepta um vértice v de T , então convenciona-se que γ será subs-
tituı́do por uma curva deformada para direita em torno de v (considerando-se a orientação de γ), como
mostra a Figura 5.10. Essa convenção deve-se a escolha da função de expansão do bordo apresentada
na Definição 36.
Consideremos ξ, η ∈ ∂D2 , ξ 6= η, com expansões ξf¯ = ξ0 ξ−1 . . . e ηf = η0 η1 . . .. Como na
Seção 5.2.3, escreveremos ξ ∗η = · · · ξ¯−1 ξ¯0 η0 η1 · · · , com γ = γ(ξ, η), onde ξ é o atrator e η o repulsor
de γ, fica assim estabelecida uma orientação para as geodésicas em D2 . Diz-se que ξ ∗ η é mı́nimo
se todos os seus blocos são mı́nimos. Denomina-se por E(ξ ∗ η) a sequência de arestas conectando
os pontos . . . , ξ0 ξ1 0, ξ00, 0, η0 0, η0 η1 0, . . ., e E(η), E(ξ) as sequências de arestas 0, η0 0, η0 η1 0, . . . e
. . . ξ0 ξ1 0, ξ00, 0. A sequência de arestas de γ é denotada por E(γ). Uma sequência (ei )∞
i=−∞ , ei ∈ Γ0 ,
pode iniciar ou terminar em uma cadeia infinita de ciclos, tendo comprimentos n(v1 )−1, n(v2 )−1, . . .
em vértices v1 , v2 , . . . consecutivos sobre uma geodésica em T .
Uma geodésica γ(ξ, η) passa próximo a um vértice v ∈ T se ξ, η encontram-se em setores opos-
tos do particionamento de D2 determinado pelas geodésicas T (v) em T que interceptam v. Con-
sideremos a Figura 5.11 como exemplo, todas as geodésicas γ apresentadas passam próximo ao
único vértice apresentado explicitamente, pois seus pontos terminais encontram-se em setores opos-
5.4 Representação Geométrica e Aritmética do Fluxo Geodésico 123
γ γ
γ∈R∩A γ∈A−R
(1) (2)
γ γ
γ∈R−A γ ∈A∪R
/
(3) (4)
Figura 5.11: Possı́veis discrepâncias entre os conjuntos A e R.
tos desse. Se γ passa próximo a um vértice v ∈ F e γ ∩ F 6= ∅, então diz-se que γ corta v em F se os

pontos terminais de γ não pertencem ao setor de v que contém F . Suponhamos ξ¯0 η0 associados a ξ, η
fazem parte de um ciclo ou cadeia. Então os lados C(ξ0), C(η0 ) de F encontram-se em um vértice de
F denotado por v(ξ, η) ou são separados por um lado de F denotado por s(ξ, η).
Definição 38. Seja Σ = {(ei )∞ +

i=−∞ | ei . . . ei+k ∈ B(Σ ), com 0 < k e (ei ) não começa ou termina
com cadeias infinitas de ciclos anti-horários}. Então,
A = {γ = γ(ξ, η)| ξ ∗ η ∈ Σ} e R = {γ = γ(ξ, η)| γ ∩ IntF 6= ∅}.
Deve-se ressaltar que o processo de codificação que gera A e R em cada instante de tempo (ou
ı́ndice dos sı́mbolos das sequências código) emprega uma região F especı́fica para comparação desses
conjuntos (uma referência), associada ao conjunto R.
Ao contrário do caso particular abordado na Seção 5.2, já não é observada a igualdade A = R.
A disparidade entre os conjuntos A e R surge com relação às geodésicas que passam próximo a
vértices de F [8]. Podendo ser de quatro tipos, dependendo da direção da geodésica e sua posição em
relação a F . Os possı́veis casos são apresentados na Figura 5.11. Se queremos que nosso conjunto
de sequências código reflita propriedades de um espaço topológico, podendo ser associadas a uma
superfı́cie, devemos trabalhar com o conjunto R. Contudo, precisamos projetar codificadores que
Codifica em Estima em
A∩R Superfı́cie M A∩R
Figura 5.12: Modelo de sistema para sequências código restritas a A ∩ R.
associem sequências código às sequências de informação de nossa fonte, e o código associado a R
é demasiadamente complexo para que consigamos determinar até mesmo uma representação finita
desse. Ao contrário, o código associado a A é um ssr, portanto possui uma representação finita
através de um grafo direcionado e rotulado.
Propomos duas alternativas para tratar com esse dilema. A primeira restringe o conjunto de
sequências efetivamente aplicadas no processo de codificação àquelas contidas no conjunto A ∩ R,
com condição a ser satisfazer para isso expressa na primeira implicação da Proposição 71 e repre-
sentada no caso (1) da Figura 5.11. Um modelo para o nosso sistema resultante é apresentado na
Figura 5.12. A segunda alternativa será tratada na próxima seção.
Proposição 71. [8] Suponha que ξ¯0 η0 pertença a um ciclo ou cadeia e que γ passe próximo ao vértice
v(ξ, η). Então,
ξ ∗ η ∈ A ⇒ (γ passa por v em sentido horário ⇔ γ ∈ R),

ξ∗η ∈
/ A ⇒ (γ passa por v em sentido anti-horário ⇔ γ ∈ R).
5.4.1 Estendendo o conjunto de sequências código

Podemos fazer uso de todo o conjunto R, continuando a empregar as boas propriedades apresen-
tadas pelo conjunto A para implementação de codificadores, se conseguirmos relacionar de forma
biunı́voca as sequências desses conjuntos. De fato, isso é possı́vel pelo emprego de mapas de
conjugação T : R → A e S : A → R, definidos a seguir com base nos casos apresentados na
Figura 5.11. Antes, precisamos de alguns conceitos adicionais.
Procedimento 1. Sejam P = (Ri )∞ ′ ′ ∞
i=−∞ e P = (Ri )i=−∞ sequências de polı́gonos mı́nimas e orien-
tadas, com pontos terminais no infinito iguais. As regiões de P e P ′ podem ser associadas de acordo
com as seguintes regras.
1. Se a região S é comum às duas sequências, S = Ri = Rj′ , então Ri é associada a Rj′ .
2. Suponhamos que Ri , Ri+1 , . . . , Rp e Rj′ , Rj+1

′
, . . . , Rq′ sejam sequências de regiões em P e P ′ que
não possuem regiões em comum mas que compartilham os vértices v−k , . . . , v0 , . . . , vl , tal que o
5.4 Representação Geométrica e Aritmética do Fluxo Geodésico 125
ângulo vi é π para i 6= 0, seguindo-se que o ângulo sobre P em v0 é π + . Suponhamos também

que Rs , Rt′ sejam regiões em P, P ′ com v0 ∈ Rs e v0 ∈ Rt′ . Então, Rt+r
′
é associada a Rs+r+1 para
max(i − s − 1, j − t) ≤ r ≤ min(q − t, p − s − 1).
Além disso, se o ângulo sobre P em v0 é π − então Rt+r+1
′
é associada a Rs+r para max(i − s, j −
r − 1) ≤ r ≤ min(p − s, q − t − 1). Sendo associações relativas ao vértice v0 .
3. Suponhamos que P e P ′ não possuem regiões em comum e possuem ângulo π em todos os vértices
comuns. Sejam Ri , . . . , Ri+p e Rj′ , . . . , Rj+p
′
sequências de regiões em P e P ′ que compartilham
os vértices v1 , . . . , vk . Suponhamos também que Ri e Rj′ possuam um lado em comum. Então
′
Ri+r é associada a Rj+r para 0 ≤ r ≤ p.
O Procedimento 1 de associação de sequências de polı́gonos é empregado na explicitação do

Procedimento 2 para descrever as bijeções entre as sequências em A e R. Além desse conceito,
será empregado o conceito de caminho complementar, esta definição envolve diversos conceitos não
abordados neste texto, além de resultados de lemas, não sendo explicitada aqui mas podendo ser
consultada em [8, Definição 5.5].
Procedimento 2. O procedimento de associação de sequências de polı́gonos é empregado na explici-

tação do procedimento de conjugação entre os conjuntos de A e R.
1. T (γ) = S(γ) = γ, se γ ∈ R ∩ A.
2. Definição de S sobre A − R. Suponha que γ = γ(ξ, η) ∈ A − R. As sequências de arestas

E(ξ ∗ η), E(γ) interceptam-se em ∂D2 e são mı́nimas, assim é possı́vel aplicar o Procedimento 1
para combinar as sequências. Temos que 0 ∈ E(ξ ∗ η) mas 0 ∈
/ E(γ), já que γ ∈
/ R. Seja hF a
região associada a F , então S(γ) = h̄γ.
3. Definição de T sobre R − A. Suponha inicialmente que ξ ∗ η não é mı́nimo. Assim, γ é um lado

de T , e 0 ∈ E(γ) uma vez que γ ∈ R [8]. Seja gF a região associada a F no lado oposto de γ,
então T (γ) = ḡγ.
Considerando o caso em que ξ ∗η é mı́nima. Neste caso γ passa próximo de v(ξ, η) e as sequências
E(γ), E(ξ ∗ η) interceptam R. Consideremos E ∗ (ξ ∗ η) a sequência complementar a E(ξ ∗ η) em
v(ξ, η). É possı́vel aplicar o Procedimento 1 para combinar as sequências E(γ) e E ∗ (ξ ∗ η). Seja
gF a região associada a F , então T (γ) = ḡγ.
Salientamos que pela definição acima, os mapas S, T são iguais por partes aos elementos de Γ,
além disso, pode ser verificado geometricamente que as regiões onde S e T são iguais a um g ∈ Γ
fixo podem ter suas fronteiras determinadas explicitamente. O Teorema 72 especifica a importância
desses mapeamentos.
Codifica em
S(·)
A
Superfı́cie M
Decodifica
T (·)
em A
Figura 5.13: Modelo de sistema para sequências em R.
Teorema 72. [8] O mapa T é uma bijeção R → A. De fato, T e S são inversos um do outro.
Além de poder relacionar biunivocamente as sequências em A e R, é necessário garantir que o

comportamento dinâmico do sistema seja preservado. O que é estabelecido no Teorema 73.
Teorema 73. [8] O mapa T conjuga as ações de σ sobre A e τ sobre R. Portanto, os seguintes
diagramas comutativos são válidos.
τ σ
R −−−→ R A −−−→ A
   
   
Ty yT Sy yS
A −−−→ A R −−−→ R
σ τ
Agora, o segundo sistema proposto emprega todo o conjunto de sequências em A no processo

de codificação, seguido por um processo posterior de mapeamento em R. Nesse caso, as sequências
referentes a segunda implicação da Proposição 71 são integradas no processo de codificação, repre-
sentando o caso (3) da Figura 5.11. Um modelo para o nosso sistema resultante é apresentado na
Figura 5.13.
5.5 Estrutura e Entropia do SFT Inerente ao Código Aritmético

Nesta seção consideraremos o resultado apresentado no Lema 68 para o caso de uma tesselação
{(8g − 4), 4}, onde g é o gênero da superfı́cie. Essa condição não impõe de fato uma restrição, pois
como é provado em [9], a qualquer superfı́cie com g ≥ 2 pode ser associada uma região fundamental
que satisfaça essa condição. A importância desse caso está em podermos apresentar explicitamente
a medida invariante associada as funções de expansão do bordo f e f¯, o que permite-nos realizar
5.5 Estrutura e Entropia do SFT Inerente ao Código Aritmético 127
análises estatı́sticas quantitativas sobre o código aritmético decorrente dessas funções de expansão do
bordo [34].
5.5.1 Definindo a estrutura da região fundamental
Consideraremos como região fundamental um polı́gono hiperbólico F com (8g−4) lados, e tesselação
associada {(8g − 4), 4}. Rotularemos as arestas consecutivas por s1 , . . . , s8g−4 em sentido anti-
horário. A identificação de arestas é especificada pela permutação de ordem 2 sobre 1, . . . , 8g − 4
definida em (5.2). 
4g − 4 mod (8g − 4), i ı́mpar,
σ(i) = (5.2)
2 − i mod (8g − 4), i par.
Uma representação para o caso de um polı́gono com 12 arestas (g = 2) é apresentado na Figura 5.14,
onde destacamos as arestas identificadas através das retas tracejadas. Os rótulos 11 , 12 , 21 , 22, . . . na
base da figura identificam os elementos do particionamento B apresentado na Seção 5.3.3, especifica-
dos pelos pontos terminais das geodésicas em T que passam por vértices de F . Os pontos terminais
das geodésicas obtidas como prolongamento da aresta si de F são rotulados por ai e bi , com ai prece-
dendo bi quando considerando o sentido anti-horário. Representamos o caso a7 e b7 na Figura 5.14.
Portanto, como decorrência da ação de g1 o ponto a1 é mapeado em b7 , b1 é mapeado em a7 , b12 é
mapeado em b8 e a2 é mapeado em a6 . O caso geral é apresentado no Lema 74.
Lema 74. [9] A transformação gi mapeia os pontos ai−1 , ai , bi−1 , ai+1 , bi , bi+1 , respectivamente, nos
pontos aσ(i)+1 , bσ(i) , bσ(i)+1 , aσ(i)−1 , aσ(i) , bσ(i)−1 .
Sabendo que as funções de expansão do bordo f e f¯ são Γ-equivalentes, podemos empregar

o Lema 74 para determinar as regras de transição que especificam o SFT subjacente ao código
aritmético associado a essa tesselação [9], apresentadas em (5.3). Portanto, a região 11 é mapeada por
f (ou g1 ) nos intervalos 82 , 91 , enquanto 12 é mapeado por f em 92 , 101 , . . . , 51 , 52 .

i → (σ(i) + 1) , (σ(i) + 2) ,
1 2 1
(5.3)
i → (σ(i) + 2) , (σ(i) + 3) , . . . , (σ(i) − 2) , (σ(i) − 2) .
2 2 1 1 2
De forma similar, as regras de transição que definem o SFT subjacente ao código aritmético podem
ser determinadas para um tesselação qualquer que satisfaça a propriedade dos cantos pares [45].
b7 a7
g1 F
7
8 6
g1
9 5
F
10 4
11 3
12 2
1
D
22
11 12 21
Figura 5.14: Região fundamental.
5.5.2 Maior ssf-completo

Nesta seção abordaremos uma questão estrutural do SFT, que denotaremos por Xg , definido pelas
regras de transição (5.3). Inicialmente, podemos verificar a partir de (5.3) que a cardinalidade do
alfabeto associado a Xg é 2(8g − 4). A seguir especificaremos a maior cardinalidade do alfabeto de
um ssf-completo contido em Xg , ou seja, o conjunto de proibições é vazio.
Como um ssf-completo não possui sequências proibidas, deve ser possı́vel a transição entre quais-
quer elementos do seu alfabeto. A partir das regras de transição (5.3), observamos que um elemento
de sub-ı́ndice um não pode ocorrer sucessivamente em uma sequência. Portanto, para a análise a
seguir omitiremos o sub-ı́ndice, estabelecendo previamente que trata-se do sub-ı́ndice dois.
Lema 75. Seja L = {1, . . . , k}, onde k ≥ 4 é um inteiro par, e σ : L → L uma permutação
S
arbitrária. Suponhamos uma partição {C, P} de L, tal que, P = i∈C P(i) onde P(i) = {(σ(i) −
1), σ(i), (σ(i) + 1)}. Logo, o maior valor de |C| é obtido quando |P| = |C| + 2 e os elementos
{σ(i)}i∈C são consecutivos.
Demonstração: Inicialmente, i, j ∈ L são consecutivos se |i − j mod k| = 1, relembrando que

(k − 1) ≡ −1 mod k e, portanto, |(k − 1) mod k| = 1. A seguir demonstramos que não há σ(·)
que satisfaça |P| = |C| e |P| = |C| + 1, e que |P| = |C| + 2 só é satisfeita quando {σ(i)}i∈C é um
conjunto consecutivo de elementos.
Consideremos verdade que |P| = |C|, assim há i ∈ C e j1 , l ∈ C satisfazendo σ(j1 ) = (σ(i) − 1) e
σ(l) = (σ(i)+1). De outra forma, deve existir t1 , t2 ∈ C satisfazendo σ(t1 ) = σ(t2 ) e t1 6= t2 , o que é
uma contradição. Como j1 ∈ C e σ(j1 ) = (σ(i) − 1) então há j2 ∈ C satisfazendo σ(j2 ) = (σ(i) − 2),
e portanto existe j3 ∈ C tal que σ(j3 ) = (σ(i) − 3), etc. O que nos leva a concluir que L = P.
Agora, suponhamos que |P| = |C| + 1, implicando em dois possı́veis casos σ −1 (σ(i) − 1) ∈
/ C
ou σ −1 (σ(i) + 1) ∈
/ C para algum i ∈ C. Consideraremos aqui um dos casos, a análise do outro
segue pari passu. Seja σ(j1 ) = (σ(i) + 1) para algum j1 ∈ C, então existe j2 ∈ C satisfazendo
σ(j2 ) = (σ(i) + 2), e assim por diante. Novamente, concluı́mos que L = P.
Se |P| = |C| + 2 e {σ(i)}i∈C não é um conjunto de elementos consecutivos, então C possui pelo
menos três elementos j1 , j2 , j3 satisfazendo (σ(jl ) + 1) ∈
/ {σ(i)}i∈C ou (σ(jl ) − 1) ∈
/ {σ(i)}i∈C ,
1 ≤ l ≤ 3. Portanto, |P| = |{P(i)}i∈C | ≥ |C| + 3. Concluı́mos que |P| = |C| + 2 só ocorre se os
elementos do conjunto {P(i)}i∈C são consecutivos, sendo simples verificar que só há dois elementos
no conjunto P que não pertencem a {P(i)}i∈C . Neste caso obtemos |C| = k/2 − 1 e |P| = k/2 + 1.

Para prova do Teorema 76 novamente referenciaremos (5.3), chamando a atenção que as transições
i → (σ(i) − 1), σ(i), (σ(i) + 1) são exatamente as transições proibidas, o que nos permitirá empregar
o Lema 75.
Teorema 76. O máximo ssf-completo contido no ssf Xg , possui alfabeto C com cardinalidade 4(g−1),
ou seja, |C| = 4(g − 1).
Demonstração: Para a permutação σ(·) apresentada em (5.2), iremos demonstrar que não há um
partição {C, P} de L = {1, . . . , 8g − 4} satisfazendo |P| = |C| + 2, especificando em seguida uma
partição que satisfaz |P| = |C| + 4.
Como resultado do Lema 75, existe uma partição satisfazendo |P| = |C| + 2 se, e somente se,
os elementos em {σ(i)}i∈C são consecutivos. Portanto, os elementos em C também são consecutivos,
além disso |L| = |C| + |P| = 2|C| + 2 = 8g − 4, logo |C| = 4g − 3. Complementando, |L|/4 =
(8g − 4)/4 = 2g − 1 e assim |C| − |L|/4 = 2g − 4, o que para g ≥ 2 é pelo menos dois. Portanto,
o conjunto C possui pelo menos um dos elementos “cardinais” {1, 2g, 4g − 1, 6g − 2}. De (5.2), o
vizinho de um elemento cardinal é a imagem um do outro. Assim, para |P| = |C| + 2 existe i ∈ L
satisfazendo i, σ(i) ∈ C, o que é uma contradição.
Como não há uma partição com |C| = (4g−3), prosseguimos com a análise do caso |C| = (4g−4).
Considerando a partição {C1 , C2 } de C onde C1 = {2, 3, . . . , 2g −1} e C2 = {4g, 4g +1, . . . , 6g −3}.
Portanto, |C| = |C1 | + |C2 | = 4(g − 1). A partir de (5.2), segue que para

2g + 1 ≤ σ(i) ≤ 4g − 3, i ı́mpar,
i ∈ C1 :
6g ≤ σ(i) ≤ 8g − 4, i par.

6g − 1 ≤ σ(i) ≤ 8g − 5, i ı́mpar,
i ∈ C2 :
2g + 2 ≤ σ(i) ≤ 4g − 2, i par.
Assim, P = {2g, 2g + 1, . . . , 4g − 1} ∪ {6g − 2, 6g − 1, . . . , 1}, onde σ −1 (i) ∈

/ C para i ∈ {1, 2g, 4g −
1, 6g − 2}. Podendo ser verificado que C ∩ P = ∅ e L = C ∪ P.
5.5.3 Entropia Topológica
Em processos de codificação de fonte e codificação conjunta, a entropia topológica das palavras ou

sequências código é de suma importância, pois representa a quantidade de informação que pode
ser codificada através dessas. A seguir definiremos esse parâmetro para Xg , iniciando com alguns
conceitos necessários sobre grafos direcionados. Como na Seção 5.5.2, o valor obtido é uma função
do gênero da superfı́cie associada a região fundamental.
Grafos Direcionados
Um grafo G = (V, E) é definido por um conjunto finito de vértices V e um conjunto finito de ramos
E, tal que, para todo ramo e ∈ E é associado um estado inicial i(e) e um estado terminal t(e). Um
caminho π em G é um conjunto de ramos consecutivos, ou seja, se π = e1 . . . en então t(ei ) = i(ei+1 )
para 1 ≤ i < n. Um grafo rotulado é um par G = (G, L) tal que G e um grafo e L : E → A é a
função de rotulação onde A é um conjunto finito chamado de alfabeto. Um grafo rotulado G é
determinı́stico se para qualquer e1 , e2 ∈ E satisfazendo i(e1 ) = i(e1 ) então L(e1 ) 6= L(e2 ). Um grafo
G pode ser considerado um grafo rotulado ao considerarmos L igual a função identidade. Seja Aij
igual ao número de ramos em G com estado inicial i e estado terminal j, para qualquer i, j ∈ V. A
matriz adjacência de G é A = [Aij ]. A matriz adjacência associada ao grafo G é denotada por AG .
Para um grafo rotulado G = (G, L), a matriz adjacência é denotada por AG = AG . Um ssr XG é
determinado pela leitura dos rótulos de ramos consecutivos em um grafo rotulado G. Neste caso G
é uma representação de XG . Para um SFT com memória um, ou seja, que pode ser determinado por
um conjunto F de palavras proibidas de comprimento dois, há um procedimento simplificado para a
determinação de uma representação G = (G, L). Um grafo inicial G = (V, E) é especificado que
satisfaça V = A e E = {ij ∈ A × A| ij ∈
/ F}, tal que i(ij) = i e t(ij) = j, com função rotulação
especificada por L(ij) = j para todo ij ∈ E [18].
Entropia topológica de Xg
Uma apresentação GXg = (G, LXg ) do código do fluxo geodésico possui o grafo G como dado em
(5.4), onde P é o conjunto de sequências permitidas de comprimento dois especificadas em (5.3), e a
função de rotulação é dada por LX (ik il ) = il para todo ik il ∈ E.


 V = {i | 1 ≤ i ≤ 8g − 4 and k ∈ {1, 2}};
k
G: (5.4)
 E = {i i | i i ∈ P for 1 ≤ i, j ≤ 8g − 4 and k, l ∈ {1, 2}}.
k l k l
Empregamos a simetria de GXg para determinar dois outros grafos rotulados com a mesma entropia to-
pológica de Xg , no entanto que permitam a obtenção de expressões algébricas para essa. Inicialmente,
GY = (G, LY ) possui o mesmo grafo G que GXg e função de rotulação dada em (5.5).



 LY (i2 (σ(i) + 2)2 ) = b1 , LY (i2 (σ(i) + 3)2 ) = b2 , . . . ,


 L (i (σ(i) − 2) ) = b
(k−3) ;

Y 2 2
(5.5)


 LY (i2 (σ(i) + 3)1 ) = c1 , . . . , LY(i2 (σ(i) − 2)1 ) = c(k−4) ;


 L (i (σ(i) + 1) ) = d , L (i (σ(i) + 2) ) = a .

Y 1 2 1 Y 1 1 1
O outro grafo rotulado GZ = (GZ , LZ ) possui o grafo GZ como especificado em (5.6), onde k = 8g −4
e LZ é a identidade.

 V = {1, 2};
Z
GZ : (5.6)
 E = {a } ∪ {d } ∪ {c , . . . , c
Z 1 1 1 (k−4) } ∪ {b1 , . . . b(k−3) },
tal que 
 t(a ) = i(a ) = 1, e t(b ) = i(b ) = 2 para 1 ≤ l ≤ (k − 3);
1 1 l l
(5.7)
 i(d ) = 1, t(d ) = 2, e i(c ) = 2, t(c ) = 1 para 1 ≤ t ≤ (k − 4).
1 1 t t
Lema 77. Os grafos rotulados GY e GZ são apresentações do mesmo ssr, ou seja, B(Y) = B(Z).
Demonstração: A partir das definições de GY e GX , para qualquer i ∈ {1, . . . , 8g − 4} e n, m ∈

{1, 2}, há um caminho π em GY satisfazendo LY (π) = w, i(π) = in e t(π) = im se, e somente se,
há um caminho ̟ em GZ satisfazendo LZ (̟) = n, i(̟) = n e t(̟) = m, ou seja, sempre que os
caminhos possuem comprimento |π| = |̟| = 1.
Empregando um raciocı́nio indutivo, suponhamos que a observação acima seja verificada sempre
que os comprimentos |π| = |̟| = n sejam menores ou iguais a um inteiro positivo n. A seguir
demonstraremos que ela também é verificada quando |π| = |̟| = n + 1.
Suponha que πe é um caminho em GY satisfazendo LY (πe) = LY (π)LY (e) = wa para e ∈ EY ,
i(π) = in e t(π) = im . Seguindo da hipótese indutiva que há um caminho ̟ ∈ GZ satisfazendo
|̟| = |π|, LZ (̟) = w, i(̟) = n e t(̟) = m. Além disso, há um caminho f em GZ satisfazendo
|f | = 1, LZ (f ) = LY (e) = a e i(f ) = m, além do que t(f ) = p se, e somente se, t(e) = ip .

Dessa forma, L(̟f ) = wa e, portanto, B(Y) ⊆ B(Z). De forma similar, pode ser demonstrado que
B(Z) ⊆ B(Y).
Para a demonstração do Teorema 80 são necessários alguns resultados a cerca da entropia de gra-
fos direcionados e dos grafos rotulados associados. Para nossos fins, a Proposição 78 e a Proposição 79
são necessários. Esses resultados fazem parte do capı́tulo sobre entropia de [18], onde são apresen-
tados diversos resultados sobre a determinação dessa para um ssr. Entre os resultados mais relevan-
tes, por tratar da determinação do autovalor de matrizes não negativas, podemos citar o teorema de
Perron-Frobenius, do qual decorre a Proposição 79.
Proposição 78. [18] Seja G = (G, L) um grafo rotulado determinı́stico. Então h(XG ) = h(XG ).
Proposição 79. [18] Seja G um grafo com matriz adjacência A. Então h(XG ) = log λA , onde λA é o
maior autovalor de A.
Teorema 80. A entropia topológica do código Xg está relacionada com a região fundamental Πg
através do gênero da superfı́cie associada, sendo dada por
" #
p
h(X) = log (4g − 3) + (4g − 3)2 − 1 (5.8)
Demonstração: Como os grafos rotulados GX e GY são determinados a partir do mesmo grafo G,

e são ambos determinı́sticos, segue da Proposição 78 que h(X) = h(Y). Do Lema 77, já sabemos
que h(Y) = h(Z). Portanto, da Proposição 79 podemos aplicar a matriz adjacência AGZ de GZ para
determinar a entropia topológica de X. Como AGZ possui ordem dois, independentemente da região
empregada na codificação Πg , com entradas só dependendo do gênero g, temos como determinar
uma equação algébrica para h(Z) e, consequentemente, teremos uma equação algébrica para h(X). A
partir de (5.6) e (5.7), a matriz adjacência associada AGZ é dada por (5.9).
" #
1 1
AGY = (5.9)
8g − 8 8g − 7
O maior autovalor λAGY de AGY é igual a maior raiz do polinômio caracterı́stico λ2 + λ (6 − 8g) + 1
de AGY . Assim,
p
(8g − 6) + (6 − 8g)2 − 4 p
λAGY = = (4g − 3) + (4g − 3)2 − 1.
2
Dessa forma h(X) = h(Y) = log λAGY , do que segue (5.8).

Capı́tulo 6
Representação de Códigos Geodésicos
No Capı́tulo 5 abordamos os métodos de codificação do fluxo geodésico. Dois métodos foram consi-
derados, um que captura a topologia da superfı́cie da qual o fluxo geodésico é codificado, denominado
geométrico. O outro, baseado em métodos de expansão dos pontos em ∂D2 , emprega mapeamentos
Markovianos, sendo denominado aritmético. Para nossos objetivos de determinar representações
do fluxo geodésico a serem empregadas no projeto de codificadores casados com a topologia de
uma superfı́cie (especificada pelo gênero da superfı́cie), a impossibilidade de determinar-se uma
representação finita para o código geométrico constitui um desafio a ser contornado, já que é esse
o método que captura a topologia da superfı́cie. Como apresentado no Seção 5.4, há pelo menos duas
abordagens possı́veis para contornarmos esse obstáculo, uma é representar a interseção do código
geométrico com o aritmético, enquanto a outra é fazermos uso de conjugados bem definidos entre os
códigos. Para qualquer escolha que façamos, saber representar o código aritmético é uma necessidade
inicial.
Neste capı́tulo demonstramos como, a partir de um conjunto infinito de restrições bem definidas
para o código aritmético, especificadas na Proposição 84, podemos empregar os conceitos e métodos
desenvolvidos no Capı́tulo 3 para gerar de forma sistemática uma representação determinı́stica e
mı́nima para o código. Em nosso desenvolvimento fica claro como a riqueza de propriedades das
palavras proibidas conduzem à simplificação, sistematização e generalidade (com relação a topologia
da superfı́cie) do método. Essas propriedades decorrem da estrutura topológica da superfı́cie, a saber,
dos possı́veis ciclos completos de geradores.
Nosso desenvolvimento é baseada nos resultados apresentados em [8, 45], que por sua vez fa-
zem suposições iniciais estabelecidas em [42, 44]. Portanto, iniciamos a Seção 6.1 estabelecendo as
propriedades necessárias da região fundamental para aplicação destes resultados. Em seguida detalha-
mos o método de geração de ciclos de vértices e sequências de geradores apresentado inicialmente na
Seção 4.5. Finalizamos a seção com a demonstração de propriedades necessárias subsequentemente.
133
134 Representação de Códigos Geodésicos
Empregando as propriedades das sequências de geradores, demonstramos no Teorema 86 da

Seção 6.2 que o conjunto de restrições O que especificam o código de Artin é irredutı́vel e que o
procedimento para determinar o conjunto de restrições à direita é facilitado, não requerendo cálculos
ou comparações além daquelas necessárias para especificar o conjunto finito de prefixos obtidos di-
retamente de um subconjunto finito e bem especificado de O.
Na Seção 6.3 exemplificamos o emprego dos resultados apresentados na Seção 6.2 para construir
uma apresentação minimal para o código de Artin, obtido a partir da tesselação {12, 4} estudada
em [9]. O procedimento é geral, e a escolha desta tesselação deve-se a clareza que propicia para
apreciação do método.
6.1 Ciclos de Vértices

Dado um grupo Fuchsiano Γ com região fundamental F , um polı́gono hiperbólico não triangular sa-
tisfazendo a propriedade dos cantos pares, com conjunto simétrico de geradores Γ0 . Consideraremos
que Γ não possui elementos parabólicos e que vértices elı́pticos não são interiores a segmentos de
geodésicas contidos em ∂F . Como apresentado na Seção 4.5, cada vértice v de F é identificado com
um outro vértice pela aplicação de um gerador em Γ0 . Cada vértice v é ponto terminal de duas ares-
tas s e ∗s de F . Neste caso, denotamos por (v, s) e (v, ∗s) os possı́veis pares de arestas com ponto
terminal v, de outra forma, s e ∗s possuem v como ponto de interseção. Consideraremos a seguinte
convenção para a denominação de arestas e vértices:
• Os vértices são enumerados em sentido anti-horário;
• Os pontos terminais da aresta si de F são os vértices vi e vi+1 , fazendo-se i + 1 = 1 caso i = N e

F seja um polı́gono com N arestas.
Seja g(s) o gerador associado a aresta s de F . Especificado um par (v1 , s1 ), então v2 = g(s1 )(v1 ) e
s2 = g(s1 )(s1 ) formam um par (v2 , s2 ). O processo é repetido, mas agora considerando a reflexão em
torno de v2 , ou seja, o par (v2 , ∗s2). De forma similar obtemos o par (v3 , ∗s3 ) para o qual g(∗s2)(v2 ) =
v3 e g(∗s2)(∗s2 ) = s3 . Portanto, através da sequência de ações: (i) Aplicar a transformação g(s)
associada ao lado s ao par (v, s), (ii) Refletir em torno de g(s)(v); determina-se a sequência de pares
(v1 , s1 ) → (v2 , ∗s2) → · · · → (vn , ∗sn ) → (vn+1 , ∗sn+1 ), onde eventualmente (vn+1 , ∗sn+1 ) =
(v1 , s1 ) já que o número de pares (v, s) é finito. A sequência de vértices v1 , v2 , . . . , vn é chamada
ciclo de vértices, enquanto a sequência g1 = g(s1 ), g2 = g(∗s2 ), . . . , gn = g(∗sn ) é chamada ciclo
de geradores ou sequência de geradores que especifica a transformação gv1 ,s1 = gn gn−1 . . . g1 , tendo
(v1 , s1 ) como par inicial. Pela convenção estabelecida quanto ao rótulo de vértices e arestas de F ,
especificado um par (vi , si ), o ciclo de vértices e de geradores obtidos são ditos L-ciclo e L-sequência,
6.1 Ciclos de Vértices 135
vi 1
gi1 b
gi2
b
vi 2
Figura 6.1: Relação entre ciclo de vértices e sequência de geradores.
respectivamente. Analogamente, no caso (vi+1 , si ), o ciclo de vértices e de geradores obtidos são ditos
R-ciclos e R-sequências, respectivamente. A transformação gn . . . g1 , associada a uma sequência
de geradores obtida a partir de um vértice v em D2 é uma transformação elı́ptica ou identidade e,
necessariamente, (gn . . . g1 )ν = 1 para algum inteiro ν. Neste caso v é um ponto elı́ptico de ordem ν.
Se v ∈ ∂D2 então gn . . . g1 é uma transformação parabólica [30, 46].
Proposição 81. A um ciclo de geradores está associada um único ciclo de vértices e vice-versa, a
não ser para ciclos de comprimento um e dois, quando pode-se associar os ciclos g, h e h−1 , g −1.
Demonstração: A cada elemento gi de Γ0 , como ao seu inverso, está associado uma única aresta
si da região fundamental e a esta um único par de vértices {vi , ui }. Dado o ciclo de geradores
gi1 , gi2 , . . . , gin , obtém-se que {gi−1
1
(vi2 ), gi−1
1
(ui2 )} ∩ {vi1 , ui1 } = {vi1 }. Portanto, o par inicial
(vi1 , si1 ) que determina unicamente o ciclo de vértices a partir do qual o ciclo de geradores gi1 , gi2 , . . . ,
gin é especificada e unicamente determinado.
Dado um ciclo de vértices, definido o primeiro elemento do ciclo de geradores associada fica defi-
nida toda a sequência, pois o par (vi1 , si1 ) inicial fica determinado. Supondo que há uma ambiguidade,
então os dois geradores associados aos lados adjacentes a vi1 mapeiam este em vi2 . Sejam estes ge-
radores gi1 e gi2 , a Figura 6.1 mostra a geração dos únicos ciclos de geradores possı́veis gi1 , gi−1
2
e
gi2 , gi−1
1
, que são o L-ciclo e R-ciclo associados ao ciclo de vértices vi1 → vi2 , respectivamente.
Corolário 82. Seja gi1 . . . gin e hj1 . . . hjm um L-ciclo e R-ciclo, respectivamente. Logo, se u ∈
S(P(g)) ∩ S(P(h)) então |u| ≤ 1, ou seja, L-ciclos e R-ciclos não possuem fatores em comum de
comprimento maior que um.
Demonstração: Segue da Proposição 81 que a um ciclo de geradores está associada um único ci-
clo de vértices. Portanto, o vértice associado a cada um dos geradores na sequência gi1 gi2 . . . gin é
unicamente determinado, e consequentemente se é um R-ciclo ou um L-ciclo.
No Lema 83 estabelecemos relações entre sequências de geradores obtidas a partir de vértices que
pertencem a um mesmo ciclo de vértices. As relações estabelecidas contemplam os possı́veis casos,
uma vez que são considerados todas as possı́veis combinações de vértices e lados adjacentes tomados
a partir de um ciclo de vértices de referência. Ou seja, para o ciclo v1 → · · · → vn consideram-se os
casos (vi , si ) e (vi , ∗si ) para 1 ≤ i ≤ n.
Lema 83. Sejam os ciclos de vértices v1 → · · · vn e v1′ → · · · vm

′
com respectivas sequências de
′
geradores gv1 ,s1 = gn . . . g1 e gv1′ ,s′1 = gm . . . g1′ , com gi associado ao lodo si e gi′ ao lado s′i . Se gv1 ,s1
e gv1′ ,s′1 possuem dois elementos consecutivos iguais, a não ser pelas operações de permutação cı́clica
e inversão, então:
1. gv1 ,s1 = gv1′ ,s′1 se, e somente se, (v1 , s1 ) = (v1′ , s′1 );
2. gv1 ,s1 = Ti gv1′ ,s′1 Ti−1 se, e somente se, (v1 , s1 ) = (vi+1
′
, s′i+1 ) e Ti = gi′ . . . g1′ ;
3. gv1 ,s1 = gv−1 ′ ′

′ ,s′ se, e somente se, (v1 , s1 ) = (v1 , ∗s1 );
1 1
4. gv1 ,s1 = Ti gv−1

′ ,s′ Ti
−1
se, e somente se, (v1 , s1 ) = (vi′ , ∗s′i ) e Ti = gi′ . . . g1′ .
1 1
Demonstração: A análise que segue é baseada no resultado da Proposição 81, a saber, a uma
sequência de geradores está associado um único ciclo de vértices e a um par (v, s) está associada
uma única sequência de geradores, do que decorre diretamente o caso 1. Para o caso 2, temos que
′
(vi+1 , s′i+1 ) transita para (vi+2
′
, ∗s′i+2 ) pela aplicação de gi+1
′
, seguindo o procedimento para obtenção
′ ′ ′ ′ ′ ′ −1
dos ciclos de vértices obtém-se que gvi+1
′ ,s′i+1 = gi . . . g1 gn . . . gi+1 = Ti (gn . . . g1 )Ti . Para o caso 3,
temos que (v1′ , ∗s′1 ) transita para (vm

′
, s′m ) pela aplicação de (gm
′ −1
) , seguindo o procedimento para
obtenção dos ciclos de vértices obtém-se que gv1′ ,∗s′1 = (g1′ )−1 . . . (gm ) = gv−1
′ −1
′ ,s′ . O caso 4 é estabe-
1 1
lecida pela aplicação em gv1′ ,s′1 de uma inversão seguida pela determinação do conjugado em relação
a transformação Ti .
Do Lema 83 conclui-se que o conjunto de vértices de uma região fundamental é particionado em

subconjuntos contendo os vértices que pertencem a um mesmo ciclo de vértices. Pois especificado
um vértice inicial, o ciclo de vértices é preservado a não ser por permutação cı́clica e inversão de
ordem.
6.2 Representação Simbólica de Pontos sobre ∂D2

Iniciando em um vértice vi e lado si associado ao gerador gi , consideremos o ciclo de vértices
vi = w1 , . . . , wn e sequência de geradores associada gi = h1 , . . . , hp . A sequência h−1 −1 −1
1 h2 . . . hp
6.2 Representação Simbólica de Pontos sobre ∂D2 137
horária está em ordem cı́clica à esquerda (L), qualquer sequência de geradores respeitando esta ordem
é denominado um L-ciclo. De outro modo, iniciando no vértice vi+1 e lado si associado ao gerador
gi , obtém-se o ciclo vi+1 = z1 , z2 , . . . , zq e geradores gi = j1 , j2 , . . . , jq . Neste caso, a sequência
j1−1 j2−1 . . . jq−1 anti-horária está em ordem cı́clica à direita (R), qualquer sequência de geradores res-
peitando esta ordem é denominado um R-ciclo. Há inteiros µ, ν satisfazendo (h−1 −1 −1 µ
1 h2 . . . hp ) =
(j1−1 j2−1 . . . jq−1 )ν = Id [30, 46]. Os inteiros pµ e qν representam os números de lados de F que
encontram-se nos vértices vi e vi+1 , respectivamente. Segue da condição de cantos pares que pµ = 2l
e qν = 2k são pares [44]. Os L-ciclo e R-ciclo compostos por 2l e 2k elementos, respectivamente,
são ditos completos, sendo iguais a identidade em Γ.
Definição 39. Dado um L-ciclo completo w de comprimento 2l, os L-ciclos de comprimento l − 1, l

e l + 1 obtidos a partir de w são ditos L D-ciclos, L H-ciclos e L S-ciclos, respectivamente.
Definição 40. Dado um R-ciclo completo w de comprimento 2k, os R-ciclos de comprimento k − 1,

k e k + 1 obtidos a partir de w são ditos R D-ciclos, R H-ciclos e R S-ciclos, respectivamente.
Seguindo a nomenclatura adotada em [45], as denominações acima referem-se a deficient (D),

half (H) e superfluous (S).
Definição 41. O conjunto de todos os L D-ciclos, L H-ciclos e L S-ciclos associados a um conjunto

de geradores simétricos Γ0 de um grupo Fuchsiano Γ são denotados por L D, L H e L S, respecti-
vamente. De forma análoga, o conjunto de R D-ciclos, R H-ciclos e R S-ciclos são denotados por
R D, R H e R S.
Seja h = gi , então definiremos h+ = gi+1 e h− = gi−1 . Se B = b1 . . . br , B 1 = b1 . . . br+1

e C = c1 . . . cs são L-ciclos com c−1
1 = (b−1 +
r+1 ) , B e C são L-ciclos adjacentes ou consecutivas,
Figura 6.2. Analogamente, se B, B 1 e C são R-ciclos e c−1 −1 −
1 = (br+1 ) , então B e C são R-ciclos
consecutivos, Figura 6.3. Uma sequência B1 . . . Br é dita uma L-cadeia se Bi , Bi+1 são L-ciclos
consecutivos, 1 ≤ i < r. Quando B1 e Br são L H-ciclos e B2 , . . . , Br−1 são L D-ciclos, então
B1 . . . Br é chamada uma L H-cadeia. Caso B1 seja um L D-ciclo então B1 . . . Br é dita uma
L D-cadeia. As L H-cadeias são representadas por HD . . . DH, e as L D-cadeias por D . . . DH.
Analogamente, uma cadeia com um L-ciclo inicial arbitrária p seguida por uma cadeia de L D-ciclos
e terminando com um L H-ciclo é representada por pDD . . . DH, seguindo-se uma representação
análoga para L-cadeias formadas por L-ciclos arbitrárias.
Definição 42. O conjunto de todas as L H-cadeias associadas a um conjunto de geradores simétricos

Γ0 de um grupo Fuchsiano Γ são denominados L H C.
−1 +
c−1
1 = (br+1 ) b−1
r
b−1
r+1 b−1
r+1
b−1
r c−1 −1 −
1 = (br+1 )
Figura 6.2: L-ciclo consecutivos. Figura 6.3: R-ciclo consecutivos.
Como decorrência do emprego da teoria de linguagem formal ao estudo dos códigos geodésicos,
interpretaremos o conjunto de geradores Γ0 do grupo Fuchsiano como um alfabeto finito, especifican-
do-o por A, quando for adequado (análises envolvendo essencialmente teoria de linguagens formais).
Proposição 84. [45] Uma sequência e1 . . . ep , ei ∈ Γ0 , é admissı́vel se, e somente se, não possui
fatores no conjunto O formado pelas sequências finitas
1. gg −1, g ∈ Γ0 ;
2. Todos os R H-ciclos;
3. Todos os L S-ciclos;
4. Todas as L H-cadeias.
A Proposição 84 especifica um conjunto de proibições O associado às expansões simbólicas de
pontos no bordo ∂D2 . No Teorema 86 demonstramos que este conjunto é irredutı́vel, para isso preci-
saremos do resultado apresentado no Lema 85. Enfatizamos as considerações sobre a região funda-
mental e expressas na Seção 6.1, temos que pµ e qν são iguais ou maiores que quatro.
Lema 85. R-ciclos não possuem fatores de comprimento maior que um em comum com L-ciclos e
L-cadeias.
Demonstração: Do Corolário 82 um R-ciclo não poderá ter fatores em comum com um L-ciclo de
comprimento maior que um. Logo, resta provar que dados B e C, dois L-ciclos, tais que, BC forma
uma cadeia, BC não possui um R-ciclo de comprimento maior que um como fator.
Sejam B = b1 . . . br e C = c1 . . . cs L-ciclos com os geradores c−1 −1 + −1
1 = (br+1 ) , br , br+1 associados
aos lados s1 , s2 , s3 , respectivamente. Como mostra a Figura 6.4, se essa concatenação gera um R-
ciclo, então o lado s1 está a esquerda de s2 , s3 está a direita de s2 , além disso s1 e s3 são adjacentes
pela definição de b−1 −1 +
r+1 e (br+1 ) . Portanto, os lados s1 , s2 , s3 formam um triângulo, contrariando a
hipótese sobre a região fundamental.
b−1 (b−1 +
r+1 b r+1 ) b
br s3 b−1
r+1 s3
b b
(b−1 +
r+1 ) br
s2 s2
b b
b s1 b s1
Figura 6.4: Configuração ao Figura 6.5: Configuração ao

considerar-se um R-ciclo como considerar-se uma sequência gg −1
fator de uma L-cadeia. como fator de uma L-cadeia.
Teorema 86. O conjunto de proibições O é irredutı́vel.
Demonstração: A condição de necessidade e suficiência expressa na Proposição 84 implica que é

suficiente demonstrar que nenhuma das sequências em O é fator próprio de outra.
Como vértices de F não são interiores a segmentos de geodésicas em ∂F e pµ e qν são números
pares, segue que os ciclos completos têm comprimento maior ou igual a quatro. Portanto, os R H-
ciclos, L S-ciclos e as L H-cadeias têm comprimento pelo menos dois, não existindo sequências
proibidas de comprimento um, logo as restrições gg −1 não possuem fatores próprios em O, g ∈ Γ0 .
Além disso, como os ciclos de geradores não possuem fatores da forma gg −1, então os R H-ciclos
e L S-ciclos também não os possuem. No caso das L H-cadeias o fator gg −1 só poderia ocorrer
entre L-ciclos que compõem as L H-cadeias HD . . . DH. Neste caso, na concatenação dos L-ciclos
B = b1 . . . br e C = c1 . . . cs ocorreria c−1
1 = (b−1
r+1 )
+
= br . Como mostra a Figura 6.5, se os
geradores br , b−1 −1 +
r+1 , (br+1 ) estão associados aos lados s1 , s2 , s3 , respectivamente, então s1 = s3 e,
portando, a região fundamental só teria dois lados, uma contradição.
Segue do Lema 85 que R H-ciclos não podem ser fatores de L S-ciclos e L H-cadeias, e vice-
versa. Portanto, resta provar que L S-ciclos e L H-cadeias não podem ser fator uns dos outros. O
que segue da relação entre seus comprimentos e da definição de uma L H-cadeia.
Uma L H-cadeia não pode ser fator de um L S-ciclo. Caso contrário, como decorrência da
Proposição 81, a L H-cadeia e o L S-ciclo estão associados ao mesmo ciclo completo. No entanto a
L H-cadeia é da forma HDD . . . H, logo seu comprimento é pelo menos o comprimento do L S-ciclo
mais um (referente ao L H-ciclo terminal), não podendo ser fator deste.
Um L S-ciclo não pode ser fator de uma L H-cadeia. Caso contrário, isso implicaria que a
concatenação de um L H-ciclo com um L D-ciclo, ou a concatenação de L D-ciclos, forma o fator
de um L-ciclo completo. O que contradiz a definição de uma L H-cadeia, pois terı́amos que na
concatenação BC dos L-ciclos B = b1 . . . br e C = c1 . . . cs , ocorreria b−1 −1 +
r+1 = (br+1 ) = c−1
1 e,
portanto, que b−1 −1 +
r+1 e (br+1 ) estão associados ao mesmo lado da região fundamental, contrariando o
processo de construção das cadeias de ciclos.
A propriedade de ciclicidade dos ciclos de geradores possibilita a obtenção de resultados relevan-

tes quando do estudo das sequências de geradores através dos conceitos de conjuntos de proibições.
A noção de ciclicidade faz-se precisa pelo conceito de permutação cı́clica, seja c = c1 . . . ck uma
sequência qualquer, a permutação cı́clica de ordem n de c é dada por ln = l1 · ln−1 (c), onde l1 (c) =
c2 c3 . . . ck c1 .
Particularmente, dado um conjunto proibido irredutı́vel F associado ao ssf XF sobre um alfabeto
A, para todo v ∈ B(XF ) uma condição de necessidade para q ∈ Cv é que q ∈ S(A−1 F) e exista
p ∈ S(v) tal que pq ∈ F, satisfeito isso, a condição de suficiência requer que q não possua fatores
próprios em Cv . Se F possui um elemento w cı́clico, ou seja, para todo n ∈ Z tem-se que ln (w) ∈ F,
demonstramos no Lema 87 que a determinação dos elementos de Cv pode ser simplificada.
Lema 87. Suponha w ∈ F tal que ln (w) ∈ F para todo n ≥ 0. Seja v ∈ P(wA−1), |v| > 0. Se
p ∈ S(A−1 v), |p| > 0, então v −1 w é prefixo de p−1 ln (w), onde n = |v| − |p|.
Demonstração: Como p ∈ S(v), então existe u ∈ P(v) tal que v = up, logo v −1 w = (up)−1 w =
p−1 (u−1w), do que segue que v −1 w é prefixo de p−1 ln (w) uma vez que u−1 w é prefixo de ln (w).
Segue do Lema 87 que para todo w ∈ F, um elemento cı́clico, para qualquer v ∈ P(wA−1) não
nulo e p ∈ S(A−1 v), a sequência p−1 ln (w) não pertence a Cv .
Proposição 88. O conjunto de restrições de w = w1 w2 . . . wn ∈ P(R H · A−1 ), |w| > 0, é dado por
Cw = {wn−1, w −1 R H, wn−1L S, wn−1L H C}.
Demonstração: Como gg −1 ∈ O, g ∈ Γ0 , então wn−1 ∈ Cw . Segue do Lema 87 que para todo

v ∈ S(w), |v| > 0, w −1 R H é prefixo de v −1 R H e como o conjunto O é irredutı́vel, w −1 R H não
possui prefixos nos conjuntos (S(w))−1 L S e (S(w))−1 L H C. Do que segue que w −1R H ∈ Cw .
Do Corolário 82 obtém-se que S(w) ∩ P(L H ∪ L H C) = {ε, wn }. Seja wn−1 L S = H
e wn−1 L H C = {D1 D2 . . . Di Hi+1 }∞ −1
i=1 . Isto implica que wn L S não pode ser prefixo de uma
sequência em wn−1L H C, pois, tomado um ciclo de vértices como referência, |H| > |D1 | e |H| ≤
|D1 D2 |, caso contrário haveria H-ciclos contendo cadeias de L-ciclos como fator. De forma mais
direta, pelo mesmo motivo L-ciclos em wn−1 L S não podem ter prefixos em wn−1 L H C. Concluimos
que {wn−1 L S, wn−1 L H C} ⊆ Cw .
Proposição 89. O conjunto de restrições de w = w1 w2 . . . wn ∈ P(L S · A−1 ), |w| > 0, é dado por
Cw = {wn−1, wn−1 R H, w −1L S, w −1L H C}.
Demonstração: Como gg −1 ∈ O para todo g ∈ Γ0 , então wn−1 ∈ Cw . Do Corolário 82, S(w) ∩

P(R H) = {ε, wn }, e do Lema 85 wn−1R H não possui prefixos em S(w)−1 L S e S(w)−1 L H C.
Como ciclos não possuem fatores gg −1, g ∈ Γ0 , então wn−1 R H ∈ Cw .
Segue do Lema 87 que w −1 L S é prefixo de v −1 L S para todo v ∈ S(w), |v| > 0. Além
disso, como o conjunto O é irredutı́vel, w −1 L S não pode ser fator dos elementos em w −1 L H C
e vice-versa. No entanto w −1 L S é fator de todo elemento em v −1 L H C tal que v ∈ S(A−1 w),
|v| > 0. O que decorre de w(w −1L S) ser prefixo de (wv −1 ) · v(v −1 L H) já que |w(w −1L S)| =
|H| + 1 −|w| + |w| = |H| + 1 e |(wv −1) · v(v −1 L H)| = |H| −|v| + |v| + (|w| −|v|) = |H| + |w| −|v|,
onde |w| − |v| ≥ 1. Como gg −1 ∈ O, g ∈ Γ0 , não pode ser fator das sequências em L S e L H C.
Conclui-se que {w −1 L S, w −1 L H C} ⊆ Cw .
Referenciando a Proposição 88, notamos que os elementos wn−1, w −1 R H, wn−1 L S e wn−1 L H C

não são só suficientes para determinação do conjunto Cw , mas necessários. Como exemplo, temos que
Cw \{wn−1L H C} = {wn−1 , wn−1R H, wn−1 L S} o que permanece válido se wn−1L H C for permutado
com quaisquer dos elementos à direita na expressão. Considerando w = w1 . . . wn ∈ P(R H · A−1 ),
como O é irredutı́vel então wn−1 não é igual a w −1 R H, wn−1 L S ou pertence a wn−1L H C, caso
contrário wn wn−1 seria igual a wn (w −1R H), wn (wn−1 L S) ou pertenceria a wn (wn−1 L H C). Segue
do Corolário 82 que w −1 R H não pode pertencer a wn−1 L S ∪ wn−1L H C, caso contrário o R-
ciclo wn (w −1 R H) de comprimento maior que um pertenceria ao conjunto de L S-ciclos e L-cadeias
wn (wn−1L S ∪ wn−1 L H C). Por fim, wn−1 L S ∈
/ wn−1L H C, caso contrário o L S-ciclo wn (wn−1 L S)
conteria cadeias de L-ciclos.
De forma análoga, mas agora referenciando a Proposição 89, consideremos w = w1 . . . wn ∈
P(L S · A−1 ). Como O é irredutı́vel, temos que wn−1 não é igual a wn−1R H, w −1L S ou pertence a
w −1 L H C. Segue do Corolário 82 que wn−1R H não pertence a w −1 L S ∪ w −1 L H C. Finalmente,
w −1 L S ∈
/ w −1 L H C, caso contrário o L S-ciclo w(w −1L S) conteria cadeias de L-ciclos.
Sabendo que o conjunto O é irredutı́vel, uma forma de estabelecer o resultado que o código
geodésico gera um ssr é provar que existe um número finito de possı́veis conjuntos de restrições
{Cw }w∈B(Xg ) . Há duas formas de {Cw }w∈B(Xg ) ser finito, a primeira é trivial, e ocorre quando P(OA−1 )
é finito. Neste caso os conjuntos de restrições também são finitos já que são subconjuntos de S(A−1 O).
No segundo caso, apesar do conjunto O ser infinito, suas propriedades estruturais podem ser aplicadas
para determinar-se o conjunto {Cw }w∈B(Xg ) finito. É este o princı́pio do Teorema 92.
Como consequência das restrições decorrentes das L H-cadeias, para todo w ∈ B(Xg ), o conjunto
Cw é infinito. Contudo, o sub-conjunto de Cw formado pelas sequências decorrentes das restrições
gg −1, g ∈ Γ0 , dos R H-ciclos e dos L S-ciclos é finito, já que a união destas sequências gera
um conjunto finito. Associado a isso, a despeito do conjunto de L H-cadeias ser infinito, pode-se
demonstrar como decorrência do Lema 90 que os possı́veis conjuntos de restrições determinados por
este é finito. Estabelecido isso, temos que o conjunto de restrições {Cw }w∈B(Xg ) é finito.
A seguir faremos uso das nomenclaturas {L H C, L S, R H}-prefix, sufixo, restrições para de-
nominar prefixos, sufixos e restrições associados aos elementos dos conjuntos L H C, L S, R H,
respectivamente.
Lema 90. Seja v um L H C-prefixo, v = H1 D1 . . . Dn p, |p| > 0. As L H C-restrições de v em Cv

são da forma

pq = H,
q: (6.1)
pq = D . . . DH.
Demonstração: Estabelecemos inicialmente que u−1 L H C ∈ Cv onde u ∈ S(v), somente se u = v.

Suponha que v possui um sufixo próprio não nulo u, satisfazendo uq ∈ L H C para um q inicialmente
arbitrário. Quanto a forma de u, consideramos os dois possı́veis casos: (i) u é uma L H-cadeia
satisfazendo u = sDj . . . Dn p tal que s ∈ S(A−1 H1 ) ou s ∈ S(Di ), onde 1 ≤ i, j ≤ n; (ii) u é um
L-ciclo satisfazendo u ∈ S(p), |u| > 0. Considerando inicialmente o caso (i).
(i) Supondo que sDD . . . Dpq = HDD . . . DH, isto implica que o primeiro L H-ciclo é formado
por cadeias de L-ciclos de comprimento menor que o seu, uma contradição;
(ii) Neste caso, existe q ′ satisfazendo uq ′ = H, permitindo a formação da cadeia (uq ′ )DD . . . DH ∈
L H C. Portanto, como há w tal que pw é um L H-ciclo, ou seja, vw ∈ L H C, têm-se que
w ∈ P(q ′ ) e portanto q ′ DD . . . DH ∈
/ Cv .
Segue de (i) e (ii) que se q é uma L H C-restrição de v então vq ∈ L H C. Portanto, q só poderá ser
da forma especificada em (6.1). Como O é irredutı́vel, as R H-restrições de v não são prefixos de
suas L H C-restrições. Além disso, como |p−1 L S| > |p−1 L H| > |p−1 L D| então as L S-restrições
de v não são prefixos de q. Já que q não possui prefixos próprios entre as sequências satisfazendo
(6.1), como consequência de O ser irredutı́vel, conclui-se que q ∈ Cv .
Proposição 91. Seja v = HD . . . Dp, |p| > 0, um L H C-prefixo próprio e w um L S-prefixo

satisfazendo p = A−1 w, então Cv = Cw .
Demonstração: Inicialmente observe que, em decorrência da ciclicidade das L S sequências con-

tidas em O, o fato de p ser um fator não nulo de um L S-prefixo implica que ele também é um
L S-prefixo, portanto possuindo as propriedades comuns aos elementos deste conjunto.
Segue da Proposição 89 e do fato de p ser um sufixo não nulo do L S-prefixo w = w1 . . . wn
que {wn−1 , wn−1 R H} ⊆ Cv , pois do Lema 85 wn−1 R H não possui prefixos entre as L S-restrições e
L H C-restrições. Além disso as L H C-restrições de w contidas no conjunto Cw formam o conjunto
w −1 L H C = {qD . . . DH}, tal que wq ∈ L H. Como p é sufixo de w e |w| = |p| + 1, se qD . . . DH
é uma L H C-restrição de w então HD . . . D(pq)D . . . DH ∈ L H C pois pq ∈ L D, decorrendo do
Lema 90 que qD . . . DH é uma L H C-restrição de v em Cv .
Por outro lado, considerando s ∈ Cv uma L H C-restrição de v, de acordo com o Lema 90,
podemos ter dois casos:
(i) Se s é um L-ciclo satisfazendo ps ∈ L H, então ws ∈ L S uma vez que p−1 L H = (A−1 w)−1 L H
= w −1 [(A · L H) ∩ L S] = w −1L S, consequentemente s ∈ Cw é uma L S-restrição de w;
(ii) Se s = qD . . . DH é uma L-cadeia satisfazendo pq ∈ L D, então wq ∈ L H e, portanto, s é uma

L H C-restrição de w.
Finalmente, segue do Lema 87 que w −1L S é um prefixo próprio de p−1 L S, como p−1 L H =
w −1 L S é uma L H C-restrição de v então p−1 L S ∈
/ Cv . Conclui-se que o conjunto formado pelas
L S-restrições, L H C-restrições e R H-restrições de v e w são iguais, portanto Cv = Cw .
Na Proposição 91, como cada gerador do grupo fuchsiano está associado a um único L-ciclo,
especificado p a sequência w fica unicamente determinada e sempre vai existir por ser o fator de um
L-ciclo completo.
Teorema 92. Dado um código geodésico Xg , o conjunto {Cw }w∈B(Xg ) é finito.
Demonstração: Como em cada vértice da região fundamental F encontra-se um número finito de

suas imagens {gF }g∈Γ (não há elementos parabólicos), então há um número finito de conjuntos de
restrições Cw associados aos prefixos próprios w das sequências em R H ∪ L S ∪ {gg −1}g∈Γ0 , uma
vez que cada um dos conjuntos que compõem esta união é finito.
Da Proposição 91, os possı́veis conjuntos de restrições gerados pelos L H C-prefixos é finito, uma
vez que o conjunto de restrições Cv de um L H C-prefixo v = HD . . . Dp é determinado por p, como
o conjunto P(L D) de possı́veis prefixos de L D-ciclos é finito, então o conjunto {Cv }v∈P(LHCA−1 )
também é finito. Além disso, decorre da mesma proposição que este conjunto de restrições está
contido naquele dos L S-prefixos próprios de comprimento maior que um.
Proposição 93. R H-prefixos próprios distintos possuem conjuntos de restrições distintos.
Demonstração: Dados os R H-prefixos próprios distintos v = v1 . . . vn e w = w1 . . . wm , serão

considerados os dois únicos casos possı́veis, a saber, (i) vn = wm e (ii) vn 6= wm .
(i) Como w 6= v então w −1 R H =

6 v −1 R H. No entanto wm
−1
= vn−1 , wm
−1
L S = vn−1 L S e
−1
wm L H C = vn−1 L H C, do que segue que Cw 6= Cv .
−1
(ii) Inicialmente, observe que |wm L S|, |vn−1L S| ≥ 2, uma vez que ciclos completos possuem com-
−1
primento pelo menos quatro, disso segue que wm 6 vn−1 . Além disso, do Corolário 82 segue
LS =
−1
que wm L S 6= v −1 R H, caso contrário essas sequências possuiriam fatores de comprimento maior
−1
que dois em comum. Finalmente, wm / {vn−1 L S, vn−1 L H C}, pois especificada uma posição
LS ∈
−1
em um L-ciclo e o elemento associado, o ciclo é unicamente determinado. Como wm L S ∈ Cw e,
−1
no entanto, wm LS ∈
/ Cv , conclui-se da Proposição 88 que Cw 6= Cv .
Proposição 94. L S-prefixos próprios distintos possuem conjuntos de restrições distintos.
Demonstração: Dados os L S-prefixos próprios distintos v = v1 . . . vn e w = w1 . . . wm , serão

considerados os dois únicos casos possı́veis, a saber, (i) vn = wm e (ii) vn 6= wm .
−1
(i) Neste caso temos que wm = vn−1 e wm
−1
R H = vn−1 R H, portanto, resta provar que v −1 L S ∈
/
(w −1 L S ∪ w −1 L H C) o que da Proposição 89 implica que Cv 6= Cw . Como w e v estão associados
ao mesmo L-ciclo, pois possuem os elementos un e wm iguais, temos necessariamente que para
serem distintos é preciso que |w| =
6 |v|. Consideramos, sem perda de generalidade, que |w| < |v|,
logo v −1 L S =
6 w −1 L S pois |w(w −1L S)| = |v(v −1L S)|. Como as sequências em w −1L H C
sempre conterão L-cadeias, pois |w| < |w(w −1L H)|, então v −1 L S ∈
/ w −1 L H C. Concluı́mos
que v −1 L S ∈
/ Cw .
(ii) Supondo o subconjunto A = {pD . . . DH} de L H C-restrições com sequências satisfazendo

a condição |p| > 0 e |L D · p−1 | > 0, ou seja, p é um sufixo próprio não nulo de um L D-
ciclo. Portanto, há um único L S-prefixo possı́vel w ∈ P(L H) ∩ L H C · (pD . . . DH)−1 . Sendo
caracterizado pela propriedade wp ∈ L H.
Novamente considerando o subconjunto A = {pDD . . . DH} de L H C-restrições, mas agora su-
pondo que p ∈ L D, então P(L H) ∩ (L H C · (pD . . . DH)−1 ) = {w, v}, sendo os dois casos
possı́veis determinados pelas relações w ∈ L H e vp ∈ L H, o que implica que |v| = 1. Por-
tanto, segue da Proposição 89 que o conjunto Cv é composto pelas restrições v −1 L S ∈ L H, vn−1 ,
vn−1 R H e v −1 L H C, esta última formada por L-cadeias da forma {D . . . DH}. Desta forma, as
restrições podem ser separadas em quatro tipos: um L H-ciclo, uma sequência de comprimento
um (o inverso de vn ), um R-ciclo (podendo ter comprimento um), e um conjunto de L-cadeias com
número infinito de elementos.
Já Cw é composto por um total de cinco tipos de restrições, sendo estas: w −1 L S = wm+1 ,
−1 −1
wm , wm R H, L H ∩ w −1 L H C e w −1 L H C\L H, esta última formada por L-cadeias da forma
{D . . . DH}. Portanto, as restrições podem ser separadas em cinco tipos: o elemento wm+1 subse-
quente a wm em um L-ciclo, o inverso de wm , uma R-sequência (podendo ter comprimento um),
um L H-ciclo e um conjunto de L-cadeias com número infinito de elementos.
Para que Cv = Cw é necessário que os subconjuntos infinitos de L-cadeias correspondentes sejam
iguais. Sendo as outras restrições associadas aos conjuntos Cv e Cw dadas por {vn−1 , vn−1 R H,
6.3 Códigos de Artin para o Caso da Tesselação {12, 4} 145
v −1 L S} e {wm
−1 −1
, wm R H, w −1L S, w −1 L H C ∩ L H}, respectivamente. Como estes conjuntos
possuem cardinalidades distintas, conclui-se que Cv e Cw são distintos.
Proposição 95. Sejam w = w1 . . . wm ∈ P(L S · A−1) e v = v1 . . . vn ∈ P(R H · A−1 ) sequências

não nulas. Então Cw = Cv se, e somente se, w = v.
Demonstração: As L-cadeias pertencentes ao conjunto Cv são da forma D . . . DH, tal que, vn D . . .

DH ∈ L H C. Sendo as demais restrições dadas por vn−1 L S, v −1 R H e vn−1 . Portanto, para que
Cw possua o mesmo conjunto de L-cadeias, deve-se ter (i) w ∈ L H ou (ii) |w| = 1, pois são os
dois únicos casos onde as L H C-restrições são da forma D . . . DH. Neste caso, considerando-se a
Proposição 89 e a Proposição 88, tem-se:
(i) Além das L-cadeias, o conjunto Cw possui os elementos w −1 L H C ∩ L H, wm

−1 −1
, wm R H,
w −1L S. Portanto, Cw é distinto de Cv já que este último só possui três restrições além das L-
cadeias, enquanto o primeiro possui quatro.
(ii) Como os subconjuntos das restrições formados pelas L-cadeias são iguais e |w| = 1, então
vn = w. Seque que os conjuntos {vn−1 , vn−1 L S, v −1 R H} e {w −1, w −1 L S, w −1 R H} das demais
restrições em Cv e Cw , respectivamente, devem ser iguais. Como vn−1 = w −1 e vn−1 L S = w −1 L S
(pois vn−1 L S e w −1 L S são as únicas L-sequências de comprimento maior que um em Cv e Cw ,
respectivamente), deve-se ter v −1 R H = w −1 R H para que Cv = Cw , do que segue que |v| =
|w| = 1 e v = w.
6.3 Códigos de Artin para o Caso da Tesselação {12, 4}

O objetivo desta seção é exemplificar a determinação dos conjuntos definidos nas seções anteriores
e demonstrar como os resultados obtidos podem ser aplicados na construção de uma representação
determinı́stica e com número mı́nimo de vértices para o código de Artin, apresentado no Capı́tulo 5.
Faremos uso da tesselação {12, 4}, que refere-se ao caso {8g − 4, 4} estudado em [9], para g =
2. Apresentamos na Figura 6.6 a região fundamental e identificação de arrestas associadas a essa
tesselação.
Inicialmente devemos especificar os conjuntos relevantes de ciclos de geradores para determinação
do conjunto O, do qual determinaremos os possı́veis conjuntos de restrições {Cw }w∈B(Xg ) e, portanto,
como demonstrado no Capı́tulo 3, o conjunto de estados de nossa representação.
g1 F
7
8 6
g1
9 5
F
10 4
11 3
12 2
1
D
Figura 6.6: Região fundamental e identificação de arestas da tesselação {12, 4}.
Sequências de geradores associadas aos L-ciclos de vértices gerados a partir dos pares de vértices
e lados (v1 , s1 ), (v10 , s10 ) e (v6 , s6 ) são especificados em (6.2), respectivamente. Exemplificando o
processo para o par (v1 , s1 ) pela aplicação do método apresentado na Seção 6.1, onde “∗” denota
g1 ∗ g8
a reflexão de uma aresta em torno de um vértice, obtemos, (v1 , s1 ) −→ (v8 , s7 ) −→ (v8 , s8 ) −→
∗ g7 ∗ g2
(v7 , s6 ) −→ (v7 , s7 ) −→ (v2 , s1 ) −→ (v2 , s2 ) −→ (v1 , s12 ), com os demais determinados de forma
análogo.
{g1 g8 g7 g2 , g10 g5 g4 g11 , g6 g9 g12 g3 }. (6.2)
Observamos que todos os elementos do conjunto simétrico de geradores Γ0 ocorrem em uma, e só
uma, das sequências em (6.2). Portanto, este conjunto contém todas as sequências possı́veis, a não
ser por uma permutação cı́clica. De forma similar, em (6.3) apresentamos as possı́veis sequências
de geradores associadas aos R-ciclos de vértices, considerando os pares de vértices e lados (v2 , s1 ),
(v11 , s10 ) e (v3 , s2 ), respectivamente. Exemplificando o processo para o par (v2 , s1 ) obtemos, (v2 , s1 )
g1 ∗ g6 ∗ g7 ∗ g12
−→ (v7 , s7 ) −→ (v7 , s6 ) −→ (v8 , s8 ) −→ (v8 , s7 ) −→ (v1 , s1 ) −→ (v1 , s12 ) −→ (v2 , s2 ), com os
demais determinados de forma análogo.
{g1 g6 g7 g12 , g10 g3 g4 g9 , g2 g11 g8 g5 }. (6.3)
Com relação a (6.2), observamos que às transformações associadas as sequências de geradores apre-
sentadas são iguais a identidade, ou seja, g2 g7 g8 g1 = g11 g4 g5 g10 = g3 g12 g9 g6 = Id. Portanto,
de acordo com a Definição 39, essas sequências podem ser empregadas diretamente na determinação
dos L-ciclos completos, só sendo necessária a troca de cada um dos dı́gitos da sequência pelo seu
inverso em Γ0 e subsequente especificação das possı́veis permutações cı́clicas. Aplicando essas
transformações em (6.2) listamos os possı́veis L-ciclos completos em (6.4). Para exemplificação,
tomemos a sequência de geradores g1 g8 g7 g2 , tracando cada um dos elementos por seu inverso em
Γ0 obtemos a sequência g7 g6 g1 g12 , todas as permutações cı́clicas desta sequência gera a primeira
linha em (6.4).
{g7 g6 g1 g12 , g6 g1 g12 g7 , g1 g12 g7 g6 , g12 g7 g6 g1 }
{g8 g11 g2 g5 , g5 g8 g11 g2 , g2 g5 g8 g11 , g11 g2 g5 g8 } (6.4)
Empregando o mesmo procedimento com relação às sequências em (6.3), mas agora utilizando a
Definição 40, listamos todas os possı́veis R-ciclos completos em (6.5).
{g4 g5 g10 g11 , g5 g10 g11 g4 , g10 g11 g4 g5 , g11 g4 g5 g10 } (6.5)
Como os L-ciclos e R-ciclos completos possuem comprimento quatro, os L H-ciclos são formados
por todos os prefixos (ou fatores) de comprimento dois em (6.4), os L S-ciclos pelos prefixos (ou
fatores) de comprimento três e os L D-ciclos pelos prefixos (ou fatores) de comprimento um. De
forma similar definimos R-ciclos relevantes a partir dos ciclos em (6.5). A partir da Proposição 84, o
ssf gerado pelo código aritmético do fluxo geodésico Xg é determinado pelo conjunto de proibições
irredutı́veis O = L S ∪ L H C ∪ R H ∪ {gg −1}g∈Γ0 . Em (6.6) apresentamos o conjunto de L S-
ciclos, em (6.7) o conjunto de R H-ciclos e em (6.8) alguns elementos do conjunto de L H-cadeias,
lembrando que esse conjunto é infinito.

 g g g, g g g , g g g, g g g ,
 7 6 1 6 1 12 1 12 7 12 7 6


LS = g8 g11 g2 , g5 g8 g11 , g2 g5 g8 , g11 g2 g5 , (6.6)


 g g g , g g g, g g g, g g g

4 3 10 9 4 3 10 9 4 3 10 9

 g g, g g, g g, g g,
 7 8 8 1 1 2 2 7


RH= g4 g5 , g5 g10 , g10 g11 , g11 g4 , (6.7)


 g g, g g, g g, g g

12 9 9 6 6 3 3 12



 g7 g6 g6 g6 g1 ,


g7 g6 g6 g6 g6 g1 ,






g g g12 g12 g12 g7 ,


 1 12


..
LHC = . (6.8)


g2 g5 g1 g5 g1 g5 g1 g12 ,






g4 g3 g3 g3 g3 g3 g3 g10




 ...



Nosso objetivo é determinar o conjunto {Cw }w∈P(OA−1 ) , a partir do qual determinaremos uma apresen-
tação determinı́stica mı́nima para o código, como apresentado na Seção 3.12. Para isso faremos uso
dos resultados da Seção 6.2, empregando-os para guiar-nos na especificação de um método simples
de obter a representação.
1. A partir da Proposição 94, para quaisquer v, w ∈ P(L S · A−1 ) satisfazendo v 6= w, temos que
Cv 6= Cw . Listamos em (6.9) os prefixos próprios desse conjunto, empregando (6.6).



 g7 g6 , g6 g1 , g1 g12 , g12 g7 ,


g g , g g , g g, g g,


 8 11 5 8 2 5 11 2


P(L S · A−1 ) = g4 g3 , g9 g4 , g10 g9 , g3 g10 , (6.9)


g1 , g2 , g3 , g4 , g5 , g6 , g7 , g8 ,






 g , g , g , g ,ε

9 10 11 12
2. A partir da Proposição 93, para quaisquer v, w ∈ P(R H · A−1) satisfazendo v 6= w, temos

que Cv 6= Cw . Além disso, a partir da Proposição 95, como os elementos em R H possuem
comprimento dois, então P(R H · A−1) ⊂ P(L S · A−1). Portanto, até o momento, as sequências
relevantes já encontram-se presentes em (6.9).
3. A partir da Proposição 91, para todo v = HD . . . Dp, |p| > 0, um L H C-prefixo próprio, o
conjunto Cv é igual ao de uma das sequências em (6.9).
4. O conjunto dos prefixos próprios de {gg −1}g∈Γ0 sempre estará contido no conjunto de prefixos
próprios de L S, ou seja, independente do conjunto O.
Assim, temos em (6.9) o conjunto de sequências necessárias e suficientes para determinar o conjunto
{Cw }w∈B(Xg ) , formando o nosso conjunto V de estados. Para a construção do grafo, precisamos
determinar seus ramos e respectivos rótulos, fazendo uso da construção apresentada na Seção 3.12.
g7 g6
g8 g11 g6 g1
g6
g7 g6
g11 g1
g8 g7 g5
g9 g4 g5 g8
g8 g6
g4 g8
g9 g9 g7 g5 g4
g8 g6
g9 g5
g10 g9 g9 g10 g10 g4 g4 g3
ε g4 g3
g10 g11
g3 g3
g11 g12 g2 g3
g1
g2
g12 g2 g10
g11 g2 g1 g2 g3 g10
g11
g7 g5
g12
g12 g1
g12 g7 g2 g5
g1 g12
Figura 6.7: Autômata inicial parcial do código para tesselação {12, 4}.
Portanto, para w, v ∈ P(L S · A−1 ) e a ∈ A (com A = {a}a∈Γ0 sendo o alfabeto da linguagem do

código), existe um ramo do estado Cv para o estado Cw com rótulo a, se Cva = Cw . Na determinação
dos ramos do grafo, é necessário destacar o caso em que v ∈ L H e va forma uma L-cadeia, pois a
determinação do estado terminal do ramo é baseado na Proposição 91. Neste caso w ∈ P(L S · A−1 ),
|w| = 2, deve satisfazer a equação a = A−1w.
Para facilitar a visualização, representaremos as classes de equivalência determinadas a partir dos
conjuntos de restrições à direita pela única sequência em (6.9) que pertence à classe. Na Figura 6.7
apresentamos o autômato inicial parcial, onde é apresentado o estado inicial ε, as transições a partir
g1
desse (e.g., ε −→ g1 ), as transições de estados cujo rótulo são sequências de comprimento um para
g12
aqueles cujo rótulo são sequências de comprimento dois (e.g., g1 −→ g1 g12 ), por fim, as transições
dos estados cujos rótulos pertencem ao conjunto P(L S · A−1 ) e que quando concatenados com o
rótulo do ramo geram uma L-cadeia, portanto, o próximo estado é determinado pela aplicação da
g12
Proposição 91 (e.g., g1 g12 −→ g12 ). As demais transições podem ser determinadas de forma direta
pelo emprego da Proposição 89, não apresentadas pela complexidade resultante que isso acarretaria à
figura.
Para fins de exemplificação, consideremos a determinação dos ramos, rótulos e vértices terminais,
respectivos, associados aos vértices g6 e g4 g3 . Escolhemos estados cujos rótulos são sequências de
comprimento distinto, no caso um e dois, pois a estrutura das transições a partir de estados com
rótulos de mesmo comprimento são semelhantes. No caso do estado g6 temos que g6−1 · R H = g3
e g6−1 · {gg −1}g∈Γ0 = g8 , sendo os únicos sı́mbolos proibidos a partir do estado g6 , o conjunto de
transições possı́veis é apresentado em (6.10).

g1
 −→ g2 g4 g5 g6
g6 g1 , −→ g2 , −→ g4 , −→ g5 , −→ g6 ,
g6 g7 g9 g10 g11 g12
(6.10)
 −→ g , −→ g , −→ g , −→ g , −→ g .
7 9 10 11 12
No caso do estado g4 g3 temos que g3−1 ·R H = g12 , (g4 g3 )−1 L S = g10 e g3−1 ·{gg −1}g∈Γ0 = g5 , sendo
os únicos sı́mbolos proibidos a partir do estado g4 g3 , o conjunto de transições possı́veis é apresentado
em (6.11). 
g1
 −→ g2 g3 g4 g6
g1 , −→ g2 , −→ g3 , −→ g4 , −→ g6 ,
g4 g3 g7 g8 g9 g11
(6.11)
 −→ g7 , −→ g8 , −→ g9 , −→ g11 .
g3
Com a transição g4 g3 −→ g3 sendo especificada pelo emprego da Proposição 91. O grafo essencial
final, obtido pela eliminação de vértices isolados (não é vértice inicial ou terminal de ramos, só há o
vértice ε), é apresentado na Figura 6.8, com a explicitação das transições partindo dos vértices g6 e
g4 g3 .
g7 g7 g6
g11 g8 g11 g7 g6 g6 g6
g8 g8 g7 g6 g1
g9 g4 g6 g1
g9
g4 g5
g5
g9 g5
g10 g4
g9 g7 g8
g10 g9 g8 g6 g5 g8
g11
g9 g4
g9
g10 g12 g2 g4
g10 g10 g4 g3
g11 g2 g4 g3
g11
g2 g3
g11 g3
g2
g11 g10
g1
g12 g7 g3 g10
g7 g12 g2 g2
g12 g1 g12 g2 g5 g5
g12 g1 g1
Figura 6.8: Representação determinı́stica mı́nima parcial do código para a tesselação {12, 4}.
Capı́tulo 7
Conclusões
A proposta do presente trabalho foi de obter descrições combinatoriais para os fluxos geodésicos
sobre regiões compactas de superfı́cies hiperbólicas, como meio para associar às sequências código
quaisquer, parâmetros topológicos oriundos destas superfı́cies. O encaminhamento para o estabe-
lecimento deste objetivo é caracterizado pelas etapas: (1) Identificação de um procedimento ade-
quado de codificação do fluxo geodésico que reflita a topologia da superfı́cie; (2) Desenvolvimento
de ferramentas de análise do código; (3) Identificação de possı́veis métodos para implementação de
representações; (4) Determinação de representações para o código. Cada uma destas etapas foi abor-
dada na tese, com ordem de exposição refletindo a relação de dependência dos resultados e conceitos
desenvolvidos em cada capı́tulo.
No Capı́tulo 2, determinamos na Seção 2.4 como a propriedade de completude de um sistema
dinâmico de eventos discretos invariante no tempo se reflete na topologia das trajetórias do sistema,
quando especificadas por sequências bi-infinitas e descritas sobre um alfabeto finito, passando a
denomina-los de ssf. Tal relevância decorre de serem os sistemas completos aqueles para os quais
é possı́vel determinar uma representação finita (e.g., através de grafos ou equações a diferença).
No Capı́tulo 3 determinamos uma descrição combinatorial para um ssf, baseada no conceito de
relação de ordem parcial. Estendemos o conceito na Seção 3.9, demonstrando como um ssf pode ser
caracterizado globalmente, através do seu conjunto de restrições irredutı́veis, ou localmente, por con-
juntos de restrições dependentes do contexto ou palavra da linguagem. Na Seção 3.11 demonstramos
como os diversos conceitos de restrição podem ser aplicados na determinação do monoide sintático da
linguagem. Por fim, na Seção 3.12 demonstramos como a coleção de possı́veis conjuntos de restrições
à direita de uma linguagem podem ser empregados na determinação de uma representação minimal
para esta, fato utilizado no Capı́tulo 6.
No Capı́tulo 5 foram apresentados os conceitos e procedimentos sobre os métodos de codificação
aritmético e geométrico do fluxo geodésico, relevantes para a apreciação do trabalho. A partir
153
154 Conclusões
da conjugação Γ por partes que relaciona os códigos aritméticos e geométricos, especificamos na

Seção 5.4 dois métodos para codificação do fluxo geodésico cujas sequências código refletem a topo-
logia da superfı́cie associada. Empregando um particionamento markoviano estendido do bordo do
disco de Poincaré ∂D2 para o método de codificação aritmético associado a uma superfı́cie {8g−4, 4},
na Seção 5.5, determinamos o máximo ssf-completo contido no código resultante e a entropia to-
pológica do código, onde g é o gênero da superfı́cie.
No Capı́tulo 6, empregamos os métodos e conceitos desenvolvidos no Capı́tulo 3 e Capı́tulo 5, de-
terminamos uma representação para o código aritmético ou códigos de Artin, empregando o conceito
de ciclo de geradores, que por sua vez está relacionado a estrutura topológica da superfı́cie. Devido a
estrutura das sequências de restrição associadas ao processo de codificação de Artin, a apresentação
resultante revela considerável regularidade, além de seu método de determinação ser bastante simples.
7.1 Encaminhamentos e Trabalhos Futuros

Durante a realização de nosso trabalho, ficou claro o interesse no emprego de dinâmica simbólica para
abordar problemas que permitem duplicidade de interpretação, por um lado podem ser vistos como
sistemas dinâmicos e por outro como códigos. Neste contexto, há diversos problemas que podem ser
abordados empregando os conceitos de conjuntos de restrição, os quais pretendemos desenvolver em
trabalhos futuros.
1. Extensão do método para PFT’s (Periodic Shifts of Finite-Type);
2. Caracterizar outros tipos de representações minimais a partir dos conceitos propostos;
3. Procurar identificar critérios de necessidade sobre o conjunto de restrições irredutı́veis para geração
de apresentações mı́nimas;
4. Estabelecer métodos para construção de codificadores de linha e para codificação conjunta;
5. Caracterização de ssf’s homogêneos através dos respectivos conjuntos de restrições, como também
a sı́ntese dos codificadores. Contribuindo na determinação de códigos em treliça que também são
sistemas de órbitas e na caracterização de códigos de treliça sobre grupo empregando dinâmica
simbólica.
Quanto aos códigos do fluxo geodésico, duas possı́veis linhas de desenvolvimento são de nosso
maior interesse, com as possibilidades não estando restritas só a estas.
1. Especificação de códigos sobre árvores puramente topológicos, empregando as classes homotópicas

e conceitos de distância topológica;
7.1 Encaminhamentos e Trabalhos Futuros 155
2. Identificação de possı́veis códigos topológicos a serem empregados para codificação das UPO’s
de sistemas dinâmicos em estado caótico sobre atratores de baixa dimensão;
3. Identificação de classes de códigos topológicos aos quais possam ser associados codificadores de
baixa complexidade, empregando descrições dos códigos via conjuntos de restrições.
156 Conclusões
Referências Bibliográficas
[1] Jan C. Willems. Models for dynamics. Dynamics Reported, 2:171–269, 1989.
[2] G. David Forney, Jr. and Mitchell D. Trott. The dynamics of group codes: State spaces, trellis
diagrams, and canonical encoders. IEEE Trans. Inform. Theory, 39(9):1491–1513, September
1993.
[3] Eric J. Rossin, N. T. Sindhushayana, and Chris D. Heegard. Trellis group codes for the gaussian
channel. IEEE Trans. Inform. Theory, 41(5):1217–1245, September 1995.
[4] David Slepian. Group codes for the gaussian channel. Bell Syst. Tech. J., 47:575–602, April
1968.
[5] G. David Forney, Jr. Geometrically uniform codes. IEEE Trans. Inform. Theory, 37:1241–1260,
September 1991.
[6] N. T. Sindhushayana, Brian Marcus, and Mitchell Trott. Homogeneous shifts. IMA Journal of
Mathematical Control & Information, 41:255–287, 1997.
[7] Henrique Lazari. Uma contribuição à teoria dos códigos geometricamente uniformes hi-
perbólicos. Tese de Doutorado, FEEC-Unicamp, 2000.
[8] C. Series. Geometrical markov coding of geodesics on surfaces of constant negative curvature.
Ergodic Theory and Dynamical Systems, 6:601–625, 1986.
[9] Roy L. Adler and Leopold Flatto. Geodesic flows, interval maps, and symbolic dynamics. Bull.
Amer. Math. Soc., 25(2):229–334, October 1991.
[10] Lapo Casetti, Marco Pettini, and E.G.D. Cohen. Geometric approach to hamiltonian dynamics
and statistial mechanics. Physics Reports, 337:237–341, 2000.
[11] George Osipenko. Dynamical Systems, Graphs, and Algorithms. Springer, 2007.
157
158 REFERÊNCIAS BIBLIOGRÁFICAS
[12] Roy L. Adler. Symbolic dynamics and markov partitions. Bull. Amer. Math. Soc., 35(1):1–56,
January 1998.
[13] Samuel Eilenberg. Automata, Languages, and Machines, volume A. Academic Press, 1974.
[14] John M. Howie. Fundamentals of Semigroup Theory. Oxford University Press, 1995.
[15] John E. Hopcroft and Jeffrey D. Ullman. Introduction to Automata Theory, Languages, and
Computation. Addison-Wesley, 1979.
[16] Mark V. Lawson. Finite Automata. Chapman & Hall/CRC, 2004.
[17] Nagabhushana T. Sindhushayana. Symbolic dynamics, automata theory and the theory of co-
ding: A comparative study and applications. Master’s thesis, Cornell University, 1992.
[18] Douglas Lind and Brian H. Marcus. An Introduction to Symbolic Dynamics and Coding. Cam-
bridge University Press, 1995.
[19] Nataša Jonoska. Sofic shifts with synchronizing presentations. Theoret. Comput. Sci., (158):81–
115, 1996.
[20] F. Blanchard and G. Hansel. Languages and subshifts, automata on infinite words. Lecture
Notes in Computer Science, 192:138–146, 1984.
[21] Allan Clark. Elements of Abstract Algebra. Dover Publications, 1984.
[22] M. Crochemore, F. Mignosi, and A. Restivo. Automata and forbidden words. Information
Processing Letters, (67):111–117, 1998.
[23] M.-P. Béal, M. Crochemore, and G. Fici. Presentations of constrained systems with unconstrai-
ned positions. IEEE Trans. Inform. Theory, 51(5):1891–1900, May 2005.
[24] M.-P. Béal, M. Crochemore, B. E. Moision, and P. H. Siegel. Periodic-finite-type shift spaces.
IEEE Trans. Inform. Theory, 57(6):3677–3691, June 2011.
[25] Daniel P. B. Chaves and Cecilio Pimentel. A new algorithm for finding the Shannon cover of
shifts of finite type. In Proceedings of the VI International Telecommunications Symposium -
ITS2006, pages 694–699, 2006.
[26] Arnaldo Garcia and Yves Lequain. Elementos de Álgebra. Projeto Euclides. IMPA, Rio de
Janeiro, second edition, 2003.
REFERÊNCIAS BIBLIOGRÁFICAS 159
[27] Elon Lages Lima. Espaços Métricos. Projeto Euclides. IMPA, Rio de Janeiro, fourth edition,
2007.
[28] John Stillwell. Geometry of Surfaces. Springer-Verlag, 1992.
[29] Peter A. Firby and Cyril F. Gardiner. Surface Topology. Horwood Publishing Limited, third
edition, 2001.
[30] Svetlana Katok. Fuchsian Groups. Chicago Lectures in Mathematics, 1992.
[31] A. Beardon. The Geometry of Discrete Groups. Springer-Verlag, 1983.
[32] Manfredo Perdigão do Carmo. Geometria Riemanniana. Projeto Euclides. IMPA, Rio de Ja-
neiro, third edition, 2005.
[33] Manfredo Perdigão do Carmo. Differential Geometry of Curves and Surfaces. Prentice-Hall,
New Jersey, 1976.
[34] Anatole Katok and Boris Hasselblatt. Introduction to the Modern Theory of Dynamical Systems.
Cambridge University Press, 1995.
[35] Svetlana Katok and Ilie Ugarcovici. Symbolic dynamics for the modular surface and beyond.
Bull. Amer. Math. Soc., 44(1):87–132, January 1991.
[36] Daniel P. B. Chaves, Reginaldo Palazzo Jr., and José R. Rios Leite. Properties of an arithmetic
code for geodesic flows. J. Phys.: Conf. Ser., 285:1–10, 2011.
[37] Gian Mario Maggio and Zbigniew Galias. Applications of symbolic dynamics to differential
chaos shift keying. IEEE Trans. Circuits Syst.-I, 49(12):1729–1735, 2002.
[38] J. Schweizer and Thomas Schimming. Symbolic dynamics for processing chaotic signals-I:
Noise reduction of chaotic sequences. IEEE Trans. Circuits Syst.-I, 48:1269–1282, 2001.
[39] Tim Bedford, Michael Keane, and Caroline Series, editors. Ergodic Theory, Symbolic Dynamics
and Hyperbolic Spaces. Oxford Science Publications, 1991.
[40] C. Series. The infinite word problem and limit sets in fuchsian groups. Ergodic Theory and
Dynamical Systems, 1:337–360, 1981.
[41] D. J. Grabiner and J. C. Lagarias. Cutting sequences for geodesic flow on the modular surface
and continue fractions. Monatsh. Math., 133(4):295–339, 2001.
160 REFERÊNCIAS BIBLIOGRÁFICAS
[42] Joan S. Birman and C. Series. Dehn’s algorithm revisited, with applications to simple curves
on surfaces. In S. M. Gersten and John R. Stallings, editors, Combinatorial Group Theory and
Topology, pages 451–478. Princeton University Press, New Jersey, United States, 1987.
[43] Svetlana Katok and Ilie Ugarcovici. Arithmetic coding of geodesics on the modular surface via
continued fractions. CWI Tract, 135:59–77, 2005.
[44] R. Bowen and C. Series. Markov maps for fuchsian groups. Inst. Hautes Études Sci. Publ.
Math., 50:153–170, 1979.
[45] C. Series. Symbolic dynamics for geodesic flow. Acta Math., 146:103–128, 1981.
[46] Lester R. Ford. Automorphic Functions. AMS, second edition, 1957.

Índice Remissivo
ação de grupo, 88 de geradores, 134

conjunto de orbitas, 89 de vértices, 134
estabilizador, 89 ciclos elı́pticos, 100
orbita, 88 vértices elı́pticos, veja vértice
propriamente descontı́nua, 96 classes de equivalência, 42
autômato, 47 codificação do fluxo geodésico, 116
acessı́vel, 48 congruência, 43
caminho, 47 conjunto de restrições
completo, 49 w-proibições Ow , 62
comportamento, 47 à direita Cw , 64
determinı́stico, 49 à esquerda Dw , 66
essencial, 28, 49 conjunto limite Λ(Γ) de Γ, 96
estados, 47 conjunto proibido irredutı́vel O, 61
estados iniciais, 47
estados terminais, 47 dinâmica simbólica
linguagem representada, 47 código de bloco deslizante,sbc, 33
ramos, 47 domı́nio, 42
trie, 75
equivalência
quociente, 42
cálculo de divisão, 44
espaço de identificação, 100
código aritmético, 119
espaço de sequências sobre grupo, 34
expansão do bordo, 120
espaço métrico, 88
mı́nimo, 122
subconjunto discreto, 89
código de Artin, veja código aritmético
código de Koebe-Morse, veja código geométrico função parcial, 42
código geométrico, 117 função reversa, 57
sequências cortantes, 118 linguagem reversa, 65
sequências de arestas, 118
sequências de polı́gonos, 118 grafo, 130
código sobre grupo, 34 arestas, 130
cı́rculo isométrico, 95 caminho, 130
ciclo estado inicial, 130
L-ciclo, 134 estado terminal, 130
L-sequência, 134 matriz adjacência, 130
R-ciclo, 135 representação, 130
R-sequência, 135 vértices, 130
161
162 ÍNDICE REMISSIVO
grupo, 87 região fundamental, 98

Isom(H2 ) de isometrias de H2 , 93 arestas de Dp (Γ), 99
cı́clico, 88 cantos pares, 117
de estabilizadores, 88 fronteira, 98
discreto, 95 localmente finita, 99
especial linear SL(2, R), 92 mapa de retorno, 109
especial linear projetivo PSL(2, R), 92 região de Dirichlet Dp (Γ), 98
fuchsiano Γ, 96 tesselação, 98
fuchsiano de primeiro tipo, 97 vértices de Dp (Γ), 99
fuchsiano de segundo tipo, 97 relação, 41
metrizável, 96 relação de equivalência, 42
poduto direto, 88 kernel, 43
produto semi-direto, 88 núcleo, 43
subgrupo cı́clico maximal, 101 reflexiva, 42
topológico, 88 simétrica, 42
grupo fuchsiano, 96 transitiva, 42
Γ-congruência, 100 reticulados, 96
assinatura, 102
co-compacto, 101 seção transversal, 108
geometricamente finito, 101 mapa da seção transversal, 108
perı́odos de Γ, 101 semigrupo, 38
sequência de geradores, 134
identificação de arestas, 97 sequências cortantes
linguagem H-ciclos, 118
regular, 48 cadeia, 119
linguagem reversa, veja função reversa cadeia complementar, 119
linguagens regulares, 47 ciclos, 118
ciclos anti-horário, 119
monoide, 38 ciclos horário, 119
A-módulo, 41 ciclos longos, 118
livre A∗ , 39 palavra reduzida, 119
sub-monoide, 39 sequência mı́nima, 119
morfismo, 39 sistema dinâmico, 6
fino, 40 ssf-completo, 128
com variáveis latentes, 9
palavra, 40
comportamento induzido, 18
alfabeto, 40
conjugado topológico, 33
fator, 40
conjunto de restrições, 28
letra, 40
prefixo, 40 especificado instantâneamente, 13
segmento, 40 especificado localmente, 13
sufixo, 40 eventos elementares, 26
produto direto e semi-direto, veja grupo fluxo contı́nuo no tempo, 21
fluxo discreto no tempo, 21
região de Dirichlet, veja região fundamental homeomorfismo, 33
ÍNDICE REMISSIVO 163
homomorfismo, 33 singular, 99
invariante no tempo, 10
inversı́vel, 33
latência, 13
lei de evolução discreta no tempo, 18
linear, 10
memória finita, 13
memória local, 13
na forma de espaço de estados, 15
sequências de eventos, 26
SFT (shift of finite type), 113
simetria, 10
sistema dinâmico fechado, ssf, 32
topologicamente conjugado, 33
superfı́cie, 97
fibrado tangente, 107
gênero, 102
hiperbólica, 97
superfı́cie riemanniana, 106
espaço tangente, 106
estrutura diferenciável, 106
fibrado tangente unitário, 107
parametrização, 106
projeção natural, 108
vetor tangente, 106
vizinhança coordenada, 106
teorema
de Gauss-Bonnet, 92
de Killing-Hopf, 97
de Poincaré, 102
de Siegel, 101
tesselação, veja região fundamental
transformação
anti-conforme, 93
conforme, 93
isométria, 88
trie (tree-like automaton), veja autômato
vértice, 97, 99
Γ-congruente, 100
ciclo de, 97, 134
elı́pticos, 100
ordinário, 99
ponto elı́ptico, 135

Chaves DanielPedroBezerra D

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Chaves DanielPedroBezerra D

Enviado por

Direitos autorais:

Formatos disponíveis

Universidade Estadual de Campinas

Faculdade de Engenharia Elétrica e de Computação

Sistemas Dinâmicos de Eventos Discretos com Aplicação

Autor: Daniel Pedro Bezerra Chaves

Tese de Doutorado apresentada à Faculdade de

Chaves, Daniel Pedro Bezerra

Orientadore: Reginaldo Palazzo Júnior.

1. Sistemas dinâmicos. 2. Grupos fuchsianos.

Tı́tulo em Inglês: Discrete event dynamical systems with application to the

A receptividade e acolhimento da FEEC / UNICAMP.

Aos colegas de pós-graduação pelo apoio.

Pela ajuda e estı́mulo constante dos meus pais.

Lista de Tabelas xvii

Lista de Sı́mbolos xix

Trabalhos Publicados Pelo Autor xxi

2 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica 5

3 Dinâmica Simbólica e Autômatos 37

3.4 Linguagens Regulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

5 Códigos Geodésicos 105

6 Representação de Códigos Geodésicos 133

Referências Bibliográfica 157

Índice Remissivo 161

2.1 Modelo apresentado por Willems. . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

3.1 Diagramas de comutação das expressões RC RB = RBC , LX RC = RC LX , e LXB =

4.1 Exemplo de geodésicas em H2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

5.1 Fluxo geodésico sobre D2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

5.14 Região fundamental. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

6.1 Relação entre ciclo de vértices e sequência de geradores. . . . . . . . . . . . . . . . 135

2.1 R ELACIONANDO C ONCEITOS DE M EM ÓRIA . . . . . . . . . . . . . . . . . . . . . . . . 14

3.1 C LASSES DE E QUIVAL ÊNCIA À D IREITA . . . . . . . . . . . . . . . . . . . . . . . . . 74

Cw - Conjunto de restrições à direita de w

Ao restringirmos as propriedades de uma estrutura matemática, ou equivalentemente, tornarmos seu

Sistemas Dinâmicos, Códigos e Dinâmica

Figura 2.1: Modelo apresentado por

Definição 1. Um sistema dinâmico Σ é definido por uma tripla

onde T ⊆ R é o tempo; W é um conjunto abstrato chamado de alfabeto de sinais; e B ⊆ W T é o

Figura 2.3: Modelo do comportamento Figura 2.4: Relação entre as posições w

mente, T é igual a R ou R+ no caso de sistemas em tempo contı́nuo, e Z ou Z+ no caso de sistemas em

Exemplo 1. A análise do comportamento térmico de um circuito elétrico é um caso tı́pico de constru-

VRC = RC IRC ; VRL = RL IRL ; C V̇C = IC ; L IL = VL (2.1)

I = IRC + IRL ; IRC = IC ; IRL = IL (2.2)

V = VC + VRC = VL + VRL (2.3)

Portanto, o comportamento da porta é formalmente definido em (2.4).

B ={(I, V) : R → R2 |∃ (IRC , VRC , IRL , VRL , IC , VC , IL , VL ) : R → R8

RC LC Ï + (L + RC RL C)İ + RL I = LC V̈ + (RC + RL )C V̇ + V (2.5)

Permitindo a especificação explı́cita do comportamento em (2.6).

B = {(I, V) : R → R2 | satisfazendo a equação (2.5)} (2.6)

ocorre quando w~ 1 representa o centro de massa de um veı́culo lançador de satélites e w

Onde m e a massa do pêndulo, g é a constante gravitacional e ~1z é o vetor unitário na direção z. As

Definição 2. O sistema dinâmico com variáveis latentes é uma quádrupla

com T, W já especificados na Definição 1; A é o conjunto de variáveis latentes e Ba ⊆ (W × A)T o

2.1 Estrutura Básica

2.1.2 Invariante no tempo

(1) Seja T = G um subgrupo aditivo de R e Sg (T, W, B) = (T + g, W, σ g B). Neste caso, os sistemas

2.2 O Conceito de Memória

2.2.1 Concatenação e mapa não-antecipativo

Sejam T ⊂ R e W conjuntos. Para um dado mapa w : T → W definem-se os mapas:

w − := w|T ∩(−∞,0) (o passado estrito de w)

Para B1 , B2 ⊆ W T obtêm-se as extensões B1 Λ− B2 e B1 Λ+ B2 de significado imediato.

Seja T ⊆ R, W1 e W2 conjuntos, como também B1 ⊆ W1T , B2 ⊆ W2T . Consideremos o mapa F :

para t′ ≤ t ⇒ (F w1′ )(t′ ) para t′ ≤ t . O mapa F será chamado estritamente não-antecipativo se

{w ∈ B} ⇔ {w|[t0,t1 ] ∈ B|[t0 ,t1 ] : t0 , t1 ∈ R tal que − ∞ < t0 ≤ t1 < ∞}.

Sendo chamado de L-completo se,