Escolar Documentos
Profissional Documentos
Cultura Documentos
Banca Examinadora
Prof. Dr Reginaldo Palazzo Júnior UNICAMP
Prof. Dr. José Roberto Rios Leite UFPE
Prof. Dr. Cecilio José Lins Pimentel UFPE
Prof. Dr. Henrique Lazari UNESP
Prof. Dr. Carlos Eduardo Câmara FATEC-AM
Campinas, SP
2011
FICHA CATALOGRÁFICA ELABORADA PELA
BIBLIOTECA DA ÁREA DE ENGENHARIA E ARQUITETURA- BAE - UNICAMP
ii
iii
iv
Resumo
Neste trabalho apresentamos um método de descrição combinatorial para o fluxo geodésico sobre uma
região hiperbólica compacta, tendo como objetivo associar a sequências de codificação, parâmetros
topológicos oriundos destas superfı́cies. Isto permite conjugar conceitos topológicos e combinatoriais
oriundos das superfı́cies estudadas com conceitos de teoria da informação e codificação.
Demonstramos como a propriedade de completude de um sistema dinâmico de eventos discretos
invariantes no tempo se reflete na topologia do espaço de trajetórias do sistema, quando especificadas
por sequências bi-infinitas e descritas sobre um alfabeto finito. A mesma estrutura obtida pelo pro-
cesso de codificação do fluxo geodésico, e a qual passamos a chamar de sistema simbólico fechado
(ssf).
Identificamos como um ssf pode ser caracterizado globalmente, através do seu conjunto de res-
trições irredutı́veis, ou localmente, por conjuntos de restrições dependentes do contexto. Ambas
derivadas de relações de ordem parcial. Disto determinamos métodos de representação do ssf.
Através da relação entre os métodos de codificação aritmético e geométrico, propomos processos
de codificação sobre superfı́cies hiperbólicas, determinando como as representações mı́nimas das
sequências código do fluxo geodésico podem ser construı́das a partir das propriedades topológicas e
combinatoriais da superfı́cie.
Palavras-chave: Sistemas Dinâmicos, Dinâmica Simbólica, Linguagem Formal, Conjunto de
Restrições, Grafos Direcionados, Fluxo Geodésico.
Abstract
In this work we present methods for a combinatorial description of the geodesic flow on a hyper-
bolic compact surface, with the intent of identifying how the topological parameters of the surface
may be associated with discrete sequences. This approach allows to conjugate the topological and
combinatorial properties of a surface with concepts of information theory and coding.
We determine the intrinsic topological property of complete and time-invariant discrete dynami-
cal systems whose trajectories are bi-infinite sequences over a finite alphabet. The same structure
generated by the geodesic flow coding methods, that we call shift space.
We show how a shift space can be completely characterized by the irreducible forbidden set and
locally by the constraint sets, and how both can be obtained through partial order relations. As
consequence of these results, some constructions to represent the shift spaces are proposed.
Methods for coding source sequences on hyperbolic surfaces are proposed, based on Γ-piecewise
and common-sets relations that exist between these methods. We conclude by specifying a construc-
tion procedure for presentations of arithmetic codes that is related with the topological and combina-
torial properties of the hyperbolic surface.
Keywords: Dynamical Systems, Symbolic Dynamics, Formal Language, Constraints Set, Direc-
ted Graph, Geodesic Flow.
v
vi
Agradecimentos
Ao meu orientador Professor Doutor Reginaldo Palazzo Júnior pela oportunidade e incentivo para o
desenvolvimento deste trabalho.
A Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) pelo apoio financeiro (Bolsa
DR-II, processo 06/60976-8) concedido durante o perı́odo de março de 2007 a fevereiro de 2011, sem
o qual não seria possı́vel a realização do Programa de Doutoramento em Engenharia Elétrica.
Aos Professores Cecilio José Lins Pimentel e José Roberto Rios Leite pela parceria e comentários
relevantes durante a realização do trabalho.
Aos membros da banca pelos comentários e sugestões para o enriquecimento deste trabalho.
vii
viii
Aos meus pais e irmãs
DEDICO
ix
x
Sumário
Lista de Figuras xv
1 Introdução 1
xi
xii SUMÁRIO
4 Geometria Hiperbólica 87
4.1 Conceitos Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.2 O Plano Hiperbólico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.3 Grupo de Isometrias do Plano Hiperbólico . . . . . . . . . . . . . . . . . . . . . . . 92
4.4 Grupo Fuchsiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.5 Superfı́cies Hiperbólicas e Regiões Fundamentais . . . . . . . . . . . . . . . . . . . 97
7 Conclusões 153
7.1 Encaminhamentos e Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . 154
xv
xvi LISTA DE FIGURAS
xvii
xviii LISTA DE TABELAS
Lista de Sı́mbolos
Σ - Sistema dinâmico
B - Comportamento de um sistema dinâmico
Σa - Sistema dinâmico com variáveis latentes
ΣS - Sistema dinâmico na forma de espaço de estados
Σ∂ - Sistema dinâmico descrito por lei de evolução
Bcompl - Complementação de B
(X, σ) - Sistema simbólico fechado (ssf)
X - Conjunto de sequências bi-infinitas de um ssf
σ - Função deslocamento
(w)i - Conteúdo da posição i de w
d(x, y) - Distância entre os pontos x, y em um espaço métrico M
Z
CkA (u) - Conjunto cilindro
B(X) - Linguagem de X
(S, ·) - Semigrupo com operação “·”
1 - Elemento identidade de um monoide
A∗ - Monoide livre com base A
ϕ - Morfismo
r - Relação de equivalência
∼r - Relação de equivalencia r
X/r - Conjunto quociente de X por r
Σa - Autômato acessı́vel
L - Linguagem ou comportamento de um autômato
ϕL - Morfismo sintático de L
(X, )
V - Conjunto parcialmente ordenado
WY - Maior limite inferior de Y , se existir
Y - Menor limite superior de Y , se existir
FPR - Fatorial prolongável e regular
FTR - Fatorial transitiva e regular
S(·) - Conjunto de sufixos
P(·) - Conjunto de prefixos
O - Conjunto proibido irredutı́vel
Ow - Conjunto minimal de w-proibições
R(w, L) - Contexto à direita de w com relação a linguagem L
L(w, L) - Contexto à esquerda de w com relação a linguagem L
xix
xx LISTA DE SÍMBOLOS
1. D. P. B. Chaves, R. Palazzo Jr., J. R. R. Leite. “Properties of an Arithmetic Code for Geodesic Flows”.
Journal of Physics: Conference Series, vol. 285, pp. 1-10, 2011.
2. D. P. B. Chaves, R. Palazzo Júnior. “Presentations of Constrained Control Sequences for Symbolic Models
of Systems”. Anais of The 2nd International Multi-Conference on Complexity, Informatics and Cybernetics
(IMCIC 2011), Orlando, EUA, pp. 72-77, Março 2011.
3. D. P. B. Chaves, R. Palazzo Júnior. “Properties of an arithmetic code for geodesic flows”. Proceedings of
the Dynamics Days South America, São José dos Campos: INPE, Brasil, Julho 2010.
4. D. P. B. Chaves, R. Palazzo Júnior. “About the syntatic monoid of FP-languages”. Proceedings of The XXI
School of Algebra, Brası́lia: UNB, Brasil, Julho 2010.
xxi
xxii
Capı́tulo 1
Introdução
1
2 Introdução
de Slepian G(x0 ). Como extensão natural para o caso de uma treliça bi-infinita, consideram o produto
direto bi-infinito G Z de G, gerando o código de grupo sobre treliça G Z (x0 ). Os grupos de treliça não
triviais surgem quando consideramos a ação sobre x0 de subgrupos próprios Λ de G Z , neste caso,
para que possamos garantir a determinação de codificadores para Λ(x0 ) e respectivos decodificadores
não catastróficos, como demonstrado em [3], é necessário que Λ seja um sistema simbólico fechado
sobre grupo, o caso central abordado em [2]. Entre os vários problemas em aberto identificados pelos
autores, destacamos a necessidade de métodos algorı́tmicos para a construção de sistemas simbólicos
fechados sobre grupos que representem todas as simetrias de um código de grupo sobre treliça.
Assim como os códigos de Slepian estabeleceram os elementos geminais para posterior introdução
por Forney dos códigos geometricamente uniformes [5], os conceitos apresentados em [3] formam
a base para a generalização dos códigos geometricamente uniformes para espaços de sequências em
[6]. A generalização dá-se pela substituição da estrutura euclidiana por um sistema simbólico fechado
homogêneo Y que sofre a ação de um sistema simbólico fechado sobre grupo X, nesse caso dizemos
que X é o sistema simétrico de Y.
Muitos dos resultados relevantes em [2, 3, 6] são estabelecidos pela aplicação de representações
minimais canônicas através de grafos direcionados dos sistemas simbólicos fechados sobre análise.
Essa é uma abordagem comum no desenvolvimento da teoria de dinâmica simbólica, que com a ex-
tensão de seu escopo para aplicações de natureza combinatorial, passou a adotar resultados e métodos
oriundos da teoria de autômato para abordar problemas de natureza algorı́tmica, e a adotar álgebra
linear como ferramenta para determinar parâmetros globais invariantes a conjugação dos sistemas
simbólicos fechados, como a entropia topológica. Nesse contexto, como primeira contribuição, in-
troduzimos no Capı́tulo 3 um método combinatorial derivado da estrutura topológica dos sistemas
simbólicos fechados, obtido pela aplicação de relações de ordem parcial. Ao contrário dos métodos
anteriores, que aplicam ferramentas oriundas da teoria de autômato em dinâmica simbólica, deriva-
mos uma ferramenta combinatorial baseada na teoria de autômata e linguagens formais a partir das
propriedades topológicas intrı́nsecas dos sistemas simbólicos fechados. Como resultados dos concei-
tos apresentados, além de propormos novos métodos para a determinação de representações canônicas
minimais, pudemos especificar o monóide sintático do sistema simbólico fechado e um método para
implementarmos sua operação a partir de autômatos. Acreditamos que a maior relevância deste re-
sultado reside tanto no potencial das ferramentas introduzidas para análise e determinação de sis-
temas simbólicos fechados com propriedades especı́ficas estabelecidas pelas aplicações citadas nos
parágrafos anteriores, como para construção de codificadores para estes sistemas.
Em seguida, consideramos a possibilidade de associar às sequências código especificadas por um
sistema simbólico fechado propriedades topológicas herdadas possivelmente da estrutura algébrica
subsequente à topologia da superfı́cie. Essa abordagem é motivada pelos trabalhos desenvolvidos no
3
grupo de pesquisa que visam estabelecer um modelo para sistema de comunicação concebido sobre
um espaço hiperbólico. Como referência inicial, citamos a extensão do conceito de códigos geo-
metricamente uniformes para espaços hiperbólicos [7]. A partir desse trabalho, vários outros foram
desenvolvidos que estenderam os resultados, ou inovaram com a aplicação da geometria hiperbólica a
outros elementos constituintes de um sistema de comunicação tı́pico. Em nosso trabalho, procuramos
identificar formas de atribuir a nossas sequências código propriedades topológicas de uma superfı́cie
hiperbólica (de gênero maior que dois). Estas propriedades se refletem nas classes homotópicas ob-
tidas a partir de uma dada superfı́cie, que por sua vez deverão induzir padrões nas sequências código
obtidas a partir dessas curvas. Estas relações são verificadas no processo de codificação geométrico,
aqui denominado código de Koebe-Morse [8]. No entanto, as sequências códigos obtidas por este
processo são demasiadamente complexas, no sentido de não possuirem uma representação através
de grafo direcionado. Como alternativa, há os códigos aritméticos, aqui denominados códigos de
Artin, que apesar de não refletirem de forma tão evidente as propriedades topológicas da superfı́cie,
é sabido (apesar de não determinado na literatura) que possuem uma representação através de grafos
direcionados. A partir de resultados apresentados em [8], propomos no Capı́tulo 5 duas possı́veis
abordagens que conduzam a representações de sequências código do fluxo geodésico, ambas basea-
das na determinação de uma representação para o código de Artin. Assim, no Capı́tulo 6 desenvolve-
mos um método baseado unicamente nos ciclos de geradores da região fundamental para construção
de uma representação minimal para o código de Artin, exemplificando nosso método através dos
códigos propostos em [9]. Estes resultados estabelecem elementos iniciais necessários a aplicação
da abordagem de Willems e teoria de dinâmica simbólica, assim como realizado em [2, 3, 6], para
análise e proposição de códigos e codificadores aos quais possamos atribuir propriedades de natureza
topológica.
A seguir apresentamos uma breve descrição dos tópicos e resultados apresentados nos capı́tulos
que compõem a tese. Onde todos os resultados não referenciados explicitamente, decorrem do desen-
volvimento do nosso trabalho.
No Capı́tulo 2 empregando a abordagem topológica para dinâmica simbólica, na Proposição 6
formalizamos a equivalência entre sistemas dinâmicos invariantes no tempo e completos, introduzidos
em [1], e sistemas dinâmicos simbólicos fechados (ssf), este último o objeto central de estudo da teoria
de dinâmica simbólica.
No Capı́tulo 3 demonstramos como as propriedades topológicas de um ssf podem ser representa-
das combinatorialmente através de um conjunto irredutı́vel de sequências proibidas, especificado por
uma relação de ordem parcial apropriada. A mesma idéia que permite-nos determinar um conjunto
irredutı́vel de sequências proibidas para o ssf pode ser estendido para a determinação de um conjunto
irredutı́vel de sequências proibidas para qualquer fator de uma sequência em ssf. Demonstramos
4 Introdução
como essas caracterizações combinatórias global e local, respectivamente, podem ser empregadas
para a construção de estruturas algébricas (monóide sintático) e representações mı́nimas (autômato
mı́nimo) para o ssf. Resultados que estabelecem os fundamentos para aplicação dos ssf em sistemas
de codificação realizáveis.
No Capı́tulo 4 apresentamos os elementos necessários para apreciação dos resultados posteriores
sobre códigos geodésicos. Em particular, apresentamos os conceitos fundamentais sobre geometria
hiperbólica bidimensional, com ênfase no modelo do disco de Poincaré. Explicitamos a relação que
há entre as propriedades algébricas e topológicas dos elementos do grupo fuchsiano e as propriedades
topológicas da superfı́cie hiperbólica associada.
No Capı́tulo 5 apresentamos as duas classes de códigos do fluxo geodésico, os aritméticos e os
geométricos. Explicitamos a diferença entre estas e o reflexo dessa nas propriedades do código, prin-
cipalmente na complexidade do código gerado, o que é transcrito na capacidade ou não de representar-
se o código através de um grafo direcionado rotulado. Nossa abordagem é baseada em [8], que
permite uma clara comparação entre estes métodos de codificação. Nas Seção 5.5 derivamos propri-
edades estruturais e determinamos a topologia do caso particular apresentado em [9], a saber, de uma
tesselação regular {8g − 4, 4}, onde g é o gênero da superfı́cie. Cuja importância deve-se a possibili-
dade de especificar-se explicitamente a medida invariante do fluxo geodésico associado às respectivas
superfı́cies.
No Capı́tulo 6, empregando os resultados apresentados no Capı́tulo 3, derivamos um método sim-
ples, baseado nas propriedades topológicas do grupo fuchsiano associado a superfı́cie, para gerar uma
representação mı́nima para o código do fluxo geodésico discutido no Capı́tulo 5. É sabido que esse
código possui uma representação, contudo, até onde sabemos, sua determinação (não necessariamente
mı́nima) empregando os métodos disponibilizados na literatura envolve etapas cuja complexidade é
exponencial em relação ao número de estados. Nosso método de determinação de uma representação
mı́nima não necessita de cálculos adicionais, a não ser a determinação de um subconjunto finito de
sequências proibidas decorrentes das propriedades topológicas do grupo fuchsiano associado à su-
perfı́cie, seguido pela determinação dos vértices e ramos da apresentação derivados diretamente do
conjunto de proibições.
Finalmente, no Capı́tulo 7 apresentamos as conclusões e os trabalhos futuros.
Capı́tulo 2
Considerando uma abordagem clássica, a descrição dos sistemas dinâmicos é realizada pela especi-
ficação da evolução do seu espaço de estados. Como exemplo notório e importante, têm-se o estudo
dos sistemas dinâmicos no contexto de equações diferenciais. Nesta abordagem é pressuposto que o
estado evolui de maneira autônoma, ou seja, o caminho descrito no espaço de estado só depende do
estado inicial e das leis de movimento. Portanto, a não ser para algumas situações bem definidas em
sistemas mecânicos e elétricos, a abordagem clássica não deixa claro como as variáveis de estado de-
vem ser especificadas. Além do que, esta abordagem não formaliza como influências externas devem
ser incorporadas, equivalendo a uma evolução do sistema com base unicamente nas forças internas.
Decorre da suposição que o estado evolui de forma determinı́stica, que o sistema encontra-se iso-
lado do ambiente, contudo não existem sistemas isolados. A abordagem clássica assume que a forma
como o ambiente influencia o sistema é conhecida, como também as condições de contorno e como
são geradas as influências externas. Em sı́ntese, ao modelar-se um sistema dinâmico real através de
uma abordagem clássica, em última instância, deparamo-nos com a impossı́vel suposição de termos
que modelar o ambiente.
Um contraponto aos métodos clássicos é apresentado por Willems em [1]. Inspirado em abor-
dagens tı́picas de teoria de circuitos, controle e processamento digital de sinais, como também de
ciência da computação; sua abordagem considera o sistema dinâmico como uma caixa preta que re-
cebe estı́mulos do meio (entradas), e como reação a estes produz uma saı́da. O conceito é similar
ao empregado em teoria de controle, incorporando variáveis de estado a estrutura especificada pelas
entradas e saı́das. O sistema dinâmico passa a ser visto como um objeto que está inserido em seu meio
e interage com este, no entanto é abstraı́do deste, como ilustrado na Figura 2.1. Nesta abordagem,
desejamos determinar a evolução de certos atributos em função do tempo, para isso o conjunto de ins-
5
6 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica
Modelo do w Meio
Sistema Modelo do w Modelo do
Desconhecido
Dinâmico Σ Variáveis de Sistema Meio
Interação Dinâmico Σ Variáveis de
Interação
tantes de tempo relevantes T é selecionado e o conjunto W onde os valores de tais atributos podem
ser observados. As leis que regem a evolução da dinâmica no tempo determinam quais trajetórias
podem ocorrer e quais não podem, especificando o comportamento do sistema.
Nesta abordagem, quaisquer relações que especifiquem a dinâmica (e.g., as equações do modelo)
são empregadas como os elementos básicos para o processo de análise, determinando as considerações
iniciais a partir das quais a análise deve prosseguir, e que devem ser empregados na fundamentação
teórica do sistema dinâmico. Quaisquer pré-considerações sobre o modelo devem ser justificadas pelo
aparato teórico empregado na modelagem. Esta visão contrasta com a clássica, onde o meio também
é visto como um sistema dinâmico especı́fico, o que torna possı́vel considerar-se o sistema dinâmico
sobre análise como autônomo, como consequência o meio deve ser modelado, como ilustrado na
Figura 2.2.
Em consonância com a proposta apresentada, um sistema dinâmico é interpretado como uma
famı́lia de regras que restringem o conjunto de sinais produzidos pelo sistema dinâmico, e por-
tanto, que determinam o comportamento do sistema. O conjunto de todos os sinais compatı́veis
com estas regras definem o comportamento do sistema. No entanto, regras e modelos derivados de
princı́pios fundamentais conterão invariavelmente variáveis adicionais àquelas modeladas, denomi-
nadas de variáveis latentes. Algumas variáveis latentes podem ter propriedades importantes relacio-
nadas a captura da estrutura da memória do sistema, o que conduz ao importante conceito de estado
do sistema dinâmico. Estes elementos são ilustrados no Exemplo 1.
Σ = (T, W, B)
O conjunto T refere-se aos instantes de tempo relevantes para o problema considerado. Usual-
7
w
~1
m
I RC RL
L F~
V ~1z
C L
Sistema w
~2
Meio
1
e.g., sistema axiomático ou leis fundamentais da fı́sica.
8 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica
Além de satisfazer a lei de Kirchhoff para corrente (2.2) e a lei de Kirchhoff para tensão (2.3).
Após a eliminação das variáveis IRC , VRC , IRL , VRL , IC , VC , IL , VL , obtém-se como equação de
comportamento a equação diferencial (2.5).
No Exemplo 1 a descrição das variáveis básicas V, I foi obtida a partir de princı́pios fundamentais.
Contudo, o processo de modelagem envolveu variáveis auxiliares adicionais àquelas descritas, neste
caso IRC , VRC , IRL , VRL , IC , VC , IL , VL , correspondendo às variáveis latentes. A inserção destas
variáveis ocorre essencialmente por tornarem-se convenientes na escrita das equações de movimento,
ou por serem essenciais ao expressar as leis de constituição2 ou de conservação3 que definem o com-
portamento do sistema. Variáveis latentes ocorrem invariavelmente quando o sistema modelado for
tratado como uma interconexão de subsistemas, uma abordagem comum na determinação de mode-
los. Este procedimento é mais uma vez exemplificado no Exemplo 2, onde as variáveis externas dos
subsistemas tornam-se variáveis latentes para o sistema interconectado.
Exemplo 2. Considerando o pêndulo da Figura 2.4. Deseja-se modelar a relação entre as posições
w
~ 1 da massa e w
~ 2 do suporte do pêndulo, podendo ser interpretado como o passo inicial no projeto de
um controlador que estabilize w
~ 1 em uma dada trajetória pelo emprego de w
~ 2 como controle. Como
2
Expressas por relações entre quantidades fı́sicas que são especı́ficas de um material ou substância, aproximando
a resposta do material a forças externas. Ao serem combinadas com equações que expressam leis fı́sicas, permitem a
solução de problemas fı́sicos como a resposta de um cristal a um campo elétrico. Em muitos casos são expressas por
proporções simples, como é o caso da condutividade elétrica ou constante de elasticidade de uma mola.
3
Especifica quando uma propriedade mensurável de um sistema fı́sico isolado não muda enquanto o sistema evolui,
e.g., conservação da massa-energia e da carga elétrica do sistema.
9
d2 w
~1
m = mg~1z + F~
dt2
||w
~1 − w
~ 2 || = L (2.7)
F~ = a(w
~1 − w
~ 2)
B = {(w
~ 1, w ~ : R → R3 e a : R → R satisfazendo (2.7)}.
~ 2) : R → R3 × R3 |∃ F (2.8)
Assim como as tensões e correntes sobre os elementos resistivos, capacitivos e indutivos do Exem-
~ na barra
plo 1 foram empregados como variáveis auxiliares à determinação de um modelo, a força F
do pêndulo e o fator de proporcionalidade a cumpre papel similar. Novamente, a análise do sistema
envolve a interconexão de seus componentes constituintes, cujas especificações dos comportamentos
através das relações entre variáveis de entrada e saı́da sabemos descrever, cujas descrições parciais
envolvem variáveis latentes empregadas na determinação da solução global.
Não só na análise de sistemas reais, como também em abordagens puramente teóricas, as variáveis
latentes assumem um papel relevante. Pois, assim como as variáveis de estado ou as variáveis livres,
são necessárias na redução de equações de movimento à expressões puramente locais no tempo.
Em uma primeira análise, podemos considerar dois tipos de variáveis: as diretamente observáveis
(explı́citas) e as latentes (implı́citas). Como exemplo, em termodinâmica a pressão, temperatura e
volume são variáveis explı́citas, enquanto a energia interna e entropia podem ser consideradas como
variáveis latentes, cujo valor é deduzido a partir das variáveis explı́citas. Em um contexto econômico,
o número de vendas pode ser visto como uma variável explı́cita, enquanto a demanda dos consu-
midores como uma variável latente. Especificar que variáveis são observáveis ou mensuráveis está
relacionado a disponibilidade instrumental e tecnológica, sendo um conceito flexı́vel que adequa-se
aos objetivos da análise. O conceito de variáveis latentes é formalmente estabelecido na Definição 2.
Σa = (T, W, A, Ba )
10 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica
O sistema Σa é chamado de um modelo com variáveis latentes para o sistema dinâmico induzido
Σ = (T, W, Pw Ba ), onde Pw : (W × A)T → W T satisfaz (Pw w)(t) = Pw (w(t)), reduzindo-se a
uma projeção quando aplicado a um elemento de W × A, ou seja, Pw (w, a) := w. Na abordagem
considerada, pode-se interpretar Ba como o comportamento interno do sistema, enquanto Pw Ba como
o comportamento externo.
2.1.1 Linearidade
Um sistema dinâmico Σ = (T, W, B) é dito linear se W é um espaço vetorial e B é um subespaço
linear de W T , este último um espaço vetorial obtido pela adição ponto-a-ponto e multiplicação por
escalar.
2.1.3 Simetria
Seja Σ uma famı́lia de sistemas dinâmicos. Cada elemento em Σ é um sistema dinâmico de acordo
com a Definição 1. Seja G um grupo e G = (Sg , g ∈ G) um grupo de transformações em Σ, ou
seja, cada Sg : Σ → Σ é uma bijeção com Sg1 ◦g2 = Sg1 ◦ Sg2 . O par ordenado (Σ, G) é chamado
de estrutura de simetria. Um elemento Σ ∈ Σ é dito G-simétrico se Sg Σ = Σ para todo g ∈ G.
De modo informal, diz-se que Σ possui G como uma simetria. Como exemplo de simetrias comuns,
pode-se citar:
2.2 O Conceito de Memória 11
(2) Seja (Sgw , g ∈ G) um grupo de transformações sobre W e Sg (T, W, B) = (T, W, Sg B), onde
Sg B = {Sg (w(·)) : T → W |w ∈ B}. A simetria resultante sugere um comportamento que
é invariante sobre algumas mudanças de sinal ou permutações dos componentes das variáveis
externas, e.g., a permutação de partı́culas em um sistema com n partı́culas idênticas.
(3) Seja G = {0, 1} e considere S1 (T, W, B) = (−T, W, RB) onde R é a inversão do eixo do tempo:
(Rf )(t) := f (−t). O sistema de simetria resultante é dito inversı́vel no tempo, como exemplos,
têm-se os sistemas descritos por equações diferenciais contendo só derivados de ordem par.
(4) Seja J uma involução sobre W (i.e., J = J−1 ). Considerando G = {0, 1} e S1 (T, W, B) =
(−T, W, JRB). A simetria resultante é algumas vezes chamada de reversão do tempo. A
involução J é empregado para expressar que pode ser necessário alterar o sinal da velocidade,
em alguns sistemas mecânicos, quando realiza-se uma reversão no tempo.
Nas considerações que seguem, nos restringiremos a explanação de sistemas invariantes no tempo,
particularmente nos casos T = R ou Z. Esta consideração deve-se principalmente ao enfoque em
dinâmica simbólica e a caracterı́stica conceitual do texto, o que faz destes casos mais adequados para
apresentação dos resultados.
Para B ⊆ W T , estes conceitos conduzem às extensões B− , B−0 , B0+ , e B+ de significado imediato.
Sejam w1 , w2 : T → W e t ∈ T . As concatenações em t de w1 , w2 : T → W , representadas por
w1 Λ− w2 e w1 Λ+ w2 , são definidas como
t t
w (t′ ) para t′ <t
′ 1
w1 Λ− w2 (t ) :=
t w (t′ ) para t′ ≥t
2
w (t′ ) para t′ ≤t
′ 1
w1 Λ+ w2 (t ) :=
t w (t′ ) para t′
2 >t
2.2.2 Completude
Relacionado com a possibilidade das equações de comportamento serem escritas através de equações
a diferença, portanto, as equações de comportamento não podem se estender indefinidamente para
o passado, no sentido −∞, como também para o futuro, no sentido +∞. Dito isso, um sistema
dinâmico Σ = (T, W, B) é dito completo se,
{w ∈ B} ⇔ {w|[t,t+L] ∈ B|[t,t+L] : ∀ t ∈ T }.
Se um sistema é L-completo para todo L > 0, será chamado especificado localmente. Se um sistema
é 0-completo, será chamado especificado instantâneamente. Estas noções conduzem a interpretações
intuitivas. Um sistema dinâmico discreto no tempo é governado pelo conjunto de equações a diferença
se, e somente se, ele é L-completo. Para o mapa f : W L → R pode-se tomar qualquer um que
satisfaça f −1 (0) = B|[0,L] ∈ W L , o que formalmente equivale a especificar uma equação a diferença
que defina o comportamento B = {w : Z → W | a equação a diferença é satisfeita para todo t ∈ Z}.
Neste contexto, o inteiro L ∈ Z+ é dito a latência. Similarmente, desconsiderando inicialmente
maiores considerações sobre a continuidade da variedade considerada, um sistema contı́nuo no tempo
governado por um conjunto de equações diferenciais
dn w dn−1 w
f (t), (t), . . . , w(t) = 0, t ∈ R,
dtn dtn−1
Extensão de memória expressa o intervalo de tempo no qual há uma conexão entre o passado e o
futuro. Mais formalmente, diz-se que um sistema dinâmico Σ = (T, W, B) possui memória ∆-finita
(ou que sua memória possui extensão ∆) se
n o
w1 , w2 ∈ B, e w1 |[0,∆) = w2 |[0,∆) ⇒ w1 Λ− w2 ∈ B ,
0
sendo dito de memória finita se possui memória ∆-finita para algum ∆ > 0; ou memória local se pos-
sui memória ∆-finita para todo ∆ > 0. Ao nos referirmos a extensão da memória, como geralmente
adotado, referimo-nos implicitamente a ∆min , o mı́nimo ∆ ∈ Z+ apresentando a propriedade acima.
Quando a memória só é constituı́da do valor presente, ela recebe uma denominação proveniente da
14 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica
é de memória t-finita que w1 ′ Λ − w Λ w4 ∈ B. Logo, w|[t′ ,t′ +t+1) ∈ B|[t′ ,t′ +t+1) para todo
(t −1) (t′ +t+1)−
t′ ∈ Z, consequentemente w|[t′ ,t′ +t] ∈ B|[t′ ,t′ +t] para todo t′ ∈ Z. Segue da definição de um sistema
L-completo que Σ é t-completo. Este resultado é resumido na Proposição 1.
Podendo ser demonstradas implicações associadas a conceitos distintos de memória, como espe-
cificado na Tabela 2.1.
Se T = Z, e se Σ é completo, então as setas verticais da Tabela 2.1 também podem ser revertidas, o
que seguirá da Proposição 1. Destes resultados, a nı́vel de aplicação temos o resultado: Um sistema
discreto no tempo pode ser descrito através de uma equação a diferença com latência L se, e somente
se, ele é completo e possui memória L-finita.
2.2 O Conceito de Memória 15
W
σ−t w20+
w
0 t T
w1−
então o sistema dinâmico resultante será autônomo. No caso contı́nuo, um sistema dinâmico descrito
pela equação diferencial
dn w
n−1
′ d w
(t) = f (t), . . . , w(t) ,
dtn dtn−1
será autônomo (assumindo que f ′ é suficiente contı́nuo), tal que, a equação diferencial possui solução
única para toda a condição inicial
dn−1 w
dw
w(0), (0), . . . , n−1 (0) .
dt dt
2.3 Leis de Evolução 17
Proposição 3. [1] Seja Σx essencial. Então ele é controlável se, e somente se, é estado controlável.
Além disso, se Σx é estado controlável, então Σ é controlável.
Portanto, restringir nossa abordagem ao caso de equações a diferença e diferenciais de primeira ordem
não limita o escopo dos resultados aqui apresentados. Tais modelos são definidos automaticamente
quando o sistema é representado na forma de espaço de estados.
Definição 4. Uma lei de evolução discreta no tempo é definida como uma quádrupla
Σ∂ = (T, W, X, ∂)
A versão contı́nua no tempo análoga a uma relação próximo-estado é uma relação diferencial de
primeira-ordem. Neste caso, no lugar do próximo estado onde o sistema é permitido estar, especifica-
se em que direção e com que velocidade ele pode prosseguir.
Σ∂ = (T, W, X, ∂)
Como caso mais comum, X pode ser pensado como um subconjunto aberto do Rn e identificar
T X com X × Rn . A interpretação a ser dada para tal estrutura é que ((x, v), w) ∈ ∂ significa
que quando o sistema está no estado x, ele poderá prosseguir com velocidade v enquanto produz o
valor de sinal externo w. Definindo o comportamento induzido por ∂ como B∂ := {(w, x) : R →
W × X| x é absolutamente contı́nuo e ((x(t), ẋ(t)), w(t)) ∈ ∂ para todo t ∈ R onde ẋ(t) existe}.
Portanto, o comportamento de uma lei de evolução discreta no tempo pode ser vista como o conjunto
de soluções de uma equação a diferença que é de primeira ordem em x e de ordem zero em w:
2.3 Leis de Evolução 19
f (x(t), w(t), x(t + 1) = 0 (∂ = f −1 (0)). Enquanto uma lei de evolução contı́nua no tempo pode ser
vista como descrita por equações diferenciais que são de primeira ordem em x e de ordem zero em
w: f (x(t), ẋ(t), w(t)) = 0 (∂ := f −1 (0)).
Como no caso discreto, B∂ satisfaz o axioma de estado, além do que também verifica-se que:
∂ ⇒ B∂ ⇒ B e Σ∂ ⇒ ΣS ⇒ Σ.
2.3.1 A lei de evolução induzida por uma representação via espaço de estados
Construção de leis de evolução que simulam um sistema representado via espaço de estados. Consi-
derando, inicialmente, o caso discreto. Seja ΣS = (Z, W, X, BS ) um sistema representado via espaço
de estados, discreto no tempo e invariante no tempo. A lei de evolução induzida por ΣS é definida
por Σ∂ = (Z, W, X, ∂), onde
Decorrendo do discutido na Seção 2.3 que ∂ induz um sistema via espaço de estados, o qual terá
o comportamento representado por B̄S , observamos que BS ⊆ B̄S . Um caso tı́pico onde ocorre a
inclusão estrita é o das Rq -sequências cuja soma dos quadrados existe, l2 (Z, Rq ) (podendo ser escrita
como o sistema (Z, Rq , 0, l2(Z, Rq )). Neste caso B̄S é igual a (Rq )Z , o que inclui l2 (Z, Rq ) como
um subconjunto estrito. Este caso conduz a questão: Quando BS = B̄S ? Para um sistema dinâmico
Σ = (T, W, B) a complementação de seu comportamento é definida por
4
Estes conceitos serão explorados (exemplificados) no Capı́tulo 3 e Capı́tulo 6.
20 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica
Podendo ser demonstrado que Bcompl é o menor subconjunto de W T que é completo e contém B.
Sendo uma consequência direta que Bcompl será invariante no tempo e/ou linear se B for. Estes
conceitos definem os elementos necessários para a demonstração do Teorema 4.
Teorema 4. [1] Seja ΣS = (Z, W, X, BS ) um sistema representado via espaço de estados e B̄S o
comportamento da lei de evolução induzida por ele. Portanto, B̄S = BScompl . Têm-se como con-
sequência que {BS = B̄S } ⇔ {ΣS é completo}. Ou seja, um comportamento BS só é integralmente
representado por uma lei de evolução se, e somente se, ele é completo.
Demonstração: Como consequência de ΣS ser uma representação via espaço de estados, o com-
portamento BS é Markoviano. Portanto, BScompl possui memória 1. Considerando os conceitos da
Seção 2.2 e a Proposição 1, BScompl pode ser descrito por equações de comportamento com latência
de primeira ordem. Seja f (x(t), w(t), x(t + 1), w(t + 1)) = 0, e f −1 (0) = BScompl |[0,1] = BS |[0,1] tal
equação. Decorrendo do axioma de estado que {(x(t), w(t), x(t + 1)) ∈ ∂ e (x(t + 1), w(t + 1), x(t +
2)) ∈ ∂} ⇒ {(w(t), x(t)), (w(t + 1), x(t + 1)) ∈ BS |[0,1] }.
Segue o resultado final do fato que ∂ = {(x0 , w0 , x1 )|∃ w1 tal que f (x0 , w0 , x1 , w1 ) = 0}.
σx = f ◦ (x, w) e c ◦ (x, w) = 0.
ẋ = f ◦ (x, w) e c ◦ (x, w) = 0.
Estas equações apresentam um meio conveniente para pensar-se sobre sistema dinâmicos represen-
tados via espaço de estados. Elas representam sistemas determinı́sticos e completos. A primeira
equação diz como uma realização das variáveis associadas ao sinal externo conduzirá à evolução do
estado, enquanto a segunda equação diz que variáveis externas w podem, de fato, ocorrer quando o
sistema está no estado x.
2.3.3 Fluxos
e
∂ = {((x, v), w)| w = x e (x, v) = f (x)} (contı́nuo no tempo)
(2.11)
equação de comportamento: ẋ = f ◦ (x),
onde foi realizada a associação (não natural) do sinal externo com o estado. Também é necessário
assumir que para qualquer condição inicial, a equação diferencial ẋ = f ◦ (x), x(0) = x0 , possui uma
única solução. Como resultado de (2.10) e (2.11), fluxos definem sistemas autônomos (sendo inter-
pretados como uma propriedade de comportamento BS ). Sendo Markovianos, e portanto, sistemas
representados via espaço de estados.
Segue da Proposição 2 que um sistema autônomo representado via espaço de estados sempre é
22 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica
Portanto, a lei de evolução para um sistema representado via espaço de estados pode ser interpretada
como um fluxo associado com um mapa r : X → W , que permite a “observação do fluxo”.
A abordagem considerando fluxos sobre variedades têm sido empregada como a base para mode-
los dinâmicos em fı́sica. De fato, a mecânica Hamiltoniana6 como também as equações de Schrödin-
ger da mecânica quântica definem fluxos sobre variedades (contudo, os mapas r para observação do
fluxo são definidos implicitamente e de forma não trivial). Apesar de em muitos casos extensiva-
mente abordados, como aqueles tı́picos da mecânica, possa parecer natural considerar fluxos como
a base para a dinâmica. Em um aspecto generalista, podem ser citados pelo menos dois pontos de
inconsistência:
• Dado que os sistemas definidos são autônomos, fluxos consideram o sistema isolado do ambi-
ente ou meio. Neste caso, o procedimento não só apresenta limitações no contexto prático, onde
precisamente a ação e reação do sistema com o ambiente é o elemento de importância central. Ca-
racterı́stica evidente em teoria de controle e ciência da computação. Como também na fı́sica há
várias situações desta natureza. Uma abordagem baseada completamente em fluxos, requer, im-
plicitamente, o isolamento do sistema do seu ambiente, o que demanda a modelagem da ação do
ambiente sobre o sistema, forçando à situação indesejada de ter-se que modelar o ambiente;
• Modelos que começam com fluxos sobre variedades consideram o espaço de estados como dado,
ao passo que na abordagem considerada neste trabalho o comportamento externo é o elemento
essencial e o espaço de estado um objeto matemático conveniente a ser construı́do a partir das
equações dinâmicos que descrevem o comportamento externo. O estado de um sistema não é
uma propriedade fı́sica do sistema real, é uma propriedade do modelo. Como exemplo, enquanto
um modelo do sistema solar considerando os planetas como elementos pontuais com massa gera
um espaço de estados de dimensão finita. Se o mesmo sistema é modelado considerando-se um
dos planetas como uma esfera levemente elástica, então o espaço de estados obtido apresentará
dimensão infinita. Portanto, ao modelar-se através do fluxo sobre uma variedade, o procedimento
é iniciado pela especificação do espaço de estado X, seguido pela determinação das equações
dinâmicas, ou seja, o campo vetorial f . Contudo, isso gera uma lógica circular, já que as equações
dinâmicas é que devem determinar qual será o espaço de estados. Pelo modelamento através do
6
O artigo [10] que além de explicitar este processo, aborda as sistemas Hamiltonianos por uma rica perspectiva
geométrica.
2.3 Leis de Evolução 23
Consideradas as observações acima, objetivando uma maior clareza sobre o que significa isolar
um “sistema” de seu “ambiente ou meio”, consideremos um exemplo qualitativo que evidencie como
o método e abordagem considerados para o estudo de um sistema dinâmico influenciam na complexi-
dade do método e relevância do modelo obtido. Consideremos a modelagem da posição de um corpo
em movimento enquanto exposto a influências do meio. Como exemplos temos a posição de um
pássaro voando, de uma pessoa se movendo em meio a uma multidão ou de um barco navegando em
um mar agitado. Considerando o primeiro caso, sendo a posição do pássaro a variável de interesse,
para descrever sua evolução será necessário introduzirmos como variáveis adicionais, pelo menos, o
movimento de suas asas e as condições atmosféricas em torno do pássaro, o que poderá ser descrito
pela velocidade e direção do vento. A interação entre estas variáveis descreverá o comportamento
do pássaro, sendo especificado por uma “relação de compatibilidade” entre as variáveis envolvidas.
Este seria um ponto de parada adequado para o modelo considerado, já que explica o posicionamento
do pássaro no ambiente constituı́do pelo movimento de suas asas e as propriedades do vento. Um
ponto a observar é que o modelo obtido envolve variáveis não conhecidas - o movimento das asas e a
caracterı́stica do vento.
Caso deseje-se inferir mais sobre a posição do pássaro, será necessário um maior conhecimento
dos elementos envolvidos no processo de modelagem, ou seja, maiores certezas e menos “variáveis”.
Neste caso, pode-se tentar incluir um modelo para a atmosfera, talvez supondo que a velocidade e
direção do vento são constantes, ou que são uma função da altura. Essas considerações reduziriam
as variáveis do modelo à posição do pássaro e ao movimento de suas asas. Como modelo pretendido
para a posição do pássaro, esse é um ponto adequado de parada, já que explica a relação entre a
posição do pássaro e o ambiente onde está inserido, formado pelo movimento de suas asas.
Se ainda assim desejarmos um modelo mais completo, poderemos tentar explicar o movimento
das asas do pássaro. Nos deparamos com a necessidade de refletirmos em nosso modelo a resposta
dada pelo sistema neural do pássaro aos estı́mulos externos conjugados a trajetória “pretendida pelo
mesmo”. Neste contexto, nossas pretensões vão além dos elementos descritivos disponibilizados
pela fı́sica teórica. Vendo-nos compelidos a empregar elementos de ciências prescritivos, tais com
cibernética e inteligência artificial. Ou seja, de alguma forma teremos de descrever por que as asas
do pássaro movem-se como o fazem. Uma forma de abordar o problema seria realizar hipóteses
a cerca das “caracterı́sticas” ou propriedades do fenômeno estudado, tais como a periodicidade do
movimento. Embora empı́rica, trata-se de uma afirmação plausı́vel e que conduziria a uma maior
compreensão do fenômeno estudado, portanto válida.
Uma abordagem alternativa para o estudo exploratório do fenômeno é inseri-lo em um contexto.
24 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica
No caso em particular, poderı́amos supor que o nosso pássaro é uma ave de rapina, e que seu movi-
mento é motivado por capturar uma presa no menor tempo possı́vel. O modelo resultante será uma
relação de compatibilidade associando a posição do pássaro àquela da presa. Tal resultado é o mo-
delo almejado, já que explica a posição do pássaro no seu meio, especificado pela posição da presa.
No entanto, ainda há espaço para o aprimoramento desse modelo. Poderı́amos modelar a posição
da presa. Supondo-a um quadrúpede, sua posição seria determinada pelo movimento de suas patas
e pelo terreno. Inicialmente, poderı́amos modelar o terreno e contextualizar o movimento da presa,
supondo que o movimento de suas patas é determinado pela maximização da distância deste para o
predador. Teremos, neste caso, um modelo para a posição da presa com relação ao seu meio, cons-
tituı́do pelo predador. Como resultado final, obteremos duas relações de compatibilidade descrevendo
o comportamento descrito pelas posições do pássaro e da presa. Conjuntamente, elas nos fornecerão
possivelmente um sistema fechado de equações que determinarão a posição do pássaro como uma
função das condições iniciais.
Este caso acima exemplifica o que significa “um sistema isolado do seu meio mas interagindo
com esse”. O que fica evidente é que isso implicará invariavelmente na ocorrência de variáveis não
explicadas ou não determinadas explicitamente, são estabelecidas de fora para dentro, e portanto,
sendo arbitrárias. De fato, tais funções matemáticas definidas no tempo são partes da modelagem
matemática de sistemas dinâmicos, e que, na maioria das situações de interesse, são constituintes
compulsórios. Além disso, fica claro que propriedades ou caracterı́sticas inerentes ao sistema invi-
abilizam a aplicação de ferramentas teóricas descritivas no estudo deste como um todo, requerendo
invariavelmente o emprego de métodos prescritivos.
Apesar do exemplo apresentado envolver a descrição de fenômenos associados a organismos vi-
vos complexos, o que erroneamente poderia ser empregado como explicação absoluta para os desafios
encontrados, obstáculos não menos desafiadores são descritos em fenômenos de natureza econômica,
social, ou mesmo puramente fı́sica. Isto se deve ao fato de depararmo-nos em muitos casos com sis-
temas que envolvem parâmetros distribuı́dos e onde não há evidências que conduzam a um processo
plausı́vel de simplificação.
A abordagem considerada neste material para descrição de sistemas dinâmicos é evidentemente bas-
tante geral, o que compactua com nossos objetivos de descrever os diversos sistemas empregando
uma linguagem comum, que permita extrair e aplicar conceitos e métodos úteis em um determinado
contexto associado a um sistema dinâmico especı́fico, em outro até então não explorado. Seguem
alguns exemplos tı́picos e importantes descritos através dos elementos até então apresentados.
2.3 Leis de Evolução 25
Mecânica Hamiltoniana
Nessa abordagem consideraremos um caso particular, não considerando abordagens que empre-
gam conceitos geométricos mais sofisticados [10]. Vamos nos limitar ao caso em que o espaço de
configuração Q é um subconjunto aberto de Rm . De acordo com os postulados da mecânica Hamilto-
niana, o movimento de um sistema mecânico pode ser descrito por uma função H : P × Q → R, com
P = Rm , o espaço momento. Essa função H é o Hamiltoniano, determinando as leis de movimento
através das equações canônicas (2.14) e (2.15).
∂H
q̇ = (p, q), (2.14)
∂p
∂H
ṗ = − (p, q). (2.15)
∂q
onde p denota momento e q posição. Assumindo a existência e unicidade de uma solução para este
conjunto de equações diferencias, para qualquer condição inicial p(0) = p0 ∈ Rm e q(0) = q0 ∈ Q.
As equações (2.14) e (2.15) definem um fluxo sobre uma variedade contı́nua P × Q. Formalmente
T = R (ou R+ ), X = P × Q e
∂H ∂H
f= − , .
∂q ∂p
Se, contudo, estas equações são interpretadas como uma forma conveniente de descrever a evolução
da posição q, com o momento p considerado como uma variável auxiliar, então obtém-se um sistema
com variáveis latentes, tal que, T = R, W = Q, A = P , e Ba = {(q, p)| as equações (2.14) e (2.15)
são satisfeitas}. Este sistema é invariante no tempo. Ele é inversı́vel no tempo se H(p, q) = H(−p, q).
A definição de B implica que a posição q é a variável de interesse. Caso também haja interesse na
velocidade então pode-se adicionar (2.16).
v = q̇, (2.16)
De forma geral, sistemas de eventos discretos descrevem situações onde a ocorrência de um evento
permite ou bloqueia a ocorrência de eventos subsequentes. Como exemplos tı́picos, pode-se citar
a linguagem natural, códigos de computadores, sistemas produtivos, etc. Esta definição confere
elementos novos em relação a interpretação usual de um sistema de eventos discretos como uma
26 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica
sequência ordenada de eventos. Com relação a Definição 1, podemos dizer que um sistema de even-
tos discretos é um sistema dinâmico (T, W, B) com T = Z e W um conjunto finito, adicionalmente,
quando o sistema é representado via espaço de estados (ou é definido através de variáveis latentes),
com X (ou o conjunto de variáveis latentes) finito. Estes elementos formam a base para interpretar-se
o conceito de linguagem formal como um sistema dinâmico.
Neste caso (Z, W, B) especifica um sistema dinâmico invariante no tempo no sentido apresentado
na Definição 1, onde determina-se a forma como B é especificado a partir de L. O procedimento
adotado foi adicionar um número infinito de sı́mbolos “antes” e “depois” de cada palavra em L.
Implicando que a interpretação de uma linguagem formal como um sistema dinâmico de eventos
discretos constitui uma generalização da noção de linguagem formal, dado que passa-se a considerar
a possibilidade de palavras infinitas.
Procedimentos comuns para geração de linguagens formais são por meio de gramáticas (po-
dendo ser interpretada como uma forma de descrever sistemas por meio de variáveis latentes) e por
autômatos (que correspondem basicamente às leis de evolução).
7
Estes conceitos serão melhor abordados no Capı́tulo 3.
2.3 Leis de Evolução 27
ai bi
ci−1
((1, 0), 1) ((1, 0), 0)
((1, 1), 0)
Somador
completo ((0, 0), 0) 0 1 ((1, 1), 1)
serial ((0, 0), 1)
((0, 1), 1) ((0, 1), 0)
ci
si
Autômatos
Autômatos são uma ferramenta para representação de linguagens, e no contexto considerado são a
forma de representar um sistema de eventos discretos via espaço de estados. Um autômato é uma
quı́ntupla (Q, A, E, I, T ), ou uma quádrupla quando o conjunto A esta subentendido, onde Q é um
conjunto finito chamado espaço de estados; A também é um conjunto finito chamado de alfabeto,
cujos elementos são chamados de sı́mbolos ou eventos externos elementares; E é a regra de transição,
sendo um subconjunto de Q × A × Q e cujos elementos são chamados de transições ou eventos
internos elementares; I ⊆ Q é o conjunto de estados iniciais; T ⊆ Q é o conjunto de estados
terminais. Uma sequência (s0 , a0 , s1 , a1 , . . . , sn−1, an−1 , sn ), com (si , ai , si+1 ) ∈ E para i + 1 ∈ n e
chamado de caminho, sendo um caminho possı́vel se s0 ∈ I e sn ∈ T .
Autômatos são comumente representados por grafos direcionados tendo os estados como nós,
as transições como ramos com rótulos, estados iniciais como nós acompanhados de uma seta apon-
tando para seu interior e estados terminais como nós com uma seta apontando para fora dele. Es-
tes conceitos e elementos são ilustrados através de um somador completo serial como apresentado
na Figura 2.6. Este autômato realiza a soma de dois números binários, representados por ai e
bi , mais o bit vai-um do estágio anterior, representado por ci−1 no diagrama em bloco e associ-
ado ao estado 0 e 1 do autômato. O bit si é o resultado da operação de soma, mais o bit vai-
um do estágio, que dependendo do valor, implicará em uma transição ou não de estado. Neste
contexto, o rótulo dos ramos é codificado como ((ai , bi ), si ) enquanto ci e ci−1 estão associados a
memória para realização da adição sequencial. Considerando a apresentação anterior sobre siste-
mas de eventos discretos, para tornar a correspondência rigorosa, torna-se necessário introduzir o
elemento ao conjunto A, gerando W := A ∪ {}; adicionar um estado fonte Ω e um estado
terminal Ψ a Q, gerando X := Q ∪ {Ψ, Ω}; e definir a lei de evolução ∂ ⊆ X × W × X como
∂ := E ∪{(Ω, , Ω), (Ω, , 0), (1, , Ψ), (Ψ, , Ψ)}. Estas modificações geram o autômato apresen-
tado na Figura 2.7. O comportamento determinado pelo autômato da Figura 2.7 passa a ser definido
como BQ = {(w, x) : Z → W × X| (x(t), w(t), x(t + 1)) ∈ ∂ para todo t ∈ Z e ∃t−1 , t1 , t−1 ≤ t1 ,
28 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica
Ω Ψ
Figura 2.7: Autômato do sistema de eventos discretos associado ao somador completo serial.
tal que x(t) = Ψ para t < t − 1 e x(t) = Ω para t ≥ t1 }. Desta forma, BQ é constituı́do basica-
mente de caminhos prováveis antecedidos por uma sequência infinita de pares (, Ω), e precedidos
por uma sequência infinita de pares (, Ψ). O que demonstra uma equivalência biunı́voca entre
BQ e a coleção de caminhos possı́veis. Uma palavra a1 a2 . . . an com ai ∈ A, i ∈ n, é represen-
tada por um autômato se há uma sequência s0 , s1 , . . . , sn com si ∈ Q, i = 0, 1, . . . , n, tal que
(s0 , a0 , s1 , a1 , . . . , sn−1 , an−1 , sn ) um caminho possı́vel. O conjunto de todas as palavras representa-
das por um autômato forma uma linguagem formal. Dados estes elementos, uma questão central na
teoria de linguagens formal é como determinar um autômato que represente uma dada linguagem. No
contexto de linguagens formal o desafio está em mostrar que condições L ∈ A∗ deve satisfazer para
que possa ser representado por um autômato com um número finito de estados. Tratando-se de uma
versão do problema de representação via espaço de estados. No Capı́tulo 3 esta questão é respondida
empregando o conceito, lá introduzido, de conjunto de restrições.
Por hora, podemos compreender um pouco mais das propriedades de um sistema de eventos dis-
cretos geral a partir das propriedades de uma representação via espaço de estados (autômato) para
este. Seja (Q, A, E, I, T ) um autômato no qual, para todo s ∈ Q, há um caminho (s0 , a0 , s1 , . . . , sn−1 ,
an−1 , sn ) com s0 ∈ I e sn = s. Se além disso, de forma similar, para todo s ∈ Q podemos determi-
nar um tal caminho satisfazendo s = s0 e sn ∈ T , então o autômato é dito essencial. Um caminho
(s0 , a0 , s1 , . . . , sn−1 , an−1 , sn ) é dito um ciclo se s0 = sn . Dado um autômato que representa o com-
portamento de um sistema de eventos discretos (como aquele da Figura 2.7), pode-se demonstrar que
comp
o fato dele ser essencial implica que o sistema é completo (i.e., BQ = BQ ) se, e somente se, o
autômato não contém ciclos. Em termos da linguagem formal reconhecida pelo autômato, isto im-
plica que um autômato essencial pode ser associado a um sistema de eventos discretos completo se, e
somente se, a linguagem reconhecida por este é finita (i.e., L contain um número finito de palavras).
Observe que todo elemento em BQ é precedido e seguido por uma sequência infinita de sı́mbolos
. Considerando o conceito de completude apresentado na Seção 2.2.2, a ocorrência de ciclos em
2.4 A Topologia de Sistemas Dinâmicos Discretos Invariantes no Tempo e Completos 29
Tabela 2.2: F ORMAS APRESENTADAS PARA REPRESENTAÇ ÃO DE SISTEMAS DIN ÂMICOS .
construção pode ser obtida por diversos métodos, seja com equações a diferença, máquinas de estado
finito, etc. Contudo, independente do método empregado nesta construção, decorre do Teorema 4 que
a representação obtida é completa, e portanto, que só será fidedigna ao comportamento do sistema
simulado se esse também for completo. Em uma perspectiva prática, a importância desse resultado
decorre da identificação das limitações inerentes a qualquer processo de simulação de um sistema
dinâmico discreto (o que inclui aqueles obtidos através de discretização), descrita por um conjunto
finito de relação (um conjunto finito de equações a diferença ou por um autômato com Q = I =
T ), sendo esta limitação a invariável completude do sistema obtido. O que inclui, por exemplo,
simulações computacionais de sistemas fı́sicos, já que os atuais computadores digitais são máquinas
de estado finito complexas.
No processo de formalização deste resultado, consideremos um sistema dinâmico discreto repre-
sentado via espaço de estados ΣS = (Z, W, X, BS ). Que como observado na Seção 2.3, é um sistema
invariante no tempo. Ao estabelecermos uma representação para este sistema, poderemos faze-lo
através das formas equivalentes: Equação a diferença (2.18), ou pela especificação da lei de evolução
induzida, como em (2.9).
f (x(t + L), w(t + L)), (x(t + L − 1), w(t + L − 1)), . . . , (x(t), w(t)) = 0, t ∈ Z (2.18)
Em ambos os casos, obteremos como resultado de nossa representação um sistema completo especifi-
cado pelo comportamento BScompl , já que, de acordo com o Teorema 4, o comportamento BScompl é igual
ao comportamento B̄S da lei de evolução induzida pelo sistema ΣS . Portanto, qualquer representação
discreta de nosso sistema é necessariamente invariante no tempo e completa.
Em nossa abordagem, consideramos que a única informação inicial é um sistema Σ = (Z, W, B) e
que qualquer estrutura adicional é obtida pelo processo de modelagem, como a inserção de variáveis
latentes ou um espaço de estados. Na procura por métodos que possibilitem a determinação de uma
estrutura, particularmente uma que reflita a “memória” do sistema, consideraremos que Σ é completo.
A forte implicação disso é que ao considerarmos uma representação via espaço de estados ΣS da qual
o comportamento BS seja formado por todas as sequências (w, x) satisfazendo Pw (w, x) = w, então
ΣS é completa. Como consequência, há a possibilidade, como comentado acima, de determinar-
mos uma representação para Σ através de equações a diferença ou pela determinação de uma lei de
evolução para o sistema. Antes de prosseguirmos, nós formalizamos essa implicação na Proposição 5.
Podemos introduzir ainda mais estrutura à nossa abordagem se considerarmos o conjunto W fi-
nito. Para efeitos práticos esta consideração não restringe o escopo de aplicações dos resultados
obtidos, já que em qualquer simulação digital ou amostragem de um sistema dinâmico o espaço W
resultante é finito, ou ainda, esta já é uma propriedade do sistema original. Neste caso, o com-
portamento do sistema é composto por um conjunto de sequências bi-infinitas em W Z , o que será
representado por w = (wi )i∈Z = . . . w−1 w0 w1 . . ., onde wi ∈ W é a i-ésima coordenada de w.
A partir das considerações até então estabelecidas, a saber: sistema dinâmicos discretos, in-
variância no tempo, completude e conjunto W finito. Para facilitar a exposição, restabeleceremos
nossa nomenclatura como forma de evitar ambiguidades. Representaremos um sistema dinâmico dis-
creto, completo e invariante no tempo Σ = (Z, W, B) pela dupla (X, σ), onde X ⊂ W Z representa o
comportamento, ou seja, X = B e σ : W Z → W Z é uma ação chamada de função deslocamento, que
reflete a invariância no tempo de Σ, sendo caracterizada por (2.19).
Considerar (X, σ) como um sistema que evolui discretamente, com a sequência em que os eventos
ocorrem associada a Z, permite que interpretemos σ como o mapeamento adjacente que provê a
dinâmica sobre o conjunto X. Ainda podendo ser vista como o gerador do grupo {σ n | n ∈ Z} que
representa a ação transitiva do grupo infinito (Z, +) sobre W Z .
Ao considerarmos W um conjunto finito, possibilitamos a determinação de uma topologia a W Z
decorrente da métrica discreta associada a W , especificada em (2.20).
0 se α = β,
ρ(α, β) = (2.20)
1 se α 6= β.
Sendo a métrica do espaço discreto associado a i-ésima coordenada do espaço de dimensão infinita
W Z dada por (2.21).
ρ(α, β)
ρi (α, β) = . (2.21)
2|i|−1
A métrica do espaço produto W Z formado pelos espaços discretos associados as suas coordenadas é
dada em (2.22).
d(x, y) = max ρi (xi , yi ), (2.22)
−∞<i<∞
o que permite a definição da métrica (2.22) por d(x, y) = 2−e(x,y) , onde e(x, y) = max{n ≥ 0| xi =
yi , −n ≤ i ≤ n}, convencionando-se e(x, y) = ∞ se x = y e e(x, y) = −1 se x0 6= y0 . As-
32 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica
sim, de acordo com a métrica (2.22) dois pontos em W Z são tão mais próximos quanto mais longa
a sequência central (com centro associado à coordenada 0) na qual coincidem. Munidos com uma
métrica, podemos considerar uma estrutura onde dispomos de conjuntos abertos e fechados. Consi-
derando o espaço métrico (W Z , d), nós demonstramos na Proposição 6 que os conjuntos fechados em
(W Z , d) correspondem exatamente aos sistemas dinâmicos completos definidos em W Z .
Agora, temos como descrever um sistema dinâmico completo em um conjunto finito W de forma
puramente topológica, quando associado ao espaço métrico (W Z , d). Fazemos isso na Definição 6,
onde dá-se o nome de sistema simbólico fechado a tal sistema.
Como caso de estudo na teoria de dinâmica simbólica que encontra aplicações no estudo de códigos,
podemos citar os sistemas dinâmicos simbólicos definidos par (M, φ), onde M é um espaço métrico
compacto e φ : M → M é uma função contı́nua. Quando φ for um homeomorfismo (uma função
contı́nua, sobrejetiva, injetiva e seu inverso φ−1 é contı́nuo), então (M, φ) é chamado de um sistema
dinâmico inversı́vel. Um exemplo importante de homeomorfismo é (X, σ), onde X é um ssf e σ é a
função deslocamento.
O processo de comparação de sistemas dinâmicos simbólicos é formalizado pelo conceito de
homomorfismo, sendo este um mapeamento θ : (M, φ) → (N, ϕ) contı́nuo que satisfaz a propriedade
comutativa ϕ ◦ θ = θ ◦ φ, como representado no seguinte diagrama.
φ
M −−−→ M
θy yθ
N −−−→ N
ϕ
Se θ for injetivo e sobrejetivo, como M é compacto, então o mapeamento θ−1 também é contı́nuo.
Neste caso, θ é chamado de conjugado topológico e é escrito como θ : (M, ϕ) ∼
= (N, φ). Quando
há um conjugado topológico entre dois sistemas dinâmicos, estes são chamados de topologicamente
conjugado.
Consideremos o importante caso quando ϕ e φ são funções deslocamento. Dado os sistemas
dinâmicos fechados (X, σX ) e (Y, σY ), onde σX , σY são as funções deslocamentos associadas aos con-
juntos W Z e V Z , respectivamente. Como W Z é compacto e X é fechado, então θ é uniformemente
contı́nua. Consequentemente, há um inteiro k tal que para todo x ∈ X, o elemento (θ(x))0 é deter-
minado pelo bloco x|[−k,k]. Como θ comuta com a função deslocamento, então qualquer sı́mbolo de
θ(x) é determinado por um bloco de comprimento (2k + 1).
Este resultado apresenta os elementos necessários para conectar a teoria de dinâmica simbólica à
de codificação. O código é obtido por uma função especial chamada código de bloco deslizante ou
sbc (do termo em inglês sliding block codes). Um sbc φ mapeia sequências . . . x−1 x0 x1 . . . de um
ssf X sobre W em uma sequência . . . y−1 y0 y1 . . . sobre V , de forma definida por um mapeamento de
blocos Φ : X|[0,m+n] → V , ou seja, de todos os blocos de comprimento m + n + 1 em sequências
de X para sı́mbolos em V . Assim, dado um sbc φ : X → V Z tem-se que y = φ(x) se, e somente se,
yi = Φ(xi−m · · · xi+n ) = Φ(x|[i−m,i+n] ), sendo φ um sbc de memória m e antecipação n induzido por
Φ.
Agora, se considerarmos x, x′ ∈ X tal que e(x, x′ ) ≥ m+n+1, então e φ(x), φ(x′ ) ≥ e(x, x′ )−
34 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica
Assim, um sbc é uma função contı́nua. Se agora considerarmos que y = φ(x), então φ(σX (x))i
= Φ x|[i+1−m,i+1+n] = yi+1 = σY φ(x) i , portanto φ · σX = σY · φ, implicando que um sbc comuta
com a função deslocamento. Dessas observações, podemos concluir que uma função θ : (X, σX ) →
(Y, σY ) é um sbc se, e somente se, θ é um homomorfismo. Este resultado conecta os elementos de
teoria de códigos às estruturas topológicas abordadas na teoria de dinâmica simbólica.
Definição 7. Um espaço de sequências sobre grupo é um grupo gerado por produto direto W =
Πk∈I Gk , onde o eixo I é qualquer subconjunto de Z, e o alfabeto de sı́mbolos Gk , k ∈ I, são grupos
arbitrários. Um código sobre grupo ou sistema sobre grupo, é qualquer subgrupo C de um espaço de
sequências sobre grupo. Se todos os sı́mbolos dos alfabetos Gk são iguais ao de um grupo comum
G, então o espaço de sequências é denotado por W = GI , e C é chamado de um código sobre grupo
sobre G definido em I.
A partir da Definição 7, os conceitos e métodos de representação abordados nas Seções 2.1, 2.2 e
2.3 são estendidos à teoria de códigos. Em particular, como observado em [2], um código sobre grupo
C só poderá ser completamente caracterizado ou gerado por sua treliça (igual a todas as sequências
geradas por caminhos na treliça), se C for completo. Caso contrário, dada a treliça de um código C
incompleto, será necessário uma especificação adicional para C através de restrições globais.
Em particular, quando C for completo, podemos interpreta-lo como um ssf, agregando a sua
estrutura elementos de topologia, que como demonstrado no Capı́tulo 3, permite-nos abordar o pro-
2.5 A Dinâmica Simbólica dos Sistemas Dinâmicos 35
blema de geração de códigos e codificação por uma perspectiva combinatorial, empregando teoria de
linguagens formais e conceitos algébricos mais gerais que o de grupo.
Particionamento Markoviano
O processo de expansão n-ário dos reais é o mais simples exemplo de métodos de representação
simbólica de órbitas de sistemas dinâmicos. Estes métodos se baseiam na representação das órbitas
36 Sistemas Dinâmicos, Códigos e Dinâmica Simbólica
1. cada Ri é aberto;
2. Ri ∩ Rj = ∅, i 6= j;
3. X = R0 ∪ R1 ∪ · · · RN −1 .
Se X é o domı́nio de um sistema dinâmico especificado por (X, φ), a partição R é dita gerador8
Markoviano se a condição (2.23) é satisfeita.
n
\
−1
Rsk ∩ φ Rsk+1 6= ∅, 1 ≤ k ≤ n − 1 ⇒ φ−k Rsk 6= ∅. (2.23)
k=1
Para R um gerador Markoviano e (X, φ) um sistema dinâmico expansivo, podemos representar sua
dinâmica por um ssf determinado por um grafo G com vértices A = {0, 1, . . . , N −1} e uma transição
do vértice i para o vértice j sempre que Ri ∩ φ−1 Rsn 6= ∅. Novamente um ssf é empregado como
representação simbólica do comportamento de um sistema dinâmico. No Capı́tulo 5 consideraremos
o método de codificação do fluxo geodésico de Artin, que é um caso concreto onde esse método de
representação simbólica é utilizado.
8
A definição de uma partição topológica que é um gerador, está fora do escopo desse trabalho, mas pode ser encontrada
em [12], como também outros tópicos relacionados.
Capı́tulo 3
Neste capı́tulo mostraremos como as propriedades topológicas, descritas na Seção 2.4, inerentes a
um ssf X devem ser utilizados para determinação de uma representação combinatorial de X pelo
emprego de conceito tı́picos de linguagem formal. Identificaremos as propriedades das linguagens
associadas a X, empregando-as para a determinação de leis de evolução e grafos direcionados finitos
associados (quando a linguagem de X for regular) que apresentem as sequências bi-infinitas de X.
Estes resultados são obtidos pela introdução dos conceitos de conjuntos proibidos e conjunto de
restrições irredutı́veis, que ainda nos possibilitam especificar procedimentos que permitem identificar
a estrutura algébrica associada à linguagem de X.
Como consequência das propriedades de um sistema simbólico fechado X ⊆ AZ , assim como
para os sistemas de eventos discretos abordados na Seção 2.3.4, podemos determina-lo a partir de um
subconjunto do monoide livre A∗1 , ou seja, a partir de uma linguagem que especifique-o unicamente.
Z
Para tanto, inicialmente, vamos definir o conjunto cilindro CkA (u), como sendo o subconjunto de
Z
A∗ formado pelos pontos x para os quais u é um fator iniciando na coordenada k, i.e., CkA (u) =
{ x ∈ X | u = x|[k,k+|u|−1]}. Como X é um conjunto fechado, então seu complemento em relação a
A∗ é aberto, ou seja, o conjunto A∗\X. Portanto, para todo y ∈ AZ \X existe k = k(y), tal que, se
A Z A Z
uy = y|[−k,k] observa-se C−k (uy ) ⊆ AZ \X. Podendo-se verificar que C−k (uy ) = B2−(k−1) (y), onde
B2−(k−1) (y) é a bola aberta de raio 2−(k−1) em torno de y. Segue disto que o conjunto F = {uy | y ∈
AZ \X} é suficiente para determinar X. Sendo X o conjunto de todas as sequências em AZ que não
possuem fatores em F. Para verificar esta afirmação, suponha que para um dado uy ∈ F existe x ∈ X
Z
satisfazendo uy = x|[i,j] , então σ (i+k) (x) ∈ C−k
A
(uy ), o que é uma contradição, já que X é invariante
por deslocamento.
Assim, podemos especificar X como o conjunto de sequências em AZ que não possuem fatores
em F, ou seja, para quaisquer inteiros i ≤ j temos que x|[i,j] ∈
/ F. O que nos permite especificar a
1
Conjunto de todas as sequências possı́veis com elementos em A, incluindo a de comprimento zero ε.
37
38 Dinâmica Simbólica e Autômatos
a1 = 1a = a, ∀a ∈ S (3.2)
3.1 Monoide e Semigrupo 39
Supor a existência de dois elementos identidade 1, 1′ em um monoide S implica que 1 = 11′ = 1′ já
que 1 é uma identidade, conclui-se que só há um elemento identidade em um monoide.
Sejam M, M ′ dois monoides, um morfismo ϕ : M → M ′ é uma função satisfazendo as condições:
ϕ ϕ′
M −→ M ′ −→ M ′′
também é um morfismo
ϕϕ′
M −→ M ′′ .
XY = {xy| x ∈ X, y ∈ Y }.
1 ∈ T and T 2 ⊂ T,
A∗ = 1 ∪ A ∪ A2 ∪ . . . ∪ An ∪ . . .
i.e.,
st = (a1 , . . . , an , b1 , . . . , bm ).
A+ = A ∪ A2 ∪ . . . ∪ An ∪ . . .
A+ = A∗ \{1},
Θ : Q × A∗ → Q, (3.5)
Com o intuito de simplificar a notação, quando não houver possibilidade de gerar-se confusão Θ(q, s)
será escrito como qs. Assim, as condições (3.6) e (3.7) podem ser escritas como
Sempre que uma função parcial (3.5) satisfazendo (3.8) é dada, diz-se que Q é um A-módulo (à
direita) com (3.5) como ação. Se (3.5) é uma função, então o módulo é dito ser completo.
f : 2X → 2Y , (3.9)
onde {Ai | i ∈ I} é a famı́lia de subconjuntos de X indexados por I. Disto segue que f (∅) = ∅.
Como decorrência da aditividade, f é completamente determinada pelos seus valores nos singletons,
tal que f pode ser vista como uma função
f : X → 2Y .
2
Se f : A → B é uma função parcial, então f (a) possui no máximo um elemento, para todo a ∈ A.
42 Dinâmica Simbólica e Autômatos
Uma relação f : X → Y é chamada uma função parcial se para cada x ∈ X o conjunto f (x) possui
no máximo um elemento. Se f (x) possui exatamente um elemento, então f é uma função.
A relação r : X → X é chamada uma relação de equivalência se satisfaz as condições
1X ⊂ r, r −1 ⊂ r, rr ⊂ r,
x∼x
x1 ∼ x2 implica x2 ∼ x1
x1 ∼ x2 e x2 ∼ x3 implica x1 ∼ x3
Destas condições segue que para quaisquer dois elementos x1 , x2 de X os subconjuntos r(x1 ) e
r(x2 ) são ambos iguais ou diferentes. Estas são as classes de equivalência ou r-classes de X mod r.
O conjunto de todas as classes de equivalência é representado por X/r e chamado de quociente de
X mod r. É de conhecimento comum em algébrica que qualquer cobertura de X por conjuntos
disjuntos não vazios determina uma única relação de equivalência em X, para a qual tais conjuntos
3.2 Relações e Congruências 43
onde g é uma função. Além disso, a função g é injetiva. A função f é injetiva se, e somente se, kerf
é a relação identidade 1X , o que implica que X/1X = X.
a ∼ b e c ∼ d implica ac ∼ bd,
e
a ∼ b implica ca ∼ cb e ac ∼ bc.
O fato do produto r(a)r(b) de duas classes de equivalência estar contido em uma única classe de
equivalência r(ab) pode ser usado para definir uma multiplicação em X/r. Com essa multiplicação,
o conjunto quociente X/r torna-se um monoide e π : X → X/r é um morfismo entre monoides.
g é um morfismo injetivo.
La : M → M e Ra : M → M
chamadas multiplicação à esquerda por a e multiplicação à direita por a, respectivamente, são defi-
nidas por
La (b) = ab e Ra (b) = ba.
LA : M → M e RA : M → M
tal que
[ [
LA = La e RA = Ra .
a∈A a∈A
LA (B) = AB e RA (B) = BA
onde
AB = {ab|a ∈ A, b ∈ B}.
L−1 −1 −1 −1
a , LA , Ra , RA : M → M
referentes a
L−1
a (b) = {x| x ∈ M, ax = b}
L−1 −1 −1
A (B) = A B e RA (B) = BA
−1
3.3 Cálculo de Divisão 45
−1 −1 −1
RB RC = RBC , RC−1 L−1 −1 −1
A = LA RC , L−1 −1 −1
AB = LB LA ,
(AC −1 )B −1 = A(BC)−1
(A−1 B)C −1 = A−1 (BC −1 )
(AB)−1 C = B −1 (A−1 C).
Estendendo este formalismo para módulos, obtém-se: Seja Q um A-módulo. Para cada a ∈ A∗
tem-se uma função parcial definida em (3.11).
Ra : Q −→ Q
(3.11)
q −→ qa
Lq : A∗ → Q,
dada por
Lq (a) = qa.
LX : A∗ → Q, RA : Q → Q
46 Dinâmica Simbólica e Autômatos
Assim
LX (A) = XA = RA (X),
onde
XA = {qa| q ∈ X, a ∈ A}.
X −1 Y = L−1 ∗
X (Y ) = {a| a ∈ Σ , Xa ∩ Y 6= ∅}
XA−1 = RA
−1
(X) = {q| q ∈ Q, qA ∩ X 6= ∅}
para X, Y ⊂ Q, A ⊂ A∗ .
A equação associativa (XB)C = X(BC) para X ∈ Q e B, C ⊂ A∗ implica nas equações
apresentadas em (3.12).
É importante salientar que na segunda equação em (3.12) o RC no lado esquerdo é uma relação
RC : Q → Q enquanto no lado direito é uma relação RC : A∗ → A∗ . Similarmente, LB no lado
direito da terceira equação é uma relação LB : A∗ → A∗ . As três identidades são expressas por
diagramas de comutação na forma apresentada na Figure 3.1.
RB LX LB
Q❃ / Q Σ∗ / Q Σ∗❅ / Σ∗
❃❃ ❅❅ ⑦⑦
❃❃ ❅❅ ⑦⑦
RC RC ❅ ⑦⑦ LX
RBC ❃❃ RC LXB ❅❅ ⑦
LX ~⑦
Q Σ∗ / Q Q
(XC −1 )B −1 = X(BC)−1 ,
(X −1 Y )C −1 = X −1 (Y C −1 ), (3.13)
(XB)−1 Y = B −1 (X −1 Y ),
3.4 Linguagens Regulares 47
onde X, Y ⊂ Q e B, C ⊂ A∗ .
Quando L é uma bijeção, então é comum representar E pelos elementos em A. O que é bem definido
quando associado com as funções i e t, uma vez que um ramo e representa a tripla (i(e), e, t(e)).
a
Outras maneiras de representar um ramo são a : p → q e p −→ q. Mesmo que a função L : E → A
não seja bijetiva, sempre é possı́vel associar E com os elementos de um conjunto A′ através de uma
função L′ : E → A′ , e os elementos em A′ com aqueles em A através da função L′′ : A′ → A,
satisfazendo L′′ (e) = L(L′−1 (e)), tal que L = L′′ L′ .
Um caminho em Σ é uma sequencia w = e1 e2 . . . en de ramos satisfazendo t(ej ) = i(ej+1 ),
1 ≤ j ≤ n, e |w| = n é o comprimento de w. Conceitos importantes são o de caminho nulo e palavra
nula, ambos escritos como ε e possuindo comprimento zero. Adicionalmente temos que i(w) = i(e1 )
e t(w) = t(en ), L(w) = L(e1 . . . en−1 ) L(en ) é o rótulo de w, |L(w)| = |w| é o comprimento da
L(w)
palavra L(w), e i(w) −→ t(w) ou L(w) : i(w) → t(w) são caminhos em Σ com rótulo L(w) de
i(w) para t(w). Um caminho w : i → t com i ∈ I e t ∈ T é chamado realizável. O subconjunto de
A∗ descrito por {L(w)| w é um caminho realizável em Σ} = |Σ| é chamado o comportamento de Σ
ou a linguagem representada por Σ, conceitos herdados da teoria de sistemas dinâmicos.
Neste contexto, uma operação natural é a concatenação de caminhos:
w : p → q, v : q → r
48 Dinâmica Simbólica e Autômatos
Então,
wv : p → r
(2) Xε = X.
(3) ∅s = ∅.
(4) (X1 ∪ X2 )s = X1 s ∪ X2 s.
O autômato Σ é dito ser acessı́vel se para todo estado q há um caminho w : i → q com i ∈ I. Assim,
A é acessı́vel se, e somente se, IA∗ = Q. A partir de (3.15) tem-se que o comportamento de Σ e
aquele do autômato obtido de Σ pela remoção dos estados Q − IA∗ e dos ramos que emergem destes,
ou seja, dos ramos e satisfazendo i(e) ∈ Q − IA∗ . A última operação conduz ao autômato acessı́vel
Σa = (Qa , I, T a),
3.4 Linguagens Regulares 49
Do que podem ser obtidas propriedades análogas às (1)-(5). Observando-se que
Se em (1) e (2) “no máximo um” é substituı́do por “exatamente um” então o autômato determinı́stico
A é dito ser um autômato completo. Dado um autômato determinı́stico Σ = (Q, i, T ), um autômato
completo Σc = (Qc , ic , T ) chamado de complementação de Σ é determinado pelas operações: Se
Σ é completo, então Σc = Σ. Se Σ não é completo, então i = ∅ ou qa = ∅ para algum par
q ∈ Q, a ∈ A. Ao conjunto Q é associado um novo estado denotado por ♦. Assim, Qc = Q ∪ ♦.
Se i = ∅, então ic = ♦, caso contrário ic = i. Se a ação de A sobre Qc é representada por “·”, então:
q · a = qa se qa 6= ∅ em Q, q · a = ♦ se qa = ∅ em Q, e ♦ · a = ♦. Como ♦ não é terminal,
ele não está contido em um caminho de Σc e, portanto, |Σc | = |Σ|.
Aplicando os conceitos apresentados na Seção 3.3 obtém-se que o comportamento de um autômato
determinı́stico Σ = (Q, i, T ) é
|Σ| = i−1 T (3.16)
i−1 (T B −1 ).
i−1 (T B −1 ) = (i−1 T )B −1 = AB −1 ,
Portanto,
[
B −1 A = |Σq |,
q∈iB
Para finalizarmos a seção, é relevante comentarmos sobre uma representação alternativa para um
autômato finito, comumente encontrada em texto sobre teoria da computação [15, 16]. Neste caso,
um autômato é representado por uma quádrupla Σ = (Q, A, I, T, δ), onde Q é o conjunto finito de
estados, A o alfabeto finito, I ⊆ Q o conjunto de estados iniciais, T ⊆ Q o conjunto finito de estados
terminais, e δ a função parcial de transição de estados. Outras variantes podem ser possı́veis de acordo
com o uso pretendido para o autômato, devendo ser devidamente definida.
O conceito de autômato mı́nimo está relacionado com a propriedade de uma função parcial chamada
morfismo ou mapeamento de estados. O mapeamento de estados ψ : Q → Q′ mapeia os estados
de um A-autômato determinı́stico Σ = (Q, i, T ) sobre aqueles de um A-autômato determinı́stico
Σ′ = (Q′ , i′ , T ′ ) satisfazendo as relações (3.17).
3.5 Autômato Mı́nimo 51
i′ ⊂ ψ(i), (3.17i)
(ψ(q))σ ⊂ ψ(qσ), (3.17ii)
ψ −1 (T ′ ) ⊂ T. (3.17iii)
i 6= ∅ ⇒ i′ 6= ∅, (3.18i)
qσ 6= ∅ e ψ(q) 6= ∅ ⇒ ψ(q)σ 6= ∅, (3.18ii)
ψ(T ) ⊂ T ′ . (3.18iii)
Teorema 8. [13] Sejam Σ and Σ′ A-autômatos essenciais satisfazendo |A| = |A′ |. Há no máximo
um mapeamento de estados ψ : Σ → Σ′ . Sendo que ψ é próprio e é uma função sobrejetiva.
Além disso, q é co-acessı́vel se, e somente se, s−1 L 6= ∅; e portanto se, e somente se,
sA∗ ∩ L 6= ∅.
X · s = s−1 X,
∗ ∗ ∗
o que faz de 2A o conjunto 2A A-módulo. Considerando o subconjunto de 2A dado por
∗
E = {X| X ∈ 2A , ε ∈ X},
∗
notamos que para 2A A-module obtém-se (3.19).
∗
X −1 E = X para todo X ∈ 2A (3.19)
3.5 Autômato Mı́nimo 53
X −1 E = {s| X · s ∈ E}
= {s| s−1 X ∈ E}
= {s| ε ∈ s−1 X}
= {s| s ∈ X} = X.
∗
Σ◦L = (2A , L, E),
ϕ : Q −→ QL
ϕ(q) = q −1 T.
Inicialmente, é necessário demonstrar que ϕ é bem definida para todo q ∈ Q. Para qualquer q ∈ Q
existe s ∈ A∗ , tal que, i · s = q, e portanto q −1 T = s−1 L, o que pode ser escrito como L · s a partir
da notação adotada. Como ΣL também é determinı́stico e essencial com comportamento L, e s é um
prefixo de uma palavra em L, então L · s = s−1 L = q −1 T ∈ QL .
No autômato Σ◦L um estado X é acessı́vel se, e somente se, X = L · s = s−1 L para algum s ∈ A∗ .
O estado X é co-acessı́vel se, e somente se, X · u ∈ E para algum u ∈ A∗ , o que é equivalente a
54 Dinâmica Simbólica e Autômatos
onde a última linha de (3.21) segue do fato de ε ∈ s−1 L se, e somente se, s ∈ L.
é dado por
ϕ(q) = q −1 T,
A demostração de que ϕ no Teorema 10 é própria, segue de uma comparação direta entre (3.20) e
(3.18).
Nos referimos ao A-autômato ΣL como uma representação minimal ou dos contextos à direita de
L. Qualquer autômato isomorfo a ΣL é chamado um autômato minimal para L.
O núcleo da função ϕ : Q → QL no Teorema 10 é determinado pela relação de equivalência
q1 ∼ q2 ⇔ q1−1 T = q2−1 T.
q1−1 T = q2−1 T ⇒ q1 = q2 .
Do que decorre que Σ é reduzido se, e somente se, ϕ é injetiva. Como ϕ é própria e é uma função
sobrejetiva, obtém-se o Corolário 11.
Corolário 11. [13] Um autômato determinı́stico Σ com comportamento L é minimal se, e somente
se, Σ é reduzido e essencial.
3.6 Morfismo Sintático e Monoide Sintático 55
α : A∗ → PF(Q),
onde PF(Q) é o monoide gerado por todas as funções parciais Q → Q. A imagem M do morfismo
α é chamada de monoide da ação de A-módulo Q. Neste caso, M é o sub-monoide de PF(Q)
gerado pelas funções parciais q → qσ para σ ∈ A. O morfismo sobrejetivo α : A∗ → M está
associado ao monoide da ação de Q. Como uma extensão natural, se Σ = (Q, i, T ) é um A-autômato
determinı́stico, então Q é um A-módulo, sendo o monoide da ação de Q denotada por MΣ . Este é o
monoide da ação do autômato Σ.
Seja ΣL = (QL , iL , TL ) o autômato minimal de um subconjunto L de A∗ . O monoide da ação de
ΣL é denotado por ML , sendo chamado do monoide sintático de L. O morfismo sobrejetivo
ϕL : A∗ → ML ,
Demonstração: (1) ⇒ (2): A validade de (1) implica que o autômato minimal ΣL é finito, portanto
ML é finito.
(2) ⇒ (3): É uma consequência direta de monoide ML , o morfismo sintático ϕL : A∗ → ML , e
do subconjunto ϕL (L) de ML satisfazerem a condições em (3).
(3) ⇒ (1): Considere o A-autômato
Σ = (M, 1, B),
m · w = m · ϕ(w).
56 Dinâmica Simbólica e Autômatos
Então
|Σ| = {w| 1 · w ∈ B}
= {w| ϕ(w) ∈ B} = ϕ−1 (B) = L,
Demonstração: (1) ⇔ (2): A partir da definição de ML como um monoide formado pelas funções
QcL → QcL segue que
s ≈L t,
sempre que esta condição for satisfeita. De fato, ≈L é uma congruência, chamada congruência
sintática de L. A equivalência de (1) e (3) mostra que esta congruência é o núcleo do morfismo ϕL .
Como ϕL é sobrejetivo, segue que ML pode ser identificado com o monoide quociente A∗ / ≈L e ϕL
pode ser identificado com o morfismo decorrente da fatoração natural A∗ → A∗ / ≈L . Comumente, a
3.6 Morfismo Sintático e Monoide Sintático 57
classe de congruência que contém um elemento x ∈ A∗ é representada por [x], comum aos elementos
do conjunto ϕ−1 ∗
L (x) ⊆ A . Quanto a operação do monoide, segue da relação de congruência que
[x][y] = [xy].
A condição (3) implica que: Se s ≈L t e s ∈ L, então t ∈ L, logo L é fechado com respeito a ≈L .
O que pode ser reescrito como
ϕ−1
L (ϕL (L)) = L,
ou também como
L = ϕ−1
L (B) para algum B ⊂ ML .
ML = MA∗ \L .
Σ̺ = (Q, T, I),
σ σ
com um ramo p −→ q para todo ramo q −→ p em Σ. Portanto, um caminho π em Σ com L(π) =
σ1 . . . σk . implica na existência de um caminho π ̺ em Σ̺ com
L(π ̺ ) = σk · · · σ1
s ≈L t ⇔ s̺ ≈L̺ t̺ .
O que implica que os monoides sintáticos ML and ML̺ são anti-isomorfos, i.e., há uma bijeção
ϕ : ML → ML̺ tal que ϕ(xy) = ϕ(y)ϕ(x) para todo x, y ∈ ML . Em outras palavras, ML̺ pode ser
58 Dinâmica Simbólica e Autômatos
∀y ∈ Y, b y.
Proposição 14. [14] Seja Y um subconjunto não vazio de um conjunto parcialmente ordenado X.
Então
Analogamente, define-se menor limite superior (ou lub - least upper bound), sendo denotado por
_
{y : y ∈ Y }.
Há duas classes destas linguagens cujas propriedades merecem destaque, são as linguagens fatoriais
prolongáveis e regulares (FPR - factorial prolongable and regular), e as linguagens fatoriais transi-
tivas e regulares (FTR - factorial transitive and regular). A importância destas classes decorre da
relação que possuem com os sistemas simbólicos fechados regulares (ssr - ou do inglês sofic shift),
sendo destes os ssf que permitem uma representação através de um grafo direcionado. Essa relação
é expressa como: A linguagem de um ssr é FPR, e a linguagem de um ssr irredutı́vel é FTR, [19].
Sendo um ssr irredutı́vel aquele cuja linguagem satisfaz a propriedade (iii) acima, o que implica que
60 Dinâmica Simbólica e Autômatos
esta linguagem pode ser representada por um grafo direcionado no qual existe um caminho entre
qualquer par ordenado de vértices.
O fato de uma linguagem ser FPR ou FTR reflete nas propriedades do monoide sintático associado
à linguagem. Tais propriedades são apresentadas na Proposição 15, Proposição 16 e na Proposição 17.
Proposição 15. [20] A linguagem L ∈ A∗ é fatorial se, e somente se, ML possui um zero, além de
ϕ−1
L (ML \{0}) = L.
Proposição 16. [19] Uma linguagem L ⊂ A∗ é FPR se, e somente se, ML possui as propriedades:
3. Para todos os elementos não nulos [x] ∈ ML , x ∈ L, há elementos y1 , y2 ∈ L distintos de 1, tal
que, [y1 xy2 ] 6= 0.
Como em teoria de grupo e anéis [21], no âmbito da teoria de semigrupos o conceito de ideal
revela propriedades importantes do monoide sintático com reflexos na estrutura da linguagem e
representações associadas. Um subconjunto I de um semigrupo S é chamado um ideal (resp. à
direita, à esquerda), se SIS ⊂ I (resp. IS ⊂ I, SI ⊂ I). Se um monoide possui um elemento nulo
(x0 = 0x = 0), então {0} é um ideal de S. Um ideal I é dito 0-minimal em um semigrupo S, se I
é minimal no conjunto de todos os ideais não-nulos, ou seja, o ideal I em S é 0-minimal se I 6= 0 e
para qualquer outro ideal J ⊆ I tem-se J = I ou J = 0.
Proposição 17. [19] Uma linguagem L ⊂ A∗ é FTR se, e somente se, ML possui as propriedades:
3. ML possui um ideal 0-minimal à direita I, tal que, para todo elemento não nulo a ∈ ML , Ia 6= 0.
para o monoide sintático de B(X). Para facilitar a notação, consideremos L = B(X) e L′ seu com-
plemento com relação a A∗ . Podemos interpretar L′ como a restrição global de X, ou seja, o conjunto
de palavras em A∗ que não ocorrem em sequências bi-infinitas de X. De fato, o conjunto F defi-
nido no inı́cio deste capı́tulo está contido em L′ . Apesar de especificado através das propriedades
topológicas de X, o conjunto F manterá sua função de especificar unicamente X se a ele for incluı́do
qualquer elemento em A∗ que possua um fator em L′ . A seguir demonstraremos que só precisamos de
um subconjunto O de L′ para especificarmos se uma palavra pertence ou não a L, que O especifica
unicamente X, assim como X especifica unicamente O, além de demonstrarmos que O é mı́nimo.
Como ficará claro pelo desenvolvimento que segue, o conceito de relação de ordem parcial tem papel
essencial na determinação destes resultados, cujo emprego já inicia-se com a Definição 8.
Definição 8. Seja (X, SP ) um conjunto ordenado induzido pela relação de ordem parcial SP dada
por
u SP w ⇔ u ∈ S(P(w)), onde u, w ∈ X.
Lema 18. Seja L uma linguagem fatorial, então L′ = A∗ · O · A∗ . O que permite-nos interpretar O
como um gerador de L′ .
′ ∗
Ou seja, o conjunto O é o glb do conjunto ΨL em (2A , I ).
para todo u ∈ O há pelo menos um v ∈ X que satisfaz v SP u. Como O é a coleção de todos os
elemento minimais, há t ∈ O tal que t SP v. Observações que nos permitem afirmar que u = u1 vu2
and v = v1 tv2 , vi , ui ∈ A∗ . Disto segue que u = u1 v1 tv2 u2 , decorrendo da minimalidade de u e t
que u = t. Portanto, u = v e u ∈ X. Do que conclui-se que O ⊆ X.
Como uma breve explicação para a expressão de Ow apresentada na Definição 10, consideraremos
os dois casos possı́veis: (i) uwv ∈ L ou (ii) uwv ∈ L′ . O caso (i) é eliminado pela exclusão
dos elementos de A∗ no conjunto L. No caso (ii) estamos interessados em selecionar as palavras
que satisfazem uw, wv ∈ L; quando incluı́mos o termo L · w · Cw eliminamos todas as palavras
satisfazendo wv ∈
/ L, enquanto a inclusão de Dw · w · L elimina todas as palavras satisfazendo
uw ∈
/ L. Desta forma, o conjunto resultante só contém os termos desejados. Como uma observação
adicional, se w ∈
/ L então Ow é trivialmente determinado. Portanto, este caso será excluı́do das
análises subsequentes.
Lema 20. Para todo u = u1 . . . un ∈ Ow , u ∈ Ow se, e somente se, u ∈ O e w SP (u2 . . . un−1 ).
Demonstração: Seja swt ∈ Ow , como resultado do Teorema 19 há v ∈ O satisfazendo v SP swt,
sendo que para v = v1 . . . vn , decorre de sw, wt ∈ L que w SP (v2 . . . vn−1 ). Assim v = s′ wt′ ,
onde s′ , t′ ∈ A+ , o que permite-nos concluir que v ∈ Ow . Como supomos que swt é um elemento
minimal de Ow e v = s′ wt′ ∈ Ow , podemos concluir que v = swt uma vez que s′ wt′ SP swt, como
consequência Ow ⊆ O. Por fim, para todo u ∈ O e w SP (u2 . . . un−1 ) temos necessariamente que
u ∈ Ow , já que u é minimal em L′ e Ow ⊆ L′ , podemos concluir que u ∈ Ow .
∗
Ou seja, o conjunto Ow é o glb do conjunto ΨOw em (2A , I ).
Demonstração: Seja v ∈ O e w SP v, então decorre do Lema 20 que v ∈ Ow e portanto para todo
K satisfazendo Ow = L · K · L, há pelo menos um elemento u, tal que, u SP v. Como K ⊆ L′ e v
é minimal em L′ , concluı́mos que v = u. Do que decorre que Ow ⊆ K.
O fato de Ia ser um ideal à direita segue de considerarmos L uma linguagem fatorial. De forma
complementar, a existência de um elemento nulo é garantida ao considerarmos que L não é uma
linguagem livre, o que, caso contrário, implicaria que para quaisquer x, w ∈ L seria verificado que
xw ∈ L. Apesar de sua relevância em muitos casos de interesse (e.g., quando A é um grupo), quando
estamos interessados em estudar as restrições do sistema (no contexto apresentado neste trabalho) as
linguagens livres tornam-se um caso trivial. A seguir avaliaremos os reflexos do conceito algébrico
de ideal à direita Ia sobre a linguagem L associada.
Definição 11. Seja X uma linguagem arbitrária e w ∈ A∗ . O contexto à direita (resp., à esquerda) de
w com relação a linguagem X é definido como sendo o conjunto
Como consequência de (3.23) o elemento nulo do monoide sintático de uma linguagem fatorial
sempre pertencerá ao ideal à direita I[w] de uma palavra w ∈ A∗ . Contudo, sabemos da Proposição 15
64 Dinâmica Simbólica e Autômatos
Definição 12. Seja (X, P ) um conjunto ordenado induzido pela relação de ordem parcial P dada
por
u P w ⇔ u ∈ P(w), onde u, w ∈ X.
Definição 13. O conjunto de restrições à direita Cw de uma palavra w ∈ A∗ é formado por todos os
elementos minimais do conjunto ordenado (Cw , P ).
Ja = {y ∈ ML : ya = 0}. (3.24)
Como desenvolvido para o caso de restrições à direta, partindo de (3.24) (com evidente semelhança a
(3.23)), podemos introduzir os conceitos recı́procos, mas agora com referência “ à esquerda ”, àqueles
introduzidos a priori. Este processo torna-se ainda mais evidente se considerarmos a linguagem
reversa de L, determinada por L̺ = ̺(L), onde ̺ é a função reversa definida em (3.22). Neste
caso, o desenvolvimento e métodos são idênticos, mas agora considerando palavras w ̺ em A∗ , o que
permite-nos especificar o ideal à direita [w ̺ ] no monoide sintático ML̺ = (ML )̺ , como realizado
na Seção 3.6. Desta forma, iremos definir o contexto à direita de w ̺ com respeito a linguagem L̺
ou L′̺ . Esta abordagem permite-nos importar os resultados desenvolvidos para w ∈ A∗ , derivando
conclusões recı́procas para o ideal à esquerda J[w] no monoide ML , como também seu contexto à
esquerda com respeito as linguagens L e L′ .
Como realizado anteriormente para o caso do contexto à direita, podemos particionar o contexto
à esquerda L(w, L′ ) em um conjunto trivial L′ , comum a todo w ∈ A∗ , e um conjunto que depende
de w, especificado como Dw = L(w, L′ )\L′ . Como antes, desta definição segue que para v ∈ Dw
tem-se vw ∈ L′ e v ∈ L. Como L é fatorial, existe uma palavra u ∈ L′ satisfazendo u ∈ (S(v)\{ε}) ·
66 Dinâmica Simbólica e Autômatos
Definição 14. Seja (X, S ) um conjunto ordenado induzido pela relação de ordem parcial S dada
por
u S w ⇔ u ∈ S(w), onde u, w ∈ X.
Definição 15. O conjunto de restrições à esquerda Dw de uma palavra w ∈ A∗ é formado por todos
os elementos minimais do conjunto ordenado (Dw , S ).
Proposição 26. Seja u ∈ A∗ , então u ∈ Dw com relação a L se, e somente se, u̺ ∈ Cw̺ com relação
a L̺ .
Os resultados que seguem são recı́procos aos Lemas 22 e 23, a Proposição 24, e ao Teorema 25,
respectivamente.
Lema 27. Seja a ∈ ML , então ϕ−1 (a) ⊆ L(w, L′ ) se, e somente se, a ∈ J[w] .
3.10 Cálculo dos Conjuntos Proibidos e Conjuntos de Restrições 67
Kv1 = a−1
1 O,
Kv2 = a−1 1 −1
2 Kv ∪ a2 O,
.. (3.25)
.
Kvn = a−1 (n−1)
n Kv ∪ a−1
n O.
(n−1)
Proposição 35. Seja v ∈ P(OA−1 ), v = a1 a2 . . . an , então Kvn = a−1
n Kv ∪ a−1
n O.
Demonstração:
Kvn = (S(v)\{ε})−1O
= (S(a1 . . . an−1 )an )−1 O
= (S(a1 . . . an−1 )an ∪ an )−1 O
= a−1 −1 −1
n S(a1 . . . an−1 ) O ∪ an O
= a−1 −1 −1 −1
n ((S(a1 . . . an−1 )\{ε}) O) ∪ an O ∪ an O
= a−1 −1 −1
n ((S(a1 . . . an−1 )\{ε}) O) ∪ an O
= a−1 (n−1)
n Kv ∪ a−1
n O.
70 Dinâmica Simbólica e Autômatos
Por fim, uma vez que o conjunto Kvn foi obtido, o conjunto de restrições à direita Cw é simples-
mente a coleção de todos os elementos minimais em (Kvn , P ).
O conjunto de restrições à esquerda Dw pode ser obtido através de um procedimento similar.
Neste caso Dw é um subconjunto de O(P(w)\{ε})−1. A equação (3.26) é recı́proca a equação
(3.25). Continuando o processo comparativo, consideremos u = b1 . . . bn como sendo o prefixo
mais longo de w pertencente ao conjunto S(A−1 O), escolha justificada pelo resultado apresentado
na Proposição 34, de onde temos que Dw = Du . No presente caso, o procedimento de cálculo
Tuj = O(P (bj . . . bn )\{ε})−1 inicia-se pelo sufixo mais curto de u que é um elemento de S(u)\{ε}
até o próprio u (seu sufixo mais longo). A partir da Proposição 36 e empregando indução, assim como
no caso dos conjuntos de restrições à direita, é possı́vel demonstrar a efetividade do procedimento.
Tun = Ob−1
n ,
Demonstração:
Tu1 = O(P(u)\{ε})−1
= O(b1 P(b2 . . . bn ))−1
= O(b1 ∪ b1 P(b2 . . . bn ))−1
= OP(b2 . . . bn )−1 b−1 −1
1 ∪ Ob1
= (O(P(b2 . . . bn )\{ε})−1)b−1 −1 −1
1 ∪ Ob1 ∪ Ob1
= (O(P(b2 . . . bn )\{ε})−1)b−1 −1
1 ∪ Ob1
= Tu2 b−1 −1
1 ∪ Ob1 .
Como antes, uma vez que o conjunto Tu1 foi determinado, o conjunto de restrições à esquerda Dw
é a coleção do elementos minimais em (Tu1 , S ).
3.11 Obtenção da Estrutura Algébrica através dos Conjuntos de Proibições e Restrições 71
Proposição 37. Seja L ⊆ A∗ uma linguagem fatorial e u, w ∈ A∗ . Então ϕL (w) = ϕL (v) se, e
somente se, as seguintes condições são satisfeitas:
(1) Cw = Cv ;
(2) Dw = Dv ;
Demonstração: Como estamos considerando linguagens fatoriais, podemos reescrever o item (2) da
Proposição 13 como:
(uw)−1L = (uv)−1L, para todo u ∈ L.
Empregando esta equação, podemos provar que ϕL (w) = ϕL (v) implica em (1)-(3). Inicialmente,
observamos que ao considerarmos u = ε teremos que w −1L = v −1 L ⇔ (1). De forma similar,
temos que (2) ⇔ (uw)−1L = (uv)−1L para todo u ∈ L. Por fim, consideremos que pwq ∈ Ow ,
o que nos permite afirmar, empregando o item (3) da Proposition 13, que pvq ∈ L′ . A partir da
Definição 10 temos que pw, wq ∈ L, portanto pv, vq ∈ L o que implica necessariamente na existência
de p′ vq ′ ∈ Ov satisfazendo p′ S p e q ′ P q. Contudo, teremos que p′ wq ′ ∈ L′ , e portanto
p′ wq ′ SP pwq, permitindo-nos concluir que p′ = p, q ′ = q e consequentemente pvq ∈ Ov . Dessa
forma, a igualdade ϕL (w) = ϕL (v) implica que (uw)−1Ow = (uv)−1Ov .
Dado o desenvolvimento apresentado no inı́cio do parágrafo anterior, resta-nos provar que a
condição uwt ∈ L ⇔ uvt ∈ L para u, t ∈ L\{ε} é satisfeita, ou de forma similar, que uwt ∈
/
72 Dinâmica Simbólica e Autômatos
A descrição de como estes resultados podem ser empregados para a determinação do monoide
sintático de uma linguagem F P R denotada por L, especificada através de um conjunto de proibições
irredutı́veis finito é demonstrado através de um exemplo, acompanhado de detalhado comentário.
Consideremos um alfabeto A = {0, 1, 2}. A linguagem L é especificada através do conjunto de
proibições irredutı́veis O = {20, 002, 100, 111, 112, 211, 212, 1011, 1012}. Com essa informação
podemos especificar os conjuntos de prefixos, sufixos e as w-proibições, como apresentado em (3.27)
e (3.28), respectivamente.
P(OA−1 ) = {ε, 0, 00, 1, 10, 101, 11, 2, 21}
Prefixos e Sufixos: (3.27)
S(A−1 O) = {ε, 0, 1, 2, 00, 02, 11, 12, 011, 012}
O = {002, 100, 1011, 1012}
0
Possı́veis w-proibições: O1 = {111, 112, 211, 212, 1011, 1012} (3.28)
O = {1011, 1012}
01
Essa informação é suficiente para determinarmos as classes de equivalência das palavras em L com
mesmo contexto à direita, e as classes de equivalência das palavras com mesmo contexto à esquerda.
Com essa informação podemos determinar as classes sintáticas, que como especificado na Seção 3.6,
podem ser mapeadas através de um morfismo bijetivo com os elementos do monoide sintático. Apli-
cando as Proposições 32 e 34, sabemos que essas classes de equivalência só precisam ser deter-
minadas para os elementos em P(OA−1 ) e S(A−1 O). No caso das palavras w com conjuntos
de w-proibições não vazios, de acordo com o Lema 20, essas são exatamente os fatores não nulos
em A−1 OA−1 e são apresentadas em (3.28). Podendo ser observado destas equações, e como con-
sequência do item (3) da Proposition 37, que cada uma destas palavras determina uma classe sintática
distinta, dado que cada uma delas possui o conjunto Ow distinto.
Prosseguindo, passamos a determinar os possı́veis conjuntos Cw e Dw . Aplicando (3.25) aos
elementos em P(OA−1 ) obtemos: K01 = {02}, K00
2
= {2, 02}, K11 = {00, 011, 012, 11, 12},
2 3 2
K10 = {0, 11, 12, 02}, K101 = {1, 2, 00, 011, 012, 11, 12}, K11 = {1, 2, 00, 011, 012, 11, 12}, K21 =
2
{0, 11, 12}, K21 = {1, 2, 00, 011, 012, 11, 12}. Aplicando (3.26) aos elementos em S(A−1 O) obte-
mos: T01 = {10, 2}, T11 = {11, 21, 101}, T21 = {00, 11, 21, 101}, T00
1 1
= {1, 2, 10}, T02 = {0, 2, 10},
1 1 1 1
T11 = {1, 2, 10, 11, 21, 101}, T12 = {1, 2, 10, 11, 21, 101}, T011 = {1, 2, 10}, T012 = {1, 2, 10}.
3 1
O procedimento de cálculo é explicitando em (3.29) para os casos K101 e T012 , observando-se que
3.11 Obtenção da Estrutura Algébrica através dos Conjuntos de Proibições e Restrições 73
K11 = K101
1 2
, K10 2
= K101 e T21 = T012
3 2
, T012 1
= T12 .
1
K101 = 1−1 O;
2
K101 = 0−1 K101
1
∪ 0−1 O = 0−1 K11 ∪ 0−1 O;
3
K101 = 1−1 K101
2
∪ 1−1 O = 1−1 K10
2
∪ 1−1 O.
(3.29)
3
T012 = O2−1 ;
2 3
T012 = T012 1−1 ∪ O1−1 = T21 1−1 ∪ O1−1 ;
1 2
T012 = T012 0−1 ∪ O0−1 = T12
1 −1
0 ∪ O0−1 .
Neste momento é necessário realizarmos algumas observações relevantes para o emprego desta ferra-
menta em alguns casos. Para toda linguagem ε · L = L, portanto Cε = ∅ é um conjunto trivial, e por-
tanto não é necessário calcula-lo explicitamente. Contudo, este conjunto deve ser considerado quando
da determinação do monoide sintático, sendo representado por [ε] = 1. O conjunto Cε também é im-
portante na determinação da apresentação por contexto à direita de uma linguagem FPR, tema abor-
dado na Seção 3.12. Vamos rever com mais cuidado (3.25), se escolhermos um inteiro positivo j > 1
e uma palavra v ∈ P(OA−1 ) satisfazendo |v| ≥ 2, para determinarmos Kvj é necessário determinar
previamente Kvj−1 = Kvj−1
′ onde v ′ = vA−1, ou seja, uma vez que P(v) ⊆ P(OA−1 ) os cálculos
necessários para a determinação de Kvj−1 não constituem unicamente procedimentos intermediários
com a única finalidade de determinar o conjunto de restrições à direta Cv de v. A mesma conclusão
pode ser estendida para os conjuntos Dw , quando da realização dos cálculos para a determinação
dos conjuntos Twi , com a modificação de Twi ser calculado após a determinação de Twi+1 = Tw1 ′ onde
w ′ = A−1 w, e S(w) ⊆ S(A−1 O).
Na Tabela 3.1 a primeira coluna apresenta o conjunto de classes de equivalência à direita, com
relação de equivalência dada por w ∼ v se, e somente se, Cw = Cv . Denotaremos por C tal relação de
equivalência. A segunda coluna contém os elementos equivalentes de P(OA−1 ), enquanto a terceira
coluna contém os conjuntos respectivos de restrições à direita. De forma recı́proca, a Tabela 3.2 apre-
senta as classes de equivalência à esquerda decorrentes da relação de equivalência D, os elementos
em S(A−1 O) que as formam, e os conjuntos respectivos de restrições à esquerda. Pode ser facilmente
verificado, que a terceira coluna, em ambas as tabelas, são determinadas pela especificação dos ele-
mentos minimais dos conjuntos Kwi e Tw1 já calculados, considerando-se as relações de ordem parcial
P e S , respectivamente.
Temos os elementos teóricos para especificar, de forma algorı́tmica, a que elemento do monoide
sintático pertence uma palavra w ∈ A∗ , equivalentemente, ao conjunto do particionamento de A∗
74 Dinâmica Simbólica e Autômatos
nas classes de equivalência estabelecidas pelos itens da Proposição 37. Nosso método decorre da
própria Proposição 37, da Proposição 32 e da Proposição 34, que permitem a redução da verificação
à determinação dos sufixos e prefixos mais longos da palavra analisada em P(OA−1 ) e S(A−1 O),
respectivamente. Seguindo-se a isso a especificação, quando necessário, do conjunto Ow .
Prosseguiremos, nesta seção, com o desenvolvimento de um procedimento para a determinação
do monoide sintático associado a uma linguagem FPL. O que implica na determinação dos elementos
que o compõe e da implementação da sua operação. Para isso empregaremos sistematicamente o con-
ceito de autômato, particularmente de um tipo de autômato similar a uma árvore n-ária, apresentado
formalmente na Definição 16 e chamado de trie (acrônico para tree-like automaton, [22]). De forma
a facilitar o entendimento, a seguir faremos uso da relação bijetiva que há entre palavras de uma lin-
guagem apresentada por um autômato determinı́stico e os caminhos sobre esse quando é fixado um
estado de “partida” de referência, podendo ser o próprio estado inicial. De forma mais formal, seja
Σ = (Q, A, i, T, δ) um autômato determinı́stico. Considerando q ∈ Q, se há um caminho π em Σ
com rótulo w partindo de q, então π é único, ou seja, não há outro caminho π ′ satisfazendo i(π ′ ) = q
e L(π ′ ) = w. Portanto, especificado um estado de partida como referência, podemos estender um
pouco a nossa notação, aplicando-a a elementos em A′ , e.g., se L é uma linguagem apresentada por
3.11 Obtenção da Estrutura Algébrica através dos Conjuntos de Proibições e Restrições 75
Σ e w ∈ L, então faz sentido escrevermos t(w) sabendo-se que o estado de partida é o estado inicial
i, como seria de esperar, teremos que t(w) = t(π), onde i(π) = i e L(π) = w. Esta terminologia
permite-nos ir um pouco além, como partindo do estado inicial i, quando existir, só há um caminho
com rótulo w, podemos referir o estado t(w) simplesmente como w, uma vez que este estado está
bem definido. Assim, como fazemos na Definição 16, podemos falar no estado t(w) ou ainda no
estado w, sendo este último o estado alcançado que possui rótulo w, parte do estado inicial i e possui
t(w) como estado terminal. Esta aparente recorrência de definições é realizada com o propósito de
facilitar o entendimento e apresentação dos resultados que seguem.
Definição 16. Um trie é um autômato determinı́stico T = (Q, A, i, T, δ), que aceita um conjunto
M ⊆ A∗ , tal que:
(1) Q é o conjunto de estados {w|w é uma palavra em P(M)}, sendo w é o rótulo de um caminho
partindo de i para o estado t(w);
(2) A é o alfabeto;
(3) O estado inicial i é a palavra de comprimento nulo ε (indicado na representação gráfica por uma
seta);
δ(u, a) = ua,
O emprego original das trie decorre de algoritmos sobre sequências empregados para reconhe-
cimento de padrão, codificação, compressão e indexação [22, 23, 24]. O emprego que faremos da
estrutura trie possui estreita relação com estas aplicações, o empregaremos para identificar máximos
prefixos e sufixos dentre um conjunto finito de possibilidades, como também para determinar se uma
palavra possui pelo menos um fator em um conjunto finito especı́fico, no nosso caso, o conjunto de
sequências proibidas.
Inicialmente iremos estabelecer um processo de rotulação dos estados de T determinado por uma
relação de equivalência sobre as sequências P(M) que especificam estes estados. Considerando uma
relação de equivalência r sobre P(M), podemos particionar os estados de T de acordo com r pelo
emprego da relação bijetiva que há entre os estados e as sequências em P(M). Tomemos a partição
P(M)/r, a qual podemos associar uma indexação que possibilita representá-la como {ei }, onde
ei ∈ P(M)/r e ei ∩ ej = ∅ para i 6= j.
76 Dinâmica Simbólica e Autômatos
0 2
2 5 O 0 5
0 1 5
O 1
0 0 4 1 O 2 2
1 6 2 5
3 2 O 0 2 6
ε 1 1
1 O
1 ε
6 1 1 5
2 O 1
2 2 3
1 O 5
2
1 6 4
4 2 O
0 O
(6) Seja w ∈ P(M) uma sequência para a qual r(w) = ej , onde ej ∈ P(M)/r. Então, o estado w é
rotulado por j, o que identifica a classe de equivalência em P(M)/r a qual a sequência associada
pertence.
Um trie munido com um processo de rotulação de seus estados estabelecido por uma relação
de equivalência é especificado por uma breve modificação da nomenclatura, sendo chamado de uma
r-trie. Em nosso caso, estamos interessados nas D-trie e C-trie, sendo definidas como:
Empregaremos as D-trie e C-trie na determinação dos elementos do monoide sintático e como forma
de realizar a operação associada a esse. Para o conjunto O que já vı́nhamos empregando, determi-
namos as C-trie e D-trie, apresentando-as na Figura 3.2 e Figura 3.3, onde os estados terminais são
representados por cı́rculos. Exclusivamente para a C-trie, os vértices não terminais possuem rótulo
O.
Considerando uma palavra w ∈ A∗ , podemos determinar a qual classe de equivalência em
S(A−1 O)/D seu prefixo mais longo em S(A−1 O) pertence pela determinação do estado final al-
cançado pelo caminho mais longo na D-trie quando carregada a partir dos dı́gitos mais a esquerda de
w.
Seguindo a mesma idéia, mas com as devidas modificações, pode-se determinar a classe de equi-
valência em P(O)/C a qual pertence o sufixo mais longo em P (O) de uma sequência w ∈ A∗ . Con-
tudo, há a necessidade de considerarmos o caso em que w não pertence a linguagem, ou seja, w pode
3.11 Obtenção da Estrutura Algébrica através dos Conjuntos de Proibições e Restrições 77
conter um fator em O que não seja um prefixo. Esse caso é devidamente tratado ao considerarmos
uma expansão da funcionalidade da C-trie pela aplicação do algoritmo L-AUTOMATON apresentado
em [22]. Tendo como entrada a C-trie, esse algoritmo gera um autômato que apresentação uma lin-
guagem FPR L especificada através de um conjunto finito de palavras proibidas O. Com função de
transição definida de forma a sempre manter a informação de qual é o máximo sufixo no conjunto
P(O) da palavra analisada. De maneira mais formal, fornecido um C-trie gerado a partir de um
conjunto de palavras proibidas O, o algoritmo L-AUTOMATON determina um autômato completo
Σ(O) = (Q, A, i, T, δ) que representa a linguagem FPR L = A∗ \(A∗ OA∗ ), onde Q = P(O) e
T = P(OA−1 ). Sucintamente, esse algoritmo estende a função parcial de transição apresentada na
Definição 16, para uma função de transição apresentada na Definição 17, ou seja, enquanto a pri-
meira é definida em um subconjunto de Q × A, a segunda é definida para todo o conjunto Q × A,
especificando as transições ainda não definidas.
Teorema 38. [22] Seja L uma linguagem FPR com conjunto de palavras proibidas irredutı́veis O.
Então |Σ(O)| = L.
0
0 2 0, 1, 2
2 5 O
1 1, 2
1 6 O 0, 1, 2
0 1
3 0 0, 1, 2
ε 0 O
1 1
0 4 1 1, 2 0, 1, 2
2 6 O
2 2 0
2 0
1 6 O 0, 1, 2
1, 2
4
0 O 0, 1, 2
2
(i) Se wa ∈ P (O), então do item (1) da Definição 17, relacionado às transições diretas, t(wa) ∈
P(OA−1 ) se, e somente se, wa ∈ L. Caso contrário, wa ∈ O dada a suposição de que wa ∈ P(O).
(ii) Se wa ∈
/ P(O), então o prefixo mais longo de wa e ua é o mesmo, caso contrário, u não é o sufixo
mais longo de w em P(OA−1 ), o que é contrário a nossa suposição. Do item (2) da Definição 17,
se wa ∈ 6 ∅ uma vez que u ∈ P(OA−1 ), e portanto wa ∈
/ L então S(ua) ∩ O = / |Σ(O)| pois seu
sufixo mais longo em P(O) pertence a O; caso contrário, t(ua) é o sufixo mais longo de ua em
P(OA−1 ).
Consideremos o caso w ∈
/ L. Assim, podemos decompor w como w = qup, satisfazendo a condição
q ∈ L é o menor prefixo de w condicionado a u ∈ O. Então (qu)A−1 ∈ L (de outra forma, como
consequência da nossa suposição sobre q, u possui um fator próprio em O), uma vez que u ∈ O e da
Definição 17 temos que t(qu) = u é um estado sorvedouro (não terminal), então w ∈
/ |Σ(O)|. Do
que concluı́mos que L = |Σ(O)|.
(1) Os conjuntos Ow dos elementos da respectiva classe de equivalência não são vazios;
(2) Os conjuntos Ow dos elementos da respectiva classe de equivalência são vazios.
Uma recapitulação necessária e breve do resultado apresentado na Proposição 37 será feita a seguir.
Sabemos que se v, w ∈ A∗ então [v] = [w] se, e somente se, Cv = Cw , Dv = Dw e (uw)−1Ow =
3.11 Obtenção da Estrutura Algébrica através dos Conjuntos de Proibições e Restrições 79
(uw)−1Ov para todo u ∈ L. O método para determinar se um conjunto de palavras está contido
na linguagem, e em caso afirmativo, quais as respectivas classes de equivalência em P(OA−1 )/C e
S(A−1 O)/D será discutido quando abordarmos o caso (2). Inicialmente abordamos como determinar
a terceira condição da Proposição 37 empregando o C-trie. A partir do Lema 20, as palavras w ∈ L
que enquadram-se no caso (1) pertencem ao conjunto S(P(A−1 OA−1 ))\{ε}, além do que Ow ⊆ O.
Para cada palavra em P(O), o autômato C-trie possui um único caminho do estado inicial i com
o rótulo correspondente. Assim, dados quaisquer w, v ∈ S(P(A−1 OA−1 ))\{ε} para que tenhamos
Ow = Ov , é necessário que de cada estado terminal u ∈ P(OA−1 )\{ε} pertencente a C-trie as duas
condições que seguem sejam satisfeitas: (i) uw ∈ P(OA−1 ) se, e somente se, uv ∈ P(OA−1 ),
como também (ii) (uwa)−1 O = (uva)−1 O para todo a ∈ A. Apesar de não abordarmos neste texto,
com toda a profundidade possı́vel, questões referentes a implementação algorı́tmica, estas últimas
observações evidenciam dois pontos relevantes. Em primeiro lugar, a condição (ii) deve ser satisfeita
para quaisquer extensões de uw e uv para palavras em OA−1 , e a condição (i) deve ser verificada para
todo prefixo de uw e uv. Esses elementos podem ser empregados na determinação dos conjuntos não
vazios Ow a partir das palavras de comprimento maior, pertencentes ao conjunto A−1 OA−1 , até as
de comprimento menor. Podendo ser empregado na determinação recursiva de palavras com mesmo
conjunto Ow .
No exemplo que estamos considerando, as palavras com conjunto Ow não vazio são S(P(A−1
OA−1 ))\{ε} = {0, 1, 01}. A partir da Figura 3.2, podemos observar que do estado 0 emana só um
ramo, cujo rótulo é 0, implicando que O0 6= O1 . Do estado 00 emana só um ramo, cujo rótulo é 2,
implicando que O0 6= O01 . Analisando as palavras 1 e 01, observamos que do estado 2 emana um
ramo com rótulo 1, contudo não emana um ramo com rótulo 01, portanto O1 6= O01 . Os processos
apresentados para determinação das classes P(OA−1 )/C e S(A−1 O)/D de uma palavra em L são
mais simples que aqueles utilizados para comparar conjuntos Ow . Assim, julgamos que é melhor
determinar se palavras no conjunto S(P(A−1 OA−1 ))\{ε} são C e D equivalentes, antes de comparar
seus conjuntos Ow . Adicionalmente, observamos que todo elemento em ML cujos representantes
em A∗ possuem conjuntos Ow não vazios, podem ser interpretados como elementos “transitórios”,
sempre que O é finito. Esses representantes pertencem ao conjunto S(P(A−1 OA−1 ))\{ε}, logo
se M + 1 é o maior comprimento de um elemento em O, sendo M a memória do ssf (o conceito
de memória é extensivamente abordado em [18]), a operação de no máximo M elementos distintos
da identidade em ML \{ε} é suficiente para garantir que os representantes do elemento resultante
possuem conjunto Ow vazio.
Analisando o caso (2), representaremos os elementos em ML através do par ordenado (ij), tal
que, para w ∈ L, [w] = (ij) se, e somente se, w ∈ Di , w ∈ Cj , e Ow = ∅; onde Di e Cj são classes
de equivalência nos conjuntos quocientes L/D e L/C, respectivamente.
80 Dinâmica Simbólica e Autômatos
Como resultado do Teorema 38, sabemos que w ∈ L se, e somente se, t(w) é um estado terminal
de Σ(O). Portanto, como procedimento para determinarmos se uma palavra w ∈ A∗ pertence a
linguagem L, e em caso afirmativo, a que classe de equivalência em L/C, só precisamos identificar o
estado alcançado em Σ(O) ao percorrermos o caminho cujo rótulo é w a partir do estado inicial. Se
w ∈ L, então a palavra que identifica o estado t(w), é a mais longa do conjunto S(w) ∩ P(OA−1 ),
sendo o rótulo do estado t(w) a classe de equivalência a qual pertence w. Este fato pode ser verificado
brevemente pelo emprego de um raciocı́nio indutivo. Essa afirmação é verificada facilmente como
verdadeira para |w| = 0, consideremos que ela também é verdadeira para |w| ≤ n. Suponhamos
que t(w) = u (assim, u é a palavra mais longa em S(w) ∩ P(OA−1 ), portanto t(wa) = t(ua) e
dos itens (1) e (2) da Definição 17 concluı́mos que t(ua) é o sufixo de ua mais longo no conjunto
Q, seguindo disso que t(ua) também é o sufixo mais longo de wa em Q. De forma a esclarecermos
esta última afirmação, se há outra opção que não o mais longo sufixo de ua, então ela terá que ser
mais longa que o próprio ua (pois ua é sufixo de wa), vamos chamá-la de v. Então |v| > |ua|,
e portanto |vA−1 | > |uaA−1| ⇒ |vA−1| > |u|. Do que seguiria que v é o mais longo sufixo de
w e não u, como supusemos inicialmente. Como exemplo, consideremos a sequência 010120 e o
autômato da Figura 3.4, percorrendo o caminho associado em Σ(O) observamos que t(010120) ∈ O,
não pertencendo a linguagem. Por outro lado, se considerarmos a sequência 110210 teremos que
t(110210) = 10, do que concluı́mos que 110210 ∈ L e 110210 ∈ C4 .
Para qualquer palavra w ∈ A∗ possuı́mos um método para determinar se ela pertence à linguagem
e, em caso afirmativo, especificar a que classe de equivalência L/C ela pertence. Agora, determina-
remos a que classe de equivalência L/D a palavra w pertence. Para tanto empregaremos a D-trie.
A classe de equivalência procurada é dada pelo rótulo do estado terminal do caminho mais longo
em D-trie que seja um prefixo de w. Para identifica-lo, só precisamos determinar o rótulo do estado
terminal do caminho mais longo em D-trie que começa no estado inicial e cujo rótulo é um prefixo
de w. A partir da construção da D-trie, o rótulo de tal caminho é o prefixo mais longo de w em
S(A−1 O), seguindo da Proposição 34 que o rótulo do estado terminal identifica a classe a qual w
pertence. Como exemplo, a partir da Figura 3.3 e considerando a palavra 110210, seu prefixo mais
longo em S(A−1 O) é 11, portanto ela pertence à classe de equivalência D5 .
Sumarizando nossa análise sobre w = 110210, como o conjunto Ow é vazio, podemos represen-
tar o elemento respectivo do monoide sintático por [110210] = (54). Uma vez que [w][v] = [wv],
o método apresentado disponibiliza uma forma de realizarmos a operação do monoide, dado que
sabemos quais são os elementos de ML , ou seja, sabemos que pares (ij) correspondem a elemen-
tos do monoide e os elementos que possuem conjunto Ow não vazio. Seguindo o procedimento já
apresentado, dados dois elementos [w] e [v], para realizarmos a operação do monoide devemos em-
pregar os autômatos Σ(O) e D-trie, “carregando-os” com wv. Se sabemos que |w| ≥ M então
3.11 Obtenção da Estrutura Algébrica através dos Conjuntos de Proibições e Restrições 81
Dwv = Dw , de forma similar se |v| ≥ M então Cwv = Cv . Considerando que estas restrições de
comprimento são satisfeitas, se sabemos que um elemento de ML possui um representante w tal
que |w| ≥ M, então podemos simplificar o cálculo envolvendo esse elemento. Para tanto, obser-
vamos que [w][v] ∈ S(P(A−1 OA−1 ))\{ε} se, e somente se, [w], [v] ∈ S(P(A−1 OA−1 ))\{ε}
ou ainda podemos ter os casos em que [w] ou [v] é a identidade. Desenvolvendo o exemplo já
iniciado, [0][1] = [01] ∈ S(P(A−1 OA−1 ))\{ε}, contudo [01][w] ou [w][01] possuem represen-
tantes com conjuntos Ow vazios sempre que [w] 6= 1. Se considerarmos um comportamento a
“longo prazo” (operação entre mais que M − 1 elementos de ML diferentes da identidade), para
w ∈ S(P(A−1 OA−1 ))\{ε}, [w] também poderá ser representado a partir de um par ordenado (ij),
desconsiderando o conjunto Ow , uma vez que o resultado da operação realizada certamente será um
elemento em ML cujos representantes possuem conjunto Ow vazio. Portanto, as especificidades lo-
cais de algumas classes do monoide sintático são eliminadas quando considerado o comportamento a
longo prazo.
Já dispomos dos elementos necessários para realizarmos a operação do monoide sintático ML
empregando os autômatos apresentados, sendo necessário iniciarmos pela determinação dos pares
ordenados (ij) associados a elementos de ML . Como as classes de equivalência das palavras com
conjuntos Ow não vazios são obtidos diretamente de O (estas classes possuem representantes no con-
junto S(P(A−1 OA−1 )) ), nos concentraremos na determinação das classes com Ow vazio, referentes
ao caso (2). Claramente, o número máximo destas classes é #(L/D) × #(L/C).
Considerando um par ordenado (ij) especı́fico, 1 ≤ i ≤ #(L/D) e 1 ≤ j ≤ #(L/C), em-
pregando os elementos desenvolvidos até aqui, podemos afirmar que há um elemento do monoide
sintático associado a esse par ordenado se, e somente se, para alguma palavra w ∈ P(S(A−1 O)) o
estado w no D-trie possui rótulo i, além de ser possı́vel estender o estado t(w) em Σ(O) para um
estado com rótulo j empregando uma palavra v, ou seja, t(wv) possui rótulo j, devendo ser satisfeita
a restrição que o rótulo do estado obtido ao carregarmos wv na D-trie também possui rótulo i. Como
exemplo, na Figura 3.3 o estado 0 possui rótulo 2, contudo se o estendermos empregando uma palavra
de rótulo 0 ou 2, as classes resultantes em L/D serão D5 ou D6 , respectivamente. Portanto, as ex-
tensões de 0 só pertencerão a classe D2 se a palavra resultante for 01 ou possui a forma 010u, tal que
010u ∈ L. Todas essas conclusões podem ser verificadas empregando-se os autômatos Σ(O) e D-trie.
Como procedimento geral, empregando o autômato D-trie determina-se o conjunto de palavras com
classe Di e cuja extensão é uma palavra em L que também pertence a classe Di . Empregando-se esse
conjunto, utilizando o autômato Σ(O) determina-se os pares (ij), onde 1 ≤ j ≤ #(L/C). De forma
natural, podemos começar esse processo de determinação dos possı́veis pares (ij), especificando-os
para os elementos dos conjuntos P(OA−1 ) e S(A−1 O), uma vez que metade do cálculo necessário
já foi realizado quando foram determinadas as classes de equivalência L/C e L/D, respectivamente.
82 Dinâmica Simbólica e Autômatos
Portanto, considerando a Tabela 3.1 e a Tabela 3.2, podemos determinar a Tabela 3.3. Para o nosso
caso, há #(L/D)×#(L/C) = 36 pares ordenados (ij) que são candidatos a representarem elementos
de ML , muitos não estão relacionados a elementos em ML , uma determinação que em alguns casos
pode ser realizada a partir de observações simples.
Inicialmente, consideremos uma linguagem FPR L sobre um conjunto finito A com conjunto de
restrições O finito. Se para qualquer w em Σ∗ de comprimento positivo, há pelo menos um prefixo de
comprimento positivo contido no conjunto S(A−1 O), o que significa que P(w)\{ε}∩S(A−1O) 6= ∅,
então podemos concluir que w ∈
/ D1 para todo w não nulo, do que resulta não haver classes em ML
cujo par ordenado (ij) associado possua i = 1, a não ser a classe com representante ε. Colocando de
outra forma, não haverá w ∈ A∗ , |w| > 0, cujo estado alcançado quando w é “carregada” no D-trie
seja ε. De forma similar, se para todo w ∈ A∗ , |w| > 0, a desigualdade S(w)\{ε} ∩ P(OA−1 ) 6= ∅
é verificada, então w ∈
/ C1 , assim não há classes sintáticas com j = 1 em seus respectivos pares
ordenados (ij), a não ser o elemento que possui ε como representante, o que é equivalente a não
haver caminhos de comprimento positivo tendo ε como estado inicial e terminal em Σ(O).
Como exemplo, consideremos a identificação dos possı́veis pares ordenados (ij) com i = 3. Só
há a palavra 1 em S(A−1 O) nessa classe. A única extensão por um dı́gito cuja palavra resultante
permanece na classe D3 e o conjunto Ow seja vazio é 10. Dessa forma, empregaremos a palavra
10 para determinar os possı́veis j, ou seja, especificar u tal que os possı́veis valores de j sejam
determinados mantendo-se a restrição 10u ∈ L. Especificamos os possı́veis casos em (3.30), obtidos
ao “carregarmos” 10u em Σ(O).
4, u = ε.
j: (3.30)
6, u = 1.
Do que concluı́mos que só temos as classes (34) e (36) em ML , cujos representantes 10 e 101,
respectivamente, possuem conjuntos Ow vazios.
Tabela 3.3: R EPRESENTANTES DAS CLASSES N ÃO NULAS E PARES ORDENADOS (ij) ASSOCIADOS .
Definição 18. O autômato M(O) é derivado da versão rotulada de Σ(O), com todos os seus estados
sendo terminais, além de seus ramos e estado inicial satisfazerem as condições que seguem.
• Dois estados terminais I, J de Σ(O) são ditos equivalentes, se possuem o mesmo rótulo (estados
com rótulo O não são considerados na determinação dos estados de M(O)). Tal relação particiona
o conjunto de estados terminais de Σ(O) em conjuntos denotados por e1 , e2 , . . . , er , onde r é o
número de classes em L/C. Cada classe de equivalência ei constitui um estado de M(O).
• Há um ramo em M(O) com rótulo a de ei para ej se, e somente se, há estados I ∈ ei e J ∈ ej e
um ramo em Σ(O) com rótulo a de I para J;
Os resultados que seguem demonstram que M(O) é uma apresentação reduzida e determinı́stica
de L. Como resultado preliminar essencial, no Lema 39 demonstramos que ao estendermos palavras
equivalentes com relação a C por elementos de A, a equivalência é preservada. Ou seja, a relação de
equivalência C é uma relação de congruência quando consideramos a operação de concatenação de
elementos em A∗ .
Lema 39. Seja w, v ∈ L satisfazendo C(w) = C(v), então C(wa) = C(va), onde wa ∈ L e a ∈ A.
O resultado apresentado no Lema 39 é essencial para que possamos determinar a linguagem apre-
sentada por M(O).
Proposição 40. Seja L uma linguagem FPR com conjunto de proibições irredutı́veis O. Então M(O)
é uma apresentação determinı́stica de L.
3
Em [25] apresentamos um algoritmo para construir o autômato minimum de uma ssf a partir de classes de restrições
à direita; contudo, os conjuntos de restrições são derivados de um conjunto de proibições irredutı́veis necessariamente
finito, e não como apresentado neste material, a saber, como uma propriedade intrı́nseca de uma linguagem fatorial e
prolongável. Também não são realizadas conexões com o conceito de monoide sintático.
84 Dinâmica Simbólica e Autômatos
Demonstração: Do Lema 39 e Proposição 32, para C(w) = C(v) e w, v ∈ L então o sufixo mais
longo de wa e va em P(OA−1 ) pertence a mesma classe de equivalência em L/C quaisquer que
sejam wa, va ∈ L, decorrendo da Definição 17 que M(O) é determinı́stico.
a a
Da Definição 18, se ei −→ ej então para todo I ∈ ei existe J ∈ ej , satisfazendo I −→ J
em Σ(O), para todo a ∈ A. Considerando que isso é satisfeito para qualquer v com comprimento
va v a
|v| ≤ n. Se ei −→ ej , e portanto va ∈ |M(O)|, então deve existir ek tal que ei −→ ek −→ ej .
v
Portanto, para todo I ∈ ei haverá K ∈ ek satisfazendo I −→ K, sendo possı́vel determinar um
a va
J ∈ ej , tal que, K −→ J. Do que decorre que I −→ J e va ∈ |A(O)|, o que permite-nos concluir
que |M(O)| ⊆ |Σ(O)|.
a a
Se I ∈ ei , J ∈ ej e I −→ J, então ei −→ ej . Consideremos que isso é satisfeito para toda a
v v va
palavra v com |v| < n, tal que, I −→ J implica que ei −→ ej . Para qualquer va, tal que, I −→ K
v a
teremos va ∈ |Σ(O)|. Logo, observa-se necessariamente que I −→ J −→ K onde K ∈ ek , portanto
v a
deve-se também observar ei −→ ej −→ ek , permitindo-nos concluir que va ∈ |M(O)|. Do que
conclui-se que |Σ(O)| ⊆ |M(O)|.
Por fim, ficam estabelecidas as igualdades |M(O)| = |A(O)| = L.
Lema 41. Sejam iv = I, v ∈ P(OA−1 ) e I um estado terminal de Σ(O). Então R(I, Σ(O)) =
R(v, L).
Demonstração: Do Teorema 38 sabemos que Σ(O) é uma apresentação de L, então R(I, Σ(O))
⊆ R(v, L), uma vez que iv = I. Se vu ∈ L, então i(vu) é um estado terminal J, e portanto
v u
i −→ I −→ J, permitindo-nos concluir que R(v, L) ⊆ R(I, Σ(O)).
Como resultado do Lema 41, o contexto à direita de estados com rótulo i em Σ(O) são iguais aos
das palavras em L pertencentes as classes Ci . Na Proposição 42 demonstramos que M(O) também
satisfaz esta propriedade, permitindo-nos concluir que ele é uma apresentação reduzida.
2 0 5
0 1 1
2 ε 1 1 3
0 1
2
2 1
4 6
0
2
Figura 3.5: O autômato M(O).
a a
Demonstração: A partir da Definição 18 temos que I −→ J ⇒ ei −→ ej , que conjuntamente com
a a
o Lema 39, caso ei −→ ej então para qualquer I ∈ ei existe J ∈ ej satisfazendo I −→ J, portanto
a a v
ei −→ ej ⇒ I −→ J. Agora, para todo |v| ≤ n, suponhamos que ei −→ ej se, e somente se, há
v v a
I ∈ ei e J ∈ ej , tal que, I −→ J. Então, para todo a ∈ A, I −→ J −→ K se, e somente se,
v a
ei −→ ej −→ ek , K ∈ ek . Do que concluı́mos que R(I, A(O)) = R(ei , M(O)).
Demonstração: Por construção, todos os estados de M(O) são terminais e alcançados a partir do
estado inicial. Como o estado inicial de Σ(O) alcança qualquer outro dos seus estados, então ele é
um autômato essencial. Da Proposição 40 o autômato M(O) é uma apresentação determinı́stica de
L, e do Lema 41 e Proposição 42 ele também é reduzido (ver Corolário 11).
Considerando a Figura 3.4, o autômato correspondente M(O) é apresentado na Figura 3.5. Como
o autômato M(O) apresenta a mesma informação que A(O) (a mesma linguagem), então ele pode
ser empregado para realizar a operação do monoide e a identificação das restrições à direita no lugar
do autômato A(O), que é mais complexo (maior número de estados). Realizando essa substituição
de representações, reduzimos a complexidade dos algoritmos empregados, pois, como pode ser de-
monstrado, ela está relacionada com o número de estados e ramos do autômato empregado.
86 Dinâmica Simbólica e Autômatos
Capı́tulo 4
Geometria Hiperbólica
Definição 20. Um grupo (G, ·) é um conjunto G sobre o qual define-se um operação ·, que associa a
cada par ordenado (a, b) de elementos de G um elemento ab ∈ G, satisfazendo as condições:
Um exemplo tı́pico de grupo com G finito, é o conjunto das simetrias (reflexão e rotação) de um
polı́gono regular . E de grupo com G infinito, o conjunto dos inteiros com operação de soma. Um
87
88 Geometria Hiperbólica
grupo é dito cı́clico se possui um elemento tal que G = {ak | k ∈ Z}, onde a é dito gerador. Como
exemplo de grupo cı́clico finito, temos as classes de resı́duos Zm = Z/mZ de Z módulo um inteiro
m com operação de adição (Zm , ⊕). Nesse caso, o elemento 1̄ ∈ Zm , com 1 ∈ 1̄, é um gerador, não
m
sendo único, pois qualquer elemento ā tal que a, m são relativamente primos também é um gerador
[26, 21].
Como uma extensão do caso anterior, temos que ao conjunto Z2 = Z × Z pode-se dar a estrutura
de grupo quando considerada a operação de soma por coordenada, gerando um reticulado em R2 .
Como caso finito, consideramos o conjunto (Zm , Zn ) com as operações de soma naturais.
Definição 23. Um espaço métrico é um par (M, d) onde M é um conjunto e d é uma métrica 1 em M.
Sejam M, N espaços métricos. Uma transformação f : M → N é chamada uma imersão isométrica
quando d(f (x), f (y)) = d(x, y) para quaisquer x, y ∈ M, ou seja, f preserva distâncias. Segue da
definição que uma imersão isométrica é sempre injetora. Uma isometria é uma imersão isométrica
sobrejetora.
Os conceitos relacionados de ação de grupo sobre conjunto, órbita e estabilizadores são centrais
no desenvolvimento que segue. Um grupo G atua sobre um conjunto X (via transformações) se para
todo (g, x) ∈ G × X está associado um elemento g(x) ∈ X tal que
Esses elementos nos permitem definir uma relação de equivalência ∼ sobre X dada por x ∼ y se, e
somente se, y = g(x) para algum g ∈ G. Uma classe de equivalência sobre ∼ é chamada de órbita ,
sendo dada, para x ∈ X, por G(x) = {y ∈ X | y = g(x), para algum g ∈ G}. O conjunto quociente
1
Uma função d : M × M → R, que para quaisquer x, y, z ∈ M satisfaz as condições: (1) d(x, x) = 0; (2) se x 6= y
então d(x, y) > 0; (3) d(x, y) = d(y, x); (4) d(x, z) ≤ d(x, y) + d(y, z).
4.2 O Plano Hiperbólico 89
γ4 γ2
γ1 α
b
γ3
seus pontos. Portanto, a distância hiperbólica dH2 (z, w) entre dois pontos z, w ∈ H2 é definido em
(4.2), para todo caminho γ de z para w.
O disco unitário é formado pelos pontos D2 = {z ∈ C | |z| < 1}, decorrendo que ∂D2 =
{z ∈ C | |z| = 1}. Como dito, os modelos D2 e H2 encontram-se relacionados através de um
homeomorfismo f (z) : H2 → D2 , apresentado em (4.3).
iz + 1
f (z) = (4.3)
z+i
O mapeamento f (z) é uma isometria, a distância entre w1 , w2 ∈ D2 pode ser estabelecida a partir da
iz+1 −iw+1
distância já conhecida entre f −1 (w1 ), f −1(w2 ) ∈ H2 . Para w = f (z) = z+i
temos que z = w−i
,
seguindo a determinação da distância em D2 como apresentado em (4.4).
|dz|
= d −iw+1 Im −iw+1
Im(z) w−i w−i
−2dw
(1−iw)(w̄−ī)
= (w−i) 2 Im (w−i)(w̄−ī)
(4.4)
|2dw|
= |w−i|2 Im (1−iw)( w̄+i)
|w−i|2
|2dw|
= (1−|w|2 )
.
4.2 O Plano Hiperbólico 91
D2
Ficando estabelecido o espaço métrico (D2 , dD2 ), com métrica especificada pelo elemento diferencial
derivado em (4.4). Neste modelo as geodésicas são arcos de cı́rculos ortogonais a ∂D2 e os diâmetros
de D2 , como apresentado na Figura 4.2. Munidos com as métrica dD2 (dH2 ), observamos que a
distância entre qualquer ponto em D2 (H2 ) e um ponto sobre o bordo ∂D2 (∂H2 ) é infinita. Logo, os
pontos do bordo são ditos pontos no infinito. De forma equivalente
aodo modelo H2 , a distância em
|1−z w̄|+|z−w|
D2 pode ser expressa algebricamente por dD2 (z, w) = ln |1−z w̄|−|z−w|
.
Dado um subconjunto A ⊂ H2 , a área hiperbólica µ(A) de A é dada pela integral (4.5), sempre
que esta existir, onde z = x + iy.
dxdy
Z
µ(A) = . (4.5)
A y2
Empregando (4.3) pode-se demonstrar que para o modelo D2 a área hiperbólica é dada por (4.6), onde
agora A ⊂ D2 e z = x + iy.
4 dxdy
Z
µ(A) = . (4.6)
A (1 − |z|2 )2
Uma diferença marcante entre a geometria hiperbólica e a euclidiana está relacionada a determinação
da área de polı́gonos. A definição de um polı́gono em qualquer uma destas geometrias é semelhante,
contudo a forma como a área pode ser determinada revela, mais uma vez, distinções fundamentais
entre estas geometrias. Inicialmente, consideremos a Definição 24.
Definição 24. Dada duas geodésicas que se interceptam em um ponto z ∈ H2 ∪ ∂H2 , o ângulo
hiperbólico entre elas é igual ao ângulo entre os vetores tangentes (no sentido euclidiano) no ponto
z. Na Figura 4.3 o ângulo θ entre os vetores tangentes às geodésicas γ1 e γ2 é igual ao ângulo
hiperbólico.
Um polı́gono hiperbólico com n arestas é uma região fechada em H2 ∪∂H2 (D2 ∪∂D2 ) delimitada
por n segmentos de geodésicas. Se duas geodésicas se interceptam em um ponto, este é denominado
um vértice do polı́gono. São permitidos vértices em ∂H2 (∂D2 ), contudo segmentos de ∂H2 (∂D2 ) não
podem pertencer ao polı́gono. Na Figura 4.4 são apresentados exemplos de triângulos em H2 ∪ ∂H2
e D2 , respectivamente. Possuı́mos elementos suficientes para enunciarmos o Teorema 44.
92 Geometria Hiperbólica
H2
θ
D2
Teorema 44. (Teorema de Gauss-Bonnet para triângulos hiperbólicos) Seja ∆ um triângulo hi-
perbólico com ângulos α, β, γ. Então,
µ(∆) = π − α − β − γ.
Podendo ser estendido para o caso de um polı́gono qualquer, resultando no Teorema 45.
az + b
γ(z) = , (4.7)
cz + d
Ressaltamos que os elementos de PSL(2, R) podem ser interpretados como classes de equivalência
contendo transformações de Möbius ou matrizes em SL(2, R) que realizam a mesma transformação
az+b
em C. Portanto, PSL(2, R) contém todas as transformações ∆ da forma z → com a, b, c, d ∈
cz+d√
R e det(∆) > 0, uma vez que dividindo o numerador e denominador da transformação por ∆
obtém-se uma nova matriz com determinante unitário. Em particular, PSL(2, R) contém todas as
transformações da forma z → az + b (a, b ∈ R, a > 0), e da forma z → − z1 .
É um resultado bem conhecido que PSL(2, R) ⊂ Isom(H2 ), onde Isom(H2 ) representa o grupo de
isometrias de H2 . Contudo, apesar de só considerarmos em nosso desenvolvimento esse conjunto, ele
não perfaz todas as possı́veis isometrias de H2 . Consideremos uma extensão imediata dos conjuntos
anteriores, a saber, o grupo PS∗ L(2, R) = S∗ L(2, R) {±12 } onde S∗ L(2, R) é um grupo de matrizes
a b
reais g = com det(g) = ±1. Portanto, o grupo PS∗ L(2, R) contém o grupo PSL(2, R)
c d
como um subgrupo de ı́ndice dois. Dito isso, no Teorema 46 especificamos o conjunto de isometrias
de H2 .
Teorema 46. [30] O grupo Isom(H2 ) é gerado pelas transformações de Möbius (4.7) em PSL(2, R)
juntamente com a transformação z → −z̄, sendo isomorfo a PS∗ L(2, R). O grupo PSL(2, R) é o
subgrupo de Isom(H2 ) de ı́ndice dois.
Teorema 47. [30] Qualquer transformação em PSL(2, R) é conforme, enquanto qualquer transfor-
mação em PS∗ L(2, R)\PSL(2, R) é anti-conforme.
az+b
Como expresso no Teorema 46, consideremos a função φ(z) = −z̄ e o elemento T (z) = cz+d
∈
−az̄+b
PSL(2, R), então T ◦ φ(z) = T (−z̄) = −cz̄+d
, observando que agora o determinante da matriz
associada a transformação T ◦ φ é dado por −ad + bc = −1. Permitindo-nos concluir que toda
az̄+b
transformação dada pela composição T ◦ φ, onde T ∈ PSL(2, R), é do tipo U(z) = cz̄+d
com
ad − bc = −1. Pode-se ver que φ gera um grupo isomorfo a Z2 , dado que φ ◦ φ = Id. Dessa
forma, o grupo das isometrias de PS∗ L(2, R) é isomorfo a PSL(2, R) × Z2 , onde σ(T ) = Id para
σ
todo T ∈ PSL(2, R).
94 Geometria Hiperbólica
az + b
TD2 (z) = , a, b ∈ C e |a|2 − |b|2 = 1. (4.8)
b̄z + ā
Há três tipos de elementos em PSL(2, R), distinguı́veis pelos valores do traço das isometrias associ-
az+b
adas, dados por Tr(T ) = |a + d|, onde T (z) = cz+d
.
(1) Isometria hiperbólica: Se Tr(T ) > 2, neste caso a matriz associada em SL(2, R) pode ser
λ 0
diagonalizável em R, sendo conjugada a uma matriz da forma , onde λ 6= 1. Equi-
0 1/λ
valentemente, é conjugada a uma transformação de Möbius da forma z 7→ kz, onde k > 0,
portanto, uma dilatação. A transformação T possui dois pontos fixos em ∂H2 ∪ {∞} (em ∂D2
para transformação conjugada sobre D2 ), um repulsor e outro atrator.
(2) Isometria elı́pticas: Se Tr(T ) < 2, neste caso a matriz associada em SL(2, R) é conjugada a
cos θ sin θ
uma matriz da forma . Equivalentemente, é conjugada a uma transformação de
− sin θ cos θ
Möbius sobre D2 da forma z 7→ zeiθ , portanto, uma rotação em torno da origem por um ângulo θ.
A transformação T possui um par de pontos complexos conjugados fixos, dessa forma um ponto
fixo em H2 (em D2 para transformação conjugada sobre D2 ).
(3) Isometria parabólicas: Se Tr(T ) = 2, é interpretada com um caso intermediário entre o hi-
perbólico e elı́ptico, sendo conjugada a uma transformação de Möbius da forma z 7→ z + 1,
portanto, uma translação. A transformação T possui um ponto fixo em ∂H2 ∪ {∞} (em ∂D2 para
transformação conjugada sobre D2 ).
As propriedades dos diferentes tipos de isometrias com relação aos seus pontos fixos reserva co-
mentários quantitativos quanto ao comportamento geométrico decorrente da ação deles sobre H2 ou
D2 . Considerando γ uma isometria hiperbólica, como dois pontos sobre ∂H2 ou ∂D2 são fixados,
a geodésica que os têm como pontos terminais permanece inalterada pela ação de γ, pois a ação de
isometrias leva geodésicas em geodésicas e dois pontos definem uma única geodésica. Quando γ for
elı́ptica, teremos um único ponto fixo em H2 ou D2 , como o conjunto de geodésicas que passam por
este ponto é invariante pela ação de γ, as geodésicas desse conjunto são mapeadas entre si realizando
um movimento de rotação em torno do ponto. Quando γ é parabólica, neste caso as geodésicas com
4.4 Grupo Fuchsiano 95
um ponto fixo em um ponto em H2 ou D2 formam uma famı́lia invariante pela ação de γ, onde um
dos extremos permanece fixo enquanto o outro é deslocado sobre pontos distintos do bordo.
a b
Consideremos uma transformação T (z) = em PSL(2, R). Com T ′ (z) = (cz + d)−2 ,
c d
as medidas euclidianas são multiplicadas por |T (z)| = |cz + d|−2. Neste caso, os comprimentos
′
euclidianos não são alterados no locus determinado pela equação algébrica |cz + d| = 1. No caso
em que c 6= 0, o locus é o cı́rculo |z + dc | = 1
|c|
com centro em − dc e raio 1
|c|
, denominado cı́rculo
isométrico . Representaremos o cı́rculo isométrico associado a uma transformação T por I(T ). O
Teorema 48 e o Teorema 49 apresentam fatos geométricos relevantes para o entendimento da ação de
T sobre H2 e D2 .
Teorema 48. [30] A transformação T expande comprimentos e áreas euclidianas no interior de I(T ),
e comprime-os fora deste.
Teorema 49. [30] Os cı́rculos isométricos I(T ) e I(T −1 ) possuem o mesmo raio, e I(T ) e mapeado
sobre I(T −1 ) pela transformação T .
Como todos os semi-cı́rculos em H2 com centros em ∂H2 são geodésicas hiperbólicas, podemos
concluir que os cı́rculos isométricos são, na verdade, geodésicas em H2 e em D2 .
az + b 1
T (z) = ∈ PSL(2, R), então kT k = (a2 + b2 + c2 + d2 ) 2 . (4.9)
cz + d
Munido com a métrica d(T, S) = kT − Sk, consideramos PSL(2, R) como um grupo topológico.
De forma similar podemos associar uma métrica a Isom(H2 ), de forma que o grupo de isometrias
hiperbólicas também é um grupo topológico.
Definição 26. Um subgrupo discreto de Isom(H2 ) é dito fuchsiano se é composto por isometrias
conformes, ou seja, é um subgrupo discreto de PSL(2, R).
Subgrupos discretos de grupos de Lie2 são comumente ditos reticulados por analogia com os
reticulados no Rn que são grupos discretos de isometrias de Rn , tendo como propriedade importante
a ação descontı́nua sobre Rn , ou seja, todo ponto do Rn possui uma vizinhança que é mapeada fora
deste pelos elementos do reticulado, exceto a identidade. Como vimos, isometrias podem ter pontos
fixos, o que impede o cumprimento total destas condições. Contudo, os grupos de isometrias podem
satisfazer uma condição de descontinuidade mais fraca, como apresentado na Definição 27.
Definição 27. Um grupo G atua de forma propriamente descontı́nua sobre um espaço métrico X, se
a G-órbita de qualquer ponto x ∈ X é localmente finita, ou seja, a orbita G(x) é discreta sobre X e o
grupo de estabilizadores Gx de x é finito.
A partir da Definição 27, o Teorema 50 pode ser demonstrado empregando conceitos elementares
de espaços topológicos.
Teorema 50. [30] Um grupo G possui ação propriamente descontı́nua sobre um espaço topológico
X se, e somente se, cada ponto x ∈ X possui uma vizinhança V tal que
Teorema 53. [30] Se o conjunto limite Λ(Γ) contém mais que dois elementos, então
Esses resultados fundamentam a seguinte classificação dos conjuntos limites, temos especial in-
teresse em grupos fuchsianos do primeiro tipo.
2. Em um grupo fuchsiano de segundo tipo , os pontos limites são densos em nenhuma parte em ∂D2 .
Definição 29. Uma identificação de arestas de um polı́gono hiperbólico Π é uma partição dos seus
ramos em pares {e, e′ } de igual comprimento hiperbólico (possivelmente infinito), com uma isometria
Te,e′ : e → e′ em PSL(2, R) para cada par. Esse conceito é formalmente estabelecido empregando
conceitos de geometria riemanniana [32, 33].
1. Pontos internos u ∈ Π;
No Teorema 54 é estabelecida a condição para que uma superfı́cie obtida pelo processo de identi-
ficação descrito acima seja uma superfı́cie hiperbólica. Seguiremos demonstrando quando um espaço
de identificação existe, como este está relacionado com o grupo de isometrias, culminando no Teo-
rema de Poincaré, que determina uma condição de necessidade e suficiência para que uma região de
identificação possa ser associada a uma superfı́cie geométrica.
Teorema 54. [28] O espaço de identificação S = SΠ possui uma métrica (concordando com a
métrica hiperbólica para regiões suficientemente pequenas no interior de Π), tornando-o uma su-
perfı́cie hiperbólica, quando a soma dos ângulos de um ciclo de vértices for igual a 2π.
Definição 30. Uma região fechada F ⊂ X (i.e. o fecho de um conjunto aberto F̊ , chamado interior
de F ) é definida como uma região fundamental para G se
S
1. T (F ) = X;
T ∈G
Lema 55. [30] Seja Γ um subgrupo de PSL(2, R) com ação propriamente descontı́nua sobre H2 ,
e p ∈ H2 um ponto fixo por algum elemento de Γ. Então há uma vizinhança W de p para a qual
nenhum outro ponto de W é fixado por um outro elemento de Γ que não a identidade.
Definição 31. Seja Γ um grupo fuchsiano arbitrário e p ∈ D2 não fixado por qualquer elemento de
Γ, a não ser a identidade, o que é factı́vel pelo Lema 55. Uma região de Dirichlet para um grupo
fuchsiano Γ, com centro em p é o conjunto
Para cada T1 ∈ PSL(2, R), o conjunto apresentado em (4.10) é formado pelos pontos z mais
próximos ou com igual distância, em relação a métrica hiperbólica, de p com relação a T1 (p).
T
Como a Γ-órbita de p é discreta, temos que o conjunto Pp (Γ) = Pp (T ) possui área hiperbólica
T ∈Γ
positiva. Além disso, os conjuntos dD2 (z, p) = dD2 (T (z), p) são geodésicas que particionam H2 em
semiplanos hiperbólicos, um dos quais contém p. Portanto, Pp (Γ) é uma região hiperbólica conexa,
podendo ser observado por comparação que Pp (Γ) = Dp (Γ). O Teorema 56 estabelece a importância
das regiões Dp (Γ).
Teorema 56. [30] Se p não é um ponto fixo para qualquer elemento Γ\{Id}, então Dp (Γ) é uma
região fundamental conexa para Γ.
Definição 32. Uma região fundamental F para um grupo fuchsiano Γ é dita localmente finita se a
tesselação {T (F ) | T ∈ Γ} é localmente finita.
Alguns pontos merecem destaque. Inicialmente, estabelecemos uma tesselação do espaço métrico
hiperbólico por regiões Dp (Γ) decorrentes da ação propriamente descontı́nua de isometrias (homeo-
morfismos conformes), portanto, formada por regiões hiperbolicamente iguais. Propriedades adicio-
nais decorrentes deste processo são apresentadas na Proposição 58.
Proposição 58. Seja Γ um grupo fuchsiano, p ∈ D2 que não é ponto fixo para qualquer Γ\{Id}, e
Dp (Γ) a região de Dirichlet associada.
1. Dado x ∈ ∂Dp (Γ), existe T ∈ Γ\{Id} tal que T (x) ∈ ∂Dp (Γ).
2. Dada uma aresta e ∈ Dp (Γ), existe uma única T ∈ Γ\{Id} tal que e = Dp (Γ) ∩ T (Dp (Γ)).
100 Geometria Hiperbólica
3. Temos que v é um vértice ordinário de Dp (Γ) se, e somente se, existem T, T ′ ∈ Γ\{Id} tais que
v = Dp (Γ) ∩ T (Dp (Γ)) ∩ T ′ (Dp (Γ)).
2. Seja {Ti } o subconjunto de Γ constituı́do pelos elementos que identificam lados de Dp (Γ). Então
{Ti } é um conjunto de geradores para Γ.
Teorema 60. [30] Há uma correspondência bijetiva entre os ciclos elı́pticos de Dp (Γ) e as classes
conjugadas de subgrupos cı́clicos finitos maximais não-triviais de Γ .
Definição 33. As ordens dos subgrupos cı́clicos finitos maximais não-conjugados de Γ são chamadas
perı́odos de Γ.
Colocados esses elementos iniciais quanto à relação entre propriedades algébricas de Γ e as pro-
priedades geométricas da tesselação associada, passaremos a verificar quais as consequências dessas
sobre a estrutura da superfı́cie hiperbólica associada.
Definição 34. Um grupo fuchsiano Γ é dito geometricamente finito se há uma região fundamental
convexa para Γ com número finito de lados.
Teorema 61. (Teorema de Siegel) Se Γ satisfaz µ(D2 /Γ) < ∞ então Γ é geometricamente finito.
Teorema 62. [30] Seja Γ um grupo fuchsiano com região de Dirichlet Dp (Γ).
3. Se µ(Dp (Γ)) < ∞ mas Dp (Γ) é não-compacta, então Dp (Γ) possui pelo menos um vértice no
infinito.
5
Não há outro subgrupo cı́clico do qual ele seja subgrupo próprio.
102 Geometria Hiperbólica
Teorema 63. [30] Seja Γ um grupo fuchsiano com região não-compacta de Dirichlet Dp (Γ) satisfa-
zendo µ(Dp (Γ)) < ∞.
2. Se ξ é o ponto fixo de alguma transformação parabólica em Γ, então existe T ∈ Γ tal que T (ξ) ∈
∂Dp (Γ).
Teorema 64. [30] Um grupo fuchsiano Γ é co-compacto se, e somente se, µ(D2 /Γ) < ∞ e Γ não
possui elementos parabólicos.
Teorema 65. [30] Seja Γ um grupo fuchsiano com região fundamental compacta, possuindo assina-
tura (g; m1 , m2 , . . . , mt ). Então
t
2
X 1
µ(D /Γ) = 2π (2g − 2) + 1− .
i=1
m i
t
X 1
(2g − 2) + 1− > 0,
i=1
mi
v5
b
v6
b
b
v4
g3 g1
v7 b
g2
b v3
b
g4
v8 b
v2
b
v1
Figura 4.5: Tesselação {8, 4}, mostrando a identificação de arestas realizada pelos geradores.
g3 g1 F
g1 F
g1 ḡ4 F g3 F
g2 ḡ3 F
ḡ3 F ḡ2
g2 F
ḡ3 g2 F
g3
F g4 ḡ2 F
ḡ2 F
g4 F
ḡ2 g4 F
g4 ḡ1 F
ḡ4 F
ḡ1 F
ḡ4 ḡ1 F
geradores que antecede o rótulo, ou seja, g3 g2−1. No entanto, há infinitas possibilidades para realizar-
mos essa translação, contudo a que exemplificamos é a mı́nima, em termos do número de geradores
empregados. Como observação adicional, percebemos a redução exponencial da área euclidiana das
imagens de F quando essas aproximam-se da fronteira de D2 . Esse fenômeno é essencial no processo
de codificação aritmética do fluxo geodésico, juntamente com o fato das topologias induzidas pelas
métricas euclidiana e hiperbólica serem a mesma [30]. Estes conceitos ajudam no entendimento dos
métodos de codificação aritmético e geométrico apresentados no Capı́tulo 5.
Capı́tulo 5
Códigos Geodésicos
O Fluxo geodésico sobre uma variedades riemanniana de curvatura seccional negativa está entre os
exemplos mais difundidos de comportamento caótico de um sistema dinâmico, para o qual a dinâmica
simbólica está entre as ferramentas mais importantes para o estudo [10, 34, 35]. Como esse exemplo
envolve um objeto matemático, dispomos para sua análise de ferramentas e métodos analı́ticos de
natureza algébrica, geométrica e topológica que nos permitem inferir sobre sua estrutura (elementos
estáticos, e.g. topologia) e comportamento (elementos dinâmicos, e.g. fluxo geodésico). Acredita-
mos que as variedades riemannianas possam servir de arquétipo para o desenvolvimento de métodos
analı́ticos para o estudo e aplicação de sistemas dinâmicos com comportamento caótico. Tendo como
interesse principal aqueles cujas caracterı́sticas fı́sicas e comportamento possam ser aplicados à sis-
temas de comunicação [36, 37, 38].
105
106 Códigos Geodésicos
A geometria riemanniana nos mune com ferramentas que permite-nos estender os conceitos de dife-
renciação, tı́picos de espaços euclidianos, para estruturas denominadas de variedades contı́nuas. As
superfı́cies hiperbólicas que abordamos pertencem a esse conjunto, sendo variedades bidimensionais
com curvatura negativa. A estrutura adicionada às variedades riemannianas que permite essa extensão
é a de fibrado tangente, sendo o espaço natural de se trabalhar quando tratamos de questões que
envolvam “posição” e “velocidade”.
Aqui introduziremos a ideia que possibilite-nos apreciar o conceito de fibrado tangente. Inici-
almente, consideremos um ponto p ∈ M, onde M é uma superfı́cie riemanniana diferenciável ou
variedade diferenciável bidimensional1[32]. Uma parametrização em torno de p é definido como
o par (Uα , xα ), onde Uα ⊂ R2 é um aberto e xα uma aplicação biunı́voca de Uα sobre M, ou
seja, xα : Uα ⊂ R2 → M, satisfazendo p ∈ xα (Uα ). Dada qualquer outra parametrização
xβ : Uβ ⊂ R2 → M em torno de p, para o conjunto xα (Uα ) ∩ xβ (Uβ ) = W 6= ∅ em M, temos
que xα −1 (W ) e xβ −1 (W ) são abertos em R2 e a aplicação xβ −1 ◦ xα é um difeomorfimo2. O par
(Uα , xα ) também é chamado de um sistema de coordenadas de M em p, com xα (Uα ) sendo uma
vizinhança coordenada em p. Observadas algumas condições quanto a extensão por uma famı́lia
{(Uα , xα )} de parametrizações satisfazendo
[
xα (Uα ) = M,
α
esta é dita uma estrutura diferenciável em M. Consideremos uma curva α : (−ǫ, ǫ) → M dife-
renciável em M. Suponhamos que α(0) = p ∈ M, e seja D o conjunto das funções de M dife-
renciáveis em p. O vetor tangente à curva α em t = 0 é a função α′ (0) : D → R dada por
d(f ◦ α)
α′ (0)(f ) = , f ∈ D.
dt t=0
1
Poderı́amos considerar uma dimensão qualquer, mas não precisamos desse grau de generalidade.
2
Um homeomorfismo diferenciável, função bijetiva e contı́nuo com inversa também contı́nua, ambas diferenciáveis.
5.1 Conceitos Preliminares 107
η
us+t
F
t
us
∂ ∂
onde ∂x1 0
e são os vetores tangentes em p às curvas coordenadas x1 → x(x1 , 0) e x2 →
∂x2 0
x(0, x2 ), respectivamente. Portanto, ∂x∂ 1 0 , ∂x∂ 2 0 forma uma base em Tp M. Dada uma variedade
7
8 6
g1
9 5
F
10 4
γ1
γ2 6
11 3 5 8 7
9 3 1
12 2 11
1 10 12 γ4
4 2
M γ3
g3 g1 F
g1 F
g1 ḡ4 F g3 F
u′′ g2 ḡ3 F
ḡ3 F
us+t
g2 F
ḡ3 g2 F
u′
F g4 ḡ2 F
ḡ2 F g4 F
us
ḡ2 g4 F
g4 ḡ1 F
ḡ4 F
ḡ1 F
ḡ4 ḡ1 F
vetores π(us+t ) e π(u′′) são elementos de C interceptados sucessivamente pelo fluxo geodésico em
SM. Em D2 , temos que ḡ2 us+t = u′ , sendo que u′ define unicamente uma geodésica e, portanto, o
vetor u′′ .
Com o emprego da seção transversal, temos uma forma de “capturar” a dinâmica do nosso fluxo
geodésico através de um sistema discreto de eventos. Contudo, o valor assumido em cada instante de
tempo ainda é não enumerável. Nosso próximo passo consiste em determinar um particionamento fi-
nito de C (que induzirá nossa quantização) que, apesar da perda de detalhamento, nos permitirá inferir
sobre as caracterı́sticas do fluxo geodésico através do locus (ou geodésica) gerado pelo deslocamento
dos vetores em SD2 ou SM. A descrição do processo de codificação fica mais clara quando consi-
deramos o fluxo em SD2 . O código é determinado pela sequência de sı́mbolos definida pelo mapa
de retorno, especificado pelo gerador de Γ cuja ação sobre (p, v) ∈ SD2 , onde p ∈ ∂F e v aponta
para fora de F , é o elemento (p′ , v ′ ) com p′ ∈ SD2 e v ′ apontando para dentro de F . Referindo-nos
à Figura 5.4, quando a geodésica definida por (ps , us ) intercepta ∂F em (ps+t , us+t), a ação de ḡ2
sobre SD2 e D2 gera as translações (ps+t , us+t ) → (p′ , u′) e g2 F → F , respectivamente. Neste caso
g2 é armazenado como um sı́mbolo de nossa sequência, e a operação é repetida para a geração dos
sı́mbolos subsequentes.
Esse processo de codificação é conhecido como codificação geométrica (método de codificação
de Koebe-Morse), possuindo estreita relação com a geometria da região fundamental e superfı́cie
associada. O processo de codificação também pode ser realizado de forma aritmética (método de
codificação de Artin), empregando métodos generalizados de expansão dos pontos terminais da
110 Códigos Geodésicos
P1 P2
ā a b̄ b
geodésica (ou pontos limites da geodésica sobre ∂D2 ), de forma similar a expansões n-árias e em
frações contı́nuas, essa última relacionada a processos de codificação do fluxo geodésico em H2
empregando a superfı́cie modular [35, 39]. Na próxima seção descreveremos esses processos de
codificação para uma superfı́cie em particular, cujas peculiaridades evidenciem propriedades e con-
ceitos necessários para posterior apresentação do método geral.
R∞
a
ā
R∞ ā a R b b̄ R∞
b̄
b̄
b
R∞
por π o homeomorfismo D2 → M∞ , que também pode ser interpretado como uma projeção.
A região fechada R na Figura 5.6, que compõe a cobertura de M, é prolongada para a região
infinita R∞ que é projetada em M∞ através de π. Sem comprometimento da generalidade da análise,
podemos supor que 0 ∈ R. As linhas Pi são prolongadas para as linhas P̃i , que formam os lados da
região R∞ e são identificadas por isometrias a, b de D2 . Pode-se observar que o grupo Fuchsiano Γ
associado a R∞ não possui elementos elı́pticos, logo Γ é um grupo livre e pode ser presentado por
ha, b| i. As cópias de R que lhe são adjacentes são da forma eR, onde e ∈ Γ0 = {a, ā, b, b̄}. O lado
s comum a R e eR é rotulado por e no lado de eR, no lado de R ele recebe o rótulo ē. De forma
equivalente, o lado de s interior a R é rotulado pela isometria que o mapeia em outro lado de R.
Essa rotulação é estendida por translação através da aplicação de Γ sobre R∞ para a tesselação de D2
constituı́da pelas imagens de R∞ , como também induz uma rotulação nas linhas orientadas P1 e P2
sobre M.
ao lado de e0 . . . ei−1 R através do qual γ sai, entrando na região e0 . . . ei−1 ei R. Essa é a sequência
cortante de γ. Portanto, quando analisado a partir da cobertura universal U ⊆ D2 de M, se um
arco direcionado α em U passa pela região R2 a partir da região R1 , possuindo sequência cortante
e1 . . . en , então R2 = e1 . . . en R1 . A sequência cortante de γ é infinita se, e somente se, γ está contida
em M, implicando que esta nunca intercepta ∂M. Pelo processo de construção, nota-se que em uma
sequência cortante não há fatores do tipo eē, e ∈ Γ0 , caso contrário γ interceptaria Pi duas vezes
seguidas em direções opostas, o que é impossı́vel. Sequências onde tais fatores não ocorrem são ditas
reduzidas.
Associado ao método de codificação de Artin, este método requer a definição do processo de expansão
do bordo ∂D2 associado ao grupo Fuchsiano Γ. O que é feito para o caso particular de um toro
puncionado em [40]. Segue uma descrição similar, mas para o caso da esfera com três buracos. A
curva C(e) corresponde ao lado de R∞ cujo rótulo exterior é e, e ∈ Γ0 , sendo A(e) o arco sobre ∂D2
definido por C(e) associado ao semi-plano hiperbólico He (R∞ ) oposto ao qual encontra-se a região
R∞ . Define-se o mapeamento f : A → ∂D2 , f |A(e) (x) = ēx, onde A = {A(e) : e ∈ Γ0 } é o
S
sequência obtida por expansão do bordo para ξ é igual a sequência cortante para β. Decorre deste
fato que as conclusões decorrentes de um método podem ser estendidas para o outro, como será visto,
isto permite representar o fluxo geodésico em M associado ao conjunto de sequências cortantes, com
o ssf obtido pelo método de expansão do bordo.
Inicialmente, observamos que uma geodésica estende-se ao infinito, logo as geodésicas, que po-
dem ser identificadas unicamente através do processo de expansão do bordo, são aquelas que têm
os pontos limites no conjunto ∞ −n
S
n=0 f A. Pois, dada uma geodésica direcionada β, podemos de-
terminar unicamente a expansão dos seus pontos inicial e terminal, portanto determinamos a própria
geodésica. No entanto, tomando ξ como um ponto terminal de β e supondo que β∩R 6= ∅, caso ξ pos-
sua expansão do bordo infinita, ou seja, ξ ∈ ∞ −n
S
n=0 f A, segue do parágrafo acima que a sequência
cortante associada a β também é infinita, implicando que π(β) está integralmente contida na região
compacta M de M∞ e, portanto, mantem-se a uma distância limitada da órbita Γ0 do ponto 0 ∈ D2 ,
assim β converge para um ponto do conjunto limite Λ de Γ, segue que ∞ −n
S
n=0 f A ⊆ Λ. Além disso,
como Λ ⊂ A, se ξ ∈ Λ então f n ξ ∈ ΓΛ = Λ ⊂ A para todo n, uma vez que Λ é Γ-invariante. Por-
tanto, ξ ∈ ∞ −n
A. Fica assim estabelecido o resultado [8, Lema 2.2], a saber, Λ = ∞ −n
T T
n=0 f n=0 f A.
Isto permite estabelecer uma bijeção entre o espaço das sequências reduzidas infinitas Σ+ em Γ0 e o
conjunto limite de Γ, ou seja, há uma bijeção p+ : Σ+ → Λ que associa a cada ponto e0 e1 . . . ∈ Σ+ o
ponto ∞ −1
T
n=1 (e0 · · · en ) A(en+1 ). Como caracterı́stica adicional, as sequências obtidas por expansão
do bordo ou as sequências cortantes só possuem como restrição os fatores ef onde f = ē. Logo, o
conjunto de sequências Σ+ pode ser especificado por uma matriz adjacente M = (mef ), e, f ∈ Γ0 ,
com mef = 0 se f = ē e mef = 1 caso contrário. Isto implica que Σ+ é igual ao conjunto de
sequências (ei )∞
i=0 satisfazendo mei ei+1 = 1 para todo i ≥ 0 e, portanto, é um SF T (possui conjunto
de proibições irredutı́veis finito).
ser reduzida. Para o caso ξ0 = η0 , a geodésica γ(ξ, η) estaria contida integralmente no semi-plano
hiperbólico limitado por C(ξ0 ) no lado aposto àquele onde encontra-se a região R, assim γ ∈
/ R. Se
ξ0 6= η0 então γ ∩ R∞ 6= ∅, implicando que γ ∩ R 6= ∅ e, portanto, γ ∈ R. Fica assim estabelecido o
resultado [8, Teorema I0 ], a saber, A = R.
Seguindo com a determinação da relação entre estas estruturas, consideremos ξ ′ ∗ η ′ = σ(ξ ∗ η),
do que segue que η ′ = η1 η2 . . . e ξ ′ = η̄0 ξ0 ξ1 . . .. Como f (η) = η̄0 (η) possui expansão η1 η2 . . . e
f (ξ ′) = η0 (ξ ′ ) possui expansão ξ0 ξ1 . . ., têm-se que η ′ = η̄0 (η) e η0 (ξ ′ ) = ξ. Portanto, σ(ξ ∗ η)
corresponde a geodésica η̄0 (γ). Como as sequências cortantes e aquelas obtidas por expansão do
bordo são iguais, então e0 = η0 e, portanto, τ (γ) = ē0 γ = σ(γ). Fica assim estabelecido o resultado
[8, Teorema II0 ], a saber, τ = σ.
códigos coincidem e são iguais ao conjunto de sequências reduzidas sobre os geradores do grupo
fuchsiano associado. O mesmo não é observado no caso geral. Pelo teorema de Poincaré, a presença
de vértices de F em D2 introduz relações entre os geradores de Γ que implicam na não observância
de propriedades essenciais, listadas abaixo.
• Não é mais verdadeiro que qualquer geodésica conectando um ponto em F a um ponto em A(g)
possui sequência cortante iniciando com g.
Como consequência, o conjunto de sequências cortantes já não é mais um SFT. Podemos minorar
as dificuldades surgidas se considerarmos regiões fundamentais com a propriedade de cantos pares,
ou seja, as arestas de F podem ser estendidas para geodésicas completas em D2 que continuam a
pertencer a tesselação T de D2 obtida por Γ(∂F ). A observância da propriedade de cantos pares tem
implicações essenciais na estrutura do código obtido pelo emprego das sequências cortantes, espe-
cificado no Teorema 67, e pelo emprego da expansão do bordo, especificado no Teorema 70. Nas
próximas seções desenvolveremos os conceitos apresentados no Teorema 67 e Teorema 70, explici-
tando o emprego destes nos processos de codificação do fluxo geodésico.
γ1
γ2
γ4
M γ3
Figura 5.7: Imagem das arestas de F , com vértices pares, sobre a superfı́cie associada.
γ
γ
Teorema 67. [42] Seja Γ um grupo fuchsiano e F uma região fundamental associada com a propri-
edade dos cantos pares. Para os interesses desse trabalho, supomos que F possui mais que quatro
lados.
• Uma sequência de arestas é mı́nima se, e somente se, é reduzida e não contém ciclos longos ou
cadeias longas.
Dado uma sequência de polı́gonos mı́nima P que contém o vértice v, diz-se que o ângulo em P
sobre o vértice v é π, π + ou π − , se o número de regiões em P que interceptam v é n(v), n(v) + 1 ou
n(v) − 1, respectivamente.
Portanto, é comumente referenciado como um processo generalizado de expansão dos pontos em ∂D2
[44, 45].
Expansão do Bordo
Consideraremos a rotulação dos lados externos a F por g1 , . . . , gk em sentido anti-horário, sendo estes
o conjunto simétrico Γ0 de geradores de Γ. Denotamos por C(gi ) a geodésica completa em T pela
extensão do lado de rótulo gi , e por A(gi ) = [Pi , Qi ] o arco delimitado por C(gi ) sobre ∂D2 , onde Pi
precede Qi em sentido anti-horário. Em nossa abordagem, consideramos que Γ é de primeira espécie5 ,
portanto, o conjunto g∈Γ0 A(g) recobre ∂D2 . Estabelecidos estes elementos, segue a definição da
S
Definição 36. A função de expansão do bordo f : ∂D2 → ∂D2 é dada por f |[Pi,Pi+1 ) (ξ) = ḡi (ξ), ou
seja, é igual por partes ao conjunto de geradores Γ0 do grupo fuchsiano Γ com região fundamental F .
Quando Γ não possui elementos parabólicos, portanto, F não possui vértices em ∂D2 fixados
por elementos de Γ, então a partição induzida em ∂D2 pelos pontos Pi , Qi constitui uma partição
Markoviana finita para f , [44, Teorema 2.1]. A f -expansão6 de ξ ∈ ∂D2 é a sequência ξf = gi0 gi1 . . .,
onde gij ∈ Γ0 , satisfazendo f n (ξ) ∈ [Pin , Pin +1 ), n ∈ N. O conjunto de sequências infinitas que são
expansões de pontos em ∂D2 é denotado por Σ+ = {ξf : ξ ∈ ∂D2 } ⊂ ∞
Q
i=0 Γ0 .
O conjunto de pontos em ∂D2 formado pelos pontos terminais das geodésicas em T que passam
por um vértice de F é denotado por W . Então W induz um particionamento B finito em ∂D2 ,
cujos elementos são os conjuntos de intervalos disjuntos limitados por pontos em W . Segue de [44,
Lema 2.3] que f (W ) ⊆ W , com igualdade seguindo diretamente quando W é finito e sabendo-
se que f é Γ-equivalente por partes. Essas propriedades permitem-nos associar à ação de f sobre
o particionamento B um ssf de memória um, que denotaremos por ΣB ⊂ ∞
Q
i=0 B, onde B é um
alfabeto finito com elementos a ∈ B associados biunivocamente a intervalos B(a) ∈ B, e portanto
S
a∈B B(a) = B.
Como cada intervalo [Pi , Pi+1 ) é uma união de intervalos em B, pode-se definir um mapeamento
natural β : B → Γ0 que associa a um intervalo J ∈ B o gerador gi quando J ⊂ [Pi , Pi+1 ), do
que segue que o mapeamento induzido β̄ : ΣB → Σ+ é sobrejetivo e injetivo exceto em um número
contável de pontos onde ele é 2 para 1, um fenômeno similar a dubiedade na expansão decimal dos
números reais, no entanto decorrente das propriedades da ação da função f sobre ∂D2 [45]. Como
5
Com relação ao processo de codificação por expansão do bordo, o objetivo dessa restrição é facilitar a compreensão
do método, não sendo inerente a esse.
6
A f -expansão é introduzida e extensivamente analisada em [44], sendo a principal ferramenta para codificação por
expansão do bordo.
5.3 Codificação do Fluxo Geodésico 121
Σ+ é a imagem de um mapa fator sobre um SFT de memória um, temos que Σ+ é um ssr [18]. Devido
a relevância desse resultado para nossa abordagem, iremos referencia-lo através do Lema 68.
Lema 68. [8, 44] O ssf Σ+ é um ssr obtido como imagem do SFT ΣB pelo mapa fator β̄.
Teorema 69. [8] Uma palavra w pertence a B(Σ+ ) se, e somente se, não contém H-ciclos anti-
horários.
Como veremos na próxima seção, o processo de codificação do fluxo geodésico através de códigos
aritméticos está relacionado com a expansão dos pontos sobre ∂D2 para os quais a geodésica cor-
respondente ao locus do fluxo geodésico codificado converge. Chamados de pontos terminais da
geodésica. Especificada uma direção para a geodésica, de acordo com o sentido do fluxo, o ponto
contrário ao sentido do fluxo é denominado repulsor (ξ), enquanto o outro de atrator (η), como mostra
a Figura 5.1. A Definição 36 é empregada no processo de expansão do atrator. Para a expansão do
repulsor empregamos a função apresentada na Definição 37. Essa mudança tem como objetivo tornar
o processo de codificação aritmética do fluxo geodésico consistente, ou seja, uma representação do
fluxo geodésico através de um fluxo especial sobre um ssf.
Definição 37. A função de expansão do bordo f¯ : ∂D2 → ∂D2 é dada por f¯|(Qi−1 ,Qi] (ξ) = ḡi (ξ), ou
seja, é igual por partes ao conjunto de geradores Γ0 do grupo fuchsiano Γ com região fundamental F .
Como resultado desse duplo processo de expansão, a extensão de Σ+ (conjunto de sequências in-
finitas) para um conjunto Σ (conjunto de sequências bi-infinitas) corresponde a extensão do processo
de codificação de um ponto para uma geodésica. A inversão da assimetria apresentada na definição de
f permite representar a ação do fluxo sobre as geodésicas na superfı́cie, através da ação do mapa des-
locamento sobre Σ. A função f¯ satisfaz todas as propriedades de f , a não ser pela inversão dos termos
+
“anti-horário” e “horário”. Em particular, ei . . . ei+r ∈ B(Σ+ ) se, e somente se, ēi+r . . . ēi ∈ B(Σ ),
+
onde Σ = {ξf¯ : ξ ∈ ∂D2 }.
As funções f e f¯ bem definidas (equivalentes por parte a Γ0 ), permitem-nos associar uma estrutura
Markoviana a ação do fluxo geodésico sobre ∂D2 , como expresso no Teorema 70. Estas funções são
extensivamente estudadas em [45, 9].
Teorema 70. [44] Seja Γ um grupo fuchsiano de primeira espécie finitamente gerado, com uma
região fundamental F que satisfaz a propriedade dos cantos pares. Então há um mapeamento Mar-
122 Códigos Geodésicos
γ γ
γ∈R γ ∈R
/
(1) (2)
Figura 5.10: Possı́veis deformações de uma geodésica orientada quando intercepta um vértice.
koviano f : ∂D2 → ∂D2 cuja ação sobre ∂D2 é equivalente a ação de Γ sobre ∂D2 , ou seja, geram
as mesmas órbitas.
γ γ
γ∈R∩A γ∈A−R
(1) (2)
γ γ
γ∈R−A γ ∈A∪R
/
(3) (4)
Deve-se ressaltar que o processo de codificação que gera A e R em cada instante de tempo (ou
ı́ndice dos sı́mbolos das sequências código) emprega uma região F especı́fica para comparação desses
conjuntos (uma referência), associada ao conjunto R.
Ao contrário do caso particular abordado na Seção 5.2, já não é observada a igualdade A = R.
A disparidade entre os conjuntos A e R surge com relação às geodésicas que passam próximo a
vértices de F [8]. Podendo ser de quatro tipos, dependendo da direção da geodésica e sua posição em
relação a F . Os possı́veis casos são apresentados na Figura 5.11. Se queremos que nosso conjunto
de sequências código reflita propriedades de um espaço topológico, podendo ser associadas a uma
superfı́cie, devemos trabalhar com o conjunto R. Contudo, precisamos projetar codificadores que
124 Códigos Geodésicos
Codifica em Estima em
A∩R Superfı́cie M A∩R
associem sequências código às sequências de informação de nossa fonte, e o código associado a R
é demasiadamente complexo para que consigamos determinar até mesmo uma representação finita
desse. Ao contrário, o código associado a A é um ssr, portanto possui uma representação finita
através de um grafo direcionado e rotulado.
Propomos duas alternativas para tratar com esse dilema. A primeira restringe o conjunto de
sequências efetivamente aplicadas no processo de codificação àquelas contidas no conjunto A ∩ R,
com condição a ser satisfazer para isso expressa na primeira implicação da Proposição 71 e repre-
sentada no caso (1) da Figura 5.11. Um modelo para o nosso sistema resultante é apresentado na
Figura 5.12. A segunda alternativa será tratada na próxima seção.
Proposição 71. [8] Suponha que ξ¯0 η0 pertença a um ciclo ou cadeia e que γ passe próximo ao vértice
v(ξ, η). Então,
3. Suponhamos que P e P ′ não possuem regiões em comum e possuem ângulo π em todos os vértices
comuns. Sejam Ri , . . . , Ri+p e Rj′ , . . . , Rj+p
′
sequências de regiões em P e P ′ que compartilham
os vértices v1 , . . . , vk . Suponhamos também que Ri e Rj′ possuam um lado em comum. Então
′
Ri+r é associada a Rj+r para 0 ≤ r ≤ p.
1. T (γ) = S(γ) = γ, se γ ∈ R ∩ A.
Salientamos que pela definição acima, os mapas S, T são iguais por partes aos elementos de Γ,
além disso, pode ser verificado geometricamente que as regiões onde S e T são iguais a um g ∈ Γ
fixo podem ter suas fronteiras determinadas explicitamente. O Teorema 72 especifica a importância
desses mapeamentos.
126 Códigos Geodésicos
Codifica em
S(·)
A
Superfı́cie M
Decodifica
T (·)
em A
Teorema 72. [8] O mapa T é uma bijeção R → A. De fato, T e S são inversos um do outro.
Teorema 73. [8] O mapa T conjuga as ações de σ sobre A e τ sobre R. Portanto, os seguintes
diagramas comutativos são válidos.
τ σ
R −−−→ R A −−−→ A
Ty yT Sy yS
A −−−→ A R −−−→ R
σ τ
análises estatı́sticas quantitativas sobre o código aritmético decorrente dessas funções de expansão do
bordo [34].
Consideraremos como região fundamental um polı́gono hiperbólico F com (8g−4) lados, e tesselação
associada {(8g − 4), 4}. Rotularemos as arestas consecutivas por s1 , . . . , s8g−4 em sentido anti-
horário. A identificação de arestas é especificada pela permutação de ordem 2 sobre 1, . . . , 8g − 4
definida em (5.2).
4g − 4 mod (8g − 4), i ı́mpar,
σ(i) = (5.2)
2 − i mod (8g − 4), i par.
Uma representação para o caso de um polı́gono com 12 arestas (g = 2) é apresentado na Figura 5.14,
onde destacamos as arestas identificadas através das retas tracejadas. Os rótulos 11 , 12 , 21 , 22, . . . na
base da figura identificam os elementos do particionamento B apresentado na Seção 5.3.3, especifica-
dos pelos pontos terminais das geodésicas em T que passam por vértices de F . Os pontos terminais
das geodésicas obtidas como prolongamento da aresta si de F são rotulados por ai e bi , com ai prece-
dendo bi quando considerando o sentido anti-horário. Representamos o caso a7 e b7 na Figura 5.14.
Portanto, como decorrência da ação de g1 o ponto a1 é mapeado em b7 , b1 é mapeado em a7 , b12 é
mapeado em b8 e a2 é mapeado em a6 . O caso geral é apresentado no Lema 74.
Lema 74. [9] A transformação gi mapeia os pontos ai−1 , ai , bi−1 , ai+1 , bi , bi+1 , respectivamente, nos
pontos aσ(i)+1 , bσ(i) , bσ(i)+1 , aσ(i)−1 , aσ(i) , bσ(i)−1 .
De forma similar, as regras de transição que definem o SFT subjacente ao código aritmético podem
ser determinadas para um tesselação qualquer que satisfaça a propriedade dos cantos pares [45].
128 Códigos Geodésicos
b7 a7
g1 F
7
8 6
g1
9 5
F
10 4
11 3
12 2
1
D
22
11 12 21
Lema 75. Seja L = {1, . . . , k}, onde k ≥ 4 é um inteiro par, e σ : L → L uma permutação
S
arbitrária. Suponhamos uma partição {C, P} de L, tal que, P = i∈C P(i) onde P(i) = {(σ(i) −
1), σ(i), (σ(i) + 1)}. Logo, o maior valor de |C| é obtido quando |P| = |C| + 2 e os elementos
{σ(i)}i∈C são consecutivos.
Agora, suponhamos que |P| = |C| + 1, implicando em dois possı́veis casos σ −1 (σ(i) − 1) ∈
/ C
ou σ −1 (σ(i) + 1) ∈
/ C para algum i ∈ C. Consideraremos aqui um dos casos, a análise do outro
segue pari passu. Seja σ(j1 ) = (σ(i) + 1) para algum j1 ∈ C, então existe j2 ∈ C satisfazendo
σ(j2 ) = (σ(i) + 2), e assim por diante. Novamente, concluı́mos que L = P.
Se |P| = |C| + 2 e {σ(i)}i∈C não é um conjunto de elementos consecutivos, então C possui pelo
menos três elementos j1 , j2 , j3 satisfazendo (σ(jl ) + 1) ∈
/ {σ(i)}i∈C ou (σ(jl ) − 1) ∈
/ {σ(i)}i∈C ,
1 ≤ l ≤ 3. Portanto, |P| = |{P(i)}i∈C | ≥ |C| + 3. Concluı́mos que |P| = |C| + 2 só ocorre se os
elementos do conjunto {P(i)}i∈C são consecutivos, sendo simples verificar que só há dois elementos
no conjunto P que não pertencem a {P(i)}i∈C . Neste caso obtemos |C| = k/2 − 1 e |P| = k/2 + 1.
Para prova do Teorema 76 novamente referenciaremos (5.3), chamando a atenção que as transições
i → (σ(i) − 1), σ(i), (σ(i) + 1) são exatamente as transições proibidas, o que nos permitirá empregar
o Lema 75.
Teorema 76. O máximo ssf-completo contido no ssf Xg , possui alfabeto C com cardinalidade 4(g−1),
ou seja, |C| = 4(g − 1).
Demonstração: Para a permutação σ(·) apresentada em (5.2), iremos demonstrar que não há um
partição {C, P} de L = {1, . . . , 8g − 4} satisfazendo |P| = |C| + 2, especificando em seguida uma
partição que satisfaz |P| = |C| + 4.
Como resultado do Lema 75, existe uma partição satisfazendo |P| = |C| + 2 se, e somente se,
os elementos em {σ(i)}i∈C são consecutivos. Portanto, os elementos em C também são consecutivos,
além disso |L| = |C| + |P| = 2|C| + 2 = 8g − 4, logo |C| = 4g − 3. Complementando, |L|/4 =
(8g − 4)/4 = 2g − 1 e assim |C| − |L|/4 = 2g − 4, o que para g ≥ 2 é pelo menos dois. Portanto,
o conjunto C possui pelo menos um dos elementos “cardinais” {1, 2g, 4g − 1, 6g − 2}. De (5.2), o
vizinho de um elemento cardinal é a imagem um do outro. Assim, para |P| = |C| + 2 existe i ∈ L
satisfazendo i, σ(i) ∈ C, o que é uma contradição.
Como não há uma partição com |C| = (4g−3), prosseguimos com a análise do caso |C| = (4g−4).
Considerando a partição {C1 , C2 } de C onde C1 = {2, 3, . . . , 2g −1} e C2 = {4g, 4g +1, . . . , 6g −3}.
Portanto, |C| = |C1 | + |C2 | = 4(g − 1). A partir de (5.2), segue que para
2g + 1 ≤ σ(i) ≤ 4g − 3, i ı́mpar,
i ∈ C1 :
6g ≤ σ(i) ≤ 8g − 4, i par.
6g − 1 ≤ σ(i) ≤ 8g − 5, i ı́mpar,
i ∈ C2 :
2g + 2 ≤ σ(i) ≤ 4g − 2, i par.
130 Códigos Geodésicos
Grafos Direcionados
Um grafo G = (V, E) é definido por um conjunto finito de vértices V e um conjunto finito de ramos
E, tal que, para todo ramo e ∈ E é associado um estado inicial i(e) e um estado terminal t(e). Um
caminho π em G é um conjunto de ramos consecutivos, ou seja, se π = e1 . . . en então t(ei ) = i(ei+1 )
para 1 ≤ i < n. Um grafo rotulado é um par G = (G, L) tal que G e um grafo e L : E → A é a
função de rotulação onde A é um conjunto finito chamado de alfabeto. Um grafo rotulado G é
determinı́stico se para qualquer e1 , e2 ∈ E satisfazendo i(e1 ) = i(e1 ) então L(e1 ) 6= L(e2 ). Um grafo
G pode ser considerado um grafo rotulado ao considerarmos L igual a função identidade. Seja Aij
igual ao número de ramos em G com estado inicial i e estado terminal j, para qualquer i, j ∈ V. A
matriz adjacência de G é A = [Aij ]. A matriz adjacência associada ao grafo G é denotada por AG .
Para um grafo rotulado G = (G, L), a matriz adjacência é denotada por AG = AG . Um ssr XG é
determinado pela leitura dos rótulos de ramos consecutivos em um grafo rotulado G. Neste caso G
é uma representação de XG . Para um SFT com memória um, ou seja, que pode ser determinado por
um conjunto F de palavras proibidas de comprimento dois, há um procedimento simplificado para a
determinação de uma representação G = (G, L). Um grafo inicial G = (V, E) é especificado que
satisfaça V = A e E = {ij ∈ A × A| ij ∈
/ F}, tal que i(ij) = i e t(ij) = j, com função rotulação
especificada por L(ij) = j para todo ij ∈ E [18].
Entropia topológica de Xg
Uma apresentação GXg = (G, LXg ) do código do fluxo geodésico possui o grafo G como dado em
(5.4), onde P é o conjunto de sequências permitidas de comprimento dois especificadas em (5.3), e a
5.5 Estrutura e Entropia do SFT Inerente ao Código Aritmético 131
Empregamos a simetria de GXg para determinar dois outros grafos rotulados com a mesma entropia to-
pológica de Xg , no entanto que permitam a obtenção de expressões algébricas para essa. Inicialmente,
GY = (G, LY ) possui o mesmo grafo G que GXg e função de rotulação dada em (5.5).
LY (i2 (σ(i) + 2)2 ) = b1 , LY (i2 (σ(i) + 3)2 ) = b2 , . . . ,
L (i (σ(i) − 2) ) = b
(k−3) ;
Y 2 2
(5.5)
LY (i2 (σ(i) + 3)1 ) = c1 , . . . , LY(i2 (σ(i) − 2)1 ) = c(k−4) ;
L (i (σ(i) + 1) ) = d , L (i (σ(i) + 2) ) = a .
Y 1 2 1 Y 1 1 1
O outro grafo rotulado GZ = (GZ , LZ ) possui o grafo GZ como especificado em (5.6), onde k = 8g −4
e LZ é a identidade.
V = {1, 2};
Z
GZ : (5.6)
E = {a } ∪ {d } ∪ {c , . . . , c
Z 1 1 1 (k−4) } ∪ {b1 , . . . b(k−3) },
tal que
t(a ) = i(a ) = 1, e t(b ) = i(b ) = 2 para 1 ≤ l ≤ (k − 3);
1 1 l l
(5.7)
i(d ) = 1, t(d ) = 2, e i(c ) = 2, t(c ) = 1 para 1 ≤ t ≤ (k − 4).
1 1 t t
Lema 77. Os grafos rotulados GY e GZ são apresentações do mesmo ssr, ou seja, B(Y) = B(Z).
O maior autovalor λAGY de AGY é igual a maior raiz do polinômio caracterı́stico λ2 + λ (6 − 8g) + 1
de AGY . Assim,
p
(8g − 6) + (6 − 8g)2 − 4 p
λAGY = = (4g − 3) + (4g − 3)2 − 1.
2
No Capı́tulo 5 abordamos os métodos de codificação do fluxo geodésico. Dois métodos foram consi-
derados, um que captura a topologia da superfı́cie da qual o fluxo geodésico é codificado, denominado
geométrico. O outro, baseado em métodos de expansão dos pontos em ∂D2 , emprega mapeamentos
Markovianos, sendo denominado aritmético. Para nossos objetivos de determinar representações
do fluxo geodésico a serem empregadas no projeto de codificadores casados com a topologia de
uma superfı́cie (especificada pelo gênero da superfı́cie), a impossibilidade de determinar-se uma
representação finita para o código geométrico constitui um desafio a ser contornado, já que é esse
o método que captura a topologia da superfı́cie. Como apresentado no Seção 5.4, há pelo menos duas
abordagens possı́veis para contornarmos esse obstáculo, uma é representar a interseção do código
geométrico com o aritmético, enquanto a outra é fazermos uso de conjugados bem definidos entre os
códigos. Para qualquer escolha que façamos, saber representar o código aritmético é uma necessidade
inicial.
Neste capı́tulo demonstramos como, a partir de um conjunto infinito de restrições bem definidas
para o código aritmético, especificadas na Proposição 84, podemos empregar os conceitos e métodos
desenvolvidos no Capı́tulo 3 para gerar de forma sistemática uma representação determinı́stica e
mı́nima para o código. Em nosso desenvolvimento fica claro como a riqueza de propriedades das
palavras proibidas conduzem à simplificação, sistematização e generalidade (com relação a topologia
da superfı́cie) do método. Essas propriedades decorrem da estrutura topológica da superfı́cie, a saber,
dos possı́veis ciclos completos de geradores.
Nosso desenvolvimento é baseada nos resultados apresentados em [8, 45], que por sua vez fa-
zem suposições iniciais estabelecidas em [42, 44]. Portanto, iniciamos a Seção 6.1 estabelecendo as
propriedades necessárias da região fundamental para aplicação destes resultados. Em seguida detalha-
mos o método de geração de ciclos de vértices e sequências de geradores apresentado inicialmente na
Seção 4.5. Finalizamos a seção com a demonstração de propriedades necessárias subsequentemente.
133
134 Representação de Códigos Geodésicos
Seja g(s) o gerador associado a aresta s de F . Especificado um par (v1 , s1 ), então v2 = g(s1 )(v1 ) e
s2 = g(s1 )(s1 ) formam um par (v2 , s2 ). O processo é repetido, mas agora considerando a reflexão em
torno de v2 , ou seja, o par (v2 , ∗s2). De forma similar obtemos o par (v3 , ∗s3 ) para o qual g(∗s2)(v2 ) =
v3 e g(∗s2)(∗s2 ) = s3 . Portanto, através da sequência de ações: (i) Aplicar a transformação g(s)
associada ao lado s ao par (v, s), (ii) Refletir em torno de g(s)(v); determina-se a sequência de pares
(v1 , s1 ) → (v2 , ∗s2) → · · · → (vn , ∗sn ) → (vn+1 , ∗sn+1 ), onde eventualmente (vn+1 , ∗sn+1 ) =
(v1 , s1 ) já que o número de pares (v, s) é finito. A sequência de vértices v1 , v2 , . . . , vn é chamada
ciclo de vértices, enquanto a sequência g1 = g(s1 ), g2 = g(∗s2 ), . . . , gn = g(∗sn ) é chamada ciclo
de geradores ou sequência de geradores que especifica a transformação gv1 ,s1 = gn gn−1 . . . g1 , tendo
(v1 , s1 ) como par inicial. Pela convenção estabelecida quanto ao rótulo de vértices e arestas de F ,
especificado um par (vi , si ), o ciclo de vértices e de geradores obtidos são ditos L-ciclo e L-sequência,
6.1 Ciclos de Vértices 135
vi 1
gi1 b
gi2
b
vi 2
respectivamente. Analogamente, no caso (vi+1 , si ), o ciclo de vértices e de geradores obtidos são ditos
R-ciclos e R-sequências, respectivamente. A transformação gn . . . g1 , associada a uma sequência
de geradores obtida a partir de um vértice v em D2 é uma transformação elı́ptica ou identidade e,
necessariamente, (gn . . . g1 )ν = 1 para algum inteiro ν. Neste caso v é um ponto elı́ptico de ordem ν.
Se v ∈ ∂D2 então gn . . . g1 é uma transformação parabólica [30, 46].
Proposição 81. A um ciclo de geradores está associada um único ciclo de vértices e vice-versa, a
não ser para ciclos de comprimento um e dois, quando pode-se associar os ciclos g, h e h−1 , g −1.
Demonstração: A cada elemento gi de Γ0 , como ao seu inverso, está associado uma única aresta
si da região fundamental e a esta um único par de vértices {vi , ui }. Dado o ciclo de geradores
gi1 , gi2 , . . . , gin , obtém-se que {gi−1
1
(vi2 ), gi−1
1
(ui2 )} ∩ {vi1 , ui1 } = {vi1 }. Portanto, o par inicial
(vi1 , si1 ) que determina unicamente o ciclo de vértices a partir do qual o ciclo de geradores gi1 , gi2 , . . . ,
gin é especificada e unicamente determinado.
Dado um ciclo de vértices, definido o primeiro elemento do ciclo de geradores associada fica defi-
nida toda a sequência, pois o par (vi1 , si1 ) inicial fica determinado. Supondo que há uma ambiguidade,
então os dois geradores associados aos lados adjacentes a vi1 mapeiam este em vi2 . Sejam estes ge-
radores gi1 e gi2 , a Figura 6.1 mostra a geração dos únicos ciclos de geradores possı́veis gi1 , gi−1
2
e
gi2 , gi−1
1
, que são o L-ciclo e R-ciclo associados ao ciclo de vértices vi1 → vi2 , respectivamente.
Corolário 82. Seja gi1 . . . gin e hj1 . . . hjm um L-ciclo e R-ciclo, respectivamente. Logo, se u ∈
S(P(g)) ∩ S(P(h)) então |u| ≤ 1, ou seja, L-ciclos e R-ciclos não possuem fatores em comum de
comprimento maior que um.
Demonstração: Segue da Proposição 81 que a um ciclo de geradores está associada um único ci-
clo de vértices. Portanto, o vértice associado a cada um dos geradores na sequência gi1 gi2 . . . gin é
unicamente determinado, e consequentemente se é um R-ciclo ou um L-ciclo.
136 Representação de Códigos Geodésicos
No Lema 83 estabelecemos relações entre sequências de geradores obtidas a partir de vértices que
pertencem a um mesmo ciclo de vértices. As relações estabelecidas contemplam os possı́veis casos,
uma vez que são considerados todas as possı́veis combinações de vértices e lados adjacentes tomados
a partir de um ciclo de vértices de referência. Ou seja, para o ciclo v1 → · · · → vn consideram-se os
casos (vi , si ) e (vi , ∗si ) para 1 ≤ i ≤ n.
1. gv1 ,s1 = gv1′ ,s′1 se, e somente se, (v1 , s1 ) = (v1′ , s′1 );
2. gv1 ,s1 = Ti gv1′ ,s′1 Ti−1 se, e somente se, (v1 , s1 ) = (vi+1
′
, s′i+1 ) e Ti = gi′ . . . g1′ ;
Demonstração: A análise que segue é baseada no resultado da Proposição 81, a saber, a uma
sequência de geradores está associado um único ciclo de vértices e a um par (v, s) está associada
uma única sequência de geradores, do que decorre diretamente o caso 1. Para o caso 2, temos que
′
(vi+1 , s′i+1 ) transita para (vi+2
′
, ∗s′i+2 ) pela aplicação de gi+1
′
, seguindo o procedimento para obtenção
′ ′ ′ ′ ′ ′ −1
dos ciclos de vértices obtém-se que gvi+1
′ ,s′i+1 = gi . . . g1 gn . . . gi+1 = Ti (gn . . . g1 )Ti . Para o caso 3,
horária está em ordem cı́clica à esquerda (L), qualquer sequência de geradores respeitando esta ordem
é denominado um L-ciclo. De outro modo, iniciando no vértice vi+1 e lado si associado ao gerador
gi , obtém-se o ciclo vi+1 = z1 , z2 , . . . , zq e geradores gi = j1 , j2 , . . . , jq . Neste caso, a sequência
j1−1 j2−1 . . . jq−1 anti-horária está em ordem cı́clica à direita (R), qualquer sequência de geradores res-
peitando esta ordem é denominado um R-ciclo. Há inteiros µ, ν satisfazendo (h−1 −1 −1 µ
1 h2 . . . hp ) =
(j1−1 j2−1 . . . jq−1 )ν = Id [30, 46]. Os inteiros pµ e qν representam os números de lados de F que
encontram-se nos vértices vi e vi+1 , respectivamente. Segue da condição de cantos pares que pµ = 2l
e qν = 2k são pares [44]. Os L-ciclo e R-ciclo compostos por 2l e 2k elementos, respectivamente,
são ditos completos, sendo iguais a identidade em Γ.
−1 +
c−1
1 = (br+1 ) b−1
r
b−1
r+1 b−1
r+1
b−1
r c−1 −1 −
1 = (br+1 )
Como decorrência do emprego da teoria de linguagem formal ao estudo dos códigos geodésicos,
interpretaremos o conjunto de geradores Γ0 do grupo Fuchsiano como um alfabeto finito, especifican-
do-o por A, quando for adequado (análises envolvendo essencialmente teoria de linguagens formais).
Proposição 84. [45] Uma sequência e1 . . . ep , ei ∈ Γ0 , é admissı́vel se, e somente se, não possui
fatores no conjunto O formado pelas sequências finitas
1. gg −1, g ∈ Γ0 ;
2. Todos os R H-ciclos;
3. Todos os L S-ciclos;
4. Todas as L H-cadeias.
A Proposição 84 especifica um conjunto de proibições O associado às expansões simbólicas de
pontos no bordo ∂D2 . No Teorema 86 demonstramos que este conjunto é irredutı́vel, para isso preci-
saremos do resultado apresentado no Lema 85. Enfatizamos as considerações sobre a região funda-
mental e expressas na Seção 6.1, temos que pµ e qν são iguais ou maiores que quatro.
Lema 85. R-ciclos não possuem fatores de comprimento maior que um em comum com L-ciclos e
L-cadeias.
Demonstração: Do Corolário 82 um R-ciclo não poderá ter fatores em comum com um L-ciclo de
comprimento maior que um. Logo, resta provar que dados B e C, dois L-ciclos, tais que, BC forma
uma cadeia, BC não possui um R-ciclo de comprimento maior que um como fator.
Sejam B = b1 . . . br e C = c1 . . . cs L-ciclos com os geradores c−1 −1 + −1
1 = (br+1 ) , br , br+1 associados
aos lados s1 , s2 , s3 , respectivamente. Como mostra a Figura 6.4, se essa concatenação gera um R-
ciclo, então o lado s1 está a esquerda de s2 , s3 está a direita de s2 , além disso s1 e s3 são adjacentes
pela definição de b−1 −1 +
r+1 e (br+1 ) . Portanto, os lados s1 , s2 , s3 formam um triângulo, contrariando a
hipótese sobre a região fundamental.
6.2 Representação Simbólica de Pontos sobre ∂D2 139
b−1 (b−1 +
r+1 b r+1 ) b
br s3 b−1
r+1 s3
b b
(b−1 +
r+1 ) br
s2 s2
b b
b s1 b s1
tes quando do estudo das sequências de geradores através dos conceitos de conjuntos de proibições.
A noção de ciclicidade faz-se precisa pelo conceito de permutação cı́clica, seja c = c1 . . . ck uma
sequência qualquer, a permutação cı́clica de ordem n de c é dada por ln = l1 · ln−1 (c), onde l1 (c) =
c2 c3 . . . ck c1 .
Particularmente, dado um conjunto proibido irredutı́vel F associado ao ssf XF sobre um alfabeto
A, para todo v ∈ B(XF ) uma condição de necessidade para q ∈ Cv é que q ∈ S(A−1 F) e exista
p ∈ S(v) tal que pq ∈ F, satisfeito isso, a condição de suficiência requer que q não possua fatores
próprios em Cv . Se F possui um elemento w cı́clico, ou seja, para todo n ∈ Z tem-se que ln (w) ∈ F,
demonstramos no Lema 87 que a determinação dos elementos de Cv pode ser simplificada.
Lema 87. Suponha w ∈ F tal que ln (w) ∈ F para todo n ≥ 0. Seja v ∈ P(wA−1), |v| > 0. Se
p ∈ S(A−1 v), |p| > 0, então v −1 w é prefixo de p−1 ln (w), onde n = |v| − |p|.
Demonstração: Como p ∈ S(v), então existe u ∈ P(v) tal que v = up, logo v −1 w = (up)−1 w =
p−1 (u−1w), do que segue que v −1 w é prefixo de p−1 ln (w) uma vez que u−1 w é prefixo de ln (w).
Segue do Lema 87 que para todo w ∈ F, um elemento cı́clico, para qualquer v ∈ P(wA−1) não
nulo e p ∈ S(A−1 v), a sequência p−1 ln (w) não pertence a Cv .
Proposição 88. O conjunto de restrições de w = w1 w2 . . . wn ∈ P(R H · A−1 ), |w| > 0, é dado por
Cw = {wn−1, w −1 R H, wn−1L S, wn−1L H C}.
Proposição 89. O conjunto de restrições de w = w1 w2 . . . wn ∈ P(L S · A−1 ), |w| > 0, é dado por
Cw = {wn−1, wn−1 R H, w −1L S, w −1L H C}.
Segue do Lema 87 que w −1 L S é prefixo de v −1 L S para todo v ∈ S(w), |v| > 0. Além
disso, como o conjunto O é irredutı́vel, w −1 L S não pode ser fator dos elementos em w −1 L H C
e vice-versa. No entanto w −1 L S é fator de todo elemento em v −1 L H C tal que v ∈ S(A−1 w),
|v| > 0. O que decorre de w(w −1L S) ser prefixo de (wv −1 ) · v(v −1 L H) já que |w(w −1L S)| =
|H| + 1 −|w| + |w| = |H| + 1 e |(wv −1) · v(v −1 L H)| = |H| −|v| + |v| + (|w| −|v|) = |H| + |w| −|v|,
onde |w| − |v| ≥ 1. Como gg −1 ∈ O, g ∈ Γ0 , não pode ser fator das sequências em L S e L H C.
Conclui-se que {w −1 L S, w −1 L H C} ⊆ Cw .
respectivamente.
(i) Supondo que sDD . . . Dpq = HDD . . . DH, isto implica que o primeiro L H-ciclo é formado
por cadeias de L-ciclos de comprimento menor que o seu, uma contradição;
(ii) Neste caso, existe q ′ satisfazendo uq ′ = H, permitindo a formação da cadeia (uq ′ )DD . . . DH ∈
L H C. Portanto, como há w tal que pw é um L H-ciclo, ou seja, vw ∈ L H C, têm-se que
w ∈ P(q ′ ) e portanto q ′ DD . . . DH ∈
/ Cv .
Segue de (i) e (ii) que se q é uma L H C-restrição de v então vq ∈ L H C. Portanto, q só poderá ser
da forma especificada em (6.1). Como O é irredutı́vel, as R H-restrições de v não são prefixos de
suas L H C-restrições. Além disso, como |p−1 L S| > |p−1 L H| > |p−1 L D| então as L S-restrições
de v não são prefixos de q. Já que q não possui prefixos próprios entre as sequências satisfazendo
(6.1), como consequência de O ser irredutı́vel, conclui-se que q ∈ Cv .
Por outro lado, considerando s ∈ Cv uma L H C-restrição de v, de acordo com o Lema 90,
podemos ter dois casos:
(i) Se s é um L-ciclo satisfazendo ps ∈ L H, então ws ∈ L S uma vez que p−1 L H = (A−1 w)−1 L H
= w −1 [(A · L H) ∩ L S] = w −1L S, consequentemente s ∈ Cw é uma L S-restrição de w;
Finalmente, segue do Lema 87 que w −1L S é um prefixo próprio de p−1 L S, como p−1 L H =
w −1 L S é uma L H C-restrição de v então p−1 L S ∈
/ Cv . Conclui-se que o conjunto formado pelas
L S-restrições, L H C-restrições e R H-restrições de v e w são iguais, portanto Cv = Cw .
Na Proposição 91, como cada gerador do grupo fuchsiano está associado a um único L-ciclo,
especificado p a sequência w fica unicamente determinada e sempre vai existir por ser o fator de um
L-ciclo completo.
−1
que dois em comum. Finalmente, wm / {vn−1 L S, vn−1 L H C}, pois especificada uma posição
LS ∈
−1
em um L-ciclo e o elemento associado, o ciclo é unicamente determinado. Como wm L S ∈ Cw e,
−1
no entanto, wm LS ∈
/ Cv , conclui-se da Proposição 88 que Cw 6= Cv .
v −1 L S} e {wm
−1 −1
, wm R H, w −1L S, w −1 L H C ∩ L H}, respectivamente. Como estes conjuntos
possuem cardinalidades distintas, conclui-se que Cv e Cw são distintos.
(ii) Como os subconjuntos das restrições formados pelas L-cadeias são iguais e |w| = 1, então
vn = w. Seque que os conjuntos {vn−1 , vn−1 L S, v −1 R H} e {w −1, w −1 L S, w −1 R H} das demais
restrições em Cv e Cw , respectivamente, devem ser iguais. Como vn−1 = w −1 e vn−1 L S = w −1 L S
(pois vn−1 L S e w −1 L S são as únicas L-sequências de comprimento maior que um em Cv e Cw ,
respectivamente), deve-se ter v −1 R H = w −1 R H para que Cv = Cw , do que segue que |v| =
|w| = 1 e v = w.
g1 F
7
8 6
g1
9 5
F
10 4
11 3
12 2
1
D
Sequências de geradores associadas aos L-ciclos de vértices gerados a partir dos pares de vértices
e lados (v1 , s1 ), (v10 , s10 ) e (v6 , s6 ) são especificados em (6.2), respectivamente. Exemplificando o
processo para o par (v1 , s1 ) pela aplicação do método apresentado na Seção 6.1, onde “∗” denota
g1 ∗ g8
a reflexão de uma aresta em torno de um vértice, obtemos, (v1 , s1 ) −→ (v8 , s7 ) −→ (v8 , s8 ) −→
∗ g7 ∗ g2
(v7 , s6 ) −→ (v7 , s7 ) −→ (v2 , s1 ) −→ (v2 , s2 ) −→ (v1 , s12 ), com os demais determinados de forma
análogo.
{g1 g8 g7 g2 , g10 g5 g4 g11 , g6 g9 g12 g3 }. (6.2)
Observamos que todos os elementos do conjunto simétrico de geradores Γ0 ocorrem em uma, e só
uma, das sequências em (6.2). Portanto, este conjunto contém todas as sequências possı́veis, a não
ser por uma permutação cı́clica. De forma similar, em (6.3) apresentamos as possı́veis sequências
de geradores associadas aos R-ciclos de vértices, considerando os pares de vértices e lados (v2 , s1 ),
(v11 , s10 ) e (v3 , s2 ), respectivamente. Exemplificando o processo para o par (v2 , s1 ) obtemos, (v2 , s1 )
g1 ∗ g6 ∗ g7 ∗ g12
−→ (v7 , s7 ) −→ (v7 , s6 ) −→ (v8 , s8 ) −→ (v8 , s7 ) −→ (v1 , s1 ) −→ (v1 , s12 ) −→ (v2 , s2 ), com os
demais determinados de forma análogo.
Com relação a (6.2), observamos que às transformações associadas as sequências de geradores apre-
sentadas são iguais a identidade, ou seja, g2 g7 g8 g1 = g11 g4 g5 g10 = g3 g12 g9 g6 = Id. Portanto,
de acordo com a Definição 39, essas sequências podem ser empregadas diretamente na determinação
dos L-ciclos completos, só sendo necessária a troca de cada um dos dı́gitos da sequência pelo seu
inverso em Γ0 e subsequente especificação das possı́veis permutações cı́clicas. Aplicando essas
transformações em (6.2) listamos os possı́veis L-ciclos completos em (6.4). Para exemplificação,
6.3 Códigos de Artin para o Caso da Tesselação {12, 4} 147
tomemos a sequência de geradores g1 g8 g7 g2 , tracando cada um dos elementos por seu inverso em
Γ0 obtemos a sequência g7 g6 g1 g12 , todas as permutações cı́clicas desta sequência gera a primeira
linha em (6.4).
{g7 g6 g1 g12 , g6 g1 g12 g7 , g1 g12 g7 g6 , g12 g7 g6 g1 }
{g8 g11 g2 g5 , g5 g8 g11 g2 , g2 g5 g8 g11 , g11 g2 g5 g8 } (6.4)
{g4 g3 g10 g9 , g9 g4 g3 g10 , g10 g9 g4 g3 , g3 g10 g9 g4 }
Empregando o mesmo procedimento com relação às sequências em (6.3), mas agora utilizando a
Definição 40, listamos todas os possı́veis R-ciclos completos em (6.5).
{g7 g8 g1 g2 , g8 g1 g2 g7 , g1 g2 g7 g8 , g2 g7 g8 g1 }
{g4 g5 g10 g11 , g5 g10 g11 g4 , g10 g11 g4 g5 , g11 g4 g5 g10 } (6.5)
{g12 g9 g6 g3 , g9 g6 g3 g12 , g6 g3 g12 g9 , g3 g12 g9 g6 }
Como os L-ciclos e R-ciclos completos possuem comprimento quatro, os L H-ciclos são formados
por todos os prefixos (ou fatores) de comprimento dois em (6.4), os L S-ciclos pelos prefixos (ou
fatores) de comprimento três e os L D-ciclos pelos prefixos (ou fatores) de comprimento um. De
forma similar definimos R-ciclos relevantes a partir dos ciclos em (6.5). A partir da Proposição 84, o
ssf gerado pelo código aritmético do fluxo geodésico Xg é determinado pelo conjunto de proibições
irredutı́veis O = L S ∪ L H C ∪ R H ∪ {gg −1}g∈Γ0 . Em (6.6) apresentamos o conjunto de L S-
ciclos, em (6.7) o conjunto de R H-ciclos e em (6.8) alguns elementos do conjunto de L H-cadeias,
lembrando que esse conjunto é infinito.
g g g, g g g , g g g, g g g ,
7 6 1 6 1 12 1 12 7 12 7 6
LS = g8 g11 g2 , g5 g8 g11 , g2 g5 g8 , g11 g2 g5 , (6.6)
g g g , g g g, g g g, g g g
4 3 10 9 4 3 10 9 4 3 10 9
g g, g g, g g, g g,
7 8 8 1 1 2 2 7
RH= g4 g5 , g5 g10 , g10 g11 , g11 g4 , (6.7)
g g, g g, g g, g g
12 9 9 6 6 3 3 12
148 Representação de Códigos Geodésicos
g7 g6 g6 g6 g1 ,
g7 g6 g6 g6 g6 g1 ,
g g g12 g12 g12 g7 ,
1 12
..
LHC = . (6.8)
g2 g5 g1 g5 g1 g5 g1 g12 ,
g4 g3 g3 g3 g3 g3 g3 g10
...
Nosso objetivo é determinar o conjunto {Cw }w∈P(OA−1 ) , a partir do qual determinaremos uma apresen-
tação determinı́stica mı́nima para o código, como apresentado na Seção 3.12. Para isso faremos uso
dos resultados da Seção 6.2, empregando-os para guiar-nos na especificação de um método simples
de obter a representação.
1. A partir da Proposição 94, para quaisquer v, w ∈ P(L S · A−1 ) satisfazendo v 6= w, temos que
Cv 6= Cw . Listamos em (6.9) os prefixos próprios desse conjunto, empregando (6.6).
g7 g6 , g6 g1 , g1 g12 , g12 g7 ,
g g , g g , g g, g g,
8 11 5 8 2 5 11 2
P(L S · A−1 ) = g4 g3 , g9 g4 , g10 g9 , g3 g10 , (6.9)
g1 , g2 , g3 , g4 , g5 , g6 , g7 , g8 ,
g , g , g , g ,ε
9 10 11 12
3. A partir da Proposição 91, para todo v = HD . . . Dp, |p| > 0, um L H C-prefixo próprio, o
conjunto Cv é igual ao de uma das sequências em (6.9).
4. O conjunto dos prefixos próprios de {gg −1}g∈Γ0 sempre estará contido no conjunto de prefixos
próprios de L S, ou seja, independente do conjunto O.
Assim, temos em (6.9) o conjunto de sequências necessárias e suficientes para determinar o conjunto
{Cw }w∈B(Xg ) , formando o nosso conjunto V de estados. Para a construção do grafo, precisamos
determinar seus ramos e respectivos rótulos, fazendo uso da construção apresentada na Seção 3.12.
6.3 Códigos de Artin para o Caso da Tesselação {12, 4} 149
g7 g6
g8 g11 g6 g1
g6
g7 g6
g11 g1
g8 g7 g5
g9 g4 g5 g8
g8 g6
g4 g8
g9 g9 g7 g5 g4
g8 g6
g9 g5
g10 g9 g9 g10 g10 g4 g4 g3
ε g4 g3
g10 g11
g3 g3
g11 g12 g2 g3
g1
g2
g12 g2 g10
g11 g2 g1 g2 g3 g10
g11
g7 g5
g12
g12 g1
g12 g7 g2 g5
g1 g12
Figura 6.7: Autômata inicial parcial do código para tesselação {12, 4}.
respectivos, associados aos vértices g6 e g4 g3 . Escolhemos estados cujos rótulos são sequências de
comprimento distinto, no caso um e dois, pois a estrutura das transições a partir de estados com
rótulos de mesmo comprimento são semelhantes. No caso do estado g6 temos que g6−1 · R H = g3
e g6−1 · {gg −1}g∈Γ0 = g8 , sendo os únicos sı́mbolos proibidos a partir do estado g6 , o conjunto de
transições possı́veis é apresentado em (6.10).
g1
−→ g2 g4 g5 g6
g6 g1 , −→ g2 , −→ g4 , −→ g5 , −→ g6 ,
g6 g7 g9 g10 g11 g12
(6.10)
−→ g , −→ g , −→ g , −→ g , −→ g .
7 9 10 11 12
No caso do estado g4 g3 temos que g3−1 ·R H = g12 , (g4 g3 )−1 L S = g10 e g3−1 ·{gg −1}g∈Γ0 = g5 , sendo
os únicos sı́mbolos proibidos a partir do estado g4 g3 , o conjunto de transições possı́veis é apresentado
em (6.11).
g1
−→ g2 g3 g4 g6
g1 , −→ g2 , −→ g3 , −→ g4 , −→ g6 ,
g4 g3 g7 g8 g9 g11
(6.11)
−→ g7 , −→ g8 , −→ g9 , −→ g11 .
g3
Com a transição g4 g3 −→ g3 sendo especificada pelo emprego da Proposição 91. O grafo essencial
final, obtido pela eliminação de vértices isolados (não é vértice inicial ou terminal de ramos, só há o
vértice ε), é apresentado na Figura 6.8, com a explicitação das transições partindo dos vértices g6 e
g4 g3 .
6.3 Códigos de Artin para o Caso da Tesselação {12, 4} 151
g7 g7 g6
g11 g8 g11 g7 g6 g6 g6
g8 g8 g7 g6 g1
g9 g4 g6 g1
g9
g4 g5
g5
g9 g5
g10 g4
g9 g7 g8
g10 g9 g8 g6 g5 g8
g11
g9 g4
g9
g10 g12 g2 g4
g10 g10 g4 g3
g11 g2 g4 g3
g11
g2 g3
g11 g3
g2
g11 g10
g1
g12 g7 g3 g10
g7 g12 g2 g2
g12 g1 g12 g2 g5 g5
g12 g1 g1
Figura 6.8: Representação determinı́stica mı́nima parcial do código para a tesselação {12, 4}.
152 Representação de Códigos Geodésicos
Capı́tulo 7
Conclusões
A proposta do presente trabalho foi de obter descrições combinatoriais para os fluxos geodésicos
sobre regiões compactas de superfı́cies hiperbólicas, como meio para associar às sequências código
quaisquer, parâmetros topológicos oriundos destas superfı́cies. O encaminhamento para o estabe-
lecimento deste objetivo é caracterizado pelas etapas: (1) Identificação de um procedimento ade-
quado de codificação do fluxo geodésico que reflita a topologia da superfı́cie; (2) Desenvolvimento
de ferramentas de análise do código; (3) Identificação de possı́veis métodos para implementação de
representações; (4) Determinação de representações para o código. Cada uma destas etapas foi abor-
dada na tese, com ordem de exposição refletindo a relação de dependência dos resultados e conceitos
desenvolvidos em cada capı́tulo.
No Capı́tulo 2, determinamos na Seção 2.4 como a propriedade de completude de um sistema
dinâmico de eventos discretos invariante no tempo se reflete na topologia das trajetórias do sistema,
quando especificadas por sequências bi-infinitas e descritas sobre um alfabeto finito, passando a
denomina-los de ssf. Tal relevância decorre de serem os sistemas completos aqueles para os quais
é possı́vel determinar uma representação finita (e.g., através de grafos ou equações a diferença).
No Capı́tulo 3 determinamos uma descrição combinatorial para um ssf, baseada no conceito de
relação de ordem parcial. Estendemos o conceito na Seção 3.9, demonstrando como um ssf pode ser
caracterizado globalmente, através do seu conjunto de restrições irredutı́veis, ou localmente, por con-
juntos de restrições dependentes do contexto ou palavra da linguagem. Na Seção 3.11 demonstramos
como os diversos conceitos de restrição podem ser aplicados na determinação do monoide sintático da
linguagem. Por fim, na Seção 3.12 demonstramos como a coleção de possı́veis conjuntos de restrições
à direita de uma linguagem podem ser empregados na determinação de uma representação minimal
para esta, fato utilizado no Capı́tulo 6.
No Capı́tulo 5 foram apresentados os conceitos e procedimentos sobre os métodos de codificação
aritmético e geométrico do fluxo geodésico, relevantes para a apreciação do trabalho. A partir
153
154 Conclusões
3. Procurar identificar critérios de necessidade sobre o conjunto de restrições irredutı́veis para geração
de apresentações mı́nimas;
5. Caracterização de ssf’s homogêneos através dos respectivos conjuntos de restrições, como também
a sı́ntese dos codificadores. Contribuindo na determinação de códigos em treliça que também são
sistemas de órbitas e na caracterização de códigos de treliça sobre grupo empregando dinâmica
simbólica.
Quanto aos códigos do fluxo geodésico, duas possı́veis linhas de desenvolvimento são de nosso
maior interesse, com as possibilidades não estando restritas só a estas.
2. Identificação de possı́veis códigos topológicos a serem empregados para codificação das UPO’s
de sistemas dinâmicos em estado caótico sobre atratores de baixa dimensão;
3. Identificação de classes de códigos topológicos aos quais possam ser associados codificadores de
baixa complexidade, empregando descrições dos códigos via conjuntos de restrições.
156 Conclusões
Referências Bibliográficas
[1] Jan C. Willems. Models for dynamics. Dynamics Reported, 2:171–269, 1989.
[2] G. David Forney, Jr. and Mitchell D. Trott. The dynamics of group codes: State spaces, trellis
diagrams, and canonical encoders. IEEE Trans. Inform. Theory, 39(9):1491–1513, September
1993.
[3] Eric J. Rossin, N. T. Sindhushayana, and Chris D. Heegard. Trellis group codes for the gaussian
channel. IEEE Trans. Inform. Theory, 41(5):1217–1245, September 1995.
[4] David Slepian. Group codes for the gaussian channel. Bell Syst. Tech. J., 47:575–602, April
1968.
[5] G. David Forney, Jr. Geometrically uniform codes. IEEE Trans. Inform. Theory, 37:1241–1260,
September 1991.
[6] N. T. Sindhushayana, Brian Marcus, and Mitchell Trott. Homogeneous shifts. IMA Journal of
Mathematical Control & Information, 41:255–287, 1997.
[7] Henrique Lazari. Uma contribuição à teoria dos códigos geometricamente uniformes hi-
perbólicos. Tese de Doutorado, FEEC-Unicamp, 2000.
[8] C. Series. Geometrical markov coding of geodesics on surfaces of constant negative curvature.
Ergodic Theory and Dynamical Systems, 6:601–625, 1986.
[9] Roy L. Adler and Leopold Flatto. Geodesic flows, interval maps, and symbolic dynamics. Bull.
Amer. Math. Soc., 25(2):229–334, October 1991.
[10] Lapo Casetti, Marco Pettini, and E.G.D. Cohen. Geometric approach to hamiltonian dynamics
and statistial mechanics. Physics Reports, 337:237–341, 2000.
[11] George Osipenko. Dynamical Systems, Graphs, and Algorithms. Springer, 2007.
157
158 REFERÊNCIAS BIBLIOGRÁFICAS
[12] Roy L. Adler. Symbolic dynamics and markov partitions. Bull. Amer. Math. Soc., 35(1):1–56,
January 1998.
[13] Samuel Eilenberg. Automata, Languages, and Machines, volume A. Academic Press, 1974.
[14] John M. Howie. Fundamentals of Semigroup Theory. Oxford University Press, 1995.
[15] John E. Hopcroft and Jeffrey D. Ullman. Introduction to Automata Theory, Languages, and
Computation. Addison-Wesley, 1979.
[17] Nagabhushana T. Sindhushayana. Symbolic dynamics, automata theory and the theory of co-
ding: A comparative study and applications. Master’s thesis, Cornell University, 1992.
[18] Douglas Lind and Brian H. Marcus. An Introduction to Symbolic Dynamics and Coding. Cam-
bridge University Press, 1995.
[19] Nataša Jonoska. Sofic shifts with synchronizing presentations. Theoret. Comput. Sci., (158):81–
115, 1996.
[20] F. Blanchard and G. Hansel. Languages and subshifts, automata on infinite words. Lecture
Notes in Computer Science, 192:138–146, 1984.
[22] M. Crochemore, F. Mignosi, and A. Restivo. Automata and forbidden words. Information
Processing Letters, (67):111–117, 1998.
[23] M.-P. Béal, M. Crochemore, and G. Fici. Presentations of constrained systems with unconstrai-
ned positions. IEEE Trans. Inform. Theory, 51(5):1891–1900, May 2005.
[24] M.-P. Béal, M. Crochemore, B. E. Moision, and P. H. Siegel. Periodic-finite-type shift spaces.
IEEE Trans. Inform. Theory, 57(6):3677–3691, June 2011.
[25] Daniel P. B. Chaves and Cecilio Pimentel. A new algorithm for finding the Shannon cover of
shifts of finite type. In Proceedings of the VI International Telecommunications Symposium -
ITS2006, pages 694–699, 2006.
[26] Arnaldo Garcia and Yves Lequain. Elementos de Álgebra. Projeto Euclides. IMPA, Rio de
Janeiro, second edition, 2003.
REFERÊNCIAS BIBLIOGRÁFICAS 159
[27] Elon Lages Lima. Espaços Métricos. Projeto Euclides. IMPA, Rio de Janeiro, fourth edition,
2007.
[29] Peter A. Firby and Cyril F. Gardiner. Surface Topology. Horwood Publishing Limited, third
edition, 2001.
[32] Manfredo Perdigão do Carmo. Geometria Riemanniana. Projeto Euclides. IMPA, Rio de Ja-
neiro, third edition, 2005.
[33] Manfredo Perdigão do Carmo. Differential Geometry of Curves and Surfaces. Prentice-Hall,
New Jersey, 1976.
[34] Anatole Katok and Boris Hasselblatt. Introduction to the Modern Theory of Dynamical Systems.
Cambridge University Press, 1995.
[35] Svetlana Katok and Ilie Ugarcovici. Symbolic dynamics for the modular surface and beyond.
Bull. Amer. Math. Soc., 44(1):87–132, January 1991.
[36] Daniel P. B. Chaves, Reginaldo Palazzo Jr., and José R. Rios Leite. Properties of an arithmetic
code for geodesic flows. J. Phys.: Conf. Ser., 285:1–10, 2011.
[37] Gian Mario Maggio and Zbigniew Galias. Applications of symbolic dynamics to differential
chaos shift keying. IEEE Trans. Circuits Syst.-I, 49(12):1729–1735, 2002.
[38] J. Schweizer and Thomas Schimming. Symbolic dynamics for processing chaotic signals-I:
Noise reduction of chaotic sequences. IEEE Trans. Circuits Syst.-I, 48:1269–1282, 2001.
[39] Tim Bedford, Michael Keane, and Caroline Series, editors. Ergodic Theory, Symbolic Dynamics
and Hyperbolic Spaces. Oxford Science Publications, 1991.
[40] C. Series. The infinite word problem and limit sets in fuchsian groups. Ergodic Theory and
Dynamical Systems, 1:337–360, 1981.
[41] D. J. Grabiner and J. C. Lagarias. Cutting sequences for geodesic flow on the modular surface
and continue fractions. Monatsh. Math., 133(4):295–339, 2001.
160 REFERÊNCIAS BIBLIOGRÁFICAS
[42] Joan S. Birman and C. Series. Dehn’s algorithm revisited, with applications to simple curves
on surfaces. In S. M. Gersten and John R. Stallings, editors, Combinatorial Group Theory and
Topology, pages 451–478. Princeton University Press, New Jersey, United States, 1987.
[43] Svetlana Katok and Ilie Ugarcovici. Arithmetic coding of geodesics on the modular surface via
continued fractions. CWI Tract, 135:59–77, 2005.
[44] R. Bowen and C. Series. Markov maps for fuchsian groups. Inst. Hautes Études Sci. Publ.
Math., 50:153–170, 1979.
[45] C. Series. Symbolic dynamics for geodesic flow. Acta Math., 146:103–128, 1981.
161
162 ÍNDICE REMISSIVO
homomorfismo, 33 singular, 99
invariante no tempo, 10
inversı́vel, 33
latência, 13
lei de evolução discreta no tempo, 18
linear, 10
memória finita, 13
memória local, 13
na forma de espaço de estados, 15
sequências de eventos, 26
SFT (shift of finite type), 113
simetria, 10
sistema dinâmico fechado, ssf, 32
topologicamente conjugado, 33
superfı́cie, 97
fibrado tangente, 107
gênero, 102
hiperbólica, 97
superfı́cie riemanniana, 106
espaço tangente, 106
estrutura diferenciável, 106
fibrado tangente unitário, 107
parametrização, 106
projeção natural, 108
vetor tangente, 106
vizinhança coordenada, 106
teorema
de Gauss-Bonnet, 92
de Killing-Hopf, 97
de Poincaré, 102
de Siegel, 101
tesselação, veja região fundamental
transformação
anti-conforme, 93
conforme, 93
isométria, 88
trie (tree-like automaton), veja autômato
vértice, 97, 99
Γ-congruente, 100
ciclo de, 97, 134
elı́pticos, 100
ordinário, 99
ponto elı́ptico, 135