Você está na página 1de 81

Teoria Axiomatica de Conjuntos:

Uma Introducao
Marcelo Esteban Coniglio
GTAL, Departmento de Filosofia
Universidade Estadual de Campinas
P.O. Box 6133, 13081-970
Campinas, SP, Brazil
E-mail: coniglio@cle.unicamp.br

Abstract
O presente texto corresponde as notas de aula do curso HF005-Teoria
de Conjuntos, do Programa de Pos-Graduacao em Filosofia da UNICAMP,
que ministrei no segundo semestre de 1997. Trata-se principalmente de
uma adaptacao do livro Axiomatic Set Theory, de P. Suppes (Dover, 1972).
Alguns topicos (principalmente, teoria de ordinais e de cardinais) foram
adaptados do livro Set Theory: an Introduction to Large Cardinals, de
F.R. Drake (North Holland, 1974).

Contents
Introducao 3

1 Teoria Cumulativa de Tipos 4

2 Axiomas Basicos da Teoria de Conjuntos 5

3 Axiomas Adicionais 9

4 Produtos Cartesianos 13

5 Relacoes em S 16

6 Relacoes de Ordem 19

7 Relacoes de Equivalencia 24

8 Funcoes 29

9 Equipolencia 33

10 Conjuntos Finitos 40

11 Axiomas Finais de ZF . O Axioma da Escolha 46

1
12 Introducao aos Ordinais 49

13 Inducao e Recursao Transfinita 54

14 Aritmetica Ordinal 62

15 Cardinais 73

2
Introducao
A Teoria de Conjuntos (TC) ocupa um lugar privilegiado dentre as disciplinas
da Matematica moderna: todas as entidades estudadas na matematica (com
algumas excecoes) podem ser consideradas conjuntos. Portanto, as questoes
acerca da natureza da matematica sao basicamente questoes acerca de conjun-
tos.
A TC foi iniciada a partir das pesquisas de Georg Cantor em 1870 sobre
a teoria das series infinitas em Analise; a partir destes trabalhos, Cantor foi
levado a considerar conjuntos infinitos ou classes de carater arbitrario. Mas
o que sao os conjuntos? A nossa ideia intuitiva os define como colecoes de
objetos. Segundo Cantor, um conjunto e uma colecao, considerada como um
todo, de objetos distintos e definidos da nossa intuicao ou pensamento. Os
objetos sao chamados de elementos do conjunto. Os paradoxos surgidos logo
no incio do estudo da teoria mostraram que a concepcao ingenua de Cantor
nao podia formar uma base satisfatoria para a TC, e muito menos para a
Matematica. Isto levou a uma reformulacao dos princpios basicos da teoria.
Os paradoxos apareceram principalmente pelo uso indiscriminado das nocoes de
conjunto, numero cardinal e ordinal, etc. Um paradoxo consiste na derivacao no
sistema logico de e para alguma afirmacao , ou entao a derivacao de uma
afirmacao da forma . O primeiro paradoxo foi descoberto pelo proprio
Cantor em 1895 e nao foi publicado imediatamente, mas foi redescoberto por
Burali-Forti em 1897, que tambem nao conseguiu fornecer uma solucao. O
paradoxo surgiu com relacao a teoria dos ordinais, num estagio relativamente
avancado da teoria, e nao foi levado muito a serio. A aparicao em 1902 do celebre
paradoxo de Russell fez mudar as coisas, pois ele surge no primeiro estagio da
teoria: dado que, pelo axioma de compreensao, podemos definir os conjuntos
{x : (x)}, onde (x) e uma formula denotando uma propriedade, entao e
lcito formular o conjunto A = {x : x 6 x} (considerando (x) def x 6 x).
Logo, podemos nos perguntar se e o caso que A A ou nao e o caso que A A,
obtendo: A A sse A 6 A!! Este fato causou uma verdadeira revolucao no
meio academico ligado a fundamentacao da matematica, obrigando Dedekind a
suspender a publicacao do seu ensaio sobre a natureza dos numeros. Enquanto
isso, Frege acabara de publicar sua obra prima, fruto de decadas de esforcos,
admitindo por fim que um dos pilares do seu edifcio tinha sido sacudido por
Russell.
Os paradoxos tem uma origem antiga: o exemplo classico e o Paradoxo do
Mentiroso (Epimenides), que pode ser formulado simplesmente como: Esta
frase e falsa. E claro que supor a verdade ou a falsidade da frase leva a uma
contradicao. O paradoxo de Grelling-Nelson (1908) diz o seguinte: defina como
heterologicos os adjetivos tais que eles mesmos nao satisfazem a propriedade
que eles denotam. Por exemplo, ingles, azul ou frio sao heterologicos,
enquanto que polissilabico ou portugues nao o sao; em smbolos, dado
um adjetivo S, temos que S e heterologico sse S nao e (nao satisfaz) S.
Logo, heterologico e heterologico sse heterologico nao e heterologico. O
paradoxo de Richard (1905) diz o seguinte: considere os numeros reais entre 0
e 1 que podem ser definidos por um numero finito (nao limitado) de palavras

3
em portugues: por exemplo, ponto cinco, o maior numero tal que elevado
ao quadrado e multiplicado por tres e igual a dois. Os numeros definidos desta
maneira podem ser enumerados (so temos uma quantidade enumeravel de frases
de tamanho finito). Considere o seguinte numero: o numero real entre 0 e 1
cuja n-esima casa decimal e tres se a n-esima casa decimal do n-esimo numero e
cinco, e e cinco em caso contrario. Logo, esta frase define um numero diferente
de todos os numeros da lista, uma contradicao (este paradoxo e baseado no
metodo diagonal de Cantor para provar que o conjunto dos numeros reais nao
e enumeravel). Ramsey distingue dois tipos de paradoxos: os semanticos e
os logicos. Todos os paradoxos mencionados acima (com excecao do paradoxo
de Russell) sao semanticos; dentre os paradoxos logicos podemos mencionar o
paradoxo de Russell, o de Cantor e o de Burali-Forti. O paradoxo de Cantor
(1899) diz: considere U o conjunto de todos os conjuntos. Logo, o conjunto
P(U ) das partes de U tem cardinal estritamente maior do que o cardinal de
U , o que contradiz a hipotese de que U seja o maior conjunto. O paradoxo de
Burali-Forti (1897) diz: o conjunto bem ordenado W de todos os ordinais tem
um ordinal maior que todo elemento de W , portanto maior que todo ordinal.

1 Teoria Cumulativa de Tipos


Todos os paradoxos vistos tem a mesma origem: a auto-referencia. No caso dos
paradoxos em TC, podemos solucionar o problema considerando que os conjun-
tos sao formados em etapas ou estagios; assim, um conjunto so pode ser criado
a partir de conjuntos que ja foram definidos ou criados anteriormente. Isto da
origem a teoria simples de tipos:

Nvel 0: alguns indivduos (urelemente), sem propriedades especficas.


Nvel 1: todas as colecoes formadas por indivduos.
Nvel 2: todas as colecoes formadas por elementos no nvel 1, etc.

Assim, se os indivduos sao os numeros naturais, entao 3 e um conjunto no


nvel 0, {1, 2} esta no nvel 1, e {{2}, {4, 6}} esta no nvel 2. As questoes sao:
(a) qual e o problema em considerar {1, {1}} como conjunto? (b) o conjunto
vazio , assumindo que seja um indivduo, seria diferente nas diferentes etapas
em que pudesse aparecer? Com relacao a (a), e obvio que o modelo e restritivo
demais, logo consideramos a teoria cumulativa de tipos:

Nvel 0: alguns indivduos.


Nvel 1: todas as colecoes formadas por indivduos.
Nvel 2: todas as colecoes formadas por elementos no nvel 0 ou 1.
Em cada nvel, considerar as colecoes cujos elementos estao em nveis
anteriores.

Logo, {1, {1}} aparece no nvel 2, no nosso exemplo. Com relacao a (b), temos
que assumir que uma vez que um conjunto aparece num nvel, toda aparicao
posterior e a mesma. As questoes seguintes sao: quantos indivduos deveriam

4
ser tomados? os nveis tem final? Com relacao a primeira questao, parece
claro que deveria ser considerado o unico indivduo; isto equivale a nao tomar
indivduos (logo, sera o unico conjunto do nvel 1). Com relacao a segunda
questao, a resposta e nao. Se existisse um maximo nvel , e claro que
poderiamos criar um nvel adicional +1 com os conjuntos que temos definidos,
uma contradicao.

2 Axiomas Basicos da Teoria de Conjuntos


A primeira axiomatizacao de TC foi dada por Zermelo em 1908, e modificada
por Fraenkel em 1922, dando origem ao sistema Zermelo-Fraenkel (ZF ). Ex-
istem muitos outros sistemas, como o de von Neumann-Godel-Bernays (N GB)
e o de Kelley-Morse (KM ). Estes ultimos usam classes juntamente com con-
juntos. Uma classe pode ser pensada como uma colecao enorme, de maneira
que os conjuntos viriam ser classes pequenas. Por exemplo,

V = {x : x = x}

e a colecao de todos os conjuntos, chamada de classe universal. V e uma


classe propria, isto e, ela nao e um conjunto, portanto nao aparece em nenhum
nvel da hierarquia cumulativa. Se todos os membros de uma classe aparecem
antes de um dado nvel, entao a classe e um conjunto nesse nvel. Neste curso
estudaremos apenas ZF .
A formulacoes ZF de TC e realizada numa linguagem de primeira ordem,
utilizando constantes para os (eventuais) indivduos, duas relacoes binarias (=,
), os conectivos , , , , , e os quantificadores (para todo) e
(existe), junto com um repertorio enumeravel de variaveis. As variaveis sao
denotadas: a, b, . . . , x, y, z (com ou sem ndices). Como e usual, as formulas
(x = y) e (x y) serao denotadas por (x 6= y) e (x 6 y), respectivamente.
Comecamos enunciando o primeiro axioma de ZF :

Axioma de Extensionalidade:

[A1] (z)(z x z y) (x = y)

Aqui e evidenciada a intencao de que, quando uma colecao aparecer em dife-


rentes nveis, ela seja considerada como sendo a mesma; por outro lado, e
estabelecido que o que interessa com relacao aos conjuntos sao os seus e-
lementos, mais do que o que eles sao. Observe que a implicacao recproca
(x = y) (z)(z x z y) e logicamente valida.

Axioma de Compreensao ou Separacao:

[A2] (y)(x)(x y (x a (x)))

Isto significa que estamos separando alguns elementos de a, exatamente aque-


les que satisfazem a propriedade . Aqui, (x) e uma formula onde x aparece

5
livre, podendo aparecer outras variaveis livres em (os parametros do con-
junto criado), mas a variavel y nao aparece livre em . O axioma de
compreeensao tenta tomar, em cada estagio, todos os conjuntos ja criados,
para formar os conjuntos do nvel seguinte. O axioma e limitado, pois so
tomamos os conjuntos formados pelas formulas . Observe que [A2] e um
axioma-esquema, isto e, cada formula determina um axioma. A condicao
sobre y nao ocorrer livre em esta relacionada com a auto-referencia, e e fun-
damental para evitar o paradoxo de Russell; caso contrario, podemos considerar
(a)(x)(x a x = b) (esta formula e demonstravel em ZF , como veremos
depois de incorporar outros axiomas) e (x, y) def x 6 y em [A2]; logo, te-
remos: x y (x a x 6 y), e entao x a (x y x 6 y) para todo
x. Portanto, tomando a como acima, teremos: x = b (x y x 6 y) para
todo x, donde, tomando b no lugar de x, obtemos b y b 6 y, contradicao.
Como provaremos na Proposicao 11.1, o axioma [A2] sera dedutvel dos outros
axiomas de ZF (especificamente, [A2] e um caso particular do axioma [A7], a
ser introduzido na Secao 11). Porem, na primeira parte deste texto faremos um
uso pesado do axioma [A2] sem precisar usar por enquanto o axioma mais forte
[A7].
A partir de agora adotaremos a seguinte notacao: {x : } e um (meta)termo
s em que toda ocorrencia de x e limitada ( e uma formula). Logo,

s = t denota (z)((x)(x z ) z = t);


t = s denota (z)((x)(x z ) t = z);
s t denota (z)((x)(x z ) z t);
t s denota (z)((x)(x z ) t z)

onde z nao ocorre em nem em t.


Assim, por exemplo, se s def {x : (x)} e t def {x : (x)} entao s t
denota a formula (z)((x)(x z ) z t). Por sua vez, z t denota a
formula (u)((x)(x u ) z u), portanto s t denota a formula

(z)((x)(x z ) (u)((x)(x u ) z u)).

Se (y)(x)(x y (x)) e demonstrado a partir dos axiomas, dizemos que


{x : (x)} e legitimado. Logo, o axioma de separacao diz que o (meta)termo

{x : x a (x)}

e legitimado. Note que este (meta)termo depende de a (e das variaveis diferentes


de x que ocorrem livres em (x)).

Observacao 2.1 Se si def {x : i (x)} e legitimado (i = 1, . . . , n), entao


(x1 ) (xn )(x1 , . . . , xn ) implica (s1 , . . . , sn ), onde (s1 , . . . , sn ) e a ex-
pressao obtida de substituindo xi por si (eliminando a posteriori os si apli-
cando as regras de reducao definidas acima). Portanto, se s def {x : (x)} e
legitimado, entao de x y (x) deduzimos s y (z)((x)(x z (x))
(z)) e s y (s) (lembrando que devemos eliminar s para obter formulas a
partir dessas expresoes). 

6
Proposicao 2.2 Suponha que s def {x : (x)} e legitimado; logo, sao demon-
straveis:
x s (x), (s = y) (x)(x s x y) e
(s = y) (x)(x y (x)).

Demonstracao: Sejam def (y)(x)(x y (x)) e def (y)((z)(z


y (z))x y), isto e, e x {x : (x)}; logo, implica implica (x).
Por outro lado, (x)(x y (x)) implica x y, e entao (x) implica .
Para provar a segunda equivalencia, considere (z, y) def (z = y) (x)(x
z x y). Por [A1] vale (z)(z, y) e entao, pela Observacao 2.1 obtemos
(s, y), i.e., (s = y) (x)(x s x y). A ultima afirmacao e uma con-
sequencia das duas primeiras. 

Desta maneira, se s def {x : (x)} e t def {x : (x)} sao legitimados,


entao, para provar (s = t), basta provar (x) (x).

Axioma do Conjunto Vazio:

[VZ] (y)(x)(x 6 y)

Este axioma e redundante, pois pode ser deduzido de [A2]: considere (x) def
(x 6= x); como (x y (x a x 6= x)) (x 6 y (x 6 a x = x)) (x 6
y (x = x)) x 6 y, entao o axioma [VZ] se segue por [A2]. Assim, o termo
{x : x 6= x}, que sera denotado , e legitimado em ZF . Note que (s = ) sse
(x)(x), se s def {x : (x)}.

Corolario 2.3 [A1], [A2] ` x 6 .

Demonstracao: Pela Proposicao 2.2,

` (y)(x)(x y x 6= x) (x x 6= x)

(note que o antecedente desta implicacao expressa que def {x : x 6= x} e


legitimado). Logo, [V Z] ` (x x 6= x), donde [A1], [A2] ` x 6 . 

Axioma do Par:

[PR] (y)(x)(x y ((x = a) (x = b)))

Este axioma afirma que existe o conjunto com a e b como unicos membros,
legitimando o termo {x : (x = a) (x = b)}, que sera denotado {a, b} (note
que o nome do termo depende de a e b). Em funcao da hierarquia cumulativa,
o par {a, b} pode ser formado em qualquer estagio depois que a e b foram
formados; logo, nao tem ultimo estagio. O conjunto {a, a} sera denotado {a},
sendo que contem a como unico elemento. Este axioma e redundante, como
provaremos depois na Proposicao 11.2. O axioma [PR] permitira formar, junto
com o axioma [RF] da reuniao finita a ser introduzido a seguir, os conjuntos
finitos da forma {a1 , . . . , an }.

7
Corolario 2.4 (a) [A1], [A2], [P R] ` x {a, b} (x = a) (x = b).
(b) [A1], [A2], [P R] ` x {a} x = a.
Adotemos a notacao x y e x y para indicar as formulas

(z)(z x z y) e (x y) (x 6= y),

respectivamente. E claro que s t (x)((x) (x)) se s def {x : (x)}


e t def {x : (x)} sao legitimados.

Axioma da Reuniao Finita:

[RF] (y)(x)(x y (x a x b))

Aqui estabelecemos que a b def {x : (x a) (x b)} e legitimado. Este


axioma sera redundante na presenca dos outros axiomas, como provaremos na
Proposicao 3.2. Por outro lado, a b def {x : (x a) (x b)} e legitimado,
por [A2]. Logo, podemos provar o seguinte:
Proposicao 2.5 (a b) c = (a c) (b c), e (a b) c = (a c) (b c).
Demonstracao: x (a b) c sse x (a b) x c sse (x a x b) x c
sse (x ax c)(x bx c) see (x ac)(x bc) sse x (ac)(bc).
A outra afirmacao e provada analogamente. 

Por [A2], a b def {x : (x a) (x 6 b)} e legitimado.


Proposicao 2.6 a (a b) = a b.
Demonstracao: x a(ab) sse x ax 6 (ab) sse x a(x ax b)
see x a (x 6 a x 6 b) sse (x a x 6 a) (x a x 6 b) see x a x 6 b
see x a b. 

Exerccios 2.7 Provar na TC obtida ate agora o seguinte:


(1) x x; (x y y x) (x = y); (x y y z) (x z).
(2) x; (x ) (x = ).
(3) (x x); (x y) (y x).
(4) a b e a b sao legitimados.
(5) ab = ba; (ab)c = a(bc); a = ; ab a; (a b) (ab = a).
(6) (a b) (a b = b); a = a; a a b.
(7) a (a b) = a b; (a b) b = a b; (a b) b = a b; a (b c) =
(a b) (a c); a (b c) = (a b) (a c); (a b) (a b = ).
(8) Obter o paradoxo de Russell a partir de (y)(x)(x y).
(9) Opinar sobre a verdade ou falsidade das seguintes afirmacoes:
(9.1) O termo {x : x = x} nao pode ser legitimado.
(9.2) (x) x {x : (x)}.
(9.3) {x : x y} = y.
(9.4) (x)((x) (x)) ({x : (x)} {x : (x)}).
(9.5) (x)((x) (x)) ({x : (x)} = {x : (x)}).

8
(10) Sejam s def {x : (x)} e t def {x : (x)} legitimados. Entao
s t (w)((x)(x w (x)) (w)).
(11) x a {x} a.

Observacao 2.8 A partir das expressoes obtidas na Proposicao 2.2 e no E-


xerccio 2.7 (10), vemos que podemos iterar os termos {x : }, uma vez que
eles sao legitimados. Assim, se os (meta)termos

si def {x : i (x)} (i = 1, . . . , n) e {x : (x, x1 , . . . , xn , z1 , . . . , zk )}

sao legitimados entao, usando a Proposicao 2.2, {x : (x, z1 , . . . , zk )} e legi-


timado, onde e obtida de substituindo xi por si e , a posteriori, (w si ),
(si w), (si = w), (si sj ) e (si = sj ) pela expressao correspondente (w
e uma variavel que ocorre livre ou limitada em ). Por exemplo, os termos
ab def {x : x ax b} e s def {a} {x : x = a} sao legitimados, logo
{a} b e legitimado, obtido como {x : x s x b} {x : x = a x b}.
Se, por outro lado, queremos formar {s1 } s2 , onde si def {x : i (x)} sao
legitimados (i = 1, 2) entao teremos t1 def {s1 } {x : x = s1 } {x :
(y)(y x 1 (x)}, logo t1 s2 def {x : x t1 x s2 } {x : (y)(y
x 1 (x)) 2 (x)}. E nesse sentido que devemos entender, por exemplo, o
(meta)termo (a b) c def {x : x (a b) x c} {x : (x a x
b) x c} na Proposicao 2.5. 

3 Axiomas Adicionais
Nesta secao definiremos tres axiomas adicionais da TC dada por ZF .

Axioma das Partes:

[A3] (y)(x)(x y (z)(z x z a))

Este axioma garante en ZF que o conjunto {x : x a} pode ser formado,


uma vez que a foi formado. A notacao utilizada para este (meta)termo sera
P(a). Como todo subconjunto de a sera formado ao menos no nvel de a, entao
P(a) aparecera so no nvel seguinte. Logo, este axioma e verdadeiro na teoria
cumulativa de tipos, assumindo que nao existe um maximo nvel.

Proposicao 3.1 (1) a P(a); P(a) na TC introduzida ate agora.


(2) Se s def {x : (x)} e t def {x : (x)} sao legitimados em ZF , entao
s P(t) sse s t sse (x)((x) (x)); em particular, s P(s) e P(s).
(3) ZF ` P() = {}.
(4) ZF ` P(P()) = {, {}}.
(5) ZF ` a b P(a) P(b).
(6) ZF ` P(a) P(b) P(a b).
(7) ZF ` P(a b) = P(a) P(b).
(8) ZF ` P(a b) (P(a) P(b)) {}.

9
Demonstracao: (1) a P(a) sse a a. Pelo Exerccio 2.7 (10),

P(a) (w)((x)(x w x 6= x) (x)(x w x a)).

Logo, P(a) (w)((x)(x 6 w) (x)(x w x a). Mas (x)(x 6 w)


implica (x)(x w x a); portanto, pelo axioma do conjunto vazio obtemos
P(a).
(2) Basta considerar (x, y) def (x P(y) x y) e usar a Observacao 2.1.
(3) P() = {x : (y)(y x y 6= y)} = {x : x = } = {} (= {y : (z)(z 6
y)}).
(4) Por (3) temos que (y P()) (z)(z 6 y). Assim,

P(P()) = {x : (y)(y x (z)(z 6 y))}


def {x : (x)}.
Por outro lado,

{, {}} = {x : x = x = {}}
= {x : (y)(y 6 x) (y)(y x (z)(z 6 y))}
def {x : (x)}.
Devemos provar entao a equivalencia de (x) e (x), as formulas que definem os
meta-termos P(P()) e {, {}}, respectivamente. Partindo de (x), se assum-
imos (x) def (y)(y x) entao obtemos (x), pois (x) ((x) (x)).
Assumindo (x) entao tambem obtemos (x), porque nesse caso x = , e
P(s) para todo s legitimado, por (2). Assim,

(x), (x = ) (x 6= ) implica ,

portanto (x) implica (x), pelo Princpio do Terceiro Excludo. Analogamente


(analisando os casos em que x = ou x 6= ) provamos que (x) implica (x).
(5) Suponha que a b, e seja x P(a). Se y x entao y a, logo y b. Assim
y x implica y b, donde x P(b), isto e, P(a) P(b). Reciprocamente,
suponha que P(a) P(b). Como a P(a), entao a P(b), donde a b.
(6), (7) e (8): Sao deixados como exerccio. 

Axioma da Reuniao:

[A4] (y)(x)(x y (z)((x z) (z a))

Este axioma legitima em ZF o meta-termo


[
a def {x : (z)((x z) (z a))},
S
definindo a reuniao da colecao de conjuntos a; os elementos de a sao exata-
mente os elementos dos elementos de a. ComoSos elementos dos elementos de
a ocorrem em nveis anteriores ao de a, entao a ocorre no nvel de a (e pos-
sivelmente no nvel anterior). Isto e valido na estrutura cumulativa de tipos.

10
ObserveS que, pelo axioma do par, existe {a, b}; logo, pelo axioma da reuniao,
existe {a, b}. E facil provar que este conjunto e exatamente a b. Vemos
assim que o axioma da reuniao finita resulta agora redundante.
S
Proposicao 3.2 (1) [A1], [PR], [A4] ` {a, b} = a b. Portanto, o axioma
[RF] e deduzido dos outros axiomas introduzidos ate agora.
(2) Se s def {x : (x)} e t def {x : (x)} sao legitimados entao
[
{s, t} = s t = {x : (x) (x)}.

Demonstracao: (1) Por definicao,


S
{a, b} = {x : (z)(z {a, b} x z)}
= {x : (z)((z = a z = b) x z)}
= {x : (z)((z = a x z) (z = b x z))}
= {x : x a x b}
= a b.
S
(2) Considere (a, b) def (x)(x {a, b} x a b) (lembrando que
devemos eliminar os meta-termos para obter uma formula). Por (1) temos
(a)(b)(a, b) e entao, pela Observacao 2.1, deduzimos (s, t), pois s e t sao
legitimados. 
Observe que, por [A2], sempre podemos definir a intersecao de uma familia nao
vazia de conjuntos:
Proposicao 3.3 [A2], (x)(x a) ` (w)(x)(x
T w (y)(y a x y)).
Em outras palavras, se a 6= , entao a def {x : (y)(y a x y)} e
legitimado.
Demonstracao: Por [A2] temos que existe s = {x : x b (y)(y
a x y)}. Mas b a e (y)(y a x y) implicam que x b, logo
s = {x : (y)(y a x y)}. 

Provaremos algumas propriedades basicas da intersecao e a reuniao arbitraria


de conjuntos. Antes disso, precissamos ampliar a nossa notacao permitindo
(meta)termos da forma {t : }, onde t e um (meta)termo da forma {x : }.
Definimos {t : } como sendo {x : (u1 ) (un )((x = t) )} onde u1 ,
. . . , un sao algumas das variaveis livres comuns a t e (no contexto ficara
claro quais variaveis serao livres, funcionando como parametros). Por exemplo,
podemos formar o termo s def {a c : c b}, com variaveis livres a e b,
a partir do termo t def a c (com variaveis livres a e c). Logo, s denota o
termo {x : (c)((x = a c) c b)}; aqui, c e b sao as variaveis livres de
(c, b) def c b. E imediato que se t e legitimado, entao implica t {t : }.
Proposicao
S 3.4 Na TC introduzida ate agora temos o seguinte:
(1) S = .
(2) {a} = a. S S
(3) Se s def {x : (x)} e legitimado, entao {s} = s; em particular, {} =
.

11
S S S
(4) T(a b) = ( a) ( b).
(5) {a, b} = a b. T
(6) Se s def {x : (x)} e t def {x : (x)} sao legitimados, entao {s, t} =
s t. T T T T
(7) Se a 6= e b 6= ,TentaoSexiste (a b), e (a b) = ( a) ( b).
(8) Se a S 6= , entao
S a a.
(9) a ( b) = {a c : cT b}. T T
(10) Se b 6= , entao existe {a c : c b}, e a ( b) = {a c : c b}.
S
Demonstracao: (1) x S sse (z)(x z z ) see (z)(x z z 6= z)
sse (z)(zS 6= z). Logo, x 6 para todo x.
(2) x {a} sse (z)(x z z {a}) sse (z)(x z z = a) S sse x a.
(3) E consequencia de (2), considerando (a) def (x)(x {a} x a), a
Observacao
S 2.1, e o fato de s ser legitimado.
(4) x (a b) sse (z)(x z z a b) sse (z)(x z (z a z b)) sse
(z)((x Sz z Sa)(x z z b)) sse (z)(x z z a)(z)(x z z b)
sse x (T a) ( b) (lembre que (z)((z) (z)) (z)(z) (z)(z)).
(5) x {a, b} sse (y)(y {a, b} x y) sse (y)((y = a y = b) x y)
sse (y)((y = a x y) (y = b x y)) sse (y)(y = a x y) (y)(y =
b x y) sse x a x b sse x a b (lembre que (y)((y) (y))
(y)(y) (y)(y)). T
(6) Considere (a, b) def (x)(x {a, b} x x a b). Por (5),
vale (a)(b)(a, b), donde deduzimos (s, t) para s e t legitimados, pela Ob-
servacao 2.1.
(7) A prova e similar a do item (5).
(8) E imediato.
S
(9) x {a c : c b} sse (z)(x z (c)(z = (a c) c b) sse (c)(x
(a c) c Sb) sse (c)((x a (x c c b)) sse x a (c)(x c c b)
sse x a ( b) (lembre que (c)( (c)) (c)(c) se c nao ocorre livre
em ). T T
(10) x a ( b) sse x a (c)(c b x c). Por outro lado, x {a c :
c b} sse (y)(yT {a c : c b} x y).
Seja x a ( b) e y {a c : c b}; logo, existe c0 b tal que y = a c0 .
Se x a, entao x (a c0 ) = y. Se (c)(c b x c), entao, tomando c0
0
no lugar de T c, obtemos x c e entao x y. Em todo caso, provamos T que
x a ( b) T implica y {a c : c b} x y, donde T x a ( b)
implica x {a c : c b}. Reciprocamente, seja x {a c : c b}, e
c b. Como a c T {a c : c b}, entao x a c, donde x a x c.
Desta maneira, x {a c : c b} implica T c b (x a x c) e
entao x a (c b x c). Portanto, x {a c : c b} implica
(c)(x a (c b x c)) que implica x a (c)(c b x c) (lembre
que (c)( (c)) (c)(c), se c nao ocorre livre em ). 

Finalmente formularemos o axioma da regularidade. Este axioma, devido a Zer-


melo (1930) (existe uma versao previa de von Neumann em 1925) e fundamental

12
para evitar situacoes da forma x x ou, em geral,
x1 x2 xn x1 .
Alem disso, este axioma evita descensos infinitos da forma
xn xn1 x2 x1
(isto significa que a relacao x y e bem fundada, como estudaremos depois).

Axioma da Regularidade:

[A5] (y)(y x) (y)(y x (z)(z x z y))

Este e o unico axioma expressando a ideia que os conjuntos ocorrem en nveis


ou tipos, e e precisso utilizar a teoria cumulativa de tipos para entende-lo. Com
efeito, consideremos um conjunto x nao vazio. Comecemos a analizar os nveis
de baixo para cima, ate encontrar o primeiro nvel em que foram formados
elementos de x. Por exemplo, se x = {{}, {{}}, {{{}}}}, entao o primeiro
nvel em que aparecem elementos de x e o nvel 2, assumindo que nao temos
indivduos. Assim se y x esta no nvel mnimo, entao os elementos de y (se
existirem) devem necessariamente ter sido criados em nveis anteriores, logo nao
podem pertencer a x, isto e: y x = (o que se confirma no nosso exemplo). Os
axiomas de extensionalidade e regularidade sao os unicos que exigem conjuntos
satisfazendo certas propriedades; os outros axiomas estabelecem a existencia de
suficientes conjuntos em alguma direcao.

Definicao 3.5 S e o sistema axiomatico da TC que consiste dos axiomas [A1]-


[A5] mais [PR].

Proposicao 3.6 (1) S ` a 6 a.


(2) S ` (a b b a).

Demonstracao: (1) a a implica a {a} a. Por [A5] existe x {a} tal


que {a} x = . Mas x {a} sse x = a e entao {a} a = , o que contradiz
a {a} a.
(2) Se a b b a, entao a {a, b} b e b {a, b} a. Por [A5] existe
x {a, b} tal que {a, b} x = . Mas x {a, b} sse x = a ou x = b. Os dois
casos levam a uma contradicao. 
A partir de agora, desenvolveremos um estudo da TC obtida atraves do sis-
tema S. O sistema completo ZF da TC sera introduzido na Secao 11. Porem, e
importante observar que uma parte interessante da TC finita pode ser desen-
volvida utilizando apenas o sub-sistema S de ZF , como veremos nas proximas
secoes.

4 Produtos Cartesianos
Estamos em condicoes de comecar a desenvolver as primeiras aplicacoes do
fragmento S de ZF introducido ate agora. Antes de estudar a teoria de relacoes

13
e funcoes na proxima secao, e necessario definir o conceito de par ordenado, a
partir do qual sao introduzidos os produtos cartesianos de conjuntos.

Definicao 4.1 (Kuratowski) (i) ha, bi def {{a}, {a, b}}.


(ii) ha1 , . . . , an+1 i def hha1 , . . . , an i, an+1 i para n 2.

E claro que o axioma [PR] assegura a existencia de ha, bi para todo a e b. Ob-
serve que a definicao de ha, b, ci como sendo {{a}, {a, b}, {a, b, c}} nao funciona
(porque?).

Proposicao 4.2 S ` ha, bi = hc, di (a = c) (b = d).

Demonstracao: x ha, bi sse x = {a} ou x = {a, b}, e x hc, di sse x = {c}


ou x = {c, d}. Suponha que ha, bi = hc, di; a prova de que a = c e b = d sera
feita por analise de casos.
Caso 1: a = b. Logo, ha, bi = {{a}} = {{c}, {c, d}} e entao, pelo Corolario 2.4,
{c} = {a} = {c, d} donde, usando novamente o Corolario 2.4, obtemos que
c = a = d.
Caso 2: a 6= b. Dado que {a} hc, di, entao {a} = {c} ou {a} = {c, d} (usando
o Corolario 2.4).
Caso 2.a: {a} = {c}. Logo a = c, e entao hc, di = {{a}, {a, d}}. Como
{a, b} hc, di e {a, b} 6= {a} (pelo Corolario 2.4 e a hipotese a 6= b), entao
{a, b} = {a, d}. Daqui obtemos, de a 6= b, que b = d.
Caso 2.b: {a} = {c, d}. Logo c = a = d e entao hc, di = {{a}}. Mas
{a, b} hc, di, donde {a, b} = {a}, e entao a = b, o que contradiz a hipotese
a 6= b. Daqui inferimos que vale o caso 2.a.
Claramente, a = c, b = d implica ha, bi = hc, di, pelas regras da igualdade. 

Uma vez que possuimos a definicao de par ordenado, podemos criar o con-
junto de todos os pares ordenados hx, yi, onde x a e y b, fixados a e b.

Definicao 4.3 O produto cartesiano de a e b e dado por a b def {hx, yi :


x a y b}.

Provaremos agora que o termo a b e legitimado.

Proposicao 4.4 a b = {x : x P(P(a b)) (y)(z)(x = hy, zi (y


a) (z b))}. Portanto, a b e legitimado por [A2] (dado que os termos
envolvidos na definicao sao legitimados pelos outros axiomas de S).

Demonstracao: Temos que {x : x P(P(a b)) (y)(z)(x = hy, zi (y


a) (z b))} e legitimado por [A2]. Provaremos em S que
(y)(z)(x = hy, zi (y a) (z b))
x P(P(a b)) (y)(z)(x = hy, zi (y a) (z b))
e entao (dado que a implicacao recproca e sempre verdadeira) teremos provado
o resultado. Seja entao x = hy, zi tal que y a, z b. Portanto, {y} a b
e {y, z} a b, donde {y} P(a b) e {y, z} P(a b). Desta maneira,
x = {{y}, {y, z}} P(a b) e entao x P(P(a b)). 

14
Proposicao 4.5 S ` a b = a = b = .
Demonstracao: Suponha que a b = . Assuma que (a = b = ), isto
e, a 6= e b 6= . Logo, (y)(y a) e (z)(z b). Daqui hy, zi a b, uma
contradicao. Portanto, inferimos que a = b = . Reciprocamente, suponha
que a = b = ; logo, (y)(y a) (z)(z b) e entao (y)(z)((y
a) (z b) x = hy, zi) para todo x. Portanto, x 6 a b para todo x, donde
a b = . 

Proposicao 4.6 S ` a b = b a (a = b = a = b).


Demonstracao: Suponha que a b = b a; assumindo a 6= , b 6= e a 6= b
provaremos uma contradicao. Com efeito, de a 6= b inferimos que existe x a,
x 6 b ou existe x b, x 6 a, por [A1]. Assumamos x a, x 6 b (o raciocnio
para a outra possibilidade e simetrico). Seja y b (assumimos b 6= ). Portanto,
hx, yi a b = b a, e entao (x b) (y a), donde x b, uma contradicao.
Reciprocamente, suponha que (a = b = a = b). Temos que (a = b = )
implica a b = = b a, pela Proposicao 4.5. Por outro lado, a = b implica
a b = b a, pelas regras da igualdade. 

Proposicao 4.7 (i) S ` (a 6= a b a c) (b c).


(ii) S ` (b c) (a b a c).
Demonstracao: (i) O caso b = e trivial. Assuma entao b 6= e seja y b.
Fixe x a (assumimos a 6= ); logo hx, yi a b, e a b a c, donde
hx, yi a c. Daqui (x a) (y c), e entao y c; isto e, b c.
(ii) O caso a b = e trivial. Seja z a b; logo, z = hx, yi para x a e y b.
Mas b c, donde y c e entao z = hx, yi a c. Portanto a b a c. 

Proposicao 4.8 (i) S ` a (b c) = (a b) (a c).


(ii) S ` a (b c) = (a b) (a c).
(iii) S ` a (b c) = (a b) (a c).
Demonstracao: (i) hx, yi a (b c) sse (x a) (y (b c)) sse (x
a) ((y b) (y c)) sse ((x a) (y b)) ((x a) (y c)) sse
(hx, yi a b) (hx, yi a c) sse hx, yi (a b) (a c).
(ii), (iii): Sao deixados como exerccio. 

Proposicao 4.9 S ` (a a a) a = .
Demonstracao: Se z a entao, de a a a, inferimos
z = {{x}, {x, y}} a a para algum x, y a. ()
S
Suponha entao S a 6= . Pelo axioma deS regularidade aplicado a a ( a) 6= ,
existeSc a ( a) tal que c (a ( a)) = . Observe que os elementos de
a (S a) sao conjuntos nao vazios, por (). Daqui, c 6= . SSe c a, entao
c a (isto e uma consequencia imediata
S da definicao de a, e S e deixado
S Daqui =
como exerccio). 6 c = c ( a), o que contradiz c (a ( a)) = .
Portanto c a donde, por (), teremos que c = {x} ou c = {x, y} para
x, y a. Nos dois casos c a 6= , uma contradicao. 

15
5 Relacoes em S
Nesta secao trataremos a teoria elementar de relacoes em S, utilizando os re-
sultados sobre produtos cartesianos provados na secao anterior.
Definicao 5.1 Introduzimos as notacoes seguintes:
rel(r) para (x)(x r (y)(z)(x = hy, zi))
r e uma relacao (um conjunto de pares ordenados);
u r v para hu, vi r
u esta em relacao r com v;
dom(r) para {x : (y)(x r y)}
(o domnio de r);
im(r) para {y : (x)(x r y)}
(a imagem de r);
r|z para {u : u r (x)(y)(u = hx, yi x z)}
(r com domnio restrito a z);
1
r para {u : (x)(y)(u = hx, yi y r x)}
(a relacao inversa de r);
rz para {y : (x)(x z x r y)}, isto e, im(r|z)
(a imagem de z por r);
r(z) para {y : (u)((w)(z r w w = u) y u)}
(o unico valor de r em z, se existir, ou em caso contrario).

Proposicao 5.2 (a) (rel(r) (s r)) rel(s); em particular, rel().


(b) (rel(r) rel(s)) rel(r s) rel(r s) rel(r s).

Demonstracao: (a) z s implica z r implica z = hx, yi para algum x e y;


logo, rel(s).
(b) z r s implica z r ou z s; nos dois casos, z = hx, yi para algum x, y.
Os outros casos sao similares. 

Proposicao 5.3 Os meta-termos da Definicao 5.1 sao legitimados.


SS
Demonstracao: dom(r): Por S [A2],
S existe {x : x r (y)(x r y)}.
Provaremos que a condicao x r pode ser eliminada. Com efeito, suponha
S
que (y)(xSrSy). Logo hx, yi r, isto e, {{x}, {x, y}} r. Daqui {x} r e
entao x r.
im(r): A prova e analoga a anterior.
r|z: E legitimado por [A2].
r1 : Por [A2] existe {u : u im(r) dom(r) (x)(y)(u = hx, yi y r x)}.
Provaremos que a condicao u im(r)dom(r) e implicada pela outra condicao.
Seja entao u satisfazendo: (x)(y)(u = hx, yi y r x). Logo, u = hx, yi tal
que y r x, donde y dom(r) e x im(r), e entao u = hx, yi im(r) dom(r).
rz: Temos que rz = im(r|z), S sendo portanto legitimado.
r(z): Por [A2], existe {y : y im(r) (u)((w)(z r S w w = u) y u)}.
Como antes, veremos que a condicao de separacao y im(r) e redundante.
Com efeito, suponha que y satisfaz (u)((w)(z r w w = u) y u), e seja

16
u satisfazendo (w)(z r w w = u) y u. Tomando
S w = u obtemos que z
r u, donde u im(r). Mas y u, portanto y im(r). 

Proposicao 5.4 (a) dom(r s) = dom(r) dom(s).


(b) dom(r s) dom(r) dom(s).
(c) dom(r) dom(s) dom(r s).
(d) im(r s) = im(r) im(s).
(e) im(r s) im(r) im(s).
(f ) im(r) im(s) im(r s).

Demonstracao: (a) Temos que x dom(r s) sse (y)(x (r s) y) sse (y)((x


r y) (x s y)) sse (y)(x r y) (y)(x s y) sse x dom(r) x dom(s) sse
x dom(r) dom(s).
(b)-(f): As provas sao analogas, e sao deixadas como exerccio. 

Com relacao a r1 temos as seguintes propriedades:

Proposicao 5.5 (a) (r1 )1 r; rel(r) r (r1 )1 .


(b) (r s)1 = r1 s1 .
(c) (r s)1 = r1 s1 .
(d) (r s)1 = r1 s1 .

Demonstracao: (a) z (r1 )1 implica que z = hx, yi tal que x (r1 )1


y. Mas x (r1 )1 y implica y r1 x implica x r y, isto e, z = hx, yi r.
Reciprocamente, se rel(r), seja z r; entao z = hx, yi tal que x r y, e a prova
e como acima, revertendo as implicacoes.
(b) hx, yi (r s)1 sse hy, xi r s sse (hy, xi r) (hy, xi s) sse
hx, yi r1 hx, yi s1 see hx, yi r1 s1 .
(c) Analoga a prova anterior.
(d) hx, yi (r s)1 sse hy, xi r s sse (hy, xi r) (hy, xi 6 s) sse
hx, yi r1 hx, yi 6 s1 see hx, yi r1 s1 . 

Definicao 5.6 A composicao de r e s e definida como

r s def {hx, yi : (z)((x r z) (z s y))}.

Proposicao 5.7 r s e legitimado em S.

Demonstracao: Provaremos que

r s = {u : u dom(r) im(s) (x)(y)(z)((u = hx, yi) (x r z) (z s y))},

donde o resultado segue por [A2]. Assim, suponha que u = hx, yi tal que x
r z, z s y para algum z. Logo x dom(r) e y im(s), donde u = hx, yi
dom(r) im(s). 

A composicao satisfaz as seguintes propriedades:

17
Proposicao 5.8 (a) r (s t) = (r s) (r t).
(b) r (s t) (r s) (r t).
(c) (r s) (r t) r (s t).
(d) (r s)1 = s1 r1 .
(e) r (s t) = (r s) t

Demonstracao: (a) Temos que

x (r (s t)) y
see (z)((x r z) (z (s t) y))
see (z)((x r z) ((z s y) (z t y)))
see (z)(((x r z) (z s y)) ((x r z) (z t y)))
see (z)((x r z) (z s y)) (z)((x r z) (z t y))
see (x (r s) y) (x (r t) y)
see x ((r s) (r t)) y.

(b) Temos que

x (r (s t)) y
implica (z)((x r z) (z (s t) y))
implica (z)((x r z) ((z s y) (z t y)))
implica (z)(((x r z) (z s y)) ((x r z) (z t y)))
implica (z)((x r z) (z s y)) (z)((x r z) (z t y))
implica (x (r s) y) (x (r t) y)
implica x ((r s) (r t)) y,

lembrando que (z)( ) ((z) (z)). A recproca desta propriedade


logica nao e verdadeira em geral, donde nao vale em geral a igualdade em (b).
(c) A prova e analoga a anterior.
(d) x (r s)1 y sse y (r s) x sse (z)((y r z) (z s x)) sse (z)((z r1 y) (x
s1 z)) sse x (s1 r1 ) y.
(e) E deixada como exerccio. 

A restricao satisfaz as seguintes propriedades:

Proposicao 5.9 (a) r|z = r (z im(r)).


(b) r|(a b) = (r|a) (r|b).
(c) r|(a b) = (r|a) (r|b).
(d) r|(a b) = (r|a) (r|b).
(e) (r s)|a = (r|a) s.

Demonstracao: Exerccio. 

Finalmente, a imagem rz satisfaz as seguintes propriedades:

Proposicao 5.10 (a) r(a b) = ra rb.


(b) r(a b) ra rb.

18
(c) ra rb r(a b).
(d) (a b) (ra rb).
(e) (ra = ) (dom(r) a = ).

Demonstracao: (a) Temos que


y r(a b)
sse (x)((x r y) (x a b))
sse (x)((x r y) (x a)) (x)((x r y) (x b))
sse (y ra) (y rb)
sse y (ra rb).
(b) A prova e analoga, usando agora (x)( ) ((x) (x)).
(c) Analoga a anterior.
(d) y ra implica (x)((x r y) (x a)) implica (x)((x r y) (x b))
implica y rb.
(e) y ra implica (x)((x r y) (x a)). Portanto, se (x r y) (x a), entao
x dom(r) a. Isto e, ra 6= implica dom(r) a 6= . Reciprocamente, se
x dom(r)a, entao x r y para algum y, e x a, donde (x)((x r y)(x a)).
Portanto y ra, isto e: dom(r) a 6= implica ra 6= . 

Exemplo 5.11 Assumindo os numeros naturais como indivduos, sejam

r = {h1, 2i, h1, 3i, h2, 1i, h2, 3i}, s = {h2, 1i, h3, 5i}.

Portanto,

dom(r) = {1, 2}, im(r) = {1, 2, 3},


r({1}) = {2, 3}, r({3}) = ,
s1 = {h1, 2i, h5, 3i}, r s = {h1, 1i, h1, 5i, h2, 5i},
s r = {h2, 2i, h2, 3i}, r|{2} = {h2, 1i, h2, 3i},
im(r|{2}) = {1, 3} = r{2}, (r1 ){3} = {1, 2}. 

6 Relacoes de Ordem
Um tipo muito importante de relacoes e a classe das relacoes de ordem. Elas
ocorrem em quase todas as areas da matematica, sendo que o seu estudo cons-
titui, em si, uma area relevante dentro da Matematica.

Definicao 6.1 Introduzimos as notacoes seguintes:


ref (r, a) para (x)(x a (x r x))
(r e reflexiva em a);
irr(r, a) para (x)(x a (x r x))
(r e irreflexiva em a);
sim(r, a) para (x)(y)(((x a) (y a) (x r y)) (y r x))
(r e simetrica em a);
asim(r, a) para (x)(y)(((x a) (y a) (x r y)) (y r x))
(r e asimetrica em a);

19
anti(r, a) para (x)(y)(((x a) (y a) (x r y) (y r x)) (x = y));
(r e antisimetrica em a);
tran(r, a) para
(x)(y)(z)(((x a) (y a) (z a) (x r y) (y r z)) (x r z))
(r e transitiva em a);
con(r, a) para (x)(y)(((x a) (y a) (x 6= y)) ((x r y) (y r x)))
(r e conectada em a);
f con(r, a) para (x)(y)(((x a) (y a)) ((x r y) (y r x)))
(r e fortemente conectada em a).

As definicoes usuais (r e reflexiva, r e simetrica, etc.) sao obtidas considerando


a = dom(r)im(r) def F (r); assim, ref (r) denota ref (r, F (r)), sim(r) denota
sim(r, F (r)), etc. Sera muito util definir a relacao identidade sobre um conjunto
a, dada pelo termo I(a) = {hx, xi : x a}.

Proposicao 6.2 O termo I(a) e legitimado em S.

Demonstracao: O termo s def {z : z PP(a) (x)(z = hx, xi (x a))}


e legitimado por [A2]. Basta entao provar que (x)(z = hx, xi(x a)) implica
z PP(a). Com efeito, z = hx, xi implica z = {{x}}. Por outro lado, x a
implica {x} P(a), portanto z P(a), isto e, z PP(a). Logo I(a) = s,
sendo portanto legitimado. 

Proposicao 6.3 Seja r uma relacao. As seguintes propriedades sao demons-


traveis em S:
(a) asim(r) irr(r).
(b) asim(r) anti(r).
(c) (sim(r) tran(r)) ref (r).

Demonstracao: (a) Seja x F (r); como r e asimetrica, entao (x r x) implica


(x r x), donde obtemos (x r x).
(b) Sejam x, y F (r) tais que (x r y)(y r x). Logo, obtemos (y r x), pois r e
asimetrica, donde deduzimos uma contradicao. Portanto (x, y F (r))asim(r)
implica ((x r y) (y r x)), e a posteriori ((x r y) (y r x)) (x = y), isto
e, ((x r y) (y r x)) (x = y).
(c) Suponha que x F (r). Se x dom(r), entao x r y para algum y F (r).
Como sim(r), entao y r x, donde (x r y) (y r x). Portanto x r x, pois tran(r).
Por outro lado, se x im(r), entao y r x para algum y F (r), e a prova e
analoga. 

Podemos definir cinco tipos de ordens:

Definicao 6.4 Sejam r uma relacao e a um conjunto. Definimos o seguinte:


(a) qo(r, a) denota ref (r, a) tran(r, a) (r e uma quase ordem em a).
(b) op(r, a) denota ref (r, a) anti(r, a) tran(r, a) (r e uma ordem parcial em
a).
(c) os(r, a) denota anti(r, a) tran(r, a) f con(r, a) (r e uma ordem simples
em a).

20
(d) ope(r, a) denota asim(r, a) tran(r, a) (r e uma ordem parcial estrita em
a).
(e) ose(r, a) denota asim(r, a) tran(r, a) con(r, a) (r e uma ordem simples
estrita em a).
(f ) qo(r) denota qo(r, F (r)), etc.

Se r satisfaz alguma das definicoes de ordem introduzidas na Definicao 6.4,


entao escreveremos x y ou ainda x < y (se r e irreflexiva) no lugar de x r y,
quando nao existir risco de confusao.

Exemplos 6.5 (1) Dado um conjunto b, entao a = P(b) e parcialmente orde-


nado pela relacao x y sse x y b. Com efeito, e parcial, pois nem todo
par de subconjuntos x, y de b deve ser necessariamente comparavel pela relacao
de inclusao.
(2) O conjunto N dos numeros naturais e ordenado pela relacao: n m sse n|m
(n divide a m). Com efeito, n n para todo n, pois n = 1.n, donde n|n. Por
outro lado, n|m e m|n significa: existem k, h em N tais que m = kn, n = hm,
portanto m = k(hm) = (kh)m. Se m = 0, entao n = h.0 = 0 = m. Se m 6= 0,
entao de m = (kh)m inferimos 1 = kh, e entao k = 1 = h, donde n = m.
Finalmente, se n m e m r, entao m = kn e r = hm para certos k, h N.
Portanto r = hm = h(kn) = (hk)n para hk N donde n|r, isto e, n r.
Observe que 1|n para todo n, pois n = n.1; logo 1 n para todo n, isto e, 1 e
o mnimo elemento de N com a ordem divide a. Por outro lado, 0 = 0.n para
todo n, e entao n|0 para todo n, isto e, n 0 para todo n. Daqui 0 e o maximo
elemento de N com a ordem divide a. Observe que a ordem nao e conectada:
2 6 3 e 3 6 2, pois 2 e 3 sao co-primos. Os numeros primos positivos sao
os elementos minimais, isto e, se n p e p e primo, entao n = 1 (o mnimo
elemento com relacao a ) ou n = p. Reciprocamente, se p e minimal, entao
p deve ser necessariamente primo. 

Proposicao 6.6 Em S temos o seguinte:


(a) op(r) qo(r).
(b) os(r) op(r).
(c) os(r) os(r1 ).
(d) qo(r) qo(s) qo(r s).

Demonstracao: (a) Imediato das definicoes.


(b) So falta provar a reflexividade da r. Mas x F (r) implica ((x r x) (x r
x)), isto e, x r x, pois f con(r).
(c) E claro que tran(r) tran(r1 ). Com efeito, ((x r1 y)(y r1 z)) implica
((y r x) (z r y)) implica z r x (pois tran(r)) implica x r1 z. Da mesma
maneira provamos que anti(r) anti(r1 ) e f con(r) f con(r1 ).
(d) Seja x F (r s), logo x F (r) F (s), donde ((x r x) (x s x)), pois
ref (r) ref (s). Portanto x (r s) x, isto e, ref (r s). Suponha agora que ((x
(r s) y) (y (r s) z)). Daqui obtemos ((x r y) (y r z)), donde x r z, pois
tran(r). Analogamente x s z, e entao x (r s) z; isto e, tran(r s). 

21
Observe que a reuniao de duas quase-ordens nao resulta necessariamente numa
quase-ordem. Por exemplo

r = {h1, 1i, h2, 2i, h1, 2i}, s = {h2, 2i, h3, 3i, h2, 3i}

sao duas quase-ordens, mas a uniao, embora reflexiva, nao e transitiva. A


situacao muda se F (r) F (s) = .
Proposicao 6.7 S ` (qo(r) qo(s) (F (r) F (s) = )) qo(r s).
Demonstracao: E claro que r s e reflexiva. Suponha que ((x (r s) y) (y
(r s) z)). Como F (r) F (s) = , entao so vale uma das seguintes afirmacoes:

((x r y) (y r z)), ((x s y) (y s z)).

Nos dois casos, obtemos x (r s) z, pois tran(r) tran(s). 

Proposicao 6.8 S ` ((r s) (s (a a)) ose(r, a) ose(s, a)) (r = s).

Demonstracao: Suponha que x s y mas (x r y). Como asim(s), entao


x 6= y, donde y r x, pois con(r, a). Portanto y s x, pois r s, o que contradiz
asim(s). 

O significado da proposicao precedente e o seguinte: uma ordem simples estrita


em a ordena todos os elementos de a numa ordem estrita, isto e: x 6< x para
todo x a. Portanto, se r, s sao duas ordens estritas simples em a tal que s
estende r, entao elas devem necessariamente coincidir, pois r ja ordenou todos
os elementos de a.
Introduziremos agora a importante nocao de boa ordem. Uma boa ordem
em a e uma ordem simples estrita r tal que todo subconjunto nao vazio de a
tem um elemento mnimo segundo r. De fato, a conectividade de r implicara a
transitividade e asimetria de r. Antes da definicao, analizaremos alguns exem-
plos.
Exemplos 6.9 (a) O conjunto N dos numeros naturais e bem ordenado pela
relacao < usual (menor que). De fato, =
6 A N possui um elemento mnimo.
(b) N nao e bem ordenado pela ordem simples estrita > (maior que). Com
efeito, =6 A N tem elemento mnimo com relacao a > significa que existe
n A tal que n > m para todo m A. Em particular, o proprio N deveria ter
um primeiro elemento relativo a >, isto e, deveria existir n N tal que n > m
para todo m N; mas isto nao e verdade (n 6> n + 1).
(c) Considere A = {(n 1)/n : n N n 6= 0} {1} ordenado pela relacao
< usual (em Q, o conjunto dos numeros racionais). Logo, A e bem ordenado.
Com efeito,

(n 1)/n < (m 1)/m sse m(n 1) < n(m 1) sse

mn m < nm n sse m < n sse n < m.

22
Portanto, 6= B A tem primeiro elemento (n 1)/n, onde n e o mnimo m
tal que (m 1)/m B. Se B = {1}, entao claramente 1 e o primeiro elemento
de B.
(d) Seja A como no item (c). Logo, > (a ordem maior que de Q) nao e uma
boa ordem em A, pois B = A {1} nao tem primeiro elemento. Com efeito,
se x = (n 1)/n fosse mnimo, entao (n 1)/n > n/(n + 1) donde n > n + 1,
uma contradicao. 

Definicao 6.10 Definimos o seguinte:


(a) min(x, r, a) denota x a (y)(y a (y r x)) (x e um elemento
r-minimal de a).
(b) pe(x, r, a) denota x a (y)((y a x 6= y) x r y) (x e um r-primeiro
elemento de a).
(c) bo(r, a) denota con(r, a) (b)((b a b 6= ) (x)min(x, r, b)) (r e uma
boa ordem em a).

Observacao 6.11 Um elemento minimal nao tem antecessores, enquanto que


um primeiro elemento precede todo outro elemento diferente dele mesmo. Se r
e asimetrica, entao todo primeiro elemento e minimal. Com efeito, seja x a
primeiro elemento de r. Se y a, entao (y r x) se y = x, pois r e irreflexiva.
Se y 6= x, entao x r y, pois x e primeiro elemento. Logo (y r x), pois r e
asimetrica, e entao x e minimal. Observe que r = {h1, 1i} em a = {1} tem
trivialmente 1 como primeiro elemento, mas 1 nao e minimal, pois 1 r 1; vemos
que a hipotese de asimetria e fundamental. A recproca nao vale em geral: 1
e minimal em r = {h1, 2i} sobre a = {1, 2, 3}, mas 1 nao e primeiro elemento,
pois (1 r 3). Se r e conectada e asimetrica, as duas nocoes coincidem. Com
efeito, se x e minimal e y 6= x, entao (y r x), pois x e minimal. Mas r e
conectada, portanto x r y. Daqui x e primeiro elemento. 

Proposicao 6.12 S ` bo(r, a) (asim(r, a) tran(r, a)).

Demonstracao: Sejam x, y a tais que x r y, y r x. Logo, {x, y} nao tem


elemento minimal. Com efeito, y nao e minimal, pois x r y. Analogamente,
y r x implica que x nao e minimal; isto contraria o fato de r ser uma boa
ordem. Portanto, r deve ser asimetrica. Sejam agora x, y, z a tais que x r
y, y r z, (x r z). Como r e asimetrica, entao x 6= z. Logo, z r x, pois r e
conectada. Mas entao {x, y, z} nao tem elemento minimal: x r y implica que y
nao e minimal; y r z implica que z nao e minimal. Finalmente, z r x implica
que x nao pode ser minimal. Daqui, inferimos que r e transitiva. 

Proposicao 6.13
(a) ` bo(r, a) (asim(r, a) con(r, a) (b)(b 6= b a (x)pe(x, r, b))).
(b) ` bo(r, a) a 6= (!x)pe(x, r, a). Aqui, a notacao (!x)(x) indica:
(x)((x) (y)((y) (y = x))) (existe um unico x tal que (x)).
(c) ` bo(r, a) b a bo(r, b).

23
Demonstracao: (a) Assuma bo(r, a); pela Proposicao 6.12, obtemos asim(r, a).
Claro que con(r, a), pela definicao de boa ordem. Se = 6 b a, entao existe
x b tal que min(x, r, b). Pela Observacao 6.11, pe(x, r, b). Reciprocamente,
suponha que (b)(b 6= b a (x)pe(x, r, b)), asim(r, a) e con(r, a). Logo,
con(r, a). Dado =6 b a, seja x b tal que pe(x, r, b). Pela Observacao 6.11
obtemos min(x, r, b), pois asim(r, a).
(b) Se =6 a, entao, de a a, obtemos (x)pe(x, r, a), pelo item (a). Sejam
x, y a tais que pe(x, r, a), pe(y, r, a). Se x 6= y, entao x r y, y r x. Mas
asim(r, a), pela Proposicao 6.12. Logo x = y.
(c) Suponha que bo(r, a) e b a. E claro que con(r, b). Se 6= c b, entao
=6 c a, donde min(x, r, c) para algum x c. Portanto bo(r, b). 

Definicao 6.14 si(y, x, r) denota (x r y) (z)((x r z) (z = y (y r z)))


(y e um r-sucessor imediato de x).
ue(x, r, a) denota (x a) (y)(((y a) y 6= x) y r x) (x e um r-ultimo
elemento de a).

Proposicao 6.15 S ` pe(x, r, a) ue(x, r1 , a).

Demonstracao: Imediata. 

Proposicao 6.16 S ` (bo(r, a) (F (r) a) (x a) ue(x, r, a))


(!y)si(y, x, r).

Demonstracao: Por [A2] podemos formar b = {y : y F (r)(x r y)}. Dado


que F (r) a, entao obtemos que b = {y : x r y} a. Pela Proposicao 6.13(c),
temos que bo(r, b). Como x nao e um ultimo r-elemento de a, entao b 6= .
Portanto, existe um unico r-primeiro elemento y de b, pela Proposicao 6.13(b).
Temos que x r y, pois y b. Por outro lado, se (x r z) e z 6= y, entao y r z, pela
definicao de b e a definicao de primeiro elemento. Portanto, y e um r-sucessor
imediato de x. Por outro lado, z e um r-sucessor imediato de x sse z e um
primeiro elemento de b. Portanto, y e unico. 

7 Relacoes de Equivalencia
As relacoes de equivalencia sao utilizadas com frequencia na Matematica. Sao
relacoes reflexivas, simetricas e transitivas. Dois exemplos basicos sao a relacao
de identidade e a relacao de paralelismo entre retas. Como veremos depois,
uma relacao de equivalencia num conjunto a classifica os seus elementos de
acordo com algum criterio. Esta e uma ferramenta muito util nas construcoes
matematicas, pois permite simplificar os domnios, analizando as classes dos
objetos no lugar dos proprios objetos. Os objetos pertencentes a uma mesma
classe sao considerados identicos.
Definicao 7.1 equiv(r) denota rel(r) ref (r) sim(r) tran(r) (r e uma
relacao de equivalencia).
equiv(r, a) denota a = F (r) equiv(r) (r e uma relacao de equivalencia em
a).

24
Proposicao 7.2 (a) S ` equiv(r) (r r1 = r).
(b) S ` qo(r) equiv(r1 r).

Demonstracao: (a) Se x (r r1 ) y entao existe z tal que x r z, z r1 y.


Daqui obtemos y r z e entao z r y, pois sim(r), donde x r y, pois tran(r). Isto
e, r r1 r. Por outro lado, x r y implica (x r y) (y r1 y), donde x (r r1 )
y. Portanto r = r r1 .
(b) E imediato que r1 r = {hx, yi : (x r y) (y r x)}. Daqui o resultado e
trivial. 

Definicao 7.3 r[x] = {y : x r y}.

Dado que r[x] = {y : y F (r) (x r y)}, entao r[x] e legitimado. E imediato


que r[x] = r{x}. A notacao usual em Matematicas para r[x] e simplesmente
[x], isto e, r e subentendida.

Proposicao 7.4 S ` (x, y F (r) equiv(r)) (r[x] = r[y] (x r y)).

Demonstracao: Assuma r[x] = r[y], isto e, (x r z) (y r z). Como y r y,


entao x r y. Suponha agora x r y, e seja z tal que x r z. De sim(r) obtemos
y r x, e entao inferimos: (y r x), (x r z) implica y r z, pois tran(r). De x r y
provamos analogamente (y r z) (x r z). Isto e, r[x] = r[y]. 

Proposicao 7.5 S ` equiv(r) (r[x] = r[y] (r[x] r[y] = )).

Demonstracao: Suponha que r[x] 6= r[y]; se x 6 F (r) ou y 6 F (r) entao


claramente r[x] r[y] = . Se x, y F (r), entao seja z r[x] r[y]. Logo
(x r z) e (y r z), donde obtemos x r y e posteriormente, pela Proposicao 7.4,
r[x] = r[y], uma contradicao . Portanto, r[x] r[y] = . 

Veremos a continuacao a estreita relacao entre particoes e relacoes de equiva-


lencia.

Definicao 7.6 par(, a) denota


S
( = a) (b)(c)(((b ) (c ) b 6= c) b c = )
(x)(x (y)(y x))
( e uma particao de a).

Por exemplo, se a = {1, 2, 3, 4, 5}, entao = {{1, 4}, {2}, {3, 5}} e uma particao
de a, enquanto que

1 = {{1}, {2, 3, 4}}, 2 = {{1, 2}, {2, 3}, {4}, {5}}

nao sao particoes de a (porque?). Observe que e a unica particao possvel do


conjunto .

Proposicao 7.7 S ` a 6= par({a}, a).

25
S
Demonstracao: Temos que {a} = a. Dado que nao existem b, c {a}
com b 6= c, entao a segunda condicao de par(, a) e trivialmente satisfeita.
Finalmente, seja x {a}; e claro que x = a. Dado que a 6= , entao existe
y a, e a terceira condicao de par(, a) e satisfeita por = {a}. 

Um conceito importante entre particoes e a relacao mais fina que. Intuitiva-


mente, uma particao 1 e mais fina que 2 se todo elemento de 1 esta contido
em algum elemento de 2 , e dai a denominacao mais fina resulta obvia. Por
exemplo, considere as seguintes particoes de a = {1, 2, 3, 4, 5}:

1 = {{1}, {2, 3}, {4, 5}}, 2 = {{1}, {2, 3}, {4}, {5}},

3 = {{1}, {2}, {3}, {4}, {5}}, 4 = {{1, 2, 3}, {4}, {5}}.

E imediato que 2 e mais fina que 1 e 4 , enquanto que 3 e mais fina do que
as outras particoes. Por outro lado, 1 e 4 nao sao comparaveis pela relacao
mais fina que.

Definicao 7.8 mf (1 , 2 ) denota 1 6= 2 (x)(x 1 (y)((y 2 )


(x y))) (a particao 1 e mais fina do que a particao 2 ).

Proposicao 7.9 Todo conjunto tem uma particao mais fina do que todas as
outras particoes do conjunto.

Demonstracao: Seja = {y : y P(a) (x)((x a) y = {x})}.


Temos que e legitimado por [A2], e podemos escrever
S = {{x} : x a}.
Provaremos
S par(, a). Primeiro de tudo, temos = a. Com efeito, seja
x ; logo, existe y tal que x y. Mas y = {z} com z a, pela
definicao
S de . Daqui, x y, y = {z} implica x = z e logo x a. Isto e,
S a. Por outro lado,
S seja x a; logo y = {x} tal que x y, donde
x , isto e, a = . Sejam b, c com b 6= c. Logo b = {x}, c = {y}
tal que x, y a. Portanto, b 6= c implica x 6= y, e entao b c = . Finalmente,
b implica que b = {x} para algum x a; daqui x b e logo (z)(z b).
Isto prova que par(, a). Suponha S agora que par(1 , a) e 1 6= . Seja y ;
logo y = {x} com x a. Como 1 = a, entao existe z 1 tal que x z,
donde y = {x} z, isto e, mf (, 1 ). 

Vemos entao que 3 no exemplo acima e de fato a particao mais fina sobre a.
Provaremos a continuacao que toda relacao de equivalencia sobre um con-
junto a origina uma particao sobre a.

Definicao 7.10 (r) = {b : (x)(x F (r) b = r[x])}.

E imediato que (r) = {b : (b P(F (r))) (x)(x F (r) b = r[x])},


portanto (r) e legitimado por [A2]. O resultado procurado e o seguinte:

Proposicao 7.11 S ` equiv(r, a) par((r), a).

26
Demonstracao: Temos que equiv(r, a) implica S equiv(r)(a = F (r)). Podemos
escrever (r) = {r[x] : x a}. Seja y S(r); logo existe x a tal que
y r[x], donde x r y, isto e, y a. Daqui (r) S a. Por outro S lado, seja
x a. Logo (x r[x]) (r[x] (r)), donde x (r). Isto e, (r) = a.
Sejam r[x], r[y] (r). Se r[x] 6= r[y] entao r[x] r[y] = , pela Proposicao 7.5.
Finalmente, dado r[x] (r), temos que x r[x], isto e, (y)(y r[x]),
provando assim que par((r), a). 

Podemos relacionar a inclusao de relacoes de equivalencia com a relacao mais


fina que das particoes associadas.

Proposicao 7.12 S ` (equiv(r, a) equiv(s, a)) (r s mf ((r), (s)).

Demonstracao: Assuma equiv(r, a)equiv(s, a). Suponha r s; como r 6= s,


existem x, y a tais que x s y mas (x r y). Desta maneira, y s[x] r[x]
e entao r[x] 6= s[x]. Seja z r[x]; portanto x r z, donde x s z, pois r s.
Daqui z s[x], e entao r[x] s[x]. Assim r[x] 6= s[w] para todo w a, pois
par((s), a). Daqui r[x] (r) (s) e entao (r) 6= (s). Seja y (r);
logo y = r[x] para algum x a, e entao r[x] s[x], com s[x] (s), pois
r s. Isto e, mf ((r), (s)). Reciprocamente, suponha mf ((r), (s)). Logo
(r) 6= (s). Se x r y entao y r[x]; mas r[x] s[z] para algum z, donde
y s[z], isto e, y s z. Mas x r[x] s[z], portanto x s[z], donde x s z. De
y s z obtemos z s y e entao x s y; logo r s. Finalmente, suponha que r = s.
Logo, r[x] = s[x] para todo x a, donde (r) = (s), contradicao. Portanto
r s. 

Provaremos agora que uma particao origina uma relacao de equivalencia.

Definicao 7.13 r() = {hx, yi : (b)((b ) x, y b)}.

E imediato que r() e legitimado, pois


[ [
r() = {z : z ( )( )(x)(y)(z = hx, yi(b)((b )x, y b))}.

Proposicao 7.14 S ` par(, a) equiv(r(), a).

Demonstracao: E imediato que par(, a) implica F (r()) = a. Se x a,


entao existe b tal que x b; daqui x r() x, isto e, ref (r(), a) . A prova
da simetria de r() e imediata. Sejam x, y a tais que x r() y, y r() z; entao
x, y b e y, z c para b, c . Logo y b c, donde b = c. Daqui x, z c,
c , e entao x r() z. Isto e, tran(r(), a), portanto equiv(r(), a). 

Vamos agora relacionar particoes com relacoes de equivalencia. Provaremos


que, partindo de uma relacao de equivalencia r, entao a particao (r) e tal que
a relacao de equivalencia gerada, r((r)), coincide com r. Analogamente, a
relacao r() gerada por uma particao e tal que (r()) = .

Proposicao 7.15 S ` (par(, a) equiv(r, a)) ( = (r) r() = r).

27
Demonstracao: Assuma par(, a) equiv(r, a). Suponha = (r). De
equiv(r, a) obtemos x r y sse (z)(x, y r[z]). Mas b sse (z)(b = r[z]),
por hipotese. Logo

x r y sse (b)(x, y b b ) sse x r() y,

isto e, r = r(). Reciprocamente, suponha r = r(). Se b , entao existe


x a tal que x b. Portanto y b sse x r() y sse x r y sse y r[x].
Daqui b = r[x] (r). Por outro lado, seja r[x] (r). Como x a, entao
existe b tal que x b. Portanto b = r[x], como acabamos de provar. Logo
r[x] . Isto e, = (r). 

Finalmente provaremos que a relacao mais fina que e de fato uma ordem
parcial estrita. Considere P AR(a) = { : par(, a)}. Temos que P AR(a) e
legitimado, pois

P AR(a) = { : PP(a) par(, a)}

Considere agora

<a = {u : u P AR(a) P AR(a) (1 )(2 )(u = h1 , 2 i mf (1 , 2 )}

Temos que <a e legitimado por [A2], e 1 <a 2 sse mf (1 , 2 ) para toda
1 , 2 P AR(a).

Proposicao 7.16 (a) S ` (1 <a 2 ) (r(1 ) r(2 )).


(b) S ` ope(<a , P AR(a)).

Demonstracao: (a) Sejam 1 , 2 P AR(a). Logo,

1 <a 2 sse mf (1 , 2 ) sse

mf ((r(1 )), (r(2 ))) equiv(r(1 ), a) equiv(r(2 ), a)


(por 7.14, 7.11, 7.15) sse

r(1 ) r(2 ) (por 7.12).

(b) Sejam 1 , 2 P AR(a) tais que 1 <a 2 ; por (a) temos que r(1 )
r(2 ). Se 2 <a 1 entao r(2 ) r(1 ), uma contradicao. Logo, <a e
asimetrica. Se 1 <a 2 , 2 <a 3 , entao r(1 ) r(2 ) e r(2 ) r(3 ),
donde r(1 ) r(3 ). Portanto 1 <a 3 , por (a). Isto e, <a e uma ordem
parcial estrita em P AR(a). 

Exemplo 7.17 Fixemos k Z, onde Z denota o conjunto dos numeros inteiros.


Definimos em Z a relacao seguinte:

n Rk m sse k|(n m) sse existe z Z tal que n m = z.k .

28
Observe que n Rk m sse n e m tem o mesmo resto na divisao por k. Com efeito,
assumamos que n Rk m; logo, n m = z.k. Por outro lado, n = z1 .k + r1 ,
m = z2 .k + r2 , onde 0 r1 , r2 < k. Se r1 r2 , entao
n m = (z1 .k + r1 ) (z2 .k + r2 ) = (z1 z2 ).k + (r1 r2 ) = z.k
onde 0 r1 r2 < k. Pela unicidade do algoritmo da divisao, temos que
r1 r2 = 0, donde r1 = r2 . Analogamente, se r1 r2 , entao
m n = (z2 .k + r2 ) (z1 .k + r1 ) = (z2 z1 ).k + (r2 r1 ) = (z).k
onde 0 r2 r1 < k. Pela unicidade do algoritmo da divisao, temos que
r2 r1 = 0, donde r1 = r2 . Reciprocamente, se n e m tem o mesmo resto na
divisao por k, entao n = z1 .k + r1 , m = z2 .k + r1 , portanto n m = (z1 z2 ).k,
donde k|(n m), isto e, n Rk m. Provaremos a seguir que Rk e uma relacao de
equivalencia (observe que F (Rk ) = Z).
Se n Z, entao n n = 0 = 0.k, donde n Rk n, isto e, Rk e reflexiva.
Se n Rk m, entao n m = z.k, donde m n = (z).k, com z Z; isto e,
m Rk n. Finalmente, assumamos que n Rk m, m Rk w. Logo, n m = z1 .k,
m w = z2 .k, donde n w = (n m) + (m w) = z1 .k + z2 .k = (z1 + z2 ).k, com
z1 + z2 Z. Daqui n Rk w, e Rk e uma relacao de equivalencia. O conjunto
(Rk ) e usualmente denotado por Zk . Observe que Rk = Rk para todo k Z.
Para ilustrar estas definicoes, considere k = 6; logo, os unicos restos possveis
da divisao de n por 6 sao: 0, 1,. . . , 5. Daqui inferimos que as unicas classes
de equivalencia possveis para R6 sao n def R6 [n], com 0 n 5, portanto
Z6 = {0, . . . , 5}, sendo que, para 0 n 5, n e o conjunto dos numeros inteiros
m tais que o resto da divisao de m por 6 e n. Analogamente, Z3 = {0, 1, 2},
onde agora n = {m : o resto da divisao de m por 3 e n} (n = 0, 1, 2). Observe
que, se 6|(n m), entao 3|(n m), pois 3|6; daqui, R6 e mais fina do que R3 .
Dado que 3 = 1.3+0, 4 = 1.3+1, 5 = 1.3+2, entao R6 [3] R3 [0], R6 [4] R3 [1]
e R6 [5] R3 [2], donde
R3 [0] = R6 [0] R6 [3], R3 [1] = R6 [1] R6 [4], R3 [2] = R6 [2] R6 [5].
Em geral, Rm e mais fina do que Rn sse n|m. Temos portanto que R0 produz a
particao mais fina de Z, pois m|0 para todo m. Para verificar isto diretamente,
observe que n R0 m sse n m = z.0 = 0 sse n = m, donde R0 [n] = {n}
para todo n Z. Por outro lado, R1 produz a particao menos fina {Z}. Com
efeito, 1|n para todo n, donde Rn e mais fina do que R1 . E claro que n R1
m sse 1|(n m), condicao que resulta verdadeira para todo n, m Z, e entao
R1 [0] = Z. 

8 Funcoes
O importante conceito de funcao, cuja definicao foi discutida ate finais do seculo
19, pode ser introduzido elegantemente na linguagem da TC. Informalmente,
uma funcao e uma relacao em que cada elemento do domnio tem associado
um unico elemento na imagem; isto nao proibe, e claro, que dois elementos
diferentes do domnio possam ter associados o mesmo elemento na imagem.

29
Definicao 8.1 f un(f ) denota rel(f ) (x)(y)(z)(((x f y) (x f z)) y =
z) (f e uma funcao).
E claro que f un(f ) equivale a: rel(f ) (x)(x dom(f ) (!y)(x f y)).
Usaremos a notacao f (x) para indicar o unico y tal que x f y. Por exemplo, se
f = {h1, 2i, h2, 2i, h3, 5i}, entao f (1) = 2, f (2) = 2, f (3) = 5. A notacao f (x)
(introduzida na Definicao 5.1) e legitimada pela Proposicao 5.3. A composicao
f g de duas funcoes f , g e definida de maneira que (f g)(x) = f (g(x)).
Isto significa que f g e a composicao (como relacoes) g f introduzida na
Definicao 5.6.
Lema 8.2 (a) S ` f un(f ) (x)(y)((x f y) y = f (x)).
(b) S ` (f un(f ) x dom(f )) (x f f (x)).
Demonstracao: (a) Assuma f un(f ). Se x f y, provaremos:

z y (u)((w)((x f w) w = u) z u)

(lembrando que a formula a direita do primeiro significa z f (x)).


Daqui, teremos, por [A1], que y = f (x). Com efeito, temos o seguinte:
f un(f ), x f y, x f w implica w = y; x f y, w = y implica x f w, portanto
f un(f ), x f y implica (w)(x f w w = y), donde f un(f ), x f y, z y implica
(w)(x f w w = y)z y. Daqui obtemos (u)((w)((x f w) w = u)z
u), isto e: f un(f ), x f y implica z y z f (x).
Por outro lado, x f y, (w)((x f w) w = u) implica (x f y) (x f u), donde,
usando f un(f ), obtemos y = u. Daqui, provamos: f un(f ), x f y, z f (x)
implica z y, isto e: f un(f ), x f y implica z f (x) z y, portanto f un(f ),
x f y implica y = f (x).
(b) Assuma f un(f ) x dom(f ). Provaremos que x f f (x). Com efeito,
f un(f ), x f u implica u = f (x), por (a). Logo, f un(f ), x f u implica x f
f (x). Portanto f un(f ), (u)(x f u) implica x f f (x). Mas x dom(f ) implica
(u)(x f u), portanto: f un(f ), x dom(f ) implica x f f (x). 

Proposicao 8.3 (a) S ` (f un(f ) f un(g)) ((x (g f ) y) y = f (g(x))).


(b) S ` (f un(f ) f un(g) x dom(g) g(x) dom(f )) (x (g f ) f (g(x))).

Demonstracao: (a) Se x (g f ) y, entao x g z, z f y para algum z. Pelo


Lema 8.2(a) obtemos z = g(x) e y = f (z), donde y = f (g(x)), pelas regras da
igualdade.
(b) Pelo Lema 8.2(b), temos que g(x) f f (g(x)), pois g(x) dom(f ). Como
x dom(g), entao x g g(x), novamente por 8.2(b). Daqui obtemos: x g g(x),
g(x) f f (g(x)), e entao x (g f ) f (g(x)), pela Definicao 5.6. 

Vemos assim que f g def g f satisfaz a propriedade desejada x (f g) y sse


y = f (g(x)) (sob certas condicoes razoaveis estabelecidas na Proposicao 8.3(b)).
Uma propriedade fundamental e que a composicao de funcoes e uma funcao.
Proposicao 8.4 (a) S ` (f un(f ) f un(g)) (f un(f g) f un(f g)).
(b) S ` (f un(f ) f un(g) x dom(f g)) (f g)(x) = f (g(x)).

30
Demonstracao: (a) Sejam x, y, z tais que , x (f g) y, x (f g) z. Daqui
obtemos x f y, x g y, x f z, x g z. Como f un(f ), f un(g), entao y = z,
donde f un(f g). Por outro lado, suponha que x (f g) y, x (f g) z. Pela
Proposicao 8.3(a) obtemos y = f (g(x)), z = f (g(x)), donde y = z e entao
f un(f g).
(b) Assuma f un(f ), f un(g), x dom(f g). Pelo item (a) obtemos f un(f
g), x dom(f g), donde x (f g) ((f g)(x)), pelo Lema 8.2(b). Pela
Proposicao 8.3(a) obtemos (f g)(x) = f (g(x)). 

Daqui em diante, quando nao houver risco de confusao, escreveremos f g no


lugar de f g, se f e g sao funcoes. Algumas das propriedades provadas na
Proposicao 5.10 podem ser fortalecidas, no caso em que f e funcao.

Proposicao 8.5 (a) S ` (f g)|z = f (g|z).


(b) S ` f un(f ) (f 1 (ab) = f 1 (a)f 1 (b))(f 1 (ab) = f 1 (a)
f 1 (b)).

Demonstracao: (a) E uma reformulacao da Proposicao 5.9(e).


(b) Assuma f un(f ). Pela Proposicao 5.10(b),(c), basta provar

f 1 (a) f 1 (b) f 1 (a b),

e f 1 (a b) f 1 (a) f 1 (b).
Se x f 1 (a) f 1 (b), entao existem y a, w b tais que x f y, x f
w. Como f un(a), entao y = w, portanto y a b tal que x f y, donde
x f 1 (a b).
Seja agora x f 1 (a b). Logo, existe y a b tal que x f y, e entao
x f 1 (a). Se x f 1 (b), entao existe z b tal que x f z. Como f un(f ),
obtemos y = z donde y b, uma contradicao. Portanto x f 1 (a) f 1 (b).


Definicao 8.6 inj(f ) denota f un(f ) f un(f 1 ) (f e injetora).

Proposicao 8.7 (a) S ` (inj(f ) x, y dom(f )) (f (x) = f (y) x = y).


(b) S ` (inj(f ) x dom(f ) y im(f )) (f 1 (y) = x y = f (x)).
(c) S ` (inj(f ) x dom(f )) f 1 (f (x)) = x.
(d) S ` (inj(f ) y im(f )) f (f 1 (y)) = y.
(e) S ` (inj(f ) inj(g)) inj(f g).
(f ) S ` (inj(f ) inj(g) dom(f ) dom(g) = im(f ) im(g) = )
inj(f g).

Demonstracao: (a) Assuma inj(f ) x dom(f ) y dom(f ). Se f (x) =


f (y), entao obtemos que f (x) f 1 x, f (x) f 1 y. Mas f un(f 1 ), portanto
x = y. Reciprocamente, x = y implica f (x) = f (y), pelas regras da igualdade.
(b) Assuma inj(f ) x dom(f ) y im(f ). Como f un(f 1 ) y dom(f 1 ),
entao x = f 1 (y) implica y f 1 x, pelo Lema 8.2(b). Daqui, x f y e entao, pelo
Lema 8.2(a), obtemos y = f (x); isto e, x = f 1 (y) y = f (x). Simetricamente
provamos y = f (x) x = f 1 (y).

31
(c) Assuma inj(f ) x dom(f ). Logo f (x) im(f ) e f (x) = f (x). Pelo item
(b) obtemos x = f 1 (f (x)).
(d) Analogo ao item (c).
(e) Imediato a partir da Proposicao 8.4 (a).
(f) x (f g) y, x (f g) z implica que (x f y) (x f z) ou (x g y) (x g z), mas
nao ambas simultaneamente. Daqui y = z, e f un(f g). Da mesma maneira
(lembrando que (f g)1 = f 1 g 1 ), x (f g)1 y, x (f g)1 z implica (x
f 1 y) (x f 1 z) ou (x g 1 y) (x g 1 z), mas nao ambas simultaneamente.
Daqui y = z, e f un((f g)1 ). Portanto inj(f g). 

Definicao 8.8 (a) f un(f, a, b) denota f un(f ) (dom(f ) = a) (im(f ) b)


(f e uma funcao de a em b).
(b) sobre(f, a, b) denota f un(f )(dom(f ) = a)(im(f ) = b) (f e uma funcao
sobrejetora de a em b).
(c) inj(f, a, b) denota inj(f ) (dom(f ) = a) (im(f ) b) (f e uma funcao
injetora de a em b).
(d) bij(f, a, b) denota inj(f, a, b) sobre(f, a, b) (f e uma funcao bijetora de
a em b).
(e) ab = {f : f un(f, b, a)} (ab e o conjunto de todas as funcoes de b em a).

Observacao 8.9 Podemos a partir de agora utilizar a notacao usual f : ab


para denotar f un(f, a, b). De fato, utilizaremos as duas notacoes indistinta-
mente. 

Proposicao 8.10 (a) S ` (f un(f, a, b) f un(g, b, c)) f un(g f, a, c).


(b) S ` inj(f, a, b) (bij(f, a, im(f )) bij(f 1 , im(f ), a)).
(c) S ` bij(f, a, b) bij(f 1 , b, a).
(d) S ` (bij(f, a, b) bij(g, b, c)) bij(g f, a, c).
(e) S ` bij(f, a, b) ((f f 1 = I(b)) (f 1 f = I(a))).
(f ) S ` f un(f, a, b) ((I(b) f = f ) (f I(a) = f )).

Demonstracao: (a) Notar que g f e utilizado para denotar g f , isto e, f g


(como relacoes). Assuma entao f : ab, g : bc. Daqui obtemos:

f un(f ), dom(f ) = a, im(f ) b, f un(g), dom(g) = b, im(g) c.

Pela Proposicao 8.4(a) obtemos f un(g f ). Por definicao de composicao,


dom(g f ) dom(f ), im(g f ) im(g); isto e, dom(g f ) a, im(g f ) c.
Seja x a; pela Proposicao 8.3(b) temos que x (gf ) (g(f (x)), pois a = dom(f )
e b = dom(g), donde x dom(f ) f (x) dom(g). Daqui x dom(g f ), isto
e, dom(g f ) = a. Portanto f un(g f, a, c).
(b) Observe que dom(f 1 ) = im(f ), im(f 1 ) = dom(f ). Assuma inj(f, a, b).
Logo, temos o seguinte:

f un(f ), f un(f 1 ), dom(f 1 ) = im(f ), im(f 1 ) = a.

Daqui obtemos imediatamente inj(f 1 , im(f ), a), sobre(f 1 , im(f ), a), isto e,
bij(f 1 , im(f ), a). A formula bij(f, a, im(f )) e obtida trivialmente.

32
(c) Por (b) inferimos bij(f, a, b) bij(f 1 , b, a), pois im(f ) = b.
(d) Assuma bij(f, a, b), bij(g, b, c). Daqui obtemos:
f un(f, a, b), f un(f 1 , b, a), f un(g, b, c), f un(g 1 , c, b).
Por (a) e pela Proposicao 5.8(d) obtemos f un(g f, a, c), f un((g f )1 , c, a).
Daqui dom(g f ) = a, im(g f ) = c, f un(g f ), f un((g f )1 ), e entao
bij(g f, a, c).
(e) Por (a) temos f un(f f 1 , b, b), f un(f 1 f, a, a). Seja x b; x f f 1 y
implica x f 1 z, z f y para algum z a. Daqui z f x, z f y e entao y = x, isto
e: (f f 1 )(x) = x para todo x b, donde f f 1 = I(b). Seja agora x a;
x f 1 f y implica x f z, z f 1 y para algum z b. Daqui z f 1 x, z f 1 y,
donde x = y, isto e: (f 1 f )(x) = x para todo x a. Portanto f 1 f = I(a).
(f) Por (a), f un(I(b) f, a, b) f un(f I(a), a, b). Seja x a; logo (I(b)
f )(x) = I(b)(f (x)) = f (x), donde I(b) f = f . Por outro lado, (f I(a))(x) =
f (I(a)(x)) = f (x), donde f I(a) = f . 

Proposicao 8.11 (a) O termo ab e legitimado em S.


(b) a = {}.
(c) a 6= a = .
(d) ab = a = b 6= .
(e) a{x} = {{hx, yi} : y a}.
(f ) a b ac bc .

Demonstracao: (a) Claramente ab = {f : f P(b a) f un(f, b, a)},


legitimado portanto por [A2].
(b) a P( a) = P() = {}. Por outro lado f un(, , a) e satisfeita tri-
vialmente, e entao a = {}.
(c) Seja a 6= , e suponha que f un(f, a, ). Seja x a; logo, x dom(f ),
portanto f (x) , uma contradicao.
(d) Assuma f ab . Se b 6= , seja x b; portanto f (x) a, donde a 6= ,
provando assim: ab 6= (b 6= a 6= ). Mas b 6= a 6= equivale
a (a = b 6= ). Reciprocamente, suponha (a = b 6= ), isto e,
a 6= b = . Se a 6= , seja y a. Logo, e imediato que f = {hx, yi : x b}
e legitimado, e f un(f, b, a). Daqui ab 6= . Por outro lado, b = implica que
ab = {} =6 , por (b). Portanto (a = b 6= ) ab 6= .
(e) Seja b = {{hx, yi} : y a}; e claro que b e legitimado, e b a{x} . Seja
f a{x} ; como dom(f ) = {x}, entao f (x) a tal que f = {hx, f (x)i}; daqui
f b.
(f) Imediato das definicoes. 

9 Equipolencia
A nocao de equipolencia foi apontada por Cantor como um conceito fundamen-
tal, pois permite generalizar a nocao de numero natural para cardinais. Essen-
cialmente, dois conjuntos sao equipolentes se existe uma bijecao entre eles, o
que equivale a afirmar que possuem o mesmo cardinal.

33
Definicao 9.1 a b denota (f )bij(f, a, b) (a e b sao equipolentes).

Exemplo 9.2 Sejam a = {1, 2, 3}, b = {3, 4, 5}. Entao

f = {h1, 3i, h2, 4i, h3, 5i}, g = {h1, 5i, h2, 4i, h3, 3i}

sao duas bijecoes entre a e b, cada uma delas garantindo a b. 

A intuicao por tras de a b e que a e b tem o mesmo numero de elementos,


o que pode ser percebido nos exemplos em que a e b sao finitos (todas estas sao
nocoes por enquanto intuitivas, mas serao formalizadas em ZF ). E tambem
claramente intuitivo que um conjunto finito nao pode ser equipolente com um
subconjunto proprio. No caso de a ser infinito, esta propriedade deixa de ser
verdadeira: o conjunto P dos numeros naturais pares e um subconjunto proprio
do conjunto N dos numeros naturais, embora f (n) = 2.n seja uma bijecao entre
N e P. Vemos assim que a parte e menor do que a totalidade nao tem mais
validade no caso infinito.

Proposicao 9.3 (a) S ` a a.


(b) S ` (a b) (b a).
(c) S ` ((a b) (b c)) (a c).

Demonstracao: (a) Pode ser provado facilmente que a relacao I(a) intro-
duzida previamente a Proposicao 6.2 e uma bijecao entre a e a.
(b), (c) Sao consequencias imediatas da Proposicao 8.10(c),(d), respectiva-
mente. 

Os seguintes resultados serao uteis para a definicao da artimetica cardinal.

Proposicao 9.4 As seguintes formulas sao teoremas de S:


(a) ((a b) (c d) (a c = ) (b d = )) (a c b d).
(b) ((a b) (c d)) (a c b d).
(c) a b b a.
(d) a (b c) (a b) c.
(e) (a {x} a) ({x} a a).
(f ) (c)(d)((a c) (b d) (c d = )).

Demonstracao: (a) Sejam f , g tais que bij(f, a, b), bij(g, c, d). Por hipotese
temos que dom(f ) dom(g) = , im(f ) im(g) = , portanto inj(f g), pela
Proposicao 8.7(f). E imediato provar bij(f g, a c, b d).
(b) Sejam f , g tais que bij(f, a, b), bij(g, c, d). E imediato que h (ac)(bd)
dado por
h = {hhx, yi, hf (x), g(y)ii : (x a) (y c)}
e legitimado, estabelecendo uma bijecao h(hx, yi) = hf (x), g(y)i entre a c e
b d.
(c) E imediato que f (hx, yi) = hy, xi e uma bijecao entre a b e b a.
(d) f (hx, hy, zii) = hhx, yi, zi e uma bijecao entre a (b c) e (a b) c.

34
(e) f1 (hy, xi) = y, f2 (hx, yi) = y sao bijecoes.
(f) Sejam c = a {}, d = b {{}}. Logo a c, b d, pelo item (e), e
c d = . 

Os seguintes resultados serao utilizados para a exponenciacao cardinal.


Proposicao 9.5 Em S as seguintes formulas sao teoremas:
(a) ((a b) (c d)) (ac bd ).
(b) (b c = ) (abc ab ac ).
(c) (a b)c ac bc .
(d) (ab )c abc .
Demonstracao: (a) Se ac = entao a = e c 6= , donde b = e d 6= .
Logo bd = e entao ac bd . Suponha agora que ac 6= . Sejam f , g tais que
bij(f, a, b), bij(g, c, d). Dada h ac , entao f h bc , pela Proposicao 8.10(a).
A partir dai, obtemos da mesma maneira f h g 1 bd . Definimos entao
uma funcao f 0 (h) = f h g 1 tal que f 0 : ac bd . Dado h0 bd , entao
h = f 1 h0 g e o unico elemento de ac tal que h0 = f h g 1 = f 0 (h),
pela Proposicao 8.10(e),(f). Portanto f 0 e uma bijecao com inversa f 01 (h0 ) =
f 1 h0 g.
(b) abc = implica a = , b c 6= implica a = e: b 6= ou c 6= implica
ab = ou ac = implica ab ac = . Logo abc ab ac . Suponha agora que
abc 6= . Dado f abc , entao hf |b, f |ci ab ac . Defina
h = {hf, hf |b, f |cii : f abc },
legitimado por [A2]. E claro que h : abc ab ac e uma funcao. Por outro
lado, se hf1 , f2 i ab ac , entao f1 f2 abc tal que h(f1 h2 ) = hf1 , f2 i. Se
h(f ) = hf1 , f2 i, entao f = f1 f2 , donde h1 : ab ac abc e uma funcao.
Daqui infere-se que bij(h, abc , ab ac ).
(c) Se (a b)c = entao a b = e c 6= , donde a = ou b = , e c 6= .
Daqui ac = ou bc = donde ac bc = , e entao (a b)c ac bc . Suponha
agora que (a b)c 6= . Dada f (a b)c , considere
fa = {hx, yi : (z)(hx, hy, zii f )}, fb = {hx, zi : (y)(hx, hy, zii f )}.
Isto e, se 1 aab e 2 bab sao dadas por 1 (hx, yi) = x e 2 (hx, yi) = y
(as projecoes canonicas), entao fa = 1 f e fb = 2 f . E claro que fa ac ,
fb bc , h = {hf, hfa , fb ii : f (a b)c } e legitimado, e h : (a b)c ac bc
e uma funcao. Dada hf1 , f2 i ac bc , entao f = {hx, hf1 (x), f2 (x)ii : x c}
e legitimado, f (a b)c , e h(f ) = hf1 , f2 i. E claro que h(f 0 ) = h(f ) implica
f = f 0 , portanto f un(h1 , ac bc , (a b)c ) e assim bij(h, (a b)c , ac bc ).
(d) abc = implica a = , b c 6= implica a = , b 6= , c 6= implica ab = ,
c 6= implica (ab )c = . Logo (ab )c abc . Suponha agora que abc 6= . Seja
f abc . Para cada y c, seja
fy = {hx, zi : hhx, yi, zi f }.
E claro que fy e legitimado, fy ab , e fy (x) = f (hx, yi). Alem disso, hf =
{hy, fy i : y c} (ab )c , onde hf (y) = fy . Portanto h = {hf, hf i : f abc }

35
e legitimado, e h : abc (ab )c e uma funcao, onde h(f ) = hf . Dada f 0
(ab )c , entao f (hx, yi) = f 0 (y)(x) e uma funcao, f abc , e h(f ) = f 0 . Alem
disso, h(f1 ) = h(f2 ) implica f1 = f2 , portanto f un(h1 , (ab )c , abc ) e assim
bij(h, abc , (ab )c ). 

Observacao 9.6 Neste ponto da nossa exposicao sobre a Teoria Axiomatica


de Conjuntos assumiremos que o leitor ja assimilou o fato de que os enuncia-
dos dos teoremas, assim como as respectivas demonstracoes, sao realizados no
marco formal de ZF (ou de certos fragmentos, tais como S). Para simplificar
a exposicao, a partir daqui os enunciados e demonstracoes dos teoremas de ZF
serao feitos numa linguagem coloquial, omitindo os detalhes mais formais. 

Antecipando a definicao de 2 = {, {}}, provamos o seguinte resultado util,


introduzindo a ideia que os subconjuntos de um conjunto a sao as funcoes
caractersticas sobre a.

Proposicao 9.7 Temos que P(a) 2a .

Demonstracao: Seja b a. Definimos a funcao gb : a2 pela regra: gb (x) =


{} se x b, e gb (x) = se x 6 b. Logo, h(b) = gb define uma funcao
h : P(a)2a . Por outro lado, h(b) = h(c) implica gb = gc , isto e, gb (x) = gb (x)
para todo x a. Portanto: gb (x) = {} sse gc (x) = {}, donde x b sse x c.
Por [A1] obtemos b = c, e entao h e injetora. Por outro lado, se g 2a , considere
b = {x : x a g(x) = {}}. Logo b e legitimado por [A2], e claramente
h(b) = g. Daqui h e sobrejetora, e entao h e uma bijecao entre P(a) e 2a . Assim
P(a) 2a . 

Vamos definir a continuacao o conceito de ser menor ou igual em termos de


tamanho (obviamente estes conceitos sao ainda difusos).

Definicao 9.8 a  b denota (c)(c b a c).

Proposicao 9.9 (a) a b implica a  b.


(b) a b implica a  b.
(c) a  a b.
(d) a  b e b  c implica a  c.

Demonstracao: (a) Temos que a c com c = b b. Logo a  b.


(b) A funcao I(a) produz: a c com c = a b. Logo a  b.
(c) E uma consequencia direta de (b).
(d) Suponha que a a1 (via f ) com a1 b, e b b1 (via g) com b1 c. Logo
g f e uma bijecao de a em ga1 c. Daqui a  c. 

O seguinte resultado, cuja demonstracao e mais complicada, foi conjecturado


por Cantor e provado independientemente por Schroder e Bernstein em 1890.
A seguinte prova e devida a Fraenkel e Whitaker.

36
Teorema 9.10 (Cantor-Schroder-Bernstein)
Se a  b e b  a, entao a b.

Demonstracao: Seja f uma bijecao de a em b1 b, e g uma bijecao de b em


a1 a. Observe que o resultado (a b) estara provado se encontramos um
conjunto d a tal que g|(b f d) e uma bijecao de b f d em a d. Com
efeito, nesse caso teriamos que h = (f |d) (g 1 |(a d)) e uma bijecao entre a
e b, como pode ser facilmente conferido usando a Proposicao 8.7(f). O nosso
objetivo e portanto achar um conjunto d com a propriedade mencionada acima.
Para isso considere o conjunto

u = {c : c a g(b f (c)) a c}.

Dado que c a sse c P(a), entao u e legitimado por [A2].


Fatos: (1) Dados x, y z, entao: x z y sse y z x, e x = z y sse
y = z x. S
(2) Sejam z, y conjuntos. Se x y para todo x z, entao z y.
S c1 c2 a, entaoSa g(b f c1 ) a g(b f c2 ).
(3) Se
(4) u a g(b f u) (onde u e deinido como acima).
Com efeito:
(1) Suponha que x z y. Seja w y; logo, w z, pois y z. Se w x, entao
w z y, isto e, w 6 y, uma contradicao. Portanto w 6 x, donde w z x e
entao y z x. Simetricamente, y z x implica x z y. Para a segunda
parte, suponha que x = z y; logo x z y e entao, pela primeira parte,
y z x. Seja w z x; se w 6 y, entao w z y = x. Mas w 6 x, por
hipotese. Esta contradicao mostra que w y, isto e: z x = y. A prova de
que y = z x implica x = z y e simetrica. S
(2) Assuma que x y paraStodo x z, e seja w z. Logo w x para algum
S z, pela definicao de z. Mas x y, por hipotese; logo w y. Daqui
x
z y.
(3) Se c1 c2 a, entao f c1 f c2 b donde b f (c2 ) b f (c1 ). Por-
tanto
g(b f (c2 )) g(b f (c1 )) a
e entao a g(b f c1 ) a g(b f c2 ).
(4) Seja c u; logo g(b f (c)) a c e entao, por (1),

c a g(b f (c)). ()
S S
Por outro lado u a, por (2). Alem disso, S c u: Scom efeito, se x c
entao (x c) (c u) portanto S x u. De c u a infere-se Sque
a g(b f (c)) a g(b f S u), por (3). Portanto
S c a g(b f u)
para todo c u, por (), donde u a g(b f u), por (2). Isto conclui
a prova dos Fatos. S S
Considere w = a g(b f u). Por (4) temos que u w a, logo
[
w = a g(b f u) a g(b f w),

37
S
por (3). PorS(1) obtemos g(b f w) a w, isto e, w u. Daqui w u,
donde w = u. Isto e,
[ [
a g(b f u) = u.
S S
PelaSsegunda parte de (1) obtemos g(b f u) = a u. Vemos assim que
d = u satisfaz a propriedade requerida. 

Proposicao 9.11 Se a  b e c  d, entao:


(i) Se b d = entao a c  b d;
(ii) a c  b d;
(iii) ac  bd se nao e o caso que: a = b = c = e d 6= .

Demonstracao: Sejam f1 e f2 bijecoes de a em b1 b e de c em d1 d,


respectivamente.
(i) Temos que a c = (a c) c, com (a c) c = . Como b d = , entao
f1 (a c) d1 = . Portanto h = (f1 |(a c)) f2 e uma bijecao entre a c e
f1 (a c) d1 b d.
(ii) Pela Proposicao 9.4(b), a c b1 d1 b d.
(iii) a b1 e c d1 implicam que ac bd11 bd1 , pela Proposicao 9.5(a). A
prova estara terminada se encontrarmos uma injecao de bd1 em bd . O unico
caso em que isto nao e possvel e quando bd = e bd1 6= , e e por isso que
a hipotese adicional (nao e o caso que a = b = c = e d 6= ) foi colocada.
Com efeito, se bd = , entao d 6= e b = , pela Proposicao 8.11(d). Nesse caso
a = . Agora, se d1 = (o que equivale a ter bd1 6= ), entao c = , donde
a = b = c = e d 6= , contrariando a nossa hipotese. Logo d1 6= e entao
bd1 = , pela Proposicao 8.11(d). Ou seja: bd = implica bd1 = , e entao
ac = , donde ac  bd . Suponha finalmente que bd 6= . Os casos bd1 = ou
d = implicam trivialmente que ac  bd . Suponha entao que bd1 6= e d 6= .
Dado que bd 6= e d 6= , entao b 6= . Fixemos x0 b. Para f bd1 e x d,
defina


f (x) se x d1
h(f )(x) = .
x0 se x d d1

Ou seja: h(f ) = f {hx, x0 i : x d d1 }. Claramente h(f ) bd e entao


h : bd1 bd e uma funcao. Observe que f {hx, x0 i : x d d1 } = (pois
hx, yi f implica x d1 implica hx, yi 6 {hx, x0 i : x d d1 }). Daqui
h(f ) = h(g) implica f = g, isto e, h e injetora. Seja g e uma bijecao entre ac
e bd11 (lembre que ac bd11 ). Daqui h g e uma bijecao de ac em h(bd11 ) bd ,
isto e, ac  bd . 

Definicao 9.12 a b denota a  b (b  a).

Proposicao 9.13 (i) Nao e o caso que a a.


(ii) Se a b entao nao e o caso que b a.
(iii) Se a b e b c entao a c.

38
Demonstracao: (i) Pela Definicao 9.12, a a sse a  a e nao e o caso que
a  a, uma contradicao. Logo nao e o caso que a a.
(ii) Assuma a b; isto implica que a  b e nao b  a. Por outro lado, b a
equivale a b  a e nao a  b. Portanto nao podemos ter b a, pois a  b, por
hipotese.
(iii) Assuma a b e b c. Logo a  b e b  c, donde a  c. Se c  a, entao
c  b, contrariando b c. Portanto nao podemos ter c  a, donde a c. 

Estabeleceremos algumas relacoes entre  e .

Proposicao 9.14 (i) Se a  b entao nao b a.


(ii) Se a  b e b c entao a c.
(iii) Se a b e b  c, entao a c.
(iv) a  b sse a b ou a b.

Demonstracao: (i) Pela Definicao 9.12, b a implica que nao a  b. Portanto


a  b implica b 6 a.
(ii) Assuma a  b e b c. Daqui a  b e b  c, donde a  c. Se c  a entao
c  b, contrariando b c. Portanto nao e o caso que c  a, donde a c.
(iii) Assuma a b e b  c. Como antes, obtemos a  c. Se c  a entao b  a,
pois b  c; mas isto contraria a b. Portanto c 6 a, donde a c.
(iv) Assuma que a  b. Se a 6 b entao, pela Definicao 9.12, inferimos que
b  a ou a 6 b. Daqui obtemos que b  a e entao, pelo Teorema 9.10, a b.
provamos desta maneira que a  b implica a b ou a b. Reciprocamente,
suponha que a b. Logo a  b. Se a b, entao a  b, pela Definicao 9.12.
Isto prova que a b ou a b implica a  b. 

Observe que o item (iv) da proposicao acima justifica a denominacao intuitiva


de menor ou igual para a relacao .

Teorema 9.15 (Cantor) a P(a).

Demonstracao: A funcao f (x) = {x} de a em P(a) e injetora, portanto


a  P(a). Suponha que a P(a) via uma funcao g : aP(a). Considere

b = {y : (y a) (y 6 g(y))}.

E claro que b e legitimado por [A2], e b P(a). Como g e sobrejetora, deve


existir algum x a tal que g(x) = b. Portanto:

x g(x) sse x 6 g(x).

Daqui inferimos que nao pode existir uma tal g, isto e, a 6 P(a). Por outro
lado, observe que Teorema 9.10 pode ser refraseado como: a  b implica (a 6 b
implica b 6 a). Logo, de a  P(a) e a 6 P(a) inferimos, pelo Teorema 9.10,
que P(a) 6 a. Pela Definicao 9.12, a P(a). 

39
10 Conjuntos Finitos
Estudaremos nesta secao os conjuntos finitos. A definicao intuitiva de conjunto
finito e a seguinte: um conjunto a e finito se a tem n elementos, para algum
numero natural n. Esta ideia e correta, mas utiliza o conceito de numeros
inteiros. Dedekind propos em 1888 uma definicao nao numerica extremamente
elegante: um conjunto a e finito se a nao e equipolente com nenhum subconjunto
proprio. Em outras palavras, os conjuntos finitos sao exatamente aqueles em
que a parte e menor do que o todo. E evidente que esta definicao pode ser
facilmente introduzida em ZF . O problema que envolve esta definicao e que,
para provar que todo conjunto finito (no sentido de Dedekind) e finito (no
sentido usual), devemos usar o Axioma da Escolha [AE]. Este axioma, a ser
introduzido posteriormente, e o mais questionado dos axiomas da TC, existindo
inclusive TCs que rejeitam este princpio (de fato, na literatura sao diferenciados
os sistemas ZF e ZF C, sendo que ZF C consiste de ZF com o acrescimo do
Axioma da Escolha). Tarski propos em 1924 a seguinte definicao de finitude a
qual, embora seja menos intuitiva, tem a vantagem que nao requer [AE] para
provar a equivalencia com a definicao usual de finitude.

Definicao 10.1 (i) min(x, u) denota x u (y)(y u (y x))


(x e um elemento minimal de u).
(ii) max(x, u) denota x u (y)(y u (x y))
(x e um elemento maximal de u).

Por exemplo, se b = {1, 2, 3, 4} e u P(b), u = {{1, 2, 4}, {2}, {2, 4}, {1, 3}},
entao {1, 2, 4} e {1, 3} sao os elementos maximais de u, enquanto que {2} e
{1, 3} sao os elementos minimais de u. Por outro lado, seja b = N e

Nn = N{1, . . . , n1} = {n, n+1, n+2, . . .} (n N); u = {Nn : n N} P(b).

Dado que Nn Nm se n > m, entao u nao tem elementos minimais. Esta e


a situacao que caracteriza os conjuntos b infinitos, segundo a descoberta de
Tarski.

Definicao 10.2 (Tarski) f in(b) denota a formula


(u)((u P(b) (u 6= )) (z)min(z, u))
(b e finito se toda famlia nao vazia de subconjuntos de b possui um elemento
minimal).

As primeiras propriedades simples da finitude sao as seguintes:

Proposicao 10.3 (i) e finito.


(ii) {x} e finito.
(iii) Se b e finito e c b, entao c e finito.
(iv) Se c e finito entao c b e c b sao finitos.

Demonstracao: (i) Observe que P() = {}, portanto u = {} e a unica


famlia nao vazia de subconjuntos de . E claro que e um elemento minimal
de u, portanto f in().

40
(ii) Temos que P({x}) = {, {x}}. Logo, as unicas famlias nao vazias de
subconjuntos de {x} sao u1 = {}, u2 = {{x}}, e u3 = {, {x}}. E imediato que
todo conjunto da forma {z} tem um elemento minimal (o proprio z), portanto
u1 e u2 possuem elemento minimal. Finalmente, e o elemento minimal de u3 .
Isto prova f in({x}).
(iii) Assuma que b e finito, e seja c b. Seja u P(c), u 6= . Logo u P(b),
u 6= . Dado que f in(b), entao u possui um elemento minimal z. Daqui f in(c).
(iv) Suponha que c e finito. Para todo b temos que c b c e c b c. Pelo
item (iii) obtemos que f in(c b) e f in(c b). 

A seguinte propriedade exige uma demonstracao um pouco mais complicada.


Proposicao 10.4 Se c e b sao finitos, entao c b e finito.
Demonstracao: Assuma f in(c) e f in(b). Seja u P(cb), u 6= . Provaremos
que u tem um elemento minimal. Considere

w = {a : a c (d)((d b) a d u)}.

Temos que w 6= . Com efeito, seja z u. Dado que z = (z c) (z c), entao


a = z c e d = z c satisfazem: a c; d b (pois z c b); a d u. Logo
a e um elemento de w. Daqui w P(c), w 6= . Como c e finito, deve existir
a w minimal. Logo

(1) a w, a c.

Considere agora
w1 = {d : d b (a d u)}.
Por (1) temos que a d u para algum d b, logo d w1 . Portanto w1 P(b),
w1 6= . Como b e finito existe um elemento minimal d w1 , donde

(2) d w1 , d b, a d u.

Provaremos que a d e um elemento minimal de u. Suponha que s u tal que


s a d . Daqui s a a c e s d d b. Dado que s a d , entao

(3) s = s (a d ) = (s a ) (s d ).

Como s u obtemos que s a w, e s a a . Dado que a e minimal,


inferimos s a = a . Por (3) obtemos que a (s d ) u, donde s d w1 .
Logo sd = d , pois d e minimal. Usando (3) vemos que s = a d . Portanto
a d e um elemento minimal de u. Isto prova que c b e finito. 

Corolario 10.5 Se b e finito, entao b {x} e finito.

Podemos definir um princpio de inducao para conjuntos finitos. Antes disso,


provaremos que existe uma caracterizacao da finitude em termos de conjuntos
maximais.

41
Proposicao 10.6 (a) Toda famlia nao vazia de subconjuntos de um conjunto
finito possui um elemento maximal.
(b) Se toda famlia nao vazia de subconjuntos de um conjunto b possui um
elemento maximal, entao b e finito.

Demonstracao: (a) Dado a finito, seja u P(a), u 6= . Considere v =


{a x : x u}. Claro que v e legitimado por [A2], v P(a), e v 6= (pois
u 6= ). Como a e finito, existe a x v minimal, onde x u. Provaremos que
x e maximal em u. Para isto, observe que

(1) para todo w, y a temos que: y w sse a w a y.

A prova e simples, e e deixada como exerccio. Suponha entao que x nao e


maximal em u. Logo, deve existir y u tal que x y. Por (1) obtemos
a y a x, onde a y v. Isto contradiz a minimalidade de a x em v,
portanto x e maximal.
(b) A prova e analoga a do item anterior. Assim, considere u P(b), u 6= .
Logo
v = {b x : x u}
e uma famlia nao vazia de subconjuntos de b. Por hipotese, existe um elemento
maximal b x em v, com x u. Utilizando (1) vemos que x e minimal em u,
portanto b e finito. 

Teorema 10.7 Seja (b) uma formula em que b ocorre livre e nem c nem x
ocorrem livres (outras variaveis podem ocorrer livres em ). Suponha o seguinte:
(i) c e finito;
(ii) ();
(iii) (x)(b)(((x c) (b c) (b)) (b {x})).
Entao (c).

Demonstracao: Considere u = {b : b c (b)}. Logo u P(c) e u 6=


pois u, pela hipotese (ii). Dado que c e finito, por (i), entao existe b u
maximal, pela Proposicao 10.6(a). Provaremos que b = c, e logo (c) como
queriamos. Por reducao ao absurdo, suponha que b 6= c. Como b c, deve
existir x c b. Por (iii), temos que (b {x}) e entao b {x} u, sendo que
b b {x}. Isto contradiz a maximalidade de b em u. Daqui b = c e (c). 

Em particular, obtemos a seguinte formulacao conjuntista do princpio de inducao


para conjuntos finitos:

Teorema 10.8 Suponha o seguinte:


(i) c e finito;
(ii) w;
(iii) (x)(b)(((x c) (b c) b w) b {x} w).
Entao c w.

42
Demonstracao: Basta considerar no Teorema 10.7 a formula (b) como sendo
b w. 

Observe que o Teorema 10.7 e uma consequencia do Teorema 10.8 considerando


w = {b : (b P(c)) (b)} (legitimado por [A2]). Daqui, os Teoremas 10.7
e 10.8 sao equivalentes. De fato, as propriedades (ii) e (iii) do Teorema 10.8
caracterizam os conjuntos finitos, como provaremos a seguir.

Proposicao 10.9 c e finito sse c pertence a todo w satisfazendo as condicoes


(ii) e (iii) do Teorema 10.8.

Demonstracao: Se c e finito, entao a conclusao vale pelo Teorema 10.8. Reci-


procamente, assuma que c w para todo w satisfazendo as condicoes (ii) e (iii)
do Teorema 10.8. Seja w o conjunto de todos os subconjuntos finitos de c (w
e legitimado por [A2]; confira!). Pela Proposicao 10.3(i) temos que w. Se
b w e x c entao b {x} w pelo Corolario 10.5. Portanto w satisfaz as
condicoes (ii) e (iii) do Teorema 10.8, donde c w. Isto e, c e finito. 

Proposicao 10.10 Se c e finito e f e uma funcao com domnio c e imagem b,


entao b e finito.

Demonstracao: Seja w = {a : (a c) f in(f a)}. Provaremos pelo Teo-


rema 10.8 que c w, donde im(f ) = f c resultara ser finito. Observe que
c e f = (finito); entao w. Seja x c e a w; logo a {x} c.
Como f e funcao, entao f {x} = {f (x)}, logo f {x} e finito, pela Propo-
sicao 10.3(ii). Daqui f (a {x}) = f a f {x} e finito, pela Proposicao 10.4,
e entao a {x} w. Pelo Teorema 10.8 temos que c w, portanto im(f ) e
finito. 

Proposicao 10.11 Se c e finito, entao P(c) e finito.

Demonstracao: Considere w = {b : b c f in(P(b))}. Temos que w.


Suponha b w e x c. Se x b entao b {x} w. Se x 6 b, entao b {x} c.
Defina
f = {ha, a {x}i : a P(b)}.
Temos que f e legitimado por [A2], e f e funcao com domnio P(b) (finito). Pela
Proposicao 10.10 temos que a imagem de f e finita. Seja z = P(b {x}) P(b).
Provaremos que im(f ) = z. Com efeito, dado a P(b), temos que a {x} z,
pois x 6 b. Logo im(f ) z. Por outro lado, se d z, entao x d, d {x}
P(b) e d = (d {x}) {x}. Daqui f (d {x}) = d, portanto d im(f ).
Provamos entao que z = im(f ) e finito. Mas P(b {x}) = z P(b), portanto
P(b {x}) e finito, pela Proposicao 10.4. Desta maneira b {x} w, donde
c w, isto e, P(c) e finito. 

S
Proposicao 10.12 Se c e finito e todo x c e finito, entao c e finito

43
S
Demonstracao: Considere w = {b : b c f in( b)} (legitimado por [A2]). S
Claramente w. Seja b w e x c. Logo x e finito, por hipotese, e b e
finito, pela hipotese de inducao (b w). E facil provar que
[ [
(b {x}) = ( b) x
S
(exerccio). Portanto (b {x}) e finito, pela Proposicao 10.4, e entao b {x}
S
w (claramente b {x} c). Pelo Teorema 10.8 obtemos c w, isto e, c e
finito. 

Proposicao 10.13 Se P(c) e finito, entao c e finito.


Demonstracao: Seja b = {{x} : x c} (legitimado por [A2]). Como P(c) e
finito e b P(c), entao a Proposicao 10.3(iii) assegura que b e finito. Como todo
elemento de Sb e da forma {x} (portanto finito)S entao a Proposicao 10.12 S nos
garante que b e finito. Mas e facil provar que b = c. Com efeito: se y b,
entao existe x c tal que y {x}, isto e, y = x dondeS y c. Reciprocamente,
se x c entao x {x} onde {x} b, portanto x b. Logo, c e finito. 

Proposicao 10.14 (i) Se c e finito e c b entao b e finito.


(ii) Se c e finito e b  c entao b e finito.
Demonstracao: (i) Seja f uma bijecao de c em b. Como c e finito entao im(f )
e finito, pela Proposicao 10.10. Mas im(f ) = b.
(ii) Se b  c, entao b a onde a c. Se c e finito, entao a e finito. Logo a b
e a e finito, donde b e finito, pelo item (i). 

A Lei de Tricotomia estabelece: para todo par de conjuntos c,b, temos que vale
uma e so uma das seguinte possibilidades: c b, b c, ou c b. Pode ser
provado que a Tricotomia equivale ao Axioma da Escolha. Porem, se um dos
conjuntos e finito, nao precisamos de [AE] para provar esta propriedade.
Proposicao 10.15 Se c e finito entao c b, b c, ou c b.
Demonstracao: Faremos inducao sobre os subconjuntos de c. Dado b, con-
sidere
w = {a : a c ((a b) (b a) (a b))}.
Claramente w pois, se b = , entao b e, se b 6= , entao b. Seja
a w e x c; queremos provar que a {x} w. O caso em que x a e obvio.
Assumamos que x 6 a. Como a w, entao temos tres casos:
Caso 1: a b. Logo, existe y b im(f ), onde f e uma funcao injetora de a
em b. Portanto, g = f {hx, yi} e uma funcao injetora de a {x} em b, donde
a{x}  b. Daqui inferimos a{x} b ou a{x} b, pela Proposicao 9.14(iv).
Nos dois casos, a {x} w.
Caso 2: b a. Como a  a {x}, entao b a {x}, pela Proposicao 9.14(iii).
Portanto a {x} w.
Caso 3: b a. Como a a{x}, entao a a{x} ou a a{x}. No primeiro
caso b a {x}; no segundo caso b a {x}. Nos dois casos a {x} w.
Em virtude do Teorema 10.8, c w, isto e, c b, b c, ou c b. 

44
Corolario 10.16 Se c e finito e b nao e finito, entao c b.

Demonstracao: Temos que c b, b c ou c b. Os dois ultimos casos


implicam a existencia de uma bijecao f de a c em b. Mas a e finito, portanto
b = im(f ) e finito, o que contradiz a hipotese. Logo, so pode ser c b. 

Provaremos agora que um conjunto finito (no sentido Tarski) e um conjunto


finito (no sentido Dedekind). Como mencionamos anteriormente, toda prova
conhecida da afirmacao recproca precisa do [AE].

Definicao 10.17 Dedf in(c) denota (b)(b c c b)


(c e Dedekind-finito se nao e equipolente com nenhum subconjunto proprio).

Teorema 10.18 Se c e finito, entao c e Dedekind-finito.

Demonstracao: Seja c finito, e suponha que c nao e Dedekind-finito. Logo,


existe b c tal que c b (via uma bijecao f de c em b). Considere

u = {a : a c f a a}.

Como c c e f c = b c, entao c u, logo u 6= . Como c e finito e u P(c)


e nao vazio, existe um elemento minimal d em u. Dado que f d d e d e
minimal, entao

(1) f d 6 u.

Por outro lado f d d implica que existe x (df d). Note que f (f d) f d.
Se f (x) f (f d), entao f (x) = f (y) com y f d. Mas f e injetora,
portanto f (x) = f (y) implica x = y, isto e, x f d, uma contradicao.
Logo f (x) f d f (f d), donde f (f d) f d. Daqui (e do fato de ter
f d d c) inferimos f d u, em contradicao com (1). Portanto a suposicao
inicial e falsa e entao c e Dedekind-finito. 

Proposicao 10.19 Sejam c e b finitos.


(i) c b e finito.
(ii) cb e finito.

Demonstracao: (i) Sejam c e b finitos. Se c = ou b = entao c b = e


finito. Se c e b sao nao vazios, entao
[
cb= a, a = {c {y} : y b}.

Dado que c c {y}, entao todo elemento de a e S finito. Claramente a b,


donde a e finito. Pela Proposicao 10.12 o conjunto a e finito, isto e, c b e
finito.
(ii) Temos que cb P(b c). Como b c e finito, pelo item (i), entao P(b c)
e finito, donde cb e finito. 

45
11 Axiomas Finais de ZF . O Axioma da Escolha
Para definir a nocao de ordinal precisaremos de acrescentar axiomas adicionais
ao sistema S. A seguir completaremos a definicao do sistema ZF , estudando as
consequencias da incorporacao dos mesmos. O primeiro axioma a ser incorpo-
rado ao nosso sistema atual e o Axioma da Infinidade, que assegura a existencia
de un conjunto infinito.

Axioma da Infinidade:

[A6] (w)(( w) (x)(x w x {x} w))

Por definicao temos que w, portanto

{} = {} w;
{, {}} = {} {{}} w;
{, {}, {, {}}} = {, {}} {{, {}}} w; etc.

Dado que {x} e logo x {x} so aparece num nvel posterior ao nvel em que foi
criado x, entao [A6] exige a existencia de uma sequencia crescente infinita de
nveis na estrutura cumulativa de tipos, sendo que w aparece so depois de todos
esses nveis. Este axioma e a primeira tentativa de afirmar que os nveis nao
tem fim. Portanto, esta afirmacao pode ser aceita por alguns matematicos e re-
jeitada por outros. E fundamental perceber que este axioma separa claramente
a Aritmetica (que pode ser realizada sem assumir a existencia de sequencias
infinitas) de outras disciplinas da Matematica avanzada, tais como Analise, que
fazem um uso essencial do Axioma da Infinidade.
A seguir introduziremos um axioma importantssimo, o Axioma de Substi-
tuicao. Nao so obteremos o Axioma de Separacao como um corolario, senao
que poderemos assegurar a existencia de ordinais e cardinais transfinitos.

Axioma de Substituicao: Seja (x, y) uma formula com x e y livres, mas


onde b nao ocorre livre (outras variaveis podem ocorrer livres em ). Seja z uma
variavel nova, e F U N a formula (x)(y)(z)((x, y) (x, z) (y = z)).

[A7] F U N (b)(y)(y b (x)(x a (x, y)))

A hipotese F U N indica que define uma funcao parcial, isto e: para cada x,
existe no maximo um y tal que (x, y). Assumindo F U N , entao [A7] assegura
que o termo s dado por

s = {y : (x)((x a) (x, y))}

e legitimado; ele representa a imagem de a sob a funcao parcial definida por


(x, y); se o termo r dado por

r = {hx, yi : (x, y)}

46
e legitimado, entao s e r(a) = im(r|a). Dado que r nao e necessariamente legi-
timado, devemos esperar que [A7] acrescente novos conjuntos. Observe que [A7]
e um esquema de axioma, definindo um axioma particular para cada formula
. Ele afirma que, dado a, podemos substituir os seus elementos por outros
conjuntos, desde que coloquemos no maximo um conjunto para cada elemento
de a.
Em termos da teoria cumulativa de tipos, isto afirma que os nveis nao tem
fim. De fato, e a afirmacao mais forte em ZF nessa direcao. Assim, [A7] afirma
que toda colecao de nveis colocados em correspondencia com os elementos de
um conjunto pode ser considerada como completada, portanto existem nveis
superiores. Mais precisamente, seja f (x) o nvel em que aparece y tal que
(x, y) (se nao existir y entao f (x) pode ser tomado como o primeiro nvel).
Logo, a colecao de nveis f (x) esta em correspondencia com os elementos de a,
portanto existe um nvel em que todos os y tais que (x, y) para algum x a
ja foram criados. Nesse nvel pode ser criado b = {y : (x)((x a) (x, y))}.
Observe que [A7] fornece um axioma para cada formula apropriada; isto
limita o poder de [A7], da mesma maneira que acontece con [A2]. Por outro
lado, [A2] e um caso particular de [A7]:

Proposicao 11.1 Seja (x) uma formula em que x ocorre livre mas b nao
ocorre livre. Logo,

[A7] ` (b)(x)(x b ((x a) (x))).

Em outras palavras, [A2] e implicado por [A7].

Demonstracao: Seja y uma variavel nova (isto e, y nao ocorre em (x) e


y 6= b). Considere (x, y) dada por

(x, y) def (x) (x = y).

Pelas regras da igualdade, provamos a formula

() (x)((x a) (x, y)) (y a) (y).

Por outro lado, e facil provar que (x, y) e (x, z) implica y = z. Logo F U N
donde, por [A7], inferimos que (b)(y)(y b (x)((x a) (x, y)). Por
() obtemos
(b)(y)(y b ((y a) (y))),
isto e, [A2]. 

Provaremos agora que o axioma [PR] pode ser deduzido dos axiomas [A3] e
[A7], conforme anunciado na Secao 2.

Proposicao 11.2 [A3], [A7] ` [PR].

Demonstracao: Primeiro obtemos o seguinte:

47
Fato 1: [A7] ` (c)(u)(u 6 c).
Com efeito, basta tomar c (x, y) def (x 6= x) (x = y) em [A7], e a uma
variavel qualquer (exerccio).
Fato 2: [A3], [A7] ` (d)(x)(x d (w)(w x (u)(u 6 w)).
Com efeito, basta tomar c como no Fato 1 e depois aplicar [A3] no conjunto c,
obtendo o conjunto d com as propriedades requeridas (exerccio).
Fato 3: Dados a e b considere a formula

a,b (x, y) def ((w)(w 6 x) y = a)


((w)(w x) (w)(w x (u)(u 6 w)) y = b).

Entao F U Na,b (exerccio).


Fato 4: Usando apenas logica classica temos que

(x)((w)(w x (u)(u 6 w)) a,b (x, y)) (y = a y = b)

(exerccio).

Logo, pelo Fato 3 e por [A7] temos que

(z)(y)(y z (x)(x d a,b (x, y))).

Finalmente, tomando d como no Fato 2 obtemos, pelo Fato 4, que

(z)(y)(y z (y = a y = b)).

Definicao 11.3 O sistema ZF da Teoria de Conjuntos consiste do axioma


[A1] junto com os axiomas [A3]-[A7]. 1

Uma vez que introduzimos a totalidade dos axiomas de TC, discutiremos o Ax-
ioma da Escolha ([AE]), que originou uma das principais discussoes dentro da
Teoria de Conjuntos. O sistema obtido de ZF acrescentando [AE] e usualmente
denotado por ZFC. Uma possvel formulacao de [AE] e a seguinte:

Axioma da Escolha:

[AE] ((x)(x z x 6= ) (x)(y)(((x, y z) (x 6= y))


x y = )) (u)(x)(v)(x z u x = {v})

Isto e: dado um conjunto z cujos elementos sao nao vazios e dois a dois disjuntos,
entao existe um conjunto de escolhas u, que tem exatamente um membro em
comum com cada elemento de z. Observe que, embora u escolha um e-
lemento de cada membro de z, o axioma nada diz respeito a existencia de um
procedimento efetivo para realizar esta escolha.
1
Dado que, pela Proposicao 11.1 o axioma [A2] e derivavel em ZF , continuaremos a utiliza-
lo no resto do texto, embora nao seja parte da axiomatica de ZF .

48
O carater altamente nao construtivo deste axioma foi alvo de crticas por
parte das escolas matematicas construtivistas. Porem, a quantidade de aplicacoes
fundamentais de [AE] dentro de TC como na Matematica em geral fazem de
[AE] um axioma praticamente imprescindvel. Em TC e necessario [AE], por
exemplo, para obter a Lei de Tricotomia para conjuntos. Existe uma serie de
importantes resultados matematicos relacionados com o Axioma de Escolha,
por exemplo: o Teorema de Hahn-Banach, o Teorema de Ideais Primos para
Algebras de Boole, a existencia de bases em espacos vetoriais, e o Teorema de
Tychonoff (o produto de espacos topologicos compactos e compacto). Estes
dois ultimos resultados sao de fato equivalentes a [AE], assim como os seguintes
Princpios:
Princpio da Boa Ordem: Todo conjunto admite uma boa ordem.
Lema de Zorn: Seja A um conjunto ordenado tal que todo subconjunto total-
mente ordenado (ou cadeia) B tem um limitante superior. Entao, A tem um
elemento maximal.
A nao-construtividade embutida em [AE] pode ser entendida atraves do
seguinte exemplo intuitivo, devido a Bertrand Russell:

Exemplo 11.4 Considere uma colecao z de pares de sapatos identicos. Nesse


caso, e possvel escolher sem problemas um unico elemento (sapato) de cada par
de sapatos de z, por exemplo atraves do algoritmo pegue apenas os sapatos
que correspondam ao pe direito. Por outro lado, se agora consideramos uma
colecao z 0 de pares de meias identicas (nao existindo nenhuma diferenca entre
a meia do pe direito e a do pe esquerdo), nao existe um metodo imaginavel
que permita escolher apenas uma meia de cada par de z 0 . Porem, o Axioma da
Escolha garante que e possvel fazer isto! 

12 Introducao aos Ordinais


Embora os axiomas de ZF nao mencionam explicitamente a existencia dos nveis
da teoria cumulativa de tipos, eles sao fortes o suficiente como para permitir
a sua definicao. Os ordinais permitirao indexar os nveis (alem de ter muitas
outras aplicacoes).

Definicao 12.1 (von Neumann) transi(x) denota


(y)(z)((y z) (z x) (y x))
(x e transitivo);
conec(x) denota (y)(z)(y, z x ((y z) (z y) (y = z)))
(x e conectado com relacao a );
ord(x) denota transi(x) conec(x)
(x e um ordinal);
x < y denota ord(x) ord(y) x y
(x e um ordinal menor que y);
x y denota ord(x) ord(y) (x < y x = y).

Teorema 12.2 Utilizando os axiomas [A1], [A2], [A4], [A5], [PR] provamos o
seguinte:

49
(i) Se x e ordinal e y x, entao y e ordinal.
(ii) e ordinal.
(iii) Se x e ordinal, entao x {x} e ordinal.

Demonstracao: (i) Fixe um ordinal x, e y x. Sejam u, v y. Como x e


transitivo e y x, entao u, v x. Como x e conectado com relacao a , entao
u v ou v u ou u = v. Daqui y e conectado. Para provar que y e transitivo
devemos utilizar o axioma da regularidade. Sejam entao u z, z y. Como
y x e x e transitivo, obtemos que u x. Logo, de conec(x) deduzimos: y u
ou y = u ou u y. Queremos eliminar as duas primeiras possibilidades.
Caso 1: y u. Temos entao: u z, z y, y u. Considere a = {u, y, z}
Logo:
y u a, z y a, u z a.
Logo, a 6= nao tem nenhum elemento disjunto com a, contrariando o axioma
da regularidade. Portanto, nao podemos ter y u.
Caso 2: y = u. Temos entao: u z, z y, y = u; isto e, y z, z y. Mas, na
Proposicao 3.6(2) provamos que [A5] implica: (a b b a). Portanto nao
podemos ter y = u.
Assim u y, donde transi(y). Daqui y e ordinal.
(ii) Todas as hipoteses sao falsas, logo e trivialmente um ordinal.
(iii) Seja y = x {x}. Observe que

() z y sse z x ou z = x.

Para provar que y e transitivo sejam u z e z y; queremos obter u y. Por


() temos dois casos a partir da hipotese z y:
Caso 1: z x. Logo u z, z x implica u x, pois transi(x). Daqui u y,
por ().
Caso 2: z = x. Logo u z, z = x implica u x. Portanto u y, por ().
Provamos assim transi(y). Para provar que y e conectado considere u y,
z y; queremos obter z u ou u z ou z = u. Por () inferimos a partir de
u, z y:
Caso 1: u x.
Caso 1.1: z x. Daqui u x, z x implica z u ou u z ou z = u, pois
conec(x).
Caso 1.2: z = x. Logo u x, x = z implica u z, donde z u ou u z ou
z = u.
Caso 2: u = x.
Caso 2.1: z x. Daqui z x, x = u implica z u, logo z u ou u z ou
z = u.
Caso 2.2: z = x. Logo u = x, x = z implica u = z, portanto z u ou u z
ou z = u.
Provamos entao que y e conectado, sendo portanto um ordinal. 

Definicao 12.3 Introduzimos a notacao seguinte:


0 denota ;

50
1 denota {};
2 denota {, {}};
3 denota {, {}, {, {}}};
em geral, n denota {0, 1, 2, ..., n 1};
x + 1 denota x {x} (o sucessor de x).

Podemos provar agora a lei de tricotomia para ordinais (nao confundir com a lei
de tricotomia enunciada anteriormente!). Esta propriedade e de fundamental
importancia.

Teorema 12.4 Se x e y sao ordinais, entao: x y ou y x ou x = y.

Demonstracao: Provaremos primeiro o seguinte


Fato: Se x e y sao ordinais e x y, entao x y.
Com efeito: Seja z = y x. Logo z 6= , portanto existe u z tal que u z = ,
pelo axioma da regularidade. Logo u y, u 6 x. Como u z = , entao v u
implica v 6 z, isto e, v 6 y ou v x ou, equivalentemente, (v y v x). Ou
seja: v u implica (v y v x). Como y e transitivo e u y, entao v u
implica v y. Como tambem temos (v y v x), entao deduzimos v x.
Ou seja: v u implica v x, donde u x. Por outro lado, seja w x; como
x y, entao w y. Dado que u y e y e conectado, entao u = w ou u w
ou w u. Se u = w, entao de w x inferimos u x, contradicao (u y x).
Se u w entao: u w, w x implica u x (pois x e transitivo), contradicao.
Portanto so podemos ter w u. Assim: w x implica w u, donde x u.
Desta maneira u = x. Como u y, entao x y, provando o Fato.
Sejam entao x e y ordinais. E muito simples provar que z = x y e tambem
um ordinal (exerccio). Se z 6= x e z 6= y, entao z x e z y, donde z x e
z y, pelo Fato. Daqui z x y, isto e, z z, contradicao. Logo z = x ou
z = y. Se z = x, entao x y. Se x = y, vale a tricotomia. Se x y, entao
x y, pelo Fato, donde vale a tricotomia. O caso z = y e similar. 

Corolario 12.5 (Paradoxo de Burali-Forti) O termo {x : ord(x)} nao


e legitimado.

Demonstracao: Suponha que definimos On = {x : ord(x)}. Provaremos


que On e um ordinal, portanto On On, uma contradicao. Com efeito, pelo
Teorema 12.2(i) obtemos que On e transitivo. Pelo Teorema 12.4 inferimos que
On e conectado. Daqui ord(On). 

Desde o ponto de vista da teoria cumulativa de tipos, esperamos ter so um


ordinal em cada nvel (isto sera provado depois). Logo, On nao poderia ser
jamais completado.

Definicao 12.6 Usaremos as letras gregas , , , etc., eventualmente com


subndices (mas nao , , as quais sao reservadas para denotar formulas),
como variaveis para indicar ordinais. Alem disso,
()() denotara ()(ord() ());
()() denotara ()(ord() ()), e

51
{ : ()} denotara { : ord() ()}.
A definicao da quantificacao () e () e correta, pois existem ordinais.

Definicao 12.7 suc(x) denota ord(x) ((y)(x = y + 1) (x = 0))


(x e zero ou um ordinal sucessor);
lim(x) denota ord(x) suc(x)
(x e um ordinal limite);
int(x) denota suc(x) (y)(y < x suc(y))
(x e um enteiro nao negativo).

Se x e um ordinal sucessor da forma x = y + 1, entao y x, pela definicao


de y + 1. Pelo Teorema 12.2(i), temos que y e tambem um ordinal. Portanto
y + 1 e um ordinal sse y e um ordinal. Nao existe razao para considerar 0 como
sucessor ou limite, mas ele e incluido no conjunto dos sucessores. Observe que
vale a seguinte propriedade:

[LIM] lim(x) ord(x) (x 6= 0) (y)(y x y + 1 x).

Com efeito, lim(x) implica ord(x) e ord(x) ((y)(x = y + 1) x 6= 0). Logo


ord(x), x 6= 0 e (y)(x 6= y + 1). Seja y x; como ord(y), entao ord(y + 1)
donde, por tricotomia, y + 1 < x ou y + 1 = x ou x < y + 1. Nao podemos ter
x = y+1. Por outro lado, x < y+1 implica: x = y (portanto x x, contradicao)
ou x y (portanto x y e y x, contradicao). Logo y +1 < x, isto e, y +1 x.
Reciprocamente, suponha ord(x), x 6= 0, (y)(y x y + 1 x). Se x = y + 1,
entao y x, donde y + 1 x, isto e, x x, contradicao. Logo x 6= y + 1 para
todo y donde x e ordinal limite.
Provaremos que um princpio fraco de inducao matematica para os inteiros e
valido no sistema S (lembre da Definicao 3.5).
Teorema 12.8 (Inducao Matematica) Para cada formula da linguagem
de ZF, temos que:

S ` ((0) ()(() ( + 1))) ()(int() ()).

Demonstracao: Suponhamos que a conclusao do princpio de inducao e falsa;


provaremos que a hipotese e falsa. Assim, assumamos que existe um ordinal
tal que int() (). Observe que, dados ordinais e , entao sse
= ou sse + 1. Portanto, por [A2] podemos criar o conjunto

y = { : ()} = { : ( + 1) ()}.

Por outro lado y 6= , pois y. Pelo axioma da regularidade existe 0 y tal


que 0 y = . Dado que 0 e int(), entao suc(0 ). Com efeito: 0 =
implica int(0 ), logo suc(0 ). Por outro lado, 0 < implica suc(0 ), pela
definicao de int(). Dado que suc(0 ), entao
Caso 1: 0 = 0. Daqui (0), pois 0 y.
Caso 2: 0 = 1 +1 para algum 1 (que resulta ser um ordinal, pela observacao
apos a Definicao 12.7). Como 1 0 e 0 y = , entao 1 6 y. Daqui (1 ),
pois 1 . Isto e: (1 ) (1 + 1).

52
Vemos que cualquer dos casos acima contraria a hipotese do princpio de inducao.


O princpio de inducao 12.8 e mais fraco do que a inducao utilizada frequente-


mente em matematicas, pois 12.8 e restrito as propriedades dos inteiros que po-
dem ser expressadas mediante formulas da linguagem. O conjunto das formulas
e enumeravel, enquanto que o conjunto das propriedades dos inteiros positivos
e o conjunto P(N), que nao e enumeravel.
Queremos provar que a colecao dos inteiros e um conjunto. Isto sera provado
a partir do axioma do infinito (de fato, o seguinte teorema e equivalente a [A6]).

Teorema 12.9 Seja Z o sistema composto dos axiomas [A1]-[A6] mais [PR],
isto e, Z e obtido de ZF substituindo o axioma de substituicao [A7] pelos a-
xiomas [A2] e [PR]. Logo

Z ` (y)(z)(z y int(z)).

Demonstracao: Pelo axioma [A6] existe um conjunto w tal que 0 w e se


x w entao x + 1 w. Considere a formula (x) dada por x w. Por inducao
matematica obtemos:
(x)(int(x) x w).
Portanto inferimos que int(x) sse (x w) int(x) para todo x. Por otro lado,
de [A2] deduzimos

(y)(x)(x y ((x w) int(x))).

Isto significa que existe y = {x : (x w) int(x)} = {x : int(x)}. 

Definicao 12.10 denota {z : int(z)}


(o conjunto dos inteiros nao negativos).

Teorema 12.11 (i) Z ` ord().


(ii) Z ` lim().

Demonstracao: (i) Considere y x e x . Logo y x e int(x); daqui y


e um ordinal (pois y x e x e um ordinal), e y < x. Logo suc(y). Se z y,
entao z x, logo suc(z). Daqui int(y), isto e, y . Isto prova que e
transitivo. Sejam agora x, y . Logo ord(x) e ord(y). Pela lei de tricotomia
para ordinais obtemos x y ou y x ou x = y. Isto prova que e conectado
para .
(ii) Observe que 6= 0, pois 0 . Alem disso e um ordinal, por (i).
Claramente
(y)(int(y) int(y + 1)),
isto e, (y)(y (y + 1 )). Pela propriedade [LIM] obtemos que e um
ordinal limite. 

53
13 Inducao e Recursao Transfinita
Introduziremos a seguir a importante nocao de fecho transitivo de um conjunto,
que sera utilizada para provar que a relacao de pertinencia e bem fundada.
O fato de ser bem fundada permitira a introducao de definicoes e demon-
stracoes por recursao transfinita em ZF, uma poderosa ferramenta na teoria de
conjuntos.

Definicao 13.1 F T (x) denota {y : (z)(x z transi(z) y z)}


(F T (x) e o fecho transitivo de x).

Por definicao, F T (x) e o menor conjunto transitivo z tal que x z, isto e, F T (x)
e a intersecao de todos os conjuntos transitivos z tais que x z. Ele e formado
intuitivamente da maneira seguinte: dado x, procuramos nos nveis anteriores
os elementos y de x, e recomecamos o processo, isto e, procuramos os elementos
z de y, e depois os elementos w de z etc., obtendo o historico de x atraves
destas componentes. E claro que precisamos provar a existencia de F T (x)
para todo x. Ela e garantida pelos axiomas da infinidade e da substituicao.
Enunciamos este resultado, omitindo a demonstracao.

Teorema 13.2 Em ZF o termo F T (x) e legitimado, isto e:

Z ` (x)(w)(y)(y w (z)(x z transi(z) y z)).

Podemos agora definir a classe de formulas a partir das quais podemos fazer
inducao, isto e, as formulas (x, y) que expressam relacoes bem fundadas.

Definicao 13.3 Seja (x, y) uma formula onde x e y ocorrem livres. BF ()


denota
(x)((x 6= (v)(v x (z)(z x (z, v))))
(u)(x u (w, y)(y u (w, y) w u)))
(a relacao (x, y) e bem fundada).

A primeira parte da formula anterior afirma que todo conjunto nao vazio deve
ter um elemento -minimal; intuitivamente, nao temos -ciclos nem -cadeias
descendentes infinitas, isto e: nao podemos ter (x, x1 ), (x1 , x2 ), ..., (xn , x)
nem
(x1 , x), (x2 , x1 ), (x3 , x2 ), . . . , (xn , xn1 ), . . . .
A segunda parte afirma que todo conjunto pode ser estendido a um conjunto
u que e -fechado, isto e: todo conjunto -relacionado com um membro de u
deve pertencer a u.

Proposicao 13.4 Em ZF provamos que as relacoes x < y e x y sao bem


fundadas.

Demonstracao: Nas duas relacoes, a primeira parte e uma consequencia direta


do axioma da regularidade. A segunda parte segue do Teorema 13.2, tomando
u como sendo F T (x). Com efeito: seja y x; se x z e z e transitivo, entao
y z. Logo y F T (x), donde x F T (x). Se y F T (x) e w y, considere z

54
transitivo tal que x z. Logo y z, donde w z, pois z e transitivo. Daqui
w F T (x), portanto F T (x) satisfaz as condicoes requeridas. 

Podemos agora legitimar a nocao de prova por -inducao transfinita, assumindo


que e bem fundada. Assim, para provar que (y)(y) basta assumir a ver-
dade de (z) para todos os -antecessores z de y. A hipotese de inducao e
(z)((z, y) (z)).

Teorema 13.5 (Inducao Transfinita) Em S provamos o seguinte:

[BF () (y)((z)((z, y) (z)) (y))] (y)(y).

Demonstracao: Suponha que (y)(y) e falsa e BF () e verdadeira. Encon-


traremos v0 tal que

(1) (z)((z, v0 ) (z)) (v0 ),

contrariando a hipotese do teorema. Seja entao v tal que (v); ele existe,
pela suposicao (y)(y). Como BF (), podemos estender {v} a um conjunto
-fechado u, isto e:

(2) (v u) (z u (w, z) w u).

Considere u0 = {z : (z u) (z)}, legitimado por [A2]. Como v u, entao


v u0 , portanto u0 6= . Pela primeira parte de BF () existe um elemento
v0 de u0 que e -minimal. Logo, fixe z tal que (z, v0 ); isto implica z 6 u0 ,
pois v0 e -minimal em u0 , portanto z 6 u ou (z). Dado que v0 u (pois
v0 u0 ) e (z, v0 ), entao z u, por (2). Daqui (z), provando desta maneira:
(z, v0 ) (z) para todo z. Como v0 u0 , entao (v0 ). Desta maneira
provamos (1) como queriamos. 

As provas por inducao transfinita sao importantes, mas sao mais uteis quando
combinadas com a definicao por recursao transfinita. Suponha que queremos
definir a soma de ordinais de maneira a ter

+ 0 = ;
() + ( + S
1) = ( + ) + 1;
+ = < ( + ) se e um ordinal limite.
S
Embora +1 e sejam operacoes conhecidas, vemos que a segunda e a terceira
clausula de () utilizam + nos dois lados da definicao. Usualmente este tipo de
definicao circular seria rejeitada. Porem, devemos observar que os ordinais do
lado direito utilizam + em ordinais menores aos do lado esquerdo (o membro
a ser definido). Podemos pensar que, fixado , definimos sucessivamente +
para ordinais cada vez maiores, utilizando os valores + com < . O
Teorema da Definicao por Recursao Transfinita estabelece que, partindo de uma
relacao (x, y) bem fundada, entao podem ser realizadas este tipo de definicoes

55
que utilizam os -antecessores, e a definicao e unica. Ou seja, podemos definir
novas operacoes por inducao sobre uma relacao bem fundada. Observe que
a definicao (), embora consista de varias clausulas, elas podem ser juntadas
numa so clausula mediante disjuncao de conjuncoes. Assim uma definicao pode
ser pensada como sendo introduzida por uma formula. Isto coincide com a ideia

de definicao de funcoes por recursao: se h( x ) e g(x, y; x ) sao funcoes recursi-
vas de numeros naturais, entao podemos definir por recursao sobre x a funcao

f (x; x ) (onde x consiste de parametros) da maneira seguinte:

f (0; x ) = h( x );

f (x + 1; x ) = g(f (x; x ), x; x ).

Desta maneira f e definida a partir de g, que utiliza o valor anterior de f .


Definiremos um analogo (mais geral) para TC, onde agora g utilizara todos os
valores anteriores de f .
Definicao 13.6 Seja G(x1 , ..., xn , y) uma formula com ao menos x1 ,..., xn , y
livres. Definimos
G0 hx1 , ..., xn i = {z : (y)((w)(G(x1 , ..., xn , w) y = w) (z y))}.
Isto e, G0 hx1 , ..., xn i e o unico y tal que G(x1 , ..., xn , y) (se existir), ou em caso
contrario. Logo G0 hx1 , ..., xn i e sempre um conjunto.
Definicao 13.7 Seja F (x1 , ..., xn , y) uma formula com ao menos x1 , ..., xn , y
livres, e (u, v) com u, v livres. Definimos
AN T (F, x1 , ..., xn , (u, v)) = {hhz, x2 , x3 , ..., xn i, F 0 hz, x2 , ..., xn ii : (z, x1 )}.
O termo AN T (F, x1 , ..., xn , (u, v)) define o conjunto dos valores de F previos
a x1 (a variavel de recursao).
Lema 13.8 Se (u, v) e bem fundada, entao AN T (F, x1 , ..., xn , (u, v)) e le-
gitimado em ZF.
Estabeleceremos a seguir o teorema de recursao transfinita. A partir de agora
G(x, x1 , ...., xn , y) e uma formula definindo uma operacao que e iterada na
variavel x1 , com x2 ,..., xn como parametros para definir uma operacao y =
F 0 hx1 , ...., xn i. Em AN T (F, x1 , ..., xn , (u, v)) estao disponveis os valores an-
teriores de F , e permanecem no primeiro lugar de G na iteracao, da mesma
maneira que e feito na definicao da funcao recursiva

f (x + 1; x ) = g(f (x; x ), x; x ).

Teorema 13.9 (Recursao Transfinita) Sejam G(x, x1 , ..., xn , y) e (u, v)


formulas. Entao existe uma formula F (x1 , ..., xn , y) tal que

BF ((u, v)) (x1 )[(!y)F (x1 , ..., xn , y) (y)(F (x1 , ..., xn , y)


y = G0 hAN T (F, x1 , ..., xn , (u, v)), x1 , x2 , ..., xn i)]

e demonstravel em ZF.

56
Veremos a seguir dois exemplos de aplicacao do princpio de definicao por re-
cursao transfinita: a funcao de posto e a hierarquia cumulativa de von Neumann.
S
Definicao 13.10 (x) = {(y) + 1 : y x}
((x) e o posto de x).

Proposicao 13.11 Em ZF provamos o seguinte:


(i) (x) e definido para todo conjunto x.
(ii) (x) e um ordinal para todo conjunto x.
(iii) Se e um ordinal, entao () = .
(iv) se x y, entao (x) < (y).

Demonstracao: (i) Usaremos o principio de recursao transfinita. Para isto,


considere (u, v) como sendo u v; logo, a relacao (isto e, a relacao ) e bem
fundada, pela Proposicao 13.4. Seja G(X, x1 , y) a formula
[
G(X, x1 , y) def (x1 = x1 ) (y = {w + 1 : w im(X)}).

Logo, a operacao F (x, y) definida no Teorema 13.9 satisfaz:


[
F 0 hxi = G0 hAN T (F, x, ), xi = {w + 1 : w im(AN T (F, x, ))}.

Por outro lado:


AN T (F, x, ) = {hz, F 0 hzii : z x}
donde im(AN T (F, x, )) = {F 0 hzi : z x}. Daqui
[
F 0 hxi = {F 0 hzi + 1 : z x}.

Isto significa que a operacao F e a funcao posto.


(ii) Considere a formula (x) dada por ord((x)). Provaremos por inducao
transfinita sobre a relacao que (x) e verdadeira para todo x. Assim fixemos
y, e suponhamos que
(z)(z y ord((z))
(a hipotese de inducao) e verdadeira. Queremos provar que (y) eSum ordinal.
Se z y, entao ord((z)), logo ord((z) + 1). Alem disso, (y) = {(z) + 1 :
z y}, logo x (y) sse existe z y tal que x (z) + 1. Sejam entao x (y)
e w x; logo w x e x (z) + 1 para algum z y, e (z) + 1 e um ordinal
(portanto e transitivo). Daqui w (z) + 1 e entao w (y). Logo, (y) e
transitivo. Se u, v (y), entao u (z) + 1 e v (z 0 ) + 1 para z, z 0 y.
Dado que (z) + 1 e (z 0 ) + 1 sao ordinais, entao u e v sao ordinais, portanto
u v ou v u ou u = v, pela lei de tricotomia para ordinais. Daqui (y) e
conectado, sendo portanto um ordinal.
(iii) Considere (x) a formula (ord(x) x = (x)). Provaremos por inducao
transfinita sobre a relacao bem fundada < que (x) vale para todo x. As-
sumamos entao, fixado y, a hipotese de inducao (z)(z < y (z)), isto e,

(z)[(ord(z) ord(y) z y) (ord(z) z = (z))]

57
ou, equivalentemente,

() (z)[(ord(y) ord(z) z y) z = (z)].

Queremos provar que (ord(y) y = (y)). Suponha entao que y e um ordinal.


Logo, se z y entao z e um ordinal, e vale a hipotese de () para z, portanto
z = (z). Daqui
[ [
(y) = {(z) + 1 : z y} = {z + 1 : z y}.

Seja x (y); logo x z + 1 para algum z y. Temos dois casos:


(a) x z. Logo x z, z y implica x y (pois y e um ordinal portanto e
transitivo).
(b) x = z. Logo x = z, z y implica x y.
Vemos que em todos os casos x (y) implica x y, donde (y) y. Suponha
agora que x y; logo x x + 1 tal que x y, donde x (y). Isto e, y (y),
portanto y = (y) como queriamos provar. S
(iv) Seja x y. Como (x) (x) + 1 e x y, entao (x) {(z) + 1 : z
y} = (y). Dado que (x) e (y) sao ordinais, pelo item (ii), entao inferimos
que (x) < (y). 

Definicao 13.12 A Hierarchia Cumulativa de von Neumann e definida da


maneira seguinte:
[ [
V = P(V ) = {P(V ) : < }.
<

Exemplo 13.13 Aplicando a definicao acima temos que


S S
V0 = S{P(V ) : < 0} = S = ; S S
V1 = S{P(V ) : < 1} = S{P(V0 )} = {P()} S = {{}} = {};
V2 = {P(V ) : < 2} = {P(V0 ), P(V1 )} = {{}, {, {}}}
=S{, {}}; S
V3 = S{P(V ) : < 3} = {P(V0 ), P(V1 ), P(V2 )}
= {{}, {, {}}, {, {}, {{}}, {, {}}}} = {, {}, {{}}, {, {}}}.


Teorema 13.14 Em ZF provamos o seguinte:


(i) V e definido para todos os ordinais .
(ii) Seja um ordinal. Logo V e transitivo,
S e V+1 = P(V ).
(iii) Seja um ordinal limite. Logo V = < V .
(iv) Seja um ordinal. Entao x V sse (x) < .
(v) (x)()(x V ) (aqui, denota um ordinal).

Demonstracao: (i) Aplicaremos o principio de recursao transfinita 13.9. Con-


sidere a formula
[
G(X, x1 , y) def (x1 = x1 ) (y = {P(w) : w im(X)}).

58
A operacao F (x, y) definida por recursao transfinita sobre a partir de G
satisfaz o seguinte:
[
F 0 hxi = {P(w) : w im(AN T (F, x, ))}.

Mas im(AN T (F, x, )) = {F 0 hyi : y x}, logo


[
F 0 hxi = {P(F 0 hyi) : y x}.

Se e um ordinal, entao < sse , logo F 0 hi representa V sobre os


ordinais , isto e, V esta legitimado para todo ordinal .
(ii) Faremos inducao transfinita sobre a relacao < e a seguinte formula:

(x) def ord(x) (transi(Vx ) Vx+1 P(Vx )).

Fixado um ordinal y, assuma que a hipotese de inducao e verdadeira, isto e,


(z)(z < y (z)) ou, equivalentemente,

() (z)(z y (transi(Vz ) Vz+1 P(Vz )))

(pois, se y e ordinal, entao z < y sse z y). Queremos provar que Vy e transi-
tivo e Vy+1 P(Vy ). Pela definicao de Vy temos que

() x Vy sse x P(Vz ) para algum z y sse x Vz para algum z y.

Fato 1: Seja u transitivo e w u. Logo w u.


Com efeito, se z w, entao: z w, w u, transi(u) implica z u, isto e:
z w implica z u. Daqui w u, provando o Fato 1.
Seja entao x Vy e w x. Por () temos que x Vz para algum z y.
Dado que w x, entao w Vz . Por () temos que Vz e transitivo, e w Vz ,
logo w Vz , pelo Fato 1. Portanto w Vy , por (). Isto significa que Vy e
transitivo se y e um ordinal. Falta provar que Vy+1 P(Vy ). Por () temos que
Vz+1 P(Vz ) para todo z y, logo Vz+1 = P(Vz ) para todo z y (a inclusao
P(Vz ) Vz+1 e imediata da Definicao 13.12). Logo
S S
Vy+1 = S{P(Vz ) : z y + 1} = ({P(Vz ) : z y} {P(Vy )})
= ({Vz+1 : z y} {P(Vy )}).

SejaSx Vy+1 ; logo x u tal que u {Vz+1 : z y} {P(Vy )}, pela definicao
de . Temos dois casos:
(a) u = P(Vy ). Logo, x P(Vy ).
(b) u = Vz+1 para algum z y. Provaremos primeiro o seguinte
Fato 2: Se e sao ordinais, entao < + 1 implica V V .
Com efeito, se < , entao: implica . Logo, se w V , entao
w P(V ) para algum , pela Definicao 13.12. Daqui w P(V ) onde
, portanto w V , isto e, V V . O caso = e obvio. Isto prova o
Fato 2.

59
Continuando com o caso (b), temos que x u = Vz+1 , onde z y. Logo existe
w z + 1 tal que x P(Vw ), pela Definicao 13.12. Mas w z + 1, z y implica
w y, pois y e ordinal. Daqui w < y + 1 e entao Vw Vy , pelo Fato 2. Dado
que x P(Vw ), entao x Vw , donde x Vy , isto e, x P(Vy ).
Vemos que os dois casos (a) e (b) nos levam a conclusao de que x P(Vy ).
Portanto Vy+1 P(Vy ). Desta maneira provamos (y) a partir da hipotese de
inducao. Logo, (x) vale para todo x, isto e: V e transitivo e V+1 = P(V ),
se e um ordinal.
(iii) Seja um ordinal limite. Por (ii) temos que
[ [
V = {P(V ) : < } = {V+1 : < }.

Se < entao + 1 < , por [LIM], donde V V e V+1 V , pelo Fato


2. Portanto V P(V ) e V+1 P(V ). Isto significa que existem os conjuntos

a = {V : < } = {x : x P(V ) ()( < x = V )},

b = {V+1 : < } = {x : x P(V ) ()( < x = V+1 )}.


S S
Dado que < implica V V , entao a V , pela definicao de
S . S Por
S < implica + 1 < entao b a, donde V = b a,
outro lado, como
isto e, V = a como queriamos.
(iv) Considere (x) def ()(x V (x) < ) (aqui, e uma variavel de
ordinais). Provaremos por inducao sobre que (x) vale para todo x. Seja y,
e suponhamos que

(HI) (z)(z y (z)).

Queremos provar que vale (y). Fixemos entao um ordinal .


Parte 1: (y V (y) < ).
Assumamos que y V . Se z y, entao z V , pois V e transitivo por (ii).
Por (HI) temos que (z) < , portanto (z) + 1 . Suponha que existe z y
tal que = (z) + 1. Logo, por (ii)

y V = V(z)+1 = P(V(z) ).

Daqui y V(z) ; mas z y, logo z V(z) , e (z) e um ordinal. Por (HI)


obtemos que (z) < (z), uma contradicao. Logo (z) + 1 < para todo z y.
Portanto [
(y) = {(z) + 1 : z y}
donde (y) . Suponha que = (y). Dado que y V , entao existe
tal que y P(V ), pela Definicao 13.12. Dado que = (y), entao existe
z y tal que (z)+1. Mas y P(V ), entao y V , e z y, donde z V .
Por (HI) temos que (z) < . Por outro lado provamos que (z) + 1, e
entao temos dois casos:

(a) (z): logo (z) e (z) , contradicao.

60
(b) = (z): logo (z) e = (z), contradicao.

Os dois casos nos levam a uma contradicao, portanto (y) < . Isto conclui a
prova da Parte 1.
Parte 2: ((y) < y V ).
Assumamos que [
(y) = {(z) + 1 : z y} < .
S S
Suponha que y 6 V = {P(V ) : < }. Aplicando a definicao de
obtemos:

( ) para todo < existe z y tal que z 6 V

pois y 6 P(V ) sse y 6 V . Por hipotese (y) < donde, por (), existe z y
tal que z 6 V(y) . Dado que z y e (z) < (z) + 1 entao, por (HI), temos que
z V(z)+1 . Mas z y implica (z) < (y), pela Proposicao 13.11(iv). Logo
(z)+1 < (y)+1, donde V(z)+1 V(y) , pelo Fato 2. De z V(z)+1 obtemos
z V(y) , uma contradicao. Portanto y V . Provamos desta maneira a Parte
2, obtendo portanto (y). Por inducao transfinita temos que (x) vale para
todo x.
(v) Dado x, entao (x) e um ordinal, portanto (x) + 1 e tambem um ordinal,
e (x) < (x) + 1. Pelo item (iv) inferimos que x V(x)+1 . 

O teorema anterior e a afirmacao mais forte que podemos fazer em ZF com


relacao a teoria cumulativa de tipos. Provamos desta maneira que os objetos
que estudamos na linguagem (reprsentados pelas variaveis livres) pertencem de
fato a uma estrutura cumulativa. O ordinal (x)+1 indica o nvel da hierarquia
em que o conjunto x aparece pela primeira vez; portanto o seu posto (x) de-
nota exatamente o nvel em que ele e concebido. Por outro lado, V e a colecao
de todos os conjuntos que apareceram antes do nvel . Logo V+1 V consiste
dos conjuntos criados no nvel . O fato que (x) + 1 = M in{ : x V } e
facil de ser provado. Com efeito:

(a) (x) < (x) + 1 implica x V(x)+1 ;


(b) x V implica (x) < implica (x) + 1 .

Assim, 0 aparece no nvel 1 (pois o nvel 0 e vazio); 1 e concebido no nvel 1 (isto


e, (1) = 1 ' 1), logo so aparece no nvel 2; em geral, n e concebido no nvel
(n) = n ' n, portanto aparece pela primeira vez no nvel seguinte n + 1. Ja
aparece no nvel + 1, pois ele e criado no nvel (infinito), enquanto que
V consiste de todos os conjuntos que apareceram em nveis finitos. Em geral,
se e um ordinal, entao e concebido no nvel , logo aparece no nvel + 1,
isto e: V+1 V . Cada nvel (diferente do nvel 0) contem exatamente
um ordinal, e cada ordinal denota um nvel. Neste sentido forte, os ordinais
descrevem os nveis da hierarquia cumulativa de tipos.

61
14 Aritmetica Ordinal
Continuaremos estudando nesta secao os ordinais. Primeiro de tudo provaremos
que os ordinais sao exatamente os conjuntos bem ordenados, dai a denominacao
de ordinais. Lembremos da Definicao 6.10 que bo(r, x) denota que r e uma boa
ordem em x, e min(v, r, u) denota v u (w)(w u (w r v)) (v e um
elemento r-minimal de u). Introduzimos a seguinte notacao:
Definicao 14.1 bf (r, x) denota (u)(u x u 6= (v)min(v, r, u)
(r e bem fundada sobre x)
Usando esta definicao, e imediato que bo(r, x) bf (r, x) con(r, x), em que
con(r, x) denota que r e conectada em x (lembre da Definicao 6.1). Como foi
provado nas Proposicoes 6.12 e 6.13, uma boa ordem r em x equivale a uma
ordem estrita r em x tal que todo subconjunto de x nao vazio tem r-primeiro
elemento.
Lema 14.2 Seja E(x) = {hy, zi : y, z x y z}. Em S vale o seguinte:
(i) Se x e um ordinal, entao E(x) e uma boa ordem em x.
(ii) Se r e bem fundada em z, entao (x, y) def (x, y z) (x r y) e bem
fundada (lembre da Definicao 13.3).
Demonstracao: (i) Se x e um ordinal, entao y E(x) z sse y < z para todo
y, z x. Dado que y < z e uma relacao bem fundada, entao E(x) e bem
fundada em x. Se y, z x entao y e x sao ordinais. Pela lei de tricotomia para
ordinais temos que E(x) e conectada em x.
(ii) Seja r bem fundada em z, e considere (x, y) def (x, y z) (x r y). Se
x 6= , queremos provar o seguinte:

() ( v x)( w x)(w z v z (w r v),

pois (w, v) [w z v z (w r v)]. Considere u = x z z. Se u = ,


entao tomando v x arbitrario (estamos assumindo que x e nao vazio) obtemos
() trivialmente, pois v 6 z. Se u 6= entao, dado que u z, temos que existe
v u (portanto v x) tal que (w r v) para todo w u, pois r e bem fundada
em z. Seja w x; se w z e v z, isto e, se w z, entao inferimos w u,
donde (w r v). Isto prova (), e logo (x, y) satisfaz a primeira metade da
definicao de relacao bem fundada. Para a segunda metade, seja x arbitrario;
queremos provar que existe u tal que

() x u ( w, y)(y u (w, y) w u).

Se x = , entao u = satisfaz trivialmente (). Se x 6= considere

u = x {w : w z ( y z)(w r y)}.

Temos que u 6= e x u. Sejam w e y tais que y u e (w, y), logo: y, w z


e w r y. Daqui w u, pela definicao de u, portanto vale () e entao (x, y) e
bem fundada. 

62
Lema 14.3 Em ZF provamos o seguinte: se bf (r, z), entao existe

h(x) = {h(y) : y z y r x}

para todo x z.

Demonstracao: Usaremos recursao transfinita para definir os conjuntos h(x).


Considere a formula

G(X, x1 , y) def (x1 = x1 ) (y = im(X)).

Seja F (x, y) a operacao definida a partir de G(X, x1 , y) por recursao transfinita


na relacao bem fundada (x, y) def (x, y z) (x r y) (temos que (x, y) e
bem fundada pelo Lema 14.2(ii)). Por definicao

AN T (F, x, (u, v)) = {hy, F 0 hyii : (y, x)}

portanto, fixado x z,

F 0 hxi = G0 hAN T (F, x, (u, v)), xi


= im(AN T (F, x, (u, v))
= {F 0 hyi : (y, x)}
= {F 0 hyi : x, y z y r x}
= {F 0 hyi : y z y r x}.

Desta maneira, F (x, y) representa a operacao h(x) desejada para todo x z. 

Teorema 14.4 (Caracterizacao dos Ordinais) Em ZF prova-se: se r e uma


boa ordem em z, entao existe um ordinal tal que

h : z , h(x) = {h(y) : y z y r x}

e um isomorfismo de conjuntos bem ordenados, isto e: h e uma bijecao tal que:


x r y sse h(x) < h(y). O ordinal e o isomorfismo h sao unicos.

Demonstracao: Seja r uma boa ordem em z; logo, bf (r, z) donde existe h(x)
para todo x z, pelo Lema 14.3. Seja

r = (r|z) {hy, zi : y z}

lembrando que r|z = {hx, yi : x z x r y}. Provaremos que r e bem


fundada em z + 1. Seja entao u z + 1, u 6= .
Caso 1: u z. Como bf (r, z), existe v u tal que (w r v) para todo w u.
Pela construcao de r , temos que (w r v) para todo w u pois r coincide
com r em z z.
Caso 2: u = {z} u1 tal que u1 z. Se u1 = entao v = z satisfaz: v u
e (w r v) para todo w u. Se u1 6= entao u1 z e nao vazio, logo existe
v u1 tal que (w r v) para todo w u1 . Como (z r v), pela construcao de

63
r , entao (w r v) para todo w u.
Isto prova que bf (r , z + 1). Pelo Lema 14.3 inferimos que existe

h (x) = {h (y) : (y z + 1) (y r x)}

para todo x z + 1.
Fato 1: h (x) = h(x) para todo x z.
Com efeito: seja (x) def (x z h (x) = h(x)). Fixemos y tal que

(HI) (w)((w, y) (w)),

onde (u, v) def (u, v z)(u r v) e uma relacao bem fundada, pelo Lema 14.2(ii).
Suponhamos que y z; logo, pela construcao de r :

h (y) = {h (w) : (w z + 1) (w r y)}


= {h (w) : w z w r y}
= {h (w) : (w, y)}.

Por (HI) temos que (w) para todo w tal que (w, y). Como (w, y) implica w
z, entao obtemos que h (w) = h(w) para todo w tal que (w, y). Daqui h (y) =
h(y). Por inducao transfinita sobre (x, y) inferimos que (x) e verdadeira para
todo x como queriamos, provando o Fato 1.
A partir do Fato 1 e da definicao de r obtemos

h (z) = {h (y) : (y z + 1) (y r z)} = {h (y) : y z} = {h(y) : y z}.

Seja def h (z). Provaremos que e um ordinal. Seja x h(y), y z. Logo


x = h(w) tal que w z, pelas definicoes de h(y) e (w, y), portanto x ;
daqui e transitivo. Sejam h(x), h(y) . Como x, y z, entao y = x ou
y r x ou x r y. Se x = y entao h(x) = h(y). O caso em que y r x implica
h(y) h(x). Se x r y entao h(x) h(y). Vemos assim que e conectado. Daqui
obtemos que e um ordinal, portanto h(x) e um ordinal para todo x z, e
e bem ordenado pela relacao E() = <, pelo Lema 14.2(i). A propriedade x r
y sse h(x) < h(y) e imediata, logo h : z e um isomorfismo de conjuntos
bem ordenados. Para provar a unicidade de , suponha que hz, ri e isomorfo
a h, <i via g : z para um outro ordinal . Logo g h1 : e um
isomorfismo.
Fato 2: Sejam e ordinais, e f : un isomorfismo, isto e: f e uma
bijecao tal que < sse f () < f () para todo , . Logo f () = {f () :
< }, donde f () = para todo .
Com efeito, se < < , entao f () f (). Por outro lado, seja f ();
entao = f () para , pois f e sobrejetora. Daqui f () < f () implica <
, e entao = f () com < , isto e: f () = {f () : < }. Considerando a
formula
(x) def x f (x) = x
entao e agora muito simples provar por inducao sobre que (x) vale para
todo x (exerccio!), concluindo a prova do Fato 2.

64
Temos que g h1 : e um isomorfismo. Pelo Fato 2, g h1 (x) = x
para todo x . Mas g h1 e sobrejetora, portanto = , e g h1 = I().
Daqui g = h (compondo a direita com h). Isto mostra que e h sao unicos
para cada hz, ri. 

Pelo Lema 14.2(i) vemos que todo ordinal e bem ordenado pela relacao <.
Reciprocamente, pelo Teorema 14.4, se z e um conjunto bem ordenado por uma
relacao r entao existe um unico ordinal e um unico isomorphismo h : z
de conjuntos bem ordenados tal que hz, ri ' h, <i. O ordinal associado com
hz, ri e dito o tipo ordinal de hz, ri. Observe que o tipo ordinal de z depende
da relacao r: com efeito, z pode possuir duas estruturas de boa ordem r1 e r2
nao isomorfas, de maneira a ter associados dois tipos ordinais, 1 para hz, r1 i e
2 para hz, r2 i com 1 6= 2 .

Exemplo 14.5 Considere em N a estrutura usual r1 de boa ordem: n r1 m


sse n < m. Logo, h1 : N dada por h1 (n) = n e o unico isomorfismo de
hN, r1 i em h, <i tal que e o tipo ordinal de hN, r1 i. Por outro lado, considere
a seguinte relacao r2 em N:

n r2 m se n, m > 0 e n < m;
n r2 0 para todo n > 0.

Isto e: r2 coincide com a boa ordem usual < para todos os numeros naturais
positivos, e 0 e colocado como r2 -ultimo elemento de N. E muito simples ver
que r2 e uma boa ordem em N (conferir!). Considere h2 : N + 1 dada por

n 1 se n > 0
h2 (n) = .
se n = 0
Temos que h2 e um isomorfismo entre hN, r2 i e h + 1, <i (conferir!), portanto
+ 1 e o tipo ordinal de hN, r2 i, sendo que 6= + 1. Isto mostra que o tipo
ordinal de um conjunto bem ordenado depende da boa ordem especificada. 

Definicao 14.6 Sejam e ordinais. Definimos a soma ordinal + como


sendo




se = 0


+ = ( + ) + 1 se = + 1 .


S

< ( + ) se e limite ordinal

Para provar que a soma esta bem definida, precisamos introduzir uma relacao
bem fundada apropriada.

Lema 14.7 Considere a formula

(u, v) def (ord(u) ord(v)) [(z)(v = z + 1 u = z) (lim(v) u v)].

65
Entao (u, v) e uma relacao bem fundada.

Demonstracao: Seja x 6= . Pelo axioma da regularidade, existe v x tal


que ( z x)(z 6 v). Logo, v 6= z + 1 para todo z x, e entao nao vale
(z)(v = z + 1 u = z) para todo u x. Se v e um ordinal limite entao, dado
que z 6 v para todo z x, inferimos que nao vale (lim(v) u v) para todo
u x. Desta maneira obtemos: u x (u, v), donde

x 6= ( v x)( w x)(w, v).

Para provar a segunda parte da Definicao 13.3 de relacao bem fundada, seja
x arbitrario, e considere u = F T (x), o fecho transitivo de x. Seja y u e w
tal que (w, y). Se z e um conjunto transitivo tal que x z entao y z, pois
y F T (x). Dado que (w, y), entao w y (e uma consequencia direta da
definicao de ), logo w z (pois z e transitivo). Daqui w F T (x) = u, donde

(u)(x u ( w, y)(y u (w, y) w u)).

Isto prova que (u, v) e uma relacao bem fundada. 

LemaS14.8 Seja b um conjunto de ordinais, isto e: (x)(x b ord(x)).


Logo b e um ordinal.
S
Demonstracao: Seja a = b. Considere x a e y x. Logo, existe z b
tal que x z. Por hipotese z e um ordinal, e y x, x z; portanto y z
com z b, donde y a. Isto mostra que a e transitivo. Por outro lado, sejam
x, y a; logo existem z, w b tais que x z e y w. Por hipotese z e w sao
ordinais, logo x e y sao ordinais. Portanto x = y ou x y ou y x pela lei
de tricotomia para ordinais. Isto prova que a e conectado para , portanto a e
um ordinal. 

Proposicao 14.9 A soma ordinal esta bem definida em ZF, isto e, para cada
ordinal e , existe um unico conjunto + definido de acordo com a Defi-
nicao 14.6.

Demonstracao: Para provar que a soma ordinal esta bem definida usaremos
recursao transfinita sobre a relacao bem fundada (u, v) do Lema 14.7. Con-
sidere a seguinte formula:
S
G(X, x1 , x2 , y) def [x1 = 0y = x2 ] S
[(z)(x1 = z+1)y = ( im(X))+1]
[lim(x1 ) y = im(X)].

Logo, definimos por recursao transfinita sobre (u, v) uma operacao F (x1 , x2 , y).
Temos que, se x1 e um ordinal, entao

AN T (F, 0, x2 , (u, v)) = {hhw, x2 i, F 0 hw, x2 ii : (w, 0)} = ,

AN T (F, z + 1, x2 , (u, v)) = {hhw, x2 i, F 0 hw, x2 ii : (w, z + 1)}

66
= {hhz, x2 i, F 0 hz, x2 ii},

AN T (F, x1 , x2 , (u, v)) = {hhw, x2 i, F 0 hw, x2 ii : (w, x1 )}


= {hhw, x2 i, F 0 hw, x2 ii : w x1 }

segundo o caso: x1 = 0, x1 = z + 1 ou x1 e um ordinal limite, respectivamente.


Obtemos assim em cada caso:

im(AN T (F, 0, x2 , (u, v))) = ,

im(AN T (F, z + 1, x2 , (u, v))) = {F 0 hz, x2 i},

im(AN T (F, x1 , x2 , (u, v))) = {F 0 hw, x2 i : w x1 },

respectivamente. Portanto, se e sao ordinais, entao

F 0 h0, i = G0 hAN T (F, 0, , (u, v)), 0, i = ,

F 0 h + 1, i = G0 hAN T (F, + 1, , (u, v)), + 1, i = ( {F 0 h, i}) + 1


S
= (F 0 h, i) + 1,

F 0 h, i = G0 hAN T (F, , , (u, v)), , i = {F 0 h, i : }


S

segundo o caso: = 0, = + 1 ou e um ordinal limite, respectivamente.


Desta maneira F 0 h, i = + e definido de acordo com 14.6; isto e, sempre
podemos definir o conjunto + . 

Proposicao 14.10 Sejam e ordinais. Entao + e um ordinal.

Demonstracao: Considere a formula

(x) def ord(x) (z)(ord(z) ord(z + x)).

Provaremos por inducao sobre (u, v) (Lema 14.7) que (x) vale para todo x;
logo teremos que + e um ordinal para todo ordinal e . Seja y um con-
junto satisfazendo

(HI) (w)((w, y) (w)).

Queremos provar que vale (y). Suponhamos entao que y e um ordinal, e seja
z um ordinal. Provaremos que z + y e um ordinal. Temos tres casos:
(a) y = 0. Logo z + y = z, portanto z + y e um ordinal.
(b) y = w + 1. Logo temos que (w, y), portanto vale (w), por (HI). Como y
e um ordinal e w y, entao w e um ordinal, logo ord(z) ord(z + w). Mas z e
um ordinal, portanto z +w e um ordinal. Daqui inferimos que z +y = (z +w)+1
e um ordinal.

67
(c) y e um ordinal limite. Se w y entao vale (w, y), donde vale (w) por
(HI). Dado que w y implica que w e um ordinal, entao, como antes, obtemos
que z + w e um ordinal para todo w y. Pelo Lema 14.8 deduzimos que
[
z + y = {z + w : w y}

e um ordinal.
Portanto, em todos os casos possveis temos que z + y e um ordinal, provando
que (HI) implica ord(y) (z)(ord(z) ord(z + y)), isto e, (y). Por inducao
transfinita inferimos que (x) vale para todo x. 

Proposicao 14.11 Sejam , e ordinais. Entao < implica que + <


+ .

Demonstracao: Considere a formula

(x) def ord(x) (y)(y < x (z)(ord(z) (z + y < z + x))).

Por inducao sobre a formula (u, v) do Lema 14.7 provaremos que (x) vale
para todo x. Suponha que temos

(HI) (w)((w, x) (w)).

Queremos provar (x). Suponha que x e um ordinal.


(1) Se x = 0 entao y < x e falso para todo y, portanto

(y)(y < x (z)(ord(z) (z + y < z + x)))

e trivialmente verdadeiro.
(2) Se x = w + 1, considere y < x e z um ordinal.
(2.1) Se y = w entao z + w < (z + w) + 1 = z + (w + 1) = z + x.
(2.2) Se y w entao, dado que (w, x), obtemos (w) por (HI), portanto
z + y < z + w (pois y < w). Mas z + w < z + x (caso 2.1), logo z + y < z + x.
(3) Se x e um ordinal limite, seja y < x e z um ordinal.S Como (z +y) (z +(y +
1)) (caso 2.1) e y+1 x, pois x e limite, entao z+y {z+w : w x} = z+x.
Em todos os casos temos que (y)(y < x (z)(ord(z) (z + y < z + x))) e
verdadeiro. Portanto (HI) implica (x) donde (x) vale para todo x. 

Proposicao 14.12 + ( + ) = ( + ) + para todo ordinal , e .

Demonstracao: Considere a formula

(z) def ord(z) ( x, y)(ord(x) ord(y) ((x + y) + z = x + (y + z))).

Por inducao na relacao (u, v) do Lema 14.7 provaremos que (x) vale para
todo x. Seja z tal que

(HI) (w)((w, z) (w)).

68
Suponha que z e ordinal, e sejam x, y ordinais.
(1) Se z = 0, entao (x + y) + z = x + y = x + (y + 0) = x + (y + z).
(2) Se z = w + 1, entao temos (w, z), donde vale (w) por (HI). Daqui

(x + y) + z = (x + y) + (w + 1) = ((x + y) + w) + 1
=HI (x + (y + w)) + 1 = x + ((y + w) + 1)
= x + (y + (w + 1)) = x + (y + z).

(3) Se z e limite, entao provaremos primeiro os seguintes


Fatos: Seja ordinal limite.
(a) Se x + tal que + entao existe < tal que x + ( + ).
(b) + e um ordinal limite.
Com efeito, seja x + tal que + . Logo + tal que .
De < + inferimos que + < + ( + ), pela Proposicao 14.11. Logo
x + ( + )Spara algum , provando o item (a). Para provar (b), observe
que + = { + : } e nao vazio. Seja u + , logo u +
para algum . Daqui u + 1 ( + ) + 1 = + ( + 1), onde + 1 .
Assim u + 1 + , donde + e um ordinal limite, por [LIM]. Isto conclui
a demonstracao dos Fatos.
Por causa dos Fatos(b) obtemos que y +z e um ordinal limite, e pelos Fatos(a)
[ [
x + (y + z) = {x + w : w y + z} {x + (y + w) : w z}.

Alem disso, se w z entao (y + w) (y + z) pela Proposicao 14.11, logo:

u x + (y + w) para w z implica u x + w0 com w0 y + z


S
implica u {x + w : w y + z},

donde [ [
{x + (y + w) : w z} {x + w : w y + z}
e assim
[ [
x + (y + z) = {x + w : w y + z} = {x + (y + w) : w z}.

Mas, para todo w z temos que (w, z) e satisfeita, logo vale (w) por (HI),
donde x + (y + w) = (x + y) + w para todo w z. Portanto
[ [
x + (y + z) = {x + (y + w) : w z} = {(x + y) + w : w z} = (x + y) + z.

Acabamos de provar que (HI) implica (z). Por inducao transfinita obtemos
que (z) vale para todo z. 
S
Lema 14.13 Seja um ordinal limite. Entao = .
Demonstracao:
S Seja x ; logo, x+1 S
. Portanto x x+1 com x+1 S ,
donde x . Daqui obtemos que . Reciprocamente, seja x ;
S x y para algum y ; dado que Se transitivo, entao x . Portanto
logo
. Desta maneira, temos que = . 

69
Proposicao 14.14 Seja um ordinal. Vale o seguinte:
(i) 0 + = .
(ii) + 1 = + 1.

Demonstracao: (i) Por inducao na relacao (u, v) do Lema 14.7, provaremos


que (x)(x), onde
(x) def ord(x) (0 + x = x).
Seja x um conjunto satisfazendo

(HI) (z)((z, x) (z)).

Assuma que x e um ordinal. Temos tres casos para analizar:


(a) x = 0. Logo 0 + x = 0 + 0 = 0 = x.
(b) x = z + 1. Logo (z, x) e ord(z), portanto 0 + z = z, por (HI). Daqui
0 + x = 0 + (z + 1) = (0 + z) + 1 = z + 1 = x.
(c) x e um ordinal limite. Se z x, entao (z, x) e ord(z), portanto 0 + z = z,
por (HI). Daqui
[ [ [
0 + x = {0 + z : z x} = {z : z x} = x=x

pelo Lema 14.13. Vemos que nos tres casos possveis 0 + x = x. Portanto (HI)
implica (x) donde, por inducao transfinita, obtemos que (x) e verdadeira
para todo x.
(ii) Temos que 1 = 0 + 1, pela definicao de 1. Logo
+ 1 = + (0 + 1) = ( + 0) + 1 = + 1.


Definiremos agora o produto de ordinais.


Definicao 14.15 Sejam e ordinais. Definimos o produto ordinal como
sendo

0 = 0;
( +S1) = ( ) + ;
= < se e ordinal limite.

Como foi feito com a soma ordinal, podemos provar que pode ser definido,
e e um ordinal. A relacao funcional G(X, x1 , x2 , y) utilizada para definir
F (x1 , x2 , y) tal que F 0 h, i = e dada neste caso por
S
G(X, x1 , x2 , y) def [x1 = 0y = 0][(z)(x
S 1 = z+1)y = ( im(X))+x2 ]
[lim(x1 ) y = im(X)]

(confira os detalhes!).

70
Proposicao 14.16 Seja um ordinal. Logo 0 = 0.
Demonstracao: Por inducao na relacao (u, v) do Lema 14.7, provaremos que
(x)(x), onde
(x) def ord(x) (0 x = 0).
Seja x um conjunto satisfazendo

(HI) (z)((z, x) (z)).

Assuma que x e um ordinal. Temos tres casos para analizar:


(a) x = 0. Logo 0 x = 0 0 = 0.
(b) x = z + 1. Logo (z, x) e ord(z), portanto 0 z = 0, por (HI). Daqui
0 x = 0 (z + 1) = (0 z) + 0 = 0 + 0 = 0.
(c) x e um ordinal limite. Se z x, entao (z, x) e ord(z), portanto 0 z = 0,
por (HI). Daqui
[ [ [
0 x = {0 z : z x} = {0 : z x} = {0} = 0.

Vemos que nos tres casos possveis 0 x = 0. Portanto (HI) implica (x) donde,
por inducao transfinita, obtemos que (x) e verdadeira para todo x. 

Proposicao 14.17 Seja um ordinal. Entao 1 = = 1 .

Demonstracao: Por inducao na relacao (u, v) do Lema 14.7, provaremos que


(x)(x), onde
(x) def ord(x) (1 x = x).
Seja x um conjunto satisfazendo

(HI) (z)((z, x) (z)).

Assuma que x e um ordinal. Temos tres casos para analizar:


(a) x = 0. Logo 1 x = 1 0 = 0 = x.
(b) x = z + 1. Logo (z, x) e ord(z), portanto 1 z = z, por (HI). Daqui
1 x = 1 (z + 1) = (1 z) + 1 = z + 1 = z + 1 = x.
(c) x e um ordinal limite. Se z x, entao (z, x) e ord(z), portanto 1 z = z,
por (HI). Daqui
[ [ [
1 x = {1 z : z x} = {z : z x} = z=z

pelo Lema 14.13. Daqui 1 x = x em todos os casos. Assim (HI) implica


(x) donde, por inducao transfinita, inferimos que (x)(x). A segunda parte
e provada diretamente:
x 1 = x (0 + 1) = (x 0) + x = 0 + x = x
pelo Lema 14.14(i). 

71
Proposicao 14.18 Se > 0 e e ordinal limite, entao e um ordinal
limite.

Demonstracao: Por definicao temos que


[
= { : },

portanto 6= 0. Seja x ; logo x para algum , donde


x + 1 ( ) + 1. Dado que < 1 sse = 0 entao, pela lei de tricotomia dos
ordinais, temos dois casos para serem analizados:
(a) = 1. Logo

( ) + 1 = ( ) + 1 = ( ) + = ( + 1).

Mas + 1 , pois e e ordinal limite. Daqui x + 1 .


(b) 1 < . Pelo Lema 14.14(ii) e a Proposicao 14.11 inferimos:

( ) + 1 = ( ) + 1 < ( ) + = ( + 1).

Daqui x + 1 ( + 1) onde + 1 , pois e e um ordinal limite.


Portanto x + 1 . Nos dois casos possveis para obtemos: x
implica x + 1 . Isto prova que e um ordinal limite, pela propriedade
[LIM] (introduzida logo apos a Definicao 12.7). 

Por inducao transfinita pode ser provado o seguinte:


Proposicao 14.19 Sejam , e ordinais. Em ZF vale o seguinte:
(a) ( + ) = ( ) + ( ).
(b) ( ) = ( ) .
Definiremos agora a exponenciacao ordinal.
Definicao 14.20 Sejam e ordinais. A exponenciacao ordinal e definida
da maneira seguinte:

0 = 1;
+1 = ;
= se e ordinal limite e 0 < ;
S

= 0 se e ordinal limite e = 0.

Podemos provar como antes que a definicao acima e legitimada em ZF por re-
cursao transfinita em (u, v) (Lema 14.7) utilizando
S
G(X, x1 , x2 , y) def [x1 = 0y = 1][(z)(x1 =Sz +1)y = ( im(X))x2 ]
[lim(x1 ) x2 6= 0 y = im(X)]
[lim(x1 ) x2 = 0 y = 0]

para definir uma operacao F (x1 , x2 , y) tal que F 0 h, i = (confira os deta-


lhes!). Por inducao transfinita pode ser provado o seguinte:

72
Proposicao 14.21 Sejam , e ordinais. Em ZF valem as seguintes pro-
priedades:
(a) e um ordinal.
(b) 1 = .
(c) Se > 0 entao 0 = 0.
(d) 1 = 1.
(e) + = .
(f ) ( ) = .

Observacao 14.22 Se bem as operacoes de soma, produto e exponenciacao


ordinal possuem propriedades analogas as propriedades das mesmas operacoes
numericas, existem algumas diferencias notorias. Certas asimetrias (nao comu-
tatividade da soma e o produto, por exemplo) aparecem por causa das proprias
definicoes, feitas por recursao transfinita numa so das variaveis. Podemos
destacar os seguintes exemplos em que as operacoes sao mal comportadas:

1 + = 6= + 1; logo a soma ordinal nao e comutativa.

2 = 6= 2, logo o produto ordinal nao e comutativo.

(1 + 1) = 2 = 6= (1 ) + (1 );

logo o produto ordinal nao e distributivo a direita da soma ordinal. 

15 Cardinais
Finalmente estudaremos a nocao de numero cardinal. Os cardinais foram in-
troduzidos originalmente por Frege e Russell para indicar o tamanho dos
conjuntos. A ideia intuitiva e que dois conjuntos a e b tem o mesmo tamanho
(ou seja, o cardinal de a e igual ao cardinal de b) se existe uma bijecao entre
eles, isto e, se sao equipolentes. Portanto a definicao natural de cardinal de um
=
conjunto a, denotado por a, e a colecao de todos os conjuntos b equipolentes
com a. Isto e, a partir da relacao de equivalencia (equipolencia), definimos
=
a = {b : a b}.

Portanto o cardinal de um conjunto a, na concepcao de Frege e Russell, e a classe


de equivalencia de a na relacao . O problema que apresenta esta definicao e
=
que a e uma classe propria, isto e, o cardinal de a nao pode ser legitimado em
= S=
ZF (nem em ZFC); se a fosse legitimado, podemos provar que a e o conjunto
de todos os conjuntos, uma contradicao. A solucao para este problema e definir
o cardinal de um conjunto a partir da teoria de ordinais. A definicao e feita
de maneira a escolher um conjunto (ordinal) equipolente a x; de fato, o ordinal
escolhido sera o menor ordinal equipolente com x. Como ja parece evidente, a
teoria de cardinais faz um uso pesado do Axioma da Escolha [AE]. A partir de
[AE] poderemos provar a Lei de Tricotomia que estabelece que a relacao  e
total entre conjuntos (isto e, dados x e y, entao x  y ou y  x), assim como

73
demonstrar que todo conjunto e similar a um ordinal (o teorema da boa ordem:
todo conjunto x admite uma boa ordem). Na primeira parte desta exposicao
nao utilizaremos [AE], mas ele devera ser considerado posteriormente, fato que
sera oportunamente informado. Comecamos reformulando a nocao de conjunto
finito, agora utilizando a representacao dos numeros naturais em ZF.

Definicao 15.1 F IN (x) denota (n)(n x n)


(x e n-finito);
IN F IN (x) denota F IN (x)
(x e infinito);
EN U M (x) denota x
(x e enumeravel).

Antes de provar as seguintes propriedades precisamos do seguinte resultado.

Lema 15.2 Seja um inteiro. Entao + 1.

Demonstracao: Seja um inteiro, e f : + 1 dada por f (x) = x; logo


f e injetora, portanto  + 1, pela definicao de . Provaremos por inducao
matematica que (x)(x), onde

(x) def int(x) (x 6 x + 1).

E imediato que 0 6 1 = 0+1, portanto vale (0). Suponha que vale (y); para
provar (y+1), suponha que y+1 e um inteiro, logo y e um inteiro, pois y y+1,
portanto y 6 y + 1. Suponhamos que existe uma bijecao f : y + 1(y + 1) + 1;
daqui inferimos que f |y e uma bijecao entre y e ((y + 1) + 1) {f (y)}.
Fato: Seja z um conjunto, e v z + 1. Portanto (z + 1) {v} z.
Com efeito, se v = z entao (z + 1) {v} = z, e a equipolencia e imediata. Por
outro lado, se v z entao definimos g : ((z + 1) {v})z como g(u) = u se
u 6= z, e g(z) = v. E claro que g e uma bijecao; isto conclui a prova do Fato.
Vemos entao que, por um lado, f |y e uma bijecao estabelecendo que y ((y +
1) + 1) {f (y)} enquanto que, por outro lado, ((y + 1) + 1) {f (y)} y + 1,
em virtude do Fato; portanto y y + 1, uma contradicao. Daqui obtemos que
y +1 6 (y +1)+1. Desta maneira (y) implica int(y +1) y +1 6 ((y +1)+1),
isto e, provamos que (y) (y + 1). Por inducao matematica obtemos que
(x)(int(x) (x)) ou, equivalentemente, (x)(x), isto e, 6 + 1 para
todo inteiro . Como  + 1, entao deduzimos que + 1 para todo
inteiro . 

Proposicao 15.3 (i) Em S vale o seguinte: se x e y sao inteiros, entao x  y


sse x y.
(ii) Em Z vale o seguinte: e infinito.

Demonstracao: (i) Provaremos por inducao matematica que para todo x vale
(x), onde

(x) def int(x) (y)(int(y) (x  y x y)).

74
E imediato que (0) e verdadeira (confira!). Seja x tal que (x) e verdadeira.
Para provar (x + 1), assuma que x + 1 e um inteiro; logo x e um inteiro, donde

() (y)(int(y) (x  y x y))

pois vale (x). Suponha que y e um inteiro tal que x + 1  y. Como x x + 1


(pelo Lema 15.2), entao x y; por () inferimos que x < y (nao poderiamos
ter x = y, senao x y, o que contradiz x y), portanto x + 1 y. Logo (x)
implica (x + 1). Por inducao matematica obtemos que (x) vale para todo x,
provando assim a primeira metade de (i). A outra implicacao e imediata: x y
implica x  y para todo ordinal x e y.
(ii) Suponhamos que e n-finito, isto e, existe um inteiro n tal que n.
Daqui inferimos que n e n n + 1, pelo Lema 15.2, logo n + 1. Mas
n + 1 = n + 1, logo n + 1  (pois n + 1 ). Portanto n + 1  , n + 1
implica n + 1 n + 1, uma contradicao. Daqui obtemos que e infinito. 

Definicao 15.4 inic() denota ord() ()( < ( 6 ))


( e um ordinal inicial).

Pela Proposicao 15.3(i) vemos que todo ordinal n-finito n e um ordinal inicial:
se n entao  n e n  , donde n e n . Pela tricotomia dos
ordinais inferimos que = n, e entao 6< n. Por 15.3(ii) e pela definicao de
e imediato que e tambem um ordinal inicial. Por outro lado, e simples provar
que
+ 1 + 2 + = 2 3
junto com

2 3 etc.
(confira!). Pode ser provado que nenhuma das operacoes sobre ordinais consegue
produzir um ordinal inicial superior a partir de . Para superar esta barreira
devemos considerar o conjunto das partes P(x); uma maneira possvel e atraves
da funcao aleph de Hartogs:

Definicao 15.5 (x) denota { :  x}


(o aleph de x).

Proposicao 15.6 Em ZF provamos que (x) e legitimado, e (x) e um ordinal


inicial para todo conjunto x.

Demonstracao: Dado um conjunto x, considere o seguinte conjunto:

z = {r : (y)(y x r y y bo(r, y))}.

Dado que z P(x x), entao z e legitimado por [A2]. Por outro lado, lem-
brando que F (r) denota o conjunto dom(r)im(r), considere a seguinte formula:

75
isom(r, ) def (h)(bij(h, F (r), ) (x)(y)(x, y F (r)
(((x r y) h(x) < h(y)))).

O teorema de caracterizacao dos ordinais prova que se r e uma boa ordem sobre
a = F (r), entao (!)isom(r, ) (onde (!) indica existencia e unicidade). Logo,
a formula
(r, ) def bo(r, F (r)) isom(r, )
satisfaz a condicao F U N do axioma de substituicao [A7], portanto existe o
conjunto

b = { : (r)(r z (r, ))} = { : (r)(r z isom(F (r), )}.

Pela definicao de z e dado que (!)isom(F (r), ) para todo r z, sendo que
F (r) x, vemos que b = (x), portanto o conjunto (x) e legitimado para todo
conjunto x. Para provar que (x) e um ordinal basta provar que e transitivo,
pois (x) e um conjunto de ordinais. Considere entao (x) e < . Logo:
e  x, donde  x. Daqui (x) e (x) e transitivo, sendo
portanto um ordinal. Suponha que existe < (x) tal que (x) . Dado
que (x), entao obtemos que  x, donde (x)  x. Daqui (x) (x),
uma contradicao. Logo (x) e um ordinal inicial. 

Observe que, se e um ordinal, entao (), pois  . Portanto < ().


Isto significa que, para cada ordinal , existe um ordinal inicial () maior do
que . Pelo Teorema de Cantor-Schroder-Bernstein () deve ser o seguinte
ordinal inicial. Com efeito, suponha que e um ordinal inicial diferente de
() tal que < . Pela lei de tricotomia para ordinais temos que < () ou
() < . Suponhamos que < (), logo () e entao  . Por outro
lado, < implica donde  . Pelo Teorema de Cantor-Schroder-
Bernstein inferimos que , sendo que < e e um ordinal inicial,
contradicao. Portanto () < , isto e: () e o mnimo ordinal inicial maior
que .

Definicao 15.7 Por recursao transfinita definimos a seguinte sequencia de or-


dinais iniciais infinitos:

0 = ;
+1 =
S ( );
= < se e um ordinal limite.

Como foi feito anteriormente, podemos provar que a definicao por recursao
transfinita 15.7 e legitimada em ZF, e que e um ordinal inicial infinito para
todo ordinal (conferir!). Reciprocamente, por inducao transfinita podemos
provar que se e ordinal inicial infinito, entao existe um ordinal tal que
= . Logo: inic() IN F IN () ()( = ) e um teorema em ZF.

Definicao 15.8 Um cardinal e um ordinal inicial.

76
Portanto, todo cardinal infinito e da forma para algum ordinal . Uma
notacao alternativa para e . Por inducao transfinita podemos provar o
seguinte resultado, que utilizaremos para definir as operacoes aritmeticas entre
cardinais:

Proposicao 15.9 Em ZF vale o seguinte: Se e um cardinal e , entao


( ).

Se e um ordinal, entao para todo ordinal : implica que  ,


portanto (). Desta maneira existe por [A2] o conjunto

a = { : () } = { : }.

Temos que , portanto a 6= . Daqui inferimos que existe o conjunto


= \ \
= a = { : }.

= =
O conjunto e dito o cardinal de . Pode ser provado que e um cardinal, e
=
que = se e um cardinal. Se x e um conjunto e x para algum ordinal
entao x sse para todo ordinal , portanto existe
= \ =
x def { : x} = .

Definicao 15.10 Seja x um conjunto. O cardinal de x e definido como


T
{ : x} se x para algum ordinal
=
x= .
em caso contrario

Teorema 15.11 (Princpio da Boa Ordem) Em ZFC (isto e, em ZF mais o


axioma da escolha) provamos o seguinte: todo conjunto x admite uma boa ordem
r em x.
= T
Daqui temos que para todo conjunto x existe x = { : x}. Com
efeito, se x e um conjunto, entao existe uma boa ordem r em x; pelo teorema
de caracterizacao dos ordinais existe um unico ordinal isomorfo a hx, ri; em
= T
particular x . Pela Definicao 15.10 obtemos que x = { : x}.
Devemos observar que, de fato, o axioma da escolha e equivalente ao princpio
da boa ordem. Por outro lado, o cardinal de um conjunto e determinado pelas
diferentes possibilidades que existem para definir uma boa ordem r em x; cada
r determina um ordinal isomorfo a hx, ri, portanto o mnimo desses ordinais
corresponde a unica boa ordem sobre x que o faz um cardinal.

Proposicao 15.12 Seja b um conjunto e um ordinal tal que b  . Con-


sidere a seguinte relacao em b: x r y sse f (x) < f (y) onde f e uma funcao
injetora de b em . Logo r e uma boa ordem em b tal que, se e o tipo ordinal
de hb, ri, entao .

77
Demonstracao: E imediato que r e uma boa ordem em b, pois r e computada
a partir da copia f b de b em na relacao de boa ordem . Seja h : b o
isomorfismo entre b e o tipo ordinal de b dado por
h(x) = {h(y) : y r x} = {h(y) : f (y) < f (x)}.
Logo, h(x) < h(y) sse x r y sse f (x) < f (y). Definimos uma funcao g :
dada por g() = f (x) onde x e o unico elemento de b tal que = h(x). Logo g
e uma funcao satisfazendo
= h(x) < h(y) = sse g() = f (x) < f (y) = g()
portanto g e um isomorfismo entre e g. Logo g() = para todo
(pelo Fato 2 na demonstracao do Teorema 14.4) e entao . 

Corolario 15.13 Sejam b e c conjuntos. Em ZFC vale o seguinte: se b c


= =
entao b c.
= T
Demonstracao: Seja x b = { : b}. Queremos provar que x
= T
c = { : c}. Seja entao um ordinal equipolente com c, e considere
f : c uma bijecao. Logo f |b e uma bijecao entre b e f b , donde b  .
Considere o ordinal da Proposicao 15.12. Logo b donde x , pois
= = = =
x b. Mas , portanto x . Provamos assim que x c, e entao b c,
= =
donde b c. 

Definicao 15.14 Uma famlia de conjuntos indexada por um conjunto I e um


conjunto
(xi )iI = {hi, xi i : i I}
onde xi e um conjunto para cada i I. Mais formalmente, uma famlia (xi )iI
e uma funcao x : Ia tal que I e a sao conjuntos,
S com I 6= . Se i I
entao x(i) e denotado por xi . Por outro lado, iI xi denota o conjunto
[
{z a : (i)(i I z xi )}.
S S
Isto e, iI xi = im(x). O produto cartesiano de (xi )iI e dado por
Y [
xi = {f : f un(I, xi ) (i)(i I f (i) xi )}.
iI iI

Definicao 15.15 Seja L (i )iI uma famlia indexada de cardinais.


(i) A soma cardinal iI i e o cardinal construdo da maneira seguinte: se
(ai )iI e uma famlia de conjuntos dois a dois disjuntos (isto e, ai aj = se
= S
i 6= j) tal que a i = i para todo i I entao e o cardinal do conjunto iI ai .
Se I = {0, 1} escreveremos J 0 1 .
(ii) O produto cardinal iI i e o cardinal construdo da maneira seguinte:
=
se (ai )iI e uma famliaQde conjuntos tal que a i = i para todo i I entao e
o cardinal do conjunto iI ai . Se I = {0, 1} escreveremos 0 1 .
(iii) Se , sao cardinais, definimos a exponenciacao cardinal como sendo
= =
o cardinal dado pelo cardinal do conjunto xy , onde x = e y = .

78
Vemos que sem o axioma da escolha nao podemos assegurar que existem estas
operacoes para I infinito, pois nada garante a existencia dos conjuntos ai tais
=
que a i = i para todo i I nem a existencia da soma e o produto cardinal. O
axioma da escolha nos assegura que estas operacoes existem e sao bem definidas,
isto e, independem dos conjuntos escolhidos para a sua realizacao. Observemos
que e um caso particular de produto cardinal, em que I = e i =
para todo i . Algumas propriedades das operacoes entre cardinais sao as
seguintes (no caso em que a propriedade requer do axioma da escolha, isto e
indicado acrescentando ([AE]) no incio do enunciado).

Proposicao 15.16 As operacoes entre cardinais satisfazem as propriedades


seguintes:
(i) = , = .
(ii) ( ) = ( ) , ( ) = ( ) .
(iii) Se entao e .
(iv) ( ) =L ( ) (
L ).
(v) ([AE]) ( iI i ) = iI ( i ).
L =
(vi) ([AE]) Se i = para todo i I, entao iI i = I .
(vii) e o cardinal do ordinal + , e e o cardinal do ordinal .

Suponha que e um cardinal. Estamos interessados em encontrar o mnimo


cardinal tal que existe uma particao de em pedacos de cardinalidade es-
tritamente menor do que . Esse cardinal mnimo e a cofinalidade de , e sera
denotado cf (). No caso em que e um cardinal tal que cf () = dizemos que
e regular. Por exemplo, nao pode ser particionado numa quantidade finita
de subconjuntos finitos; para cobrir todo por uma particao de subconjuntos
finitos precissamos de subconjuntos; portanto e um cardinal regular.

Definicao 15.17 Sejam e ordinais. S


cf denota (f )(f un(f, , ) = im(f ))
( e cofinal em
T ).
cf () denota { : cf }
(a cofinalidade de ).

Dado que cf implica que (donde + 1) entao C = { : cf


} + 1, portanto C e legitimado por [A2]. Por outro lado cf , portanto
C 6= Se entao existe cf () para todo ordinal . Se cf e f :
tal que im(f ) = S entao, para cada existe tal que f (),
pela definicao de . Ou seja, para cada existe tal que < f ().
Em outras palavras, a imagem de f nao e limitada em , portanto f e uma
sequencia
S em (indexada por ) convergendo a (a convergencia e dada pela
uniao ). Observe que se = + 1 entao cf () = 1. Com efeito, 1 cf ( + 1)
via f (0) = .

Proposicao 15.18 Sejam e ordinais limites. Em ZF vale o seguinte:


(i) cf e uma relacao transitiva.
(ii) cf () e um cardinal.

79
Definicao 15.19 Seja um cardinal. Dizemos que e regular se cf () = .
Em caso contrario, isto e, se cf () < , entao e dito singular.

Proposicao 15.20 Em ZFC vale o seguinte:


(i) e regular.
(ii) +1 e regular para todo .
(iii) Se e um ordinal limite entao cf ( ) = cf ().

Observe que, pela proposicao anterior, cf ( ) = cf () = . Por exemplo,


pode ser atingido pela sequencia

0 < 1 < 2 <

provando que e singular. Tambem temos que cf ( ) = , considerando,


por exemplo, a sequencia

0 < 1 < 2 < .

Finalmente, discutiremos brevemente a Hipotese do Contnuo (HC). Temos


duas maneiras para passar de um cardinal a outro superior: considerar () >
ou, pelo teorema de Cantor, considerar 2 > . A Hipotese do Contnuo afirma
o seguinte:

(HC) 2 0 = 1 .

Dado que R 20 entao (HC) afirma que todo subconjunto de R nao enu-
meravel e equipolente com R, isto e, nao existem subconjuntos de R de cardi-
nalidade intermediaria entre 0 e a cardinalidade de R. Portanto (HC) afirma
que 2 e () coincidem no primeiro valor 0 . A Hipotese Generalizada do
Contnuo (HGC) afirma que estas funcoes coincidem em todo cardinal . Em
outras palavras, para cada cardinal infinito nao existe um cardinal estrita-
mente entre e 2 . Em termos da funcao temos que (HGC) afirma que

(HGC) 2 = +1

para todo ordinal . Com a ajuda de (HGC) resolvemos todas as questoes


acerca das potencias cardinais:

Teorema 15.21 Assumamos (HGC). Em ZFC temos que e determinado,
sendo que

(i) = +1 se ;

(ii) = se < cf ( );

(iii) = +1 se cf ( ) .

Em 1936 Kurt Godel demonstrou que, se a teoria ZF e consistente, entao ZF C


com o acrescimo de (HC) e consistente. Por outro lado, Cohen demonstrou em
1964 (mediante a tecnica de forcing) que, se a teoria ZF e consistente, entao
ZF C com o acrescimo da negacao de (HC) tambem e consistente, portanto a

80
Hipotese do Contnuo e indecidvel na teoria ZF C. Tambem foi provado por
Cohen que, se a teoria ZF e consistente, entao ZF com o acrescimo da negacao
de [AE] tambem e consistente. Vemos assim que, em particular, tanto ZF
com o acrescimo de [AE] quanto ZF com o acrescimo da negacao de [AE] sao
consistentes, desde que ZF seja consistente. Assim, ambas teorias de conjuntos
sao validas, e a inclusao do Axioma da Escolha ou da sua negacao acaba sendo
uma questao de escolha.
Devemos observar, finalmente, que os famosos teoremas de incompletude de
Godel se aplicam a ZF , portanto existem sentencas de ZF que sao indecidveis
em ZF . Em particular, se ZF e consistente, entao ZF nao pode provar a sua
propria consistencia.

References
[1] C.A. di Prisco, Una Introduccion a la Teora de Conjuntos, Colecao
CLE, vol. 20, (UNICAMP), 1997.

[2] F.R. Drake, Set Theory: an Introduction to Large Cardinals,


North Holland, 1974.

[3] H.B. Enderton, Elements of Set Theory, Academic Press, 1977.

[4] T. Jech, Set Theory, Springer Verlag (segunda edicao), 2002.

[5] P. Suppes, Axiomatic Set Theory, Dover, 1972.

81

Você também pode gostar