Você está na página 1de 103

Elementos da Teoria dos Conjuntos

Rogério Augusto dos Santos Fajardo

24 de Novembro de 2013
2
Conteúdo

1 Aprendendo a contar 5

2 O paradoxo de Russell 13

3 A linguagem da teoria dos conjuntos 17


3.1 O alfabeto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.2 Fórmulas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.3 Unicidade de representação . . . . . . . . . . . . . . . . . . . . . . . . 19
3.4 Omissão de parênteses . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.5 Variáveis livres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.6 Abreviaturas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.7 Sistema de axiomas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.8 Notas sobre sı́mbolos relacionais e funcionais . . . . . . . . . . . . . . 25
3.9 Notas sobre a semântica . . . . . . . . . . . . . . . . . . . . . . . . . 27

4 Axioma da extensão 31

5 Axiomas do vazio, par e união 37

6 Axiomas das partes e da separação 43

7 Axioma da infinidade 47

8 Relações e funções 53
8.1 Pares ordenados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
8.2 Produto cartesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
8.3 n-uplas ordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
8.4 Funções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

9 Aritmética dos números naturais 59


9.1 Aritmética dos números naturais . . . . . . . . . . . . . . . . . . . . 60

10 Axioma da regularidade 63

11 Construção dos conjuntos numéricos 65


11.1 Relação de equivalência . . . . . . . . . . . . . . . . . . . . . . . . . . 65
11.2 Construção do conjunto dos números inteiros . . . . . . . . . . . . . . 66

3
4 CONTEÚDO

11.3 Construção do conjunto dos números racionais . . . . . . . . . . . . . 68


11.4 Construção do conjunto dos números reais . . . . . . . . . . . . . . . 69

12 Axioma da substituição 71

13 Relações de ordem 77

14 Axioma da escolha 83

15 Conjuntos equipotentes 93

16 Comparação entre conjuntos 99


Capı́tulo 1

Aprendendo a contar

A matemática é formada por conceitos abstratos que, muitas vezes, nossa intuição as-
simila com certa facilidade, mas encontramos dificuldade em formalizá-los. A maioria
das pessoas já está familiarizada com os conceitos de conjuntos, funções e relações,
mesmo sem fazer qualquer ideia sobre como explicar esses conceitos, ou sequer com-
preender uma explicação sobre eles. Esse abismo entre intuição e formalização se
evidencia quando estudamos a história da matemática, e descobrimos que conceitos
com os quais a humanidade lida desde os primórdios só foram formalizados – e de
maneira surpreendentemente simples – no século passado.
Para ilustrar isso, imaginemos a seguinte situação cotidiana. George é um me-
nino que está comemorando seu aniversário com os amiguinhos. Após cantarem os
parabéns, sua mãe lhe pede para ajudar a cortar o bolo e distribuir para os amigos.
Para ninguém ficar sem bolo e não haver desperdı́cio, George conta quantas pessoas
estão presentes na festa – digamos que foram vinte – e separa vinte fatias de bolo
para distribuir uma para cada pessoa presente.
Vamos detalhar como é esse processo de contagem, que aparenta ser tão simples.
Primeiro, George ergue a mão e aponta cada uma das pessoas que estão na festa
(inclusive ele, se também quiser comer bolo). Cada vez que ele aponta alguém, ele
fala, em voz alta um número, começando do número 1 e segue, na sequência, até o
número 20. O mesmo processo ele usa para contar as fatias de bolo.
Quando George conta as pessoas, ele está, na realidade, estabelecendo uma função
que associa a cada número natural – no caso, até 20 – uma pessoa na festa. Além de
se preocupar em pronunciar os números na sequência correta, ele toma o cuidado de
não contar duas vezes a mesma pessoa (isto é, a função tem que ser injetora) e de não
deixar ninguém de fora da contagem (isto é, a função também precisa ser sobrejetora).
Ou seja, George sabe, intuitivamente, o que significa uma função bijetora. Mais do
que isso, quando ele conta o número de pessoas e o número de pedaços de bolo –
chegando no mesmo valor – ele sabe que poderá distribuir um pedaço para cada
convidado, sem faltar ninguém (desde que cada um só coma um pedaço). Portanto,
ele sabe que a composição de funções bijetoras é bijetora.
Por trás desse conceito de função, George possui uma ideia intuitiva do que sig-
nifica conjunto: o conjunto das pessoas que estão na festa, o conjunto dos pedaços de
bolo, o conjunto dos presentes que ele ganhou, e assim por diante. Desde o momento

5
6 CAPÍTULO 1. APRENDENDO A CONTAR

que ele aprende a contar, ele consegue abstrair a ideia de conjuntos equipotentes, ou
seja, conjuntos com a mesma quantidade de elementos.
Conjunto é um conceito abstrato, e desse conceito podemos derivar todos os ou-
tros da matemática. Por exemplo, os números naturais – uma das primeiras ideias
abstratas construı́das pela matemática – surgem na tentativa de comparar o tama-
nho de conjuntos formados por objetos concretos (no caso de George, o conjunto de
pessoas na festas e o conjunto de pedaços de bolo cortados). Segundo alguns his-
toriadores da matemática, a palavra cálculo – vinda do latim calculus, que significa
pedra – surgiu do hábito dos pastores, na antiguidade (antes da humanidade criar –
ou descobrir – os números naturais) de utilizar pedras para verificarem se não perde-
ram alguma ovelha, associando cada ovelha a uma pedrinha. Com o surgimento dos
números naturais, passamos a utilizar eles próprios para a contagem de tamanhos de
conjuntos, em vez de um saquinho de pedrinhas.
Dessa forma, os conjuntos, que, inicialmente, eram abstratos mas possuı́am, como
elementos, objetos concretos, podem ser formados por objetos abstratos, como os
números naturais. Mas dessa ideia de conjuntos de objetos abstratos surge um novo
conceito que contraria a nossa intuição e tem assombrado a mente dos melhores
matemáticos: o infinito. Quando nos limitamos a investigar conjuntos formados por
objetos concretos, nunca nos deparamos com a infinitude. Mesmo o conjunto de
todas as estrelas no céu, ou mesmo de todos os átomos do universo, não importa o
quão imenso seja esse conjunto, ele possui uma quantidade limitada de elementos.
Mas os números naturais – sendo esses objetos abstratos, criados pela mente humana
(segundo algumas correntes filosóficas da matemática) – são ilimitados. Isso porque,
se existisse o maior número natural possı́vel, somarı́amos 1 a esse e obterı́amos um
número maior do que esse que seria o máximo.
O processo de contagem para conjuntos finitos, com a qual estamos acostumados
e que explicamos no exemplo do menino George, segue alguns princı́pios que perce-
bemos intuitivamente. Primeiro: não importa a ordem que seguimos na contagem de
um conjunto, encontraremos sempre o mesmo número na quantidade de seus elemen-
tos, contanto que tonhamos o cuidado de não contarmos duas vezes o mesmo elemento
e de não esquecermos de nenhum. Segundo: se tirarmos qualquer elemento de um
conjunto, obteremos, na nova contagem, um número menor de elementos (conforme
diz um axioma de Euclides, de que a parte é menor que o todo).
Porém, quando alguns matemáticos quiseram comparar tamanho de conjuntos
infinitos, começaram a ver que essas “regras”, que valem para conjuntos finitos,
deixam de valer. Galileu Galilei (1564–1642) foi um dos primeiros, que se tem notı́cia,
a usar esse conceito de funções bijetoras para comparar conjuntos infinitos. Ele
considerou a função que associa, a cada número natural, o seu dobro, conforme o
diagrama seguinte:

0 ←→ 0
1 ←→ 2
2 ←→ 4
3 ←→ 6
...
7

Com isso, Galilei mostrou que o conjunto dos números naturais “tem o mesmo ta-
manho” que o conjunto dos números pares, mesmo havendo muitos números naturais
que não são pares.

O hotel de Hilbert O matemático alemão David Hilbert (1862–1943) deu um


exemplo parecido. Se chegamos em um hotel e todos os quartos estão ocupados,
então sabemos que não há vaga nesse hotel, a menos que uma famı́lia saia. Agora
imaginemos um hotel com infinitos quartos – um para cada número natural – sendo
que todos estão ocupados. Chega uma nova famı́lia querendo se hospedar e o dono
não quer despejar nenhum hóspede, mas também não quer recusar quarto para os
recém-chegados. Como há infinitos quartos – mesmo que todos ocupados – é fácil
resolver o problema. Basta passar cada hóspede para o quarto ao lado. Assim, quem
está hospedado no quarto 0 vai para o quarto 1, e do quarto 1 para o 2, e assim por
diante, sobrando o quarto 0 para os novos hóspedes.
O problema do dono do hotel parece se complicar quando chega um ônibus com
uma infinidade de hóspedes, um hóspede para cada número natural. Mas a solução
ainda é simples: ele passa cada hóspede de um quarto para outro cujo número é o
dobro do primeiro. Sobra, assim, todos os números ı́mpares para colocar os novos
hóspedes.
E se chegarem infinitos ônibus – cada ônibus marcado por um número natural
diferente – com infinitos passageiros cada um – cada passageiro também marcado
por um número – poderá ainda o dono do hotel hospedar todo mundo? Sim. E
poderá fazê-lo de forma que não fique nenhum quarto vazio. Basta colocar o n-ésimo
passageiro do m-ésimo ônibus no quarto 2n · (m + 1) (para simplificar, desta vez
assumimos que o hotel está vazio – fica como exercı́cio verificar o que se faria se o
hotel estivesse lotado).

O paraı́so de Cantor Aparentemente o paradoxo criado por Galilei não causou


tanto impacto na matemática e na filosofia, nem foi devidamente explorado durante
alguns séculos. Foi só no século XIX que o assunto foi trazido novamente à tona pelo
matemático alemão Georg Cantor (1845–1918). Dessa vez, o impacto transformou
totalmente o rumo da matemática moderna e deu inı́cio à teoria dos conjuntos, que
será estudada neste curso.
Cantor não só criou um paradoxo ou uma discussão filosófica através dessa ideia
de comparar tamanho de conjuntos infinitos: ele de fato resolveu um problema ma-
temático usando esse conceito. Enquanto outros matemáticos tiveram uma grande
dificuldade para provar que números como π e e são transcendentes (isto é, não são
raı́zes de equações polinomiais de coeficientes inteiros), Cantor provou, de maneira re-
lativamente simples, que existem muitos números transcendentes, mesmo sem exibir
um sequer. Vamos aqui tratar brevemente dessa demonstração.
O conjunto dos números algébricos (os não transcendentes) aparentemente é
muito maior que os números naturais. Para começar, esse engloba todos os raci-
onais, uma vez que a fração ab é raiz da equação bx − a, e quase todos os números
reais que conhecemos. Os transcendentes parecem ser estranhas exceções dentro do
conjunto dos números reais. Se os irracionais já parecem aberrações, mais ainda
8 CAPÍTULO 1. APRENDENDO A CONTAR

os números transcendentes. Pois Cantor provou justamente o contrário: há muito


mais números transcendentes do que algébricos. De fato, o conjunto dos números
algébricos tem o mesmo tamanho que o conjunto dos números naturais.

Estabelecer uma bijeção entre os números naturais e os algébricos não é difı́cil.


Primeiro, precisamos estabelecer uma bijeção entre os números naturais e os po-
linômios de coeficientes inteiros, ou seja, colocarmo-los numa sequência, como uma
fila infinita.

O inı́cio da sequência deve ser constituı́da pelos polinômios de grau 1 e cujos


coeficientes têm módulo menor ou igual a 1. Está claro que existe apenas uma
quantidade finita desses polinômios. Podemos dispô-los em ordem lexicográfica, como
a usada em dicionários, conforme descrevemos abaixo.

−x − 1
−x
−x + 1
x−1
x
x+1

Continuamos a sequência escrevendo os polinômios de grau menor ou igual a 2,


cujos coeficientes têm módulo menor ou igual a 2, e que não estão na lista anterior.
Usamos a mesma ordem lexicográfica dos coeficientes, começando com os polinômios
de grau menor (ou maior, como queiram). Prosseguimos esse processo para 3, 4 e
assim por diante, e isso irá contemplar todos os polinômios de coeficientes inteiros,
conforme ilustra o seguinte diagrama:
9

0 ←→ −x − 1
1 ←→ −x
2 ←→ −x + 1
3 ←→ x−1
4 ←→ x
5 ←→ x+1
6 ←→ −2x − 2
7 ←→ −2x − 1
8 ←→ −2x
9 ←→ −2x + 1
10 ←→ −2x + 2
11 ←→ −x − 2
12 ←→ −x + 2
13 ←→ x−2
14 ←→ x+2
15 ←→ 2x − 2
16 ←→ 2x − 1
17 ←→ 2x
18 ←→ 2x + 1
19 ←→ 2x + 2
20 ←→ −2x2 − 2x − 2
...
Agora, para “colocarmos em fila” os números algébricos basta substituirmos cada
polinômio pelas suas raı́zes (em ordem crescente), suprimindo os que já foram listados.
Fazendo assim obtemos:

0 ←→ −1 (raiz do polinômio −x − 1)
1 ←→ 0 (raiz do polinômio −x)
2 ←→ 1 (raiz do polinômio −x + 1)
3 ←→ −2 (raiz do polinômio −x − 2)
4 ←→ 2 (raiz do polinômio −x + 2)
5 ←→ − 21 (raiz do polinômio −2x − 1)
1
6 ←→ 2√
(raiz do polinômio −2x + 1)
1− 3
7 ←→ 2√
(primeira raiz de −2x2 − 2x + 1)
1+ 3
8 ←→ 2
(segunda raiz de −2x2 − 2x + 1)
...
Com isso Cantor mostrou que o conjunto dos números algébricos “tem o mesmo
tamanho” que o dos números naturais. Isso significa dizer que o conjunto dos números
algébricos é enumerável, ou seja, podemos enumerar todos seus elementos numa lista
infinita, indexada com os números naturais.
É fácil intuir 1 que um subconjunto infinito de um conjunto enumerável é enu-
merável. Assim, os conjuntos dos números inteiros, racionais e algébricos são todos
enumeráveis.
1
A demonstração rigorosa desse fato é mais trabalhosa, como veremos posteriormente.
10 CAPÍTULO 1. APRENDENDO A CONTAR

A essa altura começamos a imaginar que todos os conjuntos são enumeráveis.


Talvez por isso o aparente paradoxo de Galilei não tenha impactado tanto os ma-
temáticos. Infinito é infinito e parece natural que todos os conjuntos infinitos te-
nham o mesmo tamanho. Parece que, se nos esforçarmos bem, como fizemos com os
números algébricos, conseguimos colocar qualquer conjunto infinito numa sequência
bem comportada. Porém, Cantor surpreende a todos ao provar que o conjunto dos
números reais não é enumerável.
Vejamos a prova de Cantor da não-enumerabilidade dos números reais. Seja f
uma função de N em R. Mostraremos que f não pode ser sobrejetora.
Para cada n natural, consideremos an a parte inteira de f (n) e (anm )m∈N a
sequência dos algarismos após a vı́rgula na representação decimal 2 de f (n).

f (0) = a0 , a00 , a01 , a02 , a03 . . .


f (1) = a1 , a10 , a11 , a12 , a13 . . .
f (2) = a2 , a20 , a21 , a22 , a23 . . .
f (3) = a3 , a30 , a31 , a32 , a33 . . .
...
Agora mostremos que existe um real r que não pertence a essa lista. Definimos
r da seguinte forma: a parte inteira pode ser qualquer número (0, por exemplo) e
a n-ésima casa decimal de r será 1 se ann for 0 e será 0 caso contrário. Portanto,
para todo n teremos que a n-ésima casa de f (n) difere da n-ésima casa de r, de onde
concluı́mos que r não está na imagem de f .
Ou seja, escolhemos um número real que “evita” a diagonal da matriz infinita
formada pelas casas decimais de cada número real da sequência. Essa prova ficou
conhecida como argumento diagonal de Cantor 3 .
Com isso Cantor mostrou que o conjunto dos números reais é não-enumerável,
isto é, realmente a quantidade de números reais é maior que dos números naturais.
Ora, se o conjunto dos números algébricos é enumerável, e o conjunto dos números
reais é não-enumerável, concluı́mos que existem infinitos números reais que não são
algébricos.
Concluı́mos também que há uma bijeção entre os números reais e os transcen-
dentes. De fato, considere em R uma sequência (xn )n∈N de números transcendentes
distintos (por exemplo, xn pode ser π + n) e (an )n∈N a sequência de todos os números
algébricos (lembre-se que os algébricos são enumeráveis). Podemos definir uma função
bijetora do conjunto dos números reais nos transcentendes da seguinte forma: cada
an é mapeado para x2n , cada xn é mapeado para x2n+2 , e os demais números são
mapeados para eles mesmos.
A demonstração de Cantor causou uma das maiores controvérsias da história da
matemática. Para alguns, essa prova desvirtua o propósito da matemática e perde
relação com o mundo real. Uma corrente filosófica da matemática – os construti-
vistas – não aceitou o argumento de Cantor pois ele prova a existência de diversos
2
Aqui assumimos que a representação decimal é aquela que nunca utiliza uma dı́zima de perı́odo
9. Ou seja, a representação decimal de 1 que consideraremos é 1, 000 . . ., e não 0, 999 . . ..
3
Um argumento semelhante foi usado por Gödel em uma parte crucial da demonstração do
Teorema da Incompletude.
11

números transcendentes sem ser capaz de exibir (a partir da prova) sequer um número
transcendente.
Para outros matemáticos, no entanto, a prova de Cantor foi uma inovação no
pensamento abstrato e um grande passo para a Rainha das Ciências. O matemático
francês Henry Poincaré (1854–1912) chegou a dizer que “o cantorismo é uma doença
da qual a matemática precisa se curar ´´, enquanto, por outro lado, David Hilbert
reagia às crı́ticas a Cantor dizendo que “ninguém nos tirará do paraı́so criado por
Cantor ´´.

Exercı́cios
1. Mostre uma bijeção entre o conjunto dos números inteiros e os naturais.

2. Prove que qualquer subconjunto infinito dos números naturais é enumerável.

3. Na bijeção que construı́mos entre os números naturais e os polinômios, encontre


o polinômio associado ao número 30.

4. Na bijeção que construı́mos entre os números√naturais e os números algébricos,


encontre o número natural associado ao número 2

5. Suponha que, em um conjunto infinito, existe uma forma de representar cada ele-
mento do conjunto como uma sequência finita de sı́mbolos, dentre um conjunto finito
de sı́mbolos. Mostre que esse conjunto é enumerável e use esse resultado diretamente
para mostrar que os conjuntos dos números racionais e dos números algébricos são
enumeráveis.
12 CAPÍTULO 1. APRENDENDO A CONTAR
Capı́tulo 2

O paradoxo de Russell

O que é conjunto? Todos têm uma noção intuitiva do que é um conjunto, mas, como
sempre ocorre na matemática (e ocorreu com o próprio Euclides, quando tentou
definir o que era ponto e reta), qualquer tentativa de definição seria circular ou
insatisfatória. Portanto, como costuma ocorrer na matemática moderna, em vez de
tentarmos explicar o que são os conjuntos, nos limitaremos a descrever como são os
conjuntos, enunciando os axiomas que os regem, e discutindo o conceito intuitivo que
tais axiomas procuram formalizar.
Inicialmente, o conceito de conjuntos estava diretamente ligado ao das fórmulas
da linguagem de primeira ordem com uma variável livre. Por exemplo, a fórmula
∃y(x = 2 · y) tem x como variável livre (veremos isso no próximo capı́tulo) e, se
pensarmos no universo dos números naturais, representa o conjunto dos números
pares. Um conjunto, então, é determinado por uma propriedade.
Gottlob Frege (1848–1925) tentou levar essa ideia adiante, propondo uma forma-
lização da matemática em que lógica e conjuntos eram praticamente indissociáveis.
Porém, Bertrand Russell (1872–1970) encontrou uma inconsistência nessa forma-
lização, através do seu famoso paradoxo 1 .
Se qualquer propriedade determina um conjunto, então podemos definir um con-
junto X como o conjunto de todos os conjuntos que não pertencem a si mesmos 2
Se permitirmos livremente a construção de conjuntos através de uma expressão
que descreve todos seus elementos, e ainda utilizarmos a linguagem natural, cheia
de auto-referências, podemos definir o conjunto de todos os objetos que podem ser
descritos com menos de vinte palavras. Certamente esse conjunto, se assim existisse,
pertenceria a ele próprio. Ou, um exemplo mais simples, se existir o conjunto de
todos os conjuntos, ele pertence a si próprio.
Surge a pergunta: X pertence a si mesmo? Se sim, então, pela sua definição, ele
1
Esse paradoxo possui uma variança popular conhecido como paradoxo do barbeiro, que dizia
que havia numa cidade um barbeiro que cortava o cabelo de todas as pessoas que não cortavam seu
próprio cabelo, e apemas dessas.
2
Podemos nos perguntar se é possı́vel um conjunto pertencer a si próprio. Nota-se que há uma
diferença entre pertencer a si próprio e estar contido em si próprio. Essa confusão entre as duas
relações é muito comum, devido a uma falha clássica do ensino de matemática no nı́vel básico, que
será discutida melhor durante a disciplina. Um conjunto sempre está contido nele próprio, mas
poderá pertencer a si próprio?

13
14 CAPÍTULO 2. O PARADOXO DE RUSSELL

não pode pertencer. Se não pertence a si mesmo, novamente usando sua definição,
concluı́mos que ele pertence. Chegamos numa inevitável contradição, que só se resolve
não permitindo a existência de tal conjunto.
Isso derruba a proposta de Frege de unificar conjuntos e lógica, relacionando
um conjunto com uma sentença que descreve seus elementos. Para contornar esse
problema surgiram várias alternativas. O próprio Bertrand Russell criou uma for-
malização da aritmética usando teoria dos tipos. Nela, os objetos são classificados
hierarquicamente. Os objetos de primeiro tipo são os números naturais. Os objetos
de segundo tipo são os conjuntos de números naturais. Os de terceiro tipo são os
conjuntos de conjuntos de números naturais, e assim por diante. Nessa formalização,
a pertinência só poderia ser usada entre um objeto de um determinado tipo e outro
do tipo subsequente. Por exemplo, entre números e conjuntos de números.
Ernest Zermelo (1871–1953) e Abraham Fraenkel (1891–1965) propuseram uma
outra formalização mais eficaz e mais simples. Diferente da proposta de Russell, no
sistema de Zermelo e Fraenkel – conhecido como ZFC, quando consideramos o axioma
da escolha (do inglês choice, ou como ZF, quando não consideramos tal axioma – tudo
é conjunto, e podemos agrupar vários objetos matemáticos em um mesmo conjunto.
Como tudo é conjunto, em particular, os próprios números naturais são conjuntos, e
os elementos de conjuntos sempre são conjuntos. Não há a distinção absoluta entre
“elementos” e “conjuntos”, como erroneamente nos ensinaram alguns professores de
ensino médio, nem tampouco há uma hierarquia entre “tipos” de conjuntos, como
formalizou Bertrand Russell.
Para resolver o problema do paradoxo de Russell, a solução foi a seguinte: pode-
mos definir um conjunto através de uma propriedade, como queria Frege, desde que
essa propriedade seja estabelecidada a partir de um conjunto previamente fixado. Por
exemplo, não podemos definir o conjunto de todos os conjuntos finitos, pois não está
claro qual é o universo que estamos considerando, mas podemos definir o conjunto
dos números reais que são maiores que 2. Ou seja, dentro de um conjunto previa-
mente fixado, separamos aqueles que têm a propriedade desejada. Esse é o axioma
da separação, que iremos falar, com mais detalhes, em algumas aulas.
Essa restrição criada pelo axioma da separação em relação à proposta inicial
de Frege cria uma dificuldade na axiomatização: o axioma da separação não nos
permite criar um conjunto “do nada”, sendo necessários outros axiomas que garantem
a existência de certos conjuntos. Assim, enquanto na teoria intuitiva dos conjuntos
– que mais se aproxima da concepção de Frege – basta definirmos um conjunto para
garantir sua existência, na teoria axiomática precisamos provar que ele existe, através
dos axiomas.
Podemos separar os axiomas de ZFC em três grupos. O primeiro deles é formado
pelos axiomas que garantem a existência de um conjunto, em particular. São eles: o
axioma do vazio e o axioma da infinidade. Como os nomes sugerem, eles garantem a
existência, respectivamente, do conjunto vazio e de um conjunto infinito.
O segundo grupo de axiomas é formado por aqueles que nos permitem construir
uns conjuntos a partir de outros. São eles o axioma do par, o axioma da união,
o axioma das partes, o axioma da escolha, o axioma da separação e o axioma da
substituição. Na realidade, esses dois últimos não são, propriamente, axiomas, mas
15

esquemas de axiomas (isto é, sequências infinitas de axiomas dadas por alguma regra
especı́fica), pois, conforme vimos (e veremos com mais detalhes quando estudarmos a
linguagem da teoria dos conjuntos), cada propriedade nos dará uma versão diferente
do axioma da separação. O axioma da substituição é uma generalização do axioma
da separação.
O terceiro grupo de axiomas de ZFC são aqueles que descrevem a natureza dos
conjuntos. São eles: o axioma da extensão e o axioma da regularidade. O primeiro
serve para determinar quando dois conjuntos são iguais, e o segundo garante que
todos os conjuntos são construı́dos sequencialmente a partir do vazio, evitando cir-
cularidades como “um conjunto pertencer a ele próprio”.
A versão atual do axioma da separação impede que o paradoxo de Russell gere
uma contradição no sistema. Porém, o argumento de Russell mostra um teorema
importante de ZFC: não existe o conjunto de todos os conjuntos. De fato, se existisse,
o axioma da separação garantiria a existência do conjunto de todos os conjuntos que
não pertencem a si mesmos, gerando, novamente, o paradoxo. Retornaremos a esse
assunto quando falarmos, formalmente, do axioma da separação.
Na tentativa de resgatar a conceitologia de Frege – de definir coleções de objetos a
partir de uma propriedade, sem impor alguma limitação no universo, como ocorre com
o axioma da separação – alguns matemáticos criaram outras teorias dos conjuntos
onde é apresentado o conceito de classe. Todos os conjuntos são classes, mas algumas
classes – chamadas de classes próprias – são “grandes demais para formarem um
conjunto”. Por exemplo: classe de todos os conjuntos, classe de todas as funções, e
assim por diante. As teorias que formalizam o conceito de classe dentro da teoria
dos conjuntos são NGB (Neumann-Gödel-Bernays) e KM (Kelley-Morse). Porém,
dentro de ZFC podemos trabalhar com o conceito de classe identicando-a com uma
fórmula. Apesar dessas três teorias adotarem formalizações diferentes, os resultados
são essencialmente o mesmo.
Como o axioma da separação depende de escrevermos uma propriedade, não po-
demos axiomatizar a teoria dos conjuntos valendo-se apenas da imprecisa linguagem
natural. Faz-se necessário criarmos uma linguagem de sintaxe controlada e livre de
contexto – como idealizou Frege – que não deixe dúvidas sobre quais frases possam
ser consideradas “propriedades”. Para isso, o próximo capı́tulo discorrerá sobre a
linguagem da lógica de primeira ordem, que será usada na teoria dos conjuntos.
16 CAPÍTULO 2. O PARADOXO DE RUSSELL
Capı́tulo 3

A linguagem da teoria dos


conjuntos

Há um cı́rculo vicioso entre lógica de primeira ordem e teoria dos conjuntos. A for-
malização de uma depende da formalização da outra. Seja como for que lidemos
com essa dicotomia, em algum momento precisamos apelar para a abordagem intui-
tiva da outra. Ou seja, podemos desenvolver toda a teoria dos conjuntos de forma
axiomática mas utilizando a linguagem natural (tal como Halmos faz em seu livro,
e também como é feito nas disciplinas de Análise Real e Álgebra) para, posterior-
mente, formalizarmo-la com a lógica de primeira ordem (que possui a vantagem de
ser muito próxima à argumentação que costumamos fazer na linguagem natural, para
provarmos teoremas matemáticos). Ou podemos estudar lógica primeiro, utilizando
noções intuitivas de teoria dos conjuntos – tais quais aprendemos no Ensino Médio
– para depois desenvolvermos a teoria dos conjuntos axiomaticamente. Seguiremos
aqui uma terceira opção: apresentar apenas uma parte da lógica de primeira ordem
(a sintaxe) – que requer apenas uma parcela mı́nima de noções intuitivas de conjuntos
e aritmética – para depois formalizar a teoria dos conjuntos com o rigor da lógica.
Podemos separar a lógica de primeira ordem em três aspectos: a linguagem,
o sistema de axiomas e a semântica. Os dois primeiros constituem a sintaxe da
lógica de primeira ordem, que trata da manipulação dos sı́mbolos através de regras
bem definidas, livre de contexto e de significado. A semântica trata justamente do
significado das expressões lógicas. É justamente na semântica que o uso de teoria
dos conjuntos é mais evidente e, por essa razão, trataremos aqui apenas da parte
sintática, fazendo apenas alguns comentários a respeito da semântica.
A lógica de primeira ordem pode se adaptar a vários contextos, apresentando
sı́mbolos especı́ficos de algum assunto que quisermos axiomatizar. Assim, para axi-
omatizar a aritmética utilizamos alguns sı́mbolos especı́ficos da aritmética, como +,
×, 0 e 1. Na teoria dos conjuntos, o sı́mbolo especı́fico será o de pertinência (∈).
Por isso, muitas vezes, em vez de dizermos a lógica de primeira ordem, dizemos uma
lógica de primeira ordem, ou uma linguagem de primeira ordem.
Aqui trataremos especificamente da linguagem da teoria dos conjuntos. Não
demonstraremos nenhum dos teoremas aqui enunciados 1 . Como referência recomen-
1
Os teoremas a respeito da lógica de primeira ordem fazem parte do que chamamos de meta-

17
18 CAPÍTULO 3. A LINGUAGEM DA TEORIA DOS CONJUNTOS

damos o livro Set Theory and Logic, de Robert Stoll.

3.1 O alfabeto
Os sı́mbolos utilizados na linguagem da teoria dos conjuntos são os seguintes:

Variáveis: representadas pelas letras minúsculas: x, y, z, . . .. Eventualmente, são


indexadas pelos números naturais: x1 , x2 , x3 , . . ..

Conectivos: ¬ (negação – “não”), → (condicional – “se. . . então”), ∧ (conjunção –


“e”), ∨ (disjunção – “ou”), ↔ (bicondicional – “se, e somente se”).

Quantificadores: ∀ (quantificador universal – “para todo”), ∃ (quantificador exis-


tencial – “existe”).

Parênteses: são os parênteses esquerdo e direito: ( e ).

Sı́mbolo de igualdade: =

Predicado binário: ∈ (pertence).

3.2 Fórmulas
Fórmulas são sequências finitas de sı́mbolos do alfabeto que seguem as seguintes
regras:

1. Se x e y são variáveis, x ∈ y e x = y são fórmulas.

2. Se A e B são fórmulas, ¬(A), (A) → (B), (A) ∧ (B), (A) ∨ (B) e (A) ↔ (B)
são fórmulas;

3. Se A é fórmula e x é uma variável, então ∀x(A) e ∃x(A) são fórmulas.

4. Todas as fórmulas têm uma das formas descritas nos itens 1, 2 e 3.

Por exemplo, pela regra 1, temos que x ∈ y é uma fórmula. Pela regra 1, x = z
também é uma fórmula. A regra 2 nos garante que (x ∈ y) → (x = z) é uma
fórmula. Logo, a regra 3 nos garante que ∀x((x ∈ y) → (x = z)) é uma fórmula.
matemática, isto é, a matemática utilizada para formalizar a matemática. A lógica de primeira
ordem é a linguagem utilizada na matemática. Então nos perguntamos qual é a linguagem utilizada
quando formalizamos a lógica de primeira ordem. Obviamente, utilizamos a linguagem natural,
mas podemos, posteriormente, formalizá-la utilizando a própria ordem de primeira ordem. A essa
linguagem que utilizamos para descrever a lógica de primeira ordem chamamos de metalinguagem.
Em seu livro Uma Breve História do Tempo, Stephen Hawking menciona uma história que serve
como uma curiosa alegoria para entendermos o que é metalinguagem e metamatemática: de acordo
com algumas pessoas, a Terra era achatada e estava apoiada no casco de uma tartaruga gigante,
sendo que essa tartaruga, por sua vez, estava apoiada no casco de uma outra tartaruga gigante, e
assim sucessivamente.
3.3. UNICIDADE DE REPRESENTAÇÃO 19

De fato, é uma expressão que “faz sentido” (ou seja, entendemos o que ela significa,
independente de ser verdadeira ou não). Traduzindo para a linguagem natural, seria
o seguinte: “para todo x, se x pertence a y então x é igual a z”. Ou, simplesmente,
“z é o único elemento de y”.
As fórmulas usadas no processo de construção de fórmulas mais complexas são
chamadas de subfórmulas. Por exemplo, A e B são subfórmulas de (A) → (B). No
caso do nosso exemplo, as subfórmulas de ∀x((x ∈ y) → (x = z)) são x ∈ y, x = z,
(x ∈ y) → (x = z) e, para alguns efeitos práticos, consideramos a própria fórmula
∀x((x ∈ y) → (x = z)) como subfórmula dela mesma.
As fórmulas que constam no item 1 são chamadas de fórmulas atômicas, porque
não podem ser divididas em subfórmulas menores.

3.3 Unicidade de representação


A regra 4 nos diz que as únicas fórmulas são aquelas que se enquadram numa das
três anteriores. Ou seja, toda fórmula é da forma x ∈ y, x = y, ¬(A), (A) → (B),
(A) ∧ (B), (A) ∨ (B), (A) ↔ (B), ∀x(A) ou ∃x(A), onde x e y são variáveis e A
e B são fórmulas. Uma questão importantı́ssima para evitarmos ambiguidades na
limguagem é: toda fórmula pode ser escrita em apenas uma dessa maneira? Isto é,
olhando para uma sequência de sı́mbolos que representa uma fórmula, existe apenas
uma maneira de lermos essa sequência de sı́mbolos como uma dessas formas?
A resposta é sim: se escrevemos uma fórmula de duas possı́veis maneiras, tanto o
sı́mbolo quanto as variáveis e fórmulas envolvidas são as mesmas, nas duas maneiras.
Não demonstraremos isso aqui. Apenas ressaltamos que esse é o papel dos parênteses
na fórmula. Por exemplo, se não houvesse parênteses, considere a fórmula x ∈ y →
x = z ∨ z ∈ x. Podemos cosiderá-la como da forma A → B, onde A é a fórmula x ∈ y
e B é a fórmula x = z ∨ z ∈ x, ou como da forma A ∨ B, onde A é a fórmula x ∈
y → x = z e B é a fórmula z ∈ x. Assim, sem os parênteses não sabemos se se trata
de uma disjunção ou de uma implicação, gerando uma ambiguidade que, inclusive,
fará diferença na interpretação da fórmula. Porém, com a regra dos parênteses na
formação das fórmulas, ou a escrevemos (x ∈ y) → ((x = z) ∨ (z ∈ x)) – que
não há outra forma de descrevermo-la senão da forma (A) → (B) – ou escrevemos
((x ∈ y) → (x = z))∨(z ∈ x) – que é uma fórmula exclusivamente da forma (A)∨(B).
Há uma notação que dispensa o uso de parênteses e, mesmo assim, é livre de
ambiguidades. Chama-se notação pré-fixada, ou notação polonesa, que consiste em
colocar os sı́mbolos na frente das fórmulas e variáveis. Por exemplo, no lugar de
x ∈ y escreverı́amos ∈ xy, no lugar de x = y seria = xy, em vez de (A) ∧ (B)
terı́amos ∧AB. As fórmulas que acabamos de escrever ficariam →∈ xy∨ = xz ∈ zx
ou ∨ →∈ xy = xz ∈ zx. Essa notação é elegante e evidencia a questão da unicidade,
pois basta observarmos o primeiro sı́mbolo para reconhecermos o formato da fórmula.
Porém, como o leitor deve ter percebido, a leitura e compreensão das fórmulas escritas
nessa notação não são nada intuitivas, e se tornam piores para fórmulas longas 2 .
2
Quem já usou a calculadora financeira HP12C deve se lembrar que ela usa uma notação seme-
lhante, só que pós-fixada, em vez de pré-fixada. Ou seja, nessa calculadora pressionamos primeiro
20 CAPÍTULO 3. A LINGUAGEM DA TEORIA DOS CONJUNTOS

3.4 Omissão de parênteses


Como uma espécie de abuso de notação, às vezes omitimos alguns parênteses des-
necessários para a correta compreensão da fórmula. Por exemplo, embora a forma
correta seja (x = y) ∧ (¬(x ∈ y)), podemos escrever simplesmente (x = y) ∧ ¬(x ∈ y),
sem prejuı́zo da compreensão da fórmula. Outra situação é que evitamos o uso de
parênteses é em torno de um quantificador, como no exemplo ∀x(x ∈ y) → ∃x(x ∈ y).
Em sequência de conjunções ou de disjunções também omitimos os parênteses.
Por exemplo, podemos escrever simplesmente (x = y) ∨ (x ∈ y) ∨ (y ∈ x). Embora
essa notação seja ambı́gua a respeito do formato – pois, apesar de sabermos que
é uma fórmula do tipo (A) ∨ (B), não tem como sabermos se A é x = y e B é
(x ∈ y) ∨ (y ∈ x), ou se A é (x = y) ∨ (x ∈ y) e B é y ∈ x – as duas possı́veis formas
são logicamente equivalentes, ou seja, expressam o mesmo significado.

3.5 Variáveis livres


Cada lugar que surge uma variável dentro de uma subfórmula atômica de uma fórmula
chamamos de ocorrência de tal variável. Por exemplo, a fórmula (x = y) ∨ (x ∈ z)
apresenta duas ocorrências da variável x, e uma de cada uma das variáveis y e z.
Na fórmula ∀x(x = y), não consideramos o primeiro sı́mbolo x como uma ocorrência
da variável, pois não está numa subfórmula atômica. Ou seja, não consideramos
como ocorrência de uma variável quando tal sı́mbolo está imediatamente após um
quantificador.
Dizemos que uma ocorrência de uma variável y numa fórmula A está no escopo
de uma variável x se a A apresenta uma subfórmula da forma ∀x(B) ou ∃x(B), e essa
ocorrência de y está em B. Por exemplo, na fórmula (x ∈ y) ∧ ∃x(y = x), a segunda
ocorrência de y está no escopo da variável x, mas a primeira, não.
Dizemos que uma ocorrência de uma variável x numa fórmula A é livre se tal
ocorrência não está no escopo dela mesma. Chamamos de variáveis livres de uma
fórmula A aquelas que apresentam pelo menos uma ocorrência em que é livre. Uma
sentença é uma fórmula que não apresenta variáveis livres.
Por exemplo, a fórmula ¬(x ∈ y) (x não pertence a y) apresenta duas variáveis
livres: x e y. Não podemos, portanto, julgar tal fórmula como verdadeira ou falsa,
pois não conhecemos quem é x ou quem é y. As variáveis correspondem ao pronome,
na linguagem cotidiana. Se falarmos Ele foi à feira, a pergunta que naturalmente
surge é: Ele quem? Se falarmos João foi à feira, ou alguém do prédio foi à feira, ou
todo mundo do prédio foi à feira, então a frase fica mais completa, e ganha o status
de sentença, que permite averiguar se a frase é verdadeira ou falsa.
Digamos, então, que acrescentemos um quantificador no nosso exemplo. A fórmula
∀x¬(x ∈ y) tem apenas uma variável livre: que é y. A variável x não ocorre livre, pois
só ocorre no escopo dela própria. A fórmula significa “para todo x, x não pertence
a y”, ou, colocada de outra forma, “y não possui elementos”, ou, simplesmente “y é
um conjunto vazio”. Observamos que, para julgarmos a fórmula como verdadeira ou
os números (separados pela tecla “enter”) e depois pressionamos a operação para obtermos os re-
sultados.
3.6. ABREVIATURAS 21

falsa, basta agora conhecermos quem é y. Em outras palavras, a fórmula em questão


nos dita uma propriedade a respeito de y, enquanto a fórmula ¬(x ∈ y) dita uma
propriedade a respeito de x e de y.
Se, porém, escrevemos ∃y∀x¬(x ∈ y), não há mais variáveis livres nessa fórmula.
Essa é uma sentença, cujo significado não depende mais de interpretarmos as variáveis.
Essa sentença diz que existe um conjunto vazio, que veremos ser verdadeira. Se es-
crevêssemos ∀y∀x¬(x ∈ y) terı́amos um significado totalemnte diferente, que seria
todo conjunto é vazio. Claramente essa é uma sentença falsa. Mas é uma sentença,
pois os sı́mbolos estão dispostos numa ordem que faz sentido e não apresenta variáveis
livres.
Se A é uma fórmula e x e y são variáveis, denotamos por Ayx a fórmula obtida ao
substituirmos toda ocorrência livre da variável x pela variável y. Por essa notação,
A é sentença se Ayx é igual a A, para todas variáveis x e y.
Frequentemente denotamos por P (x) uma fórmula que tem x como (única) variável
livre, ou por P (x, y) uma fórmula que tem duas variáveis livres, x e y (e analogamente
para outras quantidades de variáveis livres). Nesse caso, P (y) denota P (x)yx .
O motivo de utilizarmos a letra P nessa notação é justamente pelo fato de P (x)
designar uma propriedade de x. Veremos mais para frente como criar fórmulas para
representar propriedades como “x é um conjunto infinito”, ou “x é enumerável”.

3.6 Abreviaturas
À medida que desenvolvemos assuntos mais complexos, as fórmulas vão se tornando
demasiadamente longas e ilegı́veis. Para resolver isso, introduzimos novos sı́mbolos
que funcionam como abreviaturas para expressões maiores. O importante é que o
processo de conversão da linguagem abreviada para a linguagem da lógica de primeira
ordem seja perfeitamente claro.
Comecemos a exemplificar isso com o sı́mbolo de inclusão. Dizemos que x está
contido em y se todo elemento de x pertence a y. A fórmula para designar inclusão
é ∀z((z ∈ x) → (z ∈ y)). Observe que essa fórmula tem duas variáveis livres, x e y.
Abreviamos essa fórmula como x ⊂ y.
Assim como o sı́mbolo de pertinência, a inclusão é um predicado binário (ou
sı́mbolo relacional binário), pois relaciona uma propriedade entre dois objetos do
universo (no caso, o universo dos conjuntos). Poderı́amos ter introduzido o sı́mbolo
de inclusão entre os sı́mbolos primitivos, como o de pertinência. Mas como a inclusão
é perfeitamente definı́vel a partir da pertinência e dos demais sı́mbolos lógicos, é
tecnicamente mais fácil utilizarmos o sı́mbolo de inclusão apenas como abreviatura.
Outras abreviaturas são um pouco mais sutis na transcrição. Por exemplo, o
conjunto vazio é denotado por ∅. A rigor, para utilizarmos a expressão o conjunto
vazio e denotá-lo por um sı́mbolo, antes precisarı́amos mostrar que ele existe e é único.
Aceitemos esse fato, por enquanto, antes de o provarmos num momento oportuno.
Saber utilizar corretamente essa abreviatura requer um pouco mais de atenção.
Primeiro notemos que, ao contrário da inclusão, o conjunto vazio não se refere a uma
relação entre objetos, mas a um objeto em particular, e, ao contrário das variáveis,
22 CAPÍTULO 3. A LINGUAGEM DA TEORIA DOS CONJUNTOS

se refere a um objeto bem definido. Corresponde a um nome próprio na linguagem


cotidiana. A esse tipo de sı́mbolo, na lógica, chamamos de constante.
Assim como as variáveis, as constantes são termos, isto é, se referem a objetos
do universo. Podemos utilizá-las no lugar de uma variável em fórmulas atômicas.
Por exemplo, ∅ ∈ x é uma fórmula na linguagem abreviada. Para encontrarmos
o correspondente na linguagem original, precisamos explicar quem é ∅. Para isso,
tomamos uma variável que não está na fórmula (y, por exemplo) e escrevemos da
seguinte forma:
∀y((∀x¬(x ∈ y)) → y ∈ x)

Um importante detalhe da fórmula acima é que a ocorrência não-livre da variável


x não mantém qualquer relação com a ocorrência livre que ocorre a seguir (se quise-
rem, podem substituir x por z, tanto na primeira ocorrência, em x ∈ y quanto após
o ∀). A fórmula significa, numa interpretação literal, “para todo y, se y não possui
elementos, então y é pertence a x”, ou, “para todo y, se y é vazio, então y pertence
a x”, ou, simplesmente, “o conjunto vazio pertence a x”. Notem que essa fórmula
apresenta x como a única variável livre.
Descrevemos, a seguir, o processo formal dessa abreviatura:

Seja B a sequência de sı́mbolos obtida ao substituirmos todas as


ocorrências livres de uma variável x numa fórmula A pelo sı́mbolo ∅.
Então B designará a fórmula ∀x((∀y¬(y ∈ x)) → (A).

Outro exemplo que citaremos aqui é da união de conjuntos. A expressão x ∪ y


representa o conjunto formado pelos elementos que pertencem x ou a y. Ou seja,
∀z(z ∈ x ∪ y ↔ ((z ∈ x) ∨ (z ∈ y)).
Desta vez, essa abreviatura trata-se de um sı́mbolo funcional binário, pois associa
a cada dois objetos do universo um terceiro. Outros exemplos de sı́mbolos funcionais
binários são as operações + e × na aritmética. Eis o detalhamento do processo de
abreviatura:

Sejam A uma fórmula e x, y, z variáveis distintas. Seja B a sequência


de sı́mbolos obtida ao substituirmos toda ocorrência livre de z em A por
x ∪ y. Então B designa a fórmula

∀z(∀w((w ∈ z) ↔ ((w ∈ x) ∨ (w ∈ y))) → A)

Para algumas finalidades – como no estudo da metamatemática ou na elaboração


do sistema de axiomas, como será feito na seção seguinte – convém reduzirmos os
sı́mbolos primitivos ao mı́nimo possı́vel. A partir de agora, passaremos a considerar
como sı́mbolo primitivo da linguagem apenas as variáveis, os parênteses, o sı́mbolo
de pertinência ∈, o sı́mbolo de igualdade =, o quantificador universal ∀, a negação ¬
e a implicação →.
Definiremos a partir desses sı́mbolos os demais anteriormente descritos: ∨, ∧, ↔
e ∃. Eis as regras:
3.7. SISTEMA DE AXIOMAS 23

(A) ∨ (B) é abreviatura para (¬(A)) → (B);

(A) ∧ (B) é abreviatura para ¬((¬(A)) ∨ (¬(B));

(A) ↔ (B) é abreviatura para ((A) → (B)) ∧ ((B) → (A));

∃x(A) é abreviatura para ¬(∀x(¬(A))).

Fica como exercı́cio ao leitor entender, a partir da concepção intuitiva desses


sı́mbolos, o porquê dessas abreviaturas.

3.7 Sistema de axiomas


O sistema de axiomas da lógica de primeira ordem é composto de sete axiomas e
duas regras de inferência. Na verdade, são cinco esquemas de axiomas, pois cada um
representa uma lista infinita de axiomas.
Uma demonstração matemática é uma sequência de fórmulas onde cada uma ou
é um axioma ou é obtida das fórmulas anteriores através de uma regra de inferência.
Um teorema é qualquer fórmula que conste em uma demonstração.
Os axiomas apresentados aqui são os axiomas lógicos, que valem em qualquer
teoria que utiliza a lógica de primeira ordem. Esses axiomas traduzem os argumen-
tos comuns que utilizamos em demonstrações matemáticas. Nos outros capı́tulos
estudaremos os axiomas especı́ficos da teoria dos conjuntos.
Lembramos que é virtualmente impossı́vel demonstrar teoremas complicados uti-
lizando estritamente o rigor lógico apresentado aqui. Na prática, utilizamos os argu-
mentos usuais que estamos acostumados em cursos como Análise Real ou Álgebra.
Mas conhecer o processo formal de demonstração lógica nos dá uma base de sus-
tentação, evitando as armadilhas da linguagem cotidiana. Isto é, devemos, em cada
momento, tomar o cuidado de saber como formalizarı́amos cada trecho de uma argu-
mentação matemática, caso fosse necessário.
Os três primeiros esquemas de axiomas são puramente proposicionais. Lembra-
mos que utilizamos as abreviaturas apresentadas na seção anterior, para os conectivos
∧, ∨, ↔ e o quantificador ∃.
Se A, B, C são fórmulas, as seguintes fórmulas são axiomas:
A1 (A) → ((B) → (A));

A2 ((C) → ((A) → (B)) → (((C) → (A)) → ((C) → (B)));

A3 ((¬(A)) → (¬(B))) → ((B) → (A)).


Os outros quatro esquemas de axiomas tratam da natureza dos quantificadores
(ou melhor, do quantificador, já que reduzimos o quantificador existencial a abrevia-
tura). Nesses esquemas é preciso prestar atenção às regras quanto às variáveis livres
(lembre-se da Seção 3.5)

A4 (∀x((A) → (B))) → ((A) → (∀x(B))), se A e B são fórmulas, e x não possui


ocorrência livre em A;
24 CAPÍTULO 3. A LINGUAGEM DA TEORIA DOS CONJUNTOS

A5 (∀x(A)) → (Ayx ), se A é uma fórmula e x é uma variável que não ocorre livre no
escopo de y, em A;

A6 x = x é um axioma, para qualquer variável x;

A7 (x = y) → ((A) → (B)), sempre que x, y são variáveis, A é uma fórmula, e B


é obtido de A substituindo alguma ocorrência livre de x por uma ocorrência
livre de y.

As regras de inferência são duas:

Modus Ponens: Se A e (A) → (B) são teoremas então B é teorema.

Generalização: Se A é um teorema e x é uma variável, então ∀x(A) é teorema.

Agora que descrevemos os axiomas e regras de inferência, faremos alguns co-


mentários e exemplos para esclarecer o sistema.
Os três primeiros axiomas, juntamente com o Modus Ponens, são suficientes para
provar todas as instâncias de tautologia 3 . Isto é, se pegarmos uma tautologia da
lógica proposicional, e substituirmos cada proposição por uma fórmula de primeira
ordem (devidamente cercado de parênteses, como mandam nossas regras de formação
de fórmulas), a fórmula obtida é um teorema da lógica de primeira ordem, que pode
ser deduzida a partir dos três primeiros axiomas e do Modus Ponens. Esse surpre-
endente resultado é conhecido como teorema da completude do cálculo proposicional.
A verificação de que uma fórmula é uma instância de tautologia – construindo uma
tabela-verdade – é bem mais simples que uma demonstração axiomática.
O axioma A5 requer uma explicação especial. Primeiro, vejamos, como exemplo
de aplicação, que (∀y(y ∈ x)) → (z ∈ x) é um axioma do esquema A5, pois subs-
tituı́mos a variável livre y por z na fórmula y ∈ x. Propositalmente utilizamos y
no lugar de x e z no lugar de y, na forma como enunciamos o esquema de axiomas,
para deixar claro que, na forma como está enunciada, x e y representam quaisquer
variáveis.
Se tomamos A como a fórmula (y ∈ x) → ∀y(y = x), precisamos tomar um certo
cuidado na aplicação do esquema de axiomas A5. A fórmula Azy é (z ∈ x) → ∀y(y =
x). Ou seja, não substituı́mos a segunda ocorrência de y porque essa ocorrência não
é livre. Esse detalhe na definição de Ayx (ou Azy , como queiram) é essencial.
Por fim, outro cuidado que devemos tomar é com a última condição: a variável
substituı́da não pode estar no escopo da variável nova. Vamos dar um exemplo de
porque existe essa condição e, novamente, para não viciar o leitor com alguma ideia
errada, vamos fazer a substituição da variável y por z, na aplicação de A5. Considere
A a fórmula ∃z¬(y = z). Vamos utilizar o axioma A5 para a fórmula A e as variaveis
y e z. Teremos o seguinte (já omitindo o excesso de parênteses):

(∀y∃z¬(y = z)) → (∃z¬(z = z))


3
Aqui, assumimos que o leitor está familiarizado com noções de lógica proposicional e tabela
verdade. Se não estiver, isso não é absolutamente essencial para o curso, mas é aconselhável estudar
um pouco sobre o assunto, especialmente para melhor compreender a lógica.
3.8. NOTAS SOBRE SÍMBOLOS RELACIONAIS E FUNCIONAIS 25

Ora, num sistema em que ∀y∃z¬(y = z) é um teorema (não é difı́cil um sistema


assim, pois basta uma teoria em que existem dois objetos diferentes), por modus
ponens e essa aplicação de A5 concluı́mos que ∃z¬(z = z), o que é um absurdo (por
A6, regra da generalização e a definição de ∃, temos que a negação dessa fórmula
é um teorema). Portanto, poderı́amos ter uma inconsistência na lógica de primeira
ordem se não declarássemos que essa substituição é proibida: y está no escopo de
z, na fórmula A, e, portanto, não podemos fazer essa substituição na aplicação do
esquema A5.
No esquema de axiomas A7 lembramos que a substituição pode ser feita em
apenas uma ocorrência da variável livre, diferente dos axiomas A4 e A5, em que a
substituição precisa ser feita em todas as ocorrências.
Um exercı́cio não trivial é mostrar que, se podemos fazer uma substituição, em
A7, podemos fazer quantas quisermos.
É bom observar que, no esquema A5, podemos escolher uma variável para subs-
tituição que não ocorra em A. Dessa forma, como caso particular temos que, para
toda fórmula A, (∀xA) → A é um axioma.

3.8 Notas sobre sı́mbolos relacionais e funcionais


Aqui nos limitamos a sistematizar apenas a linguagem da teoria dos conjuntos, que
possui apenas um sı́mbolo relacional (também chamado predicado), que é o sı́mbolo
∈. Dizemos que é um sı́mbolo relacional binário porque tem dois argumentos, isto
é, relaciona dois termos. A rigor, a igualdade poderia ser considerado também um
sı́mbolo relacional binário, mas costuma entrar na lista dos sı́mbolos obrigatórios da
lógica de primeira ordem (mas isso depende da formalização que seguimos).
Os sı́mbolos relacionais correspondem ao verbo da linguagem cotidiana. Por
exemplo, quando dizemos “o pai de João” não estamos enunciando nenhuma afirmação.
A frase “o pai de João” não está passı́vel a julgá-la como verdadeira ou falsa, pois
apenas se refere a algum indivı́duo, e nada diz sobre ele. Mas se dissermos “o pai de
João conhece o pai de Joaquim”, então aı́, sim, temos uma frase completa. O verbo
conhecer relaciona duas pessoas, e, se soubermos quem são os indivı́duos relacionados
pelo verbo conhecer, seremos capazes de julgar se a frase é verdadeira ou falsa.
“O pai de João” e “o pai de Joaquim” correspondem aos termos da lógica de
primeira ordem, pois se referem a indivı́duos do universo que estamos considerando.
“João” e “Joaquim” seriam constantes, pois se referem a indivı́duos especı́ficos, di-
ferentemente das variáveis (os pronomes, como ele, ela, alguém, correspondem às
variáveis). A expressão “O pai de” é, na lógica, sı́mbolos funcionais unários, pois
representa uma função que associa a cada indivı́duo do universo um outro indivı́duo
do mesmo universo. Assim, se criarmos uma lógica para formalizar relações entre
pessoas, nosso universo será o conjunto de todas as pessoas, e “pai de” será uma
função que associa a cada indivı́duo um outro indivı́duo.
Observe que só é possı́vel estabelecermos “pai de” como sı́mbolo funcional porque
cada pessoa possui um único pai biológico (ainda que não esteja mais vivo ou seja
desconhecido). Se a clonagem vingar, já não poderemos tratar “pai de” como sı́mbolo
funcional. Da mesma forma, a expressão “o irmão de” não pode ser usada como
26 CAPÍTULO 3. A LINGUAGEM DA TEORIA DOS CONJUNTOS

sı́mbolo funcional, pois nem todas pessoas têm irmãos, e algumas têm mais que
um irmão. A expressão “o irmão de” pressupõe que o indivı́duo tem apenas um
irmão, e, na lógica, só poderı́amos usar algo semelhante se isso acontecesse a todos
os indivı́duos. Por outro lado, nada impede de considerarmos “é irmão de” como
sı́mbolo relacional binário, assim como “é pai de” como sı́mbolo relacional binário. A
formalização do “pai” permite escolhermos entre sı́mbolo funcional e relacional, mas
“irmão” necessariamente será um sı́mbolo relacional.
Na aritmética, há dois exemplos clássicos de sı́mbolos funcionais binários: as
operações + e ×, que representam funções que associam a cada dois números um ter-
ceiro. Também podemos considerar como constantes os números 0 e 1 (as constantes
também podem ser vistas como sı́mbolos funcionais 0-ário, ou seja, sem parâmetro
nenhum). Já a relação de ordem < é um sı́mbolo relacional binário.
A sucessiva aplicação de sı́mbolos funcionais (como em 1 × (x + 0), ou “a mãe do
pai de Joaquim”) constrói termos cada vez mais complexos, e os sı́mbolos relacionais
(e a própria igualdade) passam a relacionar termos, e não apenas variáveis. Embora
a preferência de notação, para sı́mbolo funcional ou relacional binário, é colocar o
sı́mbolo no meio dos termos, se o grau desse sı́mbolo for diferente de dois precisamos
mudar a notação, e, para isso, acrescentamos, no alfabeto, a vı́rgula. A definição de
termos passa a ser recursiva, semelhante a de fórmulas, conforme as regras:

1. As variáveis são termos;

2. As constantes são termos;

3. Se t1 , . . . , tn são termos e F é um sı́mbolo funcional n-ário, então F (t1 , . . . , tn )


é um termo;

4. Todos os termos têm uma das formas acima.

Mudamos também a definição de fórmula atômica. Para as fórmulas mais com-


plexas, continuam as regras anteriores.

1. Se t1 e t2 são termos, t1 = t2 é uma fórmula;

2. Se t1 , . . . , tn são termos e R é um sı́mbolo relacional n-ário, então R(t1 , . . . , tn )


é uma fórmula.

O sistema de axiomas muda, também, quando introduzimos sı́mbolos funcionais.


Por exemplo, no axioma A5 fazemos a substituição da variável x por um termo t,
que não necessariamente é uma variável, e precisamos tomar cuidado para que x não
esteja no escopo de nenhuma variável que ocorra em t. O axioma A6 passa a ser
t = t, para todo termo t, e, no axioma A7, novamente substituı́mos as variáveis por
termos. Também acrescentamos o seguinte axioma:

(t = s) → F (t1 , . . . , tk−1 , t, tk+1 , . . . , tn ) = F (t1 , . . . , tk−1 , s, tk+1 , . . . , tn ),

para todo F sı́mbolo funcional n-ário.


3.9. NOTAS SOBRE A SEMÂNTICA 27

Se preferirmos, podemos dispensar o uso de sı́mbolos funcionais no sistema,


transformando-os em sı́mbolos relacionais. Por exemplo, o sı́mbolo de +, na aritmética,
pode ser transformado num sı́mbolo relacional ternário R(x, y, z) que significa x+y =
z. Precisamos, porém, tomar mais cuidado na axiomatização especı́fica.
Embora na teoria dos conjuntos só contamos com um sı́mbolo relacional, se es-
tendermos a linguagem com as abreviaturas que utilizaremos ao longo da disciplina,
podemos pensar em uma série de sı́mbolos funcionais e constantes que utilizamos.
Temos as constantes ∅ (conjunto vazio), ω (o conjunto dos números naturais, que
será explicado posteriormente) etc. Dentre os sı́mbolos funcionais unários adiciona-
dos teremos P(X) (o conjunto dos subconjuntos de X), {x} (o conjunto que tem
como único elemento o conjunto x), e assim por diante. A união e a intersecção de
conjuntos podem ser vistos como sı́mbolos funcionais binários, e a inclusão como um
novo sı́mbolo relacional binário.

3.9 Notas sobre a semântica


Para falarmos sobre a semântica da lógica de primeira ordem, a rigor precisarı́amos
primeiro desenvolver a teoria dos conjuntos. Porém, nesta seção apresentamos uma
breve explicação da semântica, a partir da noção intuitiva de conjuntos que o leitor
provavelmente adquiriu no ensino médio e nas outras disciplinas do curso de ma-
temática. Mas, como prometemos anteriormente, essa parte não será necessária para
aprender a teoria dos conjuntos axiomática, e nada impeça que o leitor só leie esta
seção (ou retorne a ela) após o fim do livro (ou, pelo menos, após o capı́tulo 11).
Não há, portanto, circularidade nessa apresentação. Mas entendermos um pouco da
semântica ajuda a tornar mais intuitiva a sintaxe da lógica de primeira ordem.
Seja L uma linguagem de primeira ordem. Um modelo M para a linguagem L é
uma estrutura constituı́da das seguintes componentes:

• Um conjunto não-vazio D, que chamaremos de domı́nio, ou universo, de M;

• Para cada sı́mbolo relacional n-ário R uma relação RM em D (isto é, RM é um


subconjunto de Dn );

• Para cada constante c um elemento cM de D;

• Para cada sı́mbolo funcional n-ário F uma função F M de Dn em D.

Uma atribuição de variáveis é uma função σ que associa a cada variável um


elemento de D.
Dados um modelo M e uma atribuição de variáveis σ, a interpretação de termos
sob a atribuição σ é uma função σ ∗ que estende a função σ a todos os termos, conforme
as seguintes condições:

• Se x é variável σ ∗ (x) = σ(x);

• Se F é um sı́mbolo funcional n-ário e t1 , . . . , tn são termos, então σ ∗ (F (t1 , . . . , tn )) =


F M (σ ∗ (t1 ), . . . , σ ∗ (tn )).
28 CAPÍTULO 3. A LINGUAGEM DA TEORIA DOS CONJUNTOS

Se M é um modelo, σ é uma atribuição de variáveis e A é uma fórmula, denota-


mos por (M, σ) |= A quando A é verdadeira no modelo M para uma atribuição de
variáveis σ, que definimos através das seguintes propriedades:

• Para quaisquer termos t1 e t2 , (M, σ) |= t1 = t2 se, e somente se, σ ∗ (t1 ) = σ ∗ (t2 );

• Se R é um sı́mbolo relacional n-ário e t1 , . . . , tn são termos, então (M, σ) |=


R(t1 , . . . , tn ) se, e somente se, (σ ∗ (t1 ), . . . , σ ∗ (tn )) ∈ RM ;

• (M, σ) |= ¬(A) se, e somente se, não ocorre (M, σ) |= A;

• (M, σ) |= (A) → (B) se, e somente se, (M, σ) |= B ou não ocorre (M, σ) |= A;

• (M, σ) |= ∀x(A) se, e somente se, para toda atribuição de variáveis θ tal que
θ(y) = σ(y), para toda variável y diferente de x, temos (M, θ) |= A.

Vamos dar um exemplo para entender melhor o significado de modelo. Considere


a linguagem da aritmética, com dois sı́mbolos funcionais binários + e ×, as constantes
0 e 1 e o sı́mbolo relacional binário <.
Podemos tomar a estrutura dos números naturais como modelo para a aritmética.
Isto é, o domı́nio é o conjunto dos números naturais N, as constantes 0 e 1 são
interpretadas pelos números correspondentes (isto é, 0M = 0 e 1M = 1, notando a
diferença entre os sı́mbolos 0 e 1 e os números 0 e 1). Os sı́mbolos +, × e < também
são interpretados pelas operações e relação correspondentes.
Uma atribuição de variáveis σ associa a cada variável um número natural. Por
exemplo, imagine que σ associa x ao número 1 e y ao número 2. Então o termo
x + y é associado a 3, isto é, σ ∗ (x + y) = 1 + 2 = 3. De acordo com essa atribuição
de variáveis, (M, σ) |= x < y. Agora, considere a fórmula ∀y(x × y = y). Se
modificarmos σ apenas na variável y, teremos x × y = y verdadeiro no modelo M
para essa nova atribuição de variável (pois 1 × y = y vale para qualquer y).
Observe que, se A é uma sentença (isto é, não contém variáveis livres), a veraci-
dade de A num modelo M não depende da atribuição de variáveis. Isto é, se tivermos
(M, σ) |= A teremos (M, θ) |= A, para toda atribuição de variáveis θ. Quando isso
acontece (A é verdadeira em M para qualquer atribuição de variável), denotamos
M |= A. Observe também que, quando A é uma sentença, ou M |= A ou M |= ¬A
(esse é o princı́pio do terceiro excluı́do).
Quando M |= A, também dizemos que o modelo M satisfaz a fórmula A.

Consequência sintática e consequência semântica: Sejam L uma linguagem


de primeira ordem e Γ um conjunto de fórmulas de L. Dizemos que uma fórmula A é
consequência sintática de Γ (que denotaremos por Γ ` A) se existe uma demonstração
de A a partir das fórmulas de Γ (isto é, se incluirmos as fórmulas pertencentes a Γ
entre os axiomas da lógica de primeira ordem, podemos provar A). Dizemos que
uma fórmula A é consequência semântica de Γ (que denotaremos por Γ |= A) se todo
modelo que satisfaz todas as fórmulas em Γ também satisfaz A.
3.9. NOTAS SOBRE A SEMÂNTICA 29

Teoremas fundamentais: Os três principais teoremas metamatemáticos a res-


peito da lógica de primeira ordem são os teoremas da completude, da compacidade e
de Loweinhein-Skolen.
O teorema da completude diz que Γ ` A se, e somente se, Γ |= A. Ou seja, con-
sequência sintática é equivalente a consequência semântica, provando que o sistema
de axiomas que construı́mos é suficiente para provar tudo que podemos provar pelos
argumentos usuais da linguagem cotidiana.
O teorema da compacidade diz que, se para todo Γ0 subconjunto finito de Γ existe
um modelo que satisfaz todas as fórmulas de Γ0 , então existe um modelo que satisfaz
todas as fórmulas de Γ.
O teorema de Loweinhein-Skolen pode ser enunciado da seguinte maneira: se
existe um modelo que satisfaça todas as fórmulas de um conjunto Γ, então, para
qualquer conjunto infinito X, existe um modelo cujo domı́nio é X e que também
satisfaz Γ. Em geral, as linguagens de lógica de primeira ordem que utilizamos têm
uma quantidade enumerável de sı́mbolos. Senão, precisamos assumir que X tem
cardinalidade maior ou igual à cardinalidade do alfabeto. Uma versão do teorema
diz que todo modelo possui um modelo equivalente (isto é, ambos possuem as mesmas
fórmulas como verdadeiras) cujo domı́nio é enumerável.

Exercı́cios
1. Usando a linguagem de primeira ordem da teoria dos conjuntos, escreva fórmulas
para representar as seguintes frases:

a) Não existe conjunto de todos os conjuntos.

b) Existe um único conjunto vazio.

c) x é um conjunto unitário.

d) Existe um conjunto que tem como elemento apenas o conjunto vazio.

e) y é o conjunto dos subconjuntos de x.

2. Marque as ocorrências livres de variáveis nas fórmulas abaixo.

a) (∀x(x = y)) → (x ∈ y)

b) ∀x((x = y) → (x ∈ y))

c) ∀x(x = x) → (∀y∃z(((x = y) ∧ (y = z)) → ¬(x ∈ y)))

d) ∀x∃y(¬(x = y) ∧ ∀z((z ∈ y) ↔ ∀w((w ∈ z) → (w ∈ x))))

e) (x = y) → ∃y(x = y)
30 CAPÍTULO 3. A LINGUAGEM DA TEORIA DOS CONJUNTOS

3. Na linguagem da aritmética dos números naturais (com os sı́mbolos funcionais +


e × e as constantes 0 e 1) escreva as fórmulas de primeira ordem que correspondem
às frases abaixo.

a) x é número primo.

b) x é menor do que y.

c) A soma de dois números ı́mpares é par.

d) A equação x3 + y 3 = z 3 não tem soluções inteiras positivas.

e) Todo número par maior do que dois pode ser escrito como soma de dois números
primos.

4. Julgue se cada uma das fórmulas abaixo é verdadeira em cada um dos seguintes
modelos: N, Z, Q, R.

a) ∀x∀y∃z(x + y = z)

b) ∀x∀y(¬(y = 0) → ∃z(x × y = z))

c) ∃x(x × x = 1 + 1)

5. É possı́vel uma axiomatização de primeira ordem para os números reais? Justi-


fique, tentando descobrir o que significa uma “lógica de segunda ordem”.
Capı́tulo 4

Axioma da extensão

O primeiro dos axiomas que estudaremos é quase uma definição de conjuntos, pois
nos diz que um conjunto é caracterizado exclusivamente pelos seus elementos.

Axioma 1 (da extensão) Dois conjuntos são iguais se, e somente se, eles têm os
mesmos elementos.

∀x∀y((x = y) ↔ (∀z(z ∈ x ↔ z ∈ y))

Há essencialmente duas maneiras de representar um conjunto: descrevendo os


elementos do conjunto através de uma propriedade comum a todos eles ou descre-
vendo cada elemento, entre chaves e separados por vı́rgulas. Por exemplo, numa
abordagem informal, considere os seguintes “conjuntos”:

{Uruguai, Itália, Alemanha, Brasil, Inglaterra, Argentina, França, Es-


panha}

Conjunto dos paı́ses que já venceram alguma Copa do Mundo de fu-
tebol

Ambos os conjuntos possuem os mesmos elementos. Cada elemento do primeiro


conjunto também é um elemento do segundo, e vice-versa. Logo, os dois conjuntos
são iguais, isto é, são o mesmo conjunto.
Considere agora o seguinte conjunto:

{Alemanha, Argentina, Brasil, Espanha, França, Inglaterra, Itália,


Uruguai, Brasil}

O axioma da extensão nos garante que esse conjunto é o mesmo que o anterior.
Ou seja, vale aquela máxima que aprendemos no ensino básico: em um conjunto não
importa a ordem dos elementos nem contamos as repetições.
É claro que não estamos falando de conjuntos matemáticos, existentes em ZFC.
Mas é bom ressaltar que, sendo esse o primeiro axioma que enunciamos (o que é
necessário, pois esse axioma é fundamental para a compreensão do conceito de con-
junto), não podemos provar, neste momento, a existência de qualquer conjunto. Por

31
32 CAPÍTULO 4. AXIOMA DA EXTENSÃO

enquanto trabalharemos com a teoria ingênua dos conjuntos, de forma semelhante


à concepção fregeana, em que um conjunto é definido simplesmente pela descrição
de seus elementos ou das propriedades que os delimitam. Assumiremos também a
existência dos números naturais, mesmo que ainda não tenhamos sequer os definido.
Isso será necessário para discutirmos alguns conceitos apresentados a seguir.

Sı́mbolo de inclusão: Apresentamos o conceito de subconjuntos, introduzindo um


novo sı́mbolo relacional binário que, no ensino básico, costuma ser bastante confun-
dido com o sı́mbolo de pertinência.
Definição 4.1 Dizemos que x está contido em y – ou x é subconjunto de y – se todo
elemento de x pertence a y. Denotamos por x ⊂ y quando x está contido em y.
Com essa definição, introduzimos ⊂ como um novo sı́mbolo relacional binário
na linguagem, chamado de sı́mbolo de inclusão. Podemos enxergá-lo como apenas
uma abreviatura. Ou seja, onde está escrito x ⊂ y lê-se “todo elemento de x é um
elemento de y”, ou “para todo z, se z pertence a x então z pertence a y”. Ou ainda,
na linguagem de primeira ordem, podemos escrever x ⊂ y como ∀z(z ∈ x → z ∈ y).
Isto é, vale a seguinte fórmula:
(x ⊂ y) ↔ ∀z(z ∈ x → z ∈ y)
Por exemplo, o conjunto {1, 2, 3} está contido no conjunto {2, 1, 3, 4}, uma vez que
todos os elementos do primeiro conjunto também são elementos do segundo. Se dois
conjuntos são determinados por propriedades, um ser subconjunto do outro significa
que a segunda propriedade é mais geral do que a primeira. Por exemplo, o conjunto
dos números transcendentes está contido no conjunto dos números irracionais, pois
ser transcendente implica ser irracional (isto é, a propriedade de ser irracional é mais
geral que a de ser transcendente).
Com essa simbologia e através de uma simples manipulação lógica (faça como
exercı́cio), podemos reescrever o axioma da extensão da seguinte maneira:
Afirmação: Dois conjuntos x e y são iguais se, e somente se, x ⊂ y e
y ⊂ x.
Em partiular, x ⊂ x, para todo conjunto x.
Dizemos que x é um subconjunto próprio de y se x ⊂ y mas x 6= y. Ou seja,
todo elemento de x pertence a y, mas existe pelo menos um elemento de y que não
pertence a x.

Conjuntos de conjuntos: Difundiu-se pelo ensino básico uma maneira errônea de


distinguir os sı́mbolos de pertinênia e de inclusão. Dizem que o sı́mbolo de inclusão
só relaciona conjuntos, enquanto o de pertinência é utilizado apenas entre elemento
e conjunto, e nunca entre dois conjuntos.
Ora, além de ignorar a possibilidade dos elementos de um conjunto serem, eles
próprios, conjuntos, esse “macete” foge da real definição dos dois conceitos. A in-
clusão de conjuntos é definida de uma maneira simples, a partir do sı́mbolo de per-
tinência e de conceitos elementares de lógica. Os dois sı́mbolos têm significados
33

completamente distintos, e, se alguém ainda os confunde, é porque ainda não com-


preendeu as notações conjuntı́sticas. Vamos reforçar a explicação que fizemos sobre
a notação das chaves: representamos um conjunto descrevendo seus elementos entre
chaves e separando-os por vı́rgulas. Dessa forma, cotinuando com a nossa suposição
de que existem os números naturais e os conjuntos que iremos descrever, analisemos
quem são os elementos do seguinte conjunto:

X = {1, {1, 2}, {1, 3}, 3}

O primeiro elemento representado no conjunto X (lembrando que a ordem dos


elementos de um conjunto não importa, e, por esse motivo não devemos chamá-lo
de primeiro elemento de X) é o número 1. A seguir, como manda nossa notação,
escrevemos uma vı́rgula e começamos a representar outro objeto matemático, que é
o próximo elemento que representamos em X. Se a notação {1 representasse alguma
coisa, poderı́amos ter dúvida sobre a notação, achando que {1 seria o segundo ele-
mento descrito em X. Mas, como não é o caso, fica claro que o próximo elemento
descrito no conjunto X é um outro conjunto: {1, 2}; que bem sabemos ser o conjunto
formado pelos números 1 e 2.
Assim, os elementos de X (supondo que ele existe) são:

{1, 2}
{1, 3}
3
Portanto, podemos escrever 1 ∈ X, o que não deve causar nenhum impacto a um
estudante secundarista. Mas também podemos escrever

{1, 2} ∈ {1, {1, 2}, {1, 3}, 3}

Temos aı́ a pertinênia entre dois conjuntos e, se compreendemos bem a notação das
chaves, não há motivo algum para nos assustarmos com isso.
Podemos também dizer que {1, 2} é um subconjunto de X? Vamos analisar isso
com calma, usando a definição lógica da inclusão de conjuntos. Precisamos verificar
se todo elemento de {1, 2} é, também, um elemento de X. Quais são os elementos
de {1, 2}? A resposta é fácil: 1 e 2. O número 1 pertence a X? Sim, vimos acima
que 1 é um dos elementos do conjunto X. E o 2, pertence a X? Não! Na descrição
dos elementos de X não consta o número 2. Encontramos, portanto, um elemento
de {1, 2} que não pertence a X. Denotamos isso como

{1, 2} 6⊂ {1, {1, 2}, {1, 3}, 3}

Vimos que um conjunto pode pertencer a outro e não estar contido nele. Será
que pode um conjunto ser subconjunto e elemento de outro, ao mesmo tempo? Ve-
rifiquemos o conjunto {1, 3}. Ele é um elemento de X. Vale, portanto:

{1, 3} ∈ {1, {1, 2}, {1, 3}, 3}


34 CAPÍTULO 4. AXIOMA DA EXTENSÃO

Será que {1, 3} está contido em X? Os números 1 e 3 são ambos elementos de


X, e esses são todos os elementos de {1, 3}. Ou seja, todo elemento de {1, 3} é um
elemento de X. Logo, vale o seguinte:

{1, 3} ⊂ {1, {1, 2}, {1, 3}, 3}

É importante ressaltar que essa análise foi feita na teoria ingênua dos conjuntos,
assumindo que os números naturais não são conjuntos. Se definı́ssemos, por exemplo,
o número 2 como o conjunto {1, 3}, terı́amos {1, 2} ∈ X. Mas esse não é o caso,
mesmo na construção que faremos dos números naturais. Na construção de Venn-
Euler, o número 2 será definido como o conjunto {0, 1}.
Os detalhes apresentados nessa discussão talvez tenham sido exagerados e exaus-
tivos, mas um vı́cio de aprendizagem é algo que requer muito esforço e cuidado para
ser superado. Os exercı́cios apresentados a seguir são imprescindı́veis para a continui-
dade do curso. Lembrem-se sempre: não esperem a véspera das provas para fazerem
os exercı́cios e tirarem as dúvidas!

Exercı́cios
Para esses exercı́cios, assumimos que os conjuntos enunciados existem, e não trata-
remos os números como conjuntos. Em particular, supomos que um número nunca
pertence a outro 1 .

1. Usando o axioma da extensão, verifique se os conjuntos de cada um dos itens


abaixo são iguais. Justifique

a) {1} e {{1}}.

b) {1, 3, 2, 4, 2} e {4, 3, 2, 1}.

c) {x ∈ N : x < 3} e {0, 1, 0, 2}.

d) {1, 2, 4, 3} e {1, 1, 3, 4}.

2. Para cada par de conjuntos abaixo, decida qual(is) dos sı́mbolos ∈ e ⊂ tornam
a fórmula verdadeira. Lembre-se que a resposta também pode ser ambos os sı́mbolos
ou nenhum deles. Justifique cada resposta.

a) {1} . . . {1, {1}}

b) {0} . . . {{0}}

c) {1, 2, 3} . . . {{1}, {2}, {3}}

d) {1, 2, 3} . . . {{1}, {1, 2}, {1, 2, 3}}


1
Quando virmos a construção dos números naturais, veremos que essa suposição é, em geral,
falsa.
35

e) {1, 2} . . . {1, {1}, 2, {2}, {3}}

f ) {{1}, {2}} . . . {{1, 2}}

g) {{1}} . . . {1, {1}}

h) {{1, 2}, {1}} . . . {x ⊂ N : x é finito }.

i) {{1}, {{1}}} . . . {x ⊂ N : x é finito }.

j) {{{1}}} . . .Conjunto dos subconjuntos dos subconjuntos de N.

3. Seja x o conjunto {0, {0}, 0, {0, {0}}}.

a) Quantos elementos tem o conjunto x?

b) Descreva todos os subconjuntos de x.

c) Descreva, utilizando chaves e vı́rgulas, o conjunto de todos os subconjuntos de x.

d) Quantos elementos o conjunto dos subconjuntos de x possui?

4. Prove que x ⊂ x, para todo x.

5. Prove que x ∈ y se, e somente se, {x} ⊂ y.


36 CAPÍTULO 4. AXIOMA DA EXTENSÃO
Capı́tulo 5

Axiomas do vazio, par e união

Vimos no capı́tulo anterior o axioma da extensão, que caracteriza quando dois con-
juntos são iguais. No entanto, conforme frisamos nos exercı́cios e exemplos, apenas
com o axioma da extensão não podemos garantir a existência de qualquer conjunto
especı́fico. Por isso, nosso próximo axioma garante a existência de um conjunto bem
especial.

Axioma 2 (do vazio) Existe um conjunto vazio.

∃x∀y¬(y ∈ x)

Usando a notação ∈
/ para não pertence, o axioma do vazio pode ser reescrito como

∃x∀y(y ∈
/ x)

Na verdade, o axioma do vazio é dispensável, pois veremos que ele pode ser
provado a partir do axioma da separação, desde que assumamos que existe pelo menos
um conjunto. Assim,podemos reescrever o axioma do vazio como existe um conjunto 1

Teorema 5.1 Existe um único conjunto vazio.

Demonstração: A existência de um conjunto vazio é ditada pelo axioma do vazio.


Mostremos a unicidade. Suponhamos que existem x e y conjuntos vazios diferentes.
Pelo axioma da extensão, existe um elemento de x que não pertence a y ou existe um
elemento de y que não pertence a x, o que, em ambos os casos, contradiz que x e y
são vazios. 
Como o conjunto vazio é único, podemos adicionar uma constante na linguagem
que o represente. O sı́mbolo adotado para o conjunto vazio é ∅.

Teorema 5.2 O conjunto vazio está contido em qualquer conjunto.


1
Na verdade, a formulação que aqui apresentamos da lógica de primeira ordem não permite que
o domı́nio (vide a seção sobre semântica, no Capı́tulo ??) seja vazio. Logo, a rigor, o axioma do
vazio – ou da existência de conjuntos – é dispensável. Porém, mantemos esse axioma por motivos
históricos e didáticos.

37
38 CAPÍTULO 5. AXIOMAS DO VAZIO, PAR E UNIÃO

Demonstração: Seja x um conjunto. Se ∅ não está contido em x, isso significa que


existe um elemento de ∅ que não pertence a x, contradizendo que o conjunto vazio
não possui elemento. 
O próximo axioma é o primeiro que nos permite construir um conjunto a partir
de outros.

Axioma 3 (do par) Para todos conjuntos x e y existe um conjunto cujos elementos
são x e y.
∀x∀y∃z∀w((w ∈ z) ↔ ((w = x) ∨ (w = y)))

Pelo axioma da extensão, podemos provar que o conjunto formado por x e y é


unicamente determinado por x e y. Isto é, se z e z 0 têm como elementos x e y, e
apenas esses, então z = z 0 . Isso justifica introduzirmos a notação do capı́tulo anterior:
{x, y} denota o conjunto formado por x e por y. Essa notação pode ser vista como
um sı́mbolo funcional binário, apesar de seguir uma regra de formação um pouco
diferente do padrão. A saber, podemos introduzir a seguinte regra de formação de
termos: se t e s são termos, {t, s} é um termo.
Notemos que, pelo axioma da extensão, a ordem dos elementos não importa. Ou
seja, {x, y} = {y, x}. Por esse motivo, costumamos chamar esse conjunto de par
não-ordenado, para diferenciar do par ordenado, que será visto posteriormente.
Se x = y, o par {x, y} – que passa a ser o par {x, x} – possui, na verdade, apenas
um elemento, e denotaremos por {x}. Vista como um sı́mbolo funcional unário,
essa notação pode ser formalizada pela seguinte regra: se x é um termo então {x}
é um termo. Ou seja, usando os axiomas do par e da extensão, podemos garantir a
existência de um conjunto unitário.

Teorema 5.3 Para todo x, existe um conjunto formado só pelo elemento x.

∀x∃y∀z(z ∈ y ↔ z = x)

Com o axioma do par e o Teorema 5.3 podemos formar vários conjuntos a partir
do vazio. Aplicando o Teorema 5.3 tomando x como ∅ obtemos o conjunto {∅}. Pelo
axioma da extensão, esse conjunto é diferente de ∅, pois ∅ ∈ {∅} mas ∅ ∈ / ∅. Com
aplicações sucessivas do axioma do par (e do Teorema 5.3) criamos vários outros
conjuntos (ou melhor, provamos a existência de vários outros conjuntos), a partir do
vazio: {∅, {∅}}, {{∅}}, {{{∅}}}, {{∅}, {{∅}}}, e assim por diante. Usando o axioma
da extensão podemos provar que todos esses conjuntos são diferentes.
No entanto, o axioma do par não é o bastante para construirmos conjuntos com
mais de dois elementos. O próximo axioma – que também pertence ao grupo de
axiomas de construção – permite-nos construir todos os conjuntos finitos e heredi-
tariamente finitos. Isto é, conjuntos finitos cujos elementos são, também, conjuntos
finitos, e os elementos de seus elementos também são finitos, e assim por diante.

Axioma 4 (da união) Para todo conjunto x existe o conjunto de todos os conjuntos
que pertencem a algum elemento de x.

∀x∃y∀w((w ∈ y) ↔ ∃v((w ∈ v) ∧ (v ∈ x)))


39

Repare que o axioma da união não garante, a princı́pio, a união de dois conjuntos,
mas, sim, a união de uma famı́la de conjuntos. Se pensarmos em um conjunto
de conjuntos como uma caixa cheia de pacotes menores, a união desse conjunto
de conjuntos corresponde a despejarmos todo o conteúdo dos pacotes menores na
caixa maior. Vejamos, como exemplo (assumindo que existe – visto que ainda nem
explicamos o que são os números naturais), o seguinte conjunto:

{{1, 2}, {1, 3}, {4}}

A união do conjunto acima é o conjunto formado por todos os números que pertencem
a pelo menos um de seus elementos, a saber:

{1, 2, 3, 4}

Em outras palavras, a união de x é o conjunto dos elementos dos elementos de


x. S
Denotamos a união de um conjunto x por x. O axioma da extensão garante
que a união é única. Isto é, dado qualquer conjunto x, não existem dois conjuntos
diferentes que, no lugar de y, tornariam a sentença correspondente ao axioma da
união verdadeira. O axioma daSunião determina unicamente um conjunto a partir de
x. Isso justifica introduzirmos como um sı́mbolo funcional unário.
Deixamos ao leitor a tarefa de mostrar as seguintes igualdades:
S
∅=∅
S
{∅} = ∅
S
{∅, {∅}} = {∅}
S
{{∅}} = {∅}

Com o axioma do par e o axioma da união em mãos podemos definir a união de


dois conjuntos.

Teorema 5.4 Dados dois conjuntos x e y existe o conjunto formado por todos os
conjuntos que pertencem a x ou a y.

∀x∀y∃z∀w((w ∈ z) ↔ ((w ∈ x) ∨ (w ∈ y)))

Demonstração: Dados dois conjuntos x e y, aplicamos o axioma do para para


obtermos o conjunto {x,S y}. Aplicando o axioma da união sobre o conjunto {x, y}
obtemos o conjunto z = {x, y}. Observe, pela definição da união de uma famı́la de
conjuntos, que, para todo w, w ∈ z se, e somente se, existe u ∈ {x, y} tal que w ∈ u.
Mas, se u ∈ {x, y}, temos que u = w ou u = y, provando que z satisfaz o enunciado
do teorema. 
Novamente notamos que a união de dois conjuntos é única, pelo axioma da ex-
tensão, o que nos permite introduzir a seguinte definição.
40 CAPÍTULO 5. AXIOMAS DO VAZIO, PAR E UNIÃO

Definição 5.5 Definimos a união de x e y como o conjunto formado por todos os


conjuntos que pertencem a x ou a y, e denotaremos esse conjunto por x ∪ y.

Combinando o axioma do par e da união, podemos construir as triplas (não-


ordenadas) de conjuntos.

Teorema 5.6 Para todos conjuntos x, y e z existe um único conjunto cujos elemen-
tos são x, y e z.

∀x∀y∀z∃u∀v(v ∈ u ↔ (v = x ∨ v = y ∨ v = z))

Demonstração: Pelo axioma do par existe o conjunto {x, y}. Pelo Teorema 5.3
existe o conjunto {z}. Aplicando o Teorema 5.4 aos conjuntos {x.y} e {z} obtemos
um conjunto u formado por x, y e z. 
Assim, introduzimos mais uma notação: se t, s e u são termos da linguagem da
teoria dos conjuntos, então {t, s, u} também é um termo, que corresponde ao conjunto
formado exatamente por t, s e u. Ao definirmos essa notação para termos, em vez
de variáveis, permitimos construir, formalmente, conjuntos como {∅, {x}, {∅}.
Seguindo o mesmo raciocı́nio, podemos usar os axiomas do par e da união para
provarmos a existência de conjuntos com quatro, cinco ou mais elementos, utilizando
a mesma notação das chaves. Isso justifica a notação que temos usado até agora, de
representar um conjunto finito (apesar de não termos definido ainda o que é conjunto
finito) indicando seus elementos entre chaves. Formalmente, podemos pensar nessa
notação como uma coleção infinita enumerável de sı́mbolos funcionais da linguagem,
sendo um sı́mbolo n-ário para cada n ≥ 1.

Exercı́cios
1. Para cada par de conjuntos abaixo, decida qual(is) dos sı́mbolos ∈ e ⊂ torna(m)
a fórmula verdadeira. Lembre-se que a resposta também pode ser ambos os sı́mbolos
ou nenhum deles. Justifique cada resposta e prove que os conjuntos abaixo existem.

(a) {∅} . . . {{∅}}

(b) {∅} . . . {∅, {{∅}}}

(c) {∅, {∅}} . . . {∅, {∅}, {∅, {∅}}}

(d) {{∅}} . . . {∅, {{{∅}}}}

2. Defina 0 como o conjunto vazio, 1 como o conjunto {0}, 2 como 1 ∪ {1} e 3 como
2 ∪ {2}.
(a) Prove que 0, 1, 2 e 3 existem e são diferentes um do outro.

(b) Prove que existe o conjunto x = {{0}, {0, 1}, {{1}}, {1, 2}, {{1, 2}}} e diga quais
dos conjuntos 0, 1, 2 e 3 pertencem a x.
41
S
(c) Calcule x, descrevendo seus elementos entre chaves.

(d) Sem usar os sı́mbolos 0, 1, 2 e 3, mas apenasSSo sı́mbolo


S SdoSconjunto vazio, as
chaves e as vı́rgulas, descreva os conjuntos ( x) e ( ( x)).

3. Considere x o conjunto
{∅, {∅}, {∅, {∅}}}

(a) Prove que o conjunto x existe.


S
(b) Descreva, com a notação das chaves, o conjunto x.
SS
(c) Descreva o conjunto ( x).

(d) Escreva todos os subconjuntos de x e prove (com os axiomas que temos até
agora) que existe o conjunto de todos os subconjuntos de x. Isto é, existe z tal
que z ∈ y se, e somente se, z ∈ x
S S
4. Prove que ∅=∅e {x} = x.
S S
5. Prove que, se x ⊂ y, então x⊂ y.

6. Dizemos que um conjunto x é transitivo se z ∈ y e y ∈ x implicam que z ∈ x,


para todos y e z.

(a) Prove que x é transitivo se, e somente se, y ∈ x implica y ⊂ x, para todo y.
S
(b) Prove que x é transitivo se, e somente, x ⊂ x.

(c) Mostre que o conjunto x do exercı́cio 3 é transitivo.

(d) Suponha que x é transitivo. Prove que x ∪ {x} é transitivo.

7. Usando apenas os axiomas que temos até agora, podemos provar que x 6= {x}?
Justifique.
42 CAPÍTULO 5. AXIOMAS DO VAZIO, PAR E UNIÃO
Capı́tulo 6

Axiomas das partes e da separação

O axioma seguinte já foi discutido, de alguma forma, nos exercı́cios do capı́tulo
anterior.
Axioma 5 (das partes) Para todo conjunto x existe o conjunto dos subconjuntos
de x.
∀x∃y∀z((z ∈ y) ↔ (z ⊂ x))
Se quisermos transformar a fórmula acima sem usar o sı́mbolo de inclusão, basta
escolhermos uma variável nova que não consta na fórmula (w, por exemplo) e substi-
tuirmos z ⊂ x pela fórmula ∀w((w ∈ z) → (w ∈ x)). É importante que o leitor esteja
familiarizado com essas abreviaturas e com o processo de converter essas abreviaturas
pela fórmula completa.
O conjunto definido pelo axioma das partes é único, para cada x. Isto é, fixado
um conjunto x, existe um único conjunto formado exatamente pelos subconjuntos
de x. A demonstração disso é, mais uma vez, uma simples aplicação do axioma da
extensão, e deixamo-la por conta do leitor. A existência e unicidade do conjunto dos
subconjuntos de um conjunto nos permite introduzir a seguinte definição:
Definição 6.1 Definimos o conjunto das partes de x como o conjunto dos subcon-
juntos de x, e denotaremos por P(x).
O próximo axioma da separação resgata a concepção inicial de Frege de definir
um conjunto através de uma fórmula lógica que descreve seus elementos. Mas, para
evitar o paradoxo de Russell, na formulação do axioma da separação é necessário
estabelecer um conjunto do qual iremos “separar” os elementos que satisfazem uma
determinada propriedade.
Assim, para cada fórmula P (x), temos que, para todo conjunto y, existe o con-
junto formado por todos x ∈ y tais que P (x) é verdadeiro.
Formalmente, o axioma da separação é um esquema de axiomas, isto é, uma lista
infinita de axiomas, conforme abaixo:
Axioma 6 (Esquema de axiomas da separação) Para cada fórmula P em que
z não ocorre livre a seguinte fórmula é um axioma:
∀y∃z∀x((x ∈ z) ↔ ((x ∈ y) ∧ P ))

43
44 CAPÍTULO 6. AXIOMAS DAS PARTES E DA SEPARAÇÃO

O conjunto z, como no axioma, será denotado por

{x ∈ y : P (x)}

Notemos que a única restrição sobre a fórmula P é não conter z como variável li-
vre. Essa restrição é necessária porque utilizamos essa variável no axioma para definir
o conjunto {x ∈ y : P (x)}. Se permitirmos que a mesma variável que define o con-
junto dado pelo axioma da separação também ocorra livre em P , poderı́amos tomar
P como a fórmula x ∈ / z e terı́amos a seguinte instância do axioma da separação:

∀y∃z∀x((x ∈ z) ↔ ((x ∈ y) ∧ (x ∈
/ z)))
Se tomássemos, por exemplo, y = {∅} e x = ∅, terı́amos x ∈ y verdadeiro e,
portanto, terı́amos
(x ∈ z) ↔ (x ∈
/ z)
o que é uma contradição.
Não precisamos impor qualquer outra restrição sobre as variáveis livres em P .
Em todas as aplicações do axioma da separação, a variável x ocorre livre em P (por
isso utilizamos a notação P (x) para a fórmula P ). Mas se x não ocorrer livre em
P , isso não causará inconsistência no sistema. Apenas a aplicação do axioma da
separação seria trivial, pois o conjunto z seria vazio ou o próprio y (já que a validade
de P , nesse caso, não depende da variável x, que não ocorre livre em P ).
Podemos ter outras variáveis livres em P além de x. Isso ocorre, por exemplo,
na definição de intersecção de conjuntos:

a ∩ b = {x ∈ a : x ∈ b}
A própria variável y (que reservamos para o – digamos – “conjunto universo”)
pode ocorrer livre em P , como na seguinte definição:

{x ∈ y : x ⊂ y}
Com essa formulação do sistema de Zermelo-Fraenkel o Paradoxo de Russell ga-
nha um novo significado, conforme o teorema seguinte.

Teorema 6.2 (Paradoxo de Russell) Não existe conjunto de todos os conjuntos.

∀x∃y(y ∈
/ x)

Demonstração: Suponha que exista um conjunto y tal que, para todo x, x ∈ y.


Pelo axioma da separação para a fórmula x ∈
/ x, existe z tal que, para todo x,

(x ∈ z) ↔ ((x ∈ y) ∧ (x ∈
/ x))

Como x ∈ y é verdadeiro para todo x temos que

(x ∈ z) ↔ (x ∈
/ x))
45

Tomando z no lugar de x temos

(z ∈ z) ↔ (z ∈
/ z)

chegando numa contradição. 


O axioma do vazio segue como consequência do axioma da separação, pois, pelos
axiomas lógicos podemos provar a sentença ∃y(y = y) (ou seja, a formulação lógica
aqui apresentada garante que existe algum conjunto). Usemos o axioma da separação
para esse y e para a fórmula x 6= x. Obtemos o conjunto

{x ∈ y : x 6= x},

que é o conjunto vazio.


A partir do axioma da separação podemos definir as operações conjuntı́sticas.
Comecemos pela intersecção de uma famı́lia de conjuntos.

Teorema 6.3 (Intersecção de uma famı́lia de conjuntos) Dado um conjunto não


vazio x existe o conjunto formado por todos os conjuntos que pertencem simultanea-
mente a todos os elementos de x.

∀x(∃y(y ∈ x) → ∃y(∀z((z ∈ y) ↔ ∀w((w ∈ x) → (z ∈ w)))))


T
Denotaremos esse conjunto por x.

Demonstração: Seja z um elemento de x. Defina o conjunto y como

{v ∈ z : ∀w((w ∈ x) → (v ∈ w))}

O axioma da separação garante a existência do conjunto y. Agora verifiquemos que


y satisfaz as condições do teorema. Seja v ∈ y. Pela definição de y, para todo w ∈ x
temos v ∈ w. Reciprocamente, se para todo w ∈ x temos v ∈ w, então, em particular,
v ∈ z e, portanto, v ∈ y. Isso prova que, para todo v, v ∈ y se, e somente se, v ∈ w,
para todo w ∈ x.

É bom notar que, diferente da união de uma famı́lia de conjuntos, na intersecção
precisamos impor a restrição de que a famı́lia é não-vazia. A união de uma famı́lia
vazia é o conjunto vazio. Mas se fizéssemos a intesecção de uma famı́lia vazia ob-
terı́amos o “conjunto de todos os conjuntos”, já que todo conjunto x satisfaz, por
vacuidade, a condição “para todo y pertencente ao conjunto vazio x ∈ y”.
Agora aplicaremos o axioma da separação para definir diversas operações binárias
entre conjuntos. A saber, são elas:

Intersecção: x ∩ y = {z ∈ x : z ∈ y}

Subtração: x r y = {z ∈ x : z ∈
/ y}

Diferença simétrica: x∆y = {z ∈ x ∪ y : z ∈


/ x ∩ y}
46 CAPÍTULO 6. AXIOMAS DAS PARTES E DA SEPARAÇÃO

Quando x ∩ y = ∅, dizemos que x e y são disjuntos.


A intersecção de conjuntos está relacionado ao operador booleano e, pois perten-
cer a x ∩ y significa pertencer a x e a y. A união significa ou, pois pertencer a x ∪ y
seginifica pertencer a x ou pertencer a x. A diferença simétrica é ou ou exclusivo
(pertencer a x ou a y, mas não a ambos). A união de umaSfamı́lia de conjuntos
está relacionada ao quantificador existencial, pois pertencer a x significa pertencer
a algum elemento de x, enquanto a intersecção deTuma famı́lia de conjutos repre-
senta o quantificador universal, porque pertencer a x significa pertencer a todos os
elementos de x.

Exercı́cios
1. Escreva o conjunto P({∅, {∅}}).
S
2. Prove que P(x) = x.

3. Prove que não existe o conjunto de todos os conjuntos unitários.


Dica: Assuma, por absurdo, a existência do conjunto de todos os conjuntos
unitários e prove a existência do conjunto de todos os conjuntos.

4. Prove que, para todo conjunto X existe o conjunto

{{x} : x ∈ X}

5. Sendo x um conjunto não vazio, prove que


\
∀y(y ∈ x → ( x ⊂ y))

6. Sendo x um conjunto não vazio, prove que


\ \
x⊂y→ y⊂ x

7. Escreva na linguagem da lógica de primeira ordem, sem abreviaturas, a seguinte


fórmula: [\
x∈ (y ∪ (w r z))
Capı́tulo 7

Axioma da infinidade

O axioma da infinidade é, ao lado do vazio, um axioma que garante a existência


de um conjunto especı́fico. No caso, de um conjunto infinito. Há várias formas de
apresentar o axioma da infinidade. Uma delas enuncia a existência do conjunto dos
números naturais, conforme a concepção de von Neumann. Outra forma, utilizada
aqui, é enunciar a existência de um conjunto do qual deduzimos a existência (e
definimos) do conjunto dos números naturais. A terceira simplesmente enuncia a
existência de um conjunto infinito (embora ainda não tenhamos definido o que é
um conjunto infinito), e a construção do conjunto dos números naturais torna-se um
pouco mais complicada e utiliza o axioma da substituição, semelhante ao que será
feito na construção dos ordinais.
Na definição dos números naturais atribuı́da a von Neumann, pensamos em um
número natural como o conjunto dos números naturais menores que ele. Assim, o 0
é o conjunto dos números naturais menores que 0. Como não existe número natural
menor que 0, então 0 será representado pelo conjunto vazio. O número 1 é o conjunto
formado pelos números menores que 1. Ou seja, 1 é o conjunto {0}, que é igual a
{∅}.. O número 2 é o conjunto {0, 1}, ou seja, o conjunto {∅, {∅}}, e assim por diante.
Note que o número 3, que é o conjunto {0, 1, 2}, pode ser escrito como {0, 1}∪{2},
assim como 1 = ∅ ∪ {0} e 2 = {0} ∪ {1}. Ou seja, o sucessor de um número natural
n é o resultado de acrescentarmos o próprio n ao conjunto n. Isto é, n + 1 = n ∪ {n}.
Isso justifica a seguinte definição de sucessor:

Definição 7.1 Dado um conjunto x, definimos x+ como x ∪ {x}. Isto é,

∀y(y ∈ x+ ↔ (y ∈ x ∨ y = x))

Quando um conjunto possui o vazio como elemento, e é fechado pela operação de


sucessor, então dizemos que tal conjunto é indutivo, conforme segue a definição.

Definição 7.2 Dizemos que um conjunto x é indutivo se, e somente se, ∅ ∈ x e, para
todo y, se y ∈ x então y + ∈ x.

O axioma da infinidade nada mais diz que a existência de algum conjunto indu-
tivo.

47
48 CAPÍTULO 7. AXIOMA DA INFINIDADE

Axioma 7 (da infinidade) Existe um conjunto indutivo.

∃x(∅ ∈ x ∧ ∀y(y ∈ x → y + ∈ x))

Note que um conjunto indutivo precisa possuir o vazio e todos os sucessores


obtidos a partir do vazio. Ou seja, um conjunto indutivo precisa conter o conjunto
dos números naturais (conforme será provado no teorema 7.4, parte (b)), mas pode
ter elementos a mais. Usando o teorema 6.3 e os axiomas da separação, das partes e
da infinidade, definimos o conjunto dos números naturais da seguinte forma:

Definição 7.3 Definimos o conjunto dos números naturais – que será denotado por
ω – como o seguinte conjunto:
\
ω = {x ∈ P(I) : x é indutivo}

onde I é o conjunto indutivo determinado pelo axioma da infinidade.

Notemos que a intersecção é permitida porque a famı́lia de subconjunts de I


que são indutivos não é vazia, dado que pelo menos o próprio conjunto I é indutivo.
Agora, resta-nos mostrar que o próprio conjunto ω é indutivo, e que segue da definição
que ele é o menor conjunto indutivo que existe. Fica como exercı́cio provar – a partir
do teorema seguinte – que a definição de ω não depende da escolha de I.

Teorema 7.4 (a) ω é um conjunto indutivo.

(b) Se A é um conjunto indutivo então ω ⊂ A.

Demonstração: Seja I o conjunto indutivo dado pelo axioma da infinidade. Vamos


provar que ω é indutivo. Primeiro, provemos que ∅ ∈ ω. De fato, se A é um
subconjunto de I que é indutivo, então ∅ ∈ A. Logo ∅ pertence à intersecção de
todos os subconjuntos indutivos de I. Agora, suponha que x ∈ ω. Isso significa que
x ∈ A, para todo A suconjunto indutivo de I. Mas isso implica que x+ ∈ A, para
todo A ⊂ I indutivo. Logo, x+ ∈ A, provando a parte (a) do teorema.
Agora provemos a parte (b). Seja A um conjunto indutivo. Repetindo o argu-
mento do parágrafo anterior, concluı́mos que A ∩ I é indutivo. Como A ∩ I ⊂ I,
temos, pela definição de ω, que todo elemento de ω também pertence a A ∩ I. Ou
seja, ω ⊂ A ∩ I e, portanto, ω ⊂ A. 
Observe que segue da demonstração do Teorema 7.4, que a definição de ω inde-
pende da escolha do conjunto indutivo T I. Para verificarmos isso, tome J qualquer
outro conjunto indutivo e defina A = {x ∈ P(J) : J é indutivo}. A demonstração
do Teorema 7.4 pode ser aplicada para A, no lugar de ω, e concluı́mos que A é indu-
tivo e, pelo item (b) (aplicado duas vezes) temos que A ⊂ ω e ω ⊂ A. O teorema da
extensão nos garante, então, que A = ω.
Mostraremos agora algumas propriedades do conjunto ω. Antes, enunciaremos
uma definição que já foi mencionada em alguns exercı́cios do Capı́tulo 5:
49

Definição 7.5 Dizemos que um conjunto x é transitivo se todo elemento de x é um


subconjunto de x. Isto é, se y ∈ x implica y ⊂ x.

Lema 7.6 (a) ω é um conjunto transitivo.

(b) Se n ∈ ω então n é transitivo.

(c) Para todo n ∈ ω, temos n ∈


/ n.

(d) Se n ∈ ω e m ∈ n então n ∈
/ m.

Demonstração: Usando o axioma da separação, considere o conjunto

S = {n ∈ ω : n ⊂ ω}

Mostraremos que S é indutivo. Pelo Teorema 7.4, parte (b), isso é suficiente para
mostrar que S = ω.
Claramente, ∅ ∈ S. Assumindo que n ∈ S, provaremos que n+ ∈ S. Ou seja,
mostraremos que, se n ⊂ ω, então n ∪ {n} ⊂ ω. De fato, se x ∈ n ∪ {n}, temos duas
possibilidades. Ou x ∈ n, o que, por hipótese, implica que x ∈ ω, ou x = n, que
pertence a ω.
Provamos, assim, que S = ω e, portanto, todo elemento de ω é um subconjunto
de ω, o que prova o item (a).
Para o item (b), considere S o conjunto dos elementos transitivos de ω. Ou seja

S = {n ∈ ω : ∀m(m ∈ n → m ⊂ n)}

A existência de S segue do axioma da separação. Provemos que S é indutivo. De


fato, ∅ ∈ S, pois a implicação m ∈ ∅ → m ⊂ ∅ é verdadeira por vacuidade, já que o
conjunto vazio não possui elementos. Suponha que n ∈ S. Mostremos que n+ ∈ S,
isto é, n+ é transitivo. Seja m ∈ n+ . Temos m ∈ n ou m = n. Se m ∈ n, pela
hipótee n ∈ S temos m ⊂ n e, portanto, m ⊂ n+ , uma vez que n ⊂ n+ . Pelo mesmo
motivo, se m = n, então m ⊂ n+ . Concluı́mos que n+ ∈ S e que S é indutivo.
Portanto, pelo Teorema 7.4, item (b), ω ⊂ S. Como S ⊂ ω, por definição, temos
S = ω, e concluı́mos que todos os elementos de ω são transitivos.
Para a parte (c), use novamente o axioma da separação para definir o seguinte
conjunto:
S = {n ∈ ω : n ∈
/ n}
Mostraremos que S é indutivo.
Como ∅ ∈ / ∅, temos ∅ ∈ S. Suponhamos, por absurdo, que n ∈ S e n+ ∈ / S. Isto
+ + + +
é, n ∈
/ n e n ∈ n . Temos, portanto, n ∈ n ou n = n. No primeiro caso, pelo
item (b), vale n+ ⊂ n e, portanto, n ∈ n, contrariando a hipótese. No segundo caso,
pelo axioma da extensão, de n ∈ n+ e n+ = n segue n ∈ n.
Concluı́mos o item (c) do lema. Para a parte (d) definimos o conjunto

S = {n ∈ ω : ∀m(m ∈ n → n ∈
/ m)}
50 CAPÍTULO 7. AXIOMA DA INFINIDADE

Como m ∈ ∅ é sempre falso, temos que ∅ ∈ S. Suponha que n ∈ S. Mostraremos


que n+ ∈ S. Isto é, se m ∈ n+ então n+ ∈
/ m. De fato, suponha que m ∈ n ∪ {n} e
n∪{n} ∈ m. Pela parte (b) essa última asserção implica que n∪{n} ⊂ m e, portanto,
n ∈ m. Como m ∈ n ∪ {n} temos m ∈ n ou m = n. O primeiro caso contradiz a
hipótese de que n ∈ S e n ∈ m. O segundo caso contradiz o item (c), uma vez que
n ∈ m.
Provamos que S é indutivo e, portanto, igual a ω, concluindo o item (d) do lema.

Os itens (c) e (d) do teorema anterior são verdadeiros para quaisquer conjuntos,
e não apenas para os elementos de ω, pois seguem do axioma da regularidade, que
veremos posteriormente. A saber, mostraremos que não pode ocorrer x ∈ x nem
podem ocorrer, simultaneamente, x ∈ y e y ∈ x. Porém, é interessante percebermos
que, no caso do conjunto ω, podemos provar essas propriedades sem usar o axioma
da regularidade. É bastante comum, nessa área, estudarmos a interdependência dos
axiomas, analisando quais são realmente necessários, em cada teorema que provamos,
o que justifica nosso esforço extra para provar esses itens que seriam consequências
fáceis do axioma da regularidade.
Agora veremos por que convém chamarmos ω de “conjunto dos números na-
turais”. Primeiro, vamos enunciar os axiomas de Peano, sobre números naturais.
Adotamos como conceitos primitivos zero e sucessor de. São esses os axiomas:

1. Zero é um número natural.


2. O sucessor de um número natural é um número natural.
3. Números naturais distintos nunca têm o mesmo sucessor.
4. Zero não é sucessor de qualquer número natural.
5. Se uma propriedade vale para zero e, valendo para um dado número natural,
também vale para o seu sucessor, então valerá para todos os números naturais.

O quinto axioma de Peano é o que conhecemos como princı́pio da indução finita.


Uma formalização precisa dos axiomas de Peano, usando lógica de primeira or-
dem, é a seguinte: introduzimos 0 (zero) como uma constante e s (sucessor de)
como um sı́mbolo funcional unário da linguagem. O primeiro e o segundo axi-
oma tornam-se desnecessários. O terceiro e o quarto axioma são respectivamente
∀x∀y(¬(x = y) → ¬(s(x) = s(y))) e ∀x(¬(s(x) = 0)). O quinto axioma torna-se um
esquema de axiomas, em que, para cada fórmula P , a fórmula

(Px0 ∧ ∀x(P → Pxs(x) )) → ∀xP

é um axioma.
O próximo teorema diz que o conjunto ω serve como domı́nio de um modelo para
os axiomas de Peano, interpretando 0 como ∅ e s(n) como n+ .

Teorema 7.7 O conjunto ω satisfaz os axiomas de Peano, identificando “zero” com


o conjunto vazio e o sucessor de n com n+ .
51

Demonstração: Os dois primeiros axiomas seguem do fato de ω ser indutivo. Para


provarmos o terceiro axioma, suponhamos, por absurdo, que n 6= m e n+ = m+ .
Temos que n ∈ n+ , logo, pela hipótese, n ∈ m+ . Como m+ = m ∪ {m}, e n 6= m,
então n ∈ m. Analogamente provamos que m ∈ n, contradizendo o Lema 7.6, parte
(d).
O quarto axioma segue do fato de que n ∈ n+ . Logo, não podemos ter, para
nenhum n, n+ = ∅.
Para provarmos o princı́pio da indução finita, seja P uma fórmula tal que Px∅
+
e ∀x(P → Pxx ) são verdadeiros. Usando o axioma da separação, considere A o
conjunto {x ∈ ω : P }. Pela hipótese sobre P é fácil verificar que A é indutivo. Logo,
pelo Teorema 7.4, parte (b), temos que ω ⊂ A, provando que todo elemento de ω
satisfaz P . 

Teorema 7.8 Para todos n e m pertencentes a ω temos:

(a) n ∈ m, m ∈ n ou m = n.

(b) n ⊂ m ou m ⊂ n.

(c) m ∈ n se, e somente se, m ⊂ n e m 6= n.

Demonstração: Provaremos o item (a) por indução em n. Ou seja, tomamos P (n)


a seguinte fórmula:
∀m(n ∈ m ∨ n = m ∨ m ∈ n)
Como ∅ ∈ n, para todo número natural n 6= ∅ (veja exercı́cio no final deste
capı́tulo), temos P (0) verdadeiro. Supondo que P (n) é verdadeiro mostraremos
P (n+ ).
Antes, provaremos, por indução em m, para um n fixado 1 , a seguinte fórmula,
que chamaremos de Q(m):

n ∈ m → (n+ ∈ m ∨ n+ = m)

Como ∅ ∈ m é sempre falso, a implicação é sempre verdadeira. Logo, vale Q(0).


Suponha que Q(m) é verdadeiro. Provemos Q(m+ ).
Suponha que n ∈ m+ . Isso significa que n ∈ m ou n = m. No primeiro caso,
pela hipótese de indução temos n+ ∈ m e, portanto, n+ ∈ m+ (pois m ⊂ m+ ). No
segundo caso, temos n+ = m+ . Em ambos os casos, concluı́mos que vale Q(m+ ) e,
portanto, pelo princı́pio da indução, concluı́mos que Q(m) é verdadeiro, para todo
m ∈ ω.
Voltemos à prova de P (n+ ) a partir de P (n). Seja m ∈ ω. Pela hipótese P (n)
temos três possibilidades: m ∈ n, m = n ou n ∈ m. No primeiro caso, temos m ∈ n+ .
No segundo caso, de m = n e n ∈ n+ segue também m ∈ n+ . Analisemos o terceiro
caso. Como mostramos que Q(m) é verdadeiro, para todo m, temos n+ ∈ m ou
n+ = m. Provamos, assim, P (n+ ) e, pelo princı́pio da indução, concluı́mos a parte
(a) do teorema.
1
Esse é um tı́pico exemplo de prova por indução dupla
52 CAPÍTULO 7. AXIOMA DA INFINIDADE

Pelo Lema 7.6, parte (b), se n ∈ m, então n ⊂ m, e, se m ∈ n, então m ⊂ n.


Logo, o item (b) deste teorema segue do item (a).
O item (c) segue facilmente dos itens (a) e (b), e do Lema 7.6. Deixamos os
detalhes da prova como exercı́cio ao leitor.


Exercı́cios:
1. Prove, a partir dos axiomas de Peano, os seguintes teoremas:

(a) Todo número natural é diferente do seu sucessor.

(b) Zero é o único número natural que não é sucessor de algum número natural.

2. Prove que, para todo n ∈ ω, ∅ ∈ n ou ∅ = n.

3. A união de dois conjuntos indutivos é necessariamente um conjunto indutivo?


Justifique sua resposta.

4. Prove a existência do conjunto dos números pares.


Observação: Lembre-se de que ainda não temos definida a aritmética!
S
5. Prove que ω = ω.

6. Prove que ω ⊂ P(ω).

7. Prove ou dê um contra-exemplo para a seguinte afirmação: se n ∈ ω então


P(n) ⊂ ω.

8. Prove que, se n, m ∈ ω, então n ∩ m e n ∪ m pertencem a ω.

9. Prove que, se x é transitivo, então x+ é transitivo.

10.
S Descreva – usando apenas o conjunto vazio, as chaves e a vı́rgula – o conjunto
P(3 r 1).
Capı́tulo 8

Relações e funções

As definições neste e no próximo capı́tulo são fundamentais para enunciarmos o


axioma da escolha. Começamos definindo pares ordenados, produto cartesiano e
relações.

8.1 Pares ordenados


O axioma do par nos garante construirmos, a partir de dois conjuntos a e b, o par
{a, b}. Porém, nessa definição de par a ordem dos elementos não importa, de modo
que {a, b} = {b, a}. Na definição de par ordenado, a igualdade só vale quando a
ordem é a mesma.

Definição 8.1 Dados dois conjuntos a e b, definimos o par ordenado (a, b) como o
conjunto {{a}, {a, b}}. Ou seja,

∀x(x ∈ (a, b) ↔ ∀y((y ∈ x ↔ y = a) ∨ (y ∈ x ↔ (y = a ∨ y = b))))

É fácil verificar que o par ordenado entre quaisquer conjuntos existe (aplicando
três vezes o axioma do par: uma para formar o conjuntoi {a}, outra para o conjunto
{a, b} e outra para o conjunto {{a}, {a, b}}) e é único (aplicação padrão do axioma
da extensão).
Assim, podemos introduzir a notação (a, b) como mais um sı́mbolo funcional
binário na nossa linguagem estendida da teoria dos conjuntos (ou mais uma abrevi-
atura).
Notemos que, quando a = b, o par ordenado (a, b) é igual ao conjunto {{a}}.

Teorema 8.2 Dois pares ordenados (a, b) e (c, d) são iguais se, e somente se, a = c
e b = d.

Demonstração: Um dos lados da equivalência é trivial: se a = c e b = d então os


pares ordenados (a, b) e (c, d) são iguais. Mostraremos o outro lado.
Suponha que (a, b) = (c, d). Como {a} ∈ (a, b) temos que {a} ∈ (c, d). Logo
{a} = {c} ou {a} = {c, d}. Em ambos os casos temos que a = c.

53
54 CAPÍTULO 8. RELAÇÕES E FUNÇÕES

Para provarmos que b = d, separemos em dois casos. No primeiro caso, supomos


que a = b, o que implica que (a, b) = {{b}}. Teremos que {c, d} ∈ (a, b) e, portanto,
{c, d} = {b}, provando que b = d. No segundo caso, supomos que a 6= b. Como
{a, b} ∈ (c, d) temos {a, b} = {c} ou {a, b} = {c, d}. Como {c} ⊂ {c, d}, em ambos
os casos o axioma da extensão garante que b ∈ {c, d}. Não podemos ter b = c, pois
provamos que a = c e assumimos que a 6= b. Portanto, b = d.


8.2 Produto cartesiano


O próximo teorema nos garante a existência do produto cartesiano entre dois con-
juntos.

Teorema 8.3 Dados dois conjuntos A e B, existe o conjunto de todos os pares or-
denados (a, b) que satisfazem a ∈ A e b ∈ B.

Demonstração: Usando os axiomas do par, da união, das partes e da separação,


definimos o conjunto

X = {x ∈ P(P(A ∪ B)) : ∃a∃b(a ∈ A ∧ b ∈ B ∧ x = (a, b))}

Para verificarmos que X atende as condições do teorema, só resta verificarmos que
todo par ordenado (a, b), onde a ∈ A e b ∈ B, pertence a P(P(A ∪ B)).
De fato, {{a}, {a, b}} ∈ P(P(A ∪ B)) é equivalente a {{a}, {a, b}} ⊂ P(A ∪ B),
que ocorre se, e somente se, {a} ∈ P(A ∪ B) e {a, b} ∈ P(A ∪ B), o que é verdade,
pois {a} ⊂ A ∪ B e {a, b} ⊂ A ∪ B. 
O conjunto estabelecido pelo Teorema 8.3 é chamado de produto cartesiano de A
e B, e será denotado por A × B. Introduzimos essa notação como outra abreviatura,
desempenhando o papel de um sı́mbolo funcional binário.
A partir do produt cartesiano definimos o conceito de relação, como um subcon-
junto de um produto cartesiano.

Definição 8.4 Dizemos que R é uma relação (ou relação binária) entre A e B se é
um subconjunto de A × B. Quando R é uma relação, utilizamos a notação xRy como
abreviatura de (x, y) ∈ R.

8.3 n-uplas ordenadas


Podemos definir uma tripla ordenada (a, b, c) como o par ordenado ((a, b), c). Ob-
servem que vale o análogo ao Teorema 8.2 para triplas ordenadas. Isto é, (a, b, c) =
(d, e, f ) se, e somente se, a = d, b = e e c = f .
O conjunto das triplas ordenadas (a, b, c) tais que a ∈ A, b ∈ B e c ∈ C coincide
com o conjunto (A × B) × C, que denotaremos, simplesmente, por A × B × C. Note
que a operação × não é associtiva. Os conjuntos (A × B) × C e A × (B × C) são
8.4. FUNÇÕES 55

diferentes. Mas, para efeito do Teorema 8.2, e seu análogo para triplas, são idênticos.
De fato, poderı́amos definir, sem problemas, (a, b, c) como (a, (b, c)), e terı́amos a
mesma propriedade de duas triplas serem iguais se, e somente se, as coordenadas
correspondentes são iguais.
Podemos estender essa definição para n-uplas ordenadas. Formalmente (mas nem
tanto), definimos (a1 , . . . , an ) como ((a1 , . . . , an−1 ), an ). É bom lembrarmos que essa
definição recursiva ainda não pode ser feita rigorosamente na linguagem de primeira
ordem, pois utiliza o teorema de recursão sobre classes, que ainda não vimos.
Para n ≥ 2 definimos An o conjunto das n-uplas (a1 , . . . , an ) tais que ai ∈ A, para
todo i entre 1 e n. Na metalinguagem, formalizamos An como An−1 × A, sendo que
A1 é, por definição, o próprio conjunto A. Vemos, por essa definição, que A2 = A×A.
Outra maneira, mais precisa, de definirmos An é como o conjunto das funções
(como veremos daqui a pouco) de n em A.

8.4 Funções
Uma função de A em B é uma relação que associa a cada elemento de A um único
elemento de B. Posto isso formalmente temos a seguinte definição:

Definição 8.5 Dizemos que uma relação F entre A e B é uma função de A em B


se para todo x ∈ A existe um único y ∈ B tal que (x, y) ∈ F . Isto é, F é uma função
de A em B se a seguinte fórmula é verdadeira:

(F ⊂ A×B)∧∀x(x ∈ A → ∃y((x, y) ∈ F ))∧∀x∀y∀z(((x, y) ∈ F ∧(x, z) ∈ F ) → (y = z))

. Notemos que a fórmula dada é uma conjunção de três subfórmulas. A primeira


diz que uma função de A em B é uma relação entre A e B. Ou seja, para todo par
ordenado (x, y) ∈ f temos x ∈ A e y ∈ B. A segunda subfórmula diz que todo
elemento de A é contemplada pela função F (quando não exigimos essa condição,
dizemos que f é uma função parcial de A em B). Finalmente, a terceira subfórmula
nos diz que a função só relaciona um elmento de B, para cada elemento de A.
Denotamos por A B o conjunto das funções de A em B. Deixamos como exercı́cio
ao leitor provar a existência de A B, pois é uma simples aplicação do axioma da
separação. Essa notação funciona como um sı́mbolo funcional da linguagem.
Mantendo a tradição, usaremos preferencialmente letras minúsculas para denotar
funções.
Se f é uma função de A em B, dizemos que A é o domı́nio de f – que será
denotado por dom(f ) – e o conjunto {b ∈ B : ∃a((a, b) ∈ f )} é chamado de imagem
de f – que será denotada por im(f ).
Normalmente se utiliza o termo contradomı́nio de uma função para designar o
conjunto B, quando a função é de A em B. Todavia, esse termo não é muito adequado
na definição aqui adotada de função, já que, dada uma função f , não é possı́vel
“recuperar” o contradomı́nio. Por exemplo, se tomarmos o conjunto (supondo que já
temos construı́dos os números reais) {(x, y) ∈ R2 : y = x2 }, esse pode tanto ser visto
como uma função de R em R quanto uma função de R em R+ (os reais não-negativos).
56 CAPÍTULO 8. RELAÇÕES E FUNÇÕES

Por outro lado, essa ambiguidade não existe ao definirmos o domı́nio e a imagem
a partir da função. É possı́vel “recuperar” o domı́nio e a imagem de uma função.
Abaixo seguem as definições do domı́nio e imagem a partir da função, e a tarefa de
mostrar que essas definições cumprem o prometido é deixada ao leitor:
[[
dom(f ) = {a ∈ f : ∃b((a, b) ∈ f )}
[[
im(f ) = {b ∈ f : ∃a((a, b) ∈ f )}
Nessas definições é bom notar em como os axiomas do par e das partes “empa-
cotam” os conjuntos, enquanto o axioma da união “desempacota”.
Também notamos que as mesmas definições podem ser aplicadas para relações
binárias quaisquer.
Como uma função associa a cada elemento do domı́nio um único elemento da
imagem, podemos introduzir a seguinte notação: se (x, y) pertence a uma função f ,
denotamos y por f (x). Essa notação só é possı́vel, pois, para x ∈ dom(f ), existe
um único y satisfazendo (x, y) ∈ f . Porém, precisamos ser mais cautelosos com essa
notação do que somos com outras como a do par ({a, b}), da união de dois conjuntos
(a ∪ b) e do par ordenado. Isso porque, enquanto as outras notações valem para
quaisquer termos, f (x) só está bem definido quando f é uma função e x pertence ao
domı́nio de f . Logo, não podemos desavisadamente introduzir essa notação como um
sı́mbolo funcional binário da linguagem, pois f (x) não está definido para quaisquer
conjuntos f e x.
Outra notação que podemos introduzir – comum na linguagem cotidiana da ma-
temática – é f : A −→ B para designar que f é uma função de A em B, ou, em
outras palavras (ou melhor, sı́mbolos), f ∈A B. A notação f : A −→ B deixa
implı́cito que f é uma função, o domı́nio de f é A e a imagem de f está contida em
B. Se escrevemos que f : A −→ B é sobrejetora, isso significa que f é sobrejetora em
relação a B. Ou seja, que a imagem de f é B. Da mesma forma, quando escrevemos
que f : A −→ B é bijetora, dizemos que f é bijetora em relação a B, isto é, é injetora
e tem imagem igual a B.
Suponha que f é uma função de A em B e que C é um subconjunto de A.
Definimos
f |C = (C × B) ∩ f
a restrição de f ao conjunto C. Fica como exercı́cio ao leitor mostrar que f |C é uma
função de C em B.
Dizemos que uma função f : A −→ B é injetora se, para todo x, y ∈ A temos
que, se x 6= y, então f (x) 6= f (y). Ou seja, quando dois elementos distintos do
domı́nio nunca são mapeados para o mesmo elemento da imagem. Dizemos que f é
sobrejetora em relação a B se para todo y ∈ B existe x ∈ A tal que f (x) = y. Ou
seja, quando B é a imagem de f . A necessidade de relativizarmos a B a definição de
sobrejetora vem daquele problema anteriormente mencionado, sobre a impossibilidade
de “recuperarmos” o contra-domı́nio de uma função. Quando está claro no contexto
qual contradomı́nio está sendo considerado (quando, por exemplo, escrevemos que
“f é uma função de A em B”) dizemos apenas que a função é sobrejetora, mas é
necessária uma cautela extra para esse tipo de nomenclatura.
8.4. FUNÇÕES 57

Uma função f : A −→ B é bijetora (ou bijetora em relação a B) quando é


injetora e sobrejetora (em relação a B). Nesse caso também dizemos que A é uma
bijeção entre A e B. No capı́tulo sobre conjuntos equipotentes discutiremos melhor a
propriedade de existir uma bijeção entre dois conjuntos (lembram-se da introdução,
sobre como comparar tamanhos de conjuntos infinitos?)
Ainda há algumas definições a serem introduzidas, com as quais o estudante de
matemática deve estar bem acostumado. Se f e g são funções, e im(g) ⊂ dom(f ),
então definimos a função composta de f e g da seguinte forma:
f ◦ g = {(x, z) ∈ dom(g) × im(f ) : ∃y((x, y) ∈ g ∧ (y, z) ∈ f }
Novamente, é preciso tomar cuidado com essa notação, pois ela só faz sentido
dentro das hipóteses estritas apresentadas acima.

Exercı́cios
1. Encontre uma definição alternativa para par ordenado de modo que o Teo-
rema 8.2 continue valendo. Justifique.

2. Prove que A × B = ∅ se, e somente se A = ∅ ou B = ∅.

3. Prove que, se A ⊂ C e B ⊂ D, então A × B ⊂ C × D.

4. Vale a recı́proca do exercı́cio 3? Justifique.

5. Descreva todos os elementos de P(2 × 2).

6. Escreva uma fórmula de primeira ordem, de três variáveis livres, sem abreviaturas
da linguagem de teoria dos conjuntos, que significa “x é uma função de y em z”.

7. Prove que, se f e g são injetoras, então f ◦ g é injetora. Mostre, através de um


contra-exemplo, que a recı́proca não é verdadeira.

8. Em quais condições temos A B ⊂C D? Justifique.

9. Dada uma relação R, definimos a inversa de R – que será denotada por R−1 –
como o conjunto {(y, x) : (x, y) ∈ R}. Com base nisso, prove as seguintes asserções:
(a) Para toda relação R existe R−1 .
(b) Se f é uma função, f −1 é uma função se, e somente se, f é injetora.
(c) Se f e g são funções injetoras tais que im(g) ⊂ dom(f ), então (f ◦g)−1 = g −1 ◦f −1 .

10. Prove que existe uma função injetora de ω em ω que não é sobrejetora (em
relação a ω).
58 CAPÍTULO 8. RELAÇÕES E FUNÇÕES
Capı́tulo 9

Aritmética dos números naturais

Já definimos o conjunto dos números naturais e mostramos que esse satisfaz os axi-
omas de Peano. Vamos, agora, definir as operações de adição e multiplicação, como
funções de ω × ω em ω. Para isso, precisamos, antes, definir o teorema da recursão.

Teorema 9.1 (da recursão) Sejam X um conjunto, x um elemento de X e g uma


função de X em X. Então existe uma única função f de ω em ω tal que

• f (0) = x;

• f (n+ ) = g(f (n)), para todo n ∈ ω.

Demonstração: Usando o axioma da separação, defina o conjunto

C = {R ∈ P(ω × X) : (0, x) ∈ R ∧ ∀n∀y((n, y) ∈ R → (n+ , g(y))) ∈ R}.

Claramente ω × X ∈ C. Logo, C é não-vazio. Podemos, portanto, definir o conjunto


\
f= C

Precisamos provar que f é uma função e que satisfaz a condição para pertencer a C.

Afirmação 1: f ∈ C

O procedimento da demonstração da afirmação 1 é análogo à demonstração que


ω é um conjunto indutivo. Como (0, x) ∈ R, para todo R ∈ C, então (0, x) ∈ f . Se
(n, y) ∈ f , então (n, y) ∈ R, para todo R ∈ C. Logo, pela hipótese sobre os elementos
de C, (n+ , g(y)) ∈ R, para todo R ∈ C. Logo, (n+ , g(y)) ∈ f , concluindo a prova da
afirmação.

Afirmação 2: f é uma função de domı́nio ω

Vamos provar, por indução, que para todo n ∈ ω vale a fórmula P (n), definida
abaixo:

P (n) ≡ ∃y((n, y) ∈ f ) ∧ ∀y∀z(((n, y) ∈ R ∧ (n, z) ∈ R) → (y = z))

59
60 CAPÍTULO 9. ARITMÉTICA DOS NÚMEROS NATURAIS

Vamos provar P (0). Pela afirmação 1, (0, x) ∈ f . Vamos provar que, se (0, y) ∈ f ,
então y = x. Suponha, por absurdo, que existe y 6= x tal que (0, y) ∈ f . Considere
R = f r {(0, y)}. Vamos verificar que R ∈ C. De fato, (0, x) ∈ R, pois (0, x) ∈ f
e x 6= y. Se (n, y) ∈ R, então (n, y) ∈ f , pois R ⊂ f . Logo, (n+ , g(y)) ∈ f (pela
afirmação 1). Como n+ 6= 0 (axioma 4 de Peano), temos que (n+ , g(y)) ∈ f é diferente
de (0, y) e, portanto, pertence a R.
Portanto, concluı́mos que R ∈ C, o que implica que f ⊂ R. Como R ⊂ f , temos
f = R, absurdo, pois (0, y) ∈ f e (0, y) ∈
/ R.
Vamos agora provar que P (n) implica P (n+ ).
Assumindo P (n) como verdadeiro, temos que existe y tal que (n, y) ∈ f . Logo,
como f ∈ C, temos que (n+ , g(y)) ∈ f , provando a “primeira parte” de P (n+ ).
Agora supomos, por absurdo, que existe z 6= g(y) tal que (n+ , z) ∈ f . Defina
R = f r {(n+ , z)}. Vamos verificar que R ∈ C,
Como n+ 6= 0, continuamos tendo (0, x) ∈ R. Suponha que (m, v) ∈ R. Como
f ∈ C e R ⊂ f temos que (m+ , g(v)) ∈ R. Se m 6= n, o axioma 3 de Peano nos
garante que m+ 6= n+ , logo, (m+ , g(v)) 6= (n+ , z), provando que (m+ , g(v)) ∈ R. Se
m = n, pela hipótese indutiva P (n) temos que v = y (pois (n, y) ∈ f ), e já vimos
que (n+ , g(y) ∈ f . Como z 6= g(y), também temos que (n+ , g(y) ∈ R. Provamos,
com isso, que R ∈ C o que novamente contradiz com o fato de R estar contido
propriamente em f . Isso conclui a demonstração da afirmação 2.
Das afirmações 1 e 2 segue imediatamente o teorema. Sendo f uma função de
domı́nio ω e satisfazendo as condições da famı́lia de conjuntos C, temos que (0, x) ∈ f ,
o que significa que f (0) = x. Como, para todo n, temos, pela própria definição de
função, (n, f (n)) ∈ f , da afirmação 1 segue que (n+ , g(f (n)) ∈ f , o que significa que
f (n+ ) = g(f (n)).
A unicidade da função f pode ser provada por indução. Suponha que existe
h satisfazendo as mesmas condições do teorema estabelecidas para f . Temos que
f (0) = h(0), pois ambos são iguais a x. Se f (n) = h(n), então g(f (n)) = g(h(n)), e
ambos são iguais a f (n+ ) e h(n+ ). Logo, por indução, f = h.


9.1 Aritmética dos números naturais


Já definimos ω como o conjunto dos números naturais, e mostramos que ele satisfaz
os axiomas de Peano. Falta definir a aritmética. Ou seja, precisamos definir duas
funções de ω × ω em ω que correspondem às operações de soma e produto.
A ideia geral da definição da soma é utilizar o teorema da recursão para definir,
para cada número natural m, uma função sm : ω −→ ω tal que

sm (0) = m

sm (n+ ) = (sm (n))+


e definimos m + n como sm (n). Utilizando novamente o teorema da recursão e a
definição das funções acima podemos definir, para cada número natural m, uma
9.1. ARITMÉTICA DOS NÚMEROS NATURAIS 61

função pm : ω −→ ω tal que


pm (0) = 0
pm (n+ ) = pm (n) + n
e definimos m · n como pm (n).
Essa definição de soma e produto ainda precisa ser melhor justificada, para po-
demos construı́-la axiomaticamente. Façamos isso.

Teorema 9.2 Existe uma função s de ω em ω ω tal que s(m)(0) = m e s(m)(n+ ) =


(s(m)(n))+ , para todos n, m ∈ ω.

Demonstração: Usando o axioma da separação defina

s = {(m, f ) ∈ ω ×ω ω : ∀n((f (0) = m) ∧ (f (n+ ) = (f (n))+ ))}

Pelo teorema da recursão, utilizando-o para a função g = {(n, n+ ) : n ∈ ω},


para cada m existe uma única f satisfazendo as condições descritas na definição de
s. Logo, s é uma função.


Definição 9.3 Definimos a operação de soma em ω como a função + : ω × ω −→ ω


dada por +((m, n)) = s(m)(n). Denotamos +((m, n)) por m + n.

Teorema 9.4 Existe uma função p de ω em ω ω tal que p(m)(0) = 0 e p(m)(n+ ) =


p(m)(n) + m, para todos n, m ∈ ω.

Demonstração: Usando o axioma da separação defina

p = {(m, f ) ∈ ω ×ω ω : ∀n((f (0) = 0) ∧ (f (n+ ) = (f (n) + m)))}

Tomando a função g = {(i, j) ∈ ω ×ω : i+m = j}, o teorema da recursão garante


que p é uma função. 

Definição 9.5 Definimos a operação de produto em ω como a função · : ω×ω −→ ω


dada por ·((m, n)) = p(m)(n). Denotamos ·((m, n)) por m · n.

Da definição de soma e produto seguem os seguintes axiomas da aritmética de


Peano, quando adicionamos os sı́mbolos funcionais binários + e · à linguagem da
aritmética:
m+0=m
m + n+ = (m + n)+
m·0=0
m · n+ = (m · n) + n
Eventualmente usaremos a notação xy para representar x · y.
62 CAPÍTULO 9. ARITMÉTICA DOS NÚMEROS NATURAIS

Exercı́cios
1. Use o teorema da recursão para definir a função f (n) = 2n , para n ∈ ω.

2. Use o teorema da recursao para definir a potenciação entre os números naturais


(adote 00 = 1).

3. Prove a propriedade comutativa da adição no conjunto dos números naturais.

4. Prove a existência do conjunto dos números primos.


Capı́tulo 10

Axioma da regularidade

Até agora, todos os axiomas que vimos garantem a construção de alguns conjuntos
partindo apenas do conjunto vazio. O próximo axioma garante que todos os conjuntos
são construı́dos a partir do vazio. Também irá evitar coisas como x ∈ x e será útil
em teoria dos modelos para fazermos indução sobre a relação de pertinência.

Axioma 8 (da regularidade) Para todo conjunto x não-vazio existe y ∈ x tal que
x ∩ y = ∅.
∀x(x 6= ∅ → ∃y(y ∈ x ∧ x ∩ y = ∅))

Teorema 10.1 Não existem x e y tais que x ∈ y e y ∈ x.

Demonstração: Sejam x e y conjuntos quaisquer. Vamos provar que x ∈ / y ou


y∈/ x.
Usando o axioma do par, tome z = {x, y}. Como z não é vazio, pelo axioma da
regularidade existe w ∈ z tal que w ∩ z = ∅. Se w = x, isso implica que y ∈/ x. Se
w = y, isso implica que x ∈
/ y, provando o teorema. 

Corolário 10.2 Não existe x tal que x ∈ x.

Demonstração: Aplique o teorema anterior para x = y. 


O axioma da regularidade garante que não existe uma sequência infinita de-
crescente na relação de pertinência. Ou seja, não existe uma sequência da forma
. . . x3 ∈ x2 ∈ x1 ∈ x0 . É claro que essa expressão não está de acordo com a “norma
culta” da linguagem lógica. Formalizando essa afirmação, deixamos como exercı́co
ao leitor provar o seguinte fato:

Afirmação: Não existe uma função f de domı́nio ω tal que f (n+ ) ∈


f (n), para todo n ∈ ω.

Concluı́mos desse resultado que, para qualquer conjunto x, se tomarmos um


elemento de x, e um elemento de um elemento de x, e um elemento de um elemento
de um elemento de x, assim sucessivamente, chegaremos, após uma quantidade finita
de passos, no conjunto vazio.

63
64 CAPÍTULO 10. AXIOMA DA REGULARIDADE

É bom notar que se, por um lado, não existe uma sequência infinita decrescente,
na relação de pertinência, por outro lado, como veremos no próximo capı́tulo, é
possı́vel existir uma sequência infinita crescente. Ou seja, sequências infinitas da
forma x0 ∈ x1 ∈ x2 . . . existem (os números naturais, por exemplo).

Exercı́cios
1. Usando o axioma da regularidade, prove que não existem x, y, z tais que x ∈ y,
y ∈ z e z ∈ x.

2. Usando o axioma da regularidade, prove que não existem w, x, y, z tais que w ∈ x,


x ∈ y, y ∈ z e z ∈ w.

3. Use o axioma da regularidade para provar que o conjunto vazio pertence a todo
conjunto transitivo não-vazio.

4. Prove que não existe x tal que P(x) = x.

5. Prove que existe um modelo para teoria dos conjuntos em que valem os axiomas
do par, da união e das partes, mas não valem os axiomas do vazio e da regularidade.
Dica: Considere um modelo formado por um único elemento x tal que x ∈ x.
Capı́tulo 11

Construção dos conjuntos


numéricos

Já temos construı́dos os números naturais e as funções de soma e produto entre


números naturais. Neste capı́tulo aprenderemos a construir os conjuntos dos números
inteiros, racionais e reais.

11.1 Relação de equivalência


Para construirmos o conjunto dos números inteiros a partir do conjunto dos números
naturais, e o conjunto dos números racionais a partir do conjunto dos número inteiros,
precisamos, antes, desenvolver o conceito de relação de equivalência.

Definição 11.1 Dizemos que uma relação R ⊂ X ×X é uma relação de equivalência


em X se satisfaz as seguintes propriedades, para todos x, y, z ∈ X:
• Reflexividade: xRx;

• Simetria: se xRy então yRx;

• Transitividade: se xRy e yRz então xRz.


Definimos o conjunto das classes de equivalência de R como

X/R = {Y ∈ PX : ∃x∀y(y ∈ Y ↔ xRy)}

Os elementos de X/R são, obviamente, chamados de classes de equivalência,


também denotado do seguinte modo:

X/R = {[x] : x ∈ X}

onde
[x] = {y ∈ X : xRy}

Teorema 11.2 Seja R uma relação de equivalência em um conjunto X. As seguintes


afirmações são verdadeiras:

65
66 CAPÍTULO 11. CONSTRUÇÃO DOS CONJUNTOS NUMÉRICOS
S
(a) X/R = X;

(b) ∅ ∈
/ X/R;

(c) Para todos Y, Z ∈ X/R, se Y 6= Z então Y ∩ Z = ∅;

(d) Se x ∈ Y e todo Y ∈ X/R, para todo y ∈ X temos que xRy se, e somente se,
y ∈Y.

Demonstração: Usaremos a notação [x] para o conjunto {y ∈ X : xRy}.


Dado x ∈ X, temos que x ∈ [x], uma vez que, pela propriedade reflexiva, xRx.
Isso prova (a). Como todo elemento de X/R é da forma [x], para algum x ∈ X, isso
prova também a parte (b)
Para provar (c), assumindo que Y e Z são dois elementos de X/R que não são
disjuntos, mostraremos que Y = Z. Sejam x ∈ Y ∩ Z e y0 , z0 ∈ X tais que Y = [y0 ]
e Z = [z0 ]. Dado y ∈ Y , temos, por definição, que y0 Ry. Logo, pela simetria, yRy0 .
Mas como x ∈ Y , temos y0 Rx. Pela transitividade temos yRx. Mas, como x ∈ Z,
temos z0 Rx e, pela simetria, xRz0 . Logo, a transitividade nos dá yRz0 e, novamente
pela simetria, z0 Ry, o que prova que y ∈ Z. Isso conclui que Y ⊂ Z e um argumento
análogo mostra que Z ⊂ Y , provando que Y = Z.
Mostremos a parte (d). Se Y ∈ X/R, existe y0 ∈ X tal que Y = [y0 ]. Como
x ∈ Y , temos que y0 Rx e, portanto, xRy0 . Se yRx, por transitividade e simetria
temos yRy0 e y0 Ry, de onde temos que y ∈ Y . Por outro lado, se y ∈ Y , temos y0 Ry
e, portanto, xRy, concluindo a prova do teorema. 
Em outras palavras, o Teorema 11.2 parte (d) nos diz que duas classes de equi-
valência [x] e [y] são iguais se, e somente se, xRy.

11.2 Construção do conjunto dos números inteiros


A construção dos números inteiros a partir dos naturais se assemelha muito à cons-
trução dos racionais a partir dos inteiros, sendo essa última mais conhecida.
Iremos identificar pares de números naturais que “possuem a mesma diferença”.
Por exemplo, identificaremos o par (5, 3) com os pares (4, 2), (6, 4) etc. Assim, o
número inteiro 2 é o conjunto {(2, 0), (3, 1), (4, 2), . . .} (sendo esses pares ordenados
formados por números naturais), enquanto −2 é o conjunto {(0, 2), (1, 3), (2, 4), . . .}.
Definimos R ⊂ (ω × ω)2 como o conjunto dos pares ((a, b), (c, d)) tais que a + d =
b + c. Deixamos como exercı́cio ao leitor provar o seguinte fato:

R é uma relação de equivalência

Defina o conjunto dos números inteiros como

Z = (ω × ω)/R

Falta definirmos as operações de soma e produto em Z. Para não sobrecarregar


o texto, abusaremos a notação utilizando os mesmos sı́mbolos + e · para a soma e
11.2. CONSTRUÇÃO DO CONJUNTO DOS NÚMEROS INTEIROS 67

produto de números inteiros. Uma definição informal seria

[(a, b)] + [(c, d)] = [(a + c, b + d)]

[(a, b)] · [(c, d)] = [(ac + bd, ad + bc)]


Porém, tal definição não pode depender da escolha do representante. Nesta primeira
vez que fazemos esse tipo de construção seremos mais rigorosos, definindo explicita-
mente as funções de soma e produto. Como mais um abuso de notação, denotaremos
(Z×Z)×Z por Z×Z×Z, ou, simplesmente, Z3 , e o par ((x, y), z) pela tripla (x, y, z).
Definimos:

S = {(x, y, z) ∈ Z3 : ∃a∃b∃c∃d((a, b) ∈ x ∧ (c, d) ∈ y ∧ (a + c, b + d) ∈ z}

P = {(x, y, z) ∈ Z3 : ∃a∃b∃c∃d((a, b) ∈ x ∧ (c, d) ∈ y ∧ (ac + bd, ad + bc) ∈ z}

Teorema 11.3 Sejam S e P definidos como acima. Temos que

(a) S e P são funções;

(b) Para todos a, b, c, d em ω temos que S([(a, b)], [(c, d)]) = [(a + c, b + d)];

(c) Para todos a, b, c, d em ω temos que P ([(a, b)], [(c, d)]) = [(ac + bd, ad + bc)].

Demonstração: Para as três partes do teorema precisamos mostrar a independência


em relação à escolha dos representantes. Isto é, mostraremos a seguinte afirmação:

Afirmação: Se (a, b)R(a0 , b0 ) e (c, d)R(c0 , d0 ) então (a + c, b + d)R(a0 +


c , b0 + d0 ) e (ac + bd, ad + bc)R(a0 c0 + b0 d0 , a0 d0 + b0 c0 ).
0

Provaremos a afirmação assumindo as propriedaes conhecidas da aritmética: co-


mutatividade, associatividade, lei do cancelamento etc.
Suponha que (a, b)R(a0 , b0 ) e (c, d)R(c0 , d0 ). Isso significa que a + b0 = b + a0
e c + d0 = d + c0 . Logo, a + b0 + c + d0 = b + a0 + d + c0 , o que significa que
(a + c, b + d)R(a0 + c0 , b0 + d0 ).
Agora veremos que (ac + bd, ad + bc)R(a0 c0 + b0 d0 , a0 d0 + b0 c0 ).
Como a + b0 = a0 + b e c + d0 = c0 + d, temos que, para todos x, y, z, w em ω, vale
a seguinte igualdade:

(a + b0 )x + (c + d0 )y + (a0 + b)z + (c0 + d)w = (a0 + b)x + (c0 + d)y + (a + b0 )z + (c + d0 )w

Tomando x = c + c0 , y = a + a0 , z = d + d0 e w = b + b0 , utilizando as propriedades


operatórias de números naturais, provamos que ac+bd+a0 d0 +b0 c0 = ad+bc+a0 c0 +b0 d0
e, portanto, (ac + bd, ad + bc)R(a0 c0 + b0 d0 , a0 d0 + b0 c0 ). Deixamos os detalhes das contas
para o leitor completar.
Vejamos como isso ajuda a provar o teorema. Para provar que S é uma função
de Z2 em Z, primeiro temos que provar que, para todo (x, y) ∈ Z2 , existe z tal que
68 CAPÍTULO 11. CONSTRUÇÃO DOS CONJUNTOS NUMÉRICOS

(x, y, z) ∈ S. Mas isso é verdade, pois pelo Teorema 11.2, parte (b), existe x e y são
não-vazios. Logo, existem (a, b) ∈ x e (c, d) ∈ y. Pela parte (a) do mesmo teorema,
existe z tal que (a + c, b + c) ∈ z, o que nos dá, pela definição de S, que (x, y, z) ∈ S.
O mesmo argumento mostra que, para todo (x, y) ∈ Z2 , existe z tal que (x, y, z) ∈ P ,
tomando, desta vez, z contendo (ac + bd, ad + bc).
Isso já prova, quando concluirmos que S e P são funções, as partes (b) e (c) do
presente teorema.
Agora vejamos a unicidade. Suponha que (x, y, z) ∈ S e (x, y, z 0 ) ∈ S. Pela
definição de S, (x, y, z) ∈ S implica que existem números naturais a, b, c, d tais que
(a, b) ∈ x, (c, d) ∈ y e (a + c, b + d) ∈ z, e (x, y, z 0 ) ∈ S implica que existem números
naturais a0 , b0 , c0 , d0 tais que (a0 , b0 ) ∈ x, (c0 , d0 ) ∈ y e (a0 + c0 , b0 + d0 ) ∈ z 0 .
Note que não podemos, a princı́pio, assumir que os números a, b, c, d que teste-
munham que (x, y, z) ∈ S são os mesmos que testemunham que (x, y, z 0 ) ∈ S.
Porém, como (a, b) e (a0 , b0 ) ambos pertencem a x, o Teorema 11.2, parte (d),
nos garante que (a, b)R(a0 , b0 ). Da mesma forma temos (c, d)R(c0 , d0 ). Logo, pela
afirmação, (a + c, b + d)R(a0 + c0 , b0 + d0 ). Logo, o Teorema 11.2, parte (d), também
nos assegura que (a0 + c0 , b0 + d0 ) ∈ z. Portanto, (a0 + c0 , b0 + d0 ) ∈ z ∩ z 0 , o que implica,
pela parte (c) do Teorema 11.2, que z = z 0 , como querı́amos provar.
A demonstração de que P é uma função é análoga.

Sendo x e y números inteiros, denotamos S((x, y)) por x + y, e P ((x, y)) por
x · y ou, simplesmente, xy. Como estamos usando os mesmos sı́mbolos em conjuntos
diferentes, estamos fugindo um pouco do rigor da lógica, e precisamos estar atentos
ao contexto. O importante é nunca perder a conexão com a linguagem lógica estrita,
estando ciente de como cada uma dessas notações funciona como abreviatura.
Definir função em classes de equivalência através de um representante, para de-
pois mostrar que a definição independe da escolha do representatne, é uma prática
bastante comum no cotidiano da matemática, com a qual o estudante deve ter se
deparado diversas vezes. Aqui foi apresentada a formalização desse processo, que,
como podemos notar, não é trivial, apesar de ser bem intuitivo. Reparem que todos
os itens do Teorema 11.2 foram utilizados e, na demonstração desse, foram utilizadas
todas as três propriedades de relação de equivalência.

11.3 Construção do conjunto dos números racio-


nais
A construção de Q a partir de Z se assemelha muito à construção de Z a partir de ω.
Primeiro definimos o número inteiro 0 (eventualmente denotado por 0Z , quando
houver possibilidade de confusão com o número natural 0) como a classe [(0, 0)].
Definimos uma relação R em Z × (Z r {0Z }) como

R = {((a, b), (c, d)) ∈ (Z × (Z r {0Z }))2 : ad = bc}

Fica como exercı́cio verificar que R é uma relação de equivalência.


11.4. CONSTRUÇÃO DO CONJUNTO DOS NÚMEROS REAIS 69

Definimos
Q = (Z × (Z r {0Z }))/R
Obviamente, a classe de equivalência representada pelo par (a, b) corresponde ao
número racional representado pela fração ab , e R é a equivalência de frações.
Definimos a soma e o produto de números reais da seguinte forma:
[(a, b)] + [(c, d)] = [(ad + bc, bd)]
[(a, b)] · [(c, d)] = [(ac, bd)]
Deixamos como exercı́cio ao leitor provar que essa definição independe da escolha
do representante. Os demais detalhes para a formalização são iguais aos que foram
feitos anteriormente.

11.4 Construção do conjunto dos números reais


A construção que será feita nesta seção deve-se a Richard Dedekind (1831–1916).
Para construirmos os números reais a partir dos racionais, precisamos, antes,
introduzir uma série de definições para podermos falar da ordem em Q.
Dizemos que um número inteiro x é positivo se existe n ∈ ω tal que n 6= 0 e
(n, 0) ∈ x.
Dizemos que um número racional x é positivo se existe (a, b) ∈ x tal que a e b
são números inteiros positivos.
Definimos uma relação < em Q da seguinte forma: a < b se, e somente se, existe
um número racional positivo c tal que a + c = b.
Dizemos que um subconjunto C de Q é um corte se satisfaz as seguintes propri-
edades:
• é não-vazio: ∃x(x ∈ C);
• não contém todos os racionais: ∃x(x ∈ Q ∧ x ∈
/ C);
• não tem máximo: ∀x∃y : x < y;
• é fechado para baixo: ∀x∀y((x ∈ C ∧ y < x) → y ∈ C).
Definimos o conjunto dos números reais como:
R = {C ⊂ Q : C é um corte}
Intuitivamente, pensamos em um número real, nesta construção por cortes, como
o conjunto dos racionais menores do que ele.
Dados dois números reais A e B (ou seja, dois cortes em Q) definimos a soma e
o produto de A e B como:
[A] + [B] = {a + b : a ∈ A ∧ b ∈ B}
[A] · [B] = {x ∈ Q : ∃a∃b(a ∈ A ∧ b ∈ B ∧ x < a · b)}
Deixamos como exercı́cio provar que as definições acima estão boas. Ou seja, que
os subconjuntos de Q definidos acima são cortes. Ao leitor mais paciente indicamos a
tarefa de provar todos os axiomas de corpo ordenado completo – com a ordem dada
pela inclusão – que são estudados em Análise Real.
70 CAPÍTULO 11. CONSTRUÇÃO DOS CONJUNTOS NUMÉRICOS

Exercı́cios
1. Seja X um conjunto e sejam x0 e y0 dois elementos distintos de X. Considere a
seguinte relação em X:

R = {(x, y) ∈ X × X : x = y} ∪ {(x0 , y0 ), (y0 , x0 )}

(a) Prove que R é uma relação de equivalência em X.

(b) Descreva os elementos de X/R.

2. Considere C um conjunto não-vazio de conjuntos não-vazios


S tal que, para todos
x e y pertencentes a C, se x 6= y então x ∩ y = ∅. Seja X = C. Defina em X a
relação:
R = {(x, y) ∈ X : ∃z(z ∈ C ∧ x ∈ z ∧ y ∈ z)}

(a) Prove que R é uma relação de equivalência em X.

(b) Mostre que C = X/R.

(c) Prove que duas relações de equivalência diferentes possuem classes de equi-
valências diferentes.

3. Como fica uma relação de equivalência sobre ∅? Ela satisfaz o Teorema 11.2?

4. Prove a propriedade comutativa da soma de números inteiros.

5. Prove que a relação R definida na Seção 11.2 é uma relação de equivalência


(podendo assumir as propriedades usuais da soma de números naturais, como asso-
ciatividade e a lei do cancelamento).
Capı́tulo 12

Axioma da substituição

Veremos agora o último axioma (ou melhor, esquema de axiomas) de ZF (isto é, o
sistema de Zermelo e Fraenkel sem o axioma da escolha).

Axioma 9 (da substituição) Seja P (x, y) uma fórmula e suponha que, para todo
x, y, z temos que P (x, y) e P (x, z) implicam y = z. Então, para todo conjunto X,
existe o conjunto
{y : ∃x(x ∈ X ∧ P (x, y))}.

A condição sobre a fórmula P diz que, para todo x, existe no máximo um y para
o qual P (x, y) vale. Ou seja, P exerce o papel de uma função parcial em X, e o
axioma da substituição garante que existe a imagem dessa “função”.
Para simplificar a notação, introduzimos alguns sı́mbolos lógicos que serão utili-
zados neste capı́tulo. O sı́mbolo ∃0 significa “existe no máximo um” e é definido da
seguinte forma:
∃0 xP ≡ ∀y(Pxy → (x = y))
O sı́mbolo ∃! significa “existe um único” e é definido como

∃!xP ≡ (∃xP ) ∧ (∃0 xP )

Formalmente, utilizando essa notação, o esquema de axiomas da substituição diz


que para toda fórmula P em que v não ocorre livre a seguinte fórmula é um axioma:

∀x∃0 yP → ∀X∃v∀y((y ∈ v) ↔ ∃x(x ∈ X ∧ P ))

O motivo da restrição de v não ocorrer livre em P é o mesmo que foi discutido no


axioma da separação: reservamos a variável v para definir o conjunto que o axioma
constrói, e a ocorrência livre de v em P poderia resultar em um paradoxo.
Poderı́amos suprimir o axioma da separação da lista de axiomas de ZFC, e prová-
lo como teorema, a partir do axioma da substituição. Para isso basta tomarmos a
fórmula P (x) ∧ (x = y), escolhendo y uma variável que não ocorre livre em P (lem-
brando que, utilizando os axiomas lógicos, é sempre possı́vel substituirmos uniforme-
mente as variáveis livres de uma fórmula). O axioma da separação nos garante que
existe o conjunto
{y : ∃x(x ∈ X ∧ P (x) ∧ (x = y))},

71
72 CAPÍTULO 12. AXIOMA DA SUBSTITUIÇÃO

o que coincide com o conjunto


{x ∈ X : P (x)}.

Classes de conjuntos: Para entendermos melhor o axioma da substituição, pre-


cisamos compreender a noção intuitiva de classes de conjuntos. A grosso modo, uma
classe própria é um conjunto (intuitivamente falando) “grande demais para ser con-
junto”. Por exemplo, vimos que não existe o “conjunto de todos os conjuntos”, nem
o “conjunto de todos os conjuntos unitários”. Então falamos, intuitivamente, da
“classe de todos os conjuntos”, ou da “classe dos conjuntos unitários”.
Outras axiomatizações para a teoria dos conjuntos – como a de Neumann, Bern-
nays e Gödel (NGB) e a de Kelley e Morse (KM) – formalizam o conceito de classes.
Nessas teorias, existem dois tipos de objetos matemáticos: as classes e os conjuntos.
Todo conjunto é uma classe, mas nem toda classe é um conjunto. Classes que não
são conjuntos são chamadas de classes próprias.
Em ZFC, não existem classes, mas podemos reproduzir os argumentos usados em
NGB e KM “interpretando” corretamente o conceito de classe, na metalinguagem.
Para isso, basta identificarmos classes com uma variável livre que ocorre em uma
fórmula. Por exemplo, podemos escrever a fórmula “x é unitário”. Então pensamos
na classe de todos os conjuntos x que satisfazem essa fórmula. Se C é a “classe” de
todos os conjuntos unitários, então escrevermos (por um abuso de notação) x ∈ C é o
mesmo que escrever “x é unitário”. A primeira frase não pode ser escrita formalmente
em ZFC (apenas em NGB e KM), mas a segunda, pode, e tem o mesmo significado
que a primeira.
Assim, dentro de ZFC o conceito de classes pode ser considerado um modo de
enxergarmos alguns argumentos e teoremas que, de outro modo, seria menos intuitivo
para compreendermos.
Sob esse ponto de vista, vamos explicar o que significa o axioma da substituição.
A condição que temos sobre a fórmula P (x, y) é a mesma que temos para uma relação
ser função (parcial). Ou seja, P pode ser vista como uma “função entre classes”. O
axioma da substituição diz que, se o domı́nio de P é um conjunto (ou está contido
em um conjunto), então a imagem de P também é um conjunto. Ou ainda, quando
restringimos P a um conjunto, a imagem de P restrita a esse conjunto também é um
conjunto.
Para aplicarmos o axioma da substituição precisamos enunciar uma nova versão
do teorema da recursão finita. Antes, convém discorrermos sobre as diferenças entre
essa versão e aquela que vimos no Capı́tulo 9, e como aplicaremos para obtermos o
fecho transitivo de um conjunto.
O fecho transitivo de x é o menor conjunto transitivo que contém x. Para conse-
guirmos isso, iteramos
S uma sequência infinita de uniões. Isto é, o fecho transitivo de
x será o conjunto z, onde z é “definido” como
[ [[ [[[
z = {x, x, x, x, . . .}

É claro que essa definição não está boa. Além de definirmos rigorosamente o conjunto
z acima, sem usarmos as reticências, precisamos provar que ele existe, e é nesse ponto
que entrarão o axioma da substituição e o teorema da recursão “para classes”.
73

Vejamos como poderı́amos usar o teorema da recursão finita para provarmos a


existência de z. Retome o enunciado S do Teorema 9.1. O conjunto x será o mesmo
do enunciado, e g a função g(y) = y. Pelo teorema da recursão existe uma S única
+ +
função f de domı́nio ω tal que f (0) = x e f (n ) = g(g(n)). Isto é, f (n ) = f (n).
O conjunto z procurado é justamente a imagem de f .
Porém, há uma falha nos argumentos do parágrafo anterior, que é justamente
a definição de g. Falta definirmos o domı́nio e contradomı́nio de g (o conjunto X
do enunciado do Teorema 9.1). Se tivéssemos o “conjunto de todos os conjuntos”,
bastarı́amos tomar esse como X.
Para contornarmos esse problema, trocamos a função g, no enunciado do teorema
da recursão, por uma “fórmula funcional” G. Exigimos, então, que a fórmula possua
pelo menos duas variáveis livres, x e y, e que, para cada x existe um único y tal que
G(x, y) é verdadeira. Ou seja, poderı́amos escrever y = G(x) e, nessa concepção, a
fórmula G(f (n), f (n+ )) escrita no enunciado do teorema seguinte equivale a f (n+ ) =
G(f (n)).

Teorema 12.1 (recursão finita “para classes”) Sejam x0 um conjunto e G(x, y)


uma fórmula tal que ∀x∃!yG(x, y) seja verdadeira. Existe uma única função f de
domı́nio ω tal que f (0) = x0 e G(f (n), f (n+ )) é verdadeira.

Demonstração: Seja F (n, f ) a seguinte fórmula:

n ∈ ω e f é uma função de domı́nio n+ satisfazendo f (0) = x0 e


G(f (k), f (k + )), para todo k ∈ n.

Primeiro notemos que as expressões f (0), f (k) e f (k + ) da fórmula acima estão


bem definidas. Isto é, 0, k e k + pertencem ao domı́nio de f . De fato, já vimos que
0 ∈ n+ , para qualquer n, e é fácil ver que k ∈ n implica que k + ∈ n+ .
Está claro, pela maneira como definimos a fórmula F (n, f ), que essa nunca será
satisfeita quando n não é um número natural. A próxima afirmação, que será pro-
vada por indução em n, assegura que F (n, f ) satisfaz as condições do axioma da
substituição, e tem como “domı́nio” o conjunto ω.

Afirmação 1: Para cada n ∈ ω existe um único f tal que F (n, f ) é


verdadeiro.

A afirmação é verdadeira para n = 0. De fato, f = {(0, x0 )} é a única função de


domı́nio 0+ que satisfaz f (0) = x0 . Como não existe k ∈ 0, a condição G(f (k), f (k + ))
é automaticamente satisfeita, para todo k ∈ 0.
Suponha que a afirmação vale para n. Mostraremos para n+ . Seja f satisfazendo
F (n, f ). Pela hipótese, existe y tal que G(f (n), y) é verdadeiro. Defina

g = f ∪ {(n+ , y)}

Ou seja, g restrita a n+ é igual a f , e g(n+ ) = y. Mostremos que vale F (n+ , g).


Como dom(f ) = n+ , temos que g é uma função de domı́nio n+ ∪ {n+ }. Isto é,
dom(g) = (n+ )+ . De 0 ∈ n+ e n+ = dom(f ) segue que g(0) = f (0) = x0 .
74 CAPÍTULO 12. AXIOMA DA SUBSTITUIÇÃO

Falta mostrar a “última parte” de F (n+ , g). Seja k ∈ n+ . Temos k ∈ n ou


k = n. Se k ∈ n, temos k + ∈ n+ , que é o domı́nio de f , e, portanto, g(k) = f (k) e
g(k + ) = f (k + ). Logo, de G(f (k), f (k + )) segue G(g(k), g(k + )).
Analisemos o segundo caso: k = n. Temos g(k + ) = g(n+ ) = y e g(k) = f (k).
Logo, de G(f (n), y) segue G(g(k), g(k + )).
Concluı́mos que F (n+ , g) é verdadeira. Mostremos a unicidade. Isto é, se vale
F (n+ , g 0 ) então g = g 0 .
Seja g 0 uma função de domı́nio (n+ )+ satisfazendo F (n+ , g 0 ). Considere f 0 a
restrição de g 0 a n+ . Isto é, definimos f 0 (k) = g 0 (k), para todo k ∈ n+ . Vejamos que
vale F (n, f 0 ).
Temos f 0 (0) = g 0 (0) = x0 . Se k ∈ n, de F (n+ , g 0 ) segue G(g 0 (k), g 0 (k + )). Logo,
como k + ∈ n+ , vale G(f 0 (k), f 0 (k + )). Concluı́mos que F (n, f 0 ) é verdadeira.
Portanto, da hipótese indutiva sobre a unicidade de f , segue que f 0 = f . Em
particular, g 0 (k) = g(k), para todo k ∈ n+ . Para mostrarmos que g = g 0 , basta verifi-
carmos que g(n+ ) = g 0 (n+ ). Mas ambas as fórmulas G(g(n), g(n+ )) e G(g 0 (n), g 0 (n+ ))
são verdadeiras. Como g(n) = g 0 (n), pois n ∈ n+ , da hipótese sobre G segue que
g(n+ ) = g 0 (n+ ).
Concluı́mos, dessa forma, que a existência de uma única f tal que F (n, f ) é
verdadeira implica na existência de uma única g tal que vale G(n+ , g). Portanto,
provamos a afirmação 1 por indução sobre n.
Usando o axioma da substituição, garantimos a existência do seguinte conjunto:

Y = {g : ∃n(n ∈ ω ∧ F (n, g))}

Ou seja, g ∈ Y se, e somente se, vale F (n, g) para algum n ∈ ω. Definimos


[
f= Y

Afirmação 2: f é uma função de domı́nio ω satisfazendo G(f (n), f (n+ )),


para todo n ∈ ω.

Para provarmos a afirmação 2, primeiro notamos que todos os elementos de f são


elementos de alguma função g de domı́nio contido em ω. Logo, f é um conjunto de
pares ordenados da forma (n, y), para n ∈ ω.
Seja n ∈ ω. Existe g que satisfaz F (n, g). Como n ∈ dom(g), existe y tal que
(n, y) ∈ g e, portanto, (n, y) ∈ f . Agora, suponha que exista y 0 tal que (n, y 0 ) ∈ f .
Temos que (n, y 0 ) ∈ g 0 , para algum g 0 ∈ Y . Como n ∈ dom(g 0 ), repetindo o argumento
feito no final da afirmação 1 concluı́mos que a restrição de g 0 a n+ é igual a g e,
portanto, y 0 = g 0 (n) = g(n) = y. Provamos que f é uma função de domı́nio ω.
Vejamos que G(f (n), f (n+ )) vale para todo n. Seja n ∈ ω e tome g tal que vale
F (n+ , g). Temos g ∈ Y e vale G(g(n), g(n+ )). Como f (n) = g(n) e f (n+ ) = g(n+ ),
temos G(f (n), f (n+ )).
Com isso, concluı́mos a afirmação 2 e a existência da f , como no enunciado. Falta
provar a unicidade.
Seja f 0 uma função de domı́nio ω satisfazendo f 0 (0) = x0 e G(f 0 (n), f 0 (n+ )), para
todo n. Provemos, por indução em n, que f 0 (n) = f (n), para todo n.
75

Vale f 0 (0) = f (0) pois ambos são iguais a x0 . Suponha f 0 (n) = f (n). Pela
hipótese sobre G, e por valer G(f 0 (n), f 0 (n+ )) e G(f (n), f (n+ )), isso significa que
f 0 (n+ ) = f (n+ ), como querı́amos.

Uma das aplicações do Teorema 12.1 é a definição do fecho transitivo de um
conjunto. Dizemos que y é o fecho transitivo de x se y é transitivo, x está contido
em y e, para qualquer conjunto transitivo z, se x ⊂ z então y ⊂ z. Ou seja, o fecho
transitivo de x é o menor conjunto transitivo que contém y. Está claro que o fecho
transtivio, quando existe, é único. A existência segue do teorema anterior.

Corolário 12.2 Para todo x existe o fecho transitivo de y.


S
Demonstração: Usando o Teorema 12.1, para x0S= x e G(x, y) a fórmula y = x,
defina f de domı́nio
S ω tal que f (0) = x e f (n+ ) = f (n).
Tome y = im(f ). Mostraremos que y é o fecho transitivo de x.
S que x ⊂ y, pois x ∈ im(f ). Se z ∈ y, existe n ∈ ω tal que z ∈ f (n).
Está claro
Logo, z ⊂ f (n) = f (n+ ). Portanto, z ⊂ y.
Agora suponha que existe um conjunto transitivo z tal que x ⊂ z. Vamos mostrar
que y ⊂ z. Para isso, basta mostrar que S f (n) ⊂ z, para todo n ∈ ω. Mas notemos
que, pela transitividade, se w ⊂ z temos w ∈ z. Assim, como x ⊂ z, por indução
provamos que f (n) ⊂ z, para todo n ∈ ω.


Exercı́cios
1. Prove o Teorema 9.1 como corolário do Teorema 12.1.

2. Prove que existe um conjunto x satisfazendo a seguinte condição: ∅ ∈ x e, se


y ∈ x então {y} ∈ x.

3. Prove a existência de um conjunto indutivo ao qual ω pertence. Discuta o uso


do axioma da substituição.
76 CAPÍTULO 12. AXIOMA DA SUBSTITUIÇÃO
Capı́tulo 13

Relações de ordem

Já vimos dois tipos importantes de relação: as funções e as relações de equivalência.


Veremos, agora, um terceiro tipo de relação: as relações de ordem.
Definição 13.1 Uma relação ≤⊂ X × X é chamada de ordem em X se satisfaz as
seguintes propriedades, para todos x, y, z ∈ X:
• Reflexividade: x ≤ x;
• Transitividade: se x ≤ y e y ≤ z então x ≤ z.
• Anti-simetria: se x ≤ y e y ≤ x então x = y;
Chamamos de conjunto ordenado um par (X, ≤), onde ≤ é uma ordem em X, e
dizemos que X é o domı́nio da ordem ≤.
Uma relação de ordem também é chamada de ordem parcial, para diferenciar da
ordem total, que veremos daqui a pouco.
Um exemplo de ordem em um conjunto X é a relação de inclusão. Isto é, o
conjunto {(x, y) ∈ X × X : x ⊂ y}. De fato, todo conjunto está contido nele mesmo,
se x está contido em y e y está contido em z então x está contido em z, e o axioma
da extensão nos garante que x = y toda vez que x está contido em y e y está contido
em x. Por abuso de notação, usaremos, eventualmente, o sı́mbolo ⊂ para designar a
relação de inclusão, como conjunto de pares ordenados.
Veremos que toda relação de ordem pode ser vista como uma relação de inclusão.
Para explicar o que isso significa, introduzimos a seguinte definição:
Definição 13.2 Sejam ≤1 e ≤2 duas ordens em X1 e X2 , respectivamente. Dizemos
que ≤1 e ≤2 são ordens isomorfas (ou que os conjuntos ordenados (X1 , ≤1 ) e (X2 , ≤2 )
são isomorfos) se existe uma função f : X1 −→ X2 bijetora em X2 tal que x ≤1 y
se, e somente se, f (x) ≤2 f (y).
Nesse caso, dizemos que a função f é um isomorfismo de ordens.
O próximo resultado diz que toda ordem é isomorfa à relação de inclusão sobre
algum conjunto.
Teorema 13.3 Seja (X, ≤) um conjunto ordenado. Existe um conjunto ordenado
(Y, ) isomorfo a (X, ≤) tal que
= {(x, y) ∈ Y × Y : x ⊂ y}

77
78 CAPÍTULO 13. RELAÇÕES DE ORDEM

Demonstração: Defina f : X −→ P(X) como


f (x) = {y ∈ X : y ≤ x}
Tome Y a imagem de f . Mostraremos que f é injetora, o que basta para provarmos
que é bijetora em Y .
Suponha que f (x) = f (y). Pela reflexividade, como x ≤ x e y ≤ y, temos
x ∈ f (x) e y ∈ f (y). Como f (x) e f (y) são iguais, temos x ∈ f (y) e y ∈ f (x). Pela
definição de f isso nos dá x ≤ y e y ≤ x, que, pela anti-simetria, implica que x = y,
provando que f é bijetora em Y .
Agora resta-nos mostrar que x ≤ y se, e somente se, f (x) ⊂ f (y). Suponha que
x ≤ y. Seja z ∈ f (x). Temos que z ≤ x e, por transitividade, z ≤ y. Logo, z ∈ f (y).
Reciprocamente, suponha que f (x) ⊂ f (y). Como x ∈ f (x), temos x ∈ f (y), o que
significa que x ≤ y. 
Listamos agora uma série de definições usadas para conjuntos ordenados.
Definição 13.4 Seja ≤ uma relação de ordem em um conjunto X. Para todo x ∈ X
e todo S ⊂ X não-vazio dizemos que
• x é limitante superior de S se y ≤ x, para todo y ∈ S;
• x é limitante inferior de S se x ≤ y, para todo y ∈ S;
• S é limitado superiormente se possui um limitante superior;
• S é limitado inferiormente se possui um limitante inferior;
• x é máximo de S se x ∈ S e y ≤ x, para todo y ∈ S;
• x é mı́nimo de S se x ∈ S e x ≤ y, para todo y ∈ S;
• x é maximal se não existe y ∈ X tal que x 6= y e x < y;
• x é minimal se não existe y ∈ X tal que x 6= z e y < x;
• x é supremo de S se x é o mı́nimo dos limitantes superior de S;
• x é ı́nfimo de S se x é o máximo dos limitantes inferior de S;
• S é uma cadeia se, para todos y, z ∈ S temos y ≤ z ou z ≤ y.
Essas definições dependem da ordem. Portanto, quando não estiver claro no
contexto qual é a ordem que estamos considerando sobre o conjunto X, devemos
mencionar a qual ordem nos referimos. Ou seja, para ser mais preciso devemos
escrever x é o máximo de X em relação a ≤. Eventualmente, também usamos a
notação ≤-máximo, ≤-maximal etc.
Notemos – pela definição e pela antissimetria da relação de ordem – que nem
sempre um conjunto possui um elemento máximo, mas, se possuir, esse é único. O
mesmo vale para mı́nimo, supremo e ı́nfimo. Porém, podemos ter vários limitantes
superiores e inferiores de um conjunto e elementos maximais e minimais da ordem.
Agora podemos enunciar os principais tipos de ordem usados na matemática:
79

Definição 13.5 Dizemos que uma ordem ≤ sobre um conjunto X é uma(um):

• ordem total (ou ordem linear ) se, para todos x, y ∈ X temos x ≤ y ou y ≤ x;

• boa ordem se todo subconjunto não-vazio de X possui elemento mı́nimo;

• árvore se, para todo x ∈ X, o conjunto {y ∈ X : y ≤ x} é uma cadeia em X;

• reticulado se, para todos x, y ∈ X, o conjunto {x, y} possui supremo e ı́nfimo.

Aplicamos os termos acima também para o conjunto ordenado (X, ≤) e, por abuso
de notação, para o domı́nio X.

Uma ordem total tem esse nome porque todos os elementos do domı́nio podem
ser comparados. Também a chamamos de ordem linear porque podemos visualizar
todos os elementos da ordem como se estivessem numa mesma reta. As ordens usuais
nos números naturais, inteiros, racionais e reais são exemplos de ordens totais.
Nota-se que toda boa ordem também é uma ordem total, uma vez que o conjunto
{x, y} tem mı́nimo, o que nos dá x ≤ y ou y ≤ x.
Uma árvore é uma ordem que pode “bifurcar”, mas nunca “juntar”, como na copa
de uma árvore, em que o tronco se ramifica em galhos, que se ramificam em galhos
menores, mas os galhos nunca se reajuntam. Além das numerosas aplicações em
teoria dos conjuntos, as árvores são usadas em computação e em teoria dos jogos. Por
exemplo, as possı́veis sequências de jogadas a partir de uma posição numa partida de
xadrez formam uma árvore, que um programa de computador (ou o cérebro humano,
de uma maneira mais intuitiva) analisará para poder decidir o melhor lance.
Uma ordem total é uma árvore, já que todo o conjunto é uma cadeia e, portanto,
todos seus subconjuntos são cadeias.
Se considerarmos a ordem da inclusão em uma famı́lia de conjuntos fechada pelas
operações de união e intersecção, essa ordem será um reticulado, onde o ı́nfimo de
{x, y} é x ∩ y, e o supremo é x ∪ y. Esse tipo de ordem é particularmente interessante
nos estudos de álgebras de Boole. O reticulado é um pouco mais geral, pois temos as
operações de supremo e ı́nfimo (que correspondem às operações booleanas “e” e “ou”)
mas não precisamos do complemento (correspondente à operação booleana “não”).
Também é evidente que toda ordem total é um reticulado, já que o próprio x e o
próprio y serão um deles o ı́nfimo e o outro o supremo do conjunto {x, y}.
Por abuso de linguagem, se (X, ≤) é uma boa ordem dizemos que X é um conjunto
bem-ordenado. Obviamente, isso só faz sentido quando, no contexto, está claro qual é
a ordem ≤. Por exemplo, nos números naturais, sabemos que a ordem usual coincide
com a ordem da inclusão. Mostraremos, então, o seguinte teorema:

Teorema 13.6 (ω, ⊂) é uma boa-ordem.

Demonstração: Primeiro provaremos, por indução em n, que todo natural n é


bem-ordenado com a ordem da inclusão. O passo inicial n = 0 é trivial, já que
0 não contém sub-conjunto não-vazio. Supondo que n é bem-ordenado, considere
S um subconjunto não-vazio de n+ . Seja S 0 = S r {n}. Observe que S 0 ⊂ n. Se
80 CAPÍTULO 13. RELAÇÕES DE ORDEM

S 0 = ∅, então S = {n}, que possui n como elemento mı́nimo. Se S 0 6= ∅, pela hipótese


indutiva existe m que é o mı́nimo de S 0 . Como m ∈ S 0 , temos que m ∈ n. Logo, pelo
Teorema 7.8, parte (c), m ⊂ n, provando que m é o mı́nimo também de S.
Seja agora S ⊂ ω não-vazio. Seja k ∈ S e n0 = k + . Temos k ∈ S ∩k + e, portanto,
S ∩ n0 6= ∅. Como n0 é bem-ordenado, seja m o mı́nimo de S ∩ n0 . Mostremos que
m é o mı́nimo de S. Seja n ∈ S. Pelo item (a), temos n ∈ n0 , n = n0 ou n0 ∈ n. No
primeiro caso, de n ∈ S ∩ n0 segue que m ⊂ n, pois é o mı́nimo de S ∩ n0 . No segundo
caso, como m ∈ n0 , por (b) temos que m ⊂ n0 e, portanto, m ⊂ n. No terceiro caso,
como m ∈ n0 e n0 ∈ n, pelo Teorema 7.8, parte (c), segue que m ⊂ n0 e n0 ⊂ n, de
onde concluı́mos que m ⊂ n, provando que (ω, ⊂) é bem-ordenado.

Conjuntos bem-ordenados nos permite fazer um tipo especial de indução e re-
cursão. Suponha que X é bem-ordenado e provamos que, para todo x ∈ X, se uma
determinada propriedade vale para todos os elementos menores que x, então essa
propriedade vale para x. Concluı́mos, então, que essa propriedade vale para todo
elemento de X. De fato, sejam (X, ≤) um conjunto bem-ordenado e P (x) uma pro-
priedade tal que, para todo x ∈ X, se vale P (y), para todo y ≤ x diferente de x,
então vale P (x). Suponha, por absurdo, que existe x0 ∈ X tal que não valha P (x0 ).
Considere Y = {x ∈ X : ¬P (x)}. Por hipótese, Y 6= ∅, pois x0 ∈ Y . Como X
é bem-ordenado, Y possui um mı́nimo (digamos, x1 ) em relação à ordem ≤. Isso
significa que todo elemento de X menor que x1 não pertence a Y e, portanto, satisfaz
a propriedade P . Logo, por hipótese, vale P (x1 ), contradizendo que x1 ∈ X.
Como sempre, onde podemos fazer provas por indução podemos fazer definições
por recursão. Em particular, se temos um conjunto bem-ordenado e queremos definir
uma função que tem como domı́nio esse conjunto, podemos definı́-la em cada elemento
x usando, recorrentemente, sua definição nos elementos menores que x.
Para formalizar esse argumento, anunciamos e provamos o próximo teorema, que
é mais uma versão do teorema da recursão. Desta vez, ela é transfinita, pois pode ser
aplicada a conjuntos arbitrariamente grandes, a partir de uma boa ordem (veremos
uma aplicação do axioma da escolha que mostra que todo conjunto pode ser bem-
ordenado, isto é, para todo X existe ≤ tal que (X, ≤) é bem-ordenado) e, a exemplo
do Teorema 12.1, utiliza o axioma da substituição para que não precisemos “ter
controle” sobre a imagem da função usada no passo indutivo.
Para o próximo teorema, usaremos a seguinte definição: se (X, ≤) é um conjunto

bem-ordenado e x ∈ X, denotamos por x o conjunto dos elementos de X menores
do que x, isto é, o conjunto {y ∈ X : (y ≤ x) ∧ (y 6= x)}.
Teorema 13.7 (recursão transfinita) Seja F (x, y) uma fórmula tal que ∀x∃!yF (x, y)
seja verdadeira. Seja (X, ≤) um conjunto bem-ordenado. Existe uma única função f
cujo domı́nio é X e que satisfaz, para todo x ∈ X,

F (f | x, f (x))

Demonstração: Considere G(x, f ) a seguinte fórmula:


← ←
(x ∈ X) ∧ (f é função) ∧ (dom(f ) = x ∪{x}) ∧ ∀y(y ≤ x → F (f | y , f (y)))
81

Afirmação 1: Para todo x ∈ X, se valem G(x, f ) e G(x, g) então


f = g.

Provemos a afirmação 1 por indução em x. Suponha que a afirmação vale para



todo y ∈ x. Se G(x, f ) e G(x, g) são verdadeiras, está claro, pela definição de G(x, f ),
← ←
que G(y, f |( y ∪{y})) e G(y, g|( y ∪{y})) também valem, para todo y < x. Logo, pela
hipótese de indução, temos, para todo y < x.
← ←
f |( y ∪{y}) = g|( y ∪{y})

Em particular, f (y) = g(y), para todo y ∈ x.
Portanto, das hipóteses G(x, f ) e G(x, g) seguem que
← ←
F (f | x, f (x)) ∧ F (f | x, g(x)),

o que implica, pela hipótese sobre F (x, y), que f (x) = g(x), concluindo que f = g.

Afirmação 2: Para todos x, y ∈ X, se y ≤ x e valem G(x, f ) e



G(y, g), então f |( y ∪{y}) = g.

Nessas hipóteses, está claro, pela definição de G, que G(y, f |( x ∪{x}) é verda-

deira. Portanto, da afirmação 1 segue que f |( x ∪{x}) = g.

Afirmação 3: Para todo x ∈ X existe f tal que G(x, f ).

Suponha, por indução transfinita, que a afirmação seja verdadeira para todo
y < x. Considere o conjunto

Z = {g : ∃y(y ∈ x ∧G(y, g))}

A existência do conjunto Z é assegurada pelo axioma da substituição, lembrando que


a afirmação 1 nos grante que G satisfaz as hipóteses do axioma da substituição.
S ←
As afirmações 2 e 3 provam que Z é uma função cujo domı́nio S é x.
Pela condição sobre F , sabemos que existe um único t tal que F ( Z, t) é verda-
deira.
Defina [
f = ( Z) ∪ {(x, t)}
← S
Como f | x= Z e t = f (x), está claro que

F (f | x, f (x))

Pela definição de Z e pela afirmação 2 temos que G(y, f | y ∪{y}) vale, para todo

y ∈ x.

Em particular, para todo y ∈ x temos

F (f | y , f (y))
82 CAPÍTULO 13. RELAÇÕES DE ORDEM

o que conclui a afirmação.


Se (X, ≤) possui máximo, então as afirmações 1 e 3 já provam o teorema, pois
basta tomar f a única função tal que G(x, f ) é verdadeira, onde x é o máximo de
X. Se não possui máximo, temos duas maneiras de encerrar a prova. A primeira,
repetimos o argumento usado na afirmação 3, usando o axioma da substituição para
definir como f a união de todas as funções g que satisfazem G(x, g), para algum
x ∈ X.
Outra maneira é acrescentarmos um máximo ao conjunto (X, ≤), obtendo um
conjunto bem-ordenado (X 0 , ≤0 ) onde X 0 = X ∪ {x0 } e x ≤0 x0 para todo x ∈ X.
Como mostramos que existe uma única f tal que G(x0 , f ) vale, é fácil ver que f |X
satisfaz as condições do teorema


Exercı́cios
1. Considere X o conjunto das funções f tais que dom(f ) ∈ ω e im(f ) ⊂ ω. Prove
que (X, ⊂) é uma árvore.

2. Considere X o conjunto dos subconjuntos finitos de ω. Isto é,

X = {S ⊂ ω : ∃n∃f ((n ∈ ω) ∧ (f é função injetora de S em n))}

Prove que (X, ⊂) é um reticulado. Assuma, sem provar, que união e intersecção de
conjuntos finitos são finitas.

3. Considere X o conjunto dos subconjuntos finitos ou cofinitos de ω. Isto é,

X = {S ⊂ ω : ∃n∃f ((n ∈ ω)∧((f é função injetora)∧(dom(f ) ∈ {S, ωrS})∧(im(f ) ⊂ n))}

Prove que (X, ⊂) é um reticulado.

4. Seja C uma cadeia no conjunto ordenado (X, ⊂) do exercı́cio 2. Prove que C é


bem-ordenado. O mesmo vale para a ordem do exercı́cio 3? Justifique.

5. Dê exemplos ou prove que não existe:

(a) Uma ordem total que não é uma boa ordem;

(b) Uma árvore que não é uma ordem total;

(c) Um reticulado que não é árvore;

(d) Uma árvore que é um reticulado mas não é totalmente ordenado.


Capı́tulo 14

Axioma da escolha

O axioma da escolha enuncia que, dada uma famı́lia de conjuntos não-vazios, existe
uma função que a cada conjunto pertencente a essa famı́lia seleciona um elemento
desse conjunto.

Axioma 10 (daSescolha) Para todo conjunto x de conjuntos não-vazios existe uma


função f : x −→ x tal que, para todo y ∈ x, f (y) ∈ y.

∀x(∅ ∈
/ x → ∃f ((f é função) ∧ (dom(f ) = x) ∧ ∀y(y ∈ x → f (y) ∈ y)))

A função f garantida pelo axioma da escolha é chamada de função de escolha.


Esse é certamente o axioma mais controverso da teoria dos conjuntos, rejeitado
por algumas correntes filosóficas da matemática, como os construtivistas. Por isso
alguns matemáticos preferem tomar um cuidado especial quando utilizam o axioma
da escolha, evitando-o a todo custo, referindo-se por ZF ao sistema de axiomas de
Zermelo e Fraenkel sem o axioma da escolha e por ZFC ao sistema ZF com o axioma
da escolha (a letra C vem de choice, da sigla em inglês).
Para entendermos melhor por que esse axioma é tão controverso, precisamos
entender para quais construções ele é necessário. Ou seja, precisamos entender para
quais conjuntos x a existência da função de escolha depende do axioma da escolha e
para quais podemos prová-la em ZF.
Primeiro notemos que, se x for finito (isto é, se existe uma função bijetora entre x
e um número natural) então a existência de uma função de escolha é garantida pelos
outros axiomas. Por exemplo: se x é o conjunto {a, b, c}, sendo seus três elementos
não-vazios, sabemos que existem a0 ∈ a, b0 ∈ b e c0 ∈ c. Usando sucessivas vezes o
axioma do par, da união, das partes e da separação (como fizemos quando mostramos
a existência de pares ordenados) construı́mos o conjunto {(a, a0 ), (b, b0 ), (c, co )}, que
é precisamente uma função de escolha no conjunto x.
Formalizando o argumento geral, temos o seguinte: provaremos por indução em
n que, dados x um conjunto de conjuntos não-vazios, n um número natural e s
uma função bijetora de n em x, existe uma função de escolha em x. Se n = 0, x
necessariamente será o conjunto vazio e, portanto, o conjunto vazio é uma função de
escolha em x (verifiquem que, de acordo com a definição dada neste livro, ∅ é uma
função de ∅ em ∅). Suponha que a hipótese de indução é verdadeira para algum

83
84 CAPÍTULO 14. AXIOMA DA ESCOLHA

natural n, e provaremos para n+ . Sejam x um conjunto de conjuntos não-vazios e s


uma função bijetora de n+ em x. Como n+ = n ∪ {n}, defina t a restrição de s a n,
isto é, t = {(m, s(m) : m ∈ n}. Defina y = im(t). Claramente
S t é uma bijeção de n
em y. Logo, pela hipótese indutiva, existe g : y −→ y tal que g(z) ∈ z, para todo
z ∈ y. Como s(n) 6= ∅, pois s(n) ∈ x, existe a ∈ s(n). Defina f = g ∪ {(s(n), a)}.
Como x = y ∪ {s(n)} é fácil verificar que f é uma função de escolha em x.
Ou seja, se substituirmos “para todo x” pela expressão “para todo x finito” no
enunciado do axioma da escolha, teremos um teorema que é válido em ZF.
Outro caso bem significativo em que não precisamos lançar mão do axioma da
escolha para provarmos a existência de uma função de escolha é quando existe uma
fórmula que desempenha esse papel de selecionar exatamente um elemento de cada
conjunto que pertence a x.
De fato, suponha que existe uma fórmula P (y, z) tal que, para todo y ∈ x, existe
um único z em y para o qual P (y, z) é verdadeira. Isto é, suponha que existe uma
fórmula P para a qual conseguimos provar que

∀y(y ∈ x → ∃!z(z ∈ y ∧ P )),

onde o sı́mbolo ∃! é definido da seguinte forma:

∃!zA ≡ ∃z(A ∧ ∀w(Aw


z → (z = w)))

Nesse caso, provamos a existência da função de escolha usando o axioma da separação:


[
f = {(y, z) ∈ x × x : (z ∈ y) ∧ P }

Por exemplo, suponha que x é um conjunto formado por subconjuntos não-vazios


de ω. Vimos em um exercı́cio do capı́tulo anterior que ω é bem-ordenado pela relação
de inclusão (que coincide com a relação de ordem usual dos números naturais), o que
significa que cada subconjunto não-vazio de ω possui um único elemento que está
contido em todos os demais (isto é, o mı́nimo desse subconjunto). Logo, podemos
definir a seguinte função de escolha

f = {(y, n) ∈ x × ω : (n ∈ y) ∧ ∀m(m ∈ y → n ⊂ m)}

O fato de (ω, ⊂) ser bem ordenado garante que f é uma função cujo domı́nio é
x, e é claramente uma função de escolha.
Vimos, portanto, dois casos particulares do axioma da escolha que são teoremas
de ZF. Então surge a pergunta: quando precisamos do axioma da escolha para provar
a existência de uma função de escolha em x? A resposta é: quando x é infinito e
não existe uma maneira explı́cita e bem determinada de escolher um único elemento
de cada elemento de x.
Bertrand Russell forneceu uma comparação bastante interessante e curiosa para
explicar o axioma da escolha: para escolhermos uma meia de cada par de meias,
dentre uma coleção infinita de pares de meias, precisamos usar o axioma da escolha;
se forem sapatos, não precisamos. Isso porque, no caso dos sapatos, podemos escolher
o pé direito de cada par, e, no caso das meias, os pés de cada par são indistinguı́veis.
85

Portanto, os objetos matemáticos cuja existências dependem do axioma da es-


colha não podem ser construı́dos explicitamente, de forma que possamos determinar
precisamente quais são os seus elementos. Quando dizemos que há uma função de
escolha em um conjunto x e, para isso, foi essencial o uso do axioma da escolha,
isso significa que há, na verdade, uma infinidade de possı́veis funções de escolha,
e que não podemos precisar qual função nós estamos considerando. Tais objetos
matemáticos são ditos não-construtı́veis e, para alguns matemáticos, nada vale pro-
varmos a existência de um objeto que não conseguimos explicar exatamente quem
ele é.
Porém é certo que, desde o inı́cio, como mostramos na introdução, a teoria dos
conjuntos não agradou os construtivistas. A prova de Cantor de que existem muitos
números transcendentes independe do axioma da escolha e, mesmo assim, é altamente
não-construtiva. Ainda assim, há muitos que aceitam ZF como algo suficientemente
construtivo, mas recusam trabalhar em ZFC.
Um dos resultados dependentes do axioma da escolha e que mais agravaram
a polêmica em torno dele é o paradoxo de Banach-Tarski: existe uma forma de
particionar uma bola no espaço em uma quantidade finita de partes e remontar essas
partes para formar duas bolas disjuntas, idênticas à primeira. Para muitos, esse
resultado apenas prova que não existe uma medida universal finitamente aditiva em
R3 . Para outros, no entanto, essa é uma evidência de que as aplicações do axioma
da escolha são inúteis, sem nenhuma conexão com a realidade.
Por outro lado, muitos resultados importantes da matemática dependem do axi-
oma da escolha, como a existência de uma base em qualquer espaço vetorial e o
Teorema de Hahn-Banach. Mas a maior aplicação do axioma da escolha é na teoria
dos cardinais. O fato de podermos atribuir a qualquer conjunto um “tamanho” – ao
qual chamamos de cardinalidade – depende do axioma da escolha.
Feita essa pequena discussão filosófica sobre o axioma da escolha, enunciamos,
agora, suas principais aplicações. Começamos mostrando a forma equivalente ao
axioma da escolha mais utilizada na matemática.

Teorema 14.1 (Lema de Zorn) Se (X, ≤) é uma ordem parcial em que toda ca-
deia admite limitante superior, então (X, ≤) admite um elemento maximal.

Demonstração: Primeiro vamos discutir um pouco a ideia intuitiva desse teorema


(que, por motivos históricos, recebeu essa alcunha de lema). Suponha que (X leq)
não admita um elemento maximal. Notemos que a hipótese do teorema implica que
X é não-vazio (por quê?). Tomamos, então, algum x0 ∈ X. Como x0 não é maximal,
encontramos algum x1 estritamente maior que x0 . Da mesma forma podemos encon-
trar algum x2 maior que x1 e assim por diante (aqui podemos imaginar que o axioma
da escolha é necessário para tomarmos sempre um elemento maior do que outro).
Após chegarmos em infinitos elementos de X através desse processo, notamos que
esses formam uma cadeia, e, então, pela hipótese, tomamos y um limitante superior
dessa cadeia, e iniciamos novamente o processo. A ideia intuitiva é que, em algum
momento, esse processo tem que parar, chegando num elemento maximal. Como,
infelizmente, não tem como formalizarmos essa ideia, não nos resta outra solução a
86 CAPÍTULO 14. AXIOMA DA ESCOLHA

não ser procurar uma demonstração rigorosa, que é árdua, trabalhosa e pouco intui-
tiva. A discussão precedente só serve para dar ao leitor uma vaga noção sobre o que
significa o lema de Zorn e por quê ele vale.
Vamos à demonstração formal, que é adaptada do livro de Halmos, que, por sua
vez, atribui a Zermelo a criação dessa prova.
Começamos definindo X o conjunto das cadeias em X, ordenado pela inclusão.
Mostraremos que X tem um elemento maximal, e isso será suficiente para mostrar
que X tem um elemento maximal, conforme a seguinte afirmação:

Afirmação 1: Se X possui um elemento maximal então X possui um


elemento maximal.

De fato, suponha que A é um elemento maximal de X. Pela hipótese sobre X,


seja x ∈ X um limitante superior de A, ou seja, a ≤ x para todo a ∈ A. Temos
que x ∈ A pois, caso contrário, terı́amos que A ∪ {x} seria uma cadeia que contém
propriamente A, contradizendo a maximalidade de A. Temos que x é maximal em
X, pois, se existisse y ∈ X tal que x ≤ y e x 6= y terı́amos novamente que A ∪ {y}
seria uma cadeia maior que A. Isso conclui a prova da afirmação.
S
Afirmação 2: Se C é uma cadeia em X então C ∈ X.
S
Como C é claramente
S um subconjunto de X, para mostrarmos a afirmação
S
basta provarmos que C é uma cadeia em X. Sejam a e b pertencentes a C.
Sejam A, B ∈ C tais que a ∈ A e b ∈ B. Como C é uma cadeia, temos que A ⊂ B
ou B ⊂ A, o que significa que a, b ∈ A ou a, b ∈ B. Como C ⊂ X, tanto A quanto B
são cadeias, o que significa que a ≤ b ou b ≤ a.
Seja f uma função de escolha em P(X)r{∅}. Definimos uma função s : X −→ X
como


A ∪ {f ({x ∈ X r A : A ∪ {x} ∈ X})} , se A não é maximal;
s(A) =
A , se A é maximal;

A função s faz o seguinte: se A é uma cadeia não-maximal, s estende A acrescentando-


lhe um único elemento. Se A é uma cadeia maximal, s(A) = A. Se A é uma cadeia
não-maximal, existirá x ∈ / A tal que A ∪ {x} é uma cadeia, pois o subconjunto de
uma cadeia é uma cadeia. Reparem a necessidade de usar o axioma da escolha para
podermos escolher um elemento para estender a cadeia A.
Com essa definição e pela afirmação 1, nossa tarefa de demonstrar o lema de Zorn
se reduz, agora, à tarefa de mostrar que existe A ∈ X tal que s(A) = A.
Antes de prosseguirmos a demonstração, precisamos de mais algumas definições.
Dizemos que um subconjunto T de X é uma torre se satisfaz as seguintes condições:

• ∅ ∈ T;

• se A ∈ T então s(A) ∈ T ;
87
S
• se C é uma cadeia em (T, ⊂) então C ∈ T.
Existe pelo menos uma torre, pois claramente X é uma. Logo, podemos introduzir
a seguinte definição: \
X 0 = {T ⊂ X : T é uma torre}.

Afirmação 3: X 0 é uma torre e está contida em qualquer outra torre.

Deixamos a cargo do leitor provar essa afirmação, que é bem semelhante à de-
monstração de que ω é um conjunto indutivo. Pela minimalidade de X 0 iremos
fazer algumas provas utilizando uma espécie de indução, onde s desempenha o papel
de sucessor. Na verdade, pela terceira condição sobre torres, essa indução mais se
aproxima da indução transfinita, que veremos posteriormente.

S que X 0 é uma cadeia em X. Feito isso, não


Nosso próximo objetivo será mostrar
teremos dificuldades em mostrar que X 0 é maximal em X, isto é, é uma cadeia em
X que não está contida propriamente em nenhuma outra cadeia. Pela afirmação 1
isso será suficiente para provarmos o lema de Zorn.
Dizemos que um elemento C de X 0 é comparável se, para todo A ∈ X 0 , temos
A ⊂ C ou C ⊂ A. Mostrar que X 0 é uma cadeia é o mesmo que mostrar que todo
elemento de X 0 é comparável.
Introduzimos agora mais uma definição provisória (a última!): uma função g :
X 0 −→ P(X 0 ) dada por

g(C) = {A ∈ X 0 : (A ⊂ C) ∨ (s(C) ⊂ A)}

Se o leitor teve paciência de acompanhar até aqui, anime-se, pois a demonstração


está chegando no fim. Faltam ainda mais algumas afirmações.

Afirmação 4: Se C é comparável então g(C) = X 0 .

A prova dessa afirmação usa uma espécie de indução, como dissemos anterior-
mente. Precisamos apenas mostrar que g(C) é uma torre e seguirá da afirmação 3
que g(C) = X 0 .
Está claro que ∅ ∈ g(C), pois ∅ ⊂ C. Seja S uma cadeia em g(C). Temos duas
possibilidades: ou todo A ∈ S está contido em S C ou existe pelo menos
S um A ∈ S
tal que s(C) ⊂ A. No primeiro
S caso, temos SS ⊂ C e, portanto,
S S ∈ g(C). No
segundo caso, como A ⊂ S, temos s(C) ⊂ S e, novamente, S ∈ g(C). Para
mostrar que g(C) é torre só falta mostrar que, se A ∈ s(C) então s(A) ∈ g(C).
Seja A ∈ g(C). Temos três casos. Ou A = C, ou A está contido propriamente
em C ou s(C) ⊂ A.
No primeiro caso, temos s(A) = s(C). Em particular, s(C) ⊂ s(A), o que prova
que s(A) ∈ g(C).
No segundo caso, supomos que A está contido propriamente em C. Como C
é comparável, temos C ⊂ s(A) ou s(A) ⊂ C. Se s(A) ⊂ C temos s(A) ∈ g(C).
Assumimos, então, que C ⊂ s(A). Se C = s(A) caı́mos no caso s(A) ⊂ C. Se
C 6= s(A) existe x ∈ s(A) r C. Mas, pela hipótese de A estar contido propriamente
88 CAPÍTULO 14. AXIOMA DA ESCOLHA

em C, existe y ∈ C r A. Portanto, x e y são elementos distintos (pois um pertence a


C e outro não) de s(A) r A, contradizendo que s(A) tem, no máximo, um elemento
que não pertence a A.
No terceiro caso, se s(C) ⊂ A, como A ⊂ s(A) temos s(C) ⊂ s(A), o que nos dá
s(A) ∈ g(C). Concluı́mos, assim, a prova da afirmação.

Afirmação 5: X 0 é uma cadeia em X.

Vamos provar “por indução” que todo elemento de X 0 é comparável. Ou seja,


mostraremos que o conjunto dos elementos comparáveis de X 0 é uma torre e, por-
tanto, coincide com todo o conjunto X 0 .
Como ∅ ⊂ A, para todo A, temos ∅ é comparável.SSeja S uma cadeia em X 0
formada de elementos comparáveis. Mostraremos que S é comparável.S De fato,
seja A ∈ X 0 . Se existe C ∈ S tal que A ⊂ C, temos, em particular, A ⊂ S. Caso
S todo elemento de S é comparável, temos C ⊂ A, para todo C ∈ S,
contrário, como
o que nos dá S ⊂ A.
Falta mostrar que, se C é comparável, s(C) é comparável. Seja A ∈ X 0 . Pela
afirmação 4 temos que A ∈ g(C). Ou seja, A ⊂ C ou s(C) ⊂ A. Como C ⊂ s(C),
temos A ⊂ s(C) ou s(C) ⊂ A, provando que s(C) é comparável.
Isso conclui que o conjunto dos elementos de X 0 é uma torre, provando a afirmação.
S
Afirmação 6: X 0 é maximal em X.
S
Seja C = X 0 . Provemos que s(C) = C. Como, pela afirmação 5, X 0 é uma
cadeia, a afirmação 3 – que diz que X 0 é uma torre – nos garante que C ∈S X 0.
Portanto, novamente pela afirmação 3, s(C) ∈ X 0 . Isso implica que s(C) ⊂ X 0 .
Ou seja, s(C) ⊂ C. Como C ⊂ s(C) concluı́mos que s(C) = C, provando a afirmação.
Portanto X tem um elemento maximal e, pela afirmação 1, X também possui,
provando o lema de Zorn.

Como uma consequência simples do lema de Zorn, mostramos que todo conjunto
pode ser bem-ordenado. Embora a prova detalhada desse resultado seja um pouco
longa, são argumentos bem comuns e corriqueiros, sem tantos “truques” como na
demonstração do lema de Zorn.

Teorema 14.2 (Princı́pio da Boa Ordem) Para todo conjunto X existe uma relação
≤ tal que (X, ≤) é uma boa ordem.

Demonstração: A demonstração do princı́pio da boa ordem é uma aplicação stan-


dard do lema de Zorn. Diversos resultados clássicos da matemática – como a existência
de base em espaços vetoriais e o teorema de Hahn-Banach – utilizam argumentos bem
parecidos. A ideia é simples: se quisermos mostrar que uma propriedade vale para
um conjunto X, consideramos todos a ordem parcial constituı́da dos subconjuntos
de X que satisfazem tal propriedade (no caso, ser bem-ordenado). Verificamos que a
hipótese do lema de Zorn é atendida e tomamos Y um elemento maximal dessa ordem
89

parcial. Se Y não for todo o conjunto X, mostramos que esse pode ser estendido um
pouco mais, contradizendo sua maximalidade.
Quando a propriedade que queremos mostrar para X envolve alguma estrutura
– neste caso, uma ordem – é natural que, nessa ordem parcial que criamos, conside-
remos algo a mais que os subconjuntos de Y . No caso deste teorema, o domı́nio da
ordem parcial é formada pelos conjuntos bem-ordenados (Y, ≤) tais que Y ⊂ X, e
na definição da ordem, precisamos respeitar a compatibilidade entre esses conjuntos
ordenados.
Vamos à demonstração.
Definimos uma ordem parcial (X, ) da seguinte forma: X é o conjunto de todos
os conjuntos bem-ordenados (Y, ≤) tais que Y ⊂ X, e (Y1 , ≤1 )  (Y2 , ≤2 ) se, e
somente se, as seguintes condições são satisfeitas:

1. Y1 ⊂ Y2 ;

2. x ≤1 y se, e somente se, x ≤2 y, para todos x, y ∈ Y1 ;

3. se x ∈ Y1 e y ∈ Y2 r Y1 então x ≤ y.

Fica como exercı́co ao leitor mostrar que (X, ) é um conjunto ordenado. Pro-
varemos que ele satisfaz a hipótese do lema de Zorn.
Seja S uma cadeia em X. Definimos
[
Y = {Y 0 : ∃ ≤0 : (Y 0 , ≤0 ) ∈ S}

e [
≤= {≤0 : ∃Y 0 : (Y 0 , ≤0 ) ∈ S}

Afirmação: (Y, ≤) ∈ X e é um limitante superior de S.

Para provar a afirmação, primeiro verifiquemos que ≤ é uma boa ordem sobre X.
Como S é uma cadeia, dados x, y, z ∈ Y existe (Y 0 , ≤0 ) ∈ S tal que x, y, z ∈ Y 0 e,
para todos u, v ∈ Y 0 , temo u ≤ v se, e somente se, u ≤0 v. Portanto, as propriedades
de ordem são satisfeitas para ≤, pois são satisfeitas para ≤0 . Portanto, ≤ é uma
ordem.
Para verificar que ≤ é uma boa ordem, considere Z ⊂ Y um conjunto não-vazio.
Portanto, existe (Y1 , ≤1 ) ∈ S tal que Z ∩ Y1 6= ∅. Por hipótese, existe z ∈ Z ∩ Y1 que
é mı́nimo, em relação à ordem ≤1 . Vamos mostrar que também é o mı́nimo de Z, em
relação a ≤.
Suponhamos, por absurdo, que existe w ∈ Z tal que w 6= z e w ≤ z. Como z é
mı́nimo de Z ∩ Y1 , temos que w ∈ / Y1 Tome (Y2 , ≤2 ) tal que w ∈ Y2 . Como S é uma
cadeia, vale (Y2 , ≤2 )  (Y1 , ≤1 ) ou (Y1 , ≤1 )  (Y2 , ≤2 ). Mas o primeiro caso não é
possı́vel, pois w ∈ Y2 r Y1 .
Temos, então, (Y1 , ≤1 )  (Y2 , ≤2 ). Da condição 3 da ordem  segue que z ≤2 w.
Porém, como w ≤ z, da definição de ≤, do fato de S ser uma cadeia e da condição 2
da ordem  seguem que w ≤2 z (deixamos os detalhes dessa passagem como exercı́cio
90 CAPÍTULO 14. AXIOMA DA ESCOLHA

ao leitor). Portanto, a antissimetria de ≤2 , nos dá que w = z, contradizendo nossa


hipótese e provando a afirmação.
Agora, aplicamos o lema de Zorn para obter (Y, ≤) maximal em X. Tudo que
precisamos para concluir o teorema é provar que Y = X. De fato, suponha que
Y 6= X. Tome x ∈ X r Y . Considere Y 0 = Y ∪ {x} e defina uma ordem ≤0 em Y 0
acrescentando a condição y ≤ x, para todo y ∈ Y . Isto é, ≤0 =≤ ∪{(y, x) : y ∈ Y }.
Claramente (Y 0 , ≤0 ) é um conjunto bem-ordenado, diferente de (Y, ≤) e tal que (Y ≤
)  (Y 0 , ≤0 ), contradizendo a maximalidade de (Y, ≤).

Os dois teorema anteriores são, na verdade, formas equivalentes ao axioma da
escolha, como mostra o seguinte resultado:
Teorema 14.3 Em ZF, são equivalentes:
(a) Axioma da escolha;
(b) Lema de Zorn;
(c) Princı́pio da boa ordem.

Demonstração: Já provamos que (a) implica (b) e que (b) implica (c), lembrando
que a demonstração do princı́pio da boa ordem não utiliza diretamente o axioma da
escolha, mas apenas o lema de Zorn. Resta mostrar que (c) implica (a), cuja ideia
da demonstração já foi discutida no inı́cio deste capı́tulo.
Seja X um conjunto de conjuntos não-vazios. S Aplicando o princı́pio da boa
ordem, considere ≤ uma boa ordem no conjunto X. Definiremos uma função de
escolha que a cada elemento x de X associa o mı́nimo de x, isto é:
[ [
f = {(x, y) ∈ X × X : (y ∈ x) ∧ ∀z(z ∈ X → y ≤ z}
PelaSpropriedade de boa ordem e pelo fato de ∅ ∈ / X, para todo x ∈ X existe
y ∈ x tal que (x, y) ∈ f . A unicidade do elemento mı́nimo, como já foi discutido
anteriormente, segue da antissimetria da ordem (se y e z fossem “dois mı́nimos”,
terı́amos y ≤ z e z ≤ y, o que implica que y = z).
Portanto f é uma função, e é justamente uma função de escolha em X.


Exercı́cios
1. Discuta a seguinte afirmação: sempre que a existência de uma função de escolha
sobre um conjunto vale em ZFC mas não é assegurada em ZF, temos, em ZFC, mais
de uma função de escolha sobre esse conjunto.

2. Seja f uma função de domı́nio A e imagem B. Prove que existe uma função g
injetora de domı́nio B tal que f ◦ g(b) = b, para todo b ∈ B. Discuta o uso do axioma
da escolha nessa demonstração. Se A for o conjunto ω, é necessário o uso do axioma
da escolha para provar esse resultado?
91

3. Prove que todo espaço vetorial sobre R possui uma base (algébrica).

4. Prove em ZF (sem assumir o axioma da escolha) que ω × 2 e ω × ω podem ser


bem-ordenados.
92 CAPÍTULO 14. AXIOMA DA ESCOLHA
Capı́tulo 15

Conjuntos equipotentes

Este capı́tulo aborda o assunto discutido na introdução, que deu origem a toda a
teoria dos conjuntos: a comparação entre conjuntos infinitos pela “quantidade” de
elementos. Começamos a falar quando dois conjuntos são “iguais”, em termos de
tamanho. No próximo capı́tulo discutiremos o que significa um conjunto ser “menor”
do que outro.

Definição 15.1 Dizemos que dois conjuntos X e Y são equipotentes se existe uma
função bijetora de X em Y . Usamos a notação X ≈ Y para denotar que X e Y são
equipotentes.

Está claro que X ≈ X e que X ≈ Y se, e somente se, Y ≈ X. Também é


fácil verificar (pois a composta de funções bijetoras é bijetora) que X ≈ Y e Y ≈ Z
implica X ≈ Z. Ou seja, ≈ é uma espécie de relação de equivalência sobre a classe
de todos os conjuntos. É claro que, como não existe conjunto de todos os conjuntos,
não podemos considerar ≈ como uma relação (a menos quando o restringimos a uma
famı́lia particular de conjuntos), mas, sim, como um sı́mbolo relacional binário que
adicionamos à linguagem, que satisfaz as propriedades de uma relação de equivalência
(reflexividade, simetria e transitividade).

Definição 15.2 Dizemos que um conjunto é finito se é equipotente a algum número


natural, e infinito se não é finito. Dizemos que um conjunto X é enumerável se é
finito ou equipotente a ω, e não-enumerável se é infinito e não equipotente a ω.

O próximo teorema nos oferece outras três definições alternativas para conjuntos
finitos (e, consequentemente, para conjuntos infinitos).

Teorema 15.3 Para um conjunto X, são equivalentes:


(a) X é infinito;
(b) Não existem n ∈ ω e uma função de domı́nio n e imagem X;
(c) Existe uma função injetora de domı́nio ω e imagem contida em X;
(d) X é equipotente a um subconjunto próprio de X.

93
94 CAPÍTULO 15. CONJUNTOS EQUIPOTENTES

Demonstração: Provaremos as implicações circularmente: (a) implica (b), (b) im-


plica (c), (c) implica (d) e, finalmente, (d) implica (a). Usaremos o axioma da escolha
na parte (b) implica (c).
(a) ⇒ (b) Provaremos pela contrapositiva. Isto é, assumimos que existem n ∈ ω
e uma função f : n −→ X sobrejetora. Mostraremos que X é finito. Isto é, existem
m ∈ ω e uma função g : m −→ X sobrejetora.
Antes, provaremos uma afirmação:

Afirmação 1: Se n ∈ ω e S ⊂ n, então S é finito.

Provaremos a afirmação por indução em n. Seja P (n) a fórmula “todo subconjunto


de n é finito”. Por argumentos de vacuidade, o conjunto vazio é uma função bijetora
no conjunto vazio (verifique). Logo, vale P (0), já que 0 é o único subconjunto de 0.
Supondo que vale P (n) mostraremos P (n+ ).
Seja S ⊂ n+ . Consideremos dois casos. Se n ∈ / S, então S ⊂ n e, pela hipótese
de indução, S é finito. Se n ∈ S, considere S = S r {n}. Temos que S 0 ⊂ n e,
0

por hipótese indutiva, S 0 é finito. Sejam m ∈ ω e f : m → S 0 uma função bijetora.


Claramente, f ∪{(m, n)} é uma função bijetora de m+ em S, provando que S é finito.
Provamos, assim, que vale P (n+ ) e que, por indução, vale P (n), para todo n ∈ ω.
Agora usaremos a afirmação para provarmos a primeira parte do teorema. Sejam
n ∈ ω e f : n −→ X sobrejetora. Para cada x ∈ X definimos

f −1 [x] = {k ∈ n : f (k) = x}.

Considere
S = {k ∈ n : ∃x(x ∈ X ∧ k = minf −1 [x])}
Ou seja, escolhemos, para cada x ∈ X, apenas um k ∈ ω tal que f (k) = n. Repare
que, neste ponto, não precisamos usar o axioma da escolha, pois já sabemos que ω é
bem-ordenado.
Seja f 0 = f |S a restrição de f a S. Isto é, f 0 é uma função de S em X definida
como f 0 (k) = f (k), para todo k ∈ S. É fácil verificar que f 0 é bijetora em relação a
X.
Pela afirmação, existem m ∈ ω e g : m −→ S bijetora. Tomemos h = f 0 ◦ g.
Como composição de funções injetoras é injetora, concluı́mos que h é uma bijeção
entre m e X, provando que X é finito.
(b) ⇒ (c) Suponha que vale (b), isto é, não existe uma função sobrejetora de
algum número natural em X. Provaremos a existência de uma função h : ω −→ X
injetora.
A ideia da construção é simples. Definimos h recursivamente. Se temos definida
a função h até n − 1, definimos h(n) como qualquer elemento de X que não está
na imagem de h restrito a {0, . . . , n − 1}. Tal elemento existe pela hipótese de que
nenhuma função de n em X é sobrejetora. Fazendo isso sucessivamente, definimos h
para todo número natural.
O problema é formalizar esse argumento, usando o teorema da recursão. Nas
aplicações que fizemos até agora, definimos f (n+ ) a partir de f (n). Nesse caso,
95

h(n+ ) depende não apenas de h(n), mas de h(i), para todo i ≤ n. Usaremos um
artifı́cio para adaptar o teorema da recursão simples para aquele que conhecemos
como recursão completa.
Também precisaremos usar o axioma da escolha para escolher um elemento de
X que não está na imagem de uma função parcial de ω em X. Começamos a de-
monstração desta parte do teorema fixando s uma função de escolha de domı́nio
P(X) r {∅}. Isto é, s é uma função definida em todos os subconjuntos não-vazios de
X que satisfaz s(A) ∈ A, para todo A ⊂ X não-vazio.
Seja Y o conjunto de todas as funções que têm como domı́nio um número natural
e imagem contida em X. Isto é

Y = {f ⊂ ω × X : (f é função) ∧ (dom(f ) ∈ ω)}

Tome y0 = ∅ e g : Y −→ Y a função definida por

g(f ) = f ∪ {(dom(f ), s(X r im(f ))}

Isto é, se f é uma função de domı́nio n, g(f ) é uma função f 0 de domı́nio n+ definida
da seguinte forma: f 0 (k) = f (k), para k ∈ n, e f 0 (n) = s(X r im(f )). Lembre-se
de que X r im(f ) é não-vazio pela hipótese, que garante que f não é sobrejetora em
relação a X, e s(X r im(f )) é um elemento de X r im(f ), garantindo que f 0 (n) não
pertence à imagem de f .
Pelo teorema da recursão, existe uma função F : ω −→ Y tal que F (0) = y0 e
F (n+ ) = g(F (n)).
Ou seja, cada F (n) é um “pedaço” da função h, que queremos definir, restrita a
n. Definimos [
h= im(F )
Para ficar mais clara a definição de h, uma outra definição equivalente a essa seria:
h é uma função de ω em X tal que h(n) = f (n), tomando f = F (n+ ).
A função h é injetora. De fato, se n 6= m, podemos assumir, sem perda de
generalidade, que m ∈ n. Sejam f1 = F (m+ ) e f2 = F (n+ ). É fácil verificar, por
indução, que F (m+ ) ⊂ F (n). Como, pela construção, f2 (n) ∈ / imF (n), temos que
f1 (m) 6= f2 (n). Logo, h(m) 6= h(n).
(c) ⇒ (d) Suponha que existe uma função f : ω −→ X injetora. Provaremos que
existem Y ⊂ X diferente de X e g : X −→ Y bijetora. Para isso, basta provarmos
que existe g : X −→ X injetora e não sobrejetora, e tomamos Y a imagem de g.
Defina g : X −→ X do seguinte modo: g(x) = x, quando x ∈ / im(f ) e g(f (n)) =
+
f (n ). Formalmente, definimos

/ im(f )} ∪ {(f (n), f (n+ )) ∈ X × X : n ∈ ω}


g = {(x, x) ∈ X × X : x ∈

Provemos que g é uma função, é injetora, e não sobrejetora, em relação a X.


Sejam (x, y) e (x, z) elementos de g. Se x ∈ / im(f ), então ambos y e z são iguais
a x, pela definição de g. Se x ∈ im(f ), de (x, y) ∈ g segue que existe n ∈ ω tal que
x = f (n) e y = f (n+ ), e de (x, z) ∈ g segue que existe m ∈ ω tal que x = f (m) e
z = f (m+ ). Como f (n) e f (m) são ambos iguais a x, da injetividade em f segue que
96 CAPÍTULO 15. CONJUNTOS EQUIPOTENTES

m = n e, portanto, y = z, pois ambos são iguais a f (n). Provamos, assim, que g é


uma função.
Mostremos, agora, que g é injetora. Sejam (x, z) e (y, z) elementos de g, e mos-
remos que x = y. Analisemos três casos. Se ambos x e y não pertencem a im(f ),
pela definição de g temos z = x e z = y, de onde concluı́mos que x = y. Se am-
bos x e y pertencem a im(f ), existem números naturais n e m tais que f (n) = x e
f (m) = y. Pela definição de g, temos que z = f (n+ ) e z = f (m+ ). Da injetividade
de f segue que n+ = m+ , o que implica que n = m e, portanto, x = y. O terceiro
caso a ser analisado seria quando x ∈ im(f ) e y ∈
/ im(f ). Mas isso é impossı́vel, pois,
por um lado, terı́amos z = y e, em particular, z ∈ / im(f ). Por outro lado, terı́amos
que x = f (n), para algum n ∈ ω, e, portanto, z = f (n+ ), contradizendo que z não
pertence à imagem de f .
Falta mostrar que g não é sobrejetora em relação a X. De fato, mostraremos
que f (0) não pertencem à imagem de g. Suponha o contrário. Seja x ∈ X tal que
g(x) = f (0). Se x ∈ / im(f ), temos que g(x) = x, o que é uma contradição, visto que
f (0) pertence à imagem de f . Se x ∈ im(f ), então x é da forma f (n), para algum
n ∈ ω. Nesse caso, como g(x) = f (n+ ), terı́amos f (n+ ) = f (0). Como f é injetora,
isso implica que n+ = 0, de onde segue que n ∈ 0, chegando a um absurdo.
(d) ⇒ (a) Mostraremos pela contrapositiva. Isto é, se X é finito, então X não
é equipotente a um subconjunto próprio. Provaremos, primeiro, que essa afirmação
é verdadeira para os próprios elementos de ω. Ou seja, mostraremos a seguinte
afirmação:

Afirmação 2: Se n ∈ ω e S está contido propriamente em n, então


S não é equipotente a n.

Provemos a afirmação por indução em n. Vale para 0, pois 0 não possui subcon-
junto próprio. Suponhamos que nenhum subconjunto próprio de n é equipotente a
n. Mostraremos que o mesmo vale para n+ .
Suponha, por absurdo, que existem S ⊂ n+ diferente de n+ e uma função bijetora
f de S em n+ . Assumiremos, sem perda de generalidade, que n ∈ / S. De fato, se
+
n ∈ S, como S 6= n , existe m < n que não pertence a S. Podemos “trocar”
n com m, mantendo o mesmo valor de f . Ou seja, no lugar de S consideramos
S 0 = (Sr{n})∪{m} e no lugar de f consideramos f 0 = (f r{(n, f (n))})∪{(m, f (n))}.
Está claro que S 0 continua sendo um subconjunto próprio de n+ (porque n ∈ / S) e f 0
0 +
ainda é uma bijeção de S e n .
Feita essa suposição de que n ∈
/ S, seja m < n tal que f (m) = n. Considere
S = S r {m} e f a restrição de f a S 0 . Temos que f 0 é uma bijeção de S 0 em
0 0

n. De fato, sendo a restrição de uma função injetora, f 0 é uma função injetora, e,


como o único elemento que tiramos da imagem de f foi n, da sobrejetividade de f
em relação a n+ segue a sobrejetividade de f 0 em relação a n. Além disso, S 0 está
contido propriamente em n, visto que m e n não pertencem a S 0 , contradizendo a
hipótese indutiva.
Usando a afirmação 2, mostraremos que um conjunto finito X não pode ser
equipotente a um subconjunto próprio. De fato, suponha, por absurdo, que existe
97

uma função f : X −→ X injetora e não sobrejetora, em relação a X. Ou seja, se


tomarmos Y a imagem de f , temos que X é equipotente a Y , que é um subconjunto
próprio de X. Seja g : X −→ n uma função bijetora e considere h a restrição de X
a Y (isto é, h(y) = g(y), para todo y ∈ Y ).
Seja S a imagem de h. Como Y está contido propriamente em X e f é injetora,
temos que S é um subconjunto próprio de n. De fato, se x ∈ X r Y , então f (x) não
pertence a S.
Note que g −1 é uma bijeção de n em X, f é uma bijeção de X em Y e h é
uma bijeção de Y em S. Como composição de funções bijetoras é bijetora, a função
h ◦ f ◦ g −1 (isto é, a função h ◦ (f ◦ g −1 ), para ser mais preciso) é uma bijeção de n
em S, contradizendo a afirmação 2.

Da equivalência entre (c) e (a) fica claro que ω é um conjunto infinito. Aliás,
fica fácil ver que qualquer conjunto indutivo é infinito (finalmente justificamos o
nome do axioma da infinidade!). Como, dados dois números naturais diferentes, um
está contido em outro, a afirmação 2 feita dentro da demonstração do Teorema 15.3
garante que dois números naturais distintos nunca são equipotentes.
A pergunta que surge é: os conjuntos infinitos são sempre equipotentes, entre
eles? Como vimos no começo do livro, isso não é verdade, pois os números reais são
um exemplo de conjunto não-enumerável, isto é, infinito e não equipotente a ω. O
argumento de Cantor pode ser copiado para provar que P(ω) é não-enumerável. De
modo geral, Cantor mostrou que o conjunto das partes de X não é equipotente a
X. Reparem a semelhança do argumento utilizado por Cantor com o Paradoxo de
Russell.

Teorema 15.4 (Cantor) O conjunto P(X) não é equipotente a X.

Demonstração: Seja f uma função de X em P(X). Considere

Z = {x ∈ X : x ∈
/ f (x)}.

Vamos mostrar que Z ∈ / im(f ).


Suponha que existe z ∈ X tal que f (z) = Z. Se z ∈ Z então, por definição,
z ∈
/ f (z), o que significa que z ∈/ Z. Se z ∈
/ Z isso significa que z ∈
/ f (z), o que
implica que z ∈ Z. Chegamos, assim, numa contradição. 

Exercı́cios
1. Mostre que um conjunto X é infinito se, e somente se, existe uma boa ordem em
X em relação a qual X não possui máximo.

2. Prove que, se X é enumerável então X × X é enumerável (pode usar, sem de-


monstrar, fatos básicos de aritmética).

3. Prove que a união e a intersecção de conjuntos finitos são finitas.


98 CAPÍTULO 15. CONJUNTOS EQUIPOTENTES

4. Prove que um subconjunto de um conjunto finito é finito.

5. Prove que P(X) é finito se, e somente se, X é finito.


Capı́tulo 16

Comparação entre conjuntos

Terminamos o capı́tulo anterior mostrando o teorema de Cantor, que afirma que o


conjunto das partes de um conjunto X não é equipotente a X. Ora, se X e P(X)
“não são iguais”, quanto ao tamanho, então qual deles “é o maior”? Nossa intuição
nos diz que P(X) tem muito mais elementos. De fato, o conjunto {{x} : x ∈ X}
é um subconjunto próprio de P(X) equipotente a X, através da função f (x) =
{x} (a injetividade dessa função segue do axioma da extensão). Como P(X) não é
equipotente a X, mas contém um subconjunto equipotente a X, é sensato dizermos
que P(X) possui um tamanho maior que o conjunto X.
Sendo assim, definimos dessa forma a comparação entre tamanhos de conjuntos:
Y “é maior ou igual a” X se existe um subconjunto de Y equipotente a X. Isso é
equivalente a existir uma função injetora de X em Y (a imagem dessa função seria o
subconjunto de Y equipotente a X).
Quando Y “for maior ou igual a” X, diremos que Y domina X. Se Y “é maior
que” X, diremos que Y domina estritamente X, conforme a definição a seguir.

Definição 16.1 Dizemos que um conjunto Y domina um conjunto X se existe uma


função injetora de X em Y . Dizemos que Y domina estritamente X se Y domina
X mas X não domina Y . Denotamos por X  Y quando Y domina X e X ≺ Y
quando Y domina estritamente X.

De acordo com essa definição, o teorema de Cantor diz que o conjunto das partes
de X domina estritamente X. Ainda de acordo com essa definição, o item (c) do Te-
orema 15.3 nos diz que ω é “o menor” conjunto infinito que existe. Em particular, os
conjuntos não-enumeráveis sempre dominam estritamente os conjuntos enumeráveis.
A pergunta natural a fazer depois de vermos o enunciado do Teorema de Cantor é
sobre a existência de alguma coisa intermediária entre ω e P(ω), ou, mais geralmente,
entre X e P(X). Essa conjectura de que não existe nada entre ω e P(ω) é conhecida
como hipótese do contı́nuo e foi colocada por Hilbert no topo dos problemas mais
importantes na virada do século XIX para o século XX.

Hipótese do contı́nuo: Se ω  X e X  P(ω) então X é equipo-


tente a ω ou a P(ω).

99
100 CAPÍTULO 16. COMPARAÇÃO ENTRE CONJUNTOS

Esse problema foi provado ser independente de ZFC, isto é, não pode ser provado
nem refutado utilizando os axiomas usuais de teoria dos conjuntos. Pelo teorema da
completude da lógica de primeira ordem, isso significa que existem um modelo para
teoria dos conjuntos que satisfaz os axiomas de ZFC e a hipótese do contı́nuo, e outro
modelo para teoria dos conjuntos que satisfaz os axiomas de ZFC e a negação da
hipótese do contı́nuo.
Como dissemos, o problema foi postado por Hilbert em 1900 na sua famosa lista
dos 22 problemas mais importantes do século XIX. A consistência da hipótese do
contı́nuo só foi mostrada em 1940 por Kurt Gödel, e a consistência da negação da
hipótese do contı́nuo foi provada em 1964 por Paul Cohen.
A seguinte generalização da hipótese do contı́nuo também foi provada ser inde-
pendente de ZFC.

Hipótese generalizado do contı́nuo: Se X  Y e Y  P(X) então


Y é equipotente a X ou a P(X).

A ideia de compararmos conjuntos pelo seu tamanho remete a ideia de ordem.


De fato, queremos que a “relação”  (que seria uma relação na classe de todos os
conjuntos) satisfaça as condições de uma relação de ordem.
É fácil verificar que X  Y e Y  Z implicam que X  Z, pois a composição
de funções injetoras é injetora. Também é imediato que X  X, pois a função
identidade é injetora. Para podermos dizer que  estabelece uma relação de ordem
na classe de todos os conjuntos, precisarı́amos ter que X  Y e Y  X implica
X = Y . Obviamente, isso não vale, pois existem conjuntos equipotentes diferentes, e
conjuntos equipotentes dominam um o outro. Porém, é de se esperar que se X  Y
e Y  X então X ≈ Y . Mostraremos que isso é verdadeiro, pelo teorema de Cantor-
Schröder-Bernstein, e esse resultado não depende do axioma da escolha.
Outro resultado importante (e esse depende do axioma da escolha) é podermos
comparar dois conjuntos quaisquer. Isto é, dados dois conjuntos, ou os dois são
equipotentes ou um domina estritamente o outro. Pelo teorema de Cantor-Schröder-
Bernstein, para mostrarmos isso basta verificarmos que, dados dois conjuntos, um
deles domina o outro. Antes de provarmos esse resultado, provaremos um lema
importante, que diz que a existência de uma função injetora de X em Y é equivalente
à existência de uma função sobrejetora de T em X.

Lema 16.2 Sejam X e Y conjuntos não-vazios. Temos que X  Y se, e somente


se, existe uma função sobrejetora de Y em X.

Demonstração: Suponha que existe f : X −→ Y injetora. Tome x0 ∈ X um ele-


mento qualquer. Defina g : Y −→ X como g(y) = f −1 (y), se y ∈ im(f ) (lembrando
que f é bijetora sobre sua imagem) e g(y) = x0 se y ∈ Y r im(f ).
Suponha agora que existe g : Y −→ X sobrejetora. Considere a função h : X −→
P(Y ) dada por
h(x) = {y ∈ Y : g(y) = x}
101

Como g é sobrejetora, h(x) 6= ∅, para todo x ∈ X. Usando o axioma da escolha


defina uma função s : im(h) −→ Y tal que s(A) ∈ A, para todo A ∈ im(h). Defina
a função f : X −→ Y por
f (x) = s(h(x))
Notemos que h(x) ∩ h(x0 ) = ∅, sempre que x 6= x0 . Logo, f é injetora, provando o
que querı́amos. 

Teorema 16.3 Para todos conjuntos X e Y , ou X  Y ou Y  X.

Demonstração: Podemos assumir que tanto X quanto Y são não-vazios, pois,


nesse caso, o resultado seria trivial, uma vez que qualquer conjunto domina o conjunto
vazio.
Supomos que X não domina Y . Pelo Lema 16.2 isso significa que não existe uma
função sobrejetora de X em Y . Vamos mostrar que Y domina X.
Sejam ≤ uma relação de boa ordem sobre o conjunto X e h uma função de escolha
em P(Y ) r {∅}. Defina uma função
[ ←
g: { x Y : x ∈ X} −→ Y

dada por
g(s) = h(Y r im(s)).
Notemos que s não é sobrejetora em Y , pois o domı́nio de s está contido em X e se
tivéssemos im(s) = Y poderı́amos facilmente estender s para uma função sobrejetora
de X em Y , que assumimos não existir. Portanto, h está bem definida.
Pelo teorema da recursão (vide teorema 13.7), existe f : X −→ Y tal que, para
todo x,

f (x) = g(f | x),

lembrando que x denota o conjunto dos elementos de X menores do que x.
Mostremos que f é injetora. Suponha que não seja. Tome x e y em X tais que
x 6= y e f (x) = f (y). Como boa ordem implica ordem total, temos x ≤ y ou y ≤ x.
Podemos assumir que y ≤ x, sendo o outro caso totalmente análogo. Temos que
← ← ←
y ∈ x, contradizendo que g(f | x) ∈
/ im(f | x) e f (x) = f (y). 
Notemos que usamos o axioma da escolha duas vezes na demonstração acima:
uma para bem ordenar o conjunto X e outra para definir a função h. O uso do
axioma da escolha é necessário. De fato, o teorema da comparabilidade dos conjuntos
é equivalente ao axioma da escolha, em ZF.
O próximo lema será usado na demonstração do teorema de Cantor-Schröder-
Bernstein.

Lema 16.4 (teorema do ponto fixo de Tarski) Seja F uma função de P(X) em
P(X) tal que z ⊂ w ⊂ X implica F (z) ⊂ F (w). Então existe w ⊂ X tal que
F (w) = w.
102 CAPÍTULO 16. COMPARAÇÃO ENTRE CONJUNTOS

Demonstração: Sendo F e X como na hipótese do lema, considere o conjunto


A = {z ∈ P(X) : z ⊂ F (z)}
e tome [
w= A.
S
Se z ∈ A, como z ⊂ F (z) e z ⊂ w, temos z ⊂ F (w). Como w = A isso implica
que
w ⊂ F (w).
Agora notamos que, se z ∈ A, então z ⊂ F (z) e, pela hipótese do lema, F (z) ⊂
F (F (z)), o que implica que F (z) ∈ A. Em particular, F (w) ∈ A, o que implica que
F (w) ⊂ w,
provando que F (w) = w.


Teorema 16.5 (Cantor-Schröder-Bernstein) Se X  Y e Y  X então X ≈ Y .

Demonstração: Sejam g : X −→ Y e h : Y −→ X funções injetoras. Mostraremos


que existe f : X −→ Y bijetora.
A ideia da demonstração é dividir X em duas partes, X1 e X2 , e Y em duas
partes, Y1 e Y2 , de modo que g restrita a X1 seja sobrejetora em relação a Y1 e h
restrita a Y2 seja sobrejetora em relação a X2 . Em seguida, basta “colar” as funções
g restrita a X1 e a inversa de h restrita a Y2 . Usaremos o teorema de ponto fixo de
Tarski para achar as partições de X e Y .
Usaremos a notação g[A] para denotar o conjunto im(g|A), e o mesmo também
para a função h.
Defina a função F : P(X) −→ P(X) dada por
F (A) = X r h[Y r g[A]]
Notemos que, se A ⊂ B, g[A] ⊂ g[B]. Logo, Y r g[B] ⊂ Y r g[B] e h[Y r g[B]] ⊂
h[Y r g[B]], concluindo que F (A) ⊂ F (B).
Logo, F satisfaz a hipótese do teorema do ponto fixo de Tarski. Tome X1 ⊂ X
tal que F (X1 ) = X1 . Defina Y1 = g[X1 ], X2 = X r X1 e Y2 = Y r Y1 .
Mostraremos que h[Y2 ] = X2 o que equivale a mostrar que
h[Y r g[X1 ]] = X r X1 .
É fácil verificar que a expressão acima é equivalente a
X r h[Y r g[X1 ]] = X1 ,
que é exatamente a expressão F (X1 ) = X1 , que vale pela definição de X1 .
Tomamos agora
f = (g|X1 ) ∪ (h|Y2 )−1 ,
que é claramente uma função bijetora de X em Y .

103

Exercı́cios
1. Prove que, se X e Y são infinitos, então X ∪Y é equipotente a X ou a Y . Assuma
o seguinte resultado: se X é infinito então X é equipotente a X × X.

2. Seja X um conjunto infinito. Prove que, se X domina Y e domina Z, então X


domina Y ∪ Z. Mostre que isso nem sempre vale quando X é finito.

3. Prove que, se ω domina estritamente X, então X é finito.

4. Prove que, dados dois números naturais n e m, temos que n domina estritamente
m se, e somente se, m < n.

5. Prove que, se Y é não-vazio, X × Y domina X.

Você também pode gostar