Elementos Conjuntos

Elementos da Teoria dos Conjuntos
Rogério Augusto dos Santos Fajardo
24 de Novembro de 2013
2
Conteúdo
1 Aprendendo a contar 5
2 O paradoxo de Russell 13
3 A linguagem da teoria dos conjuntos 17

3.1 O alfabeto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.2 Fórmulas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.3 Unicidade de representação . . . . . . . . . . . . . . . . . . . . . . . . 19
3.4 Omissão de parênteses . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.5 Variáveis livres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.6 Abreviaturas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.7 Sistema de axiomas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.8 Notas sobre sı́mbolos relacionais e funcionais . . . . . . . . . . . . . . 25
3.9 Notas sobre a semântica . . . . . . . . . . . . . . . . . . . . . . . . . 27
4 Axioma da extensão 31
5 Axiomas do vazio, par e união 37
6 Axiomas das partes e da separação 43
7 Axioma da infinidade 47
8 Relações e funções 53
8.1 Pares ordenados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
8.2 Produto cartesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
8.3 n-uplas ordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
8.4 Funções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
9 Aritmética dos números naturais 59

9.1 Aritmética dos números naturais . . . . . . . . . . . . . . . . . . . . 60
10 Axioma da regularidade 63
11 Construção dos conjuntos numéricos 65

11.1 Relação de equivalência . . . . . . . . . . . . . . . . . . . . . . . . . . 65
11.2 Construção do conjunto dos números inteiros . . . . . . . . . . . . . . 66
3
4 CONTEÚDO
11.3 Construção do conjunto dos números racionais . . . . . . . . . . . . . 68

11.4 Construção do conjunto dos números reais . . . . . . . . . . . . . . . 69
12 Axioma da substituição 71
13 Relações de ordem 77
14 Axioma da escolha 83
15 Conjuntos equipotentes 93
16 Comparação entre conjuntos 99

Capı́tulo 1
Aprendendo a contar
A matemática é formada por conceitos abstratos que, muitas vezes, nossa intuição as-
simila com certa facilidade, mas encontramos dificuldade em formalizá-los. A maioria
das pessoas já está familiarizada com os conceitos de conjuntos, funções e relações,
mesmo sem fazer qualquer ideia sobre como explicar esses conceitos, ou sequer com-
preender uma explicação sobre eles. Esse abismo entre intuição e formalização se
evidencia quando estudamos a história da matemática, e descobrimos que conceitos
com os quais a humanidade lida desde os primórdios só foram formalizados – e de
maneira surpreendentemente simples – no século passado.
Para ilustrar isso, imaginemos a seguinte situação cotidiana. George é um me-
nino que está comemorando seu aniversário com os amiguinhos. Após cantarem os
parabéns, sua mãe lhe pede para ajudar a cortar o bolo e distribuir para os amigos.
Para ninguém ficar sem bolo e não haver desperdı́cio, George conta quantas pessoas
estão presentes na festa – digamos que foram vinte – e separa vinte fatias de bolo
para distribuir uma para cada pessoa presente.
Vamos detalhar como é esse processo de contagem, que aparenta ser tão simples.
Primeiro, George ergue a mão e aponta cada uma das pessoas que estão na festa
(inclusive ele, se também quiser comer bolo). Cada vez que ele aponta alguém, ele
fala, em voz alta um número, começando do número 1 e segue, na sequência, até o
número 20. O mesmo processo ele usa para contar as fatias de bolo.
Quando George conta as pessoas, ele está, na realidade, estabelecendo uma função
que associa a cada número natural – no caso, até 20 – uma pessoa na festa. Além de
se preocupar em pronunciar os números na sequência correta, ele toma o cuidado de
não contar duas vezes a mesma pessoa (isto é, a função tem que ser injetora) e de não
deixar ninguém de fora da contagem (isto é, a função também precisa ser sobrejetora).
Ou seja, George sabe, intuitivamente, o que significa uma função bijetora. Mais do
que isso, quando ele conta o número de pessoas e o número de pedaços de bolo –
chegando no mesmo valor – ele sabe que poderá distribuir um pedaço para cada
convidado, sem faltar ninguém (desde que cada um só coma um pedaço). Portanto,
ele sabe que a composição de funções bijetoras é bijetora.
Por trás desse conceito de função, George possui uma ideia intuitiva do que sig-
nifica conjunto: o conjunto das pessoas que estão na festa, o conjunto dos pedaços de
bolo, o conjunto dos presentes que ele ganhou, e assim por diante. Desde o momento
5
6 CAPÍTULO 1. APRENDENDO A CONTAR
que ele aprende a contar, ele consegue abstrair a ideia de conjuntos equipotentes, ou
seja, conjuntos com a mesma quantidade de elementos.
Conjunto é um conceito abstrato, e desse conceito podemos derivar todos os ou-
tros da matemática. Por exemplo, os números naturais – uma das primeiras ideias
abstratas construı́das pela matemática – surgem na tentativa de comparar o tama-
nho de conjuntos formados por objetos concretos (no caso de George, o conjunto de
pessoas na festas e o conjunto de pedaços de bolo cortados). Segundo alguns his-
toriadores da matemática, a palavra cálculo – vinda do latim calculus, que significa
pedra – surgiu do hábito dos pastores, na antiguidade (antes da humanidade criar –
ou descobrir – os números naturais) de utilizar pedras para verificarem se não perde-
ram alguma ovelha, associando cada ovelha a uma pedrinha. Com o surgimento dos
números naturais, passamos a utilizar eles próprios para a contagem de tamanhos de
conjuntos, em vez de um saquinho de pedrinhas.
Dessa forma, os conjuntos, que, inicialmente, eram abstratos mas possuı́am, como
elementos, objetos concretos, podem ser formados por objetos abstratos, como os
números naturais. Mas dessa ideia de conjuntos de objetos abstratos surge um novo
conceito que contraria a nossa intuição e tem assombrado a mente dos melhores
matemáticos: o infinito. Quando nos limitamos a investigar conjuntos formados por
objetos concretos, nunca nos deparamos com a infinitude. Mesmo o conjunto de
todas as estrelas no céu, ou mesmo de todos os átomos do universo, não importa o
quão imenso seja esse conjunto, ele possui uma quantidade limitada de elementos.
Mas os números naturais – sendo esses objetos abstratos, criados pela mente humana
(segundo algumas correntes filosóficas da matemática) – são ilimitados. Isso porque,
se existisse o maior número natural possı́vel, somarı́amos 1 a esse e obterı́amos um
número maior do que esse que seria o máximo.
O processo de contagem para conjuntos finitos, com a qual estamos acostumados
e que explicamos no exemplo do menino George, segue alguns princı́pios que perce-
bemos intuitivamente. Primeiro: não importa a ordem que seguimos na contagem de
um conjunto, encontraremos sempre o mesmo número na quantidade de seus elemen-
tos, contanto que tonhamos o cuidado de não contarmos duas vezes o mesmo elemento
e de não esquecermos de nenhum. Segundo: se tirarmos qualquer elemento de um
conjunto, obteremos, na nova contagem, um número menor de elementos (conforme
diz um axioma de Euclides, de que a parte é menor que o todo).
Porém, quando alguns matemáticos quiseram comparar tamanho de conjuntos
infinitos, começaram a ver que essas “regras”, que valem para conjuntos finitos,
deixam de valer. Galileu Galilei (1564–1642) foi um dos primeiros, que se tem notı́cia,
a usar esse conceito de funções bijetoras para comparar conjuntos infinitos. Ele
considerou a função que associa, a cada número natural, o seu dobro, conforme o
diagrama seguinte:
0 ←→ 0
1 ←→ 2
2 ←→ 4
3 ←→ 6
...
7
Com isso, Galilei mostrou que o conjunto dos números naturais “tem o mesmo ta-
manho” que o conjunto dos números pares, mesmo havendo muitos números naturais
que não são pares.
O hotel de Hilbert O matemático alemão David Hilbert (1862–1943) deu um

exemplo parecido. Se chegamos em um hotel e todos os quartos estão ocupados,
então sabemos que não há vaga nesse hotel, a menos que uma famı́lia saia. Agora
imaginemos um hotel com infinitos quartos – um para cada número natural – sendo
que todos estão ocupados. Chega uma nova famı́lia querendo se hospedar e o dono
não quer despejar nenhum hóspede, mas também não quer recusar quarto para os
recém-chegados. Como há infinitos quartos – mesmo que todos ocupados – é fácil
resolver o problema. Basta passar cada hóspede para o quarto ao lado. Assim, quem
está hospedado no quarto 0 vai para o quarto 1, e do quarto 1 para o 2, e assim por
diante, sobrando o quarto 0 para os novos hóspedes.
O problema do dono do hotel parece se complicar quando chega um ônibus com
uma infinidade de hóspedes, um hóspede para cada número natural. Mas a solução
ainda é simples: ele passa cada hóspede de um quarto para outro cujo número é o
dobro do primeiro. Sobra, assim, todos os números ı́mpares para colocar os novos
hóspedes.
E se chegarem infinitos ônibus – cada ônibus marcado por um número natural
diferente – com infinitos passageiros cada um – cada passageiro também marcado
por um número – poderá ainda o dono do hotel hospedar todo mundo? Sim. E
poderá fazê-lo de forma que não fique nenhum quarto vazio. Basta colocar o n-ésimo
passageiro do m-ésimo ônibus no quarto 2n · (m + 1) (para simplificar, desta vez
assumimos que o hotel está vazio – fica como exercı́cio verificar o que se faria se o
hotel estivesse lotado).
O paraı́so de Cantor Aparentemente o paradoxo criado por Galilei não causou

tanto impacto na matemática e na filosofia, nem foi devidamente explorado durante
alguns séculos. Foi só no século XIX que o assunto foi trazido novamente à tona pelo
matemático alemão Georg Cantor (1845–1918). Dessa vez, o impacto transformou
totalmente o rumo da matemática moderna e deu inı́cio à teoria dos conjuntos, que
será estudada neste curso.
Cantor não só criou um paradoxo ou uma discussão filosófica através dessa ideia
de comparar tamanho de conjuntos infinitos: ele de fato resolveu um problema ma-
temático usando esse conceito. Enquanto outros matemáticos tiveram uma grande
dificuldade para provar que números como π e e são transcendentes (isto é, não são
raı́zes de equações polinomiais de coeficientes inteiros), Cantor provou, de maneira re-
lativamente simples, que existem muitos números transcendentes, mesmo sem exibir
um sequer. Vamos aqui tratar brevemente dessa demonstração.
O conjunto dos números algébricos (os não transcendentes) aparentemente é
muito maior que os números naturais. Para começar, esse engloba todos os raci-
onais, uma vez que a fração ab é raiz da equação bx − a, e quase todos os números
reais que conhecemos. Os transcendentes parecem ser estranhas exceções dentro do
conjunto dos números reais. Se os irracionais já parecem aberrações, mais ainda
os números transcendentes. Pois Cantor provou justamente o contrário: há muito

mais números transcendentes do que algébricos. De fato, o conjunto dos números
algébricos tem o mesmo tamanho que o conjunto dos números naturais.
Estabelecer uma bijeção entre os números naturais e os algébricos não é difı́cil.

Primeiro, precisamos estabelecer uma bijeção entre os números naturais e os po-
linômios de coeficientes inteiros, ou seja, colocarmo-los numa sequência, como uma
fila infinita.
O inı́cio da sequência deve ser constituı́da pelos polinômios de grau 1 e cujos

coeficientes têm módulo menor ou igual a 1. Está claro que existe apenas uma
quantidade finita desses polinômios. Podemos dispô-los em ordem lexicográfica, como
a usada em dicionários, conforme descrevemos abaixo.
−x − 1
−x
−x + 1
x−1
x
x+1
Continuamos a sequência escrevendo os polinômios de grau menor ou igual a 2,

cujos coeficientes têm módulo menor ou igual a 2, e que não estão na lista anterior.
Usamos a mesma ordem lexicográfica dos coeficientes, começando com os polinômios
de grau menor (ou maior, como queiram). Prosseguimos esse processo para 3, 4 e
assim por diante, e isso irá contemplar todos os polinômios de coeficientes inteiros,
conforme ilustra o seguinte diagrama:
9
0 ←→ −x − 1
1 ←→ −x
2 ←→ −x + 1
3 ←→ x−1
4 ←→ x
5 ←→ x+1
6 ←→ −2x − 2
7 ←→ −2x − 1
8 ←→ −2x
9 ←→ −2x + 1
10 ←→ −2x + 2
11 ←→ −x − 2
12 ←→ −x + 2
13 ←→ x−2
14 ←→ x+2
15 ←→ 2x − 2
16 ←→ 2x − 1
17 ←→ 2x
18 ←→ 2x + 1
19 ←→ 2x + 2
20 ←→ −2x2 − 2x − 2
...
Agora, para “colocarmos em fila” os números algébricos basta substituirmos cada
polinômio pelas suas raı́zes (em ordem crescente), suprimindo os que já foram listados.
Fazendo assim obtemos:
0 ←→ −1 (raiz do polinômio −x − 1)
1 ←→ 0 (raiz do polinômio −x)
2 ←→ 1 (raiz do polinômio −x + 1)
3 ←→ −2 (raiz do polinômio −x − 2)
4 ←→ 2 (raiz do polinômio −x + 2)
5 ←→ − 21 (raiz do polinômio −2x − 1)
1
6 ←→ 2√
(raiz do polinômio −2x + 1)
1− 3
7 ←→ 2√
(primeira raiz de −2x2 − 2x + 1)
1+ 3
8 ←→ 2
(segunda raiz de −2x2 − 2x + 1)
...
Com isso Cantor mostrou que o conjunto dos números algébricos “tem o mesmo
tamanho” que o dos números naturais. Isso significa dizer que o conjunto dos números
algébricos é enumerável, ou seja, podemos enumerar todos seus elementos numa lista
infinita, indexada com os números naturais.
É fácil intuir 1 que um subconjunto infinito de um conjunto enumerável é enu-
merável. Assim, os conjuntos dos números inteiros, racionais e algébricos são todos
enumeráveis.
1
A demonstração rigorosa desse fato é mais trabalhosa, como veremos posteriormente.
A essa altura começamos a imaginar que todos os conjuntos são enumeráveis.

Talvez por isso o aparente paradoxo de Galilei não tenha impactado tanto os ma-
temáticos. Infinito é infinito e parece natural que todos os conjuntos infinitos te-
nham o mesmo tamanho. Parece que, se nos esforçarmos bem, como fizemos com os
números algébricos, conseguimos colocar qualquer conjunto infinito numa sequência
bem comportada. Porém, Cantor surpreende a todos ao provar que o conjunto dos
números reais não é enumerável.
Vejamos a prova de Cantor da não-enumerabilidade dos números reais. Seja f
uma função de N em R. Mostraremos que f não pode ser sobrejetora.
Para cada n natural, consideremos an a parte inteira de f (n) e (anm )m∈N a
sequência dos algarismos após a vı́rgula na representação decimal 2 de f (n).
f (0) = a0 , a00 , a01 , a02 , a03 . . .

f (1) = a1 , a10 , a11 , a12 , a13 . . .
f (2) = a2 , a20 , a21 , a22 , a23 . . .
f (3) = a3 , a30 , a31 , a32 , a33 . . .
...
Agora mostremos que existe um real r que não pertence a essa lista. Definimos
r da seguinte forma: a parte inteira pode ser qualquer número (0, por exemplo) e
a n-ésima casa decimal de r será 1 se ann for 0 e será 0 caso contrário. Portanto,
para todo n teremos que a n-ésima casa de f (n) difere da n-ésima casa de r, de onde
concluı́mos que r não está na imagem de f .
Ou seja, escolhemos um número real que “evita” a diagonal da matriz infinita
formada pelas casas decimais de cada número real da sequência. Essa prova ficou
conhecida como argumento diagonal de Cantor 3 .
Com isso Cantor mostrou que o conjunto dos números reais é não-enumerável,
isto é, realmente a quantidade de números reais é maior que dos números naturais.
Ora, se o conjunto dos números algébricos é enumerável, e o conjunto dos números
reais é não-enumerável, concluı́mos que existem infinitos números reais que não são
algébricos.
Concluı́mos também que há uma bijeção entre os números reais e os transcen-
dentes. De fato, considere em R uma sequência (xn )n∈N de números transcendentes
distintos (por exemplo, xn pode ser π + n) e (an )n∈N a sequência de todos os números
algébricos (lembre-se que os algébricos são enumeráveis). Podemos definir uma função
bijetora do conjunto dos números reais nos transcentendes da seguinte forma: cada
an é mapeado para x2n , cada xn é mapeado para x2n+2 , e os demais números são
mapeados para eles mesmos.
A demonstração de Cantor causou uma das maiores controvérsias da história da
matemática. Para alguns, essa prova desvirtua o propósito da matemática e perde
relação com o mundo real. Uma corrente filosófica da matemática – os construti-
vistas – não aceitou o argumento de Cantor pois ele prova a existência de diversos
2
Aqui assumimos que a representação decimal é aquela que nunca utiliza uma dı́zima de perı́odo
9. Ou seja, a representação decimal de 1 que consideraremos é 1, 000 . . ., e não 0, 999 . . ..
3
Um argumento semelhante foi usado por Gödel em uma parte crucial da demonstração do
Teorema da Incompletude.
11
números transcendentes sem ser capaz de exibir (a partir da prova) sequer um número
transcendente.
Para outros matemáticos, no entanto, a prova de Cantor foi uma inovação no
pensamento abstrato e um grande passo para a Rainha das Ciências. O matemático
francês Henry Poincaré (1854–1912) chegou a dizer que “o cantorismo é uma doença
da qual a matemática precisa se curar ´´, enquanto, por outro lado, David Hilbert
reagia às crı́ticas a Cantor dizendo que “ninguém nos tirará do paraı́so criado por
Cantor ´´.
Exercı́cios
1. Mostre uma bijeção entre o conjunto dos números inteiros e os naturais.
2. Prove que qualquer subconjunto infinito dos números naturais é enumerável.
3. Na bijeção que construı́mos entre os números naturais e os polinômios, encontre

o polinômio associado ao número 30.
4. Na bijeção que construı́mos entre os números√naturais e os números algébricos,

encontre o número natural associado ao número 2
5. Suponha que, em um conjunto infinito, existe uma forma de representar cada ele-
mento do conjunto como uma sequência finita de sı́mbolos, dentre um conjunto finito
de sı́mbolos. Mostre que esse conjunto é enumerável e use esse resultado diretamente
para mostrar que os conjuntos dos números racionais e dos números algébricos são
enumeráveis.
Capı́tulo 2
O paradoxo de Russell
O que é conjunto? Todos têm uma noção intuitiva do que é um conjunto, mas, como
sempre ocorre na matemática (e ocorreu com o próprio Euclides, quando tentou
definir o que era ponto e reta), qualquer tentativa de definição seria circular ou
insatisfatória. Portanto, como costuma ocorrer na matemática moderna, em vez de
tentarmos explicar o que são os conjuntos, nos limitaremos a descrever como são os
conjuntos, enunciando os axiomas que os regem, e discutindo o conceito intuitivo que
tais axiomas procuram formalizar.
Inicialmente, o conceito de conjuntos estava diretamente ligado ao das fórmulas
da linguagem de primeira ordem com uma variável livre. Por exemplo, a fórmula
∃y(x = 2 · y) tem x como variável livre (veremos isso no próximo capı́tulo) e, se
pensarmos no universo dos números naturais, representa o conjunto dos números
pares. Um conjunto, então, é determinado por uma propriedade.
Gottlob Frege (1848–1925) tentou levar essa ideia adiante, propondo uma forma-
lização da matemática em que lógica e conjuntos eram praticamente indissociáveis.
Porém, Bertrand Russell (1872–1970) encontrou uma inconsistência nessa forma-
lização, através do seu famoso paradoxo 1 .
Se qualquer propriedade determina um conjunto, então podemos definir um con-
junto X como o conjunto de todos os conjuntos que não pertencem a si mesmos 2
Se permitirmos livremente a construção de conjuntos através de uma expressão
que descreve todos seus elementos, e ainda utilizarmos a linguagem natural, cheia
de auto-referências, podemos definir o conjunto de todos os objetos que podem ser
descritos com menos de vinte palavras. Certamente esse conjunto, se assim existisse,
pertenceria a ele próprio. Ou, um exemplo mais simples, se existir o conjunto de
todos os conjuntos, ele pertence a si próprio.
Surge a pergunta: X pertence a si mesmo? Se sim, então, pela sua definição, ele
1
Esse paradoxo possui uma variança popular conhecido como paradoxo do barbeiro, que dizia
que havia numa cidade um barbeiro que cortava o cabelo de todas as pessoas que não cortavam seu
próprio cabelo, e apemas dessas.
2
Podemos nos perguntar se é possı́vel um conjunto pertencer a si próprio. Nota-se que há uma
diferença entre pertencer a si próprio e estar contido em si próprio. Essa confusão entre as duas
relações é muito comum, devido a uma falha clássica do ensino de matemática no nı́vel básico, que
será discutida melhor durante a disciplina. Um conjunto sempre está contido nele próprio, mas
poderá pertencer a si próprio?
13
14 CAPÍTULO 2. O PARADOXO DE RUSSELL
não pode pertencer. Se não pertence a si mesmo, novamente usando sua definição,
concluı́mos que ele pertence. Chegamos numa inevitável contradição, que só se resolve
não permitindo a existência de tal conjunto.
Isso derruba a proposta de Frege de unificar conjuntos e lógica, relacionando
um conjunto com uma sentença que descreve seus elementos. Para contornar esse
problema surgiram várias alternativas. O próprio Bertrand Russell criou uma for-
malização da aritmética usando teoria dos tipos. Nela, os objetos são classificados
hierarquicamente. Os objetos de primeiro tipo são os números naturais. Os objetos
de segundo tipo são os conjuntos de números naturais. Os de terceiro tipo são os
conjuntos de conjuntos de números naturais, e assim por diante. Nessa formalização,
a pertinência só poderia ser usada entre um objeto de um determinado tipo e outro
do tipo subsequente. Por exemplo, entre números e conjuntos de números.
Ernest Zermelo (1871–1953) e Abraham Fraenkel (1891–1965) propuseram uma
outra formalização mais eficaz e mais simples. Diferente da proposta de Russell, no
sistema de Zermelo e Fraenkel – conhecido como ZFC, quando consideramos o axioma
da escolha (do inglês choice, ou como ZF, quando não consideramos tal axioma – tudo
é conjunto, e podemos agrupar vários objetos matemáticos em um mesmo conjunto.
Como tudo é conjunto, em particular, os próprios números naturais são conjuntos, e
os elementos de conjuntos sempre são conjuntos. Não há a distinção absoluta entre
“elementos” e “conjuntos”, como erroneamente nos ensinaram alguns professores de
ensino médio, nem tampouco há uma hierarquia entre “tipos” de conjuntos, como
formalizou Bertrand Russell.
Para resolver o problema do paradoxo de Russell, a solução foi a seguinte: pode-
mos definir um conjunto através de uma propriedade, como queria Frege, desde que
essa propriedade seja estabelecidada a partir de um conjunto previamente fixado. Por
exemplo, não podemos definir o conjunto de todos os conjuntos finitos, pois não está
claro qual é o universo que estamos considerando, mas podemos definir o conjunto
dos números reais que são maiores que 2. Ou seja, dentro de um conjunto previa-
mente fixado, separamos aqueles que têm a propriedade desejada. Esse é o axioma
da separação, que iremos falar, com mais detalhes, em algumas aulas.
Essa restrição criada pelo axioma da separação em relação à proposta inicial
de Frege cria uma dificuldade na axiomatização: o axioma da separação não nos
permite criar um conjunto “do nada”, sendo necessários outros axiomas que garantem
a existência de certos conjuntos. Assim, enquanto na teoria intuitiva dos conjuntos
– que mais se aproxima da concepção de Frege – basta definirmos um conjunto para
garantir sua existência, na teoria axiomática precisamos provar que ele existe, através
dos axiomas.
Podemos separar os axiomas de ZFC em três grupos. O primeiro deles é formado
pelos axiomas que garantem a existência de um conjunto, em particular. São eles: o
axioma do vazio e o axioma da infinidade. Como os nomes sugerem, eles garantem a
existência, respectivamente, do conjunto vazio e de um conjunto infinito.
O segundo grupo de axiomas é formado por aqueles que nos permitem construir
uns conjuntos a partir de outros. São eles o axioma do par, o axioma da união,
o axioma das partes, o axioma da escolha, o axioma da separação e o axioma da
substituição. Na realidade, esses dois últimos não são, propriamente, axiomas, mas
15
esquemas de axiomas (isto é, sequências infinitas de axiomas dadas por alguma regra
especı́fica), pois, conforme vimos (e veremos com mais detalhes quando estudarmos a
linguagem da teoria dos conjuntos), cada propriedade nos dará uma versão diferente
do axioma da separação. O axioma da substituição é uma generalização do axioma
da separação.
O terceiro grupo de axiomas de ZFC são aqueles que descrevem a natureza dos
conjuntos. São eles: o axioma da extensão e o axioma da regularidade. O primeiro
serve para determinar quando dois conjuntos são iguais, e o segundo garante que
todos os conjuntos são construı́dos sequencialmente a partir do vazio, evitando cir-
cularidades como “um conjunto pertencer a ele próprio”.
A versão atual do axioma da separação impede que o paradoxo de Russell gere
uma contradição no sistema. Porém, o argumento de Russell mostra um teorema
importante de ZFC: não existe o conjunto de todos os conjuntos. De fato, se existisse,
o axioma da separação garantiria a existência do conjunto de todos os conjuntos que
não pertencem a si mesmos, gerando, novamente, o paradoxo. Retornaremos a esse
assunto quando falarmos, formalmente, do axioma da separação.
Na tentativa de resgatar a conceitologia de Frege – de definir coleções de objetos a
partir de uma propriedade, sem impor alguma limitação no universo, como ocorre com
o axioma da separação – alguns matemáticos criaram outras teorias dos conjuntos
onde é apresentado o conceito de classe. Todos os conjuntos são classes, mas algumas
classes – chamadas de classes próprias – são “grandes demais para formarem um
conjunto”. Por exemplo: classe de todos os conjuntos, classe de todas as funções, e
assim por diante. As teorias que formalizam o conceito de classe dentro da teoria
dos conjuntos são NGB (Neumann-Gödel-Bernays) e KM (Kelley-Morse). Porém,
dentro de ZFC podemos trabalhar com o conceito de classe identicando-a com uma
fórmula. Apesar dessas três teorias adotarem formalizações diferentes, os resultados
são essencialmente o mesmo.
Como o axioma da separação depende de escrevermos uma propriedade, não po-
demos axiomatizar a teoria dos conjuntos valendo-se apenas da imprecisa linguagem
natural. Faz-se necessário criarmos uma linguagem de sintaxe controlada e livre de
contexto – como idealizou Frege – que não deixe dúvidas sobre quais frases possam
ser consideradas “propriedades”. Para isso, o próximo capı́tulo discorrerá sobre a
linguagem da lógica de primeira ordem, que será usada na teoria dos conjuntos.
16 CAPÍTULO 2. O PARADOXO DE RUSSELL
Capı́tulo 3
A linguagem da teoria dos

conjuntos
Há um cı́rculo vicioso entre lógica de primeira ordem e teoria dos conjuntos. A for-
malização de uma depende da formalização da outra. Seja como for que lidemos
com essa dicotomia, em algum momento precisamos apelar para a abordagem intui-
tiva da outra. Ou seja, podemos desenvolver toda a teoria dos conjuntos de forma
axiomática mas utilizando a linguagem natural (tal como Halmos faz em seu livro,
e também como é feito nas disciplinas de Análise Real e Álgebra) para, posterior-
mente, formalizarmo-la com a lógica de primeira ordem (que possui a vantagem de
ser muito próxima à argumentação que costumamos fazer na linguagem natural, para
provarmos teoremas matemáticos). Ou podemos estudar lógica primeiro, utilizando
noções intuitivas de teoria dos conjuntos – tais quais aprendemos no Ensino Médio
– para depois desenvolvermos a teoria dos conjuntos axiomaticamente. Seguiremos
aqui uma terceira opção: apresentar apenas uma parte da lógica de primeira ordem
(a sintaxe) – que requer apenas uma parcela mı́nima de noções intuitivas de conjuntos
e aritmética – para depois formalizar a teoria dos conjuntos com o rigor da lógica.
Podemos separar a lógica de primeira ordem em três aspectos: a linguagem,
o sistema de axiomas e a semântica. Os dois primeiros constituem a sintaxe da
lógica de primeira ordem, que trata da manipulação dos sı́mbolos através de regras
bem definidas, livre de contexto e de significado. A semântica trata justamente do
significado das expressões lógicas. É justamente na semântica que o uso de teoria
dos conjuntos é mais evidente e, por essa razão, trataremos aqui apenas da parte
sintática, fazendo apenas alguns comentários a respeito da semântica.
A lógica de primeira ordem pode se adaptar a vários contextos, apresentando
sı́mbolos especı́ficos de algum assunto que quisermos axiomatizar. Assim, para axi-
omatizar a aritmética utilizamos alguns sı́mbolos especı́ficos da aritmética, como +,
×, 0 e 1. Na teoria dos conjuntos, o sı́mbolo especı́fico será o de pertinência (∈).
Por isso, muitas vezes, em vez de dizermos a lógica de primeira ordem, dizemos uma
lógica de primeira ordem, ou uma linguagem de primeira ordem.
Aqui trataremos especificamente da linguagem da teoria dos conjuntos. Não
demonstraremos nenhum dos teoremas aqui enunciados 1 . Como referência recomen-
1
Os teoremas a respeito da lógica de primeira ordem fazem parte do que chamamos de meta-
17
18 CAPÍTULO 3. A LINGUAGEM DA TEORIA DOS CONJUNTOS
damos o livro Set Theory and Logic, de Robert Stoll.
3.1 O alfabeto
Os sı́mbolos utilizados na linguagem da teoria dos conjuntos são os seguintes:
Variáveis: representadas pelas letras minúsculas: x, y, z, . . .. Eventualmente, são

indexadas pelos números naturais: x1 , x2 , x3 , . . ..
Conectivos: ¬ (negação – “não”), → (condicional – “se. . . então”), ∧ (conjunção –

“e”), ∨ (disjunção – “ou”), ↔ (bicondicional – “se, e somente se”).
Quantificadores: ∀ (quantificador universal – “para todo”), ∃ (quantificador exis-

tencial – “existe”).
Parênteses: são os parênteses esquerdo e direito: ( e ).
Sı́mbolo de igualdade: =
Predicado binário: ∈ (pertence).
3.2 Fórmulas
Fórmulas são sequências finitas de sı́mbolos do alfabeto que seguem as seguintes
regras:
1. Se x e y são variáveis, x ∈ y e x = y são fórmulas.
2. Se A e B são fórmulas, ¬(A), (A) → (B), (A) ∧ (B), (A) ∨ (B) e (A) ↔ (B)
são fórmulas;
3. Se A é fórmula e x é uma variável, então ∀x(A) e ∃x(A) são fórmulas.
4. Todas as fórmulas têm uma das formas descritas nos itens 1, 2 e 3.
Por exemplo, pela regra 1, temos que x ∈ y é uma fórmula. Pela regra 1, x = z
também é uma fórmula. A regra 2 nos garante que (x ∈ y) → (x = z) é uma
fórmula. Logo, a regra 3 nos garante que ∀x((x ∈ y) → (x = z)) é uma fórmula.
matemática, isto é, a matemática utilizada para formalizar a matemática. A lógica de primeira
ordem é a linguagem utilizada na matemática. Então nos perguntamos qual é a linguagem utilizada
quando formalizamos a lógica de primeira ordem. Obviamente, utilizamos a linguagem natural,
mas podemos, posteriormente, formalizá-la utilizando a própria ordem de primeira ordem. A essa
linguagem que utilizamos para descrever a lógica de primeira ordem chamamos de metalinguagem.
Em seu livro Uma Breve História do Tempo, Stephen Hawking menciona uma história que serve
como uma curiosa alegoria para entendermos o que é metalinguagem e metamatemática: de acordo
com algumas pessoas, a Terra era achatada e estava apoiada no casco de uma tartaruga gigante,
sendo que essa tartaruga, por sua vez, estava apoiada no casco de uma outra tartaruga gigante, e
assim sucessivamente.
3.3. UNICIDADE DE REPRESENTAÇÃO 19
De fato, é uma expressão que “faz sentido” (ou seja, entendemos o que ela significa,
independente de ser verdadeira ou não). Traduzindo para a linguagem natural, seria
o seguinte: “para todo x, se x pertence a y então x é igual a z”. Ou, simplesmente,
“z é o único elemento de y”.
As fórmulas usadas no processo de construção de fórmulas mais complexas são
chamadas de subfórmulas. Por exemplo, A e B são subfórmulas de (A) → (B). No
caso do nosso exemplo, as subfórmulas de ∀x((x ∈ y) → (x = z)) são x ∈ y, x = z,
(x ∈ y) → (x = z) e, para alguns efeitos práticos, consideramos a própria fórmula
∀x((x ∈ y) → (x = z)) como subfórmula dela mesma.
As fórmulas que constam no item 1 são chamadas de fórmulas atômicas, porque
não podem ser divididas em subfórmulas menores.
3.3 Unicidade de representação

A regra 4 nos diz que as únicas fórmulas são aquelas que se enquadram numa das
três anteriores. Ou seja, toda fórmula é da forma x ∈ y, x = y, ¬(A), (A) → (B),
(A) ∧ (B), (A) ∨ (B), (A) ↔ (B), ∀x(A) ou ∃x(A), onde x e y são variáveis e A
e B são fórmulas. Uma questão importantı́ssima para evitarmos ambiguidades na
limguagem é: toda fórmula pode ser escrita em apenas uma dessa maneira? Isto é,
olhando para uma sequência de sı́mbolos que representa uma fórmula, existe apenas
uma maneira de lermos essa sequência de sı́mbolos como uma dessas formas?
A resposta é sim: se escrevemos uma fórmula de duas possı́veis maneiras, tanto o
sı́mbolo quanto as variáveis e fórmulas envolvidas são as mesmas, nas duas maneiras.
Não demonstraremos isso aqui. Apenas ressaltamos que esse é o papel dos parênteses
na fórmula. Por exemplo, se não houvesse parênteses, considere a fórmula x ∈ y →
x = z ∨ z ∈ x. Podemos cosiderá-la como da forma A → B, onde A é a fórmula x ∈ y
e B é a fórmula x = z ∨ z ∈ x, ou como da forma A ∨ B, onde A é a fórmula x ∈
y → x = z e B é a fórmula z ∈ x. Assim, sem os parênteses não sabemos se se trata
de uma disjunção ou de uma implicação, gerando uma ambiguidade que, inclusive,
fará diferença na interpretação da fórmula. Porém, com a regra dos parênteses na
formação das fórmulas, ou a escrevemos (x ∈ y) → ((x = z) ∨ (z ∈ x)) – que
não há outra forma de descrevermo-la senão da forma (A) → (B) – ou escrevemos
((x ∈ y) → (x = z))∨(z ∈ x) – que é uma fórmula exclusivamente da forma (A)∨(B).
Há uma notação que dispensa o uso de parênteses e, mesmo assim, é livre de
ambiguidades. Chama-se notação pré-fixada, ou notação polonesa, que consiste em
colocar os sı́mbolos na frente das fórmulas e variáveis. Por exemplo, no lugar de
x ∈ y escreverı́amos ∈ xy, no lugar de x = y seria = xy, em vez de (A) ∧ (B)
terı́amos ∧AB. As fórmulas que acabamos de escrever ficariam →∈ xy∨ = xz ∈ zx
ou ∨ →∈ xy = xz ∈ zx. Essa notação é elegante e evidencia a questão da unicidade,
pois basta observarmos o primeiro sı́mbolo para reconhecermos o formato da fórmula.
Porém, como o leitor deve ter percebido, a leitura e compreensão das fórmulas escritas
nessa notação não são nada intuitivas, e se tornam piores para fórmulas longas 2 .
2
Quem já usou a calculadora financeira HP12C deve se lembrar que ela usa uma notação seme-
lhante, só que pós-fixada, em vez de pré-fixada. Ou seja, nessa calculadora pressionamos primeiro
3.4 Omissão de parênteses

Como uma espécie de abuso de notação, às vezes omitimos alguns parênteses des-
necessários para a correta compreensão da fórmula. Por exemplo, embora a forma
correta seja (x = y) ∧ (¬(x ∈ y)), podemos escrever simplesmente (x = y) ∧ ¬(x ∈ y),
sem prejuı́zo da compreensão da fórmula. Outra situação é que evitamos o uso de
parênteses é em torno de um quantificador, como no exemplo ∀x(x ∈ y) → ∃x(x ∈ y).
Em sequência de conjunções ou de disjunções também omitimos os parênteses.
Por exemplo, podemos escrever simplesmente (x = y) ∨ (x ∈ y) ∨ (y ∈ x). Embora
essa notação seja ambı́gua a respeito do formato – pois, apesar de sabermos que
é uma fórmula do tipo (A) ∨ (B), não tem como sabermos se A é x = y e B é
(x ∈ y) ∨ (y ∈ x), ou se A é (x = y) ∨ (x ∈ y) e B é y ∈ x – as duas possı́veis formas
são logicamente equivalentes, ou seja, expressam o mesmo significado.
3.5 Variáveis livres

Cada lugar que surge uma variável dentro de uma subfórmula atômica de uma fórmula
chamamos de ocorrência de tal variável. Por exemplo, a fórmula (x = y) ∨ (x ∈ z)
apresenta duas ocorrências da variável x, e uma de cada uma das variáveis y e z.
Na fórmula ∀x(x = y), não consideramos o primeiro sı́mbolo x como uma ocorrência
da variável, pois não está numa subfórmula atômica. Ou seja, não consideramos
como ocorrência de uma variável quando tal sı́mbolo está imediatamente após um
quantificador.
Dizemos que uma ocorrência de uma variável y numa fórmula A está no escopo
de uma variável x se a A apresenta uma subfórmula da forma ∀x(B) ou ∃x(B), e essa
ocorrência de y está em B. Por exemplo, na fórmula (x ∈ y) ∧ ∃x(y = x), a segunda
ocorrência de y está no escopo da variável x, mas a primeira, não.
Dizemos que uma ocorrência de uma variável x numa fórmula A é livre se tal
ocorrência não está no escopo dela mesma. Chamamos de variáveis livres de uma
fórmula A aquelas que apresentam pelo menos uma ocorrência em que é livre. Uma
sentença é uma fórmula que não apresenta variáveis livres.
Por exemplo, a fórmula ¬(x ∈ y) (x não pertence a y) apresenta duas variáveis
livres: x e y. Não podemos, portanto, julgar tal fórmula como verdadeira ou falsa,
pois não conhecemos quem é x ou quem é y. As variáveis correspondem ao pronome,
na linguagem cotidiana. Se falarmos Ele foi à feira, a pergunta que naturalmente
surge é: Ele quem? Se falarmos João foi à feira, ou alguém do prédio foi à feira, ou
todo mundo do prédio foi à feira, então a frase fica mais completa, e ganha o status
de sentença, que permite averiguar se a frase é verdadeira ou falsa.
Digamos, então, que acrescentemos um quantificador no nosso exemplo. A fórmula
∀x¬(x ∈ y) tem apenas uma variável livre: que é y. A variável x não ocorre livre, pois
só ocorre no escopo dela própria. A fórmula significa “para todo x, x não pertence
a y”, ou, colocada de outra forma, “y não possui elementos”, ou, simplesmente “y é
um conjunto vazio”. Observamos que, para julgarmos a fórmula como verdadeira ou
os números (separados pela tecla “enter”) e depois pressionamos a operação para obtermos os re-
sultados.
3.6. ABREVIATURAS 21
falsa, basta agora conhecermos quem é y. Em outras palavras, a fórmula em questão

nos dita uma propriedade a respeito de y, enquanto a fórmula ¬(x ∈ y) dita uma
propriedade a respeito de x e de y.
Se, porém, escrevemos ∃y∀x¬(x ∈ y), não há mais variáveis livres nessa fórmula.
Essa é uma sentença, cujo significado não depende mais de interpretarmos as variáveis.
Essa sentença diz que existe um conjunto vazio, que veremos ser verdadeira. Se es-
crevêssemos ∀y∀x¬(x ∈ y) terı́amos um significado totalemnte diferente, que seria
todo conjunto é vazio. Claramente essa é uma sentença falsa. Mas é uma sentença,
pois os sı́mbolos estão dispostos numa ordem que faz sentido e não apresenta variáveis
livres.
Se A é uma fórmula e x e y são variáveis, denotamos por Ayx a fórmula obtida ao
substituirmos toda ocorrência livre da variável x pela variável y. Por essa notação,
A é sentença se Ayx é igual a A, para todas variáveis x e y.
Frequentemente denotamos por P (x) uma fórmula que tem x como (única) variável
livre, ou por P (x, y) uma fórmula que tem duas variáveis livres, x e y (e analogamente
para outras quantidades de variáveis livres). Nesse caso, P (y) denota P (x)yx .
O motivo de utilizarmos a letra P nessa notação é justamente pelo fato de P (x)
designar uma propriedade de x. Veremos mais para frente como criar fórmulas para
representar propriedades como “x é um conjunto infinito”, ou “x é enumerável”.
3.6 Abreviaturas
À medida que desenvolvemos assuntos mais complexos, as fórmulas vão se tornando
demasiadamente longas e ilegı́veis. Para resolver isso, introduzimos novos sı́mbolos
que funcionam como abreviaturas para expressões maiores. O importante é que o
processo de conversão da linguagem abreviada para a linguagem da lógica de primeira
ordem seja perfeitamente claro.
Comecemos a exemplificar isso com o sı́mbolo de inclusão. Dizemos que x está
contido em y se todo elemento de x pertence a y. A fórmula para designar inclusão
é ∀z((z ∈ x) → (z ∈ y)). Observe que essa fórmula tem duas variáveis livres, x e y.
Abreviamos essa fórmula como x ⊂ y.
Assim como o sı́mbolo de pertinência, a inclusão é um predicado binário (ou
sı́mbolo relacional binário), pois relaciona uma propriedade entre dois objetos do
universo (no caso, o universo dos conjuntos). Poderı́amos ter introduzido o sı́mbolo
de inclusão entre os sı́mbolos primitivos, como o de pertinência. Mas como a inclusão
é perfeitamente definı́vel a partir da pertinência e dos demais sı́mbolos lógicos, é
tecnicamente mais fácil utilizarmos o sı́mbolo de inclusão apenas como abreviatura.
Outras abreviaturas são um pouco mais sutis na transcrição. Por exemplo, o
conjunto vazio é denotado por ∅. A rigor, para utilizarmos a expressão o conjunto
vazio e denotá-lo por um sı́mbolo, antes precisarı́amos mostrar que ele existe e é único.
Aceitemos esse fato, por enquanto, antes de o provarmos num momento oportuno.
Saber utilizar corretamente essa abreviatura requer um pouco mais de atenção.
Primeiro notemos que, ao contrário da inclusão, o conjunto vazio não se refere a uma
relação entre objetos, mas a um objeto em particular, e, ao contrário das variáveis,
se refere a um objeto bem definido. Corresponde a um nome próprio na linguagem

cotidiana. A esse tipo de sı́mbolo, na lógica, chamamos de constante.
Assim como as variáveis, as constantes são termos, isto é, se referem a objetos
do universo. Podemos utilizá-las no lugar de uma variável em fórmulas atômicas.
Por exemplo, ∅ ∈ x é uma fórmula na linguagem abreviada. Para encontrarmos
o correspondente na linguagem original, precisamos explicar quem é ∅. Para isso,
tomamos uma variável que não está na fórmula (y, por exemplo) e escrevemos da
seguinte forma:
∀y((∀x¬(x ∈ y)) → y ∈ x)
Um importante detalhe da fórmula acima é que a ocorrência não-livre da variável

x não mantém qualquer relação com a ocorrência livre que ocorre a seguir (se quise-
rem, podem substituir x por z, tanto na primeira ocorrência, em x ∈ y quanto após
o ∀). A fórmula significa, numa interpretação literal, “para todo y, se y não possui
elementos, então y é pertence a x”, ou, “para todo y, se y é vazio, então y pertence
a x”, ou, simplesmente, “o conjunto vazio pertence a x”. Notem que essa fórmula
apresenta x como a única variável livre.
Descrevemos, a seguir, o processo formal dessa abreviatura:
Seja B a sequência de sı́mbolos obtida ao substituirmos todas as

ocorrências livres de uma variável x numa fórmula A pelo sı́mbolo ∅.
Então B designará a fórmula ∀x((∀y¬(y ∈ x)) → (A).
Outro exemplo que citaremos aqui é da união de conjuntos. A expressão x ∪ y

representa o conjunto formado pelos elementos que pertencem x ou a y. Ou seja,
∀z(z ∈ x ∪ y ↔ ((z ∈ x) ∨ (z ∈ y)).
Desta vez, essa abreviatura trata-se de um sı́mbolo funcional binário, pois associa
a cada dois objetos do universo um terceiro. Outros exemplos de sı́mbolos funcionais
binários são as operações + e × na aritmética. Eis o detalhamento do processo de
abreviatura:
Sejam A uma fórmula e x, y, z variáveis distintas. Seja B a sequência

de sı́mbolos obtida ao substituirmos toda ocorrência livre de z em A por
x ∪ y. Então B designa a fórmula
∀z(∀w((w ∈ z) ↔ ((w ∈ x) ∨ (w ∈ y))) → A)
Para algumas finalidades – como no estudo da metamatemática ou na elaboração

do sistema de axiomas, como será feito na seção seguinte – convém reduzirmos os
sı́mbolos primitivos ao mı́nimo possı́vel. A partir de agora, passaremos a considerar
como sı́mbolo primitivo da linguagem apenas as variáveis, os parênteses, o sı́mbolo
de pertinência ∈, o sı́mbolo de igualdade =, o quantificador universal ∀, a negação ¬
e a implicação →.
Definiremos a partir desses sı́mbolos os demais anteriormente descritos: ∨, ∧, ↔
e ∃. Eis as regras:
3.7. SISTEMA DE AXIOMAS 23
(A) ∨ (B) é abreviatura para (¬(A)) → (B);
(A) ∧ (B) é abreviatura para ¬((¬(A)) ∨ (¬(B));
(A) ↔ (B) é abreviatura para ((A) → (B)) ∧ ((B) → (A));
∃x(A) é abreviatura para ¬(∀x(¬(A))).
Fica como exercı́cio ao leitor entender, a partir da concepção intuitiva desses

sı́mbolos, o porquê dessas abreviaturas.
3.7 Sistema de axiomas

O sistema de axiomas da lógica de primeira ordem é composto de sete axiomas e
duas regras de inferência. Na verdade, são cinco esquemas de axiomas, pois cada um
representa uma lista infinita de axiomas.
Uma demonstração matemática é uma sequência de fórmulas onde cada uma ou
é um axioma ou é obtida das fórmulas anteriores através de uma regra de inferência.
Um teorema é qualquer fórmula que conste em uma demonstração.
Os axiomas apresentados aqui são os axiomas lógicos, que valem em qualquer
teoria que utiliza a lógica de primeira ordem. Esses axiomas traduzem os argumen-
tos comuns que utilizamos em demonstrações matemáticas. Nos outros capı́tulos
estudaremos os axiomas especı́ficos da teoria dos conjuntos.
Lembramos que é virtualmente impossı́vel demonstrar teoremas complicados uti-
lizando estritamente o rigor lógico apresentado aqui. Na prática, utilizamos os argu-
mentos usuais que estamos acostumados em cursos como Análise Real ou Álgebra.
Mas conhecer o processo formal de demonstração lógica nos dá uma base de sus-
tentação, evitando as armadilhas da linguagem cotidiana. Isto é, devemos, em cada
momento, tomar o cuidado de saber como formalizarı́amos cada trecho de uma argu-
mentação matemática, caso fosse necessário.
Os três primeiros esquemas de axiomas são puramente proposicionais. Lembra-
mos que utilizamos as abreviaturas apresentadas na seção anterior, para os conectivos
∧, ∨, ↔ e o quantificador ∃.
Se A, B, C são fórmulas, as seguintes fórmulas são axiomas:
A1 (A) → ((B) → (A));
A2 ((C) → ((A) → (B)) → (((C) → (A)) → ((C) → (B)));
A3 ((¬(A)) → (¬(B))) → ((B) → (A)).

Os outros quatro esquemas de axiomas tratam da natureza dos quantificadores
(ou melhor, do quantificador, já que reduzimos o quantificador existencial a abrevia-
tura). Nesses esquemas é preciso prestar atenção às regras quanto às variáveis livres
(lembre-se da Seção 3.5)
A4 (∀x((A) → (B))) → ((A) → (∀x(B))), se A e B são fórmulas, e x não possui

ocorrência livre em A;
A5 (∀x(A)) → (Ayx ), se A é uma fórmula e x é uma variável que não ocorre livre no
escopo de y, em A;
A6 x = x é um axioma, para qualquer variável x;
A7 (x = y) → ((A) → (B)), sempre que x, y são variáveis, A é uma fórmula, e B

é obtido de A substituindo alguma ocorrência livre de x por uma ocorrência
livre de y.
As regras de inferência são duas:
Modus Ponens: Se A e (A) → (B) são teoremas então B é teorema.
Generalização: Se A é um teorema e x é uma variável, então ∀x(A) é teorema.
Agora que descrevemos os axiomas e regras de inferência, faremos alguns co-

mentários e exemplos para esclarecer o sistema.
Os três primeiros axiomas, juntamente com o Modus Ponens, são suficientes para
provar todas as instâncias de tautologia 3 . Isto é, se pegarmos uma tautologia da
lógica proposicional, e substituirmos cada proposição por uma fórmula de primeira
ordem (devidamente cercado de parênteses, como mandam nossas regras de formação
de fórmulas), a fórmula obtida é um teorema da lógica de primeira ordem, que pode
ser deduzida a partir dos três primeiros axiomas e do Modus Ponens. Esse surpre-
endente resultado é conhecido como teorema da completude do cálculo proposicional.
A verificação de que uma fórmula é uma instância de tautologia – construindo uma
tabela-verdade – é bem mais simples que uma demonstração axiomática.
O axioma A5 requer uma explicação especial. Primeiro, vejamos, como exemplo
de aplicação, que (∀y(y ∈ x)) → (z ∈ x) é um axioma do esquema A5, pois subs-
tituı́mos a variável livre y por z na fórmula y ∈ x. Propositalmente utilizamos y
no lugar de x e z no lugar de y, na forma como enunciamos o esquema de axiomas,
para deixar claro que, na forma como está enunciada, x e y representam quaisquer
variáveis.
Se tomamos A como a fórmula (y ∈ x) → ∀y(y = x), precisamos tomar um certo
cuidado na aplicação do esquema de axiomas A5. A fórmula Azy é (z ∈ x) → ∀y(y =
x). Ou seja, não substituı́mos a segunda ocorrência de y porque essa ocorrência não
é livre. Esse detalhe na definição de Ayx (ou Azy , como queiram) é essencial.
Por fim, outro cuidado que devemos tomar é com a última condição: a variável
substituı́da não pode estar no escopo da variável nova. Vamos dar um exemplo de
porque existe essa condição e, novamente, para não viciar o leitor com alguma ideia
errada, vamos fazer a substituição da variável y por z, na aplicação de A5. Considere
A a fórmula ∃z¬(y = z). Vamos utilizar o axioma A5 para a fórmula A e as variaveis
y e z. Teremos o seguinte (já omitindo o excesso de parênteses):
(∀y∃z¬(y = z)) → (∃z¬(z = z))

3
Aqui, assumimos que o leitor está familiarizado com noções de lógica proposicional e tabela
verdade. Se não estiver, isso não é absolutamente essencial para o curso, mas é aconselhável estudar
um pouco sobre o assunto, especialmente para melhor compreender a lógica.
3.8. NOTAS SOBRE SÍMBOLOS RELACIONAIS E FUNCIONAIS 25
Ora, num sistema em que ∀y∃z¬(y = z) é um teorema (não é difı́cil um sistema

assim, pois basta uma teoria em que existem dois objetos diferentes), por modus
ponens e essa aplicação de A5 concluı́mos que ∃z¬(z = z), o que é um absurdo (por
A6, regra da generalização e a definição de ∃, temos que a negação dessa fórmula
é um teorema). Portanto, poderı́amos ter uma inconsistência na lógica de primeira
ordem se não declarássemos que essa substituição é proibida: y está no escopo de
z, na fórmula A, e, portanto, não podemos fazer essa substituição na aplicação do
esquema A5.
No esquema de axiomas A7 lembramos que a substituição pode ser feita em
apenas uma ocorrência da variável livre, diferente dos axiomas A4 e A5, em que a
substituição precisa ser feita em todas as ocorrências.
Um exercı́cio não trivial é mostrar que, se podemos fazer uma substituição, em
A7, podemos fazer quantas quisermos.
É bom observar que, no esquema A5, podemos escolher uma variável para subs-
tituição que não ocorra em A. Dessa forma, como caso particular temos que, para
toda fórmula A, (∀xA) → A é um axioma.
3.8 Notas sobre sı́mbolos relacionais e funcionais

Aqui nos limitamos a sistematizar apenas a linguagem da teoria dos conjuntos, que
possui apenas um sı́mbolo relacional (também chamado predicado), que é o sı́mbolo
∈. Dizemos que é um sı́mbolo relacional binário porque tem dois argumentos, isto
é, relaciona dois termos. A rigor, a igualdade poderia ser considerado também um
sı́mbolo relacional binário, mas costuma entrar na lista dos sı́mbolos obrigatórios da
lógica de primeira ordem (mas isso depende da formalização que seguimos).
Os sı́mbolos relacionais correspondem ao verbo da linguagem cotidiana. Por
exemplo, quando dizemos “o pai de João” não estamos enunciando nenhuma afirmação.
A frase “o pai de João” não está passı́vel a julgá-la como verdadeira ou falsa, pois
apenas se refere a algum indivı́duo, e nada diz sobre ele. Mas se dissermos “o pai de
João conhece o pai de Joaquim”, então aı́, sim, temos uma frase completa. O verbo
conhecer relaciona duas pessoas, e, se soubermos quem são os indivı́duos relacionados
pelo verbo conhecer, seremos capazes de julgar se a frase é verdadeira ou falsa.
“O pai de João” e “o pai de Joaquim” correspondem aos termos da lógica de
primeira ordem, pois se referem a indivı́duos do universo que estamos considerando.
“João” e “Joaquim” seriam constantes, pois se referem a indivı́duos especı́ficos, di-
ferentemente das variáveis (os pronomes, como ele, ela, alguém, correspondem às
variáveis). A expressão “O pai de” é, na lógica, sı́mbolos funcionais unários, pois
representa uma função que associa a cada indivı́duo do universo um outro indivı́duo
do mesmo universo. Assim, se criarmos uma lógica para formalizar relações entre
pessoas, nosso universo será o conjunto de todas as pessoas, e “pai de” será uma
função que associa a cada indivı́duo um outro indivı́duo.
Observe que só é possı́vel estabelecermos “pai de” como sı́mbolo funcional porque
cada pessoa possui um único pai biológico (ainda que não esteja mais vivo ou seja
desconhecido). Se a clonagem vingar, já não poderemos tratar “pai de” como sı́mbolo
funcional. Da mesma forma, a expressão “o irmão de” não pode ser usada como
sı́mbolo funcional, pois nem todas pessoas têm irmãos, e algumas têm mais que
um irmão. A expressão “o irmão de” pressupõe que o indivı́duo tem apenas um
irmão, e, na lógica, só poderı́amos usar algo semelhante se isso acontecesse a todos
os indivı́duos. Por outro lado, nada impede de considerarmos “é irmão de” como
sı́mbolo relacional binário, assim como “é pai de” como sı́mbolo relacional binário. A
formalização do “pai” permite escolhermos entre sı́mbolo funcional e relacional, mas
“irmão” necessariamente será um sı́mbolo relacional.
Na aritmética, há dois exemplos clássicos de sı́mbolos funcionais binários: as
operações + e ×, que representam funções que associam a cada dois números um ter-
ceiro. Também podemos considerar como constantes os números 0 e 1 (as constantes
também podem ser vistas como sı́mbolos funcionais 0-ário, ou seja, sem parâmetro
nenhum). Já a relação de ordem < é um sı́mbolo relacional binário.
A sucessiva aplicação de sı́mbolos funcionais (como em 1 × (x + 0), ou “a mãe do
pai de Joaquim”) constrói termos cada vez mais complexos, e os sı́mbolos relacionais
(e a própria igualdade) passam a relacionar termos, e não apenas variáveis. Embora
a preferência de notação, para sı́mbolo funcional ou relacional binário, é colocar o
sı́mbolo no meio dos termos, se o grau desse sı́mbolo for diferente de dois precisamos
mudar a notação, e, para isso, acrescentamos, no alfabeto, a vı́rgula. A definição de
termos passa a ser recursiva, semelhante a de fórmulas, conforme as regras:
1. As variáveis são termos;
2. As constantes são termos;
3. Se t1 , . . . , tn são termos e F é um sı́mbolo funcional n-ário, então F (t1 , . . . , tn )

é um termo;
4. Todos os termos têm uma das formas acima.
Mudamos também a definição de fórmula atômica. Para as fórmulas mais com-

plexas, continuam as regras anteriores.
1. Se t1 e t2 são termos, t1 = t2 é uma fórmula;
2. Se t1 , . . . , tn são termos e R é um sı́mbolo relacional n-ário, então R(t1 , . . . , tn )

é uma fórmula.
O sistema de axiomas muda, também, quando introduzimos sı́mbolos funcionais.

Por exemplo, no axioma A5 fazemos a substituição da variável x por um termo t,
que não necessariamente é uma variável, e precisamos tomar cuidado para que x não
esteja no escopo de nenhuma variável que ocorra em t. O axioma A6 passa a ser
t = t, para todo termo t, e, no axioma A7, novamente substituı́mos as variáveis por
termos. Também acrescentamos o seguinte axioma:
(t = s) → F (t1 , . . . , tk−1 , t, tk+1 , . . . , tn ) = F (t1 , . . . , tk−1 , s, tk+1 , . . . , tn ),
para todo F sı́mbolo funcional n-ário.

3.9. NOTAS SOBRE A SEMÂNTICA 27
Se preferirmos, podemos dispensar o uso de sı́mbolos funcionais no sistema,

transformando-os em sı́mbolos relacionais. Por exemplo, o sı́mbolo de +, na aritmética,
pode ser transformado num sı́mbolo relacional ternário R(x, y, z) que significa x+y =
z. Precisamos, porém, tomar mais cuidado na axiomatização especı́fica.
Embora na teoria dos conjuntos só contamos com um sı́mbolo relacional, se es-
tendermos a linguagem com as abreviaturas que utilizaremos ao longo da disciplina,
podemos pensar em uma série de sı́mbolos funcionais e constantes que utilizamos.
Temos as constantes ∅ (conjunto vazio), ω (o conjunto dos números naturais, que
será explicado posteriormente) etc. Dentre os sı́mbolos funcionais unários adiciona-
dos teremos P(X) (o conjunto dos subconjuntos de X), {x} (o conjunto que tem
como único elemento o conjunto x), e assim por diante. A união e a intersecção de
conjuntos podem ser vistos como sı́mbolos funcionais binários, e a inclusão como um
novo sı́mbolo relacional binário.
3.9 Notas sobre a semântica

Para falarmos sobre a semântica da lógica de primeira ordem, a rigor precisarı́amos
primeiro desenvolver a teoria dos conjuntos. Porém, nesta seção apresentamos uma
breve explicação da semântica, a partir da noção intuitiva de conjuntos que o leitor
provavelmente adquiriu no ensino médio e nas outras disciplinas do curso de ma-
temática. Mas, como prometemos anteriormente, essa parte não será necessária para
aprender a teoria dos conjuntos axiomática, e nada impeça que o leitor só leie esta
seção (ou retorne a ela) após o fim do livro (ou, pelo menos, após o capı́tulo 11).
Não há, portanto, circularidade nessa apresentação. Mas entendermos um pouco da
semântica ajuda a tornar mais intuitiva a sintaxe da lógica de primeira ordem.
Seja L uma linguagem de primeira ordem. Um modelo M para a linguagem L é
uma estrutura constituı́da das seguintes componentes:
• Um conjunto não-vazio D, que chamaremos de domı́nio, ou universo, de M;
• Para cada sı́mbolo relacional n-ário R uma relação RM em D (isto é, RM é um

subconjunto de Dn );
• Para cada constante c um elemento cM de D;
• Para cada sı́mbolo funcional n-ário F uma função F M de Dn em D.
Uma atribuição de variáveis é uma função σ que associa a cada variável um

elemento de D.
Dados um modelo M e uma atribuição de variáveis σ, a interpretação de termos
sob a atribuição σ é uma função σ ∗ que estende a função σ a todos os termos, conforme
as seguintes condições:
• Se x é variável σ ∗ (x) = σ(x);
• Se F é um sı́mbolo funcional n-ário e t1 , . . . , tn são termos, então σ ∗ (F (t1 , . . . , tn )) =

F M (σ ∗ (t1 ), . . . , σ ∗ (tn )).
Se M é um modelo, σ é uma atribuição de variáveis e A é uma fórmula, denota-

mos por (M, σ) |= A quando A é verdadeira no modelo M para uma atribuição de
variáveis σ, que definimos através das seguintes propriedades:
• Para quaisquer termos t1 e t2 , (M, σ) |= t1 = t2 se, e somente se, σ ∗ (t1 ) = σ ∗ (t2 );
• Se R é um sı́mbolo relacional n-ário e t1 , . . . , tn são termos, então (M, σ) |=

R(t1 , . . . , tn ) se, e somente se, (σ ∗ (t1 ), . . . , σ ∗ (tn )) ∈ RM ;
• (M, σ) |= ¬(A) se, e somente se, não ocorre (M, σ) |= A;
• (M, σ) |= (A) → (B) se, e somente se, (M, σ) |= B ou não ocorre (M, σ) |= A;
• (M, σ) |= ∀x(A) se, e somente se, para toda atribuição de variáveis θ tal que
θ(y) = σ(y), para toda variável y diferente de x, temos (M, θ) |= A.
Vamos dar um exemplo para entender melhor o significado de modelo. Considere

a linguagem da aritmética, com dois sı́mbolos funcionais binários + e ×, as constantes
0 e 1 e o sı́mbolo relacional binário <.
Podemos tomar a estrutura dos números naturais como modelo para a aritmética.
Isto é, o domı́nio é o conjunto dos números naturais N, as constantes 0 e 1 são
interpretadas pelos números correspondentes (isto é, 0M = 0 e 1M = 1, notando a
diferença entre os sı́mbolos 0 e 1 e os números 0 e 1). Os sı́mbolos +, × e < também
são interpretados pelas operações e relação correspondentes.
Uma atribuição de variáveis σ associa a cada variável um número natural. Por
exemplo, imagine que σ associa x ao número 1 e y ao número 2. Então o termo
x + y é associado a 3, isto é, σ ∗ (x + y) = 1 + 2 = 3. De acordo com essa atribuição
de variáveis, (M, σ) |= x < y. Agora, considere a fórmula ∀y(x × y = y). Se
modificarmos σ apenas na variável y, teremos x × y = y verdadeiro no modelo M
para essa nova atribuição de variável (pois 1 × y = y vale para qualquer y).
Observe que, se A é uma sentença (isto é, não contém variáveis livres), a veraci-
dade de A num modelo M não depende da atribuição de variáveis. Isto é, se tivermos
(M, σ) |= A teremos (M, θ) |= A, para toda atribuição de variáveis θ. Quando isso
acontece (A é verdadeira em M para qualquer atribuição de variável), denotamos
M |= A. Observe também que, quando A é uma sentença, ou M |= A ou M |= ¬A
(esse é o princı́pio do terceiro excluı́do).
Quando M |= A, também dizemos que o modelo M satisfaz a fórmula A.
Consequência sintática e consequência semântica: Sejam L uma linguagem

de primeira ordem e Γ um conjunto de fórmulas de L. Dizemos que uma fórmula A é
consequência sintática de Γ (que denotaremos por Γ ` A) se existe uma demonstração
de A a partir das fórmulas de Γ (isto é, se incluirmos as fórmulas pertencentes a Γ
entre os axiomas da lógica de primeira ordem, podemos provar A). Dizemos que
uma fórmula A é consequência semântica de Γ (que denotaremos por Γ |= A) se todo
modelo que satisfaz todas as fórmulas em Γ também satisfaz A.
3.9. NOTAS SOBRE A SEMÂNTICA 29
Teoremas fundamentais: Os três principais teoremas metamatemáticos a res-

peito da lógica de primeira ordem são os teoremas da completude, da compacidade e
de Loweinhein-Skolen.
O teorema da completude diz que Γ ` A se, e somente se, Γ |= A. Ou seja, con-
sequência sintática é equivalente a consequência semântica, provando que o sistema
de axiomas que construı́mos é suficiente para provar tudo que podemos provar pelos
argumentos usuais da linguagem cotidiana.
O teorema da compacidade diz que, se para todo Γ0 subconjunto finito de Γ existe
um modelo que satisfaz todas as fórmulas de Γ0 , então existe um modelo que satisfaz
todas as fórmulas de Γ.
O teorema de Loweinhein-Skolen pode ser enunciado da seguinte maneira: se
existe um modelo que satisfaça todas as fórmulas de um conjunto Γ, então, para
qualquer conjunto infinito X, existe um modelo cujo domı́nio é X e que também
satisfaz Γ. Em geral, as linguagens de lógica de primeira ordem que utilizamos têm
uma quantidade enumerável de sı́mbolos. Senão, precisamos assumir que X tem
cardinalidade maior ou igual à cardinalidade do alfabeto. Uma versão do teorema
diz que todo modelo possui um modelo equivalente (isto é, ambos possuem as mesmas
fórmulas como verdadeiras) cujo domı́nio é enumerável.
Exercı́cios
1. Usando a linguagem de primeira ordem da teoria dos conjuntos, escreva fórmulas
para representar as seguintes frases:
a) Não existe conjunto de todos os conjuntos.
b) Existe um único conjunto vazio.
c) x é um conjunto unitário.
d) Existe um conjunto que tem como elemento apenas o conjunto vazio.
e) y é o conjunto dos subconjuntos de x.
2. Marque as ocorrências livres de variáveis nas fórmulas abaixo.
a) (∀x(x = y)) → (x ∈ y)
b) ∀x((x = y) → (x ∈ y))
c) ∀x(x = x) → (∀y∃z(((x = y) ∧ (y = z)) → ¬(x ∈ y)))
d) ∀x∃y(¬(x = y) ∧ ∀z((z ∈ y) ↔ ∀w((w ∈ z) → (w ∈ x))))
e) (x = y) → ∃y(x = y)
3. Na linguagem da aritmética dos números naturais (com os sı́mbolos funcionais +

e × e as constantes 0 e 1) escreva as fórmulas de primeira ordem que correspondem
às frases abaixo.
a) x é número primo.
b) x é menor do que y.
c) A soma de dois números ı́mpares é par.
d) A equação x3 + y 3 = z 3 não tem soluções inteiras positivas.
e) Todo número par maior do que dois pode ser escrito como soma de dois números
primos.
4. Julgue se cada uma das fórmulas abaixo é verdadeira em cada um dos seguintes
modelos: N, Z, Q, R.
a) ∀x∀y∃z(x + y = z)
b) ∀x∀y(¬(y = 0) → ∃z(x × y = z))
c) ∃x(x × x = 1 + 1)
5. É possı́vel uma axiomatização de primeira ordem para os números reais? Justi-

fique, tentando descobrir o que significa uma “lógica de segunda ordem”.
Capı́tulo 4
Axioma da extensão
O primeiro dos axiomas que estudaremos é quase uma definição de conjuntos, pois
nos diz que um conjunto é caracterizado exclusivamente pelos seus elementos.
Axioma 1 (da extensão) Dois conjuntos são iguais se, e somente se, eles têm os
mesmos elementos.
∀x∀y((x = y) ↔ (∀z(z ∈ x ↔ z ∈ y))
Há essencialmente duas maneiras de representar um conjunto: descrevendo os

elementos do conjunto através de uma propriedade comum a todos eles ou descre-
vendo cada elemento, entre chaves e separados por vı́rgulas. Por exemplo, numa
abordagem informal, considere os seguintes “conjuntos”:
{Uruguai, Itália, Alemanha, Brasil, Inglaterra, Argentina, França, Es-

panha}
Conjunto dos paı́ses que já venceram alguma Copa do Mundo de fu-
tebol
Ambos os conjuntos possuem os mesmos elementos. Cada elemento do primeiro

conjunto também é um elemento do segundo, e vice-versa. Logo, os dois conjuntos
são iguais, isto é, são o mesmo conjunto.
Considere agora o seguinte conjunto:
{Alemanha, Argentina, Brasil, Espanha, França, Inglaterra, Itália,

Uruguai, Brasil}
O axioma da extensão nos garante que esse conjunto é o mesmo que o anterior.
Ou seja, vale aquela máxima que aprendemos no ensino básico: em um conjunto não
importa a ordem dos elementos nem contamos as repetições.
É claro que não estamos falando de conjuntos matemáticos, existentes em ZFC.
Mas é bom ressaltar que, sendo esse o primeiro axioma que enunciamos (o que é
necessário, pois esse axioma é fundamental para a compreensão do conceito de con-
junto), não podemos provar, neste momento, a existência de qualquer conjunto. Por
31
32 CAPÍTULO 4. AXIOMA DA EXTENSÃO
enquanto trabalharemos com a teoria ingênua dos conjuntos, de forma semelhante

à concepção fregeana, em que um conjunto é definido simplesmente pela descrição
de seus elementos ou das propriedades que os delimitam. Assumiremos também a
existência dos números naturais, mesmo que ainda não tenhamos sequer os definido.
Isso será necessário para discutirmos alguns conceitos apresentados a seguir.
Sı́mbolo de inclusão: Apresentamos o conceito de subconjuntos, introduzindo um

novo sı́mbolo relacional binário que, no ensino básico, costuma ser bastante confun-
dido com o sı́mbolo de pertinência.
Definição 4.1 Dizemos que x está contido em y – ou x é subconjunto de y – se todo
elemento de x pertence a y. Denotamos por x ⊂ y quando x está contido em y.
Com essa definição, introduzimos ⊂ como um novo sı́mbolo relacional binário
na linguagem, chamado de sı́mbolo de inclusão. Podemos enxergá-lo como apenas
uma abreviatura. Ou seja, onde está escrito x ⊂ y lê-se “todo elemento de x é um
elemento de y”, ou “para todo z, se z pertence a x então z pertence a y”. Ou ainda,
na linguagem de primeira ordem, podemos escrever x ⊂ y como ∀z(z ∈ x → z ∈ y).
Isto é, vale a seguinte fórmula:
(x ⊂ y) ↔ ∀z(z ∈ x → z ∈ y)
Por exemplo, o conjunto {1, 2, 3} está contido no conjunto {2, 1, 3, 4}, uma vez que
todos os elementos do primeiro conjunto também são elementos do segundo. Se dois
conjuntos são determinados por propriedades, um ser subconjunto do outro significa
que a segunda propriedade é mais geral do que a primeira. Por exemplo, o conjunto
dos números transcendentes está contido no conjunto dos números irracionais, pois
ser transcendente implica ser irracional (isto é, a propriedade de ser irracional é mais
geral que a de ser transcendente).
Com essa simbologia e através de uma simples manipulação lógica (faça como
exercı́cio), podemos reescrever o axioma da extensão da seguinte maneira:
Afirmação: Dois conjuntos x e y são iguais se, e somente se, x ⊂ y e
y ⊂ x.
Em partiular, x ⊂ x, para todo conjunto x.
Dizemos que x é um subconjunto próprio de y se x ⊂ y mas x 6= y. Ou seja,
todo elemento de x pertence a y, mas existe pelo menos um elemento de y que não
pertence a x.
Conjuntos de conjuntos: Difundiu-se pelo ensino básico uma maneira errônea de

distinguir os sı́mbolos de pertinênia e de inclusão. Dizem que o sı́mbolo de inclusão
só relaciona conjuntos, enquanto o de pertinência é utilizado apenas entre elemento
e conjunto, e nunca entre dois conjuntos.
Ora, além de ignorar a possibilidade dos elementos de um conjunto serem, eles
próprios, conjuntos, esse “macete” foge da real definição dos dois conceitos. A in-
clusão de conjuntos é definida de uma maneira simples, a partir do sı́mbolo de per-
tinência e de conceitos elementares de lógica. Os dois sı́mbolos têm significados
33
completamente distintos, e, se alguém ainda os confunde, é porque ainda não com-

preendeu as notações conjuntı́sticas. Vamos reforçar a explicação que fizemos sobre
a notação das chaves: representamos um conjunto descrevendo seus elementos entre
chaves e separando-os por vı́rgulas. Dessa forma, cotinuando com a nossa suposição
de que existem os números naturais e os conjuntos que iremos descrever, analisemos
quem são os elementos do seguinte conjunto:
X = {1, {1, 2}, {1, 3}, 3}
O primeiro elemento representado no conjunto X (lembrando que a ordem dos

elementos de um conjunto não importa, e, por esse motivo não devemos chamá-lo
de primeiro elemento de X) é o número 1. A seguir, como manda nossa notação,
escrevemos uma vı́rgula e começamos a representar outro objeto matemático, que é
o próximo elemento que representamos em X. Se a notação {1 representasse alguma
coisa, poderı́amos ter dúvida sobre a notação, achando que {1 seria o segundo ele-
mento descrito em X. Mas, como não é o caso, fica claro que o próximo elemento
descrito no conjunto X é um outro conjunto: {1, 2}; que bem sabemos ser o conjunto
formado pelos números 1 e 2.
Assim, os elementos de X (supondo que ele existe) são:
{1, 2}
{1, 3}
3
Portanto, podemos escrever 1 ∈ X, o que não deve causar nenhum impacto a um
estudante secundarista. Mas também podemos escrever
{1, 2} ∈ {1, {1, 2}, {1, 3}, 3}
Temos aı́ a pertinênia entre dois conjuntos e, se compreendemos bem a notação das
chaves, não há motivo algum para nos assustarmos com isso.
Podemos também dizer que {1, 2} é um subconjunto de X? Vamos analisar isso
com calma, usando a definição lógica da inclusão de conjuntos. Precisamos verificar
se todo elemento de {1, 2} é, também, um elemento de X. Quais são os elementos
de {1, 2}? A resposta é fácil: 1 e 2. O número 1 pertence a X? Sim, vimos acima
que 1 é um dos elementos do conjunto X. E o 2, pertence a X? Não! Na descrição
dos elementos de X não consta o número 2. Encontramos, portanto, um elemento
de {1, 2} que não pertence a X. Denotamos isso como
{1, 2} 6⊂ {1, {1, 2}, {1, 3}, 3}
Vimos que um conjunto pode pertencer a outro e não estar contido nele. Será
que pode um conjunto ser subconjunto e elemento de outro, ao mesmo tempo? Ve-
rifiquemos o conjunto {1, 3}. Ele é um elemento de X. Vale, portanto:
{1, 3} ∈ {1, {1, 2}, {1, 3}, 3}

Será que {1, 3} está contido em X? Os números 1 e 3 são ambos elementos de

X, e esses são todos os elementos de {1, 3}. Ou seja, todo elemento de {1, 3} é um
elemento de X. Logo, vale o seguinte:
{1, 3} ⊂ {1, {1, 2}, {1, 3}, 3}
É importante ressaltar que essa análise foi feita na teoria ingênua dos conjuntos,
assumindo que os números naturais não são conjuntos. Se definı́ssemos, por exemplo,
o número 2 como o conjunto {1, 3}, terı́amos {1, 2} ∈ X. Mas esse não é o caso,
mesmo na construção que faremos dos números naturais. Na construção de Venn-
Euler, o número 2 será definido como o conjunto {0, 1}.
Os detalhes apresentados nessa discussão talvez tenham sido exagerados e exaus-
tivos, mas um vı́cio de aprendizagem é algo que requer muito esforço e cuidado para
ser superado. Os exercı́cios apresentados a seguir são imprescindı́veis para a continui-
dade do curso. Lembrem-se sempre: não esperem a véspera das provas para fazerem
os exercı́cios e tirarem as dúvidas!
Exercı́cios
Para esses exercı́cios, assumimos que os conjuntos enunciados existem, e não trata-
remos os números como conjuntos. Em particular, supomos que um número nunca
pertence a outro 1 .
1. Usando o axioma da extensão, verifique se os conjuntos de cada um dos itens

abaixo são iguais. Justifique
a) {1} e {{1}}.
b) {1, 3, 2, 4, 2} e {4, 3, 2, 1}.
c) {x ∈ N : x < 3} e {0, 1, 0, 2}.
d) {1, 2, 4, 3} e {1, 1, 3, 4}.
2. Para cada par de conjuntos abaixo, decida qual(is) dos sı́mbolos ∈ e ⊂ tornam
a fórmula verdadeira. Lembre-se que a resposta também pode ser ambos os sı́mbolos
ou nenhum deles. Justifique cada resposta.
a) {1} . . . {1, {1}}
b) {0} . . . {{0}}
c) {1, 2, 3} . . . {{1}, {2}, {3}}
d) {1, 2, 3} . . . {{1}, {1, 2}, {1, 2, 3}}

1
Quando virmos a construção dos números naturais, veremos que essa suposição é, em geral,
falsa.
35
e) {1, 2} . . . {1, {1}, 2, {2}, {3}}
f ) {{1}, {2}} . . . {{1, 2}}
g) {{1}} . . . {1, {1}}
h) {{1, 2}, {1}} . . . {x ⊂ N : x é finito }.
i) {{1}, {{1}}} . . . {x ⊂ N : x é finito }.
j) {{{1}}} . . .Conjunto dos subconjuntos dos subconjuntos de N.
3. Seja x o conjunto {0, {0}, 0, {0, {0}}}.
a) Quantos elementos tem o conjunto x?
b) Descreva todos os subconjuntos de x.
c) Descreva, utilizando chaves e vı́rgulas, o conjunto de todos os subconjuntos de x.
d) Quantos elementos o conjunto dos subconjuntos de x possui?
4. Prove que x ⊂ x, para todo x.
5. Prove que x ∈ y se, e somente se, {x} ⊂ y.

Capı́tulo 5
Axiomas do vazio, par e união
Vimos no capı́tulo anterior o axioma da extensão, que caracteriza quando dois con-
juntos são iguais. No entanto, conforme frisamos nos exercı́cios e exemplos, apenas
com o axioma da extensão não podemos garantir a existência de qualquer conjunto
especı́fico. Por isso, nosso próximo axioma garante a existência de um conjunto bem
especial.
Axioma 2 (do vazio) Existe um conjunto vazio.
∃x∀y¬(y ∈ x)
Usando a notação ∈
/ para não pertence, o axioma do vazio pode ser reescrito como
∃x∀y(y ∈
/ x)
Na verdade, o axioma do vazio é dispensável, pois veremos que ele pode ser
provado a partir do axioma da separação, desde que assumamos que existe pelo menos
um conjunto. Assim,podemos reescrever o axioma do vazio como existe um conjunto 1
Teorema 5.1 Existe um único conjunto vazio.
Demonstração: A existência de um conjunto vazio é ditada pelo axioma do vazio.

Mostremos a unicidade. Suponhamos que existem x e y conjuntos vazios diferentes.
Pelo axioma da extensão, existe um elemento de x que não pertence a y ou existe um
elemento de y que não pertence a x, o que, em ambos os casos, contradiz que x e y
são vazios.
Como o conjunto vazio é único, podemos adicionar uma constante na linguagem
que o represente. O sı́mbolo adotado para o conjunto vazio é ∅.
Teorema 5.2 O conjunto vazio está contido em qualquer conjunto.

1
Na verdade, a formulação que aqui apresentamos da lógica de primeira ordem não permite que
o domı́nio (vide a seção sobre semântica, no Capı́tulo ??) seja vazio. Logo, a rigor, o axioma do
vazio – ou da existência de conjuntos – é dispensável. Porém, mantemos esse axioma por motivos
históricos e didáticos.
37
38 CAPÍTULO 5. AXIOMAS DO VAZIO, PAR E UNIÃO
Demonstração: Seja x um conjunto. Se ∅ não está contido em x, isso significa que

existe um elemento de ∅ que não pertence a x, contradizendo que o conjunto vazio
não possui elemento.
O próximo axioma é o primeiro que nos permite construir um conjunto a partir
de outros.
Axioma 3 (do par) Para todos conjuntos x e y existe um conjunto cujos elementos
são x e y.
∀x∀y∃z∀w((w ∈ z) ↔ ((w = x) ∨ (w = y)))
Pelo axioma da extensão, podemos provar que o conjunto formado por x e y é

unicamente determinado por x e y. Isto é, se z e z 0 têm como elementos x e y, e
apenas esses, então z = z 0 . Isso justifica introduzirmos a notação do capı́tulo anterior:
{x, y} denota o conjunto formado por x e por y. Essa notação pode ser vista como
um sı́mbolo funcional binário, apesar de seguir uma regra de formação um pouco
diferente do padrão. A saber, podemos introduzir a seguinte regra de formação de
termos: se t e s são termos, {t, s} é um termo.
Notemos que, pelo axioma da extensão, a ordem dos elementos não importa. Ou
seja, {x, y} = {y, x}. Por esse motivo, costumamos chamar esse conjunto de par
não-ordenado, para diferenciar do par ordenado, que será visto posteriormente.
Se x = y, o par {x, y} – que passa a ser o par {x, x} – possui, na verdade, apenas
um elemento, e denotaremos por {x}. Vista como um sı́mbolo funcional unário,
essa notação pode ser formalizada pela seguinte regra: se x é um termo então {x}
é um termo. Ou seja, usando os axiomas do par e da extensão, podemos garantir a
existência de um conjunto unitário.
Teorema 5.3 Para todo x, existe um conjunto formado só pelo elemento x.
∀x∃y∀z(z ∈ y ↔ z = x)
Com o axioma do par e o Teorema 5.3 podemos formar vários conjuntos a partir
do vazio. Aplicando o Teorema 5.3 tomando x como ∅ obtemos o conjunto {∅}. Pelo
axioma da extensão, esse conjunto é diferente de ∅, pois ∅ ∈ {∅} mas ∅ ∈ / ∅. Com
aplicações sucessivas do axioma do par (e do Teorema 5.3) criamos vários outros
conjuntos (ou melhor, provamos a existência de vários outros conjuntos), a partir do
vazio: {∅, {∅}}, {{∅}}, {{{∅}}}, {{∅}, {{∅}}}, e assim por diante. Usando o axioma
da extensão podemos provar que todos esses conjuntos são diferentes.
No entanto, o axioma do par não é o bastante para construirmos conjuntos com
mais de dois elementos. O próximo axioma – que também pertence ao grupo de
axiomas de construção – permite-nos construir todos os conjuntos finitos e heredi-
tariamente finitos. Isto é, conjuntos finitos cujos elementos são, também, conjuntos
finitos, e os elementos de seus elementos também são finitos, e assim por diante.
Axioma 4 (da união) Para todo conjunto x existe o conjunto de todos os conjuntos
que pertencem a algum elemento de x.
∀x∃y∀w((w ∈ y) ↔ ∃v((w ∈ v) ∧ (v ∈ x)))

39
Repare que o axioma da união não garante, a princı́pio, a união de dois conjuntos,
mas, sim, a união de uma famı́la de conjuntos. Se pensarmos em um conjunto
de conjuntos como uma caixa cheia de pacotes menores, a união desse conjunto
de conjuntos corresponde a despejarmos todo o conteúdo dos pacotes menores na
caixa maior. Vejamos, como exemplo (assumindo que existe – visto que ainda nem
explicamos o que são os números naturais), o seguinte conjunto:
{{1, 2}, {1, 3}, {4}}
A união do conjunto acima é o conjunto formado por todos os números que pertencem
a pelo menos um de seus elementos, a saber:
{1, 2, 3, 4}
Em outras palavras, a união de x é o conjunto dos elementos dos elementos de

x. S
Denotamos a união de um conjunto x por x. O axioma da extensão garante
que a união é única. Isto é, dado qualquer conjunto x, não existem dois conjuntos
diferentes que, no lugar de y, tornariam a sentença correspondente ao axioma da
união verdadeira. O axioma daSunião determina unicamente um conjunto a partir de
x. Isso justifica introduzirmos como um sı́mbolo funcional unário.
Deixamos ao leitor a tarefa de mostrar as seguintes igualdades:
S
∅=∅
S
{∅} = ∅
S
{∅, {∅}} = {∅}
S
{{∅}} = {∅}
Com o axioma do par e o axioma da união em mãos podemos definir a união de

dois conjuntos.
Teorema 5.4 Dados dois conjuntos x e y existe o conjunto formado por todos os
conjuntos que pertencem a x ou a y.
∀x∀y∃z∀w((w ∈ z) ↔ ((w ∈ x) ∨ (w ∈ y)))
Demonstração: Dados dois conjuntos x e y, aplicamos o axioma do para para

obtermos o conjunto {x,S y}. Aplicando o axioma da união sobre o conjunto {x, y}
obtemos o conjunto z = {x, y}. Observe, pela definição da união de uma famı́la de
conjuntos, que, para todo w, w ∈ z se, e somente se, existe u ∈ {x, y} tal que w ∈ u.
Mas, se u ∈ {x, y}, temos que u = w ou u = y, provando que z satisfaz o enunciado
do teorema.
Novamente notamos que a união de dois conjuntos é única, pelo axioma da ex-
tensão, o que nos permite introduzir a seguinte definição.
Definição 5.5 Definimos a união de x e y como o conjunto formado por todos os

conjuntos que pertencem a x ou a y, e denotaremos esse conjunto por x ∪ y.
Combinando o axioma do par e da união, podemos construir as triplas (não-

ordenadas) de conjuntos.
Teorema 5.6 Para todos conjuntos x, y e z existe um único conjunto cujos elemen-
tos são x, y e z.
∀x∀y∀z∃u∀v(v ∈ u ↔ (v = x ∨ v = y ∨ v = z))
Demonstração: Pelo axioma do par existe o conjunto {x, y}. Pelo Teorema 5.3
existe o conjunto {z}. Aplicando o Teorema 5.4 aos conjuntos {x.y} e {z} obtemos
um conjunto u formado por x, y e z.
Assim, introduzimos mais uma notação: se t, s e u são termos da linguagem da
teoria dos conjuntos, então {t, s, u} também é um termo, que corresponde ao conjunto
formado exatamente por t, s e u. Ao definirmos essa notação para termos, em vez
de variáveis, permitimos construir, formalmente, conjuntos como {∅, {x}, {∅}.
Seguindo o mesmo raciocı́nio, podemos usar os axiomas do par e da união para
provarmos a existência de conjuntos com quatro, cinco ou mais elementos, utilizando
a mesma notação das chaves. Isso justifica a notação que temos usado até agora, de
representar um conjunto finito (apesar de não termos definido ainda o que é conjunto
finito) indicando seus elementos entre chaves. Formalmente, podemos pensar nessa
notação como uma coleção infinita enumerável de sı́mbolos funcionais da linguagem,
sendo um sı́mbolo n-ário para cada n ≥ 1.
Exercı́cios
1. Para cada par de conjuntos abaixo, decida qual(is) dos sı́mbolos ∈ e ⊂ torna(m)
a fórmula verdadeira. Lembre-se que a resposta também pode ser ambos os sı́mbolos
ou nenhum deles. Justifique cada resposta e prove que os conjuntos abaixo existem.
(a) {∅} . . . {{∅}}
(b) {∅} . . . {∅, {{∅}}}
(c) {∅, {∅}} . . . {∅, {∅}, {∅, {∅}}}
(d) {{∅}} . . . {∅, {{{∅}}}}
2. Defina 0 como o conjunto vazio, 1 como o conjunto {0}, 2 como 1 ∪ {1} e 3 como
2 ∪ {2}.
(a) Prove que 0, 1, 2 e 3 existem e são diferentes um do outro.
(b) Prove que existe o conjunto x = {{0}, {0, 1}, {{1}}, {1, 2}, {{1, 2}}} e diga quais
dos conjuntos 0, 1, 2 e 3 pertencem a x.
41
S
(c) Calcule x, descrevendo seus elementos entre chaves.
(d) Sem usar os sı́mbolos 0, 1, 2 e 3, mas apenasSSo sı́mbolo

S SdoSconjunto vazio, as
chaves e as vı́rgulas, descreva os conjuntos ( x) e ( ( x)).
3. Considere x o conjunto
{∅, {∅}, {∅, {∅}}}
(a) Prove que o conjunto x existe.

S
(b) Descreva, com a notação das chaves, o conjunto x.
SS
(c) Descreva o conjunto ( x).
(d) Escreva todos os subconjuntos de x e prove (com os axiomas que temos até
agora) que existe o conjunto de todos os subconjuntos de x. Isto é, existe z tal
que z ∈ y se, e somente se, z ∈ x
S S
4. Prove que ∅=∅e {x} = x.
S S
5. Prove que, se x ⊂ y, então x⊂ y.
6. Dizemos que um conjunto x é transitivo se z ∈ y e y ∈ x implicam que z ∈ x,

para todos y e z.
(a) Prove que x é transitivo se, e somente se, y ∈ x implica y ⊂ x, para todo y.
S
(b) Prove que x é transitivo se, e somente, x ⊂ x.
(c) Mostre que o conjunto x do exercı́cio 3 é transitivo.
(d) Suponha que x é transitivo. Prove que x ∪ {x} é transitivo.
7. Usando apenas os axiomas que temos até agora, podemos provar que x 6= {x}?
Justifique.
Capı́tulo 6
Axiomas das partes e da separação
O axioma seguinte já foi discutido, de alguma forma, nos exercı́cios do capı́tulo
anterior.
Axioma 5 (das partes) Para todo conjunto x existe o conjunto dos subconjuntos
de x.
∀x∃y∀z((z ∈ y) ↔ (z ⊂ x))
Se quisermos transformar a fórmula acima sem usar o sı́mbolo de inclusão, basta
escolhermos uma variável nova que não consta na fórmula (w, por exemplo) e substi-
tuirmos z ⊂ x pela fórmula ∀w((w ∈ z) → (w ∈ x)). É importante que o leitor esteja
familiarizado com essas abreviaturas e com o processo de converter essas abreviaturas
pela fórmula completa.
O conjunto definido pelo axioma das partes é único, para cada x. Isto é, fixado
um conjunto x, existe um único conjunto formado exatamente pelos subconjuntos
de x. A demonstração disso é, mais uma vez, uma simples aplicação do axioma da
extensão, e deixamo-la por conta do leitor. A existência e unicidade do conjunto dos
subconjuntos de um conjunto nos permite introduzir a seguinte definição:
Definição 6.1 Definimos o conjunto das partes de x como o conjunto dos subcon-
juntos de x, e denotaremos por P(x).
O próximo axioma da separação resgata a concepção inicial de Frege de definir
um conjunto através de uma fórmula lógica que descreve seus elementos. Mas, para
evitar o paradoxo de Russell, na formulação do axioma da separação é necessário
estabelecer um conjunto do qual iremos “separar” os elementos que satisfazem uma
determinada propriedade.
Assim, para cada fórmula P (x), temos que, para todo conjunto y, existe o con-
junto formado por todos x ∈ y tais que P (x) é verdadeiro.
Formalmente, o axioma da separação é um esquema de axiomas, isto é, uma lista
infinita de axiomas, conforme abaixo:
Axioma 6 (Esquema de axiomas da separação) Para cada fórmula P em que
z não ocorre livre a seguinte fórmula é um axioma:
∀y∃z∀x((x ∈ z) ↔ ((x ∈ y) ∧ P ))
43
44 CAPÍTULO 6. AXIOMAS DAS PARTES E DA SEPARAÇÃO
O conjunto z, como no axioma, será denotado por
{x ∈ y : P (x)}
Notemos que a única restrição sobre a fórmula P é não conter z como variável li-
vre. Essa restrição é necessária porque utilizamos essa variável no axioma para definir
o conjunto {x ∈ y : P (x)}. Se permitirmos que a mesma variável que define o con-
junto dado pelo axioma da separação também ocorra livre em P , poderı́amos tomar
P como a fórmula x ∈ / z e terı́amos a seguinte instância do axioma da separação:
∀y∃z∀x((x ∈ z) ↔ ((x ∈ y) ∧ (x ∈
/ z)))
Se tomássemos, por exemplo, y = {∅} e x = ∅, terı́amos x ∈ y verdadeiro e,
portanto, terı́amos
(x ∈ z) ↔ (x ∈
/ z)
o que é uma contradição.
Não precisamos impor qualquer outra restrição sobre as variáveis livres em P .
Em todas as aplicações do axioma da separação, a variável x ocorre livre em P (por
isso utilizamos a notação P (x) para a fórmula P ). Mas se x não ocorrer livre em
P , isso não causará inconsistência no sistema. Apenas a aplicação do axioma da
separação seria trivial, pois o conjunto z seria vazio ou o próprio y (já que a validade
de P , nesse caso, não depende da variável x, que não ocorre livre em P ).
Podemos ter outras variáveis livres em P além de x. Isso ocorre, por exemplo,
na definição de intersecção de conjuntos:
a ∩ b = {x ∈ a : x ∈ b}
A própria variável y (que reservamos para o – digamos – “conjunto universo”)
pode ocorrer livre em P , como na seguinte definição:
{x ∈ y : x ⊂ y}
Com essa formulação do sistema de Zermelo-Fraenkel o Paradoxo de Russell ga-
nha um novo significado, conforme o teorema seguinte.
Teorema 6.2 (Paradoxo de Russell) Não existe conjunto de todos os conjuntos.
∀x∃y(y ∈
/ x)
Demonstração: Suponha que exista um conjunto y tal que, para todo x, x ∈ y.

Pelo axioma da separação para a fórmula x ∈
/ x, existe z tal que, para todo x,
(x ∈ z) ↔ ((x ∈ y) ∧ (x ∈
/ x))
Como x ∈ y é verdadeiro para todo x temos que
(x ∈ z) ↔ (x ∈
/ x))
45
Tomando z no lugar de x temos
(z ∈ z) ↔ (z ∈
/ z)
chegando numa contradição.

O axioma do vazio segue como consequência do axioma da separação, pois, pelos
axiomas lógicos podemos provar a sentença ∃y(y = y) (ou seja, a formulação lógica
aqui apresentada garante que existe algum conjunto). Usemos o axioma da separação
para esse y e para a fórmula x 6= x. Obtemos o conjunto
{x ∈ y : x 6= x},
que é o conjunto vazio.

A partir do axioma da separação podemos definir as operações conjuntı́sticas.
Comecemos pela intersecção de uma famı́lia de conjuntos.
Teorema 6.3 (Intersecção de uma famı́lia de conjuntos) Dado um conjunto não

vazio x existe o conjunto formado por todos os conjuntos que pertencem simultanea-
mente a todos os elementos de x.
∀x(∃y(y ∈ x) → ∃y(∀z((z ∈ y) ↔ ∀w((w ∈ x) → (z ∈ w)))))

T
Denotaremos esse conjunto por x.
Demonstração: Seja z um elemento de x. Defina o conjunto y como
{v ∈ z : ∀w((w ∈ x) → (v ∈ w))}
O axioma da separação garante a existência do conjunto y. Agora verifiquemos que

y satisfaz as condições do teorema. Seja v ∈ y. Pela definição de y, para todo w ∈ x
temos v ∈ w. Reciprocamente, se para todo w ∈ x temos v ∈ w, então, em particular,
v ∈ z e, portanto, v ∈ y. Isso prova que, para todo v, v ∈ y se, e somente se, v ∈ w,
para todo w ∈ x.

É bom notar que, diferente da união de uma famı́lia de conjuntos, na intersecção
precisamos impor a restrição de que a famı́lia é não-vazia. A união de uma famı́lia
vazia é o conjunto vazio. Mas se fizéssemos a intesecção de uma famı́lia vazia ob-
terı́amos o “conjunto de todos os conjuntos”, já que todo conjunto x satisfaz, por
vacuidade, a condição “para todo y pertencente ao conjunto vazio x ∈ y”.
Agora aplicaremos o axioma da separação para definir diversas operações binárias
entre conjuntos. A saber, são elas:
Intersecção: x ∩ y = {z ∈ x : z ∈ y}
Subtração: x r y = {z ∈ x : z ∈
/ y}
Diferença simétrica: x∆y = {z ∈ x ∪ y : z ∈

/ x ∩ y}
46 CAPÍTULO 6. AXIOMAS DAS PARTES E DA SEPARAÇÃO
Quando x ∩ y = ∅, dizemos que x e y são disjuntos.

A intersecção de conjuntos está relacionado ao operador booleano e, pois perten-
cer a x ∩ y significa pertencer a x e a y. A união significa ou, pois pertencer a x ∪ y
seginifica pertencer a x ou pertencer a x. A diferença simétrica é ou ou exclusivo
(pertencer a x ou a y, mas não a ambos). A união de umaSfamı́lia de conjuntos
está relacionada ao quantificador existencial, pois pertencer a x significa pertencer
a algum elemento de x, enquanto a intersecção deTuma famı́lia de conjutos repre-
senta o quantificador universal, porque pertencer a x significa pertencer a todos os
elementos de x.
Exercı́cios
1. Escreva o conjunto P({∅, {∅}}).
S
2. Prove que P(x) = x.
3. Prove que não existe o conjunto de todos os conjuntos unitários.

Dica: Assuma, por absurdo, a existência do conjunto de todos os conjuntos
unitários e prove a existência do conjunto de todos os conjuntos.
4. Prove que, para todo conjunto X existe o conjunto
{{x} : x ∈ X}
5. Sendo x um conjunto não vazio, prove que

\
∀y(y ∈ x → ( x ⊂ y))
6. Sendo x um conjunto não vazio, prove que

\ \
x⊂y→ y⊂ x
7. Escreva na linguagem da lógica de primeira ordem, sem abreviaturas, a seguinte

fórmula: [\
x∈ (y ∪ (w r z))
Capı́tulo 7
Axioma da infinidade
O axioma da infinidade é, ao lado do vazio, um axioma que garante a existência

de um conjunto especı́fico. No caso, de um conjunto infinito. Há várias formas de
apresentar o axioma da infinidade. Uma delas enuncia a existência do conjunto dos
números naturais, conforme a concepção de von Neumann. Outra forma, utilizada
aqui, é enunciar a existência de um conjunto do qual deduzimos a existência (e
definimos) do conjunto dos números naturais. A terceira simplesmente enuncia a
existência de um conjunto infinito (embora ainda não tenhamos definido o que é
um conjunto infinito), e a construção do conjunto dos números naturais torna-se um
pouco mais complicada e utiliza o axioma da substituição, semelhante ao que será
feito na construção dos ordinais.
Na definição dos números naturais atribuı́da a von Neumann, pensamos em um
número natural como o conjunto dos números naturais menores que ele. Assim, o 0
é o conjunto dos números naturais menores que 0. Como não existe número natural
menor que 0, então 0 será representado pelo conjunto vazio. O número 1 é o conjunto
formado pelos números menores que 1. Ou seja, 1 é o conjunto {0}, que é igual a
{∅}.. O número 2 é o conjunto {0, 1}, ou seja, o conjunto {∅, {∅}}, e assim por diante.
Note que o número 3, que é o conjunto {0, 1, 2}, pode ser escrito como {0, 1}∪{2},
assim como 1 = ∅ ∪ {0} e 2 = {0} ∪ {1}. Ou seja, o sucessor de um número natural
n é o resultado de acrescentarmos o próprio n ao conjunto n. Isto é, n + 1 = n ∪ {n}.
Isso justifica a seguinte definição de sucessor:
Definição 7.1 Dado um conjunto x, definimos x+ como x ∪ {x}. Isto é,
∀y(y ∈ x+ ↔ (y ∈ x ∨ y = x))
Quando um conjunto possui o vazio como elemento, e é fechado pela operação de

sucessor, então dizemos que tal conjunto é indutivo, conforme segue a definição.
Definição 7.2 Dizemos que um conjunto x é indutivo se, e somente se, ∅ ∈ x e, para
todo y, se y ∈ x então y + ∈ x.
O axioma da infinidade nada mais diz que a existência de algum conjunto indu-
tivo.
47
48 CAPÍTULO 7. AXIOMA DA INFINIDADE
Axioma 7 (da infinidade) Existe um conjunto indutivo.
∃x(∅ ∈ x ∧ ∀y(y ∈ x → y + ∈ x))
Note que um conjunto indutivo precisa possuir o vazio e todos os sucessores

obtidos a partir do vazio. Ou seja, um conjunto indutivo precisa conter o conjunto
dos números naturais (conforme será provado no teorema 7.4, parte (b)), mas pode
ter elementos a mais. Usando o teorema 6.3 e os axiomas da separação, das partes e
da infinidade, definimos o conjunto dos números naturais da seguinte forma:
Definição 7.3 Definimos o conjunto dos números naturais – que será denotado por
ω – como o seguinte conjunto:
\
ω = {x ∈ P(I) : x é indutivo}
onde I é o conjunto indutivo determinado pelo axioma da infinidade.
Notemos que a intersecção é permitida porque a famı́lia de subconjunts de I

que são indutivos não é vazia, dado que pelo menos o próprio conjunto I é indutivo.
Agora, resta-nos mostrar que o próprio conjunto ω é indutivo, e que segue da definição
que ele é o menor conjunto indutivo que existe. Fica como exercı́cio provar – a partir
do teorema seguinte – que a definição de ω não depende da escolha de I.
Teorema 7.4 (a) ω é um conjunto indutivo.
(b) Se A é um conjunto indutivo então ω ⊂ A.
Demonstração: Seja I o conjunto indutivo dado pelo axioma da infinidade. Vamos

provar que ω é indutivo. Primeiro, provemos que ∅ ∈ ω. De fato, se A é um
subconjunto de I que é indutivo, então ∅ ∈ A. Logo ∅ pertence à intersecção de
todos os subconjuntos indutivos de I. Agora, suponha que x ∈ ω. Isso significa que
x ∈ A, para todo A suconjunto indutivo de I. Mas isso implica que x+ ∈ A, para
todo A ⊂ I indutivo. Logo, x+ ∈ A, provando a parte (a) do teorema.
Agora provemos a parte (b). Seja A um conjunto indutivo. Repetindo o argu-
mento do parágrafo anterior, concluı́mos que A ∩ I é indutivo. Como A ∩ I ⊂ I,
temos, pela definição de ω, que todo elemento de ω também pertence a A ∩ I. Ou
seja, ω ⊂ A ∩ I e, portanto, ω ⊂ A.
Observe que segue da demonstração do Teorema 7.4, que a definição de ω inde-
pende da escolha do conjunto indutivo T I. Para verificarmos isso, tome J qualquer
outro conjunto indutivo e defina A = {x ∈ P(J) : J é indutivo}. A demonstração
do Teorema 7.4 pode ser aplicada para A, no lugar de ω, e concluı́mos que A é indu-
tivo e, pelo item (b) (aplicado duas vezes) temos que A ⊂ ω e ω ⊂ A. O teorema da
extensão nos garante, então, que A = ω.
Mostraremos agora algumas propriedades do conjunto ω. Antes, enunciaremos
uma definição que já foi mencionada em alguns exercı́cios do Capı́tulo 5:
49
Definição 7.5 Dizemos que um conjunto x é transitivo se todo elemento de x é um

subconjunto de x. Isto é, se y ∈ x implica y ⊂ x.
Lema 7.6 (a) ω é um conjunto transitivo.
(b) Se n ∈ ω então n é transitivo.
(c) Para todo n ∈ ω, temos n ∈

/ n.
(d) Se n ∈ ω e m ∈ n então n ∈
/ m.
Demonstração: Usando o axioma da separação, considere o conjunto
S = {n ∈ ω : n ⊂ ω}
Mostraremos que S é indutivo. Pelo Teorema 7.4, parte (b), isso é suficiente para
mostrar que S = ω.
Claramente, ∅ ∈ S. Assumindo que n ∈ S, provaremos que n+ ∈ S. Ou seja,
mostraremos que, se n ⊂ ω, então n ∪ {n} ⊂ ω. De fato, se x ∈ n ∪ {n}, temos duas
possibilidades. Ou x ∈ n, o que, por hipótese, implica que x ∈ ω, ou x = n, que
pertence a ω.
Provamos, assim, que S = ω e, portanto, todo elemento de ω é um subconjunto
de ω, o que prova o item (a).
Para o item (b), considere S o conjunto dos elementos transitivos de ω. Ou seja
S = {n ∈ ω : ∀m(m ∈ n → m ⊂ n)}
A existência de S segue do axioma da separação. Provemos que S é indutivo. De

fato, ∅ ∈ S, pois a implicação m ∈ ∅ → m ⊂ ∅ é verdadeira por vacuidade, já que o
conjunto vazio não possui elementos. Suponha que n ∈ S. Mostremos que n+ ∈ S,
isto é, n+ é transitivo. Seja m ∈ n+ . Temos m ∈ n ou m = n. Se m ∈ n, pela
hipótee n ∈ S temos m ⊂ n e, portanto, m ⊂ n+ , uma vez que n ⊂ n+ . Pelo mesmo
motivo, se m = n, então m ⊂ n+ . Concluı́mos que n+ ∈ S e que S é indutivo.
Portanto, pelo Teorema 7.4, item (b), ω ⊂ S. Como S ⊂ ω, por definição, temos
S = ω, e concluı́mos que todos os elementos de ω são transitivos.
Para a parte (c), use novamente o axioma da separação para definir o seguinte
conjunto:
S = {n ∈ ω : n ∈
/ n}
Mostraremos que S é indutivo.
Como ∅ ∈ / ∅, temos ∅ ∈ S. Suponhamos, por absurdo, que n ∈ S e n+ ∈ / S. Isto
+ + + +
é, n ∈
/ n e n ∈ n . Temos, portanto, n ∈ n ou n = n. No primeiro caso, pelo
item (b), vale n+ ⊂ n e, portanto, n ∈ n, contrariando a hipótese. No segundo caso,
pelo axioma da extensão, de n ∈ n+ e n+ = n segue n ∈ n.
Concluı́mos o item (c) do lema. Para a parte (d) definimos o conjunto
S = {n ∈ ω : ∀m(m ∈ n → n ∈
/ m)}
Como m ∈ ∅ é sempre falso, temos que ∅ ∈ S. Suponha que n ∈ S. Mostraremos

que n+ ∈ S. Isto é, se m ∈ n+ então n+ ∈
/ m. De fato, suponha que m ∈ n ∪ {n} e
n∪{n} ∈ m. Pela parte (b) essa última asserção implica que n∪{n} ⊂ m e, portanto,
n ∈ m. Como m ∈ n ∪ {n} temos m ∈ n ou m = n. O primeiro caso contradiz a
hipótese de que n ∈ S e n ∈ m. O segundo caso contradiz o item (c), uma vez que
n ∈ m.
Provamos que S é indutivo e, portanto, igual a ω, concluindo o item (d) do lema.

Os itens (c) e (d) do teorema anterior são verdadeiros para quaisquer conjuntos,
e não apenas para os elementos de ω, pois seguem do axioma da regularidade, que
veremos posteriormente. A saber, mostraremos que não pode ocorrer x ∈ x nem
podem ocorrer, simultaneamente, x ∈ y e y ∈ x. Porém, é interessante percebermos
que, no caso do conjunto ω, podemos provar essas propriedades sem usar o axioma
da regularidade. É bastante comum, nessa área, estudarmos a interdependência dos
axiomas, analisando quais são realmente necessários, em cada teorema que provamos,
o que justifica nosso esforço extra para provar esses itens que seriam consequências
fáceis do axioma da regularidade.
Agora veremos por que convém chamarmos ω de “conjunto dos números na-
turais”. Primeiro, vamos enunciar os axiomas de Peano, sobre números naturais.
Adotamos como conceitos primitivos zero e sucessor de. São esses os axiomas:
1. Zero é um número natural.

2. O sucessor de um número natural é um número natural.
3. Números naturais distintos nunca têm o mesmo sucessor.
4. Zero não é sucessor de qualquer número natural.
5. Se uma propriedade vale para zero e, valendo para um dado número natural,
também vale para o seu sucessor, então valerá para todos os números naturais.
O quinto axioma de Peano é o que conhecemos como princı́pio da indução finita.

Uma formalização precisa dos axiomas de Peano, usando lógica de primeira or-
dem, é a seguinte: introduzimos 0 (zero) como uma constante e s (sucessor de)
como um sı́mbolo funcional unário da linguagem. O primeiro e o segundo axi-
oma tornam-se desnecessários. O terceiro e o quarto axioma são respectivamente
∀x∀y(¬(x = y) → ¬(s(x) = s(y))) e ∀x(¬(s(x) = 0)). O quinto axioma torna-se um
esquema de axiomas, em que, para cada fórmula P , a fórmula
(Px0 ∧ ∀x(P → Pxs(x) )) → ∀xP
é um axioma.
O próximo teorema diz que o conjunto ω serve como domı́nio de um modelo para
os axiomas de Peano, interpretando 0 como ∅ e s(n) como n+ .
Teorema 7.7 O conjunto ω satisfaz os axiomas de Peano, identificando “zero” com

o conjunto vazio e o sucessor de n com n+ .
51
Demonstração: Os dois primeiros axiomas seguem do fato de ω ser indutivo. Para

provarmos o terceiro axioma, suponhamos, por absurdo, que n 6= m e n+ = m+ .
Temos que n ∈ n+ , logo, pela hipótese, n ∈ m+ . Como m+ = m ∪ {m}, e n 6= m,
então n ∈ m. Analogamente provamos que m ∈ n, contradizendo o Lema 7.6, parte
(d).
O quarto axioma segue do fato de que n ∈ n+ . Logo, não podemos ter, para
nenhum n, n+ = ∅.
Para provarmos o princı́pio da indução finita, seja P uma fórmula tal que Px∅
+
e ∀x(P → Pxx ) são verdadeiros. Usando o axioma da separação, considere A o
conjunto {x ∈ ω : P }. Pela hipótese sobre P é fácil verificar que A é indutivo. Logo,
pelo Teorema 7.4, parte (b), temos que ω ⊂ A, provando que todo elemento de ω
satisfaz P .
Teorema 7.8 Para todos n e m pertencentes a ω temos:
(a) n ∈ m, m ∈ n ou m = n.
(b) n ⊂ m ou m ⊂ n.
(c) m ∈ n se, e somente se, m ⊂ n e m 6= n.
Demonstração: Provaremos o item (a) por indução em n. Ou seja, tomamos P (n)

a seguinte fórmula:
∀m(n ∈ m ∨ n = m ∨ m ∈ n)
Como ∅ ∈ n, para todo número natural n 6= ∅ (veja exercı́cio no final deste
capı́tulo), temos P (0) verdadeiro. Supondo que P (n) é verdadeiro mostraremos
P (n+ ).
Antes, provaremos, por indução em m, para um n fixado 1 , a seguinte fórmula,
que chamaremos de Q(m):
n ∈ m → (n+ ∈ m ∨ n+ = m)
Como ∅ ∈ m é sempre falso, a implicação é sempre verdadeira. Logo, vale Q(0).

Suponha que Q(m) é verdadeiro. Provemos Q(m+ ).
Suponha que n ∈ m+ . Isso significa que n ∈ m ou n = m. No primeiro caso,
pela hipótese de indução temos n+ ∈ m e, portanto, n+ ∈ m+ (pois m ⊂ m+ ). No
segundo caso, temos n+ = m+ . Em ambos os casos, concluı́mos que vale Q(m+ ) e,
portanto, pelo princı́pio da indução, concluı́mos que Q(m) é verdadeiro, para todo
m ∈ ω.
Voltemos à prova de P (n+ ) a partir de P (n). Seja m ∈ ω. Pela hipótese P (n)
temos três possibilidades: m ∈ n, m = n ou n ∈ m. No primeiro caso, temos m ∈ n+ .
No segundo caso, de m = n e n ∈ n+ segue também m ∈ n+ . Analisemos o terceiro
caso. Como mostramos que Q(m) é verdadeiro, para todo m, temos n+ ∈ m ou
n+ = m. Provamos, assim, P (n+ ) e, pelo princı́pio da indução, concluı́mos a parte
(a) do teorema.
1
Esse é um tı́pico exemplo de prova por indução dupla
Pelo Lema 7.6, parte (b), se n ∈ m, então n ⊂ m, e, se m ∈ n, então m ⊂ n.

Logo, o item (b) deste teorema segue do item (a).
O item (c) segue facilmente dos itens (a) e (b), e do Lema 7.6. Deixamos os
detalhes da prova como exercı́cio ao leitor.

Exercı́cios:
1. Prove, a partir dos axiomas de Peano, os seguintes teoremas:
(a) Todo número natural é diferente do seu sucessor.
(b) Zero é o único número natural que não é sucessor de algum número natural.
2. Prove que, para todo n ∈ ω, ∅ ∈ n ou ∅ = n.
3. A união de dois conjuntos indutivos é necessariamente um conjunto indutivo?

Justifique sua resposta.
4. Prove a existência do conjunto dos números pares.

Observação: Lembre-se de que ainda não temos definida a aritmética!
S
5. Prove que ω = ω.
6. Prove que ω ⊂ P(ω).
7. Prove ou dê um contra-exemplo para a seguinte afirmação: se n ∈ ω então

P(n) ⊂ ω.
8. Prove que, se n, m ∈ ω, então n ∩ m e n ∪ m pertencem a ω.
9. Prove que, se x é transitivo, então x+ é transitivo.
10.
S Descreva – usando apenas o conjunto vazio, as chaves e a vı́rgula – o conjunto
P(3 r 1).
Capı́tulo 8
Relações e funções
As definições neste e no próximo capı́tulo são fundamentais para enunciarmos o

axioma da escolha. Começamos definindo pares ordenados, produto cartesiano e
relações.
8.1 Pares ordenados

O axioma do par nos garante construirmos, a partir de dois conjuntos a e b, o par
{a, b}. Porém, nessa definição de par a ordem dos elementos não importa, de modo
que {a, b} = {b, a}. Na definição de par ordenado, a igualdade só vale quando a
ordem é a mesma.
Definição 8.1 Dados dois conjuntos a e b, definimos o par ordenado (a, b) como o
conjunto {{a}, {a, b}}. Ou seja,
∀x(x ∈ (a, b) ↔ ∀y((y ∈ x ↔ y = a) ∨ (y ∈ x ↔ (y = a ∨ y = b))))
É fácil verificar que o par ordenado entre quaisquer conjuntos existe (aplicando
três vezes o axioma do par: uma para formar o conjuntoi {a}, outra para o conjunto
{a, b} e outra para o conjunto {{a}, {a, b}}) e é único (aplicação padrão do axioma
da extensão).
Assim, podemos introduzir a notação (a, b) como mais um sı́mbolo funcional
binário na nossa linguagem estendida da teoria dos conjuntos (ou mais uma abrevi-
atura).
Notemos que, quando a = b, o par ordenado (a, b) é igual ao conjunto {{a}}.
Teorema 8.2 Dois pares ordenados (a, b) e (c, d) são iguais se, e somente se, a = c
e b = d.
Demonstração: Um dos lados da equivalência é trivial: se a = c e b = d então os

pares ordenados (a, b) e (c, d) são iguais. Mostraremos o outro lado.
Suponha que (a, b) = (c, d). Como {a} ∈ (a, b) temos que {a} ∈ (c, d). Logo
{a} = {c} ou {a} = {c, d}. Em ambos os casos temos que a = c.
53
54 CAPÍTULO 8. RELAÇÕES E FUNÇÕES
Para provarmos que b = d, separemos em dois casos. No primeiro caso, supomos

que a = b, o que implica que (a, b) = {{b}}. Teremos que {c, d} ∈ (a, b) e, portanto,
{c, d} = {b}, provando que b = d. No segundo caso, supomos que a 6= b. Como
{a, b} ∈ (c, d) temos {a, b} = {c} ou {a, b} = {c, d}. Como {c} ⊂ {c, d}, em ambos
os casos o axioma da extensão garante que b ∈ {c, d}. Não podemos ter b = c, pois
provamos que a = c e assumimos que a 6= b. Portanto, b = d.

8.2 Produto cartesiano

O próximo teorema nos garante a existência do produto cartesiano entre dois con-
juntos.
Teorema 8.3 Dados dois conjuntos A e B, existe o conjunto de todos os pares or-
denados (a, b) que satisfazem a ∈ A e b ∈ B.
Demonstração: Usando os axiomas do par, da união, das partes e da separação,

definimos o conjunto
X = {x ∈ P(P(A ∪ B)) : ∃a∃b(a ∈ A ∧ b ∈ B ∧ x = (a, b))}
Para verificarmos que X atende as condições do teorema, só resta verificarmos que
todo par ordenado (a, b), onde a ∈ A e b ∈ B, pertence a P(P(A ∪ B)).
De fato, {{a}, {a, b}} ∈ P(P(A ∪ B)) é equivalente a {{a}, {a, b}} ⊂ P(A ∪ B),
que ocorre se, e somente se, {a} ∈ P(A ∪ B) e {a, b} ∈ P(A ∪ B), o que é verdade,
pois {a} ⊂ A ∪ B e {a, b} ⊂ A ∪ B.
O conjunto estabelecido pelo Teorema 8.3 é chamado de produto cartesiano de A
e B, e será denotado por A × B. Introduzimos essa notação como outra abreviatura,
desempenhando o papel de um sı́mbolo funcional binário.
A partir do produt cartesiano definimos o conceito de relação, como um subcon-
junto de um produto cartesiano.
Definição 8.4 Dizemos que R é uma relação (ou relação binária) entre A e B se é
um subconjunto de A × B. Quando R é uma relação, utilizamos a notação xRy como
abreviatura de (x, y) ∈ R.
8.3 n-uplas ordenadas

Podemos definir uma tripla ordenada (a, b, c) como o par ordenado ((a, b), c). Ob-
servem que vale o análogo ao Teorema 8.2 para triplas ordenadas. Isto é, (a, b, c) =
(d, e, f ) se, e somente se, a = d, b = e e c = f .
O conjunto das triplas ordenadas (a, b, c) tais que a ∈ A, b ∈ B e c ∈ C coincide
com o conjunto (A × B) × C, que denotaremos, simplesmente, por A × B × C. Note
que a operação × não é associtiva. Os conjuntos (A × B) × C e A × (B × C) são
8.4. FUNÇÕES 55
diferentes. Mas, para efeito do Teorema 8.2, e seu análogo para triplas, são idênticos.
De fato, poderı́amos definir, sem problemas, (a, b, c) como (a, (b, c)), e terı́amos a
mesma propriedade de duas triplas serem iguais se, e somente se, as coordenadas
correspondentes são iguais.
Podemos estender essa definição para n-uplas ordenadas. Formalmente (mas nem
tanto), definimos (a1 , . . . , an ) como ((a1 , . . . , an−1 ), an ). É bom lembrarmos que essa
definição recursiva ainda não pode ser feita rigorosamente na linguagem de primeira
ordem, pois utiliza o teorema de recursão sobre classes, que ainda não vimos.
Para n ≥ 2 definimos An o conjunto das n-uplas (a1 , . . . , an ) tais que ai ∈ A, para
todo i entre 1 e n. Na metalinguagem, formalizamos An como An−1 × A, sendo que
A1 é, por definição, o próprio conjunto A. Vemos, por essa definição, que A2 = A×A.
Outra maneira, mais precisa, de definirmos An é como o conjunto das funções
(como veremos daqui a pouco) de n em A.
8.4 Funções
Uma função de A em B é uma relação que associa a cada elemento de A um único
elemento de B. Posto isso formalmente temos a seguinte definição:
Definição 8.5 Dizemos que uma relação F entre A e B é uma função de A em B

se para todo x ∈ A existe um único y ∈ B tal que (x, y) ∈ F . Isto é, F é uma função
de A em B se a seguinte fórmula é verdadeira:
(F ⊂ A×B)∧∀x(x ∈ A → ∃y((x, y) ∈ F ))∧∀x∀y∀z(((x, y) ∈ F ∧(x, z) ∈ F ) → (y = z))
. Notemos que a fórmula dada é uma conjunção de três subfórmulas. A primeira

diz que uma função de A em B é uma relação entre A e B. Ou seja, para todo par
ordenado (x, y) ∈ f temos x ∈ A e y ∈ B. A segunda subfórmula diz que todo
elemento de A é contemplada pela função F (quando não exigimos essa condição,
dizemos que f é uma função parcial de A em B). Finalmente, a terceira subfórmula
nos diz que a função só relaciona um elmento de B, para cada elemento de A.
Denotamos por A B o conjunto das funções de A em B. Deixamos como exercı́cio
ao leitor provar a existência de A B, pois é uma simples aplicação do axioma da
separação. Essa notação funciona como um sı́mbolo funcional da linguagem.
Mantendo a tradição, usaremos preferencialmente letras minúsculas para denotar
funções.
Se f é uma função de A em B, dizemos que A é o domı́nio de f – que será
denotado por dom(f ) – e o conjunto {b ∈ B : ∃a((a, b) ∈ f )} é chamado de imagem
de f – que será denotada por im(f ).
Normalmente se utiliza o termo contradomı́nio de uma função para designar o
conjunto B, quando a função é de A em B. Todavia, esse termo não é muito adequado
na definição aqui adotada de função, já que, dada uma função f , não é possı́vel
“recuperar” o contradomı́nio. Por exemplo, se tomarmos o conjunto (supondo que já
temos construı́dos os números reais) {(x, y) ∈ R2 : y = x2 }, esse pode tanto ser visto
como uma função de R em R quanto uma função de R em R+ (os reais não-negativos).
Por outro lado, essa ambiguidade não existe ao definirmos o domı́nio e a imagem
a partir da função. É possı́vel “recuperar” o domı́nio e a imagem de uma função.
Abaixo seguem as definições do domı́nio e imagem a partir da função, e a tarefa de
mostrar que essas definições cumprem o prometido é deixada ao leitor:
[[
dom(f ) = {a ∈ f : ∃b((a, b) ∈ f )}
[[
im(f ) = {b ∈ f : ∃a((a, b) ∈ f )}
Nessas definições é bom notar em como os axiomas do par e das partes “empa-
cotam” os conjuntos, enquanto o axioma da união “desempacota”.
Também notamos que as mesmas definições podem ser aplicadas para relações
binárias quaisquer.
Como uma função associa a cada elemento do domı́nio um único elemento da
imagem, podemos introduzir a seguinte notação: se (x, y) pertence a uma função f ,
denotamos y por f (x). Essa notação só é possı́vel, pois, para x ∈ dom(f ), existe
um único y satisfazendo (x, y) ∈ f . Porém, precisamos ser mais cautelosos com essa
notação do que somos com outras como a do par ({a, b}), da união de dois conjuntos
(a ∪ b) e do par ordenado. Isso porque, enquanto as outras notações valem para
quaisquer termos, f (x) só está bem definido quando f é uma função e x pertence ao
domı́nio de f . Logo, não podemos desavisadamente introduzir essa notação como um
sı́mbolo funcional binário da linguagem, pois f (x) não está definido para quaisquer
conjuntos f e x.
Outra notação que podemos introduzir – comum na linguagem cotidiana da ma-
temática – é f : A −→ B para designar que f é uma função de A em B, ou, em
outras palavras (ou melhor, sı́mbolos), f ∈A B. A notação f : A −→ B deixa
implı́cito que f é uma função, o domı́nio de f é A e a imagem de f está contida em
B. Se escrevemos que f : A −→ B é sobrejetora, isso significa que f é sobrejetora em
relação a B. Ou seja, que a imagem de f é B. Da mesma forma, quando escrevemos
que f : A −→ B é bijetora, dizemos que f é bijetora em relação a B, isto é, é injetora
e tem imagem igual a B.
Suponha que f é uma função de A em B e que C é um subconjunto de A.
Definimos
f |C = (C × B) ∩ f
a restrição de f ao conjunto C. Fica como exercı́cio ao leitor mostrar que f |C é uma
função de C em B.
Dizemos que uma função f : A −→ B é injetora se, para todo x, y ∈ A temos
que, se x 6= y, então f (x) 6= f (y). Ou seja, quando dois elementos distintos do
domı́nio nunca são mapeados para o mesmo elemento da imagem. Dizemos que f é
sobrejetora em relação a B se para todo y ∈ B existe x ∈ A tal que f (x) = y. Ou
seja, quando B é a imagem de f . A necessidade de relativizarmos a B a definição de
sobrejetora vem daquele problema anteriormente mencionado, sobre a impossibilidade
de “recuperarmos” o contra-domı́nio de uma função. Quando está claro no contexto
qual contradomı́nio está sendo considerado (quando, por exemplo, escrevemos que
“f é uma função de A em B”) dizemos apenas que a função é sobrejetora, mas é
necessária uma cautela extra para esse tipo de nomenclatura.
8.4. FUNÇÕES 57
Uma função f : A −→ B é bijetora (ou bijetora em relação a B) quando é

injetora e sobrejetora (em relação a B). Nesse caso também dizemos que A é uma
bijeção entre A e B. No capı́tulo sobre conjuntos equipotentes discutiremos melhor a
propriedade de existir uma bijeção entre dois conjuntos (lembram-se da introdução,
sobre como comparar tamanhos de conjuntos infinitos?)
Ainda há algumas definições a serem introduzidas, com as quais o estudante de
matemática deve estar bem acostumado. Se f e g são funções, e im(g) ⊂ dom(f ),
então definimos a função composta de f e g da seguinte forma:
f ◦ g = {(x, z) ∈ dom(g) × im(f ) : ∃y((x, y) ∈ g ∧ (y, z) ∈ f }
Novamente, é preciso tomar cuidado com essa notação, pois ela só faz sentido
dentro das hipóteses estritas apresentadas acima.
Exercı́cios
1. Encontre uma definição alternativa para par ordenado de modo que o Teo-
rema 8.2 continue valendo. Justifique.
2. Prove que A × B = ∅ se, e somente se A = ∅ ou B = ∅.
3. Prove que, se A ⊂ C e B ⊂ D, então A × B ⊂ C × D.
4. Vale a recı́proca do exercı́cio 3? Justifique.
5. Descreva todos os elementos de P(2 × 2).
6. Escreva uma fórmula de primeira ordem, de três variáveis livres, sem abreviaturas
da linguagem de teoria dos conjuntos, que significa “x é uma função de y em z”.
7. Prove que, se f e g são injetoras, então f ◦ g é injetora. Mostre, através de um

contra-exemplo, que a recı́proca não é verdadeira.
8. Em quais condições temos A B ⊂C D? Justifique.
9. Dada uma relação R, definimos a inversa de R – que será denotada por R−1 –
como o conjunto {(y, x) : (x, y) ∈ R}. Com base nisso, prove as seguintes asserções:
(a) Para toda relação R existe R−1 .
(b) Se f é uma função, f −1 é uma função se, e somente se, f é injetora.
(c) Se f e g são funções injetoras tais que im(g) ⊂ dom(f ), então (f ◦g)−1 = g −1 ◦f −1 .
10. Prove que existe uma função injetora de ω em ω que não é sobrejetora (em
relação a ω).
Capı́tulo 9
Aritmética dos números naturais
Já definimos o conjunto dos números naturais e mostramos que esse satisfaz os axi-
omas de Peano. Vamos, agora, definir as operações de adição e multiplicação, como
funções de ω × ω em ω. Para isso, precisamos, antes, definir o teorema da recursão.
Teorema 9.1 (da recursão) Sejam X um conjunto, x um elemento de X e g uma

função de X em X. Então existe uma única função f de ω em ω tal que
• f (0) = x;
• f (n+ ) = g(f (n)), para todo n ∈ ω.
Demonstração: Usando o axioma da separação, defina o conjunto
C = {R ∈ P(ω × X) : (0, x) ∈ R ∧ ∀n∀y((n, y) ∈ R → (n+ , g(y))) ∈ R}.
Claramente ω × X ∈ C. Logo, C é não-vazio. Podemos, portanto, definir o conjunto

\
f= C
Precisamos provar que f é uma função e que satisfaz a condição para pertencer a C.
Afirmação 1: f ∈ C
O procedimento da demonstração da afirmação 1 é análogo à demonstração que

ω é um conjunto indutivo. Como (0, x) ∈ R, para todo R ∈ C, então (0, x) ∈ f . Se
(n, y) ∈ f , então (n, y) ∈ R, para todo R ∈ C. Logo, pela hipótese sobre os elementos
de C, (n+ , g(y)) ∈ R, para todo R ∈ C. Logo, (n+ , g(y)) ∈ f , concluindo a prova da
afirmação.
Afirmação 2: f é uma função de domı́nio ω
Vamos provar, por indução, que para todo n ∈ ω vale a fórmula P (n), definida
abaixo:
P (n) ≡ ∃y((n, y) ∈ f ) ∧ ∀y∀z(((n, y) ∈ R ∧ (n, z) ∈ R) → (y = z))
59
60 CAPÍTULO 9. ARITMÉTICA DOS NÚMEROS NATURAIS
Vamos provar P (0). Pela afirmação 1, (0, x) ∈ f . Vamos provar que, se (0, y) ∈ f ,
então y = x. Suponha, por absurdo, que existe y 6= x tal que (0, y) ∈ f . Considere
R = f r {(0, y)}. Vamos verificar que R ∈ C. De fato, (0, x) ∈ R, pois (0, x) ∈ f
e x 6= y. Se (n, y) ∈ R, então (n, y) ∈ f , pois R ⊂ f . Logo, (n+ , g(y)) ∈ f (pela
afirmação 1). Como n+ 6= 0 (axioma 4 de Peano), temos que (n+ , g(y)) ∈ f é diferente
de (0, y) e, portanto, pertence a R.
Portanto, concluı́mos que R ∈ C, o que implica que f ⊂ R. Como R ⊂ f , temos
f = R, absurdo, pois (0, y) ∈ f e (0, y) ∈
/ R.
Vamos agora provar que P (n) implica P (n+ ).
Assumindo P (n) como verdadeiro, temos que existe y tal que (n, y) ∈ f . Logo,
como f ∈ C, temos que (n+ , g(y)) ∈ f , provando a “primeira parte” de P (n+ ).
Agora supomos, por absurdo, que existe z 6= g(y) tal que (n+ , z) ∈ f . Defina
R = f r {(n+ , z)}. Vamos verificar que R ∈ C,
Como n+ 6= 0, continuamos tendo (0, x) ∈ R. Suponha que (m, v) ∈ R. Como
f ∈ C e R ⊂ f temos que (m+ , g(v)) ∈ R. Se m 6= n, o axioma 3 de Peano nos
garante que m+ 6= n+ , logo, (m+ , g(v)) 6= (n+ , z), provando que (m+ , g(v)) ∈ R. Se
m = n, pela hipótese indutiva P (n) temos que v = y (pois (n, y) ∈ f ), e já vimos
que (n+ , g(y) ∈ f . Como z 6= g(y), também temos que (n+ , g(y) ∈ R. Provamos,
com isso, que R ∈ C o que novamente contradiz com o fato de R estar contido
propriamente em f . Isso conclui a demonstração da afirmação 2.
Das afirmações 1 e 2 segue imediatamente o teorema. Sendo f uma função de
domı́nio ω e satisfazendo as condições da famı́lia de conjuntos C, temos que (0, x) ∈ f ,
o que significa que f (0) = x. Como, para todo n, temos, pela própria definição de
função, (n, f (n)) ∈ f , da afirmação 1 segue que (n+ , g(f (n)) ∈ f , o que significa que
f (n+ ) = g(f (n)).
A unicidade da função f pode ser provada por indução. Suponha que existe
h satisfazendo as mesmas condições do teorema estabelecidas para f . Temos que
f (0) = h(0), pois ambos são iguais a x. Se f (n) = h(n), então g(f (n)) = g(h(n)), e
ambos são iguais a f (n+ ) e h(n+ ). Logo, por indução, f = h.

9.1 Aritmética dos números naturais

Já definimos ω como o conjunto dos números naturais, e mostramos que ele satisfaz
os axiomas de Peano. Falta definir a aritmética. Ou seja, precisamos definir duas
funções de ω × ω em ω que correspondem às operações de soma e produto.
A ideia geral da definição da soma é utilizar o teorema da recursão para definir,
para cada número natural m, uma função sm : ω −→ ω tal que
sm (0) = m
sm (n+ ) = (sm (n))+

e definimos m + n como sm (n). Utilizando novamente o teorema da recursão e a
definição das funções acima podemos definir, para cada número natural m, uma
9.1. ARITMÉTICA DOS NÚMEROS NATURAIS 61
função pm : ω −→ ω tal que

pm (0) = 0
pm (n+ ) = pm (n) + n
e definimos m · n como pm (n).
Essa definição de soma e produto ainda precisa ser melhor justificada, para po-
demos construı́-la axiomaticamente. Façamos isso.
Teorema 9.2 Existe uma função s de ω em ω ω tal que s(m)(0) = m e s(m)(n+ ) =

(s(m)(n))+ , para todos n, m ∈ ω.
Demonstração: Usando o axioma da separação defina
s = {(m, f ) ∈ ω ×ω ω : ∀n((f (0) = m) ∧ (f (n+ ) = (f (n))+ ))}
Pelo teorema da recursão, utilizando-o para a função g = {(n, n+ ) : n ∈ ω},

para cada m existe uma única f satisfazendo as condições descritas na definição de
s. Logo, s é uma função.

Definição 9.3 Definimos a operação de soma em ω como a função + : ω × ω −→ ω

dada por +((m, n)) = s(m)(n). Denotamos +((m, n)) por m + n.
Teorema 9.4 Existe uma função p de ω em ω ω tal que p(m)(0) = 0 e p(m)(n+ ) =

p(m)(n) + m, para todos n, m ∈ ω.
Demonstração: Usando o axioma da separação defina
p = {(m, f ) ∈ ω ×ω ω : ∀n((f (0) = 0) ∧ (f (n+ ) = (f (n) + m)))}
Tomando a função g = {(i, j) ∈ ω ×ω : i+m = j}, o teorema da recursão garante

que p é uma função.
Definição 9.5 Definimos a operação de produto em ω como a função · : ω×ω −→ ω

dada por ·((m, n)) = p(m)(n). Denotamos ·((m, n)) por m · n.
Da definição de soma e produto seguem os seguintes axiomas da aritmética de

Peano, quando adicionamos os sı́mbolos funcionais binários + e · à linguagem da
aritmética:
m+0=m
m + n+ = (m + n)+
m·0=0
m · n+ = (m · n) + n
Eventualmente usaremos a notação xy para representar x · y.
62 CAPÍTULO 9. ARITMÉTICA DOS NÚMEROS NATURAIS
Exercı́cios
1. Use o teorema da recursão para definir a função f (n) = 2n , para n ∈ ω.
2. Use o teorema da recursao para definir a potenciação entre os números naturais

(adote 00 = 1).
3. Prove a propriedade comutativa da adição no conjunto dos números naturais.
4. Prove a existência do conjunto dos números primos.

Capı́tulo 10
Axioma da regularidade
Até agora, todos os axiomas que vimos garantem a construção de alguns conjuntos
partindo apenas do conjunto vazio. O próximo axioma garante que todos os conjuntos
são construı́dos a partir do vazio. Também irá evitar coisas como x ∈ x e será útil
em teoria dos modelos para fazermos indução sobre a relação de pertinência.
Axioma 8 (da regularidade) Para todo conjunto x não-vazio existe y ∈ x tal que
x ∩ y = ∅.
∀x(x 6= ∅ → ∃y(y ∈ x ∧ x ∩ y = ∅))
Teorema 10.1 Não existem x e y tais que x ∈ y e y ∈ x.
Demonstração: Sejam x e y conjuntos quaisquer. Vamos provar que x ∈ / y ou

y∈/ x.
Usando o axioma do par, tome z = {x, y}. Como z não é vazio, pelo axioma da
regularidade existe w ∈ z tal que w ∩ z = ∅. Se w = x, isso implica que y ∈/ x. Se
w = y, isso implica que x ∈
/ y, provando o teorema.
Corolário 10.2 Não existe x tal que x ∈ x.
Demonstração: Aplique o teorema anterior para x = y.

O axioma da regularidade garante que não existe uma sequência infinita de-
crescente na relação de pertinência. Ou seja, não existe uma sequência da forma
. . . x3 ∈ x2 ∈ x1 ∈ x0 . É claro que essa expressão não está de acordo com a “norma
culta” da linguagem lógica. Formalizando essa afirmação, deixamos como exercı́co
ao leitor provar o seguinte fato:
Afirmação: Não existe uma função f de domı́nio ω tal que f (n+ ) ∈

f (n), para todo n ∈ ω.
Concluı́mos desse resultado que, para qualquer conjunto x, se tomarmos um

elemento de x, e um elemento de um elemento de x, e um elemento de um elemento
de um elemento de x, assim sucessivamente, chegaremos, após uma quantidade finita
de passos, no conjunto vazio.
63
64 CAPÍTULO 10. AXIOMA DA REGULARIDADE
É bom notar que se, por um lado, não existe uma sequência infinita decrescente,
na relação de pertinência, por outro lado, como veremos no próximo capı́tulo, é
possı́vel existir uma sequência infinita crescente. Ou seja, sequências infinitas da
forma x0 ∈ x1 ∈ x2 . . . existem (os números naturais, por exemplo).
Exercı́cios
1. Usando o axioma da regularidade, prove que não existem x, y, z tais que x ∈ y,
y ∈ z e z ∈ x.
2. Usando o axioma da regularidade, prove que não existem w, x, y, z tais que w ∈ x,

x ∈ y, y ∈ z e z ∈ w.
3. Use o axioma da regularidade para provar que o conjunto vazio pertence a todo
conjunto transitivo não-vazio.
4. Prove que não existe x tal que P(x) = x.
5. Prove que existe um modelo para teoria dos conjuntos em que valem os axiomas
do par, da união e das partes, mas não valem os axiomas do vazio e da regularidade.
Dica: Considere um modelo formado por um único elemento x tal que x ∈ x.
Capı́tulo 11
Construção dos conjuntos

numéricos
Já temos construı́dos os números naturais e as funções de soma e produto entre

números naturais. Neste capı́tulo aprenderemos a construir os conjuntos dos números
inteiros, racionais e reais.
11.1 Relação de equivalência

Para construirmos o conjunto dos números inteiros a partir do conjunto dos números
naturais, e o conjunto dos números racionais a partir do conjunto dos número inteiros,
precisamos, antes, desenvolver o conceito de relação de equivalência.
Definição 11.1 Dizemos que uma relação R ⊂ X ×X é uma relação de equivalência

em X se satisfaz as seguintes propriedades, para todos x, y, z ∈ X:
• Reflexividade: xRx;
• Simetria: se xRy então yRx;
• Transitividade: se xRy e yRz então xRz.

Definimos o conjunto das classes de equivalência de R como
X/R = {Y ∈ PX : ∃x∀y(y ∈ Y ↔ xRy)}
Os elementos de X/R são, obviamente, chamados de classes de equivalência,

também denotado do seguinte modo:
X/R = {[x] : x ∈ X}
onde
[x] = {y ∈ X : xRy}
Teorema 11.2 Seja R uma relação de equivalência em um conjunto X. As seguintes

afirmações são verdadeiras:
65
66 CAPÍTULO 11. CONSTRUÇÃO DOS CONJUNTOS NUMÉRICOS
S
(a) X/R = X;
(b) ∅ ∈
/ X/R;
(c) Para todos Y, Z ∈ X/R, se Y 6= Z então Y ∩ Z = ∅;
(d) Se x ∈ Y e todo Y ∈ X/R, para todo y ∈ X temos que xRy se, e somente se,
y ∈Y.
Demonstração: Usaremos a notação [x] para o conjunto {y ∈ X : xRy}.

Dado x ∈ X, temos que x ∈ [x], uma vez que, pela propriedade reflexiva, xRx.
Isso prova (a). Como todo elemento de X/R é da forma [x], para algum x ∈ X, isso
prova também a parte (b)
Para provar (c), assumindo que Y e Z são dois elementos de X/R que não são
disjuntos, mostraremos que Y = Z. Sejam x ∈ Y ∩ Z e y0 , z0 ∈ X tais que Y = [y0 ]
e Z = [z0 ]. Dado y ∈ Y , temos, por definição, que y0 Ry. Logo, pela simetria, yRy0 .
Mas como x ∈ Y , temos y0 Rx. Pela transitividade temos yRx. Mas, como x ∈ Z,
temos z0 Rx e, pela simetria, xRz0 . Logo, a transitividade nos dá yRz0 e, novamente
pela simetria, z0 Ry, o que prova que y ∈ Z. Isso conclui que Y ⊂ Z e um argumento
análogo mostra que Z ⊂ Y , provando que Y = Z.
Mostremos a parte (d). Se Y ∈ X/R, existe y0 ∈ X tal que Y = [y0 ]. Como
x ∈ Y , temos que y0 Rx e, portanto, xRy0 . Se yRx, por transitividade e simetria
temos yRy0 e y0 Ry, de onde temos que y ∈ Y . Por outro lado, se y ∈ Y , temos y0 Ry
e, portanto, xRy, concluindo a prova do teorema.
Em outras palavras, o Teorema 11.2 parte (d) nos diz que duas classes de equi-
valência [x] e [y] são iguais se, e somente se, xRy.
11.2 Construção do conjunto dos números inteiros

A construção dos números inteiros a partir dos naturais se assemelha muito à cons-
trução dos racionais a partir dos inteiros, sendo essa última mais conhecida.
Iremos identificar pares de números naturais que “possuem a mesma diferença”.
Por exemplo, identificaremos o par (5, 3) com os pares (4, 2), (6, 4) etc. Assim, o
número inteiro 2 é o conjunto {(2, 0), (3, 1), (4, 2), . . .} (sendo esses pares ordenados
formados por números naturais), enquanto −2 é o conjunto {(0, 2), (1, 3), (2, 4), . . .}.
Definimos R ⊂ (ω × ω)2 como o conjunto dos pares ((a, b), (c, d)) tais que a + d =
b + c. Deixamos como exercı́cio ao leitor provar o seguinte fato:
R é uma relação de equivalência
Defina o conjunto dos números inteiros como
Z = (ω × ω)/R
Falta definirmos as operações de soma e produto em Z. Para não sobrecarregar

o texto, abusaremos a notação utilizando os mesmos sı́mbolos + e · para a soma e
11.2. CONSTRUÇÃO DO CONJUNTO DOS NÚMEROS INTEIROS 67
produto de números inteiros. Uma definição informal seria
[(a, b)] + [(c, d)] = [(a + c, b + d)]
[(a, b)] · [(c, d)] = [(ac + bd, ad + bc)]

Porém, tal definição não pode depender da escolha do representante. Nesta primeira
vez que fazemos esse tipo de construção seremos mais rigorosos, definindo explicita-
mente as funções de soma e produto. Como mais um abuso de notação, denotaremos
(Z×Z)×Z por Z×Z×Z, ou, simplesmente, Z3 , e o par ((x, y), z) pela tripla (x, y, z).
Definimos:
S = {(x, y, z) ∈ Z3 : ∃a∃b∃c∃d((a, b) ∈ x ∧ (c, d) ∈ y ∧ (a + c, b + d) ∈ z}
P = {(x, y, z) ∈ Z3 : ∃a∃b∃c∃d((a, b) ∈ x ∧ (c, d) ∈ y ∧ (ac + bd, ad + bc) ∈ z}
Teorema 11.3 Sejam S e P definidos como acima. Temos que
(a) S e P são funções;
(b) Para todos a, b, c, d em ω temos que S([(a, b)], [(c, d)]) = [(a + c, b + d)];
(c) Para todos a, b, c, d em ω temos que P ([(a, b)], [(c, d)]) = [(ac + bd, ad + bc)].
Demonstração: Para as três partes do teorema precisamos mostrar a independência

em relação à escolha dos representantes. Isto é, mostraremos a seguinte afirmação:
Afirmação: Se (a, b)R(a0 , b0 ) e (c, d)R(c0 , d0 ) então (a + c, b + d)R(a0 +

c , b0 + d0 ) e (ac + bd, ad + bc)R(a0 c0 + b0 d0 , a0 d0 + b0 c0 ).
0
Provaremos a afirmação assumindo as propriedaes conhecidas da aritmética: co-

mutatividade, associatividade, lei do cancelamento etc.
Suponha que (a, b)R(a0 , b0 ) e (c, d)R(c0 , d0 ). Isso significa que a + b0 = b + a0
e c + d0 = d + c0 . Logo, a + b0 + c + d0 = b + a0 + d + c0 , o que significa que
(a + c, b + d)R(a0 + c0 , b0 + d0 ).
Agora veremos que (ac + bd, ad + bc)R(a0 c0 + b0 d0 , a0 d0 + b0 c0 ).
Como a + b0 = a0 + b e c + d0 = c0 + d, temos que, para todos x, y, z, w em ω, vale
a seguinte igualdade:
(a + b0 )x + (c + d0 )y + (a0 + b)z + (c0 + d)w = (a0 + b)x + (c0 + d)y + (a + b0 )z + (c + d0 )w
Tomando x = c + c0 , y = a + a0 , z = d + d0 e w = b + b0 , utilizando as propriedades

operatórias de números naturais, provamos que ac+bd+a0 d0 +b0 c0 = ad+bc+a0 c0 +b0 d0
e, portanto, (ac + bd, ad + bc)R(a0 c0 + b0 d0 , a0 d0 + b0 c0 ). Deixamos os detalhes das contas
para o leitor completar.
Vejamos como isso ajuda a provar o teorema. Para provar que S é uma função
de Z2 em Z, primeiro temos que provar que, para todo (x, y) ∈ Z2 , existe z tal que
(x, y, z) ∈ S. Mas isso é verdade, pois pelo Teorema 11.2, parte (b), existe x e y são
não-vazios. Logo, existem (a, b) ∈ x e (c, d) ∈ y. Pela parte (a) do mesmo teorema,
existe z tal que (a + c, b + c) ∈ z, o que nos dá, pela definição de S, que (x, y, z) ∈ S.
O mesmo argumento mostra que, para todo (x, y) ∈ Z2 , existe z tal que (x, y, z) ∈ P ,
tomando, desta vez, z contendo (ac + bd, ad + bc).
Isso já prova, quando concluirmos que S e P são funções, as partes (b) e (c) do
presente teorema.
Agora vejamos a unicidade. Suponha que (x, y, z) ∈ S e (x, y, z 0 ) ∈ S. Pela
definição de S, (x, y, z) ∈ S implica que existem números naturais a, b, c, d tais que
(a, b) ∈ x, (c, d) ∈ y e (a + c, b + d) ∈ z, e (x, y, z 0 ) ∈ S implica que existem números
naturais a0 , b0 , c0 , d0 tais que (a0 , b0 ) ∈ x, (c0 , d0 ) ∈ y e (a0 + c0 , b0 + d0 ) ∈ z 0 .
Note que não podemos, a princı́pio, assumir que os números a, b, c, d que teste-
munham que (x, y, z) ∈ S são os mesmos que testemunham que (x, y, z 0 ) ∈ S.
Porém, como (a, b) e (a0 , b0 ) ambos pertencem a x, o Teorema 11.2, parte (d),
nos garante que (a, b)R(a0 , b0 ). Da mesma forma temos (c, d)R(c0 , d0 ). Logo, pela
afirmação, (a + c, b + d)R(a0 + c0 , b0 + d0 ). Logo, o Teorema 11.2, parte (d), também
nos assegura que (a0 + c0 , b0 + d0 ) ∈ z. Portanto, (a0 + c0 , b0 + d0 ) ∈ z ∩ z 0 , o que implica,
pela parte (c) do Teorema 11.2, que z = z 0 , como querı́amos provar.
A demonstração de que P é uma função é análoga.

Sendo x e y números inteiros, denotamos S((x, y)) por x + y, e P ((x, y)) por
x · y ou, simplesmente, xy. Como estamos usando os mesmos sı́mbolos em conjuntos
diferentes, estamos fugindo um pouco do rigor da lógica, e precisamos estar atentos
ao contexto. O importante é nunca perder a conexão com a linguagem lógica estrita,
estando ciente de como cada uma dessas notações funciona como abreviatura.
Definir função em classes de equivalência através de um representante, para de-
pois mostrar que a definição independe da escolha do representatne, é uma prática
bastante comum no cotidiano da matemática, com a qual o estudante deve ter se
deparado diversas vezes. Aqui foi apresentada a formalização desse processo, que,
como podemos notar, não é trivial, apesar de ser bem intuitivo. Reparem que todos
os itens do Teorema 11.2 foram utilizados e, na demonstração desse, foram utilizadas
todas as três propriedades de relação de equivalência.
11.3 Construção do conjunto dos números racio-

nais
A construção de Q a partir de Z se assemelha muito à construção de Z a partir de ω.
Primeiro definimos o número inteiro 0 (eventualmente denotado por 0Z , quando
houver possibilidade de confusão com o número natural 0) como a classe [(0, 0)].
Definimos uma relação R em Z × (Z r {0Z }) como
R = {((a, b), (c, d)) ∈ (Z × (Z r {0Z }))2 : ad = bc}
Fica como exercı́cio verificar que R é uma relação de equivalência.

11.4. CONSTRUÇÃO DO CONJUNTO DOS NÚMEROS REAIS 69
Definimos
Q = (Z × (Z r {0Z }))/R
Obviamente, a classe de equivalência representada pelo par (a, b) corresponde ao
número racional representado pela fração ab , e R é a equivalência de frações.
Definimos a soma e o produto de números reais da seguinte forma:
[(a, b)] + [(c, d)] = [(ad + bc, bd)]
[(a, b)] · [(c, d)] = [(ac, bd)]
Deixamos como exercı́cio ao leitor provar que essa definição independe da escolha
do representante. Os demais detalhes para a formalização são iguais aos que foram
feitos anteriormente.
11.4 Construção do conjunto dos números reais

A construção que será feita nesta seção deve-se a Richard Dedekind (1831–1916).
Para construirmos os números reais a partir dos racionais, precisamos, antes,
introduzir uma série de definições para podermos falar da ordem em Q.
Dizemos que um número inteiro x é positivo se existe n ∈ ω tal que n 6= 0 e
(n, 0) ∈ x.
Dizemos que um número racional x é positivo se existe (a, b) ∈ x tal que a e b
são números inteiros positivos.
Definimos uma relação < em Q da seguinte forma: a < b se, e somente se, existe
um número racional positivo c tal que a + c = b.
Dizemos que um subconjunto C de Q é um corte se satisfaz as seguintes propri-
edades:
• é não-vazio: ∃x(x ∈ C);
• não contém todos os racionais: ∃x(x ∈ Q ∧ x ∈
/ C);
• não tem máximo: ∀x∃y : x < y;
• é fechado para baixo: ∀x∀y((x ∈ C ∧ y < x) → y ∈ C).
Definimos o conjunto dos números reais como:
R = {C ⊂ Q : C é um corte}
Intuitivamente, pensamos em um número real, nesta construção por cortes, como
o conjunto dos racionais menores do que ele.
Dados dois números reais A e B (ou seja, dois cortes em Q) definimos a soma e
o produto de A e B como:
[A] + [B] = {a + b : a ∈ A ∧ b ∈ B}
[A] · [B] = {x ∈ Q : ∃a∃b(a ∈ A ∧ b ∈ B ∧ x < a · b)}
Deixamos como exercı́cio provar que as definições acima estão boas. Ou seja, que
os subconjuntos de Q definidos acima são cortes. Ao leitor mais paciente indicamos a
tarefa de provar todos os axiomas de corpo ordenado completo – com a ordem dada
pela inclusão – que são estudados em Análise Real.
Exercı́cios
1. Seja X um conjunto e sejam x0 e y0 dois elementos distintos de X. Considere a
seguinte relação em X:
R = {(x, y) ∈ X × X : x = y} ∪ {(x0 , y0 ), (y0 , x0 )}
(a) Prove que R é uma relação de equivalência em X.
(b) Descreva os elementos de X/R.
2. Considere C um conjunto não-vazio de conjuntos não-vazios

S tal que, para todos
x e y pertencentes a C, se x 6= y então x ∩ y = ∅. Seja X = C. Defina em X a
relação:
R = {(x, y) ∈ X : ∃z(z ∈ C ∧ x ∈ z ∧ y ∈ z)}
(a) Prove que R é uma relação de equivalência em X.
(b) Mostre que C = X/R.
(c) Prove que duas relações de equivalência diferentes possuem classes de equi-
valências diferentes.
3. Como fica uma relação de equivalência sobre ∅? Ela satisfaz o Teorema 11.2?
4. Prove a propriedade comutativa da soma de números inteiros.
5. Prove que a relação R definida na Seção 11.2 é uma relação de equivalência

(podendo assumir as propriedades usuais da soma de números naturais, como asso-
ciatividade e a lei do cancelamento).
Capı́tulo 12
Axioma da substituição
Veremos agora o último axioma (ou melhor, esquema de axiomas) de ZF (isto é, o
sistema de Zermelo e Fraenkel sem o axioma da escolha).
Axioma 9 (da substituição) Seja P (x, y) uma fórmula e suponha que, para todo
x, y, z temos que P (x, y) e P (x, z) implicam y = z. Então, para todo conjunto X,
existe o conjunto
{y : ∃x(x ∈ X ∧ P (x, y))}.
A condição sobre a fórmula P diz que, para todo x, existe no máximo um y para
o qual P (x, y) vale. Ou seja, P exerce o papel de uma função parcial em X, e o
axioma da substituição garante que existe a imagem dessa “função”.
Para simplificar a notação, introduzimos alguns sı́mbolos lógicos que serão utili-
zados neste capı́tulo. O sı́mbolo ∃0 significa “existe no máximo um” e é definido da
seguinte forma:
∃0 xP ≡ ∀y(Pxy → (x = y))
O sı́mbolo ∃! significa “existe um único” e é definido como
∃!xP ≡ (∃xP ) ∧ (∃0 xP )
Formalmente, utilizando essa notação, o esquema de axiomas da substituição diz

que para toda fórmula P em que v não ocorre livre a seguinte fórmula é um axioma:
∀x∃0 yP → ∀X∃v∀y((y ∈ v) ↔ ∃x(x ∈ X ∧ P ))
O motivo da restrição de v não ocorrer livre em P é o mesmo que foi discutido no

axioma da separação: reservamos a variável v para definir o conjunto que o axioma
constrói, e a ocorrência livre de v em P poderia resultar em um paradoxo.
Poderı́amos suprimir o axioma da separação da lista de axiomas de ZFC, e prová-
lo como teorema, a partir do axioma da substituição. Para isso basta tomarmos a
fórmula P (x) ∧ (x = y), escolhendo y uma variável que não ocorre livre em P (lem-
brando que, utilizando os axiomas lógicos, é sempre possı́vel substituirmos uniforme-
mente as variáveis livres de uma fórmula). O axioma da separação nos garante que
existe o conjunto
{y : ∃x(x ∈ X ∧ P (x) ∧ (x = y))},
71
72 CAPÍTULO 12. AXIOMA DA SUBSTITUIÇÃO
o que coincide com o conjunto

{x ∈ X : P (x)}.
Classes de conjuntos: Para entendermos melhor o axioma da substituição, pre-

cisamos compreender a noção intuitiva de classes de conjuntos. A grosso modo, uma
classe própria é um conjunto (intuitivamente falando) “grande demais para ser con-
junto”. Por exemplo, vimos que não existe o “conjunto de todos os conjuntos”, nem
o “conjunto de todos os conjuntos unitários”. Então falamos, intuitivamente, da
“classe de todos os conjuntos”, ou da “classe dos conjuntos unitários”.
Outras axiomatizações para a teoria dos conjuntos – como a de Neumann, Bern-
nays e Gödel (NGB) e a de Kelley e Morse (KM) – formalizam o conceito de classes.
Nessas teorias, existem dois tipos de objetos matemáticos: as classes e os conjuntos.
Todo conjunto é uma classe, mas nem toda classe é um conjunto. Classes que não
são conjuntos são chamadas de classes próprias.
Em ZFC, não existem classes, mas podemos reproduzir os argumentos usados em
NGB e KM “interpretando” corretamente o conceito de classe, na metalinguagem.
Para isso, basta identificarmos classes com uma variável livre que ocorre em uma
fórmula. Por exemplo, podemos escrever a fórmula “x é unitário”. Então pensamos
na classe de todos os conjuntos x que satisfazem essa fórmula. Se C é a “classe” de
todos os conjuntos unitários, então escrevermos (por um abuso de notação) x ∈ C é o
mesmo que escrever “x é unitário”. A primeira frase não pode ser escrita formalmente
em ZFC (apenas em NGB e KM), mas a segunda, pode, e tem o mesmo significado
que a primeira.
Assim, dentro de ZFC o conceito de classes pode ser considerado um modo de
enxergarmos alguns argumentos e teoremas que, de outro modo, seria menos intuitivo
para compreendermos.
Sob esse ponto de vista, vamos explicar o que significa o axioma da substituição.
A condição que temos sobre a fórmula P (x, y) é a mesma que temos para uma relação
ser função (parcial). Ou seja, P pode ser vista como uma “função entre classes”. O
axioma da substituição diz que, se o domı́nio de P é um conjunto (ou está contido
em um conjunto), então a imagem de P também é um conjunto. Ou ainda, quando
restringimos P a um conjunto, a imagem de P restrita a esse conjunto também é um
conjunto.
Para aplicarmos o axioma da substituição precisamos enunciar uma nova versão
do teorema da recursão finita. Antes, convém discorrermos sobre as diferenças entre
essa versão e aquela que vimos no Capı́tulo 9, e como aplicaremos para obtermos o
fecho transitivo de um conjunto.
O fecho transitivo de x é o menor conjunto transitivo que contém x. Para conse-
guirmos isso, iteramos
S uma sequência infinita de uniões. Isto é, o fecho transitivo de
x será o conjunto z, onde z é “definido” como
[ [[ [[[
z = {x, x, x, x, . . .}
É claro que essa definição não está boa. Além de definirmos rigorosamente o conjunto
z acima, sem usarmos as reticências, precisamos provar que ele existe, e é nesse ponto
que entrarão o axioma da substituição e o teorema da recursão “para classes”.
73
Vejamos como poderı́amos usar o teorema da recursão finita para provarmos a

existência de z. Retome o enunciado S do Teorema 9.1. O conjunto x será o mesmo
do enunciado, e g a função g(y) = y. Pelo teorema da recursão existe uma S única
+ +
função f de domı́nio ω tal que f (0) = x e f (n ) = g(g(n)). Isto é, f (n ) = f (n).
O conjunto z procurado é justamente a imagem de f .
Porém, há uma falha nos argumentos do parágrafo anterior, que é justamente
a definição de g. Falta definirmos o domı́nio e contradomı́nio de g (o conjunto X
do enunciado do Teorema 9.1). Se tivéssemos o “conjunto de todos os conjuntos”,
bastarı́amos tomar esse como X.
Para contornarmos esse problema, trocamos a função g, no enunciado do teorema
da recursão, por uma “fórmula funcional” G. Exigimos, então, que a fórmula possua
pelo menos duas variáveis livres, x e y, e que, para cada x existe um único y tal que
G(x, y) é verdadeira. Ou seja, poderı́amos escrever y = G(x) e, nessa concepção, a
fórmula G(f (n), f (n+ )) escrita no enunciado do teorema seguinte equivale a f (n+ ) =
G(f (n)).
Teorema 12.1 (recursão finita “para classes”) Sejam x0 um conjunto e G(x, y)

uma fórmula tal que ∀x∃!yG(x, y) seja verdadeira. Existe uma única função f de
domı́nio ω tal que f (0) = x0 e G(f (n), f (n+ )) é verdadeira.
Demonstração: Seja F (n, f ) a seguinte fórmula:
n ∈ ω e f é uma função de domı́nio n+ satisfazendo f (0) = x0 e

G(f (k), f (k + )), para todo k ∈ n.
Primeiro notemos que as expressões f (0), f (k) e f (k + ) da fórmula acima estão

bem definidas. Isto é, 0, k e k + pertencem ao domı́nio de f . De fato, já vimos que
0 ∈ n+ , para qualquer n, e é fácil ver que k ∈ n implica que k + ∈ n+ .
Está claro, pela maneira como definimos a fórmula F (n, f ), que essa nunca será
satisfeita quando n não é um número natural. A próxima afirmação, que será pro-
vada por indução em n, assegura que F (n, f ) satisfaz as condições do axioma da
substituição, e tem como “domı́nio” o conjunto ω.
Afirmação 1: Para cada n ∈ ω existe um único f tal que F (n, f ) é

verdadeiro.
A afirmação é verdadeira para n = 0. De fato, f = {(0, x0 )} é a única função de

domı́nio 0+ que satisfaz f (0) = x0 . Como não existe k ∈ 0, a condição G(f (k), f (k + ))
é automaticamente satisfeita, para todo k ∈ 0.
Suponha que a afirmação vale para n. Mostraremos para n+ . Seja f satisfazendo
F (n, f ). Pela hipótese, existe y tal que G(f (n), y) é verdadeiro. Defina
g = f ∪ {(n+ , y)}
Ou seja, g restrita a n+ é igual a f , e g(n+ ) = y. Mostremos que vale F (n+ , g).

Como dom(f ) = n+ , temos que g é uma função de domı́nio n+ ∪ {n+ }. Isto é,
dom(g) = (n+ )+ . De 0 ∈ n+ e n+ = dom(f ) segue que g(0) = f (0) = x0 .
Falta mostrar a “última parte” de F (n+ , g). Seja k ∈ n+ . Temos k ∈ n ou

k = n. Se k ∈ n, temos k + ∈ n+ , que é o domı́nio de f , e, portanto, g(k) = f (k) e
g(k + ) = f (k + ). Logo, de G(f (k), f (k + )) segue G(g(k), g(k + )).
Analisemos o segundo caso: k = n. Temos g(k + ) = g(n+ ) = y e g(k) = f (k).
Logo, de G(f (n), y) segue G(g(k), g(k + )).
Concluı́mos que F (n+ , g) é verdadeira. Mostremos a unicidade. Isto é, se vale
F (n+ , g 0 ) então g = g 0 .
Seja g 0 uma função de domı́nio (n+ )+ satisfazendo F (n+ , g 0 ). Considere f 0 a
restrição de g 0 a n+ . Isto é, definimos f 0 (k) = g 0 (k), para todo k ∈ n+ . Vejamos que
vale F (n, f 0 ).
Temos f 0 (0) = g 0 (0) = x0 . Se k ∈ n, de F (n+ , g 0 ) segue G(g 0 (k), g 0 (k + )). Logo,
como k + ∈ n+ , vale G(f 0 (k), f 0 (k + )). Concluı́mos que F (n, f 0 ) é verdadeira.
Portanto, da hipótese indutiva sobre a unicidade de f , segue que f 0 = f . Em
particular, g 0 (k) = g(k), para todo k ∈ n+ . Para mostrarmos que g = g 0 , basta verifi-
carmos que g(n+ ) = g 0 (n+ ). Mas ambas as fórmulas G(g(n), g(n+ )) e G(g 0 (n), g 0 (n+ ))
são verdadeiras. Como g(n) = g 0 (n), pois n ∈ n+ , da hipótese sobre G segue que
g(n+ ) = g 0 (n+ ).
Concluı́mos, dessa forma, que a existência de uma única f tal que F (n, f ) é
verdadeira implica na existência de uma única g tal que vale G(n+ , g). Portanto,
provamos a afirmação 1 por indução sobre n.
Usando o axioma da substituição, garantimos a existência do seguinte conjunto:
Y = {g : ∃n(n ∈ ω ∧ F (n, g))}
Ou seja, g ∈ Y se, e somente se, vale F (n, g) para algum n ∈ ω. Definimos

[
f= Y
Afirmação 2: f é uma função de domı́nio ω satisfazendo G(f (n), f (n+ )),

para todo n ∈ ω.
Para provarmos a afirmação 2, primeiro notamos que todos os elementos de f são

elementos de alguma função g de domı́nio contido em ω. Logo, f é um conjunto de
pares ordenados da forma (n, y), para n ∈ ω.
Seja n ∈ ω. Existe g que satisfaz F (n, g). Como n ∈ dom(g), existe y tal que
(n, y) ∈ g e, portanto, (n, y) ∈ f . Agora, suponha que exista y 0 tal que (n, y 0 ) ∈ f .
Temos que (n, y 0 ) ∈ g 0 , para algum g 0 ∈ Y . Como n ∈ dom(g 0 ), repetindo o argumento
feito no final da afirmação 1 concluı́mos que a restrição de g 0 a n+ é igual a g e,
portanto, y 0 = g 0 (n) = g(n) = y. Provamos que f é uma função de domı́nio ω.
Vejamos que G(f (n), f (n+ )) vale para todo n. Seja n ∈ ω e tome g tal que vale
F (n+ , g). Temos g ∈ Y e vale G(g(n), g(n+ )). Como f (n) = g(n) e f (n+ ) = g(n+ ),
temos G(f (n), f (n+ )).
Com isso, concluı́mos a afirmação 2 e a existência da f , como no enunciado. Falta
provar a unicidade.
Seja f 0 uma função de domı́nio ω satisfazendo f 0 (0) = x0 e G(f 0 (n), f 0 (n+ )), para
todo n. Provemos, por indução em n, que f 0 (n) = f (n), para todo n.
75
Vale f 0 (0) = f (0) pois ambos são iguais a x0 . Suponha f 0 (n) = f (n). Pela
hipótese sobre G, e por valer G(f 0 (n), f 0 (n+ )) e G(f (n), f (n+ )), isso significa que
f 0 (n+ ) = f (n+ ), como querı́amos.

Uma das aplicações do Teorema 12.1 é a definição do fecho transitivo de um
conjunto. Dizemos que y é o fecho transitivo de x se y é transitivo, x está contido
em y e, para qualquer conjunto transitivo z, se x ⊂ z então y ⊂ z. Ou seja, o fecho
transitivo de x é o menor conjunto transitivo que contém y. Está claro que o fecho
transtivio, quando existe, é único. A existência segue do teorema anterior.
Corolário 12.2 Para todo x existe o fecho transitivo de y.

S
Demonstração: Usando o Teorema 12.1, para x0S= x e G(x, y) a fórmula y = x,
defina f de domı́nio
S ω tal que f (0) = x e f (n+ ) = f (n).
Tome y = im(f ). Mostraremos que y é o fecho transitivo de x.
S que x ⊂ y, pois x ∈ im(f ). Se z ∈ y, existe n ∈ ω tal que z ∈ f (n).
Está claro
Logo, z ⊂ f (n) = f (n+ ). Portanto, z ⊂ y.
Agora suponha que existe um conjunto transitivo z tal que x ⊂ z. Vamos mostrar
que y ⊂ z. Para isso, basta mostrar que S f (n) ⊂ z, para todo n ∈ ω. Mas notemos
que, pela transitividade, se w ⊂ z temos w ∈ z. Assim, como x ⊂ z, por indução
provamos que f (n) ⊂ z, para todo n ∈ ω.

Exercı́cios
1. Prove o Teorema 9.1 como corolário do Teorema 12.1.
2. Prove que existe um conjunto x satisfazendo a seguinte condição: ∅ ∈ x e, se

y ∈ x então {y} ∈ x.
3. Prove a existência de um conjunto indutivo ao qual ω pertence. Discuta o uso

do axioma da substituição.
Capı́tulo 13
Relações de ordem
Já vimos dois tipos importantes de relação: as funções e as relações de equivalência.

Veremos, agora, um terceiro tipo de relação: as relações de ordem.
Definição 13.1 Uma relação ≤⊂ X × X é chamada de ordem em X se satisfaz as
seguintes propriedades, para todos x, y, z ∈ X:
• Reflexividade: x ≤ x;
• Transitividade: se x ≤ y e y ≤ z então x ≤ z.
• Anti-simetria: se x ≤ y e y ≤ x então x = y;
Chamamos de conjunto ordenado um par (X, ≤), onde ≤ é uma ordem em X, e
dizemos que X é o domı́nio da ordem ≤.
Uma relação de ordem também é chamada de ordem parcial, para diferenciar da
ordem total, que veremos daqui a pouco.
Um exemplo de ordem em um conjunto X é a relação de inclusão. Isto é, o
conjunto {(x, y) ∈ X × X : x ⊂ y}. De fato, todo conjunto está contido nele mesmo,
se x está contido em y e y está contido em z então x está contido em z, e o axioma
da extensão nos garante que x = y toda vez que x está contido em y e y está contido
em x. Por abuso de notação, usaremos, eventualmente, o sı́mbolo ⊂ para designar a
relação de inclusão, como conjunto de pares ordenados.
Veremos que toda relação de ordem pode ser vista como uma relação de inclusão.
Para explicar o que isso significa, introduzimos a seguinte definição:
Definição 13.2 Sejam ≤1 e ≤2 duas ordens em X1 e X2 , respectivamente. Dizemos
que ≤1 e ≤2 são ordens isomorfas (ou que os conjuntos ordenados (X1 , ≤1 ) e (X2 , ≤2 )
são isomorfos) se existe uma função f : X1 −→ X2 bijetora em X2 tal que x ≤1 y
se, e somente se, f (x) ≤2 f (y).
Nesse caso, dizemos que a função f é um isomorfismo de ordens.
O próximo resultado diz que toda ordem é isomorfa à relação de inclusão sobre
algum conjunto.
Teorema 13.3 Seja (X, ≤) um conjunto ordenado. Existe um conjunto ordenado
(Y, ) isomorfo a (X, ≤) tal que
= {(x, y) ∈ Y × Y : x ⊂ y}
77
78 CAPÍTULO 13. RELAÇÕES DE ORDEM
Demonstração: Defina f : X −→ P(X) como

f (x) = {y ∈ X : y ≤ x}
Tome Y a imagem de f . Mostraremos que f é injetora, o que basta para provarmos
que é bijetora em Y .
Suponha que f (x) = f (y). Pela reflexividade, como x ≤ x e y ≤ y, temos
x ∈ f (x) e y ∈ f (y). Como f (x) e f (y) são iguais, temos x ∈ f (y) e y ∈ f (x). Pela
definição de f isso nos dá x ≤ y e y ≤ x, que, pela anti-simetria, implica que x = y,
provando que f é bijetora em Y .
Agora resta-nos mostrar que x ≤ y se, e somente se, f (x) ⊂ f (y). Suponha que
x ≤ y. Seja z ∈ f (x). Temos que z ≤ x e, por transitividade, z ≤ y. Logo, z ∈ f (y).
Reciprocamente, suponha que f (x) ⊂ f (y). Como x ∈ f (x), temos x ∈ f (y), o que
significa que x ≤ y.
Listamos agora uma série de definições usadas para conjuntos ordenados.
Definição 13.4 Seja ≤ uma relação de ordem em um conjunto X. Para todo x ∈ X
e todo S ⊂ X não-vazio dizemos que
• x é limitante superior de S se y ≤ x, para todo y ∈ S;
• x é limitante inferior de S se x ≤ y, para todo y ∈ S;
• S é limitado superiormente se possui um limitante superior;
• S é limitado inferiormente se possui um limitante inferior;
• x é máximo de S se x ∈ S e y ≤ x, para todo y ∈ S;
• x é mı́nimo de S se x ∈ S e x ≤ y, para todo y ∈ S;
• x é maximal se não existe y ∈ X tal que x 6= y e x < y;
• x é minimal se não existe y ∈ X tal que x 6= z e y < x;
• x é supremo de S se x é o mı́nimo dos limitantes superior de S;
• x é ı́nfimo de S se x é o máximo dos limitantes inferior de S;
• S é uma cadeia se, para todos y, z ∈ S temos y ≤ z ou z ≤ y.
Essas definições dependem da ordem. Portanto, quando não estiver claro no
contexto qual é a ordem que estamos considerando sobre o conjunto X, devemos
mencionar a qual ordem nos referimos. Ou seja, para ser mais preciso devemos
escrever x é o máximo de X em relação a ≤. Eventualmente, também usamos a
notação ≤-máximo, ≤-maximal etc.
Notemos – pela definição e pela antissimetria da relação de ordem – que nem
sempre um conjunto possui um elemento máximo, mas, se possuir, esse é único. O
mesmo vale para mı́nimo, supremo e ı́nfimo. Porém, podemos ter vários limitantes
superiores e inferiores de um conjunto e elementos maximais e minimais da ordem.
Agora podemos enunciar os principais tipos de ordem usados na matemática:
79
Definição 13.5 Dizemos que uma ordem ≤ sobre um conjunto X é uma(um):
• ordem total (ou ordem linear ) se, para todos x, y ∈ X temos x ≤ y ou y ≤ x;
• boa ordem se todo subconjunto não-vazio de X possui elemento mı́nimo;
• árvore se, para todo x ∈ X, o conjunto {y ∈ X : y ≤ x} é uma cadeia em X;
• reticulado se, para todos x, y ∈ X, o conjunto {x, y} possui supremo e ı́nfimo.
Aplicamos os termos acima também para o conjunto ordenado (X, ≤) e, por abuso
de notação, para o domı́nio X.
Uma ordem total tem esse nome porque todos os elementos do domı́nio podem
ser comparados. Também a chamamos de ordem linear porque podemos visualizar
todos os elementos da ordem como se estivessem numa mesma reta. As ordens usuais
nos números naturais, inteiros, racionais e reais são exemplos de ordens totais.
Nota-se que toda boa ordem também é uma ordem total, uma vez que o conjunto
{x, y} tem mı́nimo, o que nos dá x ≤ y ou y ≤ x.
Uma árvore é uma ordem que pode “bifurcar”, mas nunca “juntar”, como na copa
de uma árvore, em que o tronco se ramifica em galhos, que se ramificam em galhos
menores, mas os galhos nunca se reajuntam. Além das numerosas aplicações em
teoria dos conjuntos, as árvores são usadas em computação e em teoria dos jogos. Por
exemplo, as possı́veis sequências de jogadas a partir de uma posição numa partida de
xadrez formam uma árvore, que um programa de computador (ou o cérebro humano,
de uma maneira mais intuitiva) analisará para poder decidir o melhor lance.
Uma ordem total é uma árvore, já que todo o conjunto é uma cadeia e, portanto,
todos seus subconjuntos são cadeias.
Se considerarmos a ordem da inclusão em uma famı́lia de conjuntos fechada pelas
operações de união e intersecção, essa ordem será um reticulado, onde o ı́nfimo de
{x, y} é x ∩ y, e o supremo é x ∪ y. Esse tipo de ordem é particularmente interessante
nos estudos de álgebras de Boole. O reticulado é um pouco mais geral, pois temos as
operações de supremo e ı́nfimo (que correspondem às operações booleanas “e” e “ou”)
mas não precisamos do complemento (correspondente à operação booleana “não”).
Também é evidente que toda ordem total é um reticulado, já que o próprio x e o
próprio y serão um deles o ı́nfimo e o outro o supremo do conjunto {x, y}.
Por abuso de linguagem, se (X, ≤) é uma boa ordem dizemos que X é um conjunto
bem-ordenado. Obviamente, isso só faz sentido quando, no contexto, está claro qual é
a ordem ≤. Por exemplo, nos números naturais, sabemos que a ordem usual coincide
com a ordem da inclusão. Mostraremos, então, o seguinte teorema:
Teorema 13.6 (ω, ⊂) é uma boa-ordem.
Demonstração: Primeiro provaremos, por indução em n, que todo natural n é

bem-ordenado com a ordem da inclusão. O passo inicial n = 0 é trivial, já que
0 não contém sub-conjunto não-vazio. Supondo que n é bem-ordenado, considere
S um subconjunto não-vazio de n+ . Seja S 0 = S r {n}. Observe que S 0 ⊂ n. Se
S 0 = ∅, então S = {n}, que possui n como elemento mı́nimo. Se S 0 6= ∅, pela hipótese

indutiva existe m que é o mı́nimo de S 0 . Como m ∈ S 0 , temos que m ∈ n. Logo, pelo
Teorema 7.8, parte (c), m ⊂ n, provando que m é o mı́nimo também de S.
Seja agora S ⊂ ω não-vazio. Seja k ∈ S e n0 = k + . Temos k ∈ S ∩k + e, portanto,
S ∩ n0 6= ∅. Como n0 é bem-ordenado, seja m o mı́nimo de S ∩ n0 . Mostremos que
m é o mı́nimo de S. Seja n ∈ S. Pelo item (a), temos n ∈ n0 , n = n0 ou n0 ∈ n. No
primeiro caso, de n ∈ S ∩ n0 segue que m ⊂ n, pois é o mı́nimo de S ∩ n0 . No segundo
caso, como m ∈ n0 , por (b) temos que m ⊂ n0 e, portanto, m ⊂ n. No terceiro caso,
como m ∈ n0 e n0 ∈ n, pelo Teorema 7.8, parte (c), segue que m ⊂ n0 e n0 ⊂ n, de
onde concluı́mos que m ⊂ n, provando que (ω, ⊂) é bem-ordenado.

Conjuntos bem-ordenados nos permite fazer um tipo especial de indução e re-
cursão. Suponha que X é bem-ordenado e provamos que, para todo x ∈ X, se uma
determinada propriedade vale para todos os elementos menores que x, então essa
propriedade vale para x. Concluı́mos, então, que essa propriedade vale para todo
elemento de X. De fato, sejam (X, ≤) um conjunto bem-ordenado e P (x) uma pro-
priedade tal que, para todo x ∈ X, se vale P (y), para todo y ≤ x diferente de x,
então vale P (x). Suponha, por absurdo, que existe x0 ∈ X tal que não valha P (x0 ).
Considere Y = {x ∈ X : ¬P (x)}. Por hipótese, Y 6= ∅, pois x0 ∈ Y . Como X
é bem-ordenado, Y possui um mı́nimo (digamos, x1 ) em relação à ordem ≤. Isso
significa que todo elemento de X menor que x1 não pertence a Y e, portanto, satisfaz
a propriedade P . Logo, por hipótese, vale P (x1 ), contradizendo que x1 ∈ X.
Como sempre, onde podemos fazer provas por indução podemos fazer definições
por recursão. Em particular, se temos um conjunto bem-ordenado e queremos definir
uma função que tem como domı́nio esse conjunto, podemos definı́-la em cada elemento
x usando, recorrentemente, sua definição nos elementos menores que x.
Para formalizar esse argumento, anunciamos e provamos o próximo teorema, que
é mais uma versão do teorema da recursão. Desta vez, ela é transfinita, pois pode ser
aplicada a conjuntos arbitrariamente grandes, a partir de uma boa ordem (veremos
uma aplicação do axioma da escolha que mostra que todo conjunto pode ser bem-
ordenado, isto é, para todo X existe ≤ tal que (X, ≤) é bem-ordenado) e, a exemplo
do Teorema 12.1, utiliza o axioma da substituição para que não precisemos “ter
controle” sobre a imagem da função usada no passo indutivo.
Para o próximo teorema, usaremos a seguinte definição: se (X, ≤) é um conjunto
←
bem-ordenado e x ∈ X, denotamos por x o conjunto dos elementos de X menores
do que x, isto é, o conjunto {y ∈ X : (y ≤ x) ∧ (y 6= x)}.
Teorema 13.7 (recursão transfinita) Seja F (x, y) uma fórmula tal que ∀x∃!yF (x, y)
seja verdadeira. Seja (X, ≤) um conjunto bem-ordenado. Existe uma única função f
cujo domı́nio é X e que satisfaz, para todo x ∈ X,
←
F (f | x, f (x))
Demonstração: Considere G(x, f ) a seguinte fórmula:

← ←
(x ∈ X) ∧ (f é função) ∧ (dom(f ) = x ∪{x}) ∧ ∀y(y ≤ x → F (f | y , f (y)))
81
Afirmação 1: Para todo x ∈ X, se valem G(x, f ) e G(x, g) então

f = g.
Provemos a afirmação 1 por indução em x. Suponha que a afirmação vale para

←
todo y ∈ x. Se G(x, f ) e G(x, g) são verdadeiras, está claro, pela definição de G(x, f ),
← ←
que G(y, f |( y ∪{y})) e G(y, g|( y ∪{y})) também valem, para todo y < x. Logo, pela
hipótese de indução, temos, para todo y < x.
← ←
f |( y ∪{y}) = g|( y ∪{y})
←
Em particular, f (y) = g(y), para todo y ∈ x.
Portanto, das hipóteses G(x, f ) e G(x, g) seguem que
← ←
F (f | x, f (x)) ∧ F (f | x, g(x)),
o que implica, pela hipótese sobre F (x, y), que f (x) = g(x), concluindo que f = g.
Afirmação 2: Para todos x, y ∈ X, se y ≤ x e valem G(x, f ) e

←
G(y, g), então f |( y ∪{y}) = g.
←
Nessas hipóteses, está claro, pela definição de G, que G(y, f |( x ∪{x}) é verda-
←
deira. Portanto, da afirmação 1 segue que f |( x ∪{x}) = g.
Afirmação 3: Para todo x ∈ X existe f tal que G(x, f ).
Suponha, por indução transfinita, que a afirmação seja verdadeira para todo
y < x. Considere o conjunto
←
Z = {g : ∃y(y ∈ x ∧G(y, g))}
A existência do conjunto Z é assegurada pelo axioma da substituição, lembrando que

a afirmação 1 nos grante que G satisfaz as hipóteses do axioma da substituição.
S ←
As afirmações 2 e 3 provam que Z é uma função cujo domı́nio S é x.
Pela condição sobre F , sabemos que existe um único t tal que F ( Z, t) é verda-
deira.
Defina [
f = ( Z) ∪ {(x, t)}
← S
Como f | x= Z e t = f (x), está claro que
←
F (f | x, f (x))
←
Pela definição de Z e pela afirmação 2 temos que G(y, f | y ∪{y}) vale, para todo
←
y ∈ x.
←
Em particular, para todo y ∈ x temos
←
F (f | y , f (y))
o que conclui a afirmação.

Se (X, ≤) possui máximo, então as afirmações 1 e 3 já provam o teorema, pois
basta tomar f a única função tal que G(x, f ) é verdadeira, onde x é o máximo de
X. Se não possui máximo, temos duas maneiras de encerrar a prova. A primeira,
repetimos o argumento usado na afirmação 3, usando o axioma da substituição para
definir como f a união de todas as funções g que satisfazem G(x, g), para algum
x ∈ X.
Outra maneira é acrescentarmos um máximo ao conjunto (X, ≤), obtendo um
conjunto bem-ordenado (X 0 , ≤0 ) onde X 0 = X ∪ {x0 } e x ≤0 x0 para todo x ∈ X.
Como mostramos que existe uma única f tal que G(x0 , f ) vale, é fácil ver que f |X
satisfaz as condições do teorema

Exercı́cios
1. Considere X o conjunto das funções f tais que dom(f ) ∈ ω e im(f ) ⊂ ω. Prove
que (X, ⊂) é uma árvore.
2. Considere X o conjunto dos subconjuntos finitos de ω. Isto é,
X = {S ⊂ ω : ∃n∃f ((n ∈ ω) ∧ (f é função injetora de S em n))}
Prove que (X, ⊂) é um reticulado. Assuma, sem provar, que união e intersecção de
conjuntos finitos são finitas.
3. Considere X o conjunto dos subconjuntos finitos ou cofinitos de ω. Isto é,
X = {S ⊂ ω : ∃n∃f ((n ∈ ω)∧((f é função injetora)∧(dom(f ) ∈ {S, ωrS})∧(im(f ) ⊂ n))}
Prove que (X, ⊂) é um reticulado.
4. Seja C uma cadeia no conjunto ordenado (X, ⊂) do exercı́cio 2. Prove que C é

bem-ordenado. O mesmo vale para a ordem do exercı́cio 3? Justifique.
5. Dê exemplos ou prove que não existe:
(a) Uma ordem total que não é uma boa ordem;
(b) Uma árvore que não é uma ordem total;
(c) Um reticulado que não é árvore;
(d) Uma árvore que é um reticulado mas não é totalmente ordenado.

Capı́tulo 14
Axioma da escolha
O axioma da escolha enuncia que, dada uma famı́lia de conjuntos não-vazios, existe
uma função que a cada conjunto pertencente a essa famı́lia seleciona um elemento
desse conjunto.
Axioma 10 (daSescolha) Para todo conjunto x de conjuntos não-vazios existe uma

função f : x −→ x tal que, para todo y ∈ x, f (y) ∈ y.
∀x(∅ ∈
/ x → ∃f ((f é função) ∧ (dom(f ) = x) ∧ ∀y(y ∈ x → f (y) ∈ y)))
A função f garantida pelo axioma da escolha é chamada de função de escolha.

Esse é certamente o axioma mais controverso da teoria dos conjuntos, rejeitado
por algumas correntes filosóficas da matemática, como os construtivistas. Por isso
alguns matemáticos preferem tomar um cuidado especial quando utilizam o axioma
da escolha, evitando-o a todo custo, referindo-se por ZF ao sistema de axiomas de
Zermelo e Fraenkel sem o axioma da escolha e por ZFC ao sistema ZF com o axioma
da escolha (a letra C vem de choice, da sigla em inglês).
Para entendermos melhor por que esse axioma é tão controverso, precisamos
entender para quais construções ele é necessário. Ou seja, precisamos entender para
quais conjuntos x a existência da função de escolha depende do axioma da escolha e
para quais podemos prová-la em ZF.
Primeiro notemos que, se x for finito (isto é, se existe uma função bijetora entre x
e um número natural) então a existência de uma função de escolha é garantida pelos
outros axiomas. Por exemplo: se x é o conjunto {a, b, c}, sendo seus três elementos
não-vazios, sabemos que existem a0 ∈ a, b0 ∈ b e c0 ∈ c. Usando sucessivas vezes o
axioma do par, da união, das partes e da separação (como fizemos quando mostramos
a existência de pares ordenados) construı́mos o conjunto {(a, a0 ), (b, b0 ), (c, co )}, que
é precisamente uma função de escolha no conjunto x.
Formalizando o argumento geral, temos o seguinte: provaremos por indução em
n que, dados x um conjunto de conjuntos não-vazios, n um número natural e s
uma função bijetora de n em x, existe uma função de escolha em x. Se n = 0, x
necessariamente será o conjunto vazio e, portanto, o conjunto vazio é uma função de
escolha em x (verifiquem que, de acordo com a definição dada neste livro, ∅ é uma
função de ∅ em ∅). Suponha que a hipótese de indução é verdadeira para algum
83
84 CAPÍTULO 14. AXIOMA DA ESCOLHA
natural n, e provaremos para n+ . Sejam x um conjunto de conjuntos não-vazios e s

uma função bijetora de n+ em x. Como n+ = n ∪ {n}, defina t a restrição de s a n,
isto é, t = {(m, s(m) : m ∈ n}. Defina y = im(t). Claramente
S t é uma bijeção de n
em y. Logo, pela hipótese indutiva, existe g : y −→ y tal que g(z) ∈ z, para todo
z ∈ y. Como s(n) 6= ∅, pois s(n) ∈ x, existe a ∈ s(n). Defina f = g ∪ {(s(n), a)}.
Como x = y ∪ {s(n)} é fácil verificar que f é uma função de escolha em x.
Ou seja, se substituirmos “para todo x” pela expressão “para todo x finito” no
enunciado do axioma da escolha, teremos um teorema que é válido em ZF.
Outro caso bem significativo em que não precisamos lançar mão do axioma da
escolha para provarmos a existência de uma função de escolha é quando existe uma
fórmula que desempenha esse papel de selecionar exatamente um elemento de cada
conjunto que pertence a x.
De fato, suponha que existe uma fórmula P (y, z) tal que, para todo y ∈ x, existe
um único z em y para o qual P (y, z) é verdadeira. Isto é, suponha que existe uma
fórmula P para a qual conseguimos provar que
∀y(y ∈ x → ∃!z(z ∈ y ∧ P )),
onde o sı́mbolo ∃! é definido da seguinte forma:
∃!zA ≡ ∃z(A ∧ ∀w(Aw

z → (z = w)))
Nesse caso, provamos a existência da função de escolha usando o axioma da separação:

[
f = {(y, z) ∈ x × x : (z ∈ y) ∧ P }
Por exemplo, suponha que x é um conjunto formado por subconjuntos não-vazios

de ω. Vimos em um exercı́cio do capı́tulo anterior que ω é bem-ordenado pela relação
de inclusão (que coincide com a relação de ordem usual dos números naturais), o que
significa que cada subconjunto não-vazio de ω possui um único elemento que está
contido em todos os demais (isto é, o mı́nimo desse subconjunto). Logo, podemos
definir a seguinte função de escolha
f = {(y, n) ∈ x × ω : (n ∈ y) ∧ ∀m(m ∈ y → n ⊂ m)}
O fato de (ω, ⊂) ser bem ordenado garante que f é uma função cujo domı́nio é
x, e é claramente uma função de escolha.
Vimos, portanto, dois casos particulares do axioma da escolha que são teoremas
de ZF. Então surge a pergunta: quando precisamos do axioma da escolha para provar
a existência de uma função de escolha em x? A resposta é: quando x é infinito e
não existe uma maneira explı́cita e bem determinada de escolher um único elemento
de cada elemento de x.
Bertrand Russell forneceu uma comparação bastante interessante e curiosa para
explicar o axioma da escolha: para escolhermos uma meia de cada par de meias,
dentre uma coleção infinita de pares de meias, precisamos usar o axioma da escolha;
se forem sapatos, não precisamos. Isso porque, no caso dos sapatos, podemos escolher
o pé direito de cada par, e, no caso das meias, os pés de cada par são indistinguı́veis.
85
Portanto, os objetos matemáticos cuja existências dependem do axioma da es-

colha não podem ser construı́dos explicitamente, de forma que possamos determinar
precisamente quais são os seus elementos. Quando dizemos que há uma função de
escolha em um conjunto x e, para isso, foi essencial o uso do axioma da escolha,
isso significa que há, na verdade, uma infinidade de possı́veis funções de escolha,
e que não podemos precisar qual função nós estamos considerando. Tais objetos
matemáticos são ditos não-construtı́veis e, para alguns matemáticos, nada vale pro-
varmos a existência de um objeto que não conseguimos explicar exatamente quem
ele é.
Porém é certo que, desde o inı́cio, como mostramos na introdução, a teoria dos
conjuntos não agradou os construtivistas. A prova de Cantor de que existem muitos
números transcendentes independe do axioma da escolha e, mesmo assim, é altamente
não-construtiva. Ainda assim, há muitos que aceitam ZF como algo suficientemente
construtivo, mas recusam trabalhar em ZFC.
Um dos resultados dependentes do axioma da escolha e que mais agravaram
a polêmica em torno dele é o paradoxo de Banach-Tarski: existe uma forma de
particionar uma bola no espaço em uma quantidade finita de partes e remontar essas
partes para formar duas bolas disjuntas, idênticas à primeira. Para muitos, esse
resultado apenas prova que não existe uma medida universal finitamente aditiva em
R3 . Para outros, no entanto, essa é uma evidência de que as aplicações do axioma
da escolha são inúteis, sem nenhuma conexão com a realidade.
Por outro lado, muitos resultados importantes da matemática dependem do axi-
oma da escolha, como a existência de uma base em qualquer espaço vetorial e o
Teorema de Hahn-Banach. Mas a maior aplicação do axioma da escolha é na teoria
dos cardinais. O fato de podermos atribuir a qualquer conjunto um “tamanho” – ao
qual chamamos de cardinalidade – depende do axioma da escolha.
Feita essa pequena discussão filosófica sobre o axioma da escolha, enunciamos,
agora, suas principais aplicações. Começamos mostrando a forma equivalente ao
axioma da escolha mais utilizada na matemática.
Teorema 14.1 (Lema de Zorn) Se (X, ≤) é uma ordem parcial em que toda ca-
deia admite limitante superior, então (X, ≤) admite um elemento maximal.
Demonstração: Primeiro vamos discutir um pouco a ideia intuitiva desse teorema

(que, por motivos históricos, recebeu essa alcunha de lema). Suponha que (X leq)
não admita um elemento maximal. Notemos que a hipótese do teorema implica que
X é não-vazio (por quê?). Tomamos, então, algum x0 ∈ X. Como x0 não é maximal,
encontramos algum x1 estritamente maior que x0 . Da mesma forma podemos encon-
trar algum x2 maior que x1 e assim por diante (aqui podemos imaginar que o axioma
da escolha é necessário para tomarmos sempre um elemento maior do que outro).
Após chegarmos em infinitos elementos de X através desse processo, notamos que
esses formam uma cadeia, e, então, pela hipótese, tomamos y um limitante superior
dessa cadeia, e iniciamos novamente o processo. A ideia intuitiva é que, em algum
momento, esse processo tem que parar, chegando num elemento maximal. Como,
infelizmente, não tem como formalizarmos essa ideia, não nos resta outra solução a
não ser procurar uma demonstração rigorosa, que é árdua, trabalhosa e pouco intui-
tiva. A discussão precedente só serve para dar ao leitor uma vaga noção sobre o que
significa o lema de Zorn e por quê ele vale.
Vamos à demonstração formal, que é adaptada do livro de Halmos, que, por sua
vez, atribui a Zermelo a criação dessa prova.
Começamos definindo X o conjunto das cadeias em X, ordenado pela inclusão.
Mostraremos que X tem um elemento maximal, e isso será suficiente para mostrar
que X tem um elemento maximal, conforme a seguinte afirmação:
Afirmação 1: Se X possui um elemento maximal então X possui um

elemento maximal.
De fato, suponha que A é um elemento maximal de X. Pela hipótese sobre X,

seja x ∈ X um limitante superior de A, ou seja, a ≤ x para todo a ∈ A. Temos
que x ∈ A pois, caso contrário, terı́amos que A ∪ {x} seria uma cadeia que contém
propriamente A, contradizendo a maximalidade de A. Temos que x é maximal em
X, pois, se existisse y ∈ X tal que x ≤ y e x 6= y terı́amos novamente que A ∪ {y}
seria uma cadeia maior que A. Isso conclui a prova da afirmação.
S
Afirmação 2: Se C é uma cadeia em X então C ∈ X.
S
Como C é claramente
S um subconjunto de X, para mostrarmos a afirmação
S
basta provarmos que C é uma cadeia em X. Sejam a e b pertencentes a C.
Sejam A, B ∈ C tais que a ∈ A e b ∈ B. Como C é uma cadeia, temos que A ⊂ B
ou B ⊂ A, o que significa que a, b ∈ A ou a, b ∈ B. Como C ⊂ X, tanto A quanto B
são cadeias, o que significa que a ≤ b ou b ≤ a.
Seja f uma função de escolha em P(X)r{∅}. Definimos uma função s : X −→ X
como

A ∪ {f ({x ∈ X r A : A ∪ {x} ∈ X})} , se A não é maximal;
s(A) =
A , se A é maximal;
A função s faz o seguinte: se A é uma cadeia não-maximal, s estende A acrescentando-

lhe um único elemento. Se A é uma cadeia maximal, s(A) = A. Se A é uma cadeia
não-maximal, existirá x ∈ / A tal que A ∪ {x} é uma cadeia, pois o subconjunto de
uma cadeia é uma cadeia. Reparem a necessidade de usar o axioma da escolha para
podermos escolher um elemento para estender a cadeia A.
Com essa definição e pela afirmação 1, nossa tarefa de demonstrar o lema de Zorn
se reduz, agora, à tarefa de mostrar que existe A ∈ X tal que s(A) = A.
Antes de prosseguirmos a demonstração, precisamos de mais algumas definições.
Dizemos que um subconjunto T de X é uma torre se satisfaz as seguintes condições:
• ∅ ∈ T;
• se A ∈ T então s(A) ∈ T ;
87
S
• se C é uma cadeia em (T, ⊂) então C ∈ T.
Existe pelo menos uma torre, pois claramente X é uma. Logo, podemos introduzir
a seguinte definição: \
X 0 = {T ⊂ X : T é uma torre}.
Afirmação 3: X 0 é uma torre e está contida em qualquer outra torre.
Deixamos a cargo do leitor provar essa afirmação, que é bem semelhante à de-
monstração de que ω é um conjunto indutivo. Pela minimalidade de X 0 iremos
fazer algumas provas utilizando uma espécie de indução, onde s desempenha o papel
de sucessor. Na verdade, pela terceira condição sobre torres, essa indução mais se
aproxima da indução transfinita, que veremos posteriormente.
S que X 0 é uma cadeia em X. Feito isso, não

Nosso próximo objetivo será mostrar
teremos dificuldades em mostrar que X 0 é maximal em X, isto é, é uma cadeia em
X que não está contida propriamente em nenhuma outra cadeia. Pela afirmação 1
isso será suficiente para provarmos o lema de Zorn.
Dizemos que um elemento C de X 0 é comparável se, para todo A ∈ X 0 , temos
A ⊂ C ou C ⊂ A. Mostrar que X 0 é uma cadeia é o mesmo que mostrar que todo
elemento de X 0 é comparável.
Introduzimos agora mais uma definição provisória (a última!): uma função g :
X 0 −→ P(X 0 ) dada por
g(C) = {A ∈ X 0 : (A ⊂ C) ∨ (s(C) ⊂ A)}
Se o leitor teve paciência de acompanhar até aqui, anime-se, pois a demonstração

está chegando no fim. Faltam ainda mais algumas afirmações.
Afirmação 4: Se C é comparável então g(C) = X 0 .
A prova dessa afirmação usa uma espécie de indução, como dissemos anterior-
mente. Precisamos apenas mostrar que g(C) é uma torre e seguirá da afirmação 3
que g(C) = X 0 .
Está claro que ∅ ∈ g(C), pois ∅ ⊂ C. Seja S uma cadeia em g(C). Temos duas
possibilidades: ou todo A ∈ S está contido em S C ou existe pelo menos
S um A ∈ S
tal que s(C) ⊂ A. No primeiro
S caso, temos SS ⊂ C e, portanto,
S S ∈ g(C). No
segundo caso, como A ⊂ S, temos s(C) ⊂ S e, novamente, S ∈ g(C). Para
mostrar que g(C) é torre só falta mostrar que, se A ∈ s(C) então s(A) ∈ g(C).
Seja A ∈ g(C). Temos três casos. Ou A = C, ou A está contido propriamente
em C ou s(C) ⊂ A.
No primeiro caso, temos s(A) = s(C). Em particular, s(C) ⊂ s(A), o que prova
que s(A) ∈ g(C).
No segundo caso, supomos que A está contido propriamente em C. Como C
é comparável, temos C ⊂ s(A) ou s(A) ⊂ C. Se s(A) ⊂ C temos s(A) ∈ g(C).
Assumimos, então, que C ⊂ s(A). Se C = s(A) caı́mos no caso s(A) ⊂ C. Se
C 6= s(A) existe x ∈ s(A) r C. Mas, pela hipótese de A estar contido propriamente
em C, existe y ∈ C r A. Portanto, x e y são elementos distintos (pois um pertence a

C e outro não) de s(A) r A, contradizendo que s(A) tem, no máximo, um elemento
que não pertence a A.
No terceiro caso, se s(C) ⊂ A, como A ⊂ s(A) temos s(C) ⊂ s(A), o que nos dá
s(A) ∈ g(C). Concluı́mos, assim, a prova da afirmação.
Afirmação 5: X 0 é uma cadeia em X.
Vamos provar “por indução” que todo elemento de X 0 é comparável. Ou seja,

mostraremos que o conjunto dos elementos comparáveis de X 0 é uma torre e, por-
tanto, coincide com todo o conjunto X 0 .
Como ∅ ⊂ A, para todo A, temos ∅ é comparável.SSeja S uma cadeia em X 0
formada de elementos comparáveis. Mostraremos que S é comparável.S De fato,
seja A ∈ X 0 . Se existe C ∈ S tal que A ⊂ C, temos, em particular, A ⊂ S. Caso
S todo elemento de S é comparável, temos C ⊂ A, para todo C ∈ S,
contrário, como
o que nos dá S ⊂ A.
Falta mostrar que, se C é comparável, s(C) é comparável. Seja A ∈ X 0 . Pela
afirmação 4 temos que A ∈ g(C). Ou seja, A ⊂ C ou s(C) ⊂ A. Como C ⊂ s(C),
temos A ⊂ s(C) ou s(C) ⊂ A, provando que s(C) é comparável.
Isso conclui que o conjunto dos elementos de X 0 é uma torre, provando a afirmação.
S
Afirmação 6: X 0 é maximal em X.
S
Seja C = X 0 . Provemos que s(C) = C. Como, pela afirmação 5, X 0 é uma
cadeia, a afirmação 3 – que diz que X 0 é uma torre – nos garante que C ∈S X 0.
Portanto, novamente pela afirmação 3, s(C) ∈ X 0 . Isso implica que s(C) ⊂ X 0 .
Ou seja, s(C) ⊂ C. Como C ⊂ s(C) concluı́mos que s(C) = C, provando a afirmação.
Portanto X tem um elemento maximal e, pela afirmação 1, X também possui,
provando o lema de Zorn.

Como uma consequência simples do lema de Zorn, mostramos que todo conjunto
pode ser bem-ordenado. Embora a prova detalhada desse resultado seja um pouco
longa, são argumentos bem comuns e corriqueiros, sem tantos “truques” como na
demonstração do lema de Zorn.
Teorema 14.2 (Princı́pio da Boa Ordem) Para todo conjunto X existe uma relação
≤ tal que (X, ≤) é uma boa ordem.
Demonstração: A demonstração do princı́pio da boa ordem é uma aplicação stan-

dard do lema de Zorn. Diversos resultados clássicos da matemática – como a existência
de base em espaços vetoriais e o teorema de Hahn-Banach – utilizam argumentos bem
parecidos. A ideia é simples: se quisermos mostrar que uma propriedade vale para
um conjunto X, consideramos todos a ordem parcial constituı́da dos subconjuntos
de X que satisfazem tal propriedade (no caso, ser bem-ordenado). Verificamos que a
hipótese do lema de Zorn é atendida e tomamos Y um elemento maximal dessa ordem
89
parcial. Se Y não for todo o conjunto X, mostramos que esse pode ser estendido um
pouco mais, contradizendo sua maximalidade.
Quando a propriedade que queremos mostrar para X envolve alguma estrutura
– neste caso, uma ordem – é natural que, nessa ordem parcial que criamos, conside-
remos algo a mais que os subconjuntos de Y . No caso deste teorema, o domı́nio da
ordem parcial é formada pelos conjuntos bem-ordenados (Y, ≤) tais que Y ⊂ X, e
na definição da ordem, precisamos respeitar a compatibilidade entre esses conjuntos
ordenados.
Vamos à demonstração.
Definimos uma ordem parcial (X, ) da seguinte forma: X é o conjunto de todos
os conjuntos bem-ordenados (Y, ≤) tais que Y ⊂ X, e (Y1 , ≤1 ) (Y2 , ≤2 ) se, e
somente se, as seguintes condições são satisfeitas:
1. Y1 ⊂ Y2 ;
2. x ≤1 y se, e somente se, x ≤2 y, para todos x, y ∈ Y1 ;
3. se x ∈ Y1 e y ∈ Y2 r Y1 então x ≤ y.
Fica como exercı́co ao leitor mostrar que (X, ) é um conjunto ordenado. Pro-
varemos que ele satisfaz a hipótese do lema de Zorn.
Seja S uma cadeia em X. Definimos
[
Y = {Y 0 : ∃ ≤0 : (Y 0 , ≤0 ) ∈ S}
e [
≤= {≤0 : ∃Y 0 : (Y 0 , ≤0 ) ∈ S}
Afirmação: (Y, ≤) ∈ X e é um limitante superior de S.
Para provar a afirmação, primeiro verifiquemos que ≤ é uma boa ordem sobre X.
Como S é uma cadeia, dados x, y, z ∈ Y existe (Y 0 , ≤0 ) ∈ S tal que x, y, z ∈ Y 0 e,
para todos u, v ∈ Y 0 , temo u ≤ v se, e somente se, u ≤0 v. Portanto, as propriedades
de ordem são satisfeitas para ≤, pois são satisfeitas para ≤0 . Portanto, ≤ é uma
ordem.
Para verificar que ≤ é uma boa ordem, considere Z ⊂ Y um conjunto não-vazio.
Portanto, existe (Y1 , ≤1 ) ∈ S tal que Z ∩ Y1 6= ∅. Por hipótese, existe z ∈ Z ∩ Y1 que
é mı́nimo, em relação à ordem ≤1 . Vamos mostrar que também é o mı́nimo de Z, em
relação a ≤.
Suponhamos, por absurdo, que existe w ∈ Z tal que w 6= z e w ≤ z. Como z é
mı́nimo de Z ∩ Y1 , temos que w ∈ / Y1 Tome (Y2 , ≤2 ) tal que w ∈ Y2 . Como S é uma
cadeia, vale (Y2 , ≤2 ) (Y1 , ≤1 ) ou (Y1 , ≤1 ) (Y2 , ≤2 ). Mas o primeiro caso não é
possı́vel, pois w ∈ Y2 r Y1 .
Temos, então, (Y1 , ≤1 ) (Y2 , ≤2 ). Da condição 3 da ordem segue que z ≤2 w.
Porém, como w ≤ z, da definição de ≤, do fato de S ser uma cadeia e da condição 2
da ordem seguem que w ≤2 z (deixamos os detalhes dessa passagem como exercı́cio
ao leitor). Portanto, a antissimetria de ≤2 , nos dá que w = z, contradizendo nossa

hipótese e provando a afirmação.
Agora, aplicamos o lema de Zorn para obter (Y, ≤) maximal em X. Tudo que
precisamos para concluir o teorema é provar que Y = X. De fato, suponha que
Y 6= X. Tome x ∈ X r Y . Considere Y 0 = Y ∪ {x} e defina uma ordem ≤0 em Y 0
acrescentando a condição y ≤ x, para todo y ∈ Y . Isto é, ≤0 =≤ ∪{(y, x) : y ∈ Y }.
Claramente (Y 0 , ≤0 ) é um conjunto bem-ordenado, diferente de (Y, ≤) e tal que (Y ≤
) (Y 0 , ≤0 ), contradizendo a maximalidade de (Y, ≤).

Os dois teorema anteriores são, na verdade, formas equivalentes ao axioma da
escolha, como mostra o seguinte resultado:
Teorema 14.3 Em ZF, são equivalentes:
(a) Axioma da escolha;
(b) Lema de Zorn;
(c) Princı́pio da boa ordem.
Demonstração: Já provamos que (a) implica (b) e que (b) implica (c), lembrando
que a demonstração do princı́pio da boa ordem não utiliza diretamente o axioma da
escolha, mas apenas o lema de Zorn. Resta mostrar que (c) implica (a), cuja ideia
da demonstração já foi discutida no inı́cio deste capı́tulo.
Seja X um conjunto de conjuntos não-vazios. S Aplicando o princı́pio da boa
ordem, considere ≤ uma boa ordem no conjunto X. Definiremos uma função de
escolha que a cada elemento x de X associa o mı́nimo de x, isto é:
[ [
f = {(x, y) ∈ X × X : (y ∈ x) ∧ ∀z(z ∈ X → y ≤ z}
PelaSpropriedade de boa ordem e pelo fato de ∅ ∈ / X, para todo x ∈ X existe
y ∈ x tal que (x, y) ∈ f . A unicidade do elemento mı́nimo, como já foi discutido
anteriormente, segue da antissimetria da ordem (se y e z fossem “dois mı́nimos”,
terı́amos y ≤ z e z ≤ y, o que implica que y = z).
Portanto f é uma função, e é justamente uma função de escolha em X.

Exercı́cios
1. Discuta a seguinte afirmação: sempre que a existência de uma função de escolha
sobre um conjunto vale em ZFC mas não é assegurada em ZF, temos, em ZFC, mais
de uma função de escolha sobre esse conjunto.
2. Seja f uma função de domı́nio A e imagem B. Prove que existe uma função g
injetora de domı́nio B tal que f ◦ g(b) = b, para todo b ∈ B. Discuta o uso do axioma
da escolha nessa demonstração. Se A for o conjunto ω, é necessário o uso do axioma
da escolha para provar esse resultado?
91
3. Prove que todo espaço vetorial sobre R possui uma base (algébrica).
4. Prove em ZF (sem assumir o axioma da escolha) que ω × 2 e ω × ω podem ser

bem-ordenados.
Capı́tulo 15
Conjuntos equipotentes
Este capı́tulo aborda o assunto discutido na introdução, que deu origem a toda a
teoria dos conjuntos: a comparação entre conjuntos infinitos pela “quantidade” de
elementos. Começamos a falar quando dois conjuntos são “iguais”, em termos de
tamanho. No próximo capı́tulo discutiremos o que significa um conjunto ser “menor”
do que outro.
Definição 15.1 Dizemos que dois conjuntos X e Y são equipotentes se existe uma
função bijetora de X em Y . Usamos a notação X ≈ Y para denotar que X e Y são
equipotentes.
Está claro que X ≈ X e que X ≈ Y se, e somente se, Y ≈ X. Também é

fácil verificar (pois a composta de funções bijetoras é bijetora) que X ≈ Y e Y ≈ Z
implica X ≈ Z. Ou seja, ≈ é uma espécie de relação de equivalência sobre a classe
de todos os conjuntos. É claro que, como não existe conjunto de todos os conjuntos,
não podemos considerar ≈ como uma relação (a menos quando o restringimos a uma
famı́lia particular de conjuntos), mas, sim, como um sı́mbolo relacional binário que
adicionamos à linguagem, que satisfaz as propriedades de uma relação de equivalência
(reflexividade, simetria e transitividade).
Definição 15.2 Dizemos que um conjunto é finito se é equipotente a algum número

natural, e infinito se não é finito. Dizemos que um conjunto X é enumerável se é
finito ou equipotente a ω, e não-enumerável se é infinito e não equipotente a ω.
O próximo teorema nos oferece outras três definições alternativas para conjuntos
finitos (e, consequentemente, para conjuntos infinitos).
Teorema 15.3 Para um conjunto X, são equivalentes:

(a) X é infinito;
(b) Não existem n ∈ ω e uma função de domı́nio n e imagem X;
(c) Existe uma função injetora de domı́nio ω e imagem contida em X;
(d) X é equipotente a um subconjunto próprio de X.
93
94 CAPÍTULO 15. CONJUNTOS EQUIPOTENTES
Demonstração: Provaremos as implicações circularmente: (a) implica (b), (b) im-

plica (c), (c) implica (d) e, finalmente, (d) implica (a). Usaremos o axioma da escolha
na parte (b) implica (c).
(a) ⇒ (b) Provaremos pela contrapositiva. Isto é, assumimos que existem n ∈ ω
e uma função f : n −→ X sobrejetora. Mostraremos que X é finito. Isto é, existem
m ∈ ω e uma função g : m −→ X sobrejetora.
Antes, provaremos uma afirmação:
Afirmação 1: Se n ∈ ω e S ⊂ n, então S é finito.
Provaremos a afirmação por indução em n. Seja P (n) a fórmula “todo subconjunto

de n é finito”. Por argumentos de vacuidade, o conjunto vazio é uma função bijetora
no conjunto vazio (verifique). Logo, vale P (0), já que 0 é o único subconjunto de 0.
Supondo que vale P (n) mostraremos P (n+ ).
Seja S ⊂ n+ . Consideremos dois casos. Se n ∈ / S, então S ⊂ n e, pela hipótese
de indução, S é finito. Se n ∈ S, considere S = S r {n}. Temos que S 0 ⊂ n e,
0
por hipótese indutiva, S 0 é finito. Sejam m ∈ ω e f : m → S 0 uma função bijetora.

Claramente, f ∪{(m, n)} é uma função bijetora de m+ em S, provando que S é finito.
Provamos, assim, que vale P (n+ ) e que, por indução, vale P (n), para todo n ∈ ω.
Agora usaremos a afirmação para provarmos a primeira parte do teorema. Sejam
n ∈ ω e f : n −→ X sobrejetora. Para cada x ∈ X definimos
f −1 [x] = {k ∈ n : f (k) = x}.
Considere
S = {k ∈ n : ∃x(x ∈ X ∧ k = minf −1 [x])}
Ou seja, escolhemos, para cada x ∈ X, apenas um k ∈ ω tal que f (k) = n. Repare
que, neste ponto, não precisamos usar o axioma da escolha, pois já sabemos que ω é
bem-ordenado.
Seja f 0 = f |S a restrição de f a S. Isto é, f 0 é uma função de S em X definida
como f 0 (k) = f (k), para todo k ∈ S. É fácil verificar que f 0 é bijetora em relação a
X.
Pela afirmação, existem m ∈ ω e g : m −→ S bijetora. Tomemos h = f 0 ◦ g.
Como composição de funções injetoras é injetora, concluı́mos que h é uma bijeção
entre m e X, provando que X é finito.
(b) ⇒ (c) Suponha que vale (b), isto é, não existe uma função sobrejetora de
algum número natural em X. Provaremos a existência de uma função h : ω −→ X
injetora.
A ideia da construção é simples. Definimos h recursivamente. Se temos definida
a função h até n − 1, definimos h(n) como qualquer elemento de X que não está
na imagem de h restrito a {0, . . . , n − 1}. Tal elemento existe pela hipótese de que
nenhuma função de n em X é sobrejetora. Fazendo isso sucessivamente, definimos h
para todo número natural.
O problema é formalizar esse argumento, usando o teorema da recursão. Nas
aplicações que fizemos até agora, definimos f (n+ ) a partir de f (n). Nesse caso,
95
h(n+ ) depende não apenas de h(n), mas de h(i), para todo i ≤ n. Usaremos um
artifı́cio para adaptar o teorema da recursão simples para aquele que conhecemos
como recursão completa.
Também precisaremos usar o axioma da escolha para escolher um elemento de
X que não está na imagem de uma função parcial de ω em X. Começamos a de-
monstração desta parte do teorema fixando s uma função de escolha de domı́nio
P(X) r {∅}. Isto é, s é uma função definida em todos os subconjuntos não-vazios de
X que satisfaz s(A) ∈ A, para todo A ⊂ X não-vazio.
Seja Y o conjunto de todas as funções que têm como domı́nio um número natural
e imagem contida em X. Isto é
Y = {f ⊂ ω × X : (f é função) ∧ (dom(f ) ∈ ω)}
Tome y0 = ∅ e g : Y −→ Y a função definida por
g(f ) = f ∪ {(dom(f ), s(X r im(f ))}
Isto é, se f é uma função de domı́nio n, g(f ) é uma função f 0 de domı́nio n+ definida
da seguinte forma: f 0 (k) = f (k), para k ∈ n, e f 0 (n) = s(X r im(f )). Lembre-se
de que X r im(f ) é não-vazio pela hipótese, que garante que f não é sobrejetora em
relação a X, e s(X r im(f )) é um elemento de X r im(f ), garantindo que f 0 (n) não
pertence à imagem de f .
Pelo teorema da recursão, existe uma função F : ω −→ Y tal que F (0) = y0 e
F (n+ ) = g(F (n)).
Ou seja, cada F (n) é um “pedaço” da função h, que queremos definir, restrita a
n. Definimos [
h= im(F )
Para ficar mais clara a definição de h, uma outra definição equivalente a essa seria:
h é uma função de ω em X tal que h(n) = f (n), tomando f = F (n+ ).
A função h é injetora. De fato, se n 6= m, podemos assumir, sem perda de
generalidade, que m ∈ n. Sejam f1 = F (m+ ) e f2 = F (n+ ). É fácil verificar, por
indução, que F (m+ ) ⊂ F (n). Como, pela construção, f2 (n) ∈ / imF (n), temos que
f1 (m) 6= f2 (n). Logo, h(m) 6= h(n).
(c) ⇒ (d) Suponha que existe uma função f : ω −→ X injetora. Provaremos que
existem Y ⊂ X diferente de X e g : X −→ Y bijetora. Para isso, basta provarmos
que existe g : X −→ X injetora e não sobrejetora, e tomamos Y a imagem de g.
Defina g : X −→ X do seguinte modo: g(x) = x, quando x ∈ / im(f ) e g(f (n)) =
+
f (n ). Formalmente, definimos
/ im(f )} ∪ {(f (n), f (n+ )) ∈ X × X : n ∈ ω}

g = {(x, x) ∈ X × X : x ∈
Provemos que g é uma função, é injetora, e não sobrejetora, em relação a X.

Sejam (x, y) e (x, z) elementos de g. Se x ∈ / im(f ), então ambos y e z são iguais
a x, pela definição de g. Se x ∈ im(f ), de (x, y) ∈ g segue que existe n ∈ ω tal que
x = f (n) e y = f (n+ ), e de (x, z) ∈ g segue que existe m ∈ ω tal que x = f (m) e
z = f (m+ ). Como f (n) e f (m) são ambos iguais a x, da injetividade em f segue que
m = n e, portanto, y = z, pois ambos são iguais a f (n). Provamos, assim, que g é

uma função.
Mostremos, agora, que g é injetora. Sejam (x, z) e (y, z) elementos de g, e mos-
remos que x = y. Analisemos três casos. Se ambos x e y não pertencem a im(f ),
pela definição de g temos z = x e z = y, de onde concluı́mos que x = y. Se am-
bos x e y pertencem a im(f ), existem números naturais n e m tais que f (n) = x e
f (m) = y. Pela definição de g, temos que z = f (n+ ) e z = f (m+ ). Da injetividade
de f segue que n+ = m+ , o que implica que n = m e, portanto, x = y. O terceiro
caso a ser analisado seria quando x ∈ im(f ) e y ∈
/ im(f ). Mas isso é impossı́vel, pois,
por um lado, terı́amos z = y e, em particular, z ∈ / im(f ). Por outro lado, terı́amos
que x = f (n), para algum n ∈ ω, e, portanto, z = f (n+ ), contradizendo que z não
pertence à imagem de f .
Falta mostrar que g não é sobrejetora em relação a X. De fato, mostraremos
que f (0) não pertencem à imagem de g. Suponha o contrário. Seja x ∈ X tal que
g(x) = f (0). Se x ∈ / im(f ), temos que g(x) = x, o que é uma contradição, visto que
f (0) pertence à imagem de f . Se x ∈ im(f ), então x é da forma f (n), para algum
n ∈ ω. Nesse caso, como g(x) = f (n+ ), terı́amos f (n+ ) = f (0). Como f é injetora,
isso implica que n+ = 0, de onde segue que n ∈ 0, chegando a um absurdo.
(d) ⇒ (a) Mostraremos pela contrapositiva. Isto é, se X é finito, então X não
é equipotente a um subconjunto próprio. Provaremos, primeiro, que essa afirmação
é verdadeira para os próprios elementos de ω. Ou seja, mostraremos a seguinte
afirmação:
Afirmação 2: Se n ∈ ω e S está contido propriamente em n, então

S não é equipotente a n.
Provemos a afirmação por indução em n. Vale para 0, pois 0 não possui subcon-
junto próprio. Suponhamos que nenhum subconjunto próprio de n é equipotente a
n. Mostraremos que o mesmo vale para n+ .
Suponha, por absurdo, que existem S ⊂ n+ diferente de n+ e uma função bijetora
f de S em n+ . Assumiremos, sem perda de generalidade, que n ∈ / S. De fato, se
+
n ∈ S, como S 6= n , existe m < n que não pertence a S. Podemos “trocar”
n com m, mantendo o mesmo valor de f . Ou seja, no lugar de S consideramos
S 0 = (Sr{n})∪{m} e no lugar de f consideramos f 0 = (f r{(n, f (n))})∪{(m, f (n))}.
Está claro que S 0 continua sendo um subconjunto próprio de n+ (porque n ∈ / S) e f 0
0 +
ainda é uma bijeção de S e n .
Feita essa suposição de que n ∈
/ S, seja m < n tal que f (m) = n. Considere
S = S r {m} e f a restrição de f a S 0 . Temos que f 0 é uma bijeção de S 0 em
0 0
n. De fato, sendo a restrição de uma função injetora, f 0 é uma função injetora, e,

como o único elemento que tiramos da imagem de f foi n, da sobrejetividade de f
em relação a n+ segue a sobrejetividade de f 0 em relação a n. Além disso, S 0 está
contido propriamente em n, visto que m e n não pertencem a S 0 , contradizendo a
hipótese indutiva.
Usando a afirmação 2, mostraremos que um conjunto finito X não pode ser
equipotente a um subconjunto próprio. De fato, suponha, por absurdo, que existe
97
uma função f : X −→ X injetora e não sobrejetora, em relação a X. Ou seja, se

tomarmos Y a imagem de f , temos que X é equipotente a Y , que é um subconjunto
próprio de X. Seja g : X −→ n uma função bijetora e considere h a restrição de X
a Y (isto é, h(y) = g(y), para todo y ∈ Y ).
Seja S a imagem de h. Como Y está contido propriamente em X e f é injetora,
temos que S é um subconjunto próprio de n. De fato, se x ∈ X r Y , então f (x) não
pertence a S.
Note que g −1 é uma bijeção de n em X, f é uma bijeção de X em Y e h é
uma bijeção de Y em S. Como composição de funções bijetoras é bijetora, a função
h ◦ f ◦ g −1 (isto é, a função h ◦ (f ◦ g −1 ), para ser mais preciso) é uma bijeção de n
em S, contradizendo a afirmação 2.

Da equivalência entre (c) e (a) fica claro que ω é um conjunto infinito. Aliás,
fica fácil ver que qualquer conjunto indutivo é infinito (finalmente justificamos o
nome do axioma da infinidade!). Como, dados dois números naturais diferentes, um
está contido em outro, a afirmação 2 feita dentro da demonstração do Teorema 15.3
garante que dois números naturais distintos nunca são equipotentes.
A pergunta que surge é: os conjuntos infinitos são sempre equipotentes, entre
eles? Como vimos no começo do livro, isso não é verdade, pois os números reais são
um exemplo de conjunto não-enumerável, isto é, infinito e não equipotente a ω. O
argumento de Cantor pode ser copiado para provar que P(ω) é não-enumerável. De
modo geral, Cantor mostrou que o conjunto das partes de X não é equipotente a
X. Reparem a semelhança do argumento utilizado por Cantor com o Paradoxo de
Russell.
Teorema 15.4 (Cantor) O conjunto P(X) não é equipotente a X.
Demonstração: Seja f uma função de X em P(X). Considere
Z = {x ∈ X : x ∈
/ f (x)}.
Vamos mostrar que Z ∈ / im(f ).

Suponha que existe z ∈ X tal que f (z) = Z. Se z ∈ Z então, por definição,
z ∈
/ f (z), o que significa que z ∈/ Z. Se z ∈
/ Z isso significa que z ∈
/ f (z), o que
implica que z ∈ Z. Chegamos, assim, numa contradição.
Exercı́cios
1. Mostre que um conjunto X é infinito se, e somente se, existe uma boa ordem em
X em relação a qual X não possui máximo.
2. Prove que, se X é enumerável então X × X é enumerável (pode usar, sem de-

monstrar, fatos básicos de aritmética).
3. Prove que a união e a intersecção de conjuntos finitos são finitas.

4. Prove que um subconjunto de um conjunto finito é finito.
5. Prove que P(X) é finito se, e somente se, X é finito.

Capı́tulo 16
Comparação entre conjuntos
Terminamos o capı́tulo anterior mostrando o teorema de Cantor, que afirma que o

conjunto das partes de um conjunto X não é equipotente a X. Ora, se X e P(X)
“não são iguais”, quanto ao tamanho, então qual deles “é o maior”? Nossa intuição
nos diz que P(X) tem muito mais elementos. De fato, o conjunto {{x} : x ∈ X}
é um subconjunto próprio de P(X) equipotente a X, através da função f (x) =
{x} (a injetividade dessa função segue do axioma da extensão). Como P(X) não é
equipotente a X, mas contém um subconjunto equipotente a X, é sensato dizermos
que P(X) possui um tamanho maior que o conjunto X.
Sendo assim, definimos dessa forma a comparação entre tamanhos de conjuntos:
Y “é maior ou igual a” X se existe um subconjunto de Y equipotente a X. Isso é
equivalente a existir uma função injetora de X em Y (a imagem dessa função seria o
subconjunto de Y equipotente a X).
Quando Y “for maior ou igual a” X, diremos que Y domina X. Se Y “é maior
que” X, diremos que Y domina estritamente X, conforme a definição a seguir.
Definição 16.1 Dizemos que um conjunto Y domina um conjunto X se existe uma

função injetora de X em Y . Dizemos que Y domina estritamente X se Y domina
X mas X não domina Y . Denotamos por X Y quando Y domina X e X ≺ Y
quando Y domina estritamente X.
De acordo com essa definição, o teorema de Cantor diz que o conjunto das partes
de X domina estritamente X. Ainda de acordo com essa definição, o item (c) do Te-
orema 15.3 nos diz que ω é “o menor” conjunto infinito que existe. Em particular, os
conjuntos não-enumeráveis sempre dominam estritamente os conjuntos enumeráveis.
A pergunta natural a fazer depois de vermos o enunciado do Teorema de Cantor é
sobre a existência de alguma coisa intermediária entre ω e P(ω), ou, mais geralmente,
entre X e P(X). Essa conjectura de que não existe nada entre ω e P(ω) é conhecida
como hipótese do contı́nuo e foi colocada por Hilbert no topo dos problemas mais
importantes na virada do século XIX para o século XX.
Hipótese do contı́nuo: Se ω X e X P(ω) então X é equipo-

tente a ω ou a P(ω).
99
100 CAPÍTULO 16. COMPARAÇÃO ENTRE CONJUNTOS
Esse problema foi provado ser independente de ZFC, isto é, não pode ser provado
nem refutado utilizando os axiomas usuais de teoria dos conjuntos. Pelo teorema da
completude da lógica de primeira ordem, isso significa que existem um modelo para
teoria dos conjuntos que satisfaz os axiomas de ZFC e a hipótese do contı́nuo, e outro
modelo para teoria dos conjuntos que satisfaz os axiomas de ZFC e a negação da
hipótese do contı́nuo.
Como dissemos, o problema foi postado por Hilbert em 1900 na sua famosa lista
dos 22 problemas mais importantes do século XIX. A consistência da hipótese do
contı́nuo só foi mostrada em 1940 por Kurt Gödel, e a consistência da negação da
hipótese do contı́nuo foi provada em 1964 por Paul Cohen.
A seguinte generalização da hipótese do contı́nuo também foi provada ser inde-
pendente de ZFC.
Hipótese generalizado do contı́nuo: Se X Y e Y P(X) então

Y é equipotente a X ou a P(X).
A ideia de compararmos conjuntos pelo seu tamanho remete a ideia de ordem.

De fato, queremos que a “relação” (que seria uma relação na classe de todos os
conjuntos) satisfaça as condições de uma relação de ordem.
É fácil verificar que X Y e Y Z implicam que X Z, pois a composição
de funções injetoras é injetora. Também é imediato que X X, pois a função
identidade é injetora. Para podermos dizer que estabelece uma relação de ordem
na classe de todos os conjuntos, precisarı́amos ter que X Y e Y X implica
X = Y . Obviamente, isso não vale, pois existem conjuntos equipotentes diferentes, e
conjuntos equipotentes dominam um o outro. Porém, é de se esperar que se X Y
e Y X então X ≈ Y . Mostraremos que isso é verdadeiro, pelo teorema de Cantor-
Schröder-Bernstein, e esse resultado não depende do axioma da escolha.
Outro resultado importante (e esse depende do axioma da escolha) é podermos
comparar dois conjuntos quaisquer. Isto é, dados dois conjuntos, ou os dois são
equipotentes ou um domina estritamente o outro. Pelo teorema de Cantor-Schröder-
Bernstein, para mostrarmos isso basta verificarmos que, dados dois conjuntos, um
deles domina o outro. Antes de provarmos esse resultado, provaremos um lema
importante, que diz que a existência de uma função injetora de X em Y é equivalente
à existência de uma função sobrejetora de T em X.
Lema 16.2 Sejam X e Y conjuntos não-vazios. Temos que X Y se, e somente

se, existe uma função sobrejetora de Y em X.
Demonstração: Suponha que existe f : X −→ Y injetora. Tome x0 ∈ X um ele-

mento qualquer. Defina g : Y −→ X como g(y) = f −1 (y), se y ∈ im(f ) (lembrando
que f é bijetora sobre sua imagem) e g(y) = x0 se y ∈ Y r im(f ).
Suponha agora que existe g : Y −→ X sobrejetora. Considere a função h : X −→
P(Y ) dada por
h(x) = {y ∈ Y : g(y) = x}
101
Como g é sobrejetora, h(x) 6= ∅, para todo x ∈ X. Usando o axioma da escolha

defina uma função s : im(h) −→ Y tal que s(A) ∈ A, para todo A ∈ im(h). Defina
a função f : X −→ Y por
f (x) = s(h(x))
Notemos que h(x) ∩ h(x0 ) = ∅, sempre que x 6= x0 . Logo, f é injetora, provando o
que querı́amos.
Teorema 16.3 Para todos conjuntos X e Y , ou X Y ou Y X.
Demonstração: Podemos assumir que tanto X quanto Y são não-vazios, pois,

nesse caso, o resultado seria trivial, uma vez que qualquer conjunto domina o conjunto
vazio.
Supomos que X não domina Y . Pelo Lema 16.2 isso significa que não existe uma
função sobrejetora de X em Y . Vamos mostrar que Y domina X.
Sejam ≤ uma relação de boa ordem sobre o conjunto X e h uma função de escolha
em P(Y ) r {∅}. Defina uma função
[ ←
g: { x Y : x ∈ X} −→ Y
dada por
g(s) = h(Y r im(s)).
Notemos que s não é sobrejetora em Y , pois o domı́nio de s está contido em X e se
tivéssemos im(s) = Y poderı́amos facilmente estender s para uma função sobrejetora
de X em Y , que assumimos não existir. Portanto, h está bem definida.
Pelo teorema da recursão (vide teorema 13.7), existe f : X −→ Y tal que, para
todo x,
←
f (x) = g(f | x),
←
lembrando que x denota o conjunto dos elementos de X menores do que x.
Mostremos que f é injetora. Suponha que não seja. Tome x e y em X tais que
x 6= y e f (x) = f (y). Como boa ordem implica ordem total, temos x ≤ y ou y ≤ x.
Podemos assumir que y ≤ x, sendo o outro caso totalmente análogo. Temos que
← ← ←
y ∈ x, contradizendo que g(f | x) ∈
/ im(f | x) e f (x) = f (y).
Notemos que usamos o axioma da escolha duas vezes na demonstração acima:
uma para bem ordenar o conjunto X e outra para definir a função h. O uso do
axioma da escolha é necessário. De fato, o teorema da comparabilidade dos conjuntos
é equivalente ao axioma da escolha, em ZF.
O próximo lema será usado na demonstração do teorema de Cantor-Schröder-
Bernstein.
Lema 16.4 (teorema do ponto fixo de Tarski) Seja F uma função de P(X) em
P(X) tal que z ⊂ w ⊂ X implica F (z) ⊂ F (w). Então existe w ⊂ X tal que
F (w) = w.
102 CAPÍTULO 16. COMPARAÇÃO ENTRE CONJUNTOS
Demonstração: Sendo F e X como na hipótese do lema, considere o conjunto

A = {z ∈ P(X) : z ⊂ F (z)}
e tome [
w= A.
S
Se z ∈ A, como z ⊂ F (z) e z ⊂ w, temos z ⊂ F (w). Como w = A isso implica
que
w ⊂ F (w).
Agora notamos que, se z ∈ A, então z ⊂ F (z) e, pela hipótese do lema, F (z) ⊂
F (F (z)), o que implica que F (z) ∈ A. Em particular, F (w) ∈ A, o que implica que
F (w) ⊂ w,
provando que F (w) = w.

Teorema 16.5 (Cantor-Schröder-Bernstein) Se X Y e Y X então X ≈ Y .
Demonstração: Sejam g : X −→ Y e h : Y −→ X funções injetoras. Mostraremos

que existe f : X −→ Y bijetora.
A ideia da demonstração é dividir X em duas partes, X1 e X2 , e Y em duas
partes, Y1 e Y2 , de modo que g restrita a X1 seja sobrejetora em relação a Y1 e h
restrita a Y2 seja sobrejetora em relação a X2 . Em seguida, basta “colar” as funções
g restrita a X1 e a inversa de h restrita a Y2 . Usaremos o teorema de ponto fixo de
Tarski para achar as partições de X e Y .
Usaremos a notação g[A] para denotar o conjunto im(g|A), e o mesmo também
para a função h.
Defina a função F : P(X) −→ P(X) dada por
F (A) = X r h[Y r g[A]]
Notemos que, se A ⊂ B, g[A] ⊂ g[B]. Logo, Y r g[B] ⊂ Y r g[B] e h[Y r g[B]] ⊂
h[Y r g[B]], concluindo que F (A) ⊂ F (B).
Logo, F satisfaz a hipótese do teorema do ponto fixo de Tarski. Tome X1 ⊂ X
tal que F (X1 ) = X1 . Defina Y1 = g[X1 ], X2 = X r X1 e Y2 = Y r Y1 .
Mostraremos que h[Y2 ] = X2 o que equivale a mostrar que
h[Y r g[X1 ]] = X r X1 .
É fácil verificar que a expressão acima é equivalente a
X r h[Y r g[X1 ]] = X1 ,
que é exatamente a expressão F (X1 ) = X1 , que vale pela definição de X1 .
Tomamos agora
f = (g|X1 ) ∪ (h|Y2 )−1 ,
que é claramente uma função bijetora de X em Y .

103
Exercı́cios
1. Prove que, se X e Y são infinitos, então X ∪Y é equipotente a X ou a Y . Assuma
o seguinte resultado: se X é infinito então X é equipotente a X × X.
2. Seja X um conjunto infinito. Prove que, se X domina Y e domina Z, então X

domina Y ∪ Z. Mostre que isso nem sempre vale quando X é finito.
3. Prove que, se ω domina estritamente X, então X é finito.
4. Prove que, dados dois números naturais n e m, temos que n domina estritamente
m se, e somente se, m < n.
5. Prove que, se Y é não-vazio, X × Y domina X.

Elementos Conjuntos

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Elementos Conjuntos

Enviado por

Direitos autorais:

Formatos disponíveis

Elementos da Teoria dos Conjuntos

Rogério Augusto dos Santos Fajardo

3 A linguagem da teoria dos conjuntos 17

5 Axiomas do vazio, par e união 37

6 Axiomas das partes e da separação 43

9 Aritmética dos números naturais 59

11 Construção dos conjuntos numéricos 65

11.3 Construção do conjunto dos números racionais . . . . . . . . . . . . . 68

16 Comparação entre conjuntos 99

O hotel de Hilbert O matemático alemão David Hilbert (1862–1943) deu um

O paraı́so de Cantor Aparentemente o paradoxo criado por Galilei não causou

os números transcendentes. Pois Cantor provou justamente o contrário: há muito

Estabelecer uma bijeção entre os números naturais e os algébricos não é difı́cil.

O inı́cio da sequência deve ser constituı́da pelos polinômios de grau 1 e cujos

Continuamos a sequência escrevendo os polinômios de grau menor ou igual a 2,

A essa altura começamos a imaginar que todos os conjuntos são enumeráveis.

f (0) = a0 , a00 , a01 , a02 , a03 . . .

2. Prove que qualquer subconjunto infinito dos números naturais é enumerável.

3. Na bijeção que construı́mos entre os números naturais e os polinômios, encontre

4. Na bijeção que construı́mos entre os números√naturais e os números algébricos,

A linguagem da teoria dos

damos o livro Set Theory and Logic, de Robert Stoll.

Variáveis: representadas pelas letras minúsculas: x, y, z, . . .. Eventualmente, são

Conectivos: ¬ (negação – “não”), → (condicional – “se. . . então”), ∧ (conjunção –

Quantificadores: ∀ (quantificador universal – “para todo”), ∃ (quantificador exis-

Parênteses: são os parênteses esquerdo e direito: ( e ).

Predicado binário: ∈ (pertence).

1. Se x e y são variáveis, x ∈ y e x = y são fórmulas.

3. Se A é fórmula e x é uma variável, então ∀x(A) e ∃x(A) são fórmulas.

4. Todas as fórmulas têm uma das formas descritas nos itens 1, 2 e 3.

3.3 Unicidade de representação

3.4 Omissão de parênteses

3.5 Variáveis livres

falsa, basta agora conhecermos quem é y. Em outras palavras, a fórmula em questão

se refere a um objeto bem definido. Corresponde a um nome próprio na linguagem

Um importante detalhe da fórmula acima é que a ocorrência não-livre da variável

Seja B a sequência de sı́mbolos obtida ao substituirmos todas as

Outro exemplo que citaremos aqui é da união de conjuntos. A expressão x ∪ y

Sejam A uma fórmula e x, y, z variáveis distintas. Seja B a sequência

∀z(∀w((w ∈ z) ↔ ((w ∈ x) ∨ (w ∈ y))) → A)

Para algumas finalidades – como no estudo da metamatemática ou na elaboração

(A) ∨ (B) é abreviatura para (¬(A)) → (B);

(A) ∧ (B) é abreviatura para ¬((¬(A)) ∨ (¬(B));

(A) ↔ (B) é abreviatura para ((A) → (B)) ∧ ((B) → (A));

∃x(A) é abreviatura para ¬(∀x(¬(A))).

Fica como exercı́cio ao leitor entender, a partir da concepção intuitiva desses

3.7 Sistema de axiomas

A2 ((C) → ((A) → (B)) → (((C) → (A)) → ((C) → (B)));

A3 ((¬(A)) → (¬(B))) → ((B) → (A)).

A4 (∀x((A) → (B))) → ((A) → (∀x(B))), se A e B são fórmulas, e x não possui

A6 x = x é um axioma, para qualquer variável x;

A7 (x = y) → ((A) → (B)), sempre que x, y são variáveis, A é uma fórmula, e B

As regras de inferência são duas:

Modus Ponens: Se A e (A) → (B) são teoremas então B é teorema.

Generalização: Se A é um teorema e x é uma variável, então ∀x(A) é teorema.

Agora que descrevemos os axiomas e regras de inferência, faremos alguns co-

(∀y∃z¬(y = z)) → (∃z¬(z = z))

Ora, num sistema em que ∀y∃z¬(y = z) é um teorema (não é difı́cil um sistema

3.8 Notas sobre sı́mbolos relacionais e funcionais

1. As variáveis são termos;

2. As constantes são termos;

3. Se t1 , . . . , tn são termos e F é um sı́mbolo funcional n-ário, então F (t1 , . . . , tn )

4. Todos os termos têm uma das formas acima.