Escolar Documentos
Profissional Documentos
Cultura Documentos
24 de Novembro de 2013
2
Conteúdo
1 Aprendendo a contar 5
2 O paradoxo de Russell 13
4 Axioma da extensão 31
7 Axioma da infinidade 47
8 Relações e funções 53
8.1 Pares ordenados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
8.2 Produto cartesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
8.3 n-uplas ordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
8.4 Funções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
10 Axioma da regularidade 63
3
4 CONTEÚDO
12 Axioma da substituição 71
13 Relações de ordem 77
14 Axioma da escolha 83
15 Conjuntos equipotentes 93
Aprendendo a contar
A matemática é formada por conceitos abstratos que, muitas vezes, nossa intuição as-
simila com certa facilidade, mas encontramos dificuldade em formalizá-los. A maioria
das pessoas já está familiarizada com os conceitos de conjuntos, funções e relações,
mesmo sem fazer qualquer ideia sobre como explicar esses conceitos, ou sequer com-
preender uma explicação sobre eles. Esse abismo entre intuição e formalização se
evidencia quando estudamos a história da matemática, e descobrimos que conceitos
com os quais a humanidade lida desde os primórdios só foram formalizados – e de
maneira surpreendentemente simples – no século passado.
Para ilustrar isso, imaginemos a seguinte situação cotidiana. George é um me-
nino que está comemorando seu aniversário com os amiguinhos. Após cantarem os
parabéns, sua mãe lhe pede para ajudar a cortar o bolo e distribuir para os amigos.
Para ninguém ficar sem bolo e não haver desperdı́cio, George conta quantas pessoas
estão presentes na festa – digamos que foram vinte – e separa vinte fatias de bolo
para distribuir uma para cada pessoa presente.
Vamos detalhar como é esse processo de contagem, que aparenta ser tão simples.
Primeiro, George ergue a mão e aponta cada uma das pessoas que estão na festa
(inclusive ele, se também quiser comer bolo). Cada vez que ele aponta alguém, ele
fala, em voz alta um número, começando do número 1 e segue, na sequência, até o
número 20. O mesmo processo ele usa para contar as fatias de bolo.
Quando George conta as pessoas, ele está, na realidade, estabelecendo uma função
que associa a cada número natural – no caso, até 20 – uma pessoa na festa. Além de
se preocupar em pronunciar os números na sequência correta, ele toma o cuidado de
não contar duas vezes a mesma pessoa (isto é, a função tem que ser injetora) e de não
deixar ninguém de fora da contagem (isto é, a função também precisa ser sobrejetora).
Ou seja, George sabe, intuitivamente, o que significa uma função bijetora. Mais do
que isso, quando ele conta o número de pessoas e o número de pedaços de bolo –
chegando no mesmo valor – ele sabe que poderá distribuir um pedaço para cada
convidado, sem faltar ninguém (desde que cada um só coma um pedaço). Portanto,
ele sabe que a composição de funções bijetoras é bijetora.
Por trás desse conceito de função, George possui uma ideia intuitiva do que sig-
nifica conjunto: o conjunto das pessoas que estão na festa, o conjunto dos pedaços de
bolo, o conjunto dos presentes que ele ganhou, e assim por diante. Desde o momento
5
6 CAPÍTULO 1. APRENDENDO A CONTAR
que ele aprende a contar, ele consegue abstrair a ideia de conjuntos equipotentes, ou
seja, conjuntos com a mesma quantidade de elementos.
Conjunto é um conceito abstrato, e desse conceito podemos derivar todos os ou-
tros da matemática. Por exemplo, os números naturais – uma das primeiras ideias
abstratas construı́das pela matemática – surgem na tentativa de comparar o tama-
nho de conjuntos formados por objetos concretos (no caso de George, o conjunto de
pessoas na festas e o conjunto de pedaços de bolo cortados). Segundo alguns his-
toriadores da matemática, a palavra cálculo – vinda do latim calculus, que significa
pedra – surgiu do hábito dos pastores, na antiguidade (antes da humanidade criar –
ou descobrir – os números naturais) de utilizar pedras para verificarem se não perde-
ram alguma ovelha, associando cada ovelha a uma pedrinha. Com o surgimento dos
números naturais, passamos a utilizar eles próprios para a contagem de tamanhos de
conjuntos, em vez de um saquinho de pedrinhas.
Dessa forma, os conjuntos, que, inicialmente, eram abstratos mas possuı́am, como
elementos, objetos concretos, podem ser formados por objetos abstratos, como os
números naturais. Mas dessa ideia de conjuntos de objetos abstratos surge um novo
conceito que contraria a nossa intuição e tem assombrado a mente dos melhores
matemáticos: o infinito. Quando nos limitamos a investigar conjuntos formados por
objetos concretos, nunca nos deparamos com a infinitude. Mesmo o conjunto de
todas as estrelas no céu, ou mesmo de todos os átomos do universo, não importa o
quão imenso seja esse conjunto, ele possui uma quantidade limitada de elementos.
Mas os números naturais – sendo esses objetos abstratos, criados pela mente humana
(segundo algumas correntes filosóficas da matemática) – são ilimitados. Isso porque,
se existisse o maior número natural possı́vel, somarı́amos 1 a esse e obterı́amos um
número maior do que esse que seria o máximo.
O processo de contagem para conjuntos finitos, com a qual estamos acostumados
e que explicamos no exemplo do menino George, segue alguns princı́pios que perce-
bemos intuitivamente. Primeiro: não importa a ordem que seguimos na contagem de
um conjunto, encontraremos sempre o mesmo número na quantidade de seus elemen-
tos, contanto que tonhamos o cuidado de não contarmos duas vezes o mesmo elemento
e de não esquecermos de nenhum. Segundo: se tirarmos qualquer elemento de um
conjunto, obteremos, na nova contagem, um número menor de elementos (conforme
diz um axioma de Euclides, de que a parte é menor que o todo).
Porém, quando alguns matemáticos quiseram comparar tamanho de conjuntos
infinitos, começaram a ver que essas “regras”, que valem para conjuntos finitos,
deixam de valer. Galileu Galilei (1564–1642) foi um dos primeiros, que se tem notı́cia,
a usar esse conceito de funções bijetoras para comparar conjuntos infinitos. Ele
considerou a função que associa, a cada número natural, o seu dobro, conforme o
diagrama seguinte:
0 ←→ 0
1 ←→ 2
2 ←→ 4
3 ←→ 6
...
7
Com isso, Galilei mostrou que o conjunto dos números naturais “tem o mesmo ta-
manho” que o conjunto dos números pares, mesmo havendo muitos números naturais
que não são pares.
−x − 1
−x
−x + 1
x−1
x
x+1
0 ←→ −x − 1
1 ←→ −x
2 ←→ −x + 1
3 ←→ x−1
4 ←→ x
5 ←→ x+1
6 ←→ −2x − 2
7 ←→ −2x − 1
8 ←→ −2x
9 ←→ −2x + 1
10 ←→ −2x + 2
11 ←→ −x − 2
12 ←→ −x + 2
13 ←→ x−2
14 ←→ x+2
15 ←→ 2x − 2
16 ←→ 2x − 1
17 ←→ 2x
18 ←→ 2x + 1
19 ←→ 2x + 2
20 ←→ −2x2 − 2x − 2
...
Agora, para “colocarmos em fila” os números algébricos basta substituirmos cada
polinômio pelas suas raı́zes (em ordem crescente), suprimindo os que já foram listados.
Fazendo assim obtemos:
0 ←→ −1 (raiz do polinômio −x − 1)
1 ←→ 0 (raiz do polinômio −x)
2 ←→ 1 (raiz do polinômio −x + 1)
3 ←→ −2 (raiz do polinômio −x − 2)
4 ←→ 2 (raiz do polinômio −x + 2)
5 ←→ − 21 (raiz do polinômio −2x − 1)
1
6 ←→ 2√
(raiz do polinômio −2x + 1)
1− 3
7 ←→ 2√
(primeira raiz de −2x2 − 2x + 1)
1+ 3
8 ←→ 2
(segunda raiz de −2x2 − 2x + 1)
...
Com isso Cantor mostrou que o conjunto dos números algébricos “tem o mesmo
tamanho” que o dos números naturais. Isso significa dizer que o conjunto dos números
algébricos é enumerável, ou seja, podemos enumerar todos seus elementos numa lista
infinita, indexada com os números naturais.
É fácil intuir 1 que um subconjunto infinito de um conjunto enumerável é enu-
merável. Assim, os conjuntos dos números inteiros, racionais e algébricos são todos
enumeráveis.
1
A demonstração rigorosa desse fato é mais trabalhosa, como veremos posteriormente.
10 CAPÍTULO 1. APRENDENDO A CONTAR
números transcendentes sem ser capaz de exibir (a partir da prova) sequer um número
transcendente.
Para outros matemáticos, no entanto, a prova de Cantor foi uma inovação no
pensamento abstrato e um grande passo para a Rainha das Ciências. O matemático
francês Henry Poincaré (1854–1912) chegou a dizer que “o cantorismo é uma doença
da qual a matemática precisa se curar ´´, enquanto, por outro lado, David Hilbert
reagia às crı́ticas a Cantor dizendo que “ninguém nos tirará do paraı́so criado por
Cantor ´´.
Exercı́cios
1. Mostre uma bijeção entre o conjunto dos números inteiros e os naturais.
5. Suponha que, em um conjunto infinito, existe uma forma de representar cada ele-
mento do conjunto como uma sequência finita de sı́mbolos, dentre um conjunto finito
de sı́mbolos. Mostre que esse conjunto é enumerável e use esse resultado diretamente
para mostrar que os conjuntos dos números racionais e dos números algébricos são
enumeráveis.
12 CAPÍTULO 1. APRENDENDO A CONTAR
Capı́tulo 2
O paradoxo de Russell
O que é conjunto? Todos têm uma noção intuitiva do que é um conjunto, mas, como
sempre ocorre na matemática (e ocorreu com o próprio Euclides, quando tentou
definir o que era ponto e reta), qualquer tentativa de definição seria circular ou
insatisfatória. Portanto, como costuma ocorrer na matemática moderna, em vez de
tentarmos explicar o que são os conjuntos, nos limitaremos a descrever como são os
conjuntos, enunciando os axiomas que os regem, e discutindo o conceito intuitivo que
tais axiomas procuram formalizar.
Inicialmente, o conceito de conjuntos estava diretamente ligado ao das fórmulas
da linguagem de primeira ordem com uma variável livre. Por exemplo, a fórmula
∃y(x = 2 · y) tem x como variável livre (veremos isso no próximo capı́tulo) e, se
pensarmos no universo dos números naturais, representa o conjunto dos números
pares. Um conjunto, então, é determinado por uma propriedade.
Gottlob Frege (1848–1925) tentou levar essa ideia adiante, propondo uma forma-
lização da matemática em que lógica e conjuntos eram praticamente indissociáveis.
Porém, Bertrand Russell (1872–1970) encontrou uma inconsistência nessa forma-
lização, através do seu famoso paradoxo 1 .
Se qualquer propriedade determina um conjunto, então podemos definir um con-
junto X como o conjunto de todos os conjuntos que não pertencem a si mesmos 2
Se permitirmos livremente a construção de conjuntos através de uma expressão
que descreve todos seus elementos, e ainda utilizarmos a linguagem natural, cheia
de auto-referências, podemos definir o conjunto de todos os objetos que podem ser
descritos com menos de vinte palavras. Certamente esse conjunto, se assim existisse,
pertenceria a ele próprio. Ou, um exemplo mais simples, se existir o conjunto de
todos os conjuntos, ele pertence a si próprio.
Surge a pergunta: X pertence a si mesmo? Se sim, então, pela sua definição, ele
1
Esse paradoxo possui uma variança popular conhecido como paradoxo do barbeiro, que dizia
que havia numa cidade um barbeiro que cortava o cabelo de todas as pessoas que não cortavam seu
próprio cabelo, e apemas dessas.
2
Podemos nos perguntar se é possı́vel um conjunto pertencer a si próprio. Nota-se que há uma
diferença entre pertencer a si próprio e estar contido em si próprio. Essa confusão entre as duas
relações é muito comum, devido a uma falha clássica do ensino de matemática no nı́vel básico, que
será discutida melhor durante a disciplina. Um conjunto sempre está contido nele próprio, mas
poderá pertencer a si próprio?
13
14 CAPÍTULO 2. O PARADOXO DE RUSSELL
não pode pertencer. Se não pertence a si mesmo, novamente usando sua definição,
concluı́mos que ele pertence. Chegamos numa inevitável contradição, que só se resolve
não permitindo a existência de tal conjunto.
Isso derruba a proposta de Frege de unificar conjuntos e lógica, relacionando
um conjunto com uma sentença que descreve seus elementos. Para contornar esse
problema surgiram várias alternativas. O próprio Bertrand Russell criou uma for-
malização da aritmética usando teoria dos tipos. Nela, os objetos são classificados
hierarquicamente. Os objetos de primeiro tipo são os números naturais. Os objetos
de segundo tipo são os conjuntos de números naturais. Os de terceiro tipo são os
conjuntos de conjuntos de números naturais, e assim por diante. Nessa formalização,
a pertinência só poderia ser usada entre um objeto de um determinado tipo e outro
do tipo subsequente. Por exemplo, entre números e conjuntos de números.
Ernest Zermelo (1871–1953) e Abraham Fraenkel (1891–1965) propuseram uma
outra formalização mais eficaz e mais simples. Diferente da proposta de Russell, no
sistema de Zermelo e Fraenkel – conhecido como ZFC, quando consideramos o axioma
da escolha (do inglês choice, ou como ZF, quando não consideramos tal axioma – tudo
é conjunto, e podemos agrupar vários objetos matemáticos em um mesmo conjunto.
Como tudo é conjunto, em particular, os próprios números naturais são conjuntos, e
os elementos de conjuntos sempre são conjuntos. Não há a distinção absoluta entre
“elementos” e “conjuntos”, como erroneamente nos ensinaram alguns professores de
ensino médio, nem tampouco há uma hierarquia entre “tipos” de conjuntos, como
formalizou Bertrand Russell.
Para resolver o problema do paradoxo de Russell, a solução foi a seguinte: pode-
mos definir um conjunto através de uma propriedade, como queria Frege, desde que
essa propriedade seja estabelecidada a partir de um conjunto previamente fixado. Por
exemplo, não podemos definir o conjunto de todos os conjuntos finitos, pois não está
claro qual é o universo que estamos considerando, mas podemos definir o conjunto
dos números reais que são maiores que 2. Ou seja, dentro de um conjunto previa-
mente fixado, separamos aqueles que têm a propriedade desejada. Esse é o axioma
da separação, que iremos falar, com mais detalhes, em algumas aulas.
Essa restrição criada pelo axioma da separação em relação à proposta inicial
de Frege cria uma dificuldade na axiomatização: o axioma da separação não nos
permite criar um conjunto “do nada”, sendo necessários outros axiomas que garantem
a existência de certos conjuntos. Assim, enquanto na teoria intuitiva dos conjuntos
– que mais se aproxima da concepção de Frege – basta definirmos um conjunto para
garantir sua existência, na teoria axiomática precisamos provar que ele existe, através
dos axiomas.
Podemos separar os axiomas de ZFC em três grupos. O primeiro deles é formado
pelos axiomas que garantem a existência de um conjunto, em particular. São eles: o
axioma do vazio e o axioma da infinidade. Como os nomes sugerem, eles garantem a
existência, respectivamente, do conjunto vazio e de um conjunto infinito.
O segundo grupo de axiomas é formado por aqueles que nos permitem construir
uns conjuntos a partir de outros. São eles o axioma do par, o axioma da união,
o axioma das partes, o axioma da escolha, o axioma da separação e o axioma da
substituição. Na realidade, esses dois últimos não são, propriamente, axiomas, mas
15
esquemas de axiomas (isto é, sequências infinitas de axiomas dadas por alguma regra
especı́fica), pois, conforme vimos (e veremos com mais detalhes quando estudarmos a
linguagem da teoria dos conjuntos), cada propriedade nos dará uma versão diferente
do axioma da separação. O axioma da substituição é uma generalização do axioma
da separação.
O terceiro grupo de axiomas de ZFC são aqueles que descrevem a natureza dos
conjuntos. São eles: o axioma da extensão e o axioma da regularidade. O primeiro
serve para determinar quando dois conjuntos são iguais, e o segundo garante que
todos os conjuntos são construı́dos sequencialmente a partir do vazio, evitando cir-
cularidades como “um conjunto pertencer a ele próprio”.
A versão atual do axioma da separação impede que o paradoxo de Russell gere
uma contradição no sistema. Porém, o argumento de Russell mostra um teorema
importante de ZFC: não existe o conjunto de todos os conjuntos. De fato, se existisse,
o axioma da separação garantiria a existência do conjunto de todos os conjuntos que
não pertencem a si mesmos, gerando, novamente, o paradoxo. Retornaremos a esse
assunto quando falarmos, formalmente, do axioma da separação.
Na tentativa de resgatar a conceitologia de Frege – de definir coleções de objetos a
partir de uma propriedade, sem impor alguma limitação no universo, como ocorre com
o axioma da separação – alguns matemáticos criaram outras teorias dos conjuntos
onde é apresentado o conceito de classe. Todos os conjuntos são classes, mas algumas
classes – chamadas de classes próprias – são “grandes demais para formarem um
conjunto”. Por exemplo: classe de todos os conjuntos, classe de todas as funções, e
assim por diante. As teorias que formalizam o conceito de classe dentro da teoria
dos conjuntos são NGB (Neumann-Gödel-Bernays) e KM (Kelley-Morse). Porém,
dentro de ZFC podemos trabalhar com o conceito de classe identicando-a com uma
fórmula. Apesar dessas três teorias adotarem formalizações diferentes, os resultados
são essencialmente o mesmo.
Como o axioma da separação depende de escrevermos uma propriedade, não po-
demos axiomatizar a teoria dos conjuntos valendo-se apenas da imprecisa linguagem
natural. Faz-se necessário criarmos uma linguagem de sintaxe controlada e livre de
contexto – como idealizou Frege – que não deixe dúvidas sobre quais frases possam
ser consideradas “propriedades”. Para isso, o próximo capı́tulo discorrerá sobre a
linguagem da lógica de primeira ordem, que será usada na teoria dos conjuntos.
16 CAPÍTULO 2. O PARADOXO DE RUSSELL
Capı́tulo 3
Há um cı́rculo vicioso entre lógica de primeira ordem e teoria dos conjuntos. A for-
malização de uma depende da formalização da outra. Seja como for que lidemos
com essa dicotomia, em algum momento precisamos apelar para a abordagem intui-
tiva da outra. Ou seja, podemos desenvolver toda a teoria dos conjuntos de forma
axiomática mas utilizando a linguagem natural (tal como Halmos faz em seu livro,
e também como é feito nas disciplinas de Análise Real e Álgebra) para, posterior-
mente, formalizarmo-la com a lógica de primeira ordem (que possui a vantagem de
ser muito próxima à argumentação que costumamos fazer na linguagem natural, para
provarmos teoremas matemáticos). Ou podemos estudar lógica primeiro, utilizando
noções intuitivas de teoria dos conjuntos – tais quais aprendemos no Ensino Médio
– para depois desenvolvermos a teoria dos conjuntos axiomaticamente. Seguiremos
aqui uma terceira opção: apresentar apenas uma parte da lógica de primeira ordem
(a sintaxe) – que requer apenas uma parcela mı́nima de noções intuitivas de conjuntos
e aritmética – para depois formalizar a teoria dos conjuntos com o rigor da lógica.
Podemos separar a lógica de primeira ordem em três aspectos: a linguagem,
o sistema de axiomas e a semântica. Os dois primeiros constituem a sintaxe da
lógica de primeira ordem, que trata da manipulação dos sı́mbolos através de regras
bem definidas, livre de contexto e de significado. A semântica trata justamente do
significado das expressões lógicas. É justamente na semântica que o uso de teoria
dos conjuntos é mais evidente e, por essa razão, trataremos aqui apenas da parte
sintática, fazendo apenas alguns comentários a respeito da semântica.
A lógica de primeira ordem pode se adaptar a vários contextos, apresentando
sı́mbolos especı́ficos de algum assunto que quisermos axiomatizar. Assim, para axi-
omatizar a aritmética utilizamos alguns sı́mbolos especı́ficos da aritmética, como +,
×, 0 e 1. Na teoria dos conjuntos, o sı́mbolo especı́fico será o de pertinência (∈).
Por isso, muitas vezes, em vez de dizermos a lógica de primeira ordem, dizemos uma
lógica de primeira ordem, ou uma linguagem de primeira ordem.
Aqui trataremos especificamente da linguagem da teoria dos conjuntos. Não
demonstraremos nenhum dos teoremas aqui enunciados 1 . Como referência recomen-
1
Os teoremas a respeito da lógica de primeira ordem fazem parte do que chamamos de meta-
17
18 CAPÍTULO 3. A LINGUAGEM DA TEORIA DOS CONJUNTOS
3.1 O alfabeto
Os sı́mbolos utilizados na linguagem da teoria dos conjuntos são os seguintes:
Sı́mbolo de igualdade: =
3.2 Fórmulas
Fórmulas são sequências finitas de sı́mbolos do alfabeto que seguem as seguintes
regras:
2. Se A e B são fórmulas, ¬(A), (A) → (B), (A) ∧ (B), (A) ∨ (B) e (A) ↔ (B)
são fórmulas;
Por exemplo, pela regra 1, temos que x ∈ y é uma fórmula. Pela regra 1, x = z
também é uma fórmula. A regra 2 nos garante que (x ∈ y) → (x = z) é uma
fórmula. Logo, a regra 3 nos garante que ∀x((x ∈ y) → (x = z)) é uma fórmula.
matemática, isto é, a matemática utilizada para formalizar a matemática. A lógica de primeira
ordem é a linguagem utilizada na matemática. Então nos perguntamos qual é a linguagem utilizada
quando formalizamos a lógica de primeira ordem. Obviamente, utilizamos a linguagem natural,
mas podemos, posteriormente, formalizá-la utilizando a própria ordem de primeira ordem. A essa
linguagem que utilizamos para descrever a lógica de primeira ordem chamamos de metalinguagem.
Em seu livro Uma Breve História do Tempo, Stephen Hawking menciona uma história que serve
como uma curiosa alegoria para entendermos o que é metalinguagem e metamatemática: de acordo
com algumas pessoas, a Terra era achatada e estava apoiada no casco de uma tartaruga gigante,
sendo que essa tartaruga, por sua vez, estava apoiada no casco de uma outra tartaruga gigante, e
assim sucessivamente.
3.3. UNICIDADE DE REPRESENTAÇÃO 19
De fato, é uma expressão que “faz sentido” (ou seja, entendemos o que ela significa,
independente de ser verdadeira ou não). Traduzindo para a linguagem natural, seria
o seguinte: “para todo x, se x pertence a y então x é igual a z”. Ou, simplesmente,
“z é o único elemento de y”.
As fórmulas usadas no processo de construção de fórmulas mais complexas são
chamadas de subfórmulas. Por exemplo, A e B são subfórmulas de (A) → (B). No
caso do nosso exemplo, as subfórmulas de ∀x((x ∈ y) → (x = z)) são x ∈ y, x = z,
(x ∈ y) → (x = z) e, para alguns efeitos práticos, consideramos a própria fórmula
∀x((x ∈ y) → (x = z)) como subfórmula dela mesma.
As fórmulas que constam no item 1 são chamadas de fórmulas atômicas, porque
não podem ser divididas em subfórmulas menores.
3.6 Abreviaturas
À medida que desenvolvemos assuntos mais complexos, as fórmulas vão se tornando
demasiadamente longas e ilegı́veis. Para resolver isso, introduzimos novos sı́mbolos
que funcionam como abreviaturas para expressões maiores. O importante é que o
processo de conversão da linguagem abreviada para a linguagem da lógica de primeira
ordem seja perfeitamente claro.
Comecemos a exemplificar isso com o sı́mbolo de inclusão. Dizemos que x está
contido em y se todo elemento de x pertence a y. A fórmula para designar inclusão
é ∀z((z ∈ x) → (z ∈ y)). Observe que essa fórmula tem duas variáveis livres, x e y.
Abreviamos essa fórmula como x ⊂ y.
Assim como o sı́mbolo de pertinência, a inclusão é um predicado binário (ou
sı́mbolo relacional binário), pois relaciona uma propriedade entre dois objetos do
universo (no caso, o universo dos conjuntos). Poderı́amos ter introduzido o sı́mbolo
de inclusão entre os sı́mbolos primitivos, como o de pertinência. Mas como a inclusão
é perfeitamente definı́vel a partir da pertinência e dos demais sı́mbolos lógicos, é
tecnicamente mais fácil utilizarmos o sı́mbolo de inclusão apenas como abreviatura.
Outras abreviaturas são um pouco mais sutis na transcrição. Por exemplo, o
conjunto vazio é denotado por ∅. A rigor, para utilizarmos a expressão o conjunto
vazio e denotá-lo por um sı́mbolo, antes precisarı́amos mostrar que ele existe e é único.
Aceitemos esse fato, por enquanto, antes de o provarmos num momento oportuno.
Saber utilizar corretamente essa abreviatura requer um pouco mais de atenção.
Primeiro notemos que, ao contrário da inclusão, o conjunto vazio não se refere a uma
relação entre objetos, mas a um objeto em particular, e, ao contrário das variáveis,
22 CAPÍTULO 3. A LINGUAGEM DA TEORIA DOS CONJUNTOS
A5 (∀x(A)) → (Ayx ), se A é uma fórmula e x é uma variável que não ocorre livre no
escopo de y, em A;
sı́mbolo funcional, pois nem todas pessoas têm irmãos, e algumas têm mais que
um irmão. A expressão “o irmão de” pressupõe que o indivı́duo tem apenas um
irmão, e, na lógica, só poderı́amos usar algo semelhante se isso acontecesse a todos
os indivı́duos. Por outro lado, nada impede de considerarmos “é irmão de” como
sı́mbolo relacional binário, assim como “é pai de” como sı́mbolo relacional binário. A
formalização do “pai” permite escolhermos entre sı́mbolo funcional e relacional, mas
“irmão” necessariamente será um sı́mbolo relacional.
Na aritmética, há dois exemplos clássicos de sı́mbolos funcionais binários: as
operações + e ×, que representam funções que associam a cada dois números um ter-
ceiro. Também podemos considerar como constantes os números 0 e 1 (as constantes
também podem ser vistas como sı́mbolos funcionais 0-ário, ou seja, sem parâmetro
nenhum). Já a relação de ordem < é um sı́mbolo relacional binário.
A sucessiva aplicação de sı́mbolos funcionais (como em 1 × (x + 0), ou “a mãe do
pai de Joaquim”) constrói termos cada vez mais complexos, e os sı́mbolos relacionais
(e a própria igualdade) passam a relacionar termos, e não apenas variáveis. Embora
a preferência de notação, para sı́mbolo funcional ou relacional binário, é colocar o
sı́mbolo no meio dos termos, se o grau desse sı́mbolo for diferente de dois precisamos
mudar a notação, e, para isso, acrescentamos, no alfabeto, a vı́rgula. A definição de
termos passa a ser recursiva, semelhante a de fórmulas, conforme as regras:
• (M, σ) |= (A) → (B) se, e somente se, (M, σ) |= B ou não ocorre (M, σ) |= A;
• (M, σ) |= ∀x(A) se, e somente se, para toda atribuição de variáveis θ tal que
θ(y) = σ(y), para toda variável y diferente de x, temos (M, θ) |= A.
Exercı́cios
1. Usando a linguagem de primeira ordem da teoria dos conjuntos, escreva fórmulas
para representar as seguintes frases:
c) x é um conjunto unitário.
a) (∀x(x = y)) → (x ∈ y)
b) ∀x((x = y) → (x ∈ y))
e) (x = y) → ∃y(x = y)
30 CAPÍTULO 3. A LINGUAGEM DA TEORIA DOS CONJUNTOS
a) x é número primo.
b) x é menor do que y.
e) Todo número par maior do que dois pode ser escrito como soma de dois números
primos.
4. Julgue se cada uma das fórmulas abaixo é verdadeira em cada um dos seguintes
modelos: N, Z, Q, R.
a) ∀x∀y∃z(x + y = z)
c) ∃x(x × x = 1 + 1)
Axioma da extensão
O primeiro dos axiomas que estudaremos é quase uma definição de conjuntos, pois
nos diz que um conjunto é caracterizado exclusivamente pelos seus elementos.
Axioma 1 (da extensão) Dois conjuntos são iguais se, e somente se, eles têm os
mesmos elementos.
Conjunto dos paı́ses que já venceram alguma Copa do Mundo de fu-
tebol
O axioma da extensão nos garante que esse conjunto é o mesmo que o anterior.
Ou seja, vale aquela máxima que aprendemos no ensino básico: em um conjunto não
importa a ordem dos elementos nem contamos as repetições.
É claro que não estamos falando de conjuntos matemáticos, existentes em ZFC.
Mas é bom ressaltar que, sendo esse o primeiro axioma que enunciamos (o que é
necessário, pois esse axioma é fundamental para a compreensão do conceito de con-
junto), não podemos provar, neste momento, a existência de qualquer conjunto. Por
31
32 CAPÍTULO 4. AXIOMA DA EXTENSÃO
{1, 2}
{1, 3}
3
Portanto, podemos escrever 1 ∈ X, o que não deve causar nenhum impacto a um
estudante secundarista. Mas também podemos escrever
Temos aı́ a pertinênia entre dois conjuntos e, se compreendemos bem a notação das
chaves, não há motivo algum para nos assustarmos com isso.
Podemos também dizer que {1, 2} é um subconjunto de X? Vamos analisar isso
com calma, usando a definição lógica da inclusão de conjuntos. Precisamos verificar
se todo elemento de {1, 2} é, também, um elemento de X. Quais são os elementos
de {1, 2}? A resposta é fácil: 1 e 2. O número 1 pertence a X? Sim, vimos acima
que 1 é um dos elementos do conjunto X. E o 2, pertence a X? Não! Na descrição
dos elementos de X não consta o número 2. Encontramos, portanto, um elemento
de {1, 2} que não pertence a X. Denotamos isso como
Vimos que um conjunto pode pertencer a outro e não estar contido nele. Será
que pode um conjunto ser subconjunto e elemento de outro, ao mesmo tempo? Ve-
rifiquemos o conjunto {1, 3}. Ele é um elemento de X. Vale, portanto:
É importante ressaltar que essa análise foi feita na teoria ingênua dos conjuntos,
assumindo que os números naturais não são conjuntos. Se definı́ssemos, por exemplo,
o número 2 como o conjunto {1, 3}, terı́amos {1, 2} ∈ X. Mas esse não é o caso,
mesmo na construção que faremos dos números naturais. Na construção de Venn-
Euler, o número 2 será definido como o conjunto {0, 1}.
Os detalhes apresentados nessa discussão talvez tenham sido exagerados e exaus-
tivos, mas um vı́cio de aprendizagem é algo que requer muito esforço e cuidado para
ser superado. Os exercı́cios apresentados a seguir são imprescindı́veis para a continui-
dade do curso. Lembrem-se sempre: não esperem a véspera das provas para fazerem
os exercı́cios e tirarem as dúvidas!
Exercı́cios
Para esses exercı́cios, assumimos que os conjuntos enunciados existem, e não trata-
remos os números como conjuntos. Em particular, supomos que um número nunca
pertence a outro 1 .
a) {1} e {{1}}.
2. Para cada par de conjuntos abaixo, decida qual(is) dos sı́mbolos ∈ e ⊂ tornam
a fórmula verdadeira. Lembre-se que a resposta também pode ser ambos os sı́mbolos
ou nenhum deles. Justifique cada resposta.
b) {0} . . . {{0}}
Vimos no capı́tulo anterior o axioma da extensão, que caracteriza quando dois con-
juntos são iguais. No entanto, conforme frisamos nos exercı́cios e exemplos, apenas
com o axioma da extensão não podemos garantir a existência de qualquer conjunto
especı́fico. Por isso, nosso próximo axioma garante a existência de um conjunto bem
especial.
∃x∀y¬(y ∈ x)
Usando a notação ∈
/ para não pertence, o axioma do vazio pode ser reescrito como
∃x∀y(y ∈
/ x)
Na verdade, o axioma do vazio é dispensável, pois veremos que ele pode ser
provado a partir do axioma da separação, desde que assumamos que existe pelo menos
um conjunto. Assim,podemos reescrever o axioma do vazio como existe um conjunto 1
37
38 CAPÍTULO 5. AXIOMAS DO VAZIO, PAR E UNIÃO
Axioma 3 (do par) Para todos conjuntos x e y existe um conjunto cujos elementos
são x e y.
∀x∀y∃z∀w((w ∈ z) ↔ ((w = x) ∨ (w = y)))
Teorema 5.3 Para todo x, existe um conjunto formado só pelo elemento x.
∀x∃y∀z(z ∈ y ↔ z = x)
Com o axioma do par e o Teorema 5.3 podemos formar vários conjuntos a partir
do vazio. Aplicando o Teorema 5.3 tomando x como ∅ obtemos o conjunto {∅}. Pelo
axioma da extensão, esse conjunto é diferente de ∅, pois ∅ ∈ {∅} mas ∅ ∈ / ∅. Com
aplicações sucessivas do axioma do par (e do Teorema 5.3) criamos vários outros
conjuntos (ou melhor, provamos a existência de vários outros conjuntos), a partir do
vazio: {∅, {∅}}, {{∅}}, {{{∅}}}, {{∅}, {{∅}}}, e assim por diante. Usando o axioma
da extensão podemos provar que todos esses conjuntos são diferentes.
No entanto, o axioma do par não é o bastante para construirmos conjuntos com
mais de dois elementos. O próximo axioma – que também pertence ao grupo de
axiomas de construção – permite-nos construir todos os conjuntos finitos e heredi-
tariamente finitos. Isto é, conjuntos finitos cujos elementos são, também, conjuntos
finitos, e os elementos de seus elementos também são finitos, e assim por diante.
Axioma 4 (da união) Para todo conjunto x existe o conjunto de todos os conjuntos
que pertencem a algum elemento de x.
Repare que o axioma da união não garante, a princı́pio, a união de dois conjuntos,
mas, sim, a união de uma famı́la de conjuntos. Se pensarmos em um conjunto
de conjuntos como uma caixa cheia de pacotes menores, a união desse conjunto
de conjuntos corresponde a despejarmos todo o conteúdo dos pacotes menores na
caixa maior. Vejamos, como exemplo (assumindo que existe – visto que ainda nem
explicamos o que são os números naturais), o seguinte conjunto:
A união do conjunto acima é o conjunto formado por todos os números que pertencem
a pelo menos um de seus elementos, a saber:
{1, 2, 3, 4}
Teorema 5.4 Dados dois conjuntos x e y existe o conjunto formado por todos os
conjuntos que pertencem a x ou a y.
Teorema 5.6 Para todos conjuntos x, y e z existe um único conjunto cujos elemen-
tos são x, y e z.
∀x∀y∀z∃u∀v(v ∈ u ↔ (v = x ∨ v = y ∨ v = z))
Demonstração: Pelo axioma do par existe o conjunto {x, y}. Pelo Teorema 5.3
existe o conjunto {z}. Aplicando o Teorema 5.4 aos conjuntos {x.y} e {z} obtemos
um conjunto u formado por x, y e z.
Assim, introduzimos mais uma notação: se t, s e u são termos da linguagem da
teoria dos conjuntos, então {t, s, u} também é um termo, que corresponde ao conjunto
formado exatamente por t, s e u. Ao definirmos essa notação para termos, em vez
de variáveis, permitimos construir, formalmente, conjuntos como {∅, {x}, {∅}.
Seguindo o mesmo raciocı́nio, podemos usar os axiomas do par e da união para
provarmos a existência de conjuntos com quatro, cinco ou mais elementos, utilizando
a mesma notação das chaves. Isso justifica a notação que temos usado até agora, de
representar um conjunto finito (apesar de não termos definido ainda o que é conjunto
finito) indicando seus elementos entre chaves. Formalmente, podemos pensar nessa
notação como uma coleção infinita enumerável de sı́mbolos funcionais da linguagem,
sendo um sı́mbolo n-ário para cada n ≥ 1.
Exercı́cios
1. Para cada par de conjuntos abaixo, decida qual(is) dos sı́mbolos ∈ e ⊂ torna(m)
a fórmula verdadeira. Lembre-se que a resposta também pode ser ambos os sı́mbolos
ou nenhum deles. Justifique cada resposta e prove que os conjuntos abaixo existem.
2. Defina 0 como o conjunto vazio, 1 como o conjunto {0}, 2 como 1 ∪ {1} e 3 como
2 ∪ {2}.
(a) Prove que 0, 1, 2 e 3 existem e são diferentes um do outro.
(b) Prove que existe o conjunto x = {{0}, {0, 1}, {{1}}, {1, 2}, {{1, 2}}} e diga quais
dos conjuntos 0, 1, 2 e 3 pertencem a x.
41
S
(c) Calcule x, descrevendo seus elementos entre chaves.
3. Considere x o conjunto
{∅, {∅}, {∅, {∅}}}
(d) Escreva todos os subconjuntos de x e prove (com os axiomas que temos até
agora) que existe o conjunto de todos os subconjuntos de x. Isto é, existe z tal
que z ∈ y se, e somente se, z ∈ x
S S
4. Prove que ∅=∅e {x} = x.
S S
5. Prove que, se x ⊂ y, então x⊂ y.
(a) Prove que x é transitivo se, e somente se, y ∈ x implica y ⊂ x, para todo y.
S
(b) Prove que x é transitivo se, e somente, x ⊂ x.
7. Usando apenas os axiomas que temos até agora, podemos provar que x 6= {x}?
Justifique.
42 CAPÍTULO 5. AXIOMAS DO VAZIO, PAR E UNIÃO
Capı́tulo 6
O axioma seguinte já foi discutido, de alguma forma, nos exercı́cios do capı́tulo
anterior.
Axioma 5 (das partes) Para todo conjunto x existe o conjunto dos subconjuntos
de x.
∀x∃y∀z((z ∈ y) ↔ (z ⊂ x))
Se quisermos transformar a fórmula acima sem usar o sı́mbolo de inclusão, basta
escolhermos uma variável nova que não consta na fórmula (w, por exemplo) e substi-
tuirmos z ⊂ x pela fórmula ∀w((w ∈ z) → (w ∈ x)). É importante que o leitor esteja
familiarizado com essas abreviaturas e com o processo de converter essas abreviaturas
pela fórmula completa.
O conjunto definido pelo axioma das partes é único, para cada x. Isto é, fixado
um conjunto x, existe um único conjunto formado exatamente pelos subconjuntos
de x. A demonstração disso é, mais uma vez, uma simples aplicação do axioma da
extensão, e deixamo-la por conta do leitor. A existência e unicidade do conjunto dos
subconjuntos de um conjunto nos permite introduzir a seguinte definição:
Definição 6.1 Definimos o conjunto das partes de x como o conjunto dos subcon-
juntos de x, e denotaremos por P(x).
O próximo axioma da separação resgata a concepção inicial de Frege de definir
um conjunto através de uma fórmula lógica que descreve seus elementos. Mas, para
evitar o paradoxo de Russell, na formulação do axioma da separação é necessário
estabelecer um conjunto do qual iremos “separar” os elementos que satisfazem uma
determinada propriedade.
Assim, para cada fórmula P (x), temos que, para todo conjunto y, existe o con-
junto formado por todos x ∈ y tais que P (x) é verdadeiro.
Formalmente, o axioma da separação é um esquema de axiomas, isto é, uma lista
infinita de axiomas, conforme abaixo:
Axioma 6 (Esquema de axiomas da separação) Para cada fórmula P em que
z não ocorre livre a seguinte fórmula é um axioma:
∀y∃z∀x((x ∈ z) ↔ ((x ∈ y) ∧ P ))
43
44 CAPÍTULO 6. AXIOMAS DAS PARTES E DA SEPARAÇÃO
{x ∈ y : P (x)}
Notemos que a única restrição sobre a fórmula P é não conter z como variável li-
vre. Essa restrição é necessária porque utilizamos essa variável no axioma para definir
o conjunto {x ∈ y : P (x)}. Se permitirmos que a mesma variável que define o con-
junto dado pelo axioma da separação também ocorra livre em P , poderı́amos tomar
P como a fórmula x ∈ / z e terı́amos a seguinte instância do axioma da separação:
∀y∃z∀x((x ∈ z) ↔ ((x ∈ y) ∧ (x ∈
/ z)))
Se tomássemos, por exemplo, y = {∅} e x = ∅, terı́amos x ∈ y verdadeiro e,
portanto, terı́amos
(x ∈ z) ↔ (x ∈
/ z)
o que é uma contradição.
Não precisamos impor qualquer outra restrição sobre as variáveis livres em P .
Em todas as aplicações do axioma da separação, a variável x ocorre livre em P (por
isso utilizamos a notação P (x) para a fórmula P ). Mas se x não ocorrer livre em
P , isso não causará inconsistência no sistema. Apenas a aplicação do axioma da
separação seria trivial, pois o conjunto z seria vazio ou o próprio y (já que a validade
de P , nesse caso, não depende da variável x, que não ocorre livre em P ).
Podemos ter outras variáveis livres em P além de x. Isso ocorre, por exemplo,
na definição de intersecção de conjuntos:
a ∩ b = {x ∈ a : x ∈ b}
A própria variável y (que reservamos para o – digamos – “conjunto universo”)
pode ocorrer livre em P , como na seguinte definição:
{x ∈ y : x ⊂ y}
Com essa formulação do sistema de Zermelo-Fraenkel o Paradoxo de Russell ga-
nha um novo significado, conforme o teorema seguinte.
∀x∃y(y ∈
/ x)
(x ∈ z) ↔ ((x ∈ y) ∧ (x ∈
/ x))
(x ∈ z) ↔ (x ∈
/ x))
45
(z ∈ z) ↔ (z ∈
/ z)
{x ∈ y : x 6= x},
{v ∈ z : ∀w((w ∈ x) → (v ∈ w))}
Intersecção: x ∩ y = {z ∈ x : z ∈ y}
Subtração: x r y = {z ∈ x : z ∈
/ y}
Exercı́cios
1. Escreva o conjunto P({∅, {∅}}).
S
2. Prove que P(x) = x.
{{x} : x ∈ X}
Axioma da infinidade
∀y(y ∈ x+ ↔ (y ∈ x ∨ y = x))
Definição 7.2 Dizemos que um conjunto x é indutivo se, e somente se, ∅ ∈ x e, para
todo y, se y ∈ x então y + ∈ x.
O axioma da infinidade nada mais diz que a existência de algum conjunto indu-
tivo.
47
48 CAPÍTULO 7. AXIOMA DA INFINIDADE
Definição 7.3 Definimos o conjunto dos números naturais – que será denotado por
ω – como o seguinte conjunto:
\
ω = {x ∈ P(I) : x é indutivo}
(d) Se n ∈ ω e m ∈ n então n ∈
/ m.
S = {n ∈ ω : n ⊂ ω}
Mostraremos que S é indutivo. Pelo Teorema 7.4, parte (b), isso é suficiente para
mostrar que S = ω.
Claramente, ∅ ∈ S. Assumindo que n ∈ S, provaremos que n+ ∈ S. Ou seja,
mostraremos que, se n ⊂ ω, então n ∪ {n} ⊂ ω. De fato, se x ∈ n ∪ {n}, temos duas
possibilidades. Ou x ∈ n, o que, por hipótese, implica que x ∈ ω, ou x = n, que
pertence a ω.
Provamos, assim, que S = ω e, portanto, todo elemento de ω é um subconjunto
de ω, o que prova o item (a).
Para o item (b), considere S o conjunto dos elementos transitivos de ω. Ou seja
S = {n ∈ ω : ∀m(m ∈ n → m ⊂ n)}
S = {n ∈ ω : ∀m(m ∈ n → n ∈
/ m)}
50 CAPÍTULO 7. AXIOMA DA INFINIDADE
é um axioma.
O próximo teorema diz que o conjunto ω serve como domı́nio de um modelo para
os axiomas de Peano, interpretando 0 como ∅ e s(n) como n+ .
(a) n ∈ m, m ∈ n ou m = n.
(b) n ⊂ m ou m ⊂ n.
n ∈ m → (n+ ∈ m ∨ n+ = m)
Exercı́cios:
1. Prove, a partir dos axiomas de Peano, os seguintes teoremas:
(b) Zero é o único número natural que não é sucessor de algum número natural.
10.
S Descreva – usando apenas o conjunto vazio, as chaves e a vı́rgula – o conjunto
P(3 r 1).
Capı́tulo 8
Relações e funções
Definição 8.1 Dados dois conjuntos a e b, definimos o par ordenado (a, b) como o
conjunto {{a}, {a, b}}. Ou seja,
É fácil verificar que o par ordenado entre quaisquer conjuntos existe (aplicando
três vezes o axioma do par: uma para formar o conjuntoi {a}, outra para o conjunto
{a, b} e outra para o conjunto {{a}, {a, b}}) e é único (aplicação padrão do axioma
da extensão).
Assim, podemos introduzir a notação (a, b) como mais um sı́mbolo funcional
binário na nossa linguagem estendida da teoria dos conjuntos (ou mais uma abrevi-
atura).
Notemos que, quando a = b, o par ordenado (a, b) é igual ao conjunto {{a}}.
Teorema 8.2 Dois pares ordenados (a, b) e (c, d) são iguais se, e somente se, a = c
e b = d.
53
54 CAPÍTULO 8. RELAÇÕES E FUNÇÕES
Teorema 8.3 Dados dois conjuntos A e B, existe o conjunto de todos os pares or-
denados (a, b) que satisfazem a ∈ A e b ∈ B.
Para verificarmos que X atende as condições do teorema, só resta verificarmos que
todo par ordenado (a, b), onde a ∈ A e b ∈ B, pertence a P(P(A ∪ B)).
De fato, {{a}, {a, b}} ∈ P(P(A ∪ B)) é equivalente a {{a}, {a, b}} ⊂ P(A ∪ B),
que ocorre se, e somente se, {a} ∈ P(A ∪ B) e {a, b} ∈ P(A ∪ B), o que é verdade,
pois {a} ⊂ A ∪ B e {a, b} ⊂ A ∪ B.
O conjunto estabelecido pelo Teorema 8.3 é chamado de produto cartesiano de A
e B, e será denotado por A × B. Introduzimos essa notação como outra abreviatura,
desempenhando o papel de um sı́mbolo funcional binário.
A partir do produt cartesiano definimos o conceito de relação, como um subcon-
junto de um produto cartesiano.
Definição 8.4 Dizemos que R é uma relação (ou relação binária) entre A e B se é
um subconjunto de A × B. Quando R é uma relação, utilizamos a notação xRy como
abreviatura de (x, y) ∈ R.
diferentes. Mas, para efeito do Teorema 8.2, e seu análogo para triplas, são idênticos.
De fato, poderı́amos definir, sem problemas, (a, b, c) como (a, (b, c)), e terı́amos a
mesma propriedade de duas triplas serem iguais se, e somente se, as coordenadas
correspondentes são iguais.
Podemos estender essa definição para n-uplas ordenadas. Formalmente (mas nem
tanto), definimos (a1 , . . . , an ) como ((a1 , . . . , an−1 ), an ). É bom lembrarmos que essa
definição recursiva ainda não pode ser feita rigorosamente na linguagem de primeira
ordem, pois utiliza o teorema de recursão sobre classes, que ainda não vimos.
Para n ≥ 2 definimos An o conjunto das n-uplas (a1 , . . . , an ) tais que ai ∈ A, para
todo i entre 1 e n. Na metalinguagem, formalizamos An como An−1 × A, sendo que
A1 é, por definição, o próprio conjunto A. Vemos, por essa definição, que A2 = A×A.
Outra maneira, mais precisa, de definirmos An é como o conjunto das funções
(como veremos daqui a pouco) de n em A.
8.4 Funções
Uma função de A em B é uma relação que associa a cada elemento de A um único
elemento de B. Posto isso formalmente temos a seguinte definição:
Por outro lado, essa ambiguidade não existe ao definirmos o domı́nio e a imagem
a partir da função. É possı́vel “recuperar” o domı́nio e a imagem de uma função.
Abaixo seguem as definições do domı́nio e imagem a partir da função, e a tarefa de
mostrar que essas definições cumprem o prometido é deixada ao leitor:
[[
dom(f ) = {a ∈ f : ∃b((a, b) ∈ f )}
[[
im(f ) = {b ∈ f : ∃a((a, b) ∈ f )}
Nessas definições é bom notar em como os axiomas do par e das partes “empa-
cotam” os conjuntos, enquanto o axioma da união “desempacota”.
Também notamos que as mesmas definições podem ser aplicadas para relações
binárias quaisquer.
Como uma função associa a cada elemento do domı́nio um único elemento da
imagem, podemos introduzir a seguinte notação: se (x, y) pertence a uma função f ,
denotamos y por f (x). Essa notação só é possı́vel, pois, para x ∈ dom(f ), existe
um único y satisfazendo (x, y) ∈ f . Porém, precisamos ser mais cautelosos com essa
notação do que somos com outras como a do par ({a, b}), da união de dois conjuntos
(a ∪ b) e do par ordenado. Isso porque, enquanto as outras notações valem para
quaisquer termos, f (x) só está bem definido quando f é uma função e x pertence ao
domı́nio de f . Logo, não podemos desavisadamente introduzir essa notação como um
sı́mbolo funcional binário da linguagem, pois f (x) não está definido para quaisquer
conjuntos f e x.
Outra notação que podemos introduzir – comum na linguagem cotidiana da ma-
temática – é f : A −→ B para designar que f é uma função de A em B, ou, em
outras palavras (ou melhor, sı́mbolos), f ∈A B. A notação f : A −→ B deixa
implı́cito que f é uma função, o domı́nio de f é A e a imagem de f está contida em
B. Se escrevemos que f : A −→ B é sobrejetora, isso significa que f é sobrejetora em
relação a B. Ou seja, que a imagem de f é B. Da mesma forma, quando escrevemos
que f : A −→ B é bijetora, dizemos que f é bijetora em relação a B, isto é, é injetora
e tem imagem igual a B.
Suponha que f é uma função de A em B e que C é um subconjunto de A.
Definimos
f |C = (C × B) ∩ f
a restrição de f ao conjunto C. Fica como exercı́cio ao leitor mostrar que f |C é uma
função de C em B.
Dizemos que uma função f : A −→ B é injetora se, para todo x, y ∈ A temos
que, se x 6= y, então f (x) 6= f (y). Ou seja, quando dois elementos distintos do
domı́nio nunca são mapeados para o mesmo elemento da imagem. Dizemos que f é
sobrejetora em relação a B se para todo y ∈ B existe x ∈ A tal que f (x) = y. Ou
seja, quando B é a imagem de f . A necessidade de relativizarmos a B a definição de
sobrejetora vem daquele problema anteriormente mencionado, sobre a impossibilidade
de “recuperarmos” o contra-domı́nio de uma função. Quando está claro no contexto
qual contradomı́nio está sendo considerado (quando, por exemplo, escrevemos que
“f é uma função de A em B”) dizemos apenas que a função é sobrejetora, mas é
necessária uma cautela extra para esse tipo de nomenclatura.
8.4. FUNÇÕES 57
Exercı́cios
1. Encontre uma definição alternativa para par ordenado de modo que o Teo-
rema 8.2 continue valendo. Justifique.
6. Escreva uma fórmula de primeira ordem, de três variáveis livres, sem abreviaturas
da linguagem de teoria dos conjuntos, que significa “x é uma função de y em z”.
9. Dada uma relação R, definimos a inversa de R – que será denotada por R−1 –
como o conjunto {(y, x) : (x, y) ∈ R}. Com base nisso, prove as seguintes asserções:
(a) Para toda relação R existe R−1 .
(b) Se f é uma função, f −1 é uma função se, e somente se, f é injetora.
(c) Se f e g são funções injetoras tais que im(g) ⊂ dom(f ), então (f ◦g)−1 = g −1 ◦f −1 .
10. Prove que existe uma função injetora de ω em ω que não é sobrejetora (em
relação a ω).
58 CAPÍTULO 8. RELAÇÕES E FUNÇÕES
Capı́tulo 9
Já definimos o conjunto dos números naturais e mostramos que esse satisfaz os axi-
omas de Peano. Vamos, agora, definir as operações de adição e multiplicação, como
funções de ω × ω em ω. Para isso, precisamos, antes, definir o teorema da recursão.
• f (0) = x;
Precisamos provar que f é uma função e que satisfaz a condição para pertencer a C.
Afirmação 1: f ∈ C
Vamos provar, por indução, que para todo n ∈ ω vale a fórmula P (n), definida
abaixo:
59
60 CAPÍTULO 9. ARITMÉTICA DOS NÚMEROS NATURAIS
Vamos provar P (0). Pela afirmação 1, (0, x) ∈ f . Vamos provar que, se (0, y) ∈ f ,
então y = x. Suponha, por absurdo, que existe y 6= x tal que (0, y) ∈ f . Considere
R = f r {(0, y)}. Vamos verificar que R ∈ C. De fato, (0, x) ∈ R, pois (0, x) ∈ f
e x 6= y. Se (n, y) ∈ R, então (n, y) ∈ f , pois R ⊂ f . Logo, (n+ , g(y)) ∈ f (pela
afirmação 1). Como n+ 6= 0 (axioma 4 de Peano), temos que (n+ , g(y)) ∈ f é diferente
de (0, y) e, portanto, pertence a R.
Portanto, concluı́mos que R ∈ C, o que implica que f ⊂ R. Como R ⊂ f , temos
f = R, absurdo, pois (0, y) ∈ f e (0, y) ∈
/ R.
Vamos agora provar que P (n) implica P (n+ ).
Assumindo P (n) como verdadeiro, temos que existe y tal que (n, y) ∈ f . Logo,
como f ∈ C, temos que (n+ , g(y)) ∈ f , provando a “primeira parte” de P (n+ ).
Agora supomos, por absurdo, que existe z 6= g(y) tal que (n+ , z) ∈ f . Defina
R = f r {(n+ , z)}. Vamos verificar que R ∈ C,
Como n+ 6= 0, continuamos tendo (0, x) ∈ R. Suponha que (m, v) ∈ R. Como
f ∈ C e R ⊂ f temos que (m+ , g(v)) ∈ R. Se m 6= n, o axioma 3 de Peano nos
garante que m+ 6= n+ , logo, (m+ , g(v)) 6= (n+ , z), provando que (m+ , g(v)) ∈ R. Se
m = n, pela hipótese indutiva P (n) temos que v = y (pois (n, y) ∈ f ), e já vimos
que (n+ , g(y) ∈ f . Como z 6= g(y), também temos que (n+ , g(y) ∈ R. Provamos,
com isso, que R ∈ C o que novamente contradiz com o fato de R estar contido
propriamente em f . Isso conclui a demonstração da afirmação 2.
Das afirmações 1 e 2 segue imediatamente o teorema. Sendo f uma função de
domı́nio ω e satisfazendo as condições da famı́lia de conjuntos C, temos que (0, x) ∈ f ,
o que significa que f (0) = x. Como, para todo n, temos, pela própria definição de
função, (n, f (n)) ∈ f , da afirmação 1 segue que (n+ , g(f (n)) ∈ f , o que significa que
f (n+ ) = g(f (n)).
A unicidade da função f pode ser provada por indução. Suponha que existe
h satisfazendo as mesmas condições do teorema estabelecidas para f . Temos que
f (0) = h(0), pois ambos são iguais a x. Se f (n) = h(n), então g(f (n)) = g(h(n)), e
ambos são iguais a f (n+ ) e h(n+ ). Logo, por indução, f = h.
sm (0) = m
Exercı́cios
1. Use o teorema da recursão para definir a função f (n) = 2n , para n ∈ ω.
Axioma da regularidade
Até agora, todos os axiomas que vimos garantem a construção de alguns conjuntos
partindo apenas do conjunto vazio. O próximo axioma garante que todos os conjuntos
são construı́dos a partir do vazio. Também irá evitar coisas como x ∈ x e será útil
em teoria dos modelos para fazermos indução sobre a relação de pertinência.
Axioma 8 (da regularidade) Para todo conjunto x não-vazio existe y ∈ x tal que
x ∩ y = ∅.
∀x(x 6= ∅ → ∃y(y ∈ x ∧ x ∩ y = ∅))
63
64 CAPÍTULO 10. AXIOMA DA REGULARIDADE
É bom notar que se, por um lado, não existe uma sequência infinita decrescente,
na relação de pertinência, por outro lado, como veremos no próximo capı́tulo, é
possı́vel existir uma sequência infinita crescente. Ou seja, sequências infinitas da
forma x0 ∈ x1 ∈ x2 . . . existem (os números naturais, por exemplo).
Exercı́cios
1. Usando o axioma da regularidade, prove que não existem x, y, z tais que x ∈ y,
y ∈ z e z ∈ x.
3. Use o axioma da regularidade para provar que o conjunto vazio pertence a todo
conjunto transitivo não-vazio.
5. Prove que existe um modelo para teoria dos conjuntos em que valem os axiomas
do par, da união e das partes, mas não valem os axiomas do vazio e da regularidade.
Dica: Considere um modelo formado por um único elemento x tal que x ∈ x.
Capı́tulo 11
X/R = {[x] : x ∈ X}
onde
[x] = {y ∈ X : xRy}
65
66 CAPÍTULO 11. CONSTRUÇÃO DOS CONJUNTOS NUMÉRICOS
S
(a) X/R = X;
(b) ∅ ∈
/ X/R;
(d) Se x ∈ Y e todo Y ∈ X/R, para todo y ∈ X temos que xRy se, e somente se,
y ∈Y.
Z = (ω × ω)/R
(b) Para todos a, b, c, d em ω temos que S([(a, b)], [(c, d)]) = [(a + c, b + d)];
(c) Para todos a, b, c, d em ω temos que P ([(a, b)], [(c, d)]) = [(ac + bd, ad + bc)].
(x, y, z) ∈ S. Mas isso é verdade, pois pelo Teorema 11.2, parte (b), existe x e y são
não-vazios. Logo, existem (a, b) ∈ x e (c, d) ∈ y. Pela parte (a) do mesmo teorema,
existe z tal que (a + c, b + c) ∈ z, o que nos dá, pela definição de S, que (x, y, z) ∈ S.
O mesmo argumento mostra que, para todo (x, y) ∈ Z2 , existe z tal que (x, y, z) ∈ P ,
tomando, desta vez, z contendo (ac + bd, ad + bc).
Isso já prova, quando concluirmos que S e P são funções, as partes (b) e (c) do
presente teorema.
Agora vejamos a unicidade. Suponha que (x, y, z) ∈ S e (x, y, z 0 ) ∈ S. Pela
definição de S, (x, y, z) ∈ S implica que existem números naturais a, b, c, d tais que
(a, b) ∈ x, (c, d) ∈ y e (a + c, b + d) ∈ z, e (x, y, z 0 ) ∈ S implica que existem números
naturais a0 , b0 , c0 , d0 tais que (a0 , b0 ) ∈ x, (c0 , d0 ) ∈ y e (a0 + c0 , b0 + d0 ) ∈ z 0 .
Note que não podemos, a princı́pio, assumir que os números a, b, c, d que teste-
munham que (x, y, z) ∈ S são os mesmos que testemunham que (x, y, z 0 ) ∈ S.
Porém, como (a, b) e (a0 , b0 ) ambos pertencem a x, o Teorema 11.2, parte (d),
nos garante que (a, b)R(a0 , b0 ). Da mesma forma temos (c, d)R(c0 , d0 ). Logo, pela
afirmação, (a + c, b + d)R(a0 + c0 , b0 + d0 ). Logo, o Teorema 11.2, parte (d), também
nos assegura que (a0 + c0 , b0 + d0 ) ∈ z. Portanto, (a0 + c0 , b0 + d0 ) ∈ z ∩ z 0 , o que implica,
pela parte (c) do Teorema 11.2, que z = z 0 , como querı́amos provar.
A demonstração de que P é uma função é análoga.
Sendo x e y números inteiros, denotamos S((x, y)) por x + y, e P ((x, y)) por
x · y ou, simplesmente, xy. Como estamos usando os mesmos sı́mbolos em conjuntos
diferentes, estamos fugindo um pouco do rigor da lógica, e precisamos estar atentos
ao contexto. O importante é nunca perder a conexão com a linguagem lógica estrita,
estando ciente de como cada uma dessas notações funciona como abreviatura.
Definir função em classes de equivalência através de um representante, para de-
pois mostrar que a definição independe da escolha do representatne, é uma prática
bastante comum no cotidiano da matemática, com a qual o estudante deve ter se
deparado diversas vezes. Aqui foi apresentada a formalização desse processo, que,
como podemos notar, não é trivial, apesar de ser bem intuitivo. Reparem que todos
os itens do Teorema 11.2 foram utilizados e, na demonstração desse, foram utilizadas
todas as três propriedades de relação de equivalência.
Definimos
Q = (Z × (Z r {0Z }))/R
Obviamente, a classe de equivalência representada pelo par (a, b) corresponde ao
número racional representado pela fração ab , e R é a equivalência de frações.
Definimos a soma e o produto de números reais da seguinte forma:
[(a, b)] + [(c, d)] = [(ad + bc, bd)]
[(a, b)] · [(c, d)] = [(ac, bd)]
Deixamos como exercı́cio ao leitor provar que essa definição independe da escolha
do representante. Os demais detalhes para a formalização são iguais aos que foram
feitos anteriormente.
Exercı́cios
1. Seja X um conjunto e sejam x0 e y0 dois elementos distintos de X. Considere a
seguinte relação em X:
(c) Prove que duas relações de equivalência diferentes possuem classes de equi-
valências diferentes.
3. Como fica uma relação de equivalência sobre ∅? Ela satisfaz o Teorema 11.2?
Axioma da substituição
Veremos agora o último axioma (ou melhor, esquema de axiomas) de ZF (isto é, o
sistema de Zermelo e Fraenkel sem o axioma da escolha).
Axioma 9 (da substituição) Seja P (x, y) uma fórmula e suponha que, para todo
x, y, z temos que P (x, y) e P (x, z) implicam y = z. Então, para todo conjunto X,
existe o conjunto
{y : ∃x(x ∈ X ∧ P (x, y))}.
A condição sobre a fórmula P diz que, para todo x, existe no máximo um y para
o qual P (x, y) vale. Ou seja, P exerce o papel de uma função parcial em X, e o
axioma da substituição garante que existe a imagem dessa “função”.
Para simplificar a notação, introduzimos alguns sı́mbolos lógicos que serão utili-
zados neste capı́tulo. O sı́mbolo ∃0 significa “existe no máximo um” e é definido da
seguinte forma:
∃0 xP ≡ ∀y(Pxy → (x = y))
O sı́mbolo ∃! significa “existe um único” e é definido como
71
72 CAPÍTULO 12. AXIOMA DA SUBSTITUIÇÃO
É claro que essa definição não está boa. Além de definirmos rigorosamente o conjunto
z acima, sem usarmos as reticências, precisamos provar que ele existe, e é nesse ponto
que entrarão o axioma da substituição e o teorema da recursão “para classes”.
73
g = f ∪ {(n+ , y)}
Vale f 0 (0) = f (0) pois ambos são iguais a x0 . Suponha f 0 (n) = f (n). Pela
hipótese sobre G, e por valer G(f 0 (n), f 0 (n+ )) e G(f (n), f (n+ )), isso significa que
f 0 (n+ ) = f (n+ ), como querı́amos.
Uma das aplicações do Teorema 12.1 é a definição do fecho transitivo de um
conjunto. Dizemos que y é o fecho transitivo de x se y é transitivo, x está contido
em y e, para qualquer conjunto transitivo z, se x ⊂ z então y ⊂ z. Ou seja, o fecho
transitivo de x é o menor conjunto transitivo que contém y. Está claro que o fecho
transtivio, quando existe, é único. A existência segue do teorema anterior.
Exercı́cios
1. Prove o Teorema 9.1 como corolário do Teorema 12.1.
Relações de ordem
77
78 CAPÍTULO 13. RELAÇÕES DE ORDEM
Aplicamos os termos acima também para o conjunto ordenado (X, ≤) e, por abuso
de notação, para o domı́nio X.
Uma ordem total tem esse nome porque todos os elementos do domı́nio podem
ser comparados. Também a chamamos de ordem linear porque podemos visualizar
todos os elementos da ordem como se estivessem numa mesma reta. As ordens usuais
nos números naturais, inteiros, racionais e reais são exemplos de ordens totais.
Nota-se que toda boa ordem também é uma ordem total, uma vez que o conjunto
{x, y} tem mı́nimo, o que nos dá x ≤ y ou y ≤ x.
Uma árvore é uma ordem que pode “bifurcar”, mas nunca “juntar”, como na copa
de uma árvore, em que o tronco se ramifica em galhos, que se ramificam em galhos
menores, mas os galhos nunca se reajuntam. Além das numerosas aplicações em
teoria dos conjuntos, as árvores são usadas em computação e em teoria dos jogos. Por
exemplo, as possı́veis sequências de jogadas a partir de uma posição numa partida de
xadrez formam uma árvore, que um programa de computador (ou o cérebro humano,
de uma maneira mais intuitiva) analisará para poder decidir o melhor lance.
Uma ordem total é uma árvore, já que todo o conjunto é uma cadeia e, portanto,
todos seus subconjuntos são cadeias.
Se considerarmos a ordem da inclusão em uma famı́lia de conjuntos fechada pelas
operações de união e intersecção, essa ordem será um reticulado, onde o ı́nfimo de
{x, y} é x ∩ y, e o supremo é x ∪ y. Esse tipo de ordem é particularmente interessante
nos estudos de álgebras de Boole. O reticulado é um pouco mais geral, pois temos as
operações de supremo e ı́nfimo (que correspondem às operações booleanas “e” e “ou”)
mas não precisamos do complemento (correspondente à operação booleana “não”).
Também é evidente que toda ordem total é um reticulado, já que o próprio x e o
próprio y serão um deles o ı́nfimo e o outro o supremo do conjunto {x, y}.
Por abuso de linguagem, se (X, ≤) é uma boa ordem dizemos que X é um conjunto
bem-ordenado. Obviamente, isso só faz sentido quando, no contexto, está claro qual é
a ordem ≤. Por exemplo, nos números naturais, sabemos que a ordem usual coincide
com a ordem da inclusão. Mostraremos, então, o seguinte teorema:
o que implica, pela hipótese sobre F (x, y), que f (x) = g(x), concluindo que f = g.
Suponha, por indução transfinita, que a afirmação seja verdadeira para todo
y < x. Considere o conjunto
←
Z = {g : ∃y(y ∈ x ∧G(y, g))}
Exercı́cios
1. Considere X o conjunto das funções f tais que dom(f ) ∈ ω e im(f ) ⊂ ω. Prove
que (X, ⊂) é uma árvore.
Prove que (X, ⊂) é um reticulado. Assuma, sem provar, que união e intersecção de
conjuntos finitos são finitas.
Axioma da escolha
O axioma da escolha enuncia que, dada uma famı́lia de conjuntos não-vazios, existe
uma função que a cada conjunto pertencente a essa famı́lia seleciona um elemento
desse conjunto.
∀x(∅ ∈
/ x → ∃f ((f é função) ∧ (dom(f ) = x) ∧ ∀y(y ∈ x → f (y) ∈ y)))
83
84 CAPÍTULO 14. AXIOMA DA ESCOLHA
O fato de (ω, ⊂) ser bem ordenado garante que f é uma função cujo domı́nio é
x, e é claramente uma função de escolha.
Vimos, portanto, dois casos particulares do axioma da escolha que são teoremas
de ZF. Então surge a pergunta: quando precisamos do axioma da escolha para provar
a existência de uma função de escolha em x? A resposta é: quando x é infinito e
não existe uma maneira explı́cita e bem determinada de escolher um único elemento
de cada elemento de x.
Bertrand Russell forneceu uma comparação bastante interessante e curiosa para
explicar o axioma da escolha: para escolhermos uma meia de cada par de meias,
dentre uma coleção infinita de pares de meias, precisamos usar o axioma da escolha;
se forem sapatos, não precisamos. Isso porque, no caso dos sapatos, podemos escolher
o pé direito de cada par, e, no caso das meias, os pés de cada par são indistinguı́veis.
85
Teorema 14.1 (Lema de Zorn) Se (X, ≤) é uma ordem parcial em que toda ca-
deia admite limitante superior, então (X, ≤) admite um elemento maximal.
não ser procurar uma demonstração rigorosa, que é árdua, trabalhosa e pouco intui-
tiva. A discussão precedente só serve para dar ao leitor uma vaga noção sobre o que
significa o lema de Zorn e por quê ele vale.
Vamos à demonstração formal, que é adaptada do livro de Halmos, que, por sua
vez, atribui a Zermelo a criação dessa prova.
Começamos definindo X o conjunto das cadeias em X, ordenado pela inclusão.
Mostraremos que X tem um elemento maximal, e isso será suficiente para mostrar
que X tem um elemento maximal, conforme a seguinte afirmação:
A ∪ {f ({x ∈ X r A : A ∪ {x} ∈ X})} , se A não é maximal;
s(A) =
A , se A é maximal;
• ∅ ∈ T;
• se A ∈ T então s(A) ∈ T ;
87
S
• se C é uma cadeia em (T, ⊂) então C ∈ T.
Existe pelo menos uma torre, pois claramente X é uma. Logo, podemos introduzir
a seguinte definição: \
X 0 = {T ⊂ X : T é uma torre}.
Deixamos a cargo do leitor provar essa afirmação, que é bem semelhante à de-
monstração de que ω é um conjunto indutivo. Pela minimalidade de X 0 iremos
fazer algumas provas utilizando uma espécie de indução, onde s desempenha o papel
de sucessor. Na verdade, pela terceira condição sobre torres, essa indução mais se
aproxima da indução transfinita, que veremos posteriormente.
A prova dessa afirmação usa uma espécie de indução, como dissemos anterior-
mente. Precisamos apenas mostrar que g(C) é uma torre e seguirá da afirmação 3
que g(C) = X 0 .
Está claro que ∅ ∈ g(C), pois ∅ ⊂ C. Seja S uma cadeia em g(C). Temos duas
possibilidades: ou todo A ∈ S está contido em S C ou existe pelo menos
S um A ∈ S
tal que s(C) ⊂ A. No primeiro
S caso, temos SS ⊂ C e, portanto,
S S ∈ g(C). No
segundo caso, como A ⊂ S, temos s(C) ⊂ S e, novamente, S ∈ g(C). Para
mostrar que g(C) é torre só falta mostrar que, se A ∈ s(C) então s(A) ∈ g(C).
Seja A ∈ g(C). Temos três casos. Ou A = C, ou A está contido propriamente
em C ou s(C) ⊂ A.
No primeiro caso, temos s(A) = s(C). Em particular, s(C) ⊂ s(A), o que prova
que s(A) ∈ g(C).
No segundo caso, supomos que A está contido propriamente em C. Como C
é comparável, temos C ⊂ s(A) ou s(A) ⊂ C. Se s(A) ⊂ C temos s(A) ∈ g(C).
Assumimos, então, que C ⊂ s(A). Se C = s(A) caı́mos no caso s(A) ⊂ C. Se
C 6= s(A) existe x ∈ s(A) r C. Mas, pela hipótese de A estar contido propriamente
88 CAPÍTULO 14. AXIOMA DA ESCOLHA
Teorema 14.2 (Princı́pio da Boa Ordem) Para todo conjunto X existe uma relação
≤ tal que (X, ≤) é uma boa ordem.
parcial. Se Y não for todo o conjunto X, mostramos que esse pode ser estendido um
pouco mais, contradizendo sua maximalidade.
Quando a propriedade que queremos mostrar para X envolve alguma estrutura
– neste caso, uma ordem – é natural que, nessa ordem parcial que criamos, conside-
remos algo a mais que os subconjuntos de Y . No caso deste teorema, o domı́nio da
ordem parcial é formada pelos conjuntos bem-ordenados (Y, ≤) tais que Y ⊂ X, e
na definição da ordem, precisamos respeitar a compatibilidade entre esses conjuntos
ordenados.
Vamos à demonstração.
Definimos uma ordem parcial (X, ) da seguinte forma: X é o conjunto de todos
os conjuntos bem-ordenados (Y, ≤) tais que Y ⊂ X, e (Y1 , ≤1 ) (Y2 , ≤2 ) se, e
somente se, as seguintes condições são satisfeitas:
1. Y1 ⊂ Y2 ;
3. se x ∈ Y1 e y ∈ Y2 r Y1 então x ≤ y.
Fica como exercı́co ao leitor mostrar que (X, ) é um conjunto ordenado. Pro-
varemos que ele satisfaz a hipótese do lema de Zorn.
Seja S uma cadeia em X. Definimos
[
Y = {Y 0 : ∃ ≤0 : (Y 0 , ≤0 ) ∈ S}
e [
≤= {≤0 : ∃Y 0 : (Y 0 , ≤0 ) ∈ S}
Para provar a afirmação, primeiro verifiquemos que ≤ é uma boa ordem sobre X.
Como S é uma cadeia, dados x, y, z ∈ Y existe (Y 0 , ≤0 ) ∈ S tal que x, y, z ∈ Y 0 e,
para todos u, v ∈ Y 0 , temo u ≤ v se, e somente se, u ≤0 v. Portanto, as propriedades
de ordem são satisfeitas para ≤, pois são satisfeitas para ≤0 . Portanto, ≤ é uma
ordem.
Para verificar que ≤ é uma boa ordem, considere Z ⊂ Y um conjunto não-vazio.
Portanto, existe (Y1 , ≤1 ) ∈ S tal que Z ∩ Y1 6= ∅. Por hipótese, existe z ∈ Z ∩ Y1 que
é mı́nimo, em relação à ordem ≤1 . Vamos mostrar que também é o mı́nimo de Z, em
relação a ≤.
Suponhamos, por absurdo, que existe w ∈ Z tal que w 6= z e w ≤ z. Como z é
mı́nimo de Z ∩ Y1 , temos que w ∈ / Y1 Tome (Y2 , ≤2 ) tal que w ∈ Y2 . Como S é uma
cadeia, vale (Y2 , ≤2 ) (Y1 , ≤1 ) ou (Y1 , ≤1 ) (Y2 , ≤2 ). Mas o primeiro caso não é
possı́vel, pois w ∈ Y2 r Y1 .
Temos, então, (Y1 , ≤1 ) (Y2 , ≤2 ). Da condição 3 da ordem segue que z ≤2 w.
Porém, como w ≤ z, da definição de ≤, do fato de S ser uma cadeia e da condição 2
da ordem seguem que w ≤2 z (deixamos os detalhes dessa passagem como exercı́cio
90 CAPÍTULO 14. AXIOMA DA ESCOLHA
Demonstração: Já provamos que (a) implica (b) e que (b) implica (c), lembrando
que a demonstração do princı́pio da boa ordem não utiliza diretamente o axioma da
escolha, mas apenas o lema de Zorn. Resta mostrar que (c) implica (a), cuja ideia
da demonstração já foi discutida no inı́cio deste capı́tulo.
Seja X um conjunto de conjuntos não-vazios. S Aplicando o princı́pio da boa
ordem, considere ≤ uma boa ordem no conjunto X. Definiremos uma função de
escolha que a cada elemento x de X associa o mı́nimo de x, isto é:
[ [
f = {(x, y) ∈ X × X : (y ∈ x) ∧ ∀z(z ∈ X → y ≤ z}
PelaSpropriedade de boa ordem e pelo fato de ∅ ∈ / X, para todo x ∈ X existe
y ∈ x tal que (x, y) ∈ f . A unicidade do elemento mı́nimo, como já foi discutido
anteriormente, segue da antissimetria da ordem (se y e z fossem “dois mı́nimos”,
terı́amos y ≤ z e z ≤ y, o que implica que y = z).
Portanto f é uma função, e é justamente uma função de escolha em X.
Exercı́cios
1. Discuta a seguinte afirmação: sempre que a existência de uma função de escolha
sobre um conjunto vale em ZFC mas não é assegurada em ZF, temos, em ZFC, mais
de uma função de escolha sobre esse conjunto.
2. Seja f uma função de domı́nio A e imagem B. Prove que existe uma função g
injetora de domı́nio B tal que f ◦ g(b) = b, para todo b ∈ B. Discuta o uso do axioma
da escolha nessa demonstração. Se A for o conjunto ω, é necessário o uso do axioma
da escolha para provar esse resultado?
91
3. Prove que todo espaço vetorial sobre R possui uma base (algébrica).
Conjuntos equipotentes
Este capı́tulo aborda o assunto discutido na introdução, que deu origem a toda a
teoria dos conjuntos: a comparação entre conjuntos infinitos pela “quantidade” de
elementos. Começamos a falar quando dois conjuntos são “iguais”, em termos de
tamanho. No próximo capı́tulo discutiremos o que significa um conjunto ser “menor”
do que outro.
Definição 15.1 Dizemos que dois conjuntos X e Y são equipotentes se existe uma
função bijetora de X em Y . Usamos a notação X ≈ Y para denotar que X e Y são
equipotentes.
O próximo teorema nos oferece outras três definições alternativas para conjuntos
finitos (e, consequentemente, para conjuntos infinitos).
93
94 CAPÍTULO 15. CONJUNTOS EQUIPOTENTES
Considere
S = {k ∈ n : ∃x(x ∈ X ∧ k = minf −1 [x])}
Ou seja, escolhemos, para cada x ∈ X, apenas um k ∈ ω tal que f (k) = n. Repare
que, neste ponto, não precisamos usar o axioma da escolha, pois já sabemos que ω é
bem-ordenado.
Seja f 0 = f |S a restrição de f a S. Isto é, f 0 é uma função de S em X definida
como f 0 (k) = f (k), para todo k ∈ S. É fácil verificar que f 0 é bijetora em relação a
X.
Pela afirmação, existem m ∈ ω e g : m −→ S bijetora. Tomemos h = f 0 ◦ g.
Como composição de funções injetoras é injetora, concluı́mos que h é uma bijeção
entre m e X, provando que X é finito.
(b) ⇒ (c) Suponha que vale (b), isto é, não existe uma função sobrejetora de
algum número natural em X. Provaremos a existência de uma função h : ω −→ X
injetora.
A ideia da construção é simples. Definimos h recursivamente. Se temos definida
a função h até n − 1, definimos h(n) como qualquer elemento de X que não está
na imagem de h restrito a {0, . . . , n − 1}. Tal elemento existe pela hipótese de que
nenhuma função de n em X é sobrejetora. Fazendo isso sucessivamente, definimos h
para todo número natural.
O problema é formalizar esse argumento, usando o teorema da recursão. Nas
aplicações que fizemos até agora, definimos f (n+ ) a partir de f (n). Nesse caso,
95
h(n+ ) depende não apenas de h(n), mas de h(i), para todo i ≤ n. Usaremos um
artifı́cio para adaptar o teorema da recursão simples para aquele que conhecemos
como recursão completa.
Também precisaremos usar o axioma da escolha para escolher um elemento de
X que não está na imagem de uma função parcial de ω em X. Começamos a de-
monstração desta parte do teorema fixando s uma função de escolha de domı́nio
P(X) r {∅}. Isto é, s é uma função definida em todos os subconjuntos não-vazios de
X que satisfaz s(A) ∈ A, para todo A ⊂ X não-vazio.
Seja Y o conjunto de todas as funções que têm como domı́nio um número natural
e imagem contida em X. Isto é
Isto é, se f é uma função de domı́nio n, g(f ) é uma função f 0 de domı́nio n+ definida
da seguinte forma: f 0 (k) = f (k), para k ∈ n, e f 0 (n) = s(X r im(f )). Lembre-se
de que X r im(f ) é não-vazio pela hipótese, que garante que f não é sobrejetora em
relação a X, e s(X r im(f )) é um elemento de X r im(f ), garantindo que f 0 (n) não
pertence à imagem de f .
Pelo teorema da recursão, existe uma função F : ω −→ Y tal que F (0) = y0 e
F (n+ ) = g(F (n)).
Ou seja, cada F (n) é um “pedaço” da função h, que queremos definir, restrita a
n. Definimos [
h= im(F )
Para ficar mais clara a definição de h, uma outra definição equivalente a essa seria:
h é uma função de ω em X tal que h(n) = f (n), tomando f = F (n+ ).
A função h é injetora. De fato, se n 6= m, podemos assumir, sem perda de
generalidade, que m ∈ n. Sejam f1 = F (m+ ) e f2 = F (n+ ). É fácil verificar, por
indução, que F (m+ ) ⊂ F (n). Como, pela construção, f2 (n) ∈ / imF (n), temos que
f1 (m) 6= f2 (n). Logo, h(m) 6= h(n).
(c) ⇒ (d) Suponha que existe uma função f : ω −→ X injetora. Provaremos que
existem Y ⊂ X diferente de X e g : X −→ Y bijetora. Para isso, basta provarmos
que existe g : X −→ X injetora e não sobrejetora, e tomamos Y a imagem de g.
Defina g : X −→ X do seguinte modo: g(x) = x, quando x ∈ / im(f ) e g(f (n)) =
+
f (n ). Formalmente, definimos
Provemos a afirmação por indução em n. Vale para 0, pois 0 não possui subcon-
junto próprio. Suponhamos que nenhum subconjunto próprio de n é equipotente a
n. Mostraremos que o mesmo vale para n+ .
Suponha, por absurdo, que existem S ⊂ n+ diferente de n+ e uma função bijetora
f de S em n+ . Assumiremos, sem perda de generalidade, que n ∈ / S. De fato, se
+
n ∈ S, como S 6= n , existe m < n que não pertence a S. Podemos “trocar”
n com m, mantendo o mesmo valor de f . Ou seja, no lugar de S consideramos
S 0 = (Sr{n})∪{m} e no lugar de f consideramos f 0 = (f r{(n, f (n))})∪{(m, f (n))}.
Está claro que S 0 continua sendo um subconjunto próprio de n+ (porque n ∈ / S) e f 0
0 +
ainda é uma bijeção de S e n .
Feita essa suposição de que n ∈
/ S, seja m < n tal que f (m) = n. Considere
S = S r {m} e f a restrição de f a S 0 . Temos que f 0 é uma bijeção de S 0 em
0 0
Z = {x ∈ X : x ∈
/ f (x)}.
Exercı́cios
1. Mostre que um conjunto X é infinito se, e somente se, existe uma boa ordem em
X em relação a qual X não possui máximo.
De acordo com essa definição, o teorema de Cantor diz que o conjunto das partes
de X domina estritamente X. Ainda de acordo com essa definição, o item (c) do Te-
orema 15.3 nos diz que ω é “o menor” conjunto infinito que existe. Em particular, os
conjuntos não-enumeráveis sempre dominam estritamente os conjuntos enumeráveis.
A pergunta natural a fazer depois de vermos o enunciado do Teorema de Cantor é
sobre a existência de alguma coisa intermediária entre ω e P(ω), ou, mais geralmente,
entre X e P(X). Essa conjectura de que não existe nada entre ω e P(ω) é conhecida
como hipótese do contı́nuo e foi colocada por Hilbert no topo dos problemas mais
importantes na virada do século XIX para o século XX.
99
100 CAPÍTULO 16. COMPARAÇÃO ENTRE CONJUNTOS
Esse problema foi provado ser independente de ZFC, isto é, não pode ser provado
nem refutado utilizando os axiomas usuais de teoria dos conjuntos. Pelo teorema da
completude da lógica de primeira ordem, isso significa que existem um modelo para
teoria dos conjuntos que satisfaz os axiomas de ZFC e a hipótese do contı́nuo, e outro
modelo para teoria dos conjuntos que satisfaz os axiomas de ZFC e a negação da
hipótese do contı́nuo.
Como dissemos, o problema foi postado por Hilbert em 1900 na sua famosa lista
dos 22 problemas mais importantes do século XIX. A consistência da hipótese do
contı́nuo só foi mostrada em 1940 por Kurt Gödel, e a consistência da negação da
hipótese do contı́nuo foi provada em 1964 por Paul Cohen.
A seguinte generalização da hipótese do contı́nuo também foi provada ser inde-
pendente de ZFC.
dada por
g(s) = h(Y r im(s)).
Notemos que s não é sobrejetora em Y , pois o domı́nio de s está contido em X e se
tivéssemos im(s) = Y poderı́amos facilmente estender s para uma função sobrejetora
de X em Y , que assumimos não existir. Portanto, h está bem definida.
Pelo teorema da recursão (vide teorema 13.7), existe f : X −→ Y tal que, para
todo x,
←
f (x) = g(f | x),
←
lembrando que x denota o conjunto dos elementos de X menores do que x.
Mostremos que f é injetora. Suponha que não seja. Tome x e y em X tais que
x 6= y e f (x) = f (y). Como boa ordem implica ordem total, temos x ≤ y ou y ≤ x.
Podemos assumir que y ≤ x, sendo o outro caso totalmente análogo. Temos que
← ← ←
y ∈ x, contradizendo que g(f | x) ∈
/ im(f | x) e f (x) = f (y).
Notemos que usamos o axioma da escolha duas vezes na demonstração acima:
uma para bem ordenar o conjunto X e outra para definir a função h. O uso do
axioma da escolha é necessário. De fato, o teorema da comparabilidade dos conjuntos
é equivalente ao axioma da escolha, em ZF.
O próximo lema será usado na demonstração do teorema de Cantor-Schröder-
Bernstein.
Lema 16.4 (teorema do ponto fixo de Tarski) Seja F uma função de P(X) em
P(X) tal que z ⊂ w ⊂ X implica F (z) ⊂ F (w). Então existe w ⊂ X tal que
F (w) = w.
102 CAPÍTULO 16. COMPARAÇÃO ENTRE CONJUNTOS
Exercı́cios
1. Prove que, se X e Y são infinitos, então X ∪Y é equipotente a X ou a Y . Assuma
o seguinte resultado: se X é infinito então X é equipotente a X × X.
4. Prove que, dados dois números naturais n e m, temos que n domina estritamente
m se, e somente se, m < n.