TCC - Yago Versao Final01

UNIVERSIDADE FEDERAL DE JUIZ DE FORA
INSTITUTO DE CIÊNCIAS EXATAS

BACHARELADO EM MATEMÁTICA
Yago Pereira dos Anjos Santos
Axioma da Escolha, Lema de Zorn e o Teorema de Zermelo:

Aplicações e Equivalências
Juiz de Fora
2021

Trabalho de Conclusão de Curso apresentado

ao Bacharelado em Matemática da Universi-
dade Federal de Juiz de Fora como requisito
parcial à obtenção do grau de bacharel em
Matemática.
Orientadora: Profa. Dra. Ana Tércia Monteiro Oliveira
Juiz de Fora
2021
Ficha catalográfica elaborada através do Modelo Latex do CDC da UFJF
com os dados fornecidos pelo(a) autor(a)
Santos, Yago Pereira dos Anjos.

Aplicações e Equivalências / Yago Pereira dos Anjos Santos. – 2021.
77 f. : il.
Orientadora: Ana Tércia Monteiro Oliveira

Trabalho de Conclusão de Curso (Graduação) – Universidade Federal
de Juiz de Fora, Instituto de Ciências Exatas. Bacharelado em Matemática,
2021.
1. Axioma da Escolha. 2. Lema de Zorn. 3. Teorema de Zermelo. I.

Monteiro Oliveira, Ana Tércia, orient. II. Título.

Trabalho de Conclusão de Curso apresentado

ao Bacharelado em Matemática da Universi-
dade Federal de Juiz de Fora como requisito
parcial à obtenção do grau de bacharel em
Matemática.
Aprovada em (dia) de (mês) de 2021
BANCA EXAMINADORA
Profa. Dra. Ana Tércia Monteiro Oliveira - Orientadora

Universidade Federal de Juiz de Fora
Profa. Dra. Cristiane de Andrade Mendes

Prof. Dr. Willian Versolati França

Dedico este trabalho à minha mãe.
AGRADECIMENTOS
Agradeço primeiramente à indecifrável força superior responsável pela existência

do universo e, em particular, por minha existência humana que, incompreensivelmente,
tomou o caminho que conduziu até esta monografia.
Agradeço à mulher sem a qual nada disso seria possível, minha mãe Eunice, pela
compreensão, apoio e incentivo incondicional para que eu pudesse concluir este curso,
ainda que diante de muitos obstáculos e dificuldades.
Agradeço à professora Ana Tércia que, através de sua experiência e sabedoria,
contribuiu para a minha formação acadêmica ministrando importantes disciplinas durante
o curso e pela excelente condução da orientação desta monografia. E no geral, agradeço à
todas as professoras e todos os professores que contribuíram direta e indiretamente para a
minha formação.
Deixo aqui meus agradecimentos à todas as pessoas que cuidam da limpeza do
espaço universitário em que vivemos e também às pessoas que nos atendem nas bibliotecas,
não apenas por seus serviços excepcionais como também por cada bom dia e cada sorriso
sincero, coisas que fazem nossos dias valerem a pena.
Agradeço também à instituição Universidade Federal de Juiz de Fora pela estrutura
e pela excelência do ensino público, gratuito e de qualidade.
“The existence of the infinite will never again be deniable
while that of the finites is nevertheless upheld. If one
permits either to fall, one must do away as well with the
other.” (Georg Cantor).
RESUMO
O principal objetivo deste trabalho é demonstrar as equivalências entre o Axioma

da Escolha, o Lema de Zorn e o Teorema de Zermelo. Começamos definindo conceitos
fundamentais como função, ordem parcial, e famílias para, então, introduzir formalmente
os enunciados supracitados. Apresentamos primeiramente o Axioma da Escolha e algumas
de suas aplicações como, por exemplo, o resultado que afirma que todo conjunto infinito
possui um subconjunto infinito enumerável. Em seguida, o Lema de Zorn é apresentado
seguido de algumas aplicações, dentre as quais se encontra o resultado que afirma que todo
espaço vetorial possui uma base. Definimos então o conceito de conjunto bem ordenado e
apresentamos uma aplicação deste conceito, a saber, o Princípio de Indução Transfinita e,
depois, formalizamos o enunciado do Teorema de Zermelo. Finalmente, para o resultado
final, provamos, na seguinte ordem, que: O Axioma da Escolha implica no Lema de Zorn;
o Lema de Zorn implica no Teorema de Zermelo; o Teorema de Zermelo implica no Axioma
da Escolha.
Palavras-chave: Axioma da Escolha. Lema de Zorn. Teorema de Zermelo.

ABSTRACT
The main purpose of this work is to demonstrate the equivalences between the
Axiom of Choice, Zorn’s Lemma and Zermelo’s Theorem. We start by defining fundamental
concepts such as function, partial order, and families and then formally introduce the
aforementioned statements. We first present the Axiom of Choice and some of its applica-
tions, such as the result that states that every infinite set has an infinitely enumerable
subset. Then, Zorn’s Lemma is presented followed by some applications, among which
is the result that states that every vector space has a base. We then define the concept
of a well-ordered set and present an application of this concept, namely the Principle of
Transfinite Induction, and then formalize the statement of Zermelo’s Theorem. Finally,
for the final result, we prove, in the following order, that: The Axiom of Choice implies
Zorn’s Lemma; Zorn’s Lemma implies Zermelo’s Theorem; Zermelo’s Theorem implies the
Axiom of Choice.
Keywords: Axiom of Choice. Zorn’s Lemma. Zermelo’s Theorem.

LISTA DE ILUSTRAÇÕES
2x + 1
Figura 3.2.1 – Gráfico da função f : N × N → R definida por f (x, y) = . 38
2y
Figura 5.0.1 – Uma ilustração do Axioma da Escolha. Por: Fschwarzentruber. 46
LISTA DE SÍMBOLOS
N∗ Conjunto dos números naturais distintos de zero.

SUMÁRIO
1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.1 UMA BREVE HISTÓRIA . . . . . . . . . . . . . . . . . . . . . . . . . 21
2 PRELIMINARES . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.1 OS AXIOMAS DE ZERMELO-FRAENKEL . . . . . . . . . . . . . . . 25
2.2 RELAÇÕES E FUNÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.1 RELAÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.2 DOMÍNIO E IMAGEM DE UMA RELAÇÃO . . . . . . . . . . . . . . 31
2.2.3 PROPRIEDADES DAS RELAÇÕES . . . . . . . . . . . . . . . . . . . 31
2.2.4 FUNÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3 ORDEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.1 CONJUNTOS PARCIALMENTE ORDENADOS . . . . . . . . . . . . 35
3.2 ORDEM TOTAL E ELEMENTOS NOTÁVEIS EM CONJUNTOS
PARCIALMENTE ORDENADOS . . . . . . . . . . . . . . . . . . . . . 37
4 FAMÍLIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5 AXIOMA DA ESCOLHA . . . . . . . . . . . . . . . . . . . . . . 45
5.1 APLICAÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5.1.1 CONSTRUÇÃO DO CONJUNTO DE VITALI . . . . . . . . . . . . . . 51
6 LEMA DE ZORN . . . . . . . . . . . . . . . . . . . . . . . . . . 53
6.1 APLICAÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
7 TEOREMA DE ZERMELO . . . . . . . . . . . . . . . . . . . . 63
8 RESULTADO FINAL . . . . . . . . . . . . . . . . . . . . . . . . 67
9 CONSIDERAÇÕES FINAIS . . . . . . . . . . . . . . . . . . . . 75
REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
21
1 INTRODUÇÃO
1.1 UMA BREVE HISTÓRIA
As teorias matemáticas desenvolvidas atualmente utilizam-se da linguagem de con-

juntos. Até o final do século XIX a noção que se tinha sobre conjuntos era demasiadamente
“ingênua”, pois baseava-se mais na intuição do que em princípios rigorosos universalmente
estabelecidos para a formação de conjuntos. A Teoria dos Conjuntos tem hoje a seu dispor
sistemas axiomáticos que foram desenvolvidos no decorrer da história da matemática com
a finalidade de atender as necessidades crescentes de rigor. No período entre o final do
século XIX e início do século XX, Gottlob Frege (1848 – 1925) publicou um trabalho em
dois volumes, um em 1893 e outro em 1903, nos quais ele pretendia estabelecer que toda a
matemática conhecida até a sua época poderia ser desenvolvida a partir dos princípios da
lógica. Todavia, Bertrand Russell (1872 – 1970), ao tomar conhecimento do trabalho de
Frege, derivou uma contradição a partir de seus axiomas – que ficou conhecida na história
como Paradoxo de Russell –, o que frustrou sua tentativa que objetivava fundamentar
a matemática em bases sólidas. O Paradoxo de Russell surge a partir do denominado
Princípio da Compreensão. Este princípio postula que, dada qualquer propriedade, a
coleção dos objetos que satisfazem esta propriedade é um conjunto. De acordo com este
princípio, podemos formar o conjunto de todos os conjuntos que não pertencem a si
mesmos. Se este conjunto pertence a si mesmo, então pela propriedade que o define, não
deve pertencer a si mesmo. Por outro lado, se não pertencer a si mesmo, deverá pertencer
a si mesmo. Assim, o conjunto em questão pertence a si mesmo se, e somente se, não
pertence a si mesmo, o que constitui um absurdo.
Diante deste cenário, verifica-se o surgimento de propostas de sistemas axiomáticos
para a Teoria dos Conjuntos, dentre as quais destacamos aqui a axiomática de Zermelo-
Fraenkel, frequentemente abreviada por axiomática ZF. Em 1908, Ernst Zermelo (1871 –
1953) publicou um trabalho no qual ele apresentou um sistema axiomático com o objetivo
de fundamentar a Teoria dos Conjuntos. Esse sistema também teve contribuição posterior
de Abraham Fraenkel (1891 – 1965). Dentre os axiomas deste sistema, encontra-se o
Axioma da Escolha, acrescentado por Zermelo posteriormente, que durante anos foi
motivo de muita controvérsia entre os matemáticos. Este axioma afirma que, dada uma
família arbitrária de conjuntos não vazios, é possível formar um conjunto escolhendo-se
exatamente um elemento de cada um dos conjuntos não-vazios. Desta maneira, ele fornece
ao matemático a possibilidade de se fazer infinitas escolhas arbitrárias sendo, portanto,
um axioma de natureza não-construtiva. Do grupo de matemáticos que se opunham ao
Axioma da Escolha, podemos citar os franceses Borel, Baire e Lebesgue, embora eles
tenham utilizado infinitas escolhas arbitrárias em alguns de seus trabalhos. De acordo com
o pensamento construtivista, defendido por alguns matemáticos da época, a existência
22
de um objeto matemático somente é garantida se for possível estabelecer um algoritmo

específico para a sua construção.
A fim de ilustrar o sentido que se dá à expressão “infinitas escolhas arbitrárias”,
frequentemente recorre-se à uma alegoria introduzida por Russell na qual se dispõe de um
conjunto infinito de pares de sapatos. A partir deste conjunto, desejamos formar um novo
conjunto escolhendo exatamente um sapato de cada par. Para tanto, não é necessário
utilizar o Axioma da Escolha, pois aqui é possível estabelecer uma regra específica como, por
exemplo, para cada par tomar o sapato correspondente ao pé esquerdo. Ao considerarmos
um conjunto infinito de pares de meias, a situação é diferente. Considerando que em um
par de meias não é possível distinguir um do outro, para escolher uma meia de cada par
necessitamos do Axioma da Escolha, porquanto aqui precisamos fazer infinitas escolhas
arbitrárias.
Matemáticos italianos como Giuseppe Peano (1858 – 1932) e Tullio Levi-Civita
(1873 – 1941) reconheciam a necessidade de se fazer infinitas escolhas em algumas situações,
embora acreditassem sempre ser necessário regras específicas para realização de tais escolhas.
Desta maneira, a ideia de se fazer infinitas escolhas arbitrárias não era muito apreciada
por esses matemáticos, o que evidencia o pensamento construtivista da época. Apesar
de toda relutância histórica em torno do Axioma da Escolha, aos poucos ele ganhou
espaço na comunidade matemática devido às suas consequências não somente na Teoria
dos Conjuntos como também em áreas diversas como, por exemplo, Álgebra, Topologia,
Teoria da Medida e Análise Funcional. No ano 1963 foi estabelecido, por Paul Cohen,
que o Axioma da Escolha e a sua negação não decorrem da axiomática de ZF, de modo
que este axioma é independente do sistema ZF. Em 1938, Kurt Gödel prova que ao se
supor que a axiomática ZF não acarreta contradições, então esta axiomática acrescida do
Axioma da Escolha também não acarreta contradições, ou seja, se ZF é consistente, então
ZF acrescido do Axioma da Escolha também é consistente.
O Axioma da Escolha tornou-se uma ferramenta matemática padrão no final dos
anos 1930 na forma do denominado Lema de Zorn. Na forma como é conhecido atualmente,
este lema diz que: Se X é um conjunto parcialmente ordenado tal que todo subconjunto
totalmente ordenado possui cota superior, então X possui um elemento maximal. Este
princípio maximal foi inspirado em vários princípios do mesmo tipo introduzidos pela
chamada “escola polonesa” de Sierpiński, Kuratowski e Hausdorff, dentre outros. De fato,
Sappers, em 1960, encontrou uma linhagem de estudos em que vários autores haviam
trabalhado em princípios maximais. Termos como “maximal” e “conjunto indutivo”, o
qual depende das noções de conjunto totalmente ordenado e cota superior, podem ser
encontrados no livro de N. Bourbaki, “Théorie des Ensembles”. Max Zorn (1906 – 1993) foi
professor na Universidade de Indiana e em torno de 1933 trabalhou no princípio maximal
que daria origem ao que conhecemos hoje como Lema de Zorn ou Teorema de Zorn. No
entanto, Zorn somente teve conhecimento sobre os trabalhos de Hausdorff acerca deste
23
mesmo assunto em 1976.

Ao acrescentar-se o Axioma da Escolha ao sistema axiomático ZF, obtém-se a
axiomática ZFC, em que a letra “C” faz referência à palavra em inglês Choice, significando
Escolha em português. A partir da axiomática ZFC obtém-se a teoria ZFC. Antes de sua
apresentação do Axioma da Escolha em 1908, Zermelo fez uso de uma versão preliminar
deste axioma em 1904 para demonstrar uma asserção, conjecturada por Georg Cantor
(1845 – 1918) anos antes, que dizia que todo conjunto pode ser bem ordenado, atualmente
conhecida como Teorema da Boa Ordem ou Teorema de Zermelo. Parte da formalização
que se tem hoje para a Teoria dos Conjuntos é atribuída a John von Neumann (1903 –
1957), embora o sistema ZFC tenha sido inicialmente criado por Zermelo e Fraenkel.
24
25
2 PRELIMINARES
Neste capítulo trazemos alguns pré-requisitos essenciais no desenvolvimento dessa

monografia. Iniciaremos com uma apresentação dos axiomas de Zermelo-Fraenkel e algumas
de suas consequências básicas e, em seguida, trataremos dos conceitos de relação e função.
2.1 OS AXIOMAS DE ZERMELO-FRAENKEL
Na Teoria dos Conjuntos, embora não exista o conjunto de todos os conjuntos, os

objetos com os quais trabalhamos são todos conjuntos. A postura adotada por Zermelo
diante da Teoria dos Conjuntos é semelhante àquela adotada por Euclides com respeito
à Geometria. Não se define de fato o que é um conjunto, admite-se que eles existem e
que a ideia de conjunto é primitiva, intuitiva a todos os seres humanos. O que se faz é
estabelecer, por meio de axiomas, o que é possível realizar corretamente com os conjuntos,
assim como é feito na Geometria Euclidiana, onde não se define, por exemplo, o que são
pontos e retas, mas sim o que se pode fazer com essas ideias intuitivas. Por isso, em muitas
ocasiões, quando se tenta definir o conceito de conjunto, recaímos em palavras que são
sinônimos, como famílias e coleções, por exemplo, e que geralmente são intercambiadas
dentro da teoria significando portanto a mesma coisa.
Um conceito primitivo e fundamental na Teoria dos Conjuntos é o de pertinência.
Há circunstâncias em que precisamos saber se um determinado objeto é, ou não, elemento
de um conjunto. Dado um conjunto X, se A é um elemento de X, representamos este fato
pelo símbolo “A ∈ X” e dizemos que A pertence a X. Caso contrário, dizemos que A não
pertence a X, ou que A não é um elemento de X, e representamos este fato pelo símbolo
“A ∈/ X”. Uma relação entre conjuntos decorrente da noção de pertinência é a noção de
inclusão. Dizemos que o conjunto X é subconjunto de um conjunto Y se todo elemento
de X é elemento de Y , isto é, se A ∈ X, então A ∈ Y . Assim, sempre que um conjunto
X for subconjunto de um conjunto Y , abreviaremos este fato com a notação X ⊂ Y . No
caso negativo, utilizaremos o símbolo X 6⊂ Y .
Agora estamos prontos para enunciar os axiomas de Zermelo-Fraenkel.
Axioma da Existência. Existe um conjunto vazio.
Este axioma nos diz que existe um conjunto que não possui elementos, isto é, um
conjunto X tal que, para todo elemento x, x ∈ / X. Algumas abordagens na literatura
formulam este axioma de outra maneira dizendo apenas que existe um conjunto e a
existência do conjunto vazio decorre de outro axioma. Quando a Teoria dos Conjuntos é
abordada com o rigor de uma lógica de primeira ordem, é possível garantir que o universo
em que trabalhamos é não vazio, de modo que o Axioma da Existência pode ser omitido
26
no sistema axiomático. Todavia, por motivos históricos e didáticos, mantemos o Axioma

da Existência como enunciado acima.
Axioma da Extensão. Dados os conjuntos X e Y , então X = Y se, e somente se, X ⊂ Y

e Y ⊂ X.
Como uma aplicação do Axioma da Extensão, apresentamos a unicidade do conjunto

vazio. O argumento utilizado na demonstração deste resultado é conhecido por “vacuidade”.
Teorema 2.1.1. O conjunto vazio é único.
Demonstração. Suponhamos que existam X e Y ambos conjuntos vazios e X 6= Y . Então,

pelo Axioma da Extensão, X 6⊂ Y ou Y 6⊂ X. No caso em que X 6⊂ Y existe A ∈ X tal
que A ∈/ Y . Por outro lado, se Y 6⊂ X, então existe A ∈ Y tal que A ∈
/ X. Em ambos os
casos, nos deparamos com um absurdo, pois X e Y são conjuntos vazios. Logo, existe um
único conjunto vazio.
Conhecendo o fato de que o conjunto vazio é único, vamos denotá-lo pelo símbolo:
∅.
Esquema de Axiomas da Especificação. Para todo conjunto A e toda condição S(x)

existe um conjunto B cujos elementos são exatamente os elementos x de A que satisfazem
a condição S(x).
Na condição S(x) do Axioma da Especificação, exigimos apenas que a variável x não

seja introduzida com os quantificadores universal, como em “∀x . . .”, e existencial, como
em “∃x . . .”. É importante observar também que neste axioma, para cada condição S(x),
obtém-se um conjunto B, isto é, para cada condição obtém-se um Axioma da Especificação.
Por isso enunciamos um esquema de axiomas.
O Axioma da Extensão assegura que, para cada condição S(x), o conjunto B
determinado pelo Axioma da Especificação é único.
Com efeito, suponhamos que existe um conjunto B 0 , B 0 6= B, cujos elementos são
exatamente os elementos x ∈ A que satisfazem S(x). Pelo Axioma da Extensão, B 0 6⊂ B
ou B 6⊂ B 0 . No primeiro caso, existe x ∈ B 0 tal que x ∈ / B. Com isso, x satisfaz S(x),
pois x ∈ B 0 , e x não satisfaz S(x), pois x ∈/ B. Absurdo. Por outro lado, se B 6⊂ B 0 ,
existe x ∈ B tal que x ∈/ B 0 , de modo que x satisfaz S(x) e não satisfaz S(x), o que é um
absurdo. Portanto, devemos ter B 0 = B.
Representamos o conjunto B obtido pelo Axioma da Especificação, por:
B = {x ∈ A ; S(x)}.
27
Ao tratarmos os conjuntos de maneira ingênua, nos deparamos com paradoxos

como o de Russell. Com a axiomática de Zermelo-Fraenkel, o paradoxo de Russell deixa
de ser um paradoxo e torna-se um Teorema que afirma não existir o conjunto de todos os
conjuntos.
Teorema 2.1.2 (Paradoxo de Russell). Para todo conjunto X, existe um conjunto A tal
que A ∈
/ X.
Demonstração. Suponhamos que exista um conjunto X tal que, para todo conjunto Y ,
Y ∈ X. Pelo Axioma da Especificação, existe o conjunto Z = {A ∈ X ; A ∈ / A}. Pela
definição do conjunto X, temos, em particular, Z ∈ X e, diante disso, Z ∈ Z se, e somente
se, Z ∈/ Z. Absurdo.
Teorema 2.1.3. Dado um conjunto não vazio X existe um conjunto Y tal que Z ∈ Y se,
e somente se, Z ∈ B para todo B ∈ X.
Demonstração. Seja A ∈ X. Pelo Axioma da Especificação, existe o conjunto
Y = {Z ∈ A ; Z ∈ B para todo B ∈ X}.
Dado Z ∈ Y , então para todo B ∈ X, temos Z ∈ B. Reciprocamente, se Z ∈ B para

todo B ∈ X, então, em particular, Z ∈ A. Logo, Z ∈ Y . Concluímos desta forma que
Z ∈ Y se, e somente se, Z ∈ B para todo B ∈ X.
O conjunto Y será denotado por B e será denominado a interseção da coleção

\
B∈X
não vazia de conjuntos, ou interseção da família não vazia de conjuntos, em X.
Axioma do Par. Se X e Y são conjuntos, então existe um conjunto Z tal que A ∈ Z se,
e somente se, A = X ou A = Y .
O Axioma da Extensão garante que o conjunto Z enunciado pelo Axioma do Par é

único. Assim, o representaremos por: Z = {X, Y }. Uma vez que o vazio ∅ é um conjunto,
podemos obter, a partir do Axioma do Par, os seguintes conjuntos:
{∅}, {∅, {∅}}, {{∅}, {∅, {∅}}}.
Axioma da Fundação. Para cada conjunto X não vazio, existe A ∈ X tal que A∩X = ∅.
Teorema 2.1.4. Sejam X e Y conjuntos. Então X ∈

/ Y ou Y ∈
/ X.
Demonstração. Dados os conjuntos X e Y , pelo Axioma do Par, existe o conjunto {X, Y }.

Assim, pelo Axioma da Fundação, existe Z ∈ {X, Y } tal que Z ∩ {X, Y } = ∅. Desta
forma, Z = X, ou Z = Y . Se Z = X, então Y ∈ / X. Se Z = Y , então X ∈ / Y . Portanto,
X∈ / Y ou Y ∈
/ X.
28
Corolário 2.1.1. Para todo conjunto X, X ∈

/ X.
Demonstração. Basta tomar X = Y no Teorema 2.1.4.
Axioma da União. Para toda coleção de conjuntos C , existe um conjunto U tal que
A ∈ U se, e somente se, A ∈ X para algum X ∈ C .
O Axioma da Extensão garante que o conjunto U enunciado pelo Axioma da União

é único. Desta forma, representaremos U pelo símbolo
[
X.
X∈C
Exemplo 2.1.1. Consideremos a coleção de conjuntos C = {∅, {∅}}. Então, pelo Axioma
da União, existe A = {∅}.
[
A∈C
De fato, como {∅} ∈ C e ∅ ∈ {∅}, segue que {∅} ⊂ A. Agora, seja X ∈

[ [
A.
A∈C A∈C
Então, existe Y ∈ C tal que X ∈ Y . Como Y 6= ∅, Y = {∅} e, assim, X ∈ {∅}, como
queríamos demonstrar.
Teorema 2.1.5. Dados os conjuntos X e Y , existe um conjunto Z tal que A ∈ Z se, e

somente se, A ∈ X ou A ∈ Y .
Demonstração. Pelo Axioma do Par, podemos formar a coleção de conjuntos C = {X, Y }.

Aplicando o Axioma da União, obtemos Z = B. Se A ∈ X ou A ∈ Y , então A ∈ Z.
[
B∈C
Agora, dado A ∈ Z, existe B ∈ C tal que A ∈ B. Visto que B = X ou B = Y , segue que
A ∈ X ou A ∈ Y . Portanto, A ∈ Z se, e somente se, A ∈ X ou A ∈ Y .
O conjunto Z do Teorema 2.1.4 será denotado por Z = X ∪ Y e denominado a

união dos conjuntos X e Y .
A principal utilidade do axioma a seguir é a construção dos ordinais que são, de
certa forma, “representantes especiais” dos conjuntos bem ordenados. No entanto, a teoria
dos ordinais foge do escopo desta monografia e pode ser encontrada em [3] e [4] pelo(a)
leitor(a) interessado(a). Abordaremos o conceito de conjunto bem ordenado no Capítulo 7.
Axioma da Substituição. Seja P (x, y) uma sentença. Suponha que para todos x, y, z,
P (x, y) e P (x, z) implica y = z. Então, para todo conjunto X, existe o conjunto
{y ; P (x, y) para algum x ∈ X}.
Axioma da Potência. Para cada conjunto X existe um conjunto P tal que A ∈ P se, e
somente se, A ⊂ X.
O Axioma da Extensão assegura que o conjunto P , conforme enunciado no Axioma

da Potência, é único. Assim, o denotaremos por P = P(X).
Se X e Y são conjuntos e x ∈ X, y ∈ Y , então o Axioma do Par nos assegura que
{{x}, {x, y}} é um conjunto.
29
Definição 2.1.1. Dados os conjuntos x ∈ X e y ∈ Y , dizemos que o conjunto dado por

(x, y) = {{x}, {x, y}} é o par ordenado com primeira coordenada x e segunda coordenada
y.
Se a = x e b = y, pelo Axioma da Extensão, temos {a} = {x} e {a, b} = {x, y}, de

modo que (a, b) = {{a}, {a, b}} = {{x}, {x, y}} = (x, y). A recíproca também é verdadeira,
segundo o seguinte resultado.
Teorema 2.1.6. Se (a, b) = (x, y), então a = x e b = y.
Demonstração. Suponhamos b = a. Neste caso, (a, b) é o conjunto unitário constituído

pelo elemento {a}. Como {{a}} = (a, b) = (x, y) = {{x}, {x, y}}, segue que {x} ∈ {{a}},
ou seja, {x} = {a}. Logo, x = a. Além disso, {x, y} ∈ {{a}}. Assim, {x, y} = {a}.
Portanto, y = a = b.
Agora, suponhamos que b = 6 a. Então, (a, b) é um conjunto contendo exatamente o
conjunto unitário {a} e o par {a, b}. Uma vez que (a, b) = (x, y), segue que (x, y) é um
conjunto que também contém exatamente o conjunto unitário {x} e o par {x, y}. E além
disso, {a} = {x} e {a, b} = {x, y}. Por conseguinte, a = x e, como b 6= a, temos b = y.
O resultado a seguir, garante a existência do conjunto de todos os pares ordenados

(x, y), com x ∈ X e y ∈ Y .
Teorema 2.1.7. Sejam X e Y conjuntos. Então existe um único conjunto contendo todos
os pares ordenados (x, y) com x ∈ X e y ∈ Y .
Demonstração. Dados x ∈ X e y ∈ Y , sabemos que {x} ⊂ X ∪ Y e {x, y} ⊂ X ∪ Y .

Desta forma, {x} ∈ P(X ∪ Y ) e {x, y} ∈ P(X ∪ Y ). Assim, {{x}, {x, y}} ⊂ P(X ∪ Y )
e, portanto, (x, y) = {{x}, {x, y}} é um elemento do conjunto P(P(X ∪ Y )). Agora, pelo
Axioma da Especificação, existe um conjunto:
Z = {z ∈ P(P(X ∪ Y )) ; z = (x, y), x ∈ X e y ∈ Y }.
Segue do Axioma da Extensão que o conjunto Z é único.
Diante deste resultado, podemos definir o conceito de produto cartesiano dos

conjuntos X e Y .
Definição 2.1.2. Sejam X e Y conjuntos. O produto cartesiano dos conjuntos X e Y é

o conjunto X × Y = {(x, y) ; x ∈ X e y ∈ Y }.
Para melhor enunciar o próximo axioma, precisaremos das seguintes definições.
Definição 2.1.3. Seja X um conjunto. O conjunto sucessor de X é o conjunto dado por

X + = X ∪ {X}.
30
Definição 2.1.4. Dizemos que um conjunto X é indutivo se, e somente se, ∅ ∈ X e

A+ ∈ X sempre que A ∈ X.
Axioma do Infinito. Existe um conjunto indutivo.
Por fim, apresentaremos alguns resultados sobre o Axioma do Infinito.
Teorema 2.1.8. Seja C = {I ; I é indutivo}. Então, J = I é indutivo.

\
I∈C
Demonstração. Como ∅ ∈ I para todo conjunto indutivo, segue que ∅ ∈ J. Agora, seja
A ∈ J. Então A ∈ I para todo I indutivo. Portanto, A+ ∈ I para todo conjunto I ∈ C ,
isto é, A+ ∈ J.
Seja I um conjunto indutivo e consideremos o conjunto A = {X ⊂ I ; X é indutivo}.

Note que A 6= ∅, pois I ∈ A . Desta forma, a interseção ω = X está bem definida.
\
X∈A
Teorema 2.1.9. O conjunto ω é indutivo.
Demonstração. Segue de forma similar a prova do Teorema 2.1.8.
Teorema 2.1.10. Se A é um conjunto indutivo, então ω ⊂ A.
Demonstração. Seja A um conjunto indutivo. Então, pelo Teorema 2.1.8, o conjunto

A ∩ I ⊂ I é indutivo. Dado Y ∈ ω, temos Y ∈ X para todo X ⊂ I indutivo. Em
particular, Y ∈ A ∩ I ⊂ A. Portanto, ω ⊂ A.
Desta forma, finalizamos nossa exposição sobre os axiomas de Zermelo-Fraenkel.
2.2 RELAÇÕES E FUNÇÕES
O Axioma da Escolha dita a existência de um conjunto quando estamos diante

de certas condições. Como veremos adiante, isso equivale a garantir a existência de uma
função. Por este motivo, trazemos nesta seção os conceitos de relação e função.
2.2.1 RELAÇÕES
Sejam X e Y conjuntos não vazios.
Definição 2.2.1. Uma relação de X em Y é um subconjunto R ⊆ X × Y . Nesse caso,

escrevemos xRy para indicar que (x, y) ∈ R.
Quando X = Y , em vez de dizer que R é uma relação de X em X, diremos que

R ⊆ X × X é uma relação em X.
Exemplo 2.2.1. O conjunto R1 = {(x, y) ∈ Z × Z ; x = y} é uma relação em Z.

31
Exemplo 2.2.2. Seja X um conjunto não vazio. Então R2 = {(x, A) ∈ X ×P(X); x ∈ A}

é uma relação de X em P(X).
Exemplo 2.2.3. O conjunto R3 = {(x, y) ∈ R × R ; y ≥ 0} é uma relação em R.
2.2.2 DOMÍNIO E IMAGEM DE UMA RELAÇÃO
Seja R ⊆ X × Y uma relação de X em Y .
Definição 2.2.2. Diremos que o conjunto D(R) = {x ∈ X ; ∃y ∈ Y tal que (x, y) ∈ R} é

o domínio da relação R.
Para os Exemplos 2.2.1, 2.2.2 e 2.2.3, temos D(R1 ) = Z, D(R2 ) = X e D(R3 ) = R,

respectivamente.
Definição 2.2.3. Diremos que o conjunto Im(R) = {y ∈ Y ; ∃x ∈ X tal que (x, y) ∈ R}

é a imagem da relação R.
Para os Exemplos 2.2.1, 2.2.2 e 2.2.3, temos Im(R1 ) = Z, Im(R2 ) = P(X)\{∅} e

Im(R3 ) = R+ , respectivamente.
2.2.3 PROPRIEDADES DAS RELAÇÕES
Seja R uma relação em um conjunto X não vazio. A seguir, listamos algumas pro-
priedades que a relação R pode possuir e que a torna interessante em certas circunstâncias.
Dados x, y, z ∈ X:
• Propriedade Reflexiva: (x, x) ∈ R;
• Propriedade Simétrica: se (x, y) ∈ R, então (y, x) ∈ R;
• Propriedade Transitiva: se (x, y) ∈ R e (y, z) ∈ R, então (x, z) ∈ R;
• Propriedade Antissimética: se (x, y) ∈ R e (y, x) ∈ R, então x = y.
Exemplo 2.2.4. Consideremos o conjunto X = {a, b, c}.
(a) A relação R = {(a, a), (b, b), (c, c), (c, a)} ⊆ X × X é reflexiva. No entanto, S =
{(c, c), (c, a), (a, b)} ⊆ X × X não é reflexiva, uma vez que (a, a), (b, b) ∈
/ S.
(b) A relação R = {(b, b), (a, c), (c, a)} ⊆ X × X é simétrica em X, enquanto que
S = {(a, a), (c, b)} ⊆ X × X não é uma relação simétrica em X.
(c) A relação R = {(b, b), (c, a), (a, b), (c, b)} ⊆ X × X é transitiva em X. Contudo,
S = {(a, a), (b, c), (c, a)} ⊆ X × X não é uma relação transitiva em X.
32
(d) A relação R = {(a, a), (b, b), (a, c), (c, b)} ⊆ X × X é antissimétrica em X. Porém,
S = {(a, a), (a, c), (c, a)} ⊆ X × X não é uma relação antissimétrica em X.
Definição 2.2.4. Dizemos que R ⊆ X × X é uma relação de equivalência em X se, e

somente se, R possui as propriedades reflexiva, simétrica e transitiva.
Se R é uma relação de equivalência em X, para cada x, y ∈ X, escreveremos

x ∼ y em vez de (x, y) ∈ R. Dado a ∈ X, a classe de equivalência determinada pelo
elemento a, relativamente à relação de equivalência R, é o conjunto a = {x ∈ X; x ∼ a}.
Assim, o conjunto das classes de equivalência com respeito a relação R será denotado por
X/ ∼ = {x ; x ∈ X} e chamado de conjunto quociente de X por R.
Definição 2.2.5. Seja X um conjunto não vazio. Dizemos que P ⊂ P(X)\{∅} é uma
partição de X se:
(1) A, B ∈ P implica em A = B ou A ∩ B = ∅;
(2) X =
[
A.
A∈P
Teorema 2.2.1. Se R é uma relação de equivalência em um conjunto X, então X/ ∼ é

uma partição de X.
Demonstração. Dado x ∈ X/ ∼, x ∈ X, temos x ∈ P(X) e, como x ∼ x, x 6= ∅.

Agora, sejam x, y ∈ X/ ∼, x, y ∈ X. Suponhamos que x ∩ y = 6 ∅. Assim, existe
b ∈ x ∩ y. Dado a ∈ x, então a ∼ x. Como b ∼ x, pelas propriedades simétrica e transitiva,
a ∼ b. Uma vez que b ∼ y, temos a ∼ y. Logo, a ∈ y.
Analogamente, se a ∈ y, então a ∈ x. Portanto, x = y.
Desta forma, x = y ou x ∩ y = ∅.
Por fim, mostraremos que X =
[
x.
x∈X
Dado u ∈ x, existe a ∈ X tal que u ∈ a. Como a ⊂ X, segue que u ∈ X e,

[
x∈X
portanto, x ⊂ X. Agora, seja u ∈ X. Então, como ∼ é uma relação de equivalência,
[
x∈X
vale a propriedade reflexiva, isto é, u ∼ u. Desta forma, u ∈ u e, como u ⊂ x, temos
[
[ x∈X
u∈ x.
x∈X
Portanto, X =
[
x.
x∈X
2.2.4 FUNÇÕES
Finalmente, recordamos o conceito de função e algumas definições relacionadas ao

estudo de funções.
33
Definição 2.2.6. Sejam X e Y conjuntos não vazios e f uma relação de X em Y . Dizemos

que f é uma função de X em Y se D(f ) = X e para todo x ∈ D(f ) existe um único y ∈ Y
tal que (x, y) ∈ f .
Nesse caso, escreveremos f : X → Y para representar uma função f de X em Y ,

y = f (x) em vez de (x, y) ∈ f e diremos que y é a imagem de x pela f .
Exemplo 2.2.5. A relação R1 do Exemplo 2.2.1 é uma função de Z em Z.
Definição 2.2.7. Dizemos que uma função f : X → Y é injetora se, dados x, y ∈ X,

f (x) = f (y) implica x = y.
Definição 2.2.8. Dizemos que uma função f : X → Y é sobrejetora se, para todo y ∈ Y ,
existe x ∈ X tal que y = f (x).
Uma função f : X → Y é uma bijeção se f for injetora e sobrejetora. Dado A ⊂ X

não vazio, o conjunto definido por f (A) = {f (x) ; x ∈ A} é chamado a imagem direta de
A pela f . Em particular, quando A = X, f (X) é a imagem da f . Se B é um subconjunto
arbitrário de Y , então o conjunto f −1 (B) = {x ∈ X ; f (x) ∈ B} é denominado a imagem
inversa de B pela f .
34
35
3 ORDEM
3.1 CONJUNTOS PARCIALMENTE ORDENADOS
Neste capítulo, apresentaremos alguns conceitos que serão de fundamental impor-

tância para a compreensão do enunciado do Lema de Zorn.
Definição 3.1.1. Seja X um conjunto não vazio. Uma relação de ordem parcial em X,
denotada por , é uma relação que possui as propriedades reflexiva, antissimétrica e
transitiva.
Neste caso, (X, ) é dito parcialmente ordenado. A seguir, são apresentados alguns
exemplos de conjuntos parcialmente ordenados.
Exemplo 3.1.1. Seja A um conjunto não vazio. Considere o conjunto P(A) das partes
de A. Então, P(A) é parcialmente ordenado com a relação de inclusão.
De fato, sejam X, Y, Z ∈ P(A).
Propriedade Reflexiva: É claro, pois X ⊆ X ∀X ∈ P(A).
Propriedade Antissimétrica: Se X ⊆ Y e Y ⊆ X, então os conjuntos X e Y
possuem os mesmos elementos. Portanto, segue do Axioma da Extensão que X = Y .
Propriedade Transitiva: Suponhamos que X ⊆ Y e Y ⊆ Z. Dado a ∈ X, como
X ⊆ Y , temos a ∈ Y . Visto que Y ⊆ Z, temos a ∈ Z. Logo, X ⊆ Z.
Portanto, o conjunto P(A) com a relação de inclusão é parcialmente ordenado.
Exemplo 3.1.2. Sejam X e Y conjuntos não vazios e F o conjunto das funções f :

D(f ) → Y tais que D(f ) ⊆ X e D(f ) 6= ∅. Considere a relação em F definida da seguinte
maneira:
f g ⇔ D(f ) ⊆ D(g) e f (x) = g(x) para todo x ∈ D(f ).
Então, F é parcialmente ordenado com a relação .

Sejam f, g, h ∈ F .
Propriedade Reflexiva: Como D(f ) ⊆ D(f ) e f (x) = f (x) para todo x ∈ D(f ),
segue que f f .
Propriedade Antissimétrica: Se f g e g f , então f (x) = g(x) ∀x ∈ D(f ) ⊆
D(g) e, g(x) = f (x) ∀x ∈ D(g) ⊆ D(f ), respectivamente. Daí, f (x) = g(x) ∀x ∈ D(f ) =
D(g). Portanto, f = g.
Propriedade Transitiva: Se f g e g h, então D(f ) ⊆ D(g) e D(g) ⊆ D(h), o
que implica D(f ) ⊆ D(h). Além disso, f (x) = g(x) ∀x ∈ D(f ) e g(x) = h(x) ∀x ∈ D(g).
Como D(f ) ⊆ D(g) ⊆ D(h), obtemos f (x) = h(x) ∀x ∈ D(f ). Assim, f h.
Logo, o conjunto F com a relação é parcialmente ordenado.
36
Exemplo 3.1.3. Considere o conjunto N × N com a relação definida da seguinte forma:
(x, y) (z, w) ⇔ (2x + 1)2w ≤ (2z + 1)2y para todo (x, y), (z, w) ∈ N × N,
onde ≤ representa a ordem usual no conjunto N. Com a relação , o conjunto N × N é

parcialmente ordenado.
Com efeito, sejam (x, y), (z, w), (u, v) ∈ N × N.
Propriedade Reflexiva: Como (2x+1)2y = (2x+1)2y , temos (2x+1)2y ≤ (2x+1)2y .
Assim, (x, y) (x, y).
Propriedade Antissimétrica: Suponhamos que (x, y) (z, w) e (z, w) (x, y).
Então, (2x + 1)2w ≤ (2z + 1)2y e (2z + 1)2y ≤ (2x + 1)2w , o que implica (2x + 1)2w =
(2z + 1)2y . Segue do Teorema Fundamental da Aritmética que 2x + 1 = 2z + 1 e 2w = 2y .
Consequentemente, x = z e y = w. Logo, (x, y) = (z, w).
Propriedade Transitiva: Suponhamos que (x, y) (z, w) e (z, w) (u, v). Assim,
(2x + 1)2w ≤ (2z + 1)2y e (2z + 1)2v ≤ (2u + 1)2w ⇒

2x + 1 2z + 1 2z + 1 2u + 1
≤ e ≤ ⇒
2y 2w 2w 2v
2x + 1 2u + 1
≤ ⇒
2y 2v
(2x + 1)2v ≤ (2u + 1)2y .
Logo, (x, y) (u, v).

Portanto, N × N com a relação é um conjunto parcialmente ordenado.
Exemplo 3.1.4. Considere novamente o conjunto N × N, desta vez com outra relação
tal que, para todo (x, y), (z, w) ∈ N × N:
(x, y) (z, w) ⇔ (x < z) ou (x = z e y ≤ w).
O conjunto N × N munido da relação é um conjunto parcialmente ordenado.

De fato, sejam (x, y), (z, w), (u, v) ∈ N × N.
Propriedade Reflexiva: Como x, y ∈ N, segue da ordem usual no conjunto dos
números naturais que x = x e y ≤ y. Assim, (x, y) (x, y).
Propriedade Antissimétrica: Suponhamos que (x, y) (z, w) e (z, w) (x, y). Por
um lado, x < z ou x = z, e, z < x ou z = x, o que implica em x = z. Além disso, no caso
em que x = z temos y ≤ w e w ≤ y. Portanto, (x, y) = (z, w).
Propriedade Transitiva: Se (x, y) (z, w) e (z, w) (u, v), então x < z ou x = z
e y ≤ w e, também, z < u ou z = u e w ≤ v. Se x < z, temos duas opções, a saber, z < u
ou z = u e w ≤ v. No caso z < u, obtemos x < u e, consequentemente, (x, y) (u, v). No
caso z = u e w ≤ v, temos x < u, e portanto, (x, y) (u, v). Por outro lado, suponhamos
37
que x = z e y ≤ w. Então, se z < u, obtemos x < u e, consequentemente, (x, y) (u, v).

Finalmente, se z = u e w ≤ v, temos x = u e y ≤ v. Logo, (x, y) (u, v). Portanto, vale
a transitividade.
3.2 ORDEM TOTAL E ELEMENTOS NOTÁVEIS EM CONJUNTOS PARCIAL-

MENTE ORDENADOS
Consideremos X um conjunto não vazio parcialmente ordenado com a relação .

Podemos nos perguntar se sempre é possível comparar dois elementos quaisquer de X.
Essa pergunta motiva a seguinte definição:
Definição 3.2.1. Diremos que X é totalmente ordenado se x y ou y x para quaisquer

x, y ∈ X.
Exemplo 3.2.1. O conjunto P(A) como no Exemplo 3.1.1 é totalmente ordenado se, e
somente se, ou A é o conjunto vazio ou é um conjunto unitário.
(⇒) Com efeito, suponhamos A 6= ∅. Então, existe a ∈ A, isto é, {a} ∈ P(A).
Seja x ∈ A. Como {x}, {a} são elementos do conjunto totalmente ordenado P(A), temos
{x} ⊆ {a} ou {a} ⊆ {x}. Em ambos os casos, x = a, de modo que todo elemento de A é
igual a a. Portanto, A = {a}.
(⇐) Reciprocamente, se A = ∅, então P(A) = {∅}. Assim, se X, Y ∈ P(A) então
X = Y = ∅. Consequentemente, X ⊆ Y e Y ⊆ X. Logo, P(A) é totalmente ordenado.
Por outro lado, suponhamos que A = {u}. Então, P(A) = {∅, {u}}. Sejam X, Y ∈ P(A)
tais que X = ∅ e Y = {u}. Segue que X ⊆ Y . Portanto, P(A) é totalmente ordenado.
Ao considerar conjuntos parcialmente ordenados é possível que existam elementos

específicos com certas propriedades. Definiremos a seguir algumas dessas propriedades.
Definição 3.2.2. Diremos que a ∈ X é um menor elemento de X se a x para todo

x ∈ X.
Proposição 3.2.1. Se um conjunto parcialmente ordenado X possui um menor elemento,

então ele é único.
Demonstração. Suponhamos que a, b ∈ X sejam ambos menores elementos de X. Como

a ∈ X e b é menor elemento de X, temos b a. Por outro lado, a também é menor
elemento de X, assim, a b. Portanto, pela Propriedade Antissimétrica, a = b.
Neste sentido, com a existência de um menor elemento a ∈ X, diremos simplesmente

que a é o menor elemento de X.
Exemplo 3.2.2. Considere o conjunto N × N com a relação de ordem dada no Exemplo

3.1.4. Afirmamos que (0, 0) é o menor elemento de N × N.
38
Com efeito, suponhamos que (0, 0) não seja o menor elemento de N × N. Isto
significa que existe (x, y) ∈ N × N tal que (x, y) (0, 0) e (x, y) 6= (0, 0). Então, temos
x < 0 ou x = 0 e y ≤ 0. Como x ∈ N, x = 0 e y ≤ 0. Da mesma forma, y = 0. Assim,
(x, y) = (0, 0), uma contradição. Portanto, (0, 0) é o menor elemento de N × N.
Exemplo 3.2.3. O conjunto N × N munido da relação de ordem do Exemplo 3.1.3 não

possui menor elemento.
De fato, suponhamos que N × N possui o menor elemento (a, b). Como 2b ≤ 2b+1 e
2a + 1 ∈ N, então (2a + 1)2b ≤ (2a + 1)2b+1 . Assim, (a, b + 1) (a, b). Contradição, uma
vez que assumimos que (a, b) é o menor elemento de N × N. Portanto, N × N não possui
menor elemento.
2x + 1
– Figura 3.2.1 – Gráfico da função f : N × N → R definida por f (x, y) = .
2y
Para ilustrar esse fato, consideremos a função f : N × N → R definida por

2x + 1
f (x, y) = . Então, (x, y) (a, b) se, e somente se, f (x, y) ≤ f (a, b). A Figura 3.2.1
2y
mostra o comportamento dessa função. Fixado f (x0 , y0 ) ∈ R, com (x0 , y0 ) ∈ N × N, tem-se
f (x0 , y) ≤ f (x0 , y0 ) sempre que y > y0 . Portanto, (x0 , y) (x0 , y0 ) sempre que y > y0 .
Definição 3.2.3. Diremos que a ∈ X é um maior elemento de X se x a para todo

x ∈ X.
De forma análoga à Proposição 3.2.1, tem-se a unicidade do maior elemento.
Definição 3.2.4. Diremos que a ∈ X é um elemento minimal de X se x ∈ X e x a

implica x = a.
Note que se a é o menor elemento de X então a é um elemento minimal de X.
Exemplo 3.2.4. Sejam X um conjunto não vazio e P(X)\{∅}, o conjunto de subcon-

juntos não vazios de X, com a relação de inclusão. Então, cada conjunto unitário em
39
P(X)\{∅} é um elemento minimal desse conjunto. Em particular, o elemento minimal

não necessariamente é único.
Com efeito, seja {a} ∈ P(X)\{∅}. Se A ∈ P(X)\{∅} é tal que A ⊂ {a}, então
para todo x ∈ A, temos x = a. Consequentemente, A = {a}. Logo, {a} é elemento
minimal de P(X)\{∅}.
Observação. Para X conjunto não vazio e não unitário, P(X)\{∅} não possui menor
elemento.
De fato, suponhamos que P(X)\{∅} possua o menor elemento A. Então, A ⊂ B
para todo B ∈ P(X)\{∅}. Em particular, A ⊂ {x} e A ⊂ {y}, para x, y ∈ X, x 6= y, o
que implica A = {x} e A = {y}. Isso contraria a unicidade do menor elemento. Logo,
P(X)\{∅} não possui menor elemento.
Definição 3.2.5. Diremos que a ∈ X é um elemento maximal de X se x ∈ X e a x

implica x = a.
Usaremos as seguintes notações para representar subconjuntos de X especiais:
s(a) = {x ∈ X ; x ≺ a} − segmento inicial estrito determinado por a ∈ X.
s̄(a) = {x ∈ X ; x a} − segmento inicial determinado por a ∈ X.
Um conjunto A ⊂ X diz-se limitado superiormente quando existe s ∈ X tal que

a s para todo a ∈ A. Neste caso, s é chamado de cota superior de A. Analogamente,
um conjunto A ⊂ X diz-se limitado inferiormente quando existe r ∈ X tal que r a para
todo a ∈ A. Neste caso, r é chamado de cota inferior de A.
1

Exemplo 3.2.5. Considere o conjunto A = ; n ∈ N∗ ⊂ R parcialmente ordenado
n
1
com a ordem usual ≤ em R. Então, 0 é uma cota inferior de A, pois 0 ∈ R e 0 ≤ para
n
todo n ∈ N∗ .
40
41
4 FAMÍLIAS
Quando estamos trabalhando com funções, existem certas ocasiões em que o

conjunto imagem é o mais importante a ser observado. Como um exemplo desta situação
temos as sequências de números reais, comumente estudadas em cursos de análise. Essa
consideração motiva as definições que seguem.
Definição 4.0.1. Seja X um conjunto não vazio. Uma família em é uma função x : I → X,
onde o conjunto não vazio I, domínio da função, é chamado de conjunto de índices e
cada elemento i ∈ I é chamado de índice. A imagem da função x é chamada de conjunto
indexado e cada x(i) = xi ∈ X é chamado de termo da família.
Representaremos a família x pelo conjunto de seus termos e escreveremos {xi }i∈I

quando estivermos nos referindo à função x : I → X. Neste sentido, ao considerarmos
uma família {Ai }i∈I de subconjuntos de um conjunto não vazio Y estamos nos referindo à
uma função A : I → P(Y ).
Definição 4.0.2. Seja {Ai }i∈I uma família de subconjuntos de um conjunto não vazio X.
A união da família {Ai }i∈I é a união de todos os seus termos Ai com i ∈ I.
Neste caso, utilizaremos a notação Ai . Assim, x ∈ Ai se, e somente se, x ∈ Ai

[ [
i∈I i∈I
para algum i ∈ I.
Definição 4.0.3. Seja {Ai }i∈I uma família não vazia de conjuntos não vazios. A interseção
da família {Ai }i∈I é a interseção de todos os seus termos Ai , onde i ∈ I.
Neste caso, utilizaremos a notação Ai . Assim, x ∈ Ai se, e somente se, x ∈ Ai

\ \
i∈I i∈I
para todo i ∈ I.
Naturalmente, podemos generalizar as leis associativa e comutativa para a união
de famílias.
Proposição 4.0.1 (Associatividade). Sejam {Ij }j∈J uma família de conjuntos, K =

[
Ij
j∈J
e {Ak }k∈K uma família de subconjuntos de um conjunto não vazio Y . Então, Ak =
[
k∈K
( Ai ).
[ [
j∈J i∈Ij
Demonstração. Seja a ∈ Ak . Então, a ∈ Ak0 para algum k0 ∈ K. Consequentemente,

[
k∈K
existe j0 ∈ J tal que k0 ∈ Ij0 . Assim, a ∈ Ak0 ⊂ ( Ai ). Portanto,
[ [ [
Ai ⊂
i∈Ij0 j∈J i∈Ij
( Ai ).
[ [
a∈
j∈J i∈Ij
42
Seja a ∈ ( Ai ). Então, existe j0 ∈ J tal que a ∈ Ai . Por conseguinte,

[ [ [
j∈J i∈Ij i∈Ij0
existe i0 ∈ Ij0 tal que a ∈ Ai0 . Como Ij0 ⊂ Ij = K, segue que a ∈ Ak .

[ [
j∈J k∈K
Proposição 4.0.2 (Comutatividade). Sejam x : K → K uma função bijetora tal que

x(i) = xi para todo i ∈ K e {Ak }k∈K uma família de subconjuntos de um conjunto não
vazio Y . Então, Ak = Axi .
[ [
k∈K i∈K
Demonstração. Seja a ∈ Ak . Então, a ∈ Ak0 para algum k0 ∈ K. Como x : K → K

[
k∈K
é uma função bijetora, existe i0 ∈ K tal que k0 = xi0 . Visto que Axi0 ⊂ Axi , temos
[
i∈K
Axi .
[
a∈
i∈K
Seja a ∈ Axi . Então, existe i0 ∈ K tal que a ∈ Axi0 . Como xi0 ∈ K, segue que
[
i∈K
Ak e, consequentemente, a ∈ Ak .
[ [
Axi0 ⊂
k∈K k∈K
Do mesmo modo, generalizamos as leis distributivas.
Proposição 4.0.3. Sejam {Ai }i∈I e {Bj }j∈J famílias de subconjuntos de um conjunto
não vazio X. Então:
1. ( Ai ) ∩ ( Bj ) = (Ai ∩ Bj );
[ [ [
i∈I j∈J (i,j)∈I×J
2. ( Ai ) ∪ ( Bj ) = (Ai ∪ Bj ).
\ \ \
i∈I j∈J (i,j)∈I×J
Demonstração. A prova do item (1), dividiremos em duas partes.

(i) : Seja x ∈ ( Ai ) ∩ ( Bj ). Então, x ∈ Ai e x ∈ Bj . Desta maneira,
[ [ [ [
i∈I j∈J i∈I j∈J

existem i0 ∈ I e j0 ∈ J tais que x ∈ Ai0 e x ∈ Bj0 . Assim, temos x ∈ Ai0 ∩ Bj0 para algum
(i0 , j0 ) ∈ I × J. Logo, x ∈ (Ai ∩ Bj ).
[
(i,j)∈I×J
(ii) : Seja x ∈ (Ai ∩ Bj ). Então, x ∈ Ai0 ∩ Bj0 para algum (i0 , j0 ) ∈ I × J.

[
(i,j)∈I×J
Consequentemente, x ∈ Ai0 e x ∈ Bj0 , com i0 ∈ I e j0 ∈ J. Daí, x ∈ Ai e x ∈ Bj .
[ [
i∈I j∈J
Logo, x ∈ ( Ai ) ∩ ( Bj ).
[ [
i∈I j∈J
Para provar o item (2), seguiremos o mesmo processo.

(i) : Seja x ∈ ( Ai ) ∪ ( Bj ). Então, x ∈ Ai ou x ∈ Bj . Suponhamos que
\ \ \ \
i∈I j∈J i∈I j∈J

Ai . Desta forma, para cada i ∈ I, tem-se Ai ⊂ Ai . Ademais, Ai ⊂ Ai ∪ Bj para
\ \
x∈
i∈I i∈I
43
todo j ∈ J. Assim, x ∈ Ai ∪ Bj para todo (i, j) ∈ I × J, isto é, x ∈ (Ai ∪ Bj ). Se

\
(i,j)∈I×J
Bj , obtemos, de modo análogo, x ∈ (Ai ∪ Bj ).
\ \
x∈
j∈J (i,j)∈I×J
(ii) : Seja x ∈ (Ai ∪ Bj ). Então, para cada (i, j) ∈ I × J, x ∈ Ai ∪ Bj .

\
(i,j)∈I×J
Suponhamos que x ∈ Ai . Daí, x ∈
/ Ai0 para algum i0 ∈ I. Porém, x ∈ Ai0 ∪ Bj
\
/
i∈I
para todo (i0 , j) ∈ I × J. Assim, x ∈ Bj para todo j ∈ J, e portanto x ∈ Bj . Logo,
\
i∈J
x∈( Ai ) ∪ ( Bj ).
\ \
i∈I j∈J
Proposição 4.0.4. Sejam X e Y conjuntos não vazios, I = {a, b} com a 6= b e o conjunto

Z = {z = {zi }i∈I ; za ∈ X e zb ∈ Y }. Então, existe uma bijeção de Z em X × Y .
Demonstração. Tome f : Z → X × Y tal que f (z) = (za , zb ).

Afirmação 1: A função f é injetora.
De fato, sejam z, w ∈ Z tais que f (z) = f (w). Então, (za , zb ) = (wa , wb ), e
portanto, z e w são funções de I em X ∪ Y tais que z(i) = w(i) ∀i ∈ I. Logo, z = w.
Afirmação 2: A função f é sobrejetora.
Com efeito, seja (x, y) ∈ X × Y . Considere a família z : {a, b} → X ∪ Y definida
por za = x e zb = y. Desta forma, obtemos (x, y) = (za , zb ) = f (z). Logo, f é sobrejetora.
Portanto, f é uma bijeção de Z em X × Y .
Com a ideia da construção anterior generalizaremos o conceito de produto cartesiano.

Essa generalização será importante no capítulo que tratará do Axioma da Escolha.
Definição 4.0.4. Seja {Xi }i∈I uma família de conjuntos não vazios. Definimos o produto
cartesiano da família {Xi }i∈I como o conjunto de todas as famílias {xi }i∈I em Xi tais
[
i∈I
que xi ∈ Xi para cada i ∈ I.
Utilizaremos a seguinte notação para o produto cartesiano: Xi .

Y
i∈I
44
45
5 AXIOMA DA ESCOLHA
Para cada n ∈ N∗ denotaremos por In = {p ∈ N∗ ; 1 ≤ p ≤ n} o conjunto dos

números naturais de 1 até n. Consideremos uma família finita de conjuntos {Xi }i∈In
com n ∈ N∗ . Se cada conjunto Xi for não vazio, é natural pensar na possibilidade de
escolhermos, simultaneamente, um elemento de cada Xi , formando uma outra família
finita {xi }i∈In tal que xi ∈ Xi para todo i ∈ In . A proposição seguinte nos remete à essa
escolha.
Proposição 5.0.1. Seja {Xi }i∈In uma família finita de conjuntos. Então, o produto
n
cartesiano Xi = ∅ se, e somente se, Xj = ∅ para algum j ∈ In .
Y
i=1
Demonstração. Consideremos o conjunto:

n
( )
S= n∈N ; Xi = ∅ ⇔ Xj = ∅ para algum j ∈ In
Y
∗
.
i=1
(i) Observe que 1 ∈ S e 2 ∈ S.

De fato, se existir uma família {x1 } tal que x1 ∈ X1 , temos X1 6= ∅. Se, por outro
lado, tivermos X1 6= ∅, então existe x1 ∈ X1 , de modo que obtemos uma família {x1 } com
1
x1 ∈ X1 , ou seja, X1 = Xi 6= ∅. Portanto, 1 ∈ S.
Y
i=1
Agora, suponhamos que exista uma família {xi }i∈I2 tal que xi ∈ Xi para todo
i ∈ I2 . Então, Xi 6= ∅ para i = 1, 2. Reciprocamente, se X1 6= ∅ e X2 6= ∅, existem x1 ∈ X1
e x2 ∈ X2 . Daí, obtemos uma família {xi }i∈I2 tal que xi ∈ Xi para todo i ∈ I2 . Logo, o
2
produto cartesiano Xi é não vazio. Portanto, 2 ∈ S.
Y
i=1
(ii) Supondo que k ∈ S, provaremos que k + 1 ∈ S.
Suponhamos que exista uma família {xi }i∈Ik+1 tal que xi ∈ Xi para todo i ∈ Ik+1 .
Segue imediatamente que Xi 6= ∅ para cada i ∈ Ik+1 . Reciprocamente, consideremos a
família {Xi }i∈Ik+1 . Suponhamos que Xi 6= ∅ para todo i ∈ Ik+1 . Em particular, Xi = 6 ∅
para todo i ∈ Ik . Por hipótese, existe uma família {xi }i∈Ik tal que xi ∈ Xi para cada i ∈ Ik .
Além disso, o conjunto Xk+1 6= ∅ e, consequentemente, existe xk+1 ∈ Xk+1 . Definimos
a família {xj }j∈Ik+1 de maneira que xj = xi se i = j e j ∈ Ik , e xj = xk+1 se j = k + 1.
Desta forma, obtemos uma família finita {xj }j∈Ik+1 tal que xj ∈ Xj para todo j ∈ Ik+1 .
Logo, k + 1 ∈ S.
Portanto, pelo Princípio da Indução Finita, S = N∗ .
A proposição anterior nos garante que se tivermos uma família finita de conjuntos
não vazios, então o produto cartesiano dos conjuntos dessa família também é não vazio.
A princípio, não é claro que o resultado seja válido para coleções infinitas de conjuntos.
46
O nosso próximo passo é generalizar esse resultado para o caso de famílias arbitrárias de
conjuntos.
Definição 5.0.1. Seja C uma coleção não vazia de conjuntos não vazios. Uma função
escolha para C é uma função f : C → A tal que f (A) ∈ A para todo A ∈ C .
[
A∈C
Exemplo 5.0.1. Seja C o conjunto de todos os países da Terra, sendo cada país um
conjunto de cidades. Então, C é uma coleção não vazia de conjuntos não vazios e Aé
[
A∈C
o conjunto de todas as cidades da Terra. A função f : C → A que associa a cada país
[
A∈C
sua cidade capital é uma função escolha para C .
Exemplo 5.0.2. Seja C o conjunto de todos os pares de sapatos do mundo. Então, a

função que escolhe o sapato do pé esquerdo de cada par é uma função escolha para C .
Exemplo 5.0.3. Seja C = P(N)\{∅}. A função f : C → A = N tal que f (A) =

[
A∈C
min(A), onde min(A) denota o menor elemento de A, é uma função escolha para C . O
Princípio da Boa Ordem em N nos diz que a função f está bem definida.
Agora estamos prontos para enunciar o Axioma da Escolha.
Axioma da Escolha. Para toda coleção não vazia de conjuntos não vazios existe uma
função escolha.
A Figura 5.0.1 fornece uma ilustração do Axioma da Escolha.
– Figura 5.0.1 – Uma ilustração do Axioma da Escolha. Por:

Fschwarzentruber.
Fonte: https://commons.wikimedia.org/w/index.php?curid=48219447
Existem maneiras equivalentes de formular o Axioma da Escolha que podem ser

úteis ou interessantes em alguns casos conforme mostra a proposição a seguir.
Proposição 5.0.2. Os seguintes enunciados são equivalentes:
(1) Axioma da Escolha;
(2) o produto cartesiano de uma coleção não vazia de conjuntos não vazios é não vazio;
47
(3) se {Xλ }λ∈Λ é uma coleção não vazia de conjuntos não vazios dois a dois disjuntos,
então existe um conjunto A tal que A ∩ Xλ é um conjunto unitário para cada λ ∈ Λ;
(4) toda relação contém uma função com o mesmo domínio.
Demonstração. (1) ⇒ (2): Seja C uma coleção de conjuntos não vazios. Por hipótese,
existe uma função f : C → A tal que f (A) ∈ A. Note que f é um elemento do produto
[
A∈C
cartesiano dos conjuntos em C . Portanto, segue o resultado.
(2) ⇒ (1): Seja C uma coleção de conjuntos não vazios, digamos, C = {A}A∈C .
Por hipótese, existe uma família f : C → A tal que f (A) ∈ A, isto é, um elemento do
[
A∈C
produto cartesiano dos conjuntos em C . Por definição de função escolha, segue que f é
uma função escolha para C .
(1) ⇒ (3): Seja {Xλ }λ∈Λ uma coleção não vazia de conjuntos não vazios dois a
dois disjuntos. Pelo Axioma da Escolha, existe uma família {xλ }λ∈Λ tal que xλ ∈ Xλ para
todo λ ∈ Λ. Tomemos A = {xλ ; λ ∈ Λ}.
Afirmação: A ∩ Xλ = {xλ } para cada λ ∈ Λ.
Com efeito, seja λ0 ∈ Λ.
(i) {xλ0 } ⊂ A ∩ Xλ0 : Como xλ0 ∈ A e xλ0 ∈ Xλ0 , vale a inclusão.
(ii) A ∩ Xλ0 ⊂ {xλ0 }: Suponhamos que essa inclusão não seja verdadeira. Então,
existe xλ ∈ A ∩ Xλ0 tal que xλ 6= xλ0 . Consequentemente, λ 6= λ0 e xλ ∈ Xλ ∩ Xλ0 , o que
é uma contradição do fato dos conjuntos da coleção {Xλ }λ∈Λ serem dois a dois disjuntos.
Portanto, a inclusão é verdadeira.
Logo, A ∩ Xλ é um conjunto unitário para cada λ ∈ Λ.
(3) ⇒ (1): Seja {Xλ }λ∈Λ uma coleção não vazia de conjuntos não vazios. Para cada
λ ∈ Λ, consideremos Aλ = {Xλ } × Xλ . Assim, obtemos a coleção de conjuntos {Aλ }λ∈Λ .
Para cada λ ∈ Λ, o conjunto Aλ 6= ∅, pois Xλ ∈ {Xλ } e Xλ 6= ∅. Além disso, (x, y) ∈ Aλ
se, e somente se, x = Xλ e y ∈ Xλ , λ ∈ Λ. Portanto, um elemento do conjunto Aλ é um
par ordenado (Xλ , xλ ) tal que xλ ∈ Xλ .
Afirmação 1: Dados Aλ1 e Aλ2 , tem-se Aλ1 ∩ Aλ2 = ∅ ou Aλ1 = Aλ2 .
Com efeito, suponhamos que Aλ1 ∩ Aλ2 6= ∅. Assim, existe a ∈ Aλ1 ∩ Aλ2 e,
consequentemente, a = (Xλ1 , xλ1 ) e a = (Xλ2 , xλ2 ) tal que xλ1 ∈ Xλ1 e xλ2 ∈ Xλ2 . Daí,
(Xλ1 , xλ1 ) = (Xλ2 , xλ2 ) e, em particular, Xλ1 = Xλ2 . Logo, Aλ1 = Aλ2 .
Diante disso, {Aλ }λ∈Λ é uma coleção não vazia de conjuntos não vazios dois a dois
disjuntos. Assim, existe um conjunto A tal que A ∩ Aλ = {(Xλ , xλ )} para cada λ ∈ Λ.
Tomemos f = {(Xλ , xλ ) ; (Xλ , xλ ) ∈ A ∩ Aλ para cada λ ∈ Λ} ⊂ {Xλ }λ∈Λ × Xλ .
[
λ∈Λ
Afirmação 2: f é uma função.
48
De fato, sejam (Xλ , x), (Xλ , y) ∈ f . Então, x ∈ Xλ e y ∈ Xλ . Além disso,

(Xλ , x), (Xλ , y) ∈ A∩Aλ . Como A∩Aλ é um conjunto unitário, segue que (Xλ , x) = (Xλ , y).
Portanto, x = y.
Desta forma, f é uma função de {Xλ }λ∈Λ em Xλ tal que f (Xλ ) = xλ ∈ Xλ
[
λ∈Λ
para todo λ ∈ Λ, isto é, f é uma função escolha para {Xλ }λ∈Λ . Portanto, vale o Axioma
da Escolha.
(1) ⇒ (4): Seja R ⊂ A × B uma relação. O domínio de R é o conjunto D(R) =
{a ∈ A ; (a, b) ∈ R para algum b ∈ B}. Para cada a ∈ D(R), definamos Xa = {b ∈
B ; (a, b) ∈ R}. Note que Xa 6= ∅. Desta forma, obtemos a família não vazia de
conjuntos não vazios {Xa }a∈D(R) . Pelo Axioma da Escolha, existe uma função escolha
f : {Xa }a∈D(R) → Xa tal que f (Xa ) = xa ∈ Xa para cada a ∈ D(R). Portanto,
[
[ a∈D(R)
x : D(R) → Xa dada por x(a) = xa para todo a ∈ D(R) é uma função. Mais
a∈D(R)
especificamente, o subconjunto de R, {(a, xa ) ; a ∈ D(R)} é uma função.
(4) ⇒ (1): Seja C uma coleção não vazia de conjuntos não vazios. Considere a
relação R = {(A, a) ; A ∈ C e a ∈ A}. Notemos que R é um subconjunto de C × Ae
[
A∈C
uma relação com domínio C . Por hipótese, R contém uma função f com o mesmo domínio.
Assim, para cada A ∈ C , existe um único f (A) ∈ A tal que (A, f (A)) ∈ f . Portanto,
f :C → A é uma função escolha em C .
[
A∈C
5.1 APLICAÇÕES
Uma importante aplicação do Axioma da Escolha, geralmente vista em cursos de

Análise, é o resultado que diz que todo conjunto infinito possui um subconjunto infinito
enumerável. Lembremos que um conjunto X diz-se enumerável quando é finito ou existe
uma bijeção f : N → X.
Para apresentar esse resultado, precisaremos de uma importante ferramenta conhe-
cida como Teorema da Recursão.
Teorema 5.1.1 (Teorema da Recursão). Sejam X um conjunto, a ∈ X e f : X → X

uma função. Então existe uma função u : N∗ → X tal que u(1) = a e u(n + 1) = f (u(n))
para todo n ∈ N∗ .
Demonstração. Seja C = {A ⊆ N∗ × X ; (1, a) ∈ A e ((n, x) ∈ A ⇒ (n + 1, f (x)) ∈ A)}.

Como 1 ∈ N∗ e a ∈ X, então (1, a) ∈ N∗ × X. Além disso, sendo (n, x) ∈ N∗ × X, tem-se
n + 1 ∈ N∗ e f (x) ∈ X. Consequentemente, (n + 1, f (x)) ∈ N∗ × X. Assim, N∗ × X ∈ C ,
isto é, C 6= ∅.
49
Consideremos a interseção u = A. Como u ⊆ A para todo A ∈ C , em

\
A∈C
particular, temos u ⊆ N∗ × X. Uma vez que (1, a) ∈ A para todo A ∈ C , temos (1, a) ∈ u.
Agora, suponhamos que (n, x) ∈ u. Então, para cada A ∈ C , tem-se (n, x) ∈ A, de modo
que (n + 1, f (x)) ∈ A. Assim, (n + 1, f (x)) ∈ u. Logo, u ∈ C .
Afirmação: u é uma função.
Seja S = {n ∈ N∗ ; (n, x) ∈ u para um único x ∈ X}. Note que 1 ∈ S. Com
efeito, suponhamos que 1 ∈ / S. Então, para algum b ∈ X, b 6= a, tem-se (1, b) ∈ u.
Assim, (1, a) ∈ u \{(1, b)}. Além disso, se (n, x) ∈ u \{(1, b)}, então (n + 1, f (x)) ∈ u e
(n + 1, f (x)) 6= (1, b). Daí, (n + 1, f (x)) ∈ u \{(1, b)} e, portanto, u \{(1, b)} ∈ C . Logo,
u= A ⊆ u \{(1, b)}, o que implica em u = u \{(1, b)}. Absurdo.
\
A∈C
Suponhamos agora que n ∈ S. Então, existe um único x ∈ X tal que (n, x) ∈ u.
Provaremos que n + 1 ∈ S. De fato, se n + 1 ∈ / S, existe b ∈ X, b 6= f (x), tal que
(n + 1, b) ∈ u. Como 1 6= n + 1 para todo n ∈ N , segue que (1, a) ∈ u \{(n + 1, b)}. Além
∗
disso, se (m, t) ∈ u \{(n + 1, b)}, temos duas possibilidades: m = n ou m 6= n. Se m = n,

então, por hipótese de indução, t = x e, consequentemente, (m + 1, f (t)) = (n + 1, f (x)) ∈
u \{(n + 1, b)}. Se m 6= n, então m + 1 6= n + 1 e, assim, (m + 1, f (t)) 6= (n + 1, b);
logo, (m + 1, f (t)) ∈ u \{(n + 1, b)}. Logo, o conjunto u \{(n + 1, b)} ∈ C . Diante disso,
u ⊆ u \{(n + 1, b)}. Absurdo. Portanto, n + 1 ∈ S.
Pelo Princípio da Indução Finita, concluímos que S = N∗ . Logo, u é uma função
tal que (1, a) ∈ u e (n + 1, f (x)) ∈ u sempre que (n, x) ∈ u para todo n ∈ N∗ .
Definição 5.1.1. Dizemos que um conjunto infinito Y é enumerável se existe uma função
bijetora g : N∗ → Y .
Teorema 5.1.2. Todo conjunto infinito contém um subconjunto infinito enumerável.
Demonstração. Seja X um conjunto infinito. Tomemos f : P(X)\{∅} → X uma função

escolha para X e C = {A ⊂ X ; A é finito}. Como ∅ ⊂ X é finito, temos C 6= ∅. Seja
φ : C → C dada por φ(A) = A ∪ {f (X\A)}. Pelo Teorema 5.1.1, existe u : N∗ → C tal
que u(1) = ∅ e u(n + 1) = φ(u(n)) = u(n) ∪ {f (X\u(n))} para todo n ∈ N∗ . Definimos
g : N∗ → X de modo que g(n) = f (X\u(n)) para todo n ∈ N∗ .
Afirmação: g é injetora.
Com efeito, sejam m, n ∈ N∗ , m 6= n. Então, m < n ou n < m. Suponhamos
n < m. Então, u(n) ⊂ u(m). Como g(m) = f (X\u(m)), temos g(m) ∈ / u(m). Visto
que u(n + 1) = u(n) ∪ {g(n)}, então g(n) ∈ u(n + 1) e, portanto, g(n) ∈ u(m). Logo,
g(n) 6= g(m). De modo análogo, se m < n, obtemos g(n) 6= g(m). Desta forma, g é
injetora.
A função h : N∗ → g(N∗ ) dada por h(n) = g(n) é uma bijeção. Logo, o subconjunto
g(N∗ ) de X é enumerável.
50
A seguir, apresentamos uma aplicação do Axioma da Escolha numa família de

conjuntos enumeráveis.
Lema 5.1.1. Seja f : X → Y uma função sobrejetiva. Se X é enumerável, então Y

também é enumerável.
Demonstração. Vide [2].
Lema 5.1.2. N∗ × N∗ é enumerável.
Demonstração. Vide [2].
Lema 5.1.3. O produto cartesiano de dois conjuntos enumeráveis é um conjunto enume-

rável.
Demonstração. Segue do Lema 5.1.2.
Teorema 5.1.3. Seja {Xi }i∈N∗ uma coleção de conjuntos enumeráveis. A reunião X =
Xi é enumerável.
[
i∈N∗
Demonstração. Para cada Xi , considere Fi = {g : N∗ → Xi ; g é bijetora}. Como, para

todo i ∈ N∗ , Xi é enumerável, Fi é não vazio. Assim, aplicando o Axioma da Escolha à
família {Fi }i∈N∗ , para cada i ∈ N∗ , podemos escolher fi ∈ Fi . Tomemos f : N∗ × N∗ → X
dada por f (m, n) = fn (m).
Afirmação: f é sobrejetora.
Seja x ∈ X. Então, existe j ∈ N∗ tal que x ∈ Xj . Como fj : N∗ → Xj é sobrejetora,
existe i ∈ N∗ tal que x = fj (i). Logo, x = f (i, j), isto é, f é sobrejetora.
Portanto, pelos Lemas 5.1.2 e 5.1.1, X é enumerável.
Entre tantas aplicações, o Axioma da Escolha também foi utilizado na construção

de um subconjunto de R não mensurável segundo Lebesgue, conhecido como o Conjunto
de Vitali. A seguir veremos tal construção.
Definição 5.1.2. Uma família B de subconjuntos de um conjunto X é dita uma σ-álgebra

em X se as seguintes condições são satisfeitas:
(1) ∅, X pertencem a B;
(2) se A pertence a B, então X\A pertence a B;

∞
(3) se (An )n∈N é uma sequência de subconjuntos em B, então
[
An ∈ B.
n=1
51
Um par ordenado (X, B) consistindo de um conjunto X e uma σ-álgebra B de

subconjuntos de X é chamado de espaço mensurável e os conjuntos em B são chamados
de conjuntos X-mensuráveis.
Lembremos que a medida de Lebesgue em R é uma função µ : B → [0, +∞] tal
que:
(i) µ(∅) = 0;
(ii) µ(E) ≥ 0 para todo E ∈ B;
(iii) se (Ei )i∈N é uma família de conjuntos disjuntos em B, então
∞ ∞
Ei ) = µ(Ei ),
[ X
µ(
i=1 i=1
onde B é a σ-álgebra gerada por todos os intervalos abertos (a, b) em R.

Além disso, µ coincide com o comprimento nos intervalos abertos, isto é, se a, b
são números reais com a < b, então µ((a, b)) = b − a.
Outra propriedade da medida de Lebesgue que utilizaremos é a invariância de µ
pelas translações. Mais precisamente, sejam E ∈ B, x ∈ R e E + x = {e + x ; e ∈ E}.
Então,
µ(E) = µ(E + x).
E por fim, diremos que um subconjunto A ∈ B é dito mensurável segundo Lebesgue

se, µ(A) = m para algum m ∈ R.
Observemos que se A ⊂ B, então µ(A) ≤ µ(B). Pois, se A ⊂ B, então B =
A ∪ (B\A). Além disso, A e B\A são subconjuntos disjuntos de R. Assim, µ(B) =
µ(A) + µ(B\A). Como 0 ≤ µ(B\A), segue que µ(A) ≤ µ(A) + µ(B\A) = µ(B).
5.1.1 CONSTRUÇÃO DO CONJUNTO DE VITALI
Seja I = [0, 1] ⊂ R. Dados x, y ∈ I, diremos que x ∼ y se, e somente se, x − y ∈ Q.
Proposição 5.1.1. A relação ∼ é uma relação de equivalência no conjunto I.
Demonstração. Sejam x, y, z ∈ I. Como x − x = 0 ∈ Q, segue que x ∼ x. Assim,

∼ é reflexiva. Agora, suponhamos que x ∼ y. Então, x − y ∈ Q e, por conseguinte,
y − x = −(x − y) ∈ Q. Logo, y ∼ x. Desta forma, ∼ é simétrica. Por fim, suponhamos que
x ∼ y e y ∼ z. Então, x − y ∈ Q e y − z ∈ Q. Diante disso, x − z = (x − y) + (y − z) ∈ Q,
isto é, x ∼ z. Portanto, ∼ é transitiva.
Para cada x ∈ I, considere x = {y ∈ I ; x ∼ y}. Mas como x ∼ x, x = 6 ∅. Além

disso, o conjunto quociente I/ ∼ = {x ; x ∈ I} é uma partição do intervalo I.
52
Então, o conjunto C = I/ ∼ é uma coleção não vazia de conjuntos não vazios.

Aplicando o Axioma da Escolha à família {Au }u∈C dada por Au = u = x, obtemos uma
família U = {au }u∈C tal que au ∈ u para todo u ∈ C .
O conjunto U foi obtido pelo matemático italiano Giuseppe Vitali (1875 – 1932)
em 1905 e, por isso, foi chamado de conjunto de Vitali.
Teorema 5.1.4. O conjunto U não é mensurável segundo Lebesgue.
Demonstração. Suponhamos que U seja mensurável. Então, µ(U ) = c para algum c ≥ 0.

Seja Q ∩ [−1, 1] = {rn ; n ∈ N} uma enumeração do conjunto Q ∩ [−1, 1]. Assim, para
cada n ∈ N, considere Un = U + rn = {au + rn ; au ∈ U }.
Afirmação 1: Se m 6= n, então Um ∩ Un = ∅.
Suponhamos que exista a ∈ Um ∩ Un . Então, existem u, v ∈ C tais que a = au + rm
e a = av + rn . Desta forma, au + rm = av + rn , o que implica au − av = rn − rm ∈ Q.
Assim, au ∼ av , de modo que au = av e, portanto, rm = rn . Absurdo, pois m 6= n. Logo,
Um ∩ Un = ∅
Diante disso, {Un }n∈N é uma família enumerável de subconjuntos disjuntos da reta.
∞ ∞
Desta forma, µ( Un ) = µ(Un ) e, como µ é invariante por translação, segue que, para
[ X
n=1 n=1
cada n ∈ N, µ(Un ) = µ(U ).
∞
Afirmação 2: [0, 1] ⊂ Un ⊂ [−1, 2].
[
n=1
Seja x ∈ [0, 1]. Então, pela definição do conjunto U , existe u ∈ C tal que x ∼ au .
Assim, x − au = r ∈ Q. Como 0 ≤ x ≤ 1 e 0 ≤ au ≤ 1, segue que −1 ≤ x − au ≤ 1. Logo,
r = rn0 para algum n0 ∈ N e, consequentemente, x = au + rn0 . Disso decorre que x ∈ Un0
∞
e, portanto, x ∈ Un .
[
n=1
∞
Agora, seja x ∈ Un . Então, existe j ∈ N tal que x = au + rj , com au ∈ U . Uma
[
n=1
vez que −1 ≤ rj ≤ 1 e 0 ≤ au ≤ 1, segue que −1 ≤ au + rj ≤ 2. Portanto, x ∈ [−1, 2].
Diante disso,
∞ ∞
1 ≤ µ( Un ) = µ(U ) ≤ 3.
[ X
n=1 n=1
∞ ∞ ∞
Como µ(U ) ≤ 3, decorre que µ(U ) = 0. Por outro lado, 0 < 1 ≤ µ(U ).
X X X
n=1 n=1 n=1

Absurdo.
53
6 LEMA DE ZORN
Apresentaremos neste capítulo o Lema de Zorn, que nos fornece uma condição
suficiente para que um conjunto tenha um elemento maximal. Veremos algumas de suas
aplicações que nos mostrarão a importância desse lema tão conhecido.
Lema de Zorn. Se X é um conjunto parcialmente ordenado tal que todo subconjunto

totalmente ordenado possui cota superior, então X contém um elemento maximal.
6.1 APLICAÇÕES
Teorema 6.1.1. Todo espaço vetorial V , V 6= {~0}, possui uma base.
Demonstração. Sejam V um espaço vetorial arbitrário, V 6= {~0}, e
X = {B ⊂ V ; B é linearmente independente}.
O conjunto X é parcialmente ordenado pela relação de inclusão de conjuntos. Além disso,

X = 6 ∅, pois, existe v ∈ V , v 6= ~0, de modo que {v} ⊂ V é linearmente independente.
Seja C = {Aλ }λ∈Λ ⊂ X um conjunto totalmente ordenado. Então, A = Aλ é uma
[
λ∈Λ
cota superior de C em X . De fato, temos Aλ ⊂ A para todo λ ∈ Λ. Além disso, como
C ⊂ X , temos A ⊂ V .
Afirmação 1: A é um conjunto linearmente independente.
Com efeito, seja {v1 , v2 , ..., vn } um subconjunto finito de A. Então, para cada
i = 1, . . . , n, existem αi ∈ Λ tais que vi ∈ Aαi . Como C é totalmente ordenado, existe
α ∈ {αi ; i = 1, . . . , n} tal que Aαi ⊂ Aα para todo i ∈ {1, . . . , n}. Por conseguinte, vi ∈ Aα
n
para todo i = 1, ..., n. Como Aα é linearmente independente, segue que λi vi = ~0 implica
X
i=1
λi = 0. Logo, A é linearmente independente.
Portanto, A ∈ X .
Desta forma, mostramos que X é um conjunto parcialmente ordenado tal que
todo subconjunto totalmente ordenado possui cota superior. Pelo Lema de Zorn, existe
um elemento maximal M ∈ X .
Afirmação 2: M é uma base de V .
Com efeito, se M não for uma base de V , deve existir v ∈ V , v = 6 ~0, que não é
combinação linear dos vetores de M . Assim, o conjunto M ∪{v} é linearmente independente,
o que é um absurdo, pois contraria o fato de M ser elemento maximal de X . Portanto,
M gera o espaço V e é linearmente independente.
Logo, M é uma base de V.
54
A próxima aplicação garante a existência de conjuntos ortonormais completos

em espaços de Hilbert. Antes da aplicação propriamente dita, iniciaremos com alguns
conceitos básicos que nos auxiliarão a compreendê-la.
Definição 6.1.1. Sejam V um espaço vetorial e K = R ou C. Uma norma em V é uma

função k · k : V → R tal que para quaisquer u, v ∈ V e λ ∈ K:
(1) kuk = 0 se, e somente se, u = ~0;
(2) kuk > 0, se u 6= ~0;
(3) kλuk = |λ|kuk;
(4) ku + vk ≤ kuk + kvk.
Dizemos que (V, k · k) é um espaço vetorial normado.
Definição 6.1.2. Uma sequência em um espaço vetorial V é uma função x : N → V que a

cada natural n associa um vetor x(n) = xn ∈ V . Essa sequência é denotada simplesmente
por (xn )n∈N .
Definição 6.1.3. Dizemos que uma sequência (xn )n∈N em um espaço vetorial normado
V converge para um vetor v se, para todo > 0, existe n0 ∈ N tal que n > n0 implica
kxn − vk < . Neste caso, dizemos que (xn )n∈N é convergente em V .
Definição 6.1.4. Dizemos que uma sequência (xn )n∈N em um espaço vetorial normado V
é uma sequência de Cauchy se, para todo > 0, existe n0 ∈ N tal que m, n > n0 implica
kxm − xn k < .
É conhecido e de simples verificação que toda sequência convergente é uma sequência

de Cauchy. Porém, nem sempre a recíproca é verdadeira.
Definição 6.1.5. Um espaço vetorial normado V é dito completo se toda sequência de

Cauchy em V é convergente em V .
Definição 6.1.6. Sejam V um espaço vetorial e K = R ou C. Um produto interno sobre

V é uma função h·, ·i : V × V → K que a cada par (u, v) ∈ V × V associa o escalar
hu, vi ∈ K e satisfaz as seguintes propriedades para quaisquer u, v, w ∈ V e λ ∈ K:
(1) hu, ui > 0, se u 6= ~0;
(2) hu + v, wi = hu, wi + hv, wi;
(3) hλu, vi = λhu, vi;
(4) hu, vi = hv, ui.

55
Neste caso, dizemos que V é um espaço vetorial munido do produto interno h·, ·i.
Um produto interno em um espaço vetorial induz uma norma no espaço como a
seguir.
Proposição 6.1.1. Seja V um espaço vetorial

q
com produto interno. A função k·k : V → R
que a cada v ∈ V associa o escalar kvk = hv, vi define uma norma em V .
Demonstração. Sejam u, v ∈ V e λ ∈ K.
q
• Se kuk = 0, então hu, ui = 0 e, assim, hu, ui = 0. Logo, u = ~0, pois caso contrário,
hu, ui > 0. Agora, suponhamos que u = ~0. Dado v ∈ V , temos h~0, vi = 0.
Com efeito,
h~0, vi = h~0 + ~0, vi = h~0, vi + h~0, vi ⇒ h~0, vi = 0.
q
Em particular, para v = ~0 = u, kuk = hu, ui = 0.
q
• Se u 6= ~0, então hu, ui > 0 e, desta forma, kuk = hu, ui > 0.
• Para mostrar que kλuk = |λ|kuk, observe que:
kλuk2 = hλu, λui = λhu, λui = λhλu, ui = λ(λhu, ui)

= λ(λ · hu, ui) = λ · λ · hu, ui = |λ|2 · hu, ui .
Logo, vale a igualdade kλuk = |λ|kuk.
• Para demonstrar a desigualdade triangular, utilizaremos a desigualdade de Cauchy-

Schwarz: |hu, vi| ≤ kuk · kvk. Então,
ku + vk2 = hu + v, u + vi = hu, u + vi + hv, u + vi = hu + v, ui + hu + v, vi

= hu, ui + hv, ui + hu, vi + hv, vi = hu, ui + hu, vi + hu, vi + hv, vi
= kuk2 + 2Re(hu, vi) + kvk2 .
Como Re(z) ≤ |z| para todo z ∈ C, temos
ku + vk2 ≤ kuk2 + 2|hu, vi| + kvk2 ≤ kuk2 + 2kuk · kvk + kvk2 ⇒
ku + vk2 ≤ (kuk + kvk)2 .
Portanto, ku + vk ≤ kuk + kvk.
Definição 6.1.7 (Espaço de Hilbert). Seja V um espaço vetorial com produto interno.
Dizemos que V é um espaço de Hilbert quando V , munido da norma proveniente do
produto interno, é completo.
56
Definição 6.1.8 (Ortogonalidade). Sejam V um espaço vetorial com produto interno e

u, v ∈ V . Dizemos que u e v são ortogonais quando hu, vi = 0.
Definição 6.1.9 (Conjunto Ortonormal). Um subconjunto S de um espaço de Hilbert

H é dito um conjunto ortonormal se, para quaisquer u, v ∈ S:
(1) kuk = 1;
(2) hu, vi = 0 sempre que u 6= v.
Definição 6.1.10 (Conjunto Ortonormal Completo). Um conjunto ortonormal S em um

espaço de Hilbert H é dito completo, ou uma base ortonormal completa, se o único vetor
de H ortogonal a todos os vetores de S é o vetor nulo.
Teorema 6.1.2. Todo espaço de Hilbert contém um conjunto ortonormal completo.
Demonstração. Sejam H um espaço de Hilbert e C = {S ⊂ H ; S é ortonormal }

parcialmente ordenado com a relação de inclusão. Pelo Teorema 6.1.1, H possui uma
base. Dados B uma base de H e I ⊂ B finito, segue que I é um conjunto linearmente
independente. Pelo processo de ortogonalização de Gram-schmidt, obtemos a partir de I
um conjunto ortogonal e, a partir deste, um conjunto ortonormal. Assim, C é não vazio.
Sejam {Cλ }λ∈Λ ⊂ C um conjunto totalmente ordenado e C = Cλ . Então,
[
λ∈Λ
C⊂H.
Afirmação 1: C é ortonormal.
Dado u ∈ C, temos u ∈ Cλ para algum λ ∈ Λ e, assim, como Cλ é ortonormal,
kuk = 1.
Sejam u, v ∈ C. Então, existem λ1 , λ2 ∈ Λ tais que u ∈ Cλ1 e v ∈ Cλ2 . Visto que
Cλ1 ⊂ Cλ2 ou Cλ2 ⊂ Cλ1 , existe α ∈ {λ1 , λ2 } tal que Cλi ⊂ Cα para todo i = 1, 2. Assim,
u, v ∈ Cα e, como Cα é um conjunto ortonormal, hu, vi = 0.
Portanto, C ∈ C .
Além disso, como Cλ ⊂ C para todo λ ∈ Λ, C é uma cota superior de {Cλ }λ∈Λ em
C . Logo, pelo Lema de Zorn, existe um elemento maximal M ∈ C .
Afirmação 2: M é um conjunto ortonormal completo.
Suponhamos que exista u ∈ H não nulo com kuk = 1 tal que hu, mi = 0 para
todo m ∈ M . Então, o conjunto M ∪ {u} é um conjunto ortonormal contendo M . Como
M é maximal, segue que M = M ∪ {u}, isto é, u ∈ M . Consequentemente, hu, ui = 0.
Absurdo, pois kuk2 = hu, ui = 1.
Portanto, o único vetor de H ortogonal a todos os vetores de M é o vetor nulo, isto é, M
é um conjunto ortonormal completo.
57
Agora, veremos que o produto cartesiano de uma família arbitrária de espaços topo-
lógicos compactos é compacto. Para tanto, alguns resultados preliminares são necessários.
Definição 6.1.11. Uma topologia em um conjunto X é uma coleção τ de subconjuntos

de X, chamados os abertos da topologia, com as seguintes propriedades:
(1) ∅ e X pertencem a τ ;
(2) se A1 , . . . , An ∈ τ , então A1 ∩ . . . ∩ An ∈ τ ;
(3) dada uma família arbitrária {Aλ }λ∈Λ , Aλ ∈ τ para todo λ ∈ Λ, tem-se Aλ ∈ τ .
[
λ∈Λ
Neste caso, o par (X, τ ) é um espaço topológico e τ é uma topologia em X.
Definição 6.1.12. Uma família {Aλ }λ∈Λ de subconjuntos de um conjunto X possui a

propriedade da interseção finita se para todo {λ1 , . . . , λn } ⊂ Λ finito, tem-se Aλ1 ∩ . . . ∩
Aλn 6= ∅.
Definição 6.1.13. Diremos que uma família {Aλ }λ∈Λ de subconjuntos de um conjunto
X é maximal com a propriedade da interseção finita se para toda coleção A de partes de
X com a propriedade da interseção finita tal que {Aλ }λ∈Λ ⊂ A , tem-se {Aλ }λ∈Λ = A .
Proposição 6.1.2. Uma família {Aλ }λ∈Λ de subconjuntos de um conjunto X é maximal

com a propriedade da interseção finita se, e somente se, A ⊂ X e A ∩ Aλ =
6 ∅ para todo
λ ∈ Λ implica A ∈ {Aλ }λ∈Λ .
Demonstração. (⇒) Seja A ⊂ X tal que A ∩ Aλ = 6 ∅ para todo λ ∈ Λ. Assim, podemos

considerar o conjunto de índices L = Λ ∪ {A} e a família {Bλ }λ∈L dada por Bλ = Aλ se
λ ∈ Λ e Bλ = A se λ = A. Desta forma, {Aλ }λ∈Λ ⊂ {Bλ }λ∈L .
Afirmação: {Bλ }λ∈L possui a propriedade da interseção finita.
Seja {λ1 , . . . , λn } ⊂ L finito. Então, temos as seguintes possibilidades.
Caso 1: Bλi 6= A para todo i = 1, . . . , n.
Neste caso, λi ∈ Λ para todo i ∈ {1, . . . , n}, de modo que Bλi = Aλi . Assim,
Bλ1 ∩ . . . ∩ Bλn = Aλ1 ∩ . . . ∩ Aλn 6= ∅, pois {Aλ }λ∈Λ goza da propriedade da interseção
finita.
Caso 2: Bλi = A para algum i = 1, . . . , n.
n
Suponhamos que Bλ1 ∩ . . . ∩ Bλn = ∅. Assim, A ∩ ( Aλj ) = ∅. Consequentemente,
\
j=1
j6=i
n n
Aλj = (X\Aλj ). Daí, A ⊂ X\Aλk para algum k ∈ {1, . . . , n}\{i}. Por
\ [
A ⊂ X\
j=1 j=1
j6=i j6=i
conseguinte, A ∩ Aλk = ∅. Absurdo. Logo, Bλ1 ∩ . . . ∩ Bλn 6= ∅.
58
Como {Aλ }λ∈Λ é maximal com a propriedade da interseção finita, {Aλ }λ∈Λ =
{Bλ }λ∈L e, portanto, A ∈ {Aλ }λ∈Λ .
(⇐) Seja C uma coleção de subconjuntos de X com a propriedade da interseção
finita tal que {Aλ }λ∈Λ ⊂ C . Para todo A ∈ C , temos A ⊂ X e para cada λ ∈ Λ,
A ∩ Aλ 6= ∅. Assim, por hipótese, A ∈ {Aλ }λ∈Λ . Portanto, {Aλ }λ = C , isto é, {Aλ }λ∈Λ é
maximal com a propriedade da interseção finita.
Corolário 6.1.1. Se uma família {Aλ }λ∈Λ de subconjuntos de um conjunto X é maximal

com a propriedade da interseção finita, então, para todo {λ1 , . . . , λn } ⊂ Λ finito, Aλ1 ∩
. . . ∩ Aλn ∈ {Aλ }λ∈Λ .
Demonstração. Segue de imediato da Proposição 6.1.2 e da propriedade da interseção

finita.
Lema 6.1.1. Seja {Xλ }λ∈Λ uma família de subconjuntos de um conjunto X com a
propriedade da interseção finita. Então, existe uma família M de subconjuntos de X,
maximal com a propriedade da interseção finita e contendo {Xλ }λ∈Λ
Demonstração. Seja X o conjunto de todas as famílias de subconjuntos de X com a

propriedade da interseção finita que contêm {Xλ }λ∈Λ . Então, X é parcialmente ordenado
pela relação de inclusão. Seja {Fi }i∈I um subconjunto totalmente ordenado de X .
Consideremos o conjunto Fi .
[
i∈I
Sabemos que Fi ⊂ Fi para todo i ∈ I. Além disso, para cada i ∈ I, Fi é uma

[
i∈I
família de subconjuntos de X contendo a família {Xλ }λ∈Λ . Logo, {Xλ }λ∈Λ ⊂ Fi .
[
i∈I
Seja {F1 , F2 , . . . , Fn } ⊂ Fi finito. Para cada j ∈ {1, . . . , n}, existe ij ∈ I tal

[
i∈I
que Fj ∈ Fij . Uma vez que {Fi }i∈I é totalmente ordenado, existe k ∈ {1, . . . , n} tal que
Fij ⊂ Fik para todo j = 1, . . . , n. Desta maneira, {F1 , F2 , . . . , Fn } ⊂ Fik . Como Fik
possui a propriedade da interseção finita, F1 ∩ F2 ∩ . . . ∩ Fn =6 ∅. Logo, Fi possui a
[
i∈I
propriedade da interseção finita, isto é, Fi ∈ X .
[
i∈I
Portanto, Fi é uma cota superior de {Fi }i∈I em X . Pelo Lema de Zorn, existe
[
i∈I
um elemento maximal M ∈ X .
Definição 6.1.14. Seja (X, τ ) um espaço topológico. Dizemos que um subconjunto

F ⊂ X é fechado se, X\F ∈ τ .
Definição 6.1.15. Sejam (X, τ ) um espaço topológico e S subconjunto de X. Um ponto

x ∈ X é dito aderente a S quando, para qualquer A ∈ τ contendo x, S ∩ A 6= ∅. O
conjunto dos pontos de X que são aderentes a S é chamado de fecho de S e indica-se com
a notação S.
59
Note que S ⊂ S e que S é um conjunto fechado.
Definição 6.1.16. Um espaço topológico X é compacto se, e somente se, para toda
família {Fλ }λ∈Λ de subconjuntos fechados de X, com a propriedade da interseção finita,
tem-se Fλ 6= ∅.
\
λ∈Λ
Teorema 6.1.3 (Teorema de Tychonov). Se {Xα }α∈L é uma família de espaços topológicos
compactos, então X = Xα é compacto.
Y
α∈L
Demonstração. Seja {Fλ }λ∈Λ uma família de subconjuntos fechados de X, com a proprie-
dade da interseção finita. Então, pelo Lema 6.1.1, existe uma família M de subconjuntos de
X, maximal com a propriedade da interseção finita e contendo {Fλ }λ∈Λ . Para cada α ∈ L,
considere a família Aα = {pα (M ) ; M ∈ M } de subconjuntos de Xα , onde pα : X → Xα é
dada por pα (x) = xα para todo x = (xα )α∈L ∈ X.
Assim, Bα = {pα (M ) ; M ∈ M } é uma família de subconjuntos fechados de Xα .
Afirmação: Bα possui a propriedade da interseção finita.
Com efeito, seja {M1 , . . . , Mn } ⊂ M finito. Como M possui a propriedade da
interseção finita, M1 ∩ . . . ∩ Mn 6= ∅. Assim,
∅=
6 pα (M1 ∩ . . . ∩ Mn ) ⊂ pα (M1 ) ∩ . . . ∩ pα (Mn ) ⊂ pα (M1 ) ∩ . . . ∩ pα (Mn ).
Com isso, pα (M1 ) ∩ . . . ∩ pα (Mn ) 6= ∅, o que prova a afirmação.

Visto que Xα é compacto, existe xα ∈ pα (M ). Tomemos x = (xα )α∈L .
\
M ∈M
Afirmação: x ∈ M para todo M ∈ M .

De fato, sejam M ∈ M e Uα um aberto contendo xα . Como xα ∈ pα (M ), existe
y ∈ Uα ∩ pα (M ). Assim, y = pα (u) para algum u ∈ M , de maneira que u ∈ p−1 α (Uα ).
Consequentemente, pα (Uα ) ∩ M =
−1
6 ∅, e pela Proposição 6.1.2, pα (Uα ) ∈ M . Assim,
−1
dado {Uα1 , . . . , Uαn } finito, com cada Uαi aberto contendo xαi temos, pelo Corolário 6.1.1,
α1 (Uα1 ) ∩ . . . ∩ pαn (Uαn ) ∈ M e, consequentemente, (pα1 (Uα1 ) ∩ . . . ∩ pαn (Uαn )) ∩ M 6= ∅.
p−1 −1 −1 −1
Finalmente, se V é uma vizinhança qualquer de x, então existem Uαi abertos em Xαi , i =

1, . . . , n, tais que xαi ∈ Uαi e p−1
α1 (Uα1 ) ∩ pα2 (Uα2 ) ∩ . . . ∩ pαn (Uαn ) ⊂ V . Logo, V ∩ M 6= ∅.
−1 −1
Portanto, x ∈ M .
Diante disso, x ∈ M para todo M ∈ M . Em particular, x ∈ Fλ = Fλ para todo
λ ∈ Λ, ou seja, x ∈ Fλ . Logo, X = Xα é compacto.
\ Y
λ∈Λ α∈L
Finalizamos este capítulo com uma aplicação sobre anéis com unidade. Primeira-
mente, definiremos os conceitos de anel e ideal.
Seja A um conjunto não vazio munido de duas operações, as quais chamaremos de
soma e produto em A e denotaremos por + e ·, respectivamente.
60
Assim:
+: A×A→A ·: A×A→A
(x, y) 7→ x + y (x, y) 7→ x · y
Definição 6.1.17. Chamaremos (A, +, ·) um anel se as seguintes propriedades são verifi-

cadas para quaisquer x, y, z ∈ A.
(A1) Associatividade da soma: (x + y) + z = x + (y + z);
(A2) Existência de elemento neutro para a soma: existe 0 ∈ A tal que x + 0 = 0 + x = x;
(A3) Existência de inverso aditivo: para todo x ∈ A existe um único x0 ∈ A, denotado

por x0 = −x, tal que x + x0 = x0 + x = 0;
(A4) Comutatividade da soma: x + y = y + x;
(A5) Associatividade do produto: (x · y) · z = x · (y · z);
(A6) Distributividade à esquerda e à direita: x·(y +z) = x·y +x·z e (x+y)·z = x·z +y ·z;
Dizemos que A é um anel com unidade se ele satisfaz a propriedade:
(A7) Existe 1 ∈ A, 1 6= 0, tal que x · 1 = 1 · x = x.
Dizemos que A é um anel comutativo se ele satisfaz a propriedade:
(A8) x · y = y · x.
Dizemos que A é um anel sem divisores de zero se ele satisfaz a propriedade:
(A9) x · y = 0 ⇒ x = 0 ou y = 0.
Definição 6.1.18. Seja B um subconjunto não vazio de um anel A. Suponhamos que B

seja fechado para as operações + e · de A, isto é,
x, y ∈ B ⇒ x + y ∈ B e x · y ∈ B
Se B for um anel com as operações de A, dizemos que B é um subanel de A.
Agora veremos uma classe de subanéis muito importante na teoria dos anéis.
Definição 6.1.19. Sejam A um anel e I um subanel de A. Dizemos que I é um ideal à

esquerda de A se a · x ∈ I para quaisquer a ∈ A e x ∈ I. Dizemos que I é um ideal à
direita de A se x · a ∈ I para quaisquer x ∈ I e a ∈ A.
Se I for um ideal à direita e à esquerda de um anel A, dizemos que I é um ideal de A.

61
Teorema 6.1.4. Todo anel com unidade possui um ideal maximal.
Demonstração. Seja A um anel com unidade. Considere o conjunto
F = {I ⊂ A ; I é ideal de A e I 6= A}.
F não é vazio, pois {0} é ideal de A e {0} =

6 A. Além disso, F é parcialmente ordenado
pela inclusão de conjuntos. Seja C = {Aλ }λ∈Λ um subconjunto totalmente ordenado de
F.
Afirmação: O conjunto U = Aλ é um ideal de A e U 6= A.
[
λ∈Λ
• De fato, como 0 ∈ Aλ para todo λ ∈ Λ, segue que 0 ∈ U . Dados x, y ∈ U e a ∈ A,

existe λ0 ∈ Λ tal que x, y ∈ Aλ0 , pois C é totalmente ordenado. Como Aλ0 é ideal
de A, segue que x − y ∈ Aλ0 , a · x ∈ Aλ0 e x · a ∈ Aλ0 . Assim, x − y ∈ U , a · x ∈ U
e x · a ∈ U . Portanto, U é um ideal de A.
• Além disso, U 6= A, pois, do contrário, teríamos 1 ∈ U , de modo que 1 ∈ Aλ para

algum λ ∈ Λ e, consequentemente, Aλ = A. Isso contraria a definição do conjunto
F.
Portanto, U ∈ F .
Sabemos que Aλ ⊂ U para todo λ ∈ Λ, de modo que U é uma cota superior de
C em F . Pelo Lema de Zorn, existe um elemento maximal M ∈ F . Portanto, M é um
ideal maximal de A.
62
63
7 TEOREMA DE ZERMELO
Um conjunto parcialmente ordenado pode ou não possuir o menor elemento. Um

fato interessante é que mesmo quando um conjunto tem o menor elemento, pode existir
um subconjunto dele que não possui menor elemento.
Exemplo 7.0.1. O conjunto dos números reais não negativos tem o zero como menor
elemento, enquanto o conjunto dos números irracionais maiores do que zero não tem menor
elemento.
Definição 7.0.1. Um conjunto parcialmente ordenado X diz-se bem ordenado se para

todo subconjunto não vazio A ⊂ X existe a ∈ A tal que a x para todo x ∈ A.
Como consequência dessa definição, segue a proposição:
Proposição 7.0.1. Todo conjunto bem ordenado é totalmente ordenado.
Demonstração. Sejam X um conjunto bem ordenado e x, y ∈ X. Então, {x, y} é um

subconjunto não vazio de X. Desta forma, {x, y} possui o menor elemento a. Assim,
a = x ou a = y, de modo que x y ou y x. Portanto, X é totalmente ordenado.
Um exemplo bem conhecido é enunciado pelo:
Princípio da Boa Ordenação. Todo subconjunto não vazio A ⊂ N∗ possui um menor

elemento.
Exemplo 7.0.2. O conjunto N × N munido da relação de ordem do Exemplo 3.1.3 não é

bem ordenado, uma vez que, de acordo com o Exemplo 3.2.3, não possui menor elemento.
O Princípio de Indução Finita é um método de demonstração muito útil quando

estamos diante de proposições que envolvem o conjunto bem ordenado N.
Princípio de Indução Finita (1ª forma). Seja A ⊂ N∗ tal que

(i) 1 ∈ A;
(ii) se k ∈ A, então k + 1 ∈ A.
Então A = N∗ .
Princípio de Indução Finita (2ª forma). Seja A ⊂ N∗ tal que

(i) 1 ∈ A;
(ii) se n ∈ A para todo n ≤ k, então k + 1 ∈ A.
Então, A = N∗ .
64
A relação entre os Princípios de Indução Finita e o Princípio da Boa Ordenação se

faz presente no próximo resultado.
Teorema 7.0.1. Os seguintes enunciados são equivalentes:
1. Princípio de Indução Finita (1ª forma);
2. Princípio de Indução Finita (2ª forma);
3. Princípio da Boa Ordenação.
Demonstração. (1) ⇒ (3) Seja A subconjunto não vazio de N∗ . Se 1 ∈ A, então 1 será

o menor elemento de A. Suponhamos que 1 ∈ / A. Para cada número natural p ≥ 1,
considere Ip = {n ∈ N ; 1 ≤ n ≤ p}. Seja X = {p ∈ N∗ ; Ip ⊂ N∗ \A}. Como 1 ∈
∗
/ A,
então I1 ⊂ N∗ \A e, portanto, 1 ∈ X. Além disso, A é não vazio, e por isso existe n0 ∈ A,
donde, n0 ∈
/ X. Logo, X 6= N∗ . Assim, pelo Princípio de Indução Finita (1ª forma), não
podemos ter k + 1 ∈ X sempre que k ∈ X. Caso contrário, teríamos X = N∗ . Logo, existe
k0 ∈ X tal que k0 + 1 ∈
/ X. Como k0 ∈ X, segue que 1, 2, 3, . . . , k0 não são elementos de
A. Além disso, como k0 + 1 ∈/ X então existe algum elemento a ∈ {1, 2, 3, . . . , k0 , k0 + 1}
que pertence ao conjunto A. Portanto, a = k0 + 1 e k0 + 1 é o menor elemento de A.
(3) ⇒ (2) Seja A ⊂ N∗ tal que:
(i) 1 ∈ A;
(ii) se n ∈ A para todo n ≤ k, então k + 1 ∈ A.
Provaremos que A = N∗ . Suponhamos que N∗ \A = 6 ∅. Então, pelo Princípio da Boa
Ordenação, N \A possui menor elemento, digamos a ∈ N∗ . Como 1 ∈ A, então a 6= 1.
∗
Além disso, n ∈ A para todo n ≤ a − 1. Desta forma, por (ii), a ∈ A. Absurdo. Portanto,
N∗ \A = ∅, ou seja, A = N∗ .
(2) ⇒ (1) Seja A ⊂ N∗ tal que:
(i) 1 ∈ A;
(ii) se k ∈ A, então k + 1 ∈ A.
Provaremos que A = N∗ . Por (i), temos 1 ∈ A. Suponhamos que n ∈ A para todo n ≤ k.
Em particular, k ∈ A e, por (ii), temos k + 1 ∈ A. Portanto, pelo Princípio de Indução
Finita (2ª forma), A = N∗ .
Algo interessante sobre conjuntos bem ordenados arbitrários é que existe um

processo semelhante ao Princípio de Indução Finita para provar proposições acerca desses.
Trata-se do Princípio de Indução Transfinita, enunciado e demonstrado a seguir.
Princípio de Indução Transfinita. Sejam X um conjunto bem ordenado, x ∈ X e

s(x) = {a ∈ X ; a ≺ x}. Se A ⊂ X é tal que s(x) ⊂ A implica x ∈ A, então A = X.
65
Demonstração. Suponhamos que A 6= X. Então, X\A 6= ∅. Como X é bem ordenado,

existe a ∈ X\A tal que a x para todo x ∈ X\A. Por conseguinte, s(a) ⊂ A. Assim, por
hipótese, tem-se a ∈ A. Absurdo. Portanto, A = X.
No Princípio de Indução Transfinita não há a condição sobre um elemento inicial

como ocorre no Princípio de Indução Finita. Além disso, prova-se a asserção para um
determinado elemento do conjunto a partir da asserção para o conjunto de seus antecessores
estritos, o que lembra a segunda forma do Princípio de Indução Finita em N. Isso ocorre
porque um elemento em um conjunto bem ordenado pode não possuir um antecessor
imediato.
Exemplo 7.0.3. Considere X = N ∪ {N} com a seguinte relação de ordem :

(i) se a, b ∈ N, então a b se, e somente se, a ≤ b;
(ii) se a ∈ N e b = N, então a b.
Então X é bem ordenado.
De fato, seja A ⊂ X não vazio. Se A ∩ N 6= ∅, então o menor elemento de A com
respeito à relação é o menor elemento de A ∩ N pela relação de ordem usual em N. Se
A ∩ N = ∅, então A = {N} e portanto, N é o menor elemento de A.
Nesse exemplo, o elemento N não possui um antecessor imediato em X.
A seguir apresentamos o Teorema de Zermelo que garante a boa ordenação para

qualquer conjunto não vazio.
Teorema de Zermelo. Para todo conjunto não vazio X existe uma relação de ordem
que o torna bem ordenado.
66
67
8 RESULTADO FINAL
Consideremos X um conjunto parcialmente ordenado tal que para todo A ⊂ X,

totalmente ordenado, existe cota superior.
Seja X = {A ; A ⊂ X e A é totalmente ordenado}. O conjunto X é parcialmente
ordenado pela relação de inclusão de conjuntos. O nosso objetivo é mostrar que, sob certas
condições, X tem um elemento maximal.
Dado A ∈ X , definamos o conjunto Â = {x ∈ X ; A ∪ {x} ∈ X }. Notemos que
A ⊂ Â para todo A ∈ X .
Proposição 8.0.1. A ∈ X é maximal se, e somente se, A = Â.
Demonstração. (⇒) Suponhamos A ∈ X maximal. Sabemos que A ⊂ Â. Resta mos-

trarmos que Â ⊂ A. Para tanto, seja x ∈ Â. Então, x ∈ X e A ∪ {x} ∈ X . Como
A ⊂ A ∪ {x} e A é maximal em X , temos A = A ∪ {x}, de modo que x ∈ A. Logo,
A = Â.
(⇐) Suponhamos que A = Â. Seja B ∈ X tal que A ⊂ B. Provaremos que B ⊂ A.
Dado b ∈ B, então A ∪ {b} ⊂ B e A ∪ {b} ∈ X . Assim, b ∈ Â = A. Logo, B ⊂ A.
Portanto, A = B, isto é, A é maximal em X .
Daqui em diante assumiremos que vale o Axioma da Escolha.

Seja f : P(X)\{∅} → X uma função escolha para X. Definamos g : X → X como a
seguir:

A

, se A = Â,
g(A) =
A ∪ {f (Â\A)}

, se A 6= Â.
Observemos que f (Â\A) ∈ Â\A e f (Â\A) ∈ X, o que implica em A ∪ {f (Â\A)} ∈ X .

Logo, g está bem definida. Além disso, notemos que A ∈ X é maximal se, e somente se,
g(A) = A.
Definição 8.0.1. Diremos que τ ⊂ X é uma torre se as seguintes condições são satisfeitas:
(1) ∅ ∈ τ ;
(2) se A ∈ τ , então g(A) ∈ τ ;
(3) se {Cλ }λ∈Λ ⊂ τ é totalmente ordenado, então Cλ ∈ τ .

[
λ∈Λ
Proposição 8.0.2. X é uma torre.

68
Demonstração. Por vacuidade, ∅ ∈ X .

Seja A ∈ X . Se A = Â então g(A) = A ∈ X . No caso em que A 6= Â, pelas
definições de f e de Â, g(A) = A ∪ {f (Â\A)} ∈ X . Logo, g(A) ∈ X .
Seja {Cλ }λ∈Λ ⊂ X , totalmente ordenado. Então, Cλ ⊂ X para todo λ ∈ Λ e,
portanto, Cλ ⊂ X. Dados x, y ∈ Cλ , existem λ1 , λ2 ∈ Λ tais que x ∈ Cλ1 e y ∈ Cλ2 .
[ [
λ∈Λ λ∈Λ
Como {Cλ }λ∈Λ é totalmente ordenado, existe λ ∈ {λ1 , λ2 } tal que Cλi ⊂ Cλ para todo
i = 1, 2. Desta forma, x, y ∈ Cλ . Como Cλ ∈ X , isto é, Cλ é totalmente ordenado com a
ordem parcial induzida por X, temos x y ou y x. Logo, Cλ ∈ X .
[
λ∈Λ
Proposição 8.0.3. Se {Xi }i∈I é uma família não vazia de torres em X , então Xi é
\
i∈I
uma torre em X .
Demonstração. Para cada índice i ∈ I, Xi é uma torre e, assim, ∅ ∈ Xi . Logo, ∅ ∈ Xi .

\
i∈I
Seja A ∈ Xi . Então, A ∈ Xi para todo i ∈ I. Como cada Xi é uma torre, segue

\
i∈I
que g(A) ∈ Xi . Assim, g(A) ∈ Xi .
\
i∈I
Seja {Cλ }λ∈Λ ⊂ Xi , totalmente ordenado. Para cada índice j ∈ I, temos

\
i∈I
Xi ⊂ Xj , de modo que {Cλ }λ∈Λ ⊂ Xj . Como {Cλ }λ∈Λ é totalmente ordenado e cada
\
i∈I
Xj é uma torre, então Cλ ∈ Xj para todo j ∈ I. Portanto, Xi .
[ [ \
Cλ ∈
λ∈Λ λ∈Λ i∈I
Em particular, a interseção de todas as torres em X é uma torre em X e a

denotaremos por τ0 . Desta forma, τ0 é a menor torre em X .
Definição 8.0.2. Diremos que C ∈ τ0 é comparável se, para todo D ∈ τ0 , tem-se C ⊂ D

ou D ⊂ C.
Mostraremos a seguir que a torre τ0 é totalmente ordenada, isto é, que todo elemento
de τ0 é comparável.
Proposição 8.0.4. Se C ∈ τ0 é comparável e D ∈ τ0 é tal que D ⊂ C e D 6= C, então

g(D) ⊂ C.
Demonstração. Como C é comparável e τ0 é uma torre, temos g(D) ⊂ C ou C ⊂ g(D).

Há dois casos.
Caso 1: D = D̂.
Neste caso, temos g(D) = D e C 6⊂ g(D), pois por hipótese não vale a inclusão
C ⊂ D. Logo, g(D) ⊂ C.
Caso 2: D 6= D̂.
69
Pela definição da função g, temos g(D) = D ∪ {f (D̂\D)}. Suponhamos que

C ⊂ g(D) e C 6= g(D). Então, existe x ∈ g(D) tal que x ∈ / C. Por outro lado, existe
y ∈ C tal que y ∈/ D. Assim, y ∈ g(D) = D ∪ {f (D̂\D)}, de modo que y = f (D̂\D).
Como y ∈ C, temos y 6= x. Além disso, x ∈ g(D) = D ∪ {y}, donde x ∈ D ⊂ C. Absurdo.
Logo, g(D) ⊂ C.
Proposição 8.0.5. Seja C = {C ∈ τ0 ; C é comparável }. Então, C é uma torre.
Demonstração. Como ∅ ∈ τ0 e, para todo D ∈ τ0 , ∅ ⊂ D, então ∅ ∈ C .

Sejam A ∈ C e U = {D ∈ τ0 ; D ⊂ A ou g(A) ⊂ D}. A fim de mostrar que
g(A) ∈ C , mostraremos primeiramente que U é uma torre.
Com efeito,
• Como ∅ ∈ τ0 e ∅ ⊂ A, então ∅ ∈ U .
• Seja D ∈ U . Então, D ∈ τ0 e D ⊂ A ou g(A) ⊂ D. Como τ0 é uma torre, temos

g(D) ∈ τ0 . Suponhamos D ⊂ A e D 6= A. Visto que A ∈ τ0 é comparável, pela
Proposição 8.0.4, g(D) ⊂ A. Logo, g(D) ∈ U . Se D = A, então g(D) = g(A), de
maneira que g(D) ∈ U . Por fim, suponhamos que g(A) ⊂ D. Neste caso, como
g(A) ⊂ D ⊂ g(D), então g(D) ∈ U .
• Seja {Bλ }λ∈Λ ⊂ U um conjunto totalmente ordenado. Como {Bλ }λ∈Λ ⊂ τ0 e τ0 é

uma torre, temos Bλ ∈ τ0 . Há então dois casos a analisar.
[
λ∈Λ
Caso 1: Bλ ⊂ A para todo λ ∈ Λ.
Neste caso, temos Bλ ⊂ A. Logo, Bλ ∈ U .
[ [
λ∈Λ λ∈Λ
Caso 2: Bλ0 6⊂ A para algum λ0 ∈ Λ.
Como Bλ0 ∈ U , temos g(A) ⊂ Bλ0 . Então, g(A) ⊂ Bλ e, assim, Bλ ∈ U .
[ [
λ∈Λ λ∈Λ
Desta forma, U ⊂ τ0 é uma torre.

Como τ0 é a menor torre em X , então U = τ0 . Por conseguinte, dado D ∈ τ0 , temos
D ⊂ A ⊂ g(A) ou g(A) ⊂ D. Portanto, g(A) ∈ C .
Finalmente, seja {Cλ }λ∈Λ ⊂ C , totalmente ordenado. Como C ⊂ τ0 , segue que
Cλ ∈ τ0 . Dado D ∈ τ0 , temos então as seguintes possibilidades.
[
λ∈Λ
Caso 1: Cλ ⊂ D para todo λ ∈ Λ.
Neste caso, temos
[
Cλ ⊂ D.
λ∈Λ
Caso 2: Cλ0 6⊂ D para algum λ0 ∈ Λ.
Como Cλ0 ∈ C , Cλ0 é comparável, e por isso D ⊂ Cλ0 . Diante disso, D ⊂ Cλ .
[
λ∈Λ
70
Portanto, Cλ ∈ C .
[
λ∈Λ
Logo, o conjunto C ⊂ τ0 é uma torre.
Proposição 8.0.6. O conjunto X tem um elemento maximal.
Demonstração. Como C é uma torre e C ⊂ τ0 , então C = τ0 , ou seja, τ0 é totalmente

ordenado. Daí, como τ0 é uma torre, segue que o conjunto C0 = A ∈ τ0 . Além disso,
[
A∈τ0
g(C0 ) ∈ τ0 e g(C0 ) ⊂ C0 . Pela definição de g, C0 ⊂ g(C0 ) e, portanto, g(C0 ) = C0 . Logo,
pela Proposição 8.0.1, o conjunto C0 é maximal em X .
Visto que C0 é um subconjunto totalmente ordenado de X, existe m ∈ X tal
que c m para todo c ∈ C0 . O conjunto C0 ∪ {m} ⊂ X é totalmente ordenado e
C0 ⊂ C0 ∪ {m}. Como C0 é maximal em X , temos C0 = C0 ∪ {m}. Logo, m ∈ C0 .
Se n ∈ X é tal que m n, então C0 ∪ {n} é um subconjunto de X totalmente
ordenado. Como C0 é maximal em X , segue que C0 = C0 ∪ {n}. Daí n ∈ C0 e, por isso,
n m. Desta forma, m = n. Portanto, m é maximal em X.
Portanto, podemos concluir o seguinte teorema.
Teorema 8.0.1. Se vale o Axioma da Escolha então vale o Lema de Zorn.
Seja X um conjunto arbitrário não vazio. Consideremos o seguinte conjunto:
Z = {(A, ≤A ) ; A ⊂ X, A não vazio e (A, ≤A ) é bem ordenado}.
Proposição 8.0.7. Z é não vazio.
Demonstração. Como X 6= ∅, existe a ∈ X, de modo que {a} ⊂ X. Diremos que x ≤{a} y

se, e somente se, x = y.
Afirmação: ({a}, ≤{a} ) é um conjunto parcialmente ordenado.
De fato, sejam x, y, z ∈ {a}.
Uma vez que x = a e a = a, segue que x ≤{a} x. Assim, vale a propriedade
reflexiva.
Supondo x ≤{a} y e y ≤{a} x, então x = a = y. Desta forma, vale a propriedade
antissimétrica.
Se x ≤{a} y e y ≤{a} z, temos x = a = y e y = a = z de maneira que x = z. Daí,
x ≤{a} z. Portanto, vale a propriedade transitiva.
Por fim, seja Y ⊂ {a} não vazio. Então, Y = {a}. Como, para todo x ∈ {a}, a = x, isto
é, a ≤{a} x, segue que a é o menor elemento de Y . Portanto, ({a}, ≤{a} ) é um conjunto
bem ordenado e, assim, ({a}, ≤{a} ) ∈ Z .
71
Definição 8.0.3. Dados (A, ≤A ), (B, ≤B ) ∈ Z , diremos que (A, ≤A ) (B, ≤B ) se, e
somente se:
(1) A ⊂ B;
(2) se x, y ∈ A, então x ≤A y se, e somente se, x ≤B y;
(3) se x ∈ A e y ∈ B\A, então x ≤B y.
Proposição 8.0.8. O conjunto (Z , ) é parcialmente ordenado.
Demonstração. Sejam (A, ≤A ), (B, ≤B ), (C, ≤C ) ∈ Z .

Propriedade Reflexiva: Observemos que A ⊂ A e que se x, y ∈ A, então x ≤A y se,
e somente se, x ≤A y. Desta forma, as condições (1) e (2) da Definição 8.0.3 são satisfeitas.
A condição (3) não se aplica, pois A\A = ∅. Logo, (A, ≤A ) (A, ≤A ).
Propriedade Antissimétrica: Suponhamos que (A, ≤A ) (B, ≤B ) e (B, ≤B )
(A, ≤A ). Então, A ⊂ B e B ⊂ A, de modo que A = B. Além disso, se x, y ∈ A e
x ≤A y, então x ≤B y. Como A = B, isso mostra que ≤A coincide com ≤B . Portanto,
(A, ≤A ) = (B, ≤B ).
Propriedade Transitiva: Suponhamos que (A, ≤A ) (B, ≤B ) e (B, ≤B ) (C, ≤C ).
Então, A ⊂ B e B ⊂ C e, consequentemente, A ⊂ C. Sejam x, y ∈ A. Uma vez que
(A, ≤A ) (B, ≤B ), segue que x ≤A y se, e somente se, x ≤B y. Além disso, como x, y ∈ B
e (B, ≤B ) (C, ≤C ), segue que x ≤B y se, e somente se, x ≤C y. Logo, x ≤A y se, e
somente se, x ≤C y. Finalmente, sejam x ∈ A e y ∈ C\A. Temos duas possibilidades:
y ∈ B ou y ∈/ B.
Caso 1: y ∈ B.
Neste caso temos x ∈ A e y ∈ B\A. Como (A, ≤A ) (B, ≤B ), segue da condição
(3) da Definição 8.0.3 que x ≤B y. Por fim, como x, y ∈ B e (B, ≤B ) (C, ≤C ), temos
x ≤C y.
Caso 2: y ∈
/ B.
Uma vez que A ⊂ B e x ∈ A, temos x ∈ B. Sendo y ∈ C\B e (B, ≤B ) (C, ≤C ),
segue da condição (3) da Definição 8.0.3 que x ≤C y.
Nos dois casos, se x ∈ A e y ∈ C\A, então x ≤C y. Portanto, (A, ≤A ) (C, ≤C ).
Logo, o conjunto (Z , ) é parcialmente ordenado.
Seja C = {(Ai , ≤Ai ); i ∈ I} ⊂ Z um conjunto totalmente ordenado. Consideremos

o conjunto A = Ai . Definiremos a seguir uma relação de ordem em A. Sejam x, y ∈ A
[
i∈I
arbitrários. Como C é totalmente ordenado, existe i ∈ I tal que x, y ∈ Ai . Diremos que
x ≤A y se, e somente se, x ≤Ai y.
72
Proposição 8.0.9. A relação de ordem ≤A está bem definida.
Demonstração. Se x, y ∈ Ai e x, y ∈ Aj , como C é totalmente ordenado, podemos supor

sem perda de generalidade que (Ai , ≤Ai ) (Aj , ≤Aj ). Assim, x, y ∈ Ai ⊂ Aj e x ≤Ai y se,
e somente se, x ≤Aj y. Portanto,
x ≤A y ⇔ x ≤Ai y ⇔ x ≤Aj y.
Proposição 8.0.10. O conjunto (A, ≤A ) é parcialmente ordenado.
Demonstração. Sejam x, y, z ∈ A.
Propriedade Reflexiva: Como x ∈ A, segue que x ∈ Ai para algum i ∈ I. Da
propriedade reflexiva da relação de ordem em Ai , temos x ≤Ai x. Logo, x ≤A x.
Propriedade Antissimétrica: Suponhamos que x ≤A y e y ≤A x. Então, x, y ∈ Ai
e x ≤Ai y e, também, x, y ∈ Aj e y ≤Aj x. Como o conjunto C é totalmente ordenado,
(Ai , ≤Ai ) (Aj , ≤Aj ) ou (Aj , ≤Aj ) (Ai , ≤Ai ). Suponhamos sem perda de generalidade
que (Ai , ≤Ai ) (Aj , ≤Aj ). Neste caso, Ai ⊂ Aj e x ≤Ai y ⇔ x ≤Aj y. Por outro lado,
y ≤Aj x e pela propriedade antissimétrica em Aj temos x = y.
Propriedade Transitiva: Suponhamos que x ≤A y e y ≤A z. Então, x, y ∈ Ai e
x ≤Ai y e, também, y, z ∈ Aj e y ≤Aj z. Como C é um conjunto totalmente ordenado,
(Ai , ≤Ai ) (Aj , ≤Aj ) ou (Aj , ≤Aj ) (Ai , ≤Ai ). Suponhamos que (Ai , ≤Ai ) (Aj , ≤Aj ).
Assim, Ai ⊂ Aj e x ≤Aj y. Por outro lado, y ≤Aj z, e da propriedade transitiva da relação
de ordem em Aj temos x ≤Aj z. Logo, x ≤A z. No caso em que (Aj , ≤Aj ) (Ai , ≤Ai ),
temos Aj ⊂ Ai e y ≤Ai z. Como x ≤Ai y, da propriedade transitiva da relação de ordem
em Ai , obtemos x ≤Ai z. Consequentemente, x ≤A z.
Portanto, o conjunto (A, ≤A ) é parcialmente ordenado.
Proposição 8.0.11. (A, ≤A ) é um conjunto bem ordenado.
Demonstração. Seja B ⊂ A, B não vazio. Considere J = {j ∈ I ; B ∩ Aj 6= ∅}.

Observemos que para cada j ∈ J temos B ∩ Aj ⊂ Aj com B ∩ Aj 6= ∅. Assim, como cada
Aj é bem ordenado, existe o menor elemento aj de B ∩ Aj .
Afirmação: Se j, k ∈ J e j 6= k, então aj = ak .
Com efeito, como C é um conjunto totalmente ordenado, (Aj , ≤Aj ) (Ak , ≤Ak )
ou (Ak , ≤Ak ) (Aj , ≤Aj ). Suponhamos que (Aj , ≤Aj ) (Ak , ≤Ak ). Então, Aj ⊂ Ak , de
modo que B ∩ Aj ⊂ B ∩ Ak . Como ak é o menor elemento de B ∩ Ak , ak ≤Ak aj . Aqui
temos duas possibilidades: ak ∈ Aj ou ak ∈/ Aj .
Caso 1: ak ∈ Aj .
73
Neste caso, ak ∈ B ∩ Aj e, como aj é o menor elemento de B ∩ Aj , aj ≤Aj ak .

Consequentemente, aj ≤Ak ak . Logo, pela propriedade antissimétrica da relação de ordem
em Ak , temos aj = ak .
Caso 2: ak ∈
/ Aj .
Neste caso, aj ∈ Aj e ak ∈ Ak \Aj . Daí, aj ≤Ak ak , e pela propriedade antissimétrica
da relação de ordem em Ak temos aj = ak .
Se (Ak , ≤Ak ) (Aj , ≤Aj ), o procedimento é análogo. Portanto, para quaisquer j, k ∈ J,
j 6= k, temos aj = ak . Denotaremos aj por b.
Finalmente, seja y ∈ B. Então, y ∈ Aj para algum j ∈ I, de modo que y ∈ B ∩ Aj .
Assim, b ≤Aj y. Consequentemente, b ≤A y. Portanto, b é o menor elemento de B.
Logo, (A, ≤A ) é um conjunto bem ordenado, ou seja, (A, ≤A ) ∈ Z .
Proposição 8.0.12. (A, ≤A ) é cota superior de C .
Demonstração. Sabemos que Ai ⊂ A para todo i ∈ I.

Dados i ∈ I e x, y ∈ Ai , pela definição da ordem parcial em A, x ≤Ai y se, e
somente se, x ≤A y.
Dados i ∈ I, x ∈ Ai e y ∈ A\Ai , então y ∈ Ak onde k 6= i. Como C é um
conjunto totalmente ordenado, (Ai , ≤Ai ) (Ak , ≤Ak ) ou (Ak , ≤Ak ) (Ai , ≤Ai ). Notemos
que (Ai , ≤Ai ) (Ak , ≤Ak ). Caso contrário, (Ak , ≤k ) (Ai , ≤Ai ), o que implica em
y ∈ Ak ⊂ Ai . Contradição, pois y ∈ A\Ai . Daí, Ai ⊂ Ak , x ∈ Ai e y ∈ Ak \Ai de modo
que x ≤Ak y. Consequentemente, x ≤A y.
Portanto, (Ai , ≤Ai ) (A, ≤A ) para todo i ∈ I.
De agora em diante, suponhamos que valha o Lema de Zorn. Assim, como cada
subconjunto C ⊂ Z totalmente ordenado tem cota superior em Z , então existe um
elemento maximal (M, ≤M ) ∈ Z .
Proposição 8.0.13. M = X.
Demonstração. Como M ⊂ X, resta mostrarmos que X ⊂ M .

Seja a ∈ X. Consideremos o conjunto M 0 = M ∪ {a} com a seguinte relação:
(i) se x, y ∈ M , x ≤M 0 y se, e somente se, x ≤M y;
(ii) se y = a, x ≤M 0 y.
Com essa relação, o conjunto M 0 é bem ordenado e (M 0 , ≤M 0 ) ∈ Z . Como (M, ≤M )
é maximal em Z e (M, ≤M ) (M 0 , ≤M 0 ), segue que (M, ≤M ) = (M 0 , ≤M 0 ). Assim,
M = M ∪ {a} = M 0 . Logo, a ∈ M e X ⊂ M .
Corolário 8.0.1. (X, ≤X ) é um conjunto bem ordenado.

74
Demonstração. É imediato da Proposição 8.0.13.
Portanto, acabamos de provar o seguinte resultado.
Teorema 8.0.2. Se vale o Lema do Zorn, então vale o Teorema de Zermelo.
Teorema 8.0.3. Se vale o Teorema de Zermelo, então vale o Axioma da Escolha.
Demonstração. Seja {Xi }i∈I uma família não vazia de conjuntos não vazios. Consideremos
a união da família X = Xi . Pelo Teorema de Zermelo, existe uma relação de ordem
[
i∈I
em X tal que (X, ) é bem ordenado. Assim, para cada i ∈ I, Xi ⊂ X possui menor
elemento, digamos xi . Tomemos f : {Xi }i∈I → Xi tal que f (Xi ) = xi para todo
[
i∈I
i ∈ I. Desta forma, f é uma função escolha para {Xi }i∈I . Portanto, vale o Axioma da
Escolha.
Observação. Não podemos proceder da seguinte forma: Para cada conjunto não vazio
Xi consideramos uma ordem ≤Xi tal que (Xi , ≤Xi ) é bem ordenado. Assim, para cada
i ∈ I, Xi possui menor elemento, digamos xi . Daí, tomamos f : {Xi }i∈I → Xi tal que
[
i∈I
f (Xi ) = xi . Pois para cada i ∈ I, o conjunto Oi = {≤Xi ; (Xi , ≤Xi ) é bem ordenado} é
não vazio. Desta maneira, {Oi }i∈I é uma família não vazia de conjuntos não vazios. Então,
procedendo desta maneira, estamos utilizando o Axioma da Escolha para provar o mesmo.
Finalmente, chegamos ao resultado principal nessa dissertação.
Teorema 8.0.4. Os seguintes enunciados são equivalentes.
(1) Axioma da Escolha;
(2) Lema de Zorn;
(3) Teorema de Zermelo.
Demonstração. Segue imediatamente dos Teoremas 8.0.1, 8.0.2 e 8.0.3.

75
9 CONSIDERAÇÕES FINAIS
Conquanto o Axioma da Escolha tenha sido alvo de muitas controvérsias, sua

equivalência com o Lema de Zorn e o Teorema de Zermelo tende a eliminar qualquer
resistência à sua aceitação. Um dos motivos pelo qual o Axioma da Escolha pode gerar
certo desconforto reside em sua natureza não construtiva, nos permitindo fazer infinitas
escolhas arbitrárias e, como se sabe, desde a Grécia Antiga o infinito nunca foi um assunto
tão trivial para os matemáticos no decorrer da história.
Provamos neste trabalho, com o auxílio do Axioma da Escolha, que todo conjunto
infinito possui um subconjunto infinito enumerável, o que de certa maneira nos diz que o
“enumerável” é o menor dos infinitos.
Além disso, os pontos nos quais o Axioma da Escolha é aplicado são tão sutis que,
por vezes, não percebemos quando o estamos utilizando. Provamos neste trabalho que a
união de uma família enumerável de conjuntos enumeráveis é enumerável. Na literatura, a
demonstração deste resultado, vista em cursos de análise, em boa parte das ocasiões não
menciona o Axioma da Escolha.
Todavia, ainda observando a literatura, a prova de resultados como a existência
de uma base para qualquer espaço vetorial e o fato de que o produto cartesiano de uma
família arbitrária de espaços topológicos compactos é compacto, fazem menção explícita
ao Lema de Zorn. Estes resultados também foram vistos e provados neste trabalho.
Também por meio do Axioma da Escolha, provamos que existe um subconjunto de
R não mensurável com respeito à medida de Lebesgue, a saber, o conjunto de Vitali.
Em suma, com este trabalho fomos capazes de apreciar como o Axioma da Escolha,
seja na forma do Lema de Zorn ou na forma do Teorema de Zermelo, é uma importante
ferramenta em vários ramos da matemática como Álgebra, Topologia e Análise.
76
77
REFERÊNCIAS
[1] SANCHIS, Rémy. O Axioma da Escolha, o Lema de Zorn e o Teorema de Zermelo.

Instituto de Ciências Exatas - Departamento de Matemática. Universidade Federal
de Minas Gerais, Belo Horizonte, 2016.
[2] LIMA, E. L. Análise Real volume 1. Funções de Uma Variável. 12ed. Rio de Janeiro:
Instituto de Matemática Pura e Aplicada (Coleção Matemática Universitária), 2017.
[3] HALMOS, P. R. Naive Set Theory. Princeton, N. J., Van Nostrand, 1960.
[4] SILVA, Samuel Gomes da; JESUS, João Paulo Cirineu de. Cem Anos do Axioma da
Escolha: Boa Ordenação, Lema de Zorn e o Teorema de Tychonoff. Universidade
Federal da Bahia, Salvador, 2008.
[5] BARTLE, R. G. The Elements of Integration and Lebesgue Measure. Wiley Classics
Library, 1995.
[6] GONÇALVES, A. Introdução à Álgebra. 5ed. Rio de Janeiro: Instituto de

Matemática Pura e Aplicada (Projeto Euclides), 2015.
[7] LIMA, E. L. Elementos de Topologia Geral. Rio de Janeiro: Instituto de Matemática

Pura e Aplicada, 1970.

TCC - Yago Versao Final01

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

TCC - Yago Versao Final01

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDADE FEDERAL DE JUIZ DE FORA

INSTITUTO DE CIÊNCIAS EXATAS

Yago Pereira dos Anjos Santos

Axioma da Escolha, Lema de Zorn e o Teorema de Zermelo:

Axioma da Escolha, Lema de Zorn e o Teorema de Zermelo:

Trabalho de Conclusão de Curso apresentado

Orientadora: Profa. Dra. Ana Tércia Monteiro Oliveira

Santos, Yago Pereira dos Anjos.

Orientadora: Ana Tércia Monteiro Oliveira

1. Axioma da Escolha. 2. Lema de Zorn. 3. Teorema de Zermelo. I.

Axioma da Escolha, Lema de Zorn e o Teorema de Zermelo:

Trabalho de Conclusão de Curso apresentado

Aprovada em (dia) de (mês) de 2021

Profa. Dra. Ana Tércia Monteiro Oliveira - Orientadora

Profa. Dra. Cristiane de Andrade Mendes

Prof. Dr. Willian Versolati França

Agradeço primeiramente à indecifrável força superior responsável pela existência

O principal objetivo deste trabalho é demonstrar as equivalências entre o Axioma

Palavras-chave: Axioma da Escolha. Lema de Zorn. Teorema de Zermelo.

Keywords: Axiom of Choice. Zorn’s Lemma. Zermelo’s Theorem.

N∗ Conjunto dos números naturais distintos de zero.

1.1 UMA BREVE HISTÓRIA

As teorias matemáticas desenvolvidas atualmente utilizam-se da linguagem de con-

de um objeto matemático somente é garantida se for possível estabelecer um algoritmo

mesmo assunto em 1976.

Neste capítulo trazemos alguns pré-requisitos essenciais no desenvolvimento dessa

2.1 OS AXIOMAS DE ZERMELO-FRAENKEL

Na Teoria dos Conjuntos, embora não exista o conjunto de todos os conjuntos, os

Axioma da Existência. Existe um conjunto vazio.

no sistema axiomático. Todavia, por motivos históricos e didáticos, mantemos o Axioma

Axioma da Extensão. Dados os conjuntos X e Y , então X = Y se, e somente se, X ⊂ Y

Como uma aplicação do Axioma da Extensão, apresentamos a unicidade do conjunto

Teorema 2.1.1. O conjunto vazio é único.

Demonstração. Suponhamos que existam X e Y ambos conjuntos vazios e X 6= Y . Então,

Esquema de Axiomas da Especificação. Para todo conjunto A e toda condição S(x)

Na condição S(x) do Axioma da Especificação, exigimos apenas que a variável x não

Ao tratarmos os conjuntos de maneira ingênua, nos deparamos com paradoxos

Demonstração. Seja A ∈ X. Pelo Axioma da Especificação, existe o conjunto

Y = {Z ∈ A ; Z ∈ B para todo B ∈ X}.

Dado Z ∈ Y , então para todo B ∈ X, temos Z ∈ B. Reciprocamente, se Z ∈ B para

O conjunto Y será denotado por B e será denominado a interseção da coleção

O Axioma da Extensão garante que o conjunto Z enunciado pelo Axioma do Par é

{∅}, {∅, {∅}}, {{∅}, {∅, {∅}}}.

Teorema 2.1.4. Sejam X e Y conjuntos. Então X ∈

Demonstração. Dados os conjuntos X e Y , pelo Axioma do Par, existe o conjunto {X, Y }.

Corolário 2.1.1. Para todo conjunto X, X ∈

Demonstração. Basta tomar X = Y no Teorema 2.1.4.

O Axioma da Extensão garante que o conjunto U enunciado pelo Axioma da União

De fato, como {∅} ∈ C e ∅ ∈ {∅}, segue que {∅} ⊂ A. Agora, seja X ∈

Teorema 2.1.5. Dados os conjuntos X e Y , existe um conjunto Z tal que A ∈ Z se, e

Demonstração. Pelo Axioma do Par, podemos formar a coleção de conjuntos C = {X, Y }.

O conjunto Z do Teorema 2.1.4 será denotado por Z = X ∪ Y e denominado a

O Axioma da Extensão assegura que o conjunto P , conforme enunciado no Axioma

Definição 2.1.1. Dados os conjuntos x ∈ X e y ∈ Y , dizemos que o conjunto dado por

Se a = x e b = y, pelo Axioma da Extensão, temos {a} = {x} e {a, b} = {x, y}, de

Teorema 2.1.6. Se (a, b) = (x, y), então a = x e b = y.

Demonstração. Suponhamos b = a. Neste caso, (a, b) é o conjunto unitário constituído

O resultado a seguir, garante a existência do conjunto de todos os pares ordenados

Demonstração. Dados x ∈ X e y ∈ Y , sabemos que {x} ⊂ X ∪ Y e {x, y} ⊂ X ∪ Y .

Z = {z ∈ P(P(X ∪ Y )) ; z = (x, y), x ∈ X e y ∈ Y }.

Segue do Axioma da Extensão que o conjunto Z é único.

Diante deste resultado, podemos definir o conceito de produto cartesiano dos

Definição 2.1.2. Sejam X e Y conjuntos. O produto cartesiano dos conjuntos X e Y é

Então, F é parcialmente ordenado com a relação .

Exemplo 3.1.3. Considere o conjunto N × N com a relação definida da seguinte forma:

onde ≤ representa a ordem usual no conjunto N. Com a relação , o conjunto N × N é

Logo, (x, y) (u, v).

(x, y) (z, w) ⇔ (x < z) ou (x = z e y ≤ w).

O conjunto N × N munido da relação é um conjunto parcialmente ordenado.

que x = z e y ≤ w. Então, se z < u, obtemos x < u e, consequentemente, (x, y) (u, v).

Consideremos X um conjunto não vazio parcialmente ordenado com a relação .

Definição 3.2.1. Diremos que X é totalmente ordenado se x y ou y x para quaisquer

Definição 3.2.2. Diremos que a ∈ X é um menor elemento de X se a x para todo

Definição 3.2.3. Diremos que a ∈ X é um maior elemento de X se x a para todo

Definição 3.2.4. Diremos que a ∈ X é um elemento minimal de X se x ∈ X e x a