Você está na página 1de 232

Álgebra

Amı́lcar Pacheco
Universidade Federal do Rio de Janeiro, Instituto de Matemática
E-mail address: amilcar@im.ufrj.br
Sumário

Capı́tulo 1. Preliminares 1
1.3. Relação de equivalência 2
1.9. Lema de Zorn e aplicações 3

Parte 1. Números Inteiros 5

Capı́tulo 2. Algoritmos Euclideanos 7


2.1. O algoritmo euclideano para números inteiros 7
2.5. Máximo divisor comum 8
2.11. Anéis e ideais 10
2.15. Exercı́cios 12

Capı́tulo 3. Fatoração de inteiros 13


3.1. Existência 13
3.4. Unicidade 14
3.8. MDC e fatoração 15
3.10. Aplicações 15
3.19. Funções aritméticas elementares 18

Capı́tulo 4. Indução finita 23


4.1. Enunciados 23
4.4. Exemplos da indução na sua primeira forma 23
4.10. Exemplos da indução finita na sua segunda forma 25

Capı́tulo 5. Números primos 27


5.1. Infinidade de primos 27
5.4. Primos em progressões aritméticas 29
5.7. Infinidade de compostos por funções polinomiais 31
5.9. Números de Fermat e Mersenne 32
5.12. Contando números primos 32
5.20. Função zeta 37
iii
iv SUMÁRIO

Capı́tulo 6. Aritmética modular 41


6.1. Aritmética modular 41
6.9. Critérios de divisibilidade 43
6.13. Contando elementos inversı́veis 45

Capı́tulo 7. Sistemas de congruência 47


7.1. Equações diofantinas 47
7.3. Equações lineares 47
7.7. Sistemas de equações lineares 48
7.10. Teorema Chinês dos Restos 49
7.13. Aplicação 50

Capı́tulo 8. Aplicações da teoria de grupos à teoria elementar dos números 53


8.1. Primalidade de números de Mersenne 53
8.3. Primalidade de números de Fermat 54
8.5. Números de Carmichael 54
8.11. Teorema da raiz primitiva 56

Parte 2. Grupos 59

Capı́tulo 9. Teoria de Grupos I 61


9.1. Definição e exemplos 61
9.11. Subgrupos 66
9.17. Classes Laterais e Teorema de Lagrange 67
9.25. Ordem de elemento e expoente de grupo abeliano 69

Capı́tulo 10. Teoria de grupos II 73


10.1. Subgrupos normais e grupos quocientes 73
10.10. Homomorfismo de grupos 75
10.27. Produtos de grupos 80
10.33. Grupos metacı́clicos 85
10.37. Classificação de grupos de ordem ≤ 11 87

Capı́tulo 11. Teoremas de Sylow 91


11.1. Represesentações de grupos 91
11.7. Os teoremas de Sylow 93
11.15. Exemplos 96

Capı́tulo 12. Grupos solúveis 99


SUMÁRIO v

12.1. Teorema de Jordan-Hölder 99


12.10. Grupos solúveis 102

Capı́tulo 13. Grupos abelianos finitamente gerados 105


13.1. Módulos sobre anéis 105
13.3. Diagonalização de matrizes 107
13.6. Geradores e relações para módulos 108
13.11. O teorema de estrutura 110

Parte 3. Anéis 113

Capı́tulo 14. Anéis de polinômios 115


14.1. Algoritmo da divisão 115
14.3. Máximo divisor comum de polinômios 118
14.11. Fatoração única de polinômios 121

Capı́tulo 15. Anéis e domı́nios 127


15.1. Domı́nios euclideanos 127
15.15. Domı́nios fatoriais 133
15.25. Fatores múltiplos e resultante 137
15.34. Anéis quocientes e teorema chinês dos restos 139
15.50. Aplicações 146

Parte 4. Corpos 149

Capı́tulo 16. Extensões finitas 151


16.10. Exercı́cios 155

Capı́tulo 17. Extensões algébricas 157


17.1. Elementos algébricos e transcendentes 157
17.4. Extensões algébricas 159
17.12. Adjunção de raı́zes 160
17.18. Fechos algébricos 162

Capı́tulo 18. Extensões separáveis 169


18.17. Corpos Finitos 175

Capı́tulo 19. Corpos de decomposição e extensões normais 177


19.17. Exemplos 180
vi SUMÁRIO

Capı́tulo 20. Teoria de Galois 183


20.1. Correspondência de Galois 183
20.10. Extensões e subgrupos normais 187
20.18. Coeficientes e raı́zes 189

Capı́tulo 21. Extensões ciclotômicas 191

Capı́tulo 22. Extensões cı́clicas 197

Capı́tulo 23. Solubilidade por radicais 203

Parte 5. Tópicos adicionais 209

Capı́tulo 24. O problema inverso de Galois 211


24.2. Grupo Sn 211
24.10. Grupo An 216
24.13. Método geral 216

Capı́tulo 25. Teoria de Galois infinita 219


25.1. Limite inverso 219
25.7. Completamento de um grupo 221
25.9. Teoria de Galois infinita 222

Capı́tulo 26. Teoria de transcendência 225


26.1. Bases de trasncendência 225
26.2. Transcendência de e 225
26.3. Transcendência de π 225
26.4. Elementos de teoria de transcencência 225
CAPı́TULO 1

Preliminares

Ao longo deste livro dentoraremos por N o conjunto dos números naturais,


Z o conjunto dos números inteiros, Q o conjunto dos números racionais, R o
conjunto dos números reais e C o conjunto dos números complexos. Para todo
x ∈ C denotamos por |x| seu valor absoluto usual, i.e., se x = a + bi com a, b ∈ R,

então |x| := a2 + b2 . Para todo x ∈ R denotamos seu valor absoluto usual por
|x| := x, se x ≥ 0, e |x| := −x, se x < 0.
Sejam S e T conjuntos. Uma função f : S → T é dita injetiva toda vez que
x 6= y implicar f (x) 6= f (y). Isto também equivale a dizer que se f (x) = f (y),
então x = y. A função f é dita sobrejetiva, se f (S) = T .

Lema 1.1. Sejam S 0 e R conjuntos. Então existe um conjunto S10 e bijeção


ϕ0 : S 0 → S10 tal que S10 ∩ R = ∅.

Axioma 1.2 (axioma da boa ordenação). Todo subconjunto não vazio de N


possui um menor elemento.

Seja n ≥ 1 inteiro. Sejam x, y variáveis. Considere o produto notável

xn − y n = (x − y)(xn−1 + xn−2 y + . . . + xy n−2 + y n−1 .

Podemos obter dele a soma de n termos de uma progressão geométrica de razão


n−1
q. Digamos que os termos sejam a, aq, · · · , aq . Assim,
qn − 1
a + aq + . . . + aq n−1 = a .
q−1
Basta na fórmula anterior tomar x = q e y = 1.
Para inteiros 1 ≤ m ≤ n definimos o número binomial
 
n n!
:= ,
m m!(n − m)!

onde n! := n(n − 1) . . . 1.
1
2 1. PRELIMINARES

Lembre-se [?, p. 632] das seguintes expansões em séries


1
= 1 + x2 + x3 + . . . + xn + . . . ;
1−x
x2 x3 xn
log(1 − x) = x + + + ... + + ... .
2! 3! n!
Dado um número real x denotamos por dxe a parte inteira de x, ou seja, o
maior número inteiro menor ou igual a x.
Para todo inteiro n ≥ 1 e número primo p, a ordem p-ádica ordp (n) de n é
definida por pordp (n) é a potência exata de p que divide n.

1.3. Relação de equivalência


Seja X um conjunto. Uma relação binária R é um subconjunto de X × X.
Dado um par (a, b) ∈ R dizemos que a é relacionado a b e denotamos por aRb.
Por exemplo, podemos tomar como X o conjunto de retas do plano e como R a
relação de ortogonalidade.
Uma relação de equivalência em um conjunto X é uma relação binária ∼
satisfazendo às seguintes condições:
(1) x ∼ x (reflexividade).
(2) Se x ∼ y, então y ∼ x (simetria).
(3) Se x ∼ y e y ∼ z, então x ∼ z (transitividade).

Exemplo 1.4. Seja X = Z e ∼ a relação ≡ (mod n) definida por: dados


a, b ∈ Z, a ≡ b (mod n) se e somente se n | (a − b), i.e., existe k ∈ Z tal que
a − b = kn. Isto define uma relação de equivalência. De fato,
(1) a − a = 0 = 0.n.
(2) Se a ≡ b (mod n), então existe k ∈ Z tal que a − b = kn, logo b − a =
(−k)n e b ≡ a (mod n).
(3) Se a ≡ b (mod n) e b ≡ c (mod n), então existem k, l ∈ Z tais que
a − b = kn e b − c = ln. Somando estas duas igualdades obtemos
a − c = (k + l)n, logo a ≡ c (mod n).

Exemplo 1.5. Seja X = Z × Z − {0}. Definimos dois pares (a, b), (c, d) ∈ X
como equivalentes, denotando (a, b) ∼ (c, d) se e somente se ad = bc. Isto define
uma relação de equivalência. De fato,
(1) ab = ba, logo (a, b) ∼ (a, b).
1.9. LEMA DE ZORN E APLICAÇÕES 3

(2) Suponha que (a, b) ∼ (c, d), i.e., ad = bc. Logo cb = da, i.e., (c, d) ∼
(a, b).
(3) Suponha que (a, b) ∼ (c, d) e (c, d) ∼ (e, f ), i.e., ad = bc e cf = de. Logo
af = bcd f = bcf
d
= bde
d
= be, i.e., (a, b) ∼ (e, f ).
Seja X um conjunto e ∼ uma relação de equivalência em X. Definimos a
classe [a] de um elemento a ∈ X por [a] = {b ∈ X | b ∼ a}. Note que [a] é um
conjunto.
Lema 1.6. Seja X um conjunto e ∼ uma relação de equivalência em X.
Dados a, b ∈ X, temos que a ∼ b se e somente se [a] = [b].
Demonstração. Suponha que [a] = [b]. Observe que a ∈ [a], pois a ∼ a.
Logo a ∈ [b], i.e., b ∼ a, portanto a ∼ b.
Reciprocamente, suponha a ∼ b e c ∈ [a], i.e., c ∼ a. Por transitividade,
c ∼ b, i.e., c ∈ [b]. Suponha d ∈ [b], i.e., d ∼ b. Por simetria, b ∼ a, por
transitividade, d ∼ a, i.e., d ∈ [a]. 
Corolário 1.7. Seja X um conjunto e ∼ um relação de equivalência em X.
Então a  b se e somente se [a] ∩ [b] = ∅.
Demonstração. Note que se a ∼ b, então [a] ∩ [b] = [a] = [b] 6= ∅. Por
outro lado, se existisse c ∈ [a] ∩ [b], então c ∼ a e c ∼ b. Por simetria, a ∼ c e
por transitividade a ∼ b, o que é uma contradição. 
Corolário 1.8. Seja X um conjunto e e ∼ um relação de equivalência em X.
S· S·
Então X = a [a], onde a [a] denota a união disjunta das classes de equivalência
em X.
Demonstração. Observe que o lado direito está claramente contido no lado
esquerdo. Reciprocamente, pelo corolário anterior dado x ∈ X existe uma única
classe de equivalência [a] tal que x ∈ [a]. 
Seja X um conjunto e e ∼ um relação de equivalência em X. Definimos
X := X/ ∼:= {[a] | a ∈ X} como o conjunto das classes de equivalência de ∼ em
X. No caso particular em que X = Z e ∼ é ≡ (mod n), denotamos a classe [a]
de a ∈ Z por a. Neste caso, X é denotado por Z/nZ.

1.9. Lema de Zorn e aplicações


Definição 1.10. Um conjunto M é dito parcialmente ordenado, se existe
uma relação ≤ em M satisfazendo às seguintes condições
4 1. PRELIMINARES

(1) (reflexividade) a ≤ a, para todo a ∈ M.


(2) (Transitividade) Dados a, b, c ∈ M, se a ≤ b e b ≤ c, então a ≤ c.
(3) (Anti-simetria) Dados a, b ∈ M, se a ≤ b e b ≤ a, então a = b.
Esta ordem será dita total, se para quaisquer a, b ∈ M temos a ≤ b ou b ≤ a.
Neste caso dizemos que M é um conjunto totalmente ordenado.

Definição 1.11. Seja M um conjunto parcialmente ordenado. Um elemento


m ∈ M é dito um elemento maximal de M, se dado a ∈ M tal que a ≤ m,
então a = m. Um elemento c ∈ M é dito um limite superior para M, se para
todo a ∈ M temos a ≤ c. O conjunto M é dito indutivo, se todo subconjunto
totalmente ordenado L ⊂ M possui limite superior. Neste caso, M 6= ∅.

Lema 1.12 (lema de Zorn). (ver [?, §69]) Todo conjunto parcialmente orde-
nado indutivo possui elemento máximo.

Lema 1.13 (lema de Krull). Seja R um anel comutativo com unidade. Todo
ideal não nulo a de R está contido em algum ideal maximal m de R.

Demonstração. Considere o conjunto N de todos os ideais b ( R contendo


a. É imediato que este conjunto é parcialmente ordenado com respeito à relação
de inclusão de conjuntos. Seja L ⊂ N um subconjunto totalmente ordenado e
[
C := b.
b∈L

Segue de um exercı́cio do capı́ulo de domı́nios euclideanos que C é um ideal de


R. Além disto, este ideal é próprio, do contrário, existiria b ∈ L tal que 1 ∈ b,
o que contradiria b ( R. Por construção, o ideal C é um limite superior para L.
Em particular, pelo lema de Zorn, existe m elemento máximo de N. Novamente
por construação m é maximal e contém a. 
Parte 1

Números Inteiros
CAPı́TULO 2

Algoritmos Euclideanos

O objetivo deste capı́tulo é descrever o algoritmo euclideano que permite


dividir um número inteiro por outro, definir a noção de máximo divisor comum
de números inteiros e provar o algoritmo euclideano estendido que dá uma relação
de dependência linear entre o máximo divisor comum e os números inteiros através
da noção de ideais.

2.1. O algoritmo euclideano para números inteiros


Definição 2.2. Sejam a, b ∈ Z. Dizemos que a divide b ou que b é divisı́vel
por a e denotamos a | b se existe c ∈ Z tal que ac = b.

Proposição 2.3. A divisibilidade satisfaz as seguintes propriedades:


(1) (Cancelamento). Se c 6= 0 e ac | bc, então a | b.
(2) (Transitividade). Se a | b e b | c, então a | c.

Demonstração. (1) Existe α ∈ Z tal que αac = bc, i.e., c(b − αa) = 0. Mas
o produto de dois inteiros é igual a zero implica em que um dos inteiros é nulo.
Observe que c 6= 0, assim b = ac, i.e., a | b.
(2) Existem α, β ∈ Z tais que b = αa e c = βb, substituindo a primeira
igualdade na segunda, obtemos c = βαa, i.e., a | c. 

Teorema 2.4 (algoritmo de Euclides). Sejam a, b ∈ Z com b 6= 0. Então


existem q, r ∈ Z tais que
a = bq + r, onde 0 ≤ |r| < |b|.
Se a, b ≥ 0, então q e r são unicamente determinados por a e b.

Demonstração. Suponha inicialmente que a, b ≥ 0. Se a < b tome q = 0 e


r = a. Suponha que a ≥ b. Considere o conjunto S := {k ≥ 1 inteiro | kb > a}.
Este conjunto é um subconjunto não vazio de N. Assim, pelo axioma da boa
ordenação (axioma 1.2) existe q + 1 ∈ S tal que q + 1 ≤ x para todo x ∈ S. Logo
q∈/ S, i.e., a ≥ bq. Seja r := a − bq, portanto 0 ≤ r < (q + 1)b − b = b.
7
8 2. ALGORITMOS EUCLIDEANOS

• Se a < 0 e b > 0, divida a0 := −a por b com quociente q 0 e resto r0 e


tome q := −q 0 e r := −r0 .
• Se a < 0 e b < 0, divida a0 := −a por b0 := −b com quociente q 0 e resto
r0 e tome q := q 0 e r := −r0 .
• Se a > 0 e b < 0, divida a por b0 := −b com quociente q 0 e resto r0 e
tome q := −q e r := r0 .
Para provar a unicidade suponha que

a = bq1 + r1 = bq2 + r2 , onde 0 ≤ r1 , r2 < b.

Basta provar que r1 = r2 , pois neste caso bq1 = bq2 e como b 6= 0, pela propriedade
do cancelamento, q1 = q2 . Suponha r1 < r2 . Neste caso,

r2 − r1 = b(q1 − q2 ) ≥ b, mas r2 − r1 ≤ r2 < b.

Similarmente, não podemos ter r1 > r2 . 

2.5. Máximo divisor comum


Definição 2.6. Sejam a, b ∈ Z. Dizemos que d ∈ Z é um máximo divisor
comum de a e b, denotado por mdc(a, b) se
(1) d | a e d | b; (por isto d é dito um divisor comum de a e b.)
(2) Para todo d0 ∈ Z tal que d0 | a e d0 | b, d0 | d.

Observação 2.7. • A noção de mdc está bem definida a menos de


sinal. De fato se e for um outro mdc de a e b, então por (2) e | d e d | e,
ou seja existem α, β ∈ Z tais que d = αe = αβd, portanto αβ = 1, i.e.,
α ∈ {±1}. Assim quando dizemos o mdc de a e b referimo-nos à escolha
de d positiva.
• mdc(a, b) = mdc(−a, −b) (exercı́cio).
• Se b | a, então mdc(a, b) = b (idem).
• Denote por Da,b o conjunto dos divisores comuns positivos de a e b.
Note que para qualquer x ∈ Da,b temos que x ≤ min{a, b}. Assim, este
conjunto é finito. Fica novamente como exercı́cio verificar que mdc(a, b)
é justamente o elemento máximo de Da,b .

Lema 2.8. Sejam a, b ≥ 1 inteiros e a = bq + r onde 0 ≤ r < b a divisão de


a por b. Então mdc(a, b) = mdc(b, r).
2.5. MÁXIMO DIVISOR COMUM 9

Demonstração. Basta mostrar que os conjuntos Da,b e Db,r são coincidem.


De fato, neste caso seus elementos máximos são iguais, o que prova o lema. Seja
e ∈ Da,b , digamos a = eα e b = eβ para α, β ∈ Z. Logo r = a − bq = e(α − βq),
i.e., e | r, i.e., e ∈ Db,r , i.e., Da,b ⊂ Db,r . Seja f ∈ Db,r , digamos b = f β 0 e r = f γ
para β 0 , γ ∈ Z. Então a = bq + r = f (β 0 q + γ), i.e., f | a, i.e., f ∈ Da,b , i.e.,
Db,r ⊂ Da,b . 
Teorema 2.9. Sejam a, b ≥ 1 inteiros. Consideremos a seqüência de divisões
sucessivas:
a = bq1 + r1 , 0 < r1 < b
b = r1 q2 + r2 , 0 < r2 < r1
.. ..
(2.9.1) . .
rn−2 = rn−1 qn + rn , 0 < rn < rn−1
rn−1 = rn qn+1 ,
onde rn é o último resto não nulo na seqüência de divisões. Então mdc(a, b) = rn .
Demonstração. Notemos inicialmente que em (2.9.1) terı́amos que ter um
primeiro resto nulo, rn+1 , pois
b > r1 > r2 > · · · ≥ 1
e não existe uma seqüência estritamente descendente infinita de números inteiros
positivos.
Pelo lema anterior aplicado a cada linha de (2.9.1) obtemos
mdc(a, b) = mdc(b, r1 ) = · · · = mdc(rn−1 , rn ).
Mas rn | rn−1 , logo rn = mdc(rn , rn−1 ). A fortiori, rn = mdc(a, b). 
Teorema 2.10 (algoritmo euclideano estendido). Sejam a, b ≥ 1 inteiros e
d = mdc(a, b). Existem s, t ∈ Z tais que d = sa + tb.
Demonstração. Começamos com a penúltima linha de (2.9.1),
rn = rn−2 + (−qn )rn−1 ,
tome A1 := −rn−1 e B1 := 1. Da linha seguinte temos
rn−1 = rn−3 + (−qn−1 )rn−2 ,
assim
rn = B1 rn−2 + A1 rn−1 = B1 rn−2 + A1 (rn−3 + (−qn−1 )rn−2 ).
10 2. ALGORITMOS EUCLIDEANOS

Tome A2 := B1 − A1 qn−1 e B2 := A1 . A linha seguinte nos dá


rn−2 = rn−4 + (−qn−2 )rn−3 .
Substituindo na fórmula anterior,
rn = B2 rn−3 + A2 rn−2 = B2 rn−3 + A2 (rn−4 + (−qn−2 )rn−3 )
Tome A3 := B2 − A2 qn−2 e B3 := A2 . Repetindo o mesmo argumento obtemos
rn = Bn−2 r1 + An−2 r2 .
Mas r2 = b + (−q2 )r1 , donde
rn = Bn−2 r1 + An−2 (b + (−q2 )r1 ),
tome An−1 := Bn−2 − An−2 q2 e Bn−1 := An−2 . Finalmente a primeira divisão nos
dá, r1 = a + (−q1 )b e sustituindo na fórmula anterior obtemos
rn = Bn−1 b + An−1 (a + (−q1 )b).
Basta tomar s := An−1 e t := Bn−1 − An−1 q1 . 

2.11. Anéis e ideais


Nesta seção daremos uma outra demonstração (conceitual) do algoritmo eu-
clideano estendido. Para isto precisamos da noção de ideais no conjunto Z dos
números inteiros.
O conjunto Z dos números inteiros possui duas funções. A soma + : Z×Z → Z
de números inteiros (a, b) 7→ a + b que associa ao par (a, b) sua soma a + b. E o
produto de inteiros · : Z × Z → Z dada por (a, b) 7→ ab que associa ao par (a, b)
o seu produto ab. Dados inteiros a, b, c as seguintes propriedades são satisfeitas:
(1) (Associatividade da soma) a + (b + c) = (a + b) + c.
(2) (Comutatividade da soma) a + b = b + a.
(3) (Elemento neutro da soma) a + 0 = 0.
(4) (Inverso da soma) Dado a ∈ Z existe b ∈ Z tal que a+b = 0 e denotamos
b = −a.
(5) (Associatividade do produto) a(bc) = (ab)c.
(6) (Comutatividade do produto) ab = ba.
(7) (Elemento neutro do produto) 1a = a.
(8) (Distributividade do produto em relação à soma) a(b + c) = ab + ac. Por
satisfazer estas propriedades Z é dito um anel comutativo com unidade.
Além disto a seguinte propriedade é satisfeita:
2.11. ANÉIS E IDEAIS 11

(9) (Cancelamento) Se ab = 0, então a = 0 ou b = 0. Por satisfazer esta


propriedade Z é dito um domı́nio de integridade.
Observação 2.12. Poderı́amos perguntar sobre a existência do inverso em Z
com relação ao produto. Ou seja, suponhamos que a, b ∈ Z são tais que ab = 1.
Suponha a ≥ 1. Neste caso b = a1 ∈ Z também é um inteiro positivo, mas a
única possibilidade destra fração ser um número inteiro é a = 1 e neste caso
necessariamente b = 1. Se a < 0, seja a0 = −a e b0 = −b, logo ab = a0 b0 = 1 e
pelo caso anterior a0 = 1 e b0 = 1, i.e., a = b = −1. Assim os únicos números
inteiros que admitem inverso são ±1.
Definição 2.13. Um subconjunto I ⊂ Z de Z é dito um ideal de Z, se as
seguintes condições são satisfeitas:
(1) 0 ∈ I.
(2) (I é fechado com relação à soma) Dados a, b ∈ I, a + b ∈ I.
(3) (I é estável com relação à multiplicação de elementos de Z) Dado a ∈ I
e r ∈ Z, então ra ∈ I.
Fica como exercı́cio mostrar que os seguintes conjuntos são ideais de Z :
• I := 2Z = {2k | k ∈ Z} (o conjunto dos números pares).
• Seja n ≥ 1 inteiro e I := nZ = {nk | k ∈ Z} o conjunto dos múltiplos de
n.
• Sejam n1 , · · · , nk ≥ 1 inteiros. Seja I := n1 Z + . . . + nk Z = {n1 a1 +
. . . + nk ak | a1 , · · · , ak ∈ Z} o conjunto dos números que são somas de
múltiplos de n1 com múltiplos de n2 , etc., com múltiplos de nk .
Proposição 2.14. Todo ideal I 6= (0) de Z é da forma dZ para algum d ≥ 1.
Por isto dizemos que I é um ideal principal e que Z é um domı́nio principal.
Demonstração. Observemos que I ∩ N 6= ∅. Dado a ∈ I, se a ≥ 1 nada há
a fazer. Senão, ou seja, dado a < 0 em I, então −a = (−1)a ∈ I pela propriedade
(3) de ideais, mas −a ≥ 1. Pelo axioma da boa ordenação existe d ∈ I ∩ N tal
que d ≤ k para todo k ∈ I ∩ N. Afirmamos que I = dZ.
De um lado, como d ∈ I, pela propriedade (3) de ideais, para todo k ∈ Z,
dk ∈ I, i.e., dZ ⊂ I. De outro lado, dado a ∈ I, digamos a ≥ 1, pelo algoritmo
euclideano, existem q, r ∈ Z tais que a = qn + r, onde 0 ≤ r < n. Se r > 0, então
r = a + (−q)n ∈ I, pois a, (−q)n ∈ I, mas isto contradiz o fato de d ser o menor
inteiro positivo em I. Assim, r = 0 e n | a, portanto a ∈ nZ. Se a < 0, a mesma
prova mostra que se a0 = −a, d | a0 , logo d | a, e assim I ⊂ nZ. 
12 2. ALGORITMOS EUCLIDEANOS

2.15. Exercı́cios
(1) Seja a ∈ Z. Mostre que a é par se e somente se a2 é par.
(2) Seja n > 1 inteiro. Mostre que:
(a) mdc(n, 2n + 1) = 1.
(b) mdc(2n + 1, 3n + 1) = 1.
(c) mdc(n! + 1, (n + 1)! + 1) = 1.
(3) Sejam n > m ≥ 1 inteiros. Suponha que n = qm + r seja a divisão de
n por m, onde 0 ≤ r < m. Mostre que 2n − 1 = (2m − 1)Q + R, onde
R = 2r − 1 e 0 ≤ R < (2m − 1).
n
(4) Sejam n > m ≥ 1 inteiros. O número F (n) = 22 + 1 é chamado o
n-ésimo número de Fermat. O objetivo deste exercı́cio é mostrar que
mdc(F (n), F (m)) = 1. Faremos isto por etapas.
m+1 m m m
(a) Utilizando que 22 − 1 = (22 + 1)(22 − 1) mostre uqe (22 − 1) |
n
(22 + 1) = F (n). Calcule o quociente desta divisão.
n
(b) Utilize (a) para mostrar que o resto da divisão de F (n) = 22 + 1
m
por F (m) = 22 + 1 é 2.
(c) Utilize (b) para calcular mdc(F (n), F (m)).
(5) Sejam a, b ≥ 1 inteiros. Mostre que mdc(a, b) mmc(a, b) = ab.
CAPı́TULO 3

Fatoração de inteiros

Neste capı́tulo mostramos que todo número inteiro fatora-se de forma única
como produto de números primos

3.1. Existência
Definição 3.2. Seja p ≥ 2 inteiro. Dizemos que p é um número primo, se
para todo inteiro b ≥ 1 tal que b | p, então b = 1 ou b = p, i.e., os únicos divisores
positivos de p são 1 e p. Os números inteiros que não primos são chamados de
números compostos, i.e., n ≥ 1 é composto se e somente se existem 1 < a, b < n
tais que n = ab.

Teorema 3.3 (teorema fundamental da aritmética - primeira versão). Seja


n ≥ 1 inteiro, existem p1 , · · · , pk números primos (não necessariamente distintos)
tais que

n = p 1 · · · pk .

Demonstração. Se n é primo nada há a fazer. Suponhamos que n seja


composto. Todo divisor d de n satisfaz d ≤ n, assim o conjunto dos divisores
positivos de n é finito. Seja p1 o menor divisor positivo de n. Afirmamos que p1
é primo.
Se p1 não fosse primo, terı́amos que existem 1 < a, b < p1 tais que p1 = ab,
em particular a | n, mas isto contradiz a minimalidade de p1 .
Seja n1 := pn1 < n. Se n1 é igual a 1 ou primo, então n = n1 p1 já é a fatoração
procurada. Senão, com o mesmo argumento anterior, o menor divisor positivo
p2 de n1 é primo. Seja n2 := np21 = p1np2 < n1 . Se n2 é igual a 1 ou primo, então
n = n2 p2 p1 é a fatoração procurada. Senão prosseguimos. Note que temos uma
seqüência estritamente decrescente n > n1 > n2 > · · · de inteiros positivos, assim
existe k ≥ 1 tal que nk = 1, i.e., n = p1 · · · pk . 
13
14 3. FATORAÇÃO DE INTEIROS

3.4. Unicidade
Lema 3.5. Seja p ≥ 2 um número primo e a, b ∈ Z \ {0}. Se p | ab, então
p | a ou p | b.

Demonstração. Note que dado um número primo p, então mdc(a, p) = 1


equivale a p - a, pois os únicos divisores positivos de p são 1 e p. Suponha
que p - a, i.e., pelo algoritmo euclideano estendido, existem s, t ∈ Z tais que
1 = sa + tp. Multiplicando ambos os lados por b obtemos b = sab + tpb. Mas
ab = αp, pois p | ab, para algum α ∈ Z. Logo b = p(sα + tb), i.e., p | b. 

Observação 3.6. O lema anterior pode ser estendido imediatamente para


um produto qualquer de inteiros, i.e., se p | a1 · · · an , então existe 1 ≤ i ≤ n tal
que p | ai .

Teorema 3.7 (teorema fundamental da aritmética - segunda versão). Seja


n ≥ 1 inteiro, então existem únicos números primos

p1 < · · · < pr e inteiros e1 , · · · , er ≥ 1

tais que
n = pe11 · · · perr .

Demonstração. Já provamos anteriormente a existência da fatoração, a-


grupando os primos e colocando-os em ordem temos a expressão acima. Suponha
que existam outros primos

q1 < · · · < qs e inteiros f1 , · · · , fs ≥ 1

tais que
n = pe11 · · · perr = q1f1 · · · qsfs .

Pela observação anterior temos que existe algum 1 ≤ j ≤ s tal que p1 | qj . Mas
ambos são primos, logo p1 = qj . O mesmo argumento acima mostra que existe
1 ≤ i ≤ r tal que q1 = pi . Afirmamos que j = 1. Caso contrário, ou seja j > 1,
q1 = pi ≥ p1 = qj , o que contradiz a ordenação dos números primos q’s. Logo
j = 1. Afirmamos também que e1 = f1 . Suponha, por exemplo, que e1 > f1 .
Neste caso, cancelando pf11 dos dois lados da equação acima obtemos

pe11 −f1 pe22 · · · perr = q2f2 · · · qsfs .


3.10. APLICAÇÕES 15

Repetindo a argumentação anterior obtemos que q2 = pi para algum 1 < i ≤ r.


Mas dessa forma, o fator primo p1 do lado esquerdo não cancelará com nenhum
fator primo do lado direito. Portanto, e1 = f1 .
Isto nos fornece a igualdade
pe22 · · · perr = q2f2 · · · qsfs .
Pelo mesmo argumento anterior, p2 = q2 e e2 = f2 . Assim sucessivamente con-
cluimos que o número de fatores primos em ambos os lados é igual, i.e., r = s e
para cada 1 ≤ i ≤ r, pi = qi e ei = fi . 

3.8. MDC e fatoração


Proposição 3.9. Sejam a, b ≥ 1 inteiros,
a = pe11 · · · pekk e b = pf11 · · · pfkk
suas fatorações, com ei , fi ≥ 0 para 0 ≤ i ≤ k. Seja gi = min{ei , fi } e
d = pg11 · · · pgkk .
Então d = mdc(a, b).

Demonstração. Notemos que d é um divisor comum de a e b, pois


a = dpe11 −g1 · · · pkek −gk e b = dpf11 −g1 · · · pkfk −gk ,
uma vez que para cada i, fi − gi , ei − gi ≥ 0. Seja d0 ≥ 1 um divisor comum de a
e b, i.e.,
d = ph1 1 · · · phk k
para 0 ≤ hi ≤ ei , fi . Em particular, hi ≤ gi . Assim,
d = d0 pg11 −h1 · · · pkgk −hk .


3.10. Aplicações

Proposição 3.11. Seja p ≥ 2 um número primo. Então p∈
/ Q.

Demonstração. Seja x ∈ Q \ {0}. Então x = ab com a, b ∈ Z \ {0}. Note


que a = da0 e b = db0 , onde d = mdc(a, b) e que mdc(a0 , b0 ) = 1. Simplificando
0
d obtemos que x = ab0 . Assim, dividindo pelo mdc, suporemos sempre que dado
um número x ∈ Q \ {0}, x é da forma ab com mdc(a, b) = 1.
16 3. FATORAÇÃO DE INTEIROS
√ √
Suponha que p ∈ Q, i.e., existem a, b ∈ Z tais que p = ab e mdc(a, b) = 1.
Logo a2 = pb2 e p | a2 . Pelo lema 3.5 concluimos que p | a, digamos a = pα, para
algum α ∈ Z. Substituindo na igualdade anterior concluimos que p2 α2 = pb2 ,
i.e., pα2 = b2 . Mas isto implica em p | b2 . Novamente, pelo lema 3.5, obtemos
que p | b, mas isto é impossı́vel pois mdc(a, b) = 1. 

Definição 3.12. Seja n ≥ 1 inteiro. Dizemos que n é livre de quadrados se


sua fatoração é da forma
n = p1 · · · pk .

Lema 3.13. Seja n ≥ 1 inteiro, então existem Q, a ≥ 1 inteiros tais que


n = a2 Q, onde Q é livre de quadrados.

Demonstração. Fatoramos n como


n = pe11 · · · pekk .
Pelo algoritmo euclideano, para cada 1 ≤ i ≤ k, existem qi , ri ∈ Z tais que
ei = 2qi + ri , onde 0 ≤ ri < 2. Assim
n = p2q1 r1 2qk rk
1 p1 · · · p k pk

e tomando Q := pr11 · · · prkk , excluindo os primos com expoente zero, temos que Q
é livre de quadrados. O que sobra é a2 com a := pq11 · · · pqkk , i.e., n = a2 Q. 

Proposição 3.14. Seja n ≥ 1 inteiro livre de quadrados, então n ∈ / Q.

Demonstração. Suponha que n = ab com a, b ∈ Z e mdc(a, b) = 1. Seja
n = p1 · · · pk
a fatoração de n. Então
a2 = p 1 · · · p k b 2 .
Logo para cada 1 ≤ i ≤ r temos que pi | a2 . Pelo lema 3.5 concluimos que pi | a,
digamos a = pi αi para αi ∈ Z. Substituindo na igualdade anterior obtemos
p2i αi2 = p1 · · · pk b2 .
Simplificando pi na igualdade acima, obtemos
pi αi2 = p1 · · · pi−1 pi+1 · · · pk b2 = cb2 ,
onde c := p1 · · · pi−1 pi+1 · · · pk . Como pi - c, pois pi não pode dividir nenhum dos
fatores de c uma vez que p1 < · · · < pk , ou seja são todos distintos, concluimos
3.10. APLICAÇÕES 17

que pi | b2 . Novamente pelo lema 3.5 temos que pi | b, o que contradiz mdc(a, b) =
1. 

Proposição 3.15. Seja f ≥ 2 inteiro e p ≥ 2 primo. Então f p∈
/ Q.
√ a
Demonstração. Suponha que f p= b
com a, b ∈ Z e mdc(a, b) = 1. Então

af = pbf

e p | af . Pela observação 3.6 concluimos que p | a, digamos a = pα. Substituindo


na igualdade anterior obtemos

pf αf = pbf ,

simplificando a igualdade anterior por p, concluimos que

pf −1 αf = bf .

Como f ≥ 2 temos que p aparece na fatoração do lado esquerdo, em particular,


p | bf . Novamente, pela observação 3.6 concluimos que p | b, mas isto contradiz
mdc(a, b) = 1. 

Definição 3.16. Sejam n ≥ 1 e f ≥ 2 inteiros. Dizemos que n é livre de


f -potências se a fatoração de n é da forma

n = pe11 · · · pekk

com 1 ≤ ei < f para todo 1 ≤ i ≤ k.

Lema 3.17. Seja n ≥ 1 inteiro, então existem Q, a ≥ 1 inteiros tais que


n = af Q com Q livre de f -potências.

Demonstração. Seja
n = pe11 · · · pekk
a fatoração de n. Pelo algoritmo euclideano, para cada 1 ≤ i ≤ k, existem
qi , ri ∈ Z tais que ei = f qi + ri , onde 1 ≤ ei < f . Assim escrevemos

n = pf1 q1 pr11 · · · pfk qk prkk .

Como anteriormente Q := pr11 · · · prkk é livre de f -potências e tomando a :=


pq11 · · · pfkk concluimos que n = af Q. 

Proposição 3.18. Sejam n ≥ 1 e f ≥ 2 inteiros. Suponhamos que n seja



livre de f -potências. Então f n ∈
/ Q.
18 3. FATORAÇÃO DE INTEIROS

Demonstração. Seja
n = pe11 · · · pekk
√ a
a fatoração de n, onde 1 ≤ ei < f para todo i ≤ i ≤ k. Suponhamos que f
n= b
com a, b ∈ Z e mdc(a, b) = 1. Então
af = pe11 · · · pekk bf .
Logo para cada 1 ≤ i ≤ k pi | af . Pela observação 3.6 concluimos que pi | a,
digamos a = pi αi para αi ∈ Z. Substituindo na igualdade anterior obtemos
pfi αif = pe11 · · · pekk bf .
Cancelando pei i em ambos os lados da igualdade acima e denotando
e e
c := pe11 · · · pi−1
i−1 i+1
pi+1 · · · pekk ,
obtemos
pfi −ei αif = cbf .
Como anteriormente pi - c uma vez que pi não divide nenhum fator de c. Logo
pi | bf . Novamente pela observação 3.6 concluimos que pi | b, mas isto contradiz
mdc(a, b) = 1. 

3.19. Funções aritméticas elementares


Para todo número inteiro n ≥ 1 denotemos por ν(n) o número de divisores
inteiros positivos de n e por σ(n) a soma de todos estes divisores, i.e.,
X
ν(n) := #{d ≥ 1 | d | n} e σ(n) := d.
d≥1,d|n

Utilizaremos a fatoração única para obter fórmulas explı́citas para estes dois nú-
meros.
Proposição 3.20. Seja n = pa11 · · · par r a fatoração de n em números primos.
Então
pa1 +1 − 1 par +1 − 1
ν(n) = (a1 + 1) · · · (ar + 1) e σ(n) = 1 ··· r .
p1 − 1 pr − 1
Demonstração. Note que d | n se e somente se d fatora-se como
d = pb11 · · · pbrr com 0 ≤ bi ≤ ai para todo 1 ≤ i ≤ r.
Assim, os divisores positivos de n correspondem bijetivamente as r-uplas (b1 , · · · , br )
satisfazendo a 0 ≤ bi ≤ ai para todo 1 ≤ i ≤ r. A quantidade destas r-uplas é
exatamente (a1 + 1) · · · (ar + 1).
3.19. FUNÇÕES ARITMÉTICAS ELEMENTARES 19

Para a segunda igualdade observe que


! !
X X X
σ(n) = p1b1 · · · pbrr = pb11 ··· pbrr
(b1 ,··· ,br ) b1 br

e que cada soma no segundo membro é a soma dos termos de uma progressão
geométrica, disto segue a fórmula para σ(n). 

3.20.1. Função de Mœbius. Definimos a função de Mœbius µ : N \ {0} →


Z por µ(1) := 1, µ(n) := 0, se n não é livre de quadrados, caso contrário, i.e.,
n = p1 · · · pr , onde os pi ’s são primos distintos definimos µ(n) := (−1)r .

Proposição 3.21. Se n > 1, então


X
µ(d) = 0.
d≥1,d|n

Demonstração. Seja n = pa11 · · · par r a fatoração de n. Pela definição de µ


temos que
X X
µ(d) = µ(p11 . . . prr ),
d≥1,d|n (1 ,··· ,r )

onde os i ’s são 0 ou 1. Portanto,


   
X r r
µ(d) = 1 − r + − + . . . + (−1)r = (1 − 1)r = 0.
2 3
d≥1,d|n


Para entender melhor a função de Mœbius precisamos introduzir a multi-
plicação de Dirichlet. Sejam f, g : N \ {0} → C, definimos
X
f ◦ g(n) := f (d1 )g(d2 ).
d1 ,d2 ≥1,d1 d2 =n

Este produto é associativo. Isto segue do seguinte exercı́cio


X
f ◦ (g ◦ h)(n) = (f ◦ g) ◦ h(n) = f (d1 )g(d2 )h(d3 ).
d1 ,d2 ,d3 ≥1,d1 d2 d3 =n

Definimos a função 1 : N \ {0} → Z por 1(1) := 1 e 1(n) := 0, se n > 1.


Segue da definição que para toda função f : N \ {0} → C temos f ◦ 1 = 1 ◦f = f .
Defina também a função I : N \ {0} → Z por I(n) := 1 para todo n. Novamente,
P
por esta definição obtemos f ◦ I(n) = I ◦ f (n) = d≥1,d|n f (d).

Lema 3.22. I ◦ µ = µ ◦ I = 1.
20 3. FATORAÇÃO DE INTEIROS

Demonstração. É claro que µ ◦ I(1) = µ(1)I(1) = 1. Se n > 1, então


P
µ ◦ I(n) = d≥1,d|n µ(d) = 0. A prova para I ◦ µ é idêntica. 

Teorema 3.23 (teorema de inversão de Mœbius). Seja


X
F (n) := f (d).
d≥1,d min d

Então
X
f (n) = µ(d)F (n/d).
d≥1,d|n

Demonstração. Por definição F = f ◦ I. Logo, F ◦ µ = (f ◦ I) ◦ µ =


f ◦ (I ◦ µ) = f ◦ 1 = f , i.e.,
X
f (n) = F ◦ µ(n) = µ(d)F (n/d).
d≥1,d|n


O teorema de inversão de Mœbius tem diversas aplicações, dentre elas a função
φ de Euler definida da seguinte forma. Seja n ≥ 1 inteiro, φ(n) denota o número
de inteiros positivos d ≤ n tais que mdc(d, n) = 1. É claro que se p for um
número primo φ(p) = p − 1.

Proposição 3.24.
X
φ(d) = n
d≥1,d|n

Demonstração. Consideremos as n frações 1/n, 2/n, · · · , (n − 1)/n, n/n.


Podemos reduzir cada uma delas a forma mı́nima cancelando os fatores primos
comuns do numerador e denominador. Assim, cada uma delas será igual a uma
fração a/b com mdc(a, b) = 1. Os denominadores serão sempre divisores de n.
O número de frações na forma mı́nima com denominador d, pela definição da
função φ, é igual a φ(d). Disto segue a proposição. 

Proposição 3.25. Se n = pa11 . . . par r , então


   
1 1
φ(n) = n 1 − ... 1 − .
p1 pr
Demonstração. Como
X
n= φ(d),
d≥1,d|n
3.19. FUNÇÕES ARITMÉTICAS ELEMENTARES 21

pelo teorema de inversão de Mœbius temos


X Xn X n
φ(n) = µ(d)n/d = n − + + ...
i
p i i<j
p i p j
d≥1,d|n
   
1 1
=n 1− ... 1 −
p1 pr − 1

CAPı́TULO 4

Indução finita

Neste capı́tulo apresentamos o método da indução finita. Este método é


utilizado em diversas circunstâncias em matemáticas para provar afirmativas que
dependem “indutivamente” dos números naturais.

4.1. Enunciados
Axioma 4.2 (princı́pio da indução finita na sua primeira forma). Seja A(n)
uma afirmativa sobre números naturais n ∈ N. Suponha que
(1) exista n0 ∈ N tal que A(n0 ) seja verdadeira.
(2) Dado k ≥ n0 , toda vez que A(k) for verdade, então A(k + 1) também o
será.
Então para todo n ≥ n0 a afirmativa A(n) é verdadeira.

Axioma 4.3 (princı́pio da indução finita na sua segunda forma). Seja A(n)
uma afirmativa sobre números naturais n ∈ N. Suponha que
(1) exista n0 ∈ N tal que A(n0 ) seja verdadeira.
(2) Se A(k) é verdadeira para todo n0 ≤ k < n então A(n) também é
verdadeira.
Logo para todo n ≥ n0 a afirmativa A(n) é verdadeira.

4.4. Exemplos da indução na sua primeira forma


Exemplo 4.5. Para todo inteiro n ≥ 1 temos
n
X n(n + 1)
i= .
i=1
2
1.2
Demonstração. (1) Para n = 1 temos que 1 = 2
.
Pn
(2) Suponha que i=1 i = n(n+1)
2
. Então
n+1 n
X X n(n + 1) (n + 1)(n + 2)
i= i + (n + 1) = + (n + 1) = .
i=1 i=1
2 2
23
24 4. INDUÇÃO FINITA

Lema 4.6. Seja p um número primo e 1 ≤ i < p inteiro, então o binomial


p

i
é divisı́vel por p.

Demonstração. Por definição


 
p p(p − 1) · · · (p − i + 1)
= ∈ Z.
i i(i − 1) · · · 1
Note que p não divide nenhum dos fatores do denominador, pois i < p. Logo
podemos colocar p para fora da fração e o que sobra
(p − 1) · · · (p − 1 + i)
i(i − 1) · · · 1
também é inteiro. 

Exemplo 4.7. Seja p um número primo. Para todo inteiro n ≥ 1 temos que
p divide np − n.

Demonstração. (1) Para n = 1 temos que p divide 1p − 1 = 0.


(2) Suponha que p | (np − n). Então
p−1  
p
X p i
(n + 1) − (n + 1) = n + (np − n).
i=1
i

Pelo Lema 4.6 e pela hipótese de p | (np − n) concluimos que p | ((n +


1)p − (n + 1)).


Teorema 4.8 (pequeno teorema de Fermat). Seja p um número primo e


a ∈ Z. Então p | (ap − a).

Demonstração. O exemplo mostra o teorema para inteiros positivos. Seja


m < 0 inteiro, digamos m = −n para n ≥ 1. Suponha p > 2. Neste caso,
mp − m = (−n)p − (−n) = −(np − n) que é divisı́vel por p. No caso de p = 2
temos que se n2 − n = 2α, então m2 − m = n2 + n = n + 2α + n = 2(α + 1). 

Observação 4.9. O teorema anterior é na verdade equivalente para um in-


teiro a não divisı́vel por p a p | (ap−1 − 1). De fato, suponha que ap − a =
a(ap−1 − 1) = αp para α ∈ Z. Se p - a, então pelo Lema 3.5 concluimos que
p | (ap−1 − 1).
4.10. EXEMPLOS DA INDUÇÃO FINITA NA SUA SEGUNDA FORMA 25

4.10. Exemplos da indução finita na sua segunda forma


Ordenamos os números primos

p1 = 2 < p2 = 3 < p3 = 5 · · · < pn · · · ,

onde pn denota o n-ésimo número primo. Seja P o conjunto dos números primos.

Teorema 4.11 (Euclides). O conjunto P é infinito.

Demonstração. Suponhamos que P seja finito, digamos com k elementos,

P = {p1 < · · · < pk }.

Seja
M := p1 · · · pk + 1.
Notemos que M > p1 · · · pk ≥ 2pk > pk , logo M tem que ser um número com-
posto. Pelo teorema fundamental da aritmética M é produto de números primos.
Logo os únicos primos que podem aparecer na sua fatoração são p1 , · · · , pk , di-
gamos que pi | M , i.e., existe αi ≥ 1 inteiro tal que M = αi pi . Retornando à
definição de M obtemos

pi (αi − p1 · · · pi−1 pi+1 · · · pk ) = 1.

Os fatores do lado esquerdo são ambos inteiros, o primeiro é positivo e o produto é


positivo. Logo a expressão entre parênteses é positiva. Por outro lado pi ≥ 2, logo
o lado esquerdo é pelo menos 2, enquanto o lado direito é 1, o que é impossı́vel.
A contradição vem do fato de termos suposto P finito, portanto P é infinito. 

No próximo capı́tulo daremos outras demonstrações deste teorema bem como


discutiremos em maior profundidade os números primos.
n
Exemplo 4.12. Para todo inteiro n ≥ 1 temos pn ≤ 22 .

Demonstração. (1) Observe que p1 = 2 ≤ 22 = 4.


m
(2) Suponha que para todo 1 ≤ m < n tenhamos pm ≤ 22 . A demons-
tração do teorema de Euclides mostra que M := p1 · · · pn−1 + 1 não pode
ser divisı́vel por nenhum dos primos p1 , · · · , pn−1 . Logo M só pode ser
divisı́vel por primos maiores que pn−1 , em particular, pn ≤ M . Assim,
2
pn ≤ p1 · · · pn−1 + 1 ≤ 22 + . . . 2n−1 + 1.
26 4. INDUÇÃO FINITA
n−1
Mas 22 + . . . + 2n−1 = 2(1 + . . . + 2n−2 ) = 2 2 2−1−1 = 2n − 2. Portanto,
n n n n n
pn ≤ 22 −2 +1. Basta mostrar que 22 −2 +1 ≤ 22 , i.e., 4 ≤ 22 +2 −22 =
n
22 (4 − 1), o que é verdade.


Exemplo 4.13 (algoritmo de Euclides). Seja b ≥ 1 inteiro. Para todo inteiro


n ≥ 1 existem q, r ∈ Z tais que n = bq + r para 0 ≤ r < n.
Demonstração. (1) Se n < b tome q = 0 e r = n. Se n = b tome
q = 1 e r = 0.
(2) Suponhamos que n > b. Então 1 ≤ n − b < n. Por hipótese de indução,
para todo 1 ≤ m < n existem qm , rm ∈ Z tais que m = bqm + rm , onde
0 ≤ rm < n. Em particular, existem q 0 , r0 ∈ Z tais que n − b = q 0 b + r0
onde 0 ≤ r0 < b. Logo n = (q 0 + 1)b + r0 e basta tomar q = q 0 + 1 e r = r0 .

CAPı́TULO 5

Números primos

No capı́tulo anterior provamos que o conjunto dos números primos é infi-


nito. Daremos 3 outras demonstrações para este fato. Cada qual tem seu mérito
próprio. A prova apresentada no capı́tulo sobre indução finita é a original de
Euclides. Provaremos também que existe uma infinidade de números primos em
certas progressões aritméticas e que funções polinomiais não lineares produzem
uma infinidade de números compostos.

5.1. Infinidade de primos


Seja P o conjunto dos números primos.

Teorema 5.2 (Euclides). O conjunto P é infinito.

2a. Demonstração. Suponhamos que P seja finito, digamos P = {p1 , · · · ,


pk }. Seja n ≥ 1 inteiro. Pelo Lema 3.13, n = mQ2 , com m, Q ≥ 1 inteiros e m
livre de quadrados. Por um lado a quantidade de números inteiros positivos até
n é exatamente n. Por outro, m = pe11 · · · pekk , onde ei ∈ {0, 1}, para 1 ≤ i ≤ k.
Assim, escolher m é equivalente a escolher os expoentes ei , e como tenho duas
escolhas para cada i, o número de escolhas possı́veis para m é no máximo 2k .

Observemos também que Q ≤ n, logo o número de escolhas para Q é no
√ √
máximo n, portanto, o número de escolhas para n é no máximo 2k n, i.e.,
√ √
n ≤ 2k n, i.e., n ≤ 2k , i.e., n ≤ 22k . Mas k é fixo, é a cardinalidade do
conjunto de números primos, e n é um inteiro qualquer, i.e., estamos mostrando
que o conjunto dos inteiros positivos é limitado, o que é impossı́vel. Portanto, P
é infinito. 
n
3a. Demonstração. Seja F (n) := 22 + 1 o n-ésimo número de Fermat.
Mostramos anteriormente (exercı́cio do capı́tulo sobre algoritmo de Euclides) que
se n > m ≥ 1, então mdc(F (n), F (m)) = 1. Começamos escolhendo um fator
primo q1 de F (1). Pelo resultado anterior, todo fator primo de F (2) é distinto de
q1 , escolhemos um destes fatores primos, digamos q2 . Suponhamos que para todo
27
28 5. NÚMEROS PRIMOS

1 ≤ m < n tenhamos escolhido para cada F (m) um fator primo distinto. Nova-
mente pelo resultado anterior todo fator primo de F (n) é distinto de q1 , · · · , qn−1 ,
escolhemos um destes fatores primos, digamos qn . Provamos assim (via a Indução
na sua segunda forma) que para todo n ≥ 1 temos um número primo qn fator
de F (n) distinto de q1 , · · · , qn−1 . Produzimos assim um subconjunto infinito
{q1 , · · · , qn , · · · } ⊂ P de P. Em particular, P é infinito. 
Uma quarta demonstração é conseqüência do seguinte teorema.
Teorema 5.3 (*). A série
X1

p∈P
p
diverge.
Para a noção de divergência de série veja [?, Capı́tulo IV].
Demonstração. Sejam n ≥ 1 inteiro e p1 , · · · , pl(n) os números primos me-
nores ou iguais a n. Seja
l(n)
Y 1
λ(n) := .
i=1
1 − p i

Segue das Preliminares que


1 X 1
= ,
1 − pi a ≥0 pai i
i

logo
X 1
λ(n) = al(n) ,
pa1
(a1 ,··· ,al(n) ) 1
. . . pl(n)
onde a l(n)-upla (a1 , · · · , al(n) ) é formada de inteiros não negativos. Em particu-
lar, como
1 1
1 + + . . . + < λ(n),
2 n
concluimos que λ(n) → ∞ quando n → ∞ (ver [?, Capı́tulo IV, Exemplos 23]).
Em particular, P é um conjunto infinito.
Calculando o logartimo de λ(n) (ver Preliminares) obtemos
l(n) l(n)
X X X 1
log(λ(n)) = − log(1 − pi ) =
i=1 i=1 m≥1
mpmi

l(n)
1 1 XX 1
= + ... + + .
p1 pl(n) i=1 m≥2 mpm
i
5.4. PRIMOS EM PROGRESSÕES ARITMÉTICAS 29

Note que
X 1 X 1 1 1 2
m
< m
= 2 −1 ≤ 2 .
m≥2
mpi p
m≥2 i
pi 1 − pi pi
Logo, !
1 1 1 1
log(λ(n)) < + ... + +2 2
+ ... + 2 .
p1 pl(n) p1 pl(n)
Segue de [?, Capı́tulo IV, Exemplo 29] que n≥1 n−2 converge, a fortiori o mesmo
P

vale para i≥1 p−2 −1


P P
i . Dessa forma, se p∈P p convergisse, existiria uma cons-
M
tante M tal que log(λ(n)) < M , i.e., λ(n) < e , mas λ(n) → ∞, quando n → ∞.
Assim, p∈P p−1 não pode convergir.
P


5.4. Primos em progressões aritméticas


Nos próximos 3 parágrafos procuramos estudar fórmulas “simples” que “ca-
racterizem” os números primos. Na verdade procuramos funções f : N → N cuja
imagem contenha “muitos” números primos. Começaremos pela função linear,
digamos f (n) = an + b com a, b ≥ 1 inteiros. Note que f (N) é uma progressão
aritmética com primeiro elemento a + b e razão b.

Lema 5.5. Existem infinitos números primos da forma 4n + 3 com n ≥ 1


inteiro.

Demonstração. Seja p > 2 um número primo. Comecemos analisando os


possı́veis restos da divisão de p por 4. Pelo algoritmo da divisão existem q, r ∈ Z
tais que p = 4q + r com 0 ≤ r < 4. Como p é primo as únicas possibilidades para
r são 1 e 3.
Seja P4,3 o conjunto dos números primos maiores ou iguais a 7 da forma 4n+3.
Suponha que P4,3 seja infinito, digamos P4,3 = {p1 < · · · < pk }. Seja

M := 4p1 · · · pk + 3.

Observe que M deixa resto 3 na divisão por 4. Observe também que M >
4p1 · · · pk > 4pk > pk , logo (como pk é o maior número primo que deixa resto 3
na divisão por 4) M é composto. Pelo teorema fundamental da aritmética M
fatora-se em um produto de primos.
Note que se a, b ≥ 1 são inteiros que deixam resto 1 na divisão por 4, então o
mesmo ocorre para ab. De fato, se a = 4x + 1, b = 4y + 1, então

ab = 4(4xy + x + y) + 1.
30 5. NÚMEROS PRIMOS

Fica como exercı́cio verificar (utilizando a primeira forma da indução finita) que
o mesmo vale para um produto finito a1 · · · an de inteiros positivos cada qual
deixando resto 1 na divisão por 4.
Assim, não é possı́vel que todo fator de M deixe resto 1 na divisão por 4,
i.e., existe algum 1 ≤ i ≤ k tal que pi | M , i.e., M = pi αi para αi ≥ 1 inteiro.
Retornando à definição de M obtemos

pi (αi − 4p1 · · · pi−1 pi+1 · · · pk ) = 3.

No lado esquerdo temos um produto de um número inteiro positivo por outro cujo
produto também é um inteiro positivo, logo o número inteiro entre parentêses é
um inteiro positivo. Como p1 ≥ 7, o lado esquerdo é pelo menos 7, o que é
impossı́vel. Portanto P4,3 é infinito. 

Lema 5.6. Existem infinitos números primos da forma 6n + 5 com n ≥ 1


inteiro.

Demonstração. Seja p > 2 um número primo. Pelo algoritmo da divisão


existem q, r ∈ Z tais que p = 6q + r com 0 ≤ r < 6. Como p é primo, r só pode
ser 1 ou 5.
Seja P6,5 o conjunto dos números primos maiores ou iguais a 11 da forma 6n+5
para n ≥ 1 inteiro. Suponha que P6,5 seja finito, digamos P6,5 = {p1 < · · · < pk }.
Seja
M := 6p1 · · · pk + 5.
Note que M deixa resto 5 na divisão por 6. Note também que M > 6p1 · · · pk >
6pk > pk . Como pk é o maior número primo que deixa resto 5 na divisão por 6
obtemos que M é composto.
Observe que se a, b ≥ 1 são inteiros que deixam resto 1 na divisão por 6, então
o mesmo ocorre com ab. De fato, se a = 6x + 1, b = 6y + 1, então

ab = 6(6xy + x + y) + 1.

Fica como exercı́cio mostrar que o mesmo vale para um produto finito a1 · · · an
de inteiros positivos cada qual deixando resto 1 na divisão por 6.
Assim não é possı́vel que todo fator de M deixe resto 1 na divisão por 6, i.e.,
existe 1 ≤ i ≤ k tal que pi | M , M = pi αi para αi ≥ 1 inteiro. Retornando à
definição de M obtemos

pi (αi − 6p1 · · · pi−1 pi+1 · · · pk ) = 5.


5.7. INFINIDADE DE COMPOSTOS POR FUNÇÕES POLINOMIAIS 31

No lado esquerdo temos um produto de um número inteiro positivo por outro cujo
produto também é um inteiro positivo, logo o número inteiro entre parentêses é
um inteiro positivo. Como p1 ≥ 11, o lado esquerdo é pelo menos 11, o que é
impossı́vel. Portanto P6,5 é infinito. 

No parágrafo sobre função zeta a seguir enunciaremos um teorema devido a


Dirichlet que generaliza os dois lemas anteriores.

5.7. Infinidade de compostos por funções polinomiais


Queremos agora analisar o que ocorre se a função considerada anteriormente
for polinomial. Veremos que em geral o fenômeno se contrapõe ao caso linear, ou
seja, é possı́vel apenas garantir uma infinidade de números compostos na imagem
de f .

Teorema 5.8. Seja

f (n) := ad n+ ad−1 nd−1 + . . . + a1 n + a0 ,

onde ad , · · · , a0 ∈ Z com ad > 0. Então existem infinitos números compostos da


forma f (n).

Demonstração. Se para todo n ≥ 1, f (n) for composto nada há a fazer.


Caso contrário, seja n0 ∈ N tal que f (n0 ) = p número primo. Seja h ≥ 1 inteiro
e

f (n0 + hp) = ad (n0 + hp)d + ad−1 (n0 + hp)d−1 + . . . + a1 (n0 + hp) + a0 .

Note que a soma dos termos constantes (considerando a expressão acima como
um polinômio em h) é igual a

ad nd0 + ad−1 n0d−1 + . . . + a1 n0 + a0 = p.

Logo,

f (n0 + hp) = p(1 + a1 h + a2 (2n0 h + h2 p) + . . .


+ ad−1 ((d − 1)nd−2
0 h + . . . + (d − 1)n0 h
d−2 d−3
p + hd−1 pd−2 )
+ ad (dnd−1
0 h + . . . + dn0 h
d−1 d−2
p + hd pd−1 )).

Observe que o termo lı́der da expressão acima como polinômio em h é igual a


ad pd−1 p > 0. Assim para um inteiro h ≥ 1 suficiente grande a expressão entre
parênteses do lado direito menos 1 é sempre positiva, portanto f (n0 + hp) =
32 5. NÚMEROS PRIMOS

p(1 + α) com α ≥ 1 inteiro. Em particular, f (n0 + hp) é sempre composto para


todo h ≥ 1 suficientemente grande.
Para o caso d = 2 a cota para h é h > −(2an0 + b)/(ap) (faça a conta neste
caso!). 

5.9. Números de Fermat e Mersenne


Nesta seção apresentamos os números de Fermat e Mersenne e começamos a
discussão de quando podem ser números primos. No capı́tulo subseqüente sobre
aplicações da teoria de grupos à aritmética elementar descreveremos de forma
mais precisa critérios para decidir quando estes números são primos.
n
Para todo n ≥ 1 inteiro seja F (n) := 22 + 1 o n-ésimo número de Fermat.
Fermat afirmava que todo número desta forma era primo. Na verdade o que deve
ter ocorrido é que ele calculou os quatro primeiros que realmente são. Entretanto,
Euler mostrou que 641 | F (5). Daremos uma demonstração disto posteriormente.
Para todo n ≥ 1 inteiro seja M (n) := 2n − 1 o n-ésimo número de Mersenne.

Lema 5.10. Se n é composto, então M (n) também é composto.

Demonstração. Suponha que n = ab com 1 < a, b < n. Então

2n − 1 = (2a )b − 1 = (2a − 1)(2a(b−1) + 2a(b−2) + . . . + 2a + 1)

o que mostra que M (a) | M (n). 

Observação 5.11. Se quisermos que um número de Mersenne seja primo,


devemos nos restringir àqueles números de Mersenne cujo ı́ndice n seja um número
primo. Mersenne produziu uma lista incompleta e incorreta de M (p)’s para p
primo tais que M (p) é primo. Novamente, produziremos a posteriori uma lista
ocrreta, a menos da complexidade computacional, utilizando teoria de grupos.

5.12. Contando números primos


Para todo número real x > 1 seja π(x) := #{p | número primo com p ≤ x}.
O teorema de Euclides nos garante que limx→∞ π(x) = ∞ (para a noção de limite
veja [?, capı́tulo IV]). Nosso objetivo é determinar uma estimativa elementar para
a função π(x) que conta a quantidade de números primos menores ou iguais a
um dado número real maior que 1. Note que se 1 < x ≤ y, então π(x) ≤ π(y).
Seja pn o n-ésimo número primo. Então π(pn ) = n.
5.12. CONTANDO NÚMEROS PRIMOS 33

Proposição 5.13. Seja log(x) o logaritmo na base e. Então

π(x) ≥ log(log(x)).

Demonstração. Já obtivemos anteriormente (via indução finita) que pn ≤


2n m
2 . Para todo x > 1 real fixado o conjunto {m ≥ 1 | inteiro, ee ≤ x} é finito.
n−1 n
Seja n − 1 seu maior elemento, i.e., ee ≤ x < ee . Observe que
n−1 n
ee ≥ 22 para n ≥ 4.

De fato, basta mostrar que

en−1 ≥ 2n log(2), ou seja , n − 1 ≥ n log(2) + log(log(2)),

o que é verdade pois log(2) < 1. Logo


n−1 n
π(x) ≥ π(ee ) ≥ π(22 ) ≥ π(pn ) = n ≥ log(log(x)).

Utilizaremos o método da segunda demonstração do teorema de Euclides para


refinar à proposição anterior. Para todo inteiro n ≥ 1 seja γ(n) o conjunto dos
divisores primos de n.

Proposição 5.14. Suponha que x ≥ 2 seja um inteiro, então :


log(x)
π(x) ≥ .
2 log(2)
Demonstração. Para qualquer conjunto de números primos S denotamos
por fS (x) o número de inteiros positivos n ≤ x tais que γ(n) ⊂ S. Suponha que
S seja finito de cardinalidade t. Escrevemos n = m2 s com s livre de quadrados.

Note que m ≤ x. Além disto temos no máximo 2t escolhas para s. Portanto,

fS (x) ≤ 2t x. Seja m := π(x), assim pm+1 > x. Se S = {p1 , · · · , pm }, então

fS (x) = dxe. Em particular, x ≤ 2π(x) x e disto segue a proposição. 

O método acima nos dá uma nova demonstração do teorema 5.3. De fato, se
P
p∈P 1/p fosse convergente, então existiria n ≥ 1 tal que
X 1 1
< .
p
j>n j
2

Seja S := {p1 , · · · , pn } e x ≥ 1 inteiro. Então x − fS (x) é igual ao número de


inteiros positivos m ≤ x tais que γ(m) 6⊂ S. Em outras palavras, contamos o
34 5. NÚMEROS PRIMOS

número de inteiros 1 ≤ m ≤ x para os quais existe j > n tal que pj | m. Para


cada primo pj existem dx/pj e múltiplos de pj menores ou iguais a x. Portanto,
X x  X x x
x − fS (x) ≤ ≤ < .
j>n
pj p
j>n j
2
√ √
A fortiori, fS (x) ≥ x/2. Mas, fS (x) ≤ 2n x. Logo, 2n ≥ x/2, o que é
impossı́vel pois n é fixo e x é variável.
Intimamente relacionada à função π(x) temos a seguinte função
X
θ(x) := log(p).
p∈P,p≤x

Utilizaremos θ(x) para limitar π(x). Seja θ(1) := 0.

Proposição 5.15.
θ(x) < (4 log(2))x.

Demonstração. Considere o binomial


 
2n (n + 1) . . . 2n
= .
n 1.2 . . . n
Este número é um inteiro divisı́vel por todo número primo n < p < 2n. Além
disto, como
2n    
2n
X 2n 2n 2n
(1 + 1) = , então 2 > .
j=0
j n
Em conseqüência,  
2n 2n Y
2 > > p.
n n<p<2n

Calculando o logartimo,
X
2n log(2) > log(p) = θ(2n) − θ(n).
n<p<2n

Somando esta relação para n = 1, 2, 4, · · · , 2m−1 obtemos

θ(2m ) < log(2)(2m+1 − 2) < log(2)2m+1 .

Como na demonstração da proposição 5.13 existe m ≥ 1 tal que 2m−1 < x ≤ 2m ,


donde
θ(x) ≤ θ(2m ) < log(2)2m+1 = (4 log(2))2m−1 < (4 log(2))x.

5.12. CONTANDO NÚMEROS PRIMOS 35

Proposição 5.16. Existe um real c1 > 0 tal que para todo x ≥ 2 real tenha-
mos :
x
π1 (x) < c1 .
log(x)
Demonstração. Observe que
X √ √ √ √ √
θ(x) ≥ log(p) ≥ log( x)(π(x) − π( x)) ≥ log( x)π(x) − x log( x).

x<p≤x

Logo,
2θ(x) √ x √
π(x) ≤ + x ≤ (8 log(2)) + x,
log(x) log(x)
onde a última desigualdade segue da proposição anterior. O resultado segue da

observação que x < 2x/ log(x) para x ≥ 2. 

Corolário 5.17.
π(x)
lim = 0.
x→∞ x

Nosso objetivo agora é obter uma cota inferior para a função π(x). Para isto
comecemos observando que
       
2n n+1 n+2 n+n
= · · ... · .
n 1 2 n
Por um exercı́cio deste capı́tulo temos
    X tp    
2n (2n)! 2n n
ordp = ordp 2
= j
−2 j ,
n (n!) j=1
p p

onde tp denota o maior inteiro tal que ptp ≤ 2n. Logo, tp = dlog(2n)/ log(p)e.
Além disto, d2xe − 2dxe é sempre 0 ou 1, assim
 
2n log(2n)
ordp ≤ .
n log(p)
Proposição 5.18 (*). Existe real c2 > 0 tal que para todo real x ≥ 2 tenha-
mos
x
π(x) > c2 .
log(x)
Demonstração. Pelo que foi feito anteriormente,
 
n 2n Y
2 ≤ ≤ ptp .
n p<2n
36 5. NÚMEROS PRIMOS

Calculando o logaritmo obtemos,


X X  log(2n) 
n log(2) ≤ tp log(p) = log(p).
p<2n p<2n
log(p)

Se log(p) > (1/2) log(2n), i.e., p > 2n, então dlog(2n)/ log(p)e = 1. Assim,
X  log(2n)  X √
n log(2) ≤ log(p) + log(p) ≤ 2n log(2n) + θ(2n)
√ log(p) √
p≤ 2n 2n<p<2n
√ √
Portanto, θ(2n) ≥ n log(2) − 2n log(2n). Mas, limn→∞ ( 2n log(2n))/n = 0.
Assim, existe uma constante real T > 0 tal que para n suficientemente grande
θ(2n) > T n (observe que T não depende de n). Tomando x suficientemente
grande e tal que 2n ≤ x < 2n + 1 obtemos
x−1
θ(x) ≥ θ(2n) > T n > T > Cx,
2
para algum real C > 0 conveniente (independente de x). Portanto, existe real
c2 > 0 tal que θ(x) > c2 x para todo x ≥ 2, onde c2 no depende de x. Para
completar a prova observamos que
X
θ(x) = log(p) ≤ π(x) log(x).
p≤x

Portanto,
θ(x) x
π(x) ≥ > c2 .
log(x) log(x)


5.18.1. Comentários. As duas proposições anteriores são devidas a C̆ebychef


(1852). O seguinte teorema suplanta ambas (cf. [?, chapter 4], este resultado de-
pende de teoria analı́tica dos números).

Teorema 5.19 (teorema dos números primos).


π(x)
lim = 1.
x→∞ x/ log x
O teorema dos números primos foi conjecturado por Gauss na idade de 15
ou 16 anos. A prova correta surgiu apenas em 1896 por Hadamard e de la Vallé
Poussin utilizando a função zeta de Riemann, que introduziremos no parágrafo
seguinte.
Existem uma infinidade de problemas abertos sobre os números primos. Para
mencionar apenas dois :
5.20. FUNÇÃO ZETA 37

• Existem infinitos números primos da forma n2 + 1?


• (Primos gêmeos) Existem infinitos pares de números primos da forma
(p, p + 2)?
Para mais problemas abertos veja [?] e [?].

5.20. Função zeta


Nesta seção descreveremos sem prova diversos fatos a respeito da função zeta
de Riemann (para a prova destes fatos ver [?, chapter 16]). Esta função é definida
por
X
ζ(s) := n−s , onde s ∈ C, <(s) > 1.
n≥1

Esta série converge em <(s) > 1 e converge uniformemente para <(s) ≥ 1 + δ


para todo δ > 0 (para a noção de convergência ver [?, cap’ıtulo IV]). A primeira
propriedade é que ela admite uma expansão em produto euleriano.

Proposição 5.21. Para <(s) > 1 temos


Y 1
ζ(s) = .
p∈P
1 − p−s

Particularmente importante é o comportamento assintótico desta função quan-


P
do s → 1. Considerando que n≥1 1/n diverge suspeitamos que ζ(s) → ∞
quando s → 1. Lembre que ζ(s) é uma função de uma variável complexa.

Proposição 5.22. Suponha que <(s) > 1. Então

lim(s − 1)ζ(s) = 1.
s→1

A proposição na verdade diz que ζ(s) é uma função meromorfa com um pólo
simples em s = 1 (para mais detalhes ver [?, chapter 12]).

Corolário 5.23. Quando s → 1 temos


log(s)
→ 1.
(log(s − 1))−1
Proposição 5.24.
X 1
ζ(s) = + R(s),
p∈P
ps
onde R(s) fica limitada quando s → 1.
38 5. NÚMEROS PRIMOS

Dado um subconjunto S do conjunto dos números primos P, dizemos que S


tem densidade de Dirichlet se o limite
−s
P
p∈S p
lim
s→1 (log(s − 1))−1

existe. Neste caso este limite é denotado por d(S) e é chamado a densidade de
Dirichlet de S. Esta densidade satisfaz as seguintes propriedades.

Proposição 5.25. Seja S um subconjunto do conjunto P dos números pri-


mos. Então
(1) Se S é finito, então d(S) = 0.
(2) Se S contém todos os números primos, exceto um número finito deles,
então d(S) = 1.
(3) Se S = S1 ∪ S2 com S1 ∩ S2 = ∅, então d(S1 ∪ S2 ) = d(S1 ) + d(S2 ).

Teorema 5.26 (teorema das progressões aritméticas de Dirichlet). Sejam


a ∈ Z e m ≥ 1 inteiro tais que mdc(a, m) = 1. Seja P(a; m) o subconjunto do
conjunto P dos números primos que contém os primos p tais que p ≡ a (mod m).
Então d(P(a; m)) = 1/φ(m). A fortiori, P(a; m) é infinito.

5.26.1. Comentários (*). Riemann propôs a seguinte conjectura (que per-


manece em aberto até hoje).

Conjectura 5.27 (hipótese de Riemann). Todos os zeros da função zeta de


Riemann ζ(s) estão contidos na reta <(s) = 1/2.

Sabe-se que na reta <(s) = 1/2 existe uma infinidade de zeros da função zeta
e que estes são simétricos em relação à reta =(s) = 0. A veracidade da hipótese
de Riemann implica em maiores informações sobre a distribuição dos números
primos (para mais sobre isto ver [?, chapter13]).
O inteiro positivo n nada mais é que a cardinalidade do anel Z/nZ da arit-
mética modular (a ser introducido no próximo capı́tulo). Esta analogia faz com
que Dedekind considere a seguinte extensão da função zeta. Seja K uma extensão
finita do corpo dos racionais Q (ver a parte referente à teoria de corpos). Existe
um subconjunto OK de K que cumpre o mesmo papel de Z com relação a Q. Este
conjunto é chamado o anel de inteiros de K. Ele tem (entre outras propriedades
importantes) a caracterı́stica que o anel quociente OK /I (onde I é um ideal de
OK , para mais sobre anel quocientes ver a parte de anéis) é um conjunto finito
5.20. FUNÇÃO ZETA 39

cuja cardinalidade é denotada por N (I). Assim, Dedekind define a função zeta
de K por
X
ζK (s) := N (I)−s , onde <(s) > 1,
I

e I percorre todos os ideais de OK . Novamente conjectura-se que os zeros desta


função estão na reta <(s) = 1/2, o que permanece em aberto. Note que ζQ nada
mais é que a função zeta de Riemann.
Nos anos 20 e 30 do século XX, E. Artin, H. Hasse e A. Weil consideraram um
análogo “geométrico” desta situação. Nele o papel de Q era ocupado pelo corpo de
funções racionais em uma variável Fq (τ ) sobre um corpo finito Fq de q elementos
(ver parte de corpos). Neste contexto, L é uma extensão finita de Fq (τ ). O corpo
L possui também um subanel com propriedades similares a OK (quando K é uma
extensão finita de Q). Isto permite a construção de uma função zeta associada a
L. Similarmente, pode-se formular como acima uma “hipótese de Riemann” para
L. Esta é chamada uma “hipótese de Riemann para curvas” porque L nada mais
é que o corpo de funções racionais de uma curva sobre um corpo finito (para mais
sobre curvas sobre corpos finitos e a hipótese de Riemann neste contexto ver [?]).
Após casos particulares da hipótese de Riemann para curvas terem sido tratados
por Artin e Hasse, Weil utilizando variedades abelianas e representações `-ádicas
obtém em 1948 a prova da “hipótese de Riemann para curvas” de forma geral.
No ano seguinte (1949) Weil propõe uma vasta generalização deste resultado
substituindo Fq (τ ) por um corpo de funções κ em n variáveis sobre Fq . Neste caso
a extensão finita L de κ nada mais é que o corpo de funções de uma variedade
algébrica sobre Fq (para variedades algébricas ver [?]). De maneira visionária Weil
percebe que uma prova da hipótese de Riemann neste contexto mais geral seria
conseqüência de uma teoria de cohomologia suficientemente “rica” para reprodu-
zir as propriedades da cohomologia singular sobre os complexos. Segundo muitos,
as conjecturas de Weil foram sem sobra de dúvida o problema matemático mais
profundo após a segunda guerra mundial. Na busca da cohomologia perdida, os
primeiros passos foram dados por J.-P. Serre introduzindo a cohomologia de feixes
de vetores de Witt. Mas foi A. Grothendieck que compreendeu que a função zeta
traz em si algo de novo que não havia sido percebido pelos gêometras algébricos,
desde de os italianos do século XIX. Ela necessitava de uma base variável, ou
seja, a variedade algébrica era considerada simultaneamente sobre todos os cor-
pos finitos Fqn . Para isto introduziu o conceito que revoluciona completamente
a geometria algébrica no século XX, a teoria de esquemas. Com a contribuição
40 5. NÚMEROS PRIMOS

de inúmeros matemáticos além de Serre e Grothendieck, dentre eles M. Artin,


J.-L. Verdier e L. Illusie, as teoria de esquemas e de cohomologia evoluiram, per-
mitindo que se descobrisse que a “cohomologia apropriada”, a cohomologia étale
(para mais sobre a cohomologia étale veja [?]), e que finalmente em 1973, um
ex-aluno de Grothendieck, P. Deligne provasse finalmente as conjecturas de Weil
(para os resultados de Deligne veja [?] e [?]). Entretanto, o mestre não ficou
satisfeito. Na verdade Grothendieck havia formulado um programa muito mais
amplo, “as conjecturas standard”, das quais as conjecturas de Weil eram um
corolário. Infelizmente, este programa nunca foi atingido.
CAPı́TULO 6

Aritmética modular

6.1. Aritmética modular


Definimos uma função soma de classes ⊕ : Z/nZ×Z/nZ → Z/nZ por a⊕b :=
a + b.

Lema 6.2. Esta função está bem definida, i.e., se a0 ≡ a (mod n) e b0 ≡ a


(mod n), então a0 + b0 = a + b.

Demonstração. Suponha a0 ≡ a (mod n) e b0 ≡ b (mod n), i.e., existem


k, l ∈ Z tais que a0 − a = kn e b0 − b = ln. Somando estas igualdades, (a0 + b0 ) −
(a + b) = (k + l)n, i.e., a0 + b0 ≡ a + b (mod n), i.e., a0 + b0 = a + b. 
Definimos também um função produto de classes : Z/nZ × Z/nZ → Z/nZ
por a b := ab.

Lema 6.3. Esta função também está bem definida, i.e., se a0 ≡ a (mod n) e
b0 ≡ b (mod n), então a0 b0 = ab.

Demonstração. Sejam k, l ∈ Z tais que a0 − a = kn e b0 − b = ln. Logo


a0 b0 − ab = a0 b0 − a0 b + a0 b − ab = a0 (b0 − b) + b(a0 − a) = (a0 l + bk)n, i.e., a0 b0 ≡ ab
(mod n), i.e., a0 b0 = ab. 

Proposição 6.4. O conjunto Z/nZ munido das operações ⊕ e é um anel


comutativo com unidade.

Demonstração. Precisamos provar que as 8 propriedades de 2.11 são sa-


tisfeitas. Elas são herdadas das mesmas propriedades para inteiros como segue
abaixo.
(1) a⊕(b⊕c) = a⊕b + c = a + (b + c) = (a + b) + c = a + b⊕c = (a⊕b)⊕c.
(2) a ⊕ b = a + b = b + a = b ⊕ a.
(3) Note que 0 = n = {kn | k ∈ Z} = nZ é o conjunto dos inteiros que são
múltiplos de n. Observe que a ⊕ 0 = a + 0 = a.
(4) a ⊕ n − a = a + n − a = n = 0.
41
42 6. ARITMÉTICA MODULAR

(5) a (b c) = a bc = a(bc) = (ab)c = ab c = (a b) c.


(6) a b = ab = ba = b a.
(7) a 1 = a.1 = a.
(8) a (b ⊕ c) = a b + c = a(b + c) = ab + ac = ab ⊕ ac = (a b) ⊕ (a c).


A propriedade de cancelamento em um anel garante que este é um domı́nio


de integridade. Nem sempre Z/nZ é um domı́nio de integridade. Para simplificar
a notação escreveremos + no lugar de ⊕ e ab no lugar de a b.

Proposição 6.5. Z/nZ é um domı́nio de integridade se e somente se n = p


é um número primo.

Demonstração. Suponha que Z/nZ seja um domı́nio de integridade. Supo-


nha que n = ab com 1 ≤ a, b ≤ n. Então n = 0 = ab = ab. Pela propriedade
do cancelamento, a = 0 ou b = 0. No primeiro caso existe α ≥ 1 inteiro tal que
a = nα, logo n = nαb, i.e., 1 = αb, i.e., b = 1 e a = n. No segundo caso existe
β ≥ 1 inteiro tal que b = nβ, logo n = anβ, i.e., 1 = aβ, i.e., a = 1 e b = n.
Portanto, n é primo.
Suponha que n = p seja primo. Suponha ab = 0, i.e., ab = 0, i.e., p | ab.
Pelo Lema 3.5, p | a ou p | b, i.e., a = 0 ou b = 0, i.e., vale a propriedade de
cancelamento. 

Um elemento a ∈ Z/nZ é dito inversı́vel, se existe b ∈ Z/nZ tal que ab =


1. Denotamos por (Z/nZ)∗ o subconjunto de Z/nZ formado pelos elementos
inversı́veis. Um domı́nio de integridade D é dito um corpo, se para todo a ∈
D \ {0} existe b ∈ D tal que ab = 1. Assim, Z/nZ é um corpo se e somente se
(Z/nZ)∗ = Z/nZ \ {0}.

Proposição 6.6. Z/nZ é um corpo se e somente se n = p é um número


primo.

Demonstração. Suponha que Z/nZ seja um corpo. Seja n = ab com 1 ≤


a, b ≤ n inteiros. Suponha que a < n. Neste caso, a 6= 0. Por hipótese, existe
c ∈ Z/nZ tal que ac = 1. Note que n = 0 = ab = ab. Multiplicando esta
igualdade por c dos dois lados obtemos 0 = b, i.e., b = n. Neste caso a = 1. Se
a = n, então necessariamente b = 1 e portanto n é primo.
6.9. CRITÉRIOS DE DIVISIBILIDADE 43

Reciprocamente, suponha que n = p seja primo. Seja a ∈ Z/nZ \ {0}, i.e.,


p - a. Logo mdc(a, p) = 1. Pelo algoritmo euclideano estendido, existem r, s ∈ Z
tais que ra+sp = 1, i.e., ra ≡ 1 (mod p), i.e., ra = ra = 1, i.e., a ∈ (Z/nZ)∗ . 

A princı́pio Z/nZ é o conjunto de todas as classes a para a ∈ Z. Definido


desta forma Z/nZ poderia ser infinito. Isto não ocorre.

Proposição 6.7. Z/nZ = {0, · · · , n − 1} e #Z/nZ = n.

Demonstração. Por definição o conjunto do lado direito está contido no


conjunto do lado esquerdo. O que temos que provar é a inclusão oposta. Suponha
que a ∈ Z/nZ. Note que podemos sempre supor que a ≥ 0, basta tomar um
múltiplo kn de n suficientemente grande tal que a0 = a + kn ≥ 0, uma vez que
a = a0 . Pelo algoritmo da divisão, existem q, r ∈ Z tais que a = qn + r com
0 ≤ r < n, i.e., a ≡ r (mod n), i.e., a = r ∈ {0, · · · , n − 1}.
Mostraremos agora que quaisquer duas classes no conjunto da direita são
distintas. Sejam 0 ≤ a < b < n inteiros. Logo 0 ≤ b − a < b < n, i.e., b 6≡ a
(mod n), i.e., b 6= a. 

O conjunto (Z/nZ)∗ dos inversı́veis em Z/nZ pode ser caracterizado também


da seguinte forma.

Proposição 6.8. (Z/nZ)∗ = {a ∈ Z/nZ | mdc(a, n) = 1}.

Demonstração. Seja a ∈ (Z/nZ)∗ , i.e., existe b ∈ Z/nZ tal que ab = ab =


1, i.e., existe k ∈ Z tal que ab − kn = 1. Seja d = mdc(a, n) ≥ 1. Logo d | 1, mas
isto só é possı́vel se d = 1.
Seja a ∈ Z/nZ tal que mdc(a, n) = 1. Pelo algoritmo euclideano estendido,
existem r, s ∈ Z tais que ra + sn = 1, i.e., ra ≡ 1 (mod n), i.e., ra = r a = 1,
i.e., a ∈ (Z/nZ)∗ . 

6.9. Critérios de divisibilidade


Utilizaremos a aritmética modular para demonstrar critérios de divisibilidade.

6.9.1. Expansão de um inteiro em uma dada base. Sejam a ≥ 0 e


b ≥ 1 inteiros. Seja n ≥ 1 inteiro tal que bn seja a maior potência positiva de b
menor ou igual a a, i.e.,
bn ≤ a < bn+1 .
44 6. ARITMÉTICA MODULAR

Pelo algoritmo da divisão existem qn , rn ∈ Z tais que

a = qn bn + rn , onde 0 ≤ rn < bn .

Observemos que
0 ≤ qn < b.
A primeira desigualdade é clara, porque qn bn é o maior múltiplo positivo de bn
que é menor ou igual a a. Suponha que qn ≥ b. Logo

a ≥ bn+1 + rn ≥ bn+1 ,

o que não é possı́vel. Em seguida, dividimos rn por q n−1 , i.e., existem qn−1 , rn−1 ∈
Z tais que
rn = qn−1 bn−1 + rn−1 , onde 0 ≤ rn−1 < bn−1 .
Novamente,
0 ≤ qn−1 < b.
Não precisamos repetir o argumento da primeira desigualdade, pois é o mesmo.
Para a segunda, se qn−1 ≥ b, terı́amos

rn ≥ bn + rn−1 ≥ bn ,

o que não é possı́vel. Substituindo na primeira igualdade obtemos

a = qn bn + qn−1 bn−1 + rn−1 .

Novamente, pelo algoritmo da divisão existem qn−2 , rn−2 ∈ Z tais que

rn−1 = qn−2 bn−2 + rn−2 , onde0 ≤ rn−2 < bn−2 .

Se qn−2 ≥ b, então
rn−1 ≥ bn−1 + rn−2 ≥ bn−1 ,
o que é impossı́vel. Portanto, 0 ≤ qn−2 < b. Prosseguindo sucessivamente obte-
mos

(6.9.1) a = qn bn + qn−1 bn−1 + . . . + q1 b + q0 ,

onde 0 ≤ qi < b para todo 0 ≤ i ≤ n. A expressão (6.9.1) é chamada a expansão


de a na base b. Denotamos esta expansão por ab := (qn · · · q0 )b .
Seja a ≥ 0 inteiro e a = an .10n + . . . + a1 .10 + a0 sua expansão na base 10.
Os elementos an , · · · , a0 são chamados os algarismos de a e a := (an · · · a0 )10 .
6.13. CONTANDO ELEMENTOS INVERSÍVEIS 45
Pn
Exemplo 6.10. Um inteiro a ≥ 0 é divisı́vel por 3 se e somente se i=0 ai ≡ 0
(mod 3). De fato, 10 ≡ 1 (mod 3), pois 10 − 1 = 9 = 3.3. Logo para todo n ≥ 0,
10n ≡ 1n = 1 (mod 3). Portanto, a ≡ ni=0 ai (mod 3). Logo a ≡ 0 (mod 3) se
P

e somente se ni=0 ai ≡ 0 (mod 3).


P

Exemplo 6.11. Um inteiro a ≥ 0 é divisı́vel por 11 se e somente se ni=0 (−1)ai


P

≡ 0 (mod 11). De fato, 10 ≡ −1 (mod 11), pois 10 − (−1) = 11. Logo para todo
n ≥ 1, 10n ≡ (−1)n (mod 11) e portanto, a ≡ ni=0 (−1)ai (mod 11). Conse-
P

quentemente, a ≡ 0 (mod 11) se e somente se ni=0 (−1)ai ≡ 0 (mod 11).


P

Exemplo 6.12. O critério de divisibilidade por 7 é um pouco mais intrincado.


A razão é a seguinte: 10 ≡ 3 (mod 7), pois 10 − 3 = 7. Logo 102 ≡ 32 ≡ 2
(mod 7), pois 9 − 2 = 7; 103 ≡ 3.2 = 6 (mod 7); 104 ≡ 6.3 ≡ 4 (mod 7), pois
18 − 4 = 14 = 2.7; 105 ≡ 4.3 ≡ 5 (mod 7), pois 12 − 5 = 7; 106 ≡ 5.3 ≡ 1
(mod 7), pois 15 − 1 = 14 = 2.7. Suponha para simplificar que n = 5, i.e., a tem
apenas 6 algarismos. Aplicando o mesmo raciocı́nio acima obtemos que a ≡ 0
(mod 7) se e somente se 5a5 + 4a4 + 6a3 + 2a2 + 3a1 + a0 ≡ 0 (mod 7).

6.13. Contando elementos inversı́veis


No capı́tulo de fatoração de inteiros introduzimos a função φ de Euler. Pela
proposição 6.8 a definição dada anteriormente coincide com φ(n) := #(Z/nZ)∗ .
Nesta seção vamos calcular no caso em que n é primo ou potência de primo. No
capı́tulo seguinte, usando o teorema chinês dos restos, faremos o cálculo geral.

Lema 6.14. Seja p um número primo. Então


φ(p) = p − 1.

Demonstração. Provamos anteriormente que quando n = p é primo (Z/pZ)∗


= Z/pZ \ {0}, logo φ(p) = #(Z/pZ) − 1 = p − 1. 

Lema 6.15. Seja p um número primo e r ≥ 1 inteiro. Então


φ(pr ) = pr−1 (p − 1).

Demonstração. Pela proposição 6.8, a ∈ (Z/pr Z)∗ se e somente se mdc(a, pr )


= 1, i.e., p - a. Ao invés de contarmos estes elementos contaremos aqueles que
são divisı́veis por p e subtairemos do total pr este número. Expandimos a na base
p, i.e.,
a = qr−1 pr−1 + . . . + q1 p + q0 , onde 0 ≤ qi < p
46 6. ARITMÉTICA MODULAR

é inteiro para todo 0 ≤ i ≤ r − 1. Assim, p | a se e somente se q0 = 0. Para cada


qi com 1 ≤ i ≤ r − 1 temos exatamente p escolhas. Logo o total de escolhas para
a tal que p | a é pr−1 . Portanto, φ(pr ) = pr − pr−1 = pr−1 (p − 1). 
CAPı́TULO 7

Sistemas de congruência

7.1. Equações diofantinas


Uma equação diofantina é uma equação polinomial em um número finito de
variáveis cujos coeficientes são números inteiros e/ou racionais e procuramos solu-
ções inteiras e/ou racionais. Nesta seção daremos um exemplo de como utilizar
a aritmética modular para provar que uma dada equação diofantina não tem
soluções inteiras.

Exemplo 7.2. Seja f (x, y) = x3 − 711y 3 = 5. Perguntamos se existem pares


(a, b) ∈ Z × Z tais que f (a, b) = 0. Mostraremos que não pode existir um tal par
(a, b). De fato, suponha que exista. Logo a3 ≡ 5 (mod 9). Calculemos os cubos
3 3 3 3 2
de todos os elementos de Z/9Z. 1 = 1; 2 = 8, 3 = 0, 4 = 4 4 = 74 = 1;
3 3 3 3 3 3 3 3 3 3 3
5 = −4 = −4 = 8; 6 = −3 = −3 = 0; 7 = −2 = −2 = 1; 8 = −1 = 8.
Portanto, não existe a ∈ Z tal que a3 ≡ 5 (mod 9), logo não pode existir (a, b) ∈
Z × Z tal que f (a, b) = 0.

7.3. Equações lineares


Teorema 7.4. Sejam a, b ∈ Z, a 6= 0 e n ≥ 1 inteiro. A equação ax ≡ b
(mod n) tem solução se e somente se d := mdc(a, n) | b.

Demonstração. Suponha que x0 ∈ Z seja uma solução da equação. Como


d divide a e n, denotamos a = a0 d e n = n0 d, onde n0 , a0 ∈ Z. Logo existe k ∈ Z
tal que ax0 − b = kn, i.e., d(a0 x0 − kn0 ) = b, assim d | b.
Reciprocamente, suponha que d | b, digamos b = db0 . Pelo algoritmo euclide-
ano estendido, existem t, s ∈ Z tais que ta + sn = d. Multiplicando ambos os
lados por b0 obtemos a(tb0 ) + snb0 = db0 = b, i.e., a(tb0 ) ≡ b (mod n), i.e., tb0 é
uma solução da equação. 

Observação 7.5. Observe que se x0 ∈ Z é uma solução de ax ≡ b (mod n),


então para todo y0 ≡ x0 (mod n), concluimos que y0 também é solução da
equação (assim dizemos que a classe x0 de x0 é uma solução para ax = b).
47
48 7. SISTEMAS DE CONGRUÊNCIA

De fato, y0 = x0 + kn para algum k ∈ Z e ax0 = b + ln para algum l ∈ Z. Logo


ay0 = b + ln + akn = b + (l + ak)n, i.e., ay0 ≡ b (mod n).

Teorema 7.6. Suponha que a equação ax ≡ b (mod n) admita uma solução


x0 ∈ Z. O número de soluções (módulo n) de ax ≡ b (mod n) é d e elas são
dadas pelas classes cujos representantes são x0 , x0 + n0 , · · · , x0 + (d − 1)n0 .

Demonstração. Provemos inicialmente que cada um desses elementos é


solução. Escrevemos y0 = x0 + kn0 para algum 0 ≤ k ≤ d − 1 inteiro. Logo
ay0 = ax0 +akn0 = b+ln+akn0 = b+ln+a0 dkn0 = b+ln+a0 kn = b+n(l+a0 k), i.e.,
ay0 ≡ b (mod n). Em seguida observemos que se 0 ≤ k < r ≤ d − 1 são números
inteiros, então x0 + kn0 6≡ x0 + rn0 (mod n). De fato, 0 < (x0 + rn0 ) − (x0 + kn0 ) =
n0 (r − k) < n0 d = n, logo n - ((x0 + rn0 ) − (x0 + kn0 ) = n0 (r − k)). 

7.7. Sistemas de equações lineares


Teorema 7.8. Sejam m, n ≥ 1 inteiros tais que mdc(m, n) = 1 e a, b ∈ Z.
Existe x ∈ Z tal que o sistema
(
x ≡ a (mod m)
x ≡ b (mod n)
tenha solução.

Demonstração. Pelo algoritmo euclideano estendido existem t, s ∈ Z tais


que tm + sn = 1. Logo

tm ≡ 1 (mod n) e sn ≡ 1 (mod m).

Seja x0 := asn + btm. Observe que

x0 ≡ asn (mod m) ≡ a (mod m) e x0 ≡ btm (mod n) ≡ b (mod n).

Teorema 7.9. Sejam m1 , · · · , mr ≥ 1 inteiros tais que para todo 1 ≤ i 6=


j ≤ r, mdc(mi , mj ) = 1. Sejam a1 , · · · , ar ∈ Z. Existe x ∈ Z tal que o sistema


 x ≡ a1 (mod m1 )

(7.9.1) ···


 x ≡ a (mod m )
r r

tenha solução.
7.10. TEOREMA CHINÊS DOS RESTOS 49

Demonstração. Seja
m := m1 · · · mr
e para todo 1 ≤ i ≤ r, seja
m
ni := = m1 · · · mi−1 mi+1 · · · mr .
mi
Como para cada j 6= i, mdc(mj , mi ) = 1, temos que mdc(ni , mi ) = 1. Pelo
algoritmo euclideano estendido existem ti , si ∈ Z tais que ti ni + si mi = 1, i.e.,
ti ni ≡ 1 (mod mi )
e para todo j 6= i, como ni ≡ 0 (mod mj ), então
ti ni ≡ 0 (mod mj ).
Tome
x0 := a1 t1 n1 + . . . + ar tr nr .
De fato, para todo 1 ≤ i ≤ r, temos
x0 ≡ ai ti ni (mod mi ) ≡ ai (mod mi ),
uma vez que
aj tj nj ≡ 0 (mod mi ) para i 6= j.


7.10. Teorema Chinês dos Restos


Notação. Dado n ≥ 1 inteiro e a ∈ Z denotaremos nesta seção a classe de a
módulo n por a + nZ. Isto é motivado pelo fato que um elemento é equivalente
a a módulo n se e somente se ele difere de a por um múltiplo de n.

Teorema 7.11. Sejam m1 , · · · , mr ≥ 1 inteiros tais que para todo 1 ≤ i 6=


j ≤ r, mdc(mi , mj ) = 1. Seja m := m1 · · · mr . Existe uma bijeção
Z Z Z
ϕ: → × ... ×
mZ m1 Z mr Z
definida por
ϕ(a + mZ) = (a + m1 Z, · · · , a + mr Z).
Seja ψ a restrição de ϕ a (Z/mZ)∗ , então
 ∗  ∗  ∗
Z Z Z
ψ: → × ... ×
mZ m1 Z mr Z
também é uma bijeção.
50 7. SISTEMAS DE CONGRUÊNCIA

Demonstração. Provemos inicialmente que ϕ está bem definida. De fato,


se b ≡ a (mod m), então para todo 1 ≤ i ≤ r, mi | m | (b − a), logo b ≡ a
(mod mi ), i.e., b + mi Z = a + mi Z.
Provemos agora que ϕ é injetiva. Suponha que ϕ(a + mZ) = ϕ(b + mZ), i.e.,
para todo 1 ≤ i ≤ r, a ≡ b (mod mi ). Como para i 6= j, mdc(mi , mj ) = 1,
concluimos que m | (a − b), i.e., a + mZ = b + mZ.
Provar que ϕ é sobrejetiva equivale a dizer que para todo (a1 + m1 Z, · · · , ar +
mr Z) ∈ Z/m1 Z × . . . × Z/mr Z é da forma ϕ(x + mZ) para algum x ∈ Z, i.e., que
o sistema (7.9.1) tema solução, o que já foi provado.
Provemos agora que um elemento inversı́vel módulo m tem imagem cujas
componentes são inversı́veis com respeito aos respectivos módulos. Suponha que
a + mZ ∈ (Z/mZ)∗ , i.e., mdc(a, m) = 1. Como m = m1 · · · mr , concluimos que
para cada 1 ≤ i ≤ r, mdc(a, mi ) = 1, i.e., a + mi Z ∈ (Z/mi Z)∗ . Como ψ é
obtida restringindo ϕ a um subconjunto do domı́nio, concluimos que ψ também
é injetiva.
Quanto a sobrejetividade, seja (a1 + m1 Z, · · · , ar + mr Z) ∈ (Z/m1 Z)∗ × . . . ×
(Z/mr Z)∗ . Pela parte anterior sabemos que existe x ∈ Z tal que ϕ(x + mZ) =
(a1 + m1 Z, · · · , ar + mr Z). Observemos que na verdade x + mZ ∈ (Z/mZ)∗ . De
fato, para cada 1 ≤ i ≤ r, x + mi Z = ai + mi Z, i.e., x ≡ ai (mod mi ), mas
mdc(ai , mi ) = 1, logo mdc(x, mi ) = 1 para todo 1 ≤ i ≤ r. Como m = m1 · · · mr
e mdc(mi , mj ) = 1 para i 6= j obtemos que mdc(x, m) = 1, i.e., x + mZ ∈
(Z/mZ)∗ . 

Corolário 7.12. Para todo n ≥ 1 inteiro seja φ(n) = #(Z/nZ)∗ . Então

φ(m) = φ(m1 ) · · · φ(mr ).

7.13. Aplicação
Seja n = pe11 · · · perr a fatoração do inteiro n ≥ 1. Pelo corolário 7.12 e pelo
lema 6.15,

(7.13.1) φ(n) = φ(pe11 ) · · · φ(perr ) = pe11 −1 (p1 − 1) · · · perr −1 (pr − 1)


    Y 
e1 1 er 1 1
= p1 1 − · · · pr 1 − =n 1− .
p1 pr p
p|n

Vamos utilizar a fórmula (7.13.1) para uma aplicação.


7.13. APLICAÇÃO 51

Proposição 7.14. Suponha que φ(n) = p seja um número primo. Então


n = 3, 4 ou 6.

Demonstração. Se r > 2, então ei = 1 para todo 1 ≤ i ≤ r. Logo


φ(n) = ri=1 (pi − 1). Como r > 2 existem pelo menos dois primos ı́mpares
Q

na fatoração, logo 4 | φ(n), o que não é possı́vel. Logo r ≤ 2. Suponhamos


inicialmente r = 2, i.e., φ(n) = pe11 −1 (p1 − 1)pe22 −1 (p2 − 1). Se p1 , p2 > 2 então
(novamente) 4 | φ(n). Logo p1 = 2 e φ(n) = 2e1 −1 pe22 −1 (p2 − 1). Se e1 > 1, como
p2 > 2, então 4 | φ(n). Assim, e1 = 1 e φ(n) = pe22 −1 (p2 − 1). Se e2 > 1, então
φ(n) tem 2 e p2 como fatores primos. Assim, e2 = 1 e φ(n) = pe22 −1 . Novamente,
como este número é primo, e2 = 1 e φ(n) = p2 − 1. Mas este número é par e
primo, logo p2 = 3 e n = 6.
Suponhamos que r = 1, i.e., φ(n) = pe11 −1 (p1 − 1). Se p1 = 2, então φ(n) =
2e1 −1 . A única forma deste número ser primo é e1 = 2, logo n = 4. Suponha
p1 > 2. Se e1 > 1, então φ(n) tem 2 fatores primos p1 e 2 (pois p1 − 1 é par),
impossı́vel. Assim, e1 = 1 e φ(n) = p1 − 1. Isto já foi feito anteriormente, i.e.,
p1 = 3 e n = 3. 
CAPı́TULO 8

Aplicações da teoria de grupos à teoria elementar dos


números

Neste capı́tulo desenvolveremos aplicações da teoria de grupos à aritmética


elementar. Utilizaremos os resultados do capı́tulo 9.

8.1. Primalidade de números de Mersenne


Para todo inteiro n ≥ 1, seja Mn := 2n − 1 o n-ésimo número de Mersenne.
Nosso objetivo é utilizar a teoria de grupos para determinar se Mn é primo ou
obter seu menor fator primo. Já provamos anteriormente que se n é composto,
então Mn também o é. Assim, consideraremos apenas Mp para p primo.
Seja q um fator primo de Mp , i.e., 2p ≡ 1 (mod q). Portanto em (Z/qZ)∗
p
temos 2 = 1, i.e., o(2) | p. Como p é primo temos que o(2) = 1 ou p. O primeiro
caso não pode ocorrer, pois 2 6= 1. Logo o(2) = p. Pelo teorema de Lagrange,

o(2) = p | #(Z/qZ)∗ = φ(q) = q − 1,

i.e., existe k ≥ 1 inteiro tal que q = 1 + kp.

Proposição 8.2. Todo fator primo de Mp é da forma 1 + kp para algum


inteiro k ≥ 1.

Provamos anteriormente que o menor fator primo de um número inteiro n ≥ 1



é no máximo n. Logo
√ 2p/2 − 1
q≤ 2p − 1 < 2p/2 , i.e. , k < .
p
Dessa forma para determinar um fator primo de Mp testamos para cada inteiro
k tal que
2p/2 − 1
1≤k<
p
se 1 + kp é primo e se divide Mp . Se para cada k pelo menos um desses fatos não
ocorrer então Mp é um número primo.
53
54 8. APLICAÇÕES DA TEORIA DE GRUPOS

8.3. Primalidade de números de Fermat


n
Para todo inteiro n ≥ 1, seja Fn := 22 + 1 o n-ésimo número de Fermat. Seja
n n+1
q um fator primo de Fn . Então 22 ≡ −1 (mod q), logo 22 ≡ 1 (mod q), i.e.,
2n+1 ∗
2 = 1 em (Z/qZ) . Neste caso

o(2) | (2n+1 ), i.e. , o(2) = 2d para 1 ≤ d ≤ n + 1.

Afirmamos que d = n + 1. De fato, se d < n + 1, então


2n 2d n−d
2 = (2 )2 = 1,

o que é um absurdo, portanto o(2) = 2n+1 . Pelo teorema de Lagrange,

o(2) = 2n+1 | #(Z/qZ)∗ = φ(q) = q − 1,

i.e., existe k ≥ 1 tal que q = 1 + k2n+1 .

Proposição 8.4. Todo fator primo de Fn é da forma 1 + k2n+1 para algum


inteiro k ≥ 1.

Como no caso dos números de Mersenne, temos que


√ n
√ n 22 + 1 − 1
q ≤ 22 + 1, i.e. , k ≤ .
2n+1
Dessa forma para determinar um fator primo de Fn testamos para cada inteiro k
tal que
√ n
22 + 1 − 1
1≤k<
2n+1
se 1 + k2n+1 é primo e se divide Fn . Se para cada k pelo menos um desses fatos
não ocorrer então Fn é um número primo.

8.5. Números de Carmichael


O pequeno teorema de Fermat afirma que se p é um número primo e a ∈ Z
tal que p - a, então ap−1 ≡ 1 (mod p). Assim, isto funciona para todo 1 ≤ a < p
inteiro. Isto motiva a seguinte definição.

Definição 8.6. Seja n ≥ 3 inteiro ı́mpar e 1 ≤ b < n inteiro. Dizemos que n


é pseudoprimo na base b se bn−1 ≡ 1 (mod n).
8.5. NÚMEROS DE CARMICHAEL 55

Observação 8.7. Segue do pequeno teorema de Fermat que um número


primo p é pseudoprimo em toda base 1 ≤ b < p. Observe que a princı́pio para
um número composto n não podemos esperar que ele seja pseudoprimo em toda
base. De fato, seja d = mdc(b, n). Suponha que d > 1 e que n seja pseudoprimo
na base b, i.e., existe k ∈ Z tal que bn−1 −1 = kn. Logo d | 1, o que não é possı́vel.
Assim verificaremos a congruência apenas para as bases b tais que mdc(b, n) = 1,
i.e., b ∈ (Z/nZ)∗ .

Definição 8.8. Seja n ≥ 3 ı́mpar composto. Suponha que para todo inteiro
1 ≤ b < n tal que mdc(b, n) = 1 tenhamos bn−1 ≡ 1 (mod n). Dizemos que n é
um número de Carmichael.

Exemplo 8.9. 561 é o menor número de Carmichael. É claro que provar isto
diretamente é trabalhoso, precisamos para cada inteiro
1 ≤ b < 561 tal que mdc(b, 561) = 1
verificar que
b560 ≡ 1 (mod 561).
Ao invés disto observemos que
561 = 3.11.17.
Dizer que
b560 ≡ 1 (mod 561)
equivale a dizer que 561 | (b560 − 1), i.e., que 3 | (b560 − 1), 11 | (b560 − 1) e
17 | (b560 − 1). Como mdc(b, 561) = 1, concluimos que mdc(b, 3) = mdc(b, 11) =
mdc(b, 17) = 1. Aplicando o pequeno teorema de Fermat concluimos que
b2 ≡ 1 (mod 3), logo b560 = (b2 )280 ≡ 1 (mod 3);

b10 ≡ 1 (mod 11), logo b560 = (b10 )56 ≡ 1 (mod 11);


b16 ≡ 1 (mod 17), logo b560 = (b16 )35 ≡ 1 (mod 17).

Generalizaremos agora o procedimento do exemplo, de forma a provar, a partir


da fatoração de n, que n é um número de Carmichael.

Teorema 8.10 (teorema de Korselt). Seja n ≥ 3 ı́mpar composto. n é um


número de Carmichael se e somente se
(1) n é livre de quadrados.
56 8. APLICAÇÕES DA TEORIA DE GRUPOS

(2) Para todo fator primo p de n, (p − 1) | (n − 1).

Demonstração. Suponha que as 2 condições acima sejam satisfeitas. Seja


1 ≤ b < n inteiro tal que mdc(b, n) = 1. Afirmamos que para todo fator primo p
de n, temos bn−1 ≡ 1 (mod p).
De fato, como mdc(b, n) = 1, então mdc(b, p) = 1. Pelo pequeno teorema de
Fermat, bp−1 ≡ 1 (mod p). Por hipótese, existe k ∈ Z tal que n − 1 = k(p − 1),
logo bn−1 = (bp−1 )k ≡ 1 (mod p). Além disto temos que n fatora-se n = p1 · · · pr .
Como os pi ’s são distintos e para todo 1 ≤ i ≤ r, pi | (bn−1 − 1), concluimos que
n | (bn−1 − 1), i.e., bn−1 ≡ 1 (mod n).
Reciprocamente, seja p um fator primo de n e suponhamos que p2 | n. Observe
que
n−1  
n−1
X n−1
(p − 1) = (−1)n−1−i pi ≡ (n − 1)(−1)n−2 p + 1 6≡ 1 (mod p2 ),
i=0
i

logo (p − 1)n−1 6≡ 1 (mod n), portanto n não pode ser um número de Carmichael.
Observe que efetivamente, mdc(p − 1, n) = 1, pois se este mdc fosse igual a d,
concluiriamos que d | 1, assim d = 1.
Para provar a validade da segunda condição precisamos do teorema da raiz
primitiva que provaremos na seção seguinte. Ele afirma que se p é um número
primo, então o grupo (Z/pZ)∗ é um grupo cı́clico.
De fato, seja a um gerador de (Z/pZ)∗ . Então mdc(a, n) = 1 e uma vez que
n é um número de Carmichael, temos an−1 ≡ 1 (mod n). A fortiori, an−1 ≡ 1
(mod p). Ou seja, an−1 = 1 em (Z/pZ)∗ . Logo, pelo lema chave, p − 1 = o(a) |
(n − 1). 

8.11. Teorema da raiz primitiva


Seja n ≥ 3 inteiro ı́mpar. Provamos anteriormente que φ(n) < n, i.e., φ(n) ≤
n − 1. Note que φ(n) conta exatamente a quantidade de classes a ∈ (Z/nZ)∗ tais
que mdc(a, n) = 1. Assim, φ(n) = n − 1 se e somente se n é primo. Se existir
uma classe a ∈ (Z/nZ)∗ tal que o(a) = n − 1, então (pelo teorema de Lagrange)
(n − 1) | φ(n), logo vale n − 1 = φ(n). Portanto, se (Z/nZ)∗ for cı́clico, então n
é primo. O objetivo deste capı́tulo é mostrar a recı́proca deste resultado.

Teorema 8.12 (teorema da raiz primitiva). Se p é primo, então (Z/pZ)∗ é


cı́clico.
8.11. TEOREMA DA RAIZ PRIMITIVA 57

Note que (Z/4Z)∗ é cı́clico de ordem 2. Utilizando o teorema chinês dos restos
temos (como conseqüência do teorema da raiz primitiva) que (Z/2pZ)∗ também
é cı́clico para p primo.
Demonstração. Seja a1 ∈ (Z/pZ)∗ e d1 := o(a1 ). Se d1 = p − 1, acabou.
Senão, seja H1 o subgrupo cı́clico de (Z/pZ)∗ gerado por a1 . Temos que H1 $
(Z/pZ)∗ . Note que H1 coincide exatamente com as soluções de xd1 −1 em (Z/pZ)∗ .
Seja b1 ∈ (Z/pZ)∗ \ H1 . Pelo mesmo argumento da prova da proposição 9.40
temos que existe a2 ∈ (Z/pZ)∗ tal que o(a2 ) = mmc(o(a1 ), o(b1 )) > o(a1 ). Se
o(a2 ) = p − 1 acabou. Senão repetimos o argumento acima obtendo um elemento
a3 cuja ordem é estritamente maior que o(a2 ). Como todas essas ordens são no
máximo p − 1 não podemos ter uma seqüência estritamente crescente infinita de
números menores que p − 1. Portanto existe i tal que o(bi ) = p − 1. 
Parte 2

Grupos
CAPı́TULO 9

Teoria de Grupos I

9.1. Definição e exemplos


Definição 9.2. Um grupo é um conjunto G munido de uma operação ∗ :
G × G → G dada por (x, y) 7→ x ∗ y satisfazendo às seguintes propriedades:
(1) (associatividade) para todo x, y, z ∈ G, x ∗ (y ∗ z) = (x ∗ y) ∗ z.
(2) (Elemento neutro) existe e ∈ G tal que e∗x = x∗e = x para todo x ∈ G.

(3) (Inverso) para todo x ∈ G existe y ∈ G tal que x ∗ y = y ∗ x = e.


O grupo G é dito abeliano ou comutativo se além disto x ∗ y = y ∗ x para todo
x, y ∈ G.

Em seguida daremos exemplos de grupos. Para fixar a notação suponha que


a operação seja de “multiplicação” e que o inverso de um elemento x ∈ G seja
denotado por x−1 .

Observação 9.3. Seja G um grupo e x, y ∈ G. Afirmamos que

(xy)−1 = y −1 x−1 .

De fato,

xy(y −1 x−1 ) = x(yy −1 )x−1 = xx−1 = 1


y −1 x−1 (xy) = y −1 (x−1 x)y = y −1 y = 1.

Definição 9.4. Um grupo G é dito finito se possui um número finito de


elementos, caso contrário é dito infinito. Se G for um grupo finito, o número de
elementos de G é chamado a ordem de G e denotado por #G.

Exemplo 9.5 (grupos abelianos infinitos). Z, Q, R, C e ∗ = +.

Exemplo 9.6 (grupos abelianos infinitos). Q \ {0}, R \ {0}, C \ {0} e ∗ = . .

61
62 9. TEORIA DE GRUPOS I

Exemplo 9.7. Seja


( ! )
a b
M2 (R) := | a, b, c, d ∈ R
c d

o conjunto das matrizes 2 × 2 com entradas reais. Este conjunto é um grupo com
a operação sendo a soma de matrizes. Seja
( ! )
a b
GL2 (R) := ∈ M2 (R) | ad − bc 6= 0 .
c d

Todas estas matrizes são inversı́veis com respeito à multiplicação de matrizes.


Assim GL2 (R) munido do produto de matrizes é um grupo chamado grupo line-
arem dimensão 2 sobre os reais. Ambos os grupos são infinitos. O primeiro é
abeliano. Notemos que GL2 (R) não é comutativo. De fato,
! ! !
0 1 1 0 1 1
= e
1 0 1 1 1 0
! ! !
1 0 0 1 0 1
= .
1 1 1 0 1 1

Exemplo 9.8. Seja G = Z/nZ e ∗ = ⊕. Este é um grupo abeliano de ordem


n. Seja G = (Z/nZ)∗ e ∗ = . Este é um grupo de ordem φ(n).

Exemplo 9.9. Denotamos por S∆ o grupo das simetrias do triângulo equi-


látero. A operação será ◦, a composição de funções. Fixemos os vértices do
triângulo no cı́rculo unitário

S1 := {z ∈ C | |z| = 1} por V1 = e2πi , V2 = e2πi/3 e V3 = e4πi/3 .

Cada simetria será uma função bijetiva f : {V1 , V2 , V3 } → {V1 , V2 , V3 } dada por
f (Vi ) = Vσ(i) , onde denotamos f na forma matricial por
!
1 2 3
.
σ(1) σ(2) σ(3)

Denotamos α := R2π/3 a rotação de 2π/3 que é dada por


!
1 2 3
α= .
2 3 1
9.1. DEFINIÇÃO E EXEMPLOS 63

A rotação de 4π/3, R4π/3 = R2π/3 ◦ R2π/3 que será denotada por α2 é dada por
!
1 2 3
α2 = .
3 1 2

Finalmente a rotação de 2π = 6π/3 nada mais é que id e é denotada por α3 ,


assim α3 = id. Além disto temos as simetrias em relação às retas que passam
pelos vértices e pelo centro do lado oposto, denotamos estas retas por li para
i = 1, 2, 3. Seja β := Sl3 a simetria em relação à reta l3 ,
!
1 2 3
β= .
2 1 3

Note que β 2 = id. Seja Sl1 a simetria em relação à reta l1 ,


!
1 2 3
Sl1 = .
1 3 2

Novamente Sl23 = id. Finalmente,


!
1 2 3
Sl2 =
3 1 2

e Sl22 = id. Assim, S∆ = {id, α, α2 , β, Sl1 , Sl2 }. Para provar que S∆ é um grupo
precisamos verificar as 3 propriedades da definição. A associatividade segue do
fato de composição de funções ser associativa. O elemento neutro segue do fato
que a composição da identidade com qualquer função ser a qualquer função. Basta
portanto verificar os inversos. De

α3 = αα2 = id

concluimos que
α−1 = α2 e que (α2 )−1 = α.
De
β 2 = ββ = id,
concluimos que
β −1 = β.
Antes de verificarmos os dois restantes calculemos
! ! !
1 2 3 1 2 3 1 2 3
αβ = = = Sl1 e
2 3 1 2 1 3 1 3 2
64 9. TEORIA DE GRUPOS I
! ! !
1 2 3 1 2 3 1 2 3
α2 β = = = Sl2 .
3 1 2 2 1 3 3 2 1
Geometricamente já verificamos que (αβ)2 = (α2 β)2 = id, logo (αβ)−1 = αβ
e (α2 β)−1 = α2 β. Dessa forma S∆ é um grupo de ordem 6. Vamos ver isto
de forma puramente algébrica e aproveitar para mostrar que S∆ não é abeliano.
Calculemos,
! ! !
1 2 3 1 2 3 1 2 3
(9.9.1) βα = = = α2 β.
2 1 3 2 3 1 3 2 1
Pela observação 9.3 e por (9.9.1) temos que
(αβ)−1 = β −1 α−1 = βα2 = α2 βα = α4 β = αβ e
(α2 β)−1 = β −1 (α2 )−1 = βα = α2 β.

Exemplo 9.10. O grupo S das simetrias do quadrado. Denotamos os


vértices por
V1 = e2πi , V2 = eπi/2 , V3 = eπi e V4 = e3πi/2 .
Seja α := Rπ/2 a rotação por π/2 que é dada por
!
1 2 3 4
α= ,
2 3 4 1
a rotação de π é dada por
!
1 2 3 4
Rπ := α2 = ,
3 4 1 2
a rotação de 3π/2 é dada por
!
1 2 3 4
R3π/2 := α3 =
4 1 2 3
e a rotação de 2π é dada por R2π := α4 = id. Temos também a simetria em
relação às retas l1 , respectivamente l3 , passando por divindo ao meio os lados
V1 V4 e V2 V3 , respectivamente V1 V2 e V3 V4 . Assim,
!
1 2 3 4
β := Sl3 =
2 1 4 3
e !
1 2 3 4
Sl1 = .
4 3 2 1
9.1. DEFINIÇÃO E EXEMPLOS 65

Notemos que geometricamente β 2 = Sl21 = id. Finalmente temos as simetrias


em relação às diagonais d1 , respectivamente d2 , dada por V1 V3 , respectivamente
V2 V4 . Assim,
!
1 2 3 4
Sd1 =
1 4 3 2
e !
1 2 3 4
Sd2 = .
3 2 1 4
Novamente, geometricamente Sd21 = Sd22 = id. O conjunto S fica portanto dado
por S = {id, α, α2 , α3 , β, Sl1 , Sd1 , Sd2 }. Como no exemplo anterior, para provar
que é um grupo basta calcular os inversos. Inicialmente,

α4 = αα3 = α2 α2 = id,

logo
α−1 = α3 , (α3 )−1 = α e (α2 )−1 = α2 .
Os demais já foram calculados geometricamente. Mostraremos que este grupo
não é abeliano e refaremos os cálculos algebricamente. Calculemos,
! ! !
1 2 3 4 1 2 3 4 1 2 3 4
αβ = = = Sd1 ,
2 3 4 1 2 1 4 3 1 4 3 2
! ! !
1 2 3 4 1 2 3 4 1 2 3 4
α2 β = = = Sl1 e
3 4 1 2 2 1 4 3 4 3 2 1
! ! !
1 2 3 4 1 2 3 4 1 2 3 4
α3 β = = = Sd2 .
4 1 2 3 2 1 4 3 3 2 1 4
A primeira observação é que
! ! !
1 2 3 4 1 2 3 4 1 2 3 4
βα = = = α3 β.
2 1 4 3 2 3 4 1 3 2 1 4

Logo,
(αβ)−1 = β −1 α−1 = βα3 = α3 βα2 = α6 βα = α2 α3 β = αβ,

(α2 β)−1 = β −1 (α2 )−1 = βα2 = α3 βα = α6 β = α2 β e

(α3 β)−1 = β −1 (α3 )−1 = βα = α3 β.


66 9. TEORIA DE GRUPOS I

9.11. Subgrupos
Definição 9.12. Seja G um grupo, um subconjunto H de G é dito um
subgrupo de G, se 1 ∈ H, dados x, y ∈ H, xy ∈ H e dado x ∈ H, x−1 ∈ H.

Exemplo 9.13. Seja G = Z e n ≥ 1. Note que nZ é um subgrupo de Z. De


fato, 0 = n.0 ∈ nZ, x = nk, y = nl, k, l ∈ Z, então x + y = n(k + l) ∈ nZ e
−x = n(−k) ∈ nZ. Afirmamos mais, que todo subgrupo de Z é da forma nZ
para algum n ≥ 1. De fato, seja H ⊂ Z um subgrupo. Por definição H ∩ N 6= ∅.
Seja n o menor elemento de H ∩ N. É claro que nZ ⊂ H, pela definição de H.
Reciprocamente, se x ∈ H ∩ N. Pelo algoritmo da divisão existem q, r ∈ Z tais
que x = nq + r com 0 ≤ r < n. Note que r = x − nq ∈ H. Assim r = 0 e x ∈ nZ.
Se x ∈ H e x < 0, seja y = −x ∈ H ∩ N. Pelo que foi feito anteriormente, y = kn,
em particular x = −y = (−k)n ∈ nZ.

Exemplo 9.14. Seja n ≥ 1 inteiro e

µn := {z ∈ C | z n = 1}.

Afirmamos que este é um subgrupo de C \ {0}. De fato, 1n = 1, logo 1 ∈ µn , se


x, y ∈ µn , então
(xy)n = xn y n = 1,
logo xy ∈ µn e se x ∈ µn , então x−1 C \ {0}, logo

(x−1 )n = (xn )−1 = 1

e x−1 ∈ µn . Este é um grupo abeliano chamado o grupo das raı́zes n-ésimas da


unidade. Seja ζ := e2πi/n , ζ ∈ µn e o menor inteiro positivo m ≥ 1 tal que
ζ m = 1 é n. Afirmamos que

µn = {1, ζ, · · · , ζ n−1 }.

De fato, a inclusão ⊃ é clara. Se z ∈ µn , então |z| = 1 e z = eiθ , onde θ = k2π


para k ∈ Z. Se k ≥ 1, então, pelo algoritmo da divisão, existem q, r ∈ Z tais que
k = qn + r com 0 ≤ r < n. Logo

z = ζ k = (ζ n )q ζ r = ζ r

e z ∈ {1, ζ, · · · , ζ n−1 }. Se k < 0, digamos k = −l, então ζ l ∈ {1, ζ, · · · , ζ n−1 }, e


z = ζ k = ζ −l = ζ n−l ∈ {1, ζ, · · · , ζ n−1 }. Finalmente, temos uma bijeção

µn → Z/nZ dada por ζ k 7→ k.


9.17. CLASSES LATERAIS E TEOREMA DE LAGRANGE 67

De fato, a sobrejetividade segue da definição de Z/nZ. E a injetividade uma vez


que se k = l, então n | (k − l), o que só é possı́vel se k = l.

Exemplo 9.15. Seja G := GL2 (R) e


( ! )
a 0
D2 (R) := | ad 6= 0
0 d

o conjunto das matrizes diagonais. Este é um subgrupo de GL2 (R), pois


!
1 0
∈ D2 (R),
0 1

se A, B ∈ D2 (R), digamos
! !
a 0 a0 0
A= eB= ,
0 d 0 d0

então !
aa0 0
AB = ∈ D2 (R),
0 dd0
!
a−1 0
A−1 = ∈ D2 (R).
0 d−1

Exemplo 9.16. Seja G := S , então {1, α, α2 , α3 } é um subgrupo de S ,


como também {1, β}.

9.17. Classes Laterais e Teorema de Lagrange


Definição 9.18. Seja G um grupo e H um subgrupo de G. Dados x, y ∈ G
definimos x ∼D y se e somente se x = yα, para algum α ∈ H. Definimos também
x ∼E y se e somente se x = αy para algum α ∈ H.

Observação 9.19. As relações binárias ∼E e ∼D são relações de equivalência.


De fato, x = x.1, logo x ∼D x. Se x ∼D y, então x = yα, para algum α ∈ H,
logo y = xα−1 e como H é um subgrupo de G, α−1 ∈ H, portanto y ∼D x. Se
x ∼D y e y ∼D z, então x = yα e y = zβ, para α, β ∈ H. Logo x = zβα e
βα ∈ H, pois H é um subgrupo de G, donde x ∼D z. Fica como exercı́cio fazer
a mesma demonstração para ∼E .
68 9. TEORIA DE GRUPOS I

Definição 9.20. Dado x ∈ G denotamos por


xH := {xα | α ∈ H}
sua classe de equivalência com relação a ∼D , esta é chamada de classe lateral a
direita de x em H. Seja
CLD := {xH | x ∈ G}
o conjunto das classes laterais a direita de H em G. Similarmente, definimos a
classe lateral a esquerda de x em H por
Hx := {αx | α ∈ H}
e
CLE := {Hx | x ∈ G}
o conjunto das classes laterais a esquerda de H em G.

Lema 9.21. Existe uma bijeção


ϕ : CLD → CLE dada por ϕ(xH) = Hx−1 .

Demonstração. Dado y ∈ G, existe x ∈ G tal que y = x−1 , logo Hy =


Hx−1 = ϕ(xH) e ϕ é sobrejetiva. Se ϕ(xH) = ϕ(yH), então Hx−1 = Hy −1 , i.e.,
existe α ∈ H tal que x−1 = αy −1 , i.e., x = yα, i.e., x ∼D y, i.e., xH = yH,
portanto ϕ é injetiva. 
A partir de agora nesta seção suponhamos que G seja um grupo finito. Ob-
serve que
·
[ ·
[
(9.21.1) G= xH = Hx.
x∈G x∈G

Concluimos que o número de classes laterais (a direita ou a esquerda) de H em


G também é finito. Denotamos este número por (G : H) e chamamos o ı́ndice de
H em G.

Lema 9.22. Para todo x ∈ G, existe uma bijeção


ψ : H → xH dada por α 7→ xα.

Demonstração. Pela definição de xH concluimos que ψ é sobrejetiva. Se


ψ(α) = ψ(β), i.e., xα = xβ, multiplicando os dois lados por x−1 a esquerda,
obtemos que α = β, portanto, ψ é injetiva. 
9.25. ORDEM DE ELEMENTO E EXPOENTE DE GRUPO ABELIANO 69

Teorema 9.23 (teorema de Lagrange). Seja G um grupo finito e H um


subgrupo de G. Então
#G = (G : H)|H|.

Demonstração. Segue imediatamente de (9.21.1) e do lema 9.22. 

Corolário 9.24. Seja H um grupo finito e H um subgrupo de G. Então |H|


divide |G|.

9.25. Ordem de elemento e expoente de grupo abeliano


Definição 9.26. Seja G um grupo e x ∈ G. Definimos
o(x) := min{n ≥ 1 | xn = 1, n ∈ Z}
ou o(x) = ∞ caso não exista n ≥ 1 inteiro satisfazendo xn = 1. O número o(x)
é chamado a ordem de x.

Exemplo 9.27. Seja G = Z e x = 1. Como para todo n ≥ 1, nx 6= 0,


concluimos que o(1) = ∞.

Lema 9.28 (lema chave). Seja x ∈ G de ordem n. Suponha que exista t ≥ 1


tal que xt = 1. Então n | t.

Demonstração. Pelo algoritmo de euclides existem q, r ∈ Z tais que t =


qn + r com 0 ≤ r < n. Logo
1 = xt = xqn xr = xr ,
assim pela definição da ordem de x concluimos que r = 0. 

Exemplo 9.29. Seja G := µn para n ≥ 1 inteiro e x := ζ = e2πi/n . Então


o(ζ) = n. Afirmamos mais ainda que
o(ζ i ) = n se e somente se mdc(i, n) = 1 para 0 ≤ i < n.
De fato, se mdc(i, n) = d > 1, então i = di0 e n = dn0 com n0 < n. Por outro lado
0 0 0 0 0 0
(ζ i )n = ζ in = ζ i dn = ζ i n = (ζ n )i = 1,
mas isto contradiz o(ζ i ) = n. Reciprocamente, suponha que 1 ≤ o(ζ i ) = m < n.
Então ζ im = 1, i.e., pelo lema chave im = kn para algum k ≥ 1 inteiro. Como
m < n, então existe algum fator primo p de n tal que p | i, logo mdc(i, n) > 1.
Além disto temos uma bijeção entre
Pn := {ζ i | mdc(i, n) = 1}
70 9. TEORIA DE GRUPOS I

e (Z/nZ)∗ dada por ζ i 7→ i. Por definição de (Z/nZ)∗ esta aplicação é sobrejetiva


e a injetividade segue de i = j implicar em n | (i − j) o que apenas ocorre se
i = j. O conjunto Pn é chamado o conjunto das raı́zes primitivas n-ésimas da
unidade. Mostramos em particular que #Pn = φ(n).

Exemplo 9.30. Seja G = GL2 (R) e


!
0 1
x= .
1 0

É imediato verificar que o(x) = 2.

Exemplo 9.31. Seja G := S e x = α, então o(α) = 4.

Observação 9.32. Seja G um grupo e suponha que para todo x ∈ G, o(x) =


2. Então G é abeliano. De fato, o(x) = 2 significa que x2 = 1, i.e., x−1 = x.
Assim,
xy = x−1 y −1 = (yx)−1 = yx.

Definição 9.33. Seja G um conjunto e S um subonjunto de G contendo 1.


Seja
hSi := {x1 · · · xr | ai ∈ S ou a−1
i ∈ S}.

Lema 9.34. hSi é um subgrupo de G.

Demonstração. De fato, 1 ∈ hSi. Se x, y ∈ hSi, então x = x1 · · · xr com


xi ∈ S ou x−1
i ∈ S e y = y1 · · · ys tal que jj ∈ S ou yj−1 ∈ S. Logo xy ∈ hSi.
Finalmente, se x ∈ S, então
x−1 = x−1 −1
r · · · x1

e x−1 −1 −1
i ∈ S ou (xi ) = xi ∈ S. Logo x−1 ∈ hSi. 

Definição 9.35. O subgrupo hSi é chamado o subgrupo de G gerado por


S. Estamos particularmente interessados no caso em que S = {α}. Neste caso
dizemos que o grupo hSi é um grupo cı́clico. Distinguimos duas situações. Na
primeira o(α) = n < ∞. Neste caso, hαi = {1, α, · · · , αn−1 } e este conjunto
corresponde bijetivamente a Z/nZ por αi 7→ i. O segundo caso é aquele no qual
o(α) = ∞. Neste caso hαi = {αr | r ∈ Z} e corresponde bijetivamente a Z por
αr 7→ r.

Corolário 9.36 (corolário 2 do teorema de Lagrange). Seja G um grupo


finito e x ∈ G. Então o(x) | #G.
9.25. ORDEM DE ELEMENTO E EXPOENTE DE GRUPO ABELIANO 71

Demonstração. Pelo exemplo anterior, o(x) < ∞ e o(x) = #hxi. Pelo


teorema de Lagrange #hxi | #G. 
Definição 9.37. Seja G um grupo abeliano. Definimos o expoente de G por
exp(G) := mmc{o(z) | z ∈ G} ou ∞, se existir z ∈ G tal que o(z) = ∞.

Observação 9.38. É claro que se G é finito, então exp(G) < ∞. Mas a


recı́proca não é verdade. Por exemplo se G = Z/2Z × . . . Z/2Z × . . ., então para
cada x ∈ G \ {1}, onde 1 = (0, · · · , 0, · · · ), o(x) = 2, logo exp(G) = 2, mas G é
infinito.
Proposição 9.39. Seja G um grupo abeliano e z1 , · · · , zr ∈ G tais que o(zi ) <
∞ para todo i. Então
(i) o(z1 · · · zr ) | mmc{o(z1 ), · · · , o(zr )} | o(z1 ) · · · o(zr ).
(ii) Se para todo i 6= j, mdc(o(zi ), o(zj )) = 1, então o(z1 · · · zr ) = o(z1 ) · · ·
o(zr ).
Demonstração. (i) Seja M := mmc{o(z1 ), · · · , o(zr )}. Então, (z1 · · · zr )M =
z1M · · · zrM = 1, pelo lema chave concluimos que o(z1 · · · zr ) | M . A outra divisibi-
lidade é imediata.
(ii) A segunda igualdade é uma propriedade dos inteiros positivos (basta lem-
brar que o mmc é obtido tomando o maior expoente na fatoração em números
primos). Vamos provar a primeira igualdade por indução em r. A primeira etapa
é provar para r = 2.
Seja N := o(z1 z2 ). Como G é abeliano, então
1 = (z1 z2 )N = z1N z2N , i.e. , z1−N = z2N .
Mas isto significa que z1−N = z2N ∈ hz1 i ∩ hz2 i, mas esta interseção é igual a {1},
pois mdc(o(z1 ), o(z2 )) = 1. Portanto, z1N = z2N = 1, mas isto implica que M | N .
Suponhamos que tenhamos provado que o(z1 · · · zr−1 ) = o(z1 ) · · · o(zr−1 ) com
mdc(o(zi ), o(zj )) = 1 para i 6= j. Utilizando que G é abeliano, e estendo a
definição de N para r fatores, temos que
1 = (z1 . . . zr−1 )N zrN , i.e. , (z1 . . . zr−1 )N = zr−N .
Mas isto significa que (z1 . . . zr−1 )N = zr−N ∈ hz1 , · · · , zr−1 i ∩ hzr i, mas este
grupo é trivial pois a ordem do primeiro grupo é igual a o(z1 ) . . . o(zr−1 ) e a
ordem do segundo é igual a o(zr ) e mdc(o(zi ), o(zj )) = 1, se i 6= j. Assim,
(z1 . . . zr−1 )N = zrN = 1, donde M | N . 
72 9. TEORIA DE GRUPOS I

Observe que pelo teorema de Lagrange, se G for finito, então exp(G) | #G.

Proposição 9.40. Seja G um grupo abeliano tal que exp(G) < ∞. Então
(a) Existe y ∈ G tal que exp(G) = o(y).
(b) G é cı́clico se e somente se exp(G) = #G.

Demonstração. (a) Seja exp(G) = pe11 · · · perr a fatoração de exp(G). Por


definição para todo i = 1, · · · , r existe yi ∈ G tal que o(yi ) = pei i qi tal que pi - qi .
Note que se zi = yiqi , então o(zi ) = pei i . Neste caso, pelo ı́tem (ii) da proposição
9.39 temos que se y = z1 · · · zr , então o(y) = exp(G).
(b) Se G for cı́clico, então existe x ∈ G tal que hxi = G e o(x) = #G.
Por outro lado, pelo ı́tem anterior, existe y ∈ G tal que o(y) = exp(G). Mas,
exp(G) | #G e o(x) | exp(G), logo exp(G) = #G. Reciprocamente, se vale a
igualdade, pelo ı́tem anterior existe y ∈ G tal que o(y) = exp(G) = #G, logo G
é cı́clico. 
CAPı́TULO 10

Teoria de grupos II

10.1. Subgrupos normais e grupos quocientes


Seja G um grupo e H um subgrupo de G. Seja

G/H := {xH | x ∈ G}

o conjunto das classes laterais a direita de H em G. Analogamente ao caso em que


G = Z e H = nZ, para n ≥ 1 inteiro, queremos definir em G/H uma estrutura de
grupo. Para isto precisamos de uma propriedade adicional de H. Se copiarmos
o que foi feito anteriormente a idéia é definir a função

ψ : G/H × G/H → G/H

dada por
(xH, yH) 7→ xyH.

O problema é verificar que ψ está bem definida. Sejam x0 , y 0 ∈ G tais que


x0 H = xH e y 0 H = yH, i.e., x0 = xα e y 0 = yβ para α, β ∈ H. Assim

x0 y 0 = xαyβ.

Mas a princı́pio G não é comutativo e não podemos trocar y com α para concluir
que ψ está bem definida.

Definição 10.2. Um subgrupo H de um grupo G é dito normal se e somente


se para todo x ∈ G temos xHx−1 ⊂ H. Denotamos H C G.

Lema 10.3. Seja G um grupo e H um subgrupo de G. As seguintes condições


são equivalentes:
(i) H C G.
(ii) Para todo x ∈ G, xHx−1 = H.
(iii) Para todo x ∈ G, xH = Hx.
73
74 10. TEORIA DE GRUPOS II

Demonstração. Suponha que H C G. A inclusão ⊂ já está feita por de-


finição. Uma vez que (x−1 )−1 = x, segue também da definição que x−1 Hx ⊂ H,
i.e., H ⊂ xHx−1 . Assim vale (ii).
Suponha que para todo x ∈ G, xHx−1 = H. Seja α ∈ H. Por hipótese
xαx−1 = β ∈ H, logo xα = βx ∈ Hx. Reciprocamente, como x−1 αx = γ ∈ H,
então αx = xγ ∈ xH. Disto segue (iii).
Suponha que para todo x ∈ G, xH = Hx. Por hipótese para todo α ∈ H
existe β ∈ H tal que xαx−1 = βxx−1 = β. Donde (i). 
Suponhamos que H C G, pelo lema 10.3, existe γ ∈ H tal que
x0 y 0 = xαyβ = xyγβ ∈ xyH,
pois γβ ∈ H. Assim x0 y 0 H = xyH e ψ está bem definida.

Definição 10.4. Seja G um grupo e H C G um subgrupo de normal de G. O


conjunto G/H e a função ψ definem uma estrutura de grupo em G/H chamado
o grupo quociente.

Exemplo 10.5. Seja G um grupo finito e H um subgrupo de G. Suponha


que (G : H) = 2. Afirmamos que H C G. De fato, como (G : H) = 2, isto
significa que temos apenas suas classes laterais a direita, a saber, H e xH para
x∈ / H. Também sabemos que o número de elementos de CLD é igual ao de CLE,
logo as únicas classes laterais a direita são H e Hx, como Hx 6= H e xH 6= H,
concluimos que xH = Hx, para todo x ∈ G − H. Esta igualdade também é
imediata se x ∈ H. Logo H C G.

Exemplo 10.6. Seja G = S e H = {1, α, α2 , α3 }. Temos que H C G, pois


(G : H) = |G|/|H| = 2, pelo teorema de Lagrange e pelo exemplo anterior.

Exemplo 10.7. Seja G um grupo. Definimos por


Z(G) := {x ∈ G | xy = yx para todo y ∈ G},
o centro de G. Afirmamos que Z(G) C G.
Primeiro temos que verificar que Z(G) é realmente um subgrupo de G. De
fato, 1.y = y.1 = y para todo y ∈ G, logo 1 ∈ Z(G). Se x, z ∈ Z(G) e y ∈ G,
então xzy = xyz = yxz, i.e., xz ∈ Z(G). Se x ∈ Z(G), então para todo y ∈ G,
x−1 y = (y −1 x)−1 = (xy −1 )−1 = yx−1 , i.e., x−1 ∈ Z(G).
Finalmente, dado x ∈ G e y ∈ Z(G), temos que xyx−1 = yxx−1 = y ∈ Z(G),
i.e., Z(G) C G. Podemos ainda dizer mais, se H é um subgrupo de Z(G) então
10.10. HOMOMORFISMO DE GRUPOS 75

H C G. De fato, automaticamente H é um subgrupo de G, além disto como para


todo x ∈ G e y ∈ H temos que xyx−1 = yxx−1 = y ∈ H, pois H ⊂ Z(G).
Note que G é abeliano se e somente se Z(G) = G. Assim, o quanto maior for
o centro de G, mais G estará próximo a ser abeliano.

Exemplo 10.8. Seja G um grupo. Denotamos por [G, G] o subgrupo de G


gerado pelo conjunto
{xyx−1 y −1 | x, y ∈ G}.
Este grupo é chamado o subgrupo dos comutadores.
Note que G é abeliano se e somente se [G, G] = {1}. Assim, o quanto menor
for o subgrupo dos comutadores, mais G estará próximo a ser abeliano.
Afirmamos também que [G, G] C G. Seja α ∈ [G, G], digamos
α = α1 · · · αr ,
onde para todo i,
αi = xi yi x−1 −1
i yi ou αi−1 = xi yi x−1 −1
i yi ,

para xi yi ∈ G. A última igualdade se reescreve como αi = yi xi yi−1 x−1


i . Seja
z ∈ G, então
zyz −1 = zα1 z −1 · · · zαr z −1
e observe que para cada i temos
zαi z −1 = zxi yi x−1 −1 −1
i yi z ∈ {xyx−1 y −1 | x, y ∈ G} ou
zαi z −1 = zyi xi yi−1 x−1
i z
−1
∈ {xyx−1 y −1 | x, y ∈ G}.

Observação 10.9. Observe também que G/[G, G] é um grupo abeliano.


Além disto, se H C G for tal que G/H é abeliano, então H contém [G, G]. De
fato, se dados x, y ∈ G temos xyH = xHyH = yHxH = yxH, então existe
α ∈ H tal que x−1 y −1 xy ∈ H. Consequentemente, todo elemento de [G, G] está
contido em H.

10.10. Homomorfismo de grupos


Sejam G e G dois grupos. O objetivo é compará-los e verificar que suas
estruturas são as mesmas.

Definição 10.11. Um homomorfismo de grupos é uma função f : G → G tal


que f (xy) = f (x)f (y).
76 10. TEORIA DE GRUPOS II

Observação 10.12. (a) Seja 1G o elemento neutro de G e 1G o elemento


neutro de G. Então f (1G ) = 1G . De fato, f (1G ) = f (1G 1G ) = f (1G )
f (1G ), logo f (1G ) = 1G .
(b) Para todo x ∈ G temos que f (x−1 ) = f (x)−1 . De fato, f (x)f (x−1 ) =
f (xx−1 ) = f (1G ) = 1G e f (x−1 )f (x) = f (x−1 x) = f (1G ) = 1G .

Exemplo 10.13. (1) Seja G = G = Z, n ≥ 1 inteiro e f : Z → Z definida


por f (x) = nx. f é um homomorfismo. De fato, f (x + y) = n(x + y) =
nx + ny = f (x) + f (y).
(2) Seja G um grupo e H um subgrupo normal de G e f : G → G/H
definida por f (x) = xH é um homomorfismo. De fato, f (xy) = (xy)H =
(xH)(yH) = f (x)f (y), por definição de produto de classes.
(3) Seja G um grupo e fixemos a ∈ G. Consideremos a função Ia : G → G
definida por Ia (x) = axa−1 . Esta função é um homomorfismo. De fato,
Ia (xy) = a(xy)a−1 = (axa−1 )(aya−1 ) = Ia (x)Ia (y).

A partir de agora deixaremos ao cargo do leitor identificar quando a unidade


referida por 1 está em G ou em G.

Proposição 10.14. Seja f : G → G um homomorfismo de grupos e

ker(f ) := {x ∈ G | f (x) = 1}

o núcleo de f .
(i) ker(f ) C G.
(ii) f é injetiva se e somente se ker(f ) = {1}.
(iii) f (G) é um subgrupo de H.
(iv) f −1 (f (H)) = H ker(f ).
(v) Seja H < G tal que f −1 (H) ⊃ ker(f ). Então f (f −1 (H)) = H ∩ f (G).
(vi) Se x ∈ G é tal que o(x) < ∞ então o(f (x)) < ∞ e o(f (x)) | o(x).
(vii) Se H C G, então f (H) C f (G). Se H C f (G), então f −1 (H) C G.

Demonstração. (i) Seja a ∈ G e x ∈ ker(f ), então f (axa−1 ) = f (a)f (x)


f (a−1 ) = f (a)f (a)−1 = 1, i.e., axa−1 ∈ ker(f ).
(ii) Suponha que f seja injetiva e x ∈ ker(f ). Logo f (x) = 1 = f (1), i.e.,
x = 1. Reciprocamente, se ker(f ) = {1} e se f (x) = f (y), então f (x)f (y)−1 =
f (xy −1 ) = 1, i.e., xy −1 ∈ ker(f ), logo xy −1 = 1, i.e., x = y.
10.10. HOMOMORFISMO DE GRUPOS 77

(iii) É claro que 1 = f (1) ∈ f (G). Sejam x, y ∈ f (G), i.e., existem a, b ∈ G


tais que x = f (a) e y = f (b). Logo xy = f (a)f (b) = f (ab) ∈ f (G). Se x ∈ f (G),
digamos x = f (a) para a ∈ G, então x−1 = f (a)−1 = f (a−1 ) ∈ f (G). 

Para provar a propriedade (iv) precisamos do seguinte lema.

Lema 10.15. Sejam H e K subgrupos de um grupo G. Definimos

HK := {ab | a ∈ H, b ∈ K}.

Então HK < G se e somente se HK = KH. Além disto, se H C G ou K C G,


então HK < G.

Demonstração. Suponha que HK < G. Seja α ∈ HK. Então α−1 ∈ HK,


digamos α−1 = ab. Assim α = (α−1 )−1 = b−1 a−1 ∈ KH, i.e., HK ⊂ KH. Seja
α ∈ KH, digamos α = ab. Logo α−1 = b−1 a−1 ∈ HK. Como HK < G, então
α = (α−1 )−1 ∈ HK, i.e., KH ⊂ HK.
Reciprocamente, suponha que HK = KH. Então 1 = 1.1 ∈ HK. Se x, y ∈
HK, digamos x = ab e y = cd, então xy = abcd = ac0 b0 d ∈ HK, onde bc = c0 b0 ∈
HK, uma vez que HK = KH. Se x = ab ∈ HK, então x−1 = b−1 a−1 = a0 b0 ∈
HK, pela mesma razão.
Suponha que H C G (o outro caso é análogo). Seja x = ab ∈ HK. Então
x = bb−1 ab = b(b−1 ab) = ba0 ∈ KH, logo HK ⊂ KH. Se x = ab ∈ KH, então
x = abaa−1 = (aba−1 )a = b0 a ∈ HK, i.e., KH ⊂ HK. 

Continuação da prova da proposição. (iv) Notemos inicialmente que


como ker(f ) C G, H ker(f ) < G. Seja a ∈ f −1 (f (H)), i.e., f (a) = f (b) ∈
f (H). Logo f (a)f (b)−1 = f (ab−1 ) = 1, i.e., ab−1 = c ∈ ker(f ), i.e., a = bc =
c0 b0 ∈ H ker(f ). Reciprocamente, se x = ab ∈ H ker(f ), então f (x) = f (ab) =
f (a)f (b) = f (a) ∈ f (H), i.e., x ∈ f −1 (f (H)).
(v) Seja x ∈ f (f −1 (H)), i.e., x = f (a) para a ∈ f −1 (H), i.e., f (a) = y ∈ H.
Portanto, x ∈ H ∩ f (G). Reciprocamente, suponha que x ∈ H ∩ f (G). Logo
x = f (a) ∈ H, i.e., a ∈ f −1 (H), logo x ∈ f (f −1 (H)).
(vi) Seja d = o(x), logo xd = 1 e f (xd ) = f (x)d = f (1) = 1, pelo lema chave,
o(f (x)) | o(x), em particular o(f (x)) < ∞.
(vii) Suponha que H C G e sejam a ∈ G e x ∈ H. Logo axa−1 ∈ H. Por outro
lado, f (x) ∈ f (H) e f (a) ∈ f (G) ⊂ G. Assim, f (axa−1 ) = f (a)f (x)f (a)−1 ∈
f (H). Suponha que H C f (G). Sejam x ∈ f −1 (H) e a ∈ G, i.e., f (x) = y ∈ H.
78 10. TEORIA DE GRUPOS II

Como H C f (G), então f (a)yf (a)−1 ∈ H, mas f (a)yf (a)−1 = f (axa−1 ), i.e.,
axa−1 ∈ f −1 (H). 

Definição 10.16. Seja f : G → G um homomorfismo de grupos. Se f é


bijetivo dizemos que f é um isomorfismo de grupos.

Teorema 10.17 (teorema do isomorfismo de grupos). Seja f : G → G um ho-


momorfismo de grupo. Então f induz um isomorfismo de grupos ϕ : G/ ker(f ) →
f (G) definido por
ϕ(x ker(f )) := f (x).
Além disto existe uma bijeção entre os seguintes conjuntos
{H < G | H ⊃ ker(f )} e {H < f (G)}.

Demonstração. Notemos inicialmente que ϕ está bem definido. De fato, se


x = ya para a ∈ ker(f ), então ϕ(x ker(f )) = f (x) = f (ya) = f (y)f (a) = f (y) =
ϕ(y ker(f )). Além disto, pela sua própria definição ϕ é sobrejetivo. Quanto a
injetividade, se ϕ(x ker(f )) = ϕ(y ker(f )), então f (x) = f (y), i.e., f (x)f (y)−1 =
f (xy −1 ) = 1, i.e., xy −1 ∈ ker(f ), logo x ker(f ) = y ker(f ).
A bijeção entre os dois conjuntos é dada pelas funções ψ1 : H 7→ f (H) e ψ2 :
H 7→ f −1 (H). De fato, ψ2 ◦ ψ1 (H) = ψ2 (f (H)) = f −1 (f (H)) = H ker(f ) = H,
pois H ⊃ ker(f ). Reciprocamente, ψ1 ◦ ψ2 (H) = ψ1 (f −1 (H)) = f (f −1 (H)) =
H ∩ f (G) = H, pois H < f (G). 

Corolário 10.18. Seja f : G → G um homomorfismo de grupos e H < G.


Então existe um isomorfismo de grupos
H
ψ: → f (H) dado por ψ(x(H ∩ ker(f ))) := f (x).
(H ∩ ker(f ))
Demonstração. É imediato verificar que ker(f ) ∩ H C H. Logo o grupo
quociente faz sentido. A função ψ está bem definida, pois se x = ya para
a ∈ H ∩ ker(f ), então ψ(x(ker(f ) ∩ H)) = f (x) = f (ya) = f (y)f (a) = f (y) =
ψ(y(ker(f )∩H)). Por definição ψ é sobrejetiva. Se ψ(x(ker(f )∩H)) = ψ(y(ker(f )∩
H)), então f (x) = f (y), i.e., f (xy −1 ) = f (x)f (y)−1 = 1, i.e., xy −1 ∈ ker(f ) ∩
H. 

Proposição 10.19. Seja H C G e


G
f :G→ o homomorfismo quociente f (x) := xH.
H
10.10. HOMOMORFISMO DE GRUPOS 79

Existe uma bijeção entre os conjuntos


{K C G | K ⊃ H} e {H C G/H}.

Demonstração. Definimos as funções que dão a bijeção por ψ1 : K 7→


K/H e ψ2 : H 7→ f −1 (H). De fato, ψ2 ◦ ψ1 (K) = ψ2 (K/H) = f −1 (K/H) =
f −1 (f (K)) = K ker(f ) = KH = K, pois K ⊃ H e ψ1 ◦ ψ2 (H) = ψ1 (f −1 (H)) =
f (f −1 (H)) = H ∩ f (G) = H ∩ G/H = H. 

Proposição 10.20. Sejam G um grupo, H C G e K < G. Então existe um


isomorfismo de grupos
K KH
ϕ: → .
(K ∩ H) H
Demonstração. Seja f : K → KH/H o homomorfismo quociente f (x) :=
xH. Afirmamos que f é sobrejetivo. De fato, se abH ∈ KH/H, então abH =
aH = f (a). Afirmamos também que ker(f ) = H ∩ K. De fato, se a ∈ ker(f ),
então f (a) = aH ∈ H, i.e., a ∈ H ∩ K. Portanto, o resultado é uma conseqüência
do teorema do isomorfismo. 

Proposição 10.21. Sejam K < H < G grupos com H C G e K C G (em


particular K C H). Então existe um isomorfismo de grupos
G/K G
ϕ: → .
H/K H
Demonstração. Seja f : G/K → G/H definida por f (xK) := xH. Ob-
servemos que f está bem definida. Seja x = ya para a ∈ K. Então f (xK) =
xH = (ya)H = (yH)(aH) = yH, pois a ∈ K ⊂ H. ker(f ) = {xK | xH = H} =
{xK | x ∈ H} = H/K. f é sobrejetiva por definição. Assim o resultado segue do
teorema do isomorfismo. 

Definição 10.22. Seja G um grupo. Um homomorfismo de grupos f : G →


G é chamado um endomorfismo de grupos e denotamos por End(G) o conjunto
dos endomorfismos de G que é um monóide com respeito à composição de funções.
Um monóide tem todas as propriedades de grupo exceto a existência do inverso.
Se f for bijetivo então dizemos que f é um automorfismo de G e denotamos por
Aut(G) o conjunto dos automorfismos de G. Este é um grupo com respeito à
composição de funções.

Observação 10.23. Para todo a ∈ G, Ia : G → G definida por Ia (x) :=


axa−1 é um automorfismo de G chamado um automorfismo interno de G. O
80 10. TEORIA DE GRUPOS II

conjunto G := {Ia | a ∈ G} dos automorfismos internos de G também é um


grupo com respeito à composição de funções. Fica como exercı́cio mostrar que
I(G) C Aut(G).

Definição 10.24. Seja G um grupo e H < G. Dizemos que H é um subgrupo


caracterı́stico de G se para todo σ ∈ Aut(G) temos σ(H) ⊂ H, i.e., para todo
x ∈ H, σ(x) ∈ H.

Observação 10.25. Notemos que se H for subgrupo caracterı́stico de G,


então H C G, pois a última afirmativa equivale a dizer que Ia (H) ⊂ H para todo
a ∈ H.

Proposição 10.26. Se K for subgrupo caracterı́stico de H e H C G, então


K C G.

Demonstração. Queremos mostrar que para todo a ∈ G, Ia (K) ⊂ K. A


restrição de Ia a H nos dá uma função Ja : H → G definida por Ja (x) := axa−1 .
Por hipótese H C G, logo axa−1 ∈ H e Ja ∈ Aut(H) (não podemos garantir que
Ja ∈ I(H), pois não necessariamente a ∈ H). Por hipótese, K é caracterı́stico
em H, logo Ja (K) = Ia|H (K) = K. 

10.27. Produtos de grupos


10.27.1. Produto direto. Sejam G1 , · · · , Gn grupos. Definimos no produto
cartesiano G1 × . . . × Gn uma estrutura de grupo da seguinte forma:

(x1 , · · · , xn ).(y1 , · · · , yn ) := (x1 y1 , · · · , xn yn ).

É fácil verificar que esta operação é associativa, o elemento neutro é (1, · · · , 1) e o


inverso de (x1 , · · · , xn ) é (x−1 −1
1 , · · · , xn ). Assim o conjunto G1 × . . . × Gn passa a
ter uma estrutura de grupo e é chamado o produto direto dos grupos G1 , · · · , Gn
e é denotado por G1 ⊕ . . . ⊕ Gn .

Teorema 10.28. Sejam G, G1 , · · · , Gn grupos. Então G ∼ = G1 ⊕ . . . ⊕ Gn se


e somente se existem subgrupos H1 , · · · , Hn de G tais que para todo i, Hi ∼= Gi ,
e além disto
(1) G = H1 . . . Hn .
(2) Hi C G para todo i = 1, · · · , n.
(3) Hi ∩ (H1 . . . Hi1 Hi+1 . . . Hn ) = {1} para todo i = 1, · · · , n.
10.27. PRODUTOS DE GRUPOS 81

Demonstração. Suponhamos que exista um isomorfismo ϕ : G → G1 ⊕


. . . ⊕ Gn . Seja
Hi := ϕ−1 ({1} × . . . × Gi × . . . {1}).
Definimos a seguinte função
ϕi : Hi → Gi dada por ϕi (xi ) := yi ,
onde xi = ϕ((1, · · · , yi , · · · , 1)). Esta função é um isomorfismo de grupos. De
fato, se zi = ϕ−1 ((1, · · · , wi , · · · , 1)), então
ϕi (xi zi ) = yi wi = ϕi (xi )ϕi (yi ),
pois xi zi = ϕ−1 ((1, · · · , zi wi , · · · , 1)). Além disto ϕi é injetiva, pois se yi = 1,
então xi = 1. Finalmente é sobrejetiva pois para todo yi ∈ Gi , xi = ϕ−1 ((1, · · · , yi , · · · ,
1)) e ϕi (xi ) = yi .
(1) Dado x ∈ G seja ϕ(x) := (x1 , · · · , xn ). Então ϕ(x) = (x1 , · · · , 1). . . . .(1, · · ·
, xn ). Seja yi = ϕ−1 ((1, · · · , xi , · · · , 1)), então x = y1 . . . yn , onde yi ∈ Hi para
todo i = 1, · · · , n.
(2) Seja x ∈ G e yi ∈ Hi temos que provar que xyi x−1 ∈ Hi . Calculemos
ϕ(xyi x−1 ) = ϕ(x)ϕ(yi )ϕ(x)−1 = (x1 , · · · , xn ).(1, · · · , zi , · · · , 1).(x−1 −1
1 , · · · , xn )
−1 −1
= (x1 x−1 −1
1 , · · · , xi zi xi , · · · , xn xn ) = (1, · · · , xi zi xi , · · · , 1).

Portanto, xyi x−1 = ϕ−1 ((1, · · · , xi zi x−1


i , · · · , 1)) ∈ Hi .
(3) Seja xi ∈ Hi ∩ (H1 . . . Hi−1 Hi+1 . . . Hn ). Assim, por um lado xi = ϕ−1 ((1,
· · · , yi , · · · , 1)) e por outro lado xi = ϕ−1 ((z1 , · · · , zi−1 , 1, zi+1 , · · · , zn )). Como
ϕ é um isomorfismo concluimos que zj = 1 para todo j e que yi = 1, portanto
xi = 1.
Reciprocamente, suponhamos que as 3 condições acima sejam satisfeitas. Para
provar a recı́proca utilizaremos o ı́tem 2 do lema seguinte. Afirmamos que G ∼ =
H1 ⊕ . . . ⊕ Hn . De fato, consideremos a função
ψ : G → H1 ⊕ . . . ⊕ Hn dada por ψ(x) = ψ(x1 . . . xn ) := (x1 , · · · , xn ).
Esta função é um isomorfismo. Observe que pelo lema abaixo
ψ(xy) = ψ(x1 . . . xn y1 . . . yn ) = ψ(x1 y1 x2 . . . xn y2 . . . yn ) = · · · = ψ(x1 y1 . . . xn yn )
= (x1 y1 , · · · , xn yn ) = (x1 , · · · , xn ).(y1 , · · · , yn ) = ψ(x)ψ(y).
Se ψ(x) = (1, · · · , 1), então x = 1 . . . 1 = 1, logo ψ é injetiva. Para todo
(x1 , · · · , xn )
82 10. TEORIA DE GRUPOS II

∈ H1 ⊕ . . . ⊕ Hn se x = x1 · · · xn temos que ψ(x) = (x1 , · · · , xn ), logo ψ é


sobrejetiva. 

Lema 10.29. As 3 condições acima são equivalentes às seguintes duas condi-
ções:
(a) Para todo x ∈ G existem únicos xi ∈ Hi para i = 1, · · · , n tais que
x = x1 . . . xn .
(b) Para todo i 6= j, x ∈ Hi e y ∈ Hj , xy = yx.

Demonstração. Suponha que as 3 condições anteriores sejam satisfeitas.


Assim para todo x ∈ G podemos escrever x = x1 . . . xn . Suponhamos que x =
y1 . . . yn , então
y1−1 x1 = y2 . . . yn x−1 −1
n . . . x2 .

Como Hi C G temos que para todo x ∈ G, xHi = Hi x, i.e., dado αi ∈ Hi temos


que xαi = βi x para algum βi ∈ Hi . Logo

(yn x−1 −1 −1
n )xn−1 = zn−1 (yn xn )

para algum zn−1 ∈ Hn−1 . Repetindo o argumento concluimos que

y1−1 x1 = y2 . . . yn x−1 −1 −1
n . . . x2 = z2 . . . zn−1 (yn xn ) ∈ H2 . . . Hn ∩ H1 = {1},

portanto x1 = y1 . Pelo mesmo argumento xi = yi para todo i = 2, · · · , n.


Como Hi , Hj C G temos que xyx−1 ∈ Hj , logo xyx−1 y −1 ∈ Hj e yx−1 y −1 ∈
Hi , logo xyx−1 y −1 ∈ Hi , portanto xy = yx, já que

Hi ∩ Hj ⊂ Hi ∩ (H1 . . . Hi−1 Hi+1 . . . Hn ) = {1}.

Reciprocamente, suponha as duas últimas condições satisfeitas. A primeira


condição do teorema segue automaticamente de (a). Seja x = x1 . . . xn ∈ G,
yi ∈ Hi e zi = xi yi x−1
i . Então, por (b),

xyi x−1 = x1 . . . xn yi x−1 −1 −1


n . . . x1 = x1 . . . xn−1 yi xn−1 . . . x1 = · · ·

= x1 . . . xi yi x−1 −1 −1 −1
i . . . x1 = x1 . . . xi−2 zi xi−2 . . . x1 = · · · = zi ∈ Hi .

Finalmente, se xi ∈ Hi ∩ (H1 . . . Hi−1 Hi+1 . . . Hn , pela unicidade de (a) temos que


xi = 1. 
10.27. PRODUTOS DE GRUPOS 83

10.29.1. Produtos semi-diretos de grupos. Na seção anterior dados dois


grupos H e K construimos o produto direto H ⊕ K com a operação componente
a componente. Nesta seção modificaremos levemente o procedimento. Lembre
que Aut(K) (o conjunto dos automorfismos de K) é um grupo com respeito a
composição de automorfismos. Suponhamos que seja dado um homomorfismo de
grupo σ : H → Aut(K). Definimos no produto cartesiano H × K uma nova
operação da seguinte forma:
(x, y) σ (z, w) := (xz, yσ(x)(w)),
note que σ(x) : K → K é um automorfismo de K, logo σ(x)(w) ∈ K.
Afirmamos que H × K com a operação σ é um grupo, chamado o produto
semi-direto de H e K com respeito a σ e denotado por H nσ K. De fato,
((x1 , y1 ) σ (x2 , y2 )) σ (x3 , y3 ) = (x1 x2 , y1 σ(x1 )(y2 )) σ (x3 , y3 )
= ((x1 x2 )x3 , (y1 σ(x1 )(y2 ))σ(x1 x2 )(y3 ))
= (x1 (x2 x3 ), (y1 σ(x1 )(y2 ))(σ(x1 )(σ(x2 )(y3 ))))
= (x1 (x2 x3 ), y1 σ(x1 )(y2 σ(x2 )(y3 )))
= (x1 , y1 ) σ (x2 x3 , y2 σ(x2 )(y3 ))
= (x1 , y1 ) σ ((x2 , y2 ) σ (x3 , y3 )).
O elemento neutro é (1, 1). De fato,
(1, 1) σ (x, y) = (x, σ(1)(y)) = (x, y) e
(x, y) σ (1, 1) = (x, yσ(x)(1)) = (x, y).
O inverso de (x, y) é (x−1 , σ(x−1 )(y −1 )). De fato,
(x, y) (x−1 , σ(x−1 )(y −1 )) = (1, yσ(x)(σ(x−1 )(y −1 ))) = (1, yy −1 ) = (1, 1) e
(x−1 , σ(x−1 )(y −1 )) σ (x, y) = (1, σ(x−1 )(y −1 )σ(x−1 )(y))
= (1, σ(x−1 )(y −1 y)) = (1, σ(x−1 )(1)) = (1, 1).

Proposição 10.30.
n−1
Y
n n
(a) (x, y) = (x , σ(xi )(y)).
i=0

Conseqüentemente, (x, 1) = (x , 1) e (1, y)n = (1, y n ).


n n

(b) (1, y) σ (x, 1) = (x, y).


(c) {1} nσ K C H nσ K.
84 10. TEORIA DE GRUPOS II

(d) H nσ {1} ⊂ H nσ K é um subgrupo. Este subgrupo é normal, se σ = id.

Demonstração. (a) Vamos provar por indução. Para n = 2,

(x, y) σ (x, y) = (x2 , yσ(x)(y)).

Suponha que o resultado vale para n. Então


n−1
Y
n+1 n n
(x, y) = (x, y) σ (x, y) = (x , σ(xi )(y)) σ (x, y))
i=0
n−1
Y n
Y
n+1 i n n+1
= (x , σ(x )(y)σ(x )(y)) = (x , σ(xi )(y)).
i=0 i=0

(2) Segue da definição.


(3) Primeiro verifiquemos que {1} nσ K é de fato um subgrupo de H nσ K.
É claro que (1, 1) ∈ {1} nσ K. Se (1, x), (1, y) ∈ {1} nσ K, então

(1, x) σ (1, y) = (1, xσ(1)(y)) = (1, xy) ∈ {1} nσ K.

Além disto
(1, x)−1 = (1, σ(1)(x−1 )) = (1, x−1 ) ∈ {1} nσ K.
Dado (x, y) ∈ H nσ K e (1, z) ∈ {1} nσ K, então

(x, y) σ (1, z) σ (x, y)−1 = (x, yσ(x)(z)) σ (x−1 , σ(x−1 )(y −1 ))


= (1, yσ(x)(z)σ(x)(σ(x−1 (y −1 ))))
= (1, yσ(x)(zσ(x−1 (y −1 )))) ∈ {1} nσ K.

(4) É claro que (1, 1) ∈ H nσ {1}. Se (x, 1), (y, 1) ∈ H nσ {1}, então

(x, 1) σ (y, 1) = (xy, σ(x)(1)) = (xy, 1) ∈ H nσ {1}.

Além disto

(x, 1)−1 = (x−1 , σ(x−1 )(1)) = (x−1 , 1) ∈ H nσ {1}.

Exemplo 10.31. Lembremos que S3 = {1, α, α2 , β, αβ, α2 β} é caracterizado


por o(α) = 3, o(β) = 2 e βα = α2 β, i.e., βαβ −1 = α2 . Neste caso K = hαi =
{1, α, α2 } e H = hβi = {1, β}. Isto permite-nos definir o seguinte homomorfismo

σ : H → Aut K por σ(β)(α) := α2


10.33. GRUPOS METACÍCLICOS 85

(verifique que isto é um homorfismo de grupo). Seja a = (1, α) e b = (β, 1).


Verifiquemos que estes satisfazem à descrição de S3 , portanto H nσ K ∼
= S3 . De
fato,
a3 = (1, α3 ) = (1, 1),
b2 = (β 2 , 1) = (1, 1) e
ba = (β, 1) (1, α) = (β, σ(β)(α)) = (β, α2 ) e
a2 b = (1, α2 ) σ (β, 1) = (β.α2 σ(1)(1)) = (β, α2 ) = ba.

Lema 10.32. Seja H = hαi um grupo cı́clico de ordem n, K = hβi um grupo


cı́clico de ordem m. Então existem bijeções
Hom(K, Aut(H)) → {τ ∈ Aut(H) | o(τ ) | m}
σ 7→ σ(β)
e
{τ ∈ Aut(H) | o(τ ) | m} → {1 ≤ s ≤ n − 1 | sm ≡ 1 (mod n)}
τ 7→ s, onde τ (α) = αs .

Demonstração. Note que a primeira função está de fato bem definida,


pois σ(β)m = σ(β m ) = σ(1) = id. É injetiva pois 2 automorfismos calculados no
gerador β de H são necessariamente iguais. Se τ ∈ Aut(H) satisfaz o(τ ) | m,
então τ (α)m = τ (αm ) = 1, logo αm = 1, pelo lema chave o(α) = n | m, logo
existe um homomorfismo σ : K → Aut(H) tal que σ(β) = τ .
Para a segunda, basta observar que Aut(H) → (Z/nZ)∗ dada por τ 7→ s,
onde τ (α) = αs é um isomorfismo de grupos. Neste isomorfismo o(τ ) | m se e
somente se sm ≡ 1 (mod n). 
Como conseqüência deste lema temos que se existem inteiros m, n, s ≥ 0 tais
que sm ≡ 1 (mod n), então existe um grupo G com #G = nm, G = hα, βi,
o(α) = n, o(β) = m e βαβ −1 = αs . De fato, da condição numérica e do lema
sabemos que o automorfismo τ : hαi → hαi por τ (α) = αs tem ordem o(τ ) | m.
Logo existe um homomorfismo σ : hβi → Aut(hαi). Basta tomar o produto
semi-direto hβi nσ hαi para obter um tal G.
Para mais tipos de produtos de grupos veja [?, chapter 2].

10.33. Grupos metacı́clicos


O objetivo desta seção é descrever grupos metacı́clicos que generalizam o D4
e S3 .
86 10. TEORIA DE GRUPOS II

Teorema 10.34. Seja G um grupo finito, s ≥ 1 inteiro, a, b ∈ G tais que


ba = as b (i.e., Ib (a) = as ). Seja G um grupo e α, β ∈ G. Sejam m, n ≥ 1 inteiros
tais que an = 1 e bm ∈ hai.
(1) Para todo s, t ≥ 1 temos
t
bt ar = ars bt .

Em particular,

ha, bi = {ai bj | 0 ≤ i ≤ n − 1, 0 ≤ j ≤ m − 1}.

Além disto, se m e n forem escolhidos mı́nimos para esta propriedade,


temos que #ha, bi = mn.
(2) Supondo m e n mı́nimos, seja u ≥ 0 tal que bm = au . Então existe um
homomorfismo f : ha, bi → G tal que f (a) = α e f (b) = β se e somente
se βα = αs β, αn = 1 e β m = αu .

Demonstração. (1) Vamos provar por indução. Vamos supor primeiro que
t
r = 0 e provar que Ibt (ar ) = ars . Se t = 1, então já sabemos que Ib (a) = as .
Suponhamos que isto valha para t − 1. Então
t−1 t−1 t−1 t
Ibt (ar ) = Ib ◦ Ibt−1 (ar ) = Ib (ars ) = Ib (a)rs = (as )rs = ars .

Por definição, ha, bi é formado por produtos de elementos que são iguais a a
(ou a−1 ) e b (ou b−1 ). Utilizando o resultado acima, podemos sempre colocar a
potência de a em primeiro lugar e escrever ai bj para i, j ∈ Z. Além disto, pelas
hipóteses sobre m e n obtemos que basta tomar 0 ≤ i ≤ n − 1 e 0 ≤ j ≤ m − 1.
Observemos também que se m e n forem mı́nimos então os elementos de

ha, bi = {ai bj | 0 ≤ i ≤ n − 1, 0 ≤ j ≤ m − 1}

são todos distintos, portanto sua ordem é mn. De fato, se ai bj = ak bl , então


ai−k = bl−j ∈ hai, digamos que l ≥ j. Neste caso, l − j < m, logo l = j e
ai−k = 1, bem como ak−i . Tomando o expoente positivo dentre os 2 e notando
que este expoente é menor que n concluimos que i = k.
(2) É claro que

αn = f (a)n = f (an ) = f (1) = 1,


β m = f (b)m = f (bm ) = f (au ) = f (a)u = αu e que
βα = f (b)f (a) = f (ba) = f (as b) = f (a)s f (b) = αs β.
10.37. CLASSIFICAÇÃO DE GRUPOS DE ORDEM ≤ 11 87

Para verificar a recı́proca basta definir

f : ha, bi → G por f (ai bj ) := αi β j

e provar que isto realmente é um homomorfismo. De fato,


j j j
f (ai bj ak bl ) = f (ai aks bj bl ) = f (ai+ks bj+l ) = αi+ks β j+l
j
= αi (αks β j )β l = αi β j αk β l = f (ai bj )f (ak bl ).

Teorema 10.35. Sejam m, n, s, u ≥ 0 inteiros. Existe um grupo G de ordem


nm e a, b ∈ G tais que G = ha, bi, an = 1, bm = au e ba = as b se e somente se
sm ≡ 1 (mod n) e u(s − 1) ≡ 0 (mod n).
m
Demonstração. Note que pelo teorema anterior, bm a = as bm . Mas, bm =
m m
au , logo bm a = abm = as bm , em particular as −1 = 1 e pelo lema chave, n |
(sm − 1). De novo pelo teorema anterior, bau = aus b. Mas au = bm , logo
bau = au b = aus b, i.e., au(s−1) = 1, assim n | (u(s − 1)). A recı́proca segue da
construção do final da seção anterior. 

Proposição 10.36. Sejam m, n, s, u ≥ 0 inteiros, G um grupo de ordem nm.


Suponha que existam a, b ∈ G tais que G = ha, bi, ba = as b, an = 1 e bm = au .
Então a função

Aut(G) → {(α, β) ∈ G × G | G = hα, βi, βα = αs β, αn = 1, β m = αu }


f 7→ (f (a), f (b))

é bijetiva.

Demonstração. Segue do primeiro teorema que f (a) e f (b) satisfazem as


condiç ões do conjundo do lado direito. A função é injetiva, pois a e b geram G,
assim um homomorfismo fica unicamente determinado pelo seu valor nos gerado-
res. Novamente o primeiro teorema mostra que a função é sobrejetiva. 

10.37. Classificação de grupos de ordem ≤ 11


Comecemos observando que todo grupo cı́clico de ordem n é isomorfo a Z/nZ.
De fato, se G é cı́clico de ordem n significa que G = {1, a, · · · , an−1 } para algum
gerador a de G. Consideremos a função f : G → Z/nZ definida por f (a) = 1.
Exercı́cio: verifique que esta função é um isomorfismo de grupos.
88 10. TEORIA DE GRUPOS II

10.37.1. Grupos de ordem : 2,3,5,7,11. Estes números são primos, logo


(pelo teoream de Lagrange) todo a ∈ G − {1} tem ordem p, portanto G é cı́clico,
i.e., G ∼
= Z/nZ.

10.37.2. Grupos de ordem 4. Se existe a ∈ G tal que o(a) = 4, então G


é cı́clico. Logo G ∼
= Z/4Z.
Suponhamos que para todo a ∈ G − {1}, o(a) = 2 (que é a única possibilidade
pelo teorema de Lagrange). Portanto G é um grupo abeliano. Seja a ∈ G − {1} e
b ∈ G − hai. Assim, G = {1, a, b, ab}. Neste caso a função f : G → Z/2Z × Z/2Z
definida por f (1) = (0, 0), f (a) = (1, 0), f (b) = (0, 1) e f (ab) = (1, 1) é um
isomorfismo de grupos.

10.37.3. Grupos de ordem 6. Se existe a ∈ G tal que o(a) = 6, então G


é cı́clico e G ∼
= Z/6Z.
Suponhamos que não exista a ∈ G tal que o(a) = 6. Pelo teorema de La-
grange, para todo a 6= 1 as possibilidades para a sua ordem são 2 e 3.

Lema 10.38. Existe a ∈ G tal que o(a) = 3.

Demonstração. De fato, suponhamos que para todo a ∈ G−{1} tenhamos


o(a) = 2. Seja a ∈ G − {1} e b ∈ G − hai. Neste caso, ha, bi é um subgrupo de G
de ordem 4, o que contradiz o teorema de Lagrange. 

Lema 10.39. Existe b ∈ G tal que o(b) = 2.

Demonstração. De fato, suponhamos que para todo b ∈ G − {1} tenhamos


o(b) = 3. Seja a ∈ G tal que o(a) = 3 e b ∈ G − hai. O subgrupo ha, bi de G tem
ordem 9, o que novamente contradiz o teorema de Lagrange. 

Utilizando os valores das ordens de a e b vemos que G = {1, a, a2 , b, ab, a2 b}


e que ba 6= 1, a, a2 , b. Assim, ba = ab ou a2 b. No primeiro caso, G é abeliano
e a função f : G → Z/3Z × Z/2Z definida por f (1) = (0, 1), f (a) = (1, 0),
f (a2 ) = (2, 0), f (b) = (0, 1), f (ab) = (1, 1), f (a2 b) = (2, 1) é um isomorfismo
de grupos. Mas pelo teorema chinês dos restos, Z/3Z × Z/2Z ∼ = Z/6Z, assim
2
descartamos este caso. O caso em que ba = a b é exatamente o caso em que
G∼ = S3 .

10.39.1. Grupos de ordem 8. Se existe a ∈ G tal que o(a) = 8 então G é


cı́clico e G ∼
= Z/8Z.
10.37. CLASSIFICAÇÃO DE GRUPOS DE ORDEM ≤ 11 89

Suponha que para todo a ∈ G − {1}, o(a) = 2. Neste caso G é abeliano.


Seja a ∈ G tal que o(a) = 2, seja b ∈ G − hai e c ∈ G − ha, bi. Note que
o subgrupo ha, b, ci = {1, a, b, c, ab, ac, bc, abc} tem ordem 8, logo G = ha, b, ci.
Observe também que f : G → Z/2Z × Z/2Z × Z/2Z definida por f (1) = (0, 0, 0),
f (a) = (1, 0, 0), f (b) = (0, 1, 0), f (c) = (0, 0, 1), f (ab) = (1, 1, 0), f (ac) =
(1, 0, 1), f (bc) = (0, 1, 1) e f (abc) = (1, 1, 1) é um isomorfismo de grupos.
Assim, suponha que exista a ∈ G tal que o(a) = 4. Seja b ∈ G − hai.
Note que ha, bi = {1, a, a2 , a3 , b, ab, a2 b, a3 b} e que estes elementos são distintos,
portanto G = ha, bi. Observe também que como (G : hai = 8/4 = 2, então
(bhai)2 = hai, i.e., b2 hai. Observe também que trivialmente b2 6= b, ab, a2 b, a3 b e
ba 6= 1, a, a2 , a3 , b. Pelo segundo teorema as únicas possibilidades para u e s tais
que b2 = au e ba = as b são u = 0 ou 2 e s = 1 ou 3.
Se u = 0 e s = 1, temos que ba = ab e o(b) = 2. O grupo G é abeliano.
A função f : G → Z/4Z × Z/2Z definida por f (1) = (0, 0), f (a) = (1, 0),
f (a2 ) = (2, 0), f (a3 ) = (3, 0), f (b) = (0, 1), f (ab) = (1, 1), f (a2 b) = (2, 1) e
f (a3 b) = (3, 1) é um isomorfismo de grupos.
Se u = 0 e s = 3, temos que ba = a3 b e o(b) = 2, neste caso G ∼ = D4 .
Se u = 2 e s = 0, temos que ba = ab e b2 = a2 . O grupo G é abeliano. A função
f : G → Z/4Z × Z/2Z definida por f (1) = (0, 0), f (a) = (1, 0), f (a2 ) = (2, 0),
f (a3 ) = (3, 0), f (ab) = (0, 1), f (b) = (3, 1), f (a2 b) = (1, 1) e f (a3 b) = (2, 1) é um
isomorfismo de grupos.
Finalmente, se u = 2 e s = 3, temos que ba = a3 b e b2 = a2 . Neste caso
G é isomorfo ao grupo Q dos quaternions descrito da seguinte forma. Q é um
subgrupo das matrizes 2 × 2 com entradas complexas e determinante não nulo.
Ele é definido por
( ! ! ! !)
1 0 i 0 0 1 0 i
± ,± , ± ,± .
0 1 0 −i −1 0 i 0
Basta tomar ! !
i 0 0 1
a= eb= .
0 −i −1 0

10.39.2. Grupos de ordem 9. Se existe a ∈ G tal que o(a) = 9, então G


é cı́clico e G ∼
= Z/9Z.
Caso isto não ocorra para todo a ∈ G − {1}, o(a) = 3. Seja b ∈ G − hai.
Note que o subgrupo ha, bi = {1, a, a2 , b, b2 , ab, ab2 , a2 b, a2 b2 } de G tem ordem 9,
portanto sendo igual ao próprio grupo G. Observe também que ba 6= 1, a, a2 , b, b2 .
90 10. TEORIA DE GRUPOS II

Assim, e pelo segundo teorema, ba = ab, logo G é abeliano. Neste caso G ∼ =


Z/3Z × Z/3Z (exercı́cio: determine explicitamente o isomorfismo, como nos casos
anteriores).
10.39.3. Grupos de ordem 10. Se existe a ∈ G tal que o(a) = 10, G é
cı́clico e G ∼
= Z/10Z.
Caso contrário, como nos casos anteriores existem a, b ∈ G tais que o(a) = 5 e
o(b) = 2 (verifique!). Pelo segundo teorema as únicas possibilidades para ba = as b
são s = 1 ou 4. No primeiro caso, G é abeliano e G ∼ = Z/5Z × Z/2Z, mas este é
isomorfo a Z/10Z, assim não consideramos este caso. No outro caso, G ∼ = D5 , o
grupo diedral de ordem 10.
10.39.4. Grupos diedrais. Estes grupos têm ordem 2n, um elemento a de
ordem n e outro elemento b de ordem 2 satisfazendo a ba = an−1 b.
CAPı́TULO 11

Teoremas de Sylow

11.1. Represesentações de grupos


Seja G um grupo finito e S um conjunto finito. Denotamos por Perm(S) o
conjunto das permutações de S, i.e., das funções f : S → S bijetivas. Este con-
junto forma um grupo com respeito à composição de funções. Uma representação
de G por permutação é um homomorfismo de grupos ρ : G → Perm(S).

Exemplo 11.2. Tomemos como S o próprio grupo G e consideremos para


todo x ∈ G o automorfismo interno Ix de G definido por Ix (a) := xax−1 . Assim
definimos a função ρ : G → Aut(G) dada por ρ(x) := Ix . Verifiquemos que
esta função é um homomorfismo de grupos. Esta representação é chamada a
representação de G por conjugação. De fato, dado a ∈ G temos
ρ(xy)(a) = (xy)a(xy)−1 = xyay −1 x−1 = xIy (a)x−1 = Ix (Iy (a)) = (Ix ◦ Iy )(a).
Outra representação com S = G é a translação ρ : G → Aut(G) dada por
ρ(x)(a) := xa para todo a ∈ G. De fato, ρ(x) é um automorfismo de G (exercı́cio)
e
ρ(xy)(a) = xya = xρ(y)(a) = ρ(x)(ρ(y)(a)) = (ρ(x) ◦ ρ(y))(a).
Esta representação de G é chamada representação por translação.
Observe que neste último caso a função ρ é injetiva. De fato se ρ(x) = id,
então xa = a para todo a ∈ G. Isto significa que x = 1. Como conseqüência
deste resultado temos o teorema de Cayley.

Teorema 11.3 (teorema de Cayley). Seja G um grupo de ordem n, então G


é isomorfo a um subgrupo do grupo Sn das permutações de n elementos.

Demonstração. Tome a representação ρ por translação em G e conclua


que G ∼
= ρ(G) com ρ(G) subgrupo de Sn . 

Exemplo 11.4. Seja S o conjunto de subgrupos de G e consideremos a função


ρ : G → Perm(S) dada por ρ(x)(H) := xHx−1 . Observemos que ρ(x) é de fato
91
92 11. TEOREMAS DE SYLOW

uma bijeção em S (exercı́cio) e que


ρ(xy)(H) = xyHy −1 x−1 = xρ(y)(H)x−1 = ρ(x)(ρ(y)(H)) = (ρ(x) ◦ ρ(y))(H).
Observe que como #H = #xHx−1 , então podemos restringir a representação
anterior ao conjunto dos subgrupos H de G com ordem fixada n.

Exemplo 11.5. Seja H um subgrupo de G e S o conjunto das classes laterais


a direita de H em G, i.e., S := {aH ; a ∈ G}. Consideremos a função ρ : G →
Perm(G) dada por ρ(x)(aH) := xaH. De novo fica como exercı́cio verificar que
ρ(x) é de fato uma permutação de S. Além disto
ρ(xy)(aH) = xy(aH) = xρ(y)(aH) = ρ(x)(ρ(y)(aH)) = (ρ(x) ◦ ρ(y))(aH).

Dada uma representação por permutação ρ : G → Perm(S) definimos a órbita


Oa de um elemento a ∈ S por
Oa := {ρ(x)(a) ; x ∈ G}.
O estabilizador de a é definido por
E(a) := {x ∈ G ; ρ(x)(a) = a}.
Observemos que E(a) é um subgrupo de G. De fato, 1 ∈ E(a), pois ρ(1) = id e
portanto ρ(1)(a) = a, i.e., ρ(1) ∈ E(a). Se x, y ∈ E(a), então
ρ(xy)(a) = ρ(x)(ρ(y)(a)) = ρ(x)(a) = a, i.e., xy ∈ E(a).
Finalmente, ρ(x−1 ) = ρ(x)−1 , pois ρ é um homomorfismo. Portanto, ρ(x−1 )(a) =
ρ(x)−1 (a) = a, i.e., x−1 ∈ E(a). Pelo teorema de Lagrange temos que #E(a)
divide #G. É menos imediato que o mesmo ocorre com #Oa . Isto segue da
proposição seguinte.

Proposição 11.6. Existe uma bijeção


ϕ : Oa → {C.L.D.} dada por ϕ(ρ(x)(a)) := xE(a),
o conjunto do lado direito é o conjunto das classes laterais a direita de E(a) em
G. Em particular (novamente pelo teorema de Lagrange), #Oa divide #G.

Demonstração. Inicialmente, ϕ está bem definida pois se ρ(x)(a) = ρ(y)(a),


então ρ(xy −1 )(a) = a, i.e., xy −1 ∈ E(a), i.e., xE(a) = yE(a). A função é injetiva
uma vez que se ϕ(ρ(x)(a)) = ϕ(ρ(y)(a)), i.e., xE(a) = yE(a), então xy −1 ∈ E(a),
logo ρ(xy −1 )(a) = a, i.e., ρ(x)(a) = ρ(y)(a). Finalmente, pela própria definição
do conjunto do lado direito, ϕ é sobrejetiva. 
11.7. OS TEOREMAS DE SYLOW 93

Dada uma representação ρ : G → Perm(S) definimos a seguinte relação de


equivalência (verifique!) :
a ∼ b se e somente se existe x ∈ G tal que ρ(x)(a) = b.
Em particular, a classe de equivalência de a nada mais é que a sua órbita Oa .
Além disto o conjunto S fica escrito como a união disjunta das órbitas Oa .
Comecemos considerando o caso do exemplo 11.2. Neste caso
Oa = {xax−1 ; x ∈ G}
é o conjunto dos conjugados de G. Assim,
Oa = {a} se e somente se a ∈ Z(G).
Desta forma obtemos a equação das classes de conjugação
X
(11.6.1) #G = #Z(G) + #Oa .
a∈Z(G)
/

Ainda neste exemplo, o estabilizador E(a) de a é chamado o centralizador de a


dado por
Z(a) = {x ∈ G ; xa = ax}.
No caso do exemplo 11.4, a órbita de H é dada por
OH = {xHx−1 ; x ∈ G}
é chamado o conjunto dos conjugados de H e o estabilizador de H é chamado o
normalizador de H em G denotado por
NG (H) = {x ∈ G ; xHx−1 = H}.
Observemos que H C G se e somente se NG (H) = G. Além disto da própria
definição H C NG (H). O grupo NG (H) também se caracteriza como sendo o
maior subgrupo de G no qual H é normal. De fato, se K ⊂ G for um subgrupo
e H C K, então para todo x ∈ K temos xHx−1 = H, i.e., x ∈ NG (H), i.e.,
K ⊂ NG (H).

11.7. Os teoremas de Sylow


Seja G um grupo finito e p um número primo. Suponhamos que p | #G,
digamos #G = pn b, onde p - b.

Teorema 11.8 (primeiro teorema de Sylow). Para todo 0 ≤ m ≤ n existe


um subgrupo H de G de ordem pm .
94 11. TEOREMAS DE SYLOW

Definição 11.9. Um subgrupo de G de ordem pn é chamado um p-subgrupo


de Sylow de G.

Lema 11.10 (lema de Cauchy). Seja G um grupo abeliano e suponha que


p | #G, então existe x ∈ G tal que o(x) = p.
Observe que o primeiro teorema de Sylow generaliza o lema de Cauchy para
grupos não necessariamente abelianos.
Demonstração. A prova será por indução na ordem de G. Se #G = 1,
por vacuidade nada há a fazer. Suponha que o resultado seja verdade para todo
subgrupo de ordem menor que a ordem de G. Se #G = p nada há a fazer, o
grupo é cı́clico e basta tomar um gerador. Suponhamos que |G| =6 p.
Afirmamos que existe um subgrupo H de G tal que 1 < #H < #G. De fato,
seja x ∈ H − {1}. Se hxi = 6 G, tome H = hyi. Caso hxi = G, tome H = hxp i.
Se p | #H, então por hipótese de indução existe x ∈ H com o(x) = p, em
particular x ∈ G. Caso p - #H, então p | #G/H e #G/H < #G.
Novamente por hipótese de indução existe x ∈ G/H tal que o(x) = p. Con-
sideremos o homomorfismo sobrejetivo ϕ : G  G/H. Seja r = o(x). Então
o(x) = p | r, digamos r = kp. Desta forma o(xk ) = p. 
demonstração do primeiro teorema de Sylow. Novamente a prova se-
rá por indução na ordem de G. Se #G = 1, nada há a fazer. Suponhamos que o
resultado seja verdade para todo grupo de ordem menor que #G. Se existe um
subgrupo próprio H de G tal que pm | #H, então por hipótese de indução temos
que existe um subgrupo de H de ordem pm , em particular existe um subgrupo
de G desta ordem.
Suponhamos que não exista subgrupo próprio de G cuja ordem seja divisı́vel
por pm . A equação das classes de conjugação afirma que
X
#G = #Z(G) + (G : E(a)).
a∈Z(G)
/

Para todo a ∈/ Z(a) temos que (G : E(a)) = #Oa > 1, logo #E(a) < #G. Por
m
hipótese p - |E(a)|, assim p | (G : E(a)). Em particular, p | #Z(G).
Como Z(G) é abeliano, concluimos do lema de Cauchy que existe x ∈ Z(G) tal
que o(x) = p. Note que como x ∈ Z(G), então hxi C G, portanto o grupo G/hxi
tem ordem pn−1 b < #G. Por hipótese de indução existe K subgrupo de G/hxi
tal que #K = pm−1 . Consideremos o homomorfismo canônico ϕ : G  G/hxi.
Então H = ϕ−1 (K) é um subgrupo de G de ordem pm . 
11.7. OS TEOREMAS DE SYLOW 95

Lembremos que dado um grupo qualquer (não necessariamente finito) G e um


número primo p, dizemos que G é um p-grupo se todo elemento de G tem ordem
potência de p. Utilizaremos o primeiro teorema de Sylow para provar a seguinte
proposição.

Proposição 11.11. Um grupo finito G é um p-grupo se e somente se #G é


potência de p.

Demonstração. É claro que se #G é potência de p, então G é um p-grupo.


Reciprocamente, se existisse um primo ` 6= p tal que ` | #G, então pelo primeiro
teorema de Sylow, existe x ∈ G tal que o(x) = `, em particular G não é um
p-grupo. 
Seja S o conjunto dos p-subgrupos de Sylow de G. Consideremos a repre-
sentação por conjugação ρ : G → Perm(S) definida por ρ(x)(S) = xSx−1 .
A parte mais importante do segundo teorema de Sylow afirma que esta repre-
sentação é transitiva, i.e.,
S = OS = {xSx−1 ; x ∈ G}.
Seja np := #S.

Teorema 11.12 (segundo teorema de Sylow). (1) S = OS , para algum


S ∈ S.
(2) Se P ⊂ G é um p-subgrupo, então existe S ∈ S tal que P ⊂ S.
(3) Se S ∈ S, então np = (G : NG (S)).

Para provar este teorema precisamos do seguinte lema.

Lema 11.13. Seja S ∈ S e P ⊂ G um p-subgrupo. Então P ∩ NG (S) = P ∩ S.

Demonstração. Suponhamos que P ∩NG (S) ' P ∩S, seja x ∈ P ∩NG (S)−
S. Como P é um p-grupo temos que o(x) = pr para algum r ≥ 1. Além
disto S C NG (S), logo hxiS é um subgrupo de NG (S). Mais ainda, #hxiS =
o(x)#S/#hxi ∩ S = pr+n /#hxi ∩ S. Observe que o denominador é < pr , pois
x∈ / S, o que é uma contradição uma vez que a ordem de hxiS supera a ordem
de S. 
Demonstração do segundo teorema de Sylow. Seja C o conjunto dos
subgrupos de G e consideremos a representação por conjugação ρ : G → Perm(C)
definida por ρ(x)(H) = xHx−1 . Por definição a órbita OS (para S ∈ S) de S é
o conjunto dos conjugados de S e #OS = (G : NG (S)).
96 11. TEOREMAS DE SYLOW

Provemos os 2 primeiros ı́tens. Denotemos OS = T . A restrição ϑ : P →


Perm(T ) desta representação a um p-subgrupo P de G dá uma representação
sobre o conjunto T dada por ϑ(x) = xaSa−1 x−1 , para aSa−1 ∈ T . Sejam
O1 , · · · , Ok as órbitas desta representação. Assim cada Oi é a órbita de Si =
yi Syi−1 com relação a ϑ. Lembre qie #Oi = (P : NG (Si ) ∩ P ). Pelo lema anterior
(P : NG (Si ) ∩ P ) = (P : Si ∩ P ). Assim,
k
X k
X
#T = #Oi = (P : Si ∩ P ).
i=1 i=1
n
Como #S = p e S ⊂ NG (S), então p - #T = (G : NG (S)). Por outro lado,
como P é um p-grupo finito, para todo i = 1, · · · , k, (P : Si ∩ P ) é potência de
p. Mas isto ocorre se e somente se existe i tal que P = Si ∩ P , i.e., P ⊂ Si , isto
prova (2). Para (1) note que T ⊂ S. Para a inclusão inversa, aplicando (2) a
qualquer S 0 ∈ S temos que existe i tal que S 0 ⊂ Si , i.e., S 0 = Si = yi Syi−1 , i.e.,
S0 ∈ T .
Finalmente, para provar (3), por (1) temos que np = #T = (G : NG (S)) |
b. 

Teorema 11.14 (terceiro teorema de Sylow). np | b e np ≡ 1 (mod p).

Demonstração. A primeira afirmativa já foi provada no teorema anterior.


Para a segunda, aplique a última equação para P = S obtendo
k
X
(G : NG (S)) = (S : S ∩ Si ).
i=1

Como S é um p-grupo o resultado é imediato. 

11.15. Exemplos
Determinemos o número de p-subgrupos de Sylow para grupos de certas or-
dens. Observe que np = 1 se e somente se existe um único p-subgrupo de Sylow
normal em G.

Exemplo 11.16. Seja G um grupo de ordem 56 = 23 7. Pelo terceiro teorema


de Sylow, n7 | 8 e n7 ≡ 1 (mod 7). Então n7 = 1 ou 8. No primeiro caso
temos um único 7-subgrupo de Sylow H7 normal em G. No segundo caso, cada
7-subgrupo de Sylow de G produz 6 elementos de ordem 7. Assim terı́amos 48
elementos de ordem 7. Portanto, os demais 8 elementos constituem o único 2-
subgrupo de Sylow de G. Isto não poderia ser visto diretamente pelo terceiro
11.15. EXEMPLOS 97

teorema de Sylow, pois n2 | 7 e n2 ≡ 1 (mod 2), logo a princı́pio não poderı́amos


excluir a possibilidade n2 = 7. Neste caso o 2-subgrupo de Sylow H2 de G é
normal em G.

Exemplo 11.17. Seja G um grupo de ordem 22 .7.13. Aplicando o terceiro


teorema de Sylow obtemos n13 | 22 .7 e n13 ≡ 1 (mod 13). Portanto temos duas
possibilidades n13 = 1 e n13 = 14. Vamos excluir a última. Seja H13 um 13-
subgrupo de Sylow de G. Aplicando o terceiro teorema de Sylow temos n7 | 22 .13
e n7 ≡ 1 (mod 7), logo n7 = 1, ou seja há um único 7-subgrupo de Sylow H7 de
G (portanto normal em G). A fortiori, H13 H7 é um subgrupo de G. Aplicando
o terceiro teorema de Sylow a este grupo obtemos n13 = (G : NG (H13 )) ≤ (G :
H13 H7 ) = 4. Assim, n13 = 1.
CAPı́TULO 12

Grupos solúveis

12.1. Teorema de Jordan-Hölder


Definição 12.2. Seja G um grupo. Uma série subnormal de G é uma
seqüência de grupos

G = G0 B G1 B G2 B · · · B Gn = {1},

onde cada Gi é normal no subgrupo anterior Gi−1 . Denotamos por


 
G0 G1 Gn−1
Q := , ,··· ,
G1 G2 Gn
o conjunto dos quocientes de da série cuja cardinalidade l é dita o comprimento
da série.
Um refinamente de uma série subnormal é uma outra série subnormal obtida
a partir desta inserindo subgrupos normais, por exemplo,

Gi B Hi B Gi+1 .

Um refinamento é dito próprio, se o comprimento da nova série for superior ao


da original. Uma série subnormal é dita uma série de composição, se não admite
refinamento próprio. Duas séries subnormais são distas equivalentes se existe
uma bijeção entre o conjunto dos quocientes das duas séries.

O objetivo desta seção é mostrar que todas as séries de composição de um


grupo dado são equivalentes (Teorema de Jordan-Hölder).

Definição 12.3. Um grupo G é dito simples, se seus únicos subgrupos nor-


mais são {1} e G. Por exemplo todo grupo de ordem prima é simples.

Observe que uma série subnormal é uma série de composição se e somente se


cada quociente Gi /Gi+1 é um grupo simples. Nem todo grupo admite uma série
de composição. Por exemplo, se G = Z e os subgrupos Gi = pi Z para i ≥ 1. A
série
Z B pZ B {0}
99
100 12. GRUPOS SOLÚVEIS

pode ser infinitamente refinada inserindo sucessivamente os grupos pi Z para todo


i ≥ 2.

Lema 12.4. Seja G um grupo finito de ordem maior que 1, então existe um
subgrupo normal próprio H de G que é maximal para esta propriedade, i.e., para
todo subgrupo K normal próprio de G temos que K ⊂ H.

Demonstração. É claro que {1} é um subgrupo próprio normal de G. Se


{1} for maximal no sentido acima, nada há a fazer. Caso contrário, existe H1 '
{1} que é um subgrupo próprio normal em G. Se H1 for maximal, acabou, senão
prosseguimos. Não podemos prosseguir indefinidamente pois G é finito. 

Proposição 12.5. Todo grupo finito admite uma série de composição.

Demonstração. Pelo lema anterior, existe um subgrupo maximal normal


próprio G1 de G. Similarmente, aplicando o lema sucessivamente a G1 , G2 , etc,
obtemos que cada Gi possui um subgrupo maximal normal próprio Gi+1 e uma
série subnormal
G = G0 B G1 B G2 B · · · ,
que não pode ser infinita, pois G é finito e as ordens dos grupos Gi ’s são es-
tritamente decrescentes. Logo existe n ≥ 1 tal que Gn = {1}. Além disto,
pela maximalidade dos grupos Gi+1 ’s em Gi , concluimos que todos os quocientes
Gi /Gi+1 são grupos simples. Isto equivale a dizer que a série é uma série de
composição. 

Exemplo 12.6. Consideremos a seguinte série subnormal


Z
G= B h5i B h10i B {0}.
30Z
Esta série é na verdade uma série de composição, pois o conjunto dos quocientes
é  
Z Z Z
, , ,
5Z 2Z 3Z
ou seja, cada quociente é cı́clico de ordem prima, portanto simples. Ela é refina-
mento das séries subnormais

G B h5i B {0}, e

G B h10i B {0}.
12.1. TEOREMA DE JORDAN-HÖLDER 101

Além disto esta série é equivalente às seguintes séries de composição


Z
G= B h2i B h6i B {0} e
30Z
Z
G= B h2i B h10i B {0}.
30Z
Lema 12.7 (lema de Zassenhaus). Sejam H, H1 , K, K1 subgrupos de um grupo
G tais que H1 C H e K1 C K. Então
(1) H1 (H ∩ K1 ) C H1 (H ∩ K) e K1 (H1 ∩ K) C K1 (H ∩ K).
(2)
H1 (H ∩ K) ∼ K1 (H ∩ K)
= .
H1 (H ∩ K1 ) K1 (H1 ∩ K)
Demonstração. (1) Mostremos o primeiro fato o segundo é análogo. Que-
remos mostrar que dados x ∈ H1 e y ∈ H ∩ K temos
xy(H1 (H ∩ K1 ))y −1 x−1 = H1 (H ∩ K1 ).
De fato,
xy(H1 (H ∩ K1 ))y −1 x−1 = x(yH1 y −1 )(y(H ∩ K1 )y −1 )x−1 = x(H1 (H ∩ K1 )x−1 ,
onde na primeira identidade usamos que y ∈ H e H1 C H e na segunda que
y ∈ H ∩ K e K1 C K. Mas x ∈ H1 , portanto
x(H1 (H ∩ K1 )x−1 = H1 (H ∩ K1 )x−1 .
Como H1 C H, então
H1 (H ∩ K1 ) = (H ∩ K1 )H1
e este é um subgrupo de G. Assim,
x(H1 (H ∩ K1 )x−1 = ((H ∩ K1 )H1 )x−1 = (H ∩ K1 )H1 = H1 (H ∩ K1 ),
onde novamente usamos que x−1 ∈ H1 .
(2) Fica como exercı́cio provar o seguinte fato:
se A e B são grupos e A C AB, então (A/B)A = B/(A ∩ B).
Tomemos A = H1 (H ∩ K1 ) e B = H ∩ K. Neste caso
AB = H1 (H ∩ K) e A ∩ B = (H ∩ K1 )(H1 ∩ K).
Assim, pelo fato,
H1 (H ∩ K) ∼ H ∩K
= .
H1 (H ∩ K1 ) (H ∩ K1 )(H1 ∩ K)
102 12. GRUPOS SOLÚVEIS

Similarmente, o outro quociente procurado também é isomorfo a este último gru-


po. 

Teorema 12.8 (teorema de Schreier). Duas séries subnormais de um grupo


G possuem refinamentos equivalentes.

Demonstração. Consideremos as seguintes séries subnormais

G = G0 B G1 B G2 B · · · B Gn = {0} e

G = H0 B H1 B H2 B · · · B Hm = {0}.
Refinemos a primeira utilizando os grupos da segunda da seguinte forma

Gi = Gi+1 (Gi ∩ H0 ) B Gi+1 (Gi ∩ H1 ) B · · · Gi+1 (Gi ∩ Hm ) = Gi+1 ,

o fato de cada passada ser normal segue do ı́tem (1) do lema de Zassenhaus. Da
mesma forma refinamos a segunda utilizando os grupos da primeira

Hj = Hj+1 (G0 ∩ Hj ) B Hj+1 (G1 ∩ Hj ) B · · · B Hj+1 (Gn ∩ Hj ) = Hj+1 .

A equivalência entre estas séries segue o ı́tem (2) do lema de Zassenhaus. 

Corolário 12.9 (teorema de Jordan-Hölder). Duas séries de composição de


um grupo dado são equivalentes.

Demonstração. Segue imediatamente do teorema de Schreier. 

12.10. Grupos solúveis


Definição 12.11. Seja G um grupo. Denotamos por G0 = [G, G] o subgrupo
dos comutadores e definimos indutivamente G(0) = G, G(i+1) = (G(i) )0 .

Teorema 12.12. Seja G um grupo. As seguintes condições são equivalentes


(i) G possui uma série subnormal com quocientes abelianos.
(ii) Existe n tal que G(n) = {1}.
Se além disto G for finito, então estas condições equivalem a
(iii) O grupo G admite uma série de composição com quocientes abelianos
(logo cı́clicos de ordem prima).

Definição 12.13. Um grupo satisfazendo às condições equivalentes acima é


dito um grupo solúvel.
12.10. GRUPOS SOLÚVEIS 103

Demonstração. Suponha (i). Pela observação 10.9, se H C G for tal que


G/H é abeliano, então H ⊃ G0 . Assim, como G0 /G1 é abeliano, G1 ⊃ G0 =
G(1) . Em seguida, como G1 /G2 é abeliano, então G2 ⊃ (G1 )0 = G(2) . Assim
sucessivamente, Gi ⊃ G(i) . Donde, G(n) = {1}.
Suponha (ii). Basta notar que por definição a série subnormal

G = G(0) B G(1) B G(2) B · · · B G(n) = {1}

tem quocientes abelianos.


Suponha agora que G seja um grupo finito. No próximo capı́tulo mostraremos
que todo grupo abeliano finito pode ser escrito como produto de grupos cı́clicos
da forma Z/nZ para n ≥ 1 inteiro. Observemos que as duas formulações de
(iii) de fato equivalem-se. Já observamos antes que todo grupo cı́clico de ordem
prima é simples. Reciprocamente, se um grupo abeliano finito é simples, pelo
que foi dito anteriormente, ele só pode ser um grupo cı́clico da forma Z/nZ para
algum inteiro n ≥ 1, já que se tivesse mais de um fator cı́clico, por exemplo,
Z/mZ × Z/nZ, então {0} × Z/nZ seria um subgrupo normal não trivial. Mas
pelo teorema chinês dos restos, todo grupo cı́clico fatora-se como produto de
grupos cı́clicos Z/pr Z, onde p é primo e r ≥ 1 inteiro. Assim, ficamos reduzidos
ao caso em que G = Z/pr Z. Mas se r > 1, este grupo admite como subgrupo
normal não trivial o grupo pZ/pr Z, logo não poderia ser simples.
Se G for um grupo finito é claro que (iii) implica (i). Por outro lado qualquer
refinamento de uma série subnormal com quocientes abelianos também tem quo-
cientes abelianos. Além disto, já foi visto anteriormente que toda série subnormal
de um grupo finito admite uma série de composição. 

Segue imediatamente do teorema que grupos abelianos são solúveis. Para


ver que p-grupos finitos (onde p denota um número primo) são também solúveis
precisaremos da seguinte proposição.

Proposição 12.14. Seja G um grupo de ordem pm e H um subgrupo de G


de ordem pr , onde r < m. Então
(1) existe um subgrupo K de G de ordem pr+1 contendo H.
(2) Todo subgrupo L de G de ordem pr+1 contendo H satisfaz : H C L. Em
particular, H ( NG (H).

Demonstração. Provemos o seguinte resultado mais forte que (1) por indução
na ordem de G: existe um subgrupo H de G de ordem pr+1 tal que H C K.
104 12. GRUPOS SOLÚVEIS

Se #G = 1, nada há a fazer. Senão, suponhamos o resultado seja verdade


para todo grupo de ordem menor que #G. Como Z(G) 6= {1}, utilizando o
lema de Cauchy (cf. capı́tulo sobre teoremas de Sylow) escolhemos um elemento
x ∈ Z(G) de ordem p. Note que hxi C G e x ∈ NG (H).
Se x ∈
/ H, então, o subgrupo K = Hhxi satisfaz às condições desejadas, pois
hxi∩H = {1}. Caso x ∈ H, o grupo G/hxi tem ordem estritamente menor que G,
logo por hipótese de indução existe um subgrupo K 0 de G/hxi tal que #K 0 = pr .
Seja K a pré-imagem de K 0 pelo homomorfismo canônico ϕ : G → G/hxi. O
subgrupo K 0 de G satisfaz às condições da afirmativa mais forte.
Finalmente, o segundo ı́tem segue do primeiro. 

Corolário 12.15. Seja G um grupo de ordem pm (onde p denota um número


primo). Então existem subgrupos H0 = {1}, H2 , · · · , Hm = G tais que Hi C Hi+1
e tais que Hi+1 /Hi é cı́clico de ordem p, para i = 0, · · · , m − 1.

Demonstração. Aplique a proposição a H0 = {1} obtendo H1 e ordem p,


em seguida aplique-a novamente a H1 e assim sucessivamente. 

Observação 12.16. Segue do teorema 12.12 e do corolário anterior que todo


p-grupo finito é solúvel.

Proposição 12.17. Seja G um grupo e H um subgrupo de G.


(1) Se G for solúvel, então H é solúvel.
(2) Se H C G então G é solúvel se e somente se H e G/H são solúveis.

Demonstração. (1) Suponha que G seja solúvel. Note que para todo i,
G ⊃ H (i) . Portanto, H (n) = {1} e H é solúvel.
(i)

(2) Seja ϕ : G → G/H o homomorfismo quociente. Observe que ϕ(G0 ) =


ϕ(G)0 = (G/H)0 . Suponha que G seja solúvel. Por (1) H é solúvel. Além disto,
indutivamente, para todo i, ϕ(G(i) ) = (G/H)(i) , a fortiori, (G/H)(n) = {1}, i.e.,
G/H é solúvel. Reciprocamente, suponha que H e G/H sejam solúveis. Isto
significa que existe n tal que H (n) = {1} e m tal que (G/H)(m) = {1}. Da
última igualdade segue que G(m) ⊂ ker(ϕ) = H. Aplicando indutivamente esta
derradeira igualdade obtemos G(m+j) ⊂ H (j) . Portanto G(m+n) ⊂ H (n) = {1},
i.e., G é solúvel. 
CAPı́TULO 13

Grupos abelianos finitamente gerados

13.1. Módulos sobre anéis


Seja R um anel comutativo com unidade. Um R-módulo M é um grupo
aditivo munido de uma função R × M → M tal que a(x + y) = ax + ay e
(a + b)x = ax + bx, para a, b ∈ R e x, y ∈ M . Quando R é um corpo (como os
reais) recuperamos a noção de espaço vetorial.
Dizemos que um suconjunto S de M gera M se para todo x ∈ M existem
x1 , · · · , xn ∈ S tal que x = ni=1 ai xi , onde ai ∈ R para i = 1, · · · , n. O conjunto
P

S é dito o conjunto de geradores de M . O módulo M é dito finitamente gerado,


se S for finito.
Dados x1 , · · · , sn ∈ M dizemos que eles são R-linearmente independentes
se para qualquer combinação linear ni=1 ai xi = 0 com ai ∈ R tivermos ai =
P

0 para i = 1, · · · , n. O módulo M é dito um R módulo livre se possui um


conjunto de geradores linearmente independentes. Novamente, quando R é um
corpo, um conjunto de geradores linearmente independentes nada mais é que
a base de um espaço vetorial. Quando o conjunto de geradores S é finito e
estes são R-linearmente independentes, da mesma forma que na álgebra linear
podemos mostrar que o número de elementos do conjunto gerador não depende
da particular escolha do conjunto. Este número é chamado o posto do módulo
(que corresponde à noção de dimensão de espaço vetorial)..
Observemos que a noção de Z-módulo equivale a de grupo abeliano. De
fato, todo Z-módulo por definição é um grupo abeliano. Reciprocamente, todo
grupo abeliano G admite uma estrutura de Z-módulo. De fato, denotando G
aditivamente, podemos considerar a soma de n > 0 vezes um elemento x de G
que é o elemento nx ∈ G. Para n = −m < 0, nx nada mais é que m vezes o
elemento −x, portanto também um elemento de G.
Ao contrário de espaços vetoriais nem todo Z-módulo livre é finito. De fato,
para todo n ≥ 1, Z/nZ é um Z-módulo livre de posto 1 gerado por 1. Na verdade
isto corresponde a noção de grupo abeliano de torção. Um grupo abeliano G é

105
106 13. GRUPOS ABELIANOS FINITAMENTE GERADOS

de torção se e somente todo elemento de G é de ordem finita. Veremos que o


teorema em questão diz inicialmente que todo grupo abeliano finitamente gerado
se quebra em um pedaço de torção que descreveremos completamente e uma parte
livre que é isomorfa a r cópias de Z, onde r é exatamente o posto do grupo como
Z-módulo.
Similarmente ao caso de espaços vetoriais temos noções de submódulos e de
módulos quocientes. Seja M um R-módulo. Um subconjunto N de M é dito um
R-submódulo de N se for um sugrupo e se para todo a ∈ R e x ∈ N , ax ∈ N .
Para todo x ∈ M definimos x := x + N := {x + v | v ∈ N } chamada a classe de
x com respeito a N . Como conjunto o módulo quociente M/N é definido como
sendo {x | x ∈ M }. Definimos uma estrutura de R-módulo em M/N da maneira
usual. A soma é definida por x ⊕ y := x + y e a multiplicação por escalar por
ax := ax, para todo a ∈ R. Fica como exercı́cio verificar que estas operações
estão efetivamente bem definidas.
Dados V e W R-módulos uma função ϕ : V → W é dito um homomorfismo
de R-módulos se for um homomorfismo de grupos e se para todo a ∈ R e x ∈ V
temos ϕ(ax) = aϕ(x). Da mesma forma definimos o núcleo de ϕ por N (ϕ) :=
{x ∈ V | ϕ(x) = 0}. Já sabemos que N (ϕ) é um subgrupo de V . Além disto ele
é um R-submódulo, pois para todo a ∈ R e x ∈ N (ϕ) temos ϕ(ax) = aϕ(x) = 0,
i.e., ax ∈ N (ϕ). A imagem ϕ(V ) de φ é um R-submódulo de W (exercı́cio).

Teorema 13.2 (teorema dos homomorfismos). Seja ϕ : V → W um ho-


momorfismo de R-módulos. Então ϕ induz um isomorfismo de R-módulos Φ :
V /N (ϕ) → ϕ(V ) dado por Φ(x) := ϕ(x).

Demonstração. Já sabemos que Φ é isomorfismo de grupos. Basta verificar


que é um homomorfismo de R-módulos. De fato, dado a ∈ R temos que Φ(ax) =
Φ(ax) = ϕ(ax) = aϕ(x) = aΦ(x). 

Para todo n ≥ 1 o produto cartesiano Rn é naturalmente um R-módulo


somando as coordenadas e multiplicando as coordenadas por um escalar em R.
Um homorfismo de R-módulos ϕ : Rm → Rn é determinado pela multiplicação
de um vetor por uma matriz n × m com coordenadas em R. De fato, tomemos
como conjunto gerador linearmente independente em cada um dos R-módulos
a base canônica, então da mesma forma que na álgebra linear, se e1 , · · · , em é
uma base de Rm e f1 , · · · , fn é uma base de Rn , então ϕ fica determinado por
P
ϕ(ei ) = j aij fj , onde aij ∈ R.
13.3. DIAGONALIZAÇÃO DE MATRIZES 107

Definimos o grupo GLn (R) como o subgrupo das matrizes quadradas de ordem
n com entradas em R. Observemos que este equivale ao grupo das matrizes cujo
determinante é um elemento inversı́vel em R. De fato, seja A ∈ GLn (R). Então
existe B ∈ Mn (R) tal que AB = Id, em particular det(A) det(B) = 1, i.e.,
det(A) ∈ R∗ . Reciprocamente, se det(A) = δ ∈ R∗ e Adj(A) denota a adjunta
de A (que é construı́da como na álgebra linear, pois as operações elemetares
por linhas são precisamente as mesmas tomando cuidado de escolher os escalares
pertencendo a um anel R ao invés de um corpo). Assim a regra de Cramer nos
informa que δ Id = A Adj(A). A fortiori, Id = A(δ −1 Adj(A)), assim δ −1 Ajd(A)
é a inversa de A (observe que podemos tomar δ −1 , pois δ é inversı́vel em R).

13.3. Diagonalização de matrizes


Teorema 13.4. Seja A ∈ Mn×m (Z) então existem matrizes Q ∈ GLn (Z) e
P ∈ GLm (Z) tais que A0 = QAP −1 é diagonal da seguinte forma:
  
d1 0 · · · 0
 0 d2 · · · 0  0
  
 ,
  
. . .

 
 0 0 · · · dr 
0 0

onde d1 | d2 | · · · | dr .

Demonstração. As matrizes Q e P provêem (como na álgebra linear) da


multiplicação de matrizes elementares que correspondem as operações elementa-
res por linhas e por colunas.
Etapa 1. Trocando linhas e colunas (e eventualmente multiplicando uma
linha ou coluna por -1) podemos supor que a11 ≥ 0 é uma entrada de menor
valor absoluto (claro que pode haver outra entrada com o mesmo valor absoluto).
Etapa 2. Transformamos os demais elementos da primeira coluna em 0 da
seguinte forma. Para todo i > 1 dividimos ai1 = a11 q + r, onde 0 ≤ r < a11 .
Substituı́mos a i-ésima linha por menos ela mais q vezes a primeira, ou seja
trocamos ai1 por r. Se r = 0 nada mais precisamos fazer. Senão permutamos
levando r para a primeira posição (1,1) e retornamos à etapa anterior. Em um
número finito de passos obteremos r = 0. Repetimos o argumento para as demais
entradas da linha. Similarmente, repetimos o argumento para colunas e zeramos
o restante da primeira linha.
108 13. GRUPOS ABELIANOS FINITAMENTE GERADOS

Etapa 3. Seja B a matriz restante eliminando as primeiras linha e coluna.


Se existe uma entrada b de B que não seja divisı́vel por a11 , somamos a coluna
correspondente com a primeira coluna e retornamos à etapa 2. Após um número
finito de passos todos os elementos de B são divisı́veis por a11 e aplicamos as 3
etapas a B. 

Note que na demonstração anterior além das operações elementares por linhas
que valem para qualquer anel, utilizamos tão somente o algoritmo da divisão para
os inteiros. Isto permite-nos generalizar o resultado da seguinte forma.

Teorema 13.5. Seja R um domı́nio euclideano e A ∈ Mn×m (R). Então


existem matrizes Q ∈ GLn (R) e P ∈ GLm (R) tais que A0 = QAP −1 é diagonal
da forma indicada no teorema anterior.

Notemos que este processo se aplica particularmente à matriz de um homo-


morfismo de R-módulos ϕ : Rm → Rn .

13.6. Geradores e relações para módulos


Seja ϕ : Rn → Rm um homomorfismo de R-módulos cuja matriz na base
canônica é A ∈ Mm×n (R). A base canônica de Rn é chamado o conjunto de
geradores e o núcleo N (ϕ) de ϕ é dito o conjunto de relações. A imagem de ϕ é
dada por multiplicação por A, assim denotamos ϕ(Rn ) := ARn . O conúcleo de ϕ
é definido por Rm /ARn . Neste caso dizemos que a matriz A presenta o conúcleo
de ϕ, ou em outras palavras, A é a matriz de presentação do conúcleo de ϕ.
Mostraremos agora que todo R-módulo finitamente gerado V pode ser pre-
sentado por alguma matriz. Inicialmente observemos que se v1 , · · · , vn é um con-
junto de geradores de V então temos um homomorfismo sobrejetivo canônico de
R-módulos ϕ : Rn → V dado por ϕ(ei ) = vi , onde e1 , · · · , en é a base canônica de
Rn . De fato, para todo v ∈ V temos v = ni=1 ai vi com a1 , · · · , an ∈ R. Portanto,
P

V = ARn . Seja W = N (ϕ). Mostraremos em seguida que W é também um R-


módulo finitamente gerado. Neste caso, digamos que seja gerado por w1 , · · · , wm ,
temos também um homomorfismo sobrejetivo ψ : Rm → W de R-módulos e o
W = BRm . Pelo teorema dos homomorfismos, V ∼ = Rn /W = Rn /BRm , assim a
matriz B presenta V . A idéia do teorema será diagonalizar a matriz B como na
seção anterior e obter daı́ a decomposição do módulo.

Lema 13.7. Seja ϕ : V → W um homomorfismo de R-módulos.


13.6. GERADORES E RELAÇÕES PARA MÓDULOS 109

(1) Se ker(ϕ) e ϕ(V ) são finitamente gerados, então V também é finita-


mente gerado. Se V é finitamente gerado e ϕ é sobrejetivo, então W é
finitamente gerado.
(2) Seja W um R-submódulo de V . Se W e V /W são finitamente gerados,
então V também é finitamente gerado. Se V é finitamente gerado, então
V /W é finitamente gerado.

Demonstração. (1) Seja u1 , · · · , uk um conjunto de geradores de ker(ϕ)


e w1 , · · · , wm um conjunto de geradores de W . Para todo i = 1, · · · , m seja
vi ∈ V tal que ϕ(vi ) = wi . Afirmamos que (u1 , · · · , uk ; v1 , · · · , vm ) geram V . De
P
fato, dado v ∈ V temos ϕ(v) = i ai wi com ai ∈ R para i = 1, · · · , m. Seja
v 0 = i ai vi ∈ V . Então ϕ(v 0 ) = ϕ(v), i.e., v 0 − v ∈ ker(ϕ), i.e., v 0 − v = j bj uj
P P

para bj ∈ R para todo j = 1, · · · , k. Para a segunda parte, se v1 , · · · , vn geram V ,


P
como todo w ∈ W é da forma w = ϕ(v), para algum v ∈ V , então w = i ai ϕ(vi ),
P
onde v = i ai vi , e ϕ(v1 ), · · · , ϕ(vn ) forma um conjunto de geradores de W .
(2) Segue de (1) aplicado ao homomorfismo quociente canônico ϕ : V →
V /W . 

Proposição 13.8. Seja V um R-módulo. As seguintes condições são equi-


valentes:
(1) Todo R-submódulo W de V é finitamente gerado.
(2) Não existe seqüência estritamente crescente de R-submódulos de V :
W1 W2 · · ·

Demonstração. Suponha que a condição (2) seja satisfeita e que W 6= 0.


Seja w1 ∈ W − {0}. Se w1 gera W acabou. Senão seja w2 ∈ W − Rw1 . Se
Rw1 + Rw2 = W , acabou, w1 e w2 geram W . Senão seja w3 ∈ W − (RW1 + Rw2 ).
Prosseguindo desta forma o conjunto de R-módulos Wi = Rw1 + . . . + Rwi é
estritamente crescente. Por hipótese existe k tal que Wk = W , em particular
w1 , · · · , wk geram W .
Reciprocamente suponha (1). Seja W1 ⊂ W2 ⊂ · · · uma seqüência de R-
S
submódulos de V . A união U = i Wi também é um R-submódulo de V
(exercı́cio). Por hipótese U é finitamente gerado, digamos por u1 , · · · , un . Seja j
o maior ı́ndice tal que ui ∈ Wj para todo i. Logo Wj ⊂ U ⊂ Wj , i.e., U = Wj e
a seqüência estaciona. 

Definição 13.9. Um anel R tal que todo módulo satisfaça as condições an-
teriores é chamado um anel noetheriano.
110 13. GRUPOS ABELIANOS FINITAMENTE GERADOS

Proposição 13.10. Seja R um anel noetheriano e V um R-módulo finita-


mente gerado. Então todo submódulo W de V também é finitamente gerado.

Demonstração. Observemos inicialmente que basta provar a proposição no


caso em que V = Rn . De fato, como V é finitamente gerado, então existe um
homomorfismo sobrejetivo ϕ : Rn → V . Seja W ⊂ V um submódulo. Então
ϕ−1 (W ) = W 0 é um submódulo de Rn , por hipótese é finitamente gerado. Pelo
lema anterior concluimos que W também é finitamente gerado.
Provemos por indução em n. Para n = 1 isto segue da proposição ante-
rior. Consideremos o homomorfismo de projeção ϕ : Rn → Rn−1 dado por
ϕ((a1 , · · · , an )) = (a1 , · · · , an−1 ). O seu núcleo constitui-se dos vetores da forma
(0, · · · , 0, an ). Seja W um submódulo de Rn e seja ψ a restrição de ϕ a W , diga-
mos ψ : W → Rn−1 . Por hipótese de indução ψ(W ) é finitamente gerado. Além
disto, ker(ψ) = ker(ϕ) ∩ W é um submódulo de ker(ϕ) ∼ = R, portanto também é
finitamente gerado. Assim, o resultado segue da proposição anterior. 

13.11. O teorema de estrutura


Já fizemos tudo que era necessário para obter nosso resultado principal neste
capı́tulo. Antes só mais um pouco de notação. Sejam W1 , · · · , Wn submódulos
de um R-módulo V . Definimos W1 + . . . + Wn := {w1 + . . . + wn | wi ∈ Wi , i =
1, · · · , n}. Fica como exercı́cio verificar que W1 + . . . + Wn é um R-submódulo de
P
V . Dizemos que esta soma é direta de para qualquer relação linear i ai wi = 0,
com ai ∈ R, temos ai = 0 para todo i. Neste caso escrevemos W1 ⊕ . . . ⊕ Wn .

Teorema 13.12. (teorema de estrutura de grupos abelianos finitamente ge-


rados) Seja G um grupo abeliano finitamente gerado. Então

G∼
= (Z/d1 Z) ⊕ . . . ⊕ (Z/dk Z) ⊕ Zr , onde d1 | d2 | · · · | dr

são inteiros positivos, r é o posto de G como Z-módulo e

Gtor = (Z/d1 Z) ⊕ . . . ⊕ (Z/dk Z)

é o subgrupo de torção de G, i.e., o conjunto dos elementos de ordem finita.

Demonstração. Já vimos anteriormente que G é presentado por uma ma-


triz A ∈ Mn×m (Z), i.e., G = Rn /ARm e que tal matriz pode ser diagonalizada com
a propriedade acima para suas entradas d1 , · · · , dk . As relações do grupo s são
dadas por di vi = 0 para i = 1, · · · , k para um conjunto de geradores v1 , · · · , vn ,
13.11. O TEOREMA DE ESTRUTURA 111

Seja L o submódulo gerado por vk+1 , · · · , vn . Como não há relações entre es-
tes vetores vemos que L é um Z-módulo livre de posto n − k, i.e., L ∼ = Zn−k .
Afirmamos que

G = C1 ⊕ . . . ⊕ Ck ⊕ L, onde Ci = hvi i ∼
= Z/di Z.
É claro, pela presentação de G, que estes submódulos geram G. Ou seja, G é
igual à soma destes. Queremos mostrar que a soma é direta. De fato, se houvesse
uma relação
z1 + . . . + zk + w = 0,
com zi ∈ Ci e w ∈ L, então podemos reescrê-la da forma
k
X n
X
ri vi + ri vi = 0,
i=i i=k+1

onde 0 ≤ ri < di para i = 1, · · · , k e ri ∈ Z para i = k + 1, · · · , n. Como


não há relação envolvendo os últimos n − k vetores concluimos que ri = 0 para
i = k + 1, · · · , n. Além disto pelas relações acima a única possibilidade para que
para os demais di | ri é ri = 0 para cada i. Portanto, não há relações entre os
módulos acima. 

Lembremos que no processo de diagonalização das matrizes tudo funcionava


bem para qualquer domı́nio euclideano. Assim no teorema acima podemos subs-
tituir a noção de grupo abeliano finitamtente gerado pela noção de R-módulo
finitamente gerado sobre um domı́nio euclideano R.

13.12.1. Um teorema de Mordell. Grupos abelianos finitamente gerados


surgem naturalmente na aritmética. Uma curva elı́tica sobre os complexos pode
ser pensada como o conjunto de pontos em C2 que são soluções de uma equação
da forma
y 2 = x3 + ax + b,
onde x3 + ax + b não admite raı́zes múltiplas e a priori estamos supondo a, b ∈ C.
Ocorre que existe uma estrutura de grupo abeliano na curva elı́tica que pode ser
definida geometricamente por meio de interseções com retas. Se considerarmos o
caso em que a, b ∈ Q, ou seja uma curva elı́tica definida sobre os racionais, existe
um célebre teorema devido a Mordell que afirma que o conjunto de soluções
(x0 , y0 ) ∈ Q2 da equação é um grupo abeliano finitamente gerado, digamos

E(Q)tor ⊕ Zr .
112 13. GRUPOS ABELIANOS FINITAMENTE GERADOS

O inteiro (misterioso) r é chamado o posto da curva elı́tica. Não se sabe por


exemplo se é possı́vel existir curvas elı́ticas com posto arbitrariamente grande, o
recorde é 24.
A este objeto (a curva elı́tica) está associado a uma função de natureza
analı́tica chamada a L-série de Hasse-Weil da curva elı́tica. A famosa conjec-
tura de Birch e Swinnerton-Dyer afirma que a ordem de anulamento desta função
em s = 1 é exatamente o posto. Ela surgiu a partir de evidências computacionais.
De outro lado podemos nos perguntar o que é conhecido sobre o grupo de
torção. A resposta é tudo. Um belo e profundo resultado devido a Mazur mostra
que existem exatamente 16 grupos abelianos que podem ser grupos de torção
de curvas elı́ticas sobre os racioanis e que cada um desses grupos efetivamente
ocorre.
Para mais informações sobre curva elı́ticas e o teorema de Mordell ver [?].
Para o teorema de Mazur ver [?].
Parte 3

Anéis
CAPı́TULO 14

Anéis de polinômios

14.1. Algoritmo da divisão


Seja K um corpo. Um polinômio definido sobre K é uma expressão da forma

f (x) = an xn + . . . + a1 x + a0 ,

onde a0 , · · · , an ∈ K. Identificamos f (x) a um vetor (a0 , · · · , an , 0, · · · , 0, · · · ).


Se f 6= 0 e n ≥ 0 for o maior inteiro tal que an 6= 0, dizemos então que n é o grau
de f . O conjunto de todos os polinômios definidos sobre K é denotado por K[x].
Seja g(x) = bm xm + . . . + b1 x + b0 . Suponhamos que n ≥ m. Definimos a
soma de f, g ∈ K[x] por

(f + g)(x) := (an + bn )xn + . . . + (a1 + b1 )x + a0 + b0 ,

onde bj = 0 para todo j > m. Se f + g 6= 0, então

grau(f + g) ≤ max{grau(f ), grau(g)}.

Note que se f = x3 + x + 1 e g = −x3 + x2 − 2, então grau(f + g) = 2 < 3.


Definimos o produto de f e g por
X
(f g)(x) := cn+m xn+m + . . . + c1 x + c0 , onde ci = aj b l .
j+l=i

Assim, se f, g 6= 0, grau(f g) = grau(f ) + grau(g).


Afirmamos que K[x] é um domı́nio de integridade. Observemos inicialmente
que K[x] é um espaço vetorial com a operação de multiplicação por escalar sendo
a multiplicação por um polinômio constante de grau zero. Verifique que de fato
isto faz de K[x] um espaço vetorial. Em particular, temos as propriedades aditivas
de K[x] como anel.
A associatividade do produto é provada da seguinte forma. Sejam f, g ∈ K[x].
Seja h(x) = ri=0 ci xi . Então
P

n+m
X X
fg = di xi , onde di = aj b l ,
i=0 j+l=i

115
116 14. ANÉIS DE POLINÔMIOS

logo
n+m+r
X X X
(f g)h = ei xi , onde ei = aα b β c l
i=0 j+l=i α+β=j
X
= aα b β c l .
α+β+l=i

Por outro lado,


m+r
X X
gh = = Ai xi , onde Ai = bj c l ,
i=0 j+l=i
logo
n+m+r
X X X
f (gh) = Bi xi , onde Bi = aα b β c l
i=0 α+l=i β+j=l
X
= aα b β c l .
α+β+l=i

A comutatividade do produto segue da mesma propriedade para os elementos


de K. O elemento neutro do produto é o polinômio constante f = 1. Fica como
exercı́cio verificar que a soma distribui em relação ao produto, i.e.,
f (g + h) = f h + gh.
Sejam f, g ∈ K[x] tais que f g = 0, mas f 6= 0 de grau n. Provaremos agora
que isto implica em g = 0. De fato, começando pelo coeficiente de xn+m temos
que
an bm = 0, logo bm = 0.
Em seguida, para o coeficiente de xn+m−1 temos
an bm−1 + an−1 bm = an bm−1 = 0, logo bm−1 = 0.
Para o coeficiente de xn+m−2 temos
an bm−2 + an−1 bm−1 + an−2 bm = an bm−2 = 0, logo bm−2 = 0.
Assim sucessivamente, todos os coeficientes de g são nulos. Portanto, g = 0.
Dizemos que f ∈ K[x] é inversı́vel se existe g ∈ K[x] tal que f g = 1. Note
que neste caso, o lado esquerdo da equação tem grau n + m e o lado direito tem
grau 0, logo n = m = 0 e f, g ∈ K ∗ = K \ {0}, pois K é um corpo.

Teorema 14.2 (algoritmo da divisão). Sejam f, g ∈ K[x], g 6= 0, então


existem únicos q, r ∈ K[x] tais que f = qg + r, onde r = 0 ou grau(r) < grau(g).
14.1. ALGORITMO DA DIVISÃO 117
Pn Pm
Demonstração. Sejam f = i=0 ai x i e g = j=0 bj x
j
. Definimos
an n−m
f1 := f − x g.
bm
Se f1 = 0, acabou, tome
an n−m
r=0eq= x .
bm
6 0, então n1 = grau(f1 ) < n = grau(f ). Se n1 < m, acabou, tome
Se f1 =
an n−m
r = f1 e q = x .
bm
Suponha que n1 ≥ m. Seja
n1
X
f1 := a1,i xi .
i=0

Defina
a1,n1 n1 −m
f2 := f1 − x g.
bm
Se f2 = 0, acabou, tome
1
r=0eq= (an xn−m + a1,n1 xn1 −m ).
bm
Se f2 6= 0, então n2 = grau(f2 ) < n1 . Se n2 < m, acabou, tome
1
r = f2 e q = (an xn−m + a1,n1 xn1 −m ).
bm
Prosseguindo obtemos uma seqüência de polinômios fi com graus estritamente
decrescentes, assim pelo menos para algum t ≥ 1 temos ft 6= 0 e grau(ft ) < m,
neste ponto o algoritmo acaba, tome
1
r = ft e q = (an xn−m + a1,n1 xn1 −m + . . . + at−1,nt−1 xnt−1 −m ).
bm
Suponha que tenhamos realizado duas divisões

f = q1 g + r1 = q2 g + r2 ,

onde para i = 1, 2, ri = 0 ou grau(ri ) < m. Se r1 = r2 , então q1 g = q2 g = 0, e


como g 6= 0, então q1 = q2 . Suponhamos que r1 6= r2 . Neste caso, grau(r1 − r2 ) <
m. Por outro lado
r1 − r2 = (q2 − q1 )g
e grau((q2 − q1 )g) ≥ grau(g), o que é impossı́vel. 
118 14. ANÉIS DE POLINÔMIOS

14.3. Máximo divisor comum de polinômios


Sejam f, g ∈ K[x] − {0}. Dizemos que f divide g e denotamos por f | g se
existe
h ∈ K[x] tal que f h = g.
Notemos que esta propriedade é transitiva, i.e.,

se f | g e g | h, então f | h.

De fato, se g = f α e h = gβ, onde α, β ∈ K[x], então h = f αβ, i.e., f | h.

Se h 6= 0 e f h | gh, então f | h,

pois se gh = f hα para α ∈ K[x], então h(g − f α) = 0 e como h 6= 0 e K[x] é


domı́nio de integridade, então g = f α. Além disto,

se f | g e g | f, então f = ag,

para algum a ∈ K ∗ , pois de f = gα e g = f β obtemos que 1 = αβ, mas a última


igualdade só ocorre se α, β ∈ K ∗ .

Definição 14.4. Sejam f, g ∈ K[x] − {0}, dizemos que d ∈ K[x] é um mdc


de f e g se
(1) d | f e d | g.
(2) Para todo d0 ∈ K[x] tal que d0 | f e d0 | g, temos d0 | d.

Dizemos que f = ni=0 ai xi ∈ K[x] é um polinômio mônico, se an = 1.


P

Observação 14.5. Dado um outro mdc e de f e g, pela condição (2) temos


que d | e e e | d, portanto d = ae, onde a ∈ K ∗ . A maneira de tornar canônica a
escolha do mdc é exigir que ele seja um polinômio mônico e neste caso podemos
dizer que d = mdc(f, g) é o mdc de f e g.

Observe que se f | g e f então f é um mdc de f e g. A etapa seguinte é obter


o mdc de maneira algorı́timica. Para isto introduzimos um lema simples.

Lema 14.6. Sejam f, g ∈ K[x] − {0} e q, r ∈ K[x] tais que

f = qg + r, onde r = 0 ou grau(r) < grau(g).

Então
mdc(f, g) = mdc(g, r).
14.3. MÁXIMO DIVISOR COMUM DE POLINÔMIOS 119

Demonstração. Seja Df,g (resp. Dg,r ) o conjunto dos divisores comuns de


f e g (resp. g e r). Seja d = mdc(f, g). Logo para todo d0 ∈ Df,g \ {0} temos
grau(d0 ) ≤ grau(d). Assim d é o elemento em Df,g mônico de grau máximo
possı́vel. Similarmente, e = mdc(g, r) é o elemento mônico em Dg,r de grau
máximo possı́vel. Mostraremos agora que Df,g = Dg,r , conseqüentemente d = e.
Seja A ∈ Df,g , logo f = Aα e g = Aβ, onde α, β ∈ K[x]. Segue da equação
do enunciado que
r = A(α − qβ),
em particular A ∈ Dg,r . A inclusão oposta segue pelo mesmo argumento. 

Teorema 14.7. Sejam f, g ∈ K[x] \ {0} e r1 , · · · , rn ∈ K[x] os restos não


nulos na seqüência de divisões
f = q1 g + r1 , onde grau(r1 ) < grau(b)
g = q2 r1 + r2 , onde grau(r2 ) < grau(r1 )
(14.7.1) ···
rn2 = qn rn−1 + rn , onde grau(rn ) < grau(rn−1 )
rn−1 = qn+1 rn .
Esta seqüência é finita pois os graus são estritamente decrescentes. Então rn é
um mdc de f e g.

Demonstração. A última linha nos diz que rn é um mdc de rn e rn−1 .


Logo rn = mdc(rn−1 , rn ). Pelo lema 14.6 concluimos que rn = mdc(rn−1 , rn−2 )
e prosseguindo nas linhas anteriores temos que rn = mdc(r2 , r1 ) = mdc(r1 , g) =
mdc(f, g). 

Teorema 14.8 (algoritmo euclideano estendido). Sejam f, g ∈ K[x] \ {0} e


d = mdc(a, b). Então existem α, β ∈ K[x] tais que

d = f α + gβ.

Demonstração. Do teorema anterior temos que d = rn . A penúltima equa-


ção nos dá
rn = rn−2 − qn rn−1 .
Tomando A1 = −qn e B1 = 1 reescrevemos

rn = B1 rn−2 + A1 rn−1 .
120 14. ANÉIS DE POLINÔMIOS

Utilizando a equação antecedente a esta obtemos


rn = B1 rn−2 + A1 (rn−3 − qn−1 rn−2 ) = B2 rn−3 + A2 rn−2 ,
onde B2 = A1 e A2 = B1 − A1 qn−1 . Prosseguindo ao longo das demais divisões
obtemos
rn = Bn−3 r1 + An−3 r2 = Bn−3 r1 + An−3 (g − q2 r1 ) = Bn−2 g + An−2 r1 ,
onde Bn−2 = An−3 e An−2 = Bn−3 − An−3 q2 . Pela equação antecedente temos
que
rn = Bn−2 g + An−2 (f − gq1 ) = α0 f + β 0 g,
onde α0 = An−2 e β 0 = Bn−2 − An−2 q1 . 

Nosso objetivo agora é dar uma prova mais conceitual do algoritmo euclideano
estendido usando a noção de ideal.

Definição 14.9. Um subconjunto I ⊂ K[x] é dito um ideal de K[x] se


(1) O ∈ I.
(2) Se f, g ∈ I, então f + g ∈ I.
(3) Se f ∈ I e α ∈ K[x], então f α ∈ I.

Fica como exercı́cio verificar que os seguintes conjuntos são ideais:


(i) Seja f ∈ K[x] e I := (f ) := {f α | α ∈ K[x]} o conjunto dos múltiplos de
f.
(ii) Sejam f, g ∈ K[x] e I := (f ) + (g) := {f α + gβ | α, β ∈ K[x]}.
(iii) Sejam f1 , · · · , fn ∈ K[x] e I := (f1 )+. . .+(fn ) := {f1 α1 +. . .+fn αn | α1 ,
· · · , αn ∈ K[x]}.

Teorema 14.10. O domı́nio K[x] é principal, i.e., todo ideal I de K[x] é da


forma (f ) para algum f ∈ K[x].

Demonstração. Seja I um ideal de K[x]. Se I = (0) nada há a fazer.


Suponhamos que I 6= (0). Pelo axioma da boa ordenação existe um único f ∈
I − {0} mônico de grau mı́nimo. Afirmamos que I = (f ). De fato, como f ∈ I,
para todo f α ∈ (f ), pelo ı́tem (3) da definição de ideal, f α ∈ I. Assim (f ) ⊂ I.
Para provar a inclusão oposta precisamos do algoritmo da divisão. Seja g ∈ I\{0}.
Então existem q, r ∈ K[x] tais que g = qf + r, onde r = 0 ou grau(r) < grau(f ).
Note que r ∈ I, pois g, f ∈ I. Logo, se r 6= 0 vioları́amos a minimalidade do grau
de f . Portanto, r = 0 e g ∈ (f ). 
14.11. FATORAÇÃO ÚNICA DE POLINÔMIOS 121

Aplicando este teorema ao ı́tem (ii) anterior, obtemos que existe um único
d ∈ K[x] mônico tal que (f ) + (g) = (d). Afirmamos que d = mdc(f, g). De fato,
f = 1.f + 0.g ∈ (f ) + (g) = (d), logo f = αd, para α ∈ K[x], i.e., d | f . Da
mesma forma d | g. Se d0 | f e d0 | g, para d0 ∈ K[x], então d = αf + βg, para
α, β ∈ K[x], se reescreve como d = (αα0 + ββ 0 )d0 , para α0 , β 0 ∈ K[x], i.e., d0 | d,
logo d = mdc(f, g). Observe também que de passagem provamos que d = αf +βg
que é a igualdade do algoritmo euclideano estendido.

14.11. Fatoração única de polinômios


Seja f ∈ K[x] \ {0}. Dizemos que f é irredutı́vel se dados g, h ∈ K[x] \ {0}
tais que f = gh então f ∈ K ∗ ou g ∈ K ∗ . Por exemplo x3 − 2 é irredutı́vel
em Q[x], pois sendo um polinômio de grau 3 só seria redutı́vel se um dos fatores
tivesse grau 1 e outro grau 2 ou se tivermos 3 fatores de grau 1. Mas como x3 − 2
é mônico isto equivale a este polinômio ter uma raiz racional. Mas suas raı́zes
√ √ √
são 3 2, 3 2α e 3 2α2 que não não números racionais, onde α = exp(2πi/3). Por
√ √ √
outro lado, em C[x] temos a fatoração x3 − 2 = (x − 3 2)(x − 3 2α)(x − 3 2α2 ),
assim esta noção é relativa ao corpo considerado.
Seja I ⊂ K[x] um ideal não nulo. I é dito um ideal maximal de K[x] se dado
um ideal J de K[x] tal que I ⊂ J ⊂ K[x], então J = I ou J = K[x].

Proposição 14.12. Seja f ∈ K[x] \ {0}. Então f é irredutı́vel se e somente


se (f ) é maximal.

Demonstração. Suponha que f seja irredutı́vel. Seja J um ideal de K[x]


tal que (f ) ⊂ J ⊂ K[x]. Pelo Teorema 14.10 temos que existe g ∈ K[x] tal que
J = (g). Logo f = gA, para A ∈ K[x]. Pela irredutibilidade de f temos que
g ∈ K ∗ ou A ∈ K ∗ . No primeiro caso, 1 = gg −1 ∈ (g), assim (g) = K[x]. No
segundo caso, g = A−1 f ∈ (f ), em particular (g) = (f ).
Reciprocamente, suponhamos que (f ) seja maximal e que f = gh para g, h ∈
K[x] \ {0}. Então (f ) ⊂ (g) ⊂ K[x]. Pela maximalidade de (f ), temos que
(g) = (f ) ou (g) = K[x]. No primeiro caso, g = af para algum a ∈ K ∗ , logo
1 = ah e a fortiori h ∈ K ∗ . No segundo caso, 1 = gg −1 ∈ (g) e assim g ∈ K ∗ . 

Lema 14.13. Seja f ∈ K[x] irredutı́vel tal que f | gh para g, h ∈ K[x] \ {0}.
Então f | g ou f | h.
122 14. ANÉIS DE POLINÔMIOS

Demonstração. Suponha que f - g, i.e., mdc(f, g) = 1. Pelo algoritmo


euclideano estendido existem A, B ∈ K[x] tais que 1 = Af + Bg. Logo, h =
Af h + Bgh, e como f | gh, concluimos que f | h. 

Teorema 14.14. Seja f ∈ K[x] \ {0}. Então existem únicos u ∈ K ∗ ,


p1 , · · · , pr
∈ K[x] polinômios irredutı́veis mônicos tais que grau(p1 ) < · · · < grau(pr ) e
inteiros e1 , · · · , er tais que
f = upe11 . . . perr .

Demonstração. Provavemos primeiro a existência da fatoração. Se f ∈ K ∗


ou f é irredutı́vel nada há a fazer. Suponha que grau(f ) ≥ 1 e f seja redutı́vel.
Seja Df o conjunto dos dvisores de f em K[x]. Pelo axioma da boa ordenação
existe q1 ∈ Df tal que grau(q1 ) ≤ grau(A) para todo A ∈ Df . Afirmamos que
q1 é irredutı́vel. Se isto não ocorresse, um fator B de q1 teria grau menor que
grau(q1 ) e além disto pertenceria a Df , o que é impossı́vel. Seja
f
f1 := .
q1
Se f1 ∈ K ∗ ou f1 for irredutı́vel acabou. Senão, seja q2 ∈ Df1 tal que grau(q2 ) ≤
grau(A) para todo A ∈ Df1 . Pelo mesmo argumento anterior q2 é irredutı́vel.
Seja
f1 f
f2 := = .
q2 q1 q2
Se f2 ∈ K ∗ ou f2 for irredutı́vel acabou. Senão prosseguimos. Note que grau(f ) >
grau(f1 ) > grau(f2 ) > · · · ≥ 0. Assim, existe r ≥ 1 tal que fr ∈ K ∗ , digamos
fr = u. Portanto,
f = uq1 · · · qr
é a fatoração desejada. Observe também que este processo é algorı́tmico e que
não fizemos qualquer hipótese sobre os qi ’s serem distintos.
Agrupando os polinômios irredutı́veis iguais temos uma fatoração como no
enunciado. Provemos agora sua unicidade. Suponha que tenhamos duas fa-
torações como acima, digamos
e
f = upe11 · · · prf = vq1g1 · · · qsgs ,
onde v ∈ K ∗ , q1 , · · · , qs são irredutı́veis com grau(q1 ) < · · · < grau(qs ) e g1 , · · · , gs
≥ 1 são inteiros. Observe que
p1 | vq1g1 · · · qsgs ,
14.11. FATORAÇÃO ÚNICA DE POLINÔMIOS 123

logo pelo lema 14.13 existe j tal que p1 | qj . Como ambos são irredutı́veis mônicos
isto ocorre se e somente se qj = p1 .
Afirmamos que j = 1. Suponha que j > 1. Neste caso, pelo mesmo argumento
existe i tal que q1 = bi pi para bi ∈ K ∗ . Se i = 1, então

grau(q1 ) = grau(p1 ) = grau(qj ),

o que é impossı́vel. Se i > 1, então

grau(q1 ) = grau(pi ) > grau(p1 ) = grau(qj ),

o que também é impossı́vel. Portanto q1 = a1 p1 e além disto e1 = g1 . Dividindo


os dois lados por pe11 obtemos a igualdade

upe22 · · · perr = vq2g2 · · · qsgs .

O mesmo argumento acima mostra que q2 = p2 e que e2 = g2 . Novamente


dividindo os dois lados por pe22 obtemos

upe33 · · · perr = vq3g3 · · · qsgs .

Assim aplicando sucessivamente o argumento temos que r = s, ei = gi para todo


i, qi = ai pi , onde ai ∈ K ∗ , e u = v. 

Nosso objetivo agora é obter um critério de irredutibilidade de polinômios em


Q[x] em termos dos seus coeficientes.

Lema 14.15 (lema de Gauss). Seja f ∈ Z[x] irredutı́vel. Então f é irredutı́vel


em Q[x].

Demonstração. Suponha que f = gh com g, h ∈ Q[x] e grau(g), grau(h) ≥


1. Multiplicando os dois lados pelo produto m dos denominadores de todos os
coeficientes de g e h obtemos
mf = g1 h1 ,
onde g1 , h1 ∈ Z[z] e grau(g1 ) = grau(g) e grau(h1 ) = grau(h). Seja p um fator
primo de m.
Afirmamos que p divide todos os coeficientes de g1 ou todos os coeficientes de
h1 . Escrevemos explicitamente
n
X m
X
i
g1 = ai x e h1 = bj x j .
i=0 j=0
124 14. ANÉIS DE POLINÔMIOS

Suponhamos que existam i e j tais que p - ai e p - bj . Além disto escolhamos


estes i e j minimais para esta propriedade. Consideremos o coeficiente de xi+j
de mf dado por

ci+j = a0 bi+j + . . . + ai−1 bj+1 + ai bj + ai+1 bj−1 + . . . + ai+j b0 .

Assim p divide todas as parcelas exceto ai bj , mas como p | ci+j isto nos dá uma
contradição. Portanto, p | ai para todo i ou p | bj para todo j. Suponhamos o
primeiro caso, dividindo por p dos dois lados temos que
m
f = g2 h1 .
p
Repetindo o argumento, cancelamos todos os fatores primos de m obtendo

f = g ∗ h∗ ,

onde g ∗ , h∗ ∈ Z[x] e grau(g ∗ ) = grau(g) e grau(h∗ ) = grau(h). Portanto f é


redutı́vel em Z[x]. 

Proposição 14.16 (critério de Eisenstein). Seja


n
X
f= ai xi ∈ Z[x] \ {0}.
i=0

Suponhamos que exista um número primo p tal que p | ai para todo i 6= n e


p2 - a0 . Então f é irredutı́vem em Q[x].

Demonstração. Pelo lema de Gauss basta mostrar que f é irredutı́vel em


Z[x]. Suponhamos que f = gh com g, h ∈ Z[x] e grau(g), grau(h) ≥ 1, digamos
r
X s
X
g= ai x i e h = bj x j .
i=0 j=0

Como p - an = br cs então p - br e p - cs . Por outro lado segue de p | a0 = b0 c0 e


p2 - a0 que p | b0 ou p | c0 e apenas uma destas opções ocorre. Digamos que p | b0
e p - c0 . Seja i ≤ r o menor inteiro tal que p - bi . O coeficiente de xi em f é dado
por
ai = b0 ci + b1 ci−1 + . . . + bi−1 c1 + bi c0 ,
assim p divide todas as parcelas exceto a última, portanto p - ai . Mas isto só
pode ocorrer para i = n, mas i ≤ r < n. 
14.11. FATORAÇÃO ÚNICA DE POLINÔMIOS 125

Utilizando o critério de Eisenstein vemos que todo polinômio xn − p para p


um número primo é irredutı́vel em Z[x]. Um exemplo menos óbvio é f (x) =
xp−1 + . . . + x + 1. Não existe a priori um primo para o qual possamos aplicar
o critério. A idéia é considerar o automorfismo de K[x] definido por x 7→ x + 1.
Assim dado g ∈ K[x] temos que g(x) é irredutı́vel se e somente se g(x + 1) é
irredutı́vel. Aplicando isto a f , observamos (exercı́cio) que f (x + 1) tem todos
os coeficientes, exceto o lı́der que é 1, divisı́veis por p e o coeficiente constante é
igual a p, portanto não é divisı́vel por p2 .
CAPı́TULO 15

Anéis e domı́nios

15.1. Domı́nios euclideanos


Seja D um domı́nio de integridade e ϕ : D \ {0} → N uma função tal que

ϕ(ab) ≥ ϕ(a),

para todos a, b ∈ D \ {0}. Dizemos que (D, ϕ) é um domı́nio euclideano, se para


todo a, b ∈ D com b 6= 0 temos

a = bq + r, onde r = 0 ou ϕ(r) < ϕ(b).

Como exemplos temos (Z, | |) e (K[x], grau). Em um domı́nio de integridade D


dizemos que b | a (para a, b ∈ D) se existe c ∈ D tal que a = bc.

Exemplo 15.2. Um outro exemplo é o anel dos inteiros gaussianos,

Z[i] := {a + bi | a, b ∈ Z}, onde i2 = −1.

Definimos também
ϕ(a + bi) := a2 + b2 .
Note que se a + bi, c + di ∈ Z[i] \ {0}, então

ϕ((a + bi)(c + di)) = ϕ((ac − bd) + i(ad + bc)i) = (ac − bd)2 + (ad + bc)2
= a2 c2 + b2 d2 + a2 d2 + b2 c2 = a2 (c2 + d2 ) + b2 (c2 + d2 )
= (a2 + b2 )(c2 + d2 ) = ϕ(a + bi)ϕ(c + di).

Em particular a condição

ϕ((a + bi)(c + di)) ≥ ϕ(a + bi)

é satisfeita. Afirmamos que (Z[i], ϕ) é um domı́nio euclideano. De fato, dados


a + bi, c + di ∈ Z[i] com c + di 6= 0 queremos mostrar que existem q = q0 + iq1 e
r = r0 + ir1 em Z[i] tais que

a + bi = q(c + di) + r, onde r = 0 ou ϕ(r) < ϕ(c + di).


127
128 15. ANÉIS E DOMÍNIOS

Se c + di divide a + bi basta tomar


a + bi
r=0eq= .
c + di
Suponhamos portanto que isto não ocorra, i.e., procuramos r 6= 0 satisfazendo a

ϕ(r) = ϕ(a + bi − q(c + di)) < ϕ(c + di),

i.e., (utilizando a multiplicatividade de ϕ)


 
a + bi
ϕ − q < ϕ(1) = 1.
c + di
Normalizando (a + bi)/(c + di) obtemos
(a + bi)(c − di)
= α + iβ,
c2 + d 2
onde α, β ∈ Q. Assim queremos mostrar que

ϕ(α + iβ − q) = (α − q0 )2 + (β − q1 )2 < 1.

Note que como α ∈ Q, então existe q0 ∈ Z tal que |α − q0 | ≤ 21 . Da mesma forma,


existe q1 ∈ Z tal que |β − q1 | ≤ 21 . Portanto,
1 1 1
(α − q0 )2 + (β − q1 )2 ≤ + = < 1.
4 4 2
Definimos portanto q como q0 + iq1 e r como a + bi − (c + di)q.

Exemplo 15.3. Outro exemplo é o anel


√ √
Z[ 2] := {a + b 2 | a, b ∈ Z}.

Para este anel definimos



ϕ(a + b 2) := a2 − 2b2 .

Observemos que
√ √ √
ϕ((a + b 2)(c + d 2)) = ϕ((ac + 2bd) + (ad + bc) 2) = (ac + 2bd)2 − 2(ad + bc)2
= a2 c2 + 4b2 d2 − 2a2 d2 − 2b2 c2 = a2 (c2 − 2d2 ) − 2b2 (c2 − 2d2 )
√ √
= (a2 − 2b2 )(c2 − 2d2 ) = ϕ(a + b 2)ϕ(c + d 2).

Portanto,
√ √ √
ϕ((a + b 2)(c + d 2)) ≥ ϕ(a + b 2).
15.1. DOMÍNIOS EUCLIDEANOS 129
√ √ √ √ √
Dados a + b 2, c + d 2 ∈ Z[ 2] com c + d 2 6= 0 queremos obter q, r ∈ Z[ 2]
tais que
√ √ √
a + b 2 = (c + d 2)q + r, onde r = 0 ou ϕ(r) < ϕ(c + d 2).
√ √
Se (c + d 2) | (a + b 2) tomamos

a+b 2
r=0eq= √ .
c+d 2
Caso isto não ocorra procuramos r 6= 0 tal que
√ √ √
ϕ(r) = ϕ(a + b 2 − q(c + d 2)) < ϕ(c + d 2),
i.e.,
√ !
a+b 2
ϕ √ − q < ϕ(1) = 1.
c+d 2
√ √
Normalizando (a + b 2)/(c + d 2) obtemos
√ √
(a + b 2)(c − d 2) √
= α + β 2,
c2 − 2d2
onde α, β ∈ Q. Assim queremos mostrar que
(α − q0 )2 − 2(β − q1 )2 < 1
1
para q0 , q1 ∈ Z. Novamente podemos escolher q0 , q1 ∈ Z tais que |α − q0 | ≤ 2
e
|β − q1 | ≤ 12 . Além disto
1
(α − q0 )2 − 2(β − q1 )2 ≤ (α − q0 )2 ≤ < 1.
4
Observação 15.4. Estes exemplos são na verdade casos particulares da se-
guinte situação mais geral. Seja K ⊃ Q um corpo contendo Q que como Q-espaço
vetorial é de dimensão finita. Um tal corpo é chamado um corpo de números. Os
elementos α ∈ K que satisfazem uma equação do tipo
n−1
X
αn + ai αi = 0 tais que ai ∈ Z
i=0

são chamados inteiros algébricos de K e o conjunto de todos os inteiros algébricos


forma uma anel (dos inteiros algébricos de K) denotado por OK . A pergunta é
quando OK com uma função ϕ apropriada é um domı́nio euclideano. A resposta
é como no caso anterior geométrica. Tudo depende da representação logarı́tmica
de K em um R espaço vetorial Rn de dimensão finita. Existem critérios nos quais
podemos mostrar que para certos corpos de números K existem funções ϕK tais
130 15. ANÉIS E DOMÍNIOS

que (OK , ϕK ) é um domı́nio euclideano. Para mais sobre esta questão ver [?] e
[?].

Observação 15.5. Mostraremos agora que como no caso dos inteiros e dos
polinômios domı́nios euclideanos são principais e fatoriais. Um caso clássico de
corpo de números ligado a teoria de números é o corpo
( n−1 )
X
Q[ζn ] := ai ζ i | ai ∈ Q para todo i ,
i=0

onde ζ = exp(2πi/n). Este corpo é chamado o n-ésimo corpo ciclotômico. Kum-


mer, no fim do século XIX, pensou erradamente ter “provado” o último teorema
de Fermat (i.e., que a equação xn + y n = z n não possui soluções inteiras não tri-
viais para n > 2), e seu erro foi exatamente ter “achado” que OK era principal,
o que é falso.

Teorema 15.6. Seja (D, ϕ) um domı́nio euclideano. Então D é principal,


i.e., todo ideal I ⊂ D é da forma I = (a) = {aα | α ∈ D}.

Demonstração. Se I = (0) nada há a fazer. Suponhamos que I 6= (0) e seja


a ∈ I \ {0} tal que ϕ(a) ≤ ϕ(α) para todo α ∈ I \ {0}. Afirmamos que I = (a).
A inclusão (a) ⊂ I é imediata da definição de ideal. Suponhamos que b ∈ I. Por
hipótese existem q, r ∈ D tais que b = aq + r, onde r = 0 ou ϕ(r) < ϕ(a). Se
r 6= 0, então r = b − aq ∈ I, mas isto contradiz a escolha de a. Logo r = 0 e
b ∈ (a). 

Teorema 15.7. Seja (D, ϕ) um domı́nio euclideano. Então D é principal,


i.e., todo ideal I ⊂ D é da forma I = (a) = {aα | α ∈ D}.

Demonstração. Se I = (0) nada há a fazer. Suponhamos que I 6= (0) e seja


a ∈ I \ {0} tal que ϕ(a) ≤ ϕ(α) para todo α ∈ I \ {0}. Afirmamos que I = (a).
A inclusão (a) ⊂ I é imediata da definição de ideal. Suponhamos que b ∈ I. Por
hipótese existem q, r ∈ D tais que b = aq + r, onde r = 0 ou ϕ(r) < ϕ(a). Se
r 6= 0, então r = b − aq ∈ I, mas isto contradiz a escolha de a. Logo r = 0 e
b ∈ (a). 

Seja D um domı́nio de integridade. Denotamos por D∗ o conjunto dos ele-


mentos inversı́veis de D. i.e., o conjunto dos elementos a ∈ D tais que existe
b ∈ D tal que ab = 1. Por exemplo, Z∗ = {±1} e K[x]∗ = K ∗ . Se D = Z[i],
notemos que se a + bi ∈ Z[i]∗ então existe c + di ∈ Z[i] tal que (a + bi)(c + di) = 1.
15.1. DOMÍNIOS EUCLIDEANOS 131

Logo (a2 + b2 )(c2 + d2 ) = 1, i.e., a2 + b2 = 1. Mas no cı́rculo x2 + y 2 = 1 os únicos


pontos com coordenadas inteiras são ±1 e ±i. Reciprocamente, estes elementos
são claramente inversı́veis, portanto Z[i]∗ = {±1, ±i}.
Um elemento a ∈ D é dito irredutı́vel, se toda vez que a = bc com b, c ∈ D
então b ∈ D∗ ou c ∈ D∗ .

Lema 15.8. Seja (D, ϕ) um domı́nio euclideano. Então a ∈ D∗ se e somente


se ϕ(a) = ϕ(1).

Demonstração. Observemos que ϕ(a) = ϕ(a.1) ≥ ϕ(1) para todo a ∈


D \ {0}. Por outro lado se a ∈ D∗ , então existe b ∈ D \ {0} tal que ab = 1, logo
ϕ(1) = ϕ(ab) ≥ ϕ(a), o que mostra que ϕ(a) = ϕ(1). Suponha que ϕ(a) = ϕ(1)
para a ∈ D \ {0}. Por hipótese existem q, r ∈ D tais que 1 = qa + r com r = 0 ou
ϕ(r) < ϕ(a). Assim, se r 6= 0, então ϕ(r) < ϕ(1) o que é impossı́vel. Portanto,
r = 0 e 1 = aq, i.e., a ∈ D∗ . 

Teorema 15.9. Seja (D, ϕ) um domı́nio euclideano e a ∈ D \ {0}. Então


existem u ∈ D∗ e p1 , · · · , pr ∈ D \ {0} irredutı́veis tais que a = up1 · · · pr .

Demonstração. Se a ∈ D∗ ou a for irredutı́vel nada há a fazer. Suponha-


mos a ∈ / D∗ redutı́vel. Seja Da o conjunto dos divisores d de a em D. Seja
p1 ∈ Da \ {0} tal que ϕ(p1 ) ≤ ϕ(b) para todo b ∈ Da . Afirmamos que p1 é
irredutı́vel. De fato, caso contrário, p1 = cd, c, d ∈/ D∗ e ϕ(p1 ) = ϕ(cd) ≥ ϕ(d).
Se ϕ(cd) = ϕ(d), por hipótese existem q, r ∈ D tais que d = qcd + r com r = 0
ou ϕ(r) < ϕ(cd) = ϕ(d). Se r 6= 0, então r = d(1 − qc) e ϕ(r) ≥ ϕ(d), o que é
impossı́vel, assim r = 0, mas neste caso qc = 1, logo c ∈ D∗ , o que também é
impossı́vel. Assim ϕ(cd) > ϕ(d) e d ∈ Da , mas isto contradiz a minimalidade de
p1 . Portanto, p1 é irredutı́vel.
Seja
a
a1 := .
p1
Se a1 ∈ D∗ ou a1 é irredutı́vel então nada há a fazer. Caso contrário, repetindo
o argumento existe p2 ∈ Da1 irredutı́vel tal que ϕ(p2 ) ≤ ϕ(b) para todo b ∈
Da1 \ {0}. Seja
a1 a
a2 := = .
p2 p1 p2
Novamente, se a2 ∈ D∗ ou a2 for irredutı́vel acabou. Caso contrário prosseguimos.
Observe que ϕ(a) > ϕ(a1 ) > ϕ(a2 ) > · · · ≥ ϕ(1), pois os elementos pi ’s são
132 15. ANÉIS E DOMÍNIOS

irredutı́veis. Portanto, existe r tal que ϕ(ar ) = ϕ(1), i.e., ar ∈ D∗ e neste caso

a = up1 · · · pr com u = ar .

Definição 15.10. Sejam a, b ∈ D \ {0}. Definimos um mdc d de a e b por


(1) d | a e d | b.
(2) Para todo d0 ∈ D \ {0} tal que d0 | a e d0 | b, temos que d0 | d.

Observação 15.11. Observe que se d e e são mdc’s de a e b então d | e e


e | d, i.e., d = Ae e e = Bd para A, B ∈ D, assim d = BAd e portanto A, B ∈ D∗ .
Logo a menos de multiplicação por um elemento inversı́vel a noção de mdc está
bem definida.

Observação 15.12. Seja

I := (a) + (b) := {aα + bβ | α, β ∈ D}

o ideal gerado por a e b. Como (D, ϕ) é principal, concluimos que existe d ∈


D \ {0} tal que (d) = I. Afirmamos que d = mdc(a, b). De fato, a = 1.a + 0.b ∈ I,
logo a = dα, i.e., d | a. Pelo mesmo argumento d | b. Por outro lado existem
s, t ∈ D tais que d = as + bt (o algoritmo euclideano estendido). Se d0 | a e d0 | b,
então a = Ad0 e b = Bd0 para A, B ∈ D, portanto d = d0 (sA + tB), i.e., d0 | d.

Lema 15.13. Seja p ∈ D irredutı́vel e suponha que p | ab para a, b ∈ D. Então


p | a ou p | b.

Demonstração. Suponha que p - a, então mdc(p, a) = 1 e existem s, t ∈ D


tais que 1 = sp + ta. Multiplicando por b e utilizando que ab = αp para α ∈ D,
obtemos b = spb + tαp, logo p | b. 

Teorema 15.14. Seja (D, ϕ) um domı́nio euclideano e a ∈ D \ {0}. Então


existem únicos (a menos de inversı́veis) u ∈ D∗ , p1 , · · · , pr ∈ D irredutı́veis com
ϕ(p1 ) < · · · < ϕ(pr ) e inteiros e1 , · · · , er ≥ 1 tais que

a = upe11 · · · perr .

Demonstração. Suponha que possamos fatorar a de duas maneiras distin-


tas
a = upe11 · · · perr = vq1f1 · · · qsfs ,
15.15. DOMÍNIOS FATORIAIS 133

para v ∈ D∗ , q1 , · · · , qs ∈ D irredutı́veis com ϕ(q1 ) < · · · < ϕ(qs ). Observe que


p1 | vq1f1 · · · qsfs .
Pelo lema anterior existe i tal que p1 | qi . Como ambos são irredutı́veis isto
significa que existe ai ∈ D∗ tal que qi = ai p1 . Afirmamos que i = i.
De fato, suponha que i > 1. Pelo mesmo argumento existe j tal que p1 = bj qj
com bj ∈ D∗ . Se j = 1, então ϕ(p1 ) = ϕ(q1 ) < ϕ(qi ) = ϕ(p1 ) o que é impossı́vel.
Se j > 1, então ϕ(p1 ) = ϕ(qi ) > ϕ(q1 ) = ϕ(pi ) o que também é impossı́vel.
Também temos que ter e1 = f1 , pois se por exemplo f1 > e1 , então após cancelar
p1 terı́amos que ter q1 = apj para j > 1 o que novamente é impossı́vel.
Dividindo ambos os lados por pe11 obtemos
uae11 pe22 · · · perr = vq2f2 · · · qsfs .
Repetindo o argumento anterior, q2 = a2 p2 para a2 ∈ D∗ e e2 = f2 , dividindo
ambos os lados por pe22 obtemos
uae11 ae22 pe33 · · · perr = vq3f3 · · · qsfs .
Repetindo o argumento obtemos que r = s e para todo i = 1, · · · , r temos que
qi = ai pi para ai ∈ D∗ e
u = vae11 · · · aerr .


15.15. Domı́nios fatoriais


Definição 15.16. Seja D um domı́nio de integridade. Definimos em D :=
D × (D \ {0}) a seguinte relação de equivalência:
(a, b) ∼ (c, d) se e somente se ad = bc.
Seja K := D/ ∼ o conjunto das classes de equivalência de D. A classe de
equivalência do par (a, b) é denotada pela fração ab . Definimos em D operações
de soma e produto por
a c ad + bc a c ac
+ := e + = .
b d cd b d bd
Com estas operações K é um corpo. O inverso de a/b 6= 0 é b/a.

Definição 15.17. Sejam A e B dois anéis (sempre comutativos com elemento


neutro para o produto). Uma função f : A → B é dita um homomorfismo de
anéis se f (x + y) = f (x) + f (y) e f (xy) = f (x)f (y) para todos x, y ∈ A. O
134 15. ANÉIS E DOMÍNIOS

núcleo N (f ) de f é definido como o subconjunto dos elementos a ∈ A tais que


f (a) = 0. Note que 0 ∈ N (f ). Observe também que N (f ) é um ideal de A. De
fato, se x, y ∈ N (f ), então f (x + y) = f (x) + f (y) = 0, i.e., x + y ∈ N (f ). Se
x ∈ N (f ) e a ∈ A, então f (x, y) = f (x)f (y) = 0, i.e., xa ∈ N (f ).

Lema 15.18. f é injetivo se e somente se N (f ) = (0).

Demonstração. Se f é injetivo e x ∈ N (f ), então f (x) = 0 = f (0), logo


x = 0. Se N (f ) = (0) e f (x) = f (y), então f (x − y) = 0, i.e., x − y ∈ N (f ), i.e.,
x = y. 

Observação 15.19. Um homomorfismo f : A → B é dito um isomorfismo


se for um homomorfismo bijetivo. Consideremos o homomorfismo de anéis ϕ :
D → K definido por ϕ(a) := a/1. Este é um homomorfismo injetivo, pois se
a/1 = 0/1, então a = 0. Por isto D é isomorfo a sua imagem e K é dito o corpo
de frações de D e denotado por fr(D).

Definição 15.20. Um domı́nio de integridade D é dito fatorial quando para


todo a ∈ D \ {0} podemos escrever a de maneira única
a = upe11 · · · perr ,
onde u ∈ D∗ , p1 , · · · , pr ∈ D são irredutı́veis e e1 , · · · , er ≥ 1 são inteiros,
onde a unicidade é a menos de multiplicação por um elemento de D∗ ou de
permutação dos irredutı́veis. No caso de um domı́nio euclideano, a função ϕ
determina a ordem dos elementos irredutı́veis, assim não podemos permutá-los e
a a unicidade é a menos de multiplicação por inversı́veis. Dois elementos a, b ∈ D
são ditos associados (denotado por a ∼ b), se a = ub onde u ∈ D∗ .

Definição 15.21. Seja D[x] o anel de polinômios com coeficientes em D, i.e.,


são os elementos da forma
Xn
f= ai xi tais que ai ∈ D para todo i.
i=0

Seja K := fr(D) seu corpo de frações. O conteúdo c(f ) de f ∈ D[x] é definido


por
c(f ) := mdc(an , · · · , a0 ).
Sendo um mdc, o elemento c(f ) é único a menos de multiplicação por elemento
de D∗ . Um polinômio f ∈ D[x] é dito primitivo, se c(f ) = 1.
15.15. DOMÍNIOS FATORIAIS 135

Lema 15.22 (lema de Gauss generalizado). Seja D um domı́nio fatorial e K


seu corpo de frações.
(1) Se f, g ∈ D[x], então c(f g) = c(f )c(g).
(2) Se f, g ∈ D[x] são primitivos, então f é associado a g em D[x] se e
somente se ele o for em K[x].
(3) Seja f ∈ D[x] primitivo. Então f é irredutı́vel em D[x] se e somente se
f é irredutı́vel em K[x].

Demonstração. (1) Podemos sempre escrever f = c(f )f1 para f1 ∈ D[x]


primitivo. Logo,

f g = c(f )c(g)f1 g1 e c(f g) = c(f )c(g)c(f1 g1 ).

Afirmamos que c(f1 g1 ) = 1. Escrevamos explicitamente


n
X m
X
i
f1 = ai x e g1 = bi x i .
i=0 i=0

Seja
n+m
X
f1 g1 = cj x j .
i=0

Seja p ∈ D irredutı́vel. Como c(f1 ) = c(g1 ) = 1 existe i tal que p - ai e l tal que
p - bl . Escolhamos i e l mı́nimos com esta propriedade. Então

ci+l = ai+l b0 + ai+l−1 b1 + . . . + ai+1 bl−1 + ai bl + ai−1 bl+1 + . . . + a0 bi+l

não pode ser divisı́vel por p. Em particular, p - c(f1 g1 ) e c(f1 g1 ) = 1.


(2) É claro que que se f é associado a g em D[x] também o é em K[x].
Provemos a recı́proca. Ou seja, suponhamos que f = ug para u ∈ K ∗ e K =
fr(D). Digamos que u = ab . Logo

bf = ag, c(bf ) = bc(f ) = b e c(ag) = ac(g) = a,

i.e., b = va para v ∈ D∗ , portanto f é associado a g em D[x].


(3) É claro que se f é irredutı́vel em K[x] ele também o é em D[x]. Suponha
que f seja redutı́vel em K[x], digamos f = gh para g, h ∈ K[x] tais que grau(g),
grau(h) ≥ 1. Eliminando os denominadores de g e h obtemos a ∈ D \ {0} tal que
af = g1 h1 para g1 , h1 ∈ D[x] e grau(g1 ) = grau(g) e grau(h1 ) = grau(h). Note
que
c(af ) = ac(f ) = a e c(g1 h1 ) = c(g1 )c(h1 ),
136 15. ANÉIS E DOMÍNIOS

logo existe u ∈ D∗ tal que a = c(g1 )c(h1 )u. Além disto, escrevendo g1 = c(g1 )g1∗
e h1 = c(h1 )h∗1 com g1∗ , h∗1 ∈ D[x] primitivos temos que
af = c(g1 )c(h1 )g1∗ h∗1 ,
i.e., f = u−1 g1∗ h∗1 o que contradiz o fato de f ser irredutı́vel em D[x]. 

Teorema 15.23. Seja D um domı́nio fatorial. Então D[x] também é um


domı́nio fatorial.

Demonstração. Seja f ∈ D[x] \ {0}. Se f ∈ D∗ ou f for irredutı́vel nada


há a fazer. Caso contrário fatoramos
f = upe11 · · · perr
com u ∈ K ∗ , p1 , · · · , pr ∈ K[x] irredutı́veis, grau(p1 ) < · · · < grau(pr ) e e1 , · · · , er
≥ 1 inteiros. Multiplicando pelo produto dos denominadores obtemos a ∈ D \{0}
tal que
af = vq1e1 · · · qrer ,
onde v ∈ D \ {0} e q1 , · · · , qr ∈ D[x] irredutı́veis em K[x] e grau(qi ) = grau(pi )
para todo i. Para todo i escreva qi = c(qi )qi∗ com qi∗ ∈ D[x] primitivo e irredutı́vel
em K[x]. Pelo lema de Gauss qi∗ é irredutı́vel em D[x] para todo i. Assim,
af = vc(q1 )e1 · · · c(qr )er (q1∗ )e1 · · · (qr∗ )er .
Mas c(af ) = ac(f ) e
c(vc(q1 )e1 · · · c(qr )er (q1∗ )e1 · · · (qr∗ )er ) = vc(q1 )e1 · · · c(qr )er .
Logo existe w ∈ D∗ tal que
ac(f ) = wvc(q1 )e1 · · · c(qr )er .
Em particular,
f = w−1 (q1∗ )e1 · · · (qr∗ )er
o que mostra que D[x] é fatorial. 

Teorema 15.24 (critério de Eisenstein generalizado). Seja D um domı́nio


fatorial, K = fr(D) seu corpo de frações,
n
X
f= ai xi ∈ D[x] − {0}
i=0

primitivo e p ∈ D irredutı́vel. Se p | ai para i = 0, · · · , n − 1, p - an e p2 - a0 ,


então f é irredutı́vel em K[x].
15.25. FATORES MÚLTIPLOS E RESULTANTE 137

Demonstração. A prova é igual ao caso em que D = Z que foi feita ante-


riormente, substituindo o lema de Gauss pela sua generalização. 

15.25. Fatores múltiplos e resultante


Proposição 15.26. Sejam f, g ∈ K[x] \ K. Então existe h ∈ K[x] \ K
irredutı́vel tal que
h|f eh|g
se e somente se existem u, v ∈ K[x] \ {0} tais que

ug = vf, grau(u) < grau(f ) e grau(v) < grau(g).

Demonstração. Suponhamos que exista h como acima, i.e., f = hf1 e


g = hg1 com f1 , g1 ∈ K[x] e grau(f1 ) < grau(f ) e grau(g1 ) < grau(g). Logo
f1 g = g1 f e tomamos u = f1 e v = g1 .
Reciprocamente, suponhamos a segunda condição satisfeita. Como grau(u) <
grau(f ) e pela unicidade da fatoração de polinômios temos que existe algum fator
irredutı́vel h de f tal que h | g. 

Definição 15.27. Sejam


n
X m
X
i
f= ai x e g = bj x j .
i=0 j=0

A resultante Res(f, g) é definida como o determinante da seguinte matriz


 
an an−1 · · · a1 a0

 an an−1 · · · a1 a0 

 .. .. .. .. .. 

 . . . . . 

 a n a n−1 · · · a 1 a 
0
,

bm bm−1 · · ·

b1 b0 
 

 b m b m−1 · · · b 1 b 0



 ... ... ... ... ... 

bm bm−1 · · · b1 b0
onde as linhas com os coeficientes ai ’s são repetidas m vezes e as linhas com os
coeficientes bj ’s são repetidas n vezes, ou seja a matriz é (n + m) × (n + m). As
demais entradas da matriz são todas nulas.
138 15. ANÉIS E DOMÍNIOS

Observação 15.28. Seja


r
X s
X
i
u= ci x e v = d j xj ,
i=0 j=0

onde r ≤ n − 1 e s ≤ m − 1. Para facilitar a notação tomaremos os coeficientes


de u (resp. v) até n − 1 (resp. m − 1) com a convenção que se i > r (resp. j > s)
então ci = 0 (resp. dj = 0). A igualdade ug = vf resulta em um sistema linear
homogêneo
an dm−1 − bm cn−1 = 0
an dm−2 + an−1 dm−1 − bm cn−2 − bm−1 cn−1 = 0
······
a1 d 0 + a0 d 1 − b 1 c 0 − b 0 c 1 = 0
a0 d 0 − b 0 c 0 = 0
cuja matriz transposta é igual a
 
an an−1 ··· a1 a0

 an an−1 ··· a1 a0 


 ... ... ... ... ... 

 
 an an−1 ··· a1 a0 
.
 
−bm −bm−1 ··· −b1 −b0


 

 −bm −bm−1 ··· −b1 −b0 

 .. .. .. .. .. 
 . . . . . 
−bm −bm−1 ··· −b1 −b0
Portanto, o determinante da matriz do sistema é igual a (−1)n Res(f, g). Da
álgebra linear o sistema tem solução não trivial se e somente se o determinante da
matriz do sistema é nulo, o que equivale a Res(f, g) = 0. A existência de solução
não trivial equivale justamente a existência de u e v satisfazendo à condição
acima. Dessa forma temos o teorema seguinte.
Teorema 15.29. Sejam f, g ∈ K[x] \ K, então existe h ∈ K[x] \ K irredutı́vel
tal que h | f e h | g se e somente se Res(f, g) = 0.
Definição 15.30. Definimos formalmente a derivação de polinômios D : K[x]
→ K[x] por !
Xn Xn
i
D ai x := iai xi .
i=0 i=1
15.34. ANÉIS QUOCIENTES E TEOREMA CHINÊS DOS RESTOS 139

Esta função satisfaz as seguintes propriedades:


(1) D(f + g) = D(f ) + D(g), para f, g ∈ K[x];
(2) D(af ) = aD(f ), para a ∈ K e f ∈ K[x];
(3) (regra de Leibniz) D(f g) = f D(g) + D(f )g, para f, g ∈ K[x].
Dizemos que um fator irredutı́vel f de g ∈ K[x] − K é múltiplo se f 2 | g.

Proposição 15.31. Seja g ∈ K[x] \ K e f ∈ K[x] \ K um polinômio irre-


dutı́vel. Então f é fator múltiplo de g se e somente se f | D(g).

Demonstração. Suponha que f seja fator múltiplo de g, então f 2 | g, i.e.,


g = Af 2 para algum A ∈ K[x]. Logo D(g) = D(A)f 2 + 2Af D(f ), portanto
f | D(g).
Reciprocamente, suponha que f | D(g), digamos g = f A e D(g) = f B
para A, B ∈ K[x]. Derivando a primeira igualdade, D(g) = f D(A) + D(f )A,
substituindo temos que f (B − D(A)) = D(f )A. Se D(f ) = 0 então trivialmente
D(f ) | g. Suponhamos que D(f ) 6= 0. Neste caso grau(D(f )) < grau(f ) e como
f é irredutı́vel, pela unicidade da fatoração de polinômios, concluimos que f é
um fator de A, digamos A = f C para C ∈ K[x]. Assim g = f 2 C e f é um fator
múltiplo de g. 

Definição 15.32. Definimos o discriminante de f ∈ K[x]\{0} por disc(f ) :=


Res(f, D(f )). Assim concluimos a seguinte proposição.

Proposição 15.33. Seja f ∈ K[x] \ K, então f possui fator múltiplo se e


somente se disc(f ) = 0.

15.34. Anéis quocientes e teorema chinês dos restos


Seja A um anel (sempre comutativo com unidade) e I, J ⊂ A ideais de A
definimos o ideal soma I + J por
I + J := {a + b | a ∈ I e b ∈ J}.
Fica como exercı́cio verificar que I + J é de fato um ideal de A. Dizemos que os
ideais I e J são coprimos se
I + J = A, i.e., se existem a ∈ I e b ∈ J tais que 1 = a + b.
Por exemplo, se A = Z, I = nZ e J = mZ com n, m ≥ 1 inteiros, temos que
I e J são coprimos se e somente se mdc(m, n) = 1. De fato, se os ideais forem
coprimos, então existem s, t ∈ Z tais que 1 = sn + tm. Assim, qualquer divisor
140 15. ANÉIS E DOMÍNIOS

primo comum de n e m dividiria também 1, o que é impossı́vel. Reciprocamente,


se mdc(n, m) = 1, então pelo algoritmo euclideano estendido existem s, t ∈ Z tais
que 1 = sn + tm, a fortiori 1 ∈ I + J.

Definição 15.35. Seja A um anel e I um ideal de A. Definimos em A a


seguinte relação. Dados a, b ∈ A dizemos que

a ≡ b (mod I) se a − b = α ∈ I,

dizemos neste caso que a é equivalente a b módulo I. Fica como exercı́cio verificar
que isto define de fato uma relação de equivalência. A classe de equivalência de
a ∈ A módulo I será denotada por

a + I := {a + α | α ∈ I}.

O conjunto de classes de equivalência será denotado por A/I. Quando A = Z e


I = nZ a relação acima é apenas a relação de congruência módulo n, uma vez
que Z é um domı́nio principal.

Definição 15.36. Definimos em A/I uma estrutura de anel da seguinte


forma:

(a + I) ⊕ (b + I) := (a + b) + I e (a + I) (b + I) := (ab) + I.

Observação 15.37. Verifiquemos que estas operações estão bem definidas.


Sejam a0 , b0 ∈ A tais que a0 ≡ a (mod I) e b0 ≡ b (mod I), i.e., a0 − a = α ∈ I e
b0 − b = β ∈ I. Assim,

(a0 + b0 ) − (a + b) = α + β ∈ I

e em particular a0 +b0 ≡ a+b (mod I) (o que equivale a (a0 +b0 )+I = (a+b)+I).
Também temos que

a0 b0 − ab = a0 b0 − a0 b + a0 b − ab = a0 (b0 − b) + b(a0 − a) = a0 β + bα ∈ I,

portanto a0 b0 ≡ ab (mod I) (ou equivalentemente, (a0 b0 )+I = (ab)+I). Deixamos


também como exercı́cio verificar (exatamente como no caso dos inteiros módulo
n) que o conjunto A/I com as operações ⊕ e é um anel. Note que o elemento
neutro para a soma é a classe I e o elemento neutro para o produto é a classe
1 + I.
15.34. ANÉIS QUOCIENTES E TEOREMA CHINÊS DOS RESTOS 141

15.37.1. Ideais primos e maximais.

Definição 15.38. Um ideal I de um anel A é dito maximal se para todo


ideal J de A tal que I ⊂ J ⊂ A temos J = I ou J = A.

Proposição 15.39. Um ideal I de A é maximal se e somente se o anel


quociente A/I é um corpo.

Demonstração. Suponha que I seja um ideal maximal de A. Seja a+I 6= I


uma classe em A/I. Isto equivale a a ∈ / I. O conjunto (a) = {xa | x ∈ A} é um
ideal de A e pelo que foi feito anteriormente o conjunto J = I + (a) também é um
ideal de A. Além disto, I J. Pela maximalidade de I concluimos que J = A,
i.e., que existem t ∈ I e s ∈ A tais que 1 = t + sa, i.e., sa ≡ 1 (mod I), i.e.,
(sa) + I = (s + I) (a + I) = 1 + I, i.e., a + I admite inverso multiplicativo.
Reciprocamente, suponha que A/I seja um corpo. Seja J um ideal de A tal
que I J. Seja a ∈ J − I. Então a + I 6= I e por hipótese existe b ∈ A tal que
(a + I) (b + I) = 1 + I, i.e., (ab) + I = 1 + I, i.e., existe t ∈ I tal que ab − 1 = t.
Em outras palavras 1 = t − ab ∈ J, logo A = J e I é maximal. 

Definição 15.40. Um ideal I de A é dito um ideal primo se dados a, b ∈ A


tais que ab ∈ I, então a ∈ I ou b ∈ I. Note que quando A = Z e p é um número
primo o ideal pZ é um ideal primo de Z.

Proposição 15.41. Um ideal I de A é primo se e somente se o anel quociente


A/I é um domı́nio de integridade.

Demonstração. Suponha que I seja um ideal primo de A. Sejam a + I, b +


I ∈ AI tais que (a + I) (b + I) = I, i.e., (ab + I) = I, i.e., ab ∈ I. Como I é
primo, temos que a ∈ I ou b ∈ I, i.e., a + I = I ou b + I = I.
Reciprocamente, suponha que A/I seja um domı́nio de integridade. Sejam
a, b ∈ A tais que ab ∈ I, i.e., (ab) + I = (a + I) (b + I) = I. Por hipótese,
a + I = I ou b + I = I, i.e., a ∈ I ou b ∈ I. 

15.41.1. Homomorfismo de anéis.

Definição 15.42. Sejam A e B anéis e f : A → B uma função. Esta função


é dito um homomorfismo de anéis se

f (a + b) = f (a) + f (b) e f (ab) = f (a)f (b).


142 15. ANÉIS E DOMÍNIOS

Observe que f (0) = f (0 + 0) = f (0) + f (0), portanto f (0) = 0. Se além


disto A for um domı́nio de integridade e f não for a função nula, então f (1) =
1. De fato, f (1) = f (1.1) = f (1)f (1), i.e., f (1)(f (1) − 1) = 0. Se A é um
domı́nio de integridade, então f (1) = 0 ou f (1) = 1. No primeiro caso a função
é identicamente nula, pois f (a) = f (1.a) = f (1)f (a) = 0. Observe também que
como 0 = f (0) = f (a + (−a)) = f (a) + f (−a), então f (−a) = −f (a).

Definição 15.43. Um homomorfismo f : A → B é dito um isomorfismo se


for bijetivo. Um homomorfismo f : A → A é dito um endomorfismo de A. Se este
endomorfismo for bijetivo ele é dito um automorfismo de A. Seja f : A → B um
homomorfismo de anéis. O núcleo N (f ) de f é definido por {a ∈ A | f (a) = 0}.
Fica como exercı́cio mostrar que N (f ) é um ideal de A. A imagem f (A) de f é
um subanel de B (isto também é um exercı́cio).

Lema 15.44. Seja f : A → B um homomorfismo de anéis. Então f é injetivo


se e somente se N (f ) = (0).

Demonstração. Suponha que f seja injetivo e que a ∈ N (f ). Logo f (a) =


0 = f (0), pela injetividade de f concluimos que a = 0. Reciprocamente, suponha
que N (f ) = (0). Sejam a, b ∈ A tais que f (a) = f (b). Então f (a − b) = 0, i.e.,
a − b ∈ N (f ), em particular a = b. 

Teorema 15.45 (teorema dos homomorfimos). Seja f : A → B um homo-


morfismo de anéis. Então f induz um isomorfismo ϕ : A/N (f ) → f (A) (em
outras palavras A/N (f ) ∼
= f (A), i.e., estes dois anéis são isomorfos).

Demonstração. A função ϕ é definida por


ϕ(a + N (f )) := f (a).
Verifiquemos inicialmente que ϕ está bem definida. Seja a0 ∈ A tal que a0 ≡ a
(mod N (f )), i.e., a0 − a = α ∈ N (f ). Logo f (a0 ) = f (a), i.e., ϕ(a0 + N (f )) =
ϕ(a + N (f )).
Esta função é um homomorfismo, pois
ϕ((a + N (f )) ⊕ (b + N (f ))) = ϕ((a + b) + N (f )) = f (a + b) = f (a) + f (b)
= ϕ(a + N (f )) + ϕ(b + N (f )) e
ϕ((a + N (f )) (b + N (f ))) = ϕ((ab) + N (f )) = f (ab)
= f (a)f (b) = ϕ(a + N (f ))ϕ(b + N (f )).
15.34. ANÉIS QUOCIENTES E TEOREMA CHINÊS DOS RESTOS 143

Esta função é sobrejetiva, pois para todo y ∈ f (A), temos que y = f (a) para
a ∈ A, portanto y = ϕ(a + N (f )). Esta função também é injetiva, pois se
ϕ(a + N (f )) = f (a) = 0, então a ∈ N (f ), i.e., a + N (f ) = N (f ). 
15.45.1. Teorema chinês dos restos.

Proposição 15.46. Sejam I, J ideais de A tais que I + J = A e a, b ∈ A.


Então existe x ∈ A tal que
(
x ≡ a (mod I)
x ≡ b (mod J).
Demonstração. Por hipótese existem α ∈ I e β ∈ J tais que 1 = α + β.
Então β ≡ 1 (mod I) e α ≡ 1 (mod J). Em particular, aβ ≡ a (mod I) e bα ≡ b
(mod J). Basta tomar x = aβ + bα. 
Vamos generalizar o resultado anterior para um número qualquer de ideais.
Para isto precisamos da noção de produto de ideais. Sejam I1 , · · · , Ir ideais de
A. Seja
I1 . . . Ir := {a1,1 · · · ar,1 + . . . + a1,n . . . ar,n | onde ai,j ∈ Ii , para todo i}.
Fica como exercı́cio mostrar que I1 . . . Ir é efetivamente um ideal de A.

Proposição 15.47. Sejam I1 , · · · , Ir ideais de A tais que para todo α 6= β


tenhamos Iα + Iβ = A. Sejam a1 , · · · , ar ∈ A. Então existe x ∈ A tal que


 x ≡ a1 (mod I1 )

.. ..

 . .

 x ≡ a (mod I ).

r r

Demonstração. Denotamos
J := I1 . . . Ir e para cada ν, Jν := I1 . . . Iν−1 Iν+1 . . . Ir .
Afirmamos que
(15.47.1) Iν + Jν = A.
De fato, sabemos que para cada α 6= ν existem λα ∈ Iα e λν(α) ∈ Iν tais que
λα + λν(α) = 1. Note que utilizamos o ı́ndice ν(α) para dizer que o elemento
λν(α) efetivamente depende da escolha de α, uma vez que os ideais são dois a dois
coprimos. Seja
γν := λ1 . . . λν−1 λν+1 . . . λr ∈ Jν .
144 15. ANÉIS E DOMÍNIOS

Então Y
(λα + λν(α) ) = γν + δν ,
α6=ν

onde δν ∈ Iν . Da igualdade (15.47.1) obtemos que para cada ν vale γν ≡ 1


(mod Iν ) e γν ≡ 0 (mod Iα ) para α 6= ν. Finalmente, x := a1 γ1 + . . . + ar γr é
uma solução do sistema. 

Lema 15.48. Sejam I1 , · · · , Ir ideais de A tais que para todo α 6= β tenhamos


Iα + Iβ = A. Então
I1 . . . Ir = I1 ∩ . . . ∩ Ir .

Demonstração. Provemos o resultado por indução em r. Suponhamos ini-


cialmente r = 2. Assim, um elemento de I1 I2 é da forma
a1,1 a2,1 + . . . + a1,n a2,n ,
onde a1,ν ∈ I1 (resp. a2,ν ∈ I2 ) para cada ν. Note que cada parcela a1,ν a2,ν
pertence a I1 ∩ I2 , pela definição de ideal. Logo I1 I2 ⊂ I1 ∩ I2 . Basta provar a
inclusão oposta. Por hipótese existem γ1 ∈ I1 e γ2 ∈ I2 tais que 1 = γ1 + γ2 . Seja
a ∈ I1 ∩ I2 , logo a = γ1 a + aγ2 ∈ I1 I2 .
Suponha agora o resultado provado para r − 1 fatores, vamos prová-lo para
r fatores. Novamente, pela própria definição de produto de ideais temos que
I1 . . . Ir ⊂ I1 ∩ . . . ∩ Ir . Basta provar a inclusão oposta. Da demonstração da
proposição anterior concluimos que I1 . . . Ir−1 e Ir são coprimos. Logo existe
γr ∈ I1 . . . Ir−1 e δr ∈ Ir tal que γr + δr = 1. Seja a ∈ I1 ∩ · · · ∩ Ir . Note que para
todo t ≥ 1 temos também que at ∈ I1 ∩ · · · ∩ Ir . Então
ar = γr ar + a . . . a(aδr ) ∈ I1 + . . . + Ir ,
onde a repete-se r − 1 vezes no produto acima. 

Teorema 15.49 (teorema chinês dos restos). Sejam I1 , · · · Ir ideais de A tais


que Iα + Iβ = A, para α 6= β. Então
(1) existe um isomorfismo de anéis
A ∼ A A
= × ... × .
I1 . . . Ir I1 Ir
(2) Este isomorfismo restringe-se a um isomorfismo de grupos
 ∗  ∗  ∗
A ∼ A A
= × ... × .
I1 . . . Ir I1 Ir
15.34. ANÉIS QUOCIENTES E TEOREMA CHINÊS DOS RESTOS 145

Demonstração. Definimos
A A A
ϕ: → × ... × por
I1 · · · Ir I1 Ir
ϕ(a + I1 . . . Ir ) := (a + I1 , · · · , a + Ir ).
Verifiquemos que esta função está bem definida. De fato, se b−a = α ∈ I1 . . . Ir =
I1 ∩ . . . Ir (pelo lema anterior), então b ≡ a (mod Iν ) para todo ν, i.e., b + Iν =
a + Iν para todo ν.
Afirmamos que ϕ é um homomorfismo. De fato,
ϕ((a + I1 . . . Ir ) ⊕ (b + I1 . . . Ir )) = ϕ((a + b) + I1 . . . Ir )
= ((a + b) + I1 , · · · , (a + b) + Ir )
= ((a + I1 ) ⊕ (b + I1 ), · · · , (a + Ir ) ⊕ (b + Ir ))
= (a + I1 , · · · , a + Ir ) ⊕ (b + I1 , · · · , b + Ir ) e
ϕ((a + I1 . . . Ir ) (b + I1 . . . Ir )) = ϕ((ab) + I1 . . . Ir )
= ((ab) + I1 , · · · , (ab) + Ir )
= ((a + I1 ) (b + I1 ), · · · , (a + Ir ) (b + Ir ))
= (a + I1 , · · · , a + Ir ) (b + I1 , · · · , b + Ir ).
Esta função é sobrejetiva. De fato, dado
A A
(a1 + I1 , · · · , ar + Ir ) ∈ × ... × ,
I1 Ir
pela proposição anterior existe x ∈ A tal que x ≡ aν (mod Iν ) para todo ν, i.e.,
x+Iν = aν +Iν para todo ν. Portanto, (a1 +I1 , · · · , ar +Ir ) = (x+I1 , · · · , x+Ir ) =
ϕ(x + I1 . . . Ir ).
Finalmente, ϕ é injetiva. De fato, se (a + I1 , · · · , a + Ir ) = (I1 , · · · , Ir ), então
a ∈ I1 ∩ . . . ∩ Ir = I1 . . . Ir .
Suponhamos que a + I1 . . . Ir ∈ (A/I1 . . . Ir )∗ , i.e., que exista b + I1 . . . Ir ∈
(A/I1 . . . Ir ) tal que
(a + I1 . . . Ir ) (b + I1 . . . Ir ) = (ab) + I1 . . . Ir = 1 + I1 . . . Ir ,
i.e., ab − 1 = c ∈ I1 . . . Ir = I1 ∩ . . . ∩ Ir . Logo ab ≡ 1 (mod Iν ) para todo ν,
i.e., (a + Iν ) · (b + Iν ) = 1 + Iν para todo ν. Portanto (a + I1 , · · · , a + Ir ) ∈
(A/I1 )∗ × . . . × (A/Ir )∗ .
É claro que a restrição de ϕ (A/I1 . . . Ir )∗ é um homomorfismo injetivo. Resta
provar a sua sobrejetividade. Seja (a1 + I1 , · · · , ar + Ir ) ∈ (A/I1 )∗ × . . . × (A/Ir )∗ .
146 15. ANÉIS E DOMÍNIOS

Pela parte anterior sabemos que existe x ∈ A tal que aν + Iν = x + Iν para todo
ν. Basta provar que x + I1 . . . Ir ∈ (A/I1 . . . Ir )∗ . Mas para todo ν existe αν ∈ A
tais que αν x ≡ 1 (mod Iν ), pois x é inversı́vel simultaneamente módulo cada Iν .
Ou seja, αν x − 1 = δν ∈ Iν para cada ν. Assim,
Y Y
(αν x − 1) = xz + (−1)r 1 = δν ∈ I1 . . . Ir ,
ν ν

para algum z ∈ A, i.e., xz ≡ ±1 (mod I1 . . . Ir ). Substituindo, se necessário, z


por −z, concluimos que x ∈ (A/I1 . . . Ir )∗ . 

15.50. Aplicações
15.50.1. Soma de quadrados.

Teorema 15.51 (Fermat). Seja p um número primo. As seguintes condições


são equivalentes:
(i) p = 2 ou p ≡ 1 (mod 4).
(ii) Existe a ∈ Z tal que a2 ≡ −1 (mod p).
(iii) p é redutı́vel em Z[i].
(iv) p = a2 + b2 com a, b ∈ Z.

Demonstração. Suponha (i). Se p = 2, tome a = 1 e lembre que 1 ≡ −1


(mod 2). Suponhamos que p = 4n + 1. Pelo pequeno teorema de Fermat para
todo a ∈ Z tal que p - a temos que ap−1 ≡ 1 (mod p). Em outras palavras,
temos a fatoração xp−1 − 1 = (x − 1) · · · (x − p − 1). Por outro lado, xp−1 − 1 =
2n
x4n − 1 = (x2n − 1)(x2n + 1). Ou seja, existe b ∈ {1, · · · , p − 1} tal que b = −1,
i.e., b2n ≡ −1 (mod p). Tome a = bn .
Suponha (ii). Seja k ∈ Z tal que a2 = −1 + kp. Logo (a − i)(a + i) = kp.
Suponhamos que p | (a + i), i.e, que existam c, d ∈ Z tais qeu p(c + di) = a + i.
Em particular, pd = 1 e p | 1 o que é impossı́vel. Portanto, p - (a + i). Pelo
mesmo argumento p - (a − i). Mas Z[i] é um domı́nio euclideano, logo fatorial,
assim p não pode ser um irredutı́vel am Z[i].
Suponha que p = (a + bi)(c + di) com a2 + b2 6= 1 e c2 + d2 6= 1. Pela
multiplicatividade da norma, p2 = N (p) = N (a+bi)N (a+di) = (a2 +b2 )(c2 +d2 ),
mas a única possibilidade para que isto ocorra é que a2 + b2 = c2 + d2 = p.
Suponhamos (iv) e que p > 2. Dado a ∈ Z temos que a2 ≡ 0 ou 1 (mod 4).
Assim, as possibilidades para a2 + b2 (mod 4) são 0, 1 ou 2. Mas como p é primo
apenas a segunda possibilidade pode acontecer. 
15.50. APLICAÇÕES 147

15.51.1. Lei de reciprocidade quadrática.

Definição 15.52. Vamos reescrever o ı́tem (ii) do teorema de outra forma.


Seja a ∈ Z, dizemos que a é resto quadrático módulo p se existe b ∈ Z tal que
b2 ≡ a (mod p). Assim em (ii) estamos dizendo que -1 é resto quadrático módulo
p. Dado a ∈ Z e um número primo p tal que p - a, definimos o sı́mbolo de
Legendre de a em p por
 
a
= 1, se a é resto quadrático módulo p,
p
 
a
= −1, caso contrário.
p
Assim o teorema afirma que p é soma de quadrados se e somente se (−1/p) = 1.

Um importante teorema na teoria dos números (que não demonstraremos


aqui) é a lei de reciprocidade quadrática (cf [?, chapter 5]).

Teorema 15.53 (lei de reciprocidade quadrática). Sejam p, q > 2 primos


distintos. Enão   
p q p−1 q−1
= (−1) 2 2 .
q p
Uma maneira de interpretar esta lei é uma fórmula de inverter o sı́mbolo de
Legendre, ou seja,    
q p−1 q−1 p
= (−1) 2 2 .
p q
Por exemplo, se p, q ≡ 1 (mod 4), então
   
q p
= 1 se e somente se = 1.
p q
Se p, q ≡ 3 (mod 4), então
   
p q
= 1 se e somente se = −1.
q p
Finalmente se p ≡ 1 (mod 4) e q ≡ 3 (mod 4) (ou vice-versa), então
   
p q
= 1 se e somente se = 1.
q p
Parte 4

Corpos
CAPı́TULO 16

Extensões finitas

Sejam K ⊂ L dois corpos. Dizemos que L é uma extensão de K ou que L/K é


uma extensão de corpos. Notemos neste caso que a multiplicação de elementos de
K por elementos de L induz em L uma estrutura de K-espaço vetorial. Quando
L é um K-espaço vetorial de dimensão finita, dizemos que L/K é uma extensão
finita e denotamos dimK L = [L : K] chamado o grau da extensão.

Proposição 16.1. Sejam K ⊂ L ⊂ M corpos. Então M/K é uma extensão


finita se e somente se M/L e L/K são extensões finitas e neste caso

[M : K] = [M : L][L : K].

Demonstração. Suponha que M/K seja uma extensão finita. Qualquer


conjunto de elementos de M que seja L-linearmente independente é em parti-
cular K-linearmente independente. Portanto, o número máximo de vetores L-
linearmente independentes em M é [M : K], em particular M/L é finita. Como
L ⊂ M e M é um K-espaço vetorial de dimensão finita, concluimos que o mesmo
vale para L, i.e., L/K é finita.
Suponha que M/L e L/K sejam finitas. Sejam {α1 , · · · , αn } uma base de
M/L e {β1 , · · · , βm } uma base de L/K. Afirmamos que o conjunto

{αi βj }1≤i≤n,1≤j≤m

é uma base de M/K. Disto segue imediatamente a proposição.


Seja x ∈ M , então
Xn
x= ai α i ,
i=1

onde a1 , · · · , an ∈ L. Além disto para todo i = 1, · · · , n, temos que


m
X
ai = bij βj ,
j=1

151
152 16. EXTENSÕES FINITAS

onde βj ∈ K. Logo,
n X
X m
x= bij αi βj ,
i=1 j=1

em particular o conjunto acima gera M como K-espaço vetorial.


Suponha que tenhamos uma K-combinação linear trivial
n X
X m
cij αi βj = 0,
i=1 j=1

onde para todo i, j, cij ∈ K. Reescremos


n m
!
X X
cij βj αi = 0.
i=1 j=1

Como para todo i temos


m
X
cij βj ∈ L e {α1 , · · · , αn }
j=1

é um conjunto L-linearmente independente, concluimos que para todo i temos


m
X
cij βj = 0.
j=1

Por outro lado, segue do fato de {β1 , · · · , βm } ser K-linearmente independente


que cij = 0 para todo i, j. 

Corolário 16.2. Seja L/K uma extensão finita de grau primo. Então para
todo corpo F tal que K ⊂ F ⊂ L temos que F = K ou F = L.

Definição 16.3. Seja L/K uma extensão finita com base {α1 , · · · , αn } e
u ∈ L. Definimos o polinômio caracterı́stico de u em relação a L/K da seguinte
forma. Para todo i = 1, · · · , n temos
n
X
uαi = aij αj .
j=1

O polinômio é definido por

Fu,L/K (x) := det(Ix − (aij )).

Denotamos A := (aij ).

Observação 16.4. (1) Fu,L/K tem coeficiente lı́der 1 e grau n = [L : K].


16. EXTENSÕES FINITAS 153

(2) Fu,L/K não depende da escolha da base. De fato, seja {β1 , · · · , βn } uma
outra base de L/K e B a matriz de mudança de base de {β1 , · · · , βn }
para {α1 , · · · , αn }. Seja C := B −1 . Assim,
n
X n
X n
X
uβi = u bij αj = bij ajl αl = (BA)il αl
j=1 j=1 l=1
n
X
= (BA)il clh βh = (BAC)ih βh .
h=1

Assim,

det(Ix−(BAB −1 )) = det(B(Ix−A)B −1 ) = det(B) det(Ix−A) det(B −1 ) = Fu,L/K .

(3) Se u ∈ K, então Fu,L/K = (x − u)n .

Proposição 16.5. Sejam K ⊂ L ⊂ M tais que M/L e L/K sejam extensões


finitas. Seja u ∈ L. Então
[M :L]
Fu,M/K = Fu,L/K .

Demonstração. Sejam {α1 , · · · , αn } uma base de M/L e {β1 , · · · , βm } uma


base de L/K. Então {αi βj }1≤i≤n,1≤j≤m é uma base de M/K. Note que
m
X m
X
uαi βj = αi ajl βl = ajl αi βl .
l=1 l=1

Assim, em cada bloco {α1 β1 , · · · , α1 , βm }, ... , {αn β1 , · · · , αn βm } a matriz do


operador linear definido pela multiplicação por u é igual a A. Portanto,
 
Ix − A 0 ··· 0
 0 Ix − A · · · 0 
 
n
Fu,M/K = det  .. .. ..   = Fu,L/K .
 . . ··· . 
0 0 · · · Ix − A


Definição 16.6. Escrevendo explicitamente,

Fu,L/K = xn + f1 xn−1 + . . . + fn−1 x + fn .

O traço TL/K (u) de u em relação a L/K é definido por

TL/K (u) := −f1 .


154 16. EXTENSÕES FINITAS

A norma NL/K (u) de u em relação a L/K é definida por

NL/K (u) := (−1)n fn .

Observe que expandindo o determinante que define Fu,L/K obtemos


n
X
f1 = aii = Tr(A), o traço da matriz A, e fn = det(A).
i=1

Definição 16.7. Sejam L/K uma extensão de corpos f ∈ K[x] \ {K}. Di-
zemos que um elemento α ∈ L é raiz de f se f (α) = 0.

Suponhamos conhecidas u1 , · · · , un as raı́zes de Fu,L/K . Note que uma destas


raı́zes, digamos u1 , é exatamente u. Observe também que usando o algoritmo da
divisão, se α é raiz de f então

f (x) = (x − α)g(x),

para algum g ∈ K[x]. Neste caso temos a fatoração


n
Y
Fu,L/K (x) = (x − ui ).
i=1

Desenvolvendo este produto obtemos


n
X
f1 = − ui
i=1
X
f2 = ui uj
1≤i<j≤n
X
f3 = − ui uj uk
1≤i<j<k≤n
.. ..
. .
n
Y
fn = (−1)n ui .
i=1

Assim,
n
X
TL/K (u) = ui
i=1
n
Y
NL/K (u) = ui .
i=1
16.10. EXERCÍCIOS 155

Definição 16.8. Sejam x1 , · · · , xn variáveis independentes (ver definição no


capı́tulo de extensões trancendentes) sobre um corpo K. Para todo 1 ≤ i ≤ n
definimos a i-ésima função simétrica elementar nas variáveis x1 , · · · , xn por
X
si (x1 , · · · , xn ) := uj1 . . . uji .
1≤j1 <·<ji ≤n

Observe que para todo 1 ≤ i ≤ n temos

fi = (−1)i si (u1 , · · · , un ).

Segue imediatamente da lineraridade de traço de matriz e da multiplicativi-


dade de determinante de matriz o seguinte lema.

Lema 16.9. (1) Se u ∈ K, então NL/K (u) = un e TL/K (u) = nu.


(2) A função NL/K é multiplicativa, i.e.,

NL/K (uv) = NL/K (u)NL/K (v).

(3) A função TL/K é K-linear, i.e.,

TL/K (u + v) = TL/K (u) + TL/K (v) e TL/K (au) = aTL/K (u), para a ∈ K.

(4) Se K ⊂ L ⊂ M são extensões finitas e u ∈ L, então

NM/K (u) = u[M :L] e TM/K (u) = [M : L]TL/K (u).

16.10. Exercı́cios
√ √
(1) Seja α = 3 + 5. Determine o polinômio mı́nimo de α em relação a Q

e Q[ 10]).
Pn−1
(2) Seja L/K uma extensão de corpos, α ∈ L e Pα|K = xn + i=0 ai x i .
Calcule α−1 em termos dos coeficientes ai ’s e de α.
(3) Seja L/K um extensão de corpos, α ∈ L tal que [K[α] : K] = 5. Mostre
que K[α] = K[α2 ].
(4) Calcule os polinômios mı́nimos de ζ6 e ζ10 em relação a Q, onde ζn =
exp(2πi/n).
(5) Seja ζ = exp(2πi/7) e η = exp(2πi/5). Mostre que η ∈ / Q[ζ].
2
(6) Diga se é verddeiro ou falso, seja i tal que i = −1 e α ∈ C tal que
α3 + α + 1 = 0, então i ∈ Q[α].
(7) Seja L/K uma extensão de corpos, α, β ∈ L tais que [K[α] : K] = n e
[K[β] : K] = m com mdc(m, n) = 1. Mostre que [K[α, β] : K] = mn.
156 16. EXTENSÕES FINITAS

(8) Seja α, β ∈ C tal que [Q[α] : Q] = 3 e [Q[β] : Q] = 3. Determine as


possibilidades para [Q[α, β] : Q].
(9) Sejam α, β ∈ C raı́zes de f, g ∈ Q[x] polinômios irredutı́veis, respecti-
vamente. Seja K = Q[α] e L = Q[β]. Mostre que f é irredutı́vel sobre
Q[β] se e somente se g é irredutı́vel sobre Q[α].
CAPı́TULO 17

Extensões algébricas

17.1. Elementos algébricos e transcendentes


Seja L/K uma extensão de corpos e α ∈ L. Dizemos que α é algébrico sobre
L, se existe f ∈ K[x] − {0} tal que f (α) = 0. Caso não exista tal f dizemos que

α é transcendente sobre K. Por exemplo, 2 ∈ R é algébrico sobre Q, pois é
raiz de x2 − 2 e i ∈ C é algébrico sobre Q, pois é raiz de x2 + 1. Por outro lado,
são teoremas não triviais devidos a Lindeman e Hilbert (resp.) que e, π ∈ R são
transcendentes sobre Q (ver capı́tulo de extensões transcendentes).
Na situação acima definimos a função

ϕα : K[x] → L por ϕα (g) := g(α).

Fica como exercı́cio mostrar que ϕα é um homomorfismo de anéis. Seja K[α] a


imagem de ϕα . Este é um subanel de L. Seja N (ϕα ) o núcleo de ϕα , i.e., este é
o conjunto dos elementos g ∈ K[x] tais que g(α) = 0, ou seja, este é o conjunto
dos polinômios dos quais α é raiz. Este conjunto é um ideal de K[x].

Teorema 17.2. Seja L/K uma extensão de corpos e α ∈ L.


(1) O elemento α é transcendente sobre K se e somente se ϕα é injetiva o
que equivale a N (ϕα ) = (0). Neste caso, K[α] é isomorfo ao anel de
polinômios K[x].
(2) O elemento α é algébrico sobre K se e somente se K[α] é um corpo.
Neste caso, [K[α] : K] = grau(Pα|K ).

Demonstração. Note que (1) é imediato das definições.


(2) Inicialmente, α é algébrico se e somente se N (ϕα ) 6= (0). Suponha que
isto ocorra. Seja Pα|K o gerador mônico do ideal N (ϕα ). Este polinômio é
chamado o polinômio mı́nimo de α sobre K. Por definição este é o polinômio
mônico de menor grau do qual α é raiz, sendo em particular irredutı́vel. Mas, isto
equivale a dizer que o ideal N (ϕα ) = (Pα|K ) é um ideal maximal de K[x]. Esta
última afirmativa equivale a dizer o anel quociente K[x]/(Pα|K ) é um corpo. Note
157
158 17. EXTENSÕES ALGÉBRICAS

que pelo teorema dos homomorfismos K[α] é isomorfo como anel a K[x]/(Pα|K ).
Portanto K[α] é um corpo.
Reciprocamente, se K[α] for um corpo, então por (1), temos que α é algébrico
sobre K, pois K[x] não é corpo, uma vez que 1/x ∈
/ K[x].
Provemos a última afirmativa. Seja n := grau(Pα|K ). Afirmamos que
{1, α, · · · , αn−1 }
é uma base de K[α]/K. De fato, este conjunto é K-linearmente independente,
do contrário existiriam a0 , · · · , an−1 ∈ K não todos nulos tais que
a0 + . . . + an−1 αn−1 = 0.
Ou seja α é raiz do polinômio
n−1
X
f (x) = ai xi 6= 0.
i=0

Mas isto contradiz a minimalidade do grau de Pα|K . Para ver que este conjunto
gera K[α], seja g ∈ K[x] \ {0}. Dividindo g por Pα|K obtemos
g = Pα|K q + r,
para q, r ∈ K[x] tais que r = 0 ou grau(r) < n. Substituindo x por α concluimos
que g(α) = r(α). A fortiori, g(α) é uma K-combinação linear de {1, α, · · · , αn−1 }.


Lema 17.3. Sejam L/K uma extensão de corpos e α ∈ L algébrico sobre K.


Então
(1) Fα,K[α]/K = Pα|K .
(2) Em particular, se L/K for finita, então
[L:K[α]]
Fα,L/K = Pα|K .

Demonstração. (1) Por definição, Fα,L/K é um polinômio mônico de grau


n tendo α como raiz. Logo Fα,K[α]/K ∈ N (ϕα ), i.e.,
Pα|K | Fα,K[α]/K .
Mas pela igualdade do grau e por ambos serem mônicos concluimos que Pα|K =
Fα,K[α]/K .
(2) Vimos no capı́tulo anterior que
[L:K[α]] [L:K[α]]
Fα,L/K = Fα,K[α]/K , i.e., Fα,L/K = Pα|K .
17.4. EXTENSÕES ALGÉBRICAS 159

Este é um caso particular do teorema de Cayley-Hamilton da álgebra linear. 

17.4. Extensões algébricas


Definição 17.5. Uma extensão L/K é dita algébrica se todo α ∈ L é
algébrico sobre K. Caso exista algum α ∈ L transcendente sobre K dizemos
que L/K é transcendente.

Proposição 17.6. Toda extensão finita é algébrica.

Demonstração. Sejam L/K uma extensão finita e α ∈ L. Então existe


n ≥ 1 inteiro mı́nimo tal que {1, α, · · · , αn−1 } é um conjunto K-linearmente
independente. Ou seja, existem a0 , · · · , an ∈ K não todos nulos tais que
n
X
ai αi = 0.
i=0

A fortiori, α é raiz do polinômio não nulo


n
X
f := ai x i .
i=0

Definição 17.7. Seja L/K uma extensão algébrica. Suponhamos que exis-
tam α1 , · · · , αr ∈ L tais que

K ⊂ K1 = K[α1 ] ⊂ K2 = K1 [α2 ] ⊂ · · · ⊂ Kr = Kr−1 [αr ] = K[α1 , · · · , αr ] = L.

Dizemos que L/K é uma extensão finitamente gerada e que L é gerada sobre K
por α1 , · · · , αr .

Proposição 17.8. Seja L/K uma extensão algébrica. Então L/K é finita
se e somente se L/K é finitamente gerada.

Demonstração. Suponha que L/K seja finita. Se L = K acabou. Senão


existe α1 ∈ L\K. Seja K1 := K[α1 ]. Se L = K1 acabou. Senão existe α2 ∈ L\K1 .
Seja K2 := K1 [α2 ]. Prosseguindo o argumento temos uma seqüência de corpos
estrita, i.e.,
K ( K1 ( K2 ( · · · .
Como L/K é finita esta seqüência não pode ser infinita. Logo existe r tal que
L = Kr e L/K é finitamente gerada.
160 17. EXTENSÕES ALGÉBRICAS

Reciprocamente, se L/K é finitamente gerada então cada extensão Ki /Ki−1


é finita e pela transitividade de extensões finitas, concluimos que L/K também
é finita. 

Teorema 17.9. Sejam M/L e L/K extensões de corpos. Então M/K é


algébrica se e somente se M/L e L/K também são algébricas.

Demonstração. Segue da definição que se M/K é algébrica então M/L e


L/K também são algébricas.
Suponhamos que estas duas extensões sejam algébricas. Seja α ∈ M e
n−1
X
Pα|L := ai x i + x n .
i=0

Seja L a extensão de K gerada por a0 , · · · , an−1 . Então L ⊂ L e Pα|L ∈ L[x].


Pela proposição anterior L/K é finita. Além disto, como α é algébrico sobre L,
então L[α]/L é finita. Pela transitividade de extensões finitas concluimos que
L[α]/K é finita. Por outro lado, K ⊂ K[α] ⊂ L[α], logo K[α]/K é finita. Em
particular, α é algébrico sobre K. 

Exemplo 17.10. Seja L/K extensão com [L : K] = p número primo. Então


para todo K ⊂ K 0 ⊂ L temos que K 0 = K ou K 0 = L. Em particular, dado
α ∈ L \ K, então L = K[α].

Exemplo 17.11. Seja L/Q tal que [L : Q] = 2. Mostraremos que L = Q[ d]
para d ∈ Q que não é um quadrado. Pelo exemplo anterior, dado α ∈ L \ Q
temos que L = Q[α]. Seja
a2
 
2
 a
Pα|Q := x + ax + b = x + + b− .
2 4
A mudança de variável x 7→ x + a/2 transforma Pα|Q em X 2 − β, onde β =
(a2 /4) − b. Além disto esta mudança de variável é um automorfismo de K[x],
portanto x2 − β é irredutı́vel, assim tomamos d = β.

17.12. Adjunção de raı́zes


Lema 17.13 (lema da duplicação). Sejam κ : K → K 0 um isomorfismo de
corpos e L0 ⊃ K 0 um corpo contendo K 0 . Então existe uma extensão L/K e um
isomorfismo de corpos λ : L → L0 estendendo κ, i.e., λ|K = κ.
17.12. ADJUNÇÃO DE RAÍZES 161

Demonstração. Suponha que L0 ∩ K = ∅. Definimos L da seguinte forma


: L := K q (L0 \ K 0 ), onde q denota união disjuta. Definimos λ por λ : L → L0 ,
se x ∈ K, então λ(x) := κ(x); se x ∈ L0 \ K 0 , então λ(x) := x. Dessa forma λ é
uma bijeção. Utilizamos esta bijeção para colocar uma estrutura de corpo em L
por : dados x, y ∈ L definimos

x + y := λ−1 (λ(x + y)) e xy := λ−1 (λ(x)λ(y)).

Com esta estrutura, λ é o isomorfismo de corpos procurado.


Se L0 ∩ K 6= ∅, basta aplicar o lema 1.1 para obter um conjunto L00 e uma
bijeção λ0 : L0 → L00 tal que L00 ∩ K = ∅. Novamente, definimos uma estrutura de
0 0
corpo em L00 por x0 +y 0 := λ −1 (λ0 (x)+λ0 (y)) et x0 y 0 := λ −1 (λ(x)λ(y)). Aplicamos
agora a parte anterior substituindo K 0 por K 00 := λ0 (K 0 ) e κ por κ0 := λ0 ◦ κ. 

Definição 17.14. Seja κ : K → K 0 um homomorfismo não nulo de corpos


(logo necessariamente injetivo). Este homomorfismo induz um homomorfismo de
anéis de polinômios da seguinte forma

κ∗ : K[x] → K 0 [x]
n
X n
X
i
ai x 7→ κ(ai )xi .
i=0 i=0

Teorema 17.15. Dado f ∈ K[x] \ K irredutı́vel existe uma extensão finita


L/K e α ∈ L tal que f (α) = 0.

Demonstração. Como f é irredutı́vel o ideal (f ) é maximal, logo o anel


quociente L := K[x]/(f ) é um corpo. Consideremos o homomorfimso sobrejetivo
K[x]
ϕ : K[x] → definido por g 7→ g (mod (f )).
(f )
Este homomorfismo não é o homomorfismo nulo, logo é injetivo quando restrito
a K, i.e., ϕ|K : K → K := ϕ(K) é um isomorfismo de corpos. Este induz um
isomorfismo de anéis de polinômios ϕ∗|K : K[x] → K[x] como na definição anterior.
Em particular, se x := ϕ(x), então
n
X
ϕ∗|K (f )(x) = ϕ(ai )xi = ϕ(f (x)) ≡ 0 (mod (f )).
i=0

Assim x ∈ L é uma raiz de ϕ∗|K (f ).


162 17. EXTENSÕES ALGÉBRICAS

Pelo lema da duplicação, existe uma extensão L/K e um isomorfismo λ : L →


L tal que λ|K = ϕ|K . A fortiori, definindo α := λ−1 (x), este elemento é uma raiz
de f em L. 

Corolário 17.16. Seja f ∈ K[x] \ K, então existe uma extensão finita L/K
e α ∈ L tal que f (α) = 0.

Demonstração. Basta fatorar f em fatores irredutı́veis e usar o teorema


para determinar uma extensão finita de K no qual um dos fatores tenha raiz.
Esta raiz será também raiz de f . 

Corolário 17.17. Seja f ∈ K[x] \ K. Existe uma extensão finita L/K tal
que f fatora-se linearmente em L[x].

Demonstração. Aplicando o teorema sucessivamente a cada fator irre-


dutı́vel de f obtemos em cada etapa uma extensão finita do corpo anterior e
mais uma raiz do fator. Como o número de fatores é finito e o número de raı́zes
em cada fator também o é, pela transitividade de extensões finitas, concluimos
que existe L/K finita como no corolário. 

17.18. Fechos algébricos


Definição 17.19. Seja L/K uma extensão de corpos. Definimos AL (K)
como o conjunto dos elementos α ∈ L que são algébricos sobre K. Este conjunto
é chamado o fecho algébrico de K em L.

Observação 17.20. O conjunto AL (K) é um corpo. De fato, basta mostrar


que dados α, β ∈ AL (K)\{0}, então α+β, αβ, α−1 ∈ AL (K). Provemos o caso de
α + β, os demais são similares. Por hipótese K[α] e K[β] são corpos e K[α]/K e
K[β]/K são finitas. Seja K[α, β] a extensão gerada sobre K por α e β. Considere
o seguinte diagrama de corpos.
K[α, β]
/ | \
K[α] K[α + β] K[β]
\ | /
K
A extensão K[α, β] é gerada por β sobre K[α]. Como β é algébrico sobre K e K ⊂
K[α], concluimos que β é algébrico sobre K[α]. Logo a extensão K[α, β]/K[α]
17.18. FECHOS ALGÉBRICOS 163

é finita. Pela transitividade de extensões finitas, concluimos que K[α, β]/K é


finita. Mas, K ⊂ K[α + β] ⊂ K[α, β]. Logo K[α + β]/K é finita, portanto
α + β ∈ AL (K).

Exemplo 17.21. Seja K um corpo, L/K extensão e τ ∈ L transcendente so-


bre K. Afirmamos que K é algebricamente fechado em K(τ ) = {f (τ )/g(τ ) | f, g ∈
K[x], g 6= 0}. De fato, se existisse α ∈ K(τ ) \ K algébrico sobre K, digamos α =
f (τ )/g(τ ), então K[α]/K seria finita. Observe que h := f (x) − αg(x) ∈ (K[α])[x]
e h(τ ) = 0, ou seja, τ é algébrico sobre K[α]. Portanto, K(τ ) = (K[α])[τ ] é
algébrico sobre K, mas isto é impossı́vel, pois τ é transcendente sobre K.

Definição 17.22. Dizemos que um corpo K é algebricamente fechado, se


todo f ∈ K[x] \ K possui uma raiz α ∈ K.

A seguinte proposição é uma conseqüência direta desta definição, da fatoração


de polinômios e da definição sobre elementos algébricos.

Proposição 17.23. As seguintes condições são equivalentes.


(1) K é algebricamente fechado.
(2) Todo f ∈ K[x] \ K fatora-se como produto de polinômios lineares.
(3) Todo f ∈ K[x] irredutı́vel tem grau 1.
(4) Não existe extensão L ) K algébrica.

O primeiro exemplo de corpo algebricamente fechado é C.

Teorema 17.24 (teorema fundamental da Álgebra). [?, p.199, corolário 4] O


corpo C é algebricamente fechado.

Exemplo 17.25. Seja f ∈ R[x]. Mostremos que grau(f ) = 1 ou 2. Seja


β ∈ C uma raiz de f . Então f = Pβ|R e como R ⊂ R[β] ⊂ C, e [C : R] = 2, então
grau(f ) = 1 ou 2.

Definição 17.26. Sejam K ⊂ Ω corpos com Ω algebricamente fechado. Di-


zemos que AΩ (K) é um fecho algébrico de K.

Definição 17.27. Sejam K um corpo e I um conjunto qualquer de ı́ndices.


O anel de polinômios K[xI ] em variáveis xi parametrizadas por elementos i ∈ I
é definido como sendo o conjunto de polinômios f com coeficientes em K em um
número finito de variáveis xi1 , · · · , xin , para i1 , · · · , in ∈ I.
164 17. EXTENSÕES ALGÉBRICAS

Teorema 17.28. Para todo corpo K existe um corpo Ω ⊃ K algebricamente


fechado.

Demonstração. Seja P o conjunto dos polinômios irredutı́veis mônicos em


K[x]. Seja R o anel R := K[xP ]. Considere o ideal p de R gerado pelo conjunto
{P (xP ) | P ∈ P}. Este ideal é próprio, caso contrário existiriam P1 , · · · , Pr ∈ P
e G1 , · · · , Gr ∈ K[xP1 , · · · , xPr ] ⊂ R tais que
r
X
P (xPi )Gi (xP1 , · · · , x(Pr )) = 1.
i=1

Mas pelo corolário 17.17 existe uma extensão finita L/K tal que P1 . . . Pr fatora-se
linearmente em L. Para cada 1 ≤ i ≤ r seja αi ∈ L uma raiz de Pi . Logo
r
X
1= P (αi )Gi (α1 , · · · , αr ) = 0,
i=1

o que é uma contradição.


Pelo lema de Krull, existe m ( R ideal maximal contendo p. Considere o
homomorfismo quociente ϑ : R → R/m. A restrição κ de ϑ a K induz um
isomorfimso de corpos κ : K → K := ϑ(K). Pelo lema da duplicação existe uma
extensão L1 /K e um isomorfismo de corpos λ : L1 → R/m estendendo κ. Como
na demonstração do teorema 17.15 αP := ϑ(xP ) é uma raiz de ϑ∗ (P ), e a fortiori
λ−1 (αP ) ∈ L1 é uma raiz de P . Dessa forma construimos uma extensão L1 /K na
qual todo elemento de P possui uma raiz.
Prosseguindo indutivamente, contruimos uma seqüência de corpos

L0 := K ⊂ L1 ⊂ L2 ⊂ · · · ⊂ Ln ⊂ · · ·

tais que todo polinômio irredutı́vel mônico em Lj [x] possui uma raiz em Lj+1 .
S
Seja Ω := j≥1 Lj . Este conjunto é um corpo contendo K e afirmamos que é
algebricamente fechado. De fato, dado f ∈ Ω[x]\Ω, este fatora-se linearmente em
algum Lj [x] para j suficientemente grande. Portanto, por construção, f possui
raiz em Lj+1 ⊂ Ω. 

Corolário 17.29 (existência de fecho algébrico). Todo corpo K possui um


fecho algébrico.

Demonstração. Pelo teorema anterior existe extensão Ω/K tal que Ω é


algebricamente fechado, portanto AΩ (K) é um fecho algébrico de K. 
17.18. FECHOS ALGÉBRICOS 165

Teorema 17.30. Sejam K, K 0 corpos, κ : K → K 0 um isomorfismo de corpos,


L/K, L0 /K 0 extensões de corpos, α ∈ L (resp. α0 ∈ L0 ) algébrico sobre K (resp.
algébrico sobre K 0 ). As seguintes condições são equivalentes.
(1) O isomorfismo κ estende-se a um isormorfismo de corpos κα : K[α] →
K 0 [α0 ] tal que κα (α) = α0 .
(2) κ∗ (Pα|K ) = Pα0 |K 0 .

Demonstração. Suponha (1). Então κ∗ (Pα|K )(α0 ) = κα (Pα|K (α)) = 0, em


particular κ∗ (Pα|K ) | Pα0 |K 0 . Mas estes dois polinômios são irredutı́veis mônicos.
Portanto vale a igualdade.
Suponha (2). Sabemos que K[α] ∼ = K[x]/(Pα|K ) e K 0 [α0 ] ∼
= K 0 [x]/(Pα0 |K 0 ).
Assim, compondo os isomorfismos abaixo encontramos κα :

= K[x] κ K 0 [x] ∼ =
K[α] −→ −→ −→ K 0 [α0 ].
(Pα|K ) (Pα0 |K 0 )


Definição 17.31. Sejam L e L0 extensões de K e λ : L → L0 um isomorfismo


de corpos. Dizemos que λ é um K-isomorfismo, se λ|K for a identidade.

Em particular, tomando K = K 0 , κ a identidade e L = L0 obtemos o corolário.

Corolário 17.32. Sejam L/K uma extensão de corpos e α, α0 ∈ L algébricos


sobre K. As seguintes condições são equivalentes.
(1) Existe um K-isomorfismo K[α] → K[α0 ] tal que α 7→ α0 .
(2) Pα|K = Pα0 |K 0 .

Definição 17.33. Sejam L/K uma extensão e α, β ∈ L algébricos sobre K.


Dizemos que α é K-conjugado a β (denotamos por α ∼K β), se Pα|K = Pβ|K . Esta
noção independe da escolha da extensão L/K. O conjunto Cα dos K-conjugados
de α é finito, pois #Cα ≤ grau(Pα|K ).

Proposição 17.34. Seja L/K uma extensão algébrica. Todo K-endomorfismo


de L é também um K-isomorfismo de L.

Demonstração. Seja σ um K-endomorfismo de L. Observe que para todo


α ∈ L temos σ(Cα ) ⊂ Cα , pois Pα|K (σ(β)) = β(Pα|K (β)) = 0. Mas Cα é finito e σ
é injetivo (pois é não nulo). Logo σCα é uma bijeção de um conjunto finito nele
mesmo. A fortiori, σ é sobrejetiva e σ é um K-automorfismo de L. 
166 17. EXTENSÕES ALGÉBRICAS

Teorema 17.35 (extensão de homomorfismos). Sejam L/K uma extensão


algébrica e κ : K → Ω um homomorfismo de corpos com Ω algebricamente fe-
chado. Então existe λ : L → Ω um homomorfismo de corpos estendendo κ.

Demonstração. Suponha inicialmente que L = k[α] para algum α ∈ L.


Seja α0 ∈ Ω uma raiz de κ∗ (Pα|K ). Assim, κ∗ (Pα|K ) = Pα0 |K 0 , onde K 0 := κ(K).
Pelo teorema 17.30, existe um homomorfismo de corpos λ : L → Ω estendendo κ
tal que λ(α) = α0 .
No caso geral, consideramos o conjunto M de pares ordenados (L0 , λ0 ) forma-
dos por extensões L0 /K contidas em L e homomorfismos de corpos λ0 : L0 → Ω
estendendo κ. Definimos uma ordem parcial em M por

(L0 , λ0 ) ≤ (L00 , λ00 ) se e somente se L0 ⊂ L00 e λ0 = λ00|L0 .

O conjunto M é indutivo. De fato, se L := {(Lj , λj ) | j ∈ J} ⊂ M for um


subconjunto totalmente ordenado, então o corpo
[
LJ := Lj
j∈J

é um subcorpo de L e definindo λJ em cada Lj por λJ := λj obtemos (por


construção) um homomorfismo de corpos λJ : LJ → Ω. Além disto, temos que
(Lj , λj ) ≤ (LJ , λJ ) para todo j ∈ J. Assim, (LJ , λJ ) é um limite superior para
M. Pelo lema de Zorn, o conjunto M admite elemento maximal (L̃, λ̃).
Afirmamos que L̃ = L. De fato, caso contrário, se α ∈ L̃ \ L, utlizando a
primeira parte da prova, poderı́amos estender λ̃ a um homomorfismo de corpos
L̃(α) → Ω, o que é uma contradição. 

Teorema 17.36 (unicidade a menos de isomorfismo). Seja K um corpo.


Suponha que Ω e Ω1 sejam corpos algebricamente fechados contendo K. Então
AΩ (K) e AΩ1 (K) são K-isomorfos.

Demonstração. Pelo teorema anterior, existe um K-homomorfismo λ :


AΩ (K) → Ω1 . É claro que a imagem de λ está contida em AΩ1 (K). Por outro lado
para todo α1 ∈ AΩ1 (K) e toda raiz α ∈ Ω de Pα1 |K temos que Pα|K = Pα1 |K . Logo,
pelo teorema 17.30, concluimos que existe um K-isomorfismo K[α] → K[α1 ] tal
que α 7→ α1 . Em particular, λ(AΩ (K)) = AΩ1 (K). 

Exemplo 17.37. A motivação para o teorema anterior vem da seguinte si-


tuação. Uma maneira de construir R a partir de Q é adicionar a Q os limites de
17.18. FECHOS ALGÉBRICOS 167

seqüências de Cauchy de elementos de Q (ver [?]). Por isto dizemos que R é o


completamento de Q.
Note-se entretanto que está implı́cito na discussão anterior que estamos uti-
lizando para a noção de limite o valor absoluto usual dos números racionais.
Tal valor absoluto é arquimediano, ou seja satisfaz a desigualdade triangular
|x + y| ≤ |x| + |y|. Por isto vamos dizer que R é o completamento arquimediano
de Q. Na linguagem da geometria aritmética moderna, o valor absoluto arquime-
diano nada mais é que o primo no infinito que compatifica o conjunto (esquema)
Spec(Z) dos ideais primos de Z.
Porque dizemos isto? Para cada número primo p, pela unicidade da fatoração
de números inteiros em produto de números primos, para todo x ∈ Q existe
um único ordp (x) ∈ Z tal que x = pordp (x) x0 , onde nem o numerador nem o
denominador de x0 ∈ Q são divisı́veis por p. Isto permite definir o seguinte valor
absoluto (chamado de p-ádico)

|x|p := p−ordp (x) .

Este valor absoluto é não arquimediano, ou seja, vale uma propriedade mais forte
que a propriedade triangular, |x + y|p ≤ max(|x|p , |y|p ).
Repetimos o procedimento de construção de R a partir de Q e acrescentamos
a Q os limites de seqüências de Cauchy (com respeito ao valor absoluto p-ádico).
O conjunto obtido é o corpo Qp dos números p-ádicos. Uma outra forma de
representar um elemento de Qp é através de uma “série de Laurent”
X
x= ai p i ,
i≥n

onde n ∈ Z e 0 ≤ ai < p é inteiro para todo i. Assim, Qp é o completamento de


Q com respeito ao valor absoluto p-ádico.
Pelo teorema 17.28 existe um corpo algebricamente fechado contendo R, por
exemplo C, e um corpo algebricamente fechado (até completo, mas isto não segue
do teorema, ver [?]) Cp contendo Qp . Assim, terı́amos por um lado o fecho
algébrico AC (Q) de Q en C (chamado o corpo de todos os números algébricos e
denotado por Q) e o fecho algébrico ACp (Q) de Q em Cp . O que o teorema nos
diz é que apesar destes dois fechos algébricos serem subcorpos de corpos distintos
(os valores absolutos são diferentes), eles são Q-isomorfos. Isto nos permite usar
a notação Q sem ambuiguidade.
168 17. EXTENSÕES ALGÉBRICAS

Nos tópicos adicionais comentaremos sobre um grupo ligado a Q e um dos


objetos mais importantes da aritmética (bastante misterioso, ainda) o grupo de
Galois absoluto de Q.
CAPı́TULO 18

Extensões separáveis

Definição 18.1. Seja f ∈ K[x], L/K uma extensão de corpos e α ∈ L uma


raiz de f . A multiplicidade m = m(f, α) de α como raiz de f é definido como
o maior inteiro m ≥ 1 tal que existe g ∈ L[x] com g(α) 6= 0 satisfazendo a
f = (x − α)m g. Se m = 1 dizemos que α é uma raiz simples, caso contrário que
é uma raiz múltipla.

No capı́tulo 15, seção 15.25 mostramos que dados f, g ∈ K[x]\K eles possuem
um fator comum não constante (logo uma raiz comum, utilizando o capı́tulo
anterior) se e somente sua resultante Res(f, g) for nula. Além disto, mostramos
também que f possui fator múltiplo (logo raiz múltipla) se e somente se seu
discriminante disc(f ) for nulo. Lembre que disc(f ) = Res(f, D(f )), onde D(f )
denota a derivada de f .

Definição 18.2. Seja D um domı́nio de integridade. Consideremos o ho-


momorfismo ϑ : Z → D tal que ϑ(1) = 1D , onde 1D denota o elemento neutro
multiplicativo de D. Seja I = N (ϑ) o núcleo de ϑ. Se N (ϑ) = (0) (i.e., ϑ for
injetivo) dizemos que a caracterı́stica car(D) como 0. Caso isto não ocorra I é um
ideal não nulo de Z, logo I = nZ para algum n ≥ 1. Além disto pelo teorema dos
isomorfismos Z/nZ é isomorfo a um subdomı́nio de D. Mas Z/nZ é um domı́nio
se e somente se n = p é um número primo. Neste caso dizemos que car(D) = p.
Note que neste caso p.1D = 0 e para todo a ∈ D temos também que pa = 0.
Observe também que
p  
p
X p i p−i
(a + b) = a b = ap + b p ,
i=0
i

pois para todo i = 1, · · · , p − 1 temos


 
p
≡0 (mod p).
i

169
170 18. EXTENSÕES SEPARÁVEIS

Teorema 18.3. Seja L/K uma extensão de corpos e α ∈ L algébrico sobre K.


Então Pα|K não possui raı́zes múltiplas ou existe h ∈ K[x] tal que Pα|K (x) = h(xp )
e neste caso p = car(K).

Demonstração. Suponha que D(Pα|K ) 6= 0. Neste caso, como grau(D(Pα|K


)) < grau(Pα|K ), então mdc(Pα|K , D(Pα|K )) = 1, i.e., Pα|K não admite raı́zes
múltiplas.
Seja
n−1
X
n
Pα|K = x + ai x i .
i=0

Então D(Pα|K ) = 0 se e somente se para todo i tal que ai 6= 0 temos que i = 0


em K (i.e., i ≡ 0 (mod p) em Z). Assim,
0 0
Pα|K = xn p + a(n0 −1)p x(n −1)p + . . . + ap xp + a0

e basta tomar
0 0
h = xn + a(n0 −1)p xn −1 + . . . + ap x + a0 .


Definição 18.4. Dado f ∈ K[x] \ K, dizemos que f é separável, se f não


admite raı́zes múltiplas. Seja L/K uma extensão de corpos e α ∈ L algébrico
sobre K, então α é dito separável sobre K, se Pα|K for separável. Uma extensão
algébrica L/K é dita separável, se todo α ∈ L for separável sobre K. Um corpo
K é dito perfeito, se car(K) = 0 ou car(K) = p e K = K p = {ap | a ∈ K}
(i.e., todo elemento de K é p-potência). Note que a inclusão K p ⊂ K é sempre
satisfeita. A questão é a inclusão oposta.

Proposição 18.5. Um corpo K é perfeito se e somente se para todo f ∈ K[x]


irredutı́vel for separável.

Demonstração. Suponha que K seja perfeito e seja f ∈ K[x] irredutı́vel.


Seja L/K finita e α ∈ L tal que f (α) = 0. Logo f = aPα|K para a ∈ K ∗ . Se
car(K) = 0 ou D(Pα|K ) 6= 0, então Pα|K é separável (logo o mesmo vale para f ).
Caso isto não ocorra, então Pα|K (x) = h(xp ) para algum h ∈ K[x] e p = car(K).
Como K é perfeito K = K p . Escrevendo
n
X
Pα|K = aip xip
i=0
18. EXTENSÕES SEPARÁVEIS 171

temos que para todo i existe bi ∈ K tal que aip = bpip . Logo
Xn
Pα|K =( bip xi )p
i=0

é redutı́vel, o que é uma contradição.


Reciprocamente, suponha que todo f ∈ K[x] irredutı́vel seja separável. Se
car(K) = 0 nada há a fazer. Suponhamos que car(K) = p. Seja a ∈ K e
f = xp − a. Existe uma extensão finita L/K e α ∈ L tal que f (α) = 0, em
particular
Pα|K | f = (x − α)p , i.e., Pα|K = (x − α)` ,
para algum 1 ≤ ` ≤ p. Mas pela separabilidade de Pα|K , temos que ` = 1 e
α ∈ K. 

Proposição 18.6. Um corpo K é perfeito se e somente se toda extensão


algébrica L/K for separável.

Demonstração. Suponha que K seja perfeito e seja L/K uma extensão


algébrica. Pela proposição anterior para todo α ∈ L temos que Pα|K é separável.
Reciprocamente, suponhamos que toda extensão algébrica L/K seja separável.
Novamente, se car(K) = 0 nada há a fazer. Suponhamos que car(K) = p. Seja
a ∈ K e f = xp − a. Seja L/K finita e α ∈ L tal que f (α) = 0. Logo Pα|K | f e
pelo mesmo argumento anterior α ∈ K. 

Definição 18.7. Seja L/K uma extensão algébrica. Dizemos que α ∈ L é


inseparável sobre K, se não for separável, i.e., se Pα|K admitir raı́zes múltiplas.

Para provar uma proposição sobre transitividade de extensões separáveis, pre-


cisamos antes do seguinte resultado sobre extensões de homomorfismos.

Proposição 18.8. Seja L/K uma extensão finita, digamos L = K[α1 , · · · , αr ].


Seja Ω um corpo algebricamente fechado e κ : K → Ω um homomorfismo não tri-
vial (logo necessariamente injetivo) de corpos, onde Ω é algebricamente fechado.
Seja m o número de extensões λ : L → Ω de κ a L (ver capı́tulo anterior). Então
1 ≤ m ≤ [L : K].
Além disto as seguintes condições são equivalentes:
(i) m = [L : K].
(ii) α1 , · · · , αr são separáveis sobre K.
(iii) L/K é separável.
172 18. EXTENSÕES SEPARÁVEIS

Demonstração. Provaremos inicialmente a proposição para r = 1. Sejam


{α1 = β1 , · · · , βn } as raı́zes de Pα1 |K . Se λ é uma extensão de κ a L, então λ(α1 )
é necessariamente uma raiz de Pα1 |K , uma vez que este polinômio é invariante
por κ. Assim, o número de extensões λ é igual ao número de raı́zes distintas de
Pα1 |K . Este número é no máximo igual a grau(Pα1 |K ) = [L : K]. Além disto,
m ≥ 1, pois provamos no capı́tulo anterior a existência de extensões λ de κ, se
L/K for algébrica.
Observe que m = [L : K] se e somente se o número de raı́zes distintas de Pα1 |K
for igual a [L : K] = grau(Pα1 |K ). Isto equivale a Pα1 |K ser separável. Assim,
as condições (i) e (ii) são equivalentes. É claro que (iii) implica (ii). Suponha
que L/K seja inseparável, digamos que γ ∈ L seja inseparável sobre K. Pela
equivalência entre (i) e (ii) concluimos que o número de extensões κγ de κ a K[γ]
é estritamente inferior a [K[γ] : K]. Por outro lado, pela primeira parte, cada κγ
possui no máximo [L : K[γ]] extensões a L. Dessa forma, o número de extensões
de κ a L é menor que [L : K], ou seja, (i) implica (iii).
Para provar o caso geral, para qualquer r, lembremos que existe uma seqüência
finita de extensões

K = K0 ⊂ K1 = K0 [α1 ] ⊂ K2 = K1 [α2 ] ⊂ · · ·
⊂ Kr = Kr−1 [αr ] = K[α1 , · · · , αr ] = L.
Pela primeira parte, o número de extensões κ1 de κ a K1 é no máximo [K1 : K], o
número de extensões de κ1 a K2 é no máximo [K2 : K1 ], etc. Portanto, o número
de extensões de κ a L é no máximo igual a
[K1 : K][K2 : K1 ] . . . [Kr : Kr−1 ] = [L : K].
Como anteriormente (iii) implica (ii). Suponha (ii). Então cada αi é separável
também sobre Ki−1 . A fortiori, pela primeira parte, o número de extensões de
κi−1 a Ki é igual a [Ki : Ki−1 ]. Aplicando a multiplicativade dos graus concluimos
que m = [L : K]. Finalmente, a prova que (i) implica (iii) é idêntica à da primeira
parte. 

Corolário 18.9. Sejam L/K uma extensão algébrica e M um subconjunto


de L. Se todo α ∈ M for separável sobre K, então K[M]/K é separável.

Demonstração. Basta observar que


[
K[M] = K[F],
F∈C
18. EXTENSÕES SEPARÁVEIS 173

onde F percorre o conjunto C de subconjuntos finitos de M, e aplicar a proposição


anterior. 
Teorema 18.10. Sejam L/K e M/L extensões algébricas. Então M/K é
separável se e somente se M/L e L/K o forem.
Demonstração. É claro que se M/K for separável, então M/L e L/K
também o são. Provemos a recı́proca. Seja α ∈ M e
Pα|L = xn + an−1 xn−1 + . . . + a0 .
Seja L := K[a0 , · · · , an−1 ]. Então Pα|L ∈ L[x] e α é separável sobre L. Como
cada ai ∈ L e L/K e separável, pela proposição 18.8 L/K também é separável.
Além disto, pelo observado acima e pela proposição 18.8 obtemos que L[α]/L
também é separável.
Seja κ : K → Ω um homorfismo não trivial de corpos, com Ω algebricamente
fechado. O número de extensões κL de κ a L é igual a [L : K]. Além disto, para
cada κL o número de extensões deste homomorfismo a L[α] é igual a [L[α] : L].
Portanto, o número de extensões de κ a L[α] é igual a
[L : K][L[α] : L] = [L[α] : K].
Novamente, aplicando a proposição 18.8 concluimos que L[α]/K é separável,
assim α é separável sobre K. 
Definição 18.11. Seja L/K uma extensão algébrica e Ω um corpo algebri-
camente fechado. Denotamos por HomK (L, Ω) o conjunto dos homomorfismos de
corpos λ : L → Ω tais que λ|K = id. São chamados K-homomorfismos de L em
Ω.
O seguinte resultado é uma conseqüência imediata da proposição 18.8.
Teorema 18.12. Seja L/K uma extensão finita. Então
# HomK (L, Ω) ≤ [L : K].
Além disto, vale a igualdade se e somente se L/K for separável.
Definição 18.13. Seja L/K uma extensão algébrica. Definimos o fecho sepa-
rável SL (K) de K em L por
SL (K) := {α ∈ L | α é separável sobre K.
É claro que K ⊂ SL (K). Fica como exercı́cio provar que SL (K) é um subcorpo
de K (utilize a transitividade de extensões separáveis provada acima).
174 18. EXTENSÕES SEPARÁVEIS

Definição 18.14. Seja L/K uma extensão de corpos. Dizemos que α é um


elemento primitivo de L/K se L = K[α]. Neste caso, dizemos que L/K é uma
extensão simples.

Teorema 18.15 (teorema do elemento primitivo). Suponha que K seja um


corpo infinito. Seja L/K uma extensão finita e separável. Então L/K é simples,
i.e., existe α ∈ L elemento primitivo de L/K.

Demonstração. Observemos inicialmente que basta supor que L seja ge-


rado por 2 elementos α, β, digamos L = K[α, β]. De fato, sendo L/K finita,
sabemos que L é da forma L = K[α1 , · · · , αr ]. Suponha o resultado provado
para extensões geradas por 2 elementos. Assim, existe β1 ∈ K2 = K1 [α1 ] =
K[α1 , α2 ] tal que K2 = K[β1 ]. Pelo mesmo argumento, existe β2 ∈ K3 tal que
K3 = K[β1 , α3 ] = K[β2 ]. Repetindo sucessivamente o argumento, concluimos
que L = Kr = K[βr−1 ].
Sejam
f := Pα|K = (x − α) . . . (x − αn ) e g := Pβ|K = (x − β) . . . (x − βm ).
Seja c ∈ K e γ := α + cβ. Consideremos os corpos K ⊂ F = K[γ] ⊂ L =
K[α, β]. Provaremos que L = F para uma escolha genérica de c ∈ K. Seja
h(x) := f (γ − cx) ∈ F [x]. Observe que h(β) = 0. Portanto, x − β divide
h em L[x]. Seja M/L uma extensão finita contendo todas as raı́zes de f e g.
Mostraremos que mdcM [x] (h, g) = x − β.
Observemos inicialmente que algum βj é raiz de f (com j > 1) se e somente
se
γ − cβj = α + c(β − βj ) = αi ,
para algum i. Ou equivalentemente, se e somente se
αi − α
(18.15.1) c= .
β − βj
Note que o conjunto destas frações com j percorrendo 2, · · · , m e i percorrendo
1, · · · , n é finito. Como o corpo K é infinito, podemos sempre escolher c ∈ K
diferente de todas estas frações. Em outras palavras a única raiz comum de h e
g é β, daı́ segue o resultado sobre o mdc.
Mas o mdc não depende do corpo no qual estamos considerando, pela uni-
cidade do resto no algoritmo de divisão de polinômios. Dessa forma, como
g, h ∈ F [x] concluimos que β ∈ F . Portanto, por construção α ∈ F e L = F . 
18.17. CORPOS FINITOS 175

Observação 18.16. No próximo capı́tulo daremos uma prova intrı́nseca do


teorema do elemento primitivo para corpos finitos. Observe também que na
prova do teorema do elemento primitivo, se nos restringirmos a corpos L da
forma K[α, β], não precisamos supor que L/K seja separável. Basta que β seja
separável sobre K, uma vez que isto garante que os denominadores de (18.15.1)
sejam todos não nulos.

18.17. Corpos Finitos


Dado um inteiro n ≥ 1 sabemos que o anel quociente Z/nZ é um corpo se e
somente se n = p for um número primo. Este é o primeiro exemplo de um corpo
finito que será denotado por Fp . Uma maneira natural de definir corpos finitos
é tomar f ∈ Fp [x] irredutı́vel e lembrar que o anel quociente Fp [x]/(f ) é neste
caso um corpo. Este corpo também pode ser escrito como Fp [α] para raiz α de
f em alguma extensão finita l de Fp . Além disto, [Fp [α] : Fp ] = grau(f ) digamos
n. Assim, como Fp espaço vetorial Fp [α] é isomorfo a Fnp portanto é um corpo de
q = pn elementos. Estes corpos são caracterizados pelo seguinte teorema.

Teorema 18.18. (a) Para todo n ≥ 1 inteiro existe um corpo finito Fq


de q = p elementos dado pelo conjunto das raı́zes Rxq −x de xq − x
n

em algum corpo algebricamente fechado Ω contendo Fp . Além disto este


polinômio é separável.
(b) O corpo Fq é único a menos de isomorfismo.
(c) O grupo multiplicativo F∗q = Fq \ {0} é um grupo cı́clico.
(d) Os fatores irredutı́veis mônicos de xq − x são exatamente os polinômios
irredutı́veis mônicos f ∈ Fp [x] tais que grau(f ) | n.
(e) Se q 0 = pm , então Fq0 ⊂ Fq se e somente se q 0 | q.

Demonstração. (a) Sabemos que existe uma extensão finita L de Fp tal


que f fatora-se linearmente em L[x]. Seja Fq := Rxq −x ⊂ L. Afirmamos que Fq
é um subcorpo de L. De fato, se a, b ∈ Fq , então (a + b)q = aq + bq = a + b,
logo a + b ∈ Fq . Além disto (ab)q = aq bq = ab, logo ab ∈ Fq . E se a ∈ F∗q ,
então (a−1 )q = (aq )−1 = a−1 , logo a−1 ∈ Fq . Além disto, como D(xq − x) = −1,
concluimos que xq − x é separável. O ı́tem (b) segue da unicidade de fecho
algébrico a menos de isomorfismo. 

O item (c) segue imediatamente do seguinte lema.


176 18. EXTENSÕES SEPARÁVEIS

Lema 18.19. Seja K um corpo e G ⊂ K ∗ um subgrupo finito. Então G é


cı́clico.

Demonstração. Como G é finito, então seu expoente exp(G) também o é


(veja definição 9.37). Digamos que n = exp(G). Isto significa que para todo
a ∈ G, temos an = 1, ou seja, G ⊂ Wn (K) := {α ∈ K | αn = 1}. Mas este é
o conjunto das raı́zes de xn − 1 que tem cardinalidade no máximo n. Portanto,
#G ≤ n, como a desigualdade contrária vale em geral, temos que |G| = exp(G) =
n. Pela proposição 9.40, concluimos que G é cı́clico. 
Para provar os ı́tens (d) e (e) precisamos de um lema adicional.
0
Lema 18.20. Seja q 0 := pm tal que n = mk. Então xq − x divide xq − x.

Demonstração. Recordemos a fatoração


y d − 1 = (y − 1)(y d−1 + . . . + y + 1).
0
Tomemos y = q 0 e d = k, assim q 0 − 1 divide (q 0 )k − 1 = q − 1. Tomando y = xq −1
0 0 0
e d = (q −1)/(q 0 −1) obtemos que xq −1 −1 divide (xq −1 )(q−1)/(q −1) −1 = xq−1 −1,
0
multiplicando por x concluimos que xq − x divide xq − x. 
Suite da prova do teorema. (d) Seja f um fator irredutı́vel mônico de
xq − x. Então existe α ∈ Fq tal que f = Pα|Fp . Neste caso, Fq ⊃ Fp [α] ⊃ Fp e
como [Fp [α] : Fp ] = grau(Pα|Fp ) concluimos que grau(f ) | n.
Reciprocamente, se f ∈ Fp [x] é irredutı́vel mônico de grau m | n, então
existe uma extensão finita L de Fp e α ∈ L tal que f = Pα|Fp . Neste caso,
0
Fp [α] = Fq0 , onde q 0 = pm . Como m | n, (xq − x) | (xq − x), em particular
Rxq0 − x = Fq0 ⊂ Rxq −x = Fq . Logo α é raiz de xq − x, assim f = Pα|Fp | (xq − x).
0
(e) Suponhamos que m | n. Pelo lema anterior, (xq − x) | (xq − x), logo
Rxq0 − x = Fq0 ⊂ Rxq −x = Fq . Reciprocamente, se Fq0 ⊂ Fq , então [Fq : Fp ] = n =
[Fq : Fq0 ][Fq0 : Fp ] = [Fq : Fq0 ]m, assim m | n. 
CAPı́TULO 19

Corpos de decomposição e extensões normais

Definição 19.1. Seja K um corpo e f ∈ K[x] \ K. Seja Ω um corpo algebri-


camente fechado com Ω ⊃ K. Seja Rf := {α ∈ Ω | f (α) = 0} = {α1 , · · · , αn }. O
corpo de decomposição K[Rf ] de f com relação a K é a extensão finita K[α1 , · · · ,
αn ] gerada sobre K por {α1 , · · · , αn }. Observemos que este é o menor subcorpo
de Ω contendo K e Rf . De fato, qualquer outro subcorpo contendo K e Rf
necessariamente contém K(Rf ), pois os elemento deste são polinômios nos αi ’s
com coeficientes em K. Uma extensão algébrica L/K é dita normal, se para todo
α ∈ L, RPα|K ⊂ L.

Observação 19.2. Note que a noção de corpo de decomposição a priori


dependeria do corpo Ω. Novamente, com o mesmo argumento que utilizado para
provar a unicidade de fecho algébrico a menos de isomorfismo, observamos que
se R0f for o conjunto de raı́zes de f em um outro corpo algebricamente fechado
Ω0 ⊃ K, então K[R0f ] e K[Rf ] são K-isomorfos.

Observação 19.3. Se F ⊂ K[x]\K for uma famı́lia de polinômios, definimos


da mesma forma o conjunto
[
RF := Rf
f ∈F

e denotamos por K[RF ] o corpo de decomposição da famı́lia em Ω. Este nada


mais é que o compositum dos corpos K[Rf ] para f ∈ F.

Proposição 19.4. Uma extensão algébrica L/K é normal se e somente se


para todo f ∈ K[x] irredutı́vel temos Rf ⊂ L ou Rf ∩ L = ∅.

Demonstração. Suponha que L/K seja normal. Seja f ∈ K[x] irredutı́vel


tal que Rf ∩ L 6= ∅. Seja α ∈ L ∩ Rf . Então existe a ∈ K ∗ tal que f = aPα|K .
Por hipótese, RPα|K ⊂ L, mas Rf = RPα|K .
Reciprocamente, suponha que para todo f ∈ K[x] irredutı́vel Rf ⊂ L ou
Rf ∩ L = ∅. Seja α ∈ L. Então RPα|K ∩ L 6= ∅, portanto RPα|K ⊂ L. 
177
178 19. CORPOS DE DECOMPOSIÇÃO E EXTENSÕES NORMAIS

Exemplo 19.5. Considere f = x3 − 2 ∈ Q[x]. Seja z = e2πi/3 . Então


√ √ √ √
Rx3 −2 = { 3 2, 3 2z, 3 2z 2 } ⊂ C. Desta forma, Q(Rx3 −2 ) ⊂ Q[ 3 2, z]. Mas z =
√ √ √
( 3 2z)/ 3 2 ∈ Q(Rx3 −2 ). Logo Q(Rx3 −2 ) = Q[ 3 2, z]. Pelo mesmo argumento,

Q(Rx4 −5 ) = Q[ 4 5, i].
Proposição 19.6. Seja L/K uma extensão tal que [L : K] = 2. Então L/K
é normal.
Demonstração. Seja α ∈ L. Se α ∈ K, então Pα|K = x − α e RPα|K =
{α} ⊂ K ⊂ L. Caso contrário, em L[x] temos Pα|K = (x − α)g(x) para g ∈ L[x]
mônico de grau 1, assim g(x) = x − β, logo RPα|K = {α, β} ⊂ L. 
Observação 19.7. Note que em uma extensão normal L/K para todo α ∈ L,
Pα|K fatora-se linearmente em L[x].
Definição 19.8. Seja L/K uma extensão de corpos, Ω um corpo algebri-
camente fechado contendo K e HomK (L, Ω) o conjunto dos K-homomorfismos
ϕ : L → Ω. Denotamos por Aut(L/K) ao conjunto dos K-automorfismos de L,
i.e., o conjunto dos automorfismos σ : L → L de L tais que σ|K = idK .

Observação 19.9. Ao contrário das extensões finitas, algébricas e separáveis,



não vale transitividade para extensões normais. De fato, se L = Q[ 3 2, z] =

Q(Rx3 −2 ), então L/Q é normal (pelo teorema). A extensão L/Q[ 3 2] é normal,

pois seu grau é 2. Mas a extensão Q[ 3 2]/Q não é normal, pois x3 −2 tem também
√ √
como raı́zes 3 2z e 3 2z 2 e este números são números complexos conjugados,

enquanto Q[ 3 2] ⊂ R.

Consideremos agora a extensão Q[ 4 5]/Q. Ela tem grau 4, pois x4 − 5 é
irredutı́vel sobre Q (critério de Eisenstein para p = 5). Assim, as extensões
√ √ √
Q[ 4 5]/Q[ 5] e Q[ 5]/Q têm grau 2, portanto são normais. Mas a extensão
√ √
Q[ 4 5]/Q não o é, pois x4 − 5 tem também como raı́zes ± 4 5i e estes são números

complexos conjugados, enquanto Q[ 4 5] ⊂ R.
O lema a seguir permite-nos definir o fecho normal de uma extensão L/K.
Lema 19.10. Sejam K ⊂ Ω corpos com Ω algebricamente fechado. Seja N o
conjunto dos subcorpos de Ω normais sobre K. Então a extensão
!
\
N /K
N ∈N

é normal.
19. CORPOS DE DECOMPOSIÇÃO E EXTENSÕES NORMAIS 179
T
Demonstração. Seja α ∈ N ∈N N . Como α ∈ N e N/K é normal, con-
cluimos que RPα|K ⊂ N , para todo N ∈ N. 

Definição 19.11. Sejam K ⊂ L ⊂ Ω corpos com Ω algebricamente fechado.


Seja NL o conjunto de subcorpos N de Ω contendo L tais que N/K seja normal.
O corpo
\
NΩ (L/K) := N
N ∈NL

é chamado o fecho normal da extensão L/K em Ω. Segue da definição que


NΩ (L/K) é o menor subcorpo de Ω contendo L que é normal sobre K.

Caracterizaremos agora extensões normais como sendo corpos de decomposição


de uma famı́lia de polinômios. Disto seguirá que no caso particular de extensões
normais finitas, estas podem ser caracterizadas como corpos de decomposição de
apenas um polinômio.

Teorema 19.12. Sejam K ⊂ Ω corpos com Ω algebricamente fechado. Seja


L/K uma extensão algébrica contida em Ω. As seguintes condições são equiva-
lentes:
(i) L/K é normal.
(ii) Existe uma famı́lia F ⊂ K[x] \ K tal que L = K[RF ].
(iii) HomK (L, Ω) = Aut(L/K).
A famı́lia F é descrita como {Pα|K | α ∈ M}, onde M ⊂ L é tal que L = K[M].

Demonstração. Suponha (i) e seja F como acima. Para todo α ∈ M, uma


vez que L/K é normal, RPα|K ⊂ L. A fortiori, K[RF ] ⊂ L. Por outro lado,
L = K[M] ⊂ K[RF ] ⊂ L, logo vale (ii).
Suponha (ii). Observe que temos sempre a inclusão Aut(L/K) ⊂ HomK (L, Ω).
Seja σ ∈ HomK (L, Ω). Para todo f ∈ F temos que σ(Rf ) ⊂ Rf , em particular
σ(L) ⊂ L. A igualdade segue da proposição 17.34.
Suponha (iii). Sejam α ∈ L e β ∈ RPα|K . Logo Pβ|K = Pα|K . Pelo corolário
17.32 existe um K-isomorfismo θ : K[α] → K[β] ⊂ Ω tal que θ(α) = β. Como
β ∈ L e L/K é algébrica, existe um K-homomorfismo λ : L → Ω tal que
λK[α] = θ. Por (iii) temos então β = λ(α) ∈ L. Assim, RPα|K ⊂ L e L/K é
normal. 

Corolário 19.13. Sejam L/K uma extensão algébrica, M e F como no


teorema. Então K[RF ] é o fecho normal de L/K em Ω.
180 19. CORPOS DE DECOMPOSIÇÃO E EXTENSÕES NORMAIS

Demonstração. É claro que K ⊂ L ⊂ K[RF ], e pelo teorema K[RF ]/K é


normal. Por outro lado para todo subcorpo N de Ω contendo L e normal sobre
K e para todo α ∈ M temos RPα|K ⊂ N , portanto K[RF ] ⊂ N . 
Corolário 19.14. Seja L/K uma extensão finita, digamos L = K[α1 , · · · , αr ].
Seja
P := Pα1 |K . . . Pαr |K .
Então K[RP ] é o fecho normal de L/K em Ω.
Corolário 19.15. Seja L/K uma extensão finita. As seguintes condições
são equivalentes.
(1) L/K é normal.
(2) Existe f ∈ K[x] \ K tal que L = K[Rf ].
(3) HomK (L, Ω) = Aut(L/K).
Reunindo as informações deste capı́tulo e do anterior obtemos o seguinte te-
orema.
Teorema 19.16. Seja L/K uma extensão finita e Ω um corpo algebricamente
fechado contendo K.
(1) # HomK (L, Ω) ≤ [L : K] e vale a igualdade se e somente se L/K é
separável.
(2) # Aut(L/K) ≤ # HomK (L, Ω) e vale a igualdade se e somente se L/K
é normal.
(3) # Aut(L/K) ≤ [L : K] e vale a igualdade se e somente se L/K é se-
parável e normal.
No próximo capı́tulo definiremos extensões finitas separáveis e normais como
extensões galoisianas.

19.17. Exemplos
Exemplo 19.18. Seja f = x3 − 2 ∈ Q[x]. Considere o diagrama de corpos

Q[ 3 2, z] = Q[Rf ]
/ \

3
Q[ 2] Q[z]
\ /
Q
19.17. EXEMPLOS 181

A extensão Q[ 3 2]/Q tem grau 2 pois x3 − 2 é irredutı́vel em Q[x] pelo critério
de Eisenstein com p = 2. A extensão Q[z]/Q tem grau 2, pois o polinômio mı́nimo
de z sobre Q é x2 + x + 1. As raı́zes deste polinômio são z e z 2 que são números

complexos, um conjugado do outro. Como Q[ 3 2] ⊂ R, x2 + x + 1 é irredutı́vel

sobre Q[ 3 2], portanto

3

3
[Q[ 2, z] : Q[ 2]] = 2 e [Q(Rx3 −2 ) : Q] = 6.

Assim # Gal(Q(Rx3 −2 )/Q) = 6. Um grupo de ordem 6 gerado por dois elementos


σ e τ com σ de ordem 3 e τ de ordem 2 satisfazendo a

τ σ = σ2τ

é isomorfo ao grupo S3 das permutações de 3 elementos que é dado explicitamente


por

{id, σ, σ 2 , τ, στ, σ 2 τ }.

Vamos mostrar que este é o grupo de Galois G = Gal(Q(Rx3 −2 )/Q).


√ √ 2 √ √
Como 1, 3 2, 3 2 , z, z 3 2, z 3 2 é uma base de Q(Rx3 −2 ) como Q-espaço veto-

rial, para obter um elemento de G basta calculá-lo em 3 2 e z. Observemos que
dado ϕ ∈ G, então
√ √ 3
ϕ( 2)3 = ϕ( 2 ) = ϕ(2) = 2,
3 3

√ √
logo ϕ( 3 2) ∈ { 3 2z i | para i = 0, 1, 2}. Da mesma forma ϕ(z) ∈ {z, z 2 }.
Definimos σ por

3

3
σ( 2) := 2z e σ(z) := z e

3

3
τ por τ ( 2) := 2 e τ (z) := z.
√ √
Observemos que σ e τ satisfazem à condição acima. De fato, σ 2 ( 3 2) = σ( 3 2z) =
√ √ √ √ √ √
3
2z 2 e σ 2 (z) = z; σ 3 ( 3 2) = σ( 3 2z 2 ) = 3 2 e σ 3 (z) = z; τ 2 ( 3 2) = 3 2 e
√ √ √ √
τ (z) = z 4 = z; τ σ( 3 2) = τ ( 3 2z) = 3 2z 2 e τ σ(z) = τ (z) = z 2 ; σ 2 τ ( 3 2) =
√ √
σ 2 ( 3 2) = 3 2z 2 e σ 2τ (z) = σ 2 (z 2 ) = z 2 .
Finalmente, note que o subgrupo de Aut(Q[Rf ]/Q) gerado por σ e τ tem
ordem 6, logo deve ser todo o grupo.
182 19. CORPOS DE DECOMPOSIÇÃO E EXTENSÕES NORMAIS

Exemplo 19.19. Seja f = x4 − 5 ∈ Q[x] e K = Q(Rx4 −5 ) = Q[ 4 5, i].
Considere o diagrama de corpos

Q[ 4 5, i] = Q[Rf ]
/ \

Q[ 4 5] Q[i]
\ /
Q

Note que [Q[ 5] : Q] = 4, pois x4 − 5 é irredutı́vem em Q[x] pelo critério de
4

Eisenstein para p = 5, [Q[i] : Q] = 2, pois x2 + 1 é irredutı́vel em Q[x], suas raı́zes



são ±i, assim, uma vez que Q[ 4 5] ⊂ R, temos que x2 + 1 é também irredutı́vel

sobre Q[ 4 5][x], portanto [K : Q] = 8 = # Gal(K/Q). Um grupo de ordem 8
gerado por 2 elementos σ de ordem 4 e τ de ordem 2 tal que
τ σ = σ3τ
é isomorfo ao grupo diedral de ordem 4, D4 que é dado explicitamente por
{id, σ, σ 2 , σ 3 , τ, στ, σ 2 τ, σ 3 τ }.
Vamos mostrar que este é o grupo de Galois G = Gal(K/Q).
√ √ 2 √ 3 √ √ 2 √ 3
Como 1, 4 5, 4 5 , 4 5 , i, 4 5i, 4 5 i, 4 5 i formam uma base de K como Q-

espaço vetorial, para obter um elemento de G basta cálculá-lo em 4 5 e i. Ob-
√ √ √
servemos que dado ϕ ∈ G, ϕ( 4 5) ∈ {± 4 5, ± 4 5i} e ϕ(i) ∈ {±i}.
Definimos σ por

4
√4
σ( 5) := 5i e σ(i) := i e

4
√4
τ por τ ( 5) := 5 e τ (i) := −i.
√ √
Observemos que σ e τ satisfazem à condição acima. De fato, σ 2 ( 4 5) = σ( 4 5i) =
√ √ √ √ √ √
− 4 5 e σ 2 (i) = i; σ 3 ( 4 5) = σ(− 4 5) = − 4 5i e σ 3 (i) = i; σ 4 ( 4 5) = σ(− 4 5i) =
√ √ √ √ √ √
4
5 e σ 4 (i) = i; τ 2 ( 4 5) = 4 5 e τ 2 (i) = τ (−i) = i; τ σ( 4 5) = τ ( 4 5i) = − 4 5i e
√ √ √
τ σ(i) = τ (i) = −i; σ 3 τ ( 4 5) = σ 3 ( 4 5) = − 4 5i e σ 3 τ (i) = σ 3 (−i) = −i.
Finalmente, o subgrupo de Aut(Q[Rf ]/Q) gerado por σ e τ tem ordem 8,
logo é todo o grupo.
CAPı́TULO 20

Teoria de Galois

20.1. Correspondência de Galois


Definição 20.2. Seja N/K uma extensão finita, G = Aut(N/K), K o con-
junto dos subcorpos L de N contendo K e G o conjunto dos subgrupos H de G.
Definimos duas funções:

γ : K → G dada por γ(L) := Aut(N/L) e


κ : G → K dada por κ(H) := N H := {α ∈ N | τ (α) = α para todo τ ∈ H}.

Verifiquemos que N H é de fato um subcorpo de N , é claro que K ⊂ N H . De


fato, como τ é um homomorfismo temos que τ (α + β) = τ (α) + τ (β) = α + β.
O mesmo vale para o produto. Além disto, τ (α−1 ) = τ (α)−1 = α−1 . O par de
funções {γ, κ} é chamado uma conexão de Galois.

Este par satisfaz às seguintes propriedades.

Proposição 20.3. (1) Se L1 ⊂ L2 , então γ(L1 ) ⊃ γ(L2 ).


(2) Se H1 ⊂ H2 , então κ(H1 ) ⊃ κ(H2 ).
(3) L ⊂ κ ◦ γ(L).
(4) H ⊂ γ ◦ κ(H).
Além disto, denotando por K∗ a imagem de κ e G ∗ a imagem de γ
temos também as seguintes propriedades.
(5) L ∈ K∗ se e somente se L = κ ◦ γ(L).
(6) H ∈ G ∗ se e somente se H = γ ◦ κ(H). Como conseqüência destes
últimos 2 itens temos imediatamente que
(7) γ ◦ κ ◦ γ = γ.
(8) κ ◦ γ ◦ κ = κ. Em particular, {γ, κ} induzem uma bijeção entre os
conjuntos K∗ e γ ∗ .

Demonstração. (1) Seja τ ∈ γ(L2 ), então para todo α ∈ L2 , τ α = α,


em particular o mesmo vale para todo α ∈ L1 , logo τ ∈ γ(L1 ).
183
184 20. TEORIA DE GALOIS

(2) Seja α ∈ κ(H2 ), logo para todo τ ∈ H2 , τ α = α, em particular o mesmo


vale para todo τ ∈ H1 , logo α ∈ κ(H1 ).
(3) É claro que para todo α ∈ L e para todo τ ∈ Aut(N/L) temos τ α = α,
assim α ∈ κ ◦ γ(L).
(4) É claro que para todo τ ∈ H e α ∈ κ(H) temos que τ α = α, portanto,
τ ∈ γ ◦ κ(H).
(5) É claro que se L = κ ◦ γ(L), então L ∈ K∗ . Por outro lado, se L ∈ K∗ ,
digamos L = κ(H), então, como H ⊂ γ ◦ κ(H), temos que L = κ(H) ⊃
κ ◦ γ ◦ κ(H) = κ ◦ γ(L).
(6) É claro que se H = γ ◦ κ(H), então H ∈ G ∗ . Por outro lado, se H ∈ G ∗ ,
digamos H = γ(L), então, como L ⊂ κ ◦ γ(L), temos que H = γ(L) ⊃
γ ◦ κ ◦ γ(L) = γ ◦ κ(H).


Definição 20.4. Dizemos que a restrição de uma conexão de Galois {γ, κ}


aos conjuntos K∗ e G ∗ é uma correspondência de Galois. Uma extensão finita
L/K é dita galoisiana se for separável e normal.

Teorema 20.5 (teorema de Artin). Dado H ∈ G temos que N/N H é galoi-


siana, [N : N H ] = #H e H = Aut(N/N H ) = γ ◦ κ(H).

Demonstração. Seja α ∈ N e Cα = {τ α | τ ∈ H} o conjunto dos elementos


H-conjugados a α. Note que #Cα ≤ |H|. Seja
Y
fα := (x − β).
β∈Cα

Observemos que para todo τ ∈ H, τ|Cα é uma permutação de Cα (uma vez que τ
é injetivo, Cα é finito e τ (Cα ) ⊂ Cα ). Portanto, fα ∈ N H [x]. Por construção fα é
separável, portanto α é separável sobre N H .
Assim, para provar que N/N H é normal, basta mostrar que

# Aut(N/N H ) = [N : N H ].

Inicialmente, como H ⊂ Aut(N/N H ) temos que

#H ≤ | Aut(N/N H )| ≤ [N : N H ].

Para provar a desigualdade oposta, observe que como N/N H é finita e separável,
pelo teorema do elemento primitivo, existe α ∈ N tal que N = N H (α). Mas
20.1. CORRESPONDÊNCIA DE GALOIS 185

neste caso,
[N : N H ] = grau(Pα|N H ) ≤ grau(fα ) ≤ |H|.
Portanto,
[N : N H ] = |H| = | Aut(N/N H )| e H = γ ◦ κ(H),
pois o primeiro é subgrupo do segundo e ambos têm a mesma ordem. 

Proposição 20.6. Seja L ∈ K. Então L ∈ K∗ se e somente se N/L for


galoisiana.

Demonstração. Se L ∈ K∗ , o teorema de Artin garante que N/L é galoi-


siana. Reciprocamente, suponha que N/L seja galoisisana. Logo | Aut(N/L)| =
[N : L]. Por outro lado, L ⊂ κ ◦ γ(L) ⊂ N e pelo teorema de Artin,
[N : κ ◦ γ(L)] = [N : N Aut(N/L) ] = | Aut(N/L)| = [N : L],
portanto L = κ ◦ γ(L) ∈ K∗ . 

Teorema 20.7 (teorema fundamental da teoria de Galois). Seja N/K uma


extensão galoisiana finita. Então {γ, κ} define uma correspondência de Galois
entre K e G.

Demonstração. Já provamos anteriormente que se N/K for galoisiana então


N/L também o será para todo L ∈ K (ver capı́tulos de extensões separáveis e
normais). Assim, pela proposição anterior, κ ◦ γ(L) = L. Por outro lado, pelo
teorema de Artin, γ ◦ κ(H) = H. 
Calculemos alguns exemplos concretos da correspondência de Galois.

Exemplo 20.8. Seja K = Q, N = Q[Rx3 −2 ]. Já provamos anteriormente



que N = Q[ 3 2, ζ], onde ζ = e2πi/3 , [N : Q] = 6 e G = Aut(N/Q) = S3 =

{id, σ, σ 2 , τ, στ, σ 2 τ } com o(σ) = 3, o(τ ) = 2 e τ σ = σ 2 τ . Além disto, σ( 3 2) =
√ √ √
3
2ζ, σ(ζ) = ζ, τ ( 3 2) = 3 2 e τ (ζ) = ζ 2 .
Note que N ⊂ N {id} ⊂ N , logo N {id} = N . Também Q ⊂ N G ⊂ N e pela
teoria de Galois [N : N G ] = #G = 6, logo Q = N G .
Seja H1 = hαi = {id, σ, σ 2 }. Observe que Q[ζ] ⊂ N H1 ⊂ N e que [N : N H1 ] =
#H1 = 3. Como [Q[ζ] : Q] = 2, concluimos que Q[ζ] = N H1 .

Seja H2 = hτ i = {id, τ }. Então Q[ 3 2] ⊂ N H2 ⊂ N , [N : N H2 ] = #H2 = 2.
√ √
Como [Q[ 3 2] : Q] = 3, segue que Q[ 3 2] = N H2 .
√ √ √
Seja H3 = hστ i. Observe que στ ( 3 2) = 3 2ζ, στ (ζ) = ζ 2 , logo στ ( 3 2ζ) =
√ √ √ √ √ √
3
2ζζ 2 = 3 2. Portanto, στ ( 3 2(1+ζ)) = 3 2(1+ζ) = − 3 2ζ 2 . Assim, Q[ 3 2ζ 2 ] ⊂
186 20. TEORIA DE GALOIS

N H3 ⊂ N . Como 3 2ζ 2 é raiz de x3 − 2 e este é irredutı́vel sobre Q, segue que
√ √
[Q[ 3 2ζ 2 ] : Q] = 3. Como [N : N H3 ] = #H3 = 2, concluimos que Q[ 3 2ζ 2 ] =
N H3 .
√ √
Seja H4 = hσ 2 τ i. Observe que σ 2 τ ( 3 2) = 3 2ζ 2 e σ 2 τ (ζ) = ζ 2 , logo

σ 2 τ ( 3 2ζ 2 )
√ √ √ √ √
= 3 2ζ 2 ζ = 3 2, portanto σ 2 τ ( 3 2(1 + ζ 2 )) = 3 2(1 + ζ 2 ) = − 3 2ζ. Assim,
√ √
Q[ 3 2ζ] ⊂ N H4 ⊂ N , [N : N H4 ] = #H4 = 2 e [Q[ 3 2ζ] : Q] = 3, portanto

Q[ 3 2ζ] = N H4 .

Exemplo 20.9. Seja K = Q, N = Q[Rx4 −3 ]. Já provamos anteriormente que



N = Q( 4 3, i), [N : Q] = 8 e G = Aut(N/Q) = D4 = {id, σ, σ 2 , σ 3 , τ, στ, σ 2 τ, σ 3 τ }
√ √
com o(σ) = 4, o(τ ) = 2 e τ σ = σ 3 τ . Além disto, σ( 4 3) = 4 3i, σ(i) = i,
√ √
τ ( 4 3) = 4 3 e τ (i) = −i.
N ⊂ N {id} ⊂ N , N = N {id} .
Q ⊂ N G ⊂ N , [N : N G ] = #G = 8, Q = N G .
H1 = hσi, Q[i] ⊂ N H1 ⊂ N , [N : N H1 ] = #H1 = 4, [Q[i] : Q] = 2,
Q[i] = N H1 .
√ √ √ √ √ √
H2 = hσ 2 i, σ 2 ( 4 3) = − 4 3, σ 2 (i) = i, σ 2 ( 3i) = σ 2 ( 4 3)2 i = 3i, Q[ 3i] ⊂
√ √
N H2 ⊂ N , [N : N H2 ] = #H2 = 2, [Q[ 3i] : Q] = 4 já que 3i é raiz de x4 + 3

irredutı́vel sobre Q, Q[ 3i] = N H2 .
√ √
H3 = hτ i, Q[ 4 3] ⊂ N H3 ⊂ N , [N : N H3 ] = #H3 = 4, [Q[ 4 3] : Q] = 4,

Q[ 4 3] = N H3 .
√ √ √ √ √
H4 = hστ i, στ ( 4 3) = 4 3i, στ (i) = −i, στ ( 4 3i) = 4 3, στ ( 4 3(1 + i)) =
√ √
4
3(1 + i), 4 3(1 + i) é raiz de x4 + 12, pelo critério de Eisenstein para p = 3,
√ √
este polinômio é irredutı́vel sobre Q, logo [Q[ 4 3(1 + i)] : Q] = 4, Q[ 4 3(1 + i)] ⊂

N H4 ⊂ N , [N : N H4 ] = #H4 = 2, Q( 4 3(1 + i)) = N N4 .
√ √ √ √ √
H5 = hσ 2 τ i, σ 2 τ ( 4 3) = − 4 3, σ 2 τ (i) = −i, σ 2 τ ( 4 3i) = 4 3i, Q[ 4 3i] ⊂

N H5 ⊂ N , [N : N H5 ] = #H5 = 2, [Q[ 4 3i] : Q] = 4, já que é raiz de x4 − 3,

Q[ 4 3i] = N H5 .
√ √ √ √ √
H6 = hσ 3 τ i, σ 3 τ ( 4 3) = − 4 3i, σ 3 τ (i) = −i, σ 3 τ ( 4 3i) = − 4 3, σ 3 τ ( 4 3(1 −
√ √ √ √
i)) 4 3(1 − i), 4 3(1 − i) é raiz de x4 + 12, [Q[ 4 3(1 − i)] : Q] = 4, Q[ 4 3(1 − i)] ⊂
N H6 ⊂ N , [N : N H6 ] = #H6 = 2.
Finalmente, fica como exercı́cio calcular os corpos fixos dos seguintes subgru-
pos de G : hσ 2 , τ i e hσ 2 , στ . Ambos têm ordem 4, e esgotam a correspondência
de Galois.
20.10. EXTENSÕES E SUBGRUPOS NORMAIS 187

20.10. Extensões e subgrupos normais


Proposição 20.11. Seja N/K galoisiana finita, L ∈ K e H ∈ G. Então
−1
σ Aut(N/L)σ −1 = Aut(N/σ(L)) e N σHσ = σ(N H ).

Demonstração. Como N/K é galoisiana L = N Aut(N/L) . Seja τ ∈ Aut(N/L)


e α ∈ N , então στ σ −1 (σα) = στ α = σα, i.e., στ σ −1 ∈ Aut(N/σ(L)). Recipro-
camente, se τ ∈ Aut(N/σ(L)) e α ∈ N , então τ σα = σα, i.e., σ −1 τ σα = α, i.e.,
σ −1 τ σ ∈ Aut(N/L), i.e., τ ∈ σ Aut(N/L)σ −1 .
−1
Seja α ∈ N σHσ e τ ∈ H, então στ σ −1 α = α, i.e., τ σ −1 α = σ −1 α, i.e.,
σ −1 α ∈ N H , i.e., α ∈ σ(N H ). Reciprocamente, se α ∈ N H e τ ∈ H, então
−1
στ σ −1 (σα) = στ α = σα, i.e., σα ∈ N σHσ . 

Teorema 20.12. Seja N/K galoisiana finita e L ∈ K. Então L/K é normal


(logo galoisiana) se e somente se Aut(N/L) C Aut(N/K). Neste caso
Aut(N/K)/ Aut(N/L) ∼
= Aut(L/K).

Demonstração. Suponha que L/K seja normal. Dado σ ∈ Aut(N/L) e


Ω ⊃ N algebricamente fechado, então σ|L : L → N ⊂ Ω é um K-homomorfismo
(já que L ⊃ K), portanto σ(L) = L e σ|L ∈ Aut(L/K). Neste caso, pela
proposição anterior,
σ Aut(N/L)σ −1 = Aut(N/σ(L)) = Aut(N/L), i.e., Aut(N/L) C Aut(N/K).
Reciprocamente, se Aut(N/L) C Aut(N/K), então
Aut(N/σ(L)) = σ Aut(N/L)σ −1 = Aut(N/L).
Pela correspondência de Galois L = σ(L). Seja λ : L → Ω um K-homomorfismo.
Como N/L é finita (logo algébrica), existe ν : N → Ω um K-homomorfismo tal
que ν|L = λ. Como N/K é normal, ν ∈ Aut(N/K), pelo que foi feito acima,
ν(L) = λ(L) = L, i.e., λ ∈ Aut(L/K).
Suponhamos que L/K seja normal. A função ϕ : Aut(N/K) → Aut(L/K)
definida por σ 7→ σ|L é um homomorfismo de grupos. Este homomorfismo é
sobrejetivo, pois dado τ ∈ Aut(L/K), o processo acima produz σ ∈ Aut(N/K) tal
que σ|L = τ . Além disto, σ ∈ N (ϕ) se e somente se σ|L = id, i.e., σ ∈ Aut(N/L).
Finalmente a última afirmativa segue do teorema dos homomorfismos. 

Definição 20.13. Sejam K, L subcorpos de Ω. Definimos o compositum KL


de k e L em Ω como sendo o menor subcorpo de Ω contendo K e L.
188 20. TEORIA DE GALOIS

Lema 20.14. Sejam K, L subcorpos de Ω e



f (α1 , · · · , αm )
K[L] := | f eg
g(β1 , · · · , βn )
têm coeficientes em K e α1 , · · · , αm , β1 , · · · , βn ∈ L} .

Então KL = K[L].

Demonstração. Observemos inicialmente que por construção K[l] é um


subcorpo de Ω. Além disto contem K (tome denominador igual a 1 e numerador
igual a uma função constante) e L (tome denominador igual a 1 e numerador
igual a variável α1 ). Seja N ⊂ Ω um subcorpo contendo K e L. Então ne-
cessariamente conterá qualquer fração f (α1 , · · · , αm )/g(β1 , · · · , βn ) como acima.
Portanto, KL = K[L]. 

Proposição 20.15. Seja N/K galoisiana finita, K 0 /K finita e Ω ⊃ N, K 0


um corpo algebricamente fechado. Então K 0 N/K 0 é galoisiana finita e

ϕ : Aut(K 0 N/K 0 ) → Aut(N/K 0 ∩ N )

dada por σ 7→ σ|N é um isomorfismo de grupos. Em particular, [K 0 N : K 0 ] =


[N : K 0 ∩ N ].

Demonstração. Como N/K é finita, então existem α1 , · · · , αr ∈ N tais


que N = K[α1 , · · · , αr ]. Logo K 0 N = K 0 [α1 , · · · , αr ] e como cada αi é algébrico
sobre K (logo sobre K 0 ) concluimos que K 0 N/K 0 é finita. Além disto cada αi
é separável sobre K, assim Pαi |K é separável. Mas Pαi |K 0 | Pαi |K , logo Pαi |K 0
também é separável, em particular αi é separável sobre K 0 e K 0 N/K 0 é separável.
Seja σ : K 0 N → Ω um K 0 -homomorfismo, onde Ω ⊃ K 0 é algebricamente
fechado. Logo σ|N : N → Ω é um K-homorfismo. Como N/K é normal, então σ ∈
Aut(N/K) e σ(αi ) ∈ N para todo i. Como σ|K 0 = id, concluimos que σ(K 0 N ) ⊂
K 0 N . Por outro lado, para todo z ∈ K 0 N , z = f (α1 , · · · , αr ) com coeficientes em
K 0 , e como αi = σβi para algum βi ∈ N , concluimos que z = σ(f (β1 , · · · , βr )),
portanto σ(K 0 N ) = K 0 N , σ ∈ Aut(K 0 N/K 0 ) e K 0 N/K 0 é normal.
Observe que ϕ está bem definita e é injetiva. Seja σ ∈ Aut(N/K 0 ∩ N ).
Como K ⊂ K 0 ∩ N , então σ ∈ Aut(N/K). Seja H a imagem de ϕ. Basta
mostrar que κ(H) ⊂ K 0 ∩ N . De fato, neste caso, H = γ ◦ κ(H) ⊃ γ(K 0 ∩ N ) =
Aut(N/K 0 ∩ N ) ⊃ H. Seja α ∈ κ(H) = N H e τ ∈ H. Basta mostrar que α ∈ K 0 ,
pois automaticamente α ∈ N . Existe σ ∈ Aut(K 0 N/K 0 ) tal que σ|N = τ . Assim,
20.18. COEFICIENTES E RAÍZES 189
0 0
para todo σ ∈ Aut(K 0 N/K 0 ), σα = α, i.e., α ∈ N Aut(K N/K ) = K 0 , pois K 0 N/K 0
é galoisiana. 

Corolário 20.16. Seja N/K uma extensão galoisiana finita com K ⊂ R,


N ⊂ C e N 6⊂ R. Então [N : N ∩ R] = 2 e [N : K] é par.

Demonstração. Observe que RN = C e [N : (N ∩ R)] = [C : R] = 2 e


aplique a proposição. 

Corolário 20.17. Seja N/K uma extensão galoisiana finita. Seja N (x1 , · · · ,
xn ) o corpo de frações do anel de polinômio N [x1 , · · · , xn ] em n variáveis com
coeficientes em N . Então N (x1 , · · · , xn )/K(x1 , · · · , xn ) é galoisiana com grupo
de Galois isomorfo a Aut(N/K).

Demonstração. Basta observar que N K(x1 , · · · , xn ) = N (x1 , · · · , xn ) e


aplicar a proposição anterior. 

20.18. Coeficientes e raı́zes


Para todo n ≥ 1 inteiro seja Sn o grupo das permutações de n elementos.
Para todo conjunto finito S denotamos por Perm(S) o grupo das permutações de
S.

Proposição 20.19. Seja f ∈ K[x] irredutı́vel, mônico, separável de grau n


e N = K(Rf ). Então
(a) para todo σ ∈ Aut(N/K), σ|Rf ∈ Perm(Rf ) = Sn .
(b) A função ϕ : Aut(N/K) → Sn dada por σ 7→ σRf é um homomorfismo
injetivo de grupos.

Demonstração. Observemos que #Rf = n e que σ|Rf é injetiva. Assim


(1) segue. É claro que ϕ é um homomorfismo de grupos. Observemos que se
ϕ|Rf = id, então ϕ = id, pois N = K(Rf ). 

O ı́tem (b) é um caso particular do seguinte teorema de Cayley (ver capı́tulo


sobre teoremas de Sylow).

Definição 20.20. A imagem de ϕ é chamado o grupo de Galois de f com


respeito a K e denotado por Gal(f, K).
190 20. TEORIA DE GALOIS

Observação 20.21. Quando K = Q, o problema de Galois era caracterizar


em termos de propriedades de Gal(f, Q) quando as raı́zes de f seriam expressas
da forma radical. Isto equivale a Gal(f, Q) ser um grupo solúvel. Retornaremos
a este ponto no capı́tulo de solubilidade por radicais.

Existe uma situação em que o grupo de Galois Gal(f, K) é todo o grupo Sn .


Para isto utilizaremos o seguinte lema (ver [?, p. 106]).

Lema 20.22. Seja p > 2 um número primo e H um subgrupo do grupo Sp de


permutações de p elementos. Suponha que H contenha uma transposição (ele-
mento de ordem 2) e um elemento de ordem p. Então H = Sp .

Teorema 20.23. Seja f ∈ Q[x] irredutı́vel mônico de grau primo p > 2.


Suponha que f possua exatamente p − 2 raı́zes reais. Então Gal(f, Q) = Sp .

Demonstração. A conjugação complexa τ restrita a N = Q[Rf ] nos dá um


Q-homomorfismo η : N → C. Mas como N/Q é normal, então η ∈ Aut(N/Q).
Por hipótese η fixa as p − 2 raı́zes reais e necessariamente permuta as duas raı́zes
complexas conjugadas restantes. Portanto η tem ordem 2. A fortiori, sua imagem,
também denotada por η em Gal(f, Q) também tem ordem 2.
Seja α ∈ Rf . Logo [Q[α] : Q] = grau(f ) | [N : Q] = # Gal(N/Q), uma vez
que N/Q é galoisiana. Pelo primeiro teorema de Sylow, existe θ ∈ Gal(N/Q) de
ordem p. A fortiori, sua imagem, também denotada por θ em Gal(f, Q) também
tem ordem p. Assim, o teorema segue do lema. 
CAPı́TULO 21

Extensões ciclotômicas

Seja K um subcorpo de um corpo algebricamente fechado Ω. Para todo n ≥ 1,


consideremos o subgrupo

Wn := Wn (Ω) := {z ∈ Ω | z n = 1}

de Ω∗ , dito grupo das raı́zes n-ésimas da unidade. Observemos que este grupo é
finito de ordem no máximo n. Pelo lema 18.19 temos que Wn é um grupo cı́clico
cuja ordem coincide com o seu expoente. Além disto, #Wn = n se somente se
p = car(Ω) - n. De fato, #Wn = n se e somente se polinômio xn − 1 ∈ Ω[x] é
separável, o que ocorre se e somente se car(Ω) = 0 ou p com p - n. Note por
exemplo que Wp = {1}, se car(Ω) = p.
A partir de agora suporemos sempre que car(Ω) = 0 ou p com p - n. Seja

Wn (K) := Wn ∩ K.

Este conjunto é um subgrupo cı́clico de Wn e de K ∗ . Este subgrupo depende


diretamente de K e n. Por exemplo, se K = Q, Ω = C e n = 6, temos que
W6 = {1, ζ, · · · , ζ 5 }, onde ζ = e2πi/6 , mas W6 (Q) = {±1}. Se n = 5, então
Wn = {1, η, · · · , η 4 }, onde η = e2πi/5 , mas W5 (Q) = {1}. Assim, Wn (K) depende
de n e de K. Por outro lado, se n é par (resp. ı́mpar), então Wn (Q) = {±1}
(resp. Wn (Q) = {1}).
Seja ζ um gerador de Wn . Existe um isomorfismo canônico

Wn ∼
= Z/nZ dado por ζ i 7→ i.

Lembremos que os geradores de Z/nZ são exatamente as classes

a tais que mdc(a, n) = 1,

i.e., são os elementos de (Z/nZ)∗ . A pré-imagem destes geradores pelo isomor-


fismo anterior é o conjunto Pn de geradores de Wn . Tal conjunto é chamado o
conjunto das raı́zes primitivas n-ésimas da unidade. Observe também que pelo
teorema de Lagrange para todo ϑ ∈ Wn temos o(ϑ) = d | n. Assim, podemos
191
192 21. EXTENSÕES CICLOTÔMICAS

escrever
[
(21.0.1) Wn = Pd .
d|n

Como anteriormente definimos


Pn (K) := Pn ∩ K.
Assim, Wn (K) é cı́clico de ordem n se e somente se Pn (K) 6= ∅.

Definição 21.1. Dizemos que Ln := K[Rxn −1 ] é a n-ésima extensão ci-


clotômica de K contida em Ω. Quando K = Q, Ln é dito o n-ésimo corpo
ciclotômico.

Teorema 21.2. A extensão Ln /K é galoisiana finita, Aut(Ln /K) é um grupo


abeliano isomorfo a um subgrupo de (Z/nZ)∗ . Em particular, [Ln : K] | φ(n).
Além disto, Ln = K(ζ) para algum gerador ζ de Wn (Ln ).

Demonstração. Esta extensão é finita, pois é finitamente gerada por ele-


mentos algébricos sobre K, as raı́zes de xn − 1. É claro que Ln /K é normal,
pois Ln é o corpo de decomposição de xn − 1 sobre K. Também é claro que
Ln /K é separável, pois xn − 1 é separável (lembre que p - n, se p > 0). Seja ζ
um gerador de Wn (Ln ) = Wn . Então σ ∈ Aut(Ln /K) se e somente se σ(ζ) for
também um gerador de Wn , o que ocorre se e somente se σ(ζ) = ζ aσ para algum
aσ ∈ {0, · · · , n − 1} tal que mdc(aσ , n) = 1. Isto induz a seguinte função
ϕ : Aut(Ln /K) → (Z/nZ)∗
definida por σ 7→ aσ . Esta função é um homomorfismo injetivo de grupos. De
fato, por um lado ϕ(στ ) = aστ . Por outro lado, στ (ζ) = σ(ζ aτ ) = σ(ζ)aτ = ζ aσ aτ ,
portanto aστ = aσ aτ , a fortiori, ϕ(στ ) = ϕ(σ)ϕ(τ ) e ϕ é um homomorfismo de
grupos. Além disto, σ ∈ N (ϕ) se e somente se aσ = 1, o que ocorre se e somente
se σ = id. 

Corolário 21.3. [Ln : K] = φ(n) se e somente se Aut(Ln /K) ∼


= (Z/nZ)∗ .

Verificaremos que a condição do corolário é satisfeita se K = Q. Para isto


precisamos do seguinte lema elementar cuja demonstração deixamos a cargo do
leitor.

Lema 21.4. Sejam f, g ∈ Q[x] tais que f g ∈ Z[x], então f, g ∈ Z[x].


21. EXTENSÕES CICLOTÔMICAS 193

Teorema 21.5. Seja ζ um gerador de Wn ⊂ C∗ . Então [Q(ζ) : Q] = φ(n).

Demonstração. Seja p um número primo tal que p - n. Afirmamos que


Pζ|Q = Pζ p |Q . Suponha que Pζ|Q 6= Pζ p |Q . Seja
κp : Z → Fp , a 7→ a
o homomorfismo quociente. Este induz um homomorfismo sobrejetivo κ∗p : Z[x] →
Fp [x] dado por
X X
ai xi 7→ ai x i .
i
Observe que ζ ∈ Rxn −1 , logo Pζ|Q e Pζ p |Q dividem xn −1. Ou seja, existe h ∈ Q[x]
p

tal que
xn − 1 = hPζ|Q Pζ p |Q .
Pelo lema anterior concluimos que h, Pζ|Q , Pζ p |Q ∈ Z[x]. Em particular,
xn − 1 = κ∗p (h)κ∗p (Pζ|Q )κ∗p (Pζ p |Q ).
Observe que ζ é raiz de Pζ p |Q (xp ), logo
Pζ p |Q (xp ) = h1 (x)Pζ|Q (x),
para algum h1 ∈ Z[x], onde novamente utilizamos pelo lema anterior. Portanto,
κ∗p (Pζ p |Q (xp )) = κ∗p (Pζ p |Q )(x)p = κ∗p (h1 )(x)κ∗p (Pζ|Q )(x).
Mas κ∗p (Pζ|Q ) e κ∗p (Pζ p |Q ) são irredutı́veis mônicos. Logo κ∗p (Pζ|Q ) = κ∗p (Pζ p |Q ).
Em particular, xn − 1 possui fator múltiplo. Mas este polinômio é separável, pois
p - n. Concluimos assim que
(21.5.1) Pζ|Q = Pζp |Q .
Seja η ∈ Pn , então η = ζ a , onde a = p1 · · · pr , onde pi é primo e pi - n.
Aplicando sucessivamente (21.5.1) concluimos que
Pη|Q = Pζ|Q .
Logo
#RPζ|Q ≥ #Pn = φ(n).
Por outro lado,
#RPζ|Q = grau(Pζ|Q ) = [Q(ζ) : Q] ≤ φ(n),
onde a última desigualdade segue do teorema anterior. 
194 21. EXTENSÕES CICLOTÔMICAS

Definição 21.6. Denotamos por

Φn := Pζ|Q

o n-ésimo polinômio ciclotômico.

Segue de (21.0.1) e da prova do teorema anterior que


Y
xn − 1 = Φd .
d|n

Esta última igualdade permite recuperar indutivamente os polinômios ciclotômicos,


por exemplo, a partir de Φp para p um número primo.
O grupo de Galois de extensões ciclotômicas, mesmo sobre os racionais, é
sempre abeliano, mas raramente é cı́clico. Lembre por exemplo que (Z/nZ)∗ é
cı́clico se n for 2, 4, p número primo ou 2p. Entretanto, quando substituimos Q
pelo corpo finito Fp de p elementos, para um número primo p, o que obtemos é
sempre um grupo cı́clico como explicaremos a seguir.

Observação 21.7. Note também que todo corpo finito Fq de q = pn elemen-


tos dá origem a uma extensão ciclotômica Fq /Fp de corpos finitos é necessaria-
mente uma extensão ciclotômica, pois Fpn \ {0} é exatamente Wpn −1 .
Extensões finitas de Q são ditas corpos de números. Podemos naturalmente
constuir uma torre de extensões ciclotômicas

Q ⊂ Q[ζp ] ⊂ Q[ζp2 ] ⊂ · · · ⊂ Qp∞

chamada uma torre p-ádica. O estudo deste tipo de torre foi feito por K. Iwasawa
e este associa a cada torre uma série p-ádica intimamente ligada à função analı́tica
p-ádica de Kubota e Leopoldt a qual interpola L-funções de Dirichlet nos inteiros
negativos.
Por outro lado é possı́vel construir torres semelhantes quando substituimos Q
pelo corpo de funções racionais Fp (x). Neste caso entretanto dois tipos de ciclo-
tomia aparecem, emergindo um fenômeno distinto do caso de corpos de números.
De um lado as extensões do tipo Fq (x)/Fp (x) por constantes, que como obser-
vamos anteriormente e utilizando a teoria de Galois são extensões ciclotômicas.
Por outro lado, o papel das raı́zes da unidade também tem como contrapartida o
que chamamos de pontos de torção de um determinado módulo devido a Carlitz.
Para mais sobre isto ver [?].
21. EXTENSÕES CICLOTÔMICAS 195

Finalmente, a teoria de extensões ciclotômicas tanto em um caso quanto


em outro são incarnações unidimensionais de um fenômeno mais amplo (mul-
tiplicação complexa) que ocorre por exemplo no contexto de variedades abelianas
e módulos de Drinfeld.
Definição 21.8. Seja Ωp um corpo algebricamente fechado contendo Fp .
Definimos em Ωp o automorfismo de Frobenius Frobp (a) = ap .
Teorema 21.9. A extensão Fq /Fp é galoisiana finita e seu grupo de Galois
Aut(Fq /Fp ) é cı́clico de ordem n gerado pela restrição (Frobp )|Fq do automorfismo
de Frobenius Frobp a Fq .
Demonstração. A primeira parte do teorema já está feita. Note que
(Frobp )nFq = id. Seja ζ um gerador de F∗q . Então o(ζ) = pn − 1. Se existisse j < n
j
tal que (Frobp )j|Fq = id, então ζ = Frobp (ζ)j = ζ p , i.e., (pn − 1) | (pj − 1), o que
é impossı́vel. Assim, o((Frobp )|Fq ) = n. Mas # Aut(Fq /Fp ) = [Fq : Fp ] = n. 
Teorema 21.10. Seja η um gerador de Wn (Ωp ). Então [Fp (η) : Fp ] = o(p)
em (Z/nZ)∗ .
Demonstração. Seja m := [Fp (η) : Fp ] e f := o(p) em (Z/nZ)∗ . Neste caso
Fp (η) ∼
= Fq , onde q = pm . Além disto, o(η) = n | |F∗q | = q − 1, i.e., pm ≡ 1
(mod n), em particular pm = 1. Pelo lema chave, o(p) = f | m, a fortiori f ≤ m.
f f
Reciprocamente, como pf ≡ 1 (mod n), então η p −1 = 1, i.e., η p = η. Por
outro lado, para todo α ∈ Fp (η) temos que
m−1
X
α= ai η i ,
i=0

onde ai ∈ Fp para todo i. Pelo pequeno teorema de Fermat, api = ai para todo i,
portanto,
m−1
X pf f m−1
f
X
αp = ai η p = ai η i = α.
i=0 i=0
f −1
Em particular, tomando α um gerador de Fp (η)∗ concluimos que αp = 1, logo
pelo lema chave, o(α) = (pm − 1) | (pf − 1), em particular m ≤ f . 
Definição 21.11. Analogamente, definimos Ψn := Pη|Fp .
Observação 21.12. A decomposição de
[
Wn (Ωp ) = Pd (Ωp )
d|n
196 21. EXTENSÕES CICLOTÔMICAS

e o teorema anterior implicam que


Y
xn − 1 = Ψd .
d|n

Além disto é fácil ver que Ψd = κ∗p (Φd ).


CAPı́TULO 22

Extensões cı́clicas

Seja K um subcorpo de um corpo algebricamente fechado Ω. Uma extensão


galoisiana finita L/K é cı́clica (resp. abeliana) se Aut(L/K) for cı́clico (resp.
abeliano).

Teorema 22.1 (teorema de Abel). Seja K um corpo, car(K) = p primo e


a ∈ K ∗ . As seguintes condições são equivalentes:
(1) xp − a é irredutı́vel em K[x].
(2) xp − a não possui raiz em K.
/ K p := {bp | b ∈ K}.
(3) a ∈

Demonstração. É claro que (1) implica (2) que implica (3). Suponha que
x − a seja redutı́vel em K[x] e seja α ∈ Ω tal que αp = a. Então Pα|K | (xp − a).
p

Como xp − a = (x − α)p em Ω[x] concluimos que Pα|K (x) = (x − α)l , onde


1 ≤ l ≤ p − 1. Mas se l > 1, entâo Pα|K não é separável, consequentemente existe
h ∈ K[x] tal que Pα|K (x) = h(xp ). Mas devido ao grau de Pα|K isto não é possı́vel.
Portanto, Pα|K (x) = x − α é separável e α ∈ K, em particular a ∈ K p . 

Trataremos agora o caso em que car(K) = 0 ou car(K) = p e p - n. Neste


caso Pn 6= ∅, digamos ζ ∈ Pn e

Rxn −a = {ζ i α | 0 ≤ i ≤ n − 1, α ∈ Ω, αn = a}.

Analisaremos primeiro o caso em que Pn (K) 6= ∅.

Teorema 22.2. Suponhamos que Pn (K) 6= ∅ e seja L = K[Rxn −a ]. Então


L/K é galoisiana e Aut(L/K) é isomorfo a um subgrupo de Z/nZ, sendo portanto
cı́clico. Em particular, [L : K] | n e L = K[α] para qualquer α ∈ Rxn −a .

Demonstração. Como L é um corpo de decomposição, então L/K é nor-


mal. Além disto como p - n e D(xn − a) = nxn−1 concluimos que xn − a é
separável, portanto L/K é separável. Além disto para todo σ ∈ Aut(L/K),
197
198 22. EXTENSÕES CÍCLICAS

σ(α) ∈ Rxn −a , portanto existe 0 ≤ iσ < n tal que σ(α) = ζ iσ . Consideremos a


função
ϕ : Aut(L/K) → Z/nZ dada por ϕ(σ) = iσ .
Esta função é um homomorfismo injetivo de grupos (neste caso, como Z/nZ é
cı́clico, concluimos que Aut(L/K) como subgrupo também o é). De fato, dados
σ, τ ∈ Aut(L/K), então τ σ(α) = τ (ζ iσ α) = ζ iτ iσ , portanto ϕ(τ σ) = iτ iσ =
ϕ(τ )ϕ(σ). Além disto σ ∈ N (ϕ) se e somente se iσ = 0, i.e., iσ = 0, mas neste
caso σ = id. 

Definição 22.3. A extensão cı́clica L = K[Rxn −a ] é dita uma extensão de


Kummer.

Observação 22.4. É possı́vel desenvolver uma teoria de extensões de Kum-


mer mesmo que Pn (K) = ∅. Para isto é necessário cohomologia galoisiana. Para
mais detalhes ver [?, chapter VI].
Nesta última situação construimos a seguinte seqüência de extensões

K[Rxn −a ] = K[ζ, α] ⊃ K[ζ] ⊂ K.

A primeira extensão é cı́clica de grau dividindo n enquanto a segunda é abeliana


de grau diviindo φ(n). Mais tarde veremos que isto pode ser traduzido em ter-
mos do grupo Aut(L/K). Ele tem a propriedade de ser um grupo solúvel. Em
particular obteremos que o polinômio xn − a = 0 é solúvel por radicais (o que é
exatamente a pergunta original de Galois para este polinômio particular.

Para provar a recı́proca do teorema anterior precisamos do teorema 90 de


Hilbert. Seja G um grupo e Hom(G, K) denota o conjunto dos homomorfismos
multiplicativos, i.e., dado σ ∈ hom(G, K), σ(xy) = σ(x)σ(y). Por abuso de
notação denotaremos ainda por Hom(G, K) o K-espaço vetorial gerado por este
conjunto.

Teorema 22.5 (teorema de Artin). Dados ϕ1 , · · · , ϕn ∈ Hom(G, K) distintos


então estes elementos são K-linearmente independentes.

Demonstração. Suponhamos que existam a1 , · · · , an ∈ K não todos nulos


tais que
a1 ϕ1 + . . . + an ϕn = 0,
22. EXTENSÕES CÍCLICAS 199

i.e., para todo y ∈ G temos que


(22.5.1) a1 ϕ1 (y) + . . . + an ϕn (y) = 0.
Após reenumeração suponhmaos que a1 , · · · , ak sejam não nulos que a n-upla
(a1 , · · · , ak , 0, · · · , 0) tenha o maior número de entradas nulas possı́veis. Seja
x ∈ G tal que ϕ1 (x) 6= ϕk (x). Então para todo y ∈ G temos que
(22.5.2) a1 ϕ1 (xy) + . . . + ak ϕk (xy) = a1 ϕ1 (x)ϕ1 (y) + . . . + ak ϕk (x)ϕk (y) = 0.
Multiplicando a (22.5.1) por ϕk (x) e subtraindo de (22.5.2) obtemos
b1 ϕ1 (y) + . . . + bk−1 ϕk−1 (y) = 0,
onde bi = ai (ϕi (y) − ϕi (x)) e b1 6= 0. Em particular
b1 ϕ1 + . . . + bk−1 ϕk−1 = 0
e esta combinação é não trivial possuindo um número de zeros maior que a
combinação que possui o maior número de zeros. Isto é uma contradição. 

Corolário 22.6 (teorema de Dedekind). Sejam σ1 , · · · , σn ∈ Aut(K), então


este conjunto é K-linearmente independente.

Teorema 22.7 (teorema 90 de Hilbert). Seja L/K uma extensão cı́clica de


grau n e σ um gerador de Aut(L/K). Dado β ∈ L temos que
α
(1) NL/K (β) = 1 se e somente se existe α ∈ L tal que β = σ(α) .
(2) TL/K (α) = 0 se e somente se existe α ∈ L tal que β = α − σ(α).

Demonstração. Lembremos que como Aut(L/K) = hσi, então


n−1
Y n−1
X
i
NL/K (β) = σ (β) e TL/K (β) = σ i (β).
i=0 i=0

Em particular, NL/K (σ(β)) = NL/K (β) e TL/K (σ(β)) = TL/K (β). Se existe α ∈ L
α
tal que β = σ(α) (resp. β = α − σ(α)) então NL/K (β) = 1 (resp. TL/K (β) = 0).
Provemos as recı́procas separadamente. Suponhamos primeiro que NL/K (β) =
1. Pelo teorema de Dedekind, id, σ, · · · , σ n−1 são K-lienarmente independentes.
Consideremos a K-combinação linear não trivial
id + βσ + (βσ(β))σ 2 + . . . + (βσ(β) . . . σ n−2 (β))σ n−1 6= 0,
pois o primeiro coeficiente é não nulo. Logo existe γ ∈ L tal que
α := γ + βσ(γ) + (βσ(β))σ 2 (γ) + . . . + (βσ(β) . . . σ n−2 (β))σ n−1 (γ) 6= 0.
200 22. EXTENSÕES CÍCLICAS
Qn−1
Aplicando σ dos dois lados desta igualdade de notando que i=1 σ i (β) = β −1 e
que σ n (γ) = γ concluimos que

σ(α) = σ(γ) + σ(β)σ 2 (γ) + (σ(β)σ 2 (β))σ 3 (γ) + . . . + β −1 γ


= β −1 (γ + βσ(γ) + (βσ(β))σ 2 (γ) + . . . + (βσ(β) . . . σ n−2 (β))σ n−1 (β))
= β −1 α.

Suponhamos agora que TL/K (β) = 0. Como L/K é separável existe γ ∈ L tal
que TL/K (γ) 6= 0 (ver exercı́cio no captı́tulo de extensões separáveis). Seja
1
α := (βσ(γ) + (β + σ(β))σ 2 (γ) + . . . + (β + σ(β) + . . . + σ n−2 (β))σ n−1 (γ).
TL/K (γ)
Observe que
1
σ(α) = (σ(β)σ 2 (γ)) + (σ(β) + σ 2 (β))σ 3 (γ) + . . .
TL/K (γ)
+ (σ(β) + . . . + σ n−1 (β))σ n (γ)).
Pn−1
Como σ n (γ) = γ e i=1 σ i (β) = −β concluimos que
1
α − σ(α) = (βγ + βσ(γ) + . . . + βσ n−1 (γ))
TL/K (γ)
1
= βTL/K (γ) = β.
TL/K (γ)


Teorema 22.8. Suponhamos que Pn (K) 6= ∅. Seja L/K uma extensão cı́clica
de grau n. Então existe a ∈ K ∗ tal que L = K[Rxn −a ] e L = K[α] para qualquer
α ∈ Rxn −a .

Demonstração. Seja ζ ∈ Pn (K), então NL/K (ζ) = ζ n = 1. Pelo teorema


α
90 de Hilbert existe α ∈ L tal que ζ = σ(α) , onde hσi = Aut(L/K). Em particular,
σ(α) = ζ −1 α e σ(αn ) = σ(α)n = (ζ −1 )n αn = α, i.e., a = αn ∈ K. É claro que
Rxn −a = {ζ i α | 0 ≤ i ≤ n − 1} ⊂ L, logo K[Rxn −a ] ⊂ L. Além disto Rxn −a ⊂
RPα|K , portanto xn − a = Pα|K , assim K[α] = K[Rxn −a ] e [K[α] : K] = n,
portanto L = K[α]. 

Proposição 22.9. Seja K um corpo de caracterı́stica p e a ∈ K. Então


x − x − a é irredutı́vel em K se e somente se não existe b ∈ K tal que bp − b = a.
p
22. EXTENSÕES CÍCLICAS 201

Demonstração. Se existe b ∈ K tal que bp − b = a, então xp − x − a


possui uma raiz em K sendo portanto redutı́vel. Reciprocamente, suponha que
f = xp − x − a seja redutı́vel em K[x]. Seja α ∈ Ω uma raiz de f , então
Pα|K | (xp − x − a). Note que
Y
Rxp −x−a = {α + i | 0 ≤ i < p} e Pα|K = (x − α − i)
i∈I

para algum subconjunto I ⊂ {0, 1, · · · , p − 1}. Portanto o coeficiente de grau


d − 1, onde 1 ≤ d = #I, é igual a dα + c com c ∈ {0, 1, · · · , p − 1}. Em particular,
como dα + c ∈ K, concluimos que dα ∈ K e como d é inversı́vel, pois p - d,
concluimos que α ∈ K, i.e., αp − α = a. 

Teorema 22.10. Seja a ∈ K ∗ tal que não existe α ∈ K com αp − α = a.


Então a extensão K(Rxp −x−a )/K é cı́clica de grau p. Além disto K[Rxp −x−a ] =
K[α] para todo α ∈ Rxp −x−a .

Demonstração. Como L = K[Rxp −x−a ] é um corpo de decomposição, a


extensão L/K é nornmal. Além disto D(xp − x − a) = −1, logo L/K é separável.
As raı́zes de xp − x − a são da forma α + i para i = 0, · · · , p − 1. Portanto,
L = K[α]. Pela proposição anterior xp − x − a = Pα|K para algum α ∈ Rxp −x−a ,
portanto [L : K] = p. 

Definição 22.11. Uma extensão cı́clica da forma da forma K[Rxp −x−a ]/K
em caracterı́stica p é dita uma extensão de Artin-Schreier.

Observação 22.12. É possı́vel de forma semelhante ao que foi feito acima


caracterizar extensões cı́clicas em caracterı́stica p de grau pn . Neste caso é ne-
cessário substituir α por um vetor, chamado um vetor de Witt, por isto estas
extensões são ditas de Artin-Schreier-Witt. Vetores de Witt formam um anel
que como espaço vetorial é isomorfo a K n , mas com outra soma e produto de
tal forma que seja um anel em caracterı́stica 0. Tomando seu limite projetivo
(veja capı́tulo de teoria de Galois infinita) obtemos o anel W(K) de vetores de
Witt. É um anel com um único ideal maximal pW(K) cujo quociete é isomorfo
a K. Assim pensamos que ele levanta K. Isto é similar ao fato dos anel inteiros
p-ádicos Zp levantar Fp o corpo de p elementos.
Vetores de Witt aparecem em várias partes na matemática. Para citar apenas
duas. Serre introduziu a cohomologia com coeficientes nos feixes de vetores de
Witt que pode ser vista como uma precursora da cohomologia étale. De outro
202 22. EXTENSÕES CÍCLICAS

lado, curvas sobre um corpo K de caracterı́stica p podem ser “deformadas” em


curvas sobre o anel W(K).

Teorema 22.13. Seja K um corpo de caracterı́stica p e L/K uma extensão


cı́clica de grau p. Então existe a ∈ K tal que a 6= bp − b para todo b ∈ K e
L = K[Rxp −x−a ].

Demonstração. Note que TL/K (1) = p = 0. Seja σ um gerador de Aut(L/K


). Pelo teorema 90 de Hilbert existe α ∈ L tal que 1 = α−σ(α), i.e., σ(α) = α−1.
Logo para todo 0 ≤ j < p, σ j (α) = α−j, em particular para todo i = 0, · · · , p−1,
α + i é raiz de Pα|K e além disto σ(αp − α) = αp + j − (α + j) = αp − α (pelo pe-
queno teorema de Fermat). Além disto, Rxp −x−a ⊂ RPα|K , logo Pα|K | xp − x − a,
para a = αp − α ∈ K e Pα|K = xp − x − a. Em particular, L = K(Rxp −x−a ). 
CAPı́TULO 23

Solubilidade por radicais

Este capı́tulo responde à questão original de Galois : quando uma equação


polinomial com coeficientes racionais tem solução na forma radical. Observe
que precisamos não só da gestalt da teoria de Galois mas também de extensões
ciclotômicas e cı́clicas bem como da noção de grupos solúveis.

Definição 23.1. Uma extensão galoisiana finita E/k é dita solúvel se e so-
mente se Aut(E/k) é um grupo solúvel. Isto equivale a dizer que existe uma
seqüência de corpos

E = E0 ⊃ E1 ⊃ E2 ⊃ · · · En = k

tal que cada extensão Ei /Ei+1 é abeliana, ou equivalentemente cı́clica de grau


primo.

Extensões solúveis satisfazem às seguintes propriedades.

Proposição 23.2. (1) Sejam k ⊂ F ⊂ E corpos tais que E/k e F/k


sejam extensões galoisianas finitas. Então E/k é solúvel se e somente
se E/F e F/k são solúveis.
(2) Suponha que E/k seja solúvel e que K/k seja uma extensão finita qual-
quer com E, K ⊂ Ω e Ω corpo, então EK/K é solúvel.
(3) Se E/k e K/k são solúveis, então EK/k é solúvel.

Demonstração. (1) Basta utilizar a proposição 12.17 e notar que basta


mostrar o resultado para os respectivos grupos de automorfismos, i.e., Aut(E/k)
é solúvel se e somente se Aut(E/F ) e Aut(F/k) ∼ = Aut(E/k)/ Aut(E/F ) são
solúveis (lembre que F/k é galoisiana se e somente se Aut(E/F ) C Aut(E/k).
(2) Segue da proposição 20.15 que EK/K é galoisiana finita. Além disto
Aut(EK/K) ∼ = Aut(E/E ∩ K) ⊂ Aut(E/k). Como Aut(E/k) é solúvel, pela
proposição 12.17 concluimos que Aut(EK/K) também é solúvel.
(3) Novamente, pela proposição 20.15, EK/k é galoisiana finita. Além disto,
pela proposição 12.17, utilizando que Aut(EK/K) e Aut(K/k) ∼ = Aut(EK/k)/
203
204 23. SOLUBILIDADE POR RADICAIS

Aut(EK/K) são solúveis, concluimos que Aut(EK/k) também o é. Portanto,


EK/k é solúvel. 
Definição 23.3. Uma extensão finita separável F/k é dita solúvel por radi-
cais se existe E/k finita tal que F ⊂ E e existe uma seqüência de corpos
E = E0 ⊃ E1 ⊃ · · · ⊃ En = k
tal que cada extensão Ei /Ei+1 é de um dos 3 tipos seguintes:
(1) Ei = Ei−1 [ζ], onde ζ ∈ Rxn −1 , para algum n ≥ 1.
(2) Ei = Ei−1 [α], onde α ∈ Rxn −a , para algum n ≥ 1, se p - n, onde
p = car(k) (esta condição é vazia se car(k) = 0) e a ∈ Ei−1 .
(3) Ei = Ei−1 [α], onde α ∈ Rxp −x−a , se car(K) = p > 0 e para algum
a ∈ Ei−1 .
Extensões solúveis por radicais satisfazem as seguintes propriedades. Em
todas as propriedades abaixo suporemos que os corpos estejam todos contidos em
um corpo Ω suficientemente grande, de tal forma a podermos tomar composita
de corpos.
Proposição 23.4. (1) Sejam k ⊂ F ⊂ E corpos com E/k separável
finita. Então E/k é solúvel por radicais se e somente se E/F e F/k o
são.
(2) Suponha que E/k seja solúvel por radicais e seja K/k uma extensão
finita. Então EK/K é solúvel por radicais.
(3) Suponha que E/k e K/k sejam solúveis por radicais. Então EK/k é
solúvel por radicais.
Demonstração. (1) Suponha que F/k e E/F sejam solúveis por radicais.
Logo existem F 0 /k finita tal que F 0 ⊃ F e seqüência de corpos
F 0 = F0 ⊃ F1 ⊃ · · · ⊃ k,
na qual cada extensão Fi /Fi−1 é de um dos 3 tipos anterioes. Similarmente,
existem E 0 /F finita tal que E 0 ⊃ E e seqüência de corpos
E 0 = E0 ⊃ E1 ⊃ · · · ⊃ F,
onde cada extensão Ei /Ei−1 é de um dos 3 tipos acima. Tomando o composi-
tum da segunda seqüência com F 0 e continuando pela segunda até obtemos uma
seqüência de corpos
E 0 F 0 = E0 F 0 ⊃ E1 F 0 ⊃ · · · ⊃ F 0 ⊃ F1 ⊃ · · · ⊃ k.
23. SOLUBILIDADE POR RADICAIS 205

Finalmente, observe que Ei F 0 = Ei−1 F 0 [ζ] ou Ei−1 F 0 [α], em qualquer caso recu-
peramos um dos 3 tipos anteriores.
Suponha agora que E/k seja solúvel por radicais, ou seja existe E 0 /k finita
com E 0 ⊃ E e
E 0 = E0 ⊃ E1 ⊃ · · · ⊃ k,
com Ei = Ei−1 [α] ou Ei−1 [ζ]. Primeiro, como F ⊂ E ⊂ E 0 , segue imediatamente
que F/k é solúvel por radicais. De outro lado, como acima, tomando o composi-
tum da seqüência anterior com F concluimos também que E ⊂ E 0 ⊂ E 0 F e E/F
é solúvel por radicais.
(2) Mesmo argumento do último parágrafo, tomando agora o compositum da
seqüência com K.
(3) Segue dos 2 anteriores. 

Teorema 23.5. Seja E/k uma extensão galoisiana finita. Então E/k é
solúvel por radicais se e somente se E/k é solúvel.

Demonstração. Suponha que E/k seja solúvel. Neste caso existe uma se-
qüência de corpos
E = E0 ⊃ E1 ⊃ E2 ⊃ · · · ⊃ En = k
Q
tal que cada extensão Ei /Ei+1 é cı́clica de grau primo `i . Seja m = i `i onde
fazemos o produto apenas nos números primos `i tais que `i 6= p = car(k). Seja
Ω um corpo algebricamente fechado contendo k e ζ ∈ Pm (Ω). Seja K := k[ζ].
Consideremos o compositum da seqüência de corpos acima com K,
EK = L0 ⊃ E1 K = L1 ⊃ E2 K = L2 ⊃ · · · ⊃ En K = K.
Cada extensão Li /Li+1 é galoisiana e temos que
Aut(Li /Li+1 ) = Aut(Ei K/Ei+1 K)
é isomorfo a um subgrupo de ordem > 1 de Aut(Ei /Ei+1 ). Portanto este subgrupo
é igual ao próprio Aut(Ei /Ei+1 ), o qual é cı́clico de ordem `i . Mas neste caso, por
construção existe ζ m/`i ∈ Ei−1 raiz `i -ésima da unidade, para `i 6= p. Portanto, a
extensão Li /Li+1 é uma extensão de Kummer, se `i 6= p. Caso `i = p a extensão
é automaticamente de Artin-Schreier. Portanto, cada extensão Li /Li+1 é de um
dos 3 tipos acima, i.e., EK/K é solúvel por radicais. Trivialmente, K/k é solúvel
por radicais. Do item (1) das propriedades anteriores concluimos que EK/k é
solúvel por radicais, a fortiori E/k é solúvel por radicais (novamente o item (1)
das propriedades acima, uma vez que E ⊂ EK).
206 23. SOLUBILIDADE POR RADICAIS

Reciprocamente, suponha que E/k seja solúvel por radicais. Então existe
E 0 /k finita contendo E e uma seqüência de corpos

E 0 = E0 ⊃ E1 ⊃ E2 ⊃ · · · ⊃ En = k

tal que cada Ei /Ei+1 é de um dos três tipos acima. Note que a priori a extensão
Ei /Ei−1 não é galoisiana, isto falha no caso (2) acima. Seja m o produto de todos
os números primos dividindo [E 0 : k] distintos de p = car(k) (caso p > 0). Seja
ζ ∈ Wm (Ω) uma raiz primitiva m-ésima da unidade em um corpo algebricamente
fechado Ω (como sempre supomos Ω suficientemente grande para conter todos
os corpos considerados). Seja F := k[ζ] a m-ésima extensão ciclotômica de k.
Considere agora o compositum da seqüência anterior com F dado por

E 0 F ⊃ E1 F ⊃ · · · ⊃ F.

Para cada i, seja Li := Ei F . Note que agora cada Li /Li−1 é galoisiano, pois
corrigimos o caso Kummer acrescentando um elemento ζmi , uma raiz mi -ésima
primitiva da unidade a Ei−1 , onde mi = [Ei : Ei−1 ], caso p - mi . Caso contrário
nada há a fazer. Além disto neste caso Li = Li−1 [αi ] = Li−1 [Rxmi −ai ], onde
αimi = ai . Finalmente, observe que E 0 F é o corpo de decomposição sobre k do
polinômio
Y Y
f := (xmi − ai ) × (xp − x − ai ).
i,p-mi i,mi =p

Portanto, E 0 F/k é galoisiana (já que E 0 F/F é separável, pois cada Li /Li−1 o
é, e F/k também é separável). A fortiori, E 0 F/F é solúvel. Trivialmente F/k
é solúvel. Assim, pelas propriedades de extensões solúveis, E 0 F/k é solúvel. A
fortiori, pela mesma razão, E/k é solúvel. 

Definição 23.6. Dado f ∈ Q[x] irredutı́vel. Este polinômio é dito solúvel


por radicais se Q[Rf ]/Q é solúvel por radicais.

Corolário 23.7 (teorema de Galois, post-mortem). Seja f ∈ Q[x] irre-


dutı́vel. Então f é solúvel por radicais se e somente se Gal(f, K) for solúvel.

Observação 23.8. Num capı́tulo posterior abordaremos o problema inverso


de Galois, que permaence em aberto desde o século XIX. Este diz o seguinte. Dado
um grupo finito G será que existe uma extensão galoisiana finita K/Q tal que
Gal(K/Q) seja G? Veremos que a geometria, via o teorema de irredutibilidade
de Hilbert poderá nos dar informações relevantes para este problema. Um caso
23. SOLUBILIDADE POR RADICAIS 207

particular é aquele no qual o grupo G é um grupo solúvel. Nesta situação sabe-se


que existe K. Isto é devido a S̆afarevic̆ e Iwasawa. Para mais sobre isto veja [?]

Observação 23.9. Não é difı́cil provar que S4 e S3 são grupos solúveis.


Além disto, para todo polinômio irredutı́vel f ∈ Q[x] de grau n temos que
Aut(k(Rf )/k) é isomorfo a um subgrupo de Sn . Portanto, polinômios de graus
3 e 4 são sempre solúveis. Isto mostra que os algebristas árabes e italianos só
podiam mesmo achar explicitamente as raı́zes na forma radical, o que não quer
dizer que encontrar as fórmulas por eles obtidas fosse missão fácil.
Contrariamente, equações de grau 5 não são necessariamente solúveis por
radicais, uma vez que S5 não o é (veja [?]. O teorema 20.23 nos diz que polinômios
de grau primo p > 2 com exatamente 2 raı́zes reais têm grupo de Galois Sp . Assim,
basta considerar um polinômio de grau 5 com 3 raı́zes reais.
Parte 5

Tópicos adicionais
CAPı́TULO 24

O problema inverso de Galois

Problema 24.1. Seja G um grupo finito. Será que existe uma extensão
galoisiana finita K/Q tal que Gal(K/Q) = G?

Este problema permanece em aberto desde o século XIX. Entretanto refor-


mulações geométricas não só geraram análogos desta questão em outras cir-
cunstâncias, bem como trouxeram de volta resultados para o problema original.
Nossa primeira seção será justamente dedicada a mostrar que o grupo Sn de per-
mutações de n elementos sempre é grupo de Galois de uma extensão do corpo
de funções racionais K(x1 , · · · , xn ) para um corpo K qualquer. Em particular,
tomando K = Q e utilizando o teorema de irredutibilidade de Hilbert, obte-
remos que Sn é grupo de Galois sobre Q, i.e., existe K/Q galoisiana finita tal
que Sn = Gal(K/Q). Em seguida discutiremos desenvolvimentos na direção do
problema inverso para outros grupos.

24.2. Grupo Sn
Sejam Sn o grupo das permutações de n elementos, R um anel comutativo com
unidade e A = R[x1 , · · · , xn ] o anel de polinômios em n variáveis com coeficientes
em R. Para todo σ ∈ Sn e f (x1 , · · · , xn ) ∈ A definimos

σ ∗ (f (x1 , · · · , xn )) = f (xσ(1) , · · · , xσ(n) ).

Esta função é na verdade um automorfismo de A (verifique!). Dizemos que f


é simétrico se e somente se σ ∗ (f ) = f para todo σ ∈ Sn . Por exemplo, as
funções simétricas elementares s1 , · · · , sn nas variáveis x1 , · · · , xn são polinômios
simétricos (veja capı́tulo de extensões finitas). É claro que nem todo polinômio
simétrico é uma função simétrica elementar, por exemplo,

(24.2.1) x21 + . . . + x2n .

Entretanto, mostraremos que todo polinômio simétrico se escreve de forma única


como polinômio nas funções simétricas elementares. Além disto não existem
211
212 24. O PROBLEMA INVERSO DE GALOIS

relações entre estas, ou seja, são algebricamente independentes (veja capı́tulo de


teoria de transcendência).

Teorema 24.3. Seja f ∈ A simétrico. Então existe um único g ∈ R[s1 , · · · , sn ]


tal que f (x1 , · · · , xn ) = g(s1 , · · · , sn ).

Do teorema segue imediatamente o seguinte corolário.

Corolário 24.4. Não existe g ∈ R[s1 , · · · , sn ]\{0} tal que g(s1 , · · · , sn ) = 0.

Exemplo 24.5. Observe que o polinômio em (24.2.1) pode ser reescrito como

x21 + . . . + x2n = s21 − 2s2 .

Considere o polinômio

f (t) = (t − x1 ) . . . (t − xn ) = xn − s1 xn−1 + . . . + (−1)n sn ∈ A[t].

Definimos o discriminante de f (t) por


Y Y
D := (xi − xj )2 = (−1)n(n−1)/2 (xi − xj ).
1≤i<j≤n 1≤i6=j≤n

É imediato da definição que o D é um polinômio simétrico com coeficientes


inteiros. É um dos mais importantes invariantes de um polinômio. Assim, se-
gue do teorema, que podemos escrevê-lo de forma única como D(x1 , · · · , xn ) =
∆(s1 , · · · , sn ) ∈ Z[s1 , · · · , sn ]. Na prática é bastante laborioso de obter a ex-
pressão. Entretanto, se n = 2 temos

(x1 − x2 )2 = s21 − 4s2 ;

e para n = 3 temos

(x1 − x2 )2 (x1 − x3 )2 (x2 − x3 )2 =


s21 s22 − 4s32 − 4s31 s3 − 27s23 + 18s1 s2 s3 .

É importante notar que estas igualdades são identidades no anel Z[x1 , · · · , xn ].


Assim, permanecem verdadeiras se substituimos as variáveis x1 , · · · , xn por cons-
tantes. Por exemplo, se R for um corpo K e α1 , · · · , αn forem elementos algébricos
sobre K contidos em alguma extensão L de K, então

(x − α1 ) . . . (x − αn ) = xn − a1 xn−1 + . . . + an ,
24.2. GRUPO Sn 213

onde ai = si (α1 , · · · , αn ). Neste caso o discriminante do polinômio é dado por


Y
∆(a1 , · · · , an ) = (αi − αj )2 .
1≤i<j≤n

Em particular, f é separável se e somente se ∆(a1 , · · · , an ) 6= 0. Fica como


exercı́cio verificar que esta definição de discriminante coincide com a definição
anterior (capı́tulo de anéis e domı́nios). No caso do polinômio cúbico x3 − ax + b
obtemos como discriminante −(4a3 + 27b2 ).

Para a prova do teorema precisamos da noção de grau de um polinômio em


várias variáveis. Se f ∈ A, então ele pode ser escrito como
X
f (x1 , · · · , xn ) = ai1 ···in xi11 . . . xinn ,
i1 ,··· ,in

onde cada ai1 ···in pertence a R. O monômio xi11 . . . xinn tem grau i1 + . . . + in . O
grau de f é definido como sendo o maior grau dos monômios com coeficiente não
nulo. Por exemplo, o discriminante em 3 variáveis é um polinômio de grau 6.
Demonstração do teorema. Demonstraremos o teorema por indução no
número de variáveis n e no grau d de f . Comecemos com a existência. Se
n = 1, nada há a fazer, pois x1 = s1 . Suponha que o teorema seja verdade para
polinômios em n − 1 variáveis. Definimos a seguinte função
ϕ : A = R[x1 , · · · , xn ] → R[x1 , · · · , xn−1 ]
h 7→ h(x1 , · · · , xn−1 , 0).
Observe que como f é simétrico com respeito a Sn , então ϕ(f ) é simétrico em
relação a Sn−1 . Por hipótese de indução existe g 0 ∈ R[s01 , · · · , s0n−1 ] tal que
ϕ(f (x1 , · · · , xn )) = g 0 (s01 , · · · , s0n−1 ),
onde para 1 ≤ i ≤ n − 1, a função s0i denota a i-ésima função simétrica elementar
nas variáveis x1 , · · · , xn−1 . Observe que para todo 1 ≤ i ≤ n − 1 temos
ϕ(si (x1 , · · · , xn )) = s0i (x1 , · · · , xn−1 ).
Seja
p(x1 , · · · , xn ) := f (x1 , · · · , xn ) − g 0 (s01 , · · · , s0n−1 ).
Como p é diferença de polinômios simétricos (um polinômio simétrico em n − 1
variáveis é simétrico em n variáveis), concluimos que p também é simétrico. Além
disto, p(x1 , · · · , xn−1 , 0) = 0. Mas isto significa que p(x1 , · · · , xn ) é divisı́vel por
xn . Similarmente, definindo a função ϕ anulando qualquer outra das variáveis,
214 24. O PROBLEMA INVERSO DE GALOIS

concluimos que para todo 1 ≤ i ≤ n o polinômio p(x1 , · · · , xn ) é divisı́vel por


cada xi , a fortiori por x1 . . . xn = sn (x1 , · · · , xn ), digamos

f (x1 , · · · , xn ) = g 0 (s01 , · · · , s0n−1 ) + sn h(x1 , · · · , xn ),

onde h ∈ A. Por construção o grau de h é inferior ao grau de f . Além disto, como


p(x1 , · · · , xn ) e sn são simétricos, concluimos que h também o é. Por indução no
grau, temos que existe q ∈ R[s1 , · · · , sn ] tal que

h(x1 , · · · , xn ) = q(s1 , · · · , sn ),

assim
f (x1 , · · · , xn ) = g 0 (s01 , · · · , s0n−1 ) + sn q(s1 , · · · , sn )
é uma expressão de f em termos de funções simétricas elementares.
A unicidade também é provada com indução em n e no grau. Considere a
função

ψ : A = R[x1 , · · · , xn ] → R[s1 , · · · , sn ]
f (x1 , · · · , xn ) 7→ f (s1 , · · · , sn ).

Esta função é um homomorfismo de anéis (verifique!). A unicidade então é


equivalente a injetividade de ψ. Suponha que f (x1 , · · · , xn ) ∈ ker(ψ), i.e.,
f (s1 , · · · , sn ) = 0. Aplicando ϕ a f (s1 , · · · , sn ) concluimos que f (s01 , · · · , s0n−1 ) =
0. Por indução no número de variáveis, concluimos que ϕ(f (x1 , · · · , xn ) =
f (x1 , · · · , xn−1 , 0) = 0. Logo xn divide f (x1 , · · · , xn ). Similarmente, redefinindo
ϕ de forma a anular qualquer outra das variáveis, temos que cada xi divide
f (x1 , · · · , xn ), a fortiori x1 . . . xn = sn (x1 , · · · , xn ) divide f (x1 , · · · , xn ), digamos

f (x1 , · · · , xn ) = sn (x1 , · · · , xn )h(x1 , · · · , xn ),

para algum h ∈ A. Neste caso, por construção, o grau de h é menor que o grau
de f . Além disto,

0 = f (s1 , · · · , sn ) = s1 . . . sn h(s1 , · · · , sn )

em R[s1 , · · · , sn ]. Concluimos portanto que h(s1 , · · · , sn ) = 0. Logo, por indução


no grau, h(x1 , · · · , xn ) = 0, em particular, f (x1 , · · · , xn ) = 0. 

Suponhamos agora que R seja um corpo F . Seja F (x1 , · · · , xn ) o corpo de


frações do anel de polinômios F [x1 , · · · , xn ]. Este é dito o corpo de funções
racionais em n variáveis com coeficientes em F . Analogamente, para todo σ ∈ Sn
24.2. GRUPO Sn 215

definimos σ ∗ (f (x1 , · · · , xn )) := f (xσ(1) , · · · , xσ(n) ) e dizemos que f é simétrica se


e somente se σ ∗ (f ) = f para todo σ ∈ Sn .

Teorema 24.6. Toda função simétrica f ∈ F (x1 , · · · , xn ) pode ser escrita de


forma única como f (x1 , · · · , xn ) = g(s1 , · · · , sn ) ∈ F (s1 , · · · , sn ).

Demonstração. Suponha que


f1 (x1 , · · · , xn )
f (x1 , · · · , xn ) = ,
f2 (x1 , · · · , xn )
onde f1 , f2 ∈ A, seja simétrica. Seja
Y
G(x1 , · · · , xn ) := σ ∗ (f2 ).
σ∈Sn

Observe que G e Gf são polinômios simétricos em A. Ou seja existem únicos


h1 , h2 ∈ R[s1 , · · · , sn ] tais que G = h1 e Gf = h2 . Logo f = h2 /h1 ∈ F (s1 , · · · , sn )
e esta expressão é única pela unicidade de h1 e h2 . 

Teorema 24.7. A extensão de corpos F (x1 , · · · , xn )/F (s1 , · · · , sn ) é galoisi-


ana com grupo de Galois isomorfo a Sn .

Demonstração. Seja L := F (s1 , · · · , sn ) e

f (t) := (t − x1 ) . . . (t − xn ) = tn − s1 tn−1 + . . . + (−1)n sn ∈ L[t].

Então F (x1 , · · · , xn ) = L[Rf (t) ] é o corpo de decomposição de f (t) sobre L. As-


sim, a extensão acima é normal. É também separável, pois as variáveis x1 , · · · , xn
são distintas, logo f (t) é separável. Portanto, a extensão é galoisiana. Como f (t)
tem grau n, sabemos que Gal(F (x1 , · · · , xn )/L) é isomorfo a um subgrupo de Sn
(ver capı́tulo de teoria de Galois). Por outro lado,

F (x1 , · · · , xn )Sn ⊃ L.

Isto significa que Sn ⊂ Gal(F (x1 , · · · , xn )/L). Logo Gal(F (x1 , · · · , xn )/L) ∼
=
Sn . 

Para passarmos do teorema acima para um resultado sobre Q precisamos do


teorema de irredutibilidade de Hilbert (veja [?, chapter 9].

Teorema 24.8 (teorema de irredutiblidade de Hilbert). Seja L := Q(x1 , · · ·


, xn ) ⊃ R := Q[x1 , · · · , xn ] e f (t) ∈ L[t] irredutı́vel. Então existem infinitos
homomorfismos λ : R → Q tais que λ∗ (f )(t) seja irredutı́vel em Q[t].
216 24. O PROBLEMA INVERSO DE GALOIS

Teorema 24.9. Existe uma extensão galoisiana finita K de Q tal que Gal(K/
Q) ∼
= Sn .

Demonstração. Pelo teorema 24.7 a extensão Q(x1 , · · · , xn )/Q(s1 , · · · , sn )


é galoisiana com grupo de Galois isomorfo a Sn . Seja α um elemento primitivo
desta extensão e Pα|M o seu polinômio mı́nimo sobre M := Q(s1 , · · · , sn ). Pelo te-
orema de irredutibilidade de Hilbert existem infinitos homomorfismos λ : R → Q
tais que λ∗ (Pα|M ) =: f seja irredutı́vel sobre Q[t]. Note que a extensão Q[Rf ]/Q é
galoisiana de grau n!. É possı́vel mostrar com argumentos geométricos que pode-
mos escolher λ de tal forma que Gal(Q[Rf ]/Q) seja ainda Sn (ver [?, proposition
2, seção 9.2]). 

24.10. Grupo An
Para obter o grupo An como grupo de Galois sobre Q começamos nova-
mente com a situação genérica. Seja D = 1≤i<j≤n (xi − xj )2 o discriminante
Q

do polinômio f (t) = (t − x1 ) . . . (t − xn ) = xn − s1 xn−1 + . . . + (−1)n sn . Seja


δ := 1≤i<j≤n (xi − xj ). Observe que para todo σ ∈ Sn temos σ ∗ (δ) = ±δ. Se o
Q

sinal for positivo, dizemos que a permutação é par, senão dizemos que é ı́mpar.
É claro que δ 2 = D e δ ∈/ M := F (s1 , · · · , sn ). Assim, [M [δ] : M ] = 2. Além
disto, denotando por An o subgrupo normal de ı́ndice 2 de Sn formado pelas
permutações pares, temos que F (x1 , · · · , xn )An ⊃ M [δ]. Obtemos dessa forma o
seguinte resultado.

Teorema 24.11. A extensão F (x1 , · · · , xn )/M [δ] é galoisiana com grupo de


Galois An .

Teorema 24.12. Existe extensão galoisiana K/Q tal que Gal(K/Q) ∼


= An .

Demonstração. A prova é como no caso Sn utilizando o fato adicional que


podemos escolher λ de tal forma que λ(δ) ∈
/ Q (ver [?, seção 10.3]). 

24.13. Método geral


O que está ocorrendo em ambos os casos está longe de ser uma situação
particular. Em primeiro lugar, o corpo de funções racionais F (x1 , · · · , xn ) é o
corpo de funções racionais do espaço afim An (F ) = F n como variedade algébrica.
O objetivo é primeiramente realizar um grupo finito G como grupo de Galois
sobre este corpo. Isto nem sempre pode ser obtido, é quase tão difı́cil quanto o
problema original. Entretanto, temos o seguinte resultado.
24.13. MÉTODO GERAL 217

Teorema 24.14. [?, seção 10.1] Seja G um grupo finito. Suponha que exista
uma extensão galoisiana finita L/Q(x1 , · · · , xn ) com grupo de Galois G. Então
existe uma extensão galoisiana K/Q com grupo de Galois G. Além disto, se L
é Q-regular, i.e., Q é algebricamente fechado em L, então existem uma infini-
dade de extensões linearmente disjuntas (para definição ver capı́tulo de teoria de
transcendência).

Observação 24.15. Utilizando a teoria de curvas elı́ticas é possı́vel provar


que existe uma extensão Q-regular de Q(x) com grupo de Galois PSL2 (Fp ) =
SL2 (Fp )/F∗p . Isto é devido a Shih (ver [?, seção 10.4]). Na verdade estas extensões
representam do ponto de vista geométrico recobrimentos galoisianos finitos de
curvas definidas sobre Q com um número finito de pontos de ramificação. Isto
remete a seguinte pergunta: quando um grupo finito pode ser grupo de Galois
de um tal recobrimento com um conjunto prescrito de pontos de ramificação?
Nesta generalidade a pergunta permanece em aberto, mas se considerarmos a
pergunta sobre C, ela é respondida em termos topológicos através do chamado
grupo fundamental algébrico, que neste caso é o completamento profinito do
grupo topológico (para mais sobre grupos profinitos ver capı́tulo de teoria de
Galois infinita). A reformulação desta pergunta para corpos algebricamente fe-
chados de caracterı́stica positiva, só foi respondida na década de 90 por Raynaud
e depois Harbater correspondendo a uma conjectura de Abhyankar. A resposta
é que para que um grupo G ocorra como grupo de Galois seu maior quociente
primo com p deve se realizar sobre uma curva sobre C com mesmo número de
pontos de ramificação (suposto pelo menos 1). Seu maior quociente primo com
p nada mais é que o quociente de G pelo seu quase-p-subgrupo, i.e., o subgrupo
gerado pelos seus p-subgrupos de Sylow.

Observação 24.16. Um objeto extremamente importante em aritmética e


relacionado com o problema inverso de Galois é o grupo de Galois absoluto
GQ := Gal(Q/Q), onde Q = AC (Q). O fato de um grupo finito G ser grupo
de Galois sobre Q equivale ao fato de G ser um quociente de GQ . Este tema
está intimamente relacionado a resolver problemas de mergulhos para o grupo
profinito GQ (para mais ver [?]).
CAPı́TULO 25

Teoria de Galois infinita

25.1. Limite inverso


Consideremos uma seqüência de grupos {Gn }n∈N e suponhamos que para cada
n tenhamos um homomorfismo sobrejetivo de grupos fn : Gn  Gn1 . Considere-
Q
mos em n∈N Gn (onde a operação é componente a componente) o subconjunto
de uplas da forma x = (x0 , x1 , x2 , · · · ) tais que fn (xn ) = xn−1 para todo n ∈ N.
Como cada fn é um homomorfismo sobrejetivo, partindo de x1 ∈ G1 , tomando
uma pré imagem sua x2 em G2 e assim sucessivamente, formamos pelo menos
uma upla neste subconjunto que denotaremos por limn (Gn , fn ). Este conjunto é
←−
chamado o limite inverso ou limite projetivo da famı́lia {Gn , fn } que é chamada
de um sistema projetivo.

Exemplo 25.2. Seja A um grupo abeliano, p um número primo e pA : A → A


a multiplicação por p em A. Dizemos que A é p-divisı́vel , se pA for sobrejetivo.
Neste caso tomaremos o limite projetivo considerando a seqüência constante An =
A para todo n e fn = pA para todo n. O limite projetivo de (A, pA ) será denotado
por Vp (A). Consideremos o subconjunto Tp (A) de Vp (A) formado pelas uplas tais
que x1 = 0. Seja A[pn ] := ker(pnA ). Então Tp (A) = limn A[pn ]. Este é chamado
←−
o subgrupo de Tate associado ao grupo p-divisı́vel A. O exemplo mais comum
deste tipo de grupo é no contexto de variedades abelianas sobre corpos globais.
Entretanto, o exemplo mais simples, é tomar µpn o grupo das raı́zes pn -ésimas da
unidade em um corpo algebricamente fechado Ω de caracterı́stica distinta de p,
S
tomar A como µp∞ := n µpn e considerar Tp (µ) := limn µpn .
←−

Exemplo 25.3. Dado um grupo G considere uma seqüência de subgrupos Hn


de G tais que Hn ⊃ Hn−1 . Considere o homomorfismo sobrejetivo fn : G/Hn 
G/Hn−1 (projeção). Isto nos permite tomar o limite projetivo limn (G/Hn , fn ) e
←−
observar que os homomorfismos anteriores implicam um homomorfismo natural
g : G → limn Gn dado por x 7→ (· · · , xn , · · · ), onde xn := x + Hn .
←−
219
220 25. TEORIA DE GALOIS INFINITA

Exemplo 25.4. Para todo n ≥ 0 considere Gn := Z/pn Z e o homomorfismo


sobrejetivo de projeção fn : Z/pn+1 Z → Z/pn Z. O limite projetivo limn Z/pn Z é
←−
chamado o anel Zp dos inteiros p-ádicos (para mais detalhes ver [?, chapter II].

Definiremos agora a noção de produto inverso de forma um pouco mais geral.


Seja I um conjunto de ı́ndices dotado de uma ordem parcial i ≤ j. Diremos
que I é direcionado se para quaisquer i, j ∈ I, existe k ∈ I tal que i ≤ k e
j ≤ k. Suponhamos que I seja direcionado. Uma famı́lia inversa direcionada de
grupos é uma famı́lia de grupos {Gi }i∈I e para cada par i ≤ j um homomorfismo
Q
fji : Gj → Gi tal que se k ≤ i ≤ j, então fjk = fji ◦fik e fii = id. Seja G := i Gi
com a operação compenente a componente. Seja Γ o subconjunto de G formado
pelos elementos (xi ) tais que xi ∈ Gi satisfazendo a para todo j ≥ i, fji (xj ) = xi .
Então Γ contém o elemento neutro e é um subgrupo de G dito o limite inverso
da famı́lia e denotado por Γ = limi Gi .
←−
Exemplo 25.5. Seja G um grupo e F o conjunto de subgrupos normais em
G de ı́ndice finito. Se H, K ∈ F, então H ∩ K ∈ F, assim F é uma famı́lia dire-
cionada (com respeito à inclusão). Consideramos o limite inverso limH∈F G/H.
←−
Este subgrupo de G é o que se chama um grupo profinito (no sentido de ser limite
de grupos finitos). Uma variante desta construção consiste em nos restringirmos
à famı́lia Fp de subgrupos normais H de G cujo ı́ndice é uma potência de p. Po-
demos similarmente tomar o limite inverso limH∈F G/H, este grupo é chamado
←− p
um grupo pro-p profinito.

Exemplo 25.6. Logo em seguida consideraremos o contexto natural onde


grupos profinitos aparecem, na teoria de Galois infinita. Seja k um corpo e A
uma extensão infinita de k. Por exemplo, k = Q e A = Q. Seja G := Aut(A/k)
o grupo de k-automorfismos de A. O limite inverso limH∈F G/H coincide na
←−
verdade com G (vamos mostrar isto em seção posterior). Além disto os grupos
quocientes G/H são na verdade grupos de automorfismos de extensões finitas
K/k contidas em A.
Analogamente, se X for uma superfı́cie compacta de Riemann de gênero g ≥ 2
e p : X 0 → X for a aplicação de recobrimento universal, F := C(X), F 0 := C(X 0 )
seus corpos de funções. Exites uma injeção natural π1 (X)top ,→ Aut(F 0 /F ) do
grupo fundamental topológico de X (que é um grupo em 2g geradores com uma
relação) e Gal(F 0 /F ) é o grupo profinito definido como limite projetivo com
relação a subgrupos de ı́ndice finito de AutX (X 0 ). Chamamos a Aut(F 0 /F ) de
25.7. COMPLETAMENTO DE UM GRUPO 221

grupo fundamental algébrico de X, que coincide com o completamento profinito


de π1top (X) (ver seção seguinte). Grothendieck definiu isto de maneira geral para
curvas sobre um corpo qualquer. Isto permitiu transpor a noção tradicional de
grupo fundamental na topologia algébrica para a geometria algébrica. Permanece
um grande mistério a estrutura dos grupos fundamentais algébricos de curvas,
embora por exemplo conheça-se bem todos os quocientes finitos deste grupo, no
caso de curvas afins (isto nada mais é que uma conjectura de Abhyankar, provada
por M. Raynaud e D. Harbater nos anos 90, que diz que para que um grupo seja
quociente é necessário e suficiente que seu maior quociente primo com p o seja).

25.7. Completamento de um grupo


Seja G um grupo e suponhamos que {Hr } seja uma famı́lia de subgrupos
normais de ı́ndice finito tais que Hr ⊂ Hr+1 para todo n. Uma seqüência de
elementos {xn } em G é dita uma seqüência de Cauchy, se dado Hr existe N ≥ 1
tal que para quaiquer n, m ≥ N tenhamos xn x−1 m ∈ Hr . Dizemos que a seqüência
{xn } é a seqüência nula se para todo Hr existir um N ≥ 1 tal que para todo
n ≥ N tenhamos xn ∈ Hr . Fica como exercı́cio provar que o conjunto C de
seqüências de Cauchy com operação termo a termo é um grupo e que as seqüências
nulas N formam um sugrupo normal. O grupo quociente C/N é chamado o
completamento de G com respeito às seqüências nulas e denotado por Ĝ.
Observe que existe um homomorfismo natural G → Ĝ dado por x 7→ (x, x, x, · · · )
T
mod N . O núcleo deste homomorfismo é igual a r Hr . Quando este núcleo é
trivial temos uma injeção.

Teorema 25.8. Existe um isomorfismo de grupos Ĝ ∼


= lim G/Hr .
←−r
Demonstração. Seja x = {xn } uma seqüência de Cauchy em G. Para todo
n suficientemente grande a classe de xn mod Hr independe de n, denotamos esta
classe por x(r). Assim, (x(1), x(2), · · · ) ∈ limr G/Hr .
←−
Reciprocamente, todo elemento (x1 , x2 , · · · ) ∈ limn G/Hn , com xn ∈ G/Hn e
←−
xn um representante de xn em G. A seqüência {xn } é uma seqüência de Cauchy,
que fica como exercı́cio provar que está bem definida, a menos de seqüências
nulas. Também fica como exercı́cio mostrar que a correspondência acima nos dá
a bijeção requerida (que por construção é um homomorfismo). 

Podemos fazer a construção acima mais geralmente da seguinte forma. Seja


F uma famı́lia, uma seqüência de Cauchy é uma famı́lia {xj }j∈J indexada por um
222 25. TEORIA DE GALOIS INFINITA

conjunto arbitrário J tal que para cada H ∈ F existe j ∈ J tal que para k, k 0 ≥ j
temos xk x−1
k0 ∈ H. Na prática trabalhamos realmente com seqüências, pois os
grupos profinitos considerados na maior parte dos casos que trataremos têm uma
base enumerável de abertos. Por exemplo, isto ocorre quando G é finitamente
gerado.
Mais geralmente, uma famı́lia {Hi } de subgrupos normais contida em F é
dita cofinal em F se dado H ∈ F existir i tal que Hi ⊂ H. Suponhamos que
exista uma famı́lia {Hi } cujos ı́ndices percorram um conjunto enumerável. Fica
como exercı́cio mostrar que limi G/Hi ∼ = lim G/H.
←− ←−H∈F
25.9. Teoria de Galois infinita
Estenderemos agora a teoria de Galois para extensões infinitas. Uma extensão
algébrica infinita K/k é dita galoisiana, se for normal e separável (lembre que
para definir normalidade e separabilidade precisamos apenas que a extensão K/k
seja algébrica). Para toda subextensão finita F/k de K/k tal que F/k seja
galoisiana, temos que # Gal(F/k) = [F : k]. Pela teoria geral K/F é galosiana
(a separabilidade é clara, a normalidade, segue do fato que para qualquer α ∈ K
temos Pα|K | Pα|k ). Seja H := Gal(K/F ) := Aut(K/F ). Então H tem ı́ndice
finito em G := Gal(K/k). De fato, consideremos o homomorfismo sobrejetivo
(pela normalidade) de restrição G → Gal(F/k) dado por σ 7→ σ|F . O núcleo
deste homomorfismo é exatamente H, logo, pelo teorema dos homomorfismos,
G/H ∼ = Gal(F/k), a fortiori, H tem ı́ndice finito em G. Pelas propriedades
anteriores de limite projetivo, isto permite definir um homomorfismo de grupos
G → limH∈F G/H, onde F := {Gal(F/k) | F é uma extensão galoisiana finita de
←−
k}.

Teorema 25.10. O homomorfismo G → limH∈F G/H é um isomorfismo de


←−
grupos.

Demonstração. Observemos inicialmente que o núcleo é trivial. De fato


se σ pertence ao núcleo, então para toda extensão galoisina finita F/k contida
em K temos que σ|F = 1. Mas como todo α ∈ K pertence a alguma extensão
galoisiana finita F/k concluimos que σ = 1.
Para ver a sobrejetividade, observe que um elemento (σH ) de limH G/H sa-
←−
tisfaz a compatibilidade σH 7→ σH 0 para H 0 ⊃ H. Isto nos permite definir σ ∈ G
globalmente da seguinte forma. Seja α ∈ K, como observado, existe F/k galoisi-
ana finita contida em K tal que α ∈ F . Seja H := Gal(K/F ) e σ(α) := σH (α).
25.9. TEORIA DE GALOIS INFINITA 223

Observe que a condição de compatibilidade acima afirma justamente que σ(α)


não depende da escolha de F . Portanto, isto define um elemento σ ∈ G. Além
disto, por construção σ 7→ (σH ). 

Exemplo 25.11. Seja p um número primo e para todo inteiro n ≥ 1 consi-


deremos Kn := Q(µpn ) o pn -ésimo corpo ciclotômico. Seja K := Q(µp∞ ). A ex-
tensão K/Q é abeliana infinita. Como para todo n ≥ 1 temos que Gal(Kn /Q) ∼ =
n ∗ ∗
(Z/p Z) concluimos que temos um isomorfismo de grupos Zp → Gal(K/Q).
Este tipo de extensão cicltômica foi estudada por K. Iwasawa e está associada a
funções L analı́ticas na topologia p-ádica.

Exemplo 25.12. Similarmente, dada uma curva elı́tica E sobre Q conside-


ramos a extensão ciclotômica Q(E[pn ]) gerada pelas coordenadas dos pontos de
pn -torção de E, lembre que E[pn ] ∼
= (Z/pn Z)2 . Observe também que o grupo
de Galois absoluto GQ := Gal(Q/Q) de Q age em E[pn ], para todo n, assim
temos uma representação de GQ dada por ρn : GQ → GL(E[pn ]) ∼ = GL2 (Z/pn Z)
e pelas construções anteoriores podemos tomar o limite projetivo destas repre-
sentações, obtendo assim a representação p-ádica GQ → GL2 (Zp ). Na verdade
o estudo destas representações remonta a trabalhos de Serre, Shimura e Lang-
Trotter e um teorema profundo de Serre afirma que a representação galoisiana
Q
ρ : GQ → p GL2 (Zp ) tem imagem aberta, se E não tem multiplicação complexa,
i.e., a imagem de GQ é um subgrupo de ı́ndice finito em GL2 (Zp ) para todo p
sendo igual a GL2 (Zp ) para quase todo p. O mesmo tipo de problemática pode
ser encontrado no caso de variedades abelianas, mas a extensão do teorema de
Serre depende de um conjectura sobre o grupo de Mumford-Tate da variedade
abeliana.

Pode-se considerar também extensões ciclotômicas de extensões ciclotômicas.


Isto é o conteúdo da seguinte conjectura devida a S̆afarevic̆.

Conjectura 25.13. Seja k0 := Q(µ∞ ) o compositum de todas as extensões


ciclotômicas de Q em Q. Seja k/k0 uma extensão finita e Gk := Gal(Q/k). Então
Gk é isomorfo ao completamento de um grupo profinito livro em um número
enumerável de geradores.

É possı́vel formular um análogo desta conjectura para curvas elı́ticas substi-


tuindo Q(µ) por Q(E(Q)tor ).
CAPı́TULO 26

Teoria de transcendência

26.1. Bases de trasncendência


26.2. Transcendência de e
26.3. Transcendência de π
26.4. Elementos de teoria de transcencência

225