Livro de Algebra 1

Álgebra
Amı́lcar Pacheco
Universidade Federal do Rio de Janeiro, Instituto de Matemática
E-mail address: amilcar@im.ufrj.br
Sumário
Capı́tulo 1. Preliminares 1
1.3. Relação de equivalência 2
1.9. Lema de Zorn e aplicações 3
Parte 1. Números Inteiros 5
Capı́tulo 2. Algoritmos Euclideanos 7

2.1. O algoritmo euclideano para números inteiros 7
2.5. Máximo divisor comum 8
2.11. Anéis e ideais 10
2.15. Exercı́cios 12
Capı́tulo 3. Fatoração de inteiros 13

3.1. Existência 13
3.4. Unicidade 14
3.8. MDC e fatoração 15
3.10. Aplicações 15
3.19. Funções aritméticas elementares 18
Capı́tulo 4. Indução finita 23

4.1. Enunciados 23
4.4. Exemplos da indução na sua primeira forma 23
4.10. Exemplos da indução finita na sua segunda forma 25
Capı́tulo 5. Números primos 27

5.1. Infinidade de primos 27
5.4. Primos em progressões aritméticas 29
5.7. Infinidade de compostos por funções polinomiais 31
5.9. Números de Fermat e Mersenne 32
5.12. Contando números primos 32
5.20. Função zeta 37
iii
iv SUMÁRIO
Capı́tulo 6. Aritmética modular 41

6.1. Aritmética modular 41
6.9. Critérios de divisibilidade 43
6.13. Contando elementos inversı́veis 45
Capı́tulo 7. Sistemas de congruência 47

7.1. Equações diofantinas 47
7.3. Equações lineares 47
7.7. Sistemas de equações lineares 48
7.10. Teorema Chinês dos Restos 49
7.13. Aplicação 50
Capı́tulo 8. Aplicações da teoria de grupos à teoria elementar dos números 53

8.1. Primalidade de números de Mersenne 53
8.3. Primalidade de números de Fermat 54
8.5. Números de Carmichael 54
8.11. Teorema da raiz primitiva 56
Parte 2. Grupos 59
Capı́tulo 9. Teoria de Grupos I 61

9.1. Definição e exemplos 61
9.11. Subgrupos 66
9.17. Classes Laterais e Teorema de Lagrange 67
9.25. Ordem de elemento e expoente de grupo abeliano 69
Capı́tulo 10. Teoria de grupos II 73

10.1. Subgrupos normais e grupos quocientes 73
10.10. Homomorfismo de grupos 75
10.27. Produtos de grupos 80
10.33. Grupos metacı́clicos 85
10.37. Classificação de grupos de ordem ≤ 11 87
Capı́tulo 11. Teoremas de Sylow 91

11.1. Represesentações de grupos 91
11.7. Os teoremas de Sylow 93
11.15. Exemplos 96
Capı́tulo 12. Grupos solúveis 99

SUMÁRIO v
12.1. Teorema de Jordan-Hölder 99

12.10. Grupos solúveis 102
Capı́tulo 13. Grupos abelianos finitamente gerados 105

13.1. Módulos sobre anéis 105
13.3. Diagonalização de matrizes 107
13.6. Geradores e relações para módulos 108
13.11. O teorema de estrutura 110
Parte 3. Anéis 113
Capı́tulo 14. Anéis de polinômios 115

14.1. Algoritmo da divisão 115
14.3. Máximo divisor comum de polinômios 118
14.11. Fatoração única de polinômios 121
Capı́tulo 15. Anéis e domı́nios 127

15.1. Domı́nios euclideanos 127
15.15. Domı́nios fatoriais 133
15.25. Fatores múltiplos e resultante 137
15.34. Anéis quocientes e teorema chinês dos restos 139
15.50. Aplicações 146
Parte 4. Corpos 149
Capı́tulo 16. Extensões finitas 151

16.10. Exercı́cios 155
Capı́tulo 17. Extensões algébricas 157

17.1. Elementos algébricos e transcendentes 157
17.4. Extensões algébricas 159
17.12. Adjunção de raı́zes 160
17.18. Fechos algébricos 162
Capı́tulo 18. Extensões separáveis 169

18.17. Corpos Finitos 175
Capı́tulo 19. Corpos de decomposição e extensões normais 177

19.17. Exemplos 180
vi SUMÁRIO
Capı́tulo 20. Teoria de Galois 183

20.1. Correspondência de Galois 183
20.10. Extensões e subgrupos normais 187
20.18. Coeficientes e raı́zes 189
Capı́tulo 21. Extensões ciclotômicas 191
Capı́tulo 22. Extensões cı́clicas 197
Capı́tulo 23. Solubilidade por radicais 203
Parte 5. Tópicos adicionais 209
Capı́tulo 24. O problema inverso de Galois 211

24.2. Grupo Sn 211
24.10. Grupo An 216
24.13. Método geral 216
Capı́tulo 25. Teoria de Galois infinita 219

25.1. Limite inverso 219
25.7. Completamento de um grupo 221
25.9. Teoria de Galois infinita 222
Capı́tulo 26. Teoria de transcendência 225

26.1. Bases de trasncendência 225
26.2. Transcendência de e 225
26.3. Transcendência de π 225
26.4. Elementos de teoria de transcencência 225
CAPı́TULO 1
Preliminares
Ao longo deste livro dentoraremos por N o conjunto dos números naturais,

Z o conjunto dos números inteiros, Q o conjunto dos números racionais, R o
conjunto dos números reais e C o conjunto dos números complexos. Para todo
x ∈ C denotamos por |x| seu valor absoluto usual, i.e., se x = a + bi com a, b ∈ R,
√
então |x| := a2 + b2 . Para todo x ∈ R denotamos seu valor absoluto usual por
|x| := x, se x ≥ 0, e |x| := −x, se x < 0.
Sejam S e T conjuntos. Uma função f : S → T é dita injetiva toda vez que
x 6= y implicar f (x) 6= f (y). Isto também equivale a dizer que se f (x) = f (y),
então x = y. A função f é dita sobrejetiva, se f (S) = T .
Lema 1.1. Sejam S 0 e R conjuntos. Então existe um conjunto S10 e bijeção

ϕ0 : S 0 → S10 tal que S10 ∩ R = ∅.
Axioma 1.2 (axioma da boa ordenação). Todo subconjunto não vazio de N

possui um menor elemento.
Seja n ≥ 1 inteiro. Sejam x, y variáveis. Considere o produto notável
xn − y n = (x − y)(xn−1 + xn−2 y + . . . + xy n−2 + y n−1 .
Podemos obter dele a soma de n termos de uma progressão geométrica de razão

n−1
q. Digamos que os termos sejam a, aq, · · · , aq . Assim,
qn − 1
a + aq + . . . + aq n−1 = a .
q−1
Basta na fórmula anterior tomar x = q e y = 1.
Para inteiros 1 ≤ m ≤ n definimos o número binomial

n n!
:= ,
m m!(n − m)!
onde n! := n(n − 1) . . . 1.
1
2 1. PRELIMINARES
Lembre-se [?, p. 632] das seguintes expansões em séries

1
= 1 + x2 + x3 + . . . + xn + . . . ;
1−x
x2 x3 xn
log(1 − x) = x + + + ... + + ... .
2! 3! n!
Dado um número real x denotamos por dxe a parte inteira de x, ou seja, o
maior número inteiro menor ou igual a x.
Para todo inteiro n ≥ 1 e número primo p, a ordem p-ádica ordp (n) de n é
definida por pordp (n) é a potência exata de p que divide n.
1.3. Relação de equivalência

Seja X um conjunto. Uma relação binária R é um subconjunto de X × X.
Dado um par (a, b) ∈ R dizemos que a é relacionado a b e denotamos por aRb.
Por exemplo, podemos tomar como X o conjunto de retas do plano e como R a
relação de ortogonalidade.
Uma relação de equivalência em um conjunto X é uma relação binária ∼
satisfazendo às seguintes condições:
(1) x ∼ x (reflexividade).
(2) Se x ∼ y, então y ∼ x (simetria).
(3) Se x ∼ y e y ∼ z, então x ∼ z (transitividade).
Exemplo 1.4. Seja X = Z e ∼ a relação ≡ (mod n) definida por: dados

a, b ∈ Z, a ≡ b (mod n) se e somente se n | (a − b), i.e., existe k ∈ Z tal que
a − b = kn. Isto define uma relação de equivalência. De fato,
(1) a − a = 0 = 0.n.
(2) Se a ≡ b (mod n), então existe k ∈ Z tal que a − b = kn, logo b − a =
(−k)n e b ≡ a (mod n).
(3) Se a ≡ b (mod n) e b ≡ c (mod n), então existem k, l ∈ Z tais que
a − b = kn e b − c = ln. Somando estas duas igualdades obtemos
a − c = (k + l)n, logo a ≡ c (mod n).
Exemplo 1.5. Seja X = Z × Z − {0}. Definimos dois pares (a, b), (c, d) ∈ X
como equivalentes, denotando (a, b) ∼ (c, d) se e somente se ad = bc. Isto define
uma relação de equivalência. De fato,
(1) ab = ba, logo (a, b) ∼ (a, b).
1.9. LEMA DE ZORN E APLICAÇÕES 3
(2) Suponha que (a, b) ∼ (c, d), i.e., ad = bc. Logo cb = da, i.e., (c, d) ∼
(a, b).
(3) Suponha que (a, b) ∼ (c, d) e (c, d) ∼ (e, f ), i.e., ad = bc e cf = de. Logo
af = bcd f = bcf
d
= bde
d
= be, i.e., (a, b) ∼ (e, f ).
Seja X um conjunto e ∼ uma relação de equivalência em X. Definimos a
classe [a] de um elemento a ∈ X por [a] = {b ∈ X | b ∼ a}. Note que [a] é um
conjunto.
Lema 1.6. Seja X um conjunto e ∼ uma relação de equivalência em X.
Dados a, b ∈ X, temos que a ∼ b se e somente se [a] = [b].
Demonstração. Suponha que [a] = [b]. Observe que a ∈ [a], pois a ∼ a.
Logo a ∈ [b], i.e., b ∼ a, portanto a ∼ b.
Reciprocamente, suponha a ∼ b e c ∈ [a], i.e., c ∼ a. Por transitividade,
c ∼ b, i.e., c ∈ [b]. Suponha d ∈ [b], i.e., d ∼ b. Por simetria, b ∼ a, por
transitividade, d ∼ a, i.e., d ∈ [a].
Corolário 1.7. Seja X um conjunto e ∼ um relação de equivalência em X.
Então a b se e somente se [a] ∩ [b] = ∅.
Demonstração. Note que se a ∼ b, então [a] ∩ [b] = [a] = [b] 6= ∅. Por
outro lado, se existisse c ∈ [a] ∩ [b], então c ∼ a e c ∼ b. Por simetria, a ∼ c e
por transitividade a ∼ b, o que é uma contradição.
Corolário 1.8. Seja X um conjunto e e ∼ um relação de equivalência em X.
S· S·
Então X = a [a], onde a [a] denota a união disjunta das classes de equivalência
em X.
Demonstração. Observe que o lado direito está claramente contido no lado
esquerdo. Reciprocamente, pelo corolário anterior dado x ∈ X existe uma única
classe de equivalência [a] tal que x ∈ [a].
Seja X um conjunto e e ∼ um relação de equivalência em X. Definimos
X := X/ ∼:= {[a] | a ∈ X} como o conjunto das classes de equivalência de ∼ em
X. No caso particular em que X = Z e ∼ é ≡ (mod n), denotamos a classe [a]
de a ∈ Z por a. Neste caso, X é denotado por Z/nZ.
1.9. Lema de Zorn e aplicações

Definição 1.10. Um conjunto M é dito parcialmente ordenado, se existe
uma relação ≤ em M satisfazendo às seguintes condições
4 1. PRELIMINARES
(1) (reflexividade) a ≤ a, para todo a ∈ M.

(2) (Transitividade) Dados a, b, c ∈ M, se a ≤ b e b ≤ c, então a ≤ c.
(3) (Anti-simetria) Dados a, b ∈ M, se a ≤ b e b ≤ a, então a = b.
Esta ordem será dita total, se para quaisquer a, b ∈ M temos a ≤ b ou b ≤ a.
Neste caso dizemos que M é um conjunto totalmente ordenado.
Definição 1.11. Seja M um conjunto parcialmente ordenado. Um elemento

m ∈ M é dito um elemento maximal de M, se dado a ∈ M tal que a ≤ m,
então a = m. Um elemento c ∈ M é dito um limite superior para M, se para
todo a ∈ M temos a ≤ c. O conjunto M é dito indutivo, se todo subconjunto
totalmente ordenado L ⊂ M possui limite superior. Neste caso, M 6= ∅.
Lema 1.12 (lema de Zorn). (ver [?, §69]) Todo conjunto parcialmente orde-
nado indutivo possui elemento máximo.
Lema 1.13 (lema de Krull). Seja R um anel comutativo com unidade. Todo
ideal não nulo a de R está contido em algum ideal maximal m de R.
Demonstração. Considere o conjunto N de todos os ideais b ( R contendo

a. É imediato que este conjunto é parcialmente ordenado com respeito à relação
de inclusão de conjuntos. Seja L ⊂ N um subconjunto totalmente ordenado e
[
C := b.
b∈L
Segue de um exercı́cio do capı́ulo de domı́nios euclideanos que C é um ideal de

R. Além disto, este ideal é próprio, do contrário, existiria b ∈ L tal que 1 ∈ b,
o que contradiria b ( R. Por construção, o ideal C é um limite superior para L.
Em particular, pelo lema de Zorn, existe m elemento máximo de N. Novamente
por construação m é maximal e contém a.
Parte 1
Números Inteiros
CAPı́TULO 2
Algoritmos Euclideanos
O objetivo deste capı́tulo é descrever o algoritmo euclideano que permite

dividir um número inteiro por outro, definir a noção de máximo divisor comum
de números inteiros e provar o algoritmo euclideano estendido que dá uma relação
de dependência linear entre o máximo divisor comum e os números inteiros através
da noção de ideais.
2.1. O algoritmo euclideano para números inteiros

Definição 2.2. Sejam a, b ∈ Z. Dizemos que a divide b ou que b é divisı́vel
por a e denotamos a | b se existe c ∈ Z tal que ac = b.
Proposição 2.3. A divisibilidade satisfaz as seguintes propriedades:

(1) (Cancelamento). Se c 6= 0 e ac | bc, então a | b.
(2) (Transitividade). Se a | b e b | c, então a | c.
Demonstração. (1) Existe α ∈ Z tal que αac = bc, i.e., c(b − αa) = 0. Mas
o produto de dois inteiros é igual a zero implica em que um dos inteiros é nulo.
Observe que c 6= 0, assim b = ac, i.e., a | b.
(2) Existem α, β ∈ Z tais que b = αa e c = βb, substituindo a primeira
igualdade na segunda, obtemos c = βαa, i.e., a | c.
Teorema 2.4 (algoritmo de Euclides). Sejam a, b ∈ Z com b 6= 0. Então

existem q, r ∈ Z tais que
a = bq + r, onde 0 ≤ |r| < |b|.
Se a, b ≥ 0, então q e r são unicamente determinados por a e b.
Demonstração. Suponha inicialmente que a, b ≥ 0. Se a < b tome q = 0 e

r = a. Suponha que a ≥ b. Considere o conjunto S := {k ≥ 1 inteiro | kb > a}.
Este conjunto é um subconjunto não vazio de N. Assim, pelo axioma da boa
ordenação (axioma 1.2) existe q + 1 ∈ S tal que q + 1 ≤ x para todo x ∈ S. Logo
q∈/ S, i.e., a ≥ bq. Seja r := a − bq, portanto 0 ≤ r < (q + 1)b − b = b.
7
8 2. ALGORITMOS EUCLIDEANOS
• Se a < 0 e b > 0, divida a0 := −a por b com quociente q 0 e resto r0 e

tome q := −q 0 e r := −r0 .
• Se a < 0 e b < 0, divida a0 := −a por b0 := −b com quociente q 0 e resto
r0 e tome q := q 0 e r := −r0 .
• Se a > 0 e b < 0, divida a por b0 := −b com quociente q 0 e resto r0 e
tome q := −q e r := r0 .
Para provar a unicidade suponha que
a = bq1 + r1 = bq2 + r2 , onde 0 ≤ r1 , r2 < b.
Basta provar que r1 = r2 , pois neste caso bq1 = bq2 e como b 6= 0, pela propriedade
do cancelamento, q1 = q2 . Suponha r1 < r2 . Neste caso,
r2 − r1 = b(q1 − q2 ) ≥ b, mas r2 − r1 ≤ r2 < b.
Similarmente, não podemos ter r1 > r2 .
2.5. Máximo divisor comum

Definição 2.6. Sejam a, b ∈ Z. Dizemos que d ∈ Z é um máximo divisor
comum de a e b, denotado por mdc(a, b) se
(1) d | a e d | b; (por isto d é dito um divisor comum de a e b.)
(2) Para todo d0 ∈ Z tal que d0 | a e d0 | b, d0 | d.
Observação 2.7. • A noção de mdc está bem definida a menos de

sinal. De fato se e for um outro mdc de a e b, então por (2) e | d e d | e,
ou seja existem α, β ∈ Z tais que d = αe = αβd, portanto αβ = 1, i.e.,
α ∈ {±1}. Assim quando dizemos o mdc de a e b referimo-nos à escolha
de d positiva.
• mdc(a, b) = mdc(−a, −b) (exercı́cio).
• Se b | a, então mdc(a, b) = b (idem).
• Denote por Da,b o conjunto dos divisores comuns positivos de a e b.
Note que para qualquer x ∈ Da,b temos que x ≤ min{a, b}. Assim, este
conjunto é finito. Fica novamente como exercı́cio verificar que mdc(a, b)
é justamente o elemento máximo de Da,b .
Lema 2.8. Sejam a, b ≥ 1 inteiros e a = bq + r onde 0 ≤ r < b a divisão de

a por b. Então mdc(a, b) = mdc(b, r).
2.5. MÁXIMO DIVISOR COMUM 9
Demonstração. Basta mostrar que os conjuntos Da,b e Db,r são coincidem.

De fato, neste caso seus elementos máximos são iguais, o que prova o lema. Seja
e ∈ Da,b , digamos a = eα e b = eβ para α, β ∈ Z. Logo r = a − bq = e(α − βq),
i.e., e | r, i.e., e ∈ Db,r , i.e., Da,b ⊂ Db,r . Seja f ∈ Db,r , digamos b = f β 0 e r = f γ
para β 0 , γ ∈ Z. Então a = bq + r = f (β 0 q + γ), i.e., f | a, i.e., f ∈ Da,b , i.e.,
Db,r ⊂ Da,b .
Teorema 2.9. Sejam a, b ≥ 1 inteiros. Consideremos a seqüência de divisões
sucessivas:
a = bq1 + r1 , 0 < r1 < b
b = r1 q2 + r2 , 0 < r2 < r1
.. ..
(2.9.1) . .
rn−2 = rn−1 qn + rn , 0 < rn < rn−1
rn−1 = rn qn+1 ,
onde rn é o último resto não nulo na seqüência de divisões. Então mdc(a, b) = rn .
Demonstração. Notemos inicialmente que em (2.9.1) terı́amos que ter um
primeiro resto nulo, rn+1 , pois
b > r1 > r2 > · · · ≥ 1
e não existe uma seqüência estritamente descendente infinita de números inteiros
positivos.
Pelo lema anterior aplicado a cada linha de (2.9.1) obtemos
mdc(a, b) = mdc(b, r1 ) = · · · = mdc(rn−1 , rn ).
Mas rn | rn−1 , logo rn = mdc(rn , rn−1 ). A fortiori, rn = mdc(a, b).
Teorema 2.10 (algoritmo euclideano estendido). Sejam a, b ≥ 1 inteiros e
d = mdc(a, b). Existem s, t ∈ Z tais que d = sa + tb.
Demonstração. Começamos com a penúltima linha de (2.9.1),
rn = rn−2 + (−qn )rn−1 ,
tome A1 := −rn−1 e B1 := 1. Da linha seguinte temos
rn−1 = rn−3 + (−qn−1 )rn−2 ,
assim
rn = B1 rn−2 + A1 rn−1 = B1 rn−2 + A1 (rn−3 + (−qn−1 )rn−2 ).
Tome A2 := B1 − A1 qn−1 e B2 := A1 . A linha seguinte nos dá

rn−2 = rn−4 + (−qn−2 )rn−3 .
Substituindo na fórmula anterior,
rn = B2 rn−3 + A2 rn−2 = B2 rn−3 + A2 (rn−4 + (−qn−2 )rn−3 )
Tome A3 := B2 − A2 qn−2 e B3 := A2 . Repetindo o mesmo argumento obtemos
rn = Bn−2 r1 + An−2 r2 .
Mas r2 = b + (−q2 )r1 , donde
rn = Bn−2 r1 + An−2 (b + (−q2 )r1 ),
tome An−1 := Bn−2 − An−2 q2 e Bn−1 := An−2 . Finalmente a primeira divisão nos
dá, r1 = a + (−q1 )b e sustituindo na fórmula anterior obtemos
rn = Bn−1 b + An−1 (a + (−q1 )b).
Basta tomar s := An−1 e t := Bn−1 − An−1 q1 .
2.11. Anéis e ideais

Nesta seção daremos uma outra demonstração (conceitual) do algoritmo eu-
clideano estendido. Para isto precisamos da noção de ideais no conjunto Z dos
números inteiros.
O conjunto Z dos números inteiros possui duas funções. A soma + : Z×Z → Z
de números inteiros (a, b) 7→ a + b que associa ao par (a, b) sua soma a + b. E o
produto de inteiros · : Z × Z → Z dada por (a, b) 7→ ab que associa ao par (a, b)
o seu produto ab. Dados inteiros a, b, c as seguintes propriedades são satisfeitas:
(1) (Associatividade da soma) a + (b + c) = (a + b) + c.
(2) (Comutatividade da soma) a + b = b + a.
(3) (Elemento neutro da soma) a + 0 = 0.
(4) (Inverso da soma) Dado a ∈ Z existe b ∈ Z tal que a+b = 0 e denotamos
b = −a.
(5) (Associatividade do produto) a(bc) = (ab)c.
(6) (Comutatividade do produto) ab = ba.
(7) (Elemento neutro do produto) 1a = a.
(8) (Distributividade do produto em relação à soma) a(b + c) = ab + ac. Por
satisfazer estas propriedades Z é dito um anel comutativo com unidade.
Além disto a seguinte propriedade é satisfeita:
2.11. ANÉIS E IDEAIS 11
(9) (Cancelamento) Se ab = 0, então a = 0 ou b = 0. Por satisfazer esta

propriedade Z é dito um domı́nio de integridade.
Observação 2.12. Poderı́amos perguntar sobre a existência do inverso em Z
com relação ao produto. Ou seja, suponhamos que a, b ∈ Z são tais que ab = 1.
Suponha a ≥ 1. Neste caso b = a1 ∈ Z também é um inteiro positivo, mas a
única possibilidade destra fração ser um número inteiro é a = 1 e neste caso
necessariamente b = 1. Se a < 0, seja a0 = −a e b0 = −b, logo ab = a0 b0 = 1 e
pelo caso anterior a0 = 1 e b0 = 1, i.e., a = b = −1. Assim os únicos números
inteiros que admitem inverso são ±1.
Definição 2.13. Um subconjunto I ⊂ Z de Z é dito um ideal de Z, se as
seguintes condições são satisfeitas:
(1) 0 ∈ I.
(2) (I é fechado com relação à soma) Dados a, b ∈ I, a + b ∈ I.
(3) (I é estável com relação à multiplicação de elementos de Z) Dado a ∈ I
e r ∈ Z, então ra ∈ I.
Fica como exercı́cio mostrar que os seguintes conjuntos são ideais de Z :
• I := 2Z = {2k | k ∈ Z} (o conjunto dos números pares).
• Seja n ≥ 1 inteiro e I := nZ = {nk | k ∈ Z} o conjunto dos múltiplos de
n.
• Sejam n1 , · · · , nk ≥ 1 inteiros. Seja I := n1 Z + . . . + nk Z = {n1 a1 +
. . . + nk ak | a1 , · · · , ak ∈ Z} o conjunto dos números que são somas de
múltiplos de n1 com múltiplos de n2 , etc., com múltiplos de nk .
Proposição 2.14. Todo ideal I 6= (0) de Z é da forma dZ para algum d ≥ 1.
Por isto dizemos que I é um ideal principal e que Z é um domı́nio principal.
Demonstração. Observemos que I ∩ N 6= ∅. Dado a ∈ I, se a ≥ 1 nada há
a fazer. Senão, ou seja, dado a < 0 em I, então −a = (−1)a ∈ I pela propriedade
(3) de ideais, mas −a ≥ 1. Pelo axioma da boa ordenação existe d ∈ I ∩ N tal
que d ≤ k para todo k ∈ I ∩ N. Afirmamos que I = dZ.
De um lado, como d ∈ I, pela propriedade (3) de ideais, para todo k ∈ Z,
dk ∈ I, i.e., dZ ⊂ I. De outro lado, dado a ∈ I, digamos a ≥ 1, pelo algoritmo
euclideano, existem q, r ∈ Z tais que a = qn + r, onde 0 ≤ r < n. Se r > 0, então
r = a + (−q)n ∈ I, pois a, (−q)n ∈ I, mas isto contradiz o fato de d ser o menor
inteiro positivo em I. Assim, r = 0 e n | a, portanto a ∈ nZ. Se a < 0, a mesma
prova mostra que se a0 = −a, d | a0 , logo d | a, e assim I ⊂ nZ.
2.15. Exercı́cios
(1) Seja a ∈ Z. Mostre que a é par se e somente se a2 é par.
(2) Seja n > 1 inteiro. Mostre que:
(a) mdc(n, 2n + 1) = 1.
(b) mdc(2n + 1, 3n + 1) = 1.
(c) mdc(n! + 1, (n + 1)! + 1) = 1.
(3) Sejam n > m ≥ 1 inteiros. Suponha que n = qm + r seja a divisão de
n por m, onde 0 ≤ r < m. Mostre que 2n − 1 = (2m − 1)Q + R, onde
R = 2r − 1 e 0 ≤ R < (2m − 1).
n
(4) Sejam n > m ≥ 1 inteiros. O número F (n) = 22 + 1 é chamado o
n-ésimo número de Fermat. O objetivo deste exercı́cio é mostrar que
mdc(F (n), F (m)) = 1. Faremos isto por etapas.
m+1 m m m
(a) Utilizando que 22 − 1 = (22 + 1)(22 − 1) mostre uqe (22 − 1) |
n
(22 + 1) = F (n). Calcule o quociente desta divisão.
n
(b) Utilize (a) para mostrar que o resto da divisão de F (n) = 22 + 1
m
por F (m) = 22 + 1 é 2.
(c) Utilize (b) para calcular mdc(F (n), F (m)).
(5) Sejam a, b ≥ 1 inteiros. Mostre que mdc(a, b) mmc(a, b) = ab.
CAPı́TULO 3
Fatoração de inteiros
Neste capı́tulo mostramos que todo número inteiro fatora-se de forma única
como produto de números primos
3.1. Existência
Definição 3.2. Seja p ≥ 2 inteiro. Dizemos que p é um número primo, se
para todo inteiro b ≥ 1 tal que b | p, então b = 1 ou b = p, i.e., os únicos divisores
positivos de p são 1 e p. Os números inteiros que não primos são chamados de
números compostos, i.e., n ≥ 1 é composto se e somente se existem 1 < a, b < n
tais que n = ab.
Teorema 3.3 (teorema fundamental da aritmética - primeira versão). Seja

n ≥ 1 inteiro, existem p1 , · · · , pk números primos (não necessariamente distintos)
tais que
n = p 1 · · · pk .
Demonstração. Se n é primo nada há a fazer. Suponhamos que n seja

composto. Todo divisor d de n satisfaz d ≤ n, assim o conjunto dos divisores
positivos de n é finito. Seja p1 o menor divisor positivo de n. Afirmamos que p1
é primo.
Se p1 não fosse primo, terı́amos que existem 1 < a, b < p1 tais que p1 = ab,
em particular a | n, mas isto contradiz a minimalidade de p1 .
Seja n1 := pn1 < n. Se n1 é igual a 1 ou primo, então n = n1 p1 já é a fatoração
procurada. Senão, com o mesmo argumento anterior, o menor divisor positivo
p2 de n1 é primo. Seja n2 := np21 = p1np2 < n1 . Se n2 é igual a 1 ou primo, então
n = n2 p2 p1 é a fatoração procurada. Senão prosseguimos. Note que temos uma
seqüência estritamente decrescente n > n1 > n2 > · · · de inteiros positivos, assim
existe k ≥ 1 tal que nk = 1, i.e., n = p1 · · · pk .
13
14 3. FATORAÇÃO DE INTEIROS
3.4. Unicidade
Lema 3.5. Seja p ≥ 2 um número primo e a, b ∈ Z \ {0}. Se p | ab, então
p | a ou p | b.
Demonstração. Note que dado um número primo p, então mdc(a, p) = 1

equivale a p - a, pois os únicos divisores positivos de p são 1 e p. Suponha
que p - a, i.e., pelo algoritmo euclideano estendido, existem s, t ∈ Z tais que
1 = sa + tp. Multiplicando ambos os lados por b obtemos b = sab + tpb. Mas
ab = αp, pois p | ab, para algum α ∈ Z. Logo b = p(sα + tb), i.e., p | b.
Observação 3.6. O lema anterior pode ser estendido imediatamente para

um produto qualquer de inteiros, i.e., se p | a1 · · · an , então existe 1 ≤ i ≤ n tal
que p | ai .
Teorema 3.7 (teorema fundamental da aritmética - segunda versão). Seja

n ≥ 1 inteiro, então existem únicos números primos
p1 < · · · < pr e inteiros e1 , · · · , er ≥ 1
tais que
n = pe11 · · · perr .
Demonstração. Já provamos anteriormente a existência da fatoração, a-

grupando os primos e colocando-os em ordem temos a expressão acima. Suponha
que existam outros primos
q1 < · · · < qs e inteiros f1 , · · · , fs ≥ 1
tais que
n = pe11 · · · perr = q1f1 · · · qsfs .
Pela observação anterior temos que existe algum 1 ≤ j ≤ s tal que p1 | qj . Mas
ambos são primos, logo p1 = qj . O mesmo argumento acima mostra que existe
1 ≤ i ≤ r tal que q1 = pi . Afirmamos que j = 1. Caso contrário, ou seja j > 1,
q1 = pi ≥ p1 = qj , o que contradiz a ordenação dos números primos q’s. Logo
j = 1. Afirmamos também que e1 = f1 . Suponha, por exemplo, que e1 > f1 .
Neste caso, cancelando pf11 dos dois lados da equação acima obtemos
pe11 −f1 pe22 · · · perr = q2f2 · · · qsfs .

3.10. APLICAÇÕES 15
Repetindo a argumentação anterior obtemos que q2 = pi para algum 1 < i ≤ r.

Mas dessa forma, o fator primo p1 do lado esquerdo não cancelará com nenhum
fator primo do lado direito. Portanto, e1 = f1 .
Isto nos fornece a igualdade
pe22 · · · perr = q2f2 · · · qsfs .
Pelo mesmo argumento anterior, p2 = q2 e e2 = f2 . Assim sucessivamente con-
cluimos que o número de fatores primos em ambos os lados é igual, i.e., r = s e
para cada 1 ≤ i ≤ r, pi = qi e ei = fi .
3.8. MDC e fatoração

Proposição 3.9. Sejam a, b ≥ 1 inteiros,
a = pe11 · · · pekk e b = pf11 · · · pfkk
suas fatorações, com ei , fi ≥ 0 para 0 ≤ i ≤ k. Seja gi = min{ei , fi } e
d = pg11 · · · pgkk .
Então d = mdc(a, b).
Demonstração. Notemos que d é um divisor comum de a e b, pois

a = dpe11 −g1 · · · pkek −gk e b = dpf11 −g1 · · · pkfk −gk ,
uma vez que para cada i, fi − gi , ei − gi ≥ 0. Seja d0 ≥ 1 um divisor comum de a
e b, i.e.,
d = ph1 1 · · · phk k
para 0 ≤ hi ≤ ei , fi . Em particular, hi ≤ gi . Assim,
d = d0 pg11 −h1 · · · pkgk −hk .

3.10. Aplicações
√
Proposição 3.11. Seja p ≥ 2 um número primo. Então p∈
/ Q.
Demonstração. Seja x ∈ Q \ {0}. Então x = ab com a, b ∈ Z \ {0}. Note

que a = da0 e b = db0 , onde d = mdc(a, b) e que mdc(a0 , b0 ) = 1. Simplificando
0
d obtemos que x = ab0 . Assim, dividindo pelo mdc, suporemos sempre que dado
um número x ∈ Q \ {0}, x é da forma ab com mdc(a, b) = 1.
√ √
Suponha que p ∈ Q, i.e., existem a, b ∈ Z tais que p = ab e mdc(a, b) = 1.
Logo a2 = pb2 e p | a2 . Pelo lema 3.5 concluimos que p | a, digamos a = pα, para
algum α ∈ Z. Substituindo na igualdade anterior concluimos que p2 α2 = pb2 ,
i.e., pα2 = b2 . Mas isto implica em p | b2 . Novamente, pelo lema 3.5, obtemos
que p | b, mas isto é impossı́vel pois mdc(a, b) = 1.
Definição 3.12. Seja n ≥ 1 inteiro. Dizemos que n é livre de quadrados se

sua fatoração é da forma
n = p1 · · · pk .
Lema 3.13. Seja n ≥ 1 inteiro, então existem Q, a ≥ 1 inteiros tais que

n = a2 Q, onde Q é livre de quadrados.
Demonstração. Fatoramos n como

n = pe11 · · · pekk .
Pelo algoritmo euclideano, para cada 1 ≤ i ≤ k, existem qi , ri ∈ Z tais que
ei = 2qi + ri , onde 0 ≤ ri < 2. Assim
n = p2q1 r1 2qk rk
1 p1 · · · p k pk
e tomando Q := pr11 · · · prkk , excluindo os primos com expoente zero, temos que Q
é livre de quadrados. O que sobra é a2 com a := pq11 · · · pqkk , i.e., n = a2 Q.
√
Proposição 3.14. Seja n ≥ 1 inteiro livre de quadrados, então n ∈ / Q.
√
Demonstração. Suponha que n = ab com a, b ∈ Z e mdc(a, b) = 1. Seja
n = p1 · · · pk
a fatoração de n. Então
a2 = p 1 · · · p k b 2 .
Logo para cada 1 ≤ i ≤ r temos que pi | a2 . Pelo lema 3.5 concluimos que pi | a,
digamos a = pi αi para αi ∈ Z. Substituindo na igualdade anterior obtemos
p2i αi2 = p1 · · · pk b2 .
Simplificando pi na igualdade acima, obtemos
pi αi2 = p1 · · · pi−1 pi+1 · · · pk b2 = cb2 ,
onde c := p1 · · · pi−1 pi+1 · · · pk . Como pi - c, pois pi não pode dividir nenhum dos
fatores de c uma vez que p1 < · · · < pk , ou seja são todos distintos, concluimos
que pi | b2 . Novamente pelo lema 3.5 temos que pi | b, o que contradiz mdc(a, b) =
1.
√
Proposição 3.15. Seja f ≥ 2 inteiro e p ≥ 2 primo. Então f p∈
/ Q.
√ a
Demonstração. Suponha que f p= b
com a, b ∈ Z e mdc(a, b) = 1. Então
af = pbf
e p | af . Pela observação 3.6 concluimos que p | a, digamos a = pα. Substituindo

na igualdade anterior obtemos
pf αf = pbf ,
simplificando a igualdade anterior por p, concluimos que
pf −1 αf = bf .
Como f ≥ 2 temos que p aparece na fatoração do lado esquerdo, em particular,

p | bf . Novamente, pela observação 3.6 concluimos que p | b, mas isto contradiz
mdc(a, b) = 1.
Definição 3.16. Sejam n ≥ 1 e f ≥ 2 inteiros. Dizemos que n é livre de

f -potências se a fatoração de n é da forma
n = pe11 · · · pekk
com 1 ≤ ei < f para todo 1 ≤ i ≤ k.
Lema 3.17. Seja n ≥ 1 inteiro, então existem Q, a ≥ 1 inteiros tais que

n = af Q com Q livre de f -potências.
Demonstração. Seja
n = pe11 · · · pekk
a fatoração de n. Pelo algoritmo euclideano, para cada 1 ≤ i ≤ k, existem
qi , ri ∈ Z tais que ei = f qi + ri , onde 1 ≤ ei < f . Assim escrevemos
n = pf1 q1 pr11 · · · pfk qk prkk .
Como anteriormente Q := pr11 · · · prkk é livre de f -potências e tomando a :=

pq11 · · · pfkk concluimos que n = af Q.
Proposição 3.18. Sejam n ≥ 1 e f ≥ 2 inteiros. Suponhamos que n seja

√
livre de f -potências. Então f n ∈
/ Q.
n = pe11 · · · pekk
√ a
a fatoração de n, onde 1 ≤ ei < f para todo i ≤ i ≤ k. Suponhamos que f
n= b
com a, b ∈ Z e mdc(a, b) = 1. Então
af = pe11 · · · pekk bf .
Logo para cada 1 ≤ i ≤ k pi | af . Pela observação 3.6 concluimos que pi | a,
digamos a = pi αi para αi ∈ Z. Substituindo na igualdade anterior obtemos
pfi αif = pe11 · · · pekk bf .
Cancelando pei i em ambos os lados da igualdade acima e denotando
e e
c := pe11 · · · pi−1
i−1 i+1
pi+1 · · · pekk ,
obtemos
pfi −ei αif = cbf .
Como anteriormente pi - c uma vez que pi não divide nenhum fator de c. Logo
pi | bf . Novamente pela observação 3.6 concluimos que pi | b, mas isto contradiz
mdc(a, b) = 1.
3.19. Funções aritméticas elementares

Para todo número inteiro n ≥ 1 denotemos por ν(n) o número de divisores
inteiros positivos de n e por σ(n) a soma de todos estes divisores, i.e.,
X
ν(n) := #{d ≥ 1 | d | n} e σ(n) := d.
d≥1,d|n
Utilizaremos a fatoração única para obter fórmulas explı́citas para estes dois nú-
meros.
Proposição 3.20. Seja n = pa11 · · · par r a fatoração de n em números primos.
Então
pa1 +1 − 1 par +1 − 1
ν(n) = (a1 + 1) · · · (ar + 1) e σ(n) = 1 ··· r .
p1 − 1 pr − 1
Demonstração. Note que d | n se e somente se d fatora-se como
d = pb11 · · · pbrr com 0 ≤ bi ≤ ai para todo 1 ≤ i ≤ r.
Assim, os divisores positivos de n correspondem bijetivamente as r-uplas (b1 , · · · , br )
satisfazendo a 0 ≤ bi ≤ ai para todo 1 ≤ i ≤ r. A quantidade destas r-uplas é
exatamente (a1 + 1) · · · (ar + 1).
3.19. FUNÇÕES ARITMÉTICAS ELEMENTARES 19
Para a segunda igualdade observe que

! !
X X X
σ(n) = p1b1 · · · pbrr = pb11 ··· pbrr
(b1 ,··· ,br ) b1 br
e que cada soma no segundo membro é a soma dos termos de uma progressão
geométrica, disto segue a fórmula para σ(n).
3.20.1. Função de Mœbius. Definimos a função de Mœbius µ : N \ {0} →

Z por µ(1) := 1, µ(n) := 0, se n não é livre de quadrados, caso contrário, i.e.,
n = p1 · · · pr , onde os pi ’s são primos distintos definimos µ(n) := (−1)r .
Proposição 3.21. Se n > 1, então

X
µ(d) = 0.
d≥1,d|n
Demonstração. Seja n = pa11 · · · par r a fatoração de n. Pela definição de µ

temos que
X X
µ(d) = µ(p11 . . . prr ),
d≥1,d|n (1 ,··· ,r )
onde os i ’s são 0 ou 1. Portanto,

X r r
µ(d) = 1 − r + − + . . . + (−1)r = (1 − 1)r = 0.
2 3
d≥1,d|n

Para entender melhor a função de Mœbius precisamos introduzir a multi-
plicação de Dirichlet. Sejam f, g : N \ {0} → C, definimos
X
f ◦ g(n) := f (d1 )g(d2 ).
d1 ,d2 ≥1,d1 d2 =n
Este produto é associativo. Isto segue do seguinte exercı́cio

X
f ◦ (g ◦ h)(n) = (f ◦ g) ◦ h(n) = f (d1 )g(d2 )h(d3 ).
d1 ,d2 ,d3 ≥1,d1 d2 d3 =n
Definimos a função 1 : N \ {0} → Z por 1(1) := 1 e 1(n) := 0, se n > 1.

Segue da definição que para toda função f : N \ {0} → C temos f ◦ 1 = 1 ◦f = f .
Defina também a função I : N \ {0} → Z por I(n) := 1 para todo n. Novamente,
P
por esta definição obtemos f ◦ I(n) = I ◦ f (n) = d≥1,d|n f (d).
Lema 3.22. I ◦ µ = µ ◦ I = 1.
Demonstração. É claro que µ ◦ I(1) = µ(1)I(1) = 1. Se n > 1, então

P
µ ◦ I(n) = d≥1,d|n µ(d) = 0. A prova para I ◦ µ é idêntica.
Teorema 3.23 (teorema de inversão de Mœbius). Seja

X
F (n) := f (d).
d≥1,d min d
Então
X
f (n) = µ(d)F (n/d).
d≥1,d|n
Demonstração. Por definição F = f ◦ I. Logo, F ◦ µ = (f ◦ I) ◦ µ =

f ◦ (I ◦ µ) = f ◦ 1 = f , i.e.,
X
f (n) = F ◦ µ(n) = µ(d)F (n/d).
d≥1,d|n

O teorema de inversão de Mœbius tem diversas aplicações, dentre elas a função
φ de Euler definida da seguinte forma. Seja n ≥ 1 inteiro, φ(n) denota o número
de inteiros positivos d ≤ n tais que mdc(d, n) = 1. É claro que se p for um
número primo φ(p) = p − 1.
Proposição 3.24.
X
φ(d) = n
d≥1,d|n
Demonstração. Consideremos as n frações 1/n, 2/n, · · · , (n − 1)/n, n/n.

Podemos reduzir cada uma delas a forma mı́nima cancelando os fatores primos
comuns do numerador e denominador. Assim, cada uma delas será igual a uma
fração a/b com mdc(a, b) = 1. Os denominadores serão sempre divisores de n.
O número de frações na forma mı́nima com denominador d, pela definição da
função φ, é igual a φ(d). Disto segue a proposição.
Proposição 3.25. Se n = pa11 . . . par r , então

1 1
φ(n) = n 1 − ... 1 − .
p1 pr
Demonstração. Como
X
n= φ(d),
d≥1,d|n
3.19. FUNÇÕES ARITMÉTICAS ELEMENTARES 21
pelo teorema de inversão de Mœbius temos

X Xn X n
φ(n) = µ(d)n/d = n − + + ...
i
p i i<j
p i p j
d≥1,d|n

1 1
=n 1− ... 1 −
p1 pr − 1

CAPı́TULO 4
Indução finita
Neste capı́tulo apresentamos o método da indução finita. Este método é

utilizado em diversas circunstâncias em matemáticas para provar afirmativas que
dependem “indutivamente” dos números naturais.
4.1. Enunciados
Axioma 4.2 (princı́pio da indução finita na sua primeira forma). Seja A(n)
uma afirmativa sobre números naturais n ∈ N. Suponha que
(1) exista n0 ∈ N tal que A(n0 ) seja verdadeira.
(2) Dado k ≥ n0 , toda vez que A(k) for verdade, então A(k + 1) também o
será.
Então para todo n ≥ n0 a afirmativa A(n) é verdadeira.
Axioma 4.3 (princı́pio da indução finita na sua segunda forma). Seja A(n)
uma afirmativa sobre números naturais n ∈ N. Suponha que
(1) exista n0 ∈ N tal que A(n0 ) seja verdadeira.
(2) Se A(k) é verdadeira para todo n0 ≤ k < n então A(n) também é
verdadeira.
Logo para todo n ≥ n0 a afirmativa A(n) é verdadeira.
4.4. Exemplos da indução na sua primeira forma

Exemplo 4.5. Para todo inteiro n ≥ 1 temos
n
X n(n + 1)
i= .
i=1
2
1.2
Demonstração. (1) Para n = 1 temos que 1 = 2
.
Pn
(2) Suponha que i=1 i = n(n+1)
2
. Então
n+1 n
X X n(n + 1) (n + 1)(n + 2)
i= i + (n + 1) = + (n + 1) = .
i=1 i=1
2 2
23
24 4. INDUÇÃO FINITA
Lema 4.6. Seja p um número primo e 1 ≤ i < p inteiro, então o binomial

p

i
é divisı́vel por p.
Demonstração. Por definição

p p(p − 1) · · · (p − i + 1)
= ∈ Z.
i i(i − 1) · · · 1
Note que p não divide nenhum dos fatores do denominador, pois i < p. Logo
podemos colocar p para fora da fração e o que sobra
(p − 1) · · · (p − 1 + i)
i(i − 1) · · · 1
também é inteiro.
Exemplo 4.7. Seja p um número primo. Para todo inteiro n ≥ 1 temos que
p divide np − n.
Demonstração. (1) Para n = 1 temos que p divide 1p − 1 = 0.

(2) Suponha que p | (np − n). Então
p−1
p
X p i
(n + 1) − (n + 1) = n + (np − n).
i=1
i
Pelo Lema 4.6 e pela hipótese de p | (np − n) concluimos que p | ((n +

1)p − (n + 1)).

Teorema 4.8 (pequeno teorema de Fermat). Seja p um número primo e

a ∈ Z. Então p | (ap − a).
Demonstração. O exemplo mostra o teorema para inteiros positivos. Seja

m < 0 inteiro, digamos m = −n para n ≥ 1. Suponha p > 2. Neste caso,
mp − m = (−n)p − (−n) = −(np − n) que é divisı́vel por p. No caso de p = 2
temos que se n2 − n = 2α, então m2 − m = n2 + n = n + 2α + n = 2(α + 1).
Observação 4.9. O teorema anterior é na verdade equivalente para um in-

teiro a não divisı́vel por p a p | (ap−1 − 1). De fato, suponha que ap − a =
a(ap−1 − 1) = αp para α ∈ Z. Se p - a, então pelo Lema 3.5 concluimos que
p | (ap−1 − 1).
4.10. EXEMPLOS DA INDUÇÃO FINITA NA SUA SEGUNDA FORMA 25
4.10. Exemplos da indução finita na sua segunda forma

Ordenamos os números primos
p1 = 2 < p2 = 3 < p3 = 5 · · · < pn · · · ,
onde pn denota o n-ésimo número primo. Seja P o conjunto dos números primos.
Teorema 4.11 (Euclides). O conjunto P é infinito.
Demonstração. Suponhamos que P seja finito, digamos com k elementos,
P = {p1 < · · · < pk }.
Seja
M := p1 · · · pk + 1.
Notemos que M > p1 · · · pk ≥ 2pk > pk , logo M tem que ser um número com-
posto. Pelo teorema fundamental da aritmética M é produto de números primos.
Logo os únicos primos que podem aparecer na sua fatoração são p1 , · · · , pk , di-
gamos que pi | M , i.e., existe αi ≥ 1 inteiro tal que M = αi pi . Retornando à
definição de M obtemos
pi (αi − p1 · · · pi−1 pi+1 · · · pk ) = 1.
Os fatores do lado esquerdo são ambos inteiros, o primeiro é positivo e o produto é

positivo. Logo a expressão entre parênteses é positiva. Por outro lado pi ≥ 2, logo
o lado esquerdo é pelo menos 2, enquanto o lado direito é 1, o que é impossı́vel.
A contradição vem do fato de termos suposto P finito, portanto P é infinito.
No próximo capı́tulo daremos outras demonstrações deste teorema bem como

discutiremos em maior profundidade os números primos.
n
Exemplo 4.12. Para todo inteiro n ≥ 1 temos pn ≤ 22 .
Demonstração. (1) Observe que p1 = 2 ≤ 22 = 4.

m
(2) Suponha que para todo 1 ≤ m < n tenhamos pm ≤ 22 . A demons-
tração do teorema de Euclides mostra que M := p1 · · · pn−1 + 1 não pode
ser divisı́vel por nenhum dos primos p1 , · · · , pn−1 . Logo M só pode ser
divisı́vel por primos maiores que pn−1 , em particular, pn ≤ M . Assim,
2
pn ≤ p1 · · · pn−1 + 1 ≤ 22 + . . . 2n−1 + 1.
26 4. INDUÇÃO FINITA
n−1
Mas 22 + . . . + 2n−1 = 2(1 + . . . + 2n−2 ) = 2 2 2−1−1 = 2n − 2. Portanto,
n n n n n
pn ≤ 22 −2 +1. Basta mostrar que 22 −2 +1 ≤ 22 , i.e., 4 ≤ 22 +2 −22 =
n
22 (4 − 1), o que é verdade.

Exemplo 4.13 (algoritmo de Euclides). Seja b ≥ 1 inteiro. Para todo inteiro

n ≥ 1 existem q, r ∈ Z tais que n = bq + r para 0 ≤ r < n.
Demonstração. (1) Se n < b tome q = 0 e r = n. Se n = b tome
q = 1 e r = 0.
(2) Suponhamos que n > b. Então 1 ≤ n − b < n. Por hipótese de indução,
para todo 1 ≤ m < n existem qm , rm ∈ Z tais que m = bqm + rm , onde
0 ≤ rm < n. Em particular, existem q 0 , r0 ∈ Z tais que n − b = q 0 b + r0
onde 0 ≤ r0 < b. Logo n = (q 0 + 1)b + r0 e basta tomar q = q 0 + 1 e r = r0 .

CAPı́TULO 5
Números primos
No capı́tulo anterior provamos que o conjunto dos números primos é infi-

nito. Daremos 3 outras demonstrações para este fato. Cada qual tem seu mérito
próprio. A prova apresentada no capı́tulo sobre indução finita é a original de
Euclides. Provaremos também que existe uma infinidade de números primos em
certas progressões aritméticas e que funções polinomiais não lineares produzem
uma infinidade de números compostos.
5.1. Infinidade de primos

Seja P o conjunto dos números primos.
Teorema 5.2 (Euclides). O conjunto P é infinito.
2a. Demonstração. Suponhamos que P seja finito, digamos P = {p1 , · · · ,

pk }. Seja n ≥ 1 inteiro. Pelo Lema 3.13, n = mQ2 , com m, Q ≥ 1 inteiros e m
livre de quadrados. Por um lado a quantidade de números inteiros positivos até
n é exatamente n. Por outro, m = pe11 · · · pekk , onde ei ∈ {0, 1}, para 1 ≤ i ≤ k.
Assim, escolher m é equivalente a escolher os expoentes ei , e como tenho duas
escolhas para cada i, o número de escolhas possı́veis para m é no máximo 2k .
√
Observemos também que Q ≤ n, logo o número de escolhas para Q é no
√ √
máximo n, portanto, o número de escolhas para n é no máximo 2k n, i.e.,
√ √
n ≤ 2k n, i.e., n ≤ 2k , i.e., n ≤ 22k . Mas k é fixo, é a cardinalidade do
conjunto de números primos, e n é um inteiro qualquer, i.e., estamos mostrando
que o conjunto dos inteiros positivos é limitado, o que é impossı́vel. Portanto, P
é infinito.
n
3a. Demonstração. Seja F (n) := 22 + 1 o n-ésimo número de Fermat.
Mostramos anteriormente (exercı́cio do capı́tulo sobre algoritmo de Euclides) que
se n > m ≥ 1, então mdc(F (n), F (m)) = 1. Começamos escolhendo um fator
primo q1 de F (1). Pelo resultado anterior, todo fator primo de F (2) é distinto de
q1 , escolhemos um destes fatores primos, digamos q2 . Suponhamos que para todo
27
28 5. NÚMEROS PRIMOS
1 ≤ m < n tenhamos escolhido para cada F (m) um fator primo distinto. Nova-
mente pelo resultado anterior todo fator primo de F (n) é distinto de q1 , · · · , qn−1 ,
escolhemos um destes fatores primos, digamos qn . Provamos assim (via a Indução
na sua segunda forma) que para todo n ≥ 1 temos um número primo qn fator
de F (n) distinto de q1 , · · · , qn−1 . Produzimos assim um subconjunto infinito
{q1 , · · · , qn , · · · } ⊂ P de P. Em particular, P é infinito.
Uma quarta demonstração é conseqüência do seguinte teorema.
Teorema 5.3 (*). A série
X1
p∈P
p
diverge.
Para a noção de divergência de série veja [?, Capı́tulo IV].
Demonstração. Sejam n ≥ 1 inteiro e p1 , · · · , pl(n) os números primos me-
nores ou iguais a n. Seja
l(n)
Y 1
λ(n) := .
i=1
1 − p i
Segue das Preliminares que

1 X 1
= ,
1 − pi a ≥0 pai i
i
logo
X 1
λ(n) = al(n) ,
pa1
(a1 ,··· ,al(n) ) 1
. . . pl(n)
onde a l(n)-upla (a1 , · · · , al(n) ) é formada de inteiros não negativos. Em particu-
lar, como
1 1
1 + + . . . + < λ(n),
2 n
concluimos que λ(n) → ∞ quando n → ∞ (ver [?, Capı́tulo IV, Exemplos 23]).
Em particular, P é um conjunto infinito.
Calculando o logartimo de λ(n) (ver Preliminares) obtemos
l(n) l(n)
X X X 1
log(λ(n)) = − log(1 − pi ) =
i=1 i=1 m≥1
mpmi
l(n)
1 1 XX 1
= + ... + + .
p1 pl(n) i=1 m≥2 mpm
i
5.4. PRIMOS EM PROGRESSÕES ARITMÉTICAS 29
Note que
X 1 X 1 1 1 2
m
< m
= 2 −1 ≤ 2 .
m≥2
mpi p
m≥2 i
pi 1 − pi pi
Logo, !
1 1 1 1
log(λ(n)) < + ... + +2 2
+ ... + 2 .
p1 pl(n) p1 pl(n)
Segue de [?, Capı́tulo IV, Exemplo 29] que n≥1 n−2 converge, a fortiori o mesmo
P
vale para i≥1 p−2 −1

P P
i . Dessa forma, se p∈P p convergisse, existiria uma cons-
M
tante M tal que log(λ(n)) < M , i.e., λ(n) < e , mas λ(n) → ∞, quando n → ∞.
Assim, p∈P p−1 não pode convergir.
P

5.4. Primos em progressões aritméticas

Nos próximos 3 parágrafos procuramos estudar fórmulas “simples” que “ca-
racterizem” os números primos. Na verdade procuramos funções f : N → N cuja
imagem contenha “muitos” números primos. Começaremos pela função linear,
digamos f (n) = an + b com a, b ≥ 1 inteiros. Note que f (N) é uma progressão
aritmética com primeiro elemento a + b e razão b.
Lema 5.5. Existem infinitos números primos da forma 4n + 3 com n ≥ 1

inteiro.
Demonstração. Seja p > 2 um número primo. Comecemos analisando os

possı́veis restos da divisão de p por 4. Pelo algoritmo da divisão existem q, r ∈ Z
tais que p = 4q + r com 0 ≤ r < 4. Como p é primo as únicas possibilidades para
r são 1 e 3.
Seja P4,3 o conjunto dos números primos maiores ou iguais a 7 da forma 4n+3.
Suponha que P4,3 seja infinito, digamos P4,3 = {p1 < · · · < pk }. Seja
M := 4p1 · · · pk + 3.
Observe que M deixa resto 3 na divisão por 4. Observe também que M >
4p1 · · · pk > 4pk > pk , logo (como pk é o maior número primo que deixa resto 3
na divisão por 4) M é composto. Pelo teorema fundamental da aritmética M
fatora-se em um produto de primos.
Note que se a, b ≥ 1 são inteiros que deixam resto 1 na divisão por 4, então o
mesmo ocorre para ab. De fato, se a = 4x + 1, b = 4y + 1, então
ab = 4(4xy + x + y) + 1.
Fica como exercı́cio verificar (utilizando a primeira forma da indução finita) que
o mesmo vale para um produto finito a1 · · · an de inteiros positivos cada qual
deixando resto 1 na divisão por 4.
Assim, não é possı́vel que todo fator de M deixe resto 1 na divisão por 4,
i.e., existe algum 1 ≤ i ≤ k tal que pi | M , i.e., M = pi αi para αi ≥ 1 inteiro.
Retornando à definição de M obtemos
pi (αi − 4p1 · · · pi−1 pi+1 · · · pk ) = 3.
No lado esquerdo temos um produto de um número inteiro positivo por outro cujo
produto também é um inteiro positivo, logo o número inteiro entre parentêses é
um inteiro positivo. Como p1 ≥ 7, o lado esquerdo é pelo menos 7, o que é
impossı́vel. Portanto P4,3 é infinito.
Lema 5.6. Existem infinitos números primos da forma 6n + 5 com n ≥ 1

inteiro.
Demonstração. Seja p > 2 um número primo. Pelo algoritmo da divisão

existem q, r ∈ Z tais que p = 6q + r com 0 ≤ r < 6. Como p é primo, r só pode
ser 1 ou 5.
Seja P6,5 o conjunto dos números primos maiores ou iguais a 11 da forma 6n+5
para n ≥ 1 inteiro. Suponha que P6,5 seja finito, digamos P6,5 = {p1 < · · · < pk }.
Seja
M := 6p1 · · · pk + 5.
Note que M deixa resto 5 na divisão por 6. Note também que M > 6p1 · · · pk >
6pk > pk . Como pk é o maior número primo que deixa resto 5 na divisão por 6
obtemos que M é composto.
Observe que se a, b ≥ 1 são inteiros que deixam resto 1 na divisão por 6, então
o mesmo ocorre com ab. De fato, se a = 6x + 1, b = 6y + 1, então
ab = 6(6xy + x + y) + 1.
Fica como exercı́cio mostrar que o mesmo vale para um produto finito a1 · · · an
de inteiros positivos cada qual deixando resto 1 na divisão por 6.
Assim não é possı́vel que todo fator de M deixe resto 1 na divisão por 6, i.e.,
existe 1 ≤ i ≤ k tal que pi | M , M = pi αi para αi ≥ 1 inteiro. Retornando à
definição de M obtemos
pi (αi − 6p1 · · · pi−1 pi+1 · · · pk ) = 5.

5.7. INFINIDADE DE COMPOSTOS POR FUNÇÕES POLINOMIAIS 31
No lado esquerdo temos um produto de um número inteiro positivo por outro cujo
produto também é um inteiro positivo, logo o número inteiro entre parentêses é
um inteiro positivo. Como p1 ≥ 11, o lado esquerdo é pelo menos 11, o que é
impossı́vel. Portanto P6,5 é infinito.
No parágrafo sobre função zeta a seguir enunciaremos um teorema devido a

Dirichlet que generaliza os dois lemas anteriores.
5.7. Infinidade de compostos por funções polinomiais

Queremos agora analisar o que ocorre se a função considerada anteriormente
for polinomial. Veremos que em geral o fenômeno se contrapõe ao caso linear, ou
seja, é possı́vel apenas garantir uma infinidade de números compostos na imagem
de f .
Teorema 5.8. Seja
f (n) := ad n+ ad−1 nd−1 + . . . + a1 n + a0 ,
onde ad , · · · , a0 ∈ Z com ad > 0. Então existem infinitos números compostos da

forma f (n).
Demonstração. Se para todo n ≥ 1, f (n) for composto nada há a fazer.

Caso contrário, seja n0 ∈ N tal que f (n0 ) = p número primo. Seja h ≥ 1 inteiro
e
f (n0 + hp) = ad (n0 + hp)d + ad−1 (n0 + hp)d−1 + . . . + a1 (n0 + hp) + a0 .
Note que a soma dos termos constantes (considerando a expressão acima como
um polinômio em h) é igual a
ad nd0 + ad−1 n0d−1 + . . . + a1 n0 + a0 = p.
Logo,
f (n0 + hp) = p(1 + a1 h + a2 (2n0 h + h2 p) + . . .

+ ad−1 ((d − 1)nd−2
0 h + . . . + (d − 1)n0 h
d−2 d−3
p + hd−1 pd−2 )
+ ad (dnd−1
0 h + . . . + dn0 h
d−1 d−2
p + hd pd−1 )).
Observe que o termo lı́der da expressão acima como polinômio em h é igual a

ad pd−1 p > 0. Assim para um inteiro h ≥ 1 suficiente grande a expressão entre
parênteses do lado direito menos 1 é sempre positiva, portanto f (n0 + hp) =
p(1 + α) com α ≥ 1 inteiro. Em particular, f (n0 + hp) é sempre composto para

todo h ≥ 1 suficientemente grande.
Para o caso d = 2 a cota para h é h > −(2an0 + b)/(ap) (faça a conta neste
caso!).
5.9. Números de Fermat e Mersenne

Nesta seção apresentamos os números de Fermat e Mersenne e começamos a
discussão de quando podem ser números primos. No capı́tulo subseqüente sobre
aplicações da teoria de grupos à aritmética elementar descreveremos de forma
mais precisa critérios para decidir quando estes números são primos.
n
Para todo n ≥ 1 inteiro seja F (n) := 22 + 1 o n-ésimo número de Fermat.
Fermat afirmava que todo número desta forma era primo. Na verdade o que deve
ter ocorrido é que ele calculou os quatro primeiros que realmente são. Entretanto,
Euler mostrou que 641 | F (5). Daremos uma demonstração disto posteriormente.
Para todo n ≥ 1 inteiro seja M (n) := 2n − 1 o n-ésimo número de Mersenne.
Lema 5.10. Se n é composto, então M (n) também é composto.
Demonstração. Suponha que n = ab com 1 < a, b < n. Então
2n − 1 = (2a )b − 1 = (2a − 1)(2a(b−1) + 2a(b−2) + . . . + 2a + 1)
o que mostra que M (a) | M (n).
Observação 5.11. Se quisermos que um número de Mersenne seja primo,

devemos nos restringir àqueles números de Mersenne cujo ı́ndice n seja um número
primo. Mersenne produziu uma lista incompleta e incorreta de M (p)’s para p
primo tais que M (p) é primo. Novamente, produziremos a posteriori uma lista
ocrreta, a menos da complexidade computacional, utilizando teoria de grupos.
5.12. Contando números primos

Para todo número real x > 1 seja π(x) := #{p | número primo com p ≤ x}.
O teorema de Euclides nos garante que limx→∞ π(x) = ∞ (para a noção de limite
veja [?, capı́tulo IV]). Nosso objetivo é determinar uma estimativa elementar para
a função π(x) que conta a quantidade de números primos menores ou iguais a
um dado número real maior que 1. Note que se 1 < x ≤ y, então π(x) ≤ π(y).
Seja pn o n-ésimo número primo. Então π(pn ) = n.
5.12. CONTANDO NÚMEROS PRIMOS 33
Proposição 5.13. Seja log(x) o logaritmo na base e. Então
π(x) ≥ log(log(x)).
Demonstração. Já obtivemos anteriormente (via indução finita) que pn ≤

2n m
2 . Para todo x > 1 real fixado o conjunto {m ≥ 1 | inteiro, ee ≤ x} é finito.
n−1 n
Seja n − 1 seu maior elemento, i.e., ee ≤ x < ee . Observe que
n−1 n
ee ≥ 22 para n ≥ 4.
De fato, basta mostrar que
en−1 ≥ 2n log(2), ou seja , n − 1 ≥ n log(2) + log(log(2)),
o que é verdade pois log(2) < 1. Logo

n−1 n
π(x) ≥ π(ee ) ≥ π(22 ) ≥ π(pn ) = n ≥ log(log(x)).
Utilizaremos o método da segunda demonstração do teorema de Euclides para

refinar à proposição anterior. Para todo inteiro n ≥ 1 seja γ(n) o conjunto dos
divisores primos de n.
Proposição 5.14. Suponha que x ≥ 2 seja um inteiro, então :

log(x)
π(x) ≥ .
2 log(2)
Demonstração. Para qualquer conjunto de números primos S denotamos
por fS (x) o número de inteiros positivos n ≤ x tais que γ(n) ⊂ S. Suponha que
S seja finito de cardinalidade t. Escrevemos n = m2 s com s livre de quadrados.
√
Note que m ≤ x. Além disto temos no máximo 2t escolhas para s. Portanto,
√
fS (x) ≤ 2t x. Seja m := π(x), assim pm+1 > x. Se S = {p1 , · · · , pm }, então
√
fS (x) = dxe. Em particular, x ≤ 2π(x) x e disto segue a proposição.
O método acima nos dá uma nova demonstração do teorema 5.3. De fato, se
P
p∈P 1/p fosse convergente, então existiria n ≥ 1 tal que
X 1 1
< .
p
j>n j
2
Seja S := {p1 , · · · , pn } e x ≥ 1 inteiro. Então x − fS (x) é igual ao número de

inteiros positivos m ≤ x tais que γ(m) 6⊂ S. Em outras palavras, contamos o
número de inteiros 1 ≤ m ≤ x para os quais existe j > n tal que pj | m. Para

cada primo pj existem dx/pj e múltiplos de pj menores ou iguais a x. Portanto,
X x X x x
x − fS (x) ≤ ≤ < .
j>n
pj p
j>n j
2
√ √
A fortiori, fS (x) ≥ x/2. Mas, fS (x) ≤ 2n x. Logo, 2n ≥ x/2, o que é
impossı́vel pois n é fixo e x é variável.
Intimamente relacionada à função π(x) temos a seguinte função
X
θ(x) := log(p).
p∈P,p≤x
Utilizaremos θ(x) para limitar π(x). Seja θ(1) := 0.
θ(x) < (4 log(2))x.
Demonstração. Considere o binomial

2n (n + 1) . . . 2n
= .
n 1.2 . . . n
Este número é um inteiro divisı́vel por todo número primo n < p < 2n. Além
disto, como
2n
2n
X 2n 2n 2n
(1 + 1) = , então 2 > .
j=0
j n
Em conseqüência,
2n 2n Y
2 > > p.
n n<p<2n
Calculando o logartimo,
X
2n log(2) > log(p) = θ(2n) − θ(n).
n<p<2n
Somando esta relação para n = 1, 2, 4, · · · , 2m−1 obtemos
θ(2m ) < log(2)(2m+1 − 2) < log(2)2m+1 .
Como na demonstração da proposição 5.13 existe m ≥ 1 tal que 2m−1 < x ≤ 2m ,

donde
θ(x) ≤ θ(2m ) < log(2)2m+1 = (4 log(2))2m−1 < (4 log(2))x.

5.12. CONTANDO NÚMEROS PRIMOS 35
Proposição 5.16. Existe um real c1 > 0 tal que para todo x ≥ 2 real tenha-
mos :
x
π1 (x) < c1 .
log(x)
Demonstração. Observe que
X √ √ √ √ √
θ(x) ≥ log(p) ≥ log( x)(π(x) − π( x)) ≥ log( x)π(x) − x log( x).
√
x<p≤x
Logo,
2θ(x) √ x √
π(x) ≤ + x ≤ (8 log(2)) + x,
log(x) log(x)
onde a última desigualdade segue da proposição anterior. O resultado segue da
√
observação que x < 2x/ log(x) para x ≥ 2.
Corolário 5.17.
π(x)
lim = 0.
x→∞ x
Nosso objetivo agora é obter uma cota inferior para a função π(x). Para isto
comecemos observando que

2n n+1 n+2 n+n
= · · ... · .
n 1 2 n
Por um exercı́cio deste capı́tulo temos
X tp
2n (2n)! 2n n
ordp = ordp 2
= j
−2 j ,
n (n!) j=1
p p
onde tp denota o maior inteiro tal que ptp ≤ 2n. Logo, tp = dlog(2n)/ log(p)e.
Além disto, d2xe − 2dxe é sempre 0 ou 1, assim

2n log(2n)
ordp ≤ .
n log(p)
Proposição 5.18 (*). Existe real c2 > 0 tal que para todo real x ≥ 2 tenha-
mos
x
π(x) > c2 .
log(x)
Demonstração. Pelo que foi feito anteriormente,

n 2n Y
2 ≤ ≤ ptp .
n p<2n
Calculando o logaritmo obtemos,

X X log(2n)
n log(2) ≤ tp log(p) = log(p).
p<2n p<2n
log(p)
√
Se log(p) > (1/2) log(2n), i.e., p > 2n, então dlog(2n)/ log(p)e = 1. Assim,
X log(2n) X √
n log(2) ≤ log(p) + log(p) ≤ 2n log(2n) + θ(2n)
√ log(p) √
p≤ 2n 2n<p<2n
√ √
Portanto, θ(2n) ≥ n log(2) − 2n log(2n). Mas, limn→∞ ( 2n log(2n))/n = 0.
Assim, existe uma constante real T > 0 tal que para n suficientemente grande
θ(2n) > T n (observe que T não depende de n). Tomando x suficientemente
grande e tal que 2n ≤ x < 2n + 1 obtemos
x−1
θ(x) ≥ θ(2n) > T n > T > Cx,
2
para algum real C > 0 conveniente (independente de x). Portanto, existe real
c2 > 0 tal que θ(x) > c2 x para todo x ≥ 2, onde c2 no depende de x. Para
completar a prova observamos que
X
θ(x) = log(p) ≤ π(x) log(x).
p≤x
Portanto,
θ(x) x
π(x) ≥ > c2 .
log(x) log(x)

5.18.1. Comentários. As duas proposições anteriores são devidas a C̆ebychef

(1852). O seguinte teorema suplanta ambas (cf. [?, chapter 4], este resultado de-
pende de teoria analı́tica dos números).
Teorema 5.19 (teorema dos números primos).

π(x)
lim = 1.
x→∞ x/ log x
O teorema dos números primos foi conjecturado por Gauss na idade de 15
ou 16 anos. A prova correta surgiu apenas em 1896 por Hadamard e de la Vallé
Poussin utilizando a função zeta de Riemann, que introduziremos no parágrafo
seguinte.
Existem uma infinidade de problemas abertos sobre os números primos. Para
mencionar apenas dois :
5.20. FUNÇÃO ZETA 37
• Existem infinitos números primos da forma n2 + 1?

• (Primos gêmeos) Existem infinitos pares de números primos da forma
(p, p + 2)?
Para mais problemas abertos veja [?] e [?].
5.20. Função zeta

Nesta seção descreveremos sem prova diversos fatos a respeito da função zeta
de Riemann (para a prova destes fatos ver [?, chapter 16]). Esta função é definida
por
X
ζ(s) := n−s , onde s ∈ C, <(s) > 1.
n≥1
Esta série converge em <(s) > 1 e converge uniformemente para <(s) ≥ 1 + δ

para todo δ > 0 (para a noção de convergência ver [?, cap’ıtulo IV]). A primeira
propriedade é que ela admite uma expansão em produto euleriano.
Proposição 5.21. Para <(s) > 1 temos

Y 1
ζ(s) = .
p∈P
1 − p−s
Particularmente importante é o comportamento assintótico desta função quan-

P
do s → 1. Considerando que n≥1 1/n diverge suspeitamos que ζ(s) → ∞
quando s → 1. Lembre que ζ(s) é uma função de uma variável complexa.
Proposição 5.22. Suponha que <(s) > 1. Então
lim(s − 1)ζ(s) = 1.
s→1
A proposição na verdade diz que ζ(s) é uma função meromorfa com um pólo
simples em s = 1 (para mais detalhes ver [?, chapter 12]).
Corolário 5.23. Quando s → 1 temos

log(s)
→ 1.
(log(s − 1))−1
X 1
ζ(s) = + R(s),
p∈P
ps
onde R(s) fica limitada quando s → 1.
Dado um subconjunto S do conjunto dos números primos P, dizemos que S

tem densidade de Dirichlet se o limite
−s
P
p∈S p
lim
s→1 (log(s − 1))−1
existe. Neste caso este limite é denotado por d(S) e é chamado a densidade de
Dirichlet de S. Esta densidade satisfaz as seguintes propriedades.
Proposição 5.25. Seja S um subconjunto do conjunto P dos números pri-

mos. Então
(1) Se S é finito, então d(S) = 0.
(2) Se S contém todos os números primos, exceto um número finito deles,
então d(S) = 1.
(3) Se S = S1 ∪ S2 com S1 ∩ S2 = ∅, então d(S1 ∪ S2 ) = d(S1 ) + d(S2 ).
Teorema 5.26 (teorema das progressões aritméticas de Dirichlet). Sejam

a ∈ Z e m ≥ 1 inteiro tais que mdc(a, m) = 1. Seja P(a; m) o subconjunto do
conjunto P dos números primos que contém os primos p tais que p ≡ a (mod m).
Então d(P(a; m)) = 1/φ(m). A fortiori, P(a; m) é infinito.
5.26.1. Comentários (*). Riemann propôs a seguinte conjectura (que per-

manece em aberto até hoje).
Conjectura 5.27 (hipótese de Riemann). Todos os zeros da função zeta de

Riemann ζ(s) estão contidos na reta <(s) = 1/2.
Sabe-se que na reta <(s) = 1/2 existe uma infinidade de zeros da função zeta
e que estes são simétricos em relação à reta =(s) = 0. A veracidade da hipótese
de Riemann implica em maiores informações sobre a distribuição dos números
primos (para mais sobre isto ver [?, chapter13]).
O inteiro positivo n nada mais é que a cardinalidade do anel Z/nZ da arit-
mética modular (a ser introducido no próximo capı́tulo). Esta analogia faz com
que Dedekind considere a seguinte extensão da função zeta. Seja K uma extensão
finita do corpo dos racionais Q (ver a parte referente à teoria de corpos). Existe
um subconjunto OK de K que cumpre o mesmo papel de Z com relação a Q. Este
conjunto é chamado o anel de inteiros de K. Ele tem (entre outras propriedades
importantes) a caracterı́stica que o anel quociente OK /I (onde I é um ideal de
OK , para mais sobre anel quocientes ver a parte de anéis) é um conjunto finito
5.20. FUNÇÃO ZETA 39
cuja cardinalidade é denotada por N (I). Assim, Dedekind define a função zeta
de K por
X
ζK (s) := N (I)−s , onde <(s) > 1,
I
e I percorre todos os ideais de OK . Novamente conjectura-se que os zeros desta

função estão na reta <(s) = 1/2, o que permanece em aberto. Note que ζQ nada
mais é que a função zeta de Riemann.
Nos anos 20 e 30 do século XX, E. Artin, H. Hasse e A. Weil consideraram um
análogo “geométrico” desta situação. Nele o papel de Q era ocupado pelo corpo de
funções racionais em uma variável Fq (τ ) sobre um corpo finito Fq de q elementos
(ver parte de corpos). Neste contexto, L é uma extensão finita de Fq (τ ). O corpo
L possui também um subanel com propriedades similares a OK (quando K é uma
extensão finita de Q). Isto permite a construção de uma função zeta associada a
L. Similarmente, pode-se formular como acima uma “hipótese de Riemann” para
L. Esta é chamada uma “hipótese de Riemann para curvas” porque L nada mais
é que o corpo de funções racionais de uma curva sobre um corpo finito (para mais
sobre curvas sobre corpos finitos e a hipótese de Riemann neste contexto ver [?]).
Após casos particulares da hipótese de Riemann para curvas terem sido tratados
por Artin e Hasse, Weil utilizando variedades abelianas e representações `-ádicas
obtém em 1948 a prova da “hipótese de Riemann para curvas” de forma geral.
No ano seguinte (1949) Weil propõe uma vasta generalização deste resultado
substituindo Fq (τ ) por um corpo de funções κ em n variáveis sobre Fq . Neste caso
a extensão finita L de κ nada mais é que o corpo de funções de uma variedade
algébrica sobre Fq (para variedades algébricas ver [?]). De maneira visionária Weil
percebe que uma prova da hipótese de Riemann neste contexto mais geral seria
conseqüência de uma teoria de cohomologia suficientemente “rica” para reprodu-
zir as propriedades da cohomologia singular sobre os complexos. Segundo muitos,
as conjecturas de Weil foram sem sobra de dúvida o problema matemático mais
profundo após a segunda guerra mundial. Na busca da cohomologia perdida, os
primeiros passos foram dados por J.-P. Serre introduzindo a cohomologia de feixes
de vetores de Witt. Mas foi A. Grothendieck que compreendeu que a função zeta
traz em si algo de novo que não havia sido percebido pelos gêometras algébricos,
desde de os italianos do século XIX. Ela necessitava de uma base variável, ou
seja, a variedade algébrica era considerada simultaneamente sobre todos os cor-
pos finitos Fqn . Para isto introduziu o conceito que revoluciona completamente
a geometria algébrica no século XX, a teoria de esquemas. Com a contribuição
de inúmeros matemáticos além de Serre e Grothendieck, dentre eles M. Artin,

J.-L. Verdier e L. Illusie, as teoria de esquemas e de cohomologia evoluiram, per-
mitindo que se descobrisse que a “cohomologia apropriada”, a cohomologia étale
(para mais sobre a cohomologia étale veja [?]), e que finalmente em 1973, um
ex-aluno de Grothendieck, P. Deligne provasse finalmente as conjecturas de Weil
(para os resultados de Deligne veja [?] e [?]). Entretanto, o mestre não ficou
satisfeito. Na verdade Grothendieck havia formulado um programa muito mais
amplo, “as conjecturas standard”, das quais as conjecturas de Weil eram um
corolário. Infelizmente, este programa nunca foi atingido.
CAPı́TULO 6
Aritmética modular
6.1. Aritmética modular

Definimos uma função soma de classes ⊕ : Z/nZ×Z/nZ → Z/nZ por a⊕b :=
a + b.
Lema 6.2. Esta função está bem definida, i.e., se a0 ≡ a (mod n) e b0 ≡ a

(mod n), então a0 + b0 = a + b.
Demonstração. Suponha a0 ≡ a (mod n) e b0 ≡ b (mod n), i.e., existem

k, l ∈ Z tais que a0 − a = kn e b0 − b = ln. Somando estas igualdades, (a0 + b0 ) −
(a + b) = (k + l)n, i.e., a0 + b0 ≡ a + b (mod n), i.e., a0 + b0 = a + b.
Definimos também um função produto de classes : Z/nZ × Z/nZ → Z/nZ
por a b := ab.
Lema 6.3. Esta função também está bem definida, i.e., se a0 ≡ a (mod n) e
b0 ≡ b (mod n), então a0 b0 = ab.
Demonstração. Sejam k, l ∈ Z tais que a0 − a = kn e b0 − b = ln. Logo

a0 b0 − ab = a0 b0 − a0 b + a0 b − ab = a0 (b0 − b) + b(a0 − a) = (a0 l + bk)n, i.e., a0 b0 ≡ ab
(mod n), i.e., a0 b0 = ab.
Proposição 6.4. O conjunto Z/nZ munido das operações ⊕ e é um anel

comutativo com unidade.
Demonstração. Precisamos provar que as 8 propriedades de 2.11 são sa-

tisfeitas. Elas são herdadas das mesmas propriedades para inteiros como segue
abaixo.
(1) a⊕(b⊕c) = a⊕b + c = a + (b + c) = (a + b) + c = a + b⊕c = (a⊕b)⊕c.
(2) a ⊕ b = a + b = b + a = b ⊕ a.
(3) Note que 0 = n = {kn | k ∈ Z} = nZ é o conjunto dos inteiros que são
múltiplos de n. Observe que a ⊕ 0 = a + 0 = a.
(4) a ⊕ n − a = a + n − a = n = 0.
41
42 6. ARITMÉTICA MODULAR
(5) a (b c) = a bc = a(bc) = (ab)c = ab c = (a b) c.

(6) a b = ab = ba = b a.
(7) a 1 = a.1 = a.
(8) a (b ⊕ c) = a b + c = a(b + c) = ab + ac = ab ⊕ ac = (a b) ⊕ (a c).

A propriedade de cancelamento em um anel garante que este é um domı́nio

de integridade. Nem sempre Z/nZ é um domı́nio de integridade. Para simplificar
a notação escreveremos + no lugar de ⊕ e ab no lugar de a b.
Proposição 6.5. Z/nZ é um domı́nio de integridade se e somente se n = p

é um número primo.
Demonstração. Suponha que Z/nZ seja um domı́nio de integridade. Supo-

nha que n = ab com 1 ≤ a, b ≤ n. Então n = 0 = ab = ab. Pela propriedade
do cancelamento, a = 0 ou b = 0. No primeiro caso existe α ≥ 1 inteiro tal que
a = nα, logo n = nαb, i.e., 1 = αb, i.e., b = 1 e a = n. No segundo caso existe
β ≥ 1 inteiro tal que b = nβ, logo n = anβ, i.e., 1 = aβ, i.e., a = 1 e b = n.
Portanto, n é primo.
Suponha que n = p seja primo. Suponha ab = 0, i.e., ab = 0, i.e., p | ab.
Pelo Lema 3.5, p | a ou p | b, i.e., a = 0 ou b = 0, i.e., vale a propriedade de
cancelamento.
Um elemento a ∈ Z/nZ é dito inversı́vel, se existe b ∈ Z/nZ tal que ab =

1. Denotamos por (Z/nZ)∗ o subconjunto de Z/nZ formado pelos elementos
inversı́veis. Um domı́nio de integridade D é dito um corpo, se para todo a ∈
D \ {0} existe b ∈ D tal que ab = 1. Assim, Z/nZ é um corpo se e somente se
(Z/nZ)∗ = Z/nZ \ {0}.
Proposição 6.6. Z/nZ é um corpo se e somente se n = p é um número

primo.
Demonstração. Suponha que Z/nZ seja um corpo. Seja n = ab com 1 ≤

a, b ≤ n inteiros. Suponha que a < n. Neste caso, a 6= 0. Por hipótese, existe
c ∈ Z/nZ tal que ac = 1. Note que n = 0 = ab = ab. Multiplicando esta
igualdade por c dos dois lados obtemos 0 = b, i.e., b = n. Neste caso a = 1. Se
a = n, então necessariamente b = 1 e portanto n é primo.
6.9. CRITÉRIOS DE DIVISIBILIDADE 43
Reciprocamente, suponha que n = p seja primo. Seja a ∈ Z/nZ \ {0}, i.e.,

p - a. Logo mdc(a, p) = 1. Pelo algoritmo euclideano estendido, existem r, s ∈ Z
tais que ra+sp = 1, i.e., ra ≡ 1 (mod p), i.e., ra = ra = 1, i.e., a ∈ (Z/nZ)∗ .
A princı́pio Z/nZ é o conjunto de todas as classes a para a ∈ Z. Definido

desta forma Z/nZ poderia ser infinito. Isto não ocorre.
Proposição 6.7. Z/nZ = {0, · · · , n − 1} e #Z/nZ = n.
Demonstração. Por definição o conjunto do lado direito está contido no

conjunto do lado esquerdo. O que temos que provar é a inclusão oposta. Suponha
que a ∈ Z/nZ. Note que podemos sempre supor que a ≥ 0, basta tomar um
múltiplo kn de n suficientemente grande tal que a0 = a + kn ≥ 0, uma vez que
a = a0 . Pelo algoritmo da divisão, existem q, r ∈ Z tais que a = qn + r com
0 ≤ r < n, i.e., a ≡ r (mod n), i.e., a = r ∈ {0, · · · , n − 1}.
Mostraremos agora que quaisquer duas classes no conjunto da direita são
distintas. Sejam 0 ≤ a < b < n inteiros. Logo 0 ≤ b − a < b < n, i.e., b 6≡ a
(mod n), i.e., b 6= a.
O conjunto (Z/nZ)∗ dos inversı́veis em Z/nZ pode ser caracterizado também

da seguinte forma.
Proposição 6.8. (Z/nZ)∗ = {a ∈ Z/nZ | mdc(a, n) = 1}.
Demonstração. Seja a ∈ (Z/nZ)∗ , i.e., existe b ∈ Z/nZ tal que ab = ab =

1, i.e., existe k ∈ Z tal que ab − kn = 1. Seja d = mdc(a, n) ≥ 1. Logo d | 1, mas
isto só é possı́vel se d = 1.
Seja a ∈ Z/nZ tal que mdc(a, n) = 1. Pelo algoritmo euclideano estendido,
existem r, s ∈ Z tais que ra + sn = 1, i.e., ra ≡ 1 (mod n), i.e., ra = r a = 1,
i.e., a ∈ (Z/nZ)∗ .
6.9. Critérios de divisibilidade

Utilizaremos a aritmética modular para demonstrar critérios de divisibilidade.
6.9.1. Expansão de um inteiro em uma dada base. Sejam a ≥ 0 e

b ≥ 1 inteiros. Seja n ≥ 1 inteiro tal que bn seja a maior potência positiva de b
menor ou igual a a, i.e.,
bn ≤ a < bn+1 .
Pelo algoritmo da divisão existem qn , rn ∈ Z tais que
a = qn bn + rn , onde 0 ≤ rn < bn .
Observemos que
0 ≤ qn < b.
A primeira desigualdade é clara, porque qn bn é o maior múltiplo positivo de bn
que é menor ou igual a a. Suponha que qn ≥ b. Logo
a ≥ bn+1 + rn ≥ bn+1 ,
o que não é possı́vel. Em seguida, dividimos rn por q n−1 , i.e., existem qn−1 , rn−1 ∈
Z tais que
rn = qn−1 bn−1 + rn−1 , onde 0 ≤ rn−1 < bn−1 .
Novamente,
0 ≤ qn−1 < b.
Não precisamos repetir o argumento da primeira desigualdade, pois é o mesmo.
Para a segunda, se qn−1 ≥ b, terı́amos
rn ≥ bn + rn−1 ≥ bn ,
o que não é possı́vel. Substituindo na primeira igualdade obtemos
a = qn bn + qn−1 bn−1 + rn−1 .
Novamente, pelo algoritmo da divisão existem qn−2 , rn−2 ∈ Z tais que
rn−1 = qn−2 bn−2 + rn−2 , onde0 ≤ rn−2 < bn−2 .
Se qn−2 ≥ b, então
rn−1 ≥ bn−1 + rn−2 ≥ bn−1 ,
o que é impossı́vel. Portanto, 0 ≤ qn−2 < b. Prosseguindo sucessivamente obte-
mos
(6.9.1) a = qn bn + qn−1 bn−1 + . . . + q1 b + q0 ,
onde 0 ≤ qi < b para todo 0 ≤ i ≤ n. A expressão (6.9.1) é chamada a expansão

de a na base b. Denotamos esta expansão por ab := (qn · · · q0 )b .
Seja a ≥ 0 inteiro e a = an .10n + . . . + a1 .10 + a0 sua expansão na base 10.
Os elementos an , · · · , a0 são chamados os algarismos de a e a := (an · · · a0 )10 .
6.13. CONTANDO ELEMENTOS INVERSÍVEIS 45
Pn
Exemplo 6.10. Um inteiro a ≥ 0 é divisı́vel por 3 se e somente se i=0 ai ≡ 0
(mod 3). De fato, 10 ≡ 1 (mod 3), pois 10 − 1 = 9 = 3.3. Logo para todo n ≥ 0,
10n ≡ 1n = 1 (mod 3). Portanto, a ≡ ni=0 ai (mod 3). Logo a ≡ 0 (mod 3) se
P
e somente se ni=0 ai ≡ 0 (mod 3).

P
Exemplo 6.11. Um inteiro a ≥ 0 é divisı́vel por 11 se e somente se ni=0 (−1)ai

P
≡ 0 (mod 11). De fato, 10 ≡ −1 (mod 11), pois 10 − (−1) = 11. Logo para todo
n ≥ 1, 10n ≡ (−1)n (mod 11) e portanto, a ≡ ni=0 (−1)ai (mod 11). Conse-
P
quentemente, a ≡ 0 (mod 11) se e somente se ni=0 (−1)ai ≡ 0 (mod 11).

P
Exemplo 6.12. O critério de divisibilidade por 7 é um pouco mais intrincado.

A razão é a seguinte: 10 ≡ 3 (mod 7), pois 10 − 3 = 7. Logo 102 ≡ 32 ≡ 2
(mod 7), pois 9 − 2 = 7; 103 ≡ 3.2 = 6 (mod 7); 104 ≡ 6.3 ≡ 4 (mod 7), pois
18 − 4 = 14 = 2.7; 105 ≡ 4.3 ≡ 5 (mod 7), pois 12 − 5 = 7; 106 ≡ 5.3 ≡ 1
(mod 7), pois 15 − 1 = 14 = 2.7. Suponha para simplificar que n = 5, i.e., a tem
apenas 6 algarismos. Aplicando o mesmo raciocı́nio acima obtemos que a ≡ 0
(mod 7) se e somente se 5a5 + 4a4 + 6a3 + 2a2 + 3a1 + a0 ≡ 0 (mod 7).
6.13. Contando elementos inversı́veis

No capı́tulo de fatoração de inteiros introduzimos a função φ de Euler. Pela
proposição 6.8 a definição dada anteriormente coincide com φ(n) := #(Z/nZ)∗ .
Nesta seção vamos calcular no caso em que n é primo ou potência de primo. No
capı́tulo seguinte, usando o teorema chinês dos restos, faremos o cálculo geral.
Lema 6.14. Seja p um número primo. Então

φ(p) = p − 1.
Demonstração. Provamos anteriormente que quando n = p é primo (Z/pZ)∗

= Z/pZ \ {0}, logo φ(p) = #(Z/pZ) − 1 = p − 1.
Lema 6.15. Seja p um número primo e r ≥ 1 inteiro. Então

φ(pr ) = pr−1 (p − 1).
Demonstração. Pela proposição 6.8, a ∈ (Z/pr Z)∗ se e somente se mdc(a, pr )

= 1, i.e., p - a. Ao invés de contarmos estes elementos contaremos aqueles que
são divisı́veis por p e subtairemos do total pr este número. Expandimos a na base
p, i.e.,
a = qr−1 pr−1 + . . . + q1 p + q0 , onde 0 ≤ qi < p
é inteiro para todo 0 ≤ i ≤ r − 1. Assim, p | a se e somente se q0 = 0. Para cada

qi com 1 ≤ i ≤ r − 1 temos exatamente p escolhas. Logo o total de escolhas para
a tal que p | a é pr−1 . Portanto, φ(pr ) = pr − pr−1 = pr−1 (p − 1).
CAPı́TULO 7
Sistemas de congruência
7.1. Equações diofantinas

Uma equação diofantina é uma equação polinomial em um número finito de
variáveis cujos coeficientes são números inteiros e/ou racionais e procuramos solu-
ções inteiras e/ou racionais. Nesta seção daremos um exemplo de como utilizar
a aritmética modular para provar que uma dada equação diofantina não tem
soluções inteiras.
Exemplo 7.2. Seja f (x, y) = x3 − 711y 3 = 5. Perguntamos se existem pares

(a, b) ∈ Z × Z tais que f (a, b) = 0. Mostraremos que não pode existir um tal par
(a, b). De fato, suponha que exista. Logo a3 ≡ 5 (mod 9). Calculemos os cubos
3 3 3 3 2
de todos os elementos de Z/9Z. 1 = 1; 2 = 8, 3 = 0, 4 = 4 4 = 74 = 1;
3 3 3 3 3 3 3 3 3 3 3
5 = −4 = −4 = 8; 6 = −3 = −3 = 0; 7 = −2 = −2 = 1; 8 = −1 = 8.
Portanto, não existe a ∈ Z tal que a3 ≡ 5 (mod 9), logo não pode existir (a, b) ∈
Z × Z tal que f (a, b) = 0.
7.3. Equações lineares

Teorema 7.4. Sejam a, b ∈ Z, a 6= 0 e n ≥ 1 inteiro. A equação ax ≡ b
(mod n) tem solução se e somente se d := mdc(a, n) | b.
Demonstração. Suponha que x0 ∈ Z seja uma solução da equação. Como

d divide a e n, denotamos a = a0 d e n = n0 d, onde n0 , a0 ∈ Z. Logo existe k ∈ Z
tal que ax0 − b = kn, i.e., d(a0 x0 − kn0 ) = b, assim d | b.
Reciprocamente, suponha que d | b, digamos b = db0 . Pelo algoritmo euclide-
ano estendido, existem t, s ∈ Z tais que ta + sn = d. Multiplicando ambos os
lados por b0 obtemos a(tb0 ) + snb0 = db0 = b, i.e., a(tb0 ) ≡ b (mod n), i.e., tb0 é
uma solução da equação.
Observação 7.5. Observe que se x0 ∈ Z é uma solução de ax ≡ b (mod n),

então para todo y0 ≡ x0 (mod n), concluimos que y0 também é solução da
equação (assim dizemos que a classe x0 de x0 é uma solução para ax = b).
47
48 7. SISTEMAS DE CONGRUÊNCIA
De fato, y0 = x0 + kn para algum k ∈ Z e ax0 = b + ln para algum l ∈ Z. Logo

ay0 = b + ln + akn = b + (l + ak)n, i.e., ay0 ≡ b (mod n).
Teorema 7.6. Suponha que a equação ax ≡ b (mod n) admita uma solução

x0 ∈ Z. O número de soluções (módulo n) de ax ≡ b (mod n) é d e elas são
dadas pelas classes cujos representantes são x0 , x0 + n0 , · · · , x0 + (d − 1)n0 .
Demonstração. Provemos inicialmente que cada um desses elementos é

solução. Escrevemos y0 = x0 + kn0 para algum 0 ≤ k ≤ d − 1 inteiro. Logo
ay0 = ax0 +akn0 = b+ln+akn0 = b+ln+a0 dkn0 = b+ln+a0 kn = b+n(l+a0 k), i.e.,
ay0 ≡ b (mod n). Em seguida observemos que se 0 ≤ k < r ≤ d − 1 são números
inteiros, então x0 + kn0 6≡ x0 + rn0 (mod n). De fato, 0 < (x0 + rn0 ) − (x0 + kn0 ) =
n0 (r − k) < n0 d = n, logo n - ((x0 + rn0 ) − (x0 + kn0 ) = n0 (r − k)).
7.7. Sistemas de equações lineares

Teorema 7.8. Sejam m, n ≥ 1 inteiros tais que mdc(m, n) = 1 e a, b ∈ Z.
Existe x ∈ Z tal que o sistema
(
x ≡ a (mod m)
x ≡ b (mod n)
tenha solução.
Demonstração. Pelo algoritmo euclideano estendido existem t, s ∈ Z tais

que tm + sn = 1. Logo
tm ≡ 1 (mod n) e sn ≡ 1 (mod m).
Seja x0 := asn + btm. Observe que
x0 ≡ asn (mod m) ≡ a (mod m) e x0 ≡ btm (mod n) ≡ b (mod n).
Teorema 7.9. Sejam m1 , · · · , mr ≥ 1 inteiros tais que para todo 1 ≤ i 6=

j ≤ r, mdc(mi , mj ) = 1. Sejam a1 , · · · , ar ∈ Z. Existe x ∈ Z tal que o sistema


 x ≡ a1 (mod m1 )

(7.9.1) ···


 x ≡ a (mod m )
r r
tenha solução.
7.10. TEOREMA CHINÊS DOS RESTOS 49
m := m1 · · · mr
e para todo 1 ≤ i ≤ r, seja
m
ni := = m1 · · · mi−1 mi+1 · · · mr .
mi
Como para cada j 6= i, mdc(mj , mi ) = 1, temos que mdc(ni , mi ) = 1. Pelo
algoritmo euclideano estendido existem ti , si ∈ Z tais que ti ni + si mi = 1, i.e.,
ti ni ≡ 1 (mod mi )
e para todo j 6= i, como ni ≡ 0 (mod mj ), então
ti ni ≡ 0 (mod mj ).
Tome
x0 := a1 t1 n1 + . . . + ar tr nr .
De fato, para todo 1 ≤ i ≤ r, temos
x0 ≡ ai ti ni (mod mi ) ≡ ai (mod mi ),
uma vez que
aj tj nj ≡ 0 (mod mi ) para i 6= j.

7.10. Teorema Chinês dos Restos

Notação. Dado n ≥ 1 inteiro e a ∈ Z denotaremos nesta seção a classe de a
módulo n por a + nZ. Isto é motivado pelo fato que um elemento é equivalente
a a módulo n se e somente se ele difere de a por um múltiplo de n.
Teorema 7.11. Sejam m1 , · · · , mr ≥ 1 inteiros tais que para todo 1 ≤ i 6=

j ≤ r, mdc(mi , mj ) = 1. Seja m := m1 · · · mr . Existe uma bijeção
Z Z Z
ϕ: → × ... ×
mZ m1 Z mr Z
definida por
ϕ(a + mZ) = (a + m1 Z, · · · , a + mr Z).
Seja ψ a restrição de ϕ a (Z/mZ)∗ , então
∗ ∗ ∗
Z Z Z
ψ: → × ... ×
mZ m1 Z mr Z
também é uma bijeção.
50 7. SISTEMAS DE CONGRUÊNCIA
Demonstração. Provemos inicialmente que ϕ está bem definida. De fato,

se b ≡ a (mod m), então para todo 1 ≤ i ≤ r, mi | m | (b − a), logo b ≡ a
(mod mi ), i.e., b + mi Z = a + mi Z.
Provemos agora que ϕ é injetiva. Suponha que ϕ(a + mZ) = ϕ(b + mZ), i.e.,
para todo 1 ≤ i ≤ r, a ≡ b (mod mi ). Como para i 6= j, mdc(mi , mj ) = 1,
concluimos que m | (a − b), i.e., a + mZ = b + mZ.
Provar que ϕ é sobrejetiva equivale a dizer que para todo (a1 + m1 Z, · · · , ar +
mr Z) ∈ Z/m1 Z × . . . × Z/mr Z é da forma ϕ(x + mZ) para algum x ∈ Z, i.e., que
o sistema (7.9.1) tema solução, o que já foi provado.
Provemos agora que um elemento inversı́vel módulo m tem imagem cujas
componentes são inversı́veis com respeito aos respectivos módulos. Suponha que
a + mZ ∈ (Z/mZ)∗ , i.e., mdc(a, m) = 1. Como m = m1 · · · mr , concluimos que
para cada 1 ≤ i ≤ r, mdc(a, mi ) = 1, i.e., a + mi Z ∈ (Z/mi Z)∗ . Como ψ é
obtida restringindo ϕ a um subconjunto do domı́nio, concluimos que ψ também
é injetiva.
Quanto a sobrejetividade, seja (a1 + m1 Z, · · · , ar + mr Z) ∈ (Z/m1 Z)∗ × . . . ×
(Z/mr Z)∗ . Pela parte anterior sabemos que existe x ∈ Z tal que ϕ(x + mZ) =
(a1 + m1 Z, · · · , ar + mr Z). Observemos que na verdade x + mZ ∈ (Z/mZ)∗ . De
fato, para cada 1 ≤ i ≤ r, x + mi Z = ai + mi Z, i.e., x ≡ ai (mod mi ), mas
mdc(ai , mi ) = 1, logo mdc(x, mi ) = 1 para todo 1 ≤ i ≤ r. Como m = m1 · · · mr
e mdc(mi , mj ) = 1 para i 6= j obtemos que mdc(x, m) = 1, i.e., x + mZ ∈
(Z/mZ)∗ .
Corolário 7.12. Para todo n ≥ 1 inteiro seja φ(n) = #(Z/nZ)∗ . Então
φ(m) = φ(m1 ) · · · φ(mr ).
7.13. Aplicação
Seja n = pe11 · · · perr a fatoração do inteiro n ≥ 1. Pelo corolário 7.12 e pelo
lema 6.15,
(7.13.1) φ(n) = φ(pe11 ) · · · φ(perr ) = pe11 −1 (p1 − 1) · · · perr −1 (pr − 1)

Y
e1 1 er 1 1
= p1 1 − · · · pr 1 − =n 1− .
p1 pr p
p|n
Vamos utilizar a fórmula (7.13.1) para uma aplicação.

7.13. APLICAÇÃO 51
Proposição 7.14. Suponha que φ(n) = p seja um número primo. Então

n = 3, 4 ou 6.
Demonstração. Se r > 2, então ei = 1 para todo 1 ≤ i ≤ r. Logo

φ(n) = ri=1 (pi − 1). Como r > 2 existem pelo menos dois primos ı́mpares
Q
na fatoração, logo 4 | φ(n), o que não é possı́vel. Logo r ≤ 2. Suponhamos

inicialmente r = 2, i.e., φ(n) = pe11 −1 (p1 − 1)pe22 −1 (p2 − 1). Se p1 , p2 > 2 então
(novamente) 4 | φ(n). Logo p1 = 2 e φ(n) = 2e1 −1 pe22 −1 (p2 − 1). Se e1 > 1, como
p2 > 2, então 4 | φ(n). Assim, e1 = 1 e φ(n) = pe22 −1 (p2 − 1). Se e2 > 1, então
φ(n) tem 2 e p2 como fatores primos. Assim, e2 = 1 e φ(n) = pe22 −1 . Novamente,
como este número é primo, e2 = 1 e φ(n) = p2 − 1. Mas este número é par e
primo, logo p2 = 3 e n = 6.
Suponhamos que r = 1, i.e., φ(n) = pe11 −1 (p1 − 1). Se p1 = 2, então φ(n) =
2e1 −1 . A única forma deste número ser primo é e1 = 2, logo n = 4. Suponha
p1 > 2. Se e1 > 1, então φ(n) tem 2 fatores primos p1 e 2 (pois p1 − 1 é par),
impossı́vel. Assim, e1 = 1 e φ(n) = p1 − 1. Isto já foi feito anteriormente, i.e.,
p1 = 3 e n = 3.
CAPı́TULO 8
Aplicações da teoria de grupos à teoria elementar dos

números
Neste capı́tulo desenvolveremos aplicações da teoria de grupos à aritmética

elementar. Utilizaremos os resultados do capı́tulo 9.
8.1. Primalidade de números de Mersenne

Para todo inteiro n ≥ 1, seja Mn := 2n − 1 o n-ésimo número de Mersenne.
Nosso objetivo é utilizar a teoria de grupos para determinar se Mn é primo ou
obter seu menor fator primo. Já provamos anteriormente que se n é composto,
então Mn também o é. Assim, consideraremos apenas Mp para p primo.
Seja q um fator primo de Mp , i.e., 2p ≡ 1 (mod q). Portanto em (Z/qZ)∗
p
temos 2 = 1, i.e., o(2) | p. Como p é primo temos que o(2) = 1 ou p. O primeiro
caso não pode ocorrer, pois 2 6= 1. Logo o(2) = p. Pelo teorema de Lagrange,
o(2) = p | #(Z/qZ)∗ = φ(q) = q − 1,
i.e., existe k ≥ 1 inteiro tal que q = 1 + kp.
Proposição 8.2. Todo fator primo de Mp é da forma 1 + kp para algum

inteiro k ≥ 1.
Provamos anteriormente que o menor fator primo de um número inteiro n ≥ 1

√
é no máximo n. Logo
√ 2p/2 − 1
q≤ 2p − 1 < 2p/2 , i.e. , k < .
p
Dessa forma para determinar um fator primo de Mp testamos para cada inteiro
k tal que
2p/2 − 1
1≤k<
p
se 1 + kp é primo e se divide Mp . Se para cada k pelo menos um desses fatos não
ocorrer então Mp é um número primo.
53
54 8. APLICAÇÕES DA TEORIA DE GRUPOS
8.3. Primalidade de números de Fermat

n
Para todo inteiro n ≥ 1, seja Fn := 22 + 1 o n-ésimo número de Fermat. Seja
n n+1
q um fator primo de Fn . Então 22 ≡ −1 (mod q), logo 22 ≡ 1 (mod q), i.e.,
2n+1 ∗
2 = 1 em (Z/qZ) . Neste caso
o(2) | (2n+1 ), i.e. , o(2) = 2d para 1 ≤ d ≤ n + 1.
Afirmamos que d = n + 1. De fato, se d < n + 1, então

2n 2d n−d
2 = (2 )2 = 1,
o que é um absurdo, portanto o(2) = 2n+1 . Pelo teorema de Lagrange,
o(2) = 2n+1 | #(Z/qZ)∗ = φ(q) = q − 1,
i.e., existe k ≥ 1 tal que q = 1 + k2n+1 .
Proposição 8.4. Todo fator primo de Fn é da forma 1 + k2n+1 para algum

inteiro k ≥ 1.
Como no caso dos números de Mersenne, temos que

√ n
√ n 22 + 1 − 1
q ≤ 22 + 1, i.e. , k ≤ .
2n+1
Dessa forma para determinar um fator primo de Fn testamos para cada inteiro k
tal que
√ n
22 + 1 − 1
1≤k<
2n+1
se 1 + k2n+1 é primo e se divide Fn . Se para cada k pelo menos um desses fatos
não ocorrer então Fn é um número primo.
8.5. Números de Carmichael

O pequeno teorema de Fermat afirma que se p é um número primo e a ∈ Z
tal que p - a, então ap−1 ≡ 1 (mod p). Assim, isto funciona para todo 1 ≤ a < p
inteiro. Isto motiva a seguinte definição.
Definição 8.6. Seja n ≥ 3 inteiro ı́mpar e 1 ≤ b < n inteiro. Dizemos que n

é pseudoprimo na base b se bn−1 ≡ 1 (mod n).
8.5. NÚMEROS DE CARMICHAEL 55
Observação 8.7. Segue do pequeno teorema de Fermat que um número

primo p é pseudoprimo em toda base 1 ≤ b < p. Observe que a princı́pio para
um número composto n não podemos esperar que ele seja pseudoprimo em toda
base. De fato, seja d = mdc(b, n). Suponha que d > 1 e que n seja pseudoprimo
na base b, i.e., existe k ∈ Z tal que bn−1 −1 = kn. Logo d | 1, o que não é possı́vel.
Assim verificaremos a congruência apenas para as bases b tais que mdc(b, n) = 1,
i.e., b ∈ (Z/nZ)∗ .
Definição 8.8. Seja n ≥ 3 ı́mpar composto. Suponha que para todo inteiro
1 ≤ b < n tal que mdc(b, n) = 1 tenhamos bn−1 ≡ 1 (mod n). Dizemos que n é
um número de Carmichael.
Exemplo 8.9. 561 é o menor número de Carmichael. É claro que provar isto
diretamente é trabalhoso, precisamos para cada inteiro
1 ≤ b < 561 tal que mdc(b, 561) = 1
verificar que
b560 ≡ 1 (mod 561).
Ao invés disto observemos que
561 = 3.11.17.
Dizer que
b560 ≡ 1 (mod 561)
equivale a dizer que 561 | (b560 − 1), i.e., que 3 | (b560 − 1), 11 | (b560 − 1) e
17 | (b560 − 1). Como mdc(b, 561) = 1, concluimos que mdc(b, 3) = mdc(b, 11) =
mdc(b, 17) = 1. Aplicando o pequeno teorema de Fermat concluimos que
b2 ≡ 1 (mod 3), logo b560 = (b2 )280 ≡ 1 (mod 3);
b10 ≡ 1 (mod 11), logo b560 = (b10 )56 ≡ 1 (mod 11);

b16 ≡ 1 (mod 17), logo b560 = (b16 )35 ≡ 1 (mod 17).
Generalizaremos agora o procedimento do exemplo, de forma a provar, a partir

da fatoração de n, que n é um número de Carmichael.
Teorema 8.10 (teorema de Korselt). Seja n ≥ 3 ı́mpar composto. n é um

número de Carmichael se e somente se
(1) n é livre de quadrados.
56 8. APLICAÇÕES DA TEORIA DE GRUPOS
(2) Para todo fator primo p de n, (p − 1) | (n − 1).
Demonstração. Suponha que as 2 condições acima sejam satisfeitas. Seja

1 ≤ b < n inteiro tal que mdc(b, n) = 1. Afirmamos que para todo fator primo p
de n, temos bn−1 ≡ 1 (mod p).
De fato, como mdc(b, n) = 1, então mdc(b, p) = 1. Pelo pequeno teorema de
Fermat, bp−1 ≡ 1 (mod p). Por hipótese, existe k ∈ Z tal que n − 1 = k(p − 1),
logo bn−1 = (bp−1 )k ≡ 1 (mod p). Além disto temos que n fatora-se n = p1 · · · pr .
Como os pi ’s são distintos e para todo 1 ≤ i ≤ r, pi | (bn−1 − 1), concluimos que
n | (bn−1 − 1), i.e., bn−1 ≡ 1 (mod n).
Reciprocamente, seja p um fator primo de n e suponhamos que p2 | n. Observe
que
n−1
n−1
X n−1
(p − 1) = (−1)n−1−i pi ≡ (n − 1)(−1)n−2 p + 1 6≡ 1 (mod p2 ),
i=0
i
logo (p − 1)n−1 6≡ 1 (mod n), portanto n não pode ser um número de Carmichael.
Observe que efetivamente, mdc(p − 1, n) = 1, pois se este mdc fosse igual a d,
concluiriamos que d | 1, assim d = 1.
Para provar a validade da segunda condição precisamos do teorema da raiz
primitiva que provaremos na seção seguinte. Ele afirma que se p é um número
primo, então o grupo (Z/pZ)∗ é um grupo cı́clico.
De fato, seja a um gerador de (Z/pZ)∗ . Então mdc(a, n) = 1 e uma vez que
n é um número de Carmichael, temos an−1 ≡ 1 (mod n). A fortiori, an−1 ≡ 1
(mod p). Ou seja, an−1 = 1 em (Z/pZ)∗ . Logo, pelo lema chave, p − 1 = o(a) |
(n − 1).
8.11. Teorema da raiz primitiva

Seja n ≥ 3 inteiro ı́mpar. Provamos anteriormente que φ(n) < n, i.e., φ(n) ≤
n − 1. Note que φ(n) conta exatamente a quantidade de classes a ∈ (Z/nZ)∗ tais
que mdc(a, n) = 1. Assim, φ(n) = n − 1 se e somente se n é primo. Se existir
uma classe a ∈ (Z/nZ)∗ tal que o(a) = n − 1, então (pelo teorema de Lagrange)
(n − 1) | φ(n), logo vale n − 1 = φ(n). Portanto, se (Z/nZ)∗ for cı́clico, então n
é primo. O objetivo deste capı́tulo é mostrar a recı́proca deste resultado.
Teorema 8.12 (teorema da raiz primitiva). Se p é primo, então (Z/pZ)∗ é

cı́clico.
8.11. TEOREMA DA RAIZ PRIMITIVA 57
Note que (Z/4Z)∗ é cı́clico de ordem 2. Utilizando o teorema chinês dos restos
temos (como conseqüência do teorema da raiz primitiva) que (Z/2pZ)∗ também
é cı́clico para p primo.
Demonstração. Seja a1 ∈ (Z/pZ)∗ e d1 := o(a1 ). Se d1 = p − 1, acabou.
Senão, seja H1 o subgrupo cı́clico de (Z/pZ)∗ gerado por a1 . Temos que H1 $
(Z/pZ)∗ . Note que H1 coincide exatamente com as soluções de xd1 −1 em (Z/pZ)∗ .
Seja b1 ∈ (Z/pZ)∗ \ H1 . Pelo mesmo argumento da prova da proposição 9.40
temos que existe a2 ∈ (Z/pZ)∗ tal que o(a2 ) = mmc(o(a1 ), o(b1 )) > o(a1 ). Se
o(a2 ) = p − 1 acabou. Senão repetimos o argumento acima obtendo um elemento
a3 cuja ordem é estritamente maior que o(a2 ). Como todas essas ordens são no
máximo p − 1 não podemos ter uma seqüência estritamente crescente infinita de
números menores que p − 1. Portanto existe i tal que o(bi ) = p − 1.
Parte 2
Grupos
CAPı́TULO 9
Teoria de Grupos I
9.1. Definição e exemplos

Definição 9.2. Um grupo é um conjunto G munido de uma operação ∗ :
G × G → G dada por (x, y) 7→ x ∗ y satisfazendo às seguintes propriedades:
(1) (associatividade) para todo x, y, z ∈ G, x ∗ (y ∗ z) = (x ∗ y) ∗ z.
(2) (Elemento neutro) existe e ∈ G tal que e∗x = x∗e = x para todo x ∈ G.
(3) (Inverso) para todo x ∈ G existe y ∈ G tal que x ∗ y = y ∗ x = e.

O grupo G é dito abeliano ou comutativo se além disto x ∗ y = y ∗ x para todo
x, y ∈ G.
Em seguida daremos exemplos de grupos. Para fixar a notação suponha que

a operação seja de “multiplicação” e que o inverso de um elemento x ∈ G seja
denotado por x−1 .
Observação 9.3. Seja G um grupo e x, y ∈ G. Afirmamos que
(xy)−1 = y −1 x−1 .
De fato,
xy(y −1 x−1 ) = x(yy −1 )x−1 = xx−1 = 1

y −1 x−1 (xy) = y −1 (x−1 x)y = y −1 y = 1.
Definição 9.4. Um grupo G é dito finito se possui um número finito de

elementos, caso contrário é dito infinito. Se G for um grupo finito, o número de
elementos de G é chamado a ordem de G e denotado por #G.
Exemplo 9.5 (grupos abelianos infinitos). Z, Q, R, C e ∗ = +.
Exemplo 9.6 (grupos abelianos infinitos). Q \ {0}, R \ {0}, C \ {0} e ∗ = . .
61
62 9. TEORIA DE GRUPOS I
Exemplo 9.7. Seja

( ! )
a b
M2 (R) := | a, b, c, d ∈ R
c d
o conjunto das matrizes 2 × 2 com entradas reais. Este conjunto é um grupo com
a operação sendo a soma de matrizes. Seja
( ! )
a b
GL2 (R) := ∈ M2 (R) | ad − bc 6= 0 .
c d
Todas estas matrizes são inversı́veis com respeito à multiplicação de matrizes.

Assim GL2 (R) munido do produto de matrizes é um grupo chamado grupo line-
arem dimensão 2 sobre os reais. Ambos os grupos são infinitos. O primeiro é
abeliano. Notemos que GL2 (R) não é comutativo. De fato,
! ! !
0 1 1 0 1 1
= e
1 0 1 1 1 0
! ! !
1 0 0 1 0 1
= .
1 1 1 0 1 1
Exemplo 9.8. Seja G = Z/nZ e ∗ = ⊕. Este é um grupo abeliano de ordem

n. Seja G = (Z/nZ)∗ e ∗ = . Este é um grupo de ordem φ(n).
Exemplo 9.9. Denotamos por S∆ o grupo das simetrias do triângulo equi-

látero. A operação será ◦, a composição de funções. Fixemos os vértices do
triângulo no cı́rculo unitário
S1 := {z ∈ C | |z| = 1} por V1 = e2πi , V2 = e2πi/3 e V3 = e4πi/3 .
Cada simetria será uma função bijetiva f : {V1 , V2 , V3 } → {V1 , V2 , V3 } dada por
f (Vi ) = Vσ(i) , onde denotamos f na forma matricial por
!
1 2 3
.
σ(1) σ(2) σ(3)
Denotamos α := R2π/3 a rotação de 2π/3 que é dada por

!
1 2 3
α= .
2 3 1
9.1. DEFINIÇÃO E EXEMPLOS 63
A rotação de 4π/3, R4π/3 = R2π/3 ◦ R2π/3 que será denotada por α2 é dada por
!
1 2 3
α2 = .
3 1 2
Finalmente a rotação de 2π = 6π/3 nada mais é que id e é denotada por α3 ,

assim α3 = id. Além disto temos as simetrias em relação às retas que passam
pelos vértices e pelo centro do lado oposto, denotamos estas retas por li para
i = 1, 2, 3. Seja β := Sl3 a simetria em relação à reta l3 ,
!
1 2 3
β= .
2 1 3
Note que β 2 = id. Seja Sl1 a simetria em relação à reta l1 ,

!
1 2 3
Sl1 = .
1 3 2
Novamente Sl23 = id. Finalmente,

!
1 2 3
Sl2 =
3 1 2
e Sl22 = id. Assim, S∆ = {id, α, α2 , β, Sl1 , Sl2 }. Para provar que S∆ é um grupo
precisamos verificar as 3 propriedades da definição. A associatividade segue do
fato de composição de funções ser associativa. O elemento neutro segue do fato
que a composição da identidade com qualquer função ser a qualquer função. Basta
portanto verificar os inversos. De
α3 = αα2 = id
concluimos que
α−1 = α2 e que (α2 )−1 = α.
De
β 2 = ββ = id,
concluimos que
β −1 = β.
Antes de verificarmos os dois restantes calculemos
! ! !
1 2 3 1 2 3 1 2 3
αβ = = = Sl1 e
2 3 1 2 1 3 1 3 2
! ! !
1 2 3 1 2 3 1 2 3
α2 β = = = Sl2 .
3 1 2 2 1 3 3 2 1
Geometricamente já verificamos que (αβ)2 = (α2 β)2 = id, logo (αβ)−1 = αβ
e (α2 β)−1 = α2 β. Dessa forma S∆ é um grupo de ordem 6. Vamos ver isto
de forma puramente algébrica e aproveitar para mostrar que S∆ não é abeliano.
Calculemos,
! ! !
1 2 3 1 2 3 1 2 3
(9.9.1) βα = = = α2 β.
2 1 3 2 3 1 3 2 1
Pela observação 9.3 e por (9.9.1) temos que
(αβ)−1 = β −1 α−1 = βα2 = α2 βα = α4 β = αβ e
(α2 β)−1 = β −1 (α2 )−1 = βα = α2 β.
Exemplo 9.10. O grupo S das simetrias do quadrado. Denotamos os

vértices por
V1 = e2πi , V2 = eπi/2 , V3 = eπi e V4 = e3πi/2 .
Seja α := Rπ/2 a rotação por π/2 que é dada por
!
1 2 3 4
α= ,
2 3 4 1
a rotação de π é dada por
!
1 2 3 4
Rπ := α2 = ,
3 4 1 2
a rotação de 3π/2 é dada por
!
1 2 3 4
R3π/2 := α3 =
4 1 2 3
e a rotação de 2π é dada por R2π := α4 = id. Temos também a simetria em
relação às retas l1 , respectivamente l3 , passando por divindo ao meio os lados
V1 V4 e V2 V3 , respectivamente V1 V2 e V3 V4 . Assim,
!
1 2 3 4
β := Sl3 =
2 1 4 3
e !
1 2 3 4
Sl1 = .
4 3 2 1
9.1. DEFINIÇÃO E EXEMPLOS 65
Notemos que geometricamente β 2 = Sl21 = id. Finalmente temos as simetrias

em relação às diagonais d1 , respectivamente d2 , dada por V1 V3 , respectivamente
V2 V4 . Assim,
!
1 2 3 4
Sd1 =
1 4 3 2
e !
1 2 3 4
Sd2 = .
3 2 1 4
Novamente, geometricamente Sd21 = Sd22 = id. O conjunto S fica portanto dado
por S = {id, α, α2 , α3 , β, Sl1 , Sd1 , Sd2 }. Como no exemplo anterior, para provar
que é um grupo basta calcular os inversos. Inicialmente,
α4 = αα3 = α2 α2 = id,
logo
α−1 = α3 , (α3 )−1 = α e (α2 )−1 = α2 .
Os demais já foram calculados geometricamente. Mostraremos que este grupo
não é abeliano e refaremos os cálculos algebricamente. Calculemos,
! ! !
1 2 3 4 1 2 3 4 1 2 3 4
αβ = = = Sd1 ,
2 3 4 1 2 1 4 3 1 4 3 2
! ! !
1 2 3 4 1 2 3 4 1 2 3 4
α2 β = = = Sl1 e
3 4 1 2 2 1 4 3 4 3 2 1
! ! !
1 2 3 4 1 2 3 4 1 2 3 4
α3 β = = = Sd2 .
4 1 2 3 2 1 4 3 3 2 1 4
A primeira observação é que
! ! !
1 2 3 4 1 2 3 4 1 2 3 4
βα = = = α3 β.
2 1 4 3 2 3 4 1 3 2 1 4
Logo,
(αβ)−1 = β −1 α−1 = βα3 = α3 βα2 = α6 βα = α2 α3 β = αβ,
(α2 β)−1 = β −1 (α2 )−1 = βα2 = α3 βα = α6 β = α2 β e
(α3 β)−1 = β −1 (α3 )−1 = βα = α3 β.

9.11. Subgrupos
Definição 9.12. Seja G um grupo, um subconjunto H de G é dito um
subgrupo de G, se 1 ∈ H, dados x, y ∈ H, xy ∈ H e dado x ∈ H, x−1 ∈ H.
Exemplo 9.13. Seja G = Z e n ≥ 1. Note que nZ é um subgrupo de Z. De

fato, 0 = n.0 ∈ nZ, x = nk, y = nl, k, l ∈ Z, então x + y = n(k + l) ∈ nZ e
−x = n(−k) ∈ nZ. Afirmamos mais, que todo subgrupo de Z é da forma nZ
para algum n ≥ 1. De fato, seja H ⊂ Z um subgrupo. Por definição H ∩ N 6= ∅.
Seja n o menor elemento de H ∩ N. É claro que nZ ⊂ H, pela definição de H.
Reciprocamente, se x ∈ H ∩ N. Pelo algoritmo da divisão existem q, r ∈ Z tais
que x = nq + r com 0 ≤ r < n. Note que r = x − nq ∈ H. Assim r = 0 e x ∈ nZ.
Se x ∈ H e x < 0, seja y = −x ∈ H ∩ N. Pelo que foi feito anteriormente, y = kn,
em particular x = −y = (−k)n ∈ nZ.
Exemplo 9.14. Seja n ≥ 1 inteiro e
µn := {z ∈ C | z n = 1}.
Afirmamos que este é um subgrupo de C \ {0}. De fato, 1n = 1, logo 1 ∈ µn , se

x, y ∈ µn , então
(xy)n = xn y n = 1,
logo xy ∈ µn e se x ∈ µn , então x−1 C \ {0}, logo
(x−1 )n = (xn )−1 = 1
e x−1 ∈ µn . Este é um grupo abeliano chamado o grupo das raı́zes n-ésimas da

unidade. Seja ζ := e2πi/n , ζ ∈ µn e o menor inteiro positivo m ≥ 1 tal que
ζ m = 1 é n. Afirmamos que
µn = {1, ζ, · · · , ζ n−1 }.
De fato, a inclusão ⊃ é clara. Se z ∈ µn , então |z| = 1 e z = eiθ , onde θ = k2π

para k ∈ Z. Se k ≥ 1, então, pelo algoritmo da divisão, existem q, r ∈ Z tais que
k = qn + r com 0 ≤ r < n. Logo
z = ζ k = (ζ n )q ζ r = ζ r
e z ∈ {1, ζ, · · · , ζ n−1 }. Se k < 0, digamos k = −l, então ζ l ∈ {1, ζ, · · · , ζ n−1 }, e

z = ζ k = ζ −l = ζ n−l ∈ {1, ζ, · · · , ζ n−1 }. Finalmente, temos uma bijeção
µn → Z/nZ dada por ζ k 7→ k.

9.17. CLASSES LATERAIS E TEOREMA DE LAGRANGE 67
De fato, a sobrejetividade segue da definição de Z/nZ. E a injetividade uma vez

que se k = l, então n | (k − l), o que só é possı́vel se k = l.
Exemplo 9.15. Seja G := GL2 (R) e

( ! )
a 0
D2 (R) := | ad 6= 0
0 d
o conjunto das matrizes diagonais. Este é um subgrupo de GL2 (R), pois

!
1 0
∈ D2 (R),
0 1
se A, B ∈ D2 (R), digamos
! !
a 0 a0 0
A= eB= ,
0 d 0 d0
então !
aa0 0
AB = ∈ D2 (R),
0 dd0
!
a−1 0
A−1 = ∈ D2 (R).
0 d−1
Exemplo 9.16. Seja G := S , então {1, α, α2 , α3 } é um subgrupo de S ,

como também {1, β}.
9.17. Classes Laterais e Teorema de Lagrange

Definição 9.18. Seja G um grupo e H um subgrupo de G. Dados x, y ∈ G
definimos x ∼D y se e somente se x = yα, para algum α ∈ H. Definimos também
x ∼E y se e somente se x = αy para algum α ∈ H.
Observação 9.19. As relações binárias ∼E e ∼D são relações de equivalência.

De fato, x = x.1, logo x ∼D x. Se x ∼D y, então x = yα, para algum α ∈ H,
logo y = xα−1 e como H é um subgrupo de G, α−1 ∈ H, portanto y ∼D x. Se
x ∼D y e y ∼D z, então x = yα e y = zβ, para α, β ∈ H. Logo x = zβα e
βα ∈ H, pois H é um subgrupo de G, donde x ∼D z. Fica como exercı́cio fazer
a mesma demonstração para ∼E .
Definição 9.20. Dado x ∈ G denotamos por

xH := {xα | α ∈ H}
sua classe de equivalência com relação a ∼D , esta é chamada de classe lateral a
direita de x em H. Seja
CLD := {xH | x ∈ G}
o conjunto das classes laterais a direita de H em G. Similarmente, definimos a
classe lateral a esquerda de x em H por
Hx := {αx | α ∈ H}
e
CLE := {Hx | x ∈ G}
o conjunto das classes laterais a esquerda de H em G.
Lema 9.21. Existe uma bijeção

ϕ : CLD → CLE dada por ϕ(xH) = Hx−1 .
Demonstração. Dado y ∈ G, existe x ∈ G tal que y = x−1 , logo Hy =

Hx−1 = ϕ(xH) e ϕ é sobrejetiva. Se ϕ(xH) = ϕ(yH), então Hx−1 = Hy −1 , i.e.,
existe α ∈ H tal que x−1 = αy −1 , i.e., x = yα, i.e., x ∼D y, i.e., xH = yH,
portanto ϕ é injetiva.
A partir de agora nesta seção suponhamos que G seja um grupo finito. Ob-
serve que
·
[ ·
[
(9.21.1) G= xH = Hx.
x∈G x∈G
Concluimos que o número de classes laterais (a direita ou a esquerda) de H em

G também é finito. Denotamos este número por (G : H) e chamamos o ı́ndice de
H em G.
Lema 9.22. Para todo x ∈ G, existe uma bijeção

ψ : H → xH dada por α 7→ xα.
Demonstração. Pela definição de xH concluimos que ψ é sobrejetiva. Se

ψ(α) = ψ(β), i.e., xα = xβ, multiplicando os dois lados por x−1 a esquerda,
obtemos que α = β, portanto, ψ é injetiva.
9.25. ORDEM DE ELEMENTO E EXPOENTE DE GRUPO ABELIANO 69
Teorema 9.23 (teorema de Lagrange). Seja G um grupo finito e H um

subgrupo de G. Então
#G = (G : H)|H|.
Demonstração. Segue imediatamente de (9.21.1) e do lema 9.22.
Corolário 9.24. Seja H um grupo finito e H um subgrupo de G. Então |H|

divide |G|.
9.25. Ordem de elemento e expoente de grupo abeliano

Definição 9.26. Seja G um grupo e x ∈ G. Definimos
o(x) := min{n ≥ 1 | xn = 1, n ∈ Z}
ou o(x) = ∞ caso não exista n ≥ 1 inteiro satisfazendo xn = 1. O número o(x)
é chamado a ordem de x.
Exemplo 9.27. Seja G = Z e x = 1. Como para todo n ≥ 1, nx 6= 0,

concluimos que o(1) = ∞.
Lema 9.28 (lema chave). Seja x ∈ G de ordem n. Suponha que exista t ≥ 1

tal que xt = 1. Então n | t.
Demonstração. Pelo algoritmo de euclides existem q, r ∈ Z tais que t =

qn + r com 0 ≤ r < n. Logo
1 = xt = xqn xr = xr ,
assim pela definição da ordem de x concluimos que r = 0.
Exemplo 9.29. Seja G := µn para n ≥ 1 inteiro e x := ζ = e2πi/n . Então

o(ζ) = n. Afirmamos mais ainda que
o(ζ i ) = n se e somente se mdc(i, n) = 1 para 0 ≤ i < n.
De fato, se mdc(i, n) = d > 1, então i = di0 e n = dn0 com n0 < n. Por outro lado
0 0 0 0 0 0
(ζ i )n = ζ in = ζ i dn = ζ i n = (ζ n )i = 1,
mas isto contradiz o(ζ i ) = n. Reciprocamente, suponha que 1 ≤ o(ζ i ) = m < n.
Então ζ im = 1, i.e., pelo lema chave im = kn para algum k ≥ 1 inteiro. Como
m < n, então existe algum fator primo p de n tal que p | i, logo mdc(i, n) > 1.
Além disto temos uma bijeção entre
Pn := {ζ i | mdc(i, n) = 1}
e (Z/nZ)∗ dada por ζ i 7→ i. Por definição de (Z/nZ)∗ esta aplicação é sobrejetiva

e a injetividade segue de i = j implicar em n | (i − j) o que apenas ocorre se
i = j. O conjunto Pn é chamado o conjunto das raı́zes primitivas n-ésimas da
unidade. Mostramos em particular que #Pn = φ(n).
Exemplo 9.30. Seja G = GL2 (R) e

!
0 1
x= .
1 0
É imediato verificar que o(x) = 2.
Exemplo 9.31. Seja G := S e x = α, então o(α) = 4.
Observação 9.32. Seja G um grupo e suponha que para todo x ∈ G, o(x) =

2. Então G é abeliano. De fato, o(x) = 2 significa que x2 = 1, i.e., x−1 = x.
Assim,
xy = x−1 y −1 = (yx)−1 = yx.
Definição 9.33. Seja G um conjunto e S um subonjunto de G contendo 1.

Seja
hSi := {x1 · · · xr | ai ∈ S ou a−1
i ∈ S}.
Lema 9.34. hSi é um subgrupo de G.
Demonstração. De fato, 1 ∈ hSi. Se x, y ∈ hSi, então x = x1 · · · xr com

xi ∈ S ou x−1
i ∈ S e y = y1 · · · ys tal que jj ∈ S ou yj−1 ∈ S. Logo xy ∈ hSi.
Finalmente, se x ∈ S, então
x−1 = x−1 −1
r · · · x1
e x−1 −1 −1
i ∈ S ou (xi ) = xi ∈ S. Logo x−1 ∈ hSi.
Definição 9.35. O subgrupo hSi é chamado o subgrupo de G gerado por

S. Estamos particularmente interessados no caso em que S = {α}. Neste caso
dizemos que o grupo hSi é um grupo cı́clico. Distinguimos duas situações. Na
primeira o(α) = n < ∞. Neste caso, hαi = {1, α, · · · , αn−1 } e este conjunto
corresponde bijetivamente a Z/nZ por αi 7→ i. O segundo caso é aquele no qual
o(α) = ∞. Neste caso hαi = {αr | r ∈ Z} e corresponde bijetivamente a Z por
αr 7→ r.
Corolário 9.36 (corolário 2 do teorema de Lagrange). Seja G um grupo

finito e x ∈ G. Então o(x) | #G.
9.25. ORDEM DE ELEMENTO E EXPOENTE DE GRUPO ABELIANO 71
Demonstração. Pelo exemplo anterior, o(x) < ∞ e o(x) = #hxi. Pelo

teorema de Lagrange #hxi | #G.
Definição 9.37. Seja G um grupo abeliano. Definimos o expoente de G por
exp(G) := mmc{o(z) | z ∈ G} ou ∞, se existir z ∈ G tal que o(z) = ∞.
Observação 9.38. É claro que se G é finito, então exp(G) < ∞. Mas a

recı́proca não é verdade. Por exemplo se G = Z/2Z × . . . Z/2Z × . . ., então para
cada x ∈ G \ {1}, onde 1 = (0, · · · , 0, · · · ), o(x) = 2, logo exp(G) = 2, mas G é
infinito.
Proposição 9.39. Seja G um grupo abeliano e z1 , · · · , zr ∈ G tais que o(zi ) <
∞ para todo i. Então
(i) o(z1 · · · zr ) | mmc{o(z1 ), · · · , o(zr )} | o(z1 ) · · · o(zr ).
(ii) Se para todo i 6= j, mdc(o(zi ), o(zj )) = 1, então o(z1 · · · zr ) = o(z1 ) · · ·
o(zr ).
Demonstração. (i) Seja M := mmc{o(z1 ), · · · , o(zr )}. Então, (z1 · · · zr )M =
z1M · · · zrM = 1, pelo lema chave concluimos que o(z1 · · · zr ) | M . A outra divisibi-
lidade é imediata.
(ii) A segunda igualdade é uma propriedade dos inteiros positivos (basta lem-
brar que o mmc é obtido tomando o maior expoente na fatoração em números
primos). Vamos provar a primeira igualdade por indução em r. A primeira etapa
é provar para r = 2.
Seja N := o(z1 z2 ). Como G é abeliano, então
1 = (z1 z2 )N = z1N z2N , i.e. , z1−N = z2N .
Mas isto significa que z1−N = z2N ∈ hz1 i ∩ hz2 i, mas esta interseção é igual a {1},
pois mdc(o(z1 ), o(z2 )) = 1. Portanto, z1N = z2N = 1, mas isto implica que M | N .
Suponhamos que tenhamos provado que o(z1 · · · zr−1 ) = o(z1 ) · · · o(zr−1 ) com
mdc(o(zi ), o(zj )) = 1 para i 6= j. Utilizando que G é abeliano, e estendo a
definição de N para r fatores, temos que
1 = (z1 . . . zr−1 )N zrN , i.e. , (z1 . . . zr−1 )N = zr−N .
Mas isto significa que (z1 . . . zr−1 )N = zr−N ∈ hz1 , · · · , zr−1 i ∩ hzr i, mas este
grupo é trivial pois a ordem do primeiro grupo é igual a o(z1 ) . . . o(zr−1 ) e a
ordem do segundo é igual a o(zr ) e mdc(o(zi ), o(zj )) = 1, se i 6= j. Assim,
(z1 . . . zr−1 )N = zrN = 1, donde M | N .
Observe que pelo teorema de Lagrange, se G for finito, então exp(G) | #G.
Proposição 9.40. Seja G um grupo abeliano tal que exp(G) < ∞. Então
(a) Existe y ∈ G tal que exp(G) = o(y).
(b) G é cı́clico se e somente se exp(G) = #G.
Demonstração. (a) Seja exp(G) = pe11 · · · perr a fatoração de exp(G). Por

definição para todo i = 1, · · · , r existe yi ∈ G tal que o(yi ) = pei i qi tal que pi - qi .
Note que se zi = yiqi , então o(zi ) = pei i . Neste caso, pelo ı́tem (ii) da proposição
9.39 temos que se y = z1 · · · zr , então o(y) = exp(G).
(b) Se G for cı́clico, então existe x ∈ G tal que hxi = G e o(x) = #G.
Por outro lado, pelo ı́tem anterior, existe y ∈ G tal que o(y) = exp(G). Mas,
exp(G) | #G e o(x) | exp(G), logo exp(G) = #G. Reciprocamente, se vale a
igualdade, pelo ı́tem anterior existe y ∈ G tal que o(y) = exp(G) = #G, logo G
é cı́clico.
CAPı́TULO 10
Teoria de grupos II
10.1. Subgrupos normais e grupos quocientes

Seja G um grupo e H um subgrupo de G. Seja
G/H := {xH | x ∈ G}
o conjunto das classes laterais a direita de H em G. Analogamente ao caso em que

G = Z e H = nZ, para n ≥ 1 inteiro, queremos definir em G/H uma estrutura de
grupo. Para isto precisamos de uma propriedade adicional de H. Se copiarmos
o que foi feito anteriormente a idéia é definir a função
ψ : G/H × G/H → G/H
dada por
(xH, yH) 7→ xyH.
O problema é verificar que ψ está bem definida. Sejam x0 , y 0 ∈ G tais que

x0 H = xH e y 0 H = yH, i.e., x0 = xα e y 0 = yβ para α, β ∈ H. Assim
x0 y 0 = xαyβ.
Mas a princı́pio G não é comutativo e não podemos trocar y com α para concluir
que ψ está bem definida.
Definição 10.2. Um subgrupo H de um grupo G é dito normal se e somente

se para todo x ∈ G temos xHx−1 ⊂ H. Denotamos H C G.
Lema 10.3. Seja G um grupo e H um subgrupo de G. As seguintes condições

são equivalentes:
(i) H C G.
(ii) Para todo x ∈ G, xHx−1 = H.
(iii) Para todo x ∈ G, xH = Hx.
73
74 10. TEORIA DE GRUPOS II
Demonstração. Suponha que H C G. A inclusão ⊂ já está feita por de-

finição. Uma vez que (x−1 )−1 = x, segue também da definição que x−1 Hx ⊂ H,
i.e., H ⊂ xHx−1 . Assim vale (ii).
Suponha que para todo x ∈ G, xHx−1 = H. Seja α ∈ H. Por hipótese
xαx−1 = β ∈ H, logo xα = βx ∈ Hx. Reciprocamente, como x−1 αx = γ ∈ H,
então αx = xγ ∈ xH. Disto segue (iii).
Suponha que para todo x ∈ G, xH = Hx. Por hipótese para todo α ∈ H
existe β ∈ H tal que xαx−1 = βxx−1 = β. Donde (i).
Suponhamos que H C G, pelo lema 10.3, existe γ ∈ H tal que
x0 y 0 = xαyβ = xyγβ ∈ xyH,
pois γβ ∈ H. Assim x0 y 0 H = xyH e ψ está bem definida.
Definição 10.4. Seja G um grupo e H C G um subgrupo de normal de G. O

conjunto G/H e a função ψ definem uma estrutura de grupo em G/H chamado
o grupo quociente.
Exemplo 10.5. Seja G um grupo finito e H um subgrupo de G. Suponha

que (G : H) = 2. Afirmamos que H C G. De fato, como (G : H) = 2, isto
significa que temos apenas suas classes laterais a direita, a saber, H e xH para
x∈ / H. Também sabemos que o número de elementos de CLD é igual ao de CLE,
logo as únicas classes laterais a direita são H e Hx, como Hx 6= H e xH 6= H,
concluimos que xH = Hx, para todo x ∈ G − H. Esta igualdade também é
imediata se x ∈ H. Logo H C G.
Exemplo 10.6. Seja G = S e H = {1, α, α2 , α3 }. Temos que H C G, pois

(G : H) = |G|/|H| = 2, pelo teorema de Lagrange e pelo exemplo anterior.
Exemplo 10.7. Seja G um grupo. Definimos por

Z(G) := {x ∈ G | xy = yx para todo y ∈ G},
o centro de G. Afirmamos que Z(G) C G.
Primeiro temos que verificar que Z(G) é realmente um subgrupo de G. De
fato, 1.y = y.1 = y para todo y ∈ G, logo 1 ∈ Z(G). Se x, z ∈ Z(G) e y ∈ G,
então xzy = xyz = yxz, i.e., xz ∈ Z(G). Se x ∈ Z(G), então para todo y ∈ G,
x−1 y = (y −1 x)−1 = (xy −1 )−1 = yx−1 , i.e., x−1 ∈ Z(G).
Finalmente, dado x ∈ G e y ∈ Z(G), temos que xyx−1 = yxx−1 = y ∈ Z(G),
i.e., Z(G) C G. Podemos ainda dizer mais, se H é um subgrupo de Z(G) então
10.10. HOMOMORFISMO DE GRUPOS 75
H C G. De fato, automaticamente H é um subgrupo de G, além disto como para

todo x ∈ G e y ∈ H temos que xyx−1 = yxx−1 = y ∈ H, pois H ⊂ Z(G).
Note que G é abeliano se e somente se Z(G) = G. Assim, o quanto maior for
o centro de G, mais G estará próximo a ser abeliano.
Exemplo 10.8. Seja G um grupo. Denotamos por [G, G] o subgrupo de G

gerado pelo conjunto
{xyx−1 y −1 | x, y ∈ G}.
Este grupo é chamado o subgrupo dos comutadores.
Note que G é abeliano se e somente se [G, G] = {1}. Assim, o quanto menor
for o subgrupo dos comutadores, mais G estará próximo a ser abeliano.
Afirmamos também que [G, G] C G. Seja α ∈ [G, G], digamos
α = α1 · · · αr ,
onde para todo i,
αi = xi yi x−1 −1
i yi ou αi−1 = xi yi x−1 −1
i yi ,
para xi yi ∈ G. A última igualdade se reescreve como αi = yi xi yi−1 x−1

i . Seja
z ∈ G, então
zyz −1 = zα1 z −1 · · · zαr z −1
e observe que para cada i temos
zαi z −1 = zxi yi x−1 −1 −1
i yi z ∈ {xyx−1 y −1 | x, y ∈ G} ou
zαi z −1 = zyi xi yi−1 x−1
i z
−1
∈ {xyx−1 y −1 | x, y ∈ G}.
Observação 10.9. Observe também que G/[G, G] é um grupo abeliano.

Além disto, se H C G for tal que G/H é abeliano, então H contém [G, G]. De
fato, se dados x, y ∈ G temos xyH = xHyH = yHxH = yxH, então existe
α ∈ H tal que x−1 y −1 xy ∈ H. Consequentemente, todo elemento de [G, G] está
contido em H.
10.10. Homomorfismo de grupos

Sejam G e G dois grupos. O objetivo é compará-los e verificar que suas
estruturas são as mesmas.
Definição 10.11. Um homomorfismo de grupos é uma função f : G → G tal

que f (xy) = f (x)f (y).
Observação 10.12. (a) Seja 1G o elemento neutro de G e 1G o elemento

neutro de G. Então f (1G ) = 1G . De fato, f (1G ) = f (1G 1G ) = f (1G )
f (1G ), logo f (1G ) = 1G .
(b) Para todo x ∈ G temos que f (x−1 ) = f (x)−1 . De fato, f (x)f (x−1 ) =
f (xx−1 ) = f (1G ) = 1G e f (x−1 )f (x) = f (x−1 x) = f (1G ) = 1G .
Exemplo 10.13. (1) Seja G = G = Z, n ≥ 1 inteiro e f : Z → Z definida

por f (x) = nx. f é um homomorfismo. De fato, f (x + y) = n(x + y) =
nx + ny = f (x) + f (y).
(2) Seja G um grupo e H um subgrupo normal de G e f : G → G/H
definida por f (x) = xH é um homomorfismo. De fato, f (xy) = (xy)H =
(xH)(yH) = f (x)f (y), por definição de produto de classes.
(3) Seja G um grupo e fixemos a ∈ G. Consideremos a função Ia : G → G
definida por Ia (x) = axa−1 . Esta função é um homomorfismo. De fato,
Ia (xy) = a(xy)a−1 = (axa−1 )(aya−1 ) = Ia (x)Ia (y).
A partir de agora deixaremos ao cargo do leitor identificar quando a unidade

referida por 1 está em G ou em G.
Proposição 10.14. Seja f : G → G um homomorfismo de grupos e
ker(f ) := {x ∈ G | f (x) = 1}
o núcleo de f .
(i) ker(f ) C G.
(ii) f é injetiva se e somente se ker(f ) = {1}.
(iii) f (G) é um subgrupo de H.
(iv) f −1 (f (H)) = H ker(f ).
(v) Seja H < G tal que f −1 (H) ⊃ ker(f ). Então f (f −1 (H)) = H ∩ f (G).
(vi) Se x ∈ G é tal que o(x) < ∞ então o(f (x)) < ∞ e o(f (x)) | o(x).
(vii) Se H C G, então f (H) C f (G). Se H C f (G), então f −1 (H) C G.
Demonstração. (i) Seja a ∈ G e x ∈ ker(f ), então f (axa−1 ) = f (a)f (x)

f (a−1 ) = f (a)f (a)−1 = 1, i.e., axa−1 ∈ ker(f ).
(ii) Suponha que f seja injetiva e x ∈ ker(f ). Logo f (x) = 1 = f (1), i.e.,
x = 1. Reciprocamente, se ker(f ) = {1} e se f (x) = f (y), então f (x)f (y)−1 =
f (xy −1 ) = 1, i.e., xy −1 ∈ ker(f ), logo xy −1 = 1, i.e., x = y.
(iii) É claro que 1 = f (1) ∈ f (G). Sejam x, y ∈ f (G), i.e., existem a, b ∈ G

tais que x = f (a) e y = f (b). Logo xy = f (a)f (b) = f (ab) ∈ f (G). Se x ∈ f (G),
digamos x = f (a) para a ∈ G, então x−1 = f (a)−1 = f (a−1 ) ∈ f (G).
Para provar a propriedade (iv) precisamos do seguinte lema.
Lema 10.15. Sejam H e K subgrupos de um grupo G. Definimos
HK := {ab | a ∈ H, b ∈ K}.
Então HK < G se e somente se HK = KH. Além disto, se H C G ou K C G,

então HK < G.
Demonstração. Suponha que HK < G. Seja α ∈ HK. Então α−1 ∈ HK,

digamos α−1 = ab. Assim α = (α−1 )−1 = b−1 a−1 ∈ KH, i.e., HK ⊂ KH. Seja
α ∈ KH, digamos α = ab. Logo α−1 = b−1 a−1 ∈ HK. Como HK < G, então
α = (α−1 )−1 ∈ HK, i.e., KH ⊂ HK.
Reciprocamente, suponha que HK = KH. Então 1 = 1.1 ∈ HK. Se x, y ∈
HK, digamos x = ab e y = cd, então xy = abcd = ac0 b0 d ∈ HK, onde bc = c0 b0 ∈
HK, uma vez que HK = KH. Se x = ab ∈ HK, então x−1 = b−1 a−1 = a0 b0 ∈
HK, pela mesma razão.
Suponha que H C G (o outro caso é análogo). Seja x = ab ∈ HK. Então
x = bb−1 ab = b(b−1 ab) = ba0 ∈ KH, logo HK ⊂ KH. Se x = ab ∈ KH, então
x = abaa−1 = (aba−1 )a = b0 a ∈ HK, i.e., KH ⊂ HK.
Continuação da prova da proposição. (iv) Notemos inicialmente que

como ker(f ) C G, H ker(f ) < G. Seja a ∈ f −1 (f (H)), i.e., f (a) = f (b) ∈
f (H). Logo f (a)f (b)−1 = f (ab−1 ) = 1, i.e., ab−1 = c ∈ ker(f ), i.e., a = bc =
c0 b0 ∈ H ker(f ). Reciprocamente, se x = ab ∈ H ker(f ), então f (x) = f (ab) =
f (a)f (b) = f (a) ∈ f (H), i.e., x ∈ f −1 (f (H)).
(v) Seja x ∈ f (f −1 (H)), i.e., x = f (a) para a ∈ f −1 (H), i.e., f (a) = y ∈ H.
Portanto, x ∈ H ∩ f (G). Reciprocamente, suponha que x ∈ H ∩ f (G). Logo
x = f (a) ∈ H, i.e., a ∈ f −1 (H), logo x ∈ f (f −1 (H)).
(vi) Seja d = o(x), logo xd = 1 e f (xd ) = f (x)d = f (1) = 1, pelo lema chave,
o(f (x)) | o(x), em particular o(f (x)) < ∞.
(vii) Suponha que H C G e sejam a ∈ G e x ∈ H. Logo axa−1 ∈ H. Por outro
lado, f (x) ∈ f (H) e f (a) ∈ f (G) ⊂ G. Assim, f (axa−1 ) = f (a)f (x)f (a)−1 ∈
f (H). Suponha que H C f (G). Sejam x ∈ f −1 (H) e a ∈ G, i.e., f (x) = y ∈ H.
Como H C f (G), então f (a)yf (a)−1 ∈ H, mas f (a)yf (a)−1 = f (axa−1 ), i.e.,
axa−1 ∈ f −1 (H).
Definição 10.16. Seja f : G → G um homomorfismo de grupos. Se f é

bijetivo dizemos que f é um isomorfismo de grupos.
Teorema 10.17 (teorema do isomorfismo de grupos). Seja f : G → G um ho-

momorfismo de grupo. Então f induz um isomorfismo de grupos ϕ : G/ ker(f ) →
f (G) definido por
ϕ(x ker(f )) := f (x).
Além disto existe uma bijeção entre os seguintes conjuntos
{H < G | H ⊃ ker(f )} e {H < f (G)}.
Demonstração. Notemos inicialmente que ϕ está bem definido. De fato, se

x = ya para a ∈ ker(f ), então ϕ(x ker(f )) = f (x) = f (ya) = f (y)f (a) = f (y) =
ϕ(y ker(f )). Além disto, pela sua própria definição ϕ é sobrejetivo. Quanto a
injetividade, se ϕ(x ker(f )) = ϕ(y ker(f )), então f (x) = f (y), i.e., f (x)f (y)−1 =
f (xy −1 ) = 1, i.e., xy −1 ∈ ker(f ), logo x ker(f ) = y ker(f ).
A bijeção entre os dois conjuntos é dada pelas funções ψ1 : H 7→ f (H) e ψ2 :
H 7→ f −1 (H). De fato, ψ2 ◦ ψ1 (H) = ψ2 (f (H)) = f −1 (f (H)) = H ker(f ) = H,
pois H ⊃ ker(f ). Reciprocamente, ψ1 ◦ ψ2 (H) = ψ1 (f −1 (H)) = f (f −1 (H)) =
H ∩ f (G) = H, pois H < f (G).
Corolário 10.18. Seja f : G → G um homomorfismo de grupos e H < G.

Então existe um isomorfismo de grupos
H
ψ: → f (H) dado por ψ(x(H ∩ ker(f ))) := f (x).
(H ∩ ker(f ))
Demonstração. É imediato verificar que ker(f ) ∩ H C H. Logo o grupo
quociente faz sentido. A função ψ está bem definida, pois se x = ya para
a ∈ H ∩ ker(f ), então ψ(x(ker(f ) ∩ H)) = f (x) = f (ya) = f (y)f (a) = f (y) =
ψ(y(ker(f )∩H)). Por definição ψ é sobrejetiva. Se ψ(x(ker(f )∩H)) = ψ(y(ker(f )∩
H)), então f (x) = f (y), i.e., f (xy −1 ) = f (x)f (y)−1 = 1, i.e., xy −1 ∈ ker(f ) ∩
H.
Proposição 10.19. Seja H C G e

G
f :G→ o homomorfismo quociente f (x) := xH.
H
Existe uma bijeção entre os conjuntos

{K C G | K ⊃ H} e {H C G/H}.
Demonstração. Definimos as funções que dão a bijeção por ψ1 : K 7→

K/H e ψ2 : H 7→ f −1 (H). De fato, ψ2 ◦ ψ1 (K) = ψ2 (K/H) = f −1 (K/H) =
f −1 (f (K)) = K ker(f ) = KH = K, pois K ⊃ H e ψ1 ◦ ψ2 (H) = ψ1 (f −1 (H)) =
f (f −1 (H)) = H ∩ f (G) = H ∩ G/H = H.
Proposição 10.20. Sejam G um grupo, H C G e K < G. Então existe um

isomorfismo de grupos
K KH
ϕ: → .
(K ∩ H) H
Demonstração. Seja f : K → KH/H o homomorfismo quociente f (x) :=
xH. Afirmamos que f é sobrejetivo. De fato, se abH ∈ KH/H, então abH =
aH = f (a). Afirmamos também que ker(f ) = H ∩ K. De fato, se a ∈ ker(f ),
então f (a) = aH ∈ H, i.e., a ∈ H ∩ K. Portanto, o resultado é uma conseqüência
do teorema do isomorfismo.
Proposição 10.21. Sejam K < H < G grupos com H C G e K C G (em

particular K C H). Então existe um isomorfismo de grupos
G/K G
ϕ: → .
H/K H
Demonstração. Seja f : G/K → G/H definida por f (xK) := xH. Ob-
servemos que f está bem definida. Seja x = ya para a ∈ K. Então f (xK) =
xH = (ya)H = (yH)(aH) = yH, pois a ∈ K ⊂ H. ker(f ) = {xK | xH = H} =
{xK | x ∈ H} = H/K. f é sobrejetiva por definição. Assim o resultado segue do
teorema do isomorfismo.
Definição 10.22. Seja G um grupo. Um homomorfismo de grupos f : G →

G é chamado um endomorfismo de grupos e denotamos por End(G) o conjunto
dos endomorfismos de G que é um monóide com respeito à composição de funções.
Um monóide tem todas as propriedades de grupo exceto a existência do inverso.
Se f for bijetivo então dizemos que f é um automorfismo de G e denotamos por
Aut(G) o conjunto dos automorfismos de G. Este é um grupo com respeito à
composição de funções.
Observação 10.23. Para todo a ∈ G, Ia : G → G definida por Ia (x) :=

axa−1 é um automorfismo de G chamado um automorfismo interno de G. O
conjunto G := {Ia | a ∈ G} dos automorfismos internos de G também é um

grupo com respeito à composição de funções. Fica como exercı́cio mostrar que
I(G) C Aut(G).
Definição 10.24. Seja G um grupo e H < G. Dizemos que H é um subgrupo

caracterı́stico de G se para todo σ ∈ Aut(G) temos σ(H) ⊂ H, i.e., para todo
x ∈ H, σ(x) ∈ H.
Observação 10.25. Notemos que se H for subgrupo caracterı́stico de G,

então H C G, pois a última afirmativa equivale a dizer que Ia (H) ⊂ H para todo
a ∈ H.
Proposição 10.26. Se K for subgrupo caracterı́stico de H e H C G, então

K C G.
Demonstração. Queremos mostrar que para todo a ∈ G, Ia (K) ⊂ K. A

restrição de Ia a H nos dá uma função Ja : H → G definida por Ja (x) := axa−1 .
Por hipótese H C G, logo axa−1 ∈ H e Ja ∈ Aut(H) (não podemos garantir que
Ja ∈ I(H), pois não necessariamente a ∈ H). Por hipótese, K é caracterı́stico
em H, logo Ja (K) = Ia|H (K) = K.
10.27. Produtos de grupos

10.27.1. Produto direto. Sejam G1 , · · · , Gn grupos. Definimos no produto
cartesiano G1 × . . . × Gn uma estrutura de grupo da seguinte forma:
(x1 , · · · , xn ).(y1 , · · · , yn ) := (x1 y1 , · · · , xn yn ).
É fácil verificar que esta operação é associativa, o elemento neutro é (1, · · · , 1) e o

inverso de (x1 , · · · , xn ) é (x−1 −1
1 , · · · , xn ). Assim o conjunto G1 × . . . × Gn passa a
ter uma estrutura de grupo e é chamado o produto direto dos grupos G1 , · · · , Gn
e é denotado por G1 ⊕ . . . ⊕ Gn .
Teorema 10.28. Sejam G, G1 , · · · , Gn grupos. Então G ∼ = G1 ⊕ . . . ⊕ Gn se

e somente se existem subgrupos H1 , · · · , Hn de G tais que para todo i, Hi ∼= Gi ,
e além disto
(1) G = H1 . . . Hn .
(2) Hi C G para todo i = 1, · · · , n.
(3) Hi ∩ (H1 . . . Hi1 Hi+1 . . . Hn ) = {1} para todo i = 1, · · · , n.
10.27. PRODUTOS DE GRUPOS 81
Demonstração. Suponhamos que exista um isomorfismo ϕ : G → G1 ⊕

. . . ⊕ Gn . Seja
Hi := ϕ−1 ({1} × . . . × Gi × . . . {1}).
Definimos a seguinte função
ϕi : Hi → Gi dada por ϕi (xi ) := yi ,
onde xi = ϕ((1, · · · , yi , · · · , 1)). Esta função é um isomorfismo de grupos. De
fato, se zi = ϕ−1 ((1, · · · , wi , · · · , 1)), então
ϕi (xi zi ) = yi wi = ϕi (xi )ϕi (yi ),
pois xi zi = ϕ−1 ((1, · · · , zi wi , · · · , 1)). Além disto ϕi é injetiva, pois se yi = 1,
então xi = 1. Finalmente é sobrejetiva pois para todo yi ∈ Gi , xi = ϕ−1 ((1, · · · , yi , · · · ,
1)) e ϕi (xi ) = yi .
(1) Dado x ∈ G seja ϕ(x) := (x1 , · · · , xn ). Então ϕ(x) = (x1 , · · · , 1). . . . .(1, · · ·
, xn ). Seja yi = ϕ−1 ((1, · · · , xi , · · · , 1)), então x = y1 . . . yn , onde yi ∈ Hi para
todo i = 1, · · · , n.
(2) Seja x ∈ G e yi ∈ Hi temos que provar que xyi x−1 ∈ Hi . Calculemos
ϕ(xyi x−1 ) = ϕ(x)ϕ(yi )ϕ(x)−1 = (x1 , · · · , xn ).(1, · · · , zi , · · · , 1).(x−1 −1
1 , · · · , xn )
−1 −1
= (x1 x−1 −1
1 , · · · , xi zi xi , · · · , xn xn ) = (1, · · · , xi zi xi , · · · , 1).
Portanto, xyi x−1 = ϕ−1 ((1, · · · , xi zi x−1

i , · · · , 1)) ∈ Hi .
(3) Seja xi ∈ Hi ∩ (H1 . . . Hi−1 Hi+1 . . . Hn ). Assim, por um lado xi = ϕ−1 ((1,
· · · , yi , · · · , 1)) e por outro lado xi = ϕ−1 ((z1 , · · · , zi−1 , 1, zi+1 , · · · , zn )). Como
ϕ é um isomorfismo concluimos que zj = 1 para todo j e que yi = 1, portanto
xi = 1.
Reciprocamente, suponhamos que as 3 condições acima sejam satisfeitas. Para
provar a recı́proca utilizaremos o ı́tem 2 do lema seguinte. Afirmamos que G ∼ =
H1 ⊕ . . . ⊕ Hn . De fato, consideremos a função
ψ : G → H1 ⊕ . . . ⊕ Hn dada por ψ(x) = ψ(x1 . . . xn ) := (x1 , · · · , xn ).
Esta função é um isomorfismo. Observe que pelo lema abaixo
ψ(xy) = ψ(x1 . . . xn y1 . . . yn ) = ψ(x1 y1 x2 . . . xn y2 . . . yn ) = · · · = ψ(x1 y1 . . . xn yn )
= (x1 y1 , · · · , xn yn ) = (x1 , · · · , xn ).(y1 , · · · , yn ) = ψ(x)ψ(y).
Se ψ(x) = (1, · · · , 1), então x = 1 . . . 1 = 1, logo ψ é injetiva. Para todo
(x1 , · · · , xn )
∈ H1 ⊕ . . . ⊕ Hn se x = x1 · · · xn temos que ψ(x) = (x1 , · · · , xn ), logo ψ é

sobrejetiva.
Lema 10.29. As 3 condições acima são equivalentes às seguintes duas condi-
ções:
(a) Para todo x ∈ G existem únicos xi ∈ Hi para i = 1, · · · , n tais que
x = x1 . . . xn .
(b) Para todo i 6= j, x ∈ Hi e y ∈ Hj , xy = yx.
Demonstração. Suponha que as 3 condições anteriores sejam satisfeitas.

Assim para todo x ∈ G podemos escrever x = x1 . . . xn . Suponhamos que x =
y1 . . . yn , então
y1−1 x1 = y2 . . . yn x−1 −1
n . . . x2 .
Como Hi C G temos que para todo x ∈ G, xHi = Hi x, i.e., dado αi ∈ Hi temos

que xαi = βi x para algum βi ∈ Hi . Logo
(yn x−1 −1 −1
n )xn−1 = zn−1 (yn xn )
para algum zn−1 ∈ Hn−1 . Repetindo o argumento concluimos que
y1−1 x1 = y2 . . . yn x−1 −1 −1
n . . . x2 = z2 . . . zn−1 (yn xn ) ∈ H2 . . . Hn ∩ H1 = {1},
portanto x1 = y1 . Pelo mesmo argumento xi = yi para todo i = 2, · · · , n.

Como Hi , Hj C G temos que xyx−1 ∈ Hj , logo xyx−1 y −1 ∈ Hj e yx−1 y −1 ∈
Hi , logo xyx−1 y −1 ∈ Hi , portanto xy = yx, já que
Hi ∩ Hj ⊂ Hi ∩ (H1 . . . Hi−1 Hi+1 . . . Hn ) = {1}.
Reciprocamente, suponha as duas últimas condições satisfeitas. A primeira

condição do teorema segue automaticamente de (a). Seja x = x1 . . . xn ∈ G,
yi ∈ Hi e zi = xi yi x−1
i . Então, por (b),
xyi x−1 = x1 . . . xn yi x−1 −1 −1

n . . . x1 = x1 . . . xn−1 yi xn−1 . . . x1 = · · ·
= x1 . . . xi yi x−1 −1 −1 −1
i . . . x1 = x1 . . . xi−2 zi xi−2 . . . x1 = · · · = zi ∈ Hi .
Finalmente, se xi ∈ Hi ∩ (H1 . . . Hi−1 Hi+1 . . . Hn , pela unicidade de (a) temos que

xi = 1.
10.27. PRODUTOS DE GRUPOS 83
10.29.1. Produtos semi-diretos de grupos. Na seção anterior dados dois

grupos H e K construimos o produto direto H ⊕ K com a operação componente
a componente. Nesta seção modificaremos levemente o procedimento. Lembre
que Aut(K) (o conjunto dos automorfismos de K) é um grupo com respeito a
composição de automorfismos. Suponhamos que seja dado um homomorfismo de
grupo σ : H → Aut(K). Definimos no produto cartesiano H × K uma nova
operação da seguinte forma:
(x, y) σ (z, w) := (xz, yσ(x)(w)),
note que σ(x) : K → K é um automorfismo de K, logo σ(x)(w) ∈ K.
Afirmamos que H × K com a operação σ é um grupo, chamado o produto
semi-direto de H e K com respeito a σ e denotado por H nσ K. De fato,
((x1 , y1 ) σ (x2 , y2 )) σ (x3 , y3 ) = (x1 x2 , y1 σ(x1 )(y2 )) σ (x3 , y3 )
= ((x1 x2 )x3 , (y1 σ(x1 )(y2 ))σ(x1 x2 )(y3 ))
= (x1 (x2 x3 ), (y1 σ(x1 )(y2 ))(σ(x1 )(σ(x2 )(y3 ))))
= (x1 (x2 x3 ), y1 σ(x1 )(y2 σ(x2 )(y3 )))
= (x1 , y1 ) σ (x2 x3 , y2 σ(x2 )(y3 ))
= (x1 , y1 ) σ ((x2 , y2 ) σ (x3 , y3 )).
O elemento neutro é (1, 1). De fato,
(1, 1) σ (x, y) = (x, σ(1)(y)) = (x, y) e
(x, y) σ (1, 1) = (x, yσ(x)(1)) = (x, y).
O inverso de (x, y) é (x−1 , σ(x−1 )(y −1 )). De fato,
(x, y) (x−1 , σ(x−1 )(y −1 )) = (1, yσ(x)(σ(x−1 )(y −1 ))) = (1, yy −1 ) = (1, 1) e
(x−1 , σ(x−1 )(y −1 )) σ (x, y) = (1, σ(x−1 )(y −1 )σ(x−1 )(y))
= (1, σ(x−1 )(y −1 y)) = (1, σ(x−1 )(1)) = (1, 1).
n−1
Y
n n
(a) (x, y) = (x , σ(xi )(y)).
i=0
Conseqüentemente, (x, 1) = (x , 1) e (1, y)n = (1, y n ).

n n
(b) (1, y) σ (x, 1) = (x, y).

(c) {1} nσ K C H nσ K.
(d) H nσ {1} ⊂ H nσ K é um subgrupo. Este subgrupo é normal, se σ = id.
Demonstração. (a) Vamos provar por indução. Para n = 2,
(x, y) σ (x, y) = (x2 , yσ(x)(y)).
Suponha que o resultado vale para n. Então

n−1
Y
n+1 n n
(x, y) = (x, y) σ (x, y) = (x , σ(xi )(y)) σ (x, y))
i=0
n−1
Y n
Y
n+1 i n n+1
= (x , σ(x )(y)σ(x )(y)) = (x , σ(xi )(y)).
i=0 i=0
(2) Segue da definição.

(3) Primeiro verifiquemos que {1} nσ K é de fato um subgrupo de H nσ K.
É claro que (1, 1) ∈ {1} nσ K. Se (1, x), (1, y) ∈ {1} nσ K, então
(1, x) σ (1, y) = (1, xσ(1)(y)) = (1, xy) ∈ {1} nσ K.
Além disto
(1, x)−1 = (1, σ(1)(x−1 )) = (1, x−1 ) ∈ {1} nσ K.
Dado (x, y) ∈ H nσ K e (1, z) ∈ {1} nσ K, então
(x, y) σ (1, z) σ (x, y)−1 = (x, yσ(x)(z)) σ (x−1 , σ(x−1 )(y −1 ))

= (1, yσ(x)(z)σ(x)(σ(x−1 (y −1 ))))
= (1, yσ(x)(zσ(x−1 (y −1 )))) ∈ {1} nσ K.
(4) É claro que (1, 1) ∈ H nσ {1}. Se (x, 1), (y, 1) ∈ H nσ {1}, então
(x, 1) σ (y, 1) = (xy, σ(x)(1)) = (xy, 1) ∈ H nσ {1}.
Além disto
(x, 1)−1 = (x−1 , σ(x−1 )(1)) = (x−1 , 1) ∈ H nσ {1}.
Exemplo 10.31. Lembremos que S3 = {1, α, α2 , β, αβ, α2 β} é caracterizado

por o(α) = 3, o(β) = 2 e βα = α2 β, i.e., βαβ −1 = α2 . Neste caso K = hαi =
{1, α, α2 } e H = hβi = {1, β}. Isto permite-nos definir o seguinte homomorfismo
σ : H → Aut K por σ(β)(α) := α2

10.33. GRUPOS METACÍCLICOS 85
(verifique que isto é um homorfismo de grupo). Seja a = (1, α) e b = (β, 1).

Verifiquemos que estes satisfazem à descrição de S3 , portanto H nσ K ∼
= S3 . De
fato,
a3 = (1, α3 ) = (1, 1),
b2 = (β 2 , 1) = (1, 1) e
ba = (β, 1) (1, α) = (β, σ(β)(α)) = (β, α2 ) e
a2 b = (1, α2 ) σ (β, 1) = (β.α2 σ(1)(1)) = (β, α2 ) = ba.
Lema 10.32. Seja H = hαi um grupo cı́clico de ordem n, K = hβi um grupo

cı́clico de ordem m. Então existem bijeções
Hom(K, Aut(H)) → {τ ∈ Aut(H) | o(τ ) | m}
σ 7→ σ(β)
e
{τ ∈ Aut(H) | o(τ ) | m} → {1 ≤ s ≤ n − 1 | sm ≡ 1 (mod n)}
τ 7→ s, onde τ (α) = αs .
Demonstração. Note que a primeira função está de fato bem definida,

pois σ(β)m = σ(β m ) = σ(1) = id. É injetiva pois 2 automorfismos calculados no
gerador β de H são necessariamente iguais. Se τ ∈ Aut(H) satisfaz o(τ ) | m,
então τ (α)m = τ (αm ) = 1, logo αm = 1, pelo lema chave o(α) = n | m, logo
existe um homomorfismo σ : K → Aut(H) tal que σ(β) = τ .
Para a segunda, basta observar que Aut(H) → (Z/nZ)∗ dada por τ 7→ s,
onde τ (α) = αs é um isomorfismo de grupos. Neste isomorfismo o(τ ) | m se e
somente se sm ≡ 1 (mod n).
Como conseqüência deste lema temos que se existem inteiros m, n, s ≥ 0 tais
que sm ≡ 1 (mod n), então existe um grupo G com #G = nm, G = hα, βi,
o(α) = n, o(β) = m e βαβ −1 = αs . De fato, da condição numérica e do lema
sabemos que o automorfismo τ : hαi → hαi por τ (α) = αs tem ordem o(τ ) | m.
Logo existe um homomorfismo σ : hβi → Aut(hαi). Basta tomar o produto
semi-direto hβi nσ hαi para obter um tal G.
Para mais tipos de produtos de grupos veja [?, chapter 2].
10.33. Grupos metacı́clicos

O objetivo desta seção é descrever grupos metacı́clicos que generalizam o D4
e S3 .
Teorema 10.34. Seja G um grupo finito, s ≥ 1 inteiro, a, b ∈ G tais que

ba = as b (i.e., Ib (a) = as ). Seja G um grupo e α, β ∈ G. Sejam m, n ≥ 1 inteiros
tais que an = 1 e bm ∈ hai.
(1) Para todo s, t ≥ 1 temos
t
bt ar = ars bt .
Em particular,
ha, bi = {ai bj | 0 ≤ i ≤ n − 1, 0 ≤ j ≤ m − 1}.
Além disto, se m e n forem escolhidos mı́nimos para esta propriedade,

temos que #ha, bi = mn.
(2) Supondo m e n mı́nimos, seja u ≥ 0 tal que bm = au . Então existe um
homomorfismo f : ha, bi → G tal que f (a) = α e f (b) = β se e somente
se βα = αs β, αn = 1 e β m = αu .
Demonstração. (1) Vamos provar por indução. Vamos supor primeiro que
t
r = 0 e provar que Ibt (ar ) = ars . Se t = 1, então já sabemos que Ib (a) = as .
Suponhamos que isto valha para t − 1. Então
t−1 t−1 t−1 t
Ibt (ar ) = Ib ◦ Ibt−1 (ar ) = Ib (ars ) = Ib (a)rs = (as )rs = ars .
Por definição, ha, bi é formado por produtos de elementos que são iguais a a
(ou a−1 ) e b (ou b−1 ). Utilizando o resultado acima, podemos sempre colocar a
potência de a em primeiro lugar e escrever ai bj para i, j ∈ Z. Além disto, pelas
hipóteses sobre m e n obtemos que basta tomar 0 ≤ i ≤ n − 1 e 0 ≤ j ≤ m − 1.
Observemos também que se m e n forem mı́nimos então os elementos de
ha, bi = {ai bj | 0 ≤ i ≤ n − 1, 0 ≤ j ≤ m − 1}
são todos distintos, portanto sua ordem é mn. De fato, se ai bj = ak bl , então

ai−k = bl−j ∈ hai, digamos que l ≥ j. Neste caso, l − j < m, logo l = j e
ai−k = 1, bem como ak−i . Tomando o expoente positivo dentre os 2 e notando
que este expoente é menor que n concluimos que i = k.
(2) É claro que
αn = f (a)n = f (an ) = f (1) = 1,

β m = f (b)m = f (bm ) = f (au ) = f (a)u = αu e que
βα = f (b)f (a) = f (ba) = f (as b) = f (a)s f (b) = αs β.
10.37. CLASSIFICAÇÃO DE GRUPOS DE ORDEM ≤ 11 87
Para verificar a recı́proca basta definir
f : ha, bi → G por f (ai bj ) := αi β j
e provar que isto realmente é um homomorfismo. De fato,

j j j
f (ai bj ak bl ) = f (ai aks bj bl ) = f (ai+ks bj+l ) = αi+ks β j+l
j
= αi (αks β j )β l = αi β j αk β l = f (ai bj )f (ak bl ).
Teorema 10.35. Sejam m, n, s, u ≥ 0 inteiros. Existe um grupo G de ordem

nm e a, b ∈ G tais que G = ha, bi, an = 1, bm = au e ba = as b se e somente se
sm ≡ 1 (mod n) e u(s − 1) ≡ 0 (mod n).
m
Demonstração. Note que pelo teorema anterior, bm a = as bm . Mas, bm =
m m
au , logo bm a = abm = as bm , em particular as −1 = 1 e pelo lema chave, n |
(sm − 1). De novo pelo teorema anterior, bau = aus b. Mas au = bm , logo
bau = au b = aus b, i.e., au(s−1) = 1, assim n | (u(s − 1)). A recı́proca segue da
construção do final da seção anterior.
Proposição 10.36. Sejam m, n, s, u ≥ 0 inteiros, G um grupo de ordem nm.

Suponha que existam a, b ∈ G tais que G = ha, bi, ba = as b, an = 1 e bm = au .
Então a função
Aut(G) → {(α, β) ∈ G × G | G = hα, βi, βα = αs β, αn = 1, β m = αu }

f 7→ (f (a), f (b))
é bijetiva.
Demonstração. Segue do primeiro teorema que f (a) e f (b) satisfazem as

condiç ões do conjundo do lado direito. A função é injetiva, pois a e b geram G,
assim um homomorfismo fica unicamente determinado pelo seu valor nos gerado-
res. Novamente o primeiro teorema mostra que a função é sobrejetiva.
10.37. Classificação de grupos de ordem ≤ 11

Comecemos observando que todo grupo cı́clico de ordem n é isomorfo a Z/nZ.
De fato, se G é cı́clico de ordem n significa que G = {1, a, · · · , an−1 } para algum
gerador a de G. Consideremos a função f : G → Z/nZ definida por f (a) = 1.
Exercı́cio: verifique que esta função é um isomorfismo de grupos.
10.37.1. Grupos de ordem : 2,3,5,7,11. Estes números são primos, logo

(pelo teoream de Lagrange) todo a ∈ G − {1} tem ordem p, portanto G é cı́clico,
i.e., G ∼
= Z/nZ.
10.37.2. Grupos de ordem 4. Se existe a ∈ G tal que o(a) = 4, então G

é cı́clico. Logo G ∼
= Z/4Z.
Suponhamos que para todo a ∈ G − {1}, o(a) = 2 (que é a única possibilidade
pelo teorema de Lagrange). Portanto G é um grupo abeliano. Seja a ∈ G − {1} e
b ∈ G − hai. Assim, G = {1, a, b, ab}. Neste caso a função f : G → Z/2Z × Z/2Z
definida por f (1) = (0, 0), f (a) = (1, 0), f (b) = (0, 1) e f (ab) = (1, 1) é um
isomorfismo de grupos.

é cı́clico e G ∼
= Z/6Z.
Suponhamos que não exista a ∈ G tal que o(a) = 6. Pelo teorema de La-
grange, para todo a 6= 1 as possibilidades para a sua ordem são 2 e 3.
Lema 10.38. Existe a ∈ G tal que o(a) = 3.
Demonstração. De fato, suponhamos que para todo a ∈ G−{1} tenhamos

o(a) = 2. Seja a ∈ G − {1} e b ∈ G − hai. Neste caso, ha, bi é um subgrupo de G
de ordem 4, o que contradiz o teorema de Lagrange.
Lema 10.39. Existe b ∈ G tal que o(b) = 2.
Demonstração. De fato, suponhamos que para todo b ∈ G − {1} tenhamos

o(b) = 3. Seja a ∈ G tal que o(a) = 3 e b ∈ G − hai. O subgrupo ha, bi de G tem
ordem 9, o que novamente contradiz o teorema de Lagrange.
Utilizando os valores das ordens de a e b vemos que G = {1, a, a2 , b, ab, a2 b}

e que ba 6= 1, a, a2 , b. Assim, ba = ab ou a2 b. No primeiro caso, G é abeliano
e a função f : G → Z/3Z × Z/2Z definida por f (1) = (0, 1), f (a) = (1, 0),
f (a2 ) = (2, 0), f (b) = (0, 1), f (ab) = (1, 1), f (a2 b) = (2, 1) é um isomorfismo
de grupos. Mas pelo teorema chinês dos restos, Z/3Z × Z/2Z ∼ = Z/6Z, assim
2
descartamos este caso. O caso em que ba = a b é exatamente o caso em que
G∼ = S3 .
10.39.1. Grupos de ordem 8. Se existe a ∈ G tal que o(a) = 8 então G é

cı́clico e G ∼
= Z/8Z.
10.37. CLASSIFICAÇÃO DE GRUPOS DE ORDEM ≤ 11 89
Suponha que para todo a ∈ G − {1}, o(a) = 2. Neste caso G é abeliano.

Seja a ∈ G tal que o(a) = 2, seja b ∈ G − hai e c ∈ G − ha, bi. Note que
o subgrupo ha, b, ci = {1, a, b, c, ab, ac, bc, abc} tem ordem 8, logo G = ha, b, ci.
Observe também que f : G → Z/2Z × Z/2Z × Z/2Z definida por f (1) = (0, 0, 0),
f (a) = (1, 0, 0), f (b) = (0, 1, 0), f (c) = (0, 0, 1), f (ab) = (1, 1, 0), f (ac) =
(1, 0, 1), f (bc) = (0, 1, 1) e f (abc) = (1, 1, 1) é um isomorfismo de grupos.
Assim, suponha que exista a ∈ G tal que o(a) = 4. Seja b ∈ G − hai.
Note que ha, bi = {1, a, a2 , a3 , b, ab, a2 b, a3 b} e que estes elementos são distintos,
portanto G = ha, bi. Observe também que como (G : hai = 8/4 = 2, então
(bhai)2 = hai, i.e., b2 hai. Observe também que trivialmente b2 6= b, ab, a2 b, a3 b e
ba 6= 1, a, a2 , a3 , b. Pelo segundo teorema as únicas possibilidades para u e s tais
que b2 = au e ba = as b são u = 0 ou 2 e s = 1 ou 3.
Se u = 0 e s = 1, temos que ba = ab e o(b) = 2. O grupo G é abeliano.
A função f : G → Z/4Z × Z/2Z definida por f (1) = (0, 0), f (a) = (1, 0),
f (a2 ) = (2, 0), f (a3 ) = (3, 0), f (b) = (0, 1), f (ab) = (1, 1), f (a2 b) = (2, 1) e
f (a3 b) = (3, 1) é um isomorfismo de grupos.
Se u = 0 e s = 3, temos que ba = a3 b e o(b) = 2, neste caso G ∼ = D4 .
Se u = 2 e s = 0, temos que ba = ab e b2 = a2 . O grupo G é abeliano. A função
f : G → Z/4Z × Z/2Z definida por f (1) = (0, 0), f (a) = (1, 0), f (a2 ) = (2, 0),
f (a3 ) = (3, 0), f (ab) = (0, 1), f (b) = (3, 1), f (a2 b) = (1, 1) e f (a3 b) = (2, 1) é um
isomorfismo de grupos.
Finalmente, se u = 2 e s = 3, temos que ba = a3 b e b2 = a2 . Neste caso
G é isomorfo ao grupo Q dos quaternions descrito da seguinte forma. Q é um
subgrupo das matrizes 2 × 2 com entradas complexas e determinante não nulo.
Ele é definido por
( ! ! ! !)
1 0 i 0 0 1 0 i
± ,± , ± ,± .
0 1 0 −i −1 0 i 0
Basta tomar ! !
i 0 0 1
a= eb= .
0 −i −1 0

é cı́clico e G ∼
= Z/9Z.
Caso isto não ocorra para todo a ∈ G − {1}, o(a) = 3. Seja b ∈ G − hai.
Note que o subgrupo ha, bi = {1, a, a2 , b, b2 , ab, ab2 , a2 b, a2 b2 } de G tem ordem 9,
portanto sendo igual ao próprio grupo G. Observe também que ba 6= 1, a, a2 , b, b2 .
Assim, e pelo segundo teorema, ba = ab, logo G é abeliano. Neste caso G ∼ =

Z/3Z × Z/3Z (exercı́cio: determine explicitamente o isomorfismo, como nos casos
anteriores).
10.39.3. Grupos de ordem 10. Se existe a ∈ G tal que o(a) = 10, G é
cı́clico e G ∼
= Z/10Z.
Caso contrário, como nos casos anteriores existem a, b ∈ G tais que o(a) = 5 e
o(b) = 2 (verifique!). Pelo segundo teorema as únicas possibilidades para ba = as b
são s = 1 ou 4. No primeiro caso, G é abeliano e G ∼ = Z/5Z × Z/2Z, mas este é
isomorfo a Z/10Z, assim não consideramos este caso. No outro caso, G ∼ = D5 , o
grupo diedral de ordem 10.
10.39.4. Grupos diedrais. Estes grupos têm ordem 2n, um elemento a de
ordem n e outro elemento b de ordem 2 satisfazendo a ba = an−1 b.
CAPı́TULO 11
Teoremas de Sylow
11.1. Represesentações de grupos

Seja G um grupo finito e S um conjunto finito. Denotamos por Perm(S) o
conjunto das permutações de S, i.e., das funções f : S → S bijetivas. Este con-
junto forma um grupo com respeito à composição de funções. Uma representação
de G por permutação é um homomorfismo de grupos ρ : G → Perm(S).
Exemplo 11.2. Tomemos como S o próprio grupo G e consideremos para

todo x ∈ G o automorfismo interno Ix de G definido por Ix (a) := xax−1 . Assim
definimos a função ρ : G → Aut(G) dada por ρ(x) := Ix . Verifiquemos que
esta função é um homomorfismo de grupos. Esta representação é chamada a
representação de G por conjugação. De fato, dado a ∈ G temos
ρ(xy)(a) = (xy)a(xy)−1 = xyay −1 x−1 = xIy (a)x−1 = Ix (Iy (a)) = (Ix ◦ Iy )(a).
Outra representação com S = G é a translação ρ : G → Aut(G) dada por
ρ(x)(a) := xa para todo a ∈ G. De fato, ρ(x) é um automorfismo de G (exercı́cio)
e
ρ(xy)(a) = xya = xρ(y)(a) = ρ(x)(ρ(y)(a)) = (ρ(x) ◦ ρ(y))(a).
Esta representação de G é chamada representação por translação.
Observe que neste último caso a função ρ é injetiva. De fato se ρ(x) = id,
então xa = a para todo a ∈ G. Isto significa que x = 1. Como conseqüência
deste resultado temos o teorema de Cayley.
Teorema 11.3 (teorema de Cayley). Seja G um grupo de ordem n, então G

é isomorfo a um subgrupo do grupo Sn das permutações de n elementos.
Demonstração. Tome a representação ρ por translação em G e conclua

que G ∼
= ρ(G) com ρ(G) subgrupo de Sn .
Exemplo 11.4. Seja S o conjunto de subgrupos de G e consideremos a função

ρ : G → Perm(S) dada por ρ(x)(H) := xHx−1 . Observemos que ρ(x) é de fato
91
92 11. TEOREMAS DE SYLOW
uma bijeção em S (exercı́cio) e que

ρ(xy)(H) = xyHy −1 x−1 = xρ(y)(H)x−1 = ρ(x)(ρ(y)(H)) = (ρ(x) ◦ ρ(y))(H).
Observe que como #H = #xHx−1 , então podemos restringir a representação
anterior ao conjunto dos subgrupos H de G com ordem fixada n.
Exemplo 11.5. Seja H um subgrupo de G e S o conjunto das classes laterais

a direita de H em G, i.e., S := {aH ; a ∈ G}. Consideremos a função ρ : G →
Perm(G) dada por ρ(x)(aH) := xaH. De novo fica como exercı́cio verificar que
ρ(x) é de fato uma permutação de S. Além disto
ρ(xy)(aH) = xy(aH) = xρ(y)(aH) = ρ(x)(ρ(y)(aH)) = (ρ(x) ◦ ρ(y))(aH).
Dada uma representação por permutação ρ : G → Perm(S) definimos a órbita

Oa de um elemento a ∈ S por
Oa := {ρ(x)(a) ; x ∈ G}.
O estabilizador de a é definido por
E(a) := {x ∈ G ; ρ(x)(a) = a}.
Observemos que E(a) é um subgrupo de G. De fato, 1 ∈ E(a), pois ρ(1) = id e
portanto ρ(1)(a) = a, i.e., ρ(1) ∈ E(a). Se x, y ∈ E(a), então
ρ(xy)(a) = ρ(x)(ρ(y)(a)) = ρ(x)(a) = a, i.e., xy ∈ E(a).
Finalmente, ρ(x−1 ) = ρ(x)−1 , pois ρ é um homomorfismo. Portanto, ρ(x−1 )(a) =
ρ(x)−1 (a) = a, i.e., x−1 ∈ E(a). Pelo teorema de Lagrange temos que #E(a)
divide #G. É menos imediato que o mesmo ocorre com #Oa . Isto segue da
proposição seguinte.
Proposição 11.6. Existe uma bijeção

ϕ : Oa → {C.L.D.} dada por ϕ(ρ(x)(a)) := xE(a),
o conjunto do lado direito é o conjunto das classes laterais a direita de E(a) em
G. Em particular (novamente pelo teorema de Lagrange), #Oa divide #G.
Demonstração. Inicialmente, ϕ está bem definida pois se ρ(x)(a) = ρ(y)(a),

então ρ(xy −1 )(a) = a, i.e., xy −1 ∈ E(a), i.e., xE(a) = yE(a). A função é injetiva
uma vez que se ϕ(ρ(x)(a)) = ϕ(ρ(y)(a)), i.e., xE(a) = yE(a), então xy −1 ∈ E(a),
logo ρ(xy −1 )(a) = a, i.e., ρ(x)(a) = ρ(y)(a). Finalmente, pela própria definição
do conjunto do lado direito, ϕ é sobrejetiva.
11.7. OS TEOREMAS DE SYLOW 93
Dada uma representação ρ : G → Perm(S) definimos a seguinte relação de

equivalência (verifique!) :
a ∼ b se e somente se existe x ∈ G tal que ρ(x)(a) = b.
Em particular, a classe de equivalência de a nada mais é que a sua órbita Oa .
Além disto o conjunto S fica escrito como a união disjunta das órbitas Oa .
Comecemos considerando o caso do exemplo 11.2. Neste caso
Oa = {xax−1 ; x ∈ G}
é o conjunto dos conjugados de G. Assim,
Oa = {a} se e somente se a ∈ Z(G).
Desta forma obtemos a equação das classes de conjugação
X
(11.6.1) #G = #Z(G) + #Oa .
a∈Z(G)
/
Ainda neste exemplo, o estabilizador E(a) de a é chamado o centralizador de a

dado por
Z(a) = {x ∈ G ; xa = ax}.
No caso do exemplo 11.4, a órbita de H é dada por
OH = {xHx−1 ; x ∈ G}
é chamado o conjunto dos conjugados de H e o estabilizador de H é chamado o
normalizador de H em G denotado por
NG (H) = {x ∈ G ; xHx−1 = H}.
Observemos que H C G se e somente se NG (H) = G. Além disto da própria
definição H C NG (H). O grupo NG (H) também se caracteriza como sendo o
maior subgrupo de G no qual H é normal. De fato, se K ⊂ G for um subgrupo
e H C K, então para todo x ∈ K temos xHx−1 = H, i.e., x ∈ NG (H), i.e.,
K ⊂ NG (H).
11.7. Os teoremas de Sylow

Seja G um grupo finito e p um número primo. Suponhamos que p | #G,
digamos #G = pn b, onde p - b.
Teorema 11.8 (primeiro teorema de Sylow). Para todo 0 ≤ m ≤ n existe

um subgrupo H de G de ordem pm .
Definição 11.9. Um subgrupo de G de ordem pn é chamado um p-subgrupo

de Sylow de G.
Lema 11.10 (lema de Cauchy). Seja G um grupo abeliano e suponha que

p | #G, então existe x ∈ G tal que o(x) = p.
Observe que o primeiro teorema de Sylow generaliza o lema de Cauchy para
grupos não necessariamente abelianos.
Demonstração. A prova será por indução na ordem de G. Se #G = 1,
por vacuidade nada há a fazer. Suponha que o resultado seja verdade para todo
subgrupo de ordem menor que a ordem de G. Se #G = p nada há a fazer, o
grupo é cı́clico e basta tomar um gerador. Suponhamos que |G| =6 p.
Afirmamos que existe um subgrupo H de G tal que 1 < #H < #G. De fato,
seja x ∈ H − {1}. Se hxi = 6 G, tome H = hyi. Caso hxi = G, tome H = hxp i.
Se p | #H, então por hipótese de indução existe x ∈ H com o(x) = p, em
particular x ∈ G. Caso p - #H, então p | #G/H e #G/H < #G.
Novamente por hipótese de indução existe x ∈ G/H tal que o(x) = p. Con-
sideremos o homomorfismo sobrejetivo ϕ : G G/H. Seja r = o(x). Então
o(x) = p | r, digamos r = kp. Desta forma o(xk ) = p.
demonstração do primeiro teorema de Sylow. Novamente a prova se-
rá por indução na ordem de G. Se #G = 1, nada há a fazer. Suponhamos que o
resultado seja verdade para todo grupo de ordem menor que #G. Se existe um
subgrupo próprio H de G tal que pm | #H, então por hipótese de indução temos
que existe um subgrupo de H de ordem pm , em particular existe um subgrupo
de G desta ordem.
Suponhamos que não exista subgrupo próprio de G cuja ordem seja divisı́vel
por pm . A equação das classes de conjugação afirma que
X
#G = #Z(G) + (G : E(a)).
a∈Z(G)
/
Para todo a ∈/ Z(a) temos que (G : E(a)) = #Oa > 1, logo #E(a) < #G. Por
m
hipótese p - |E(a)|, assim p | (G : E(a)). Em particular, p | #Z(G).
Como Z(G) é abeliano, concluimos do lema de Cauchy que existe x ∈ Z(G) tal
que o(x) = p. Note que como x ∈ Z(G), então hxi C G, portanto o grupo G/hxi
tem ordem pn−1 b < #G. Por hipótese de indução existe K subgrupo de G/hxi
tal que #K = pm−1 . Consideremos o homomorfismo canônico ϕ : G G/hxi.
Então H = ϕ−1 (K) é um subgrupo de G de ordem pm .
11.7. OS TEOREMAS DE SYLOW 95
Lembremos que dado um grupo qualquer (não necessariamente finito) G e um

número primo p, dizemos que G é um p-grupo se todo elemento de G tem ordem
potência de p. Utilizaremos o primeiro teorema de Sylow para provar a seguinte
proposição.
Proposição 11.11. Um grupo finito G é um p-grupo se e somente se #G é

potência de p.
Demonstração. É claro que se #G é potência de p, então G é um p-grupo.

Reciprocamente, se existisse um primo ` 6= p tal que ` | #G, então pelo primeiro
teorema de Sylow, existe x ∈ G tal que o(x) = `, em particular G não é um
p-grupo.
Seja S o conjunto dos p-subgrupos de Sylow de G. Consideremos a repre-
sentação por conjugação ρ : G → Perm(S) definida por ρ(x)(S) = xSx−1 .
A parte mais importante do segundo teorema de Sylow afirma que esta repre-
sentação é transitiva, i.e.,
S = OS = {xSx−1 ; x ∈ G}.
Seja np := #S.
Teorema 11.12 (segundo teorema de Sylow). (1) S = OS , para algum

S ∈ S.
(2) Se P ⊂ G é um p-subgrupo, então existe S ∈ S tal que P ⊂ S.
(3) Se S ∈ S, então np = (G : NG (S)).
Para provar este teorema precisamos do seguinte lema.
Lema 11.13. Seja S ∈ S e P ⊂ G um p-subgrupo. Então P ∩ NG (S) = P ∩ S.
Demonstração. Suponhamos que P ∩NG (S) ' P ∩S, seja x ∈ P ∩NG (S)−
S. Como P é um p-grupo temos que o(x) = pr para algum r ≥ 1. Além
disto S C NG (S), logo hxiS é um subgrupo de NG (S). Mais ainda, #hxiS =
o(x)#S/#hxi ∩ S = pr+n /#hxi ∩ S. Observe que o denominador é < pr , pois
x∈ / S, o que é uma contradição uma vez que a ordem de hxiS supera a ordem
de S.
Demonstração do segundo teorema de Sylow. Seja C o conjunto dos
subgrupos de G e consideremos a representação por conjugação ρ : G → Perm(C)
definida por ρ(x)(H) = xHx−1 . Por definição a órbita OS (para S ∈ S) de S é
o conjunto dos conjugados de S e #OS = (G : NG (S)).
Provemos os 2 primeiros ı́tens. Denotemos OS = T . A restrição ϑ : P →

Perm(T ) desta representação a um p-subgrupo P de G dá uma representação
sobre o conjunto T dada por ϑ(x) = xaSa−1 x−1 , para aSa−1 ∈ T . Sejam
O1 , · · · , Ok as órbitas desta representação. Assim cada Oi é a órbita de Si =
yi Syi−1 com relação a ϑ. Lembre qie #Oi = (P : NG (Si ) ∩ P ). Pelo lema anterior
(P : NG (Si ) ∩ P ) = (P : Si ∩ P ). Assim,
k
X k
X
#T = #Oi = (P : Si ∩ P ).
i=1 i=1
n
Como #S = p e S ⊂ NG (S), então p - #T = (G : NG (S)). Por outro lado,
como P é um p-grupo finito, para todo i = 1, · · · , k, (P : Si ∩ P ) é potência de
p. Mas isto ocorre se e somente se existe i tal que P = Si ∩ P , i.e., P ⊂ Si , isto
prova (2). Para (1) note que T ⊂ S. Para a inclusão inversa, aplicando (2) a
qualquer S 0 ∈ S temos que existe i tal que S 0 ⊂ Si , i.e., S 0 = Si = yi Syi−1 , i.e.,
S0 ∈ T .
Finalmente, para provar (3), por (1) temos que np = #T = (G : NG (S)) |
b.
Teorema 11.14 (terceiro teorema de Sylow). np | b e np ≡ 1 (mod p).
Demonstração. A primeira afirmativa já foi provada no teorema anterior.

Para a segunda, aplique a última equação para P = S obtendo
k
X
(G : NG (S)) = (S : S ∩ Si ).
i=1
Como S é um p-grupo o resultado é imediato.
11.15. Exemplos
Determinemos o número de p-subgrupos de Sylow para grupos de certas or-
dens. Observe que np = 1 se e somente se existe um único p-subgrupo de Sylow
normal em G.
Exemplo 11.16. Seja G um grupo de ordem 56 = 23 7. Pelo terceiro teorema

de Sylow, n7 | 8 e n7 ≡ 1 (mod 7). Então n7 = 1 ou 8. No primeiro caso
temos um único 7-subgrupo de Sylow H7 normal em G. No segundo caso, cada
7-subgrupo de Sylow de G produz 6 elementos de ordem 7. Assim terı́amos 48
elementos de ordem 7. Portanto, os demais 8 elementos constituem o único 2-
subgrupo de Sylow de G. Isto não poderia ser visto diretamente pelo terceiro
11.15. EXEMPLOS 97
teorema de Sylow, pois n2 | 7 e n2 ≡ 1 (mod 2), logo a princı́pio não poderı́amos

excluir a possibilidade n2 = 7. Neste caso o 2-subgrupo de Sylow H2 de G é
normal em G.
Exemplo 11.17. Seja G um grupo de ordem 22 .7.13. Aplicando o terceiro

teorema de Sylow obtemos n13 | 22 .7 e n13 ≡ 1 (mod 13). Portanto temos duas
possibilidades n13 = 1 e n13 = 14. Vamos excluir a última. Seja H13 um 13-
subgrupo de Sylow de G. Aplicando o terceiro teorema de Sylow temos n7 | 22 .13
e n7 ≡ 1 (mod 7), logo n7 = 1, ou seja há um único 7-subgrupo de Sylow H7 de
G (portanto normal em G). A fortiori, H13 H7 é um subgrupo de G. Aplicando
o terceiro teorema de Sylow a este grupo obtemos n13 = (G : NG (H13 )) ≤ (G :
H13 H7 ) = 4. Assim, n13 = 1.
CAPı́TULO 12
Grupos solúveis
12.1. Teorema de Jordan-Hölder

Definição 12.2. Seja G um grupo. Uma série subnormal de G é uma
seqüência de grupos
G = G0 B G1 B G2 B · · · B Gn = {1},
onde cada Gi é normal no subgrupo anterior Gi−1 . Denotamos por

G0 G1 Gn−1
Q := , ,··· ,
G1 G2 Gn
o conjunto dos quocientes de da série cuja cardinalidade l é dita o comprimento
da série.
Um refinamente de uma série subnormal é uma outra série subnormal obtida
a partir desta inserindo subgrupos normais, por exemplo,
Gi B Hi B Gi+1 .
Um refinamento é dito próprio, se o comprimento da nova série for superior ao

da original. Uma série subnormal é dita uma série de composição, se não admite
refinamento próprio. Duas séries subnormais são distas equivalentes se existe
uma bijeção entre o conjunto dos quocientes das duas séries.
O objetivo desta seção é mostrar que todas as séries de composição de um

grupo dado são equivalentes (Teorema de Jordan-Hölder).
Definição 12.3. Um grupo G é dito simples, se seus únicos subgrupos nor-

mais são {1} e G. Por exemplo todo grupo de ordem prima é simples.
Observe que uma série subnormal é uma série de composição se e somente se

cada quociente Gi /Gi+1 é um grupo simples. Nem todo grupo admite uma série
de composição. Por exemplo, se G = Z e os subgrupos Gi = pi Z para i ≥ 1. A
série
Z B pZ B {0}
99
100 12. GRUPOS SOLÚVEIS
pode ser infinitamente refinada inserindo sucessivamente os grupos pi Z para todo

i ≥ 2.
Lema 12.4. Seja G um grupo finito de ordem maior que 1, então existe um
subgrupo normal próprio H de G que é maximal para esta propriedade, i.e., para
todo subgrupo K normal próprio de G temos que K ⊂ H.
Demonstração. É claro que {1} é um subgrupo próprio normal de G. Se

{1} for maximal no sentido acima, nada há a fazer. Caso contrário, existe H1 '
{1} que é um subgrupo próprio normal em G. Se H1 for maximal, acabou, senão
prosseguimos. Não podemos prosseguir indefinidamente pois G é finito.
Proposição 12.5. Todo grupo finito admite uma série de composição.
Demonstração. Pelo lema anterior, existe um subgrupo maximal normal

próprio G1 de G. Similarmente, aplicando o lema sucessivamente a G1 , G2 , etc,
obtemos que cada Gi possui um subgrupo maximal normal próprio Gi+1 e uma
série subnormal
G = G0 B G1 B G2 B · · · ,
que não pode ser infinita, pois G é finito e as ordens dos grupos Gi ’s são es-
tritamente decrescentes. Logo existe n ≥ 1 tal que Gn = {1}. Além disto,
pela maximalidade dos grupos Gi+1 ’s em Gi , concluimos que todos os quocientes
Gi /Gi+1 são grupos simples. Isto equivale a dizer que a série é uma série de
composição.
Exemplo 12.6. Consideremos a seguinte série subnormal

Z
G= B h5i B h10i B {0}.
30Z
Esta série é na verdade uma série de composição, pois o conjunto dos quocientes
é
Z Z Z
, , ,
5Z 2Z 3Z
ou seja, cada quociente é cı́clico de ordem prima, portanto simples. Ela é refina-
mento das séries subnormais
G B h5i B {0}, e
G B h10i B {0}.
12.1. TEOREMA DE JORDAN-HÖLDER 101
Além disto esta série é equivalente às seguintes séries de composição

Z
G= B h2i B h6i B {0} e
30Z
Z
G= B h2i B h10i B {0}.
30Z
Lema 12.7 (lema de Zassenhaus). Sejam H, H1 , K, K1 subgrupos de um grupo
G tais que H1 C H e K1 C K. Então
(1) H1 (H ∩ K1 ) C H1 (H ∩ K) e K1 (H1 ∩ K) C K1 (H ∩ K).
(2)
H1 (H ∩ K) ∼ K1 (H ∩ K)
= .
H1 (H ∩ K1 ) K1 (H1 ∩ K)
Demonstração. (1) Mostremos o primeiro fato o segundo é análogo. Que-
remos mostrar que dados x ∈ H1 e y ∈ H ∩ K temos
xy(H1 (H ∩ K1 ))y −1 x−1 = H1 (H ∩ K1 ).
De fato,
xy(H1 (H ∩ K1 ))y −1 x−1 = x(yH1 y −1 )(y(H ∩ K1 )y −1 )x−1 = x(H1 (H ∩ K1 )x−1 ,
onde na primeira identidade usamos que y ∈ H e H1 C H e na segunda que
y ∈ H ∩ K e K1 C K. Mas x ∈ H1 , portanto
x(H1 (H ∩ K1 )x−1 = H1 (H ∩ K1 )x−1 .
Como H1 C H, então
H1 (H ∩ K1 ) = (H ∩ K1 )H1
e este é um subgrupo de G. Assim,
x(H1 (H ∩ K1 )x−1 = ((H ∩ K1 )H1 )x−1 = (H ∩ K1 )H1 = H1 (H ∩ K1 ),
onde novamente usamos que x−1 ∈ H1 .
(2) Fica como exercı́cio provar o seguinte fato:
se A e B são grupos e A C AB, então (A/B)A = B/(A ∩ B).
Tomemos A = H1 (H ∩ K1 ) e B = H ∩ K. Neste caso
AB = H1 (H ∩ K) e A ∩ B = (H ∩ K1 )(H1 ∩ K).
Assim, pelo fato,
H1 (H ∩ K) ∼ H ∩K
= .
H1 (H ∩ K1 ) (H ∩ K1 )(H1 ∩ K)
Similarmente, o outro quociente procurado também é isomorfo a este último gru-

po.
Teorema 12.8 (teorema de Schreier). Duas séries subnormais de um grupo

G possuem refinamentos equivalentes.
Demonstração. Consideremos as seguintes séries subnormais
G = G0 B G1 B G2 B · · · B Gn = {0} e
G = H0 B H1 B H2 B · · · B Hm = {0}.
Refinemos a primeira utilizando os grupos da segunda da seguinte forma
Gi = Gi+1 (Gi ∩ H0 ) B Gi+1 (Gi ∩ H1 ) B · · · Gi+1 (Gi ∩ Hm ) = Gi+1 ,
o fato de cada passada ser normal segue do ı́tem (1) do lema de Zassenhaus. Da
mesma forma refinamos a segunda utilizando os grupos da primeira
Hj = Hj+1 (G0 ∩ Hj ) B Hj+1 (G1 ∩ Hj ) B · · · B Hj+1 (Gn ∩ Hj ) = Hj+1 .
A equivalência entre estas séries segue o ı́tem (2) do lema de Zassenhaus.
Corolário 12.9 (teorema de Jordan-Hölder). Duas séries de composição de

um grupo dado são equivalentes.
Demonstração. Segue imediatamente do teorema de Schreier.
12.10. Grupos solúveis

Definição 12.11. Seja G um grupo. Denotamos por G0 = [G, G] o subgrupo
dos comutadores e definimos indutivamente G(0) = G, G(i+1) = (G(i) )0 .
Teorema 12.12. Seja G um grupo. As seguintes condições são equivalentes

(i) G possui uma série subnormal com quocientes abelianos.
(ii) Existe n tal que G(n) = {1}.
Se além disto G for finito, então estas condições equivalem a
(iii) O grupo G admite uma série de composição com quocientes abelianos
(logo cı́clicos de ordem prima).
Definição 12.13. Um grupo satisfazendo às condições equivalentes acima é

dito um grupo solúvel.
12.10. GRUPOS SOLÚVEIS 103
Demonstração. Suponha (i). Pela observação 10.9, se H C G for tal que

G/H é abeliano, então H ⊃ G0 . Assim, como G0 /G1 é abeliano, G1 ⊃ G0 =
G(1) . Em seguida, como G1 /G2 é abeliano, então G2 ⊃ (G1 )0 = G(2) . Assim
sucessivamente, Gi ⊃ G(i) . Donde, G(n) = {1}.
Suponha (ii). Basta notar que por definição a série subnormal
G = G(0) B G(1) B G(2) B · · · B G(n) = {1}
tem quocientes abelianos.

Suponha agora que G seja um grupo finito. No próximo capı́tulo mostraremos
que todo grupo abeliano finito pode ser escrito como produto de grupos cı́clicos
da forma Z/nZ para n ≥ 1 inteiro. Observemos que as duas formulações de
(iii) de fato equivalem-se. Já observamos antes que todo grupo cı́clico de ordem
prima é simples. Reciprocamente, se um grupo abeliano finito é simples, pelo
que foi dito anteriormente, ele só pode ser um grupo cı́clico da forma Z/nZ para
algum inteiro n ≥ 1, já que se tivesse mais de um fator cı́clico, por exemplo,
Z/mZ × Z/nZ, então {0} × Z/nZ seria um subgrupo normal não trivial. Mas
pelo teorema chinês dos restos, todo grupo cı́clico fatora-se como produto de
grupos cı́clicos Z/pr Z, onde p é primo e r ≥ 1 inteiro. Assim, ficamos reduzidos
ao caso em que G = Z/pr Z. Mas se r > 1, este grupo admite como subgrupo
normal não trivial o grupo pZ/pr Z, logo não poderia ser simples.
Se G for um grupo finito é claro que (iii) implica (i). Por outro lado qualquer
refinamento de uma série subnormal com quocientes abelianos também tem quo-
cientes abelianos. Além disto, já foi visto anteriormente que toda série subnormal
de um grupo finito admite uma série de composição.
Segue imediatamente do teorema que grupos abelianos são solúveis. Para

ver que p-grupos finitos (onde p denota um número primo) são também solúveis
precisaremos da seguinte proposição.
Proposição 12.14. Seja G um grupo de ordem pm e H um subgrupo de G

de ordem pr , onde r < m. Então
(1) existe um subgrupo K de G de ordem pr+1 contendo H.
(2) Todo subgrupo L de G de ordem pr+1 contendo H satisfaz : H C L. Em
particular, H ( NG (H).
Demonstração. Provemos o seguinte resultado mais forte que (1) por indução
na ordem de G: existe um subgrupo H de G de ordem pr+1 tal que H C K.
Se #G = 1, nada há a fazer. Senão, suponhamos o resultado seja verdade

para todo grupo de ordem menor que #G. Como Z(G) 6= {1}, utilizando o
lema de Cauchy (cf. capı́tulo sobre teoremas de Sylow) escolhemos um elemento
x ∈ Z(G) de ordem p. Note que hxi C G e x ∈ NG (H).
Se x ∈
/ H, então, o subgrupo K = Hhxi satisfaz às condições desejadas, pois
hxi∩H = {1}. Caso x ∈ H, o grupo G/hxi tem ordem estritamente menor que G,
logo por hipótese de indução existe um subgrupo K 0 de G/hxi tal que #K 0 = pr .
Seja K a pré-imagem de K 0 pelo homomorfismo canônico ϕ : G → G/hxi. O
subgrupo K 0 de G satisfaz às condições da afirmativa mais forte.
Finalmente, o segundo ı́tem segue do primeiro.
Corolário 12.15. Seja G um grupo de ordem pm (onde p denota um número

primo). Então existem subgrupos H0 = {1}, H2 , · · · , Hm = G tais que Hi C Hi+1
e tais que Hi+1 /Hi é cı́clico de ordem p, para i = 0, · · · , m − 1.
Demonstração. Aplique a proposição a H0 = {1} obtendo H1 e ordem p,

em seguida aplique-a novamente a H1 e assim sucessivamente.
Observação 12.16. Segue do teorema 12.12 e do corolário anterior que todo

p-grupo finito é solúvel.
Proposição 12.17. Seja G um grupo e H um subgrupo de G.

(1) Se G for solúvel, então H é solúvel.
(2) Se H C G então G é solúvel se e somente se H e G/H são solúveis.
Demonstração. (1) Suponha que G seja solúvel. Note que para todo i,
G ⊃ H (i) . Portanto, H (n) = {1} e H é solúvel.
(i)
(2) Seja ϕ : G → G/H o homomorfismo quociente. Observe que ϕ(G0 ) =

ϕ(G)0 = (G/H)0 . Suponha que G seja solúvel. Por (1) H é solúvel. Além disto,
indutivamente, para todo i, ϕ(G(i) ) = (G/H)(i) , a fortiori, (G/H)(n) = {1}, i.e.,
G/H é solúvel. Reciprocamente, suponha que H e G/H sejam solúveis. Isto
significa que existe n tal que H (n) = {1} e m tal que (G/H)(m) = {1}. Da
última igualdade segue que G(m) ⊂ ker(ϕ) = H. Aplicando indutivamente esta
derradeira igualdade obtemos G(m+j) ⊂ H (j) . Portanto G(m+n) ⊂ H (n) = {1},
i.e., G é solúvel.
CAPı́TULO 13
Grupos abelianos finitamente gerados
13.1. Módulos sobre anéis

Seja R um anel comutativo com unidade. Um R-módulo M é um grupo
aditivo munido de uma função R × M → M tal que a(x + y) = ax + ay e
(a + b)x = ax + bx, para a, b ∈ R e x, y ∈ M . Quando R é um corpo (como os
reais) recuperamos a noção de espaço vetorial.
Dizemos que um suconjunto S de M gera M se para todo x ∈ M existem
x1 , · · · , xn ∈ S tal que x = ni=1 ai xi , onde ai ∈ R para i = 1, · · · , n. O conjunto
P
S é dito o conjunto de geradores de M . O módulo M é dito finitamente gerado,

se S for finito.
Dados x1 , · · · , sn ∈ M dizemos que eles são R-linearmente independentes
se para qualquer combinação linear ni=1 ai xi = 0 com ai ∈ R tivermos ai =
P
0 para i = 1, · · · , n. O módulo M é dito um R módulo livre se possui um

conjunto de geradores linearmente independentes. Novamente, quando R é um
corpo, um conjunto de geradores linearmente independentes nada mais é que
a base de um espaço vetorial. Quando o conjunto de geradores S é finito e
estes são R-linearmente independentes, da mesma forma que na álgebra linear
podemos mostrar que o número de elementos do conjunto gerador não depende
da particular escolha do conjunto. Este número é chamado o posto do módulo
(que corresponde à noção de dimensão de espaço vetorial)..
Observemos que a noção de Z-módulo equivale a de grupo abeliano. De
fato, todo Z-módulo por definição é um grupo abeliano. Reciprocamente, todo
grupo abeliano G admite uma estrutura de Z-módulo. De fato, denotando G
aditivamente, podemos considerar a soma de n > 0 vezes um elemento x de G
que é o elemento nx ∈ G. Para n = −m < 0, nx nada mais é que m vezes o
elemento −x, portanto também um elemento de G.
Ao contrário de espaços vetoriais nem todo Z-módulo livre é finito. De fato,
para todo n ≥ 1, Z/nZ é um Z-módulo livre de posto 1 gerado por 1. Na verdade
isto corresponde a noção de grupo abeliano de torção. Um grupo abeliano G é
105
106 13. GRUPOS ABELIANOS FINITAMENTE GERADOS
de torção se e somente todo elemento de G é de ordem finita. Veremos que o

teorema em questão diz inicialmente que todo grupo abeliano finitamente gerado
se quebra em um pedaço de torção que descreveremos completamente e uma parte
livre que é isomorfa a r cópias de Z, onde r é exatamente o posto do grupo como
Z-módulo.
Similarmente ao caso de espaços vetoriais temos noções de submódulos e de
módulos quocientes. Seja M um R-módulo. Um subconjunto N de M é dito um
R-submódulo de N se for um sugrupo e se para todo a ∈ R e x ∈ N , ax ∈ N .
Para todo x ∈ M definimos x := x + N := {x + v | v ∈ N } chamada a classe de
x com respeito a N . Como conjunto o módulo quociente M/N é definido como
sendo {x | x ∈ M }. Definimos uma estrutura de R-módulo em M/N da maneira
usual. A soma é definida por x ⊕ y := x + y e a multiplicação por escalar por
ax := ax, para todo a ∈ R. Fica como exercı́cio verificar que estas operações
estão efetivamente bem definidas.
Dados V e W R-módulos uma função ϕ : V → W é dito um homomorfismo
de R-módulos se for um homomorfismo de grupos e se para todo a ∈ R e x ∈ V
temos ϕ(ax) = aϕ(x). Da mesma forma definimos o núcleo de ϕ por N (ϕ) :=
{x ∈ V | ϕ(x) = 0}. Já sabemos que N (ϕ) é um subgrupo de V . Além disto ele
é um R-submódulo, pois para todo a ∈ R e x ∈ N (ϕ) temos ϕ(ax) = aϕ(x) = 0,
i.e., ax ∈ N (ϕ). A imagem ϕ(V ) de φ é um R-submódulo de W (exercı́cio).
Teorema 13.2 (teorema dos homomorfismos). Seja ϕ : V → W um ho-

momorfismo de R-módulos. Então ϕ induz um isomorfismo de R-módulos Φ :
V /N (ϕ) → ϕ(V ) dado por Φ(x) := ϕ(x).
Demonstração. Já sabemos que Φ é isomorfismo de grupos. Basta verificar

que é um homomorfismo de R-módulos. De fato, dado a ∈ R temos que Φ(ax) =
Φ(ax) = ϕ(ax) = aϕ(x) = aΦ(x).
Para todo n ≥ 1 o produto cartesiano Rn é naturalmente um R-módulo

somando as coordenadas e multiplicando as coordenadas por um escalar em R.
Um homorfismo de R-módulos ϕ : Rm → Rn é determinado pela multiplicação
de um vetor por uma matriz n × m com coordenadas em R. De fato, tomemos
como conjunto gerador linearmente independente em cada um dos R-módulos
a base canônica, então da mesma forma que na álgebra linear, se e1 , · · · , em é
uma base de Rm e f1 , · · · , fn é uma base de Rn , então ϕ fica determinado por
P
ϕ(ei ) = j aij fj , onde aij ∈ R.
13.3. DIAGONALIZAÇÃO DE MATRIZES 107
Definimos o grupo GLn (R) como o subgrupo das matrizes quadradas de ordem
n com entradas em R. Observemos que este equivale ao grupo das matrizes cujo
determinante é um elemento inversı́vel em R. De fato, seja A ∈ GLn (R). Então
existe B ∈ Mn (R) tal que AB = Id, em particular det(A) det(B) = 1, i.e.,
det(A) ∈ R∗ . Reciprocamente, se det(A) = δ ∈ R∗ e Adj(A) denota a adjunta
de A (que é construı́da como na álgebra linear, pois as operações elemetares
por linhas são precisamente as mesmas tomando cuidado de escolher os escalares
pertencendo a um anel R ao invés de um corpo). Assim a regra de Cramer nos
informa que δ Id = A Adj(A). A fortiori, Id = A(δ −1 Adj(A)), assim δ −1 Ajd(A)
é a inversa de A (observe que podemos tomar δ −1 , pois δ é inversı́vel em R).
13.3. Diagonalização de matrizes

Teorema 13.4. Seja A ∈ Mn×m (Z) então existem matrizes Q ∈ GLn (Z) e
P ∈ GLm (Z) tais que A0 = QAP −1 é diagonal da seguinte forma:
  
d1 0 · · · 0
 0 d2 · · · 0  0
  
 ,
  
. . .

 
 0 0 · · · dr 
0 0
onde d1 | d2 | · · · | dr .
Demonstração. As matrizes Q e P provêem (como na álgebra linear) da

multiplicação de matrizes elementares que correspondem as operações elementa-
res por linhas e por colunas.
Etapa 1. Trocando linhas e colunas (e eventualmente multiplicando uma
linha ou coluna por -1) podemos supor que a11 ≥ 0 é uma entrada de menor
valor absoluto (claro que pode haver outra entrada com o mesmo valor absoluto).
Etapa 2. Transformamos os demais elementos da primeira coluna em 0 da
seguinte forma. Para todo i > 1 dividimos ai1 = a11 q + r, onde 0 ≤ r < a11 .
Substituı́mos a i-ésima linha por menos ela mais q vezes a primeira, ou seja
trocamos ai1 por r. Se r = 0 nada mais precisamos fazer. Senão permutamos
levando r para a primeira posição (1,1) e retornamos à etapa anterior. Em um
número finito de passos obteremos r = 0. Repetimos o argumento para as demais
entradas da linha. Similarmente, repetimos o argumento para colunas e zeramos
o restante da primeira linha.
Etapa 3. Seja B a matriz restante eliminando as primeiras linha e coluna.

Se existe uma entrada b de B que não seja divisı́vel por a11 , somamos a coluna
correspondente com a primeira coluna e retornamos à etapa 2. Após um número
finito de passos todos os elementos de B são divisı́veis por a11 e aplicamos as 3
etapas a B.
Note que na demonstração anterior além das operações elementares por linhas
que valem para qualquer anel, utilizamos tão somente o algoritmo da divisão para
os inteiros. Isto permite-nos generalizar o resultado da seguinte forma.
Teorema 13.5. Seja R um domı́nio euclideano e A ∈ Mn×m (R). Então

existem matrizes Q ∈ GLn (R) e P ∈ GLm (R) tais que A0 = QAP −1 é diagonal
da forma indicada no teorema anterior.
Notemos que este processo se aplica particularmente à matriz de um homo-

morfismo de R-módulos ϕ : Rm → Rn .
13.6. Geradores e relações para módulos

Seja ϕ : Rn → Rm um homomorfismo de R-módulos cuja matriz na base
canônica é A ∈ Mm×n (R). A base canônica de Rn é chamado o conjunto de
geradores e o núcleo N (ϕ) de ϕ é dito o conjunto de relações. A imagem de ϕ é
dada por multiplicação por A, assim denotamos ϕ(Rn ) := ARn . O conúcleo de ϕ
é definido por Rm /ARn . Neste caso dizemos que a matriz A presenta o conúcleo
de ϕ, ou em outras palavras, A é a matriz de presentação do conúcleo de ϕ.
Mostraremos agora que todo R-módulo finitamente gerado V pode ser pre-
sentado por alguma matriz. Inicialmente observemos que se v1 , · · · , vn é um con-
junto de geradores de V então temos um homomorfismo sobrejetivo canônico de
R-módulos ϕ : Rn → V dado por ϕ(ei ) = vi , onde e1 , · · · , en é a base canônica de
Rn . De fato, para todo v ∈ V temos v = ni=1 ai vi com a1 , · · · , an ∈ R. Portanto,
P
V = ARn . Seja W = N (ϕ). Mostraremos em seguida que W é também um R-

módulo finitamente gerado. Neste caso, digamos que seja gerado por w1 , · · · , wm ,
temos também um homomorfismo sobrejetivo ψ : Rm → W de R-módulos e o
W = BRm . Pelo teorema dos homomorfismos, V ∼ = Rn /W = Rn /BRm , assim a
matriz B presenta V . A idéia do teorema será diagonalizar a matriz B como na
seção anterior e obter daı́ a decomposição do módulo.
Lema 13.7. Seja ϕ : V → W um homomorfismo de R-módulos.

13.6. GERADORES E RELAÇÕES PARA MÓDULOS 109
(1) Se ker(ϕ) e ϕ(V ) são finitamente gerados, então V também é finita-

mente gerado. Se V é finitamente gerado e ϕ é sobrejetivo, então W é
finitamente gerado.
(2) Seja W um R-submódulo de V . Se W e V /W são finitamente gerados,
então V também é finitamente gerado. Se V é finitamente gerado, então
V /W é finitamente gerado.
Demonstração. (1) Seja u1 , · · · , uk um conjunto de geradores de ker(ϕ)

e w1 , · · · , wm um conjunto de geradores de W . Para todo i = 1, · · · , m seja
vi ∈ V tal que ϕ(vi ) = wi . Afirmamos que (u1 , · · · , uk ; v1 , · · · , vm ) geram V . De
P
fato, dado v ∈ V temos ϕ(v) = i ai wi com ai ∈ R para i = 1, · · · , m. Seja
v 0 = i ai vi ∈ V . Então ϕ(v 0 ) = ϕ(v), i.e., v 0 − v ∈ ker(ϕ), i.e., v 0 − v = j bj uj
P P
para bj ∈ R para todo j = 1, · · · , k. Para a segunda parte, se v1 , · · · , vn geram V ,

P
como todo w ∈ W é da forma w = ϕ(v), para algum v ∈ V , então w = i ai ϕ(vi ),
P
onde v = i ai vi , e ϕ(v1 ), · · · , ϕ(vn ) forma um conjunto de geradores de W .
(2) Segue de (1) aplicado ao homomorfismo quociente canônico ϕ : V →
V /W .
Proposição 13.8. Seja V um R-módulo. As seguintes condições são equi-

valentes:
(1) Todo R-submódulo W de V é finitamente gerado.
(2) Não existe seqüência estritamente crescente de R-submódulos de V :
W1 W2 · · ·
Demonstração. Suponha que a condição (2) seja satisfeita e que W 6= 0.

Seja w1 ∈ W − {0}. Se w1 gera W acabou. Senão seja w2 ∈ W − Rw1 . Se
Rw1 + Rw2 = W , acabou, w1 e w2 geram W . Senão seja w3 ∈ W − (RW1 + Rw2 ).
Prosseguindo desta forma o conjunto de R-módulos Wi = Rw1 + . . . + Rwi é
estritamente crescente. Por hipótese existe k tal que Wk = W , em particular
w1 , · · · , wk geram W .
Reciprocamente suponha (1). Seja W1 ⊂ W2 ⊂ · · · uma seqüência de R-
S
submódulos de V . A união U = i Wi também é um R-submódulo de V
(exercı́cio). Por hipótese U é finitamente gerado, digamos por u1 , · · · , un . Seja j
o maior ı́ndice tal que ui ∈ Wj para todo i. Logo Wj ⊂ U ⊂ Wj , i.e., U = Wj e
a seqüência estaciona.
Definição 13.9. Um anel R tal que todo módulo satisfaça as condições an-
teriores é chamado um anel noetheriano.
Proposição 13.10. Seja R um anel noetheriano e V um R-módulo finita-

mente gerado. Então todo submódulo W de V também é finitamente gerado.
Demonstração. Observemos inicialmente que basta provar a proposição no

caso em que V = Rn . De fato, como V é finitamente gerado, então existe um
homomorfismo sobrejetivo ϕ : Rn → V . Seja W ⊂ V um submódulo. Então
ϕ−1 (W ) = W 0 é um submódulo de Rn , por hipótese é finitamente gerado. Pelo
lema anterior concluimos que W também é finitamente gerado.
Provemos por indução em n. Para n = 1 isto segue da proposição ante-
rior. Consideremos o homomorfismo de projeção ϕ : Rn → Rn−1 dado por
ϕ((a1 , · · · , an )) = (a1 , · · · , an−1 ). O seu núcleo constitui-se dos vetores da forma
(0, · · · , 0, an ). Seja W um submódulo de Rn e seja ψ a restrição de ϕ a W , diga-
mos ψ : W → Rn−1 . Por hipótese de indução ψ(W ) é finitamente gerado. Além
disto, ker(ψ) = ker(ϕ) ∩ W é um submódulo de ker(ϕ) ∼ = R, portanto também é
finitamente gerado. Assim, o resultado segue da proposição anterior.
13.11. O teorema de estrutura

Já fizemos tudo que era necessário para obter nosso resultado principal neste
capı́tulo. Antes só mais um pouco de notação. Sejam W1 , · · · , Wn submódulos
de um R-módulo V . Definimos W1 + . . . + Wn := {w1 + . . . + wn | wi ∈ Wi , i =
1, · · · , n}. Fica como exercı́cio verificar que W1 + . . . + Wn é um R-submódulo de
P
V . Dizemos que esta soma é direta de para qualquer relação linear i ai wi = 0,
com ai ∈ R, temos ai = 0 para todo i. Neste caso escrevemos W1 ⊕ . . . ⊕ Wn .
Teorema 13.12. (teorema de estrutura de grupos abelianos finitamente ge-

rados) Seja G um grupo abeliano finitamente gerado. Então
G∼
= (Z/d1 Z) ⊕ . . . ⊕ (Z/dk Z) ⊕ Zr , onde d1 | d2 | · · · | dr
são inteiros positivos, r é o posto de G como Z-módulo e
Gtor = (Z/d1 Z) ⊕ . . . ⊕ (Z/dk Z)
é o subgrupo de torção de G, i.e., o conjunto dos elementos de ordem finita.
Demonstração. Já vimos anteriormente que G é presentado por uma ma-

triz A ∈ Mn×m (Z), i.e., G = Rn /ARm e que tal matriz pode ser diagonalizada com
a propriedade acima para suas entradas d1 , · · · , dk . As relações do grupo s são
dadas por di vi = 0 para i = 1, · · · , k para um conjunto de geradores v1 , · · · , vn ,
13.11. O TEOREMA DE ESTRUTURA 111
Seja L o submódulo gerado por vk+1 , · · · , vn . Como não há relações entre es-
tes vetores vemos que L é um Z-módulo livre de posto n − k, i.e., L ∼ = Zn−k .
Afirmamos que
G = C1 ⊕ . . . ⊕ Ck ⊕ L, onde Ci = hvi i ∼
= Z/di Z.
É claro, pela presentação de G, que estes submódulos geram G. Ou seja, G é
igual à soma destes. Queremos mostrar que a soma é direta. De fato, se houvesse
uma relação
z1 + . . . + zk + w = 0,
com zi ∈ Ci e w ∈ L, então podemos reescrê-la da forma
k
X n
X
ri vi + ri vi = 0,
i=i i=k+1
onde 0 ≤ ri < di para i = 1, · · · , k e ri ∈ Z para i = k + 1, · · · , n. Como

não há relação envolvendo os últimos n − k vetores concluimos que ri = 0 para
i = k + 1, · · · , n. Além disto pelas relações acima a única possibilidade para que
para os demais di | ri é ri = 0 para cada i. Portanto, não há relações entre os
módulos acima.
Lembremos que no processo de diagonalização das matrizes tudo funcionava

bem para qualquer domı́nio euclideano. Assim no teorema acima podemos subs-
tituir a noção de grupo abeliano finitamtente gerado pela noção de R-módulo
finitamente gerado sobre um domı́nio euclideano R.
13.12.1. Um teorema de Mordell. Grupos abelianos finitamente gerados

surgem naturalmente na aritmética. Uma curva elı́tica sobre os complexos pode
ser pensada como o conjunto de pontos em C2 que são soluções de uma equação
da forma
y 2 = x3 + ax + b,
onde x3 + ax + b não admite raı́zes múltiplas e a priori estamos supondo a, b ∈ C.
Ocorre que existe uma estrutura de grupo abeliano na curva elı́tica que pode ser
definida geometricamente por meio de interseções com retas. Se considerarmos o
caso em que a, b ∈ Q, ou seja uma curva elı́tica definida sobre os racionais, existe
um célebre teorema devido a Mordell que afirma que o conjunto de soluções
(x0 , y0 ) ∈ Q2 da equação é um grupo abeliano finitamente gerado, digamos
E(Q)tor ⊕ Zr .
O inteiro (misterioso) r é chamado o posto da curva elı́tica. Não se sabe por

exemplo se é possı́vel existir curvas elı́ticas com posto arbitrariamente grande, o
recorde é 24.
A este objeto (a curva elı́tica) está associado a uma função de natureza
analı́tica chamada a L-série de Hasse-Weil da curva elı́tica. A famosa conjec-
tura de Birch e Swinnerton-Dyer afirma que a ordem de anulamento desta função
em s = 1 é exatamente o posto. Ela surgiu a partir de evidências computacionais.
De outro lado podemos nos perguntar o que é conhecido sobre o grupo de
torção. A resposta é tudo. Um belo e profundo resultado devido a Mazur mostra
que existem exatamente 16 grupos abelianos que podem ser grupos de torção
de curvas elı́ticas sobre os racioanis e que cada um desses grupos efetivamente
ocorre.
Para mais informações sobre curva elı́ticas e o teorema de Mordell ver [?].
Para o teorema de Mazur ver [?].
Parte 3
Anéis
CAPı́TULO 14
Anéis de polinômios
14.1. Algoritmo da divisão

Seja K um corpo. Um polinômio definido sobre K é uma expressão da forma
f (x) = an xn + . . . + a1 x + a0 ,
onde a0 , · · · , an ∈ K. Identificamos f (x) a um vetor (a0 , · · · , an , 0, · · · , 0, · · · ).

Se f 6= 0 e n ≥ 0 for o maior inteiro tal que an 6= 0, dizemos então que n é o grau
de f . O conjunto de todos os polinômios definidos sobre K é denotado por K[x].
Seja g(x) = bm xm + . . . + b1 x + b0 . Suponhamos que n ≥ m. Definimos a
soma de f, g ∈ K[x] por
(f + g)(x) := (an + bn )xn + . . . + (a1 + b1 )x + a0 + b0 ,
onde bj = 0 para todo j > m. Se f + g 6= 0, então
grau(f + g) ≤ max{grau(f ), grau(g)}.
Note que se f = x3 + x + 1 e g = −x3 + x2 − 2, então grau(f + g) = 2 < 3.

Definimos o produto de f e g por
X
(f g)(x) := cn+m xn+m + . . . + c1 x + c0 , onde ci = aj b l .
j+l=i
Assim, se f, g 6= 0, grau(f g) = grau(f ) + grau(g).

Afirmamos que K[x] é um domı́nio de integridade. Observemos inicialmente
que K[x] é um espaço vetorial com a operação de multiplicação por escalar sendo
a multiplicação por um polinômio constante de grau zero. Verifique que de fato
isto faz de K[x] um espaço vetorial. Em particular, temos as propriedades aditivas
de K[x] como anel.
A associatividade do produto é provada da seguinte forma. Sejam f, g ∈ K[x].
Seja h(x) = ri=0 ci xi . Então
P
n+m
X X
fg = di xi , onde di = aj b l ,
i=0 j+l=i
115
116 14. ANÉIS DE POLINÔMIOS
logo
n+m+r
X X X
(f g)h = ei xi , onde ei = aα b β c l
i=0 j+l=i α+β=j
X
= aα b β c l .
α+β+l=i
Por outro lado,

m+r
X X
gh = = Ai xi , onde Ai = bj c l ,
i=0 j+l=i
logo
n+m+r
X X X
f (gh) = Bi xi , onde Bi = aα b β c l
i=0 α+l=i β+j=l
X
= aα b β c l .
α+β+l=i
A comutatividade do produto segue da mesma propriedade para os elementos

de K. O elemento neutro do produto é o polinômio constante f = 1. Fica como
exercı́cio verificar que a soma distribui em relação ao produto, i.e.,
f (g + h) = f h + gh.
Sejam f, g ∈ K[x] tais que f g = 0, mas f 6= 0 de grau n. Provaremos agora
que isto implica em g = 0. De fato, começando pelo coeficiente de xn+m temos
que
an bm = 0, logo bm = 0.
Em seguida, para o coeficiente de xn+m−1 temos
an bm−1 + an−1 bm = an bm−1 = 0, logo bm−1 = 0.
Para o coeficiente de xn+m−2 temos
an bm−2 + an−1 bm−1 + an−2 bm = an bm−2 = 0, logo bm−2 = 0.
Assim sucessivamente, todos os coeficientes de g são nulos. Portanto, g = 0.
Dizemos que f ∈ K[x] é inversı́vel se existe g ∈ K[x] tal que f g = 1. Note
que neste caso, o lado esquerdo da equação tem grau n + m e o lado direito tem
grau 0, logo n = m = 0 e f, g ∈ K ∗ = K \ {0}, pois K é um corpo.
Teorema 14.2 (algoritmo da divisão). Sejam f, g ∈ K[x], g 6= 0, então

existem únicos q, r ∈ K[x] tais que f = qg + r, onde r = 0 ou grau(r) < grau(g).
14.1. ALGORITMO DA DIVISÃO 117
Pn Pm
Demonstração. Sejam f = i=0 ai x i e g = j=0 bj x
j
. Definimos
an n−m
f1 := f − x g.
bm
Se f1 = 0, acabou, tome
an n−m
r=0eq= x .
bm
6 0, então n1 = grau(f1 ) < n = grau(f ). Se n1 < m, acabou, tome
Se f1 =
an n−m
r = f1 e q = x .
bm
Suponha que n1 ≥ m. Seja
n1
X
f1 := a1,i xi .
i=0
Defina
a1,n1 n1 −m
f2 := f1 − x g.
bm
Se f2 = 0, acabou, tome
1
r=0eq= (an xn−m + a1,n1 xn1 −m ).
bm
Se f2 6= 0, então n2 = grau(f2 ) < n1 . Se n2 < m, acabou, tome
1
r = f2 e q = (an xn−m + a1,n1 xn1 −m ).
bm
Prosseguindo obtemos uma seqüência de polinômios fi com graus estritamente
decrescentes, assim pelo menos para algum t ≥ 1 temos ft 6= 0 e grau(ft ) < m,
neste ponto o algoritmo acaba, tome
1
r = ft e q = (an xn−m + a1,n1 xn1 −m + . . . + at−1,nt−1 xnt−1 −m ).
bm
Suponha que tenhamos realizado duas divisões
f = q1 g + r1 = q2 g + r2 ,
onde para i = 1, 2, ri = 0 ou grau(ri ) < m. Se r1 = r2 , então q1 g = q2 g = 0, e

como g 6= 0, então q1 = q2 . Suponhamos que r1 6= r2 . Neste caso, grau(r1 − r2 ) <
m. Por outro lado
r1 − r2 = (q2 − q1 )g
e grau((q2 − q1 )g) ≥ grau(g), o que é impossı́vel.
14.3. Máximo divisor comum de polinômios

Sejam f, g ∈ K[x] − {0}. Dizemos que f divide g e denotamos por f | g se
existe
h ∈ K[x] tal que f h = g.
Notemos que esta propriedade é transitiva, i.e.,
se f | g e g | h, então f | h.
De fato, se g = f α e h = gβ, onde α, β ∈ K[x], então h = f αβ, i.e., f | h.
Se h 6= 0 e f h | gh, então f | h,
pois se gh = f hα para α ∈ K[x], então h(g − f α) = 0 e como h 6= 0 e K[x] é

domı́nio de integridade, então g = f α. Além disto,
se f | g e g | f, então f = ag,
para algum a ∈ K ∗ , pois de f = gα e g = f β obtemos que 1 = αβ, mas a última

igualdade só ocorre se α, β ∈ K ∗ .
Definição 14.4. Sejam f, g ∈ K[x] − {0}, dizemos que d ∈ K[x] é um mdc

de f e g se
(1) d | f e d | g.
(2) Para todo d0 ∈ K[x] tal que d0 | f e d0 | g, temos d0 | d.
Dizemos que f = ni=0 ai xi ∈ K[x] é um polinômio mônico, se an = 1.

P
Observação 14.5. Dado um outro mdc e de f e g, pela condição (2) temos

que d | e e e | d, portanto d = ae, onde a ∈ K ∗ . A maneira de tornar canônica a
escolha do mdc é exigir que ele seja um polinômio mônico e neste caso podemos
dizer que d = mdc(f, g) é o mdc de f e g.
Observe que se f | g e f então f é um mdc de f e g. A etapa seguinte é obter

o mdc de maneira algorı́timica. Para isto introduzimos um lema simples.
Lema 14.6. Sejam f, g ∈ K[x] − {0} e q, r ∈ K[x] tais que
f = qg + r, onde r = 0 ou grau(r) < grau(g).
Então
mdc(f, g) = mdc(g, r).
14.3. MÁXIMO DIVISOR COMUM DE POLINÔMIOS 119
Demonstração. Seja Df,g (resp. Dg,r ) o conjunto dos divisores comuns de

f e g (resp. g e r). Seja d = mdc(f, g). Logo para todo d0 ∈ Df,g \ {0} temos
grau(d0 ) ≤ grau(d). Assim d é o elemento em Df,g mônico de grau máximo
possı́vel. Similarmente, e = mdc(g, r) é o elemento mônico em Dg,r de grau
máximo possı́vel. Mostraremos agora que Df,g = Dg,r , conseqüentemente d = e.
Seja A ∈ Df,g , logo f = Aα e g = Aβ, onde α, β ∈ K[x]. Segue da equação
do enunciado que
r = A(α − qβ),
em particular A ∈ Dg,r . A inclusão oposta segue pelo mesmo argumento.
Teorema 14.7. Sejam f, g ∈ K[x] \ {0} e r1 , · · · , rn ∈ K[x] os restos não

nulos na seqüência de divisões
f = q1 g + r1 , onde grau(r1 ) < grau(b)
g = q2 r1 + r2 , onde grau(r2 ) < grau(r1 )
(14.7.1) ···
rn2 = qn rn−1 + rn , onde grau(rn ) < grau(rn−1 )
rn−1 = qn+1 rn .
Esta seqüência é finita pois os graus são estritamente decrescentes. Então rn é
um mdc de f e g.
Demonstração. A última linha nos diz que rn é um mdc de rn e rn−1 .

Logo rn = mdc(rn−1 , rn ). Pelo lema 14.6 concluimos que rn = mdc(rn−1 , rn−2 )
e prosseguindo nas linhas anteriores temos que rn = mdc(r2 , r1 ) = mdc(r1 , g) =
mdc(f, g).
Teorema 14.8 (algoritmo euclideano estendido). Sejam f, g ∈ K[x] \ {0} e

d = mdc(a, b). Então existem α, β ∈ K[x] tais que
d = f α + gβ.
Demonstração. Do teorema anterior temos que d = rn . A penúltima equa-

ção nos dá
rn = rn−2 − qn rn−1 .
Tomando A1 = −qn e B1 = 1 reescrevemos
rn = B1 rn−2 + A1 rn−1 .
Utilizando a equação antecedente a esta obtemos

rn = B1 rn−2 + A1 (rn−3 − qn−1 rn−2 ) = B2 rn−3 + A2 rn−2 ,
onde B2 = A1 e A2 = B1 − A1 qn−1 . Prosseguindo ao longo das demais divisões
obtemos
rn = Bn−3 r1 + An−3 r2 = Bn−3 r1 + An−3 (g − q2 r1 ) = Bn−2 g + An−2 r1 ,
onde Bn−2 = An−3 e An−2 = Bn−3 − An−3 q2 . Pela equação antecedente temos
que
rn = Bn−2 g + An−2 (f − gq1 ) = α0 f + β 0 g,
onde α0 = An−2 e β 0 = Bn−2 − An−2 q1 .
Nosso objetivo agora é dar uma prova mais conceitual do algoritmo euclideano
estendido usando a noção de ideal.
Definição 14.9. Um subconjunto I ⊂ K[x] é dito um ideal de K[x] se

(1) O ∈ I.
(2) Se f, g ∈ I, então f + g ∈ I.
(3) Se f ∈ I e α ∈ K[x], então f α ∈ I.
Fica como exercı́cio verificar que os seguintes conjuntos são ideais:

(i) Seja f ∈ K[x] e I := (f ) := {f α | α ∈ K[x]} o conjunto dos múltiplos de
f.
(ii) Sejam f, g ∈ K[x] e I := (f ) + (g) := {f α + gβ | α, β ∈ K[x]}.
(iii) Sejam f1 , · · · , fn ∈ K[x] e I := (f1 )+. . .+(fn ) := {f1 α1 +. . .+fn αn | α1 ,
· · · , αn ∈ K[x]}.
Teorema 14.10. O domı́nio K[x] é principal, i.e., todo ideal I de K[x] é da

forma (f ) para algum f ∈ K[x].
Demonstração. Seja I um ideal de K[x]. Se I = (0) nada há a fazer.

Suponhamos que I 6= (0). Pelo axioma da boa ordenação existe um único f ∈
I − {0} mônico de grau mı́nimo. Afirmamos que I = (f ). De fato, como f ∈ I,
para todo f α ∈ (f ), pelo ı́tem (3) da definição de ideal, f α ∈ I. Assim (f ) ⊂ I.
Para provar a inclusão oposta precisamos do algoritmo da divisão. Seja g ∈ I\{0}.
Então existem q, r ∈ K[x] tais que g = qf + r, onde r = 0 ou grau(r) < grau(f ).
Note que r ∈ I, pois g, f ∈ I. Logo, se r 6= 0 vioları́amos a minimalidade do grau
de f . Portanto, r = 0 e g ∈ (f ).
14.11. FATORAÇÃO ÚNICA DE POLINÔMIOS 121
Aplicando este teorema ao ı́tem (ii) anterior, obtemos que existe um único
d ∈ K[x] mônico tal que (f ) + (g) = (d). Afirmamos que d = mdc(f, g). De fato,
f = 1.f + 0.g ∈ (f ) + (g) = (d), logo f = αd, para α ∈ K[x], i.e., d | f . Da
mesma forma d | g. Se d0 | f e d0 | g, para d0 ∈ K[x], então d = αf + βg, para
α, β ∈ K[x], se reescreve como d = (αα0 + ββ 0 )d0 , para α0 , β 0 ∈ K[x], i.e., d0 | d,
logo d = mdc(f, g). Observe também que de passagem provamos que d = αf +βg
que é a igualdade do algoritmo euclideano estendido.
14.11. Fatoração única de polinômios

Seja f ∈ K[x] \ {0}. Dizemos que f é irredutı́vel se dados g, h ∈ K[x] \ {0}
tais que f = gh então f ∈ K ∗ ou g ∈ K ∗ . Por exemplo x3 − 2 é irredutı́vel
em Q[x], pois sendo um polinômio de grau 3 só seria redutı́vel se um dos fatores
tivesse grau 1 e outro grau 2 ou se tivermos 3 fatores de grau 1. Mas como x3 − 2
é mônico isto equivale a este polinômio ter uma raiz racional. Mas suas raı́zes
√ √ √
são 3 2, 3 2α e 3 2α2 que não não números racionais, onde α = exp(2πi/3). Por
√ √ √
outro lado, em C[x] temos a fatoração x3 − 2 = (x − 3 2)(x − 3 2α)(x − 3 2α2 ),
assim esta noção é relativa ao corpo considerado.
Seja I ⊂ K[x] um ideal não nulo. I é dito um ideal maximal de K[x] se dado
um ideal J de K[x] tal que I ⊂ J ⊂ K[x], então J = I ou J = K[x].
Proposição 14.12. Seja f ∈ K[x] \ {0}. Então f é irredutı́vel se e somente

se (f ) é maximal.
Demonstração. Suponha que f seja irredutı́vel. Seja J um ideal de K[x]

tal que (f ) ⊂ J ⊂ K[x]. Pelo Teorema 14.10 temos que existe g ∈ K[x] tal que
J = (g). Logo f = gA, para A ∈ K[x]. Pela irredutibilidade de f temos que
g ∈ K ∗ ou A ∈ K ∗ . No primeiro caso, 1 = gg −1 ∈ (g), assim (g) = K[x]. No
segundo caso, g = A−1 f ∈ (f ), em particular (g) = (f ).
Reciprocamente, suponhamos que (f ) seja maximal e que f = gh para g, h ∈
K[x] \ {0}. Então (f ) ⊂ (g) ⊂ K[x]. Pela maximalidade de (f ), temos que
(g) = (f ) ou (g) = K[x]. No primeiro caso, g = af para algum a ∈ K ∗ , logo
1 = ah e a fortiori h ∈ K ∗ . No segundo caso, 1 = gg −1 ∈ (g) e assim g ∈ K ∗ .
Lema 14.13. Seja f ∈ K[x] irredutı́vel tal que f | gh para g, h ∈ K[x] \ {0}.
Então f | g ou f | h.
Demonstração. Suponha que f - g, i.e., mdc(f, g) = 1. Pelo algoritmo

euclideano estendido existem A, B ∈ K[x] tais que 1 = Af + Bg. Logo, h =
Af h + Bgh, e como f | gh, concluimos que f | h.
Teorema 14.14. Seja f ∈ K[x] \ {0}. Então existem únicos u ∈ K ∗ ,

p1 , · · · , pr
∈ K[x] polinômios irredutı́veis mônicos tais que grau(p1 ) < · · · < grau(pr ) e
inteiros e1 , · · · , er tais que
f = upe11 . . . perr .
Demonstração. Provavemos primeiro a existência da fatoração. Se f ∈ K ∗

ou f é irredutı́vel nada há a fazer. Suponha que grau(f ) ≥ 1 e f seja redutı́vel.
Seja Df o conjunto dos dvisores de f em K[x]. Pelo axioma da boa ordenação
existe q1 ∈ Df tal que grau(q1 ) ≤ grau(A) para todo A ∈ Df . Afirmamos que
q1 é irredutı́vel. Se isto não ocorresse, um fator B de q1 teria grau menor que
grau(q1 ) e além disto pertenceria a Df , o que é impossı́vel. Seja
f
f1 := .
q1
Se f1 ∈ K ∗ ou f1 for irredutı́vel acabou. Senão, seja q2 ∈ Df1 tal que grau(q2 ) ≤
grau(A) para todo A ∈ Df1 . Pelo mesmo argumento anterior q2 é irredutı́vel.
Seja
f1 f
f2 := = .
q2 q1 q2
Se f2 ∈ K ∗ ou f2 for irredutı́vel acabou. Senão prosseguimos. Note que grau(f ) >
grau(f1 ) > grau(f2 ) > · · · ≥ 0. Assim, existe r ≥ 1 tal que fr ∈ K ∗ , digamos
fr = u. Portanto,
f = uq1 · · · qr
é a fatoração desejada. Observe também que este processo é algorı́tmico e que
não fizemos qualquer hipótese sobre os qi ’s serem distintos.
Agrupando os polinômios irredutı́veis iguais temos uma fatoração como no
enunciado. Provemos agora sua unicidade. Suponha que tenhamos duas fa-
torações como acima, digamos
e
f = upe11 · · · prf = vq1g1 · · · qsgs ,
onde v ∈ K ∗ , q1 , · · · , qs são irredutı́veis com grau(q1 ) < · · · < grau(qs ) e g1 , · · · , gs
≥ 1 são inteiros. Observe que
p1 | vq1g1 · · · qsgs ,
logo pelo lema 14.13 existe j tal que p1 | qj . Como ambos são irredutı́veis mônicos
isto ocorre se e somente se qj = p1 .
Afirmamos que j = 1. Suponha que j > 1. Neste caso, pelo mesmo argumento
existe i tal que q1 = bi pi para bi ∈ K ∗ . Se i = 1, então
grau(q1 ) = grau(p1 ) = grau(qj ),
o que é impossı́vel. Se i > 1, então
grau(q1 ) = grau(pi ) > grau(p1 ) = grau(qj ),
o que também é impossı́vel. Portanto q1 = a1 p1 e além disto e1 = g1 . Dividindo

os dois lados por pe11 obtemos a igualdade
upe22 · · · perr = vq2g2 · · · qsgs .
O mesmo argumento acima mostra que q2 = p2 e que e2 = g2 . Novamente

dividindo os dois lados por pe22 obtemos
upe33 · · · perr = vq3g3 · · · qsgs .
Assim aplicando sucessivamente o argumento temos que r = s, ei = gi para todo

i, qi = ai pi , onde ai ∈ K ∗ , e u = v.
Nosso objetivo agora é obter um critério de irredutibilidade de polinômios em

Q[x] em termos dos seus coeficientes.
Lema 14.15 (lema de Gauss). Seja f ∈ Z[x] irredutı́vel. Então f é irredutı́vel

em Q[x].
Demonstração. Suponha que f = gh com g, h ∈ Q[x] e grau(g), grau(h) ≥

1. Multiplicando os dois lados pelo produto m dos denominadores de todos os
coeficientes de g e h obtemos
mf = g1 h1 ,
onde g1 , h1 ∈ Z[z] e grau(g1 ) = grau(g) e grau(h1 ) = grau(h). Seja p um fator
primo de m.
Afirmamos que p divide todos os coeficientes de g1 ou todos os coeficientes de
h1 . Escrevemos explicitamente
n
X m
X
i
g1 = ai x e h1 = bj x j .
i=0 j=0
Suponhamos que existam i e j tais que p - ai e p - bj . Além disto escolhamos

estes i e j minimais para esta propriedade. Consideremos o coeficiente de xi+j
de mf dado por
ci+j = a0 bi+j + . . . + ai−1 bj+1 + ai bj + ai+1 bj−1 + . . . + ai+j b0 .
Assim p divide todas as parcelas exceto ai bj , mas como p | ci+j isto nos dá uma
contradição. Portanto, p | ai para todo i ou p | bj para todo j. Suponhamos o
primeiro caso, dividindo por p dos dois lados temos que
m
f = g2 h1 .
p
Repetindo o argumento, cancelamos todos os fatores primos de m obtendo
f = g ∗ h∗ ,
onde g ∗ , h∗ ∈ Z[x] e grau(g ∗ ) = grau(g) e grau(h∗ ) = grau(h). Portanto f é

redutı́vel em Z[x].
Proposição 14.16 (critério de Eisenstein). Seja

n
X
f= ai xi ∈ Z[x] \ {0}.
i=0
Suponhamos que exista um número primo p tal que p | ai para todo i 6= n e

p2 - a0 . Então f é irredutı́vem em Q[x].
Demonstração. Pelo lema de Gauss basta mostrar que f é irredutı́vel em

Z[x]. Suponhamos que f = gh com g, h ∈ Z[x] e grau(g), grau(h) ≥ 1, digamos
r
X s
X
g= ai x i e h = bj x j .
i=0 j=0
Como p - an = br cs então p - br e p - cs . Por outro lado segue de p | a0 = b0 c0 e

p2 - a0 que p | b0 ou p | c0 e apenas uma destas opções ocorre. Digamos que p | b0
e p - c0 . Seja i ≤ r o menor inteiro tal que p - bi . O coeficiente de xi em f é dado
por
ai = b0 ci + b1 ci−1 + . . . + bi−1 c1 + bi c0 ,
assim p divide todas as parcelas exceto a última, portanto p - ai . Mas isto só
pode ocorrer para i = n, mas i ≤ r < n.
Utilizando o critério de Eisenstein vemos que todo polinômio xn − p para p

um número primo é irredutı́vel em Z[x]. Um exemplo menos óbvio é f (x) =
xp−1 + . . . + x + 1. Não existe a priori um primo para o qual possamos aplicar
o critério. A idéia é considerar o automorfismo de K[x] definido por x 7→ x + 1.
Assim dado g ∈ K[x] temos que g(x) é irredutı́vel se e somente se g(x + 1) é
irredutı́vel. Aplicando isto a f , observamos (exercı́cio) que f (x + 1) tem todos
os coeficientes, exceto o lı́der que é 1, divisı́veis por p e o coeficiente constante é
igual a p, portanto não é divisı́vel por p2 .
CAPı́TULO 15
Anéis e domı́nios
15.1. Domı́nios euclideanos

Seja D um domı́nio de integridade e ϕ : D \ {0} → N uma função tal que
ϕ(ab) ≥ ϕ(a),
para todos a, b ∈ D \ {0}. Dizemos que (D, ϕ) é um domı́nio euclideano, se para

todo a, b ∈ D com b 6= 0 temos
a = bq + r, onde r = 0 ou ϕ(r) < ϕ(b).
Como exemplos temos (Z, | |) e (K[x], grau). Em um domı́nio de integridade D

dizemos que b | a (para a, b ∈ D) se existe c ∈ D tal que a = bc.
Exemplo 15.2. Um outro exemplo é o anel dos inteiros gaussianos,
Z[i] := {a + bi | a, b ∈ Z}, onde i2 = −1.
Definimos também
ϕ(a + bi) := a2 + b2 .
Note que se a + bi, c + di ∈ Z[i] \ {0}, então
ϕ((a + bi)(c + di)) = ϕ((ac − bd) + i(ad + bc)i) = (ac − bd)2 + (ad + bc)2
= a2 c2 + b2 d2 + a2 d2 + b2 c2 = a2 (c2 + d2 ) + b2 (c2 + d2 )
= (a2 + b2 )(c2 + d2 ) = ϕ(a + bi)ϕ(c + di).
Em particular a condição
ϕ((a + bi)(c + di)) ≥ ϕ(a + bi)
é satisfeita. Afirmamos que (Z[i], ϕ) é um domı́nio euclideano. De fato, dados

a + bi, c + di ∈ Z[i] com c + di 6= 0 queremos mostrar que existem q = q0 + iq1 e
r = r0 + ir1 em Z[i] tais que
a + bi = q(c + di) + r, onde r = 0 ou ϕ(r) < ϕ(c + di).

127
128 15. ANÉIS E DOMÍNIOS
Se c + di divide a + bi basta tomar

a + bi
r=0eq= .
c + di
Suponhamos portanto que isto não ocorra, i.e., procuramos r 6= 0 satisfazendo a
ϕ(r) = ϕ(a + bi − q(c + di)) < ϕ(c + di),
i.e., (utilizando a multiplicatividade de ϕ)

a + bi
ϕ − q < ϕ(1) = 1.
c + di
Normalizando (a + bi)/(c + di) obtemos
(a + bi)(c − di)
= α + iβ,
c2 + d 2
onde α, β ∈ Q. Assim queremos mostrar que
ϕ(α + iβ − q) = (α − q0 )2 + (β − q1 )2 < 1.
Note que como α ∈ Q, então existe q0 ∈ Z tal que |α − q0 | ≤ 21 . Da mesma forma,

existe q1 ∈ Z tal que |β − q1 | ≤ 21 . Portanto,
1 1 1
(α − q0 )2 + (β − q1 )2 ≤ + = < 1.
4 4 2
Definimos portanto q como q0 + iq1 e r como a + bi − (c + di)q.
Exemplo 15.3. Outro exemplo é o anel

√ √
Z[ 2] := {a + b 2 | a, b ∈ Z}.
Para este anel definimos

√
ϕ(a + b 2) := a2 − 2b2 .
Observemos que
√ √ √
ϕ((a + b 2)(c + d 2)) = ϕ((ac + 2bd) + (ad + bc) 2) = (ac + 2bd)2 − 2(ad + bc)2
= a2 c2 + 4b2 d2 − 2a2 d2 − 2b2 c2 = a2 (c2 − 2d2 ) − 2b2 (c2 − 2d2 )
√ √
= (a2 − 2b2 )(c2 − 2d2 ) = ϕ(a + b 2)ϕ(c + d 2).
Portanto,
√ √ √
ϕ((a + b 2)(c + d 2)) ≥ ϕ(a + b 2).
15.1. DOMÍNIOS EUCLIDEANOS 129
√ √ √ √ √
Dados a + b 2, c + d 2 ∈ Z[ 2] com c + d 2 6= 0 queremos obter q, r ∈ Z[ 2]
tais que
√ √ √
a + b 2 = (c + d 2)q + r, onde r = 0 ou ϕ(r) < ϕ(c + d 2).
√ √
Se (c + d 2) | (a + b 2) tomamos
√
a+b 2
r=0eq= √ .
c+d 2
Caso isto não ocorra procuramos r 6= 0 tal que
√ √ √
ϕ(r) = ϕ(a + b 2 − q(c + d 2)) < ϕ(c + d 2),
i.e.,
√ !
a+b 2
ϕ √ − q < ϕ(1) = 1.
c+d 2
√ √
Normalizando (a + b 2)/(c + d 2) obtemos
√ √
(a + b 2)(c − d 2) √
= α + β 2,
c2 − 2d2
onde α, β ∈ Q. Assim queremos mostrar que
(α − q0 )2 − 2(β − q1 )2 < 1
1
para q0 , q1 ∈ Z. Novamente podemos escolher q0 , q1 ∈ Z tais que |α − q0 | ≤ 2
e
|β − q1 | ≤ 12 . Além disto
1
(α − q0 )2 − 2(β − q1 )2 ≤ (α − q0 )2 ≤ < 1.
4
Observação 15.4. Estes exemplos são na verdade casos particulares da se-
guinte situação mais geral. Seja K ⊃ Q um corpo contendo Q que como Q-espaço
vetorial é de dimensão finita. Um tal corpo é chamado um corpo de números. Os
elementos α ∈ K que satisfazem uma equação do tipo
n−1
X
αn + ai αi = 0 tais que ai ∈ Z
i=0
são chamados inteiros algébricos de K e o conjunto de todos os inteiros algébricos

forma uma anel (dos inteiros algébricos de K) denotado por OK . A pergunta é
quando OK com uma função ϕ apropriada é um domı́nio euclideano. A resposta
é como no caso anterior geométrica. Tudo depende da representação logarı́tmica
de K em um R espaço vetorial Rn de dimensão finita. Existem critérios nos quais
podemos mostrar que para certos corpos de números K existem funções ϕK tais
que (OK , ϕK ) é um domı́nio euclideano. Para mais sobre esta questão ver [?] e
[?].
Observação 15.5. Mostraremos agora que como no caso dos inteiros e dos
polinômios domı́nios euclideanos são principais e fatoriais. Um caso clássico de
corpo de números ligado a teoria de números é o corpo
( n−1 )
X
Q[ζn ] := ai ζ i | ai ∈ Q para todo i ,
i=0
onde ζ = exp(2πi/n). Este corpo é chamado o n-ésimo corpo ciclotômico. Kum-

mer, no fim do século XIX, pensou erradamente ter “provado” o último teorema
de Fermat (i.e., que a equação xn + y n = z n não possui soluções inteiras não tri-
viais para n > 2), e seu erro foi exatamente ter “achado” que OK era principal,
o que é falso.
Teorema 15.6. Seja (D, ϕ) um domı́nio euclideano. Então D é principal,

i.e., todo ideal I ⊂ D é da forma I = (a) = {aα | α ∈ D}.
Demonstração. Se I = (0) nada há a fazer. Suponhamos que I 6= (0) e seja

a ∈ I \ {0} tal que ϕ(a) ≤ ϕ(α) para todo α ∈ I \ {0}. Afirmamos que I = (a).
A inclusão (a) ⊂ I é imediata da definição de ideal. Suponhamos que b ∈ I. Por
hipótese existem q, r ∈ D tais que b = aq + r, onde r = 0 ou ϕ(r) < ϕ(a). Se
r 6= 0, então r = b − aq ∈ I, mas isto contradiz a escolha de a. Logo r = 0 e
b ∈ (a).
Teorema 15.7. Seja (D, ϕ) um domı́nio euclideano. Então D é principal,

i.e., todo ideal I ⊂ D é da forma I = (a) = {aα | α ∈ D}.
Demonstração. Se I = (0) nada há a fazer. Suponhamos que I 6= (0) e seja

a ∈ I \ {0} tal que ϕ(a) ≤ ϕ(α) para todo α ∈ I \ {0}. Afirmamos que I = (a).
A inclusão (a) ⊂ I é imediata da definição de ideal. Suponhamos que b ∈ I. Por
hipótese existem q, r ∈ D tais que b = aq + r, onde r = 0 ou ϕ(r) < ϕ(a). Se
r 6= 0, então r = b − aq ∈ I, mas isto contradiz a escolha de a. Logo r = 0 e
b ∈ (a).
Seja D um domı́nio de integridade. Denotamos por D∗ o conjunto dos ele-

mentos inversı́veis de D. i.e., o conjunto dos elementos a ∈ D tais que existe
b ∈ D tal que ab = 1. Por exemplo, Z∗ = {±1} e K[x]∗ = K ∗ . Se D = Z[i],
notemos que se a + bi ∈ Z[i]∗ então existe c + di ∈ Z[i] tal que (a + bi)(c + di) = 1.
15.1. DOMÍNIOS EUCLIDEANOS 131
Logo (a2 + b2 )(c2 + d2 ) = 1, i.e., a2 + b2 = 1. Mas no cı́rculo x2 + y 2 = 1 os únicos

pontos com coordenadas inteiras são ±1 e ±i. Reciprocamente, estes elementos
são claramente inversı́veis, portanto Z[i]∗ = {±1, ±i}.
Um elemento a ∈ D é dito irredutı́vel, se toda vez que a = bc com b, c ∈ D
então b ∈ D∗ ou c ∈ D∗ .
Lema 15.8. Seja (D, ϕ) um domı́nio euclideano. Então a ∈ D∗ se e somente

se ϕ(a) = ϕ(1).
Demonstração. Observemos que ϕ(a) = ϕ(a.1) ≥ ϕ(1) para todo a ∈

D \ {0}. Por outro lado se a ∈ D∗ , então existe b ∈ D \ {0} tal que ab = 1, logo
ϕ(1) = ϕ(ab) ≥ ϕ(a), o que mostra que ϕ(a) = ϕ(1). Suponha que ϕ(a) = ϕ(1)
para a ∈ D \ {0}. Por hipótese existem q, r ∈ D tais que 1 = qa + r com r = 0 ou
ϕ(r) < ϕ(a). Assim, se r 6= 0, então ϕ(r) < ϕ(1) o que é impossı́vel. Portanto,
r = 0 e 1 = aq, i.e., a ∈ D∗ .
Teorema 15.9. Seja (D, ϕ) um domı́nio euclideano e a ∈ D \ {0}. Então

existem u ∈ D∗ e p1 , · · · , pr ∈ D \ {0} irredutı́veis tais que a = up1 · · · pr .
Demonstração. Se a ∈ D∗ ou a for irredutı́vel nada há a fazer. Suponha-

mos a ∈ / D∗ redutı́vel. Seja Da o conjunto dos divisores d de a em D. Seja
p1 ∈ Da \ {0} tal que ϕ(p1 ) ≤ ϕ(b) para todo b ∈ Da . Afirmamos que p1 é
irredutı́vel. De fato, caso contrário, p1 = cd, c, d ∈/ D∗ e ϕ(p1 ) = ϕ(cd) ≥ ϕ(d).
Se ϕ(cd) = ϕ(d), por hipótese existem q, r ∈ D tais que d = qcd + r com r = 0
ou ϕ(r) < ϕ(cd) = ϕ(d). Se r 6= 0, então r = d(1 − qc) e ϕ(r) ≥ ϕ(d), o que é
impossı́vel, assim r = 0, mas neste caso qc = 1, logo c ∈ D∗ , o que também é
impossı́vel. Assim ϕ(cd) > ϕ(d) e d ∈ Da , mas isto contradiz a minimalidade de
p1 . Portanto, p1 é irredutı́vel.
Seja
a
a1 := .
p1
Se a1 ∈ D∗ ou a1 é irredutı́vel então nada há a fazer. Caso contrário, repetindo
o argumento existe p2 ∈ Da1 irredutı́vel tal que ϕ(p2 ) ≤ ϕ(b) para todo b ∈
Da1 \ {0}. Seja
a1 a
a2 := = .
p2 p1 p2
Novamente, se a2 ∈ D∗ ou a2 for irredutı́vel acabou. Caso contrário prosseguimos.
Observe que ϕ(a) > ϕ(a1 ) > ϕ(a2 ) > · · · ≥ ϕ(1), pois os elementos pi ’s são
irredutı́veis. Portanto, existe r tal que ϕ(ar ) = ϕ(1), i.e., ar ∈ D∗ e neste caso
a = up1 · · · pr com u = ar .
Definição 15.10. Sejam a, b ∈ D \ {0}. Definimos um mdc d de a e b por

(1) d | a e d | b.
(2) Para todo d0 ∈ D \ {0} tal que d0 | a e d0 | b, temos que d0 | d.
Observação 15.11. Observe que se d e e são mdc’s de a e b então d | e e

e | d, i.e., d = Ae e e = Bd para A, B ∈ D, assim d = BAd e portanto A, B ∈ D∗ .
Logo a menos de multiplicação por um elemento inversı́vel a noção de mdc está
bem definida.
Observação 15.12. Seja
I := (a) + (b) := {aα + bβ | α, β ∈ D}
o ideal gerado por a e b. Como (D, ϕ) é principal, concluimos que existe d ∈

D \ {0} tal que (d) = I. Afirmamos que d = mdc(a, b). De fato, a = 1.a + 0.b ∈ I,
logo a = dα, i.e., d | a. Pelo mesmo argumento d | b. Por outro lado existem
s, t ∈ D tais que d = as + bt (o algoritmo euclideano estendido). Se d0 | a e d0 | b,
então a = Ad0 e b = Bd0 para A, B ∈ D, portanto d = d0 (sA + tB), i.e., d0 | d.
Lema 15.13. Seja p ∈ D irredutı́vel e suponha que p | ab para a, b ∈ D. Então

p | a ou p | b.
Demonstração. Suponha que p - a, então mdc(p, a) = 1 e existem s, t ∈ D

tais que 1 = sp + ta. Multiplicando por b e utilizando que ab = αp para α ∈ D,
obtemos b = spb + tαp, logo p | b.
Teorema 15.14. Seja (D, ϕ) um domı́nio euclideano e a ∈ D \ {0}. Então

existem únicos (a menos de inversı́veis) u ∈ D∗ , p1 , · · · , pr ∈ D irredutı́veis com
ϕ(p1 ) < · · · < ϕ(pr ) e inteiros e1 , · · · , er ≥ 1 tais que
a = upe11 · · · perr .
Demonstração. Suponha que possamos fatorar a de duas maneiras distin-

tas
a = upe11 · · · perr = vq1f1 · · · qsfs ,
15.15. DOMÍNIOS FATORIAIS 133
para v ∈ D∗ , q1 , · · · , qs ∈ D irredutı́veis com ϕ(q1 ) < · · · < ϕ(qs ). Observe que

p1 | vq1f1 · · · qsfs .
Pelo lema anterior existe i tal que p1 | qi . Como ambos são irredutı́veis isto
significa que existe ai ∈ D∗ tal que qi = ai p1 . Afirmamos que i = i.
De fato, suponha que i > 1. Pelo mesmo argumento existe j tal que p1 = bj qj
com bj ∈ D∗ . Se j = 1, então ϕ(p1 ) = ϕ(q1 ) < ϕ(qi ) = ϕ(p1 ) o que é impossı́vel.
Se j > 1, então ϕ(p1 ) = ϕ(qi ) > ϕ(q1 ) = ϕ(pi ) o que também é impossı́vel.
Também temos que ter e1 = f1 , pois se por exemplo f1 > e1 , então após cancelar
p1 terı́amos que ter q1 = apj para j > 1 o que novamente é impossı́vel.
Dividindo ambos os lados por pe11 obtemos
uae11 pe22 · · · perr = vq2f2 · · · qsfs .
Repetindo o argumento anterior, q2 = a2 p2 para a2 ∈ D∗ e e2 = f2 , dividindo
ambos os lados por pe22 obtemos
uae11 ae22 pe33 · · · perr = vq3f3 · · · qsfs .
Repetindo o argumento obtemos que r = s e para todo i = 1, · · · , r temos que
qi = ai pi para ai ∈ D∗ e
u = vae11 · · · aerr .

15.15. Domı́nios fatoriais

Definição 15.16. Seja D um domı́nio de integridade. Definimos em D :=
D × (D \ {0}) a seguinte relação de equivalência:
(a, b) ∼ (c, d) se e somente se ad = bc.
Seja K := D/ ∼ o conjunto das classes de equivalência de D. A classe de
equivalência do par (a, b) é denotada pela fração ab . Definimos em D operações
de soma e produto por
a c ad + bc a c ac
+ := e + = .
b d cd b d bd
Com estas operações K é um corpo. O inverso de a/b 6= 0 é b/a.
Definição 15.17. Sejam A e B dois anéis (sempre comutativos com elemento

neutro para o produto). Uma função f : A → B é dita um homomorfismo de
anéis se f (x + y) = f (x) + f (y) e f (xy) = f (x)f (y) para todos x, y ∈ A. O
núcleo N (f ) de f é definido como o subconjunto dos elementos a ∈ A tais que

f (a) = 0. Note que 0 ∈ N (f ). Observe também que N (f ) é um ideal de A. De
fato, se x, y ∈ N (f ), então f (x + y) = f (x) + f (y) = 0, i.e., x + y ∈ N (f ). Se
x ∈ N (f ) e a ∈ A, então f (x, y) = f (x)f (y) = 0, i.e., xa ∈ N (f ).
Lema 15.18. f é injetivo se e somente se N (f ) = (0).
Demonstração. Se f é injetivo e x ∈ N (f ), então f (x) = 0 = f (0), logo

x = 0. Se N (f ) = (0) e f (x) = f (y), então f (x − y) = 0, i.e., x − y ∈ N (f ), i.e.,
x = y.
Observação 15.19. Um homomorfismo f : A → B é dito um isomorfismo

se for um homomorfismo bijetivo. Consideremos o homomorfismo de anéis ϕ :
D → K definido por ϕ(a) := a/1. Este é um homomorfismo injetivo, pois se
a/1 = 0/1, então a = 0. Por isto D é isomorfo a sua imagem e K é dito o corpo
de frações de D e denotado por fr(D).
Definição 15.20. Um domı́nio de integridade D é dito fatorial quando para

todo a ∈ D \ {0} podemos escrever a de maneira única
a = upe11 · · · perr ,
onde u ∈ D∗ , p1 , · · · , pr ∈ D são irredutı́veis e e1 , · · · , er ≥ 1 são inteiros,
onde a unicidade é a menos de multiplicação por um elemento de D∗ ou de
permutação dos irredutı́veis. No caso de um domı́nio euclideano, a função ϕ
determina a ordem dos elementos irredutı́veis, assim não podemos permutá-los e
a a unicidade é a menos de multiplicação por inversı́veis. Dois elementos a, b ∈ D
são ditos associados (denotado por a ∼ b), se a = ub onde u ∈ D∗ .
Definição 15.21. Seja D[x] o anel de polinômios com coeficientes em D, i.e.,

são os elementos da forma
Xn
f= ai xi tais que ai ∈ D para todo i.
i=0
Seja K := fr(D) seu corpo de frações. O conteúdo c(f ) de f ∈ D[x] é definido

por
c(f ) := mdc(an , · · · , a0 ).
Sendo um mdc, o elemento c(f ) é único a menos de multiplicação por elemento
de D∗ . Um polinômio f ∈ D[x] é dito primitivo, se c(f ) = 1.
15.15. DOMÍNIOS FATORIAIS 135
Lema 15.22 (lema de Gauss generalizado). Seja D um domı́nio fatorial e K

seu corpo de frações.
(1) Se f, g ∈ D[x], então c(f g) = c(f )c(g).
(2) Se f, g ∈ D[x] são primitivos, então f é associado a g em D[x] se e
somente se ele o for em K[x].
(3) Seja f ∈ D[x] primitivo. Então f é irredutı́vel em D[x] se e somente se
f é irredutı́vel em K[x].
Demonstração. (1) Podemos sempre escrever f = c(f )f1 para f1 ∈ D[x]

primitivo. Logo,
f g = c(f )c(g)f1 g1 e c(f g) = c(f )c(g)c(f1 g1 ).
Afirmamos que c(f1 g1 ) = 1. Escrevamos explicitamente

n
X m
X
i
f1 = ai x e g1 = bi x i .
i=0 i=0
Seja
n+m
X
f1 g1 = cj x j .
i=0
Seja p ∈ D irredutı́vel. Como c(f1 ) = c(g1 ) = 1 existe i tal que p - ai e l tal que
p - bl . Escolhamos i e l mı́nimos com esta propriedade. Então
ci+l = ai+l b0 + ai+l−1 b1 + . . . + ai+1 bl−1 + ai bl + ai−1 bl+1 + . . . + a0 bi+l
não pode ser divisı́vel por p. Em particular, p - c(f1 g1 ) e c(f1 g1 ) = 1.

(2) É claro que que se f é associado a g em D[x] também o é em K[x].
Provemos a recı́proca. Ou seja, suponhamos que f = ug para u ∈ K ∗ e K =
fr(D). Digamos que u = ab . Logo
bf = ag, c(bf ) = bc(f ) = b e c(ag) = ac(g) = a,
i.e., b = va para v ∈ D∗ , portanto f é associado a g em D[x].

(3) É claro que se f é irredutı́vel em K[x] ele também o é em D[x]. Suponha
que f seja redutı́vel em K[x], digamos f = gh para g, h ∈ K[x] tais que grau(g),
grau(h) ≥ 1. Eliminando os denominadores de g e h obtemos a ∈ D \ {0} tal que
af = g1 h1 para g1 , h1 ∈ D[x] e grau(g1 ) = grau(g) e grau(h1 ) = grau(h). Note
que
c(af ) = ac(f ) = a e c(g1 h1 ) = c(g1 )c(h1 ),
logo existe u ∈ D∗ tal que a = c(g1 )c(h1 )u. Além disto, escrevendo g1 = c(g1 )g1∗
e h1 = c(h1 )h∗1 com g1∗ , h∗1 ∈ D[x] primitivos temos que
af = c(g1 )c(h1 )g1∗ h∗1 ,
i.e., f = u−1 g1∗ h∗1 o que contradiz o fato de f ser irredutı́vel em D[x].
Teorema 15.23. Seja D um domı́nio fatorial. Então D[x] também é um

domı́nio fatorial.
Demonstração. Seja f ∈ D[x] \ {0}. Se f ∈ D∗ ou f for irredutı́vel nada

há a fazer. Caso contrário fatoramos
f = upe11 · · · perr
com u ∈ K ∗ , p1 , · · · , pr ∈ K[x] irredutı́veis, grau(p1 ) < · · · < grau(pr ) e e1 , · · · , er
≥ 1 inteiros. Multiplicando pelo produto dos denominadores obtemos a ∈ D \{0}
tal que
af = vq1e1 · · · qrer ,
onde v ∈ D \ {0} e q1 , · · · , qr ∈ D[x] irredutı́veis em K[x] e grau(qi ) = grau(pi )
para todo i. Para todo i escreva qi = c(qi )qi∗ com qi∗ ∈ D[x] primitivo e irredutı́vel
em K[x]. Pelo lema de Gauss qi∗ é irredutı́vel em D[x] para todo i. Assim,
af = vc(q1 )e1 · · · c(qr )er (q1∗ )e1 · · · (qr∗ )er .
Mas c(af ) = ac(f ) e
c(vc(q1 )e1 · · · c(qr )er (q1∗ )e1 · · · (qr∗ )er ) = vc(q1 )e1 · · · c(qr )er .
Logo existe w ∈ D∗ tal que
ac(f ) = wvc(q1 )e1 · · · c(qr )er .
Em particular,
f = w−1 (q1∗ )e1 · · · (qr∗ )er
o que mostra que D[x] é fatorial.
Teorema 15.24 (critério de Eisenstein generalizado). Seja D um domı́nio

fatorial, K = fr(D) seu corpo de frações,
n
X
f= ai xi ∈ D[x] − {0}
i=0
primitivo e p ∈ D irredutı́vel. Se p | ai para i = 0, · · · , n − 1, p - an e p2 - a0 ,

então f é irredutı́vel em K[x].
15.25. FATORES MÚLTIPLOS E RESULTANTE 137
Demonstração. A prova é igual ao caso em que D = Z que foi feita ante-

riormente, substituindo o lema de Gauss pela sua generalização.
15.25. Fatores múltiplos e resultante

Proposição 15.26. Sejam f, g ∈ K[x] \ K. Então existe h ∈ K[x] \ K
irredutı́vel tal que
h|f eh|g
se e somente se existem u, v ∈ K[x] \ {0} tais que
ug = vf, grau(u) < grau(f ) e grau(v) < grau(g).
Demonstração. Suponhamos que exista h como acima, i.e., f = hf1 e

g = hg1 com f1 , g1 ∈ K[x] e grau(f1 ) < grau(f ) e grau(g1 ) < grau(g). Logo
f1 g = g1 f e tomamos u = f1 e v = g1 .
Reciprocamente, suponhamos a segunda condição satisfeita. Como grau(u) <
grau(f ) e pela unicidade da fatoração de polinômios temos que existe algum fator
irredutı́vel h de f tal que h | g.
Definição 15.27. Sejam

n
X m
X
i
f= ai x e g = bj x j .
i=0 j=0
A resultante Res(f, g) é definida como o determinante da seguinte matriz

 
an an−1 · · · a1 a0

 an an−1 · · · a1 a0 

 .. .. .. .. .. 

 . . . . . 

 a n a n−1 · · · a 1 a 
0
,

bm bm−1 · · ·

b1 b0 
 

 b m b m−1 · · · b 1 b 0



 ... ... ... ... ... 

bm bm−1 · · · b1 b0
onde as linhas com os coeficientes ai ’s são repetidas m vezes e as linhas com os
coeficientes bj ’s são repetidas n vezes, ou seja a matriz é (n + m) × (n + m). As
demais entradas da matriz são todas nulas.
Observação 15.28. Seja

r
X s
X
i
u= ci x e v = d j xj ,
i=0 j=0
onde r ≤ n − 1 e s ≤ m − 1. Para facilitar a notação tomaremos os coeficientes

de u (resp. v) até n − 1 (resp. m − 1) com a convenção que se i > r (resp. j > s)
então ci = 0 (resp. dj = 0). A igualdade ug = vf resulta em um sistema linear
homogêneo
an dm−1 − bm cn−1 = 0
an dm−2 + an−1 dm−1 − bm cn−2 − bm−1 cn−1 = 0
······
a1 d 0 + a0 d 1 − b 1 c 0 − b 0 c 1 = 0
a0 d 0 − b 0 c 0 = 0
cuja matriz transposta é igual a
 
an an−1 ··· a1 a0

 an an−1 ··· a1 a0 


 ... ... ... ... ... 

 
 an an−1 ··· a1 a0 
.
 
−bm −bm−1 ··· −b1 −b0


 

 −bm −bm−1 ··· −b1 −b0 

 .. .. .. .. .. 
 . . . . . 
−bm −bm−1 ··· −b1 −b0
Portanto, o determinante da matriz do sistema é igual a (−1)n Res(f, g). Da
álgebra linear o sistema tem solução não trivial se e somente se o determinante da
matriz do sistema é nulo, o que equivale a Res(f, g) = 0. A existência de solução
não trivial equivale justamente a existência de u e v satisfazendo à condição
acima. Dessa forma temos o teorema seguinte.
Teorema 15.29. Sejam f, g ∈ K[x] \ K, então existe h ∈ K[x] \ K irredutı́vel
tal que h | f e h | g se e somente se Res(f, g) = 0.
Definição 15.30. Definimos formalmente a derivação de polinômios D : K[x]
→ K[x] por !
Xn Xn
i
D ai x := iai xi .
i=0 i=1
15.34. ANÉIS QUOCIENTES E TEOREMA CHINÊS DOS RESTOS 139
Esta função satisfaz as seguintes propriedades:

(1) D(f + g) = D(f ) + D(g), para f, g ∈ K[x];
(2) D(af ) = aD(f ), para a ∈ K e f ∈ K[x];
(3) (regra de Leibniz) D(f g) = f D(g) + D(f )g, para f, g ∈ K[x].
Dizemos que um fator irredutı́vel f de g ∈ K[x] − K é múltiplo se f 2 | g.
Proposição 15.31. Seja g ∈ K[x] \ K e f ∈ K[x] \ K um polinômio irre-

dutı́vel. Então f é fator múltiplo de g se e somente se f | D(g).
Demonstração. Suponha que f seja fator múltiplo de g, então f 2 | g, i.e.,

g = Af 2 para algum A ∈ K[x]. Logo D(g) = D(A)f 2 + 2Af D(f ), portanto
f | D(g).
Reciprocamente, suponha que f | D(g), digamos g = f A e D(g) = f B
para A, B ∈ K[x]. Derivando a primeira igualdade, D(g) = f D(A) + D(f )A,
substituindo temos que f (B − D(A)) = D(f )A. Se D(f ) = 0 então trivialmente
D(f ) | g. Suponhamos que D(f ) 6= 0. Neste caso grau(D(f )) < grau(f ) e como
f é irredutı́vel, pela unicidade da fatoração de polinômios, concluimos que f é
um fator de A, digamos A = f C para C ∈ K[x]. Assim g = f 2 C e f é um fator
múltiplo de g.
Definição 15.32. Definimos o discriminante de f ∈ K[x]\{0} por disc(f ) :=

Res(f, D(f )). Assim concluimos a seguinte proposição.
Proposição 15.33. Seja f ∈ K[x] \ K, então f possui fator múltiplo se e

somente se disc(f ) = 0.
15.34. Anéis quocientes e teorema chinês dos restos

Seja A um anel (sempre comutativo com unidade) e I, J ⊂ A ideais de A
definimos o ideal soma I + J por
I + J := {a + b | a ∈ I e b ∈ J}.
Fica como exercı́cio verificar que I + J é de fato um ideal de A. Dizemos que os
ideais I e J são coprimos se
I + J = A, i.e., se existem a ∈ I e b ∈ J tais que 1 = a + b.
Por exemplo, se A = Z, I = nZ e J = mZ com n, m ≥ 1 inteiros, temos que
I e J são coprimos se e somente se mdc(m, n) = 1. De fato, se os ideais forem
coprimos, então existem s, t ∈ Z tais que 1 = sn + tm. Assim, qualquer divisor
primo comum de n e m dividiria também 1, o que é impossı́vel. Reciprocamente,

se mdc(n, m) = 1, então pelo algoritmo euclideano estendido existem s, t ∈ Z tais
que 1 = sn + tm, a fortiori 1 ∈ I + J.
Definição 15.35. Seja A um anel e I um ideal de A. Definimos em A a

seguinte relação. Dados a, b ∈ A dizemos que
a ≡ b (mod I) se a − b = α ∈ I,
dizemos neste caso que a é equivalente a b módulo I. Fica como exercı́cio verificar
que isto define de fato uma relação de equivalência. A classe de equivalência de
a ∈ A módulo I será denotada por
a + I := {a + α | α ∈ I}.
O conjunto de classes de equivalência será denotado por A/I. Quando A = Z e

I = nZ a relação acima é apenas a relação de congruência módulo n, uma vez
que Z é um domı́nio principal.
Definição 15.36. Definimos em A/I uma estrutura de anel da seguinte

forma:
(a + I) ⊕ (b + I) := (a + b) + I e (a + I) (b + I) := (ab) + I.
Observação 15.37. Verifiquemos que estas operações estão bem definidas.

Sejam a0 , b0 ∈ A tais que a0 ≡ a (mod I) e b0 ≡ b (mod I), i.e., a0 − a = α ∈ I e
b0 − b = β ∈ I. Assim,
(a0 + b0 ) − (a + b) = α + β ∈ I
e em particular a0 +b0 ≡ a+b (mod I) (o que equivale a (a0 +b0 )+I = (a+b)+I).
Também temos que
a0 b0 − ab = a0 b0 − a0 b + a0 b − ab = a0 (b0 − b) + b(a0 − a) = a0 β + bα ∈ I,
portanto a0 b0 ≡ ab (mod I) (ou equivalentemente, (a0 b0 )+I = (ab)+I). Deixamos

também como exercı́cio verificar (exatamente como no caso dos inteiros módulo
n) que o conjunto A/I com as operações ⊕ e é um anel. Note que o elemento
neutro para a soma é a classe I e o elemento neutro para o produto é a classe
1 + I.
15.37.1. Ideais primos e maximais.
Definição 15.38. Um ideal I de um anel A é dito maximal se para todo

ideal J de A tal que I ⊂ J ⊂ A temos J = I ou J = A.
Proposição 15.39. Um ideal I de A é maximal se e somente se o anel

quociente A/I é um corpo.
Demonstração. Suponha que I seja um ideal maximal de A. Seja a+I 6= I

uma classe em A/I. Isto equivale a a ∈ / I. O conjunto (a) = {xa | x ∈ A} é um
ideal de A e pelo que foi feito anteriormente o conjunto J = I + (a) também é um
ideal de A. Além disto, I J. Pela maximalidade de I concluimos que J = A,
i.e., que existem t ∈ I e s ∈ A tais que 1 = t + sa, i.e., sa ≡ 1 (mod I), i.e.,
(sa) + I = (s + I) (a + I) = 1 + I, i.e., a + I admite inverso multiplicativo.
Reciprocamente, suponha que A/I seja um corpo. Seja J um ideal de A tal
que I J. Seja a ∈ J − I. Então a + I 6= I e por hipótese existe b ∈ A tal que
(a + I) (b + I) = 1 + I, i.e., (ab) + I = 1 + I, i.e., existe t ∈ I tal que ab − 1 = t.
Em outras palavras 1 = t − ab ∈ J, logo A = J e I é maximal.
Definição 15.40. Um ideal I de A é dito um ideal primo se dados a, b ∈ A

tais que ab ∈ I, então a ∈ I ou b ∈ I. Note que quando A = Z e p é um número
primo o ideal pZ é um ideal primo de Z.
Proposição 15.41. Um ideal I de A é primo se e somente se o anel quociente

A/I é um domı́nio de integridade.
Demonstração. Suponha que I seja um ideal primo de A. Sejam a + I, b +

I ∈ AI tais que (a + I) (b + I) = I, i.e., (ab + I) = I, i.e., ab ∈ I. Como I é
primo, temos que a ∈ I ou b ∈ I, i.e., a + I = I ou b + I = I.
Reciprocamente, suponha que A/I seja um domı́nio de integridade. Sejam
a, b ∈ A tais que ab ∈ I, i.e., (ab) + I = (a + I) (b + I) = I. Por hipótese,
a + I = I ou b + I = I, i.e., a ∈ I ou b ∈ I.
15.41.1. Homomorfismo de anéis.
Definição 15.42. Sejam A e B anéis e f : A → B uma função. Esta função

é dito um homomorfismo de anéis se
f (a + b) = f (a) + f (b) e f (ab) = f (a)f (b).

Observe que f (0) = f (0 + 0) = f (0) + f (0), portanto f (0) = 0. Se além

disto A for um domı́nio de integridade e f não for a função nula, então f (1) =
1. De fato, f (1) = f (1.1) = f (1)f (1), i.e., f (1)(f (1) − 1) = 0. Se A é um
domı́nio de integridade, então f (1) = 0 ou f (1) = 1. No primeiro caso a função
é identicamente nula, pois f (a) = f (1.a) = f (1)f (a) = 0. Observe também que
como 0 = f (0) = f (a + (−a)) = f (a) + f (−a), então f (−a) = −f (a).
Definição 15.43. Um homomorfismo f : A → B é dito um isomorfismo se

for bijetivo. Um homomorfismo f : A → A é dito um endomorfismo de A. Se este
endomorfismo for bijetivo ele é dito um automorfismo de A. Seja f : A → B um
homomorfismo de anéis. O núcleo N (f ) de f é definido por {a ∈ A | f (a) = 0}.
Fica como exercı́cio mostrar que N (f ) é um ideal de A. A imagem f (A) de f é
um subanel de B (isto também é um exercı́cio).
Lema 15.44. Seja f : A → B um homomorfismo de anéis. Então f é injetivo

se e somente se N (f ) = (0).
Demonstração. Suponha que f seja injetivo e que a ∈ N (f ). Logo f (a) =

0 = f (0), pela injetividade de f concluimos que a = 0. Reciprocamente, suponha
que N (f ) = (0). Sejam a, b ∈ A tais que f (a) = f (b). Então f (a − b) = 0, i.e.,
a − b ∈ N (f ), em particular a = b.
Teorema 15.45 (teorema dos homomorfimos). Seja f : A → B um homo-

morfismo de anéis. Então f induz um isomorfismo ϕ : A/N (f ) → f (A) (em
outras palavras A/N (f ) ∼
= f (A), i.e., estes dois anéis são isomorfos).
Demonstração. A função ϕ é definida por

ϕ(a + N (f )) := f (a).
Verifiquemos inicialmente que ϕ está bem definida. Seja a0 ∈ A tal que a0 ≡ a
(mod N (f )), i.e., a0 − a = α ∈ N (f ). Logo f (a0 ) = f (a), i.e., ϕ(a0 + N (f )) =
ϕ(a + N (f )).
Esta função é um homomorfismo, pois
ϕ((a + N (f )) ⊕ (b + N (f ))) = ϕ((a + b) + N (f )) = f (a + b) = f (a) + f (b)
= ϕ(a + N (f )) + ϕ(b + N (f )) e
ϕ((a + N (f )) (b + N (f ))) = ϕ((ab) + N (f )) = f (ab)
= f (a)f (b) = ϕ(a + N (f ))ϕ(b + N (f )).
Esta função é sobrejetiva, pois para todo y ∈ f (A), temos que y = f (a) para
a ∈ A, portanto y = ϕ(a + N (f )). Esta função também é injetiva, pois se
ϕ(a + N (f )) = f (a) = 0, então a ∈ N (f ), i.e., a + N (f ) = N (f ).
15.45.1. Teorema chinês dos restos.
Proposição 15.46. Sejam I, J ideais de A tais que I + J = A e a, b ∈ A.

Então existe x ∈ A tal que
(
x ≡ a (mod I)
x ≡ b (mod J).
Demonstração. Por hipótese existem α ∈ I e β ∈ J tais que 1 = α + β.
Então β ≡ 1 (mod I) e α ≡ 1 (mod J). Em particular, aβ ≡ a (mod I) e bα ≡ b
(mod J). Basta tomar x = aβ + bα.
Vamos generalizar o resultado anterior para um número qualquer de ideais.
Para isto precisamos da noção de produto de ideais. Sejam I1 , · · · , Ir ideais de
A. Seja
I1 . . . Ir := {a1,1 · · · ar,1 + . . . + a1,n . . . ar,n | onde ai,j ∈ Ii , para todo i}.
Fica como exercı́cio mostrar que I1 . . . Ir é efetivamente um ideal de A.
Proposição 15.47. Sejam I1 , · · · , Ir ideais de A tais que para todo α 6= β

tenhamos Iα + Iβ = A. Sejam a1 , · · · , ar ∈ A. Então existe x ∈ A tal que


 x ≡ a1 (mod I1 )

.. ..

 . .

 x ≡ a (mod I ).

r r
Demonstração. Denotamos
J := I1 . . . Ir e para cada ν, Jν := I1 . . . Iν−1 Iν+1 . . . Ir .
Afirmamos que
(15.47.1) Iν + Jν = A.
De fato, sabemos que para cada α 6= ν existem λα ∈ Iα e λν(α) ∈ Iν tais que
λα + λν(α) = 1. Note que utilizamos o ı́ndice ν(α) para dizer que o elemento
λν(α) efetivamente depende da escolha de α, uma vez que os ideais são dois a dois
coprimos. Seja
γν := λ1 . . . λν−1 λν+1 . . . λr ∈ Jν .
Então Y
(λα + λν(α) ) = γν + δν ,
α6=ν
onde δν ∈ Iν . Da igualdade (15.47.1) obtemos que para cada ν vale γν ≡ 1

(mod Iν ) e γν ≡ 0 (mod Iα ) para α 6= ν. Finalmente, x := a1 γ1 + . . . + ar γr é
uma solução do sistema.
Lema 15.48. Sejam I1 , · · · , Ir ideais de A tais que para todo α 6= β tenhamos

Iα + Iβ = A. Então
I1 . . . Ir = I1 ∩ . . . ∩ Ir .
Demonstração. Provemos o resultado por indução em r. Suponhamos ini-

cialmente r = 2. Assim, um elemento de I1 I2 é da forma
a1,1 a2,1 + . . . + a1,n a2,n ,
onde a1,ν ∈ I1 (resp. a2,ν ∈ I2 ) para cada ν. Note que cada parcela a1,ν a2,ν
pertence a I1 ∩ I2 , pela definição de ideal. Logo I1 I2 ⊂ I1 ∩ I2 . Basta provar a
inclusão oposta. Por hipótese existem γ1 ∈ I1 e γ2 ∈ I2 tais que 1 = γ1 + γ2 . Seja
a ∈ I1 ∩ I2 , logo a = γ1 a + aγ2 ∈ I1 I2 .
Suponha agora o resultado provado para r − 1 fatores, vamos prová-lo para
r fatores. Novamente, pela própria definição de produto de ideais temos que
I1 . . . Ir ⊂ I1 ∩ . . . ∩ Ir . Basta provar a inclusão oposta. Da demonstração da
proposição anterior concluimos que I1 . . . Ir−1 e Ir são coprimos. Logo existe
γr ∈ I1 . . . Ir−1 e δr ∈ Ir tal que γr + δr = 1. Seja a ∈ I1 ∩ · · · ∩ Ir . Note que para
todo t ≥ 1 temos também que at ∈ I1 ∩ · · · ∩ Ir . Então
ar = γr ar + a . . . a(aδr ) ∈ I1 + . . . + Ir ,
onde a repete-se r − 1 vezes no produto acima.
Teorema 15.49 (teorema chinês dos restos). Sejam I1 , · · · Ir ideais de A tais

que Iα + Iβ = A, para α 6= β. Então
(1) existe um isomorfismo de anéis
A ∼ A A
= × ... × .
I1 . . . Ir I1 Ir
(2) Este isomorfismo restringe-se a um isomorfismo de grupos
∗ ∗ ∗
A ∼ A A
= × ... × .
I1 . . . Ir I1 Ir
Demonstração. Definimos
A A A
ϕ: → × ... × por
I1 · · · Ir I1 Ir
ϕ(a + I1 . . . Ir ) := (a + I1 , · · · , a + Ir ).
Verifiquemos que esta função está bem definida. De fato, se b−a = α ∈ I1 . . . Ir =
I1 ∩ . . . Ir (pelo lema anterior), então b ≡ a (mod Iν ) para todo ν, i.e., b + Iν =
a + Iν para todo ν.
Afirmamos que ϕ é um homomorfismo. De fato,
ϕ((a + I1 . . . Ir ) ⊕ (b + I1 . . . Ir )) = ϕ((a + b) + I1 . . . Ir )
= ((a + b) + I1 , · · · , (a + b) + Ir )
= ((a + I1 ) ⊕ (b + I1 ), · · · , (a + Ir ) ⊕ (b + Ir ))
= (a + I1 , · · · , a + Ir ) ⊕ (b + I1 , · · · , b + Ir ) e
ϕ((a + I1 . . . Ir ) (b + I1 . . . Ir )) = ϕ((ab) + I1 . . . Ir )
= ((ab) + I1 , · · · , (ab) + Ir )
= ((a + I1 ) (b + I1 ), · · · , (a + Ir ) (b + Ir ))
= (a + I1 , · · · , a + Ir ) (b + I1 , · · · , b + Ir ).
Esta função é sobrejetiva. De fato, dado
A A
(a1 + I1 , · · · , ar + Ir ) ∈ × ... × ,
I1 Ir
pela proposição anterior existe x ∈ A tal que x ≡ aν (mod Iν ) para todo ν, i.e.,
x+Iν = aν +Iν para todo ν. Portanto, (a1 +I1 , · · · , ar +Ir ) = (x+I1 , · · · , x+Ir ) =
ϕ(x + I1 . . . Ir ).
Finalmente, ϕ é injetiva. De fato, se (a + I1 , · · · , a + Ir ) = (I1 , · · · , Ir ), então
a ∈ I1 ∩ . . . ∩ Ir = I1 . . . Ir .
Suponhamos que a + I1 . . . Ir ∈ (A/I1 . . . Ir )∗ , i.e., que exista b + I1 . . . Ir ∈
(A/I1 . . . Ir ) tal que
(a + I1 . . . Ir ) (b + I1 . . . Ir ) = (ab) + I1 . . . Ir = 1 + I1 . . . Ir ,
i.e., ab − 1 = c ∈ I1 . . . Ir = I1 ∩ . . . ∩ Ir . Logo ab ≡ 1 (mod Iν ) para todo ν,
i.e., (a + Iν ) · (b + Iν ) = 1 + Iν para todo ν. Portanto (a + I1 , · · · , a + Ir ) ∈
(A/I1 )∗ × . . . × (A/Ir )∗ .
É claro que a restrição de ϕ (A/I1 . . . Ir )∗ é um homomorfismo injetivo. Resta
provar a sua sobrejetividade. Seja (a1 + I1 , · · · , ar + Ir ) ∈ (A/I1 )∗ × . . . × (A/Ir )∗ .
Pela parte anterior sabemos que existe x ∈ A tal que aν + Iν = x + Iν para todo
ν. Basta provar que x + I1 . . . Ir ∈ (A/I1 . . . Ir )∗ . Mas para todo ν existe αν ∈ A
tais que αν x ≡ 1 (mod Iν ), pois x é inversı́vel simultaneamente módulo cada Iν .
Ou seja, αν x − 1 = δν ∈ Iν para cada ν. Assim,
Y Y
(αν x − 1) = xz + (−1)r 1 = δν ∈ I1 . . . Ir ,
ν ν
para algum z ∈ A, i.e., xz ≡ ±1 (mod I1 . . . Ir ). Substituindo, se necessário, z

por −z, concluimos que x ∈ (A/I1 . . . Ir )∗ .
15.50. Aplicações
15.50.1. Soma de quadrados.
Teorema 15.51 (Fermat). Seja p um número primo. As seguintes condições

são equivalentes:
(i) p = 2 ou p ≡ 1 (mod 4).
(ii) Existe a ∈ Z tal que a2 ≡ −1 (mod p).
(iii) p é redutı́vel em Z[i].
(iv) p = a2 + b2 com a, b ∈ Z.
Demonstração. Suponha (i). Se p = 2, tome a = 1 e lembre que 1 ≡ −1

(mod 2). Suponhamos que p = 4n + 1. Pelo pequeno teorema de Fermat para
todo a ∈ Z tal que p - a temos que ap−1 ≡ 1 (mod p). Em outras palavras,
temos a fatoração xp−1 − 1 = (x − 1) · · · (x − p − 1). Por outro lado, xp−1 − 1 =
2n
x4n − 1 = (x2n − 1)(x2n + 1). Ou seja, existe b ∈ {1, · · · , p − 1} tal que b = −1,
i.e., b2n ≡ −1 (mod p). Tome a = bn .
Suponha (ii). Seja k ∈ Z tal que a2 = −1 + kp. Logo (a − i)(a + i) = kp.
Suponhamos que p | (a + i), i.e, que existam c, d ∈ Z tais qeu p(c + di) = a + i.
Em particular, pd = 1 e p | 1 o que é impossı́vel. Portanto, p - (a + i). Pelo
mesmo argumento p - (a − i). Mas Z[i] é um domı́nio euclideano, logo fatorial,
assim p não pode ser um irredutı́vel am Z[i].
Suponha que p = (a + bi)(c + di) com a2 + b2 6= 1 e c2 + d2 6= 1. Pela
multiplicatividade da norma, p2 = N (p) = N (a+bi)N (a+di) = (a2 +b2 )(c2 +d2 ),
mas a única possibilidade para que isto ocorra é que a2 + b2 = c2 + d2 = p.
Suponhamos (iv) e que p > 2. Dado a ∈ Z temos que a2 ≡ 0 ou 1 (mod 4).
Assim, as possibilidades para a2 + b2 (mod 4) são 0, 1 ou 2. Mas como p é primo
apenas a segunda possibilidade pode acontecer.
15.51.1. Lei de reciprocidade quadrática.
Definição 15.52. Vamos reescrever o ı́tem (ii) do teorema de outra forma.

Seja a ∈ Z, dizemos que a é resto quadrático módulo p se existe b ∈ Z tal que
b2 ≡ a (mod p). Assim em (ii) estamos dizendo que -1 é resto quadrático módulo
p. Dado a ∈ Z e um número primo p tal que p - a, definimos o sı́mbolo de
Legendre de a em p por

a
= 1, se a é resto quadrático módulo p,
p

a
= −1, caso contrário.
p
Assim o teorema afirma que p é soma de quadrados se e somente se (−1/p) = 1.
Um importante teorema na teoria dos números (que não demonstraremos

aqui) é a lei de reciprocidade quadrática (cf [?, chapter 5]).
Teorema 15.53 (lei de reciprocidade quadrática). Sejam p, q > 2 primos

distintos. Enão
p q p−1 q−1
= (−1) 2 2 .
q p
Uma maneira de interpretar esta lei é uma fórmula de inverter o sı́mbolo de
Legendre, ou seja,
q p−1 q−1 p
= (−1) 2 2 .
p q
Por exemplo, se p, q ≡ 1 (mod 4), então

q p
= 1 se e somente se = 1.
p q
Se p, q ≡ 3 (mod 4), então

p q
= 1 se e somente se = −1.
q p
Finalmente se p ≡ 1 (mod 4) e q ≡ 3 (mod 4) (ou vice-versa), então

p q
= 1 se e somente se = 1.
q p
Parte 4
Corpos
CAPı́TULO 16
Extensões finitas
Sejam K ⊂ L dois corpos. Dizemos que L é uma extensão de K ou que L/K é

uma extensão de corpos. Notemos neste caso que a multiplicação de elementos de
K por elementos de L induz em L uma estrutura de K-espaço vetorial. Quando
L é um K-espaço vetorial de dimensão finita, dizemos que L/K é uma extensão
finita e denotamos dimK L = [L : K] chamado o grau da extensão.
Proposição 16.1. Sejam K ⊂ L ⊂ M corpos. Então M/K é uma extensão

finita se e somente se M/L e L/K são extensões finitas e neste caso
[M : K] = [M : L][L : K].
Demonstração. Suponha que M/K seja uma extensão finita. Qualquer

conjunto de elementos de M que seja L-linearmente independente é em parti-
cular K-linearmente independente. Portanto, o número máximo de vetores L-
linearmente independentes em M é [M : K], em particular M/L é finita. Como
L ⊂ M e M é um K-espaço vetorial de dimensão finita, concluimos que o mesmo
vale para L, i.e., L/K é finita.
Suponha que M/L e L/K sejam finitas. Sejam {α1 , · · · , αn } uma base de
M/L e {β1 , · · · , βm } uma base de L/K. Afirmamos que o conjunto
{αi βj }1≤i≤n,1≤j≤m
é uma base de M/K. Disto segue imediatamente a proposição.

Seja x ∈ M , então
Xn
x= ai α i ,
i=1
onde a1 , · · · , an ∈ L. Além disto para todo i = 1, · · · , n, temos que

m
X
ai = bij βj ,
j=1
151
152 16. EXTENSÕES FINITAS
onde βj ∈ K. Logo,
n X
X m
x= bij αi βj ,
i=1 j=1
em particular o conjunto acima gera M como K-espaço vetorial.

Suponha que tenhamos uma K-combinação linear trivial
n X
X m
cij αi βj = 0,
i=1 j=1
onde para todo i, j, cij ∈ K. Reescremos

n m
!
X X
cij βj αi = 0.
i=1 j=1
Como para todo i temos

m
X
cij βj ∈ L e {α1 , · · · , αn }
j=1
é um conjunto L-linearmente independente, concluimos que para todo i temos

m
X
cij βj = 0.
j=1
Por outro lado, segue do fato de {β1 , · · · , βm } ser K-linearmente independente

que cij = 0 para todo i, j.
Corolário 16.2. Seja L/K uma extensão finita de grau primo. Então para
todo corpo F tal que K ⊂ F ⊂ L temos que F = K ou F = L.
Definição 16.3. Seja L/K uma extensão finita com base {α1 , · · · , αn } e
u ∈ L. Definimos o polinômio caracterı́stico de u em relação a L/K da seguinte
forma. Para todo i = 1, · · · , n temos
n
X
uαi = aij αj .
j=1
O polinômio é definido por
Fu,L/K (x) := det(Ix − (aij )).
Denotamos A := (aij ).
Observação 16.4. (1) Fu,L/K tem coeficiente lı́der 1 e grau n = [L : K].

16. EXTENSÕES FINITAS 153
(2) Fu,L/K não depende da escolha da base. De fato, seja {β1 , · · · , βn } uma
outra base de L/K e B a matriz de mudança de base de {β1 , · · · , βn }
para {α1 , · · · , αn }. Seja C := B −1 . Assim,
n
X n
X n
X
uβi = u bij αj = bij ajl αl = (BA)il αl
j=1 j=1 l=1
n
X
= (BA)il clh βh = (BAC)ih βh .
h=1
Assim,
det(Ix−(BAB −1 )) = det(B(Ix−A)B −1 ) = det(B) det(Ix−A) det(B −1 ) = Fu,L/K .
(3) Se u ∈ K, então Fu,L/K = (x − u)n .
Proposição 16.5. Sejam K ⊂ L ⊂ M tais que M/L e L/K sejam extensões

finitas. Seja u ∈ L. Então
[M :L]
Fu,M/K = Fu,L/K .
Demonstração. Sejam {α1 , · · · , αn } uma base de M/L e {β1 , · · · , βm } uma

base de L/K. Então {αi βj }1≤i≤n,1≤j≤m é uma base de M/K. Note que
m
X m
X
uαi βj = αi ajl βl = ajl αi βl .
l=1 l=1
Assim, em cada bloco {α1 β1 , · · · , α1 , βm }, ... , {αn β1 , · · · , αn βm } a matriz do

operador linear definido pela multiplicação por u é igual a A. Portanto,
 
Ix − A 0 ··· 0
 0 Ix − A · · · 0 
 
n
Fu,M/K = det  .. .. ..   = Fu,L/K .
 . . ··· . 
0 0 · · · Ix − A

Definição 16.6. Escrevendo explicitamente,
Fu,L/K = xn + f1 xn−1 + . . . + fn−1 x + fn .
O traço TL/K (u) de u em relação a L/K é definido por
TL/K (u) := −f1 .

A norma NL/K (u) de u em relação a L/K é definida por
NL/K (u) := (−1)n fn .
Observe que expandindo o determinante que define Fu,L/K obtemos

n
X
f1 = aii = Tr(A), o traço da matriz A, e fn = det(A).
i=1
Definição 16.7. Sejam L/K uma extensão de corpos f ∈ K[x] \ {K}. Di-
zemos que um elemento α ∈ L é raiz de f se f (α) = 0.
Suponhamos conhecidas u1 , · · · , un as raı́zes de Fu,L/K . Note que uma destas

raı́zes, digamos u1 , é exatamente u. Observe também que usando o algoritmo da
divisão, se α é raiz de f então
f (x) = (x − α)g(x),
para algum g ∈ K[x]. Neste caso temos a fatoração

n
Y
Fu,L/K (x) = (x − ui ).
i=1
Desenvolvendo este produto obtemos

n
X
f1 = − ui
i=1
X
f2 = ui uj
1≤i<j≤n
X
f3 = − ui uj uk
1≤i<j<k≤n
.. ..
. .
n
Y
fn = (−1)n ui .
i=1
Assim,
n
X
TL/K (u) = ui
i=1
n
Y
NL/K (u) = ui .
i=1
16.10. EXERCÍCIOS 155
Definição 16.8. Sejam x1 , · · · , xn variáveis independentes (ver definição no

capı́tulo de extensões trancendentes) sobre um corpo K. Para todo 1 ≤ i ≤ n
definimos a i-ésima função simétrica elementar nas variáveis x1 , · · · , xn por
X
si (x1 , · · · , xn ) := uj1 . . . uji .
1≤j1 <·<ji ≤n
Observe que para todo 1 ≤ i ≤ n temos
fi = (−1)i si (u1 , · · · , un ).
Segue imediatamente da lineraridade de traço de matriz e da multiplicativi-

dade de determinante de matriz o seguinte lema.
Lema 16.9. (1) Se u ∈ K, então NL/K (u) = un e TL/K (u) = nu.

(2) A função NL/K é multiplicativa, i.e.,
NL/K (uv) = NL/K (u)NL/K (v).
(3) A função TL/K é K-linear, i.e.,
TL/K (u + v) = TL/K (u) + TL/K (v) e TL/K (au) = aTL/K (u), para a ∈ K.
(4) Se K ⊂ L ⊂ M são extensões finitas e u ∈ L, então
NM/K (u) = u[M :L] e TM/K (u) = [M : L]TL/K (u).
16.10. Exercı́cios
√ √
(1) Seja α = 3 + 5. Determine o polinômio mı́nimo de α em relação a Q
√
e Q[ 10]).
Pn−1
(2) Seja L/K uma extensão de corpos, α ∈ L e Pα|K = xn + i=0 ai x i .
Calcule α−1 em termos dos coeficientes ai ’s e de α.
(3) Seja L/K um extensão de corpos, α ∈ L tal que [K[α] : K] = 5. Mostre
que K[α] = K[α2 ].
(4) Calcule os polinômios mı́nimos de ζ6 e ζ10 em relação a Q, onde ζn =
exp(2πi/n).
(5) Seja ζ = exp(2πi/7) e η = exp(2πi/5). Mostre que η ∈ / Q[ζ].
2
(6) Diga se é verddeiro ou falso, seja i tal que i = −1 e α ∈ C tal que
α3 + α + 1 = 0, então i ∈ Q[α].
(7) Seja L/K uma extensão de corpos, α, β ∈ L tais que [K[α] : K] = n e
[K[β] : K] = m com mdc(m, n) = 1. Mostre que [K[α, β] : K] = mn.
(8) Seja α, β ∈ C tal que [Q[α] : Q] = 3 e [Q[β] : Q] = 3. Determine as

possibilidades para [Q[α, β] : Q].
(9) Sejam α, β ∈ C raı́zes de f, g ∈ Q[x] polinômios irredutı́veis, respecti-
vamente. Seja K = Q[α] e L = Q[β]. Mostre que f é irredutı́vel sobre
Q[β] se e somente se g é irredutı́vel sobre Q[α].
CAPı́TULO 17
Extensões algébricas
17.1. Elementos algébricos e transcendentes

Seja L/K uma extensão de corpos e α ∈ L. Dizemos que α é algébrico sobre
L, se existe f ∈ K[x] − {0} tal que f (α) = 0. Caso não exista tal f dizemos que
√
α é transcendente sobre K. Por exemplo, 2 ∈ R é algébrico sobre Q, pois é
raiz de x2 − 2 e i ∈ C é algébrico sobre Q, pois é raiz de x2 + 1. Por outro lado,
são teoremas não triviais devidos a Lindeman e Hilbert (resp.) que e, π ∈ R são
transcendentes sobre Q (ver capı́tulo de extensões transcendentes).
Na situação acima definimos a função
ϕα : K[x] → L por ϕα (g) := g(α).
Fica como exercı́cio mostrar que ϕα é um homomorfismo de anéis. Seja K[α] a

imagem de ϕα . Este é um subanel de L. Seja N (ϕα ) o núcleo de ϕα , i.e., este é
o conjunto dos elementos g ∈ K[x] tais que g(α) = 0, ou seja, este é o conjunto
dos polinômios dos quais α é raiz. Este conjunto é um ideal de K[x].
Teorema 17.2. Seja L/K uma extensão de corpos e α ∈ L.

(1) O elemento α é transcendente sobre K se e somente se ϕα é injetiva o
que equivale a N (ϕα ) = (0). Neste caso, K[α] é isomorfo ao anel de
polinômios K[x].
(2) O elemento α é algébrico sobre K se e somente se K[α] é um corpo.
Neste caso, [K[α] : K] = grau(Pα|K ).
Demonstração. Note que (1) é imediato das definições.

(2) Inicialmente, α é algébrico se e somente se N (ϕα ) 6= (0). Suponha que
isto ocorra. Seja Pα|K o gerador mônico do ideal N (ϕα ). Este polinômio é
chamado o polinômio mı́nimo de α sobre K. Por definição este é o polinômio
mônico de menor grau do qual α é raiz, sendo em particular irredutı́vel. Mas, isto
equivale a dizer que o ideal N (ϕα ) = (Pα|K ) é um ideal maximal de K[x]. Esta
última afirmativa equivale a dizer o anel quociente K[x]/(Pα|K ) é um corpo. Note
157
158 17. EXTENSÕES ALGÉBRICAS
que pelo teorema dos homomorfismos K[α] é isomorfo como anel a K[x]/(Pα|K ).
Portanto K[α] é um corpo.
Reciprocamente, se K[α] for um corpo, então por (1), temos que α é algébrico
sobre K, pois K[x] não é corpo, uma vez que 1/x ∈
/ K[x].
Provemos a última afirmativa. Seja n := grau(Pα|K ). Afirmamos que
{1, α, · · · , αn−1 }
é uma base de K[α]/K. De fato, este conjunto é K-linearmente independente,
do contrário existiriam a0 , · · · , an−1 ∈ K não todos nulos tais que
a0 + . . . + an−1 αn−1 = 0.
Ou seja α é raiz do polinômio
n−1
X
f (x) = ai xi 6= 0.
i=0
Mas isto contradiz a minimalidade do grau de Pα|K . Para ver que este conjunto
gera K[α], seja g ∈ K[x] \ {0}. Dividindo g por Pα|K obtemos
g = Pα|K q + r,
para q, r ∈ K[x] tais que r = 0 ou grau(r) < n. Substituindo x por α concluimos
que g(α) = r(α). A fortiori, g(α) é uma K-combinação linear de {1, α, · · · , αn−1 }.

Lema 17.3. Sejam L/K uma extensão de corpos e α ∈ L algébrico sobre K.

Então
(1) Fα,K[α]/K = Pα|K .
(2) Em particular, se L/K for finita, então
[L:K[α]]
Fα,L/K = Pα|K .
Demonstração. (1) Por definição, Fα,L/K é um polinômio mônico de grau

n tendo α como raiz. Logo Fα,K[α]/K ∈ N (ϕα ), i.e.,
Pα|K | Fα,K[α]/K .
Mas pela igualdade do grau e por ambos serem mônicos concluimos que Pα|K =
Fα,K[α]/K .
(2) Vimos no capı́tulo anterior que
[L:K[α]] [L:K[α]]
Fα,L/K = Fα,K[α]/K , i.e., Fα,L/K = Pα|K .
17.4. EXTENSÕES ALGÉBRICAS 159
Este é um caso particular do teorema de Cayley-Hamilton da álgebra linear.
17.4. Extensões algébricas

Definição 17.5. Uma extensão L/K é dita algébrica se todo α ∈ L é
algébrico sobre K. Caso exista algum α ∈ L transcendente sobre K dizemos
que L/K é transcendente.
Proposição 17.6. Toda extensão finita é algébrica.
Demonstração. Sejam L/K uma extensão finita e α ∈ L. Então existe

n ≥ 1 inteiro mı́nimo tal que {1, α, · · · , αn−1 } é um conjunto K-linearmente
independente. Ou seja, existem a0 , · · · , an ∈ K não todos nulos tais que
n
X
ai αi = 0.
i=0
A fortiori, α é raiz do polinômio não nulo

n
X
f := ai x i .
i=0
Definição 17.7. Seja L/K uma extensão algébrica. Suponhamos que exis-
tam α1 , · · · , αr ∈ L tais que
K ⊂ K1 = K[α1 ] ⊂ K2 = K1 [α2 ] ⊂ · · · ⊂ Kr = Kr−1 [αr ] = K[α1 , · · · , αr ] = L.
Dizemos que L/K é uma extensão finitamente gerada e que L é gerada sobre K
por α1 , · · · , αr .
Proposição 17.8. Seja L/K uma extensão algébrica. Então L/K é finita
se e somente se L/K é finitamente gerada.
Demonstração. Suponha que L/K seja finita. Se L = K acabou. Senão

existe α1 ∈ L\K. Seja K1 := K[α1 ]. Se L = K1 acabou. Senão existe α2 ∈ L\K1 .
Seja K2 := K1 [α2 ]. Prosseguindo o argumento temos uma seqüência de corpos
estrita, i.e.,
K ( K1 ( K2 ( · · · .
Como L/K é finita esta seqüência não pode ser infinita. Logo existe r tal que
L = Kr e L/K é finitamente gerada.
Reciprocamente, se L/K é finitamente gerada então cada extensão Ki /Ki−1

é finita e pela transitividade de extensões finitas, concluimos que L/K também
é finita.
Teorema 17.9. Sejam M/L e L/K extensões de corpos. Então M/K é

algébrica se e somente se M/L e L/K também são algébricas.
Demonstração. Segue da definição que se M/K é algébrica então M/L e

L/K também são algébricas.
Suponhamos que estas duas extensões sejam algébricas. Seja α ∈ M e
n−1
X
Pα|L := ai x i + x n .
i=0
Seja L a extensão de K gerada por a0 , · · · , an−1 . Então L ⊂ L e Pα|L ∈ L[x].

Pela proposição anterior L/K é finita. Além disto, como α é algébrico sobre L,
então L[α]/L é finita. Pela transitividade de extensões finitas concluimos que
L[α]/K é finita. Por outro lado, K ⊂ K[α] ⊂ L[α], logo K[α]/K é finita. Em
particular, α é algébrico sobre K.
Exemplo 17.10. Seja L/K extensão com [L : K] = p número primo. Então

para todo K ⊂ K 0 ⊂ L temos que K 0 = K ou K 0 = L. Em particular, dado
α ∈ L \ K, então L = K[α].
√
Exemplo 17.11. Seja L/Q tal que [L : Q] = 2. Mostraremos que L = Q[ d]
para d ∈ Q que não é um quadrado. Pelo exemplo anterior, dado α ∈ L \ Q
temos que L = Q[α]. Seja
a2

2
a
Pα|Q := x + ax + b = x + + b− .
2 4
A mudança de variável x 7→ x + a/2 transforma Pα|Q em X 2 − β, onde β =
(a2 /4) − b. Além disto esta mudança de variável é um automorfismo de K[x],
portanto x2 − β é irredutı́vel, assim tomamos d = β.
17.12. Adjunção de raı́zes

Lema 17.13 (lema da duplicação). Sejam κ : K → K 0 um isomorfismo de
corpos e L0 ⊃ K 0 um corpo contendo K 0 . Então existe uma extensão L/K e um
isomorfismo de corpos λ : L → L0 estendendo κ, i.e., λ|K = κ.
17.12. ADJUNÇÃO DE RAÍZES 161
Demonstração. Suponha que L0 ∩ K = ∅. Definimos L da seguinte forma

: L := K q (L0 \ K 0 ), onde q denota união disjuta. Definimos λ por λ : L → L0 ,
se x ∈ K, então λ(x) := κ(x); se x ∈ L0 \ K 0 , então λ(x) := x. Dessa forma λ é
uma bijeção. Utilizamos esta bijeção para colocar uma estrutura de corpo em L
por : dados x, y ∈ L definimos
x + y := λ−1 (λ(x + y)) e xy := λ−1 (λ(x)λ(y)).
Com esta estrutura, λ é o isomorfismo de corpos procurado.

Se L0 ∩ K 6= ∅, basta aplicar o lema 1.1 para obter um conjunto L00 e uma
bijeção λ0 : L0 → L00 tal que L00 ∩ K = ∅. Novamente, definimos uma estrutura de
0 0
corpo em L00 por x0 +y 0 := λ −1 (λ0 (x)+λ0 (y)) et x0 y 0 := λ −1 (λ(x)λ(y)). Aplicamos
agora a parte anterior substituindo K 0 por K 00 := λ0 (K 0 ) e κ por κ0 := λ0 ◦ κ.
Definição 17.14. Seja κ : K → K 0 um homomorfismo não nulo de corpos

(logo necessariamente injetivo). Este homomorfismo induz um homomorfismo de
anéis de polinômios da seguinte forma
κ∗ : K[x] → K 0 [x]
n
X n
X
i
ai x 7→ κ(ai )xi .
i=0 i=0
Teorema 17.15. Dado f ∈ K[x] \ K irredutı́vel existe uma extensão finita

L/K e α ∈ L tal que f (α) = 0.
Demonstração. Como f é irredutı́vel o ideal (f ) é maximal, logo o anel

quociente L := K[x]/(f ) é um corpo. Consideremos o homomorfimso sobrejetivo
K[x]
ϕ : K[x] → definido por g 7→ g (mod (f )).
(f )
Este homomorfismo não é o homomorfismo nulo, logo é injetivo quando restrito
a K, i.e., ϕ|K : K → K := ϕ(K) é um isomorfismo de corpos. Este induz um
isomorfismo de anéis de polinômios ϕ∗|K : K[x] → K[x] como na definição anterior.
Em particular, se x := ϕ(x), então
n
X
ϕ∗|K (f )(x) = ϕ(ai )xi = ϕ(f (x)) ≡ 0 (mod (f )).
i=0
Assim x ∈ L é uma raiz de ϕ∗|K (f ).

Pelo lema da duplicação, existe uma extensão L/K e um isomorfismo λ : L →

L tal que λ|K = ϕ|K . A fortiori, definindo α := λ−1 (x), este elemento é uma raiz
de f em L.
Corolário 17.16. Seja f ∈ K[x] \ K, então existe uma extensão finita L/K
e α ∈ L tal que f (α) = 0.
Demonstração. Basta fatorar f em fatores irredutı́veis e usar o teorema

para determinar uma extensão finita de K no qual um dos fatores tenha raiz.
Esta raiz será também raiz de f .
Corolário 17.17. Seja f ∈ K[x] \ K. Existe uma extensão finita L/K tal
que f fatora-se linearmente em L[x].
Demonstração. Aplicando o teorema sucessivamente a cada fator irre-

dutı́vel de f obtemos em cada etapa uma extensão finita do corpo anterior e
mais uma raiz do fator. Como o número de fatores é finito e o número de raı́zes
em cada fator também o é, pela transitividade de extensões finitas, concluimos
que existe L/K finita como no corolário.
17.18. Fechos algébricos

Definição 17.19. Seja L/K uma extensão de corpos. Definimos AL (K)
como o conjunto dos elementos α ∈ L que são algébricos sobre K. Este conjunto
é chamado o fecho algébrico de K em L.
Observação 17.20. O conjunto AL (K) é um corpo. De fato, basta mostrar

que dados α, β ∈ AL (K)\{0}, então α+β, αβ, α−1 ∈ AL (K). Provemos o caso de
α + β, os demais são similares. Por hipótese K[α] e K[β] são corpos e K[α]/K e
K[β]/K são finitas. Seja K[α, β] a extensão gerada sobre K por α e β. Considere
o seguinte diagrama de corpos.
K[α, β]
/ | \
K[α] K[α + β] K[β]
\ | /
K
A extensão K[α, β] é gerada por β sobre K[α]. Como β é algébrico sobre K e K ⊂
K[α], concluimos que β é algébrico sobre K[α]. Logo a extensão K[α, β]/K[α]
17.18. FECHOS ALGÉBRICOS 163
é finita. Pela transitividade de extensões finitas, concluimos que K[α, β]/K é

finita. Mas, K ⊂ K[α + β] ⊂ K[α, β]. Logo K[α + β]/K é finita, portanto
α + β ∈ AL (K).
Exemplo 17.21. Seja K um corpo, L/K extensão e τ ∈ L transcendente so-

bre K. Afirmamos que K é algebricamente fechado em K(τ ) = {f (τ )/g(τ ) | f, g ∈
K[x], g 6= 0}. De fato, se existisse α ∈ K(τ ) \ K algébrico sobre K, digamos α =
f (τ )/g(τ ), então K[α]/K seria finita. Observe que h := f (x) − αg(x) ∈ (K[α])[x]
e h(τ ) = 0, ou seja, τ é algébrico sobre K[α]. Portanto, K(τ ) = (K[α])[τ ] é
algébrico sobre K, mas isto é impossı́vel, pois τ é transcendente sobre K.
Definição 17.22. Dizemos que um corpo K é algebricamente fechado, se

todo f ∈ K[x] \ K possui uma raiz α ∈ K.
A seguinte proposição é uma conseqüência direta desta definição, da fatoração

de polinômios e da definição sobre elementos algébricos.
Proposição 17.23. As seguintes condições são equivalentes.

(1) K é algebricamente fechado.
(2) Todo f ∈ K[x] \ K fatora-se como produto de polinômios lineares.
(3) Todo f ∈ K[x] irredutı́vel tem grau 1.
(4) Não existe extensão L ) K algébrica.
O primeiro exemplo de corpo algebricamente fechado é C.
Teorema 17.24 (teorema fundamental da Álgebra). [?, p.199, corolário 4] O

corpo C é algebricamente fechado.
Exemplo 17.25. Seja f ∈ R[x]. Mostremos que grau(f ) = 1 ou 2. Seja

β ∈ C uma raiz de f . Então f = Pβ|R e como R ⊂ R[β] ⊂ C, e [C : R] = 2, então
grau(f ) = 1 ou 2.
Definição 17.26. Sejam K ⊂ Ω corpos com Ω algebricamente fechado. Di-

zemos que AΩ (K) é um fecho algébrico de K.
Definição 17.27. Sejam K um corpo e I um conjunto qualquer de ı́ndices.

O anel de polinômios K[xI ] em variáveis xi parametrizadas por elementos i ∈ I
é definido como sendo o conjunto de polinômios f com coeficientes em K em um
número finito de variáveis xi1 , · · · , xin , para i1 , · · · , in ∈ I.
Teorema 17.28. Para todo corpo K existe um corpo Ω ⊃ K algebricamente

fechado.
Demonstração. Seja P o conjunto dos polinômios irredutı́veis mônicos em

K[x]. Seja R o anel R := K[xP ]. Considere o ideal p de R gerado pelo conjunto
{P (xP ) | P ∈ P}. Este ideal é próprio, caso contrário existiriam P1 , · · · , Pr ∈ P
e G1 , · · · , Gr ∈ K[xP1 , · · · , xPr ] ⊂ R tais que
r
X
P (xPi )Gi (xP1 , · · · , x(Pr )) = 1.
i=1
Mas pelo corolário 17.17 existe uma extensão finita L/K tal que P1 . . . Pr fatora-se
linearmente em L. Para cada 1 ≤ i ≤ r seja αi ∈ L uma raiz de Pi . Logo
r
X
1= P (αi )Gi (α1 , · · · , αr ) = 0,
i=1
o que é uma contradição.

Pelo lema de Krull, existe m ( R ideal maximal contendo p. Considere o
homomorfismo quociente ϑ : R → R/m. A restrição κ de ϑ a K induz um
isomorfimso de corpos κ : K → K := ϑ(K). Pelo lema da duplicação existe uma
extensão L1 /K e um isomorfismo de corpos λ : L1 → R/m estendendo κ. Como
na demonstração do teorema 17.15 αP := ϑ(xP ) é uma raiz de ϑ∗ (P ), e a fortiori
λ−1 (αP ) ∈ L1 é uma raiz de P . Dessa forma construimos uma extensão L1 /K na
qual todo elemento de P possui uma raiz.
Prosseguindo indutivamente, contruimos uma seqüência de corpos
L0 := K ⊂ L1 ⊂ L2 ⊂ · · · ⊂ Ln ⊂ · · ·
tais que todo polinômio irredutı́vel mônico em Lj [x] possui uma raiz em Lj+1 .
S
Seja Ω := j≥1 Lj . Este conjunto é um corpo contendo K e afirmamos que é
algebricamente fechado. De fato, dado f ∈ Ω[x]\Ω, este fatora-se linearmente em
algum Lj [x] para j suficientemente grande. Portanto, por construção, f possui
raiz em Lj+1 ⊂ Ω.
Corolário 17.29 (existência de fecho algébrico). Todo corpo K possui um

fecho algébrico.
Demonstração. Pelo teorema anterior existe extensão Ω/K tal que Ω é

algebricamente fechado, portanto AΩ (K) é um fecho algébrico de K.
Teorema 17.30. Sejam K, K 0 corpos, κ : K → K 0 um isomorfismo de corpos,

L/K, L0 /K 0 extensões de corpos, α ∈ L (resp. α0 ∈ L0 ) algébrico sobre K (resp.
algébrico sobre K 0 ). As seguintes condições são equivalentes.
(1) O isomorfismo κ estende-se a um isormorfismo de corpos κα : K[α] →
K 0 [α0 ] tal que κα (α) = α0 .
(2) κ∗ (Pα|K ) = Pα0 |K 0 .
Demonstração. Suponha (1). Então κ∗ (Pα|K )(α0 ) = κα (Pα|K (α)) = 0, em

particular κ∗ (Pα|K ) | Pα0 |K 0 . Mas estes dois polinômios são irredutı́veis mônicos.
Portanto vale a igualdade.
Suponha (2). Sabemos que K[α] ∼ = K[x]/(Pα|K ) e K 0 [α0 ] ∼
= K 0 [x]/(Pα0 |K 0 ).
Assim, compondo os isomorfismos abaixo encontramos κα :
∼
= K[x] κ K 0 [x] ∼ =
K[α] −→ −→ −→ K 0 [α0 ].
(Pα|K ) (Pα0 |K 0 )

Definição 17.31. Sejam L e L0 extensões de K e λ : L → L0 um isomorfismo

de corpos. Dizemos que λ é um K-isomorfismo, se λ|K for a identidade.
Em particular, tomando K = K 0 , κ a identidade e L = L0 obtemos o corolário.
Corolário 17.32. Sejam L/K uma extensão de corpos e α, α0 ∈ L algébricos

sobre K. As seguintes condições são equivalentes.
(1) Existe um K-isomorfismo K[α] → K[α0 ] tal que α 7→ α0 .
(2) Pα|K = Pα0 |K 0 .
Definição 17.33. Sejam L/K uma extensão e α, β ∈ L algébricos sobre K.

Dizemos que α é K-conjugado a β (denotamos por α ∼K β), se Pα|K = Pβ|K . Esta
noção independe da escolha da extensão L/K. O conjunto Cα dos K-conjugados
de α é finito, pois #Cα ≤ grau(Pα|K ).
Proposição 17.34. Seja L/K uma extensão algébrica. Todo K-endomorfismo

de L é também um K-isomorfismo de L.
Demonstração. Seja σ um K-endomorfismo de L. Observe que para todo

α ∈ L temos σ(Cα ) ⊂ Cα , pois Pα|K (σ(β)) = β(Pα|K (β)) = 0. Mas Cα é finito e σ
é injetivo (pois é não nulo). Logo σCα é uma bijeção de um conjunto finito nele
mesmo. A fortiori, σ é sobrejetiva e σ é um K-automorfismo de L.
Teorema 17.35 (extensão de homomorfismos). Sejam L/K uma extensão

algébrica e κ : K → Ω um homomorfismo de corpos com Ω algebricamente fe-
chado. Então existe λ : L → Ω um homomorfismo de corpos estendendo κ.
Demonstração. Suponha inicialmente que L = k[α] para algum α ∈ L.

Seja α0 ∈ Ω uma raiz de κ∗ (Pα|K ). Assim, κ∗ (Pα|K ) = Pα0 |K 0 , onde K 0 := κ(K).
Pelo teorema 17.30, existe um homomorfismo de corpos λ : L → Ω estendendo κ
tal que λ(α) = α0 .
No caso geral, consideramos o conjunto M de pares ordenados (L0 , λ0 ) forma-
dos por extensões L0 /K contidas em L e homomorfismos de corpos λ0 : L0 → Ω
estendendo κ. Definimos uma ordem parcial em M por
(L0 , λ0 ) ≤ (L00 , λ00 ) se e somente se L0 ⊂ L00 e λ0 = λ00|L0 .
O conjunto M é indutivo. De fato, se L := {(Lj , λj ) | j ∈ J} ⊂ M for um

subconjunto totalmente ordenado, então o corpo
[
LJ := Lj
j∈J
é um subcorpo de L e definindo λJ em cada Lj por λJ := λj obtemos (por

construção) um homomorfismo de corpos λJ : LJ → Ω. Além disto, temos que
(Lj , λj ) ≤ (LJ , λJ ) para todo j ∈ J. Assim, (LJ , λJ ) é um limite superior para
M. Pelo lema de Zorn, o conjunto M admite elemento maximal (L̃, λ̃).
Afirmamos que L̃ = L. De fato, caso contrário, se α ∈ L̃ \ L, utlizando a
primeira parte da prova, poderı́amos estender λ̃ a um homomorfismo de corpos
L̃(α) → Ω, o que é uma contradição.
Teorema 17.36 (unicidade a menos de isomorfismo). Seja K um corpo.

Suponha que Ω e Ω1 sejam corpos algebricamente fechados contendo K. Então
AΩ (K) e AΩ1 (K) são K-isomorfos.
Demonstração. Pelo teorema anterior, existe um K-homomorfismo λ :

AΩ (K) → Ω1 . É claro que a imagem de λ está contida em AΩ1 (K). Por outro lado
para todo α1 ∈ AΩ1 (K) e toda raiz α ∈ Ω de Pα1 |K temos que Pα|K = Pα1 |K . Logo,
pelo teorema 17.30, concluimos que existe um K-isomorfismo K[α] → K[α1 ] tal
que α 7→ α1 . Em particular, λ(AΩ (K)) = AΩ1 (K).
Exemplo 17.37. A motivação para o teorema anterior vem da seguinte si-

tuação. Uma maneira de construir R a partir de Q é adicionar a Q os limites de
seqüências de Cauchy de elementos de Q (ver [?]). Por isto dizemos que R é o

completamento de Q.
Note-se entretanto que está implı́cito na discussão anterior que estamos uti-
lizando para a noção de limite o valor absoluto usual dos números racionais.
Tal valor absoluto é arquimediano, ou seja satisfaz a desigualdade triangular
|x + y| ≤ |x| + |y|. Por isto vamos dizer que R é o completamento arquimediano
de Q. Na linguagem da geometria aritmética moderna, o valor absoluto arquime-
diano nada mais é que o primo no infinito que compatifica o conjunto (esquema)
Spec(Z) dos ideais primos de Z.
Porque dizemos isto? Para cada número primo p, pela unicidade da fatoração
de números inteiros em produto de números primos, para todo x ∈ Q existe
um único ordp (x) ∈ Z tal que x = pordp (x) x0 , onde nem o numerador nem o
denominador de x0 ∈ Q são divisı́veis por p. Isto permite definir o seguinte valor
absoluto (chamado de p-ádico)
|x|p := p−ordp (x) .
Este valor absoluto é não arquimediano, ou seja, vale uma propriedade mais forte
que a propriedade triangular, |x + y|p ≤ max(|x|p , |y|p ).
Repetimos o procedimento de construção de R a partir de Q e acrescentamos
a Q os limites de seqüências de Cauchy (com respeito ao valor absoluto p-ádico).
O conjunto obtido é o corpo Qp dos números p-ádicos. Uma outra forma de
representar um elemento de Qp é através de uma “série de Laurent”
X
x= ai p i ,
i≥n
onde n ∈ Z e 0 ≤ ai < p é inteiro para todo i. Assim, Qp é o completamento de

Q com respeito ao valor absoluto p-ádico.
Pelo teorema 17.28 existe um corpo algebricamente fechado contendo R, por
exemplo C, e um corpo algebricamente fechado (até completo, mas isto não segue
do teorema, ver [?]) Cp contendo Qp . Assim, terı́amos por um lado o fecho
algébrico AC (Q) de Q en C (chamado o corpo de todos os números algébricos e
denotado por Q) e o fecho algébrico ACp (Q) de Q em Cp . O que o teorema nos
diz é que apesar destes dois fechos algébricos serem subcorpos de corpos distintos
(os valores absolutos são diferentes), eles são Q-isomorfos. Isto nos permite usar
a notação Q sem ambuiguidade.
Nos tópicos adicionais comentaremos sobre um grupo ligado a Q e um dos

objetos mais importantes da aritmética (bastante misterioso, ainda) o grupo de
Galois absoluto de Q.
CAPı́TULO 18
Extensões separáveis
Definição 18.1. Seja f ∈ K[x], L/K uma extensão de corpos e α ∈ L uma

raiz de f . A multiplicidade m = m(f, α) de α como raiz de f é definido como
o maior inteiro m ≥ 1 tal que existe g ∈ L[x] com g(α) 6= 0 satisfazendo a
f = (x − α)m g. Se m = 1 dizemos que α é uma raiz simples, caso contrário que
é uma raiz múltipla.
No capı́tulo 15, seção 15.25 mostramos que dados f, g ∈ K[x]\K eles possuem
um fator comum não constante (logo uma raiz comum, utilizando o capı́tulo
anterior) se e somente sua resultante Res(f, g) for nula. Além disto, mostramos
também que f possui fator múltiplo (logo raiz múltipla) se e somente se seu
discriminante disc(f ) for nulo. Lembre que disc(f ) = Res(f, D(f )), onde D(f )
denota a derivada de f .
Definição 18.2. Seja D um domı́nio de integridade. Consideremos o ho-

momorfismo ϑ : Z → D tal que ϑ(1) = 1D , onde 1D denota o elemento neutro
multiplicativo de D. Seja I = N (ϑ) o núcleo de ϑ. Se N (ϑ) = (0) (i.e., ϑ for
injetivo) dizemos que a caracterı́stica car(D) como 0. Caso isto não ocorra I é um
ideal não nulo de Z, logo I = nZ para algum n ≥ 1. Além disto pelo teorema dos
isomorfismos Z/nZ é isomorfo a um subdomı́nio de D. Mas Z/nZ é um domı́nio
se e somente se n = p é um número primo. Neste caso dizemos que car(D) = p.
Note que neste caso p.1D = 0 e para todo a ∈ D temos também que pa = 0.
Observe também que
p
p
X p i p−i
(a + b) = a b = ap + b p ,
i=0
i
pois para todo i = 1, · · · , p − 1 temos

p
≡0 (mod p).
i
169
170 18. EXTENSÕES SEPARÁVEIS
Teorema 18.3. Seja L/K uma extensão de corpos e α ∈ L algébrico sobre K.

Então Pα|K não possui raı́zes múltiplas ou existe h ∈ K[x] tal que Pα|K (x) = h(xp )
e neste caso p = car(K).
Demonstração. Suponha que D(Pα|K ) 6= 0. Neste caso, como grau(D(Pα|K

)) < grau(Pα|K ), então mdc(Pα|K , D(Pα|K )) = 1, i.e., Pα|K não admite raı́zes
múltiplas.
Seja
n−1
X
n
Pα|K = x + ai x i .
i=0
Então D(Pα|K ) = 0 se e somente se para todo i tal que ai 6= 0 temos que i = 0

em K (i.e., i ≡ 0 (mod p) em Z). Assim,
0 0
Pα|K = xn p + a(n0 −1)p x(n −1)p + . . . + ap xp + a0
e basta tomar
0 0
h = xn + a(n0 −1)p xn −1 + . . . + ap x + a0 .

Definição 18.4. Dado f ∈ K[x] \ K, dizemos que f é separável, se f não

admite raı́zes múltiplas. Seja L/K uma extensão de corpos e α ∈ L algébrico
sobre K, então α é dito separável sobre K, se Pα|K for separável. Uma extensão
algébrica L/K é dita separável, se todo α ∈ L for separável sobre K. Um corpo
K é dito perfeito, se car(K) = 0 ou car(K) = p e K = K p = {ap | a ∈ K}
(i.e., todo elemento de K é p-potência). Note que a inclusão K p ⊂ K é sempre
satisfeita. A questão é a inclusão oposta.
Proposição 18.5. Um corpo K é perfeito se e somente se para todo f ∈ K[x]

irredutı́vel for separável.
Demonstração. Suponha que K seja perfeito e seja f ∈ K[x] irredutı́vel.

Seja L/K finita e α ∈ L tal que f (α) = 0. Logo f = aPα|K para a ∈ K ∗ . Se
car(K) = 0 ou D(Pα|K ) 6= 0, então Pα|K é separável (logo o mesmo vale para f ).
Caso isto não ocorra, então Pα|K (x) = h(xp ) para algum h ∈ K[x] e p = car(K).
Como K é perfeito K = K p . Escrevendo
n
X
Pα|K = aip xip
i=0
18. EXTENSÕES SEPARÁVEIS 171
temos que para todo i existe bi ∈ K tal que aip = bpip . Logo
Xn
Pα|K =( bip xi )p
i=0
é redutı́vel, o que é uma contradição.

Reciprocamente, suponha que todo f ∈ K[x] irredutı́vel seja separável. Se
car(K) = 0 nada há a fazer. Suponhamos que car(K) = p. Seja a ∈ K e
f = xp − a. Existe uma extensão finita L/K e α ∈ L tal que f (α) = 0, em
particular
Pα|K | f = (x − α)p , i.e., Pα|K = (x − α)` ,
para algum 1 ≤ ` ≤ p. Mas pela separabilidade de Pα|K , temos que ` = 1 e
α ∈ K.
Proposição 18.6. Um corpo K é perfeito se e somente se toda extensão

algébrica L/K for separável.
Demonstração. Suponha que K seja perfeito e seja L/K uma extensão

algébrica. Pela proposição anterior para todo α ∈ L temos que Pα|K é separável.
Reciprocamente, suponhamos que toda extensão algébrica L/K seja separável.
Novamente, se car(K) = 0 nada há a fazer. Suponhamos que car(K) = p. Seja
a ∈ K e f = xp − a. Seja L/K finita e α ∈ L tal que f (α) = 0. Logo Pα|K | f e
pelo mesmo argumento anterior α ∈ K.
Definição 18.7. Seja L/K uma extensão algébrica. Dizemos que α ∈ L é

inseparável sobre K, se não for separável, i.e., se Pα|K admitir raı́zes múltiplas.
Para provar uma proposição sobre transitividade de extensões separáveis, pre-

cisamos antes do seguinte resultado sobre extensões de homomorfismos.
Proposição 18.8. Seja L/K uma extensão finita, digamos L = K[α1 , · · · , αr ].

Seja Ω um corpo algebricamente fechado e κ : K → Ω um homomorfismo não tri-
vial (logo necessariamente injetivo) de corpos, onde Ω é algebricamente fechado.
Seja m o número de extensões λ : L → Ω de κ a L (ver capı́tulo anterior). Então
1 ≤ m ≤ [L : K].
Além disto as seguintes condições são equivalentes:
(i) m = [L : K].
(ii) α1 , · · · , αr são separáveis sobre K.
(iii) L/K é separável.
Demonstração. Provaremos inicialmente a proposição para r = 1. Sejam

{α1 = β1 , · · · , βn } as raı́zes de Pα1 |K . Se λ é uma extensão de κ a L, então λ(α1 )
é necessariamente uma raiz de Pα1 |K , uma vez que este polinômio é invariante
por κ. Assim, o número de extensões λ é igual ao número de raı́zes distintas de
Pα1 |K . Este número é no máximo igual a grau(Pα1 |K ) = [L : K]. Além disto,
m ≥ 1, pois provamos no capı́tulo anterior a existência de extensões λ de κ, se
L/K for algébrica.
Observe que m = [L : K] se e somente se o número de raı́zes distintas de Pα1 |K
for igual a [L : K] = grau(Pα1 |K ). Isto equivale a Pα1 |K ser separável. Assim,
as condições (i) e (ii) são equivalentes. É claro que (iii) implica (ii). Suponha
que L/K seja inseparável, digamos que γ ∈ L seja inseparável sobre K. Pela
equivalência entre (i) e (ii) concluimos que o número de extensões κγ de κ a K[γ]
é estritamente inferior a [K[γ] : K]. Por outro lado, pela primeira parte, cada κγ
possui no máximo [L : K[γ]] extensões a L. Dessa forma, o número de extensões
de κ a L é menor que [L : K], ou seja, (i) implica (iii).
Para provar o caso geral, para qualquer r, lembremos que existe uma seqüência
finita de extensões
K = K0 ⊂ K1 = K0 [α1 ] ⊂ K2 = K1 [α2 ] ⊂ · · ·
⊂ Kr = Kr−1 [αr ] = K[α1 , · · · , αr ] = L.
Pela primeira parte, o número de extensões κ1 de κ a K1 é no máximo [K1 : K], o
número de extensões de κ1 a K2 é no máximo [K2 : K1 ], etc. Portanto, o número
de extensões de κ a L é no máximo igual a
[K1 : K][K2 : K1 ] . . . [Kr : Kr−1 ] = [L : K].
Como anteriormente (iii) implica (ii). Suponha (ii). Então cada αi é separável
também sobre Ki−1 . A fortiori, pela primeira parte, o número de extensões de
κi−1 a Ki é igual a [Ki : Ki−1 ]. Aplicando a multiplicativade dos graus concluimos
que m = [L : K]. Finalmente, a prova que (i) implica (iii) é idêntica à da primeira
parte.
Corolário 18.9. Sejam L/K uma extensão algébrica e M um subconjunto

de L. Se todo α ∈ M for separável sobre K, então K[M]/K é separável.
Demonstração. Basta observar que

[
K[M] = K[F],
F∈C
18. EXTENSÕES SEPARÁVEIS 173
onde F percorre o conjunto C de subconjuntos finitos de M, e aplicar a proposição

anterior.
Teorema 18.10. Sejam L/K e M/L extensões algébricas. Então M/K é
separável se e somente se M/L e L/K o forem.
Demonstração. É claro que se M/K for separável, então M/L e L/K
também o são. Provemos a recı́proca. Seja α ∈ M e
Pα|L = xn + an−1 xn−1 + . . . + a0 .
Seja L := K[a0 , · · · , an−1 ]. Então Pα|L ∈ L[x] e α é separável sobre L. Como
cada ai ∈ L e L/K e separável, pela proposição 18.8 L/K também é separável.
Além disto, pelo observado acima e pela proposição 18.8 obtemos que L[α]/L
também é separável.
Seja κ : K → Ω um homorfismo não trivial de corpos, com Ω algebricamente
fechado. O número de extensões κL de κ a L é igual a [L : K]. Além disto, para
cada κL o número de extensões deste homomorfismo a L[α] é igual a [L[α] : L].
Portanto, o número de extensões de κ a L[α] é igual a
[L : K][L[α] : L] = [L[α] : K].
Novamente, aplicando a proposição 18.8 concluimos que L[α]/K é separável,
assim α é separável sobre K.
Definição 18.11. Seja L/K uma extensão algébrica e Ω um corpo algebri-
camente fechado. Denotamos por HomK (L, Ω) o conjunto dos homomorfismos de
corpos λ : L → Ω tais que λ|K = id. São chamados K-homomorfismos de L em
Ω.
O seguinte resultado é uma conseqüência imediata da proposição 18.8.
Teorema 18.12. Seja L/K uma extensão finita. Então
# HomK (L, Ω) ≤ [L : K].
Além disto, vale a igualdade se e somente se L/K for separável.
Definição 18.13. Seja L/K uma extensão algébrica. Definimos o fecho sepa-
rável SL (K) de K em L por
SL (K) := {α ∈ L | α é separável sobre K.
É claro que K ⊂ SL (K). Fica como exercı́cio provar que SL (K) é um subcorpo
de K (utilize a transitividade de extensões separáveis provada acima).
Definição 18.14. Seja L/K uma extensão de corpos. Dizemos que α é um

elemento primitivo de L/K se L = K[α]. Neste caso, dizemos que L/K é uma
extensão simples.
Teorema 18.15 (teorema do elemento primitivo). Suponha que K seja um

corpo infinito. Seja L/K uma extensão finita e separável. Então L/K é simples,
i.e., existe α ∈ L elemento primitivo de L/K.
Demonstração. Observemos inicialmente que basta supor que L seja ge-

rado por 2 elementos α, β, digamos L = K[α, β]. De fato, sendo L/K finita,
sabemos que L é da forma L = K[α1 , · · · , αr ]. Suponha o resultado provado
para extensões geradas por 2 elementos. Assim, existe β1 ∈ K2 = K1 [α1 ] =
K[α1 , α2 ] tal que K2 = K[β1 ]. Pelo mesmo argumento, existe β2 ∈ K3 tal que
K3 = K[β1 , α3 ] = K[β2 ]. Repetindo sucessivamente o argumento, concluimos
que L = Kr = K[βr−1 ].
Sejam
f := Pα|K = (x − α) . . . (x − αn ) e g := Pβ|K = (x − β) . . . (x − βm ).
Seja c ∈ K e γ := α + cβ. Consideremos os corpos K ⊂ F = K[γ] ⊂ L =
K[α, β]. Provaremos que L = F para uma escolha genérica de c ∈ K. Seja
h(x) := f (γ − cx) ∈ F [x]. Observe que h(β) = 0. Portanto, x − β divide
h em L[x]. Seja M/L uma extensão finita contendo todas as raı́zes de f e g.
Mostraremos que mdcM [x] (h, g) = x − β.
Observemos inicialmente que algum βj é raiz de f (com j > 1) se e somente
se
γ − cβj = α + c(β − βj ) = αi ,
para algum i. Ou equivalentemente, se e somente se
αi − α
(18.15.1) c= .
β − βj
Note que o conjunto destas frações com j percorrendo 2, · · · , m e i percorrendo
1, · · · , n é finito. Como o corpo K é infinito, podemos sempre escolher c ∈ K
diferente de todas estas frações. Em outras palavras a única raiz comum de h e
g é β, daı́ segue o resultado sobre o mdc.
Mas o mdc não depende do corpo no qual estamos considerando, pela uni-
cidade do resto no algoritmo de divisão de polinômios. Dessa forma, como
g, h ∈ F [x] concluimos que β ∈ F . Portanto, por construção α ∈ F e L = F .
18.17. CORPOS FINITOS 175
Observação 18.16. No próximo capı́tulo daremos uma prova intrı́nseca do

teorema do elemento primitivo para corpos finitos. Observe também que na
prova do teorema do elemento primitivo, se nos restringirmos a corpos L da
forma K[α, β], não precisamos supor que L/K seja separável. Basta que β seja
separável sobre K, uma vez que isto garante que os denominadores de (18.15.1)
sejam todos não nulos.
18.17. Corpos Finitos

Dado um inteiro n ≥ 1 sabemos que o anel quociente Z/nZ é um corpo se e
somente se n = p for um número primo. Este é o primeiro exemplo de um corpo
finito que será denotado por Fp . Uma maneira natural de definir corpos finitos
é tomar f ∈ Fp [x] irredutı́vel e lembrar que o anel quociente Fp [x]/(f ) é neste
caso um corpo. Este corpo também pode ser escrito como Fp [α] para raiz α de
f em alguma extensão finita l de Fp . Além disto, [Fp [α] : Fp ] = grau(f ) digamos
n. Assim, como Fp espaço vetorial Fp [α] é isomorfo a Fnp portanto é um corpo de
q = pn elementos. Estes corpos são caracterizados pelo seguinte teorema.
Teorema 18.18. (a) Para todo n ≥ 1 inteiro existe um corpo finito Fq

de q = p elementos dado pelo conjunto das raı́zes Rxq −x de xq − x
n
em algum corpo algebricamente fechado Ω contendo Fp . Além disto este

polinômio é separável.
(b) O corpo Fq é único a menos de isomorfismo.
(c) O grupo multiplicativo F∗q = Fq \ {0} é um grupo cı́clico.
(d) Os fatores irredutı́veis mônicos de xq − x são exatamente os polinômios
irredutı́veis mônicos f ∈ Fp [x] tais que grau(f ) | n.
(e) Se q 0 = pm , então Fq0 ⊂ Fq se e somente se q 0 | q.
Demonstração. (a) Sabemos que existe uma extensão finita L de Fp tal

que f fatora-se linearmente em L[x]. Seja Fq := Rxq −x ⊂ L. Afirmamos que Fq
é um subcorpo de L. De fato, se a, b ∈ Fq , então (a + b)q = aq + bq = a + b,
logo a + b ∈ Fq . Além disto (ab)q = aq bq = ab, logo ab ∈ Fq . E se a ∈ F∗q ,
então (a−1 )q = (aq )−1 = a−1 , logo a−1 ∈ Fq . Além disto, como D(xq − x) = −1,
concluimos que xq − x é separável. O ı́tem (b) segue da unicidade de fecho
algébrico a menos de isomorfismo.
O item (c) segue imediatamente do seguinte lema.

Lema 18.19. Seja K um corpo e G ⊂ K ∗ um subgrupo finito. Então G é

cı́clico.
Demonstração. Como G é finito, então seu expoente exp(G) também o é

(veja definição 9.37). Digamos que n = exp(G). Isto significa que para todo
a ∈ G, temos an = 1, ou seja, G ⊂ Wn (K) := {α ∈ K | αn = 1}. Mas este é
o conjunto das raı́zes de xn − 1 que tem cardinalidade no máximo n. Portanto,
#G ≤ n, como a desigualdade contrária vale em geral, temos que |G| = exp(G) =
n. Pela proposição 9.40, concluimos que G é cı́clico.
Para provar os ı́tens (d) e (e) precisamos de um lema adicional.
0
Lema 18.20. Seja q 0 := pm tal que n = mk. Então xq − x divide xq − x.
Demonstração. Recordemos a fatoração

y d − 1 = (y − 1)(y d−1 + . . . + y + 1).
0
Tomemos y = q 0 e d = k, assim q 0 − 1 divide (q 0 )k − 1 = q − 1. Tomando y = xq −1
0 0 0
e d = (q −1)/(q 0 −1) obtemos que xq −1 −1 divide (xq −1 )(q−1)/(q −1) −1 = xq−1 −1,
0
multiplicando por x concluimos que xq − x divide xq − x.
Suite da prova do teorema. (d) Seja f um fator irredutı́vel mônico de
xq − x. Então existe α ∈ Fq tal que f = Pα|Fp . Neste caso, Fq ⊃ Fp [α] ⊃ Fp e
como [Fp [α] : Fp ] = grau(Pα|Fp ) concluimos que grau(f ) | n.
Reciprocamente, se f ∈ Fp [x] é irredutı́vel mônico de grau m | n, então
existe uma extensão finita L de Fp e α ∈ L tal que f = Pα|Fp . Neste caso,
0
Fp [α] = Fq0 , onde q 0 = pm . Como m | n, (xq − x) | (xq − x), em particular
Rxq0 − x = Fq0 ⊂ Rxq −x = Fq . Logo α é raiz de xq − x, assim f = Pα|Fp | (xq − x).
0
(e) Suponhamos que m | n. Pelo lema anterior, (xq − x) | (xq − x), logo
Rxq0 − x = Fq0 ⊂ Rxq −x = Fq . Reciprocamente, se Fq0 ⊂ Fq , então [Fq : Fp ] = n =
[Fq : Fq0 ][Fq0 : Fp ] = [Fq : Fq0 ]m, assim m | n.
CAPı́TULO 19
Corpos de decomposição e extensões normais
Definição 19.1. Seja K um corpo e f ∈ K[x] \ K. Seja Ω um corpo algebri-

camente fechado com Ω ⊃ K. Seja Rf := {α ∈ Ω | f (α) = 0} = {α1 , · · · , αn }. O
corpo de decomposição K[Rf ] de f com relação a K é a extensão finita K[α1 , · · · ,
αn ] gerada sobre K por {α1 , · · · , αn }. Observemos que este é o menor subcorpo
de Ω contendo K e Rf . De fato, qualquer outro subcorpo contendo K e Rf
necessariamente contém K(Rf ), pois os elemento deste são polinômios nos αi ’s
com coeficientes em K. Uma extensão algébrica L/K é dita normal, se para todo
α ∈ L, RPα|K ⊂ L.
Observação 19.2. Note que a noção de corpo de decomposição a priori

dependeria do corpo Ω. Novamente, com o mesmo argumento que utilizado para
provar a unicidade de fecho algébrico a menos de isomorfismo, observamos que
se R0f for o conjunto de raı́zes de f em um outro corpo algebricamente fechado
Ω0 ⊃ K, então K[R0f ] e K[Rf ] são K-isomorfos.
Observação 19.3. Se F ⊂ K[x]\K for uma famı́lia de polinômios, definimos

da mesma forma o conjunto
[
RF := Rf
f ∈F
e denotamos por K[RF ] o corpo de decomposição da famı́lia em Ω. Este nada

mais é que o compositum dos corpos K[Rf ] para f ∈ F.
Proposição 19.4. Uma extensão algébrica L/K é normal se e somente se

para todo f ∈ K[x] irredutı́vel temos Rf ⊂ L ou Rf ∩ L = ∅.
Demonstração. Suponha que L/K seja normal. Seja f ∈ K[x] irredutı́vel

tal que Rf ∩ L 6= ∅. Seja α ∈ L ∩ Rf . Então existe a ∈ K ∗ tal que f = aPα|K .
Por hipótese, RPα|K ⊂ L, mas Rf = RPα|K .
Reciprocamente, suponha que para todo f ∈ K[x] irredutı́vel Rf ⊂ L ou
Rf ∩ L = ∅. Seja α ∈ L. Então RPα|K ∩ L 6= ∅, portanto RPα|K ⊂ L.
177
178 19. CORPOS DE DECOMPOSIÇÃO E EXTENSÕES NORMAIS
Exemplo 19.5. Considere f = x3 − 2 ∈ Q[x]. Seja z = e2πi/3 . Então

√ √ √ √
Rx3 −2 = { 3 2, 3 2z, 3 2z 2 } ⊂ C. Desta forma, Q(Rx3 −2 ) ⊂ Q[ 3 2, z]. Mas z =
√ √ √
( 3 2z)/ 3 2 ∈ Q(Rx3 −2 ). Logo Q(Rx3 −2 ) = Q[ 3 2, z]. Pelo mesmo argumento,
√
Q(Rx4 −5 ) = Q[ 4 5, i].
Proposição 19.6. Seja L/K uma extensão tal que [L : K] = 2. Então L/K
é normal.
Demonstração. Seja α ∈ L. Se α ∈ K, então Pα|K = x − α e RPα|K =
{α} ⊂ K ⊂ L. Caso contrário, em L[x] temos Pα|K = (x − α)g(x) para g ∈ L[x]
mônico de grau 1, assim g(x) = x − β, logo RPα|K = {α, β} ⊂ L.
Observação 19.7. Note que em uma extensão normal L/K para todo α ∈ L,
Pα|K fatora-se linearmente em L[x].
Definição 19.8. Seja L/K uma extensão de corpos, Ω um corpo algebri-
camente fechado contendo K e HomK (L, Ω) o conjunto dos K-homomorfismos
ϕ : L → Ω. Denotamos por Aut(L/K) ao conjunto dos K-automorfismos de L,
i.e., o conjunto dos automorfismos σ : L → L de L tais que σ|K = idK .
Observação 19.9. Ao contrário das extensões finitas, algébricas e separáveis,

√
não vale transitividade para extensões normais. De fato, se L = Q[ 3 2, z] =
√
Q(Rx3 −2 ), então L/Q é normal (pelo teorema). A extensão L/Q[ 3 2] é normal,
√
pois seu grau é 2. Mas a extensão Q[ 3 2]/Q não é normal, pois x3 −2 tem também
√ √
como raı́zes 3 2z e 3 2z 2 e este números são números complexos conjugados,
√
enquanto Q[ 3 2] ⊂ R.
√
Consideremos agora a extensão Q[ 4 5]/Q. Ela tem grau 4, pois x4 − 5 é
irredutı́vel sobre Q (critério de Eisenstein para p = 5). Assim, as extensões
√ √ √
Q[ 4 5]/Q[ 5] e Q[ 5]/Q têm grau 2, portanto são normais. Mas a extensão
√ √
Q[ 4 5]/Q não o é, pois x4 − 5 tem também como raı́zes ± 4 5i e estes são números
√
complexos conjugados, enquanto Q[ 4 5] ⊂ R.
O lema a seguir permite-nos definir o fecho normal de uma extensão L/K.
Lema 19.10. Sejam K ⊂ Ω corpos com Ω algebricamente fechado. Seja N o
conjunto dos subcorpos de Ω normais sobre K. Então a extensão
!
\
N /K
N ∈N
é normal.
19. CORPOS DE DECOMPOSIÇÃO E EXTENSÕES NORMAIS 179
T
Demonstração. Seja α ∈ N ∈N N . Como α ∈ N e N/K é normal, con-
cluimos que RPα|K ⊂ N , para todo N ∈ N.
Definição 19.11. Sejam K ⊂ L ⊂ Ω corpos com Ω algebricamente fechado.

Seja NL o conjunto de subcorpos N de Ω contendo L tais que N/K seja normal.
O corpo
\
NΩ (L/K) := N
N ∈NL
é chamado o fecho normal da extensão L/K em Ω. Segue da definição que

NΩ (L/K) é o menor subcorpo de Ω contendo L que é normal sobre K.
Caracterizaremos agora extensões normais como sendo corpos de decomposição

de uma famı́lia de polinômios. Disto seguirá que no caso particular de extensões
normais finitas, estas podem ser caracterizadas como corpos de decomposição de
apenas um polinômio.
Teorema 19.12. Sejam K ⊂ Ω corpos com Ω algebricamente fechado. Seja

L/K uma extensão algébrica contida em Ω. As seguintes condições são equiva-
lentes:
(i) L/K é normal.
(ii) Existe uma famı́lia F ⊂ K[x] \ K tal que L = K[RF ].
(iii) HomK (L, Ω) = Aut(L/K).
A famı́lia F é descrita como {Pα|K | α ∈ M}, onde M ⊂ L é tal que L = K[M].
Demonstração. Suponha (i) e seja F como acima. Para todo α ∈ M, uma

vez que L/K é normal, RPα|K ⊂ L. A fortiori, K[RF ] ⊂ L. Por outro lado,
L = K[M] ⊂ K[RF ] ⊂ L, logo vale (ii).
Suponha (ii). Observe que temos sempre a inclusão Aut(L/K) ⊂ HomK (L, Ω).
Seja σ ∈ HomK (L, Ω). Para todo f ∈ F temos que σ(Rf ) ⊂ Rf , em particular
σ(L) ⊂ L. A igualdade segue da proposição 17.34.
Suponha (iii). Sejam α ∈ L e β ∈ RPα|K . Logo Pβ|K = Pα|K . Pelo corolário
17.32 existe um K-isomorfismo θ : K[α] → K[β] ⊂ Ω tal que θ(α) = β. Como
β ∈ L e L/K é algébrica, existe um K-homomorfismo λ : L → Ω tal que
λK[α] = θ. Por (iii) temos então β = λ(α) ∈ L. Assim, RPα|K ⊂ L e L/K é
normal.
Corolário 19.13. Sejam L/K uma extensão algébrica, M e F como no

teorema. Então K[RF ] é o fecho normal de L/K em Ω.
Demonstração. É claro que K ⊂ L ⊂ K[RF ], e pelo teorema K[RF ]/K é

normal. Por outro lado para todo subcorpo N de Ω contendo L e normal sobre
K e para todo α ∈ M temos RPα|K ⊂ N , portanto K[RF ] ⊂ N .
Corolário 19.14. Seja L/K uma extensão finita, digamos L = K[α1 , · · · , αr ].
Seja
P := Pα1 |K . . . Pαr |K .
Então K[RP ] é o fecho normal de L/K em Ω.
Corolário 19.15. Seja L/K uma extensão finita. As seguintes condições
são equivalentes.
(1) L/K é normal.
(2) Existe f ∈ K[x] \ K tal que L = K[Rf ].
(3) HomK (L, Ω) = Aut(L/K).
Reunindo as informações deste capı́tulo e do anterior obtemos o seguinte te-
orema.
Teorema 19.16. Seja L/K uma extensão finita e Ω um corpo algebricamente
fechado contendo K.
(1) # HomK (L, Ω) ≤ [L : K] e vale a igualdade se e somente se L/K é
separável.
(2) # Aut(L/K) ≤ # HomK (L, Ω) e vale a igualdade se e somente se L/K
é normal.
(3) # Aut(L/K) ≤ [L : K] e vale a igualdade se e somente se L/K é se-
parável e normal.
No próximo capı́tulo definiremos extensões finitas separáveis e normais como
extensões galoisianas.
19.17. Exemplos
Exemplo 19.18. Seja f = x3 − 2 ∈ Q[x]. Considere o diagrama de corpos
√
Q[ 3 2, z] = Q[Rf ]
/ \
√
3
Q[ 2] Q[z]
\ /
Q
19.17. EXEMPLOS 181
√
A extensão Q[ 3 2]/Q tem grau 2 pois x3 − 2 é irredutı́vel em Q[x] pelo critério
de Eisenstein com p = 2. A extensão Q[z]/Q tem grau 2, pois o polinômio mı́nimo
de z sobre Q é x2 + x + 1. As raı́zes deste polinômio são z e z 2 que são números
√
complexos, um conjugado do outro. Como Q[ 3 2] ⊂ R, x2 + x + 1 é irredutı́vel
√
sobre Q[ 3 2], portanto
√
3
√
3
[Q[ 2, z] : Q[ 2]] = 2 e [Q(Rx3 −2 ) : Q] = 6.
Assim # Gal(Q(Rx3 −2 )/Q) = 6. Um grupo de ordem 6 gerado por dois elementos

σ e τ com σ de ordem 3 e τ de ordem 2 satisfazendo a
τ σ = σ2τ
é isomorfo ao grupo S3 das permutações de 3 elementos que é dado explicitamente

por
{id, σ, σ 2 , τ, στ, σ 2 τ }.
Vamos mostrar que este é o grupo de Galois G = Gal(Q(Rx3 −2 )/Q).

√ √ 2 √ √
Como 1, 3 2, 3 2 , z, z 3 2, z 3 2 é uma base de Q(Rx3 −2 ) como Q-espaço veto-
√
rial, para obter um elemento de G basta calculá-lo em 3 2 e z. Observemos que
dado ϕ ∈ G, então
√ √ 3
ϕ( 2)3 = ϕ( 2 ) = ϕ(2) = 2,
3 3
√ √
logo ϕ( 3 2) ∈ { 3 2z i | para i = 0, 1, 2}. Da mesma forma ϕ(z) ∈ {z, z 2 }.
Definimos σ por
√
3
√
3
σ( 2) := 2z e σ(z) := z e
√
3
√
3
τ por τ ( 2) := 2 e τ (z) := z.
√ √
Observemos que σ e τ satisfazem à condição acima. De fato, σ 2 ( 3 2) = σ( 3 2z) =
√ √ √ √ √ √
3
2z 2 e σ 2 (z) = z; σ 3 ( 3 2) = σ( 3 2z 2 ) = 3 2 e σ 3 (z) = z; τ 2 ( 3 2) = 3 2 e
√ √ √ √
τ (z) = z 4 = z; τ σ( 3 2) = τ ( 3 2z) = 3 2z 2 e τ σ(z) = τ (z) = z 2 ; σ 2 τ ( 3 2) =
√ √
σ 2 ( 3 2) = 3 2z 2 e σ 2τ (z) = σ 2 (z 2 ) = z 2 .
Finalmente, note que o subgrupo de Aut(Q[Rf ]/Q) gerado por σ e τ tem
ordem 6, logo deve ser todo o grupo.
√
Exemplo 19.19. Seja f = x4 − 5 ∈ Q[x] e K = Q(Rx4 −5 ) = Q[ 4 5, i].
Considere o diagrama de corpos
√
Q[ 4 5, i] = Q[Rf ]
/ \
√
Q[ 4 5] Q[i]
\ /
Q
√
Note que [Q[ 5] : Q] = 4, pois x4 − 5 é irredutı́vem em Q[x] pelo critério de
4
Eisenstein para p = 5, [Q[i] : Q] = 2, pois x2 + 1 é irredutı́vel em Q[x], suas raı́zes

√
são ±i, assim, uma vez que Q[ 4 5] ⊂ R, temos que x2 + 1 é também irredutı́vel
√
sobre Q[ 4 5][x], portanto [K : Q] = 8 = # Gal(K/Q). Um grupo de ordem 8
gerado por 2 elementos σ de ordem 4 e τ de ordem 2 tal que
τ σ = σ3τ
é isomorfo ao grupo diedral de ordem 4, D4 que é dado explicitamente por
{id, σ, σ 2 , σ 3 , τ, στ, σ 2 τ, σ 3 τ }.
Vamos mostrar que este é o grupo de Galois G = Gal(K/Q).
√ √ 2 √ 3 √ √ 2 √ 3
Como 1, 4 5, 4 5 , 4 5 , i, 4 5i, 4 5 i, 4 5 i formam uma base de K como Q-
√
espaço vetorial, para obter um elemento de G basta cálculá-lo em 4 5 e i. Ob-
√ √ √
servemos que dado ϕ ∈ G, ϕ( 4 5) ∈ {± 4 5, ± 4 5i} e ϕ(i) ∈ {±i}.
Definimos σ por
√
4
√4
σ( 5) := 5i e σ(i) := i e
√
4
√4
τ por τ ( 5) := 5 e τ (i) := −i.
√ √
Observemos que σ e τ satisfazem à condição acima. De fato, σ 2 ( 4 5) = σ( 4 5i) =
√ √ √ √ √ √
− 4 5 e σ 2 (i) = i; σ 3 ( 4 5) = σ(− 4 5) = − 4 5i e σ 3 (i) = i; σ 4 ( 4 5) = σ(− 4 5i) =
√ √ √ √ √ √
4
5 e σ 4 (i) = i; τ 2 ( 4 5) = 4 5 e τ 2 (i) = τ (−i) = i; τ σ( 4 5) = τ ( 4 5i) = − 4 5i e
√ √ √
τ σ(i) = τ (i) = −i; σ 3 τ ( 4 5) = σ 3 ( 4 5) = − 4 5i e σ 3 τ (i) = σ 3 (−i) = −i.
Finalmente, o subgrupo de Aut(Q[Rf ]/Q) gerado por σ e τ tem ordem 8,
logo é todo o grupo.
CAPı́TULO 20
Teoria de Galois
20.1. Correspondência de Galois

Definição 20.2. Seja N/K uma extensão finita, G = Aut(N/K), K o con-
junto dos subcorpos L de N contendo K e G o conjunto dos subgrupos H de G.
Definimos duas funções:
γ : K → G dada por γ(L) := Aut(N/L) e

κ : G → K dada por κ(H) := N H := {α ∈ N | τ (α) = α para todo τ ∈ H}.
Verifiquemos que N H é de fato um subcorpo de N , é claro que K ⊂ N H . De

fato, como τ é um homomorfismo temos que τ (α + β) = τ (α) + τ (β) = α + β.
O mesmo vale para o produto. Além disto, τ (α−1 ) = τ (α)−1 = α−1 . O par de
funções {γ, κ} é chamado uma conexão de Galois.
Este par satisfaz às seguintes propriedades.
Proposição 20.3. (1) Se L1 ⊂ L2 , então γ(L1 ) ⊃ γ(L2 ).

(2) Se H1 ⊂ H2 , então κ(H1 ) ⊃ κ(H2 ).
(3) L ⊂ κ ◦ γ(L).
(4) H ⊂ γ ◦ κ(H).
Além disto, denotando por K∗ a imagem de κ e G ∗ a imagem de γ
temos também as seguintes propriedades.
(5) L ∈ K∗ se e somente se L = κ ◦ γ(L).
(6) H ∈ G ∗ se e somente se H = γ ◦ κ(H). Como conseqüência destes
últimos 2 itens temos imediatamente que
(7) γ ◦ κ ◦ γ = γ.
(8) κ ◦ γ ◦ κ = κ. Em particular, {γ, κ} induzem uma bijeção entre os
conjuntos K∗ e γ ∗ .
Demonstração. (1) Seja τ ∈ γ(L2 ), então para todo α ∈ L2 , τ α = α,

em particular o mesmo vale para todo α ∈ L1 , logo τ ∈ γ(L1 ).
183
184 20. TEORIA DE GALOIS
(2) Seja α ∈ κ(H2 ), logo para todo τ ∈ H2 , τ α = α, em particular o mesmo

vale para todo τ ∈ H1 , logo α ∈ κ(H1 ).
(3) É claro que para todo α ∈ L e para todo τ ∈ Aut(N/L) temos τ α = α,
assim α ∈ κ ◦ γ(L).
(4) É claro que para todo τ ∈ H e α ∈ κ(H) temos que τ α = α, portanto,
τ ∈ γ ◦ κ(H).
(5) É claro que se L = κ ◦ γ(L), então L ∈ K∗ . Por outro lado, se L ∈ K∗ ,
digamos L = κ(H), então, como H ⊂ γ ◦ κ(H), temos que L = κ(H) ⊃
κ ◦ γ ◦ κ(H) = κ ◦ γ(L).
(6) É claro que se H = γ ◦ κ(H), então H ∈ G ∗ . Por outro lado, se H ∈ G ∗ ,
digamos H = γ(L), então, como L ⊂ κ ◦ γ(L), temos que H = γ(L) ⊃
γ ◦ κ ◦ γ(L) = γ ◦ κ(H).

Definição 20.4. Dizemos que a restrição de uma conexão de Galois {γ, κ}

aos conjuntos K∗ e G ∗ é uma correspondência de Galois. Uma extensão finita
L/K é dita galoisiana se for separável e normal.
Teorema 20.5 (teorema de Artin). Dado H ∈ G temos que N/N H é galoi-

siana, [N : N H ] = #H e H = Aut(N/N H ) = γ ◦ κ(H).
Demonstração. Seja α ∈ N e Cα = {τ α | τ ∈ H} o conjunto dos elementos

H-conjugados a α. Note que #Cα ≤ |H|. Seja
Y
fα := (x − β).
β∈Cα
Observemos que para todo τ ∈ H, τ|Cα é uma permutação de Cα (uma vez que τ
é injetivo, Cα é finito e τ (Cα ) ⊂ Cα ). Portanto, fα ∈ N H [x]. Por construção fα é
separável, portanto α é separável sobre N H .
Assim, para provar que N/N H é normal, basta mostrar que
# Aut(N/N H ) = [N : N H ].
Inicialmente, como H ⊂ Aut(N/N H ) temos que
#H ≤ | Aut(N/N H )| ≤ [N : N H ].
Para provar a desigualdade oposta, observe que como N/N H é finita e separável,
pelo teorema do elemento primitivo, existe α ∈ N tal que N = N H (α). Mas
20.1. CORRESPONDÊNCIA DE GALOIS 185
neste caso,
[N : N H ] = grau(Pα|N H ) ≤ grau(fα ) ≤ |H|.
Portanto,
[N : N H ] = |H| = | Aut(N/N H )| e H = γ ◦ κ(H),
pois o primeiro é subgrupo do segundo e ambos têm a mesma ordem.
Proposição 20.6. Seja L ∈ K. Então L ∈ K∗ se e somente se N/L for

galoisiana.
Demonstração. Se L ∈ K∗ , o teorema de Artin garante que N/L é galoi-

siana. Reciprocamente, suponha que N/L seja galoisisana. Logo | Aut(N/L)| =
[N : L]. Por outro lado, L ⊂ κ ◦ γ(L) ⊂ N e pelo teorema de Artin,
[N : κ ◦ γ(L)] = [N : N Aut(N/L) ] = | Aut(N/L)| = [N : L],
portanto L = κ ◦ γ(L) ∈ K∗ .
Teorema 20.7 (teorema fundamental da teoria de Galois). Seja N/K uma

extensão galoisiana finita. Então {γ, κ} define uma correspondência de Galois
entre K e G.
Demonstração. Já provamos anteriormente que se N/K for galoisiana então

N/L também o será para todo L ∈ K (ver capı́tulos de extensões separáveis e
normais). Assim, pela proposição anterior, κ ◦ γ(L) = L. Por outro lado, pelo
teorema de Artin, γ ◦ κ(H) = H.
Calculemos alguns exemplos concretos da correspondência de Galois.
Exemplo 20.8. Seja K = Q, N = Q[Rx3 −2 ]. Já provamos anteriormente

√
que N = Q[ 3 2, ζ], onde ζ = e2πi/3 , [N : Q] = 6 e G = Aut(N/Q) = S3 =
√
{id, σ, σ 2 , τ, στ, σ 2 τ } com o(σ) = 3, o(τ ) = 2 e τ σ = σ 2 τ . Além disto, σ( 3 2) =
√ √ √
3
2ζ, σ(ζ) = ζ, τ ( 3 2) = 3 2 e τ (ζ) = ζ 2 .
Note que N ⊂ N {id} ⊂ N , logo N {id} = N . Também Q ⊂ N G ⊂ N e pela
teoria de Galois [N : N G ] = #G = 6, logo Q = N G .
Seja H1 = hαi = {id, σ, σ 2 }. Observe que Q[ζ] ⊂ N H1 ⊂ N e que [N : N H1 ] =
#H1 = 3. Como [Q[ζ] : Q] = 2, concluimos que Q[ζ] = N H1 .
√
Seja H2 = hτ i = {id, τ }. Então Q[ 3 2] ⊂ N H2 ⊂ N , [N : N H2 ] = #H2 = 2.
√ √
Como [Q[ 3 2] : Q] = 3, segue que Q[ 3 2] = N H2 .
√ √ √
Seja H3 = hστ i. Observe que στ ( 3 2) = 3 2ζ, στ (ζ) = ζ 2 , logo στ ( 3 2ζ) =
√ √ √ √ √ √
3
2ζζ 2 = 3 2. Portanto, στ ( 3 2(1+ζ)) = 3 2(1+ζ) = − 3 2ζ 2 . Assim, Q[ 3 2ζ 2 ] ⊂
√
N H3 ⊂ N . Como 3 2ζ 2 é raiz de x3 − 2 e este é irredutı́vel sobre Q, segue que
√ √
[Q[ 3 2ζ 2 ] : Q] = 3. Como [N : N H3 ] = #H3 = 2, concluimos que Q[ 3 2ζ 2 ] =
N H3 .
√ √
Seja H4 = hσ 2 τ i. Observe que σ 2 τ ( 3 2) = 3 2ζ 2 e σ 2 τ (ζ) = ζ 2 , logo
√
σ 2 τ ( 3 2ζ 2 )
√ √ √ √ √
= 3 2ζ 2 ζ = 3 2, portanto σ 2 τ ( 3 2(1 + ζ 2 )) = 3 2(1 + ζ 2 ) = − 3 2ζ. Assim,
√ √
Q[ 3 2ζ] ⊂ N H4 ⊂ N , [N : N H4 ] = #H4 = 2 e [Q[ 3 2ζ] : Q] = 3, portanto
√
Q[ 3 2ζ] = N H4 .
Exemplo 20.9. Seja K = Q, N = Q[Rx4 −3 ]. Já provamos anteriormente que

√
N = Q( 4 3, i), [N : Q] = 8 e G = Aut(N/Q) = D4 = {id, σ, σ 2 , σ 3 , τ, στ, σ 2 τ, σ 3 τ }
√ √
com o(σ) = 4, o(τ ) = 2 e τ σ = σ 3 τ . Além disto, σ( 4 3) = 4 3i, σ(i) = i,
√ √
τ ( 4 3) = 4 3 e τ (i) = −i.
N ⊂ N {id} ⊂ N , N = N {id} .
Q ⊂ N G ⊂ N , [N : N G ] = #G = 8, Q = N G .
H1 = hσi, Q[i] ⊂ N H1 ⊂ N , [N : N H1 ] = #H1 = 4, [Q[i] : Q] = 2,
Q[i] = N H1 .
√ √ √ √ √ √
H2 = hσ 2 i, σ 2 ( 4 3) = − 4 3, σ 2 (i) = i, σ 2 ( 3i) = σ 2 ( 4 3)2 i = 3i, Q[ 3i] ⊂
√ √
N H2 ⊂ N , [N : N H2 ] = #H2 = 2, [Q[ 3i] : Q] = 4 já que 3i é raiz de x4 + 3
√
irredutı́vel sobre Q, Q[ 3i] = N H2 .
√ √
H3 = hτ i, Q[ 4 3] ⊂ N H3 ⊂ N , [N : N H3 ] = #H3 = 4, [Q[ 4 3] : Q] = 4,
√
Q[ 4 3] = N H3 .
√ √ √ √ √
H4 = hστ i, στ ( 4 3) = 4 3i, στ (i) = −i, στ ( 4 3i) = 4 3, στ ( 4 3(1 + i)) =
√ √
4
3(1 + i), 4 3(1 + i) é raiz de x4 + 12, pelo critério de Eisenstein para p = 3,
√ √
este polinômio é irredutı́vel sobre Q, logo [Q[ 4 3(1 + i)] : Q] = 4, Q[ 4 3(1 + i)] ⊂
√
N H4 ⊂ N , [N : N H4 ] = #H4 = 2, Q( 4 3(1 + i)) = N N4 .
√ √ √ √ √
H5 = hσ 2 τ i, σ 2 τ ( 4 3) = − 4 3, σ 2 τ (i) = −i, σ 2 τ ( 4 3i) = 4 3i, Q[ 4 3i] ⊂
√
N H5 ⊂ N , [N : N H5 ] = #H5 = 2, [Q[ 4 3i] : Q] = 4, já que é raiz de x4 − 3,
√
Q[ 4 3i] = N H5 .
√ √ √ √ √
H6 = hσ 3 τ i, σ 3 τ ( 4 3) = − 4 3i, σ 3 τ (i) = −i, σ 3 τ ( 4 3i) = − 4 3, σ 3 τ ( 4 3(1 −
√ √ √ √
i)) 4 3(1 − i), 4 3(1 − i) é raiz de x4 + 12, [Q[ 4 3(1 − i)] : Q] = 4, Q[ 4 3(1 − i)] ⊂
N H6 ⊂ N , [N : N H6 ] = #H6 = 2.
Finalmente, fica como exercı́cio calcular os corpos fixos dos seguintes subgru-
pos de G : hσ 2 , τ i e hσ 2 , στ . Ambos têm ordem 4, e esgotam a correspondência
de Galois.
20.10. EXTENSÕES E SUBGRUPOS NORMAIS 187
20.10. Extensões e subgrupos normais

Proposição 20.11. Seja N/K galoisiana finita, L ∈ K e H ∈ G. Então
−1
σ Aut(N/L)σ −1 = Aut(N/σ(L)) e N σHσ = σ(N H ).
Demonstração. Como N/K é galoisiana L = N Aut(N/L) . Seja τ ∈ Aut(N/L)

e α ∈ N , então στ σ −1 (σα) = στ α = σα, i.e., στ σ −1 ∈ Aut(N/σ(L)). Recipro-
camente, se τ ∈ Aut(N/σ(L)) e α ∈ N , então τ σα = σα, i.e., σ −1 τ σα = α, i.e.,
σ −1 τ σ ∈ Aut(N/L), i.e., τ ∈ σ Aut(N/L)σ −1 .
−1
Seja α ∈ N σHσ e τ ∈ H, então στ σ −1 α = α, i.e., τ σ −1 α = σ −1 α, i.e.,
σ −1 α ∈ N H , i.e., α ∈ σ(N H ). Reciprocamente, se α ∈ N H e τ ∈ H, então
−1
στ σ −1 (σα) = στ α = σα, i.e., σα ∈ N σHσ .
Teorema 20.12. Seja N/K galoisiana finita e L ∈ K. Então L/K é normal

(logo galoisiana) se e somente se Aut(N/L) C Aut(N/K). Neste caso
Aut(N/K)/ Aut(N/L) ∼
= Aut(L/K).
Demonstração. Suponha que L/K seja normal. Dado σ ∈ Aut(N/L) e

Ω ⊃ N algebricamente fechado, então σ|L : L → N ⊂ Ω é um K-homomorfismo
(já que L ⊃ K), portanto σ(L) = L e σ|L ∈ Aut(L/K). Neste caso, pela
proposição anterior,
σ Aut(N/L)σ −1 = Aut(N/σ(L)) = Aut(N/L), i.e., Aut(N/L) C Aut(N/K).
Reciprocamente, se Aut(N/L) C Aut(N/K), então
Aut(N/σ(L)) = σ Aut(N/L)σ −1 = Aut(N/L).
Pela correspondência de Galois L = σ(L). Seja λ : L → Ω um K-homomorfismo.
Como N/L é finita (logo algébrica), existe ν : N → Ω um K-homomorfismo tal
que ν|L = λ. Como N/K é normal, ν ∈ Aut(N/K), pelo que foi feito acima,
ν(L) = λ(L) = L, i.e., λ ∈ Aut(L/K).
Suponhamos que L/K seja normal. A função ϕ : Aut(N/K) → Aut(L/K)
definida por σ 7→ σ|L é um homomorfismo de grupos. Este homomorfismo é
sobrejetivo, pois dado τ ∈ Aut(L/K), o processo acima produz σ ∈ Aut(N/K) tal
que σ|L = τ . Além disto, σ ∈ N (ϕ) se e somente se σ|L = id, i.e., σ ∈ Aut(N/L).
Finalmente a última afirmativa segue do teorema dos homomorfismos.
Definição 20.13. Sejam K, L subcorpos de Ω. Definimos o compositum KL

de k e L em Ω como sendo o menor subcorpo de Ω contendo K e L.
Lema 20.14. Sejam K, L subcorpos de Ω e

f (α1 , · · · , αm )
K[L] := | f eg
g(β1 , · · · , βn )
têm coeficientes em K e α1 , · · · , αm , β1 , · · · , βn ∈ L} .
Então KL = K[L].
Demonstração. Observemos inicialmente que por construção K[l] é um

subcorpo de Ω. Além disto contem K (tome denominador igual a 1 e numerador
igual a uma função constante) e L (tome denominador igual a 1 e numerador
igual a variável α1 ). Seja N ⊂ Ω um subcorpo contendo K e L. Então ne-
cessariamente conterá qualquer fração f (α1 , · · · , αm )/g(β1 , · · · , βn ) como acima.
Portanto, KL = K[L].
Proposição 20.15. Seja N/K galoisiana finita, K 0 /K finita e Ω ⊃ N, K 0

um corpo algebricamente fechado. Então K 0 N/K 0 é galoisiana finita e
ϕ : Aut(K 0 N/K 0 ) → Aut(N/K 0 ∩ N )
dada por σ 7→ σ|N é um isomorfismo de grupos. Em particular, [K 0 N : K 0 ] =

[N : K 0 ∩ N ].
Demonstração. Como N/K é finita, então existem α1 , · · · , αr ∈ N tais

que N = K[α1 , · · · , αr ]. Logo K 0 N = K 0 [α1 , · · · , αr ] e como cada αi é algébrico
sobre K (logo sobre K 0 ) concluimos que K 0 N/K 0 é finita. Além disto cada αi
é separável sobre K, assim Pαi |K é separável. Mas Pαi |K 0 | Pαi |K , logo Pαi |K 0
também é separável, em particular αi é separável sobre K 0 e K 0 N/K 0 é separável.
Seja σ : K 0 N → Ω um K 0 -homomorfismo, onde Ω ⊃ K 0 é algebricamente
fechado. Logo σ|N : N → Ω é um K-homorfismo. Como N/K é normal, então σ ∈
Aut(N/K) e σ(αi ) ∈ N para todo i. Como σ|K 0 = id, concluimos que σ(K 0 N ) ⊂
K 0 N . Por outro lado, para todo z ∈ K 0 N , z = f (α1 , · · · , αr ) com coeficientes em
K 0 , e como αi = σβi para algum βi ∈ N , concluimos que z = σ(f (β1 , · · · , βr )),
portanto σ(K 0 N ) = K 0 N , σ ∈ Aut(K 0 N/K 0 ) e K 0 N/K 0 é normal.
Observe que ϕ está bem definita e é injetiva. Seja σ ∈ Aut(N/K 0 ∩ N ).
Como K ⊂ K 0 ∩ N , então σ ∈ Aut(N/K). Seja H a imagem de ϕ. Basta
mostrar que κ(H) ⊂ K 0 ∩ N . De fato, neste caso, H = γ ◦ κ(H) ⊃ γ(K 0 ∩ N ) =
Aut(N/K 0 ∩ N ) ⊃ H. Seja α ∈ κ(H) = N H e τ ∈ H. Basta mostrar que α ∈ K 0 ,
pois automaticamente α ∈ N . Existe σ ∈ Aut(K 0 N/K 0 ) tal que σ|N = τ . Assim,
20.18. COEFICIENTES E RAÍZES 189
0 0
para todo σ ∈ Aut(K 0 N/K 0 ), σα = α, i.e., α ∈ N Aut(K N/K ) = K 0 , pois K 0 N/K 0
é galoisiana.
Corolário 20.16. Seja N/K uma extensão galoisiana finita com K ⊂ R,

N ⊂ C e N 6⊂ R. Então [N : N ∩ R] = 2 e [N : K] é par.
Demonstração. Observe que RN = C e [N : (N ∩ R)] = [C : R] = 2 e

aplique a proposição.
Corolário 20.17. Seja N/K uma extensão galoisiana finita. Seja N (x1 , · · · ,
xn ) o corpo de frações do anel de polinômio N [x1 , · · · , xn ] em n variáveis com
coeficientes em N . Então N (x1 , · · · , xn )/K(x1 , · · · , xn ) é galoisiana com grupo
de Galois isomorfo a Aut(N/K).
Demonstração. Basta observar que N K(x1 , · · · , xn ) = N (x1 , · · · , xn ) e

aplicar a proposição anterior.
20.18. Coeficientes e raı́zes

Para todo n ≥ 1 inteiro seja Sn o grupo das permutações de n elementos.
Para todo conjunto finito S denotamos por Perm(S) o grupo das permutações de
S.
Proposição 20.19. Seja f ∈ K[x] irredutı́vel, mônico, separável de grau n

e N = K(Rf ). Então
(a) para todo σ ∈ Aut(N/K), σ|Rf ∈ Perm(Rf ) = Sn .
(b) A função ϕ : Aut(N/K) → Sn dada por σ 7→ σRf é um homomorfismo
injetivo de grupos.
Demonstração. Observemos que #Rf = n e que σ|Rf é injetiva. Assim

(1) segue. É claro que ϕ é um homomorfismo de grupos. Observemos que se
ϕ|Rf = id, então ϕ = id, pois N = K(Rf ).
O ı́tem (b) é um caso particular do seguinte teorema de Cayley (ver capı́tulo

sobre teoremas de Sylow).
Definição 20.20. A imagem de ϕ é chamado o grupo de Galois de f com

respeito a K e denotado por Gal(f, K).
Observação 20.21. Quando K = Q, o problema de Galois era caracterizar

em termos de propriedades de Gal(f, Q) quando as raı́zes de f seriam expressas
da forma radical. Isto equivale a Gal(f, Q) ser um grupo solúvel. Retornaremos
a este ponto no capı́tulo de solubilidade por radicais.
Existe uma situação em que o grupo de Galois Gal(f, K) é todo o grupo Sn .

Para isto utilizaremos o seguinte lema (ver [?, p. 106]).
Lema 20.22. Seja p > 2 um número primo e H um subgrupo do grupo Sp de

permutações de p elementos. Suponha que H contenha uma transposição (ele-
mento de ordem 2) e um elemento de ordem p. Então H = Sp .
Teorema 20.23. Seja f ∈ Q[x] irredutı́vel mônico de grau primo p > 2.

Suponha que f possua exatamente p − 2 raı́zes reais. Então Gal(f, Q) = Sp .
Demonstração. A conjugação complexa τ restrita a N = Q[Rf ] nos dá um

Q-homomorfismo η : N → C. Mas como N/Q é normal, então η ∈ Aut(N/Q).
Por hipótese η fixa as p − 2 raı́zes reais e necessariamente permuta as duas raı́zes
complexas conjugadas restantes. Portanto η tem ordem 2. A fortiori, sua imagem,
também denotada por η em Gal(f, Q) também tem ordem 2.
Seja α ∈ Rf . Logo [Q[α] : Q] = grau(f ) | [N : Q] = # Gal(N/Q), uma vez
que N/Q é galoisiana. Pelo primeiro teorema de Sylow, existe θ ∈ Gal(N/Q) de
ordem p. A fortiori, sua imagem, também denotada por θ em Gal(f, Q) também
tem ordem p. Assim, o teorema segue do lema.
CAPı́TULO 21
Extensões ciclotômicas
Seja K um subcorpo de um corpo algebricamente fechado Ω. Para todo n ≥ 1,

consideremos o subgrupo
Wn := Wn (Ω) := {z ∈ Ω | z n = 1}
de Ω∗ , dito grupo das raı́zes n-ésimas da unidade. Observemos que este grupo é
finito de ordem no máximo n. Pelo lema 18.19 temos que Wn é um grupo cı́clico
cuja ordem coincide com o seu expoente. Além disto, #Wn = n se somente se
p = car(Ω) - n. De fato, #Wn = n se e somente se polinômio xn − 1 ∈ Ω[x] é
separável, o que ocorre se e somente se car(Ω) = 0 ou p com p - n. Note por
exemplo que Wp = {1}, se car(Ω) = p.
A partir de agora suporemos sempre que car(Ω) = 0 ou p com p - n. Seja
Wn (K) := Wn ∩ K.
Este conjunto é um subgrupo cı́clico de Wn e de K ∗ . Este subgrupo depende

diretamente de K e n. Por exemplo, se K = Q, Ω = C e n = 6, temos que
W6 = {1, ζ, · · · , ζ 5 }, onde ζ = e2πi/6 , mas W6 (Q) = {±1}. Se n = 5, então
Wn = {1, η, · · · , η 4 }, onde η = e2πi/5 , mas W5 (Q) = {1}. Assim, Wn (K) depende
de n e de K. Por outro lado, se n é par (resp. ı́mpar), então Wn (Q) = {±1}
(resp. Wn (Q) = {1}).
Seja ζ um gerador de Wn . Existe um isomorfismo canônico
Wn ∼
= Z/nZ dado por ζ i 7→ i.
Lembremos que os geradores de Z/nZ são exatamente as classes
a tais que mdc(a, n) = 1,
i.e., são os elementos de (Z/nZ)∗ . A pré-imagem destes geradores pelo isomor-

fismo anterior é o conjunto Pn de geradores de Wn . Tal conjunto é chamado o
conjunto das raı́zes primitivas n-ésimas da unidade. Observe também que pelo
teorema de Lagrange para todo ϑ ∈ Wn temos o(ϑ) = d | n. Assim, podemos
191
192 21. EXTENSÕES CICLOTÔMICAS
escrever
[
(21.0.1) Wn = Pd .
d|n
Como anteriormente definimos

Pn (K) := Pn ∩ K.
Assim, Wn (K) é cı́clico de ordem n se e somente se Pn (K) 6= ∅.
Definição 21.1. Dizemos que Ln := K[Rxn −1 ] é a n-ésima extensão ci-

clotômica de K contida em Ω. Quando K = Q, Ln é dito o n-ésimo corpo
ciclotômico.
Teorema 21.2. A extensão Ln /K é galoisiana finita, Aut(Ln /K) é um grupo

abeliano isomorfo a um subgrupo de (Z/nZ)∗ . Em particular, [Ln : K] | φ(n).
Além disto, Ln = K(ζ) para algum gerador ζ de Wn (Ln ).
Demonstração. Esta extensão é finita, pois é finitamente gerada por ele-

mentos algébricos sobre K, as raı́zes de xn − 1. É claro que Ln /K é normal,
pois Ln é o corpo de decomposição de xn − 1 sobre K. Também é claro que
Ln /K é separável, pois xn − 1 é separável (lembre que p - n, se p > 0). Seja ζ
um gerador de Wn (Ln ) = Wn . Então σ ∈ Aut(Ln /K) se e somente se σ(ζ) for
também um gerador de Wn , o que ocorre se e somente se σ(ζ) = ζ aσ para algum
aσ ∈ {0, · · · , n − 1} tal que mdc(aσ , n) = 1. Isto induz a seguinte função
ϕ : Aut(Ln /K) → (Z/nZ)∗
definida por σ 7→ aσ . Esta função é um homomorfismo injetivo de grupos. De
fato, por um lado ϕ(στ ) = aστ . Por outro lado, στ (ζ) = σ(ζ aτ ) = σ(ζ)aτ = ζ aσ aτ ,
portanto aστ = aσ aτ , a fortiori, ϕ(στ ) = ϕ(σ)ϕ(τ ) e ϕ é um homomorfismo de
grupos. Além disto, σ ∈ N (ϕ) se e somente se aσ = 1, o que ocorre se e somente
se σ = id.
Corolário 21.3. [Ln : K] = φ(n) se e somente se Aut(Ln /K) ∼

= (Z/nZ)∗ .
Verificaremos que a condição do corolário é satisfeita se K = Q. Para isto

precisamos do seguinte lema elementar cuja demonstração deixamos a cargo do
leitor.
Lema 21.4. Sejam f, g ∈ Q[x] tais que f g ∈ Z[x], então f, g ∈ Z[x].

21. EXTENSÕES CICLOTÔMICAS 193
Teorema 21.5. Seja ζ um gerador de Wn ⊂ C∗ . Então [Q(ζ) : Q] = φ(n).
Demonstração. Seja p um número primo tal que p - n. Afirmamos que

Pζ|Q = Pζ p |Q . Suponha que Pζ|Q 6= Pζ p |Q . Seja
κp : Z → Fp , a 7→ a
o homomorfismo quociente. Este induz um homomorfismo sobrejetivo κ∗p : Z[x] →
Fp [x] dado por
X X
ai xi 7→ ai x i .
i
Observe que ζ ∈ Rxn −1 , logo Pζ|Q e Pζ p |Q dividem xn −1. Ou seja, existe h ∈ Q[x]
p
tal que
xn − 1 = hPζ|Q Pζ p |Q .
Pelo lema anterior concluimos que h, Pζ|Q , Pζ p |Q ∈ Z[x]. Em particular,
xn − 1 = κ∗p (h)κ∗p (Pζ|Q )κ∗p (Pζ p |Q ).
Observe que ζ é raiz de Pζ p |Q (xp ), logo
Pζ p |Q (xp ) = h1 (x)Pζ|Q (x),
para algum h1 ∈ Z[x], onde novamente utilizamos pelo lema anterior. Portanto,
κ∗p (Pζ p |Q (xp )) = κ∗p (Pζ p |Q )(x)p = κ∗p (h1 )(x)κ∗p (Pζ|Q )(x).
Mas κ∗p (Pζ|Q ) e κ∗p (Pζ p |Q ) são irredutı́veis mônicos. Logo κ∗p (Pζ|Q ) = κ∗p (Pζ p |Q ).
Em particular, xn − 1 possui fator múltiplo. Mas este polinômio é separável, pois
p - n. Concluimos assim que
(21.5.1) Pζ|Q = Pζp |Q .
Seja η ∈ Pn , então η = ζ a , onde a = p1 · · · pr , onde pi é primo e pi - n.
Aplicando sucessivamente (21.5.1) concluimos que
Pη|Q = Pζ|Q .
Logo
#RPζ|Q ≥ #Pn = φ(n).
Por outro lado,
#RPζ|Q = grau(Pζ|Q ) = [Q(ζ) : Q] ≤ φ(n),
onde a última desigualdade segue do teorema anterior.
Definição 21.6. Denotamos por
Φn := Pζ|Q
o n-ésimo polinômio ciclotômico.
Segue de (21.0.1) e da prova do teorema anterior que

Y
xn − 1 = Φd .
d|n
Esta última igualdade permite recuperar indutivamente os polinômios ciclotômicos,

por exemplo, a partir de Φp para p um número primo.
O grupo de Galois de extensões ciclotômicas, mesmo sobre os racionais, é
sempre abeliano, mas raramente é cı́clico. Lembre por exemplo que (Z/nZ)∗ é
cı́clico se n for 2, 4, p número primo ou 2p. Entretanto, quando substituimos Q
pelo corpo finito Fp de p elementos, para um número primo p, o que obtemos é
sempre um grupo cı́clico como explicaremos a seguir.
Observação 21.7. Note também que todo corpo finito Fq de q = pn elemen-

tos dá origem a uma extensão ciclotômica Fq /Fp de corpos finitos é necessaria-
mente uma extensão ciclotômica, pois Fpn \ {0} é exatamente Wpn −1 .
Extensões finitas de Q são ditas corpos de números. Podemos naturalmente
constuir uma torre de extensões ciclotômicas
Q ⊂ Q[ζp ] ⊂ Q[ζp2 ] ⊂ · · · ⊂ Qp∞
chamada uma torre p-ádica. O estudo deste tipo de torre foi feito por K. Iwasawa
e este associa a cada torre uma série p-ádica intimamente ligada à função analı́tica
p-ádica de Kubota e Leopoldt a qual interpola L-funções de Dirichlet nos inteiros
negativos.
Por outro lado é possı́vel construir torres semelhantes quando substituimos Q
pelo corpo de funções racionais Fp (x). Neste caso entretanto dois tipos de ciclo-
tomia aparecem, emergindo um fenômeno distinto do caso de corpos de números.
De um lado as extensões do tipo Fq (x)/Fp (x) por constantes, que como obser-
vamos anteriormente e utilizando a teoria de Galois são extensões ciclotômicas.
Por outro lado, o papel das raı́zes da unidade também tem como contrapartida o
que chamamos de pontos de torção de um determinado módulo devido a Carlitz.
Para mais sobre isto ver [?].
21. EXTENSÕES CICLOTÔMICAS 195
Finalmente, a teoria de extensões ciclotômicas tanto em um caso quanto

em outro são incarnações unidimensionais de um fenômeno mais amplo (mul-
tiplicação complexa) que ocorre por exemplo no contexto de variedades abelianas
e módulos de Drinfeld.
Definição 21.8. Seja Ωp um corpo algebricamente fechado contendo Fp .
Definimos em Ωp o automorfismo de Frobenius Frobp (a) = ap .
Teorema 21.9. A extensão Fq /Fp é galoisiana finita e seu grupo de Galois
Aut(Fq /Fp ) é cı́clico de ordem n gerado pela restrição (Frobp )|Fq do automorfismo
de Frobenius Frobp a Fq .
Demonstração. A primeira parte do teorema já está feita. Note que
(Frobp )nFq = id. Seja ζ um gerador de F∗q . Então o(ζ) = pn − 1. Se existisse j < n
j
tal que (Frobp )j|Fq = id, então ζ = Frobp (ζ)j = ζ p , i.e., (pn − 1) | (pj − 1), o que
é impossı́vel. Assim, o((Frobp )|Fq ) = n. Mas # Aut(Fq /Fp ) = [Fq : Fp ] = n.
Teorema 21.10. Seja η um gerador de Wn (Ωp ). Então [Fp (η) : Fp ] = o(p)
em (Z/nZ)∗ .
Demonstração. Seja m := [Fp (η) : Fp ] e f := o(p) em (Z/nZ)∗ . Neste caso
Fp (η) ∼
= Fq , onde q = pm . Além disto, o(η) = n | |F∗q | = q − 1, i.e., pm ≡ 1
(mod n), em particular pm = 1. Pelo lema chave, o(p) = f | m, a fortiori f ≤ m.
f f
Reciprocamente, como pf ≡ 1 (mod n), então η p −1 = 1, i.e., η p = η. Por
outro lado, para todo α ∈ Fp (η) temos que
m−1
X
α= ai η i ,
i=0
onde ai ∈ Fp para todo i. Pelo pequeno teorema de Fermat, api = ai para todo i,
portanto,
m−1
X pf f m−1
f
X
αp = ai η p = ai η i = α.
i=0 i=0
f −1
Em particular, tomando α um gerador de Fp (η)∗ concluimos que αp = 1, logo
pelo lema chave, o(α) = (pm − 1) | (pf − 1), em particular m ≤ f .
Definição 21.11. Analogamente, definimos Ψn := Pη|Fp .
Observação 21.12. A decomposição de
[
Wn (Ωp ) = Pd (Ωp )
d|n
e o teorema anterior implicam que

Y
xn − 1 = Ψd .
d|n
Além disto é fácil ver que Ψd = κ∗p (Φd ).

CAPı́TULO 22
Extensões cı́clicas
Seja K um subcorpo de um corpo algebricamente fechado Ω. Uma extensão

galoisiana finita L/K é cı́clica (resp. abeliana) se Aut(L/K) for cı́clico (resp.
abeliano).
Teorema 22.1 (teorema de Abel). Seja K um corpo, car(K) = p primo e

a ∈ K ∗ . As seguintes condições são equivalentes:
(1) xp − a é irredutı́vel em K[x].
(2) xp − a não possui raiz em K.
/ K p := {bp | b ∈ K}.
(3) a ∈
Demonstração. É claro que (1) implica (2) que implica (3). Suponha que
x − a seja redutı́vel em K[x] e seja α ∈ Ω tal que αp = a. Então Pα|K | (xp − a).
p
Como xp − a = (x − α)p em Ω[x] concluimos que Pα|K (x) = (x − α)l , onde

1 ≤ l ≤ p − 1. Mas se l > 1, entâo Pα|K não é separável, consequentemente existe
h ∈ K[x] tal que Pα|K (x) = h(xp ). Mas devido ao grau de Pα|K isto não é possı́vel.
Portanto, Pα|K (x) = x − α é separável e α ∈ K, em particular a ∈ K p .
Trataremos agora o caso em que car(K) = 0 ou car(K) = p e p - n. Neste

caso Pn 6= ∅, digamos ζ ∈ Pn e
Rxn −a = {ζ i α | 0 ≤ i ≤ n − 1, α ∈ Ω, αn = a}.
Analisaremos primeiro o caso em que Pn (K) 6= ∅.
Teorema 22.2. Suponhamos que Pn (K) 6= ∅ e seja L = K[Rxn −a ]. Então

L/K é galoisiana e Aut(L/K) é isomorfo a um subgrupo de Z/nZ, sendo portanto
cı́clico. Em particular, [L : K] | n e L = K[α] para qualquer α ∈ Rxn −a .
Demonstração. Como L é um corpo de decomposição, então L/K é nor-

mal. Além disto como p - n e D(xn − a) = nxn−1 concluimos que xn − a é
separável, portanto L/K é separável. Além disto para todo σ ∈ Aut(L/K),
197
198 22. EXTENSÕES CÍCLICAS
σ(α) ∈ Rxn −a , portanto existe 0 ≤ iσ < n tal que σ(α) = ζ iσ . Consideremos a

função
ϕ : Aut(L/K) → Z/nZ dada por ϕ(σ) = iσ .
Esta função é um homomorfismo injetivo de grupos (neste caso, como Z/nZ é
cı́clico, concluimos que Aut(L/K) como subgrupo também o é). De fato, dados
σ, τ ∈ Aut(L/K), então τ σ(α) = τ (ζ iσ α) = ζ iτ iσ , portanto ϕ(τ σ) = iτ iσ =
ϕ(τ )ϕ(σ). Além disto σ ∈ N (ϕ) se e somente se iσ = 0, i.e., iσ = 0, mas neste
caso σ = id.
Definição 22.3. A extensão cı́clica L = K[Rxn −a ] é dita uma extensão de

Kummer.
Observação 22.4. É possı́vel desenvolver uma teoria de extensões de Kum-

mer mesmo que Pn (K) = ∅. Para isto é necessário cohomologia galoisiana. Para
mais detalhes ver [?, chapter VI].
Nesta última situação construimos a seguinte seqüência de extensões
K[Rxn −a ] = K[ζ, α] ⊃ K[ζ] ⊂ K.
A primeira extensão é cı́clica de grau dividindo n enquanto a segunda é abeliana

de grau diviindo φ(n). Mais tarde veremos que isto pode ser traduzido em ter-
mos do grupo Aut(L/K). Ele tem a propriedade de ser um grupo solúvel. Em
particular obteremos que o polinômio xn − a = 0 é solúvel por radicais (o que é
exatamente a pergunta original de Galois para este polinômio particular.
Para provar a recı́proca do teorema anterior precisamos do teorema 90 de

Hilbert. Seja G um grupo e Hom(G, K) denota o conjunto dos homomorfismos
multiplicativos, i.e., dado σ ∈ hom(G, K), σ(xy) = σ(x)σ(y). Por abuso de
notação denotaremos ainda por Hom(G, K) o K-espaço vetorial gerado por este
conjunto.
Teorema 22.5 (teorema de Artin). Dados ϕ1 , · · · , ϕn ∈ Hom(G, K) distintos

então estes elementos são K-linearmente independentes.
Demonstração. Suponhamos que existam a1 , · · · , an ∈ K não todos nulos

tais que
a1 ϕ1 + . . . + an ϕn = 0,
22. EXTENSÕES CÍCLICAS 199
i.e., para todo y ∈ G temos que

(22.5.1) a1 ϕ1 (y) + . . . + an ϕn (y) = 0.
Após reenumeração suponhmaos que a1 , · · · , ak sejam não nulos que a n-upla
(a1 , · · · , ak , 0, · · · , 0) tenha o maior número de entradas nulas possı́veis. Seja
x ∈ G tal que ϕ1 (x) 6= ϕk (x). Então para todo y ∈ G temos que
(22.5.2) a1 ϕ1 (xy) + . . . + ak ϕk (xy) = a1 ϕ1 (x)ϕ1 (y) + . . . + ak ϕk (x)ϕk (y) = 0.
Multiplicando a (22.5.1) por ϕk (x) e subtraindo de (22.5.2) obtemos
b1 ϕ1 (y) + . . . + bk−1 ϕk−1 (y) = 0,
onde bi = ai (ϕi (y) − ϕi (x)) e b1 6= 0. Em particular
b1 ϕ1 + . . . + bk−1 ϕk−1 = 0
e esta combinação é não trivial possuindo um número de zeros maior que a
combinação que possui o maior número de zeros. Isto é uma contradição.
Corolário 22.6 (teorema de Dedekind). Sejam σ1 , · · · , σn ∈ Aut(K), então

este conjunto é K-linearmente independente.
Teorema 22.7 (teorema 90 de Hilbert). Seja L/K uma extensão cı́clica de

grau n e σ um gerador de Aut(L/K). Dado β ∈ L temos que
α
(1) NL/K (β) = 1 se e somente se existe α ∈ L tal que β = σ(α) .
(2) TL/K (α) = 0 se e somente se existe α ∈ L tal que β = α − σ(α).
Demonstração. Lembremos que como Aut(L/K) = hσi, então

n−1
Y n−1
X
i
NL/K (β) = σ (β) e TL/K (β) = σ i (β).
i=0 i=0
Em particular, NL/K (σ(β)) = NL/K (β) e TL/K (σ(β)) = TL/K (β). Se existe α ∈ L
α
tal que β = σ(α) (resp. β = α − σ(α)) então NL/K (β) = 1 (resp. TL/K (β) = 0).
Provemos as recı́procas separadamente. Suponhamos primeiro que NL/K (β) =
1. Pelo teorema de Dedekind, id, σ, · · · , σ n−1 são K-lienarmente independentes.
Consideremos a K-combinação linear não trivial
id + βσ + (βσ(β))σ 2 + . . . + (βσ(β) . . . σ n−2 (β))σ n−1 6= 0,
pois o primeiro coeficiente é não nulo. Logo existe γ ∈ L tal que
α := γ + βσ(γ) + (βσ(β))σ 2 (γ) + . . . + (βσ(β) . . . σ n−2 (β))σ n−1 (γ) 6= 0.
Qn−1
Aplicando σ dos dois lados desta igualdade de notando que i=1 σ i (β) = β −1 e
que σ n (γ) = γ concluimos que
σ(α) = σ(γ) + σ(β)σ 2 (γ) + (σ(β)σ 2 (β))σ 3 (γ) + . . . + β −1 γ

= β −1 (γ + βσ(γ) + (βσ(β))σ 2 (γ) + . . . + (βσ(β) . . . σ n−2 (β))σ n−1 (β))
= β −1 α.
Suponhamos agora que TL/K (β) = 0. Como L/K é separável existe γ ∈ L tal
que TL/K (γ) 6= 0 (ver exercı́cio no captı́tulo de extensões separáveis). Seja
1
α := (βσ(γ) + (β + σ(β))σ 2 (γ) + . . . + (β + σ(β) + . . . + σ n−2 (β))σ n−1 (γ).
TL/K (γ)
Observe que
1
σ(α) = (σ(β)σ 2 (γ)) + (σ(β) + σ 2 (β))σ 3 (γ) + . . .
TL/K (γ)
+ (σ(β) + . . . + σ n−1 (β))σ n (γ)).
Pn−1
Como σ n (γ) = γ e i=1 σ i (β) = −β concluimos que
1
α − σ(α) = (βγ + βσ(γ) + . . . + βσ n−1 (γ))
TL/K (γ)
1
= βTL/K (γ) = β.
TL/K (γ)

Teorema 22.8. Suponhamos que Pn (K) 6= ∅. Seja L/K uma extensão cı́clica
de grau n. Então existe a ∈ K ∗ tal que L = K[Rxn −a ] e L = K[α] para qualquer
α ∈ Rxn −a .
Demonstração. Seja ζ ∈ Pn (K), então NL/K (ζ) = ζ n = 1. Pelo teorema

α
90 de Hilbert existe α ∈ L tal que ζ = σ(α) , onde hσi = Aut(L/K). Em particular,
σ(α) = ζ −1 α e σ(αn ) = σ(α)n = (ζ −1 )n αn = α, i.e., a = αn ∈ K. É claro que
Rxn −a = {ζ i α | 0 ≤ i ≤ n − 1} ⊂ L, logo K[Rxn −a ] ⊂ L. Além disto Rxn −a ⊂
RPα|K , portanto xn − a = Pα|K , assim K[α] = K[Rxn −a ] e [K[α] : K] = n,
portanto L = K[α].
Proposição 22.9. Seja K um corpo de caracterı́stica p e a ∈ K. Então

x − x − a é irredutı́vel em K se e somente se não existe b ∈ K tal que bp − b = a.
p
22. EXTENSÕES CÍCLICAS 201
Demonstração. Se existe b ∈ K tal que bp − b = a, então xp − x − a

possui uma raiz em K sendo portanto redutı́vel. Reciprocamente, suponha que
f = xp − x − a seja redutı́vel em K[x]. Seja α ∈ Ω uma raiz de f , então
Pα|K | (xp − x − a). Note que
Y
Rxp −x−a = {α + i | 0 ≤ i < p} e Pα|K = (x − α − i)
i∈I
para algum subconjunto I ⊂ {0, 1, · · · , p − 1}. Portanto o coeficiente de grau

d − 1, onde 1 ≤ d = #I, é igual a dα + c com c ∈ {0, 1, · · · , p − 1}. Em particular,
como dα + c ∈ K, concluimos que dα ∈ K e como d é inversı́vel, pois p - d,
concluimos que α ∈ K, i.e., αp − α = a.
Teorema 22.10. Seja a ∈ K ∗ tal que não existe α ∈ K com αp − α = a.

Então a extensão K(Rxp −x−a )/K é cı́clica de grau p. Além disto K[Rxp −x−a ] =
K[α] para todo α ∈ Rxp −x−a .
Demonstração. Como L = K[Rxp −x−a ] é um corpo de decomposição, a

extensão L/K é nornmal. Além disto D(xp − x − a) = −1, logo L/K é separável.
As raı́zes de xp − x − a são da forma α + i para i = 0, · · · , p − 1. Portanto,
L = K[α]. Pela proposição anterior xp − x − a = Pα|K para algum α ∈ Rxp −x−a ,
portanto [L : K] = p.
Definição 22.11. Uma extensão cı́clica da forma da forma K[Rxp −x−a ]/K
em caracterı́stica p é dita uma extensão de Artin-Schreier.
Observação 22.12. É possı́vel de forma semelhante ao que foi feito acima

caracterizar extensões cı́clicas em caracterı́stica p de grau pn . Neste caso é ne-
cessário substituir α por um vetor, chamado um vetor de Witt, por isto estas
extensões são ditas de Artin-Schreier-Witt. Vetores de Witt formam um anel
que como espaço vetorial é isomorfo a K n , mas com outra soma e produto de
tal forma que seja um anel em caracterı́stica 0. Tomando seu limite projetivo
(veja capı́tulo de teoria de Galois infinita) obtemos o anel W(K) de vetores de
Witt. É um anel com um único ideal maximal pW(K) cujo quociete é isomorfo
a K. Assim pensamos que ele levanta K. Isto é similar ao fato dos anel inteiros
p-ádicos Zp levantar Fp o corpo de p elementos.
Vetores de Witt aparecem em várias partes na matemática. Para citar apenas
duas. Serre introduziu a cohomologia com coeficientes nos feixes de vetores de
Witt que pode ser vista como uma precursora da cohomologia étale. De outro
lado, curvas sobre um corpo K de caracterı́stica p podem ser “deformadas” em

curvas sobre o anel W(K).
Teorema 22.13. Seja K um corpo de caracterı́stica p e L/K uma extensão

cı́clica de grau p. Então existe a ∈ K tal que a 6= bp − b para todo b ∈ K e
L = K[Rxp −x−a ].
Demonstração. Note que TL/K (1) = p = 0. Seja σ um gerador de Aut(L/K

). Pelo teorema 90 de Hilbert existe α ∈ L tal que 1 = α−σ(α), i.e., σ(α) = α−1.
Logo para todo 0 ≤ j < p, σ j (α) = α−j, em particular para todo i = 0, · · · , p−1,
α + i é raiz de Pα|K e além disto σ(αp − α) = αp + j − (α + j) = αp − α (pelo pe-
queno teorema de Fermat). Além disto, Rxp −x−a ⊂ RPα|K , logo Pα|K | xp − x − a,
para a = αp − α ∈ K e Pα|K = xp − x − a. Em particular, L = K(Rxp −x−a ).
CAPı́TULO 23
Solubilidade por radicais
Este capı́tulo responde à questão original de Galois : quando uma equação

polinomial com coeficientes racionais tem solução na forma radical. Observe
que precisamos não só da gestalt da teoria de Galois mas também de extensões
ciclotômicas e cı́clicas bem como da noção de grupos solúveis.
Definição 23.1. Uma extensão galoisiana finita E/k é dita solúvel se e so-
mente se Aut(E/k) é um grupo solúvel. Isto equivale a dizer que existe uma
seqüência de corpos
E = E0 ⊃ E1 ⊃ E2 ⊃ · · · En = k
tal que cada extensão Ei /Ei+1 é abeliana, ou equivalentemente cı́clica de grau

primo.
Extensões solúveis satisfazem às seguintes propriedades.
Proposição 23.2. (1) Sejam k ⊂ F ⊂ E corpos tais que E/k e F/k

sejam extensões galoisianas finitas. Então E/k é solúvel se e somente
se E/F e F/k são solúveis.
(2) Suponha que E/k seja solúvel e que K/k seja uma extensão finita qual-
quer com E, K ⊂ Ω e Ω corpo, então EK/K é solúvel.
(3) Se E/k e K/k são solúveis, então EK/k é solúvel.
Demonstração. (1) Basta utilizar a proposição 12.17 e notar que basta

mostrar o resultado para os respectivos grupos de automorfismos, i.e., Aut(E/k)
é solúvel se e somente se Aut(E/F ) e Aut(F/k) ∼ = Aut(E/k)/ Aut(E/F ) são
solúveis (lembre que F/k é galoisiana se e somente se Aut(E/F ) C Aut(E/k).
(2) Segue da proposição 20.15 que EK/K é galoisiana finita. Além disto
Aut(EK/K) ∼ = Aut(E/E ∩ K) ⊂ Aut(E/k). Como Aut(E/k) é solúvel, pela
proposição 12.17 concluimos que Aut(EK/K) também é solúvel.
(3) Novamente, pela proposição 20.15, EK/k é galoisiana finita. Além disto,
pela proposição 12.17, utilizando que Aut(EK/K) e Aut(K/k) ∼ = Aut(EK/k)/
203
204 23. SOLUBILIDADE POR RADICAIS
Aut(EK/K) são solúveis, concluimos que Aut(EK/k) também o é. Portanto,

EK/k é solúvel.
Definição 23.3. Uma extensão finita separável F/k é dita solúvel por radi-
cais se existe E/k finita tal que F ⊂ E e existe uma seqüência de corpos
E = E0 ⊃ E1 ⊃ · · · ⊃ En = k
tal que cada extensão Ei /Ei+1 é de um dos 3 tipos seguintes:
(1) Ei = Ei−1 [ζ], onde ζ ∈ Rxn −1 , para algum n ≥ 1.
(2) Ei = Ei−1 [α], onde α ∈ Rxn −a , para algum n ≥ 1, se p - n, onde
p = car(k) (esta condição é vazia se car(k) = 0) e a ∈ Ei−1 .
(3) Ei = Ei−1 [α], onde α ∈ Rxp −x−a , se car(K) = p > 0 e para algum
a ∈ Ei−1 .
Extensões solúveis por radicais satisfazem as seguintes propriedades. Em
todas as propriedades abaixo suporemos que os corpos estejam todos contidos em
um corpo Ω suficientemente grande, de tal forma a podermos tomar composita
de corpos.
Proposição 23.4. (1) Sejam k ⊂ F ⊂ E corpos com E/k separável
finita. Então E/k é solúvel por radicais se e somente se E/F e F/k o
são.
(2) Suponha que E/k seja solúvel por radicais e seja K/k uma extensão
finita. Então EK/K é solúvel por radicais.
(3) Suponha que E/k e K/k sejam solúveis por radicais. Então EK/k é
solúvel por radicais.
Demonstração. (1) Suponha que F/k e E/F sejam solúveis por radicais.
Logo existem F 0 /k finita tal que F 0 ⊃ F e seqüência de corpos
F 0 = F0 ⊃ F1 ⊃ · · · ⊃ k,
na qual cada extensão Fi /Fi−1 é de um dos 3 tipos anterioes. Similarmente,
existem E 0 /F finita tal que E 0 ⊃ E e seqüência de corpos
E 0 = E0 ⊃ E1 ⊃ · · · ⊃ F,
onde cada extensão Ei /Ei−1 é de um dos 3 tipos acima. Tomando o composi-
tum da segunda seqüência com F 0 e continuando pela segunda até obtemos uma
seqüência de corpos
E 0 F 0 = E0 F 0 ⊃ E1 F 0 ⊃ · · · ⊃ F 0 ⊃ F1 ⊃ · · · ⊃ k.
23. SOLUBILIDADE POR RADICAIS 205
Finalmente, observe que Ei F 0 = Ei−1 F 0 [ζ] ou Ei−1 F 0 [α], em qualquer caso recu-
peramos um dos 3 tipos anteriores.
Suponha agora que E/k seja solúvel por radicais, ou seja existe E 0 /k finita
com E 0 ⊃ E e
E 0 = E0 ⊃ E1 ⊃ · · · ⊃ k,
com Ei = Ei−1 [α] ou Ei−1 [ζ]. Primeiro, como F ⊂ E ⊂ E 0 , segue imediatamente
que F/k é solúvel por radicais. De outro lado, como acima, tomando o composi-
tum da seqüência anterior com F concluimos também que E ⊂ E 0 ⊂ E 0 F e E/F
é solúvel por radicais.
(2) Mesmo argumento do último parágrafo, tomando agora o compositum da
seqüência com K.
(3) Segue dos 2 anteriores.
Teorema 23.5. Seja E/k uma extensão galoisiana finita. Então E/k é
solúvel por radicais se e somente se E/k é solúvel.
Demonstração. Suponha que E/k seja solúvel. Neste caso existe uma se-
qüência de corpos
E = E0 ⊃ E1 ⊃ E2 ⊃ · · · ⊃ En = k
Q
tal que cada extensão Ei /Ei+1 é cı́clica de grau primo ì . Seja m = i ì onde
fazemos o produto apenas nos números primos ì tais que ì 6= p = car(k). Seja
Ω um corpo algebricamente fechado contendo k e ζ ∈ Pm (Ω). Seja K := k[ζ].
Consideremos o compositum da seqüência de corpos acima com K,
EK = L0 ⊃ E1 K = L1 ⊃ E2 K = L2 ⊃ · · · ⊃ En K = K.
Cada extensão Li /Li+1 é galoisiana e temos que
Aut(Li /Li+1 ) = Aut(Ei K/Ei+1 K)
é isomorfo a um subgrupo de ordem > 1 de Aut(Ei /Ei+1 ). Portanto este subgrupo
é igual ao próprio Aut(Ei /Ei+1 ), o qual é cı́clico de ordem ì . Mas neste caso, por
construção existe ζ m/ì ∈ Ei−1 raiz ì -ésima da unidade, para ì 6= p. Portanto, a
extensão Li /Li+1 é uma extensão de Kummer, se ì 6= p. Caso ì = p a extensão
é automaticamente de Artin-Schreier. Portanto, cada extensão Li /Li+1 é de um
dos 3 tipos acima, i.e., EK/K é solúvel por radicais. Trivialmente, K/k é solúvel
por radicais. Do item (1) das propriedades anteriores concluimos que EK/k é
solúvel por radicais, a fortiori E/k é solúvel por radicais (novamente o item (1)
das propriedades acima, uma vez que E ⊂ EK).
206 23. SOLUBILIDADE POR RADICAIS
Reciprocamente, suponha que E/k seja solúvel por radicais. Então existe
E 0 /k finita contendo E e uma seqüência de corpos
E 0 = E0 ⊃ E1 ⊃ E2 ⊃ · · · ⊃ En = k
tal que cada Ei /Ei+1 é de um dos três tipos acima. Note que a priori a extensão
Ei /Ei−1 não é galoisiana, isto falha no caso (2) acima. Seja m o produto de todos
os números primos dividindo [E 0 : k] distintos de p = car(k) (caso p > 0). Seja
ζ ∈ Wm (Ω) uma raiz primitiva m-ésima da unidade em um corpo algebricamente
fechado Ω (como sempre supomos Ω suficientemente grande para conter todos
os corpos considerados). Seja F := k[ζ] a m-ésima extensão ciclotômica de k.
Considere agora o compositum da seqüência anterior com F dado por
E 0 F ⊃ E1 F ⊃ · · · ⊃ F.
Para cada i, seja Li := Ei F . Note que agora cada Li /Li−1 é galoisiano, pois
corrigimos o caso Kummer acrescentando um elemento ζmi , uma raiz mi -ésima
primitiva da unidade a Ei−1 , onde mi = [Ei : Ei−1 ], caso p - mi . Caso contrário
nada há a fazer. Além disto neste caso Li = Li−1 [αi ] = Li−1 [Rxmi −ai ], onde
αimi = ai . Finalmente, observe que E 0 F é o corpo de decomposição sobre k do
polinômio
Y Y
f := (xmi − ai ) × (xp − x − ai ).
i,p-mi i,mi =p
Portanto, E 0 F/k é galoisiana (já que E 0 F/F é separável, pois cada Li /Li−1 o
é, e F/k também é separável). A fortiori, E 0 F/F é solúvel. Trivialmente F/k
é solúvel. Assim, pelas propriedades de extensões solúveis, E 0 F/k é solúvel. A
fortiori, pela mesma razão, E/k é solúvel.
Definição 23.6. Dado f ∈ Q[x] irredutı́vel. Este polinômio é dito solúvel

por radicais se Q[Rf ]/Q é solúvel por radicais.
Corolário 23.7 (teorema de Galois, post-mortem). Seja f ∈ Q[x] irre-

dutı́vel. Então f é solúvel por radicais se e somente se Gal(f, K) for solúvel.
Observação 23.8. Num capı́tulo posterior abordaremos o problema inverso

de Galois, que permaence em aberto desde o século XIX. Este diz o seguinte. Dado
um grupo finito G será que existe uma extensão galoisiana finita K/Q tal que
Gal(K/Q) seja G? Veremos que a geometria, via o teorema de irredutibilidade
de Hilbert poderá nos dar informações relevantes para este problema. Um caso
23. SOLUBILIDADE POR RADICAIS 207
particular é aquele no qual o grupo G é um grupo solúvel. Nesta situação sabe-se

que existe K. Isto é devido a S̆afarevic̆ e Iwasawa. Para mais sobre isto veja [?]
Observação 23.9. Não é difı́cil provar que S4 e S3 são grupos solúveis.

Além disto, para todo polinômio irredutı́vel f ∈ Q[x] de grau n temos que
Aut(k(Rf )/k) é isomorfo a um subgrupo de Sn . Portanto, polinômios de graus
3 e 4 são sempre solúveis. Isto mostra que os algebristas árabes e italianos só
podiam mesmo achar explicitamente as raı́zes na forma radical, o que não quer
dizer que encontrar as fórmulas por eles obtidas fosse missão fácil.
Contrariamente, equações de grau 5 não são necessariamente solúveis por
radicais, uma vez que S5 não o é (veja [?]. O teorema 20.23 nos diz que polinômios
de grau primo p > 2 com exatamente 2 raı́zes reais têm grupo de Galois Sp . Assim,
basta considerar um polinômio de grau 5 com 3 raı́zes reais.
Parte 5
Tópicos adicionais
CAPı́TULO 24
O problema inverso de Galois
Problema 24.1. Seja G um grupo finito. Será que existe uma extensão
galoisiana finita K/Q tal que Gal(K/Q) = G?
Este problema permanece em aberto desde o século XIX. Entretanto refor-

mulações geométricas não só geraram análogos desta questão em outras cir-
cunstâncias, bem como trouxeram de volta resultados para o problema original.
Nossa primeira seção será justamente dedicada a mostrar que o grupo Sn de per-
mutações de n elementos sempre é grupo de Galois de uma extensão do corpo
de funções racionais K(x1 , · · · , xn ) para um corpo K qualquer. Em particular,
tomando K = Q e utilizando o teorema de irredutibilidade de Hilbert, obte-
remos que Sn é grupo de Galois sobre Q, i.e., existe K/Q galoisiana finita tal
que Sn = Gal(K/Q). Em seguida discutiremos desenvolvimentos na direção do
problema inverso para outros grupos.
24.2. Grupo Sn
Sejam Sn o grupo das permutações de n elementos, R um anel comutativo com
unidade e A = R[x1 , · · · , xn ] o anel de polinômios em n variáveis com coeficientes
em R. Para todo σ ∈ Sn e f (x1 , · · · , xn ) ∈ A definimos
σ ∗ (f (x1 , · · · , xn )) = f (xσ(1) , · · · , xσ(n) ).
Esta função é na verdade um automorfismo de A (verifique!). Dizemos que f

é simétrico se e somente se σ ∗ (f ) = f para todo σ ∈ Sn . Por exemplo, as
funções simétricas elementares s1 , · · · , sn nas variáveis x1 , · · · , xn são polinômios
simétricos (veja capı́tulo de extensões finitas). É claro que nem todo polinômio
simétrico é uma função simétrica elementar, por exemplo,
(24.2.1) x21 + . . . + x2n .
Entretanto, mostraremos que todo polinômio simétrico se escreve de forma única

como polinômio nas funções simétricas elementares. Além disto não existem
211
212 24. O PROBLEMA INVERSO DE GALOIS
relações entre estas, ou seja, são algebricamente independentes (veja capı́tulo de

teoria de transcendência).
Teorema 24.3. Seja f ∈ A simétrico. Então existe um único g ∈ R[s1 , · · · , sn ]

tal que f (x1 , · · · , xn ) = g(s1 , · · · , sn ).
Do teorema segue imediatamente o seguinte corolário.
Corolário 24.4. Não existe g ∈ R[s1 , · · · , sn ]\{0} tal que g(s1 , · · · , sn ) = 0.
Exemplo 24.5. Observe que o polinômio em (24.2.1) pode ser reescrito como
x21 + . . . + x2n = s21 − 2s2 .
Considere o polinômio
f (t) = (t − x1 ) . . . (t − xn ) = xn − s1 xn−1 + . . . + (−1)n sn ∈ A[t].
Definimos o discriminante de f (t) por

Y Y
D := (xi − xj )2 = (−1)n(n−1)/2 (xi − xj ).
1≤i<j≤n 1≤i6=j≤n
É imediato da definição que o D é um polinômio simétrico com coeficientes

inteiros. É um dos mais importantes invariantes de um polinômio. Assim, se-
gue do teorema, que podemos escrevê-lo de forma única como D(x1 , · · · , xn ) =
∆(s1 , · · · , sn ) ∈ Z[s1 , · · · , sn ]. Na prática é bastante laborioso de obter a ex-
pressão. Entretanto, se n = 2 temos
(x1 − x2 )2 = s21 − 4s2 ;
e para n = 3 temos
(x1 − x2 )2 (x1 − x3 )2 (x2 − x3 )2 =

s21 s22 − 4s32 − 4s31 s3 − 27s23 + 18s1 s2 s3 .
É importante notar que estas igualdades são identidades no anel Z[x1 , · · · , xn ].

Assim, permanecem verdadeiras se substituimos as variáveis x1 , · · · , xn por cons-
tantes. Por exemplo, se R for um corpo K e α1 , · · · , αn forem elementos algébricos
sobre K contidos em alguma extensão L de K, então
(x − α1 ) . . . (x − αn ) = xn − a1 xn−1 + . . . + an ,
24.2. GRUPO Sn 213
onde ai = si (α1 , · · · , αn ). Neste caso o discriminante do polinômio é dado por

Y
∆(a1 , · · · , an ) = (αi − αj )2 .
1≤i<j≤n
Em particular, f é separável se e somente se ∆(a1 , · · · , an ) 6= 0. Fica como

exercı́cio verificar que esta definição de discriminante coincide com a definição
anterior (capı́tulo de anéis e domı́nios). No caso do polinômio cúbico x3 − ax + b
obtemos como discriminante −(4a3 + 27b2 ).
Para a prova do teorema precisamos da noção de grau de um polinômio em

várias variáveis. Se f ∈ A, então ele pode ser escrito como
X
f (x1 , · · · , xn ) = ai1 ···in xi11 . . . xinn ,
i1 ,··· ,in
onde cada ai1 ···in pertence a R. O monômio xi11 . . . xinn tem grau i1 + . . . + in . O
grau de f é definido como sendo o maior grau dos monômios com coeficiente não
nulo. Por exemplo, o discriminante em 3 variáveis é um polinômio de grau 6.
Demonstração do teorema. Demonstraremos o teorema por indução no
número de variáveis n e no grau d de f . Comecemos com a existência. Se
n = 1, nada há a fazer, pois x1 = s1 . Suponha que o teorema seja verdade para
polinômios em n − 1 variáveis. Definimos a seguinte função
ϕ : A = R[x1 , · · · , xn ] → R[x1 , · · · , xn−1 ]
h 7→ h(x1 , · · · , xn−1 , 0).
Observe que como f é simétrico com respeito a Sn , então ϕ(f ) é simétrico em
relação a Sn−1 . Por hipótese de indução existe g 0 ∈ R[s01 , · · · , s0n−1 ] tal que
ϕ(f (x1 , · · · , xn )) = g 0 (s01 , · · · , s0n−1 ),
onde para 1 ≤ i ≤ n − 1, a função s0i denota a i-ésima função simétrica elementar
nas variáveis x1 , · · · , xn−1 . Observe que para todo 1 ≤ i ≤ n − 1 temos
ϕ(si (x1 , · · · , xn )) = s0i (x1 , · · · , xn−1 ).
Seja
p(x1 , · · · , xn ) := f (x1 , · · · , xn ) − g 0 (s01 , · · · , s0n−1 ).
Como p é diferença de polinômios simétricos (um polinômio simétrico em n − 1
variáveis é simétrico em n variáveis), concluimos que p também é simétrico. Além
disto, p(x1 , · · · , xn−1 , 0) = 0. Mas isto significa que p(x1 , · · · , xn ) é divisı́vel por
xn . Similarmente, definindo a função ϕ anulando qualquer outra das variáveis,
concluimos que para todo 1 ≤ i ≤ n o polinômio p(x1 , · · · , xn ) é divisı́vel por

cada xi , a fortiori por x1 . . . xn = sn (x1 , · · · , xn ), digamos
f (x1 , · · · , xn ) = g 0 (s01 , · · · , s0n−1 ) + sn h(x1 , · · · , xn ),
onde h ∈ A. Por construção o grau de h é inferior ao grau de f . Além disto, como

p(x1 , · · · , xn ) e sn são simétricos, concluimos que h também o é. Por indução no
grau, temos que existe q ∈ R[s1 , · · · , sn ] tal que
h(x1 , · · · , xn ) = q(s1 , · · · , sn ),
assim
f (x1 , · · · , xn ) = g 0 (s01 , · · · , s0n−1 ) + sn q(s1 , · · · , sn )
é uma expressão de f em termos de funções simétricas elementares.
A unicidade também é provada com indução em n e no grau. Considere a
função
ψ : A = R[x1 , · · · , xn ] → R[s1 , · · · , sn ]
f (x1 , · · · , xn ) 7→ f (s1 , · · · , sn ).
Esta função é um homomorfismo de anéis (verifique!). A unicidade então é

equivalente a injetividade de ψ. Suponha que f (x1 , · · · , xn ) ∈ ker(ψ), i.e.,
f (s1 , · · · , sn ) = 0. Aplicando ϕ a f (s1 , · · · , sn ) concluimos que f (s01 , · · · , s0n−1 ) =
0. Por indução no número de variáveis, concluimos que ϕ(f (x1 , · · · , xn ) =
f (x1 , · · · , xn−1 , 0) = 0. Logo xn divide f (x1 , · · · , xn ). Similarmente, redefinindo
ϕ de forma a anular qualquer outra das variáveis, temos que cada xi divide
f (x1 , · · · , xn ), a fortiori x1 . . . xn = sn (x1 , · · · , xn ) divide f (x1 , · · · , xn ), digamos
f (x1 , · · · , xn ) = sn (x1 , · · · , xn )h(x1 , · · · , xn ),
para algum h ∈ A. Neste caso, por construção, o grau de h é menor que o grau
de f . Além disto,
0 = f (s1 , · · · , sn ) = s1 . . . sn h(s1 , · · · , sn )
em R[s1 , · · · , sn ]. Concluimos portanto que h(s1 , · · · , sn ) = 0. Logo, por indução

no grau, h(x1 , · · · , xn ) = 0, em particular, f (x1 , · · · , xn ) = 0.
Suponhamos agora que R seja um corpo F . Seja F (x1 , · · · , xn ) o corpo de

frações do anel de polinômios F [x1 , · · · , xn ]. Este é dito o corpo de funções
racionais em n variáveis com coeficientes em F . Analogamente, para todo σ ∈ Sn
24.2. GRUPO Sn 215
definimos σ ∗ (f (x1 , · · · , xn )) := f (xσ(1) , · · · , xσ(n) ) e dizemos que f é simétrica se

e somente se σ ∗ (f ) = f para todo σ ∈ Sn .
Teorema 24.6. Toda função simétrica f ∈ F (x1 , · · · , xn ) pode ser escrita de

forma única como f (x1 , · · · , xn ) = g(s1 , · · · , sn ) ∈ F (s1 , · · · , sn ).
Demonstração. Suponha que

f1 (x1 , · · · , xn )
f (x1 , · · · , xn ) = ,
f2 (x1 , · · · , xn )
onde f1 , f2 ∈ A, seja simétrica. Seja
Y
G(x1 , · · · , xn ) := σ ∗ (f2 ).
σ∈Sn
Observe que G e Gf são polinômios simétricos em A. Ou seja existem únicos

h1 , h2 ∈ R[s1 , · · · , sn ] tais que G = h1 e Gf = h2 . Logo f = h2 /h1 ∈ F (s1 , · · · , sn )
e esta expressão é única pela unicidade de h1 e h2 .
Teorema 24.7. A extensão de corpos F (x1 , · · · , xn )/F (s1 , · · · , sn ) é galoisi-

ana com grupo de Galois isomorfo a Sn .
Demonstração. Seja L := F (s1 , · · · , sn ) e
f (t) := (t − x1 ) . . . (t − xn ) = tn − s1 tn−1 + . . . + (−1)n sn ∈ L[t].
Então F (x1 , · · · , xn ) = L[Rf (t) ] é o corpo de decomposição de f (t) sobre L. As-

sim, a extensão acima é normal. É também separável, pois as variáveis x1 , · · · , xn
são distintas, logo f (t) é separável. Portanto, a extensão é galoisiana. Como f (t)
tem grau n, sabemos que Gal(F (x1 , · · · , xn )/L) é isomorfo a um subgrupo de Sn
(ver capı́tulo de teoria de Galois). Por outro lado,
F (x1 , · · · , xn )Sn ⊃ L.
Isto significa que Sn ⊂ Gal(F (x1 , · · · , xn )/L). Logo Gal(F (x1 , · · · , xn )/L) ∼
=
Sn .
Para passarmos do teorema acima para um resultado sobre Q precisamos do

teorema de irredutibilidade de Hilbert (veja [?, chapter 9].
Teorema 24.8 (teorema de irredutiblidade de Hilbert). Seja L := Q(x1 , · · ·

, xn ) ⊃ R := Q[x1 , · · · , xn ] e f (t) ∈ L[t] irredutı́vel. Então existem infinitos
homomorfismos λ : R → Q tais que λ∗ (f )(t) seja irredutı́vel em Q[t].
Teorema 24.9. Existe uma extensão galoisiana finita K de Q tal que Gal(K/
Q) ∼
= Sn .
Demonstração. Pelo teorema 24.7 a extensão Q(x1 , · · · , xn )/Q(s1 , · · · , sn )

é galoisiana com grupo de Galois isomorfo a Sn . Seja α um elemento primitivo
desta extensão e Pα|M o seu polinômio mı́nimo sobre M := Q(s1 , · · · , sn ). Pelo te-
orema de irredutibilidade de Hilbert existem infinitos homomorfismos λ : R → Q
tais que λ∗ (Pα|M ) =: f seja irredutı́vel sobre Q[t]. Note que a extensão Q[Rf ]/Q é
galoisiana de grau n!. É possı́vel mostrar com argumentos geométricos que pode-
mos escolher λ de tal forma que Gal(Q[Rf ]/Q) seja ainda Sn (ver [?, proposition
2, seção 9.2]).
24.10. Grupo An
Para obter o grupo An como grupo de Galois sobre Q começamos nova-
mente com a situação genérica. Seja D = 1≤i<j≤n (xi − xj )2 o discriminante
Q
do polinômio f (t) = (t − x1 ) . . . (t − xn ) = xn − s1 xn−1 + . . . + (−1)n sn . Seja

δ := 1≤i<j≤n (xi − xj ). Observe que para todo σ ∈ Sn temos σ ∗ (δ) = ±δ. Se o
Q
sinal for positivo, dizemos que a permutação é par, senão dizemos que é ı́mpar.
É claro que δ 2 = D e δ ∈/ M := F (s1 , · · · , sn ). Assim, [M [δ] : M ] = 2. Além
disto, denotando por An o subgrupo normal de ı́ndice 2 de Sn formado pelas
permutações pares, temos que F (x1 , · · · , xn )An ⊃ M [δ]. Obtemos dessa forma o
seguinte resultado.
Teorema 24.11. A extensão F (x1 , · · · , xn )/M [δ] é galoisiana com grupo de

Galois An .
Teorema 24.12. Existe extensão galoisiana K/Q tal que Gal(K/Q) ∼

= An .
Demonstração. A prova é como no caso Sn utilizando o fato adicional que

podemos escolher λ de tal forma que λ(δ) ∈
/ Q (ver [?, seção 10.3]).
24.13. Método geral

O que está ocorrendo em ambos os casos está longe de ser uma situação
particular. Em primeiro lugar, o corpo de funções racionais F (x1 , · · · , xn ) é o
corpo de funções racionais do espaço afim An (F ) = F n como variedade algébrica.
O objetivo é primeiramente realizar um grupo finito G como grupo de Galois
sobre este corpo. Isto nem sempre pode ser obtido, é quase tão difı́cil quanto o
problema original. Entretanto, temos o seguinte resultado.
24.13. MÉTODO GERAL 217
Teorema 24.14. [?, seção 10.1] Seja G um grupo finito. Suponha que exista
uma extensão galoisiana finita L/Q(x1 , · · · , xn ) com grupo de Galois G. Então
existe uma extensão galoisiana K/Q com grupo de Galois G. Além disto, se L
é Q-regular, i.e., Q é algebricamente fechado em L, então existem uma infini-
dade de extensões linearmente disjuntas (para definição ver capı́tulo de teoria de
transcendência).
Observação 24.15. Utilizando a teoria de curvas elı́ticas é possı́vel provar

que existe uma extensão Q-regular de Q(x) com grupo de Galois PSL2 (Fp ) =
SL2 (Fp )/F∗p . Isto é devido a Shih (ver [?, seção 10.4]). Na verdade estas extensões
representam do ponto de vista geométrico recobrimentos galoisianos finitos de
curvas definidas sobre Q com um número finito de pontos de ramificação. Isto
remete a seguinte pergunta: quando um grupo finito pode ser grupo de Galois
de um tal recobrimento com um conjunto prescrito de pontos de ramificação?
Nesta generalidade a pergunta permanece em aberto, mas se considerarmos a
pergunta sobre C, ela é respondida em termos topológicos através do chamado
grupo fundamental algébrico, que neste caso é o completamento profinito do
grupo topológico (para mais sobre grupos profinitos ver capı́tulo de teoria de
Galois infinita). A reformulação desta pergunta para corpos algebricamente fe-
chados de caracterı́stica positiva, só foi respondida na década de 90 por Raynaud
e depois Harbater correspondendo a uma conjectura de Abhyankar. A resposta
é que para que um grupo G ocorra como grupo de Galois seu maior quociente
primo com p deve se realizar sobre uma curva sobre C com mesmo número de
pontos de ramificação (suposto pelo menos 1). Seu maior quociente primo com
p nada mais é que o quociente de G pelo seu quase-p-subgrupo, i.e., o subgrupo
gerado pelos seus p-subgrupos de Sylow.
Observação 24.16. Um objeto extremamente importante em aritmética e

relacionado com o problema inverso de Galois é o grupo de Galois absoluto
GQ := Gal(Q/Q), onde Q = AC (Q). O fato de um grupo finito G ser grupo
de Galois sobre Q equivale ao fato de G ser um quociente de GQ . Este tema
está intimamente relacionado a resolver problemas de mergulhos para o grupo
profinito GQ (para mais ver [?]).
CAPı́TULO 25
Teoria de Galois infinita
25.1. Limite inverso

Consideremos uma seqüência de grupos {Gn }n∈N e suponhamos que para cada
n tenhamos um homomorfismo sobrejetivo de grupos fn : Gn Gn1 . Considere-
Q
mos em n∈N Gn (onde a operação é componente a componente) o subconjunto
de uplas da forma x = (x0 , x1 , x2 , · · · ) tais que fn (xn ) = xn−1 para todo n ∈ N.
Como cada fn é um homomorfismo sobrejetivo, partindo de x1 ∈ G1 , tomando
uma pré imagem sua x2 em G2 e assim sucessivamente, formamos pelo menos
uma upla neste subconjunto que denotaremos por limn (Gn , fn ). Este conjunto é
←−
chamado o limite inverso ou limite projetivo da famı́lia {Gn , fn } que é chamada
de um sistema projetivo.
Exemplo 25.2. Seja A um grupo abeliano, p um número primo e pA : A → A

a multiplicação por p em A. Dizemos que A é p-divisı́vel , se pA for sobrejetivo.
Neste caso tomaremos o limite projetivo considerando a seqüência constante An =
A para todo n e fn = pA para todo n. O limite projetivo de (A, pA ) será denotado
por Vp (A). Consideremos o subconjunto Tp (A) de Vp (A) formado pelas uplas tais
que x1 = 0. Seja A[pn ] := ker(pnA ). Então Tp (A) = limn A[pn ]. Este é chamado
←−
o subgrupo de Tate associado ao grupo p-divisı́vel A. O exemplo mais comum
deste tipo de grupo é no contexto de variedades abelianas sobre corpos globais.
Entretanto, o exemplo mais simples, é tomar µpn o grupo das raı́zes pn -ésimas da
unidade em um corpo algebricamente fechado Ω de caracterı́stica distinta de p,
S
tomar A como µp∞ := n µpn e considerar Tp (µ) := limn µpn .
←−
Exemplo 25.3. Dado um grupo G considere uma seqüência de subgrupos Hn

de G tais que Hn ⊃ Hn−1 . Considere o homomorfismo sobrejetivo fn : G/Hn
G/Hn−1 (projeção). Isto nos permite tomar o limite projetivo limn (G/Hn , fn ) e
←−
observar que os homomorfismos anteriores implicam um homomorfismo natural
g : G → limn Gn dado por x 7→ (· · · , xn , · · · ), onde xn := x + Hn .
←−
219
220 25. TEORIA DE GALOIS INFINITA
Exemplo 25.4. Para todo n ≥ 0 considere Gn := Z/pn Z e o homomorfismo

sobrejetivo de projeção fn : Z/pn+1 Z → Z/pn Z. O limite projetivo limn Z/pn Z é
←−
chamado o anel Zp dos inteiros p-ádicos (para mais detalhes ver [?, chapter II].
Definiremos agora a noção de produto inverso de forma um pouco mais geral.

Seja I um conjunto de ı́ndices dotado de uma ordem parcial i ≤ j. Diremos
que I é direcionado se para quaisquer i, j ∈ I, existe k ∈ I tal que i ≤ k e
j ≤ k. Suponhamos que I seja direcionado. Uma famı́lia inversa direcionada de
grupos é uma famı́lia de grupos {Gi }i∈I e para cada par i ≤ j um homomorfismo
Q
fji : Gj → Gi tal que se k ≤ i ≤ j, então fjk = fji ◦fik e fii = id. Seja G := i Gi
com a operação compenente a componente. Seja Γ o subconjunto de G formado
pelos elementos (xi ) tais que xi ∈ Gi satisfazendo a para todo j ≥ i, fji (xj ) = xi .
Então Γ contém o elemento neutro e é um subgrupo de G dito o limite inverso
da famı́lia e denotado por Γ = limi Gi .
←−
Exemplo 25.5. Seja G um grupo e F o conjunto de subgrupos normais em
G de ı́ndice finito. Se H, K ∈ F, então H ∩ K ∈ F, assim F é uma famı́lia dire-
cionada (com respeito à inclusão). Consideramos o limite inverso limH∈F G/H.
←−
Este subgrupo de G é o que se chama um grupo profinito (no sentido de ser limite
de grupos finitos). Uma variante desta construção consiste em nos restringirmos
à famı́lia Fp de subgrupos normais H de G cujo ı́ndice é uma potência de p. Po-
demos similarmente tomar o limite inverso limH∈F G/H, este grupo é chamado
←− p
um grupo pro-p profinito.
Exemplo 25.6. Logo em seguida consideraremos o contexto natural onde

grupos profinitos aparecem, na teoria de Galois infinita. Seja k um corpo e A
uma extensão infinita de k. Por exemplo, k = Q e A = Q. Seja G := Aut(A/k)
o grupo de k-automorfismos de A. O limite inverso limH∈F G/H coincide na
←−
verdade com G (vamos mostrar isto em seção posterior). Além disto os grupos
quocientes G/H são na verdade grupos de automorfismos de extensões finitas
K/k contidas em A.
Analogamente, se X for uma superfı́cie compacta de Riemann de gênero g ≥ 2
e p : X 0 → X for a aplicação de recobrimento universal, F := C(X), F 0 := C(X 0 )
seus corpos de funções. Exites uma injeção natural π1 (X)top ,→ Aut(F 0 /F ) do
grupo fundamental topológico de X (que é um grupo em 2g geradores com uma
relação) e Gal(F 0 /F ) é o grupo profinito definido como limite projetivo com
relação a subgrupos de ı́ndice finito de AutX (X 0 ). Chamamos a Aut(F 0 /F ) de
25.7. COMPLETAMENTO DE UM GRUPO 221
grupo fundamental algébrico de X, que coincide com o completamento profinito

de π1top (X) (ver seção seguinte). Grothendieck definiu isto de maneira geral para
curvas sobre um corpo qualquer. Isto permitiu transpor a noção tradicional de
grupo fundamental na topologia algébrica para a geometria algébrica. Permanece
um grande mistério a estrutura dos grupos fundamentais algébricos de curvas,
embora por exemplo conheça-se bem todos os quocientes finitos deste grupo, no
caso de curvas afins (isto nada mais é que uma conjectura de Abhyankar, provada
por M. Raynaud e D. Harbater nos anos 90, que diz que para que um grupo seja
quociente é necessário e suficiente que seu maior quociente primo com p o seja).
25.7. Completamento de um grupo

Seja G um grupo e suponhamos que {Hr } seja uma famı́lia de subgrupos
normais de ı́ndice finito tais que Hr ⊂ Hr+1 para todo n. Uma seqüência de
elementos {xn } em G é dita uma seqüência de Cauchy, se dado Hr existe N ≥ 1
tal que para quaiquer n, m ≥ N tenhamos xn x−1 m ∈ Hr . Dizemos que a seqüência
{xn } é a seqüência nula se para todo Hr existir um N ≥ 1 tal que para todo
n ≥ N tenhamos xn ∈ Hr . Fica como exercı́cio provar que o conjunto C de
seqüências de Cauchy com operação termo a termo é um grupo e que as seqüências
nulas N formam um sugrupo normal. O grupo quociente C/N é chamado o
completamento de G com respeito às seqüências nulas e denotado por Ĝ.
Observe que existe um homomorfismo natural G → Ĝ dado por x 7→ (x, x, x, · · · )
T
mod N . O núcleo deste homomorfismo é igual a r Hr . Quando este núcleo é
trivial temos uma injeção.
Teorema 25.8. Existe um isomorfismo de grupos Ĝ ∼

= lim G/Hr .
←−r
Demonstração. Seja x = {xn } uma seqüência de Cauchy em G. Para todo
n suficientemente grande a classe de xn mod Hr independe de n, denotamos esta
classe por x(r). Assim, (x(1), x(2), · · · ) ∈ limr G/Hr .
←−
Reciprocamente, todo elemento (x1 , x2 , · · · ) ∈ limn G/Hn , com xn ∈ G/Hn e
←−
xn um representante de xn em G. A seqüência {xn } é uma seqüência de Cauchy,
que fica como exercı́cio provar que está bem definida, a menos de seqüências
nulas. Também fica como exercı́cio mostrar que a correspondência acima nos dá
a bijeção requerida (que por construção é um homomorfismo).
Podemos fazer a construção acima mais geralmente da seguinte forma. Seja

F uma famı́lia, uma seqüência de Cauchy é uma famı́lia {xj }j∈J indexada por um
222 25. TEORIA DE GALOIS INFINITA
conjunto arbitrário J tal que para cada H ∈ F existe j ∈ J tal que para k, k 0 ≥ j
temos xk x−1
k0 ∈ H. Na prática trabalhamos realmente com seqüências, pois os
grupos profinitos considerados na maior parte dos casos que trataremos têm uma
base enumerável de abertos. Por exemplo, isto ocorre quando G é finitamente
gerado.
Mais geralmente, uma famı́lia {Hi } de subgrupos normais contida em F é
dita cofinal em F se dado H ∈ F existir i tal que Hi ⊂ H. Suponhamos que
exista uma famı́lia {Hi } cujos ı́ndices percorram um conjunto enumerável. Fica
como exercı́cio mostrar que limi G/Hi ∼ = lim G/H.
←− ←−H∈F
25.9. Teoria de Galois infinita
Estenderemos agora a teoria de Galois para extensões infinitas. Uma extensão
algébrica infinita K/k é dita galoisiana, se for normal e separável (lembre que
para definir normalidade e separabilidade precisamos apenas que a extensão K/k
seja algébrica). Para toda subextensão finita F/k de K/k tal que F/k seja
galoisiana, temos que # Gal(F/k) = [F : k]. Pela teoria geral K/F é galosiana
(a separabilidade é clara, a normalidade, segue do fato que para qualquer α ∈ K
temos Pα|K | Pα|k ). Seja H := Gal(K/F ) := Aut(K/F ). Então H tem ı́ndice
finito em G := Gal(K/k). De fato, consideremos o homomorfismo sobrejetivo
(pela normalidade) de restrição G → Gal(F/k) dado por σ 7→ σ|F . O núcleo
deste homomorfismo é exatamente H, logo, pelo teorema dos homomorfismos,
G/H ∼ = Gal(F/k), a fortiori, H tem ı́ndice finito em G. Pelas propriedades
anteriores de limite projetivo, isto permite definir um homomorfismo de grupos
G → limH∈F G/H, onde F := {Gal(F/k) | F é uma extensão galoisiana finita de
←−
k}.
Teorema 25.10. O homomorfismo G → limH∈F G/H é um isomorfismo de

←−
grupos.
Demonstração. Observemos inicialmente que o núcleo é trivial. De fato

se σ pertence ao núcleo, então para toda extensão galoisina finita F/k contida
em K temos que σ|F = 1. Mas como todo α ∈ K pertence a alguma extensão
galoisiana finita F/k concluimos que σ = 1.
Para ver a sobrejetividade, observe que um elemento (σH ) de limH G/H sa-
←−
tisfaz a compatibilidade σH 7→ σH 0 para H 0 ⊃ H. Isto nos permite definir σ ∈ G
globalmente da seguinte forma. Seja α ∈ K, como observado, existe F/k galoisi-
ana finita contida em K tal que α ∈ F . Seja H := Gal(K/F ) e σ(α) := σH (α).
25.9. TEORIA DE GALOIS INFINITA 223
Observe que a condição de compatibilidade acima afirma justamente que σ(α)

não depende da escolha de F . Portanto, isto define um elemento σ ∈ G. Além
disto, por construção σ 7→ (σH ).
Exemplo 25.11. Seja p um número primo e para todo inteiro n ≥ 1 consi-

deremos Kn := Q(µpn ) o pn -ésimo corpo ciclotômico. Seja K := Q(µp∞ ). A ex-
tensão K/Q é abeliana infinita. Como para todo n ≥ 1 temos que Gal(Kn /Q) ∼ =
n ∗ ∗
(Z/p Z) concluimos que temos um isomorfismo de grupos Zp → Gal(K/Q).
Este tipo de extensão cicltômica foi estudada por K. Iwasawa e está associada a
funções L analı́ticas na topologia p-ádica.
Exemplo 25.12. Similarmente, dada uma curva elı́tica E sobre Q conside-

ramos a extensão ciclotômica Q(E[pn ]) gerada pelas coordenadas dos pontos de
pn -torção de E, lembre que E[pn ] ∼
= (Z/pn Z)2 . Observe também que o grupo
de Galois absoluto GQ := Gal(Q/Q) de Q age em E[pn ], para todo n, assim
temos uma representação de GQ dada por ρn : GQ → GL(E[pn ]) ∼ = GL2 (Z/pn Z)
e pelas construções anteoriores podemos tomar o limite projetivo destas repre-
sentações, obtendo assim a representação p-ádica GQ → GL2 (Zp ). Na verdade
o estudo destas representações remonta a trabalhos de Serre, Shimura e Lang-
Trotter e um teorema profundo de Serre afirma que a representação galoisiana
Q
ρ : GQ → p GL2 (Zp ) tem imagem aberta, se E não tem multiplicação complexa,
i.e., a imagem de GQ é um subgrupo de ı́ndice finito em GL2 (Zp ) para todo p
sendo igual a GL2 (Zp ) para quase todo p. O mesmo tipo de problemática pode
ser encontrado no caso de variedades abelianas, mas a extensão do teorema de
Serre depende de um conjectura sobre o grupo de Mumford-Tate da variedade
abeliana.
Pode-se considerar também extensões ciclotômicas de extensões ciclotômicas.

Isto é o conteúdo da seguinte conjectura devida a S̆afarevic̆.
Conjectura 25.13. Seja k0 := Q(µ∞ ) o compositum de todas as extensões

ciclotômicas de Q em Q. Seja k/k0 uma extensão finita e Gk := Gal(Q/k). Então
Gk é isomorfo ao completamento de um grupo profinito livro em um número
enumerável de geradores.
É possı́vel formular um análogo desta conjectura para curvas elı́ticas substi-

tuindo Q(µ) por Q(E(Q)tor ).
CAPı́TULO 26
Teoria de transcendência
26.1. Bases de trasncendência

26.2. Transcendência de e
26.3. Transcendência de π
26.4. Elementos de teoria de transcencência
225

Livro de Algebra 1

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Livro de Algebra 1

Enviado por

Direitos autorais:

Formatos disponíveis

Álgebra

Parte 1. Números Inteiros 5

Capı́tulo 2. Algoritmos Euclideanos 7

Capı́tulo 3. Fatoração de inteiros 13

Capı́tulo 4. Indução finita 23

Capı́tulo 5. Números primos 27

Capı́tulo 6. Aritmética modular 41

Capı́tulo 7. Sistemas de congruência 47

Capı́tulo 8. Aplicações da teoria de grupos à teoria elementar dos números 53

Capı́tulo 9. Teoria de Grupos I 61

Capı́tulo 10. Teoria de grupos II 73

Capı́tulo 11. Teoremas de Sylow 91

Capı́tulo 12. Grupos solúveis 99

12.1. Teorema de Jordan-Hölder 99

Capı́tulo 13. Grupos abelianos finitamente gerados 105

Parte 3. Anéis 113

Capı́tulo 14. Anéis de polinômios 115

Capı́tulo 15. Anéis e domı́nios 127

Parte 4. Corpos 149

Capı́tulo 16. Extensões finitas 151

Capı́tulo 17. Extensões algébricas 157

Capı́tulo 18. Extensões separáveis 169

Capı́tulo 19. Corpos de decomposição e extensões normais 177

Capı́tulo 20. Teoria de Galois 183

Capı́tulo 21. Extensões ciclotômicas 191

Capı́tulo 22. Extensões cı́clicas 197

Capı́tulo 23. Solubilidade por radicais 203

Parte 5. Tópicos adicionais 209

Capı́tulo 24. O problema inverso de Galois 211

Capı́tulo 25. Teoria de Galois infinita 219

Capı́tulo 26. Teoria de transcendência 225

Ao longo deste livro dentoraremos por N o conjunto dos números naturais,

Lema 1.1. Sejam S 0 e R conjuntos. Então existe um conjunto S10 e bijeção

Axioma 1.2 (axioma da boa ordenação). Todo subconjunto não vazio de N

Seja n ≥ 1 inteiro. Sejam x, y variáveis. Considere o produto notável

xn − y n = (x − y)(xn−1 + xn−2 y + . . . + xy n−2 + y n−1 .

Podemos obter dele a soma de n termos de uma progressão geométrica de razão

Lembre-se [?, p. 632] das seguintes expansões em séries

1.3. Relação de equivalência

Exemplo 1.4. Seja X = Z e ∼ a relação ≡ (mod n) definida por: dados

1.9. Lema de Zorn e aplicações

(1) (reflexividade) a ≤ a, para todo a ∈ M.

Definição 1.11. Seja M um conjunto parcialmente ordenado. Um elemento

Demonstração. Considere o conjunto N de todos os ideais b ( R contendo

Segue de um exercı́cio do capı́ulo de domı́nios euclideanos que C é um ideal de

O objetivo deste capı́tulo é descrever o algoritmo euclideano que permite

2.1. O algoritmo euclideano para números inteiros

Proposição 2.3. A divisibilidade satisfaz as seguintes propriedades:

Teorema 2.4 (algoritmo de Euclides). Sejam a, b ∈ Z com b 6= 0. Então

Demonstração. Suponha inicialmente que a, b ≥ 0. Se a < b tome q = 0 e

• Se a < 0 e b > 0, divida a0 := −a por b com quociente q 0 e resto r0 e

a = bq1 + r1 = bq2 + r2 , onde 0 ≤ r1 , r2 < b.

r2 − r1 = b(q1 − q2 ) ≥ b, mas r2 − r1 ≤ r2 < b.

Similarmente, não podemos ter r1 > r2 .

2.5. Máximo divisor comum

Observação 2.7. • A noção de mdc está bem definida a menos de

Lema 2.8. Sejam a, b ≥ 1 inteiros e a = bq + r onde 0 ≤ r < b a divisão de

Demonstração. Basta mostrar que os conjuntos Da,b e Db,r são coincidem.

Tome A2 := B1 − A1 qn−1 e B2 := A1 . A linha seguinte nos dá

2.11. Anéis e ideais

(9) (Cancelamento) Se ab = 0, então a = 0 ou b = 0. Por satisfazer esta

Teorema 3.3 (teorema fundamental da aritmética - primeira versão). Seja

onde os i ’s são 0 ou 1. Portanto,