Você está na página 1de 101

Capı́tulo 1

Álgebra Clássica

1.1 Os números complexos


Um número complexo tem a forma z = a + bi, onde a e b são números reais e
i2 = −1. Vamos denotar por R o conjunto dos números reais e por C o conjunto de
todos os números complexos. Assim,

C = {a + bi | a ∈ R e b ∈ R} .

A soma e o produto de dois números complexos são definidos, respectivamente, por

(a + bi) + (c + di) = (a + c) + (b + d)i;

(a + bi)(c + di) = (ac − bd) + (ad + bc)i.

Com essas operações, o conjunto dos números complexos é um corpo. Os elementos


neutros dessas operações são 0 = 0 + 0i e 1 = 1 + 0i. O inverso aditivo de z = a + bi é
−z = −a − bi e o inverso multiplicativo de z = a + bi, se z ̸= 0, é z −1 = a
a2 +b2
b
− a2 +b 2 i.

Desse modo, temos que a inclusão R ⊂ C é válida, pois se a ∈ R, então, a =


a + 0.i ∈ C.

1
1.2 Números complexos vistos como pontos do plano
R2
Um fato interessante é que podemos identificar o conjunto dos números complexos C
com o plano R2 de todos os pares (x, y) de números reais, com as seguintes operações:

(x1 , y1 ) + (x2 , y2 ) = (x1 + x2 , y1 + y2 );

(x1 , y1 ).(x2 , y2 ) = (x1 x2 − y1 y2 , x1 y2 + x2 y1 ).

De fato, a aplicação

φ: C → R2
a + bi 7→ (a, b)

é um isomorfismo de corpos. Se a + bi e c + di são elementos arbitrários de C, então,

(i) φ((a + bi) + (c + di)) = φ((a + c) + (b + d)i) = (a + c, b + d) = (a, b) + (c, d) =


= φ(a + bi) + φ(c + di);

(ii) φ((a + bi)(c + di)) = φ((ac − bd) + (ad + bc)i) = (ac − bd, ad + bc) = (a, b)(c, d) =
= φ(a + bi)φ(c + di);

(iii) se φ(a + bi) = φ(c + di), então, (a, b) = (c, d), o que implica a + bi = c + di;

(iv) dado (x, y) ∈ R2 , temos x + yi ∈ C e satisfaz φ(x + yi) = (x, y).

e a inversa de φ é a seguinte aplicação

φ−1 : R2 → C
(a, b) 7→ a + bi

De outro ponto de vista, note que, temos (x, y) = (x, 0)+(0, y) = (x, 0)+(y, 0)(0, 1).
Identificando o par (x, 0) com o número real x, o par (y, 0) com o número real y e
definindo i = (0, 1), podemos identificar o par (x, y) com o número complexo x + yi.
Desse modo, i2 = (0, 1)(0, 1) = (−1, 0) pode ser identificado com o número real −1.

2
1.3 Subcorpos e subanéis dos números complexos
Definição 1.1 Um subanel de C é um subconjunto R ⊂ C tal que 1 ∈ R e se x, y ∈ R,
então, x + y, −x e xy ∈ R.

Definição 1.2 Um subcorpo de C é um subanel K ⊂ C tal que se x ∈ K e x ̸= 0,


então, x−1 ∈ K.

Exemplo 1.1 O conjunto R = {a + bi | a, b ∈ Z} é um subanel de C.

De fato,

• 1 = 1 + 0i ∈ R;

• Se a + bi ∈ R e c + di ∈ R, então, (a + bi) + (c + di) = (a + c) + (b + d)i ∈ R;

• Se a + bi ∈ R, então, −(a + bi) = −a + (−b)i ∈ R;

• Se a + bi ∈ R e c + di ∈ R, então, (a + bi)(c + di) = (ac − bd) + (bc + ad)i ∈ R.

Exemplo 1.2 O conjunto R = {a + bi | a, b ∈ Z} não é um subcorpo de C.

Por exemplo, 2 = 2 + 0i ∈ R, mas 2 não possui inverso em R.

Exemplo 1.3 O conjunto R = {a + bi | a, b ∈ Q} é um subcorpo de C.

De fato,

• 1 = 1 + 0i ∈ R;

• Se a + bi ∈ R e c + di ∈ R, então, (a + bi) + (c + di) = (a + c) + (b + d)i ∈ R;

• Se a + bi ∈ R, então, −(a + bi) = −a + (−b)i ∈ R;

• Se a + bi ∈ R e c + di ∈ R, então, (a + bi)(c + di) = (ac − bd) + (bc + ad)i ∈ R;

3
• Dado a + bi um elemento não nulo de R, vamos determinar o seu inverso. Temos

1 1 a − bi a − bi a −b
= = 2 2
= 2 2
+ 2 i.
a + bi a + bi a − bi a +b a +b a + b2

Observe que se a2 + b2 = 0, então, a = 0 e b = 0, o que implica a + bi = 0, o que


é uma contradição. Portanto, (a + bi)−1 = a
a2 +b2
− b
a2 +b2
i ∈ R.

Exemplo 1.4 O conjunto 2Z de todos os números inteiros pares não é um subanel de


C.

De fato, 1 ∈
/ 2Z.

 √
Exemplo 1.5 O conjunto S = a + b 3 2 | a, b ∈ Q não é um subanel de C.

√ √ √ √
De fato, se a + b 3 2 ∈ S e c + d 3 2 ∈ S, então, (a + b 3 2)(c + d 3 2) = = ac + (ad +
√ √
bc) 3 2 + bd 3 4 ∈
/ S.

Definição 1.3 Suponha que K e L sejam subcorpos de C. Um isomorfismo de K em L


é uma aplicação ϕ : K → L bijetora tal que ϕ(x + y) = ϕ(x) + ϕ(y) e ϕ(xy) = ϕ(x)ϕ(y),
para quaisquer x, y ∈ K.

Corolário 1.1 • ϕ(0) = ϕ(0 + 0) = ϕ(0) + ϕ(0), o que implica ϕ(0) = 0;

• ϕ(−x) = −ϕ(x), pois ϕ(−x) + ϕ(x) = ϕ(−x + x) = ϕ(0) = 0;

• ϕ(1) = 1, pois ϕ(1) = ϕ(1 × 1) = ϕ(1)ϕ(1), o que implica ϕ(1)(ϕ(1))−1 =


ϕ(1)ϕ(1)(ϕ(1))−1 ;

• ϕ(x−1 ) = (ϕ(x))−1 , pois ϕ(x−1 )ϕ(x) = ϕ(xx−1 ) = ϕ(1).

Se ϕ for injetora, mas não for necessariamente sobrejetora, dizemos que ϕ é um


monomorfismo. Se ϕ for sobrejetora, mas não for necessariamente injetora, dizemos
que ϕ é um epimorfismo. Um isomorfismo de K em si mesmo é chamado automorfismo
de K.

4
Exemplo 1.6 A aplicação conjugação complexa

ϕ: C → C
a + bi 7→ a − bi
é um automorfismo de C.

Com efeito, se a + bi e c + di são elementos arbitrários de C, então,

• ϕ((a + bi) + (c + di)) = ϕ((a + c) + (b + d)i) = (a + c) − (b + d)i = a + c − bi − di =


(a − bi) + (c − di) = ϕ(a + bi) + ϕ(c + di);

• ϕ((a+bi)(c+di)) = ϕ(ac−bd+(ad+bc)i) = (ac−bd)−(ad+bc)i = ac−bd−adi−


bci = ac−bci−adi−bd = (a−bi)c−(a−bi)di = (a−bi)(c−di) = ϕ(a+bi)ϕ(c+di);

• se ϕ(a + bi) = ϕ(c + di), então, a − bi = c − di, o que implica a = c e b = d.


Portanto, a + bi = c + di;

• se x + yi é um elemento arbitrário de C, então, ϕ(x − yi) = x + yi.


 √
Exemplo 1.7 Se K = p + q 2 | p, q ∈ Q , então, K é um subcorpo de C.

Com efeito,

• 1 = 1 + 0 2 ∈ K;
√ √ √ √ √
• Se p+q 2 ∈ K e r+s 2 ∈ K, então, (p+q 2)+(r+s 2) = (p+r)+(q+s) 2 ∈
K;
√ √ √
• Se p + q 2 ∈ K, então, −(p + q 2) = −p + (−q) 2 ∈ K;
√ √ √ √
• Se p + q 2 ∈ K e r + s 2 ∈ K, então, (p + q 2)(r + s 2) = (pr + 2qs) + (ps +

qr) 2 ∈ K;

• Dado p + q 2 um elemento não nulo de K, vamos determinar o seu inverso.
Temos
√ ! √
1 1 p−q 2 p−q 2 p −q √
√ = √ √ = 2 2
= 2 2
+ 2 2.
p+q 2 p+q 2 p−q 2 p − 2q p − 2q p − 2q 2

Observe que se p2 − 2q 2 = 0, então, existem duas possibilidades:

5

• se q = 0, então, p = 0, o que implica p + q 2 = 0, o que é uma contradição;
 2
p2 p
• se q ̸= 0, então, q2
= 2, isto é, q
= 2, o que é uma contradição.
√ p −q √
Portanto, (p + q 2)−1 = + 2.
p2 − 2q 2 p2 − 2q 2

Exemplo 1.8 A aplicação

ϕ: K → K
√ √
a + b 2 7→ a − b 2

é um automorfismo de K.

√ √
De fato, se a + b 2 e c + d 2 são elementos arbitrários de K, então,
√ √ √ √
• ϕ((a + b 2) + (c + d 2)) = ϕ((a + c) + (b + d) 2) = (a + c) − (b + d) 2 =
√ √ √ √ √ √
a + c − b 2 − d 2 = (a − b 2) + (c − d 2) = ϕ(a + b 2) + ϕ(c + d 2);
√ √ √ √
• ϕ((a + b 2)(c + d 2)) = ϕ(ac + 2bd + (ad + bc) 2) = (ac + 2bd) − (ad + bc) 2 =
√ √ √ √ √ √ √
ac+2bd−ad 2−bc 2 = ac−bc 2−ad 2+2bd = (a−b 2)c−(a−b 2)d 2 =
√ √ √ √
(a − b 2)(c − d 2) = ϕ(a + b 2)ϕ(c + d 2);
√ √ √ √
• se ϕ(a + b 2) = ϕ(c + d 2), então, a − b 2 = c − d 2, o que implica a = c e
√ √
b = d. Portanto, a + b 2 = c + d 2;
√ √ √
• se x + y 2 é um elemento arbitrário de K, então, ϕ(x − y 2) = x + y 2.

1.4 Resolvendo equações


Um motivo frequente para introduzir novos conjunto numéricos é que os já conheci-
dos anteriormente sejam insuficientes para resolver alguns problemas importantes. A
maioria dos problemas históricos da área de Teoria de Galois podem ser formulados
usando equações, embora é importante frisar que essa é uma interpretação moderna e
que matemáticos antigos não pensavam desse jeito.

6
Por exemplo, o passo de N para Z é necessário, pois embora algumas equações, tais
como
t+2=7

possam ser resolvidas para t ∈ N, outras tais como

t+7=2

não podem ser resolvidas. Entretanto, tais equações podem ser resolvidas em Z.
Simirlamente, o passo de Z para Q (historicamente, foi iniciado de N para Q+ , os
racionais positivos) torna possı́vel resolver a equação

2t = 7.

Equações da forma at + b = 0, onde a e b são números especı́ficos e t é um número


desconhecido, ou uma variável, são chamadas equações lineares. Em um subcorpo de
C, qualquer equação linear com a ̸= 0 pode ser resolvida com a solução única t = − ab .
O passo de Q para R está relacionado com um tipo diferente de equação:

t2 = 2.

Do modo como os gregos enxergavam (embora na própria visão geométrica deles,


eles não possuı́am notação algébrica e embora de um modo bastante diferente dos
√ √
matemáticos modernos), a “solução” t = 2 é um número irracional – 2 ∈
/ Q.
Similarmente, o passo de R para C nos permite resolver a equação

t2 = −1

que não possui soluções reais, pois o quadrado de qualquer número real é positivo.
Equações da forma
at2 + bt + c = 0,

tais que a ̸= 0 são chamadas de equações quadráticas. A fórmula clássica para suas
soluções é √
−b ± b2 − 4ac
t= .
2a

7
Sobre o números reais, a fórmula faz sentido se b2 − 4ac ≥ 0, mas não o faz se
b2 −4ac < 0; sobre o corpo dos números complexos, essa faz sentido independentemente
do sinal de b2 − 4ac. Sobre o corpo dos números racionais, essa faz sentido somente
quando b2 − 4ac é um quadrado perfeito, isto é, o quadrado de um número racional.

1.5 Soluções por radicais


Inicialmente, vamos relembrar como resolver equações polinomiais como era feito ape-
nas antes da época de Galois. Vamos considerar equações lineares, quadráticas, cúbicas,
quárticas e quı́nticas. No caso das quı́nticas, também vamos descrever algumas ideias
que foram descobertas depois de Galois. Vamos impor a hipótese padrão do perı́odo:
os coeficientes da equação são números complexos.

1.5.1 Equações lineares

Sejam a, b ∈ C com a ̸= 0. Uma equação linear geral é da forma

at + b = 0

e sua solução é
b
t=− .
a

1.5.2 Equações quadráticas

Sejam a′ , b′ , c′ ∈ C, com a′ ̸= 0. Uma equação quadrática geral é da forma

a′ t2 + b′ t + c′ = 0.

Dividindo por a′ , temos


b′ c′
t2 + t + = 0.
a′ a′
b′ c′
Renomeando os coeficientes a = a′
eb= a′
, obtemos

t2 + at + b = 0,

8
a qual é equivalente às equações
a2 a2
t2 + at + b + − =0
4 4
a2 a2
t2 + at + +b− =0
4 4
 a  2 a2
t+ = −b
2 4
Extraindo raı́zes quadradas, obtemos
r
a a2
t+ =± −b
2 4
o que nos permite concluir r
a a2
t=− ± −b
2 4
a qual é a fórmula usual quadrática exceto por uma mudança de notação. O processo
usado aqui é chamado “completar quadrados” e é da época dos Babilônios, por volta
de 1700 A.C.

1.5.3 Equações cúbicas

Sejam a′ , b′ , c′ ∈ C com a′ ̸= 0. A equação mais geral do terceiro grau é a′ t3 +


b′ c′ d′ b′ c′
b′ t2 + c′ t + d′ = 0, que é equivalente a t3 + ′ t2 + ′ t + ′ = 0. Sejam ′ = a, ′ = b e
a a a a a
d′ 3 2 a

= c. Logo, basta considerar a equação t + at + bt + c = 0. A substituição t = y −
a 3
a transforma em
 a 3  a 2  a
y− +a y− +b y− +c=0
3 3 3

a2 a3 a a2
 
3 2a 2 ba
y − 3y + 3y − + a y − 2y + + by − +c=0
3 9 27 3 9 3

y a3 a2 a3 ab
y 3 − ay 2 + a2 − + ay 2 − 2 y + + by − +c=0
3 27 3 9 3

a2 2a3 ab
 
3
y + b− y+ − +c=0
3 27 3

9
que é uma equação que não possui termo do segundo grau.
a2 2a3 ab
Sejam p = b − 3
eq= 27
− 3
+ c. Desse modo, é suficiente estudar equações do
tipo y 3 + py + q = 0.
Para resolver essa equação, escrevemos y = u + v. Substituindo, obtemos

(u + v)3 + p(u + v) + q = 0

u3 + 3u2 v + 3uv 2 + v 3 + pu + pv + q = 0

u3 + v 3 + 3u(uv) + pu + 3(uv)v + pv + q = 0

u3 + v 3 + 3uv(u + v) + p(u + v) + q = 0

u3 + v 3 + 3(uv + p)(u + v) + q = 0
p
Portanto, se conseguirmos achar números u, v tais que u3 + v 3 = −q e uv = − , ou
3
3 3 3 3 p3 3
seja, u + v = −q e u v = − , então, y = u + v será raiz da equação y + py + q = 0.
27
Já sabemos resolver o problema de achar u3 e v 3 conhecendo a sua soma e o seu
p3
produto, pois u3 e v 3 são as raı́zes da equação de segundo grau w2 + qw − = 0.
27
Resolvendo esta equação, obtemos


q
4p3
−q + q 2 +
r r
3 −q + ∆ 27 q q 2 p3 q q 2 p3
u = = =− + + e v3 = − − +
2 2 2 4 27 2 4 27

e consequentemente,
s r s r
3 q q 2 p3 3 q q 2 p3
y =u+v = − + + + − − + .
2 4 27 2 4 27

Assim, y = u + v, dada pela fórmula acima, é uma raiz da equação y 3 + py + q = 0.


Vejamos um exemplo retirado do livro de Álgebra de Euler, escrito em 1770, o qual
serviu de modelo para os compêndios utilizados por sucessivas gerações de estudantes.

10
Exemplo: t3 − 6t − 9 = 0. Nesse caso, temos
s r s r
3 −9 (−9)2 (−6)3 3 (−9) (−9)2 (−6)3
t=u+v = − + + + − − +
2 4 27 2 4 27

s r s r
3 9 81 3 9 81
t=u+v = + −8+ − −8
2 4 2 4
s r s r
3 9 81 32 3 9 81 32
t=u+v = + − + − −
2 4 4 2 4 4
s r s r
3 9 49 3 9 49
t=u+v = + + −
2 4 2 4

9 7 √ √
r r
3 9 7 3 3 3
t=u+v = + + − = 8 + 1 = 2 + 1 = 3.
2 2 2 2
Logo, pela fórmula, podemos concluir que t = 3 é uma raiz. Dividindo t3 − 6t − 9
por t − 3, obtemos t2 + 3t +√3. Assim, as
√ duas raı́zes restantes
√ são as da√equação
−3 ± ∆ −3 ± 9 − 4.1.3 −3 ± −3 −3 ± 3i
t2 + 3t + 3 = 0, isto é, = = = .
2 2 2 2

1.5.4 Equações quárticas

Sejam a′ , b′ , c′ , d′ , e′ ∈ C com a′ ̸= 0. A equação mais geral do quarto grau é


b′ c′ d′ e′
a′ t4 + b′ t3 + c′ t2 + d′ t + e′ = 0, que é equivalente a t4 + ′ t3 + ′ t2 + ′ t + ′ = 0. Sejam
a a a a
b′ c′ d′ e′
= a, ′ = b, ′ = c e ′ = d. Logo, basta considerar a equação
a′ a a a

t4 + at3 + bt2 + ct + d = 0.

a
A substituição t = y − a transforma em
4
 a 4  a 3  a 2  a
y− +a y− +b y− +c y− +d=0
4 4 4 4
2
a3 a4 a2 a3
   
4 3a 2a 3 2a
y − 4y + 6y − 4y + + a y − 3y + 3y − +
4 16 64 256 4 16 64

11
a a2
 
2
 a
+b y − 2y + +c y− +d=0
4 16 4
 3
3a3 ab a4 a4 a2 b ac
  
4 6 2 3 2 2 a
y + a − a +b y + − + − +c y+ − + − +d = 0
16 4 16 16 2 256 64 16 4
ab a3 ac a2 b 3a4
     
4 3 2 2
y + − a +b y + c− + y+ d− + − =0
8 2 8 4 16 256
| {z } | {z } | {z }
e f g

y 4 + ey 2 + f y + g = 0

Vamos analisar 3 possibilidades:

Primeiro caso: g = 0;

Se g = 0, então, y 4 + ey 2 + f y = 0, isto é, y(y 3 + ey + f ) = 0. Assim, basta


resolver a equação cúbica y 3 + ey + f = 0, que já estudamos na subseção anterior
como resolver. Se as suas soluções forem y1 , y2 e y3 , então, as soluções da quártica
t4 + at3 + bt2 + ct + d = 0 serão: t1 = − a4 , t2 = y1 − a4 , t3 = y2 − a
4
e t4 = y3 − a4 .

Segundo caso: f = 0;

Se f = 0, então, y 4 + ey 2 + g = 0, isto é, (y 2 )2 + ey 2 + g = 0. Substituindo y 2 = z,


temos a equação z 2 + ez + g = 0, a qual é uma equação quadrática na variável z, que
também já estudamos em uma subseção anterior como resolver. Se as suas soluções

forem z1 e z2 , então, as soluções da quártica t4 +at3 +bt2 +ct+d = 0 serão: t1 = z1 − a4 ,
√ √ √
t2 = − z1 − a4 , t3 = z2 − a4 e t4 = − z2 − a4 .

Terceiro caso: f ̸= 0 e g ̸= 0;

Descartes introduziu em 1637 o método de encontrar raı́zes de uma quártica fatorando-


a em duas quadráticas.

y 4 + ey 2 + f y + g = (y 2 + hy + j)(y 2 + h′ y + j ′ )

= y 4 + h′ y 3 + j ′ y 2 + hy 3 + hh′ y 2 + hj ′ y + jy 2 + jh′ y + jj ′

12
= y 4 + (h′ + h)y 3 + (j ′ + hh′ + j)y 2 + (hj ′ + jh′ )y + jj ′

Comparando coeficientes, as seguintes igualdades devem ser satisfeitas:

h′ + h = 0

j ′ + hh′ + j = e

hj ′ + jh′ = f

g = jj ′

Assim, h′ = −h. Agora, observe se j = 0, então, g = 0, o que é uma contradição.


Portanto, j ̸= 0. Consequentemente, j ′ = gj . Logo, temos
 
4 2 2 2 g
y + ey + f y + g = y + hy + j y − hy + ,
j
g
e = j ′ + hh′ + j =
− h2 + j
j
 
′ ′ g g
f = hj + jh = h − jh = h −j
j j
Além disso, observe que se h = 0, então, h′ = 0 e pela equação hj ′ + jh′ = 0,
podemos concluir também que f = 0, o que é uma contradição. Portanto, f ̸= 0.
Consequentemente,
g
+ j = e + h2
j
g f
−j =
j h
Adicionando estas duas equações, obtemos

2g f
= e + h2 +
j h

Subtraindo-as, obtemos
f
2j = e + h2 − (∗ ∗)
h
A multiplicação das duas últimas equações resulta em
  
2 f 2 f
4g = e + h + e+h −
h h

13
ef ef f2
4g = e2 + eh2 − + eh2 + h4 − f h + + fh − 2
h h h
2
f
4g = e2 + 2eh2 + h4 − 2
h
Multiplicando a última equação por h2 , obtemos

4gh2 = e2 h2 + 2eh4 + h6 − f 2

h6 + 2eh4 + (e2 − 4g)h2 − f 2 = 0

Fazendo a substituição h2 = s, esta equação pode ser reescrita como

s3 + 2es2 + (e2 − 4g)s − f 2 = 0,

a qual é uma equação cúbica com coeficientes conhecidos, que já estudamos como
resolver na seção passada. Resolvendo esta cúbica, podemos determinar os valores
de h pela equação h2 = s. Em seguida, como os valores de e e f são conhecidos,
substituindo os valores de h na equação (∗ ∗), encontramos os valores de j. Portanto,
para determinar as soluções da equação quártica

y 4 + ey 2 + f y + g = 0,

g
basta encontrar as raı́zes das equações quadráticas y 2 + hy + j = 0 e y 2 − hy + j
= 0.

14
Capı́tulo 2

O Teorema Fundamental da
Álgebra

Na época de Galois, o ambiente natural para a maioria das investigações matemáticas


era o conjunto dos números complexos. Os números reais eram inadequados para
muitas questões, porque −1 não tinha raiz quadrada real. A aritmética, a álgebra e
análise dos números complexos era mais rica, mais elegante e mais completa que as
teorias correspondentes para números reais.
Neste capı́tulo estabelecemos uma das propriedades chave dos números complexos,
conhecida como o Teorema Fundamental da Álgebra. Este teorema afirma que toda
equação polinomial com coeficientes em C tem uma solução em C, o que, de fato, é
falso sobre R, pois basta considerar t2 + 1 = 0. Este teorema será fundamental para
nós. Futuramente, faremos uma demonstração quase puramente algébrica, usando mais
ferramentas.

2.1 Polinômios
As equações lineares, quadráticas, cúbicas, quárticas e quı́nticas são exemplos de uma
classe mais geral: equações polinomiais. Estas são da forma p(t) = 0, onde p(t) é um
polinômio em t.

15
Um polinômio é uma expressão algébrica envolvendo as potências de uma variável
ou indeterminada t. De fato, definimos um polinômio sobre C na indeterminada t como
uma expressão
r0 + r1 t + · · · + rn tn ,

onde r0 , . . . , rn ∈ C, 0 ≤ n ∈ Z e t é uma indeterminada.


Os elementos r0 , . . . , rn são os coeficientes do polinômio. De modo natural, os
termos 0tm podem ser omitidos ou escritos como 0, e 1tm pode ser trocado por tm .
Definimos dois polinômios como sendo iguais se, e somente se, os coeficientes cor-
respondentes são iguais, onde estamos considerando que as potências de t que não
aparecem no polinômio possuem coeficientes iguais a zero.
Para definir a soma e o produto de dois polinômios escrevemos
X
ri ti

em vez de
r0 + r1 t + · · · + rn tn ,

onde a soma é considerada como sendo sobre todos os inteiros i ≥ 0, e rk é definido


como sendo 0, se k ≥ n.
X X
Então, se r = ri ti e s = si ti , definimos
X
r+s= (ri + si )ti
X X
r.s = qj tj , onde qj = rh si
h+i=j

O conjunto de todos os polinômios sobre C na indeterminada t com as operações


acima é um anel, que é chamado de anel de polinômios sobre C na indeterminada t e
vamos denotá-lo por C[t].
De modo análogo, podemos definir polinômios em várias indeterminadas t1 , t2 , . . . , tn ,
obtendo o anel de polinômios C[t1 , t2 , . . . , tn ], em n variáveis.
Um elemento de C[t] será usualmente denotado por uma única letra, por exemplo
como f , sempre que for claro que indeterminada está envolvida. Se existir ambiguidade
escreveremos f (t) para enfatizar o papel ocupado pela indeterminada t.

16
Definição 2.1 Se f for um polinômio sobre C e f ̸= 0, então, o grau de f é a maior
potência de t que aparece em f com coeficiente não nulo.

Exemplo 2.1 O polinômio t2 + 1 tem grau 2.

Exemplo 2.2 O polinômio 723t1101 − 9111t55 + 43 tem grau 1101.

ri ti , rn ̸= 0 e rm = 0, para m > n, então, f tem grau n.


P
De modo geral, se f =
Escrevemos ∂f para o grau de f . Se f = 0, adotamos a convenção que ∂ 0 = −∞.

Proposição 2.1 Se f e g forem polinômios sobre C, então, ∂(f + g) ≤ max {∂f, ∂g}
e ∂(f g) = ∂f + ∂g.

A notação f (t) faz f parecer como sendo uma função, com t como sua variável
independente. De fato, cada polinômio f ∈ C[t] pode ser considerado como uma função
P i
ri t , então, f (α) = ri αi . A próxima
P
de C em C, definida do seguinte modo: se f =
proposição prova que quando os coeficientes pertencem a C, não existe confusão se
usarmos o mesmo sı́mbolo f para denotar um polinômio e a função associada a ele.

Proposição 2.2 Dois polinômios f e g sobre C definem a mesma função se, e somente
se, eles possuı́rem os mesmos coeficientes.

ri ti e g = si ti dois polinômios sobre C.


P P
Demonstração: Sejam f =
Se f e g possuı́rem os mesmos coeficientes, então, ri = si , para todo i. Desse modo,
ri α i = si αi = g(α). Consequentemente, f e g definem a
P P
se α ∈ C, então, f (α) =
mesma função sobre C.
Reciprocamente, suponhamos que f e g definam a mesma função sobre C. Desse
modo, para todo α ∈ C, temos f (α) = g(α), isto é, f (α) − g(α) = 0, ou seja, (f −
g)(α) = 0. Seja f − g = h. Se h = 0, então, f = g, o que implica que f e g possuem
os mesmos coeficientes.
Supomos h ̸= 0 e seja ∂h = n. Assim, temos

h = an tn + an−1 tn−1 + · · · + a1 t + a0 e h(α) = 0.

17
Assim, como h(α) = 0, diferenciando n vezes, obtemos h(n) (α) = n.(n−1). . . . 2.1.an =
0, isto é, n!.an = 0. Portanto, an = 0, o que é uma contradição, pois ∂h = n. □

Observação: Se F for um corpo finito, é possı́vel que dois polinômios diferentes


definam a mesma função polinomial. Por exemplo, considere os polinômios f (t) =
t5 − 2t + 1 e g(t) = 4t + 1 sobre Z5 . Claramente, f e g são polinômios diferentes, mas
f (0) = g(0) = 1, f (1) = g(1) = 0, f (2) = g(2) = 4, f (3) = g(3) = 3 e f (4) = g(4) = 2,
isto é, f e g definem a mesma função polinomial.

2.2 O Teorema Fundamental da Álgebra e suas con-


sequências
Teorema 2.3 Seja p(t) um polinômio sobre C, com ∂p ≥ 1. Então, existe pelo menos
um elemento z ∈ C tal que p(z) = 0.

Tal número z é chamado de raiz da equação p(t) = 0 ou um zero do polinômio


p. Por exemplo, i é uma raiz da equação t2 + 1 = 0 e um zero de t2 + 1. Equações
polinomiais podem ter mais que uma raiz; de fato, note que i e −i são raı́zes da equação
t2 + 1.
Uma demontração que é quase puramente algébrica do Teorema Fundamental da
Álgebra será dada no Corolário 13 do Capı́tulo 23, mas precisamos desenvolver Teoria
de Galois para fazer a demonstração rigorosamente.
O Teorema Fundamental da Álgebra têm algumas implicações úteis. Antes de
provarmos a mais básica delas, primeiramente vamos provar o Teorema do Resto.

Teorema 2.4 (Teorema do Resto) Seja p(t) ∈ C[t] com ∂p ≥ 1, e seja α ∈ C.

1. Existe q(t) ∈ C e r ∈ C tal que p(t) = (t − α)q(t) + r;

2. A constante r satisfaz r = p(α).

18
Demonstração: Sejam α ∈ C e y = t − α. Escreva p(t) = pn tn + · · · + p1 t + p0 , onde
pn ̸= 0 e n ≥ 1. Desse modo,

p(t) = pn (y + α)n + · · · + p1 (y + α) + p0 .

Expandindo as potências de y + α pelo Binômio de Newton, temos


   
n
X n
p(t) = pn    y n−k αk  + · · · + p1 y + p1 α + p0
k=0 k

p(t) = pn y n + · · · + pn αn + · · · + p1 y + p1 α + p0

Reagrupando os termos de acordo com a potência de y, podemos escrever

p(t) = an y n + · · · + a1 y + a0 ,

onde aj ∈ C 0 ≤ j ≤ n.

p(t) = y(an y n−1 + · · · + a1 ) + a0 = (t − α) (an (t − α)n−1 + · · · + a1 ) + a0


| {z } |{z}
q(t) r

p(t) = (t − α)q(t) + r

Assim, substituindo t = α na última igualdade, podemos concluir que vale p(α) =


(α − α)q(α) + r, isto é, p(α) = r. □

Corolário 2.5 O número complexo α é um zero de p(t) se, e somente se, t − α divide
p(t) ∈ C[t].

Demonstração: Se α for um zero de p(t), então, p(α) = 0, o que implica 0 = p(α) =


(α − α)q(α) + r, isto é, r = p(α). Portanto, p(t) = (t − α)q(t). Logo, t − α divide p(t).
Se t − α divide p(t), então, r = 0, o que implica p(t) = t − α. Portanto, p(α) =
α − α = 0, isto é, α é um zero de p(t). □

Proposição 2.6 Seja p(t) ∈ C[t] com ∂p = n ≥ 1. Então, existem α1 , . . . , αn ∈ C, e


0 ̸= k ∈ C tais que
p(t) = k(t − α1 ) . . . (t − αn ).

19
Demonstração: A demonstração será por indução em n. Se n = 1, então, p(t) =
kt+α, onde 0 ̸= k ∈ C e α ∈ C. Em particular, podemos escrever p(t) = k t − − αk .


Seja n > 1. Suponhamos, por hipótese de indução, que o resultado é verdadeiro


para todo polinômio de grau menor que n.
Pelo Teorema Fundamental da Álgebra, sabemos que p(t) tem pelo menos um zero
em C, o qual vamos chamar de αn . Pelo Teorema do Resto, existe q(t) ∈ C[t] e r ∈ C
tal que p(t) = (t − αn )q(t) + r. Assim, como αn é um zero de p(t), temos 0 = p(αn ) = r.
Desse modo, p(t) = (t − αn )q(t). Consequentemente, ∂p = 1 + ∂q, isto é, ∂q = ∂p − 1.
Portanto, por hipótese de indução, existem α1 , . . . , αn−1 ∈ C, e 0 ̸= k ∈ C tais que
q(t) = k(t − α1 ) . . . (t − αn−1 ). Logo,

p(t) = (t − αn )q(t) = k(t − α1 ) . . . (t − αn−1 )(t − αn ).


Segue imediatamente que os αj ’s são os únicos zeros complexos de p(t). Os zeros
αj ’s não precisam ser distintos. Juntando os zeros que são iguais podemos reescrever
a equação p(t) = k(t − α1 ) . . . (t − αn ) do seguinte modo

p(t) = k(t − β1 )m1 . . . (t − βl )ml ,

onde os βj ’s são distintos, os mj ’s são inteiros maiores ou iguais a 1, e m1 +· · ·+ml = n.


Chamamos cada mj de multiplicidade do zero βj de p(t).
Em particular, provamos que todo polinômio complexo de grau n tem precisamente
n zeros complexos, contados de acordo com a multiplicidade.

20
Capı́tulo 3

Fatoração de polinômios

Não existe somente uma álgebra de polinômios, como também uma aritmética, isto é,
existem noções análogas as dos números inteiros, conceitos como divisibilidade, primo,
fatoração prima e máximo divisor comum. Estas noções são essenciais para o entendi-
mento de equações polinomiais e vamos desenvolvê-las neste capı́tulo.
Já sabemos que se f é um produto gh de polinômios de menor grau, então, as
soluções de f (t) = 0 são precisamente aquelas de g(t) = 0 junto com aquelas de
h(t) = 0. Por exemplo, para resolver a equação t3 − 6t2 + 11t − 6 = 0, podemos
fatorar o polinômio t3 − 6t2 + 11t − 6 em (t − 1)(t − 2)(t − 3) e deduzir que suas
raı́zes são t = 1, t = 2 e t = 3. A aritmética de polinômios consiste em um estudo
sistemático de propriedades de divisibilidade de polinômios em analogias com os os
números inteiros. Em particular, existe um análogo para polinômios do Algoritmo
Euclidiano para encontrar o máximo divisor comum de dois números inteiros.
Neste capı́tulo definimos noções relevantes de divisibilidade e mostramos que exis-
tem certos polinômios, os irredutı́veis, que ocupam um papel similar aos números
primos no anel de números inteiros. Todo polinômio sobre um subcorpo dado de C
pode ser escrito como um porduto de polinômios irredutı́veis sobre o mesmo subcorpo
de um modo essencialmente único. Vamos relacionar zeros de polinômios à teoria de
fatoração.
Em todo este capı́tulo, assume-se que todos os polinômios estão em K[t], onde K é

21
um subcorpo dos números complexos, ou em R[t], onde R é um subanel dos números
complexos. Alguns teoremas são válidos sobre R, enquanto outros são válidos somente
sobre K. Vamos precisar dos dois tipos.

3.1 O Algoritmo Euclidiano


Em teoria de números, um dos conceitos chave é divisibilidade: um inteiro a é divisı́vel
por um inteiro b se existir um inteiro c tal que a = bc. Por exemplo, 60 é divisı́vel por
3, pois 60 = 3 × 20, mas 60 não é divisı́vel por 7. As propriedades de divisibilidade de
números inteiros nos conduzem a ideias como primos e fatoração. Queremos desenvolver
estas ideias para polinômios.
Muitos resultados importantes na teoria de fatoração de polinômios surgem do fato
que podemos dividir um polinômio por outro.

Proposição 3.1 (Algoritmo da divisão) Sejam f e g polinômios sobre um subcorpo K


dos números complexos e suponha que f é não nulo. Então, existem únicos polinômios
q e r sobre K tais que g = f.q + r e r tem grau estritamente menor que o grau de f.

Demonstração: A demonstração será por indução em grau de g. Se ∂g = −∞, então,


g = 0 e podemos tomar q = r = 0.
Suponha ∂g = 0. Neste caso, g = k, onde k é um elemento de K. Como por
hipótese, f é não nulo, existem duas possibilidades:

k

(i) Se ∂f = 0, então, f = l ∈ K e podemos escrever g = l. l
+ 0, ou seja, basta
k
considerar q = l
e r = 0;

(ii) Se ∂f > 0, então, basta tomar q = 0 e r = g, que temos f.q + r = f.0 + g = g e


r = g tem grau 0 estritamente menor que o grau de f , que é positivo.

Assuma, por hipótese de indução, que o resultado é válido para quaisquer po-
linômios de grau < n, e seja ∂g = n > 0. Existem duas possibilidades: ∂f > ∂g ou
∂f ≤ ∂g.

22
Se ∂f > ∂g, então, podemos escrever g = f.0 + g, isto é, basta considerar q = 0 e
r = g.
Suponhamos ∂f ≤ ∂g = n > 0 e sejam

f = am tm + · · · + a0 g = bn tn + . . . + b0 ,

onde am ̸= 0, bn ̸= 0 e m ≤ n.
Seja g1 = bn a−1
m t
n−m
f − g. Note que em g1 , bn tn é cancelado e, assim, ∂g1 ≤ n − 1 <
∂g. Portanto, por hipótese de indução, existem polinômios q1 e r1 sobre K tais que
g1 = f q1 + r1 e ∂r1 < ∂f .
Desse modo, g = g + g1 − g1 = g + bn a−1
m t
n−m
f − g − (f q1 + r1 ) = bn a−1
m t
n−m
f−
f q1 − r1 = f. (bn a−1 tn−m − q1 ) + −r1 . Logo, g = f.q + r, e claramente ∂r < ∂f , pois
| m {z } |{z}
q r
r = −r1 e ∂r1 < ∂f .
Finalmente, vamos provar a unicidade. Suponha g = f.q1 + r1 e g = f.q2 + r2 ,
onde ∂r1 < ∂f e ∂r2 < ∂f . Então, f (q1 − q2 ) = r2 − r1 . Se r2 − r1 ̸= 0, então,
∂(f (q1 − q2 )) = ∂f + ∂(q1 − q2 ) = ∂(r2 − r1 ) ≤ max(∂(r2 ), ∂(−r1 )) < ∂f , o que é uma
contradição. Assim, r2 − r1 = 0, isto é, r2 = r1 . Portanto, f (q1 − q2 ) = 0, o que implica
q1 − q2 = 0, pois f ̸= 0. Logo, q1 = q2 e r1 = r2 . □
Com a notação acima, q é chamado de quociente e r é chamado de resto da divisão
de g por f . O processo indutivo que aplicamos para encontrar q e r é chamado de
Algoritmo da Divisão.

Exemplo 3.1 Vamos dividir g(t) = t4 − 7t3 + 5t2 + 4 por f = t2 + 3 e encontrar o


quociente e o resto.

Observe que
t2 (t2 + 3) = t4 + 3t2

tem o mesmo coeficiente lı́der que g. Então,

g − t2 (t2 + 3) = t4 − 7t3 + 5t2 + 4 − t4 − 3t2 = −7t3 + 2t2 + 4

23
que tem o mesmo coeficiente lı́der de −7t(t2 + 3) = −7t3 − 21t. Então,

g − t2 (t2 + 3) − (−7t(t2 + 3)) = −7t3 + 2t2 + 4 + 7t3 + 21t = 2t2 + 21t + 4

que tem o mesmo coeficiente lı́der de 2(t2 + 3) = 2t2 + 6. Então,

g−t2 (t2 +3)−(−7t(t2 +3))−2(t2 +3) = 2t2 +21t+4−(2t2 +6) = 2t2 +21t+4−2t2 −6 = 21t−2

g + (−t2 + 7t − 2)(t2 + 3) = 21t − 2

g = (t2 − 7t + 2)(t2 + 3) + (21t − 2),

de onde podemos concluir que o quociente é q(t) = t2 − 7t + 2 e r(t) = 21t − 2.


O próximo passo é introduzir as noções de divisibilidade para polinômios e em par-
ticular a ideia de máximo divisor comum, que é crucial para a aritmética de polinômios.

Definição 3.1 Sejam f e g polinômios sobre um subcorpo K do corpo dos números


complexos. Dizemos que f divide g (ou f é um fator de g ou g é um múltiplo de f )
se existir um polinômio h sobre K tal que g = f h. Vamos usar a notação f | g se f
divide g; e a notação f ∤ g se f não divide g.

Definição 3.2 Um polinômio d sobre um subcorpo K de C é um máximo divisor co-


mum dos polinômios (mdc) f e g se satisfaz as seguintes condições:

(i) d | f e d | g;

(ii) se e é um polinômio sobre K tal que e | f e e | g, então, e | d.

Note que definimos “um” máximo divisor comum ao invés de “o” máximo divisor
comum, devido ao fato que não precisa ser único. O próximo lema mostra que são
únicos a menos de fatores constantes.

Lema 3.2 Se d é um mdc dos polinômios f e g sobre um subcorpo K de C, e se


0 ̸= k ∈ K, então kd também é um mdc de f e g. Além disso, se d e e são mdc’s de
f e g, então, existe um elemento não nulo k ∈ K tal que e = kd.

24
Demonstração: Suponhamos que d é um mdc de f e g, então, d | f e d | g, isto é,
existem f1 e g1 tais que f = d.f1 e g = d.g1 . Seja k ∈ K tal que k ̸= 0. Assim,
f = k.d. fk1 e g = k.d. gk1 , o que nos permite concluir que kd | f e kd | g. Se e é um
polinômio sobre K tal que e | f e e | g, então, como d é um mdc de f e g, temos que
e | d, isto é, existe um polinômio d1 sobre K tal que d = ed1 , o que implica kd = ked1 .
Assim, e | kd. Portanto, kd é um mdc de f e g.
Agora, suponha que d e e são mdc’s de f e g. Como d | f , d | g e e é um mdc de f
e g, então, d | e. Do mesmo modo, como e | f , e | g e d é um mdc de f e g, então, e | d.
Assim, como d | e, temos que o grau de d é menor ou igual do grau de e e e = kd, para
algum polinômio k. Além disso, como e | d, também temos que o grau de e é menor
ou igual ao grau de d. Portanto, o grau de e é igual ao grau de d. Consequentemente,
a igualdade ∂e = ∂k + ∂d implica ∂k = 0. Logo, k ∈ K. Finalmente, como e ̸= 0, pois
e é um mdc de f e g, podemos concluir que k ̸= 0. □

Vamos provar que quaisquer dois polinômios não nulos tem um máximo divisor
comum fornecendo um método para calcular um. Este método é uma generalização
da técnica usada por Euclides em torno de 600 A.C. para calcular mdc de números
inteiros, e é conhecida como Algoritmo de Euclides.

Algoritmo de Euclides
Entrada: Dois polinômios f e g sobre K, ambos não nulos.
Processo: Por conveniência sejam f = r−1 e g = r0 . Use o Algoritmo da Divisão
sucessivas vezes para encontrar polinômios qj e ri tais que

r−1 = q1 r0 + r1 ∂r1 < ∂r0

r0 = q2 r1 + r2 ∂r2 < ∂r1

r1 = q3 r2 + r3 ∂r3 < ∂r2


..
.

ri = qi+2 ri+1 + ri+2 ∂ri+2 < ∂ri−1

25
Como os graus dos ri ’s vão diminuindo, obrigatoriamente o processo termina, o
que acontece somente se algum rs+2 = 0. Neste caso, a última equação na lista seria
rs = qs+2 rs+1 + rs+2 = qs+2 rs+1 .
Saı́da: Um polinômio que é um máximo divisor comum de f e g.

Teorema 3.3 Com a notação acima, rs+1 é um mdc de f e g.

Demonstração: Inicialmente, vejamos que rs+1 divide f e rs+1 divide g. Claramente,


rs+1 | rs+1 . Pela equação rs = qs+2 rs+1 , temos que rs+1 | rs .
Analogamente, pelas equações

rs−1 = qs+1 rs + rs+1 = qs+1 qs+2 rs+1 + rs+1 = (qs+1 qs+2 )rs+1

temos que rs+1 | rs−1 .


Assim, sucessivamente, podemos provar que rs+1 | ri , para todo i. Em particular,
rs+1 | r0 = g e rs+1 | r−1 = f .
Agora, suponha que e | f e e | g. Pela equação, r−1 = q1 r0 + r1 , temos que e | r1 .
Assim, como e | r0 = g e e | r1 , pela equação r0 = q2 r1 + r2 , temos que e | r2 . Assim,
sucessivamente, podemos provar que e | ri , para todo i. Em particular, e | rs+1 . □

Exemplo 3.2 Sejam f = t4 +2t3 +2t2 +2t+1 e g = t2 −1 sobre Q. Vamos determinar


um mdc de f e g.

t4 + 2t3 + 2t2 + 2t + 1 = (t2 + 2t + 3)(t2 − 1) + 4t + 4


 
2 1 1
t −1= t− (4t + 4) + 0
4 4
Portanto 4t + 4 é um mdc de f e g e, assim, 14 (4t + 4) = t + 1 também é um mdc
de f e g.

Terminamos essa seção deduzindo um resultado importante sobre o mdc de dois


polinômios.

Teorema 3.4 Sejam f e g dois polinômios sobre um subcorpo K de C e seja d um


mdc de f e g. Então, existem dois polinômios a, b sobre K tais que d = af + bg.

26
Demonstração: Como mdc’s são únicos a menos de fatores constantes, usando o
Algoritmo de Euclides, podemos assumir que d = rs+1 , onde são válidas todas as
igualdades anteriores do processo do Algoritmo de Euclides.
Vamos provar por indução que existem polinômios ai e bi tais que d = ai ri + bi ri+1 .
Inicialmente, observe que isso é verdadeiro se i = s + 1, pois basta considerar as+1 = 1
e bs+1 = 0.
Pelo processo do Algoritmo de Euclides sabemos que

ri−1 = qi+1 ri + ri+1 , ∂ri+1 < ∂ri .

ri+1 = ri−1 − qi+1 ri

Consequentemente,

d = ai ri + bi ri+1 = ai ri + bi (ri−1 − qi+1 ri )

d = bi ri−1 + (ai − bi qi+1 ) ri


|{z} | {z }
ai−1 bi−1

Assim, sucessivamente, podemos provar que d = a−1 r−1 + b−1 r0 = af + bg, onde
a = a−1 e b = b−1 , o que completa a prova. □

3.2 Irredutibilidade
Agora, vamos investigar o análogo, para polinômios, de números primos. O conceito
requerido é irredutibilidade. Em particular, vamos provar que todo polinômio sobre
um subanel de C pode ser escrito como um produto de irredutı́veis de um modo essen-
cialmente único.
Um número inteiro é primo se não pode ser escrito como um produto de números
inteiros menores. O análogo para polinômios é similar; interpretamos menor como de
menor grau. Então, a próxima definição fornece o análogo polinomial de um número
primo.

27
Definição 3.3 Um polinômio sobre um subanel R de C é redutı́vel se é um produto de
dois polinômios sobre R de grau menor. Caso contrário, ele é dito irredutı́vel.

Exemplo 3.3 Todos os polinômios de grau 0 ou de grau 1 são irredutı́veis, porque eles
não podem ser escritos como um produto de polinômios de grau menor.

Exemplo 3.4 O polinômio t2 −2 é irredutı́vel sobre Q. De fato, se t2 −2 fosse redutı́vel


sobre Q, então, existiriam a, b, c, d ∈ Q tais que

t2 − 2 = (at + b)(ct + d)

t2 − 2 = act2 + (ad + bc)t + bd

o que implica ac = 1, ad + bc = 0 e bd = −2. Assim, como c ̸= 0 (pois ac = 1),


temos que a = 1c . Substituindo na equação ad + bc = 0, temos 1c d + bc = 0, o que
d+bc2
implica c
= 0. Assim, d + bc2 = 0. Substituindo d = −bc2 na equação bd = −2,
obtemos b(−bc2 ) = −2, o que implica −b2 c2 = −2. Portanto, (bc)2 = 2, o que é uma
contradição, pois bc ∈ Q e não existe um número racional cujo quadrado seja 2.

√ √
Exemplo 3.5 O polinômio t2 − 2 é redutı́vel sobre R, pois t2 − 2 = (t − 2)(t + 2).

Os exemplos anteriores mostram que um polinômio irredutı́vel sobre um subcorpo


de C pode se tornar redutı́vel sobre um subcorpo maior de C.

Exemplo 3.6 O polinômio 6t+3 é irredutı́vel em Z[t]. De fato, se 6t+3 fosse redutı́vel,
teria que se fatorar como um produto de polinômios de grau zero, o que não é possı́vel.
Note que embora 6t + 3 = 3(2t + 1), como 2t + 1 tem grau 1, esta fatoração não torna
6t + 3 redutı́vel.

Exemplo 3.7 O polinômio constante 6 é irredutı́vel em Z[t], pois este polinômio tem
grau 0. Note novamente que embora 6 = 2.3, como 2 e 3 têm grau 0, esta fatoração
não torna 6 redutı́vel.

28
Qualquer polinômio redutı́vel pode ser escrito como o produto de dois polinômios de
grau menor. Se um destes polinômios de grau menor for redutı́vel, ele novamente poderá
ser fatorado em um produto de dois polinômios de grau menor e, assim, sucessivamente.
Este processo deve terminar porque o grau não pode decrescer indefinidamente. Esta
é a ideia por trás da demonstração do próximo teorema.

Teorema 3.5 Qualquer polinômio não nulo sobre um subanel R de C é um produto


de polinômios irredutı́veis sobre R.

Demonstração: Seja g um polinômio não nulo sobre R. Vamos proceder por indução
sobre o grau de g. Se ∂g = 0 ou 1, então, g é automaticamente irredutı́vel. Seja
∂g = n > 1 e suponhamos, por hipótese de indução, que o resultado é verdadeiro para
todo polinômio de grau < n. Se g é irredutı́vel, então, a demonstração está encerrada.
Se g é redutı́vel, então, g = hk, onde ∂h < ∂g e ∂k < ∂g. Assim, por hipótese de
indução, h e k podem ser escritos como um produto de polinômios irredutı́veis sobre
R. Portanto, g = hk é um produto de polinômios irredutı́veis. □

Exemplo 3.8 Podemos usar o Teorema anterior para provar irredutibilidade em al-
guns casos. Por exemplo, para cúbicas polinomiais sobre R = Z. O polinômio f (t) =
t3 − 5t + 1é irredutı́vel. De fato, se o fosse redutı́vel, teria que ser o produto de um
polinômio de grau 1 por um polinômio de grau 2, isto é, f (t) = (αt + β)(γt2 + δt + ω).
Desse modo, t3 − 5t + 1 = αγt3 + (αδ + βγ)t2 + (αω + βδ)t + βω. Assim,

αγ = 1, αδ + βγ = 0, αω + βδ = −5, βω = 1.

Consequentemente α = γ = 1 ou α = γ = −1; e β = ω = 1 ou β = ω = −1.


Portanto, αt + β = t + 1 ou −t + 1 ou t − 1 ou −t − 1, ou seja, 1 é raiz de f ou −1 é
raiz de f . Porém, f (1) = −5 ̸= 0 e f (−1) = 5 ̸= 0, o que é uma contradição.

Polinômios irredutı́veis são análogos a números primos. A importância dos números


primos em Z decorre não tanto da possibilidade de fatorar todo inteiro em primos,
mas mais da unicidade (a menos de ordem) dos fatores primos. Da mesma forma,

29
a importância dos polinômios irredutı́veis depende de um teorema de unicidade. A
unicidade da fatoração não é óbvia. Em certos casos é possı́vel escrever todo elemento
como um produto de elementos irredutı́veis de modos diferentes. Vamos nos preocupar
apenas em provar a unicidade de fatoração para polinômios sobre um subcorpo K de
C. É possı́vel provar teoremas mais gerais introduzindo a ideia de domı́nio de fatoração
única.
Por conveniência introduzimos a seguinte:

Definição 3.4 Se f e g são polinômios sobre um subcorpo K de C com mdc igual a


1, dizemos que f e g são coprimos ou f é primo a g.

Lema 3.6 Sejam K um subcorpo de C, f um polinômio irredutı́vel sobre K, e g, h


polinômios sobre K. Se f divide gh, então, f divide g ou f divide h.

Demonstração: Se f | g, então, o lema está provado. Suponhamos que f ∤ g.


Afirmação: f e g são coprimos. Para provar isso, seja d um mdc de f e g. Em
particular, d | f , isto é, existe um polinômio d′ sobre K tal que d.d′ = f . Como f
é irredutı́vel, f não pode ser escrito como um produto de polinômios de grau menor.
Então, ∂d = 0 e ∂d′ = ∂f ; ou ∂d = ∂f e ∂d′ = 0.
Se ∂d = ∂f , então, d = kf , para algum k ∈ K. Como d é um mdc de f e g, então,
d = kf | g, o que implica f | g, o que é uma contradição, pois estamos supondo f ∤ g.
Se ∂d = 0, então, d = k, para algum k ∈ K. Neste caso, 1 também é um mdc de f
e g. Portanto, f e g são coprimos.
Assim, pelo Teorema 3.4, existem polinômios a e b sobre K tais que 1 = af + bg.
Então, h = haf + hbg. Agora, como f | haf e f | hbg (pois f divide gh por hipótese),
então, f | h, o que completa a demonstração. □
Finalmente, podemos provar o teorema de unicidade.

Teorema 3.7 Para qualquer subcorpo K de C, fatoração de polinômios sobre K em


polinômios irredutı́veis é única a menos de fatores constantes e da ordem em que os
fatores são escritos.

30
Demonstração: Suponha que f = f1 f2 . . . fr = g1 g2 . . . gs , onde f é um polinômio
sobre K e f1 , . . . , fr , g1 , . . . , gs são polinômios irredutı́veis sobre K. Além disso, também
podemos supor sem perda de generalidade que s ≥ r.
Vamos analisar duas possibilidades:

(i) Se todos os fi ’s são constantes, então, como f = f1 . . . fr , podemos concluir que


f é constante, isto é f = k ∈ K. Portanto, k = g1 g2 . . . gs , o que nos permite
concluir que todos os gj ’s também são constantes.

(ii) Se existir fl que não é constante, então, podemos reescrever f = fi1 fi2 . . . fir′ ,
de tal modo que nenhum ft seja constante. De fato, para isso basta multiplicar
fl pelos termos constantes. Assim, como fi1 (fi2 . . . fir′ ) = g1 g2 . . . gs , temos que
fi1 | g1 g2 . . . gs . Consequentemente, aplicando o Lema 3.6 sucessivas vezes, temos
que fi1 | g1 ou fi1 | g2 ou fi1 | g3 ou . . . ou fi1 | gs , isto é, fi1 divide gj para algum
j. Podemos reescrever o produto g1 g2 . . . gs de tal modo que fi1 | g1 .

Neste caso, existe um polinômio h1 sobre C tal que fi1 .h1 = g1 . Assim, como
g1 é irredutı́vel, podem ocorrer dois casos: ∂fi1 = ∂g1 ou ∂h1 = ∂g1 . Porém, se
∂h1 = ∂g1 , então, ∂fi1 = 0, o que é uma contradição, pois fi1 não é constante.
Portanto, ∂fi1 = ∂g1 e ∂h1 = 0. Desse modo, fi1 = ki1 g1 , para alguma constante
ki1 .

Similarmente, podemos provar que fi2 = ki2 g2 , . . . , fir′ = kir′ gr′ , onde ki1 , . . . , kir′
são constantes.

Note que os eventuais gl (l > r′ ) remanescentes são todos constantes, pois caso
contrário, o grau do lado direito da igualdade fi1 (fi2 . . . fir′ ) = g1 g2 . . . gs teria
grau maior que o lado esquerdo da igualdade, o que seria uma contradição. Por-
tanto, o teorema está provado.

31
3.3 Lema de Gauss
Em geral é muito difı́cil decidir se um polinômio dado é irredutı́vel. Como um exemplo,
pense sobre

t16 + t15 + t14 + t13 + t12 + t11 + t10 + t9 + t8 + t7 + t6 + t5 + t4 + t3 + t2 + t + 1.

Devemos considerar precisamente esse polinômio no Capı́tulo 19 em conexão com


um polı́gono regular de 17 lados, e sua irredutibilidade (ou não) será crucial.
Testar a irredutibilidade tentando todos os fatores possı́veis é frequentemente inútil.
De fato, à primeira vista existem infinitos fatores a tentar, embora com cortes curtos
adequados as possibilidades possam ser reduzidas a número finito. O métode resultante
pode ser aplicado, em princı́pio, a polinômios sobre Q, por exemplo. Mesmo assim, o
método não é realmente prático.
Ao invés disso, temos que inventar alguns truques úteis. Nas próximas duas seções
vamos descrever dois deles: O Critério de Eisenstein e a redução módulo um primo.
Ambos os truques se aplicam em um primeiro momento a polinômios sobre Z. Contudo,
é conhecido que irredutibilidade sobre Z é equivalente à irredutibilidade de Q. Isto foi
provado por Gauss, e é um resultado extremamente útil que vamos usar repetidamente.

Lema 3.8 (Lema de Gauss) Seja f um polinômio sobre Z que é irredutı́vel sobre Z.
Então, f considerado como um polinômio sobre Q, também é irredutı́vel sobre Q.

Demonstração: Suponha que f é irredutı́vel sobre Z, mas é redutı́vel sobre Q. Assim,


podemos decompor f = g.h, onde g e h são polinômios sobre Q, de grau menor e
queremos obter uma contradição. Multiplicando ambos os membros pelo produto dos
denominadores dos coeficientes de g e h, podemos reescrever essa equação na forma
nf = g ′ .h′ , onde n ∈ Z e g ′ , h′ são polinômios sobre Z.
Vamos provar que podemos cancelar todos os fatores primos de n um por um sem
sair de Z[t].
Suponha que p é um fator primo de n, isto é, n = pl, para algum l ∈ Z. Conse-
quentemente, plf = g ′ .h′ , isto é, p | g ′ .h′ . Assim, p divide todos os coeficientes de g ′ .h′ .

32
Mas, vamos mostrar que p também divide todos os coeficientes de g ′ e p também divide
todos os coeficientes de h′ .
Afirmação: Se g ′ = g0 + g1 t + · · · + gr tr e h′ = h0 + h1 t + · · · + hs ts , então, p divide
todos os coeficientes gi ou p divide todos os coeficientes hj .
Suponhamos que não acontece isso, isto é, p não divide todos os coeficientes gi e p
não divide todos os coeficientes hj . Seja i o menor ı́ndice tal que p ∤ gi e seja j o menor
ı́ndice tal que p ∤ hj .
Note que como p divide todos os coeficientes de g ′ .h′ , em particular, p divide o
coeficiente de ti+j em g ′ .h′ , o qual é

g0 hi+j + g1 hi+j−1 + · · · + gi−1 hj+1 + gi hj + gi+1 hj−1 + gi+2 hj−2 + · · · + gi+j−1 h1 + gi+j h0

(g0 hi+j +g1 hi+j−1 +· · ·+gi−1 hj+1 )+gi hj +(gi+1 hj−1 +gi+2 hj−2 +· · ·+gi+j−1 h1 +gi+j h0 )

Como i é o menor ı́ndice tal que p ∤ gi , temos que p | g0 , p |g1 , . . ., p | gi−1 .


Consequentemente, p | g0 hi+j , p | g1 hi+j−1 , . . ., p | gi−1 hj+1 .
Do mesmo modo, como j é o menor ı́ndice tal que p ∤ hj , temos que p | hj−1 , p | hj−2 ,
. . ., p | h1 , p | h0 . Consequentemente, p | (gi+1 hj−1 , p | gi+2 hj−2 , . . ., p | gi+j−1 h1 ,
p | gi+j h0 .
Portanto, a prı́ncipio p divide todos os coeficientes de ti+j , exceto possivelmente o
coeficiente gi hj . Porém, como p divide a expressão toda do coeficiente de ti+j , temos
que p também divide gi hj .
Lema de Euclides Seja p um número primo e assuma que p divide o produto de
dois números inteiros a e b. Então, p | a ou p | b.
Consequentemente, pelo Lema de Euclides, temos que p | gi ou p | hj , o que é uma
contradição. Portanto, a afirmação está provada.
Sem perda de generalidade, podemos assumir que p divide todo coeficiente gi .
Então, como g ′ = g0 + g1 t + · · · + gr tr e cada gi é um múltiplo de p, colocando p
em evidência do lado direito da igualdade, temos que g ′ = pg ′′ , onde g ′′ também é um
polinômio sobre Z e possui o mesmo grau que g ′ (ou de g).

33
Como p é um fator primo de n, sabemos que p | n e, assim, n = pn1 , para algum
n1 ∈ Z. Além disso, nf = g ′ h′ , o que implica pn1 f = g ′ h′ . Desse modo, como g ′ = pg ′′ ,
temos que pn1 f = pg ′′ h′ , o que implica n1 f = g ′′ h′ . Note que esta última igualdade é
da mesma forma que a igualdade nf = g ′ .h′ e no processo um fator primo p de n foi
removido. Podemos repetir o processo sucessivas vezes para eliminar todos os fatores
primos de n e chegar a uma igualdade da forma f = gh, onde g e h são polinômios
sobre Z, que são múltiplos racionais dos polinômios iniciais g e h. Portanto, ∂g = ∂g e
∂h = ∂h, o que contradiz a irredutibilidade de f sobre Z. Logo, o lema está provado.

Corolário 3.9 Seja f ∈ Z[t] e suponha que sobre Q[t], existe uma fatoração em irre-
dutı́veis f = g1 . . . gs . Então, existem ai ∈ Q tais que ai gi ∈ Z[t] e a1 . . . as = 1. Além
disso, f = (a1 g1 ) . . . (as gs ) é uma fatoração de f em irredutı́veis em Z[t].

Demonstração: Inicialmente, fatoramos f = h1 . . . hr em um produto de irredutı́veis


em Z[t]. Como cada hj é irredutı́vel sobre Z, pelo Lema de Gauss segue que cada hj é
irredutı́vel sobre Q. Pelo teorema anterior, sabemos que a fatoração de polinômios sobre
Q em polinômios irredutı́veis é única a menos de fatores constantes e da ordem em que
os fatores são escritos. Portanto, como f = h1 . . . hr e f = g1 . . . gs sobre Q, devemos ter
r = s e hj = aj gj , para algum aj ∈ Q. Consequentemente, f = a1 g1 . . . as gs = g1 . . . gs ,
o que implica a1 . . . as = 1 e o corolário está provado. □

3.4 O critério de Eisenstein


Ferdinand Gotthold Eisenstein foi um estudante de Gauss e impressionou positivamente
o seu tutor. Podemos aplicar o Lema de Gauss para provar o critério de seu ex-aluno.

Teorema 3.10 (Critério de Eisenstein) seja f (t) = a0 + a1 t + · · · + an tn um polinômio


sobre Z. Suponha que exista um primo q tal que

(1) q ∤ an ;

34
(2) q | ai (i = 0, . . . , n − 1);

(3) q 2 ∤ a0 . Então, f é irredutı́vel sobre Q.

Demonstração: Pelo Lema de Gauss, basta mostrar que f é irredutı́vel sobre Z.


Suponha por contradição que f não é irredutı́vel sobre Z, isto é, existem polinômios

g = b0 + b1 t + · · · + br tr e h = c0 + c1 t + · · · + cs ts

de menor grau sobre Z tais que f = gh com r ≥ 1 e s ≥ 1. Podemos assumir sem


perda de generalidade que s ≥ r. Assim, como a0 + a1 t + · · · + an tn = (b0 + b1 t +
· · · + br tr )(c0 + c1 t + · · · + cs ts ) temos r + s = n e a0 = b0 c0 . Por (2) sabemos que
q | a0 = b0 c0 . Como q é primo, pelo Lema de Euclides, q | b0 ou q | c0 . Além disso,
note que se q | b0 e q | c0 , então, q 2 | b0 c0 = a0 , o que é uma contradição, pelo item
(iii). Portanto q | b0 e q ∤ c0 ; ou q ∤ b0 e q | c0 .
Vamos assumir, sem perda de generalidade, que q | b0 e q ∤ c0 . Observe que como

a0 = b 0 c 0

a1 = b 0 c 1 + b 1 c 0

a2 = b 0 c 2 + b 1 c 1 + b 2 c 0
..
.

ar = b0 cr + b1 cr−1 + · · · + br−1 c1 + br c0
..
.

as = b0 cs + b1 cs−1 + · · · + br−1 cs−r+1 + br cs−r


..
.

an−1 = br−1 cs + br cs−1

an = b r c s

• pela segunda equação, podemos concluir que q | b1 , pois q | b0 , q | a1 e q ∤ c0 ;

35
• pela terceira equação, podemos concluir que q | b2 , pois q | b0 , q | a2 , q | b1 e
q ∤ c0 ;
.
• ..;

• pela r + 1-ésima equação, podemos concluir que q | br , seguindo o mesmo proce-


dimento anterior.

Portanto, pela equação an = br cs , podemos concluir que q | an , o que é uma


contradição, por hipótese. □

Exemplo 3.9 Seja


2 5 1
f (t) = t5 + t4 + t3 + ∈ Q[t]
9 3 3
. Assim,
9f (t) = 2t5 + 15t4 + 9t3 + 3 ∈ Z[t]

. Neste caso, temos a0 = 3, a1 = 0, a2 = 0, a3 = 9, a4 = 15 e a5 = 2. Agora,


considerando q = 3, segue que

(1) q = 3 ∤ a5 = 2;

(2) q = 3 | a0 = 3, q = 3 | a1 = 0, q = 3 | a2 = 0, q = 3 | a3 = 9, q = 3 | a4 = 15;

(3) q 2 = 9 ∤ a0 = 3.

Portanto, pelo Critério de Eisenstein, 9f é irredutı́vel sobre Q. Logo, f é irredutı́vel


sobre Q.
 
p
Lema 3.11 Se p é primo, então, o coeficiente binomial   é divisı́vel por p, se
r
1 ≤ r ≤ p − 1.
 
p
Demonstração: O coeficiente binomial   é um número inteiro, e
r
 
p p!
 = .
r r!(p − r)!

36
Note que se r = 0, então,
 
p p!
 = = 1;
0 0!(p − 0)!

e se r = p, então,  
p
  = p! = 1.
p p!0!

Entretanto, se 1 ≤ r ≤ p − 1, então,
 
p
 
 =p p − 1!
.
r r!(p − r)!

 
p
Neste caso, p |  . □
r

Lema 3.12 Se p é um primo, então, o polinômio f (t) = 1 + t + · · · + tp−1 é irredutı́vel


sobre Q.

tp −1
Demonstração: Inicialmente, observe que a igualdade f (t) = t−1
é válida. Seja
t = 1 − u, onde u é uma nova indeterminada. Note que se f (t) é redutı́vel sobre Q,
então, existem polinômios g e h sobre Q tais que f (t) = g(t)h(t). Assim, f (1 + u) =
g(1 + u)h(1 + u), isto é f (1 + u) é redutı́vel sobre Q. Do mesmo modo, se f (1 + u) é
redutı́vel sobre Q, então, existem polinômios g ′ e h′ tais que f (1+u) = g(1+u)h(1+u),
o que implica f (1 + (t − 1)) = g ′ (1 + (t − 1))h′ (1 + (t − 1)) = g ′ (t)h′ (t), isto é, f (t)
é redutı́vel sobre Q. Portanto, f (t) é irredutı́vel sobre Q se, e somente se, f (1 + u) é
irredutı́vel sobre Q. Entretanto,

(1 + u)p − 1 (1 + u)p − 1
f (1 + u) = =
(1 + u) − 1 u
Assim, como
       
p p p p
(a + b)p =   ap b 0 +   ap−1 b1 + · · · +   a1 bp−1 +   a0 b p ,
0 1 p−1 p

37
temos
       
p p p p
(1 + u)p =   1p u0 +   1p−1 u1 + · · · +   11 up−1 +   10 up .
0 1 p−1 p
   
p p
(1 + u)p = 1 +  u + ··· +   up−1 + up .
1 p−1
Consequentemente,
   
p p
1+ u + ··· +   up−1 + up − 1
(1 + u)p − 1 1 p−1
f (1 + u) = =
u u
     
p p p
f (1 + u) = 1 +   +   u + · · · +   up−2 + up−1
1 2 p−1
 
p
Assim, como pelo Lema anterior, p |   para 1 ≤ r ≤ p − 1, p ∤ 1 e p2 ∤
r
1, pelo Critério de Eisenstein, podemos concluir que f (1 + u) é irredutı́vel sobre Q.
Consequentemente, f (t) também é irredutı́vel sobre Q. □

Escolhendo p = 17, temos que o polinômio

t16 + t15 + t14 + t13 + t12 + t11 + t10 + t9 + t8 + t7 + t6 + t5 + t4 + t3 + t2 + t + 1

é irredutı́vel sobre Q.

3.5 Redução módulo p


Um outro truque para provar irredutibilidade de polinômios em Z[t] envolve “reduzir”
o polinômio módulo um número inteiro primo p.
Relembre que se n ∈ Z, dois inteiros a e b são congruentes módulo n, e escrevemos
a ≡ b(mod n) se a − b é divisı́vel por n. Congruência módulo n é uma relação de
equivalência, e o conjunto das classes de equivalência é denotado por Zn .

38
O teste de irredutibilidade que agora queremos discutir pode ser mais facilmente
explicado por um exemplo. A ideia é a seguinte: existe uma aplicação natural Z → Zn
em que cada m ∈ Z é aplicado em sua classe de equivalência módulo n. Esta aplicação
pode ser estendida de modo natural para uma aplicação Z[t] → Zn [t]. Agora, um
polinômio redutı́vel sobre Z é um produto gh de polinômios de menor grau e essa
fatoração é preservada pela aplicação. Se n não dividir o coeficiente do termo de maior
grau do polinômio dado, então, a imagem também é redutı́vel sobre Zn . Portanto, se a
imagem de um polinômio é irredutı́vel sobre Zn e n não dividir o coeficiente do termo de
maior grau do polinômio dado, então, o polinômio original deve ser irredutı́vel sobre Z.
Como Zn é finito, existe somente uma quantidade finita de possibilidades para checar
quando decidir irredutibilidade. Na prática, o truque é escolher o valor certo para n.

Exemplo 3.10 Considere g(t) = t4 + 15t3 + 7 sobre Z. Escolhemos n = 5. Note que 5


não divide o coeficiente do termo de maior grau de g, o qual é 1. Sobre Z5 , g se torna
t4 + 2. Vejamos que este polinômio é irredutı́vel sobre Z5 . Se t4 + 2 fosse redutı́vel sobre
Z5 , então, t4 + 2 seria um produto de um polinômio de grau 1 por um polinômio de
grau 3; ou t4 + 2 seria produto de polinômios de grau 2. Porém, note que a primeira
possibilidade não pode ocorrer, pois g(0) = 2 ̸= 0, g(1) = 3 ̸= 0, g(2) = 18 = 3 ̸= 0,
g(3) = 83 = 3 ̸= 0 e g(4) = 258 = 3 ̸= 0 em Z5 . Se a segunda possibilidade ocorresse,
existiriam polinômios h1 (t) = a′ t2 + b′ t + c′ e h2 (t) = d′ t2 + e′ t + f ′ sobre Z tais que
a′ ̸= 0, d′ ̸= 0 e g = h1 .h2 , isto é,

b′ c′ e′ f ′
   
4 ′ 2 ′ ′ ′ 2 ′ 2 ′ ′′2
t + 2 = (a t + b t + c )(d t + e t + f ) = a t + ′ t + ′ d t + ′ + ′ .
a a d d
b′ c′ e′ f′
Assim, 1 = a′ d′ . Sejam a′
= b, a′
= c, d′
=ee d′
= f . Temos

t4 + 2 = (t2 + bt + c)(t2 + et + f ) = t4 + et3 + f t2 + bt3 + bet2 + bf t + ct2 + cet + cf

t4 + 2 = t4 + (e + b)t3 + (f + be + c)t2 + (bf + ce)t + cf

Consequentemente, e + b = 0, f + be + c = 0, bf + ce = 0 e cf = 2. Desse modo,


e = −b, o que implica 0 = bf + ce = bf − bc = b(f − c). Assim, como Z5 é um corpo,

39
sabemos que Z5 não possui divisores de zero, o que nos permite concluir que b = 0 ou
f = c.
Se b = 0, então, f + c = 0, isto é, f = −c, o que implica −c2 = 2, isto é,
c2 = −2 = 3, o que é uma contradição, pois 02 = 0, 12 = 1, 22 = 4, 32 = 4 e 42 = 1.
Se f = c, então, cf = 2 implica c2 = 2, o que é uma contradição, pois nenhum
elemento de Z5 elevado ao quadrado é igual a 2.
Portanto, t4 + 2 é irredutı́vel sobre Z5 e t4 + 15t3 + 7 é irredutı́vel sobre Z. Além
disso, pelo Lema de Gauss, também podemos concluir que t4 + 15t3 + 7 é irredutı́vel
sobre Q.

3.6 Zeros de polinômios


Já estudamos os zeros de um polinômio sobre C. Será útil empregar uma terminologia
similar para polinômios sobre um subanel R de C, porque poderemos manter o controle
de onde os zeros estão. Começamos com uma definição formal.

Definição 3.5 Seja R um subanel de C, e seja f um polinômio sobre R. Um elemento


α ∈ R tal que f (α) = 0 é um zero de f em R.

Lema 3.13 Seja f um polinômio sobre um subcorpo K de C. Um elemento α ∈ K é


um zero de f se, e somente se, (t − α) | f (t) em K[t].

Demonstração: Pelo Teorema do Resto, provado no capı́tulo anterior, já sabemos que
α é um zero de f se, e somente se, (t − α) | f (t) em C[t].
Se (t − α) | f (t) ∈ K[t], então, f (t) = (t − α)g(t), para algum polinômio g sobre
K. Assim, f (α) = (α − α)g(α) = 0.
Reciprocamente, suponhamos que α ∈ K é um zero de f , isto é, f (α) = 0. Pelo
Algoritmo da Divisão, existem polinômios q, r ∈ K[t] tais que f (t) = (t − α)q(t) + r(t),
onde ∂r < 1. Assim, r(t) = r ∈ K. Substituindo t por α, obtemos 0 = f (α) = (α −
α)q(α)+r, isto é, r = 0, o que implica f (t) = (t−α)q(t). Portanto, (t−α) | f (t) ∈ K[t].

40
Definição 3.6 Seja f um polinômio sobre um subcorpo K de C. Um elemento α ∈ K
é um zero simples se (t − α) | f (t), mas (t − α)2 ∤ f (t). Dizemos que α é um zero de f
de multiplicidade m se (t−α)m | f (t), mas (t−α)m+1 ∤ f (t). Os zeros de multiplicidade
maior que 1 são chamados de zeros repetidos ou zeros múltiplos.

Por exemplo, t3 − 3t + 2 sobre Q tem zeros em α = 1 e α = −2, e se fatora como


(t − 1)2 (t + 2). Assim, −2 é um zero simples, pois t + 2 | f (t), mas (t + 2)2 ∤ f (t);
enquanto 1 é um zero de multiplicidade 2, pois (t − 1)2 | f (t), mas (t − 1)3 ∤ f (t).

Lema 3.14 Seja f um polinômio não nulo sobre um subcorpo K de C, e sejam α1 ,


. . ., αr todos os zeros distintos de f , com multiplicidades m1 , . . . , mr , respectivamente.
Então,
f (t) = (t − α1 )m1 . . . (t − αr )mr g(t),

onde g não tem zeros em K. Reciprocamente, se

f (t) = (t − α1 )m1 . . . (t − αr )mr g(t),

e g não tem zeros em K, então, os únicos zeros de f em K são α1 , . . . , αr com multi-


plicidades m1 , . . . , mr , respectivamente.

Demonstração: Para qualquer α ∈ K, sabemos que o polinômio t − α é irredutı́vel,


pois possui grau 1. Assim, para elementos distintos α, β ∈ K, temos que os polinômios
t − α e t − β são coprimos em K[t]. Desse modo, como provamos no Teorema 3.7 que a
fatoração de polinômios sobre K em polinômios irredutı́veis é única a menos de fatores
constantes e da ordem em que fatores são escritos, temos que f (t) = (t − α1 )m1 . . . (t −
αr )mr g(t). Além disso, g não pode ter zeros em K, pois α1 , . . ., αr são todos os zeros
distintos de f .
Reciprocamente, suponha que

f (t) = (t − α1 )m1 . . . (t − αr )mr g(t),

41
e g não tem zeros em K. Claramente, α1 , . . . , αr são zeros de f com multiplicidades
m1 , . . . , mr , respectivamente. Assim, se α é um zero de f distinto desses, então,

0 = f (α) = (α − α1 )m1 . . . (α − αr )mr g(α).

Portanto, como K é um subcorpo de C e α, α1 , . . ., αr e g(α) ∈ K, temos que


α − α1 = 0 ou . . . ou α − αr = 0 ou gα = 0, o que é uma contradição. □

Teorema 3.15 O número de zeros de um polinômio não nulo sobre um subcorpo K


de C, contado de acordo com a sua multiplicidade, é menor ou igual ao seu grau.

Demonstração: Seja f um polinômio não nulo sobre um subcorpo K de C. Sejam


α1 , . . . , αr todos os seus zeros distintos, com multiplicidades m1 , . . ., mr , respectiva-
mente. Pelo Lema anterior, temos que

f (t) = (t − α1 )m1 . . . (t − αr )mr g(t),

onde g não tem zeros em K. Assim, o número de zeros de f , contado de acordo com
a sua multiplicidade é m1 + · · · + mr < m1 + · · · + mr + ∂g = ∂f . □

42
Capı́tulo 4

Extensões de corpos

A teoria de Galois original foi redigida em termos de polinômios sobre o corpo dos
números complexos. A abordagem moderna é consequência de metódos usados, começando
por volta de 1890 e prosperando nas décadas de 20 e 30 do século XX para generalizar
a teoria para corpos arbitrários. Desse ponto de vista, o objeto central de estudo deixa
de ser polinômios e se torna uma “extensões de corpos” relacionadas a polinômios.
Todo polinômio f sobre um corpo K define outro corpo L contendo K. Existem van-
tagens conceituais na criação da teoria a partir desse ponto de vista. Neste capı́tulo
definimos extensões de corpos (sempre trabalhando sobre C) e explicamos a conexão
com polinômios.

4.1 Extensões de corpos


Suponha que quiséssemos estudar a quártica polinomial f (t) = t4 − 4t2 − 5 sobre Q.
Sua fatoração irredutı́vel sobre Q é

f (t) = (t2 + 1)(t2 − 5).


√ √
Então, os zeros de f em C são i, −i, 5 e − 5. Existe um subcorpo natural L
de C associado com os zeros. De fato, existe um menor subcorpo que contém os zeros

43
desse polinômio e tal subcorpo é único. Futuramente, vamos verificar que
n √ √ o
L = p + qi + r 5 + si 5 | p, q, r, s ∈ Q .

Assim, o estudo de um polinômio sobre Q nos conduz a considerar um subcorpo


L de C que contenha Q. Do mesmo modo, o estudo de um polinômio sobre um
subcorpo K de C nos leva a um subcorpo L de C que contenha K. Vamos chamar L
de “extensão” de K. Por razões técnicas, esta definição é muito restritiva. Queremos
considerar também casos onde L contenha um subcorpo isomorfo a K, mas que não
seja necessariamente igual a K.

Definição 4.1 Uma extensão de corpos é um monomorfismo i : K → L, onde K e L


são subcorpos de C. Dizemos que K é o corpo menor e L é o corpo maior.

É rotineiro pensar em uma extensão de corpos como sendo um par de corpos (K, L),
onde é claro qual monomorfismo está intrı́nseco.

Exemplo 4.1 As inclusões naturais i1 : Q → R, i2 : R → C e i3 : Q → C são mono-


morfismos. Assim, (Q, R), (R, C) e (Q, C) são extensões de corpos.


Exemplo 4.2 Seja K o conjunto de todos os números reais da forma p + q 2, onde
p, q ∈ Q. Já provamos que K é um subcorpo de C no Capı́tulo 1. A inclusão natural
i : Q → K é um monomorfismo. Assim, (Q, K) é uma extensão de corpos.

Se i : K → L é uma extensão de corpos, então, podemos identificar K com sua


imagem i(K), isto é, i : K → i(K) é um isomorfismo, de modo que i pode ser pensado
como uma aplicação de inclusão e K pode ser pensado como um subcorpo de L. Sob
essas condições, usamos a notação L : K para a extensão e dizemos que L é uma
extensão de K.

Definição 4.2 Dado um subconjunto X de C, o subcorpo de C gerado por X é o menor


subcorpo de C que contém X.

44
Proposição 4.1 Todo subcorpo de C contém Q.

Demonstração: Seja K um subcorpo de C. Então, por definição, 0 ∈ K e 1 ∈ K.


Consequentemente, |1 + ·{z
· · + 1} = n ∈ K, para todo inteiro n > 0. Agora, como
n vezes
K é fechado para inversos aditivos, então, −n também pertence a K. Assim, Z ⊆
K. Finalmente, se p, q ∈ Z e q ̸= 0, como K é fechado para produtos e inversos
multiplicativos, temos que pq −1 ∈ K. Portanto, Q ⊆ K. □

Corolário 4.2 Seja X um subconjunto de C. Então, o subcorpo de C gerado por X


contém Q.

Demonstração: Como o subcorpo de C gerado por X é um subcorpo, então, pela


proposição anterior, ele contém Q. □

Por causa deste corolário, vamos usar a notação Q(X) para o subcorpo de C gerado
por X.

Exemplo 4.3 Vamos encontrar o subcorpo K de C gerado pelo conjunto X = {1, i}.

Demonstração: Pela Proposição 4.1, K deve conter Q. Como K é fechado para


operações aritméticas, K deve conter todos os números complexos da forma p + qi,
onde p, q ∈ Q. Seja M = {p + qi | p, q ∈ Q}. Portanto, M ⊆ K.
Afirmação: M é um subcorpo de C. De fato,

(i) M ⊆ C;

(ii) 1 = 1 + 0i ∈ M ;

(iii) se p + qi ∈ M e r + si ∈ M , então, (p + qi) + (r + si) = (p + r) + (q + s)i ∈ M ;

(iv) se p + qi ∈ M , então, −(p + qi) = −p + (−q)i ∈ M ;

(v) se p + qi ∈ M e r + si ∈ M , então, (p + qi)(r + si) = (pq − qs) + (qr + ps)i ∈ M ;

p q
(vi) se p + qi ∈ M e p + qi ̸= 0, então, (p + qi)−1 = p2 +q 2
− p2 +q 2
i ∈ M.

45
Assim, M é um subcorpo de C e M contém X, pois 1 = 1+0i ∈ M e i = 0+1i ∈ M .
Como K é o subcorpo de C gerado por X, então, K é o menor subcorpo de C que
contém X. Consequentemente, K ⊆ M . Logo, K = M . □
No caso de uma extensão de corpos L : K, estamos principalmente interessados em
subcorpos que estão entre K e L, o que significa que podemos restringir nossa atenção
para subconjuntos da forma K ∪ Y , onde Y ⊆ L.

Definição 4.3 Se L : K é uma extensão de corpos e Y é um subconjunto de L, então,


o subcorpo de C gerado por K ∪ Y é escrito K(Y ) e é dito ser obtido a partir de K
adicionando Y .

Note que se L : K é uma extensão de corpos e Y é um subconjunto de L, então


como K(Y ) é o menor subcorpo de C que contém K ∪ Y , L é um subcorpo de C e
L contém K, pois i : K → L é a inclusão natural; e L contém Y , então, K(Y ) ⊆ L.
Além disso, veremos que de modo geral K(Y ) é consideravelmente maior que K ∪ Y .
Vamos cometer alguns abusos de notação que serão úteis. Se Y tem um único
elemento y, vamos escrever K(y) ao invés de K ({y}). Do mesmo modo, vamos escrever
K (y1 , . . . , yn ) ao invés de K({y1 , . . . , yn }).

 √
Exemplo 4.4 Sejam K = Q e Y = i, 5 . Vamos determinar K(Y ). Sabemos que
K(Y ) é o menor subcorpo de C que contém K ∪ Y . Assim, K(Y ) contém K e Y , isto

é, K ⊆ K(Y ) e Y ⊆ K(Y ). Desse modo, como i ∈ K(Y ), 5 ∈ K(Y ) e K(Y ) é

um subcorpo, então, i 5 ∈ K(Y ). Além disso, também sabemos que K(Y ) contém Q.
√ √
Assim, K(Y ) deve conter todos os elementos da forma p + qi + r 5 + si 5. Seja
n √ √ o
L = p + qi + r 5 + si 5 | p, q, r, s ∈ Q .

Assim, L ⊆ K(Y ). Agora, vejamos que L é um subcorpo de C.

(i) L ⊆ C;
√ √
(ii) 1 = 1 + 0i + 0 5 + 0i 5 ∈ L;

46
√ √ √ √
(iii) se p1 + q1 i + r1 5 + s1 i 5 ∈ L e p2 + q2 i + r2 5 + s2 i 5 ∈ L, então,
√ √ √ √
(p1 + q1 i + r1 5 + s1 i 5) + (p2 + q2 i + r2 5 + s2 i 5) =
√ √
= (p1 + p2 ) + (q1 + q2 )i + (r1 + s2 ) 5 + (s1 + s2 )i 5 ∈ L;
√ √
(iv) se p + qi + r 5 + si 5 ∈ L, então,
√ √ √ √
−(p + qi + r 5 + si 5) = −p + (−q)i + (−r) 5 + (−s)i 5 ∈ L;

√ √ √ √
(v) se p1 + q1 i + r1 5 + s1 i 5 ∈ L e p2 + q2 i + r2 5 + s2 i 5 ∈ L , então,
√ √ √ √
(p1 + q1 i + r1 5 + s1 i 5)(p2 + q2 i + r2 5 + s2 i 5) =
√ √ √ √
= p1 p2 + p1 q2 i + p1 r2 5 + p1 s2 i 5 + q1 p2 i − q1 q2 + q1 r2 i 5 − q1 s2 5+
√ √ √ √
+r1 p2 5 + r1 q2 i 5 + 5r1 r2 + 5r1 s2 i + s1 p2 i 5 − s1 q2 5 + 5s1 r2 i − 5s1 s2

= (p1 p2 − q1 q2 + 5r1 r2 − 5s1 s2 ) + (p1 q2 + q1 p2 + 5r1 s2 + 5s1 r2 )i+


√ √
+(p1 r2 − q1 s2 + r1 p2 + r1 p2 − s1 q2 ) 5 + (p1 s2 + q1 r2 + r1 q2 + s1 p2 )i 5;
√ √
(vi) se α = p + qi + r 5 + si 5 ∈ L e α ̸= 0, então, vamos mostrar que α possui
um elemento inverso em L. Faremos isso em dois passos. Inicialmente, note que
podemos escrever
√ √ √ √
α = p + qi + r 5 + si 5 = p + qi + (r + si) 5 = x + y 5,

onde x = p + qi e y = r + si. Seja M = {a + bi | a, b ∈ Q}, o qual é um


subconjunto de L. Desse modo, x ∈ M e y ∈ M . Seja
√ √ √
β = p + qi − r 5 − si 5 = x − y 5 ∈ L.
√ √
Então, αβ = (x + y 5)(x − y 5) = x2 − 5y 2 = z, digamos, onde z ∈ M .
√ √
Afirmação: β ̸= 0. De fato, se β = 0, então, p + qi − r 5 − si 5 = 0, o que
√ √ √ √
implica p − r 5 = −i(q − s 5). Agora, como p − r 5 e q − s 5 são números

47
√ √
reais e i é imaginário, temos que p − r 5 = 0 e q − s 5 = 0. Se r ̸= 0, então,

5 = pr ∈ Q, o que é uma contradição. Portanto, r = 0, o que também implica

p = 0. Do mesmo modo, se s ̸= 0, então, 5 = qs ∈ Q, o que é uma contradição.
√ √
Portanto, s = 0, o que também implica q = 0. Assim, α = p+qi+r 5+si 5 = 0,
o que é uma contradição.

Agora, como α ∈ C, α ̸= 0, β ∈ C e β ̸= 0, temos que z = αβ ̸= 0, pois C é


um corpo. Consequentemente, z.β −1 = α e temos que α−1 = (z.β −1 )−1 = βz −1 .
Como z ∈ M , podemos escrever z = u + vi, onde u, v ∈ Q. Considere w = u − vi.
Note que zw = (u+vi)(u−vi) = u2 +v 2 ∈ Q e u2 +v 2 ̸= 0. De fato, se u2 +v 2 = 0,
então, u = 0 e v = 0, o que implica z = 0, o que é uma contradição. Assim,
z −1 = (u2 + v 2 )−1 w ∈ M . Portanto, α−1 = βz −1 ∈ L, pois β ∈ L, z −1 ∈ M , M
é subconjunto de L e L é fechado para produtos.

Logo, L é um subcorpo de C que contém K e Y . Como K(Y ) é o menor subcorpo


de C que contém K e Y , podemos concluir que K(Y ) ⊆ L. Além disso, já
tı́nhamos provado que L ⊆ K(Y ). Logo, K(Y ) = L.

Exemplo 4.5 Seja K = R e Y = {i}. Vamos determinar R(i). Como R(i) é um


subcorpo de C temos que R(i) ⊆ C. Além disso, como R(i) deve conter R e {i},
temos que R(i) deve conter todos os elementos da forma x + iy, onde x, y ∈ R, isto é,
C ⊆ R(i). Portanto, R(i) = C.

√ √
Exemplo 4.6 Seja K = Q e Y = 2 . Vamos determinar Q( 2). Inicialmente, é
 √
fácil ver que o conjunto a + b 2 | a, b ∈ Q é um subcorpo de R. Além disso, sabemos
√ √ √
que Q( 2) deve conter Q e 2, então, Q( 2) deve conter todos os elementos da forma
√  √ √ √
a+b 2, onde a, b ∈ Q, isto é, a + b 2 a, b ∈ Q} ⊆ Q( 2). Finalmente, como Q( 2)
√ √  √
é o menor subcorpo de R que contém Q e 2, então, Q( 2) ⊆ a + b 2 a, b ∈ Q}.
√  √
Portanto, Q( 2) = a + b 2 | a, b ∈ Q .

Exemplo 4.7 Não é verdade que um subcorpo da forma K(α) consiste de todos os

elementos da forma j + kα, onde j, k ∈ K. Por exemplo, em R : Q seja α = 3 2 e

48
considere Q(α). Suponhamos que Q(α) = {j + kα | j, k ∈ Q}. Sabemos que Q(α) é o
menor subcorpo de R que contém Q e α. Assim, em particular, Q(α) deve conter α2 .
Se α2 = j + kα, para alguns j, k ∈ Q, então, 2 = α3 = α2 α = (j + kα)α = jα + kα2 =
jα+k(j +kα) = jα+jk +k 2 α = jk +(j +k 2 )α, isto é, 2 = jk +(j +k 2 )α. Desse modo,
(j + k 2 )α = 2 − jk. Como α é um número irracional, podemos concluir que j + k 2 = 0
e 2 − jk = 0. Assim, j = −k 2 , o que implica 2 − (−k 2 )k = 0, isto é, k 3 = −2, o que é
uma contradição, pois k ∈ Q.

4.2 Expressões Racionais


Podemos realizar as operações de adição, subtração e multiplicação no anel de po-
linômios C[t], mas de modo geral, não podemos realizar divisão. Por exemplo, C[t] não
contém um inverso t−1 para t.
Contudo, podemos aumentar C[t] para possuir inversos de modo natural. Vimos
que podemos pensar em polinômios f (t) ∈ C[t] como funções de C em C. Similarmente,
p(t)
podemos pensar em frações q(t)
∈ C[t] como funções. Estas são chamadas de funções
racionais da variável complexa t e suas expressões formais em termos de polinômios
são chamadas de expressões racionais. Porém, agora existe uma dificuldade técnica. O
p(t) p(α)
domı́nio de uma destas funções q(t)
: C → C que manda α ∈ C em q(α)
não é o conjunto
dos números complexos. Precisamos remover todos os potenciais problemas. Então,
p(t)
pegamos o domı́nio de q(t)
como sendo {z ∈ C | q(z) ̸= 0}. Como já vimos, qualquer
polinômio complexo q tem somente um número finito de zeros, então, o domı́nio aqui
é “quase todo” o conjunto dos números complexos.
Do mesmo modo, podemos construir o conjunto C(t1 , . . . , tn ) de todas as funções
racionais em n variáveis (expressões racionais em n indeterminadas). Um uso de tais
funções é especificar o subcorpo gerado por um conjunto X.
p(α1 , . . . , αn )
Pode-se provar que Q(X) consiste de todas as expressões racionais ,
q(β1 , . . . , βn )
para todo n, onde p, q ∈ Q[t1 , . . . , tn ], αj ∈ X, βj ∈ X e q(β1 , . . . , βn ) ̸= 0.
Veremos no Capı́tulo 16, que é possı́vel definir tais expressões sem usar funções.

49
Esta abordagem será necessária em um desenvolvimento mais abstrato do assunto.

4.3 Extensões simples


As extensões de corpos mais essenciais serão aquelas em que adicionamos um elemento.

Definição 4.4 Uma extensão de corpos L : K é simples se L = K(α), para algum


α ∈ L.


Exemplo 4.8 Q( 2) : Q é uma extensão simples.

Exemplo 4.9 C : R é uma extensão de simples, pois C = R(i).

Exemplo 4.10 Vale ressaltar que uma extensão pode ser simples mesmo parecendo
√ √
não a ser. Considere L = Q(i, −i, 5, − 5). A princı́pio, parece que precisamos
adicionar 4 elementos a Q para obter essa extensão. Mas, na verdade vamos provar

que L = L′ , onde L′ = Q(i + 5).
√ √
Sabemos que L é o menor subcorpo de C que contém i, −i, 5 e −5 e L′ é o

menor subcorpo de C que contém i + 5. Inicialmente, observe que como L contém
√ √
i + 5 e L′ é o menor subcorpo de C que contém i + 5, então, L′ ⊆ L. Agora, vamos
√ √
mostrar que L′ contém i, −i, 5 e − 5.
√ √ √ √
Como L′ contém i + 5, então, L′ contém (i + 5)2 = −1 + 2i 5 + 5 = 4 + 2i 5.
√ √ √ √
Além disso, L′ também contém (i + 5)3 = (i + 5)(4 + 2i 5) = 4i + −2 5 +
√ √ √ √
4 5 + 10i = 14i + 2 5. Assim, como i + 5 ∈ L′ e 14i − 2 5 ∈ L′ , temos que
√ √
2(i + 5) + (14i − 2 5) = 16i ∈ L′ . Consequentemente, i ∈ L′ −i ∈ L′ , e também
√ √ √
i + 5 − i = 5 ∈ L′ e − 5 ∈ L′ . Portanto, L′ é um subcorpo de C que contém
√ √
i, −i, 5 e − 5. Como L é o menor subcorpo de C que contém tais elementos, temos
√ √
que L ⊆ L′ . Logo, L = L′ , o que nos permite concluir que Q(i, −i, 5, − 5) : Q é
simples.

Exemplo 4.11 R : Q não é uma extensão simples.

50
Nosso objetivo no próximo capı́tulo é classificar todoas as possı́veis extensões sim-
ples. Terminamos esse capı́tulo com o conceito de isomorfismo de extensões. No
próximo capı́tulo, vamos desenvolver técnicas para construir todas as possı́veis ex-
tensões simples a menos de isomorfismos.

Definição 4.5 Um isomorfismo entre duas extensões de corpos i : K → K̂, j : L → L̂


é um par (λ, µ) de isomorfismos de corpos λ : K → L e µ : K̂ → L̂ tais que j(λ(k)) =
µ(i(k)), para quaisquer k ∈ K.

51
Capı́tulo 5

Extensões simples

Um conceito fundamental na teoria de corpos é o de uma extensão simples de corpos,


onde um elemento α é adicionado a um subcorpo arbitrário K de C, juntamente com
todas as expressões racionais desse elemento sobre K. Qualquer extensão finitamente
gerada pode ser obtida por uma sequência de extensões simples, então, a estrutura
de uma extensão simples nos forcene informações cruciais sobre todas as extensões
finitamente geradas.
Primeiramente, vamos classificar as extensões simples em dois tipos muito diferen-
tes: transcendentais e algébricas. Se um elemento α satisfaz uma equação polinomial
sobre K, então, a extensão é algébrica; caso contrário, a extensão é transcendente. A
menos de isomorfismos, K tem exatamente uma extensão transcendente simples. Para
a maioria dos corpos K existem muito mais possibilidades para extensões algébricas
simples; as quais serão classificadas por polinômios irredutı́veis m sobre K.
A estrutura das extensões algébricas simples pode ser descrita em termos do anel de
polinômios K[t], com operações sendo calculadas “módulo m”. No Capı́tulo 16, vamos
generalizar esta construção usando a noção de ideal.

52
5.1 Extensões algébricas e extensões transcenden-
tes
Recorde que uma extensão simples de um subcorpo K de C é da forma K(α), onde em
casos não triviais temos que α ∈
/ K. Vamos classificar as possı́veis extensões simples
para qualquer K. Existem dois tipos distintos:

Definição 5.1 Seja K um subcorpo de C e seja α ∈ C. Dizemos que α é algébrico


sobre K se existir um polinômio não nulo p sobre K tal que p(α) = 0. Caso contrário,
dizemos que α é transcendente sobre K.

Algumas vezes vamos encurtar “algébrico sobre Q” a algébrico, e “transcendente


sobre Q” a transcendente.

Exemplo 5.1 O número α = 2 é algébrico sobre Q, pois p = x2 − 2 é um polinômio
não nulo sobre Q tal que p(α) = α2 − 2 = 0;

Exemplo 5.2 O número α = 3
2 é algébrico sobre Q, pois p = x3 − 2 é um polinômio
não nulo sobre Q tal que p(α) = α3 − 2 = 0;

Exemplo 5.3 O número π é transcendente sobre Q. Vamos provar este resultado no


Capı́tulo 24. No Capı́tulo 7, usaremos a transcendência de π para provar a impossibi-
lidade da “quadratura do cı́rculo”.

Exemplo 5.4 O número α = π é algébrico sobre Q(π), pois p = x2 − π é um
polinômio não nulo sobre Q(π) tal que p(α) = α2 − π = 0.

Exemplo 5.5 O número α = π é transcendente sobre Q. De fato, suponhamos que

p( π) = 0, para algum

0 ̸= p(t) = a0 + a1 t + a2 t2 + a3 t3 + · · · + an−1 tn−1 + an tn ∈ Q[t].

Assim,
√ √ √ 2 √ 3 √ 4 √ 5 √ n−1 √ n
0 = p(α) = p( π) = a0 +a1 π+a2 π +a3 π +a4 π +a5 π +· · ·+an−1 π +an π .

53
√ √ √ √ n−1 √ n
0 = a0 + a1 π + a2 π + a3 π π + a4 π 2 + a5 π 2 π + · · · + an−1 π + an π .

Desse modo,

• se n = 2k, então,
√ √ √ √ 2k−1 √ 2k
0 = a0 + a1 π + a2 π + a3 π π + a4 π 2 + a5 π 2 π + · · · + a2k−1 π + a2k π .

0 = a0 + a2 π + a4 π 2 + · · · + a2k π k + (a1 + a3 π + a5 π 2 + · · · + a2k−1 π k−1 ) π.
| {z } | {z }
a′ (π) b′ (π)

• se n = 2k + 1, então,
√ √ √ √ 2k √ 2k+1
0 = a0 + a1 π + a2 π + a3 π π + a4 π 2 + a5 π 2 π + · · · + a2k π + a2k+1 π .

0 = a0 + a2 π + a4 π 2 + · · · + a2k π k + (a1 + a3 π + a5 π 2 + · · · + a2k+1 π k ) π.
| {z } | {z }
a′′ (π) b′′ (π)

Consequentemente, em qualquer caso, temos que a(π) + b(π) π = 0, o que implica

a(π) = −b(π) π. Assim, (a(π))2 = (b(π))2 π. Portanto, para f = a(t)2 − b(t)2 t ∈ Q[t],
temos f (π) = (a(π))2 − (b(π))2 π = 0.
Finalmente, observe que ∂(a(t)2 ) é par e ∂(b(t)2 t) é ı́mpar, então, diferença entre
eles é não nula, isto é, f é não nulo, o que nos permite concluir que π é algébrico sobre
Q, o que é uma contradição.

Nas próximas seções, vamos classificar todas as possı́veis extensões simples e encon-
trar métodos para construı́-las. O caso transcendente é simples: se K(t) é o conjunto
das funções racionais da indeterminada t sobre K, então, K(t) : K é a única extensão
transcendente simples de K a menos de isomorfismos. Se K(α) : K é algébrica, existem
mais possibilidades. Vamos mostrar que existe um único polinômio mônico irredutı́vel
m sobre K tal que m(α) = 0, e que m determina a extensão de modo único a menos
de isomorfismo.

Teorema 5.1 O conjunto das expressões racionais K(t) é uma extensão transcendente
simples do subcorpo K de C.

54
Demonstração: Observe que K(t) : K é uma extensão simples, pois é gerada por t.
Além disso, se t fosse algébrico sobre K, então, existiria um polinômio não nulo p sobre
K tal que p(t) = 0. Neste caso, pela definição de K(t), terı́amos que p = 0, o que é
uma contradição. Portanto, t é transcendente sobre K. □

5.2 O polinômio minimal


A construção de extensões algébricas simples é muito mais delicada e vai ser controlada
por um polinômio associado com o gerador α de K(α) : K, chamado de polinômio
minimal. Para definirmos-o primeiramente precisamos de uma definição técnica.

Definição 5.2 Um polinômio f (t) = a0 + a1 t + . . . + an tn sobre um subcorpo K de C


é mônico se an = 1.

Todo polinômio é um múltiplo constante de algum polinômio mônico, e para um


polinômio não nulo, este polinômio mônico é único. Além disso, o produto de dois
polinômios mônicos é novamente um polinômio mônico.
Suponha que K(α) : K é uma extensão algébrica simples. Existe um polinômio p
sobre K tal que p(α) = 0. Note que podemos supor que p é mônico. Portanto, existe
pelo menos um polinômio mônico de menor grau que tem α como um zero. Afirmamos
que p é único. De fato, suponhamos que p e q são polinômios mônicos de menor grau
que possuem α como um zero tais que p ̸= q. Desse modo, p(α) = 0 e q(α) = 0. Assim,
(p − q)(α) = p(α) − q(α) = 0. Além disso, note que como p e q são polinômios mônicos
de mesmo grau, p − q necessariamente é um polinômio de grau menor que o grau de
p e de grau menor que o grau de q tal que algum múltiplo constante de p − q é um
polinômio mônico que tem α como um zero, o que é uma contradição. Portanto, existe
um único polinômio mônico p de menor grau tal que p(α) = 0, o que motiva a próxima
definição.

Definição 5.3 Seja L : K uma extensão de corpos e suponha que α ∈ L é algébrico

55
sobre K. Então, o polinômio minimal de α sobre K é o único polinômio mônico m
sobre K de menor grau tal que m(α) = 0.

Por exemplo, i ∈ C é algébrico sobre R. Se m(t) = t2 + 1, então, m(i) = i2 + 1 = 0.


Claramente, m é mônico. Os únicos polinômios mônicos sobre R de menor grau são
da forma t + r, onde r ∈ R, ou a constante polinomial 1. Porém, i não pode ser um
zero de nenhum desses polinômios, pois senão terı́amos que i ∈ R. Assim, o polinômio
minimal de i sobre R é t2 + 1.
É natural perguntar que polinômios podem ser minimais. O próximo lema nos
fornece informações sobre essa questão.

Lema 5.2 Se α é um elemento algébrico sobre um subcorpo K de C, então, o polinômio


minimal de α sobre K é irredutı́vel sobre K. Além disso, o polinômio minimal de α
sobre K divide todo polinômio do qual α é um zero.

Demonstração: Suponhamos que o polinômio minimal m de α sobre K é redutı́vel,


isto é, m = f g, onde f e g são polinômios de grau menor que o grau de m. Podemos
assumir que f e g são mônicos. Como 0 = m(α) = f (α)g(α), temos que f (α) = 0 ou
g(α) = 0, o que contradiz a definição de m, pois m é o polinômio de menor grau tal
que m(α) = 0 e f e g são polinômios de grau menor que o grau de m. Portanto, m é
irredutı́vel sobre K.
Agora, suponha que p é um polinômio sobre K tal que p(α) = 0. Pelo Algoritmo
da Divisão, existem polinômios q e r sobre K tais que p = mq + r e ∂r < ∂m. Assim,
0 = p(α) = m(α)q(α) + r(α) = r(α). Se r ̸= 0, então, um múltiplo constante de
r é mônico e tal que α é sua raiz, o que contradiz a definição de m, pois ∂r < ∂m.
Portanto, r = 0, o que implica p = mq, isto é, m divide p. □

Teorema 5.3 Se K é qualquer subcorpo de C e m é qualquer polinômio mônico irre-


dutı́vel sobre K, então, existe α ∈ C, algébrico sobre K, tal que α tem um polinômio
minimal m sobre K.

56
Demonstração: Sejam m um polinômio mônico irredutı́vel sobre K, α ∈ C um zero
de m e f o polinômio minimal de α sobre K. Então, m(α) = 0. Assim, pelo Lema
anterior, f divide m, isto é, existe um polinômio g sobre K tal que f.g = m. Porém,
como m é irredutı́vel, temos que ∂f = ∂m ou ∂g = ∂m.
Se ∂g = ∂m, então, ∂f = 0, isto é, f é constante. Assim, f = k, para algum k ∈ K.
Desse modo, 0 = f (α) = k, isto é, f = 0, o que é uma contradição, pois f é mônico.
Se ∂f = ∂m, então, ∂g = 0, isto é, g é constante. Assim, como f e m são mônicos,
temos que g = 1, o que implica f = m. Portanto, existe α ∈ C, algébrico sobre K, tal
que α tem um polinômio minimal m sobre K. □

5.3 Extensões algébricas simples


A seguir, vamos descrever a estrutura da extensão de corpos K(α) : K, onde α tem
polinômio minimal m sobre K. Procederemos com analogia a um conceito básico de
teoria de números. Relembre que para qualquer inteiro positivo n, dois inteiros a e
b são congruentes módulo n, e escrevemos a ≡ b(mod n), se a − b é divisı́vel por
n. Do mesmo modo, dado um polinômio não nulo m ∈ K[t], podemos calcular com
polinômios módulo m. Dizemos que dois polinômios a, b ∈ K[t] são congruentes módulo
m, e escrevemos a ≡ b(mod m) se a(t) − b(t) é divisı́vel por m(t) em K[t].

Lema 5.4 Se a1 ≡ a2 (mod m) e b1 ≡ b2 (mod m), então, a1 + b1 ≡ a2 + b2 (mod m), e


a1 b1 ≡ a2 b2 (mod m).

Demonstração: Sabemos que a1 − a2 = am e b1 − b2 = bm, para alguns polinômios


a, b ∈ K[t]. Assim,

(a1 + b1 ) − (a2 + b2 ) = (a1 − a2 ) + (b1 − b2 ) = am − bm = (a − b)m,

o que prova a primeira afirmação.


Para o produto, precisamos de um argumento um pouco mais sofisticado.

a1 b1 − a2 b2 = a1 b1 − a1 b2 + a1 b2 − a2 b2 = a1 (b1 − b2 ) + b2 =

57
= a1 (b1 − b2 ) + b2 (a1 − a2 ) = a1 bm + b2 am = (a1 b + b2 a)m.

Lema 5.5 Todo polinômio não nulo a ∈ K[t] é congruente módulo m a um único
polinômio de grau < ∂m.

Demonstração: Pelo Teorema do Resto, dividindo a por m, temos que existem q, r ∈


K[t] tais que a = qm + r, onde ∂r < ∂m. Assim, a − r = qm, o que implica que a ≡
r(mod m). Para provar a unicidade, suponhamos que a ≡ r(mod m) e a ≡ s(mod m),
onde ∂r < ∂m e ∂s < ∂m. Então, a − r = q1 m e a − s = q2 m, para alguns polinômios
q1 , q2 ∈ K[t]. Desse modo, r − s = −(a − r) + (a − s) = −q1 m + q2 m = (q2 − q1 )m.
Portanto r ≡ s(mod m) e ∂(r − s) < ∂m, o que implica r − s = 0, isto é, r = s, o que
prova a unicidade. □
Pelo Lema anterior, todo polinômio não nulo a ∈ K[t] é congruente módulo m a
um único polinômio r tal que ∂r < ∂m. Chamamos r de forma reduzida de a módulo
m. Além disso, podemos calcular com polinômios módulo m em termos de suas formas
reduzidas. De fato, a forma reduzida de a + b é a forma reduzida de a mais a forma
reduzida de b, enquanto a forma reduzida de ab é o resto, após a divisão por m, do
produto da forma reduzida de a e da forma reduzida de b.
Mais abstratamente podemos trabalhar com classes de equivalências. A relação
≡ mod m é uma relação de equivalência sobre K[t], então, ela particiona K[t] em
classes de equivalência. Vamos denotar por [a] = {f ∈ K[t] : m | (a − f )} a classe de
equivalência de a ∈ K[t].
A soma e o produto de [a] e [b] pode ser definido como:

[a] + [b] = [a + b] [a][b] = [ab].

É simples mostrar que estas operações estão bem definidas, isto é, que não dependem
da escolha dos elementos em cada classe de equivalência. Cada classe de equivalência
contém um único polinômio de grau menor que ∂m, chamado de forma reduzida de
a. Portanto, cálculos algébricos com classes de equivalência são o mesmo que cálculos

58
com formas reduzidas, e ambos são os mesmos que cálculos em K[t] com a convenção
adicional que m(t) é identificado com 0. Em particular, as classes [0] e [1] são as
identidades aditiva e multiplicativa, respectivamente.
Vamos denotar por K[t]/ ⟨m⟩ o conjunto das classes de equivalência de K[t] módulo
m.
Um resultado fundamental é o seguinte:

Teorema 5.6 Todo elemento não nulo de K[t]/ ⟨m⟩ tem um inverso multiplicativo em
K[t]/ ⟨m⟩ se, e somente se, m é irredutı́vel em K[t].

Demonstração: Inicialmente, suponhamos que todo elemento não nulo de K[t]/ ⟨m⟩
tem um inverso multiplicativo em K[t]/ ⟨m⟩. Vamos provar que m é irredutı́vel. Se
m é redutı́vel, então, existem a, b ∈ K[t] tais que m = ab, onde ∂a, ∂b < ∂m. Então,
[a][b] = [ab] = [m] = [0]. Note que se [a] = [0], então, como 0 ∈ [0] = [a], temos que
a ≡ 0mod m, isto é, a − 0 = k.m, para algum k ∈ K[t]. Assim, m | a, o que implica
a = 0 ou ∂m ≤ ∂a. Se a = 0, então, m = ab = 0, o que é uma contradição. Se
∂m ≤ ∂a, também temos uma contradição, pois ∂a < ∂m.
Portanto, [a] ∈ K[t]/ ⟨m⟩ tem um inverso multiplicativo [c], isto é, [a][c] = [c][a] =
[1]. Desse modo, [0] = [c][0] = [c][a][b] = [1][b] = [b], isto é, [b] = [0]. Assim, como
0 ∈ [0] = [b], temos que b ≡ 0mod m, isto é, b − 0 = l.m, para algum l ∈ K[t]. Assim,
m | b, o que implica b = 0 ou ∂m ≤ ∂b. Se b = 0, então, m = ab = 0, o que é uma
contradição. Se ∂m ≤ ∂b, também temos uma contradição, pois ∂b < ∂m. Portanto,
m é irredutı́vel.
Reciprocamente, suponhamos que m é irredutı́vel e vamos mostrar que todo ele-
mento [a] ∈ K[t]/ ⟨m⟩ tal que [a] ̸= [0] tem um inverso multiplicativo em K[t]/ ⟨m⟩.
Afirmação: 1 é um mdc de a e m. De fato, se mdc(a, m) = p, então, pela definição
de mdc, temos que p | a e p | m. Assim, existe q ∈ K[t] tal que m = p.q. Porém, como
m é irredutı́vel, necessariamente ∂m = ∂p ou ∂m = ∂q. Se ∂m = ∂q, então, ∂p = 0,
isto é, p é uma constante, o que implica, que 1 e um mdc de a e m. Se ∂m = ∂p,
então, ∂q = 0, isto é, q = k é um polinômio constante. Consequentemente, m = p.k.

59
m
Assim, como p | a, temos que existe g ∈ K[t] tal que a = pg = k
.g, o que implica
[a] = [ m
k
.g] = [0], pois [m] = [0], o que é uma contradição, pois [a] ̸= 0.
Assim, como 1 é um mdc de a e m, existem h, l ∈ K[t] tais que ha + lm = 1, o que
implica [h][a] + [l][m] = [1]. Portanto, como [m] = 0, podemos concluir que [h][a] = [1].
Assim, [h] é um inverso multiplicativo de [a] em K[t]/ ⟨m⟩. □

5.4 Classificando extensões simples


Agora, vamos demonstrar que os métodos vistos até o presente momento são suficientes
para a construção de todas as possı́veis extensões simples (a menos de isomorfismos).

Teorema 5.7 Toda extensão transcendente simples K(α) : K é isomorfa à extensão


K(t) : K de expressões racionais em uma indeterminada t sobre K. O isomorfismo
K(t) → K(α) pode ser escolhido como o que aplica t a α e como sendo a identidade
sobre K.
 
f (t) f (α)
Demonstração: Defina uma aplicação φ : K(t) → K(α) por φ = . Se
g(t) g(α)
g ̸= 0, então, g(α) ̸= 0, pois α é transcendente. Assim, a aplicação está bem definida.
f (t) h(t)
Vejamos que φ é um homomorfismo. Dados , ∈ K(t), temos que
g(t) i(t)
     
f (t) h(t) f (t)i(t) + h(t)g(t) f (α)i(α) + h(α)g(α)
φ + =φ =φ =
g(t) i(t) g(t)i(t) g(α)i(α)
   
f (α)i(α) h(α)g(α) f (α) h(α) f (t) h(t)
= + = + =φ +φ ;
g(α)i(α) g(α)i(α) g(α) i(α) g(t) i(t)

       
f (t) h(t) f (t)h(t)
f (α)h(α) f (α) h(α) f (t) h(t)
φ . =φ = = =φ .φ .
g(t) i(t) g(t)i(t)g(α)i(α) g(α) i(α) g(t) i(t)
   
f (t) h(t)
Prosseguindo, vejamos que φ é injetor. Se φ ̸= φ , então,
g(t) i(t)

f (α) h(α)
̸=
g(α) i(α)

60
f (α) h(α)
− ̸= 0
g(α) i(α)
f (α)i(α) − h(α)g(α)
̸= 0
g(α)i(α)
 
f (t)i(t) − h(t)g(t)
φ ̸= 0
g(t)i(t)
f (t)i(t) − h(t)g(t)
̸= 0
g(t)i(t)
f (t)i(t) h(t)g(t)
− ̸= 0
g(t)i(t) g(t)i(t)
f (t) h(t)
− ̸= 0
g(t) i(t)
f (t) h(t)
̸= .
g(t) i(t)
Além disso, pela construção de φ, também temos que φ é sobrejetor. Portanto, φ
é um isomorfismo. Além disso, note que φ|K é a identidade de K.
Finalmente, como K(α) : K e K(t) : K são extensões de corpos, seja i : K → K(t)
um monomorfismo, j : K → K(α) um monomorfismo, considere a aplicação identidade
id de K e a aplicação φ : K(t) → K(α). Assim, com essas aplicações o diagrama

K / K(t)


 
K / K(α)

é comutativo. De fato, dado k ∈ K, temos que (φ ◦ i)(k) = φ(i(k)) = φ(k) = k =


= j(k) = (j ◦ id)(k). □

A classificação das extensões algébricas simples também não é complicada, mas é


mais interessante.

Teorema 5.8 Sejam K(α) : K uma extensão algébrica simples e m o polinômio mi-
nimal de α sobre K. Então, K(α) : K é isomorfa a K[t]/ ⟨m⟩ : K. O isomorfismo
K[t]/ ⟨m⟩ → K(α) pode ser escolhido como o que aplica t a α e como sendo a identidade
sobre K.

61
Demonstração: Defina uma aplicação φ : K(t)/ ⟨m⟩ → K(α) por φ([p(t)]) = p(α),
onde [p(t)] é a classe de equivalência de p(t)(mod m).
Inicialmente, vejamos que φ está bem definida. Sejam [p(t)], [q(t)] dois elementos
de K(t)/ ⟨m⟩ tais que [p(t)] = [q(t)]. Assim, p(t) ≡ q(t) mod m, o que implica que
existe um polinômio g ∈ K[t] tal que p(t) − q(t) = g(t)m(t). Consequentemente,
p(α) − q(α) = g(α)m(α). Portanto, p(α) = q(α), pois m(α) = 0.
Prosseguindo, vamos verificar que φ é homomorfismo. Dados [p(t)], [q(t)] dois ele-
mentos de K(t)/ ⟨m⟩, temos que

φ([p(t)] + [q(t)]) = φ([p(t) + q(t)]) = p(α) + q(α) = φ([p(t)]) + φ([q(t)]);

φ([p(t)][q(t)]) = φ([p(t)q(t)]) = p(α)q(α) = φ([p(t)])φ([q(t)]).

Vejamos, agora, que φ é injetora. Sejam [g(t)], [h(t)] dois elementos de K(t)/ ⟨m⟩
tais que φ([g(t)]) = φ([h(t)]). Assim, g(α) = h(α), isto é, (g − h)(α) = 0. Dividindo
g − h por m, temos que existem q, r ∈ K[t] tais que (g − h)(t) = m(t)q(t) + r(t), onde
∂r < ∂m, o que implica (g − h)(α) = m(α)q(α) + r(α), ou seja, r(α) = 0. Portanto,
r = 0, pois ∂r < ∂m e m é o polinômio de menor grau tal que α é um zero de m.
Consequentemente, (g − h)(t) = m(t)q(t), o que implica [g − h] = [m] = [0]. Logo,
[g] = [h].
Além disso, φ é sobrejetora, pela própria construção de φ. Portanto, φ é um
isomorfismo. Claramente, φ restrita a K é a aplicação identidade de K.
Finalmente, como K(α) : K e K[t]/ ⟨m⟩ : K são extensões de corpos, seja i : K →
K(α) um monomorfismo, j = φ|K : K → K[t]/ ⟨m⟩ um monomorfismo, considere a
aplicação identidade id de K e a aplicação φ : K(t)/ ⟨m⟩ → K(α). Assim, com essas
aplicações o diagrama
K / K([t]/ ⟨m⟩

 
K / K(α)
é comutativo. De fato, dado k ∈ K, temos que (φ ◦ j)(k) = φ(j(k)) = φ(k) = k =
= i(k) = (i ◦ id)(k). □

62
Corolário 5.9 Suponha que K(α) : K e K(β) : K são extensões algébricas simples
tais que α e β possuem o mesmo polinômio minimal m sobre K. Então, essas duas
extensões são isomorfas, e o isomorfismo dos corpos maiores pode ser tomado como o
que aplica α a β e como sendo a identidade sobre K.

Demonstração: Se K(α) : K é uma extensão algébrica simples e m é o polinômio


minimal de α sobre K, então, pelo teorema anterior, K(α) : K é isomorfa a K[t]/ ⟨m⟩,
onde o isomorfismo i aplica t a α.
Se K(β) : K é uma extensão algébrica simples e m é o polinômio minimal de β sobre
K, então, pelo teorema anterior, K(β) : K é isomorfa a K[t]/ ⟨m⟩, onde o isomorfismo
j aplica t a β.
Considere a aplicação identidade id de K. Assim, i−1 ◦ id ◦ j : K(α) → K(β) é um
isomorfismo de K(α) em K(β), que é a identidade sobre K e aplica α em β. Portanto,
com essas aplicações os diagramas

K[t]/ ⟨m⟩ / K(α)



 
K[t]/ ⟨m⟩ / K(β)

K / K(α)

 
K / K(β)
são comutativos. □

Lema 5.10 Sejam K(α) : K uma extensão algébrica simples, m o polinômio minimal
de α sobre K e ∂m = n. Então, {1, α, . . . , αn−1 } é uma base para K(α) sobre K.

Demonstração: Seja m = b0 + b1 t + . . . + bn−1 tn−1 + tn o polinômio minimal de α


sobre K. Assim, como α é um zero de m, temos que m(α) = 0, o que implica

0 = m(α) = b0 + b1 α + . . . + bn−1 αn−1 + αn

63
αn = −b0 − b1 α − . . . − bn−1 αn−1 .

Portanto, {1, α, . . . , αn−1 } gera K(α) sobre K. Além disso, {1, α, . . . , αn−1 } é line-
armente independente. De fato, se existirem k0 , k1 , . . . , kn−1 ∈ K tais que k0 1 + k1 α +
. . . + kn−1 αn−1 = 0, então, α é um zero do polinômio g = k0 + k1 t + . . . + kn−1 tn−1 ,
o qual é um polinômio de grau n − 1, que é menor do que o grau de m, o que é uma
contradição, pois m é o polinômio de menor grau que tem α como zero.
Logo, {1, α, . . . , αn−1 } é uma base de K(α) sobre K. □

Para certas aplicações futuras, vamos precisamos de uma versão mais forte do Teo-
rema 5.8 para cobrir extensões de corpos isomorfos. Antes de enunciarmos esse teorema
mais geral, vamos precisar da seguinte:

Definição 5.4 Seja i : K → L um monomorfismo de corpos. Então, existe uma


aplicação î : K[t] → L[t], definida por

î(k0 + k1 t + · · · + kn tn ) = i(k0 ) + i(k1 )t + · · · + i(kn )tn ,

onde k0 , k1 , . . . , kn ∈ K.

A aplicação i definida acima é monomorfismo; e se i é um isomorfismo, então, î


também o é.
O “chapéu” é desnecessário, uma vez que a afirmação é clara e pode ser dispensado.
Assim, futuramente, vamos usar o sı́mbolo i para a aplicação entre subcorpos de C
e para sua extensão para anéis de polinômios. Isso não deve causar confusão, pois
î(k) = i(k), para quaisquer k ∈ K.

Teorema 5.11 Suponha que K e L são subcorpos de C e i : K → L é um isomorfismo.


Sejam K(α), L(β) extensões algébricas simples de K e L, respectivamente, tais que
α tem polinômio minimal mα (t) sobre K e β tem polinômio minimal mβ (t) sobre L.
Suponha além disso que mβ (t) = i(mα (t)). Então, existe um isomorfimo j : K(α) →
L(β) tal que j|K = i e j(α) = β.

64
Demonstração: Podemos sintetizar as hipótees no seguinte diagrama:

K / K(α) ,

 
L / L(β)

onde i : K → L é um isomorfismo e vamos definir j : K(α) → K(β).


Usando a forma reduzida, todo elemento de K(α) é da forma p(α) para um po-
linômio p sobre K de grau < ∂mα . Assim, basta definir j(p(α)) = (i(p))(β), onde i(p)
é a aplicação da definição anterior. Assim, o teorema é válido pelos mesmos argumentos
do teorema anterior. □
O ponto crucial desse teorema é que a aplicação dada i pode ser estendida para
uma aplicação j entre o corpos maiores. Tais teoremas de extensões nos dizem que
sob algumas condições entre aplicações sub-objetos podem ser estendidos a aplicações
entre objetos, constituem ferramentas importantes. Usando-os podemos estender nosso
conhecimento de estruturas menores para estruturas maiores com uma sequência de
passos simples.
O último teorema implica que sob as hipóteses dadas, as extensões K(α) : K e
L(β) : L são isomorfas, o que nos permite identificar K com L e K(α) com L(β), pelas
aplicações α e β.
Os Teoremas 5.3 e 5.8 juntos nos dão uma caracterização completa de extensões
algébricas simples em termos de polinômios. A cada extensão corresponde um po-
linômio mônico, e dado o corpo menor e esse polinômio, podemos reconstruir a ex-
tensão.

65
Capı́tulo 6

O grau de uma extensão

Uma técnica que se tornou muito útil em Matemática é associar a uma estrutura dada
uma que seja diferente, mas que é melhor entendida. Nesse capı́tulo, exploramos a
técnica de associar com qualquer extensão de corpos um espaço vetorial, o que nos
coloca à disposição ferramentas de álgebra linear, uma teoria algébrica muito bem
sucedida e que com sua ajuda poderemos fazer progressos consideráveis.

6.1 A definição do grau


Não é difı́cil definir uma estrutura de espaço vetorial sobre uma extensão de corpos.
Na verdade, elas já a possuem. Mais precisamente, temos o seguinte resultado:

Teorema 6.1 Se L : K é uma extensão de corpos, então, as operações (λ, u) 7→ λu


(onde λ ∈ K e u ∈ L) e (u, v) 7→ u + v (onde u, v ∈ L) definem sobre L a estrutura de
um espaço vetorial sobre K.

Demonstração: O conjunto L é um espaço vetorial sobre K se as duas operações


definidas acima satisfazem os seguintes axiomas:

(1) u + v = v + u, para quaisquer u, v ∈ L;

(2) (u + v) + w = u + (v + w), para quaisquer u, v, w ∈ L;

66
(3) Existe 0 ∈ L tal que 0 + u = u, para qualquer u ∈ L;

(4) Para qualquer u ∈ L, existe −u ∈ L tal que u + (−u) = 0;

(5) Se λ ∈ K, u, v ∈ L, então, λ(u + v) = λu + λv;

(6) Se 1 é o elemento identidade multiplicativo de K, então, 1u = u, para qualquer


u ∈ L;

(7) Se λ, µ ∈ K, então, λ(µu) = (λµ)u, para qualquer u ∈ L.

Cada uma dessas afirmações é válida pois K e L são subcorpos de C e K ⊆ L. □


Sabemos que um espaço vetorial V sobre um subcorpo K de C é unicamente de-
terminado, a menos de isomorfismo, pela sua dimensão. A dimensão é o número de
elementos de uma base - um subconjunto de vetores que gera V e é linearmente inde-
pendente sobre K. A próxima definição é a terminologia tradicional usada no contexto
de extensões de corpos:

Definição 6.1 O grau [L : K] de uma extensão de corpos L : K é a dimensão de L


considerada como um espaço vetorial sobre K.

Exemplo 6.1 O corpo dos números complexos C possui dimensão 2 sobre o corpo dos
números reais, pois uma base de C sobre R é {1, i}. Assim, [C : R] = 2.

√  √ √
Exemplo 6.2 A extensão Q(i, 5) : Q tem grau 4. Os elementos 1, 5, i, i 5

formam uma base de Q(i, 5) sobre Q.

Note que duas extensões de corpos isomorfas possuem o mesmo grau.

6.2 A lei da torre


O próximo teorema nos ajuda a calcular o grau de uma extensão complicada se conhe-
cemos os graus de certas extensões mais simples.

67
Teorema 6.2 (Lei curta da torre) Se K, L, M são subcorpos de C e K ⊆ L ⊆ M ,
então,
[M : K] = [M : L][L : K].

Observação: Se [M : L] = ∞ ou [L : K] = ∞, então, [M : K] = ∞; e se
[M : K] = ∞, então, [M : L] = ∞ ou [L : K] = ∞.
Demonstração: Sejam (xi )i∈I uma base de L como espaço vetorial sobre K e seja
(yj )j∈J uma base de M como espaço vetorial sobre L. Para quaisquer i ∈ I e j ∈ J,
temos que xi ∈ L e yj ∈ M . Vamos mostrar que (xi yj )i∈I,j∈J é uma base de M como
espaço vetorial sobre K (onde xi yj é o produto no subcorpo M ). Consequentemente,
como dimensões são cardinalidades de bases, teremos que [M : K] = |I||J| = |J||I| =
[M : L][L : K].
Inicialmente, vamos provar a independência linear. Suponhamos que
X
kij xi yj = 0 (kij ∈ K).
i,j

Podemos reorganizar essa soma como


!
X X
kij xi yj = 0 (kij ∈ K).
j i∈I
X
Assim, como os coeficientes kij xi ∈ L e os elementos yj são linearmente inde-
i∈I
pendentes sobre L, podemos concluir que
X
kij xi = 0.
i∈I

Desse modo, como os coeficientes kij ∈ K e os elementos xi são linearmente in-


dependentes sobre K, podemos concluir que kij = 0, para quaisquer i ∈ I e j ∈ J.
Portanto, os elementos xi yj são linearmente independentes sobre K.
Finalmente, vamos provar que xi yj gera M sobre K. Dado x ∈ M , como (yj )j∈J é
uma base de M sobre L, temos que
X
x= λj yj ,
j

68
para alguns λj ∈ L.
Agora, como cada λj ∈ L e (xi )i∈I é uma base de L sobre K, temos que
X
λj = λij xi ,
i

para alguns λij ∈ K.


Consequentemente,
XX X
x= λij xi yj = λij xi yj ,
j i i,j

ou seja, xi yj gera M sobre K. □

√ √  √
Exemplo 6.3 Vamos determinar [Q( 2, 3) : Q]. Inicialmente, vejamos que 1, 2
√ √  √
é uma base de Q( 2). Como já provamos que Q( 2) = p + q 2 | p, q ∈ Q , temos
 √ √ √
que o conjunto 1, 2 gera Q( 2) sobre Q. Agora, vejamos que 1 e 2 são linear-

mente independentes sobre Q. Suponha que p + q 2 = 0, onde p, q ∈ Q. Se q ̸= 0,
p √ p √
então, = − 2, o que é impossı́vel, pois é racional e − 2 é irracional. Portanto,
q q
q = 0, o que implica p = 0 e o resultado está provado.
 √ √ √ √
Prosseguindo, vamos mostrar que 1, 3 é uma base de Q( 2, 3) sobre Q( 2).
√ √ √ √ √
Todo elemento de Q( 2, 3) pode ser escrito como p+q 2+r 3+s 6, onde p, q, r, s ∈
Q. Observe que podemos reescrevê-lo como
√ √ √ √ √ √
p + q 2 + r 3 + s 6 = (p + q 2) + (r + s 2) 3,

 √ √ √ √
o que prova que 1, 3 gera Q( 2, 3) sobre Q( 2).
√ √
Vejamos também que 1 e 3 são linearmente independentes sobre Q( 2). Supo-
nhamos que
√ √ √
(p + q 2).1 + (r + s 2) 3 = 0.

√ √ p+q 2 √ √ √
Se r + s 2 ̸= 0, então, 3 = − √ ∈ Q( 2). Portanto, 3 = a + b 2, onde
r+s 2 √
a, b ∈ Q. Elevando ambos os membros ao quadrado, temos que 3 = a2 + 2ab 2 + 2b2 .
√ 3 − a2 − 2b2
Assim, ab 2 = ∈ Q, o que somente é possı́vel se a = 0 ou se b = 0.
2

69

√ é uma contradição, pois a ∈ Q. Se a = 0, então,
Se b = 0, então, 3 = a, o que
√ √ 3 √
3 = b 2, o que implica b = √ ∈ / Q.Logo, r + s 2 = 0, o que também implica
√ 2
p + q 2 = 0.
Consequentemente,
√ √ √ √ √ √
[Q( 2, 3) : Q] = [Q( 2, 3) : Q( 2)][Q( 2) : Q] = 2 × 2 = 4.
√ √
O teorema anterior também nos fornece uma base para Q( 2, 3) sobre Q. Para
 √ √ √
obtê-la, basta formar todos os possı́veis pares de produtos das bases 1, 2 de Q( 2, 3)
√  √ √  √ √ √
sobre Q( 2) e 1, 3 de Q( 2) sobre Q : 1, 2, 3, 6 .

Corolário 6.3 (Lei da Torre) Se K0 , K1 , . . . , Kn são subcorpos de C tais que K0 ⊆


K1 ⊆ · · · ⊆ Kn , então,

[Kn : K0 ] = [Kn : Kn−1 ][Kn−1 : Kn−2 ] . . . [K1 : K0 ].

Demonstração: A demonstração será por indução em n. Se n = 1, então, não há


nada a fazer. Suponhamos, por hipótese de indução, que a igualdade é válida para
n = s, isto é,
[Ks : K0 ] = [Ks : Ks−1 ][Ks−1 : Ks−2 ] . . . [K1 : K0 ].

Para n = s + 1, pela lei curta da torre, temos que

[Ks+1 : K0 ] = [Ks+1 : Ks ][Ks : K0 ]

Assim, por hipótese de indução, podemos concluir que

[Ks+1 : K0 ] = [Ks+1 : Ks ][Ks : Ks−1 ][Ks−1 : Ks−2 ] . . . [K1 : K0 ],

como querı́amos mostrar. □

Veremos que o grau de uma extensão simples é razoavelmente fácil de ser encon-
trado:

70
Proposição 6.4 Seja K(α) : K uma extensão simples. Se ela for trancendente, então,
[K(α) : K] = ∞. Se ela for algébrica, então, [K(α) : K] = ∂m, onde m é o polinômio
minimal de α sobre K.

Demonstração: Se [K(α) : K] for um extensão algébrica simples, então, provamos no


Capı́tulo anterior, que se m é o polinômio minimal de α sobre K e é tal que ∂m = n,
então, {1, α, . . . , αn−1 } é uma base de K(α) sobre K. Portanto, [K(α) : K] = ∂m.
Se [K(α) : K] for um extensão transcendente simples, então, note que o conjunto
1, α, α2 , . . . é sempre linearmente independente, pois se esse conjunto fosse linearmente
dependente, então, existiria uma combinação linear finita não trivial de elementos desse
conjunto que seria igual a 0. Neste caso, conseguirı́amos encontrar um polinômio com
coeficientes em K do qual α é um zero, isto é, α seria algébrico sobre K, o que é uma
contradição. Portanto, [K(α) : K] = ∞. □

Por exemplo, sabemos que C = R(i), onde i tem polinômio minimal t2 + 1, de grau
2. Assim, [C : R] = 2.

Exemplo 6.4 Vamos mostrar uma técnica que devemos usar, sem referência explı́cita,
√ √
sempre que tivermos estudando extensões da forma Q( α1 , . . . , αn ) : Q onde α1 , . . . , αj
√ √ √
são racionais. Vamos determinar [Q( 2, 3, 5) : Q].
Pela lei da torre,
√ √ √ √ √ √ √ √ √ √ √ √
[Q( 2, 3, 5) : Q] = [Q( 2, 3, 5) : Q( 2, 3)][Q( 2, 3) : Q( 2)][Q( 2) : Q].
√ √
Já sabemos que [Q( 2) : Q] = 2, pois t2 − 2 é o polinômio minimal de 2 sobre Q.
√ √ √
Prosseguindo, vamos determinar [Q( 2, 3) : Q( 2)]. Note que t2 − 3 é um po-
√ √
linômio sobre Q( 2) tal que 3 é um zero desse polinômio. Vejamos que, de fato, este
√ √
é o polinômio minimal de 3 sobre Q( 2). Se não o fosse, teria que existir um po-

linômio mônico de grau 1 ou de grau 0 tal que 3 seria um zero destes. Um polinômio
√ √ √
mônico de grau 1 sobre Q( 2) é da forma p = t + α, onde α ∈ Q( 2). Assim, se 3
√ √ √ √
é um zero, temos 0 = p( 3) = 3 + α, o que implica α = − 3 ∈ Q( 2), o que é uma

71
√ √
contradição, pois já provamos que 3 ∈ / Q( 2). Além disso, um polinômio mônico de
√ √
grau 0 sobre Q( 2) é a constante polinomial 1, que claramente não possui 3 como
√ √
um zero. Portanto, t2 − 3 é o polinômio minimal de 3 sobre Q( 2), o que implica
√ √ √
[Q( 2, 3) : Q( 2)] = 2.
√ √ √ √ √
Finalmente, vamos determinar [Q( 2, 3, 5) : Q( 2, 3)]. Novamente observe
√ √ √
que t2 − 5 é um polinômio sobre Q( 2, 3) tal que 5 é um zero desse polinômio.
√ √ √
Vejamos que, de fato, este é o polinômio minimal de 5 sobre Q( 2, 3). Se não o

fosse, teria que existir um polinômio mônico de grau 1 ou de grau 0 tal que 5 seria um
√ √
zero destes. Um polinômio mônico de grau 0 sobre Q( 2, 3) é a constante polinomial

1, que claramente não possui 5 como um zero. Além disso, um polinômio mônico de
√ √ √ √ √
grau 1 sobre Q( 2, 3) é da forma p = t + α, onde α ∈ Q( 2, 3). Assim, se 5 é
√ √ √ √ √
um zero, temos 0 = p( 5) = 5 + α, o que implica α = − 5 ∈ Q( 2, 3). Porém,
vamos provar que isso não acontece e para isso vamos precisar usar uma ideia nova.
√ √ √
Suponhamos que 5 ∈ Q( 2, 3). Então, existem p, q, r, s ∈ Q tais que
√ √ √ √
5 = p + q 2 + r 3 + s 6.

Elevando ambos os membros ao quadrado, temos


√ √ √ √ √ √
5 = (p + q 2 + r 3 + s 6)(p + q 2 + r 3 + s 6)
√ √ √ √ √ √
5 = p2 + pq 2 + pr 3 + ps 6 + pq 2 + 2q 2 + qr 6 + 2qs 3+
√ √ √ √ √ √
+pr 3 + qr 6 + 3r2 + 3rs 2 + ps 6 + 2qs 3 + 3rs 2 + 6s2
√ √ √
5 = p2 + 2q 2 + 3r2 + 6s2 + (2pq + 6rs) 2 + (2pr + 4qs) 3 + (2ps + 2qr) 6.

Consequentemente,
p2 + 2q 2 + 3r2 + 6s2 = 5

2pq + 6rs = 0

2pr + 4qs = 0

2ps + 2qr = 0

72
ou, equivalentemente,
p2 + 2q 2 + 3r2 + 6s2 = 5

pq + 3rs = 0

pr + 2qs = 0

ps + qr = 0

A nova ideia é observar que se a quádrupla (p, q, r, s) satisfaz as últimas 4 equações,


então, as quádruplas (p, q, −r, −s), (p, −q, r, −s) e (p, −q, −r, s) também as satisfazem.
Desse modo, extraindo a raiz quadrada de ambos os membros da equação
√ √ √
5 = (p + q 2 − r 3 − s 6)2
√ √ √
5 = (p − q 2 + r 3 − s 6)2
√ √ √
5 = (p − q 2 − r 3 + s 6)2

temos que
√ √ √ √
p+q 2−r 3−s 6=± 5
√ √ √ √
p−q 2+r 3−s 6=± 5
√ √ √ √
p−q 2−r 3+s 6=± 5

Além disso, nossa suposição inicial era que


√ √ √ √
p + q 2 + r 3 + s 6 = 5.

Assim, temos 4 equações


√ √ √ √
p+q 2+r 3+s 6= 5
√ √ √ √
p+q 2−r 3−s 6=± 5
√ √ √ √
p−q 2+r 3−s 6=± 5
√ √ √ √
p−q 2−r 3+s 6=± 5

73
√ √ √
Somando as duas primeiras, obtemos 2p + 2q 2 = 0 ou 2p + 2q 2 = 2 5. Se
√ √ √ √ √
2p + 2q 2 = 0, então, p = 0 e q = 0. Se 2p + 2q 2 = 2 5, então, p + q 2 = 5

e elevando ambos os membros ao quadrado, temos que p2 + 2pq 2 + 2q 2 = 5, o que
implica p = 0 ou q = 0. Porém, se p = 0, então, 2q 2 = 5, o que implica q 2 = 25 , o que
é impossı́vel, pois q ∈ Q. Por outro lado, se q = 0, então, p2 = 5, o que é impossı́vel,

pois p ∈ Q. Portanto, 2p + 2q 2 = 0 e temos p = 0 e q = 0.
√ √
Somando a primeira e a terceira equações, obtemos 2p + 2r 3 = 0 ou 2p + 2r 3 =
√ √ √ √ √
2 5. Assim, como p = 0, temos que r 3 = 0 ou r 3 = 5. Se r 3 = 0, então,
√ √ √
r = 0; e se r 3 = 5, então, r = √53 , o que é um absurdo. Portanto, r = 0.
√ √
Finalmente, como p = q = r = 0, pela primeira equação, temos que s 6 = 5, o
√ √ √ √
que implica s = √56 ∈ / Q, o que é uma contradição. Logo, 5 ∈/ Q( 2, 3), o que nos
√ √ √
permite concluir que t2 − 5 é o polinômio minimal de 5 sobre Q( 2, 3). Assim,
√ √ √ √ √
[Q( 2, 3, 5) : Q( 2, 3)] = 2. Consequentemente,
√ √ √ √ √ √ √ √ √ √ √ √
[Q( 2, 3, 5) : Q] = [Q( 2, 3, 5) : Q( 2, 3)][Q( 2, 3) : Q( 2)][Q( 2) : Q] =

= 2 × 2 × 2 = 8.

A álgebra linear ocupa sua forma mais poderosa quando se trata de espaços vetoriais
de dimensão finita. Consequentemente, vamos nos concentrar em extensões de corpos
que dão origem a tais espaços vetoriais.

Definição 6.2 Uma extensão finita é aquela cujo grau é finito.

Dada uma extensão simples K(α) : K, provamos que se α é algébrico sobre K,


então, [K(α) : K] = ∂m, onde m é o polinômio minimal de α sobre K. Desse modo,
toda extensão algébrica simples é finita. A recı́proca não é verdadeira.

Definição 6.3 Uma extensão L : K é algébrica se todo elemento de L é algébrico sobre


K.

74
Uma extensão algébrica pode não ser finita, mas toda extensão finita é algébrica.
De modo mais geral, temos o seguinte

Lema 6.5 Uma extensão L : K é finita se, e somente se, L = K(α1 , . . . , αr ), onde r
é finito e cada αi é algébrico sobre K.

Demonstração: Se L : K é uma extensão finita, então, [L : K] é finito, isto é, a


dimensão de L considerado como um espaço vetorial sobre K é finita. Desse modo,
seja {α1 , . . . , αr } uma base de L sobre K. Portanto, L = K(α1 , . . . , αr ). Assim,
somente falta mostrar que cada αi é algébrico sobre K. Para isso, note que como
[L : K] = r, temos que o conjunto {1, αi , αi2 , . . . , αir } é linearmente dependente, pois
possui mais que r elementos. Desse modo, existem k0 , k1 , . . . , kr ∈ K tais que

k0 .1 + k1 .αi + · · · + kr αir = 0.

Consequentemente, αi é um zero do polinômio p = k0 .1 + k1 .t + · · · + kr tr que possui


coeficientes em K. Portanto, cada αi é algébrico sobre K.
Reciprocamente, suponhamos que L = K(α1 , . . . , αr ), onde r é finito e cada αi é
algébrico sobre K. Vejamos que L : K é finita. Pela lei da torre, temos que

[L : K] = [K(α1 , . . . , αr ) : K] =

= [K(α1 , . . . , αr ) : K(α1 , . . . , αr−1 )][K(α1 , . . . , αr−1 ) : K(α1 , . . . , αr−2 )] . . . [K(α1 , α2 ) :


K(α1 )][K(α1 ) : K].
Assim, como α1 é algébrico sobre K, temos que [K(α1 ) : K] = ∂m1 , onde m1 é o
polinômio minimal de α1 sobre K. Do mesmo modo, como α2 é algébrico sobre K,
também temos que α2 é algébrico sobre K(α1 ), o que implica que [K(α1 , α2 ) : K(α1 )] =
∂m2 , onde m2 é o polinômio minimal de α2 sobre K(α1 ). Assim, sucessivamente, como
αr é algébrico sobre K, também temos que αr é algébrico sobre K(α1 , . . . , αr−1 ), o que
implica que [K(α1 , . . . , αr ) : K(α1 , . . . , αr−1 )] = ∂mr , onde mr é o polinômio minimal
de αr sobre K(α1 , . . . , αr−1 ). Portanto, L : K é finita. □

75
Capı́tulo 7

A ideia por trás da Teoria de Galois

Associamos um espaço vetorial a cada extensão de corpos. Para alguns problemas


isso é uma técnica muito grosseira, que apesar de medir o tamanho da extensão, não
determina sua forma. Galois foi mais profundamente em sua estrutura. A cada po-
linômio p ∈ C[t], ele associou um grupo de permutações, que atualmente é conhecido
como grupo de Galois de p em sua homenagem. Algumas questões complicadas sobre
o polinômio geralmente podem ser reduzidas a questões muito mais simples sobre o
grupo, particularmente quando se trata de solução por radicais. O que torna o traba-
lho dele tão surpreendente é que na época dele o conceito de grupo existia somente em
uma forma rudimentar. Outros têm investigado ideias que atualmente intepretamos
como exemplos primitivos de grupos, mas Galois foi indiscutivelmente o primeiro a
reconhecer o conceito em generalidade suficiente, e a entender sua importância.
Introduzimos as ideias principais em um contexto muito simples - uma quártica
polinomial cujas raı́zes são óbvias. Vamos mostrar que a razão para as raı́zes serem
óbvias pode ser estabelecida em termos das simetrias do polinômio - em um modo
apropriado - e que qualquer equação polinomial com essas simetrias também terão
raı́zes “óbvias”. Veremos que equações polinomiais gerais de grau n não são solúveis por
radicais quando n ≥ 5. Esta é uma aplicação espetacular do grupo de Galois, mas em
um contexto muito limitado: corresponde grosseiramente ao que Ruffini provou (ou que
chegou perto de provar) em 1813. Pegando uma outra ideia de Abel, podemos remover

76
a hipótese de Ruffini e provar que não existe expressão radical geral nos coeficientes de
uma quı́ntica, ou qualquer polinômio de grau ≥ 5, que determina um zero.
Poderı́amos parar aqui, porém Galois foi muito mais longe: os métodos dele não
são somente mais elegantes, eles fornecem resultados mais fortes. O material desse
capı́tulo fornece um ponto de partida, a partir do qual podemos começar a ver a beleza
da teoria.

7.1 Um primeiro olhar


A teoria de Galois é uma mistura fascinante de matemática clássica e matemática
moderna, e é necessário um certo esforço para usar seus padrões. Essa seção tem o
objetivo de dar uma ideia rápida dos princı́pios básicos do assunto e explica como o
tratamento abstrato pode ser desenvolvido a partir das ideias originais de Galois.
O objetivo da teoria de Galois é estudar as soluções de equações polinomiais

f (t) = tn + an−1 tn−1 + · · · + a0 = 0.

e, em particular, distinguir quais delas podem ser resolvidas por uma “fórmula” e quais
não as podem. Usamos o termo “fórmula” para nos referir a uma expressão radical, isto
é, uma expressão que possa ser construı́da a partir de coeficientes aj pelas operações de
adição, subtração, multiplicação e divisão, e também por raizes n-ésimas, n = 2, 3, 4, . . .
No Capı́tulo I, vimos que as equações polinomiais sobre C de grau 1, 2, 3 ou 4
podem ser resolvidas por radicais. O objetivo central desse livro é uma demonstração
que a equação quı́ntica é diferente. Em geral, ela não pode ser resolvida por radicais.
Em linguagem moderna, a principal ideia de Galois é olhar para as simetrias do
polinômio f (t). Essas formam um grupo, que será chamado de grupo de Galois, e a
solução da equação polinomial vai ser refletida em várias propriedades do grupo de
Galois.

77
7.2 Os grupos de Galois de acordo com Galois
Galois inventou o conceito de um grupo, muito mais do que relacioná-lo com a solução
de equações. Sua abordagem foi relativamente concreta para padrões atuais, mas para
a sua época a foi profundamente abstrata. De fato, Galois foi um dos fundadores da
álgebra abstrata moderna. Assim, para entender a abordagem moderna, é útil analisar
algo próximo do que Galois tinha em mente.
Como um exemplo, consideramos a equação polinomial

f (t) = t4 − 4t2 − 5 = 0

que já apareceu no Capı́tulo 4. Como já vimos, ela pode ser fatorada como

(t2 + 1)(t2 − 5) = 0,
√ √ √
e possui 4 raı́zes: t = i, −i, 5, − 5. Esses formam dois pares naturais: i e −i; 5
√ √ √
e − 5. De fato, é impossı́vel distinguir i de −i, ou 5 de − 5, algebricamente, no
seguinte sentido. Considere qualquer equação polinomial, com coeficientes racionais,
que é satisfeita por algumas dessas raı́zes. Se
√ √
α=i β = −i γ= 5 δ = − 5,

então, tais equações incluem

α2 + 1 = 0 α+β =0 γ2 − 5 = 0 γ+δ =0 αγ − βδ = 0.

Existe uma quantidade infinita de equações válidas desse tipo. Por outro lado,
também existem uma quantidade infinita de equações algébricas, tais como α + γ = 0,
que são falsas.
Alguns experimentos sugerem que se tomamos qualquer equação válida que conecte
α, β, γ e δ, e trocamos α por β e β por α, novamente vamos obter uma equação válida.
O mesmo é válido se trocarmos γ por δ e δ por γ. Por exemplo, aplicando esse processo
nas equações acima temos

β2 + 1 = 0 β+α=0 δ2 − 5 = 0 δ+γ =0

78
βγ − αδ = 0 αδ − βγ = 0 βδ − αγ = 0.

que todas essas equações são válidas. Porém, note que se trocarmos α por γ e γ por
α, vamos obter equações que não são válidas.
As operações que estamos usando aqui são as permutações dos zeros α, β, γ, δ. De
fato, na notação usual de permutação, trocar α por β e β por α é
 
α β γ δ
R= 
β α γ δ

e trocar γ por δ e δ por γ é


 
α β γ δ
S= .
α β δ γ

Estes são elementos do grupo simétrico S4 em 4 sı́mbolos, que inclui todas as


possı́veis 24 permutações de α, β, γ e δ.
Se essas duas permutações transformam equações válidas em equações válidas,
então, o mesmo deve acontecer com a permutação que é a composta dessas duas per-
mutações, isto é, com  
α β γ δ
T = .
β α δ γ
Existem outras permutações que preservam todas as equações válidas? Sim, de
fato, a identidade  
α β γ δ
I= .
α β γ δ

É possı́vel provar que somente essas 4 permutações preservam equações válidas,


pois as outras 20 permutações transformam equações válidas em equações falsas.
É um fato geral, e fácil de ser provado, que as transformações invertı́veis de um ob-
jeto matemático que preservam alguma caracterı́stica de sua estrutura sempre formam
um grupo, o qual vamos chamar de grupo simétrico do objeto. Essa terminologia é
especialmente comum quando o objeto é uma figura geométrica e as transformações são

79
movimentos rı́gidos, mas a mesma ideia se aplica de modo mais amplo. E, de fato, essas
4 permutações formam um grupo, que vamos denotar por G, isto é, G = {I, R, S, T }.
O que Galois percebeu é que a estrutura desse grupo até certo ponto controla como
devemos começar a resolver a equação.
Ele não usava a notação atual de permutações, e isso pode nos levar a uma potencial
confusão. Para ele, uma permutação de, digamos {1, 2, 3, 4} , era uma lista ordenada,
tal como 2413. Dada uma segunda lista, digamos 3214, ele, então, considerava a
substituição que muda 2413 para 3214, isto é, a aplicação 2 7→ 3, 4 7→ 2, 1 7→ 1, 3 7→ 4.
Atualmente, podemos escrevê-la como
 
2 4 1 3
 .
3 2 1 4
ou, reordenando os elementos da primeira linha, como
 
1 2 3 4
 ,
1 3 4 2
mas Galois nem mesmo usava a notação “ 7→′′ ou conceitos associados. Na verdade,
ele escrevia a substituição como em 1342. O uso dele de notações similares para per-
mutações e substituições provavelmente não facilitava a vida das pessoas que tinham
que julgar seus artigos. A definição atual de “função” ou “aplicação” data de em torno
de 1950 e esta com certeza ajudou a clarear as ideias.
Para ver por que permutações/substituições das raı́zes importam, considere o sub-
grupo H = {I, R} de G. Algumas expressões em α, β, γ, δ são fixadas pelas per-
mutações desse grupo. Por exemplo, se aplicarmos R a α2 + β 2 − 5γδ 2 , então, obtemos
β 2 + α2 − 5γδ 2 , que claramente é a mesma expressão. De fato, uma expressão é fixada
por R se, e somente se, é simétrica em α e β.
Pode-se mostrar que qualquer polinômio em α, β, γ, δ que é simétrico em α e β pode
ser reescrito como um polinômio em α + β, αβ, γ, δ. Por exemplo, a expressão α2 + β 2 −
5γδ 2 pode ser reescrita como (α + β)2 − 2αβ − 5γδ 2 . Porém, como sabemos que α = i
e β = −i, terı́amos que α + β = 0 e αβ = 1. Assim, a expressão (α + β)2 − 2αβ − 5γδ 2
se reduz a −2 − 5γδ 2 . Agora, α e β foram eliminados juntos.

80
7.3 Como usar o grupo de Galois
√ √
Imagine por um momento que não conhecemos os zeros explı́citos i, −i, 5, − 5, mas
que conhecemos o grupo de Galois G. De fato, considere qualquer quártica polinomial
g(t) com o mesmo grupo de Galois que f (t) do nosso exemplo. Desse modo, não
podemos conhecer os possı́veis zeros explicitamente. Vamos chamá-los de α, β, γ, δ.
Considere 3 subcorpos de C relacionados a α, β, γ, δ, os quais são

Q ⊆ Q(γ, δ) ⊆ Q(α, β, γ, δ).

Seja H = {I, R} ⊆ G. Assuma que também sabemos os seguintes dois fatos:

(1) Os números fixados por H são precisamente aqueles em Q(γ, δ);

(2) Os números fixados por G são precisamente aqueles em Q.

Então, vejamos como podemos proceder para resolver a equação quártica g(t) = 0.
Os números α + β e αβ claramente são ambos fixados por H. Pelo fato (1), temos
que α + β, αβ ∈ Q(γ, δ). Mas, como

(t − α)(t − β) = t2 − (α + β)t + αβ

temos que α e β satisfazem a mesma equação quadrática cujos coeficientes estão em


Q(γ, δ), isto é, podemos usar a fórmula que resolve uma equação quadrática para
expressar α, β em termos de funções racionais de γ e δ, o que não envolve nada pior
que raı́zes quadradas. Assim, vamos obter α e β como expressões radicais em γ e δ.
Além disso, podemos repetir o truque para encontrar γ e δ. Os números γ + δ e γδ
são fixados por I, por R, por S e por T , isto é, são fixados por todos os elementos de
G. Portanto, pelo fato (2), γ + δ ∈ Q e γδ ∈ Q.

Lembrete
Considere a equação do segundo grau ax2 + bx + c = 0. Sabemos
√ que as suas raı́zes

−b + ∆ −b − ∆
são determinadas a partir das seguintes expressões: x′ = e x′′ = .
2a 2a

81
Vamos determinar a soma e o produto das raı́zes:
√ √ √ √
′ ′′ −b + ∆ −b − ∆ −b + ∆ − b − ∆ 2b b
x +x = + = =− =− ;
2a 2a 2a 2a a
√ ! √ !
−b + ∆ −b − ∆ b2 − ∆ b2 − (b2 − 4ac) 4ac c
x′ x′′ = = = = = .
2a 2a 4a2 4a2 4a2 a
b c
Desse modo, como ax2 + bx + c = 0 é equivalente a x2 + x + = 0, temos
a a
x2 − (x′ + x′′ )x + x′ x′′ = 0.
Assim, como γ+δ ∈ Q e γδ ∈ Q, temos que γ e δ satisfazem uma equação quadrática
sobre Q, o que implica que γ e δ podem ser dados por expressões radicais em números
racionais. Substituindo γ e δ nas fórmulas para α e γ, finalmente encontramos que
todos os 4 zeros são expressões radicais em números racionais.
Note que não encontramos fórmulas explicitamente. Entretanto, mostramos que
certas informações sobre o grupo de Galois necessariamente implicam que elas existem.
Com informações adicionais, vamos poder terminar o trabalho completamente.
Esse exemplo mostra que a estrutura de subgrupo do grupo de Galois G está inti-
mamente relacionada à possibilidade de resolver a equação g(t) = 0. Galois descobriu
que essa relação é muito profunda e detalhada. Por exemplo, a demonstração que uma
equação de grau 5 não pode ser resolvida por uma fórmula se resume ao fato que a
quı́ntica tem o tipo errado de grupo de Galois. Os artigos de Galois não fazem essa de-
monstração explicitamente, provavelmente porque ele considerava que a insolubilidade
da quı́ntica era um teorema conhecido, mas é de fácil dedução a partir dos resultados
que ele provou.
Vamos apresentar uma versão simplificada desse argumento, sob algumas restrições,
na Seção 7 desse capı́tulo. Na Seção 8, removeremos essa restrição técnica usando
métodos clássicos de Abel.

82
7.4 A definição abstrata
No princı́pio, a abordagem moderna é próxima à abordagem de Galois, mas é dife-
rente em vários aspectos na prática. As permutações α, β, γ, δ que preservam todas as
relações algébricas entre elas acabam sendo o grupo simétrico do subcorpo Q(α, β, γ, δ)
de C gerado pelos zeros de g, ou mais precisamente seu grupo de automorfismos, o qual
é um nome chique para a mesma coisa.
Além disso, queremos considerar polinômios não apenas com coeficientes inteiros
ou racionais, mas coeficientes que pertençam a um subcorpo K de C (ou, futuramente,
a qualquer corpo). Os zeros de um polinômio f (t) com coeficientes em K determinam
outro corpo L que contém K, mas que pode ser maior que K. Assim, o objeto básico
a ser considerado é um par de corpos K ⊂ L, ou em uma leve generalização, uma
extensão de corpos L : K. Assim, quando Galois fala de polinômios, a abordagem
moderna fala de extensões de corpos. E o grupo de Galois do polinômio se torna o
grupo de K-automorfismos de L, isto é, das bijeções θ : L → L tais que para quaisquer
x, y ∈ L e k ∈ K satifazem

θ(x + y) = θ(x) + θ(y);

θ(xy) = θ(x)θ(y);

θ(k) = k.

Assim, a maior parte da teoria é descrita em termos de extensões de corpos e seus


grupos de K-automorfismos. Esse ponto de vista foi introduzido em 1894 por Dedekind,
que foi também quem deu definições axiomáticas de subanéis e subcorpos de C.
O método usado para resolver g(t) = 0 depende crucialmente de conhecer as
condições (1) e (2) do inı́cio da Seção 3 desse capı́tulo. Mas podemos usar aquele
tipo de informação se não já conhecemos os zeros de g? A resposta para essa per-
gunta é que podemos, embora não seja fácil, desde que façamos um estudo geral dos
grupos de automorfismos de extensões de corpos, seus subgrupos, e os subcorpos fixa-
dos por aqueles subgrupos. Esse estudo nos conduz à correspondência de Galois entre

83
subgrupos do grupo de Galois e subcorpos M de L que contém K.
Os Capı́tulos 9, 10 e 11 estabelecem a correspondência de Galois e provam as
suas propriedades fundamentais, e o teorema principal é estabelecido e provado no
Capı́tulo 12. O Capı́tulo 13 estuda um exemplo detalhadamente. Os Capı́tulos 15 e 18
deduzem as consequências espetaculares para a quı́ntica. Então, a partir do Capı́tulo
16, generalizamos a correspondência de Galois para corpos arbitrários e desenvolvemos
a teoria resultante em diversas direções.

7.5 Polinômios e extensões


Nessa seção definimos o grupo de Galois de uma extensão de corpos L : K. Começamos
definindo um tipo especial de automorfismo.

Definição 7.1 Seja L : K uma extensão de corpos, de modo que K é um subcorpo


do subcorpo L de C. Um K-automorfismo de L é um automorfismo α de L tal que
α(k) = k, para todo k ∈ K. Se α(k) = k, para todo k ∈ K, dizemos que α fixa k ∈ K.

Efetivamente, se α(k) = k, para todo k ∈ K, então, α é um automorfismo da


extensão L : K, em vez de ser apenas um automorfismo do corpo maior L. A ideia
de considerar automorfismos de um objeto matemático relativo a um sub-objeto é um
método geral útil; que se enquadra no âmbito “‘Erlangen Programme” de 1872 de Felix
Klein. A ideia de Klein é considerar cada “geometria” como a teoria de invariantes
de uma associada transformação de grupo. Assim, a geometria Euclideana é o estudo
de invariantes do grupo das transformações que preservam distância no plano; a geo-
metria projetiva surge se permitirmos transformações projetivas; a topologia vem do
grupo de todas as aplicações contı́nuas possuindo inversas contı́nuas (chamadas “ho-
meomorfismos” ou “transformações topológicas”). De acordo com essa interpretação,
qualquer extensão de corpos é uma geometria, e estamos simplesmente estudando as
figuras geométricas. O eixo sobre o qual a teoria inteira acontece é um resultado que
não é em si próprio difı́cil de ser provado.

84
Teorema 7.1 Se L : K é uma extensão de corpos, então, o conjunto de todos os
K-automorfismos de L forma um grupo com a operação de composição de funções.

Demonstração: Inicialmente, observe que o conjunto de todos os K-automorfismos é


não vazio, pois a função identidade de L é um K-automorfismo.
Se α, β, γ são K-automorfismos, então, α ◦ (β ◦ γ) = (α ◦ β) ◦ γ, pois composição
de funções é associativa.
Se α, β são K-automorfismos, então, α ◦ β é um automorfismo, pois composta de
funções bijetoras é bijetora e composta de homomorfismos é homomorfismo. Além
disso, se k ∈ K, então, α ◦ β(k) = α(β(k)) = α(k) = k. Portanto, α ◦ β é um
K-automorfismo.
A aplicação identidade de L é o elemento neutro do conjunto de todos os K-
automorfismos.
Finalmente, se α é um K-automorfismo de L, então, α−1 é um automorfismo de L,
e para qualquer k ∈ K, temos que

k = (α−1 ◦ α)(k) = α−1 (α(k)) = α−1 (k).

Portanto, α−1 é um K-automorfismo. □

Definição 7.2 O grupo de Galois Γ(L : K) de uma extensão de corpos L : K é o


grupo de todos os K-automorfismos de L com a operação de composição de funções.

Exemplo 7.1 Considere a extensão C : R. Suponha que α é um R-automorfismo de



C. Seja α(i) = j, onde i = −1. Assim,

j 2 = (α(i))2 = α(i2 ) = α(−1) = −1,

pois α(r) = r, para todo r ∈ R. Desse modo, j = i ou j = −i. Agora, para quaisquer
x, y ∈ R, temos que

α(x + iy) = α(x) + α(i)α(y) = x + jy.

85
Desse modo, temos dois candidatos para R-automorfismos:

α1 : x + iy 7→ x + iy;

α2 : x + iy 7→ x − iy.

Claramente, α1 é a identidade e, assim, é um R-automorfismo de C. A aplicação


α2 é a conjugação complexa, que vimos no Capı́tulo 1 que é um automorfismo. Além
disso, α2 (x) = α(x + 0i) = x − 0i = x, para todo x ∈ R. Portanto, α2 é um R-
automorfismo. Finalmente, note que α2 ◦ α2 = α1 , o que implica que o grupo de Galois
Γ(C, R) é o grupo cı́clico de ordem 2.

Exemplo 7.2 Seja c a raiz cúbica de 2 que é real, e considere a extensão Q(c) : Q.
Se α é um Q-automorfismo de Q(c), então,

(α(c))3 = α(c3 ) = α(2) = 2.

Portanto, α(c) é uma raiz cúbica de 2. Como α(c) ∈ Q(c) ⊆ R, temos que α(c) é
uma raiz cúbica de 2 que é real. Portanto, α(c) = c. Assim, α é a aplicação identidade
e Γ(Q(c) : Q) tem ordem 1.

√ √ √
Exemplo 7.3 Considere a extensão de corpos (Q( 2, 3, 5) : Q). Temos que t2 − 5
√ √ √ √
é irredutı́vel sobre Q( 2, 3), t2 − 2 é irredutı́vel sobre Q( 3, 5) e t2 − 3 é irredutı́vel
√ √ √ √ √ √ √
sobre Q( 2, 5). Sejam ρ um automorfismo de Q( 2, 3, 5), α = 5, β = 2 e

γ = 3, f = t2 − 5, g = t2 − 2 e h = t2 − 3. Assim,

0 = ρ(0) = ρ(f (α)) = ρ(α2 − 5) = ρ(α)ρ(α) − 5,

o que implica ρ(α) = ±α.

0 = ρ(0) = ρ(g(β)) = ρ(β 2 − 2) = ρ(β)ρ(β) − 2,

o que implica ρ(β) = ±β.

0 = ρ(0) = ρ(h(γ)) = ρ(γ 2 − 3) = ρ(γ)ρ(γ) − 3,

86
o que implica ρ(γ) = ±γ.
√ √ √
Assim, existem oito Q-automorfismos de Q( 2, 3, 5), definidos por
√ √ √ √ √ √
id : 2 7→ 2, 3 7→ 3, 5 7→ 5;
√ √ √ √ √ √
ρ2 : 2 7→ − 2, 3 7→ − 3, 5 7→ 5;
√ √ √ √ √ √
ρ3 : 2 7→ 2, 3 7→ 3, 5 7→ 5;
√ √ √ √ √ √
ρ5 : 2 7→ − 2, 3 7→ 3, 5 7→ − 5.
√ √ √ √ √ √
ρ2 ◦ ρ3 : 2 7→ − 2, 3 7→ − 3, 5 7→ 5;
√ √ √ √ √ √
ρ2 ◦ ρ5 : 2 7→ − 2, 3 7→ 3, 5 7→ − 5;
√ √ √ √ √ √
ρ3 ◦ ρ5 : 2 7→ 2, 3 7→ − 3, 5 7→ − 5;
√ √ √ √ √ √
ρ2 ◦ ρ3 ◦ ρ5 : 2 7→ − 2, 3 7→ − 3, 5 7→ − 5.

e temos que
√ √ √
Γ((Q( 2, 3, 5) : Q)) = {id, ρ2 , ρ3 , ρ5 , ρ2 ◦ ρ3 , ρ2 ◦ ρ5 , ρ3 ◦ ρ5 , ρ2 ◦ ρ3 ◦ ρ5 } .

Finalmente, considere

Z2 × Z2 × Z2 = (0, 0, 0), (1, 0, 0), (0, 1, 0), (0, 0, 1), (1, 1, 0), (1, 0, 1), (0, 1, 1), (1, 1, 1) .
√ √ √
É fácil ver que Γ((Q( 2, 3, 5) : Q)) ∼
= Z2 × Z2 × Z2 .

7.6 A correspondência de Galois


Embora seja fácil provar que o conjunto de todos os automorfismos de uma extensão
de corpos L : K forma um grupo, este fato isolado não foi um avanço significativo
no assunto. Para ser útil, o grupo de Galois deve refletir aspectos da estrutura da
extensão de corpos L : K. Galois fez a descoberta (a qual ele expressou em termos de
polinômios) que, sob certas hipóteses adicionais, existe uma correspondência injetora
entre

87
(1) Subgrupos do grupo de Galois de L : K;

(2) Subcorpos M de L tais que K ⊆ M .

Essa correspondência inverte relações de inclusão: subcorpos maiores correspon-


dem a grupos menores. Primeiramente, vamos explicar como a correspondência é
construı́da.
Se L : K é uma extensão de corpos, dizemos que qualquer corpo M tal que K ⊆
M ⊆ L é um corpo intermediário. A cada corpo intermediário M associamos o grupo
M ∗ = Γ(L : M ) de todos os M -automorfismos de L. Assim, K ∗ = Γ(L : K) (o grupo
de Galois todo) e L∗ = Γ(L : L) = idL (a aplicação identidade de L). Observe que
se M ⊆ N , então, N ∗ = Γ(L : N ) ⊆ Γ(L : M ) = M ∗ , isto é, M ∗ ⊇ N ∗ , pois todo
automorfismo de L que fixa todos os elementos de N também fixa todos os elementos
de M . A isso que nos referimos como inverter relações de inclusão.
Reciprocamente, a cada subgrupo H de Γ(L : K) associamos o conjunto H † de
todos os elementos x ∈ L tais que α(x) = x, para todo α ∈ H. De fato, este conjunto
é um corpo intermediário:

Lema 7.2 Se H é um subgrupo de Γ(L : K), então, H † = {x ∈ L | α(x) = x, ∀ α ∈ H}


é um subcorpo de L contendo K.

Demonstração: Sejam x, y ∈ H † e α ∈ H. Assim,

α(x + y) = α(x) + α(y) = x + y,

isto é, x + y ∈ H † ;
α(x − y) = α(x) − α(y) = x − y,

isto é, x − y ∈ H † ;
α(x.y) = α(x).α(y) = x.y,

isto é, x.y ∈ H † ;

α(x.y −1 ) = α(x).α(y −1 ) = α(x).(α(y))−1 = x.y −1 ,

88
isto é, x.y −1 ∈ H † .
Então, H † é um subcorpo de L. Como α ∈ H e H é um subgrupo de Γ(L : K),
temos que α ∈ Γ(L : K), o que implica que α(k) = k, para todo k ∈ K. Portanto,
K ⊆ H †. □

Definição 7.3 A cada subgrupo H de Γ(L : K) associamos o conjunto

H † = {x ∈ L | α(x) = x, ∀ α ∈ H} .

O subcorpo H † de L é chamado de corpo fixo de H.

Assim, como ∗, a aplicação † inverte inclusões: se H ⊂ G, então, H † ⊇ G† . De


fato, se x ∈ G† , então, α(x) = x, para todo α ∈ G. Em particular, α(x) = x, para
todo α ∈ H, o que implica que x ∈ H † . Também é fácil verificar que se M é um corpo
intermediário e H é um subgrupo do grupo de Galois, então, M ⊆ M ∗† e H ⊆ H †∗ .
Note que
M ∗† = (M ∗ )† = {x ∈ L | α(x) = x, ∀ α ∈ M ∗ } ,

onde M ∗ = Γ(L : M ) = é o grupo de todos os automorfismos de L, que fixam todos os


elementos de M .
Dado m ∈ M , temos que m ∈ L e α(m) = m, para todo α ∈ M ∗ . Portanto,
M ⊆ M ∗† .
Note que
H †∗ = (H † )∗ = Γ(L : H † )

é o grupo de todos os automorfismos de L que deixam todos os elementos de H † fixos,


onde
H † = {x ∈ L | α(x) = x, ∀ α ∈ H} .

Dado α ∈ H, então, α é um automorfismo de L; e se x ∈ H † , então, α(x) = x, isto


é, α deixa todos os elementos de H † fixos. Portanto, H ⊆ H †∗ .
Seja c a raiz cúbica de 2 e considere a extensão de corpos Q(c) : Q. Observe que

Q∗† = (Q∗ )† = {x ∈ Q(c) | α(x) = x, ∀ α ∈ Q∗ } ,

89
onde Q∗ = Γ(Q(c) : Q) = é o grupo de todos os automorfismos de Q(c), que fixam
todos os elementos de Q.
Vimos em um exemplo que Q∗ é a aplicação identidade. Portanto, Q∗† = Q(c).
Assim, Q∗† ̸⊆ Q.
Se F denota o conjunto de todos os corpos intermediários, e se G denota o conjunto
dos subgrupos do grupo de Galois, então, definimos duas aplicações:

∗: F → G

†: G → F

Essas duas aplicações constituem a correspondência de Galois entre F e G.


Relembre que um ciclo (a1 . . . ak ) ∈ Sn é a permutação σ tal que σ(aj ) = aj+1 ,
onde 1 ≤ j ≤ k − 1, σ(ak ) = a1 e σ(a) = a, quando a ∈
/ {a1 , . . . , ak }. Todo elemento
de Sn é um produto de ciclos disjuntos, que comutam, e essa expressão é única exceto
pela ordem em que os ciclos são compostos.

Exemplo 7.4 A equação polinomial f (t) = t4 − 4t2 − 5 = 0 foi discutida na seção 2.


√ √
Suas raı́zes são α = i, β = −i, γ = 5 e δ = − 5. A extensão de corpos associada é

L : Q, onde L = Q(i, 5), que foi discutida no Capı́tulo 4. Existem 4 Q-automorfismos
de L, I, R, S e T , onde I é a identidade, e em notação cı́clica R = (αβ), S = (γδ) e
T = (αβ)(γδ). De fato, I, R, S, T são todos os possı́veis Q-automorfismos de L, pois
√ √ √
todo Q-automorfismo deve enviar i em ± i e 5 em ± 5. Portanto, o grupo de
Galois é
Γ(L : Q) = {I, R, S, T } .

Os subgrupos próprios de Γ(L : Q) são

I {I, R} {I, S} {I, T } .

e os corpos fixos correspondentes são respectivamente


√ √
L Q( 5) Q(i) Q(i 5).

90
Capı́tulo 8

Normalidade e separabilidade

Nesse capı́tulo definimos os importantes conceitos de normalidade e separabilidade para


extensões de corpos e desenvolvemos algumas de suas propriedades fundamentais.
Suponha que K é um subcorpo de C. Sabemos que p(t) ∈ K(t) pode não ter zeros
em K, mas p(t) tem zeros em C, pelo Teorema Fundamental da Álgebra. Portanto, p(t)
pode ter no mı́nimo alguns zeros em uma extensão de corpos L de K. Por exemplo,
t2 + 1 ∈ R[t] não têm zeros em R, mas têm zeros ±i ∈ C em Q(i). Na verdade,
em qualquer subcorpo contendo Q(i). Vamos estudar esse fenômeno em detalhes,
mostrando que todo polinômio pode ser fatorado em um produto de fatores lineares se
o corpo base K é estendido a um “corpo de decomposição” adequado N , que tem grau
finito sobre K. Uma extensão N : K é normal se qualquer polinômio irredutı́vel sobre
K com pelo menos um zero em N se fatora em um produto de fatores lineares em N .
Vamos mostrar que uma extensão finita é normal se, e somente se, N é um corpo de
decomposição.
A separabilidade é uma propriedade complementar à normalidade. Um polinômio
irredutı́vel é separável se seus zeros em seu corpo de decomposição são simples. Sobre
C essa propriedade é automática. Faremos isso explicitamente pois não é automático
para corpos mais gerais, como veremos no Capı́tulo 16.

91
8.1 Corpos de decomposição
Os polinômios mais fáceis de se trabalhar são aqueles que são produtos de fatores
lineares, então, vamos separar esta propriedade:

Definição 8.1 Se K é um subcorpo de C e f é um polinômio sobre K, então, f se


decompõe sobre K se pode ser escrito como um produto de fatores lineares

f (t) = k(t − α1 ) . . . (t − αn ),

onde k, α1 , . . . , αn ∈ K.

Nesse caso, os zeros de f em K são precisamente α1 , . . . , αn . O Teorema Funda-


mental da Álgebra implica que f se decompõe sobre K se, e somente se, todos os seus
zeros em C na verdade estão em K. Equivalentemente, K contém o subcorpo gerado
por todos os zeros de f .

Exemplo 8.1 O polinômio t3 − 1 ∈ Q[t] se decompõe sobre C, pois pode ser escrito
como √ !! √ !!
−1 + 3i −1 − 3i
t3 − 1 = (t − 1) t − t−
2 2
√ √ √
Note que f também se decompoõe sobre o subcorpo Q(i, 3), pois −1+2 3i ∈ Q(i, 3).

Na verdade, f se decompõe sobre Q( −1+2 3i
), o menor subcorpo de C com essa propri-
edade.

Exemplo 8.2 O polinômio f (t) = t4 − 4t2 − 5 se decompõe sobre Q(i, 5), pois
√ √
f (t) = (t − i)(t + i)(t − 5)(t + 5).

Entretanto, sobre Q(i) o máximo que podemos fatorá-lo é como

(t − i)(t + i)(t2 − 5),

com um fator irredutı́vel t2 − 5 de grau mais que 1, pois 5 não é um quadrado em Q(i).
Assim, sobre Q(i), o polinômio f não se decompõe, o que mostra que mesmo se um
polinômio f (t) tenha alguns fatores lineares em uma extensão de corpos L, f (t) pode
não ser decomposto sobre L.

92
Se f é um polinômio sobre K e L é uma extensão de corpos de K, então, f também
é um polinômio sbre L. Portanto, faz sentido falar de f se decompor sobre L, o que
quer dizer que f é um produto de fatores lineares com coeficientes em L. Vamos
P
mostrar que dados K e f sempre poderemos construir uma extensão de K tal que
P
f se decompõe sobre . É conveniente exigir, além disso, que f não se decomponha
P
sobre qualquer corpo menor de modo que seja a menor extensão sobre a qual f se
decompõe.
P
Definição 8.2 Um subcorpo de C é um corpo de decomposição de um polinômio
P
não nulo f sobre um subcorpo K de C se K ⊆ e
P
(1) f se decompõe sobre ;
P′ P P′ P′ P
(2) Se K ⊆ ⊆ e f se decompõe sobre , então, = ;

A condição (2) é equivalente a


P P
(2’) = K(σ1 , . . . , σn ), onde σ1 , . . . , σn são os zeros de f em .

Claramente, todo polinômio sobre um subcorpo K de C possui um corpo de de-


composição.

Teorema 8.1 Se K é um subcorpo de C e f é qualquer polinômio não nulo sobre K,


P P
então, existe um único corpo de decomposição de f sobre K. Além disso, [ : K]
é finito.
P
Demonstração: Seja = K(σ1 , σ2 , . . . , σn ), onde σ1 , σ2 , . . . , σn são todos os zeros
P
de f em C. Assim, sabemos que é um corpo de decomposição de f sobre K. Se
P′
é outro corpo de decomposição de f sobre K, então, ′ = K(σ1 , σ2 , . . . , σn ), onde
P
P P′
σ1 , σ2 , . . . , σn são todos os zeros de f em C. Portanto, = . Além disso,
X
[ : K] = [K(σ1 , σ2 , . . . , σn ) : K]

é finito, pelo último lema do Capı́tulo 6

93
“Uma extensão L : K é finita se, e somente se, L = K(α1 , . . . , αr ), onde r é finito
e cada αi é algébrico sobre K.” □

Subcorpos isomorfos de C possuem corpos de decomposição isomorfos, no seguinte


forte sentido:

Lema 8.2 Suponha que i : K → K ′ é um isomorfismo de subcorpos de C. Seja f um


P
polinômio não nulo sobre K e seja ⊇ K o corpo de decomposição de f . Seja L
qualquer extensão de corpos de K ′ tal que i(f ) se decompõe sobre L. Então, existe um
P
monomorfismo j : → L tal que j |K = i.

Demonstração: Temos o seguinte diagrama

/
P
K
i j
 
K′ / L
onde precisamos determinar j. Vamos construir j usando indução sobre o grau de f .
P
Por hipótese, f é um polinômio não nulo sobre K e é o corpo de decomposição de f ,
P
então, f se decompõe sobre . Sejam σ1 , σ2 , . . . , σn todas as raı́zes de f . Desse modo,

f (t) = k(t − σ1 )(t − σ2 ) . . . (t − σn ).


P P
Considere a extensão de corpos : K. Por definição, como σ1 ∈ é algébrico
sobre K, então, o polinômio minimal de σ1 sobre K é o único polinômio mônico m sobre
K tal que m(σ1 ) = 0. Além disso, provamos que este polinômio sempre é irredutı́vel
sobre K e m divide todo polinômio que tem σ1 como raiz. Portanto, m | f .
Relembre que se i : K → K ′ é um monomorfismo de corpos. Então, existe uma
aplicação î : K[t] → K ′ [t], definida por

î(k0 + k1 t + · · · + kn tn ) = i(k0 ) + i(k1 )t + · · · + i(kn )tn ,

(k0 , . . . , kn ∈ K). Além disso, i é um isomorfismo se, e somente se, î é um isomorfismo.


Vimos que o sı́mbolo “chapéu” não é necessário e padronizamos não usá-lo.

94
Como m | f temos que i(m) | i(f ). Também sabemos, por hipótese, que i(f ) se
decompõe sobre L. Assim, como i(m) | i(f ), temos que

i(m) = (t − α1 )(t − α2 ) . . . (t − αr ),

onde α1 , α2 , . . . , αr ∈ L.
Desse modo, como i(m) é um polinômio mônico e irredutı́vel sobre K ′ tal que
(i(m))(α1 ) = 0, temos que i(m) é o polinômio minimal de α1 sobre K ′ . Consequente-
mente, pelo último teorema do Capı́tulo 5
“Suponha que K e L são subcorpos de C e i : K → L é um isomorfismo. Sejam
K(α), L(β) extensões algébricas simples de K e L, respectivamente, tais que α tem
polinômio minimal mα (t) sobre K e β tem polinômio minimal mβ (t) sobre L. Suponha
além disso que mβ (t) = i(mα (t)). Então, existe um isomorfimo j : K(α) → L(β) tal
que j|K = i e j(α) = β.”
existe um isomorfismo
j1 : K(σ1 ) → K ′ (α1 )
P
tal que j1 |K = i e j1 (σ1 ) = α1 . Agora, é um corpo de decomposição sobre K(σ1 ) do
polinômio
f
g= .
t − σ1
Desse modo, como ∂g < ∂f , por hipótese de indução, temos que existe um monomor-
P
fismo j : → L tal que j|K(σ1 ) = j1 . Portanto, como j|K(σ1 ) = j1 e j1 |K = i, podemos
concluir que j|K = i e o lema está provado.

Teorema 8.3 Seja i : K → K ′ um isomorfismo. Seja


P
o corpo de decomposição de
P′
f sobre K, e seja o corpo de decomposição de i(f ) sobre K ′ . Então, existe um
→ ′ tal que j |K = i. Em outras palavras, as extensões
P P P
isomorfismo j : :K e
P′
: K ′ são isomorfas.

95
Demonstração: Considere o seguinte diagrama

/
P
K
i j
 P
K′ / ′

Precisamos encontrar j de tal modo que o diagrama seja comutativo, dado o resto do
→ ′ tal que j|K = i.
P P
diagrama. Pelo Lema anterior, existe um monomorfismo j :
Agora, note que j( ) é um corpo de decomposição de i(f ) sobre K ′ , pois K ′ ⊆ j( ),
P P

i(f ) se decompõe sobre j( ) e j( ) = K ′ (σ1 , σ2 , . . . , σn ), onde σ1 , σ2 , . . . , σn são os


P P

zeros de i(f ) em j( ). Assim, como por hipótese ′ também é corpo de decomposição


P P

de i(f ) sobre K ′ e sabemos que o corpo de decomposição de i(f ) sobre K ′ é único,


temos que j( ) = ′ , o que implica que j é sobrejetora. Portanto, j é um isomorfismo
P P

e o teorema está provado. □

Exemplo 8.3 Seja f (t) = (t2 − 3)(t3 + 1) sobre Q. Podemos construir um corpo de
decomposição de f como segue: sobre C, o polinômio f se decompõe em um produto
de fatores lineares
√ ! √ !
√ √ 1+i 3 1−i 3
f (t) = (t + 3)(t − 3)(t + 1) t − t− ,
2 2
então, existe um corpo de decomposição em C, o qual é
√ !
√ 1+ 3 √
Q 3, = Q( 3, i).
2

Exemplo 8.4 Seja f (t) = (t2 −2t−2)(t2 +1) sobre Q. Os zeros de f em C são 1± 3
e ±i. Então, o corpo de decomposição de f é
√ √
Q(1 + 3, i) = Q( 3, i),

o qual é o mesmo corpo de decomposição que do exemplo anterior, embora os polinômios


envolvidos sejam diferentes.

Exemplo 8.5 É até mesmo possı́vel ter dois polinômios irredutı́veis distintos com o
mesmo corpo de decomposição. Por exemplo, t2 − 3 e t2 − 2t − 2 são ambos irredutı́veis

sobre Q, e o corpo de decomposição destes dois polinômios é Q( 3).

96
8.2 Normalidade
A ideia de extensão normal foi reconhecida explicitamente por Galois (mas, como
sempre, em termos de polinômios sobre C). No tratamento moderno, temos a seguinte
definição.

Definição 8.3 Uma extensão algébrica de corpos L : K é normal se todo polinômio


irredutı́vel f sobre K que tem pelo menos um zero em L se decompõe em L.

Por exemplo, C : R é normal, pois todo polinômio (irredutı́vel ou não) se decompõe


sobre C. Por outro lado, podemos encontrar extensões que não são normais. Seja α a
raiz cúbica de 2 e considere Q(α) : Q. O polinômio irredutı́vel t3 − 2 tem um zero α
em Q(α), mas não se decompõe em Q(α).
Vamos comparar os exemplos de grupos de Galois dados no Capı́tulo 8. A extensão
normal C : R tem um grupo de Galois bem comportado, no sentido que a corres-
√ √ √
pondência de Galois é uma bijeção. O mesmo acontece para Q( 2, 3, 5) : Q. Em
contraste, a extensão Q(α) : Q tem um grupo de Galois mal comportado, o que de
certo modo destaca a importância de normalidade.
Existe uma conexão próxima entre extensões normais e corpos de fatorações, o que
vai nos fornecer vários exemplos de extensões normais.

Teorema 8.4 Uma extensão de corpos L : K é normal e finita se, e somente se, L é
o corpo de decomposição para algum polinômio sobre K.

Demonstração: Suponha que L : K é normal e finita. Como L : K é finita, sabemos


pelo último lema do Capı́tulo 6 que L = K(α1 , . . . , αs ), para alguns elementos αj
algébricos sobre K. Seja mj o polinômio minimal de αj sobre K e considere o polinômio

f = m1 m2 . . . ms .

Cada mj é irredutı́vel sobre K e tem αj ∈ L como um zero. Assim, como L : K


é normal, cada mj se decompõe sobre L. Consequentemente, f também se decompõe
sobre L. Portanto, L é o corpo de decomposição de f sobre K.

97
Reciprocamente, suponha que L é o corpo de decomposição de algum polinômio
g sobre K. Claramente L : K é uma extensão finita, pela definição de corpo de
decomposição. Desse modo, somente precisamos mostrar que L : K é normal. Para
isso, considere um polinômio irredutı́vel f sobre K que tem um zero em L e vamos
mostrar que f se decompõe sobre L. Seja M o corpo de decomposição de f g sobre K.
Note que L ⊆ M , pois L = K(σ1 , . . . , σn ), onde σ1 , . . . , σn são os zeros de g em L e
M = K(σ1 , . . . , σn , α1 , . . . , αm ), onde α1 , . . . , αm são os zeros de f em M . Suponha que
θ1 e θ2 são zeros de f em M . Sejam m1 e m2 os polinômios minimais de θ1 e θ2 sobre
M . Desse modo, m1 e m2 são polinômios irredutı́veis sobre K. Além disso, sabemos
que f também é irredutı́vel sobre K e m1 divide f e m2 divide f . Portanto, m1 = f e
m2 = f , isto é, f é o polinômio minimal de θ1 e de θ2 sobre K.
Afirmação: [L(θ1 ) : L] = [L(θ2 ) : L].
Vamos provar isso usando um truque interessante. Vamos olhar para vários sub-
corpos de M , os quais são K, L, K(θ1 ), L(θ1 ), K(θ2 ), L(θ2 ). Temos duas torres

K ⊆ K(θ1 ) ⊆ L(θ1 ) ⊆ M

K ⊆ K(θ2 ) ⊆ L(θ2 ) ⊆ M

Efetuando cálculos de graus, obtemos

[L(θ1 ) : L][L : K] = [L(θ1 ) : K] = [L(θ1 ) : K(θ1 )][K(θ1 ) : K];

[L(θ2 ) : L][L : K] = [L(θ2 ) : K] = [L(θ2 ) : K(θ2 )][K(θ2 ) : K];

Assim, como [K(θ1 ) : K] é o grau do polinômio minimal de θ1 sobre K e [K(θ2 ) : K]


é o grau do polinômio minimal de θ2 sobre K e ambos são iguais ao grau de f , temos
que [K(θ1 ) : K] = [K(θ2 ) : K]. Além disso, como L(θ1 ) é o corpo de decomposição
de g sobre K(θ1 ) e L(θ2 ) é o corpo de decomposição de g sobre K(θ2 ), e pelo último
corolário do Capı́tulo 5, K(θ1 ) é isomorfa a K(θ2 ), então, pelo teorema anterior as
extensões L(θ1 ) : K(θ1 ) e L(θ2 ) : K(θ2 ) são isomorfas, o que implica que elas possuem
o mesmo grau, isto é, [L(θ1 ) : K(θ1 )] = [L(θ2 ) : K(θ2 )]. Consequentemente, pelas

98
igualdades acima, temos que [L(θ1 ) : L] = [L(θ2 ) : L]. Portanto, se θ1 ∈ L, então,
[L(θ1 ) : L] = 1, o que implica [L(θ2 ) : L] = 1, o que implica que θ2 ∈ L. Portanto,
L : K é normal, pois se f tem um zero em L, qualquer outro zero de f também pertence
a L.

8.3 Separabilidade
Galois não reconheceu explicitamente o conceito de separabilidade, pois ele trabalhou
somente com o corpo dos números complexos onde, como veremos, separabilidade é
automática. Entretanto, o conceito está implı́cito no trabalho dele e será usado quando
estudarmos corpos mais gerais.

Definição 8.4 Um polinômio irredutı́vel f sobre um subcorpo K de C é separável sobre


K se f possui somente zeros simples em C, ou equivalentemente, zeros simples em seu
corpo de decomposição, o que significa que sobre seu corpo de decomposição, ou sobre
C, f se decompõe como
f (t) = k(t − σ1 ) . . . (t − σn )

onde todos os σj ’s são diferentes.

Exemplo 8.6 O polinômio t4 + t3 + t2 + t + 1 é separável sobre Q, pois seus zeros


sobre C são
2πi 4πi 6πi 8πi
e 5 ,e 5 ,e 5 ,e 5 ,

os quais são todos diferentes.

Para polinômios sobre R existe um método padrão de determinar zeros múltiplos


por diferenciação. Com o intuito de ter o máximo de generalidade futuramente, vamos
redefinir a derivada de um modo puramente formal.

Definição 8.5 Suponha que K é um subcorpo de C, e seja

f (t) = a0 + a1 t + · · · + an tn ∈ K[t].

99
Então, a derivada formal de f é o polinômio

D(f ) = a1 + 2a2 t + · · · + nan tn−1 ∈ K[t].

Para K = R e também para K = C esta é a derivada usual. Muitas propriedades


úteis da derivada são válidas para D. Em particular, cálculos simples mostram que
para quaisquer polinômios f e g sobre K, temos que

D(f + g) = D(f ) + D(g);

D(f.g) = D(f )g + f D(g);

Além disso, se λ ∈ K, então, D(λ) = 0, o que implica

D(λ.f ) = D(λ).f + λD(f ) = λD(f ).

Estas propriedades de D nos permitem provar um critério para a existência de zeros


múltiplos sem conhecer quais são os zeros.
P
Lema 8.5 Seja f ̸= 0 um polinômio sobre um subcorpo K de C, e seja o seu corpo
P
de decomposição. Então, f tem um zero múltiplo (em C ou em ) se, e somente se,
f e D(f ) possuem um fator comum de grau ≥ 1 em K[t].
P
Demonstração: Suponhamos que f possua um zero repetido α em . Desse modo,

f (t) = (t − α)2 g(t),

o que implica

D(f ) = 2(t − α)g(t) + (t − α)2 D(g) = (t − α)[2g(t) + (t − α)D(g)].


P
Portanto, f e D(f ) têm um fator comum t − α em [t]. Assim, f e D(f ) possuem
um fator comum em K[t], o polinômio minimal de α sobre K.
Reciprocamente, suponhamos que f e D(f ) possuem um fator comum de grau ≥ 1
em K[t]. Seja α um zero desse fator comum. Desse modo, f = (t−α)g e Df = (t−α)h.
Assim,
(t − α)h = Df = g + (t − α)D(g),

100
o que implica
g = (t − α)h − (t − α)D(g) = (t − α)(h − D(g)).

Portanto, f = (t − α)g = (t − α)(t − α)(h − D(g)) = (t − α)2 (h − D(g)). Logo, f


P
tem um zero múltiplo em . □
Agora, vamos provar que a separabilidade de um polinômio irredutı́vel é automati-
camente válida sobre subcorpos de C.

Proposição 8.6 Se K é um subcorpo de C, então, todo polinômio irredutı́vel sobre K


é separável.

Demonstração: Um polinômio irredutı́vel f sobre K não é separável se, e somente se,


f tem um zero múltiplo se, e somente se, f e D(f ) tem um fator comum de grau ≥ 1.
Neste caso, como f é irredutı́vel temos que o fator comum deve ser f , porém D(f ) tem
grau menor que o grau de f , e o único múltiplo de f tendo grau menor que o grau de
f é 0. Portanto D(f ) = 0. Assim, se f (t) = a0 + a1 t + · · · + an tn , então,

0 = D(f ) = a1 + 2a2 t + 3a3 t2 + 4a4 t3 + · · · + nan tn−1 ,

o que implica kak = 0, para quaisquer inteiros k > 0. Para subcorpos de C, isso é
equivalente a an = 0, para todo n > 0. Portanto, f = a0 . Logo, se f não é constante,
então, f é separável. Além disso, sabemos que um polinômio constante sempre é
separável. Assim, todo polinômio irredutı́vel sobre um subcorpo K de C é separável.

101

Você também pode gostar