Você está na página 1de 10

Polinômio minimal

Observação 0.180. Sejam V um espaço vetorial sobre K, T ∈ L(V, V ) e


p(x) ∈ P(K). Então podemos considerar o operador linear p(T ) ∈ L(V, V ).
Lembremos que se p(x) = an xn + an−1 xn−1 + · · · + a1 x + a0 , então p(T ) =
an T n + +an−1 T n−1 + · · · + a1 T + a0 Id, onde

Tk = T
| ◦ T ◦{z· · · ◦ T} .
k


p(x), se p(T ) = 0 L(V,V ) , isto é, se p(T )
Agora, dizemos que T é raiz de p(x)
for o operador identicamente nulo. Lembremos que se dimK V = n, então
dimK L(V, V ) = n2 . Daı́, se m > n2 = dimK L(V, V ), temos que o con-
junto, {Id, T, T 2 , . . . , T m }, de vetores de L(V, V ) é LD, donde existem esca-
lares a0 , a1 , a2 , . . . , am não todos nulos tais que am T m + am−1 T m−1 + · · · +

a1 T + a0 Id = 0 L(V,V ) . Em particular, T é raiz de q(x), com q(x) = am xm +
am−1 xm−1 + · · · + a1 x + a0 .

Exemplo 0.181. Seja T ∈ L(R, R). Como dimR L(R, R) = 12 = 1, então o


conjunto {Id, T } é LD. De fato, sabemos que T = Tβ , para algum β ∈ R,
isto é, T é dada por T (x) = βx, para algum β ∈ R. Se β = 0, então

T = 0 L(R,R) e o conjunto é LD. Suponhamos então β 6= 0. Seja c := aId + bT
uma combinação linear qualquer de Id, T . Suponhamos que c é o vetor nulo.

Assim, aId + bT = 0 L(R,R) , donde em particular (aId + bT )(1) = 0 (isto é,

a + bβ = 0). Portanto, (−β)Id + T = 0 L(R,R) é uma combinação linear não
trivial de Id, T resultando no vetor nulo. Logo, o conjunto é LD.

Observação 0.182. Mas pode ser que {Id, T, T 2 , . . . , T k } já seja LD, para
algum k < n2 . Consideremos k > 0 tal que {Id, T, T 2 , . . . , T k−1 } é LI,
mas {Id, T, T 2 , . . . , T k } é LD. Mas, então, T k deve ser combinação linear
de Id, T, T 2 , . . . , T k−1 , ou seja, existem escalares a0 , a1 , a2 , . . . , ak−1 tais que
T k = ak−1 T k−1 + · · · + a1 T + a0 Id. Daı́, T é raiz de mT (x), onde mT (x) =

59
xk − ak−1 xk−1 − · · · − a1 x − a0 . Notemos mT (x) é um polinômio mônico,
pois ak := 1.

Exemplo 0.183. Seja T : R2 → R2 um operador linear dado por T (x, y) =


(x+y, x−y). Temos que T 2 (x, y) = T (T (x, y)) = T (x+y, x−y) = (x+y+(x−
y), x + y − (x − y)) = (2x, 2y) = 2Id(x, y), donde T 2 = 2Id. Já sabemos que

{Id} é LI. Verifiquemos que {Id, T } é LI. De fato, se αId + βT = 0 L(R2 ,R2 ) ,
então α(x, y) + β(x + y, x − y) = (0, 0), para todo (x, y) ∈ R2 , donde (α +
β)x + βy = 0 e βx + (α − β)y = 0. Se x = 0 e y = 1, obtemos que β = 0 = α,
donde {Id, T } é LI. Agora, desde que T 2 = 2Id, obtemos que {Id, T, T 2 } é

LD. Então, pela construção de mT (x), como T 2 − 2Id = 0 L(R2 ,R2 ) , segue que
mT (x) = x2 − 2.

Proposição 0.184. Sejam V um espaço vetorial sobre K de dimensão finita



e T ∈ L(V, V ). Se p(x) ∈ P(K) é tal que p(T ) = 0 L(V,V ) , então p(x) é um
múltiplo de mT (x).

De fato, seja p(x) ∈ P(K) tal que p(T ) = 0 L(V,V ) . Consideremos a divisão de
p(x) por mT (x). Daı́, existem q(x), r(x) ∈ P(K) tais que p(x) = mT (x)q(x)+

r(x), com ou r(x) = 0 P(K) , ou o grau de r(x) menor do que o grau de mT (x).
→ → →
Daı́, 0 L(V,V ) =P (T )=mT (T )◦q(T )+r(T )= 0 L(V,V )◦q(T )+r(T )= 0 L(V,V )+r(T ) =
r(T ). Como mT (x) é o polinômio mônico de menor grau tal que T é raiz,
→ →
e r(T ) = 0 L(V,V ) , segue que r(x) = 0 P(K) , isto é, r(x) é o polinômio identi-
camente nulo. Logo, p(x) = mT (x)q(x) e portanto p(x) é um múltiplo de
mT (x).

Definição 0.185. Sejam V um espaço vetorial sobre K de dimensão finita


e T ∈ L(V, V ). Chamamos o polinômio mT (x) ∈ P(K) (que é mônico, de

menor grau tal que mT (T ) = 0 L(V,V ) ) de polinômio minimal de T .

Exemplo 0.186. Seja S : R3 → R3 um operador linear dado por

60
 
0 0 0
 
[S]B = 
 1 0 0 ,

0 1 0
para alguma base B de R3 . S é diagonalizável? Bem,
 
x 0 0
 
[xId − S]B =   −1 x 0 

0 −1 x
e portanto pS (x) = det([xId − S]B ) = x3 , donde 0 é o único autovalor
de S (pois é a única raiz de pT (x), a menos de multiplicade). É fácil
ver que AutS (0) = [(0, 0, 1)], donde S não é diagonalizável (pois mg(0) =
dimK AutT (0) = 1 6= 3 = ma(0).
→ → →
Observemos agora que [S]B = 6 0 , ([S]B )2 6= 0 , mas ([S]B )3 = 0 M3×3 (R) , donde
→ → →
S 6= 0 , S 2 6= 0 , mas S 3 = 0 L(R3 ,R3 ) . Então S é raiz de x3 e portanto x3 é um
múltiplo de mS (x). Como os únicos divisores de x3 são x, x2 e x3 , e S não
anula os dois primeiros segue que mS (x) = x3 .

Exemplo 0.187. Seja T : R3 → R3 um operador linear dado por T (x, y, z) =


(z, z, z). Mostre que T é diagonalizável. De fato,
 
0 0 1
 
[T ]BC = 
 0 0 1  ,
0 0 1
e portanto pT (x) = det([xId − T ]BC ) = x2 (x − 1), donde 0 e 1 são au-
tovalores de T . Já sabemos que ma(1) = mg(1) = 1. Como AutT (0) =
[(1, 0, 0), (0, 1, 0)] (verifique), então {(1, 0, 0), (0, 1, 0)} é uma base de AutT (0),
donde mg(0) = dimK AutT (0) = 2 = ma(0). Logo, T é diagonalizável.
Agora, notemos que
    
0 0 1 −1 0 1 0 0 0
    
[T ]BC .([T ]BC − I3 ) = 
 0 0 1  0
 −1 1  =
 
 0 0 0 ,

0 0 1 0 0 0 0 0 0

61

donde, obtemos que T (T − I) = 0 L(R3 ,R3 ) , isto é, T é raiz de x(x − 1) e
portanto x(x − 1) é um múltiplo de mT (x). Desde que os únicos divisores de
x(x − 1) são x, x − 1 e x(x − 1), e T não anula os dois primeiros segue que
mT (x) = x(x − 1).

Observação 0.188. Notemos que, nos exemplos anteriores, verificamos que


as raı́zes do polinômio minimal do operador são os autovalores do operador.

Vejamos agora, sem demonstração, o teorema de Cayley-Hamilton.

Teorema 0.189. Sejam V um espaço vetorial sobre K de dimensão finita e


T ∈ L(V, V ). Então T é raiz de pT (x).

Observação 0.190. Assim, pelos resultados anteriores, obtemos que pT (x)


é um múltiplo de mT (x).

Proposição 0.191. Sejam V um espaço vetorial sobre K de dimensão finita


e T ∈ L(V, V ). Então pT (x) e mT (x) têm as mesmas raı́zes (a menos de
multiplicidade).

De fato, suponhamos que λ ∈ K é uma raiz de pT (x). Então λ é um auto-



valor de T e portanto existe v0 6= 0 V tal que T (v0 ) = λv0 . Daı́, T 2 (v0 ) =
λ2 v0 , T 3 (v0 ) = λ3 v0 , . . . , T j (v0 ) = λj v0 , para todo j > 0. Seja mT (x) =

xk + ak−1 xk−1 · · · + a1 x + a0 , para algum a0 , . . . , ak ∈ K. Então 0 L(V,V ) =
mT (T ) = T k + ak−1 T k−1 · · · + a1 T + a0 Id, donde

0 V = mT (T )(v0 ) = T k (v0 ) + ak−1 T k−1 (v0 ) + · · · + a1 T (v0 ) + a0 Id(v0 )
= λk v0 + ak−1 λk−1 v0 + · · · + a1 λv0 + a0 v0
= (λk + ak−1 λk−1 + · · · + a1 λ + a0 )v0

e portanto, como v0 =6 0 V , então λk + ak−1 λk−1 + · · · + a1 λ + a0 = 0, isto é,
λ é uma raiz de mT (x).
Suponhamos agora que λ ∈ K é uma raiz de mT (x). Então mT (x) = (x −

62

λ)q(x), para algum q(x) ∈ P(K). Daı́, notemos que 0 L(V,V ) = mT (T ) =
(T − λId) ◦ q(T ). Agora, como o grau de q(x) é menor do que o grau
→ →
de mT (x), então q(T ) 6= 0 L(V,V ) . Daı́, existe u0 ∈ V tal que q(T )(u0 ) 6= 0 V .

Denotemos v0 := q(T )(u0 ). Logo, 0 V = mT (T )(u0 ) = ((T −λId)◦q(T ))(u0 ) =

(T − λId)(q(T )(u0 )) = T (v0 ) − λv0 , isto é, T (v0 ) = λv0 , com v0 6= 0 V , donde
λ é um autovalor de T . Daı́, λ é uma raiz de pT (x).

Proposição 0.192. Sejam V um espaço vetorial sobre K de dimensão finita


e T ∈ L(V, V ). Sejam λ1 , λ2 , . . . , λk ∈ K todos os autovalores de T (distintos
entre si). Se T é diagonalizável, então mT (x) = (x−λk ).(x−λk−1 ). · · · .(x−λ1 ).

De fato, seja q(x) := (x − λk ).(x − λk−1 ). · · · .(x − λ1 ). Desde que q(x) é o po-
linômio mônico de menor grau que tem as mesmas raı́zes do que pT (x), então

se mostrarmos que q(T ) = 0 L(V,V ) , obteremos que mT (x) = q(x). Façamos
isto. Seja B uma base de V formada por autovetores de T . Se v ∈ B, então

existe um autovalor λi tal que T (v) = λi v. Daı́, (T − λi Id)(v) = 0 V . Logo, se

q(T ) = (T − λk Id) ◦ (T − λk−1 Id) ◦ · · · ◦ (T − λ1 Id), então q(T )(v) = 0 V , para
→ →
todo v ∈ B. Portanto, q(T )(v) = 0 V , para todo v ∈ V , donde q(T ) = 0 L(V,V ) .

Observação 0.193. Na demonstração acima, suponha que dimK V = 3 e


B := {v1 , v˜1 , v2 }, onde v1 , v˜1 ∈ AutT (λ1 ) e v2 ∈ AutT (λ2 ). Então um vetor v
de V se escreve de forma única, digamos v = α1 v1 + α˜1 v˜1 + α2 v2 . Assim,

(T −λ2 Id) ◦ (T −λ1 Id) (v) =

(T −λ2 Id) T (v)−λ1 v =
 linear
(T −λ2 Id) T (α1 v1 + α˜1 v˜1 +α2 v2 )−λ1 (α1 v1 + α˜1 v˜1 +α2 v2 ) =
 autovet.
(T −λ2 Id) α1 T (v1 )+ α˜1 T (v˜1 )+α2 T (v2 )−λ1 (α1 v1 + α˜1 v˜1 +α2 v2 ) =

(T −λ2 Id) α1 λ1 v1 + α˜1 λ1 v˜1 +α2 λ2 v2 −λ1 (α1 v1 + α˜1 v˜1 +α2 v2 ) =
 linear
(T −λ2 Id) α2 λ2 v2 −λ1 α2 v2 =
autovet.
(α2 λ2 − λ1 α2 )(T −λ2 Id)(v2 ) =
→ →
(α2 λ2 − λ1 α2 ) 0 = 0

63

ou seja, neste caso obtemos que (T −λ2 Id) ◦ (T −λ1 Id) = 0 L(V,V ) .

Agora, sem demonstração, vejamos o resultado abaixo.

Proposição 0.194. Sejam V um espaço vetorial sobre K de dimensão finita


e T ∈ L(V, V ). Sejam λ1 , λ2 , . . . , λk ∈ K todos os autovalores de T (dis-
tintos entre si). Se mT (x) = (x − λk ).(x − λk−1 ). · · · .(x − λ1 ), então T é
diagonalizável.

Observação 0.195. Com os dois resultados anteriores, temos mais uma


caracterização de T ser diagonalizável, a saber: T é diagonalizável se, e
somente se, mT (x) só admite raı́zes simples (cada autovalor de T deve ser
raiz de mT (x) uma única vez).

Exemplo 0.196. Seja T : R11 → R11 um operador linear dado por

T (x1 , x2 , . . . , x11 ) = (0, x1 , 0, . . . , 0).

Então T não é diagonalizável. Com efeito,

T 2 (x1 , x2 , . . . , x11 ) = T (T (x1 , x2 , . . . , x11 )) = T (0, x1 , 0 . . . , 0) = (0, 0, . . . , 0),



donde segue que T 2 = 0 L(R11 ,R11 ) , ou seja, T é raiz de x2 e portanto x2 é um
múltiplo de mT (x). Já que os únicos divisores de x2 são x e x2 , e T não
anula o primeiro, então mT (x) = x2 e portanto T não é diagonalizável (pois
0 não é uma raiz simples de mT (x)).

Exemplo 0.197. Seja S : R11 → R11 um operador linear dado por

S(x1 , x2 , . . . , x11 ) = (x1 , 0, . . . , 0).

Então S é diagonalizável. Com efeito,

S 2 (x1 , x2 , . . . , x11 ) = S(S(x1 , x2 , . . . , x11 )) = S(x1 , 0 . . . , 0) = (x1 , 0, . . . , 0),

64
donde segue que S 2 = S, ou seja, S é raiz de x2 − x e portanto x2 − x é
um múltiplo de mS (x). Como os únicos divisores de x2 − x são x, x − 1 e
x(x − 1), e S não anula os dois primeiros, então mS (x) = x(x− 1) e portanto
S é diagonalizável (pois 0 e 1 são raı́zes simples de mS (x)).

Exemplo 0.198. Seja S : R3 → R3 um operador linear tal que mS (x) =


x2 −24x+143. S tem autovalores? S é diagonalizável? Quais são os possı́veis
pS (x)? Sim, S tem autovalores, pois, como mS (x) = x2 − 24x + 143 =
(x − 11)(x − 13), então 11 e 13 são todos os autovalores de S. Ainda, S
é diagonalizável, pois mS (x) só tem raı́zes simples (cada autovalor de S é
raiz de mS (x) uma única vez). Finalmente, como pS (x) é um múltiplo de
mS (x) que tem as mesmas raı́zes deste, então pS (x) = (x − 11)i (x − 13)j ,
para algum i, j > 1. Desde que o grau de pS (x) é 3, pois dimR R3 = 3, então
ou pS (x) = (x − 11)(x − 13)2 , ou pS (x) = (x − 11)2 (x − 13).

Espaço vetorial com produto interno


De agora em diante, consideraremos apenas espaços vetoriais sobre R (corpo
dos números reais).

Definição 0.199. Seja V um R-espaço vetorial. Um produto interno em


V é uma função

h, i : V × V → R
(u, v) 7→ hu, vi ∈ R

satisfazendo:

(P1) hλu + v, wi = λhu, wi + hv, wi, se u, v, w ∈ V , λ ∈ R

(P2) hv, ui = hu, vi, se u, v ∈ V



(P1) hu, ui > 0, se u 6= 0 , u ∈ V

65
Assim, um R-espaço vetorial V munido com um produto interno é chamado
de um espaço vetorial (real) com produto interno.

Proposição 0.200. Seja V um espaço vetorial com produto interno h , i.


Então:
→ →
1. hv, 0 i = h 0 , vi = 0, se v ∈ V

2. hu, λv + wi = λhu, vi + hu, wi, se u, v, w ∈ V , λ ∈ R


Pm Pn Pm Pn
3. h i=1 α i ui , j=1 βj vj i = i=1 j=1 αi βj hui , vj i, se αi , βj ∈ R, ui , vj ∈
V , com i = 1, . . . , m, j = 1, . . . , n

4. hu, ui = 0 se, e somente se, u = 0
→ → → → → → (P 1) → →
Mostremos (1). Como 0 =1. 0 + 0 , então h 0 , vi = h1. 0 + 0 , vi = 1h 0 , vi + h 0 , vi
→ →
e portanto, somando −h 0 , vi dos dois lados igualdade, obtemos que h 0 , vi =
→ →
0. Por (P 2), segue então que hv, 0 i = h 0 , vi = 0, para todo v ∈ V .
(P 2) (P 1)
Mostremos (2). Para todo u, v, w ∈ V , λ ∈ R, hu, λv + wi = hλv + w, ui =
(P 2)
λhv, ui + hw, ui = λhu, vi + hu, wi.
Mostremos (3). Sejam ui , vj , v ∈ V , αi , βj ∈ R, com i = 1, . . . , m, j =
P Pm
1, . . . , n. Mostremos primeiro que h mi=1 αi ui , vi = i=1 αi hui , vi. Façamos
por indução em m. Se m = 1, então o resultado segue por (P 1). Suponhamos
P Pm−1
que o resultado vale para m − 1 (HI). Logo, h m i=1 αi ui , vi = h i=1 αi ui +
(P 1) Pm−1 (HI) Pm−1
αm um , vi = h i=1 αi ui , vi + hαm um , vi = i=1 αi hui , vi + αm hum , vi.
Pn Pn
Agora, por (P 2), obtemos que hv, j=1 βj vj i = i=1 βj hv, vj i. Usando estas
duas igualdades, obtemos o resultado.

Mostremos (4). Se u 6= 0 , então, por (P 3), hu, ui > 0 e portanto hu, ui =
6 0.
→ → →
Se u = 0 , então, pela primeira parte, h 0 , 0 i = 0. Logo, hu, ui = 0 se, e só se,

u =0.

Exemplo 0.201. Consideremos Rn como sendo R-espaço vetorial. Defina-


mos h , i:Rn×Rn →R por h(x1 , . . . , xn ), (y1 , . . . , yn )i:=x1 .y1 + · · · + xn .yn ∈ R.

66
Mostremos que h , i é um produto interno em Rn . De fato, hλ(x1 , . . . , xn ) +
(y1 , . . . , yn ), (z1 , . . . , zn )i=h(λx1 +y1 , . . . , λxn +yn ), (z1 , . . . , zn )i=(λx1 +y1 ).z1
+ · · · + (λxn + yn ).zn = λ(x1 .z1 + · · · + xn .zn ) + y1 .z1 + · · · + yn .zn =
λh(x1 , . . . , xn ), (z1 , . . . , zn )i + h(y1 , . . . , yn ), (z1 , . . . , zn )i. Ainda, é fácil ver
que (P 2) vale. Finalmente, como h(x1 , . . . , xn ), (x1 , . . . , xn )i = x21 + · · · + x2n
que é maior do que 0, se (x1 , . . . , xn ) 6= (0, . . . , 0), segue que h , i é um produto
interno em Rn , chamado de produto interno canônico de Rn .

Exemplo 0.202. Consideremos Rn como sendo R-espaço vetorial. Sejam


α1 , α2 , . . . , αn escalares positivos. Definamos h , iα1 ...αn : Rn × Rn → R
por h(x1 , . . . , xn ), (y1 , . . . , yn )iα1 ...αn :=α1 .x1 .y1 +α2 .x2 .y2 +· · ·+αn .xn .yn ∈ R.
Mostremos que h , iα1 ...αn é um produto interno em Rn . É fácil ver que (P 1)
e (P 2) valem. Agora, desde que h(x1 , . . . , xn ), (x1 , . . . , xn )iα1 ...αn = α1 .x21 +
α2 .x22 + · · · + αn .x2n que é maior do que 0, se (x1 , . . . , xn ) 6= (0, . . . , 0), segue
que h , iα1 ...αn é um produto interno em Rn . Assim, por este exemplo, vemos
que um R-espaço vetorial pode admitir diferentes produtos internos.

Exemplo 0.203. Consideremos o R-espaço vetorial das matrizes m × n com


coeficientes em R, Mm×n (R). Definamos h , i: Mm×n (R) × Mm×n (R) → R por
P Pn
h(aij )i,j , (bij )i,j i:= m
i=1 j=1 aij .bij ∈ R.

Então h , i é um produto interno em Mm×n (R) (verifique), chamado de pro-


duto interno canônico de Mm×n (R).

Exemplo 0.204. Consideremos o R-espaço vetorial das funções contı́nuas


de [a, b] em R, C([a, b], R). Definamos h , i: C([a, b], R) × C([a, b], R) → R por
Rb
hf, gi:= a f (x).g(x)dx ∈ R.

Então h , i é um produto interno em C([a, b], R). De fato, basta usarmos que
Rb Rb Rb Rb
(λf (x)+g(x)).h(x)dx = λ f (x).h(x)dx+ g(x).h(x)dx, g(x).f (x)dx =
Rab Rb 2
a a a

a
f (x).g(x)dx, e a (f (x)) dx > 0, se f não for identicamente nula, isto é,

67

se f =6 0 C([a,b],R) . Com estas propriedades, verifique que h , i é um produto
interno em C([a, b], R)

O próximo resultado nos dá uma maneira de obter um produto interno a


partir de um outro produto interno.

Proposição 0.205. Sejam V, W R-espaços vetoriais, V sendo com produto


interno h , iV . Seja T : W → V uma transformação linear injetora. Então
a função h , iT : W × W → R dada por hw1 , w2 iT := hT (w1 ), T (w2 )iV é um
produto interno em W .

Com efeito, sejam λ ∈ R, w1 , w2 , w3 ∈ W . Então hλw1 +w2 , w3 iT = hT (λw1 +


T linear h , iV p.i.
w2 ), T (w3 )iV = hλT (w1 ) + T (w2 ), T (w3 )iV = λhT (w1 ), T (w3 )iV +
hT (w2 ), T (w3 )iV = λhw1 , w3 iT + hw2 , w3 iT .
h , iV p.i.
Ainda, hw1 , w2 iT = hT (w1 ), T (w2 )iV = hT (w2 ), T (w1 )iV = hw2 , w1 iT .
h , iV p.i. →
Finalmente, hw1 , w1 iT = hT (w1 ), T (w1 )iV > 0, se T (w1 ) 6= 0 . Como T
→ →
é injetora, segue que T (w1 ) 6= 0 se, e só se, w1 6= 0 . Logo, hw1 , w1 iT > 0, se

w1 6= 0 . Portanto, h , iT é um produto interno em W .

Corolário 0.206. Todo R-espaço vetorial de dimensão finita admite um pro-


duto interno.

De fato, sejam V um R-espaço vetorial e B := {v1 , . . . , vn } uma base de


V . Consideremos Rn como sendo R-espaço vetorial e BC a base canônica
de Rn . Desde que B e BC são bases que têm o mesmo número de elemen-
tos, existe uma única transformação linear T : V → Rn tal que T (v1 ) =
(1, 0, . . . , 0), T (v2 ) = (0, 1, 0, . . . , 0), . . . , T (vn ) = (0, . . . , 0, 1) e existe uma
única S : Rn → V que faz o contrário. Assim, T é um isomorfismo (pois veri-
P
ficamos que S = T −1 ) dado por T ( ni=1 αi vi ) = (α1 , α2 , . . . , αn ) ∈ Rn . Logo,
P P
h ni=1 αi vi , ni=1 βi vi iT := h(α1 , α2 , . . . , αn ), (β1 , β2 , . . . , βn )iRn é um produto
interno em V , onde h , iRn é o produto interno canônico de Rn . Em outras
palavras, se v, w ∈ V , então hv, wiT := h[v]B , [w]B iRn .

68

Você também pode gostar