Você está na página 1de 186

CURSO DE

lgebra Linear Aplicada


Antonio Cndido Faleiros
Centro de Matemtica, Computao e Cognio
Universidade Federal do ABC
Santo Andr, SP
6 de abril de 2009

Sumrio
1 Equaes lineares
1.1 Equao algbrica linear . . . . . . . . .
1.2 Produto escalar . . . . . . . . . . . . . .
1.3 Sistemas de equaes algbricas lineares
1.4 Sistema escalonado . . . . . . . . . . . .
1.5 Sistema inferiormente escalonado . . . .
1.6 Sistemas equivalentes . . . . . . . . . . .
1.7 O mtodo da eliminao de Gauss . . . .
1.8 Matrizes inversas . . . . . . . . . . . . .
1.9 Matrizes elementares . . . . . . . . . . .
1.10 Clculo da inversa . . . . . . . . . . . .
1.11 Fatorao LU . . . . . . . . . . . . . . .
1.12 Decomposio PLU . . . . . . . . . . . .
1.13 Decomposio de Cholesky . . . . . . . .
2 Espao vetorial
2.1 Conceito de espao vetorial .
2.2 Dependncia linear . . . . .
2.3 Base e dimenso . . . . . . .
2.4 Matriz de mudana de base
2.5 Subespao vetorial . . . . .
2.6 Subespao gerado . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

1
1
3
4
6
9
10
11
13
15
17
19
26
30

.
.
.
.
.
.

33
33
35
37
40
43
44

3 Transformao linear
49
3.1 Matriz de uma transformao linear . . . . . . . . . . . . . . . . . . . . . . 54
3.2 Isomorfismo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.3 Transformaes lineares em Cm1 . . . . . . . . . . . . . . . . . . . . . . . 60
4 Produto interno e norma
4.1 Produto interno em espaos vetoriais reais . . .
4.2 Produto interno em espaos vetoriais complexos
4.3 Funcional linear . . . . . . . . . . . . . . . . . .
4.4 Norma . . . . . . . . . . . . . . . . . . . . . . .
i

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

61
61
62
65
66

ii

Notas de aula do Prof. Antonio Cndido Faleiros


4.5 Ortogonalizao de Gram-Schmidt . . . . . . . . . . . . . . . . . . . . . . 68
4.6 Decomposio QR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

5 Soma de subespaos
77
5.1 Soma direta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
5.2 Complemento ortogonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
6 Transformao adjunta
81
6.1 Posto de uma transformao linear . . . . . . . . . . . . . . . . . . . . . . 85
6.2 Existncia de soluo dos sistemas lineares . . . . . . . . . . . . . . . . . . 87
7 Projetores
7.1 Projetores ortogonais . . . . . . . . . . . . . .
7.2 Projetores ortogonais em Cm1 . . . . . . . .
7.3 Ortogonalizao de Gram-Schmidt em Cm1 .
7.4 Ortogonalizao modificada de Gram-Schmidt
7.5 Contagem das operaes . . . . . . . . . . . .
8 Refletor de Householder
8.1 Decomposio QR usando o refletor
8.2 O algoritmo para calcular R . . . .
8.3 Contagem das operaes . . . . . .
8.4 O algoritmo para calcular Q . . .
8.5 O algoritmo para calcular Q . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

de Householder
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .

9 Mnimos quadrados
9.1 Mnimos quadrados e a decomposio
9.2 Pseudo inversa . . . . . . . . . . . .
9.3 Reta de regresso . . . . . . . . . . .
9.4 Interpolao polinomial . . . . . . . .
9.5 Ajuste polinomial . . . . . . . . . . .
9.6 Aproximao polinomial de funes .
9.7 Aproximao trigonomtrica . . . . .

QR
. . .
. . .
. . .
. . .
. . .
. . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.

89
89
92
94
95
96

.
.
.
.
.

.
.
.
.
.

99
101
103
104
104
105

.
.
.
.
.
.
.

107
. 109
. 109
. 110
. 111
. 112
. 112
. 114

.
.
.
.
.

10 Autovalores e autovetores
11 Espaos Invariantes
11.1 Polinmio mnimo . . . . . . . . . . . .
11.2 Matrizes em bloco . . . . . . . . . . . .
11.3 Decomposio primria . . . . . . . . .
11.4 Diagonalizao de operadores normais .
11.5 Decomposio de Schur . . . . . . . . .
11.6 Decomposio em valores singulares . .

115

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

123
. 125
. 131
. 132
. 135
. 139
. 141

Notas de aula do Prof. Antonio Cndido Faleiros


12 Forma cannica de Jordan
12.1 Operadores nilpotentes . .
12.2 Forma cannica de Jordan
12.3 Subespaos cclicos . . . .
12.4 Forma cannica racional .
12.5 Forma triangular . . . . .
12.6 Espaos quocientes . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

iii

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

147
. 147
. 151
. 153
. 154
. 155
. 156

13 Aplicaes

159

A Matrizes
A.1 Matrizes especiais . . . . . . . . . . . . . . . .
A.2 Multiplicao de matrizes . . . . . . . . . . .
A.3 Inversa . . . . . . . . . . . . . . . . . . . . . .
A.4 Operaes elementares e matrizes elementares

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

161
162
163
164
166

B Determinante
B.1 Permutao . . . . . . . . . . . . . . . .
B.2 Determinante . . . . . . . . . . . . . . .
B.3 Cofator . . . . . . . . . . . . . . . . . .
B.4 Regra de Cramer . . . . . . . . . . . . .
B.5 Determinante de Vandermonde . . . . .
B.6 Determinante, uma definio alternativa

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

169
169
171
174
177
178
179

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

iv

Notas de aula do Prof. Antonio Cndido Faleiros

Captulo 1
Equaes lineares
1.1

Equao algbrica linear

Uma equao algbrica linear tpica nas variveis x1 , x2 e x3


x1 + 2x2 3x3 = 5.
Resolv-la significa determinar todos os valores reais para x1 , x2 e x3 que tornam verdadeira a igualdade. Neste caso, explicitando x1 em relao a x2 e x3 na equao, obtemos x1 = 5 2x2 + 3x3 . Para qualquer x2 e x3 reais, basta tomar x1 = 5 2x2 + 3x3 para
obter uma soluo. Neste exemplo, temos uma infinidade de solues, onde podemos
variar livremente x2 e x3 .
De modo geral, dados os nmeros reais a1 , . . . , an e b, uma equao da forma
a1 x1 + + an xn = b

(1.1)

chamada de equao algbrica linear nas variveis x1 , x2 , . . . , xn . As variveis


tambm so chamadas de incgnitas por serem os valores a serem determinados para
valer a igualdade. Os nmeros reais ai so chamados de coeficientes e b a constante da
equao. A primeira incgnita com coeficiente no nulo chamada de varivel principal
ou incgnita principal e as demais so chamadas de variveis livres.
Uma matriz coluna real v = [v1 , . . . , vn ]T soluo desta equao quando
a1 v1 + + an vn = b.
Diz-se ainda que a nupla de nmeros reais (v1 , . . . , vn ) satisfaz a equao.
Uma equao
0x1 + + 0xn = b,

em que todos os coeficientes so nulos degenerada. Se b for igual a zero, ento toda
matriz coluna [x1 , . . . , xn ]T soluo. Se b for diferente de zero, a equao degenerada
no possui soluo.
As equaes no degeneradas com duas ou mais variveis possui infinitas solues.
Uma equao no degenerado com uma nica varivel possui uma nica soluo.
1

Notas de aula do Prof. Antonio Cndido Faleiros

Exemplo 1.1 Para todo s real, a matriz coluna [7 + 3s, 2s]T soluo de 2x1 3x2 = 8
que, portanto, possui infinitas solues. A varivel s que aparece neste exemplo chamado
de parmetro.
O conjunto de todas as solues de uma equao chamado conjunto soluo ou
soluo geral. Cada elemento deste conjunto , evidentemente, uma soluo e, quando
for conveniente, ser chamado de soluo particular.
Para determinar a soluo geral de uma equao no degenerada a1 x1 + + an xn =
b basta explicitar a incgnita principal em funo das variveis livres.
Exemplo 1.2 Para obter a soluo geral de x1 7x2 + x3 = 1, basta explicitar x1 para
obter x1 = 1+ 7x2 x3 . A soluo geral o conjunto de matrizes coluna

x1
7
1
1 + 7x2 x3
1
x2 =
= 0 + x2 1 + x3 0 .
x2
x3
x3
0
1
0
A equao

a1 x1 + + an xn = 0

denominada de equao homognea. Ela est associada equao no homognea


(1.1) e, por esse motivo, chamada de equao homognea associada equao no
homognea
a1 x1 + + an xn = b.

O uso de matrizes pode simplificar a notao. Sendo a = [a1 , . . . , an ]T a matriz dos


coeficientes e x = [x1 , . . . , xn ]T a matriz das variveis, a equao acima pode ser
colocada na forma
aT x = b.
Exemplo 1.3 Consideremos novamente a equao do exemplo anterior x1 7x2 + x3 =
1, cuja soluo geral

x1
1 + 7x2 x3
1
7
1
x2 =
= 0 + x2 1 + x3 0 .
x2
0
0
1
x3
x3

interessante observar que [1, 0, 0]T soluo da equao e que tanto [7, 1, 0]T quanto
[1, 0, 1]T so solues da equao homognea associada.
Este exemplo apresenta um fato geral.
Se v1 , . . . , vp forem solues da equao homognea aT x = 0, ento
c1 v1 + + cp vp
continua sendo soluo, para qualquer escolha dos nmeros reais c1 , . . . , cn . Esta soma
chamada de combinao linear das matrizes v1 , . . . , vp .
Se um conjunto {v1 , . . . , vp } de solues da equao homognea for tal que toda
soluo da equao homognea uma combinao linear dos seus elementos, diremos que
ele um conjunto gerador das solues da equao homognea.

Notas de aula do Prof. Antonio Cndido Faleiros

Exemplo 1.4 Explicitando x1 na equao x1 3x2 + x3 = 0, obtemos x1 = 3x2 x3 para


da obter todas as solues desta equao

x1
3
1
3x2 x3
x2 =
= x2 1 + x3 0 .
x2
x3
x3
0
1

Portanto, [3, 1, 0]T e [1, 0, 1]T formam um conjunto gerador de solues para a equao
dada.

Se w0 for uma soluo da equao no homognea aT x = b e v for uma soluo da


equao homognea Ax = 0, ento w0 + v soluo da equao no homognea. Alm
disso, se w1 for outra soluo de Ax = b, ento existe uma soluo u de Ax = 0 tal que
w1 = w0 + u. Esta soluo u exatamente w1 w0 .
Do pargrafo acima tiramos uma lio muito interessante. Conhecendo todas as
solues da homognea e uma nica soluo da no homognea, conheceremos todas
as solues da no homognea.

1.2

Produto escalar

O produto matricial aT x denominado de produto escalar das matrizes coluna a e x,


sendo denotado por ha, xi , isto ,
ha, xi = aT x.
Este conceito de produto escalar importante e voltaremos a ele posteriormente.
Propriedades do produto escalar
Se x, y, z forem vetores coluna e k um nmero real,
1. hx, xi 0 e hx, xi = 0 se e s se x = 0.
2. hx, yi = hy, xi
3. hx, y + zi = hx, yi + hx, zi
4. hx, kyi = k hx, yi
Usando o produto escalar, a equao (1.1) assume a forma
ha, xi = b.

1.3

Notas de aula do Prof. Antonio Cndido Faleiros

Sistemas de equaes algbricas lineares

Um sistema de equaes como


3x1 2x2 = 6
x1 + x2 = 7
um sistema de equaes algbricas lineares. Nos problemas onde estes sistemas ocorrem,
o interesse se volta para a determinao dos valores de x1 e x2 que tornam verdadeiras
as duas igualdades. Neste exemplo, para determin-los, pode-se, por exemplo explicitar
x1 na segunda equao x1 = 7 x2 , substituir esta expresso no lugar de x1 na primeira
equao 3(7 x2 ) 2x2 = 6 e expliciar x2 obtendo x2 = 3. Substituindo este valor na
expresso de x1 em funo de x2 obtemos x1 = 7 x2 = 7 3 = 4. Portanto os valores
de x1 e x2 que tornam verdadeiras as duas igualdades do sistema so x1 = 4 e x2 = 3.
Dados os nmeros reais aij e bi , com i = 1, . . . , m e j = 1, . . . , n, o sistema de equaes
a11 x1 + + a1n xn = b1
=
am1 x1 + + amn xn = bm
chamado de sistema de equaes algbricas lineares com m equaes e n incgnitas.
Os nmeros aij so denominados coeficientes do sistema, bi so os termos constantes
e xj so as incgnitas ou variveis do sistema. Esta forma de apresentar o sistema
denominada de forma padro.
Podemos simplificar a notao usando matrizes. Em

x1
b1
a11 a1n

.. ,
...
x = ...
e
b = ... ,
A = ...
.
xn
bn
am1 amn
denominamos A de matriz dos coeficientes, x de matriz das incgnitas e b de matriz
dos termos constantes do sistema. Na forma matricial, o sistema se reduz a
Ax = b.
A matriz [A | b] obtida acrescentando-se matriz A uma coluna final com os elementos
de b, chamada de matriz aumentada do sistema linear.
Um vetor coluna real w tal que Aw = b chamado de soluo do sistema Ax = b.
Isto significa que w soluo de cada equao do sistema. Um sistema como este pode
ter ou no uma soluo.
Exemplo 1.5 O sistema

1 2
0 0

x1
x2

3
1

Notas de aula do Prof. Antonio Cndido Faleiros

no possui soluo pois no existem x1 e x2 que tornam verdadeira a segunda equao. A


segunda equao do sistema degenerada e seu segundo membro diferente de zero.
O sistema

4
1 2
x1
=
1
0 1
x2
possui uma nica soluo x1 = 2 e x2 = 1. Para obt-la, basta observar que, da segunda
equao x2 = 1 e, da primeira, x1 + 2x2 = 4. Como x2 = 1, devemos ter x1 = 2.
O sistema

3
1 2
x1
=
x2
6
2 4
possui infinitas solues. De fato, explicitano x1 na primira equao segue x1 = 3 2x2 .
Substituindo esta expresso na segunda vem 2(3 2x2 ) + 4x2 = 6 que se simplifica em 6 =
6, ou seja, sempre satisfeita. Logo, qualquer matrix coluna [x1 , x2 ]T = [3 2x2 , x2 ]T
uma soluo do sistema. A varivel x2 pode variar livremente nos reais.
O conjunto de todas as solues do sistema chamado de conjunto soluo ou
soluo geral do sistema. Este conjunto pode ser vazio, ter um nico elemento ou
possuir infinitos elementos. O sistema de equaes que no possui soluo chamado
incompatvel. Quando possui uma nica soluo compatvel determinado e, quando
possui infinitas solues, chamado de compatvel indeterminado.
O sistema de equaes Ax = 0 chamado de homogneo. Quando b 6= 0, o sistema
de equaes Ax = b chamado de no homogneo. Um sistema est intimamente
ligado ao outro e, por esta razo, Ax = 0 chamado de sistema homogneo de equaes
associado ao sistema Ax = b.
A equao homognea Ax = 0 possui sempre a soluo trivial x = 0. Entretanto,
quando o sistema homogneo Ax = 0 possui uma soluo v no trivial, ela possuir
infinitas solues pois cv ser soluo para qualquer nmero real c.
Podemos ir um pouco alm. Se v1 , . . . , vp forem solues do sistema homogneo Ax =
0, ento
c1 v1 + + cp vp
ainda ser uma soluo do sistema homogneo para qualquer escolha dos nmeros reais
c1 , . . . , cn . A soma acima chamada de combinao linear dos vetores {v1 , . . . , vp }.
Se toda soluo de Ax = 0 for uma combinao linear dos elementos deste conjunto, ele
ser chamado de conjunto gerador das solues do sistema homogneo Ax = 0.
Se v for uma soluo de Ax = 0 e w0 for uma soluo de Ax = b, ento w0 + v
soluo de Ax = b. Se w1 for outra soluo de Ax = b, diferente de w0 , ento u = w1
w0 soluo de Ax = 0. Logo, qualquer soluo w1 do sistema Ax = b da forma w1 =
w0 + u onde u soluo da equao homognea Ax = 0. Em outras palavras, conhecida
uma soluo w0 de Ax = b, outra soluo w1 deste sistema da forma w1 = w0 + u, onde
u soluo do sistema homogneo Ax = 0.
Ao conhecer uma nica soluo do sistema no homogneo Ax = b e a soluo geral
do sistema homogneo Ax = 0, se conhece a soluo geral do sistema no homogneo.

Notas de aula do Prof. Antonio Cndido Faleiros

O sistema no homogneo Ax = b pode ter uma soluo ou no. Se a nica soluo


do sistema homogneo Ax = 0 for a trivial e Ax = b tiver uma soluo, ela ser nica.
Quando Ax = 0 possuir soluo no trivial e Ax = b possuir uma soluo, ento possuir
infinitas outras.
Exemplo 1.6 Considere o sistema

1 2 5
0 1 6


x1
x2 = 7 .
3
x3

Explicitando x2 na segunda equao, x2 = 3+ 6x3 . Usando esta expresso de x2 na


primeira equao e explicitando x1 , segue x1 = 13+ 7x3 . Logo, toda soluo deste sistema da forma


x1
13
7
x2 = 3 + x3 6
0
1
x3
Observe que [13, 3, 0]T uma soluo particular do sistema e [7, 6, 1]T soluo
do sistema homogneo associado. O valor de x3 poder variar livremente no conjunto dos
nmeros reais.
No exemplo anterior, as variveis x1 e x2 foram expressas em termos de x3 . neste caso,
chamamos x1 e x2 de variveis principais e x3 a varivel livre.

1.4

Sistema escalonado

Uma matriz escalonada aquela em que


1. Todas as linhas nulas esto abaixo das linhas no nulas.
2. Numa linha no nula, o primeiro elemento no nulo igual a 1. Este elemento
chamado de piv ou lder da linha.
3. O piv de uma linha est direita do piv da linha de cima.
Exemplo 1.7 A matriz

escalonada.

1 0 3 0
0 0 1 2
0 0 0 0

Notas de aula do Prof. Antonio Cndido Faleiros

Um sistema Ax = b escalonado quando a matriz A for escalonada. As variveis que


multiplicam os pivs so denominadas de variveis principais e as demais de variveis
livres ou parmetros.
Achar as solues de um sistema escalonado bastante simples. Podem aparecer
equaes degeneradas na parte inferior do sistema. Se uma dessas equaes degeneradas
possuir segundo membro no nulo, o sistema no possui soluo. Se todos os segundos
membros das equaes degeneradas forem nulas, o sistema tem soluo. Para obt-las,
podemos desconsiderar as equaes degeneradas.
Eliminadas as equaes degeneradas, explicitamos as variveis principais de cada linha
em funo das demais, comeando na ltima linha e retornando at a primeira. A partir
da penltima equao use as variveis principais j explicitadas para colocar a varivel
principal daquela equao em termos das variveis livres. Com este processo obtm-se
todas as variveis principais em termos das variveis livres. Esta tcnica de soluo
denominada de substituio reversa.
Exemplo 1.8 O sistema

1
0

0
0

0
1
0
0

x1
2 1

3 5 x2
0 1 x3
0 0
x4

3
0

=
8
0

escalonado. As variveis x1 , x2 e x4 so as variveis prinicipais e x3 a varivel


livre. A ltima equao degenerada mas compatvel pois o segundo membro tambm
nulo. O sistema possui soluo e esta ltima equao pode ser desconsidereda uma vez
que qualquer matriz coluna real [x1 , x2 , x3 , x3 ]T uma soluo. Eliminada esta equao,
a terceira passa a ser a ltima, onde explicitamos x4 = 8. Da segunda, explicitamos x2 =
3x3 5x4 . Usando o valor de x4 determinado na etapa anterior, obtemos x2 = 3x3
40. Na primeira, explicitamos x1 = 3 2x3 +x4 . Usando o valor de x4 determinado
anteriormente, obtemos x1 = 3 2x3 +8 = 5 2x3 . Colocamos as trs variveis principais x1 , x2 e x4 em funo da varivel livre x3 . A soluo geral do sistema ser


5 2x3
5
2
x1

x2 40 3x3 40
+ x3 3

x3 =

0
1
x3
8
0
x4
8
onde a varivel livre x3 pode assumir qualquer valor real. interessante observar que
[2, 3, 1, 0]T soluo do sistema homogneo associado Ax = 0.
Uma matriz A de tamanho mn escalonada reduzida se for escalonada e cada piv
o nico elemento no nulo em sua coluna. Neste caso, o sistema Ax = b denominado
de sistema escalonado reduzido.

Notas de aula do Prof. Antonio Cndido Faleiros

Exemplo 1.9 O sistema

x1
3
1 2 0 3

0 0 1 1 x2 = 0
x3
0
0 0 0 0
x4

escalonado reduzido. As variveis x1 e x3 so principais e x2 e x4 so livres. A ltima


equao degenerada mas compatvel. O mtodo da substituio reversa nos fornece x3 =
x4 e x1 = 3 2x2 3x4 , onde as variveis principais esto em funo das variveis
livres.
Algoritmo da substituio reversa
Este algoritmo resolve o sistema Rx = b pelo mtodo da substituio reversa, onde R
quadrada, inversvel e triangular superior. Isto significa que

r11 r12 r1m

r22 r2m

R=
..
...

.
rmm

com rii 6= 0, para i = 1, . . . , m. Para resolver o sistema Rx = b, iniciamos explicitando


xm na ltima equao e, retornando at a primeira, explicitando as variveis principais
de cada equao em funo das variveis determinadas nas etapas anteriores. Assim,
xm = bm /rmm
xm1 = (bm1 rm1,m xm ) /rm1,m1
xm2 = (bm2 rm2,m1 xm1 rm2,m xm ) /rm2,m2
e assim por diante. O caso geral, em que j = m 1, m 2, . . . , 1, assume a forma
!,

m
X
xj = bj
rmj,mj
rjk xk
k=j+1

==================================

Entrada: Matriz R de tamanho m m e matriz b de tamanho m 1.


Sada: Matriz x de tamanho m 1.
==================================
x = b ;
x(m) = b(m) / R(m,m);
for j = m-1:-1:1
x(j) = ( b(j) - R(j, j+1:m) * x(j+1:m) ) / R(j,j);
end
==================================

Notas de aula do Prof. Antonio Cndido Faleiros

1.5

Sistema inferiormente escalonado

Um procedimento semelhante pode ser adotado para matrizes m n inferiormente


escalonadas, que so aquelas com as seguintes caractersticas:
1. Se existirem linhas nulas, elas se localizam na parte inferior da matriz.
2. O ltimo elemento no nulo de uma linha igual a 1, sendo denominado de piv
ou lider da linha.
3. O piv de uma linha se encontra direita do piv da linha anterior.
Quando A for escalonada inferiormente, o sistema Ax = b chamado de sistema
inferiormente escalonado. As variveis que multiplicam os pivs so denominadas
de principais e as demais so denominadas livres. Se as equaes degeneradas deste
sistema forem compatveis, o sistema possui soluo que pode ser obtida pelo processo de
substituio direta. Primeiro, descartam-se as equaes degeneradas. Em seguida, a
partir da primeira equao, explicita-se a varivel principal em funo das variveis livres.
A partir da segunda, prossiga at a ltima, explicitando a varivel principal daquela
equao em funo das demais, usando as expresses das variveis principais obtidas
anteriormente para explicitar a varivel principal em funo das variveis livres apenas.
Uma matriz A de tamanho m n inferiormente escalonada reduzida quando
for inferiormente escalonada e cada piv for o nico elemento no nulo em sua coluna.
Neste caso, o sistema Ax = b denominado de sistema inferiormente escalonado
reduzido. Tais sistemas, quando compatveis, so facilmente resolvidos pelo processo de
substituio direta.
Algoritmo da substituio direta
Este algoritmo resolve o sistema Rx = b pelo mtodo da substituio reversa, onde R
quadrada, inversvel e triangular inferior. Isto significa que

r11
r21 r22

R = ..

.
.
.

.
rm1 rm2 rmm

com rii 6= 0, para i = 1, . . . , m. Para resolver o sistema Rx = b, iniciamos explicitando


x1 na primeira equao e, prosseguindo at a ltima, vamos explicitando as variveis
principais de cada equao em funo das variveis determinadas nas etapas anteriores.
Assim,
x1 = b1 /r11
x2 = (b2 r21 x1 ) /r22
x3 = (b3 r31 x1 r32 x2 ) /r3,3

10

Notas de aula do Prof. Antonio Cndido Faleiros

e assim por diante. O caso geral, em que j = 2, 3, . . . , m, assume a forma


xj =

bj

j1
X

rjk xk

k=1

!,

rjj

Algoritmo da substituio direta


Este algoritmo resolve pelo mtodo da substituio direta um sistema Rx = b, onde
R uma matriz quadrada m m, triangular inferior, inversvel e b uma matriz coluna
m 1.
==================================
Entrada: Matrizes R e b.
Sada: Matriz x, soluo dos sistema Rx = b.
==================================
x = b ;
x(1) = b(1) / R(1,1);
for j = 2:m
x(j) = ( b(j) - R(j, 1:j-1) * x(1:j-1) ) / R(j,j);
end
==================================

1.6

Sistemas equivalentes

Uma tcnica muito usada para resolver sistemas de equaes lineares consiste em realizar
transformaes sobre o sistema original at se chegar a um sistema escalonado cuja soluo
simples. Para que esta tcnica se torne efetiva, as transformaes no podem alterar o
conjunto soluo do sistema.
Definio 1.10 Dois sistemas Ax = b e Bx = c so equivalentes quando ambos possuem o mesmo conjunto soluo.
Existem operaes, denominadas elementares que, ao serem aplicadas a um sistema,
preserva suas solues, transformando-o em outro sistema equivalente. As operaes elementares so:
1. Permutar a ordem de duas equaes.
2. Multiplicar uma equao por uma constante no nula.
3. Adicionar a uma equao um mltiplo de outra.

Notas de aula do Prof. Antonio Cndido Faleiros

11

Num sistema de equaes, podemos enumer-las: equao 1, 2, . . . , m. Sejam i e j


nmeros inteiros entre 1 e n.
O operao que permuta as equaes i e j ser denotada por O(li lj ), a operao que
multiplica a equao i por um nmero r no nulo ser denotada por O(rli ) e a operao
que consiste em adicionar equao i um mltiplo r de outra equao j ser denotada
por O(li + rlj ).
As operaes elementares so reversveis. A operao O(li lj ) pode ser revertida
aplicando novamente esta mesma operao. A operao O(rli ) pode ser revertida aplicando a operao O(r1 li ) e a operao O(li +rlj ) pode ser revertida aplicando a operao
O(li rlj ).
Vamos mostrar que essas transformaes levam o sistema original em outro equivalente.
Faamos a prova para um caso particular que representa o caso geral.
Se [x1 , x2 , x3 ]T for uma soluo do sistema
a11 x1 + a12 x2 + a13 x3 = b1
a21 x1 + a22 x2 + a23 x3 = b2
a31 x1 + a32 x2 + a33 x3 = b3

(1.2)

e r for um nmero real, ento vale ainda a igualdade


(a11 + ra21 )x1 + (a12 + ra22 )x2 + (a13 + ra23 )x1 =
a11 x1 + a12 x2 + a13 x3 + r(a21 x1 + a22 x2 + a23 x3 ) = b1 + rb2
mostrando que [x1 , x2 , x3 ]T soluo do sistema
(a11 + ra21 )x1 + (a12 + ra22 )x2 + (a13 + ra23 )x1 = b1 + rb2
a21 x1 + a22 x2 + a23 x3 = b2
a31 x1 + a32 x2 + a33 x3 = b3

(1.3)

Isto significa que as solues do sistema (1.2) so solues do sistema (1.3) que foi obtido
do original a partir da transformao elementar O(l1 + rl2 ). Logo, as solues de (1.3) so
solues de (1.2) pois esta pode ser obtida daquela pela operao O(l1 rl2 ). Conclumos
que os sistemas original e o transformado so equivalentes.
De modo semelhante se pode provar que as outras operaes elementares transformam
um sistema em outro equivalente.

1.7

O mtodo da eliminao de Gauss

O mtodo de Gauss consiste em realisar operaes elementares sobre linhas no sistema


Ax = b, transformando-o num sistema escalonado equivalente e resolvendo-o por substituio reversa.
Como a matriz A dos coeficientes e a matriz b das constantes contm todas as informaes necessrias para montar o sistema, vamos considerar a matriz completa do

12

Notas de aula do Prof. Antonio Cndido Faleiros

sistema, obtida ao acrescentar a coluna b direita de A. Esta matriz ser denotada por
[A b]. A realizao de operaes elementares sobre as equaes equivalente realizao
de operaes elementares sobre as linhas da matriz completa.
Vamos escreve A R quando for possvel levar A em R efetuando operaes elementares sobre as linhas de A. Se R for escalonada, diremos que ela a forma escalonada
de A. Se R for escalonada reduzida, diremos que ela a forma escalonada reduzida
de A. Pode-se provar que a forma escalonada reduzida de uma matriz nica.
O processo de Gauss para resolver um sistema Ax = b descrito pelo algoritmo abaixo,
realizado sobre a matriz completa [A b].
Passo 1. Se A = 0, encerre o algoritmo. O sistema j escalonado.
Passo 2. Percorra as colunas da matriz completa [A b] da esquerda para a direita,
localizando a primeira no nula.
Passo 3. Percorra esta coluna de cima para baixo, localizando seu primeiro elemento
no nulo. Seja p o valor deste elemento.
Passo 4. Permute esta linha com a primeira.
Passo 5. Multiplique a atual primeira linha por p1 , fazendo com que o primeiro
elemento no nulo da primeira linha fique igual a 1. Este ser o piv da primeira linha.
A partir deste ponto, a primeira linha no sofrer outras modificaes.
Passo 6. Passe segunda linha, tranformando-a na primeira da prxima etapa.
Passo 7. Repita os passos de 1 a 6 com todas as linhas restantes.
Com este algoritmo, partimos da matriz [A b] e chegamos matriz [R c], onde R a
forma escalonada de A. O sistema Rx = c equivalente ao original.
Se existirem equaes degeneradas incompatveis no sistema Rx = c, ento o sistema
Ax = b no tem soluo.
Se todas as equaes degeneradas de Rx = c forem compatveis, o sistema Ax = b
tem soluo. Exclua as equaes degeneradas e use a substituio reversa para obter as
solues do sistema euqivalente Rx = c. Estas solues possuiro a forma
x = w0 + c1 v1 + + cr vr
onde w0 uma soluo de Rx = c e v1 , . . . , vr so solues do sistema homogneo associado
Rx = 0. Os nmeros reais ci so arbitrrios e relacionados com as variveis livres. Os
nmeros reais c1 , . . . , cr so denominados de parmetros.
O nmero de pivs de R igual ao nmero de linhas no nulas de R. Se existirem k
pivs, este ser o nmero de variveis principais do sistema. Se o nmero de incgnitas
do sistema for n, o nmero de variveis livres ser n k.
Se R for escalonada e A pode ser levada em R por transformaes elementares, o
nmero de pivs de R chamado de posto da matriz A.
Exemplo 1.11 Considere o sistema
x + y 2z = 0
2x + 2y 3z = 2
3x y + 2z = 12

Notas de aula do Prof. Antonio Cndido Faleiros


cuja matriz aumentada

13

1 1 2 0
2 2 3 2
3 1 2 12

Realizando as operaes O(l2 = l2 2l1 ) e O(l3 = l3 3l1 ) sobre a matriz chegamos em

1 1 2 0
0 0
1 2 .
0 4 8 12
Realizando a operao O(l2 l3 ) segue

1 1 2 0
0 4 8 12
0 0
1 2

que uma matriz diagonal superior. Encerramos a primeira etapa do mtodo de eliminao de Gauss.
Para completar o mtodo, caminhando de baixo para cima e da esquerda para a direita,
anulamos os elementos nas colunas acima da diagonal principal. Com as operaes O(l2 =
l2 8l3 ) e O(l1 = l1 + 2l3 ), obtemos

1 1 0 4
0 4 0 4
0 0 1 2

Com as operaes O(l2 = (1/4)l2 ) seguida

1 0
0 1
0 0

de O(l1 = l1 l2 ) chegamos matriz

0 3
0 1
1 2

A matriz A foi transformada at se tornar uma matriz identidade. Agora, obter a soluo
do problema trivial x = 3, y = 1 e z = 2.

1.8

Matrizes inversas

Uma matriz quadrada A de tamanho m m inversvel quando existir uma matriz


quadrada B de tamanho m m tal que AB = BA = Im onde Im a matriz identidade
de ordem m. A matriz B chamada de inversa de A e denotada por A1 .
Pela prpria definio, a matriz B tambm inversvel e sua inversa A. Assim, B 1 =
Ae
1 1
A
= A.

Se A e B forem inversveis, ento AB so inversveis e (AB)1 = B 1 A1 . Se uma


matriz for triangular inferior, sua inversa tambm ser triangular inferior e, quando ela
for triangular superior, sua inversa tambm ser triangular superior.

14

Notas de aula do Prof. Antonio Cndido Faleiros

Teorema 1.12 Seja A uma matriz quadrada. So equivalentes as afirmaes:


1. A inversvel.
2. O sistema homogneo Ax = 0 possui apenas a soluo trivial x = 0.
3. A forma escalonada reduzida de A a matriz identidade.
4. O sistema Ax = b possui uma nica soluo para cada matriz coluna b.
5. Existe uma matriz quadrada B tal que AB = I.
Prova. (1) = (2) pois, se A inversvel e Ax = 0, ento A1 Ax = 0 o que implica
em x = 0.
(2) = (3) pois, se a forma escalonada reduzida R de A no for a matriz identidade,
uma de suas linhas nula pois R quadrada. Portanto, Rx = 0 tem solues no nulas.
Se este fosse o caso, o sistema Ax = 0 teria solues no nulas, contrariando (2).
(3) = (4) pois, se A I ento o sistema Ax = b equivalente ao sistema Ix = c,
para alguma matriz coluna c, cuja soluo x = c, mostrando que o sistema Ax = b tem
sempre uma nica soluo para cada b.
(4) = (5) pois, sendo ej a coluna j da matriz identidade I, o sistema Ax = ej tem
uma nica soluo x = bj para j = 1, 2, . . . , n. Sendo B = [b1 , . . . , bn ], obtemos AB = I.
(5) = (1) pois, se AB = I e Bx = 0, ento ABx = 0 ou Ix = 0 o que implica em
x = 0. Logo, a condio (2) vale para B no lugar de A e, consequentemente, valem (3)
e (4) com B no lugar de A. Logo, pela parte (5), existe uma matriz C tal que BC = I.
Como C = IC = (AB)C = A(BC) = A, obtemos BA = I. Como AB = I por hiptese,
provamos que A inversvel.

Corolrio 1.13 Sejam A e B matrizes quadradas m m. Se AB = I, ento A e B so


inversveis e uma a inversa da outra.
Prova. Se AB = I, provamos que A inversvel e que B a inversa de A. Logo, B
inversvel e sua inversa A.
Este corolrio garante que AB = I o bastante para garantir que A e B so inversveis,
sendo uma a inversa da outra.
Corolrio 1.14 Se A = BC for inversvel, ento B e C so inversveis.
Prova. Sendo A = BC inversvel, (A1 B) C = A1 (BC) = A1 A = I e assim C
inversvel. Por outro lado, B(CA1 ) = (BC)A1 = AA1 = I e B inversvel.

Notas de aula do Prof. Antonio Cndido Faleiros

1.9

15

Matrizes elementares

As matrizes elementares so aquelas obtidas a partir da identidade mediante uma


nica operao elementar. Vamos denotar por E(li lj ) a matriz elementar obtida a
partir da identidade pela permuta das linhas i e j. A matriz E(li + rlj ) denotar a matriz
elementar obtida da identidade adicionando linha i um mltiplo r da linha j. Se r um
nmero no nulo, E(rli ) denotar a matriz elementar obtida da identidade multiplicando
sua linha i por r.
Exemplo 1.15 As matrizes

0 0
0 1
1 0

abaixo so elementares

1
7 0 0
0 1 0
0
0
0 0 1

1 0 0
0 1 0
3 0 1

sendo, respectivamente, as matrizes E(l1 l3 ), E(7l1 ) e E(l3 + 3l1 ).


Os produtos
E(li lj )A , E(rli )A , E(li + rlj )A
realizam sobre A as operaes elementares O(li lj ), O(rli ), e O(li + rlj ), respectivamente.
Exemplo 1.16 Os produtos abaixo ilustram as

a1 a2
A = b1 b2
c1 c2
O produto

afirmaes acima. Seja

a3
b3 .
c3

0 0 1
a1 a2 a3
c1 c2 c3
E(l1 l3 )A = 0 1 0 b1 b2 b3 = b1 b2 b3
c1 c2 c3
a1 a2 a3
1 0 0

permuta a primeira com a terceira linha de

7 0 0
a1

b1
E(7l1 )A = 0 1 0
c1
0 0 1
multiplica a primeira linha de A por 7. O

1 0 0
a1 a2
E(l3 + 5l1 )A = 0 1 0 b1 b2
c1 c2
5 0 1

A. O produto

a2 a3
7a1 7a2 7a3
b2 b3 = b1 b2 b3
c2 c3
c1 c2 c3

produto

a3
a2
a3
a1

b3 =
b1
b2
b3
c3
5a1 + c1 5a2 + c2 5a3 + c3

adiciona terceira linha de A o quntuplo de sua primeira linha.

16

Notas de aula do Prof. Antonio Cndido Faleiros

As matrizes elementares so inversveis. A inversa de E(li + rlj ) E(li rlj ), a inversa


de E(li lj ) ela mesma e, para r 6= 0, a inversa de E(rli ) E((1/r)li ).
H um teorema muito interessante relacionando matrizes inversveis com matrizes
elementares.
Teorema 1.17 Uma matriz quadrada inversvel se e s se for igual a um produto de
matrizes elementares.
Prova. Se uma matriz quadrada for o produto de matrizes elementares, ela inversvel
pois cada matriz elementar inversvel.
Se A for inversvel, ento o teorema 1.12 garante que a forma escalonada reduzida de
A a matriz identidade. Em consequncia existem matrizes elementares E1 , E2 , . . . ,
Ek tais que Ek E2 E1 A = I. Neste caso, A = E11 E21 Ek1 . Como as inversas de
matrizes elementares so elementares, segue que A o produto de matrizes elementares.

Em termos de matrizes elementares, o mtodo da eliminao de Gauss usado para


resolver o sistema Ax = b pode ser descrito nos seguintes termos: multiplicamos os dois
lados do sistema sucessivamente por matrizes elementares E1 , E2 , . . . , Ek
Ek E2 E1 Ax = Ek E2 E1 b
executando operaes elementares sobre as linhas de A, at obter a matriz escalonada
U = Ek E2 E1 A.
Sendo E = Ek E2 E1 , o sistema original se transforma no sistema equivalente escalonado
Ux = Eb
que ter soluo se linhas nulas em U corresponderem a linhas nulas em Eb. Quando este
for o caso, o sistema resolvido por substituio reversa.
Se existirem linhas nulas em U e as linhas correspondentes de Eb no forem nulas, o
sistema no tem soluo, incompatvel.
Exemplo 1.18 Vamos usar transformaes
de

A = 10
15

elementares para obter a forma escalonada

1 3
5 8 .
6 16

Em lugar de executar uma operao elementar por vez, vamos executar as operaes lineares necessrias para anular todos os elementos de cada coluna abaixo da diagonal principal. Efetuando o produto

1 0 0
5 1 3
5 1 3
E1 A = 2 1 0 10 5 8 = 0 3 2
3 0 1
15 6 16
0 3 7

Notas de aula do Prof. Antonio Cndido Faleiros

17

obtemos uma matriz onde os elementos da primeira linha abaixo da diagonal principal so
nulos. A matriz E1 no elementar mas o produto de duas matrizes elementares

1 0 0
1 0 0
E1 = 2 1 0 0 1 0 .
0 0 1
3 0 1
Efetuando o produto de E1 A pela matriz elementar E3 definida


1 0 0
5 1 3
5

0 3 2 = 0
E2 E1 A = 0 1 0
0 1 1
0 3 7
0

que triangular superior. Denotemos por U


matriz

1 0 0
1

2
E2 E1 = 0 1 0
0 1 1
3

abaixo, obtemos

1 3
3 2
0 5

esta matriz, de modo



0 0
1
0

1 0 = 2 1
0 1
1 1

que E2 E1 A = U. A

0
0
1

triangular inferior, os elementos de sua diagonal principal unitria e sua inversa

1 0 0
L = 2 1 0 .
1 1 1

Um fato notvel desta inversa reside no fato de ser exatamente igual ao produto E2 E1 ,
onde os elementos abaixo da diagonal principal aparecem com os sinais trocados. Assim,

5 1 3
E2 E1 A = U = 0 3 2 .
0 0 5

1.10

Clculo da inversa

Podemos completar o processo iniciado no exemplo da seo anterior at obter a inversa


de A.
Exemplo 1.19 No exemplo anterior, multiplicamos

1
0 0
5 1 3
A = 10 5 8
e
E2 E1 = 2 1 0 ,
1 1 1
15 6 16

para obter

5 1 3
U = E2 E1 A = 0 3 2 .
0 0 5

18

Notas de aula do Prof. Antonio Cndido Faleiros

Podemos multiplicar U por matrizes elementares at obter a inversa de A. Efetuando o


produto

1 0 3/5
5 1 3
5 1 0
E3 U = 0 1 2/5 0 3 2 = 0 3 0
0 0 1/5
0 0 5
0 0 1
anulamos os elementos da terceira coluna
produto de trs matrizes elementares

1 0 0
1

0
E3 = 0 1 0
0 0 1/5
0

acima da diagonal principal. A matriz E3 o

0
0
1 0 3/5
1 2/5 0 1
0 .
0
1
0 0
1

Em seguida, efetuamos o seguinte produto

1 1/3 0
5 1 0
5 0 0
E4 E3 U = 0 1/3 0 0 3 0 = 0 1 0
0
0
1
0 0 1
0 0 1

onde E4 o produto de duas matrizes elementares

1 0 0
1 1/3 0
1
0 .
E4 = 0 1/3 0 0
0 0 1
0
0
1
Finalmente, multiplicando E4 E3 U pela matriz

1/5
E5 = 0
0
obtemos

elementar

0 0
1 0
0 1

E5 E4 E3 U = E5 E4 E3 E2 E1 A = I
onde I a matriz identidade. O produto E5 E4 E3 E2 E1 a inversa procurada

32
7
2
75
75
75
8
2
7
15
A1 = 15
.
15
1
1
1
5 5
5

Este exemplo tpico do mtodo de Gauss-Jordan para determinar a inversa de


uma matriz A. Se E for o produto de matrizes elementares para as quais EA = I, ento
A1 = E. Esta observao nos permite construir o seguinte algoritmo: tome a matriz
aumentada [A I] e realize operaes elementares sobre ela obtendo a matriz [EA EI]. No
momento que EA for igual identidade, EI = E ser a inversa A1 de A.
Se nalgum ponto deste processo chegarmos a uma matriz aumentada [EA EI] com
linha nula, conclumos que A no tem inversa.

Notas de aula do Prof. Antonio Cndido Faleiros

19

Exemplo 1.20 Vamos usar o mtodo de Gauss-Jordan para obter a inversa de

1 2 1
A = 1 3 4 .
2 7 12
Inicialmente formamos a matriz aumentada

1 2 1 1 0 0
[A I] = 1 3 4 0 1 0
2 7 12 0 0 1

e realizamos operaes elementares sobre linha at chegar a (I | A1 ). Em lugar de aplicar


uma transformao elementar por vez, vamos aplicar um produto de transformaes lineares que agiro sobre toda uma coluna.

1 0 0
1 2 1 1 0 0
1 2 1 1 0 0
1 1 0 1 3 4 0 1 0 = 0 1 3 1 1 0
2 0 1
2 7 12 0 0 1
0 3 10 2 0 1


1 0 0
1 2 1 1 0 0
1
0 1 0 0 1 3 1 1 0 = 0
0 3 1
0 3 10 2 0 1
0


1 0 1
1 2 1 1
0 0
1
0 1 3 0 1 3 1 1 0 = 0
0 0 1
0 0 1 1 3 1
0


1 2 0
1 2 0 0
3 1
1
0 1 0 0 1 0 4 10 3 = 0
0 0 1
0 0 1 1 3 1
0

Logo, a inversa de A

1.11

8 17 5
4 10 3 .
1 3 1

2 1 1
0 0
1 3 1 1 0
0 1 1 3 1

2 0 0
3 1
1 0 4 10 3
0 1 1 3 1

0 0 8 17 5
1 0 4 10 3
0 1 1 3 1

Fatorao LU

Multiplicando uma matriz A por matrizes elementares, podemos chegar a uma matriz U
triangular superior.
Para descrever o processo, vamos ampliar um pouco nosso conceito de matriz elementar e tambm denominar de elementar aquelas matrizes obtidas a partir da identidade
permitindo que os elementos de uma nica coluna abaixo da diagonal principal sejam
diferentes de zero.

20

Notas de aula do Prof. Antonio Cndido Faleiros

Exemplo 1.21 Neste conceito ampliado, a matriz

1 0 0
2 1 0
3 0 1

elementar. Ela o produto de duas matrizes elementares

1 0 0
1 0 0
2 1 0
0 1 0 .
e
0 0 1
3 0 1
Podemos usar essas matrizes elementares para zerar todos os elementos abaixo da
diagonal principal de uma coluna de uma matriz A.
Exemplo 1.22 Este exemplo ilustra o anulamento de todos os elementos de abaixo da
diagonal da primeira coluna de uma matriz mediante o uso de uma matriz elementar

1 0 0
2 6 1
2 6 1
2 1 0 4 3 8 = 0 9 10 .
6 0 1
12 7 9
0 29 15

Seja A uma matriz mm. Sejam E1 , . . . , Em1 matrizes elementares que, multiplicadas
esquerda de A a levam numa matriz triangular superior U. Os elementos abaixo da
diagonal principal da primeira coluna de E1 A so nulos. Os elementos abaixo da diagonal
principal da primeira e segunda colunas de E2 E1 A so nulos e assim por diante. Este
procedimento resulta em
Ek E1 A = U
onde U triangular superior. A matriz
E = Ek E1
triangular inferior e os elementos da diagonal principal so todos iguais a 1. Sua inversa
L tambm triangular inferior e os elementos da diagonal principal so todos iguais a 1.
Com isto, obtemos a fatorao
A = LU
onde U uma matriz triangular superior e L uma matriz triangular inferior inversvel,
cujos elementos da diagonal principal so iguais a 1.
Exemplo 1.23 Vamos obter a decomposio LU da matriz

1 2 0
A = 2 1 5 .
4 1 13

Notas de aula do Prof. Antonio Cndido Faleiros

21

Efetuando o produto

1 0 0
1 2 0
1 2 0
E1 A = 2 1 0 2 1 5 = 0 3 5
4 0 1
4 1 13
0 9 13
obtemos uma matriz cujos elementos abaixo da diagonal principal da primeira coluna so
iguais a zero. Agora, efetuando o produto

1 0 0
1 2 0
1 2
0
E2 E1 A = 0 1 0 0 3 5 = 0 3 5
0 3 1
0 9 13
0 0 2
obtemos a forma escalonada de A. Para chegar decomposio LU, basta calcular a inversa L = E11 E22 . As matrizes E1 e E2 nas multiplicaes acima so elementares

1 0 0
E1 = 2 1 0
4 0 1

1 0 0
E2 = 0 1 0
0 3 1

e pode-se verificar que


E11

1 0 0
= 2 1 0
4 0 1

E21

1 0 0
= 0 1 0
0 3 1

Oberve um fato interessante: para obter as inversas de E1 e E2 , basta trocar os sinais dos
elementos no nulos abaixo da diagonal principal. Em seguida, efetuando o produto
L = E11 E21

1 0 0
1 0 0
1 0 0
= 2 1 0 0 1 0 = 2 1 0
4 0 1
0 3 1
4 3 1

percebemos outro fato fantstico: para obter o produto L, basta colocar na matriz identidade os elementos no nulos de E11 e E21 nos seus devidos lugares. Agora tem-se a
decomposio LU de A

1 0 0
1 2
0
A = 2 1 0 0 3 5 .
4 3 1
0 0 2
O fato ocorrido no clculo de L do exemplo anterior no fortuito e sim um resultado
geral.
Para provar esta afirmao baseando-nos no livro de Trefethen e Bau.

22

Notas de aula do Prof. Antonio Cndido Faleiros

As matrizes L e U da decomposio LU de A podem ser obtidas pelo mtodo de


eliminao de Gauss. Como raro aplicar este mtodo a matrizes retangulares, vamos
descrev-lo para matrizes quadradas A pertencentes a Cmm . Considere a matriz

x x x x
x x x x

A=
x x x x
x x x x

onde o x indica nmeros quaisquer. Faamos a

x x
0 x
L1 A =
0 x
0 x

primeira transformao

x x
x x

x x
x x

zerando os elementos abaixo da diagonal principal da primeira coluna. Faamos a segunda


transformao

x x x x
0 x x x

L2 L1 A =
0 0 x x
0 0 x x

zerando os elementos abaixo da diagonal principal


a terceira transformao,

x x x
0 x x
L3 L2 L1 A =
0 0 x
0 0 0

da segunda coluna. Finalmente, com

x
x
=U
x
x

zeramos o elemento abaixo da diagonal principal da terceira coluna, obtendo assim a


matriz U. O negrito indica os elementos que foram modificados na transformao. Vejamos
um caso concreto.
Exemplo 1.24 A decomposio LU de

1
2
A=
1
0

1
2
A=
1
0

0
1
2
3

0
0
1
1

3
7
5
3

2
5
5
4

0
1

4
6

0
1 3

0 0 1
0 0 0
1
0 0

2
1
1
0

0
1
.
2
1

Notas de aula do Prof. Antonio Cndido Faleiros

23

que foi obtida multiplicando A pela esquerda por

1
2
L1 =
1
0

0
1
0
0

0
0
1
0

0
1 0

0
0 1
, L2 =

0
0 2
1
0 3

0
0
1
0

0
1 0 0

0
0 1 0
, L3 =

0
0 0 1
1
0 0 1

0
0

0
1

As inversas de L1 , L2 e L3 so

1
2

1
0

0
1
0
0

0
0
1
0

1
0

0
0
,
0
0
0
1

0
1
2
3

0
0
1
0

1
0

0
0
,
0
0
0
1

0
1
0
0

0
0
1
1

0
0
,
0
1

e podem ser obtidas de L1 , L2 e L3 trocando o sinal dos elementos no nulos abaixo da


diagonal principal. Ainda

1 1
L = L1
1 L2 L3

1
2
=
1
0

0
1
2
3

0
0
1
1

0
0

0
1

1
obtido a partir de L1
e L1
simplesmente colocando na matriz identidade os
1 , L2
3
termos no nulos dessas trs matrizes em suas respectivos posies.

Frmulas gerais e dois golpes de sorte


Seja A uma matriz m m e denote por X a matriz obtida depois de k 1 passo de
eliminao. Denote por xk a coluna k de X no incio do passo k. A transformao Lk
deve ser escolhida de modo que

x1k
..
.

xkk
xk =
xk+1,k
.
..
xm,k

x1k

..

xkk
.
Lk xk =

..
0

Para obter este efeito, para j = k + 1, . . . , m, subtramos


jk =

xjk
xkk

24

Notas de aula do Prof. Antonio Cndido Faleiros

vezes a linha k da linha j. A forma da matriz Lk


1
...
1

Lk =

k+1,k 1
..
...
.
1
m,k

Nos exemplos anteriores observamos dois golpes da sorte:

1. A inversa de Lk obtida trocando os sinais dos elementos abaixo da diagonal.


1
1
2. A matriz L = L1
1 L2 Lm1 pode ser formada coletando as entradas de jk nos
locais apropriados.

Podemos reunir esses pedaos de boa fortuna como segue. Seja

0
..

0
k =
.
k+1,k

..

.
m,k

Ento Lk = I k ek , onde ek a coluna k da matriz identidade m m. Das definies


de k e ek obtemos
ek k = 0
e
(I k ek )(I + k ek ) = I k (ek k )ek = I,

mostrando que a inversa de Lk

L1
k = I + k ek .

Para o segundo golpe de sorte, argumentamos como segue. Considere, por exemplo, o
1

produto L1
k Lk+1 . Como ek k+1 = 0, segue
1

L1
k Lk+1 = (I + k ek )(I + k+1 ek+1 ) = I + k ek + k+1 ek+1

que escrita por extenso

1
L1
k Lk+1

1
...
1
k+1,k
1
k+2,k k+2,k+1 1
..
..
...
.
.
m,k+1
1
m,k

Notas de aula do Prof. Antonio Cndido Faleiros

25

Esta matriz triangular inferior sendo obtida a partir da matriz identidade substituindo
os elementos abaixo da diagonal principal das coluna k e k + 1 pelos elementos de L1
k e
L1
inseridas
em
seus
lugares
usuais
abaixo
da
diagonal.
Quando
tomamos
o
produto
k+1
de todas estas matrizes para formar L, obtemos

1
21

1
1

1
31
32
L

L
=
L = L1

1
2
m1
..

..
.
.
.
.
.

.
.
.
m1 m2 m,m1 1
onde

xjk
xkk
so os multiplicadores necessrios para anular os elementos abaixo da diagonal da matriz
X = Ek1 E1 A.
Tais fatos geram o seguinte algoritmo
jk =

=====================================
Algoritmo da eliminao gaussiana sem pivotamento
=====================================
Entrada: A
Sada: U e L.
=====================================
U = A e L = I.
for k = 1:m-1
for j = k+1:m
L(j,k) = U(j,k)/U(k,k);
U(j,k:m) = U(j,k:m) - L(j,k) * U(k,k:m);
end
end
=====================================
Neste algoritmo podemos usar uma nica matriz para armazenar L e U se abrirmos
mo de gravar a diagonal de L cujos elementos so unitrio. Se a matriz A no for mais
necessria, podemos us-la para gravar L e U.
Soluo Ax = b por fatorao LU
Dada a decomposio A = LU, o sistema Ax = b equivalente a LUx = b. Defina y =
Ux, resolva Ly = b e, em seguida, Ux = y para obter a soluo do sistema original. A
primeira etapa, para a fatorao A = LU, exige 23 m3 flops. O segundo e o terceiro,

26

Notas de aula do Prof. Antonio Cndido Faleiros

para resolver os sistemas triangulares Ly = b e Ux = y, exigem m2 flops. Dessa forma,


a resoluo pelo mtodo de Gauss, exige 23 m3 flops.
A resoluo usando refletores de Householder, que veremos posteriormente, usa 43 m3
flops. Qual seria a vantagem da fatorao QR sobre a fatorao LU?

1.12

Decomposio PLU

Nem sempre
uma matriz A possui uma
decomposio
LU e um exemplo clssico

1 1
0 1
obtida de A pela permutao das linhas
. Entretanto, a matriz B =
0 1
1 1
possui uma decomposio LU

1 0
1 1
B=
.
0 1
0 1
Sempre possvel permutar as linhas de uma matriz A de modo que a matriz assim
obtida possui uma decomposio LU.
Uma matriz de permutao aquela obtida a partir da matriz identidade mediante
uma permutao qualquer de suas linhas. A matriz elementar E(li lj ) obtida da
identidade pela permutao das linhas i e j pertence a esta classe. Toda matriz de
permutao o produto de matrizes elementares deste tipo. O produto de duas matrizes
de permutao uma matriz de permutao e a inversa de uma matriz de permutao
uma matriz de permutao. Como tivemos a oportunidade de destacar, a inversa de
E(li lj ) ela mesma.
Exemplo 1.25 So matrizes de permutao

1 0 0 0
0 0 0 1

0 0 1 0
0 1 0 0

0
1

0
0

0
0
0
1

1
0
0
0

0
0
.
1
0

A segunda permutao a transformao elementar E(l2 l4 ).


Seja P uma matriz de permutao obtida da identidade permutando as linha i e j.
Seja E a matriz elementar que, a no ser pelo fato de a coluna k possuir elementos no
nulos abaixo da diagonal principal, a identidade. Se k < i < j, ento
E = P EP
uma matriz com os elementos das linhas i e j da coluna k permutados de seus lugares.
Exemplo 1.26 Sejam

1
0
P =
0
0

0
0
0
1

0
0
1
0

0
1

0
0

1
2
E=
3
4

0
1
0
0

0
0
1
0

0
0

0
1

Notas de aula do Prof. Antonio Cndido Faleiros

27

onde P a matriz de permutao obtida da identidade pela troca das linhas 2 e 4 e E a


matriz elementar com elementos no nulos fora da diagonal principal da primeira coluna.
Neste caso, k = 1, i = 2 e j = 4. O produto P AP igual a

1 0 0 0
4 1 0 0

3 0 1 0 .
2 0 0 1

Esta matriz pode ser obtida de A permutando os elementos das linhas 2 e 4 da coluna 1.
Fato interessantssimo.

Vamos descrever a decomposio P LU, obtida pelo mtodo da eliminao de Gauss


com pivotamento. Seguiremos o tratamento de Trefethen e Bau.
Seja X a matriz obtida no processo de eliminao Gaussiana depois de zerados os
elementos abaixo da diagonal principal das k 1 primeiras colunas. No passo seguinte,
mltiplos da linha k so subtradas das linhas k +1, . . . , m da matriz X com a qual se est
trabalhando, para introduzir zeros nas entradas k dessas linhas. A entrada xkk da matriz
X chamado de piv da coluna k. Prosseguindo o processo de eliminao, aplica-se a
X uma transformao elementar para zerar os elementos da coluna k abaixo da diagonal
principal.

xkk x x x
xkk x x x

x x x x

0 x x x
0 x x x
x x x x
x x x x
0 x x x

Entretanto, xkk pode ser nulo ou muito pequeno quando comparado aos demais elementos daquela coluna abaixo da diagonal. Neste caso, para evitar instabilidade numrica,
procura-se naquela coluna, dentre os elementos abaixo da diagonal principal, o de maior
mdulo. Troca-se esta linha com a linha k e este elemento de maior mdulo passa a ser
o piv da linha k. Esta troca de linhas denominada de pivotamento parcial. H um
processo conhecido por pivotamento onde se toma por piv o elemento de maior mdulo
na submatriz Xk:m,k:m e o coloca na posio (k, k) mediante a troca de linhas e colunas.
Devido dificuldade de gerenciar a troca de colunas e ao trabalho computacional para se
encontrar o piv, prefere-se o pivotamento parcial.

xjk
xjk
xkk


P1 L1 0

xjk
xkk
0
0


Este algoritmo pode ser expresso como um produto de matrizes. No pivotamento parcial,
em cada etapa, realiza-se uma permutao para posicionar o piv da coluna no local
correto para, em seguida, aplicar uma matriz elementar para zerar os elementos abaixo

28

Notas de aula do Prof. Antonio Cndido Faleiros

da diagonal principal da coluna k. Este processo pode ser repetido coluna a coluna, at
transformar A numa matriz U triangular superior
Lm1 Pm1 L2 P2 L1 P1 A = U.

Exemplo 1.27 Considere a matriz (exemplo

2 1
4 3
A=
8 7
6 7

copiado)

1 0
3 1
.
9 5
9 8

Para o pivotamento parcial, permutamos a primeira com a


P1 A =


8 7
0 0 1 0
2 1 1 0
0 1 0 0 4 3 3 1 4 3


1 0 0 0 8 7 9 5 = 2 1
6 7
0 0 0 1
6 7 9 8
Agora efetuamos o primeiro passo de eliminao: L1 P1 A =

8 7
1 0 0 0
8 7 9 5
1 1 0 0 4 3 3 1 0 1
2

21

0 1 0 2 1 1 0 = 0 3
4
4
6 7 9 8
34 0 0 1
0 74
Em seguida, trocamos a

1 0 0
0 0 0

0 0 1
0 1 0

Efetuamos a segunda

1 0
0 1

0 3
7
0 27

Agora permutamos

1
0

0
0

terceira coluna calculando

9 5
3 1
.
1 0
9 8

9
5
32 32
.
54 54
9
4

17
4

segunda com a quarta linha: P2 L1 P1 A =


8 7
9
5
0
8 7
9
5
9
17
1
3
3
7

1 0 2 2 2 0 4
4
4
=
0 0 34 54 54 0 34 54 54
9
17
0
0 74
0 12 32 32
4
4

eliminao: L2 P2 L1 P1 A =

8 7
9
5
0 0
9
17
0 7
0 0
4
4
4

1 0 0 34 54 54
0 1
0 12 32 32

a terceira linha

0 0 0
8
0
1 0 0

0 0 1 0
0 1 0
0

8 7 9
5
17
0 7 9
4
4
4
=
0 0 2 4 .
7
7
0 0 67 27

com a quarta: P3 L2 P2 L1 P1 A =

8 7 9
5
7 9
5
7
9
17
17
0 7 9
4
4
4 =
4
4
4
0 27 74 0 0 67 27
0 67 27
0 0 27 74

Finalmente, efetuamos a ltima eliminao: L3 P3 L2 P2 L1 P1 A =

8 7 9
5
1 0 0 0
8 7 9
5
17
17
0 7 9
0 1 0 0 0 7 9
4
4
4
4
4
4

0 0 1 0 0 0 6 2 = 0 0 6 2
7
7
7
7
2
0 0 13 1
0 0 27 74
0 0 0
3

Notas de aula do Prof. Antonio Cndido Faleiros

29

Um terceiro golpe de sorte na fatorao P LU


Todos os elementos de L abaixo da diagonal principal so menores ou iguais a 1 pois o
piv de cada linha escolhido de modo a tornar |xkk | = {|xjk | : k j m}
Analisemos a decomposio de uma matriz A de tamanho 4 4 que toma a forma
L3 P3 L2 P2 L1 P1 A = U
As matrizes P1 , P2 e P3 so suas prprias inversas. Assim podemos escrever
L3 P3 L2 P2 L1 P1 = L3 P3 L2 (P3 P3 )P2 L1 (P2 P3 P3 P2 )P1
onde acrescentamos algumas matrizes ao produto e foram colocadas entre parntesis. Note
que elas so iguais matriz identidade. Podemos associar este produto
1L
2L
3 )(P3 P2 P1 )
L3 P3 L2 P2 L1 P1 = L3 (P3 L2 P3 )(P3 P2 L1 P2 P3 )(P3 P2 P1 ) = (L
onde
= P3 L2 P3 , L
= P3 P2 L1 P2 P3
3 = L3 , L
L
so matrizes elementares obtidas de L3 , L2 , L1 permutando elementos abaixo da diagonal
principal.
Em geral, para uma matriz m m, a fatorao fornecida pela eliminao Gaussiana
com pivotamento parcial pode ser escrita na forma
2L
m1 L
1 )(Pm1 P2 P1 )A = U,
(L
onde
1
k = Pm1 Pk+1 Lk P 1 Pm1
.
L
k+1

k triangular inferior com elementos unitrios na diagonal


O produto das matrizes L
principal e facilmente invertvel. Basta trocar o sinal das entradas abaixo da diagonal,
como na eliminao Gaussiana sem pivotamento. Escrevendo
2L
1 )1
m1 L
L = (L

P = Pm1 P2 P1 ,

temos
P A = LU.
Qualquer matriz quadrada A, singular ou no, possui uma fatorao deste tipo, onde P
uma matriz de permutao, L uma matriz triangular inferior com elementos unitrios
na diagonal principal e U triangular superior. Esta fatorao conhecida por fatorao
P LU de A.
Para obter a fatorao P LU de A, multiplique a matriz A por uma matriz de permutao P e calcule a decomposio LU de A. Na prtica, no assim que se procede pois
no se conhece P a priori.
Vamos descrever um procedimento que justifica o algoritmo que vamos descrever
k E
1 Pk P1 A,
abaixo. Seja A uma matriz m m e X = Ek Pk E1 P1 A = E

30

Notas de aula do Prof. Antonio Cndido Faleiros

i so
onde Pi so matrizes de permutao que posicionam o piv no lugar correto e E
matrizes elementares que zeram as entradas abaixo da diagonal da coluna i de Pk P1
A onde E
=E
k E1 e A = Pk P1 A. Se k < m 1, o
A. Vamos escrever X = E
processo no terminou e X, em geral, no triangular superior. A prxima etapa consiste
em aplicar uma permutao P que trocar uma linha i de X com sua linha k + 1 para
posicionar o piv da coluna no local correto. Neste caso, i > k + 1. A inversa de P P e
assim P P = I. Podemos usar este fato para escrever
P )A = (P EP
)(P A).

P X = P E A = P E(P
triangular inferior e a matriz E onde se permutou a parte
Lembramos que P EP
no nula das linhas i e k + 1, situadas abaixo da diagonal ficam permutadas. Desta
forma, sempre que se aplica uma permutao matriz A se deve efetuar uma permutao

correspondente na matriz E.
Este comentriio justifica o algoritmo da eliminao Gaussiana com pivotamento parcial descrito abaixo.
Algoritmo da eliminao Gaussiana com pivotamento parcial
=============================
U = A, L = I, P = I
for k = 1:m-1
Selecione na coluna k a linha i na qual |u(i,k)| eh maximo
Permute as linhas U(k,k:m) e U(i,k:m)
Permute as linhas L(k,1:k-1) e L(i,1:k-1)
Permute as linhas P(k,:) e P(i,:)
for j = k+1:m
L(j,k) = U(j,k) / U(k,k)
U(j,k:m) = U(j,k:m) - L(j,k)*U(k,k:m)
end
end
=============================

1.13

Decomposio de Cholesky

Se a matriz A for simtrica e inversvel, uma permutao P A dessa matriz tem uma
decomposio P LU. Vamos, num primeiro momento, nos esquecer da permutao P e
escrever esta decomposio na forma A = LU de modo que
LU = A = AT = U T LT .
Como L e U so inversveis,
1
= L1 U T = D
U LT

Notas de aula do Prof. Antonio Cndido Faleiros

31

1
diagonal pois U LT
triangular superior e L1 U T triangular inferior. Assim, U =
DLT e obtemos a decomposio
A = LDLT
onde L triangular inferior cujos elementos diagonais so iguais a 1 e D = L1 U T
diagonal.
Como os elementos da diagonal principal de L so iguais a 1, D = diag(U) onde
diag(U) uma matriz diagonal, cujos elementos da diagonal principal so iguais aos
elementos da diagonal de U.
Exemplo 1.28 Considere a decomposio A = LU abaixo

2 1 0
1
0
0
2 1 0
1 2 1 = 1/2
1
0 0 3/2 1
0 1 2
0
2/3 1
0 0 4/3

2 0
0
1 T

Sendo D = L U = 0 3/2 0 obtemos a decomposio LDLT


0 0 4/3

2 1 0
1
0
0
2 0
0
1 1/2
0
1 2 1 = 1/2
1
0 0 3/2 0 0
1
2/3 .
0 1 2
0
2/3 1
0 0 4/3
0
0
1

Definio 1.29 Uma matriz simtrica A positiva definida se os elementos diagonais


T
de D na decomposio
todos maiores do que zero. Neste caso, podemos
A = LDL forem
calcular a matriz D e definir M = L D, para assim obter a decomposio A = MM T
denominada de decomposio de Cholesky da matriz A.
No exemplo acima,

2 p0
0
2
0
0
1
0
0
p
p
.
1
0 0
M = 1/2
3/2 p0 = 1/2
p3/2 p0
0
2/3 1
4/3
4/3
0
0
0
2/3

A decomposio de Cholesky de A


2
0
2 1 0

1 2 1 = 1 2 1 6
2
2
0 1 2
0
13 6

0
2 12 2
0
1
0 0
6 13 6 .
2

2
2
0
0
3
3
3
3

32

Notas de aula do Prof. Antonio Cndido Faleiros

Captulo 2
Espao vetorial
2.1

Conceito de espao vetorial

Seja K um corpo e V um conjunto no vazio, onde definimos duas operaes, sendo uma
a adio de vetores e a outra a multiplicao de um elemento do corpo K por um
elemento de V. Sejam v e w dois elementos de V e k um elemento do corpo K. Denotaremos
a adio de v e w por v + w e a multiplicao de k e v por kv. O conjunto V, com essas
operaes denominado de espao vetorial sobre o corpo K se, para todo u, v, w de
V e todo , de K, se verificarem as propriedades
1. Comutativa: v + w = w + v.
2. Associativa: (u + v) + w = u + (v + w).
3. Elemento neutro: Existe um elemento de V denotado por 0 tal que 0+v = v +0 = v.
4. Elemento oposto: Dado v em V existe um elemento denotado por v e tal que
v + (v) = (v) + v = 0.
5. Associatividade: ()v = (v).
6. Distributividade: ( + )v = v + v.
7. Distributividade: (v + w) = v + w.
8. Elemento unitrio: A multiplicao do elemento unitrio 1 de K pelo elemento v
de V igual a v, isto , 1v = v.
Os elementos de V so chamados vetores e os elementos de K de escalares. O
elemento v + w o vetor soma de v com w e o elemento v o produto de por v ou
ainda que v um mltiplo de v. O vetor v denominado oposto de v e 0 o vetor
nulo ou vetor zero. Definimos a diferena v w (leia-se v menos w) entre os vetores
v e w por v + (w).
33

34

Notas de aula do Prof. Antonio Cndido Faleiros

Em nosso curso, o corpo K ser o corpo R dos nmeros reais ou o corpo C dos nmeros
complexos. Quando V for um espao vetorial sobre o corpo dos nmeros reais, diremos
que V um espao vetorial real. Quando V for um espao vetorial sobre o corpo dos
nmeros complexos, diremos que V um espao vetorial complexo.
Quando se diz que V um espao vetorial sobre o corpo K entenda-se que est
implcito a existncia das operaes de adio de vetores e multiplicao de um escalar
por um vetor. Quando o contexto permitir, omite-se a referncia ao corpo K e se diz
apenas que V um espao vetorial. O espao vetorial {0} que contm apenas o vetor
nulo denominado de espao vetorial trivial.
Exemplo 2.1 Seja Rn o conjunto de todas as nuplas ordenadas (x1 , x2 , . . . , xn ) de
nmeros reais. Duas nuplas ordenadas (x1 , x2 , . . . , xn ) e (y1 , y2 , . . . , yn ) so iguais se
x1 = y1 , x2 = y2 , . . . , xn = yn . Define-se a operao de adio em Rn por
(x1 , x2 , . . . , xn ) + (y1 , y2 , . . . , yn ) = (x1 + y1 , x2 + y2 , . . . , xn + yn )
e a multiplicao de um nmero real por uma nupla ordenada definida por
(x1 , x2 , . . . , xn ) = (x1 , x2 , . . . , xn ).
O Rn com as operaes de adio de duas nuplas ordenadas e multiplicao de um escalar
por uma nupla um espao vetorial sobre os reais.
Exemplo 2.2 O conjunto Rmn das matrizes m n com elementos reais munido com as
operaes de adio de matrizes e multiplicao de um nmero complexo por uma matriz
um espao vetorial sobre o corpo dos nmeros reais. O zero deste espao vetorial a
matriz nula e o elemento oposto (inverso aditivo) de A = [aij ] A = [aij ].
Exemplo 2.3 O conjunto das matrizes m por n com elementos complexos, que denotaremos por Cmn , munido com as operaes de adio de matrizes e multiplicao de um
nmero complexo por uma matriz um espao vetorial sobre o corpo dos nmeros complexos. O zero deste espao vetorial a matriz nula e o elemento oposto (inverso aditivo)
de A = [aij ] A = [aij ].
Exemplo 2.4 O conjunto de todos os polinmios de grau menor ou igual a n, com coeficientes reais, munido com as operaes de adio de polinmios e multiplicao de um
nmero real por um polinmio, um espao vetorial sobre o corpo dos reais. O conjunto
dos polinmios de grau menor ou igual a n com coeficientes complexos com as operaes
acima um espao vetorial sobre o corpo dos nmeros complexos.
Exemplo 2.5 O conjunto de todos os polinmios com coeficientes reais, munido com as
operaes de adio de polinmios e multiplicao de um nmero real por um polinmio,
um espao vetorial sobre o corpo dos reais. O conjunto de todos os polinmios com
coeficientes complexos com as operaes acima um espao vetorial sobre o corpo dos
nmeros complexos.
Exemplo 2.6 O conjunto C[a, b] = {f : [a, b] R : f contnua} com as operaes de
adio de funes e multiplicao de um nmero real por uma funo um espao vetorial
sobre R.

Notas de aula do Prof. Antonio Cndido Faleiros

2.2

35

Dependncia linear

Todo elemento (x, y) do R2 pode ser decomposto na seguinte soma


(x, y) = x(1, 0) + y(0, 1).
Esta maneira de decompor um vetor muito utilizada em lgebra Linear.
Sejam v1 , . . . , vn vetores do espao vetorial V e escalares 1 , . . . , n . O vetor 1 v1 +
+ n vn uma combinao linear dos vetores v1 , . . . , vn .
Exemplo 2.7 O vetor (2, 3) do R2 uma combinao linear dos vetores (1, 0) e (0, 1)
pois (2, 3) = 2(1, 0)+ 3(0, 1).
Seja {v1 , . . . , vn } um subconjunto finito de V. Este conjunto linearmente dependente se existirem escalares 1 , . . . , n , nem todos nulos tais que
1 v1 + + n vn = 0.
Tambm se diz que os vetores v1 , . . . , vn so linearmente dependentes. Notem que a
igualdade acima se verifica para 1 = = n = 0. Se a nupla (1 , . . . , n ) = (0, . . . ,
0) for a nica para a qual
1 v1 + + n vn = 0,
diremos que o conjunto {v1 , . . . , vn } linearmente independente ou que os vetores
v1 , . . . , vn so linearmente independentes.
Exemplo 2.8 O conjunto S = { (5, 7), (1, 0), (0, 1) } de vetores do R2 linearmente
dependente pois
1(5, 7) 5(1, 0) 7(0, 1) = (0, 0).
O conjunto { (1, 2, 3), (0, 1, 1), (0, 0, 2) } de vetores do R3 linearmente independente.
De fato, se 1 , 2 e 3 forem escalares tais que
1 (1, 2, 3) + 2 (0, 1, 1) + 3 (0, 0, 2) = (0, 0, 0)
ento
1 + 02 + 03 = 0
21 + 2 + 03 = 0
31 + 2 + 23 = 0
cuja nica soluo 1 = 2 = 3 = 0.
Todo conjunto {0, v1 , . . . vp } que contm o vetor nulo linearmente dependente pois
1 0 + 0v1 + + 0vp = 0.

36

Notas de aula do Prof. Antonio Cndido Faleiros

Observe que, a dependncia linear do conjunto S = { (5, 7), (1, 0), (0, 1) } de vetores
do R2 que se expressa por
1(5, 7) 5(1, 0) 7(0, 1) = (0, 0).
implica na possibilidade de escrever (5, 7) como uma combinao linear dos vetores (1, 0)
e (0, 1)
(5, 7) = 5(1, 0) + 7(0, 1).
Esta igualdade tambm implica na dependncia linear de S = { (5, 7), (1, 0), (0, 1) }. Tal
fato enunciado de modo geral no prximo teorema.
Proposio 2.9 Um conjunto {v1 , . . . , vn } de vetores de um espao vetorial V linearmente dependente se e s se um dos seus elementos for combinao linear dos demais.
Prova. Se {v1 , . . . , vn } for linearmente dependente, existem escalares 1 , . . . , n , nem
todos nulos, tais que 1 v1 + + n vn = 0. Supondo 1 6= 0 (se 1 = 0, basta permutar os
vetores do conjunto para trazer o coeficiente no nulo para a primeira posio) podemos
escrever v1 como combinao linear de v2 , . . . , vn

v1 = 1
1 2 v2 1 n vn .

Se v1 for uma combinao linear de v2 , . . . , vn , ento existem escalares 2 , . . . , n tais


que
v1 = 2 v2 + + n vn
e
v1 + ( 2 ) v2 + + ( n ) vn = 0,

mostrando que {v1 , . . . , vn } linearmente dependente.

Todo conjunto que contm um subconjunto linearmente dependente linearmente


dependente. Todo subconjunto de um conjunto de vetores linearmente independente
linearmente independente.
Proposio 2.10 Seja S um conjunto finito de vetores.
1. Se S for linearmente dependente, qualquer conjunto finito de vetores que o contm
tambm ser linearmente dependente.
2. Se S for linearmente independente, qualquer subconjunto de S ser linearmente
independente.
Prova. Seja S = {v1 , . . . , vn }.

Notas de aula do Prof. Antonio Cndido Faleiros

37

1. Se S for linearmente dependente, existem escalares 1 , . . . , n nem todos nulos tais


que 1 v1 + + n vn = 0. Seja S 0 um conjunto finito que contm S. Se w1 , . . . , wm
forem os elementos de S 0 que no pertencem a S, ento
1 v1 + + n vn + 0w1 + + 0wm = 0
provando que S 0 linearmente dependente.
2. Se S for linearmente independente, seja S 0 um subconjunto de S. Se S 0 fosse linearmente dependente, S tambm o seria pela primeira parte. Logo S 0 linearmente
independente.

2.3

Base e dimenso

Seja B = {v1 , . . . , vn } um conjunto finito de vetores em V. Se todo elemento de V for


uma combinao linear dos elementos de B, diremos que B gera V.
Exemplo 2.11 O conjunto B = {(1, 2), (1, 0), (0, 1)} gera o R2 . Qualquer par ordenado
(x, y) pode ser decomposto nas combinaes lineares
(x, y) = 0(1, 2) + x(1, 0) + y(0, 1)
ou
(x, y) = x(1, 2) + 0(1, 0) + (y 2x)(0, 1).
Neste exemplo, o modo de escrever (x, y) como combinao linear dos elementos de B no
nica.
Exemplo 2.12 O conjunto B = {(2, 1), (1, 0) } gera o R2 pois podemos escrever um par
ordenado (x, y) qualquer como combinao linear desses dois vetores
(x, y) = x(2, 1) + (y x)(1, 0).
Neste exemplo, o modo de escrever (x, y) como combinao linear dos elementos de B
nica.
Que diferena existe entre os conjuntos geradores dos exemplos acima? O primeiro
linearmente dependente e o segundo linearmente dependente.
Definio 2.13 Um conjunto finito de vetores linearmente independente e que gera V
uma base de V.

38

Notas de aula do Prof. Antonio Cndido Faleiros

Uma base B = {v1 , . . . , vn } gera V. Assim, para cada vetor v em V existem escalares
1 , . . . , n tais que
v = 1 v1 + + n vn .
Os vetores 1 v1 , . . . , n vn so denominados de componentes do vetor v na base B, os
escalares 1 , . . . , n so as coordenadas de v na base B e a matriz coluna
[v]B = [1 . . . n ]T
a matriz das coordenadas de v na base B.
Uma base ordenada B = {v1 , v2 , . . . , vn } aquela em que se estabelece que v1 o
seu primeiro elemento, que v2 o seu segundo elemento, e assim por diante. A ordem em
que seus elementos so escritos relevante.
Proposio 2.14 A matriz das coordenadas de um vetor numa base ordenada nica.
Prova. Seja B = {v1 , . . . , vn } uma base ordenada de um espao vetorial V. Se v =
x1 v1 + + xn vn e v = y1 v1 + + yn vn forem duas decomposies de v nos elementos
da base B, ento
0 = v v = (x1 y1 )v1 + + (xn yn )vn

e, da independncia linear dos vetores da base, xi = yi para i = 1, . . . , n.

De ora em diante, uma base ordenada ser chamada simplesmente de base. O contexto
indicar a necessidade de ser a base ordenada ou no.
Exemplo 2.15 Considere as nuplas e1 = (1, 0, . . . , 0), e2 = (0, 1, . . . , 0), en = (0, 0,
. . . , 1), onde ek a linha k da matriz identidade n n. O conjunto de vetores {e1 , e2 ,
. . . , en } uma base tanto do Rn quanto do Cn e chamada de base cannica. Se x =
(x1 , . . . , xn ), ento x = x1 e1 + + xn en . Isto significa que as coordenadas de x na base
cannica so exatamente os elementos da nupla x.
Exemplo 2.16 O conjunto {1, x, x2 } uma base do espao vetorial dos polinmios de
grau menor ou igual a dois com coeficientes complexos.
Nem todo espao vetorial possui uma base tal como se definiu acima. O espao vetorial
de todos os polinmios com coeficientes complexos no possui base no sentido definido
neste texto. No existe conjunto finito de polinmios que gera todos os demais. Todo
conjunto finito de polinmios tem um polinmio de grau mximo, que no seria capaz de
gerar os polinmios de grau superior ao polinmio de grau mximo do conjunto.
Todas as bases de um espao vetorial possuem o mesmo nmero de elementos, como
provaremos em seguida. Precederemos o teorema principal por trs lemas.
Lema 2.17 Seja {v1 , . . . , vn } uma base de V e w = 1 v1 + + n vn . Se i 6= 0, ento
{v1 , . . . , vi1 , w, vi+1 , , . . . , vn }
tambm base.

Notas de aula do Prof. Antonio Cndido Faleiros

39

Prova. Para simplificar, provaremos o teorema supondo 1 6= 0. Se 1 = 0, podemos


reordenar os elementos da base para trazer para a primeira posio uma componente de w
diferente de zero. Sendo 1 6= 0, podemos explicitar v1 na igualdade w = 1 v1 + +n vn
para obter
v1 =

1
2
n
w v2
vn = 1 w + 2 v2 + + n vn .
1
1
1

Vamos provar que {w, v2 , . . . , vn } gera V. Sendo v um vetor qualquer de V, existem


escalares x1 , x2 , . . . , xn tais que
v = x1 v1 + x2 v2 + + xn vn
= x1 ( 1 w + 2 v2 + + n vn ) + x2 v2 + + xn vn
= (x1 1 )w + (x1 2 + x2 )v2 + + (x1 n + xn )vn ,
provando que o conjunto {w, v2 , . . . , vn } gera V.
Vamos provar que {w, v2 , . . . , vn } linearmente independente. Sejam k1 , k2 , . . . , kn
escalares tais que k1 w+ k2 v2 + + kn vn = 0. Se k1 6= 0, ento
k1 (1 v1 + 2 v2 + + n vn ) + k2 v2 + + kn vn = 0
ou
k1 1 v1 + (k1 2 + k2 )v2 + + (k1 n + kn )vn = 0
com k1 1 6= 0, o que contraria o fato de {v1 , v2 , . . . , vn } ser base de V. Logo, k1 = 0
e a combinao linear k1 w+ k2 v2 + + kn vn = 0 se reduz a k2 v2 + + kn vn = 0. Da
independncia linear do conjunto {v2 , . . . , vn }, obtemos k2 = = kn = 0, provando a
independncia linear de {w, v2 , . . . , vn } que, portanto, base de V.
Lema 2.18 Seja {v1 , . . . , vn } uma base com n elementos do espao vetorial V. Todo
conjunto linearmente independente com n elementos base de V.
Prova. Seja {w1 , . . . , wn } um conjunto linearmente independente com n vetores de
V. Pode-se decompor w1 na base {v1 , . . . , vn } e escrever
w1 = c11 v1 + + cn1 v1 .
Como w1 6= 0, pelo menos um dos coeficientes desta combinao linear diferente de zero.
Podemos supor que c11 6= 0 (se o c11 fosse nulo, bastaria reordenar a base {v1 , v2 , . . . , vn }
de modo que, nesta nova ordem, c11 6= 0).
Pelo lema anterior, {w1 , v2 , . . . , vn } base e podemos escrever
w2 = c12 w1 + c22 v2 + + cn2 vn .
Os coeficientes c22 , . . . , cn2 no podem ser todos nulos. De fato, se todos eles fossem nulos,
ento w2 = c12 w1 , o que contraria a hiptese de o conjunto {w1 , . . . , wn } ser linearmente

40

Notas de aula do Prof. Antonio Cndido Faleiros

independente. Assim, pelo menos um dos coeficientes c22 , . . . , cn2 no nulo. Como
antes, podemos supor, sem perda de generalidade, que c22 6= 0.
Pelo lema anterior, {w1 , w2 , v3 , . . . , vn } base de V.
Prosseguindo com este raciocnio, substitumos todos os elementos da base {v1 , . . . ,
vn } por w1 , w2 , . . . , wn , provando que {w1 , w2 , . . . , wn } base.
Lema 2.19 Se um espao vetorial V possuir uma base com n elementos, ento todo
conjunto de vetores em V com mais de n elementos linearmente dependente.
Prova. De fato, se houvesse um conjunto linearmente independente com mais do que
n elementos, qualquer subconjunto dele com n elementos seria base e os vetores restantes
seriam combinaes lineares desses n selecionados, contrariando a hiptese de independncia linear do conjunto. Logo, no existe conjunto de vetores linearmente independente
com mais do que n elementos.
Estes lemas nos permitem enunciar o
Teorema 2.20 Se um espao vetorial V possuir uma base com n elementos, todas as
outras bases deste espao vetorial tm o mesmo nmero de elementos.
Prova. De fato, como todo conjunto com mais do que n elementos linearmente
dependente, no h base com mais do que n elementos.
Seja B1 a base com n elementos. Se existisse alguma base B2 com k elementos e k <
n, pelo lema anterior, a base B1 seria linearmente dependente, possibilidade que se exclui
pela definio de base. Logo no existe base com menos do que n elementos.
Este teorema garante que todas as bases de um espao vetorial possui o mesmo nmero
de elementos o que justifica a definio que segue.
Definio 2.21 Se um espao vetorial possui uma base, diremos que ele possui dimenso finita e que o nmero de elementos das bases a sua dimenso. Por definio, a
dimenso do espao vetorial trivial, aquele que contm apenas o vetor nulo, zero.

2.4

Matriz de mudana de base

Seja V um espao vetorial complexo de dimenso finita n > 0. Sejam B1 = {u1 , . . . , un }


e B2 = {v1 , . . . , vn } duas bases de V. Podemos decompor cada elemento de B2 numa
combinao linear dos elementos de B1
v1 = p11 u1 + p21 u2 + + pn1 un
v2 = p12 u1 + p22 u2 + + pn2 un

vn = p1n u1 + p2n u2 + + pnn un

Notas de aula do Prof. Antonio Cndido Faleiros


A matriz

M12 =

41

p11 p12 p1n


p21 p22 p2n
..
.. . .
..
.
.
.
.
pn1 pn2 pnn

chamada de matriz de mudana de base, mais especificamente, matriz de mudana


da base B1 para a base B2 . Observe que as coordenadas do desenvolvimento de v1 na
base B1 formam a primeira coluna, as coordenadas do desenvolvimento de v2 na base B1
formam a primeira coluna,
Sendo B3 = {w1 , . . . , wn } uma terceira base de V, podemos escrever os vetores de B3
como combinaes lineares dos elementos da base B2 . Usando o smbolo de somatrio,
wj =

n
X

qij vi

i=1

e agora, M23 = [qij ] a matriz de mudana da base B2 para a base B3 .


Das duas decomposies acima segue
X
X X
wj =
qkj vk =
qkj
pik ui
k

X X
i

pik qkj

ui =

rij ui

P
onde M13 = [rij ] = [ k pik qkj ] a matriz de mudana da base B1 para a base B3 . Como
#
"
X
pik qkj = [pik ][qkj ] = M12 M23 ,
M13 = [rij ] =
k

provamos a identidade
M13 = M12 M23 .
Quando B3 = B1 , a matriz M13 a identidade I e M23 = M21 . Da igualdade acima segue
M12 M21 = I,
mostrando que as matrizes de mudana de base so inversveis e que a inversa de M12
M21 .
Sejam i e j inteiros do conjunto {1, 2, . . . , n}. O delta de Kronecker ij , um
conjunto de n2 nmeros definidos do seguinte modo: ij = 1 quando i = j e ij = 0
quando i 6= j.
Observe que o elemento da linha i coluna j da matriz identidade I de ordem n n
exatamente ij e podemos usar o delta de Kronecker para escrever I = [ ij ].
As igualdades matriciais
M12 M21 = I

M21 M12 = I

42

Notas de aula do Prof. Antonio Cndido Faleiros

quando escritas componente a componente, fornece


X
X
pik qkj = ij
e
qik pkj = ij
k

para i e j percorrendo os valores 1, . . . , n.


Mudana de coordenadas
Teorema 2.22 Sejam B1 e B2 duas bases do espao vetorial V. Sejam
[u]1 a matriz das coordenadas de u na base B1 ,
[u]2 a matriz das coordenadas de u na base B2 e
M12 a matriz de mudana da base B1 para a base B2 .
Ento
[u]1 = M12 [u]2
Prova. Sejam B1 = {v1 , . . . , vn } e B2 = {w1 , . . . , wn } as bases em questo. Se [u]1 =
[x1 , . . . , xn ]T for a matriz das coordenadas de u na base B1 , se [u]2 = [y1 , . . . , yn ]T for a
matriz das coordenadas de u na base B2 e se M12 = [pij ] for a matriz de mudana da base
B1 para a base B2 , segue
X
X
xi vi =
yj wj
u=
i

wj =

n
X

pij vi .

i=1

Portanto,
u =

yj wj =

X X
i

Como u =
base que

X
j

pij yj

yj

pij vi

vi .

xi vi , segue da unicidade da decomposio de um vetor nos elementos da


xi =

pij yj

que corresponde igualdade matricial


[u]1 = M12 [u]2 .

Notas de aula do Prof. Antonio Cndido Faleiros

2.5

43

Subespao vetorial

Seja V um espao vetorial e W um subconjunto no vazio de V. Diremos que W um


subespao vetorial de V se, para todo v e w em W e todo escalar , os vetores w e
v + w pertencerem a W. Em outras palavras, o subespao vetorial aquele subconjunto
fechado em relao adio e multiplicao por um escalar.
As operaes de adio de vetores e multiplicao por uma escalar definidas em V,
tambm se aplicam aos vetores de W, que est contido em V. Certamente, essas operaes
em W gozam das mesmas propriedades que em V. Deste argumento se conclui que todo
subespao vetorial , ele prprio, um espao vetorial.
O prprio V um subespao vetorial dele mesmo. O subespao {0} denominado de
subespao trivial de V. Os subespaos distintos de V so denominados de subespaos
prprios de V.
Exemplo 2.23 O conjunto W = { (x, y, 0) : x, y R } um subespao prprio de R3 .
Um subespao vetorial sempre contm o vetor nulo. De fato, sendo 0 o escalar nulo,
para todo vetor v do subespao, 0v o vetor nulo e, por definio, pertence ao subespao.
Sejam W1 e W2 subespaos vetoriais de um espao vetorial V. A soma dos subespaos
W1 + W2 , definida por
W1 + W2 = {w1 + w2 : w1 W1 e w2 W2 }
e a interseo dos subespaos W1 W2 , definida por
W1 W2 = {w : w W1 e w W2 }
so subespaos vetoriais de V.
Nota 2.24 Nem sempre a unio
W1 W2 = {w V : w W1 ou w W2 }
de dois subespaos W1 e W2 de V um subespao vetorial de V. Se u e v pertencerem
unio, u + v pode no pertencer. Quando W1 estiver contido em W2 , ento W1 W2 =
W2 e da a unio ser um subespao vetorial de V.
Seja W um subepao vetorial de V, um espao vetorial com dimenso finita. Ento
dim(W ) = dim(V ) se e s se W = V e dim(W ) < dim(V ) se e s se W for subespao
prprio de V.
Os subespaos de dimenso n 1 de um espao vetorial de dimenso n so chamados
de hiperplanos.
Exemplo 2.25 O subespao vetorial W = { x(1, 2, 0) + y(0, 3, 1) : x e y R } do R3
um hiperplano.

44

Notas de aula do Prof. Antonio Cndido Faleiros

2.6

Subespao gerado

Seja S um subconjunto de V. O conjunto de todas as combinaes lineares finitas de


elementos de S um subespao vetorial de V, chamado de subespao gerado por S e
denotado por hSi . Diz-se ainda que S gera hSi ou que hSi gerado por S. O subespao
gerado por S um subespao vetorial de V.
Sendo S = { w1 , . . . , wk } finito, ento
hSi = {1 w1 + + k wk : 1 , . . . , k R}.
Exemplo 2.26 Seja S = {e1 , e3 } um subconjunto do R3 onde e1 = (1, 0, 0, ) e e3 = (0,
0, 1). O subespao gerado por S hSi = { (x, 0, y) : x, y R3 }. Se considerarmos S
como subconjunto de C3 ento hSi = { (x, 0, y) : x, y C}.
Base do subespao gerado
Seja S = {w1 , . . . , wk } um conjunto de vetores de Cn , de modo que
w1 = (w11 , w12 , . . . , w1n )
w2 = (w21 , w22 , . . . , w2n )

wk = (wk1 , wk2 , . . . , wkn )


Vamos descrever um processo para determinar uma base para o espao gerado por S no
qual lanamos mo de alguns fatos para nos auxiliar nesta tarefa. Vamos enumer-los
abaixo.
1. Retirar os vetores nulos de S no altera o espao gerado por S.
2. Permutar a ordem dos vetores de S no altera o espao gerado por S.
3. Se multiplicarmos um ou mais vetores de S por escalares no nulos, o espao gerado
por S no se altera.
4. Se substituirmos em S o vetor wi pelo vetor wi + cwj , onde c um escalar, o espao
gerado por S permanece inalterado.
5. Se nenhum vetor de S for nulo e a matriz

w11 w12
w21 w22

..
..
.
.
wk1 wk2

w1n
w2n
..
...
.
wkn

for escalonada, ento S linearmente independente e, portanto, uma base do


espao gerado por S.

Notas de aula do Prof. Antonio Cndido Faleiros

45

Os fatos enumerados acima nos permitem usar o mtodo da eliminao de Gauss para
determinar uma base para o espao gerado por S : Construa a matriz cujas linhas so
os elementos de w1 , w2 , . . . , wk , como acima e obtenha sua forma escalonada usando o
mtodo da eliminao de Gauss. As linhas no nulas da forma escalonada desta matriz

r11 r12 r1n


0 r22 r2n

R= 0

r
3n

..
.. . .
..
. .
.
.
formaro a base de hSi .
Este procedimento pode ser usado para determinar o subespao gerado por S = { w1 ,
. . . , wk } mesmo quando S for um conjunto de vetores num espao vetorial de dimenso
finita V qualquer. Basta tomar uma base B = { v1 , v2 , . . . , vn } de V e decompor cada
elementos de S numa combinao linear de elementos de B
w1 = 11 v1 + 12 v2 + + 1n vn
w2 = 21 v1 + 22 v2 + + 2n vn

wk = k1 v1 + k2 v2 + + kn vn
formar a matriz

11 12 1n
21 22 2n
..
..
..
...
.
.
.
k1 k2 kn

e proceder como no caso em que o espao vetorial o Cn , obtendo, obter sua forma
escalonada

r11 r12 r1n


0 r22 r2n

R= 0

r
3n

..
.. . .
.
. ..
.
.
Os vetores no nulos obtidos na forma escalonada

r11 v1 + r12 v2 + + r1n vn


r22 v2 + r23 v3 + + r2n vn
r33 v3 + r34 v4 + + r3n vn
..
.
formaro uma base para o espao gerado por V.

46

Notas de aula do Prof. Antonio Cndido Faleiros

Exemplo 2.27 Vamos determinar uma base do subespao vetorial do R5 gerado por
w1
w2
w3
w4
w5
Construmos a matriz

=
=
=
=
=

(1, 2, 2, 3, 4),
(3, 8, 0, 2, 8),
(1, 2, 2, 1, 0),
(1, 2, 8, 8, 8),
(2, 6, 3, 5, 9).

1
2 2 3 4
3
8 0 2
8

1
2 2 1 0

1 2 8 8
8
2
6 3 5
9

e a escalonamos

1 2 2 3 4
1
2 2 3 4
1 0 0 0 0

3 1 0 0 0 3
8 0 2
8
0 2 6 11 20

1 0 1 0 0 1
2
4
2 2 1 0

= 0 0 0

1 0 0 1 0 1 2 8 8
0 0 10 5
4
8
0 2 1 11 17
2
6 3 5
9
2 0 0 0 1

1 2 2 3 4
1 2 2 3 4
1 0 0 0 0
0 1 0 0 0 0 2 6 11 20 0 2 6 11 20

= 0 0 0
0 0 1 0 0 0 0 0
2
4
2
4

0 0 0 1 0 0 0 10 5
0 0 10 5
4
4
0 0 5
0 3
0 2 1 11 17
0 1 0 0 1

1 2 2 3 4
1 2 2 3 4
1 0 0 0 0
0 1 0 0 0 0 2 6 11 20 0 2 6 11 20

0 0 0 0 1 0 0 0
0 3
2
4

= 0 0 5

0 0 0 1 0 0 0 10 5
4
4 0 0 10 5
0 0 0
2
4
0 0 5
0 3
0 0 1 0 0

1 2 2 3 4
1 2 2 3 4
1 0 0 0 0
0 1 0 0 0 0 2 6 11 20 0 2 6 11 20

0 0 1 0 0 0 0 5
0 3
0 3

= 0 0 5

0 0 2 1 0 0 0 10 5
5 10
4 0 0 0
0 0 0
2
4
0 0 0
2
4
0 0 0 0 1

1 2 2 3 4
1 2 2 3 4
1 0 0
0
0

0 1 0
0
0
0 2 6 11 20 0 2 6 11 20

0 0 1
0 3
0 3 = 0 0 5
0
0 0 0 5

0 0 0 1/5 0 0 0 0
1
2
5 10 0 0 0
0 0 0
0
0
0 0 0
2
4
0 0 0 2/5 1

Notas de aula do Prof. Antonio Cndido Faleiros


e assim, uma base do espao gerado por w1 , w2 , w3 , w4 , w5 formada pelos vetores
z1
z2
z3
z4

=
=
=
=

(1, 2, 2, 3, 4),
(0, 2, 6, 11, 20),
(0, 0, 5, 0, 3),
(0, 0, 0, 1, 2).

47

48

Notas de aula do Prof. Antonio Cndido Faleiros

Captulo 3
Transformao linear
Neste captulo consideraremos que os espaos vetoriais esto definidos em um mesmo corpo
K. Nos exemplos, K ser o corpo dos nmeros reais ou o corpo dos nmeros complexos.
Sejam V e W dois espaos vetoriais sobre um mesmo corpo K. Uma funo L : V W
uma transformao linear se, para todo par de vetores v, w em V e todo escalar
do corpo K,
L(v + w) = L(v) + L(w),
L(v) = L(v).
A notao Lv tambm usada para indicar L(v).
Podemos unir as duas igualdades acima dizendo que L linear quando a igualdade
L(v + w) = L(v) + L(w)
se verificar para todo e escalares e para todo v e w em V.
Toda transformao linear leva o zero de V no zero de W. De fato, L(0) = L(0 + 0) =
L(0)+ L(0) = 2L(0) o que implica em L(0) = 0.
Exemplo 3.1 A transformao L1 : R2 R definida por L1 (x, y) = 3x+ 2y linear.
A transformao L2 : R2 R2 definida por L2 (x, y) = (x y, 0) linear.
A transformao T : R2 R definida por T (x, y) = x + y + 2 no linear pois T (2x,
2y) = 2x+ 2y+ 2 diferente de 2T (x, y) = 2x+ 2y+ 4.
Uma transformao linear L : V V de um espao V sobre ele mesmo recebe o nome
de operador linear. Se V for um espao vetorial sobre um corpo K, uma transformao
linear L : V K recebe o nome de funcional linear.
Sendo L : V W e T : W U, definimos a composta T L : V U por
T L(v) = T (L(v)).
Tambm se denota T L por T L. Assim, T L(v) = T (L(v)).
49

50

Notas de aula do Prof. Antonio Cndido Faleiros

Pode-se provar por induo que, se L : V W for linear, se v1 , . . . , vn forem vetores


de V e se 1 , . . . , n forem escalares, ento
L (1 v1 + + n vn ) = 1 L(v1 ) + + n L(vn ).
A partir desta frmula podemos afirmar que quando L for linear e {v1 , . . . , vn } for
base de V, o conhecimento dos vetores w1 = L(v1 ), . . . , wn = L(vn ) suficiente para
calcular o valor de L em qualquer vetor v. Basta decompor v em uma combinao linear
dos vetores da base
v = x1 v1 + + xn vn
e calcular
L(v) = L(x1 v1 + + xn vn ) = x1 L(v1 ) + + xn L(vn ) = x1 w1 + + xn wn .
Exemplo 3.2 Seja L : R3 R uma transformao linear e e1 = (1, 0, 0), e2 = (0, 1,
0) e e3 = (0, 0, 1) os elementos da base cannica do R3 . Se Le1 = 5, Le2 = 7, Le3 = 11,
para qualquer (x1 , x2 , x3 ) em R3 , teremos
L(x1 , x2 , x3 ) = L(x1 e1 + x2 e2 + x3 e3 )
= x1 L(e1 ) + x2 L(e2 ) + x3 L(e3 )
= 5x1 + 7x2 + 11x3 .
Generalizando este exemplo, se Le1 = a1 , Le2 = a2 e Le3 = a3 , ento
L(x1 , x2 , x3 ) = L(x1 e1 + x2 e2 + x3 e3 )
= x1 L(e1 ) + x2 L(e2 ) + x3 L(e3 )
= a1 x1 + a2 x2 + a3 x3 .
Este exemplo nos d uma indicao da forma geral de um funcional linear L de Rn
em R. Vamos determin-la. Seja {e1 , e2 , . . . , en } a base cannica do Rn . Se L(ei ) = ai
para i = 1, . . . , n, ento, para todo (x1 , . . . , xn ) vale
L(x1 , . . . , xn ) = L(x1 e1 + + xn en ) = x1 L(e1 ) + + xn L(en )
ou
L(x1 , . . . , xn ) = a1 x1 + + an xn .
Esta a forma geral de um funcional linear do Rn em R.
Exemplo 3.3 Utilizando a forma geral, vemos que L1 (x, y) = 5x 4y e L2 (x, y) = 3x
so transformaes lineares de R2 em R. Todavia, T (x, y) = x+ 2 no linear pois no
possui o formato estabelecido acima e observe que T no leva o zero de R2 no zero de R.

Notas de aula do Prof. Antonio Cndido Faleiros

51

Vamos determinar agora a forma geral de uma uma transformao linear L de Rn em


R . Iniciemos com um exemplo ilustrativo com a transformao
m

L(x1 , x2 ) = (x1 3x2 , 2x1 , x1 + 4x2 )


de R2 em R3 . Se definirmos
L1 (x1 , x2 ) = x1 3x2 ,

L2 (x1 , x2 ) = 3x2

e L3 (x1 , x2 ) = x1 + 4x2

ento
L(x1 , x2 ) = ( L1 (x1 , x2 ), L2 (x1 , x2 ), L3 (x1 , x2 ) ).
Baseados neste exemplo, vemos que, se L uma transformao linear do Rn em Rm , para
qualquer x no Rn , tem-se
L(x) = ( L1 (x), . . . , Lm (x) ),
onde L1 (x), . . . , Lm (x) so nmeros reais, dependentes de x. Vamos mostrar que L1 , . . . ,
Lm so funcionais lineares de Rn em R. De fato, sendo e escalares e x, y nuplas
ordenadas, ento
L(x + y) = Lx + Ly
e assim,
( L1 (x + y), . . . , Lm (x + y) ) = ( L1 x + L1 y, . . . , Lm x + Lm y )
e, da igualdade desses elementos de Rm , obtemos
L1 (x + y) = L1 x + L1 y
...
Lm (x + y) = Lm x + Lm y
mostrando que L1 , . . . , Lm so funcionais lineares de Rn em R. A partir da, conclumos
que toda transformao linear L de Rn em Rm da forma
L(x1 , . . . , xn ) = ( a11 x1 + + a1n xn , . . . , am1 x1 + + am,n xn )
onde aij , para i = 1, . . . , m e j = 1, . . . , n, so nmeros reais.
Exemplo 3.4 A transformao
L(x, y) = (2x y, x + y, y)
de R2 em R3 linear. A transformao
T (x, y) = (x, 0, x + 2y, 3x + y, 4y)
de R2 em R5 linear.

52

Notas de aula do Prof. Antonio Cndido Faleiros


Seja L : V W uma transformao linear. O conjunto
ker L = {v V : Lv = 0}

chamado de ncleo (kernel em ingls) de L e o conjunto


Im L = {Lv : v V }
a imagem de L. Tanto o ncleo de L quanto a sua imagem, so subespaos vetoriais
de V. A dimenso do ncleo de L denominada de nulidade de L.
Exemplo 3.5 Seja L a transformao linear de R3 em R3 definida por
L(x, y, z) = (x + z, 2x + y + z, x + 2y z).
Para determinar o ncleo de L escreva
L(x, y, z) = (x + z, 2x + y + z, x + 2y z) = (0, 0, 0)
e resolva o sistema correspondente igualdade acima
x+z = 0
2x + y + z = 0
x + 2y z = 0
cuja soluo x = z e y = z pode ser obtida pelo mtodo da eliminao de Gauss. Assim,
ker L = {(z, z, z) : z R}.
O ker L gerado por (1, 1, 1) e, portanto, tem dimenso 1.
Para determinar a imagem de L escrevemos
L(x, y, z) = (x + z, 2x + y + z, x + 2y z)
= x(1, 2, 1) + y(0, 1, 2) + z(1, 1, 1)
mostrando que todo elemento da imagem de L uma combinao linear dos vetores (1, 2,
1), (0, 1, 2) e (1, 1, 1). Para determinar uma base do espao gerado usamos o processo
de escalonamento. Construmos a matriz

1 2 1
0 1 2
1 1 1

cujas linhas so os elementos dos vetores que geram o subespao.


elementares sobre as linhas chegamos a

1 2 1
1 2
1
1 2
l3 =l3 l2
3 l1
0 1 2 l3 =l
0 1

2
0 1

1 1 1
0 1 2
0 0

Usando operaes

1
2
0

Notas de aula do Prof. Antonio Cndido Faleiros

53

e chegamos a uma base da imagem de L que formada pelos vetores


(1, 2, 1) ,

(0, 1, 2)

e conclumos que a imagem de L tem dimenso 2.


Adicionando a dimenso do ncleo com a dimenso da imagem obtemos 3 que a
dimenso do domnio de L.
O resultado do exemplo anterior em que a soma das dimenses do ncleo e da imagem
de L igual dimenso do domnio de L um resultado geral, como enuncia o prximo
teorema.
Teorema 3.6 Sejam V e W espaos vetoriais e L : V W linear. Se a dimenso de V
for finita, ento
dim V = dim Im (L) + dim ker(L).
Prova. Quando L a transformao linear nula, que leva todos os vetores de V
no zero a Im (L) = {0} e nada resta a provar, uma vez que ker(L) = V. Assim, como
dim Im (L) = 0 e dim ker(L) = dim(V ).
Se L no for a transformao linear nula, Im (L) 6= {0}. Seja {v1 , . . . , vp } uma base do
ker(L). Podemos acrescentar vetores a este conjunto at obter uma base B = {v1 , . . . , vp ,
vp+1 , . . . , vn } de V. Se provarmos que {L(vp+1 ), . . . , L(vn )} base da Im (L), o teorema
estar provado pois
dim ker(L) + dim Im (L) = p + (n p) = n = dim(V ).
Inicialmente, observamos que nenhum dos vetores L(vp+1 ), . . . , L(vn ) nulo. Se fosse, o
vetor correspondente pertenceria ao ncleo de L e B seria linearmente dependente, o que
no o caso pois base de V.
Provemos agora que {L(vp+1 ), . . . , L(vn )} base da Im (L).
1. O conjunto {L(vp+1 ), . . . , L(vn )} gera Im (L).

De fato, se w pertence Im (L), ento existe v em V tal que w = Lv. Podemos


escrever v como uma combinao linear dos elementos da base B,
v = x1 v1 + + xp vp + xp+1 vp+1 + + xn vn
de onde segue
w = Lv = L(x1 v1 + + xp vp + xp+1 vp+1 + + xn vn )
= x1 Lv1 + + xp Lvp + xp+1 Lvp+1 + + xn Lvn
= xp+1 Lvp+1 + + xn Lvn ,

mostrando que {Lvp+1 , . . . , Lvn } gera a Im (L).

54

Notas de aula do Prof. Antonio Cndido Faleiros


2. O conjunto {Lvp+1 , . . . , Lvn } linearmente independente.

Se fosse linearmente dependente, existiriam escalares kp+1 , . . . , kn , nem todos nulos,


tais que
kp+1 L(vp+1 ) + + kn L(vn ) = 0
o que implica em
L(kp+1 vp+1 + + kn vn ) = 0
indicando que o vetor kp+1 vp+1 + + kn vn pertenceria ao ker(L), sendo igual a uma
combinao linear dos vetores v1 , . . . , vp que formam uma base do ncleo de L. Portanto,
existem escalares k1 , . . . , kp tais que
kp+1 vp+1 + + kn vn = k1 v1 + + kp vp
ou
k1 v1 + + kp vp kp+1 vp+1 kn vn = 0
onde pelo menos um dos ki , com i = 1, . . . , p, diferente de zero, o que vai contraria a
hiptese de B ser base de V.
Das partes 1 e 2 conclumos que {Lvp+1 , . . . , Lvn } base da Im (L).
Como {v1 , . . . , vp } base do ker(L) e {Lvp+1 , . . . , Lvn } base da Im (L), ento
dim ker L + dim Im L = p + (n p) = n = dim V
e o teorema est provado.

3.1

Matriz de uma transformao linear

Seja B1 = {v1 , . . . , vn } uma base de um espao vetorial V, B2 = {w1 , . . . , wm } uma base


de um espao vetorial W e L : V W uma transformao linear. Podemos decompor
cada vetor Lvj , com j = 1, . . . , n, numa combinao linear dos elementos da base B2
Lv1 = a11 w1 + a21 w2 + + am1 wm
Lv2 = a12 w1 + a22 w2 + + am2 wm

Lvn = a1n w1 + a2n w2 + + amn wm


Estas expresses podem ser escritas de modo taquigrfico usando somatrio: para j = 1,
2, . . . , n
m
X
aij wi .
Lvj =
i=1

Notas de aula do Prof. Antonio Cndido Faleiros


A matriz m por n
[L]12

55

a12 a1n
a22 a2n
..
..
...
.
.
am2 amn

a11
a21
..
.
am1

denominada de matriz de L nas bases B1 e B2 . Ainda se diz que [L]12 a representao


matricial de L nas bases B1 e B2 .
Quando W = V e B2 = B1 , a matriz [L]12 denotada por [L]1 e denominada de matriz
de L na base B1 . Tambm se diz que [L]1 a representao matricial de L na base B1 .
Para simplificar a notao, podemos escrever [L] em lugar de [L]12 ou [L]1 , conforme o
caso, sempre que o contexto for claro quanto s bases envolvidas.
Teorema 3.7 Sejam B1 e B2 bases dos espaos vetoriais V e W, respectivamente. Seja
L : V W uma transformao linear e v um vetor de V. Se [v]1 for a matriz de v na
base B1 , [Lv]2 a matriz de Lv na base B2 e [L]12 for ma matriz de Lv nas bases B1 e B2
ento
[Lv]2 = [L]12 [v]1 .
Prova. Sejam B1 = {v1 , . . . , vn } e B2 = {w1 , . . . , wm } as bases de V e W. Se
v=

n
X

xj vj ,

Lv =

j=1

m
X

yi wi ,

Lvj =

i=1

m
X

aij wi ,

i=1

ento [v]1 = [x1 , . . . , xn ]T , [Lv]2 = [y1 , . . . , ym ]T so matrizes coluna e [L]12 = [aij ]


uma matriz retangular m n.
Por um lado,

!
X
X
Lv = L
xj vj =
xj L (vj )
j

X
j

e por outro,

xj

aij wi =

Lv =

X X
i

aij xj

wi

yi wi .

Da unicidade da decomposio de um vetor nos elementos da base,


n
X
aij xj
yi =
j=1

para i = 1, . . . , m que equivale igualdade matricial


[Lv]2 = [L]12 [v]1 .

56

Notas de aula do Prof. Antonio Cndido Faleiros

Teorema 3.8 Sejam B1 , B2 e B3 , respectivamente, bases dos espaos vetoriais V, W e U.


Sejam L1 : V W e L2 : W U lineares. Ento
[L2 L1 ]13 = [L2 ]23 [L1 ]12 .
Prova. Sejam B1 = {v1 , . . . , vn }, B2 = {w1 , . . . , wm } e B3 = {u1 , . . . , up } as bases
em questo. Se
L1 vj =

m
X

aij wi ,

i=1
p

L2 wi =

bki uk ,

k=1
p

L2 L1 vj =

ckj uk ,

k=1

ento [L1 ]12 = [aij ], [L2 ]23 = [bki ] e [L2 L1 ]13 = [ckj ]. Como
m
!
m
X
X
L2 L1 vj = L2
aij wi =
aij L2 (wi )
i=1

m
X

aij

i=1

segue

i=1
p

bki uk =

k=1

ckj =

m
X X
k=1

m
X

i=1

bki aij

uk

bki aij

i=1

para k = 1, . . . , p e j = 1, . . . , n, que resulta na igualdade matricial


[L2 L1 ]13 = [L2 ]23 [L]12 .

Teorema 3.9 Sejam B1 e B2 duas bases do espao vetorial V e L : V V um operador


linear. Seja M12 a matriz de mudana da base B1 para a base B2 . Ento
M12 [L]2 = [L]1 M12

ou

1
[L]2 = M12
[L]1 M12 .

Prova. Sejam B1 = {v1 , . . . , vn } e B2 = {w1 , . . . , wn } as bases em questo. Seja


M12 = [mij ] a matriz de mudana da base B1 para a base B2 , de modo que
wj =

n
X
i=1

mij vi .

Notas de aula do Prof. Antonio Cndido Faleiros

57

Sejam [L]1 = [aij ] e [L]2 = [bij ] as matrizes de L nas bases B1 e B2 , respectivamente.


Podemos escrever, para j = 1, . . . , n,
Lvj =

n
X

aij vi ,

Lwj =

i=1

n
X

bij wi .

i=1

Por um lado,
Lwj =

bkj wk =

bkj

mik vi =

X X
i

mik bkj

vi

e por outro,
Lwj = L

mkj vk

X X
i

aik mkj

=
!

mkj L (vk ) =

X
k

mkj

aik vi

vi .

Pela unicidade de decomposio de vetores numa base, segue


X
X
mik bkj =
aik mkj ,
k

igualdade vlida para i = 1, . . . , n e j = 1, . . . , m. Usando a notao matricial, conclui-se


a prova do teorema:
M12 [L]2 = [L]1 M12 .

Definio 3.10 Duas matrizes A e B so semelhantes se existir uma matriz inversvel


P tal que
B = P 1 AP.
De acordo com o teorema anterior, as representaes matriciais de uma transformao
linear L : V V so semelhantes.

3.2

Isomorfismo

Sejam V e W dois espaos vetoriais sobre o mesmo corpo. Uma tranformao L : V


W injetora se, para todo v1 6= v2 em V, ento L(v1 ) 6= L(v2 ). De forma equivalente, L
injetora se para todo v1 e v2 em V com L(v1 ) = L(v2 ) tem-se v1 = v2 .

58

Notas de aula do Prof. Antonio Cndido Faleiros

Teorema 3.11 Sejam V e W espaos vetoriais sobre o mesmo corpo. Seja L : V W


linear. L injetora se e s se ker(L) = {0}. Em outras palavras, L injetora se e s se
o zero o nico vetor levado por L em zero.
Uma transformao L : V W sobrejetora se, para todo w em W, existe pelo
menos um v em V tal que Lv = w. Uma transformao bijetora aquela que ao mesmo
tempo injetora e sobrejetora. As transformaes bijetoras L : V W possuem inversa
L1 : W V que, por sua vez, bijetora e sua inversa L.
Denominamos isomorfismo transformao L : V W que linear e bijetora.
Neste caso sua inversa L1 : W V linear e, portanto, um isomorfismo. Dois espaos
vetoriais V e W so isomorfos quando houver um isomorfismo de V em W.
Teorema 3.12 Dois espaos vetoriais V e W sobre um mesmo corpo e de dimenso finita
so isomorfos se e s se dim V = dim W.
Prova. Sejam V e W isomorfos e L : V W um isomorfismo entre eles. Dada uma
base {v1 , . . . , vn } de V, vamos mostrar que {Lv1 , . . . , Lvn } base de W.
1. Provemos que {Lv1 , . . . , Lvn } gera W. Sendo L bijetora, para qualquer w em W,
existe v em V tal que w = Lv. Decompondo v na base {v1 , . . . , vn }, obtemos v =
x1 v1 + + xn vn e w = Lv = x1 Lv1 + + xn Lvn , provando que {Lv1 , . . . , Lvn }
gera W.
2. Provemos que {Lv1 , . . . , Lvn } linearmente independente. Sejam k1 , . . . , kn escalares tais que k1 Lv1 + + kn Lvn = 0. Ento L(k1 v1 + + kn vn ) = 0 e, como
L(0) = 0 e L bijetora, segue k1 v1 + + kn vn = 0. Pelo fato de {v1 , . . . , vn } ser
base de V, conclumos que k1 = = kn = 0, provando a independncia linear do
conjunto {Lv1 , . . . , Lvn }.
As partes 1 e 2 provam que dim V = dim W.
Tomando dim V = dim W = n como hiptese, provemos que V e W so isomorfos.
Seja B1 = {v1 , . . . , vn } base de V e B2 = {w1 , . . . , wn } base de W. Seja L a transformao
linear de V em W que leva vi em wi , para i = 1, . . . , n, ou seja Lvi = wi . Vamos provar
que L um isomorfismo entre V e W.
3. Provemos que L sobrejetor. Dado qualquer s em W, podemos escrever
s = s1 w1 + + sn wn = s1 Lv1 + + sn Lvn
= L(s1 v1 + + sn vn ),
provando que s est na imagem de L, provando a sobrejetividade de L.
4. Provemos que L injetor. Sejam x = x1 v1 + + xn vn e y = y1 v1 + + yn vn dois
vetores de V tais que Lx = Ly. Logo,
L(x1 v1 + + xn vn ) = L(y1 v1 + + yn vn )

Notas de aula do Prof. Antonio Cndido Faleiros

59

ou seja,
x1 w1 + + xn wn = y1 w1 + + yn wn .
Da independncia linear de B2 , conclumos que x1 = y1 , . . . , xn = yn , de onde resulta
a igualdade x = y, provando que L injetora.
De 3 e 4 conclumos que L um isomorfismo.
Teorema 3.13 Sejam V e W espaos vetoriais sobre o mesmo corpo, ambos com a
mesma dimenso e L : V W linear. So equivalentes:
1. L um isomorfismo.
2. L sobrejetora.
3. L injetora.
4. Se L(v) = 0, ento v = 0. Em outras palavras, ker(L) = {0}.
Prova. Provemos que (2) implica em (3). Seja L sobrejetora e {w1 , . . . , wn } uma
base de W. Da sobrejetividade de L, existe um conjunto de vetores B = {v1 , . . . , vn } em
V tais que Lvi = wi , para i = 1, . . . , n. O conjunto B base de V. Sejam x = x1 v1 + +
xn vn e y = y1 v1 + + yn vn dois vetores de V tais que Lx = Ly. Desta igualdade segue
x1 w1 + + xn wn = y1 w1 + + yn wn . A independncia linear de {w1 , . . . , wn } implica
em x1 = y1 , . . . , xn = yn , ou x = y, provando a injetividade de L.
Provemos que (3) implica em (4). Se L injetora e L(v) = 0, como L(0) = 0, segue
que v = 0, provando que (3) implica em (4).
Provemos que (4) implica em (2). Sendo ker(L) = {0} e {v1 , . . . , vn } uma base de V,
ento {Lv1 , . . . , Lvn } uma base de W. De fato, se k1 , . . . , kn forem escalares tais que
k1 Lv1 + + kn Lvn = 0, ento L(k1 v1 + + kn vn ) = 0 e, como o ncleo de L contm
apenas o zero, k1 v1 + + kn vn = 0. A independncia linear dos vi acarreta em k1 = =
kn = 0, provando que conjunto {Lv1 , . . . , Lvn } linearmente independente e, portanto,
base de W. Logo, L sobrejetor.
Teorema 3.14 Sejam B1 e B2 bases dos espaos V e W respectivamente e L : V W
um isomorfismo. Se A for a representao matricial de L nas bases B1 e B2 , ento A1
ser a representao matricial de L1 nas bases B2 e B1 .
Prova. Seja A = [aij ] a representao matricial de L nas bases B1 e B2 . Seja B = [bij ]
a representao matricial de L1 nas bases B2 e B1 . Como L1 L o operador identidade,
BA a matriz da transformao identidade na base B1 e esta a matriz identidade. Ainda
temos que LL1 o operador identidade e, desta maneira, AB a matriz da transformao
identidade na base B2 e esta a matriz identidade o que prova ser B = A1 .

60

Notas de aula do Prof. Antonio Cndido Faleiros

Teorema 3.15 Todo um espao vetorial V de dimenso n sobre um corpo K isomorfo


a K n.
Prova. Se {v1 , . . . , vn } for uma base de V, ento definimos a transformao linear L :
V K n por Lvi = ei , onde {e1 , . . . , en } a base cannica do K n , isto , ei = (0, . . . ,
0, 1, 0, . . . , 0) onde o nico elemento no nulo o i-simo. Como L leva uma base de V
numa base de K n ela injetora e, portanto, um isomorfismo.
Podemos afirmar que os isomorfismos so os mensageiros que trazem e levam as propriedades de um espao vetorial a outro. Se dois espaos vetoriais vetoriais forem isomorfos, todas as propriedades de um podem ser levados ao outro pelo isomorfismo. Isto
significa que, ao estudar as propriedades de um deles, teremos estudado as propriedades
do outro.
Por esta razo, ao estudar um espao vetorial real ou complexo V de dimenso n, os
prottipos so o Rn e o Cn , respectivamente. Se soubermos como proceder com um dos
dois, saberemos como proceder com V. Se{v1 , . . . , vn } for uma base de V, basta usar a
correspondncia
x1 v1 + + xn vn (x1 , . . . , xn )
definida pelo isomorfismo estabelecido no teorema anterior.

3.3

Transformaes lineares em Cm1

Seja A uma matriz complexa m por n. Ento L : Cn1 Cm1 definida por L(x) = Ax
uma transformao linear.
Reciprocamente, vamos mostrar que toda transformao linear L : Cn1 Cm1
da forma L(x) = Ax, onde A uma matriz m por n.
Se {e1 , . . . , en } for a base cannica do Cn1 ento aj = L(ej ) so vetores coluna em
Cm1 . Dado o vetor coluna x = [x1 , . . . , xn ]T = x1 e1 + + xn en do Cn , ento
!
n
n
X
X
xj ej =
xj L (ej )
L(x) = L
j=1

n
X

j=1

xj aj = Ax

j=1

onde A = [a1 , . . . , an ] a matriz complexa m por n, cujas colunas so a1 , . . . , an .


Em sntese, toda transformao L : Cn1 Cm1 do tipo L(x) = Ax, onde A
uma matriz complexa de ordem m por n. Por esta razo, podemos dizer que a matriz A
uma transformao linear e escrever A : Cn1 Cm1 .
intessante observar que, se B1 = {e1 , . . . , en } for a base cannica do Cn1 , se B2 =
{f1 , . . . , fm } for a base cannica do Cm1 e se A for uma matriz complexa m por n, ento
a representao matricial da transformao linear A : Cn1 Cm1 nas bases B1 e B2 ,
exatamente, a matriz A.

Captulo 4
Produto interno e norma
Neste captulo trabalharemos apenas com espaos vetoriais sobre o corpo dos nmeros
reais ou sobre o corpo dos nmeros complexos.

4.1

Produto interno em espaos vetoriais reais

Seja V um espao vetorial sobre o corpo R dos nmeros reais. Um produto interno em
V uma operao
h , i: V V R
que possui as propriedades abaixo, vlidas para todo v, w e z em V e todo a e b em R :
1. O produto interno positivo definido
hv, vi 0 e hv, vi = 0 se e s se v = 0.
2. O produto interno simtrico
hv, wi = hw, vi .
3. O produto interno linear na segunda varivel
hv, aw + bzi = a hv, wi + b hv, zi .
Das propriedades (2) e (3) se conclui que o produto interno liner na primeira varivel
hav + bw, zi = a hv, zi + b hw, zi .
Essas propriedades se extrai a linearidade do produto interno em relao primeira e
segunda varivel. Tanto que, se v1 , . . . , vp e w1 , . . . , wq forem vetores de V e ai , bj
forem nmeros reais, ento
+
* p
q
p
q
X
X
X
X
ai vi ,
bj wj =
ai bj hvi , wj i .
i=1

j=1

i=1 j=1

61

62

Notas de aula do Prof. Antonio Cndido Faleiros

Exemplo 4.1 Se x e y forem matrizes coluna Rn1 , o produto matricial xT y, onde xT


a matriz transposta de x, denominado produto escalar das matrizes x e y. Um produto
interno em Rn1 proveniente do produto escalar hx, yi = xT y.
Exemplo 4.2 Seja P2 (R) o conjunto dos polinmios com coeficientes reais e grau menor
ou igual a 2. Neste espao vetorial,

a0 + a1 x + a2 x2 , b0 + b1 x + b2 x2 = a0 b0 + a1 b1 + a2 b2
um produto interno e

hf (x), g(x)i =
outro.

f (x)g(x)dx

Exemplo 4.3 Seja C [a, b] o conjunto das funes reais de varivel real, definidas e contnuas no intervalo [a, b]. Com as operaes de adio de funes e a multiplicao de um
nmero real por uma funo, C [a, b] um espao vetorial sobre o corpo de nmeros reais.
Nele
Z
b

hf, gi =

f (t)g(t) dt

um produto interno.

4.2

Produto interno em espaos vetoriais complexos

Vamos agora definir produto interno em um espao vetorial sobre o corpo C dos nmeros
complexos. O corpo dos nmeros complexos formado pelo conjunto de pares ordenados
(a, b) de nmeros reais, no qual definimos duas operaes, uma de adio e outra de
multiplicao. Os elementos desse corpo so denominados nmeros complexos. Dois
nmeros complexos (a, b) e (c, d) so iguais quando a = c e b = d e se escreve (a, b) =
(c, d) para expressar esta igualdade. O a a parte real e o b a parte imaginria do
nmero complexo (a, b). Definimos as operaes de adio e de multiplicao de dois
nmeros complexos por
(a, b) + (c, d) = (a + c, b + d)
e
(a, b) (c, d) = (ac bd, ad + bc).
O sinal de multiplicao pode ser omitido e tanto (a, b) (c, d) quanto (a, b) (c, d) possuem
o mesmo significado. O nmero complexo (0, 1) denotado por i e denominado unidade
imaginria. Se denotarmos o nmero complexo (a, 0) simplesmente por a e vemos que
todo nmero complexo (a, b) pode ser escrito na forma a + bi. De fato,
(a, b) = (a, 0) + (b, 0)(0, 1) = a + bi

Notas de aula do Prof. Antonio Cndido Faleiros

63

e, a partir da, obtemos


(a + bi) + (c + di) = (a + c) + (b + d)i
e
(a + bi) (c + di) = (ac bd) + (ad + bc)i.
O sinal de multiplicao pode ser omitido e tanto (a + bi) (c + di) quanto (a + bi) (c + di)
possuem o mesmo significado. Com a notao introduzida que identifica o par (a, b) com
a + bi, os nmeros complexos a + bi e c + di so iguais se a = c e b = d e se escreve a + bi =
c + di para expressar esta igualdade. O nmero complexo z1 + z2 a soma de z1 e z2 . O
nmero complexo z1 z2 o produto de z1 e z2 .
O conjunto de todos os nmeros complexos com as operaes de adio e multiplicao
um corpo, denotado por C e denominado corpo dos nmeros complexos. O elemento
neutro da adio o 0 = 0+ 0i e o elemento neutro da multiplicao o 1 = 1+ 0i. O 0
denominado zero e 1 denominado de unidade. Se a+ bi for um nmero complexo,
ento seu inverso aditivo ou seu oposto, a + ( b)i e seu inverso multiplicativo
ou seu inverso,

b
a

i .
(a + bi)
a2 + b2 a2 + b2
que existe apenas quando a + bi for diferente de zero. O oposto de z denotado por z
e o inverso de z denotado por z 1 .
Definimos a subtrao z1 z2 de dois nmeros complexos z1 e z2 por
z1 z2 = z1 + (z2 )
e a diviso z1 /z2 , onde z2 6= 0, por
z1
= z1 z21 .
z2
Sendo z = a + bi um nmero complexo, onde
a eb so reais, z = a bi o seu
complexo conjugado e o nmero real |z| = zz = a2 + b2 o seu mdulo. Neste
caso, sendo z 6= 0, ento
z
z 1 =
zz
Exemplo 4.4 Se z = 3 + 4i, ento z = 3 4i e zz = (3 + 4i)(3 4i) = 25. Logo,
z 1 = (3 4i)/25.
Se z e w so nmeros complexos, valem as propriedades
z + w = z + w

zw = zw

1
1
z
= z .

64

Notas de aula do Prof. Antonio Cndido Faleiros

Vamos tentar definir um produto interno em Cn que mantenha as propriedades do


produto interno do Rn . Se x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) forem dois elementos de
Cn , ento, uma primeira tentativa seria
hx, yi = x1 y1 + + xn yn .
Entretanto, com esta definio a primeira propriedade hx, xi 0 falha pois hx, xi nem
sempre real. Uma correo possvel consiste em definir
hx, yi = x1 y1 + + xn yn
que agora satisfaz s propriedades 1 e 3 do produto interno em espaos vetoriais sobre os
reais. Entretanto, a propriedade 2 no satisfeita. Em seu lugar vale
hx, yi = hy, xi.
Aceitamos esta propriedade como uma consequncia inevitvel e com isto em mente definimos o produto interno em espaos vetoriais sobre o corpo dos nmeros complexos.
Seja V um espao vetorial sobre o corpo C dos nmeros complexos. Um produto
interno em V uma operao
h , i: V V C
com as propriedades abaixo, vlidas para todo v, w e z em V e todo a e b em C :
1. O produto interno positivo definido
hv, vi 0 e hv, vi = 0 se e s se v = 0.
2. O produto interno hermitiano
hv, wi = hw, vi.
3. O produto interno linear na segunda varivel
hv , aw + bz i = a hv, wi + b hv, zi .
A partir das propriedades 2 e 3, se conclui que
h av + bw , zi = a hv, zi + b hw, zi .
Se v, v1 , . . . , vp e w. w1 , . . . , wq forem vetores de V, se a1 , . . . , ap e b1 , . . . , bq forem
nmeros complexos, prova-se por induo que
*
+
X
X
v,
=
bj wj
bj hv, wj i
j

*
X
i

ai vi , w

X
i

ai hvi , wi

Notas de aula do Prof. Antonio Cndido Faleiros

65

e, juntando as duas proprieades,


+
*
XX
X
X
ai vi ,
bj wj =
a
i bj hvi , wj i .
i

Exemplo 4.5 Se x = [x1 , . . . , xn ]T e y = [y1 , . . . , yn ]T forem matrizes coluna em Cn1 ,


definimos x = [
x1 , . . . , xn ]. A operao hx, yi = x y, que leva duas matrizes coluna em
Cn1 em uma matriz complexa 1 1 um produto interno em Cn . Aqui identificamos [a],
uma matriz 1 1, com o nmero complexo a.
Exemplo 4.6 Seja V = {f : [a, b] C : f contnua}. Este conjunto com as operaes
de adio de funes de V e multiplicao de um nmero complexo por uma funo de
V um espao vetorial sobre o corpo dos nmeros complexos. Um produto interno neste
espao vetorial dado por
Z
L

hf, gi =

4.3

f (t)g(t) dt.

Funcional linear

Seja V um espao vetorial sobre um corpo C dos nmeros complexos. Uma transformao
linear f : V C recebe o nome de funcional linear em V.
Teorema 4.7 Seja V um espao vetorial sobre C, com dimenso finita e produto interno.
Dado um funcional linear f : V C. Ento existe um vetor w em V tal que f (v) =
hw, vi para todo v em V.
Prova. Seja {v1 , . . . , vn } uma base ortonormal de V. Decompondo v nesta base e
calculando f (v) obtemos
f (v) = f (a1 v1 + + an vn ) = a1 f (v1 ) + + an f (vn ) = hw, vi
onde w = f (v1 )v1 + + f (vn )vn .
Vamos mostrar que este vetor nico. Se houvesse outro vetor u tal que hv, wi =
hv, ui para todo v em V, ento hv, w ui = 0 para todo v. Tomando v = w u, segue
hw u, w ui = 0, mostrando que w = u.
O vetor w tal que f (v) = hw, vi para todo v em V pertence ao complemento ortogonal
do ker(f ) uma vez que f (v) = 0 implica em hw, vi = 0.
Toda transformao linear L de um espao vetorial complexo V de dimenso n em
Cm da forma
L(v) = ( f1 (v), . . . , fm (v) ),
onde fi um funcional linear em V. Dado um produto interno em V, existem w1 , . . . , wm
em V tais que
L(v) = ( hw1 , vi , . . . , hwm , vi ),

66

Notas de aula do Prof. Antonio Cndido Faleiros

4.4

Norma

Seja V um espao vetorial real ou complexo e v um vetor de V. A norma de v definida


por
p
kvk = hv, vi.
Se kvk = 1, diz-se que o vetor unitrio.
Para todo v e w em V e todo escalar a, as igualdades abaixo se verificam.
1. kvk 0 e kvk = 0 se e s se v = 0.
2. kavk = |a| kvk .
3. kv + wk kvk + kwk (Desigualdade triangular)
Para provar esta ltima desigualdade, devemos provar a desigualdade de CauchySchwarz. Lembramos que, se a e b so reais, a a parte real e b a parte imaginria do
nmero complexo a + bi. As notaes Re (a + bi) e Im (a + bi) so usadas para designar
as partes real e imaginria do nmero complexo a + bi. Observe que, se z for um nmero
complexo, ento 2Re (z) = z + z e 2Im (z) = z z.
As desigualdades abaixo so teis. Sendo z um nmero complexo,
Re (z) |Re (z)| |z|
Im (z) |Im (z)| |z| .
Teorema 4.8 Seja V um espao vetorial sobre o corpo C dos nmeros complexos onde
se definiu um produto interno. Sejam v e w dois vetores em V. Vale a desigualdade de
Cauchy-Schwarz
|hv, wi| kvk kwk .
Prova. Seja um nmero real qualquer. Ento
0
=
=

hv + w, v + wi = hv, vi + hv, wi + hw, vi + 2 hw, wi


kvk2 + hv, wi + hv, wi + 2 kwk2
kvk2 + 2Re hv, wi + 2 kwk2
kvk2 + 2 |hv, wi| + 2 kwk2

Como este polinmio real maior ou igual a zero para todo , seu discriminante =
4 |hv, wi|2 4 kvk2 kwk2 menor ou igual a zero, ou seja,
|hv, wi|2 kvk2 kwk2 .

Notas de aula do Prof. Antonio Cndido Faleiros

67

Esta desigualdade implica em


|hv, wi|
1
kvk kwk
para todo par de vetores v e w no nulos.
Seja V um espao vetorial sobre o corpo dos nmeros reais. A desigualdade de CauchySchwarz implica em
hv, wi
1
1
kvk kwk
o que motiva a definio de ngulo entre v e w, como sendo aquele nico nmero real ,
pertencente ao intervalo [0, ], para o qual
cos =

hv, wi
.
kvk kwk

Os vetores v e w so ortogonais quando = /2 ou hv, wi = 0, fato que ser indicado


pelo smbolo v w.
Quando estivermos em um espao vetorial sobre o corpo dos nmeros complexos, no
tem sentido definir ngulo entre vetores pois, neste caso, hv, wi pode ser um nmero
complexo. Entretanto diremos que dois vetores v e w em tal espao so ortogonais
quando hv, wi = 0 e usaremos o smbolo v w para designar este fato.
Se w for ortogonal a si mesmo, hw, wi = 0 e isto implica em w = 0. Se w for ortogonal
a todo elemento de V, ento ortogonal a si mesmo e w = 0. Se a dimenso de V for
finita e w for ortogonal a uma base de V, ento w = 0.
Um conjunto de vetores {v1 , . . . , vp } ortogonal quando seus elementos forem dois
a dois ortogonais entre si. Se alm disto, todos os vetores possurem norma unitria, o
conjunto ortonormal.
Teorema 4.9 Seja V um espao vetorial de dimenso n e S = {v1 , . . . , vn } um conjunto
ortogonal de vetores de V. Ento S uma base.
Prova. Basta provar que S linearmente independente. De fato, sejam k1 , . . . , kn
escalares tais que k1 v1 + + kn vn = 0. Como hvi , 0i = 0, obtemos
0 = hvi , 0i = hvi , k1 v1 + + kn vn i = ki hvi , vi i = ki kvi k2 .

Como kvi k 6= 0, segue que ki = 0, provando a independncia linear de S.


Seja {v1 , . . . , vn } uma base ortonormal de um espao vetorial V. Dado v = x1 v1 + +
xn vn neste espao, multiplicando-o internamente por vi , obtemos xi = hvi , vi e assim,
v = hv1 , vi v1 + + hvp , vi vp .
O prximo teorema apresenta a forma da matriz de mudana de bases quando as bases
envolvidas so ortonormais.
Seja A = [aij ] uma matriz complexa m n. A matriz A = [bij ] onde bij = aij a
matriz adjunta de A. Se A = A, a matriz A denominada hermitiana. Se A1 = A a
matriz A denominada unitria.

68

Notas de aula do Prof. Antonio Cndido Faleiros

Teorema 4.10 Sejam B1 e B2 bases ortonormais de um espao vetorial V sobre o corpo


C dos nmeros complexos. A matriz M12 de mudana da base B1 para a base B2
hermitiana e unitria.
Prova. Sejam B1 = {v1 , . . . , vn } e B2 = {w1 , . . . , wn } as bases em questo, M12 =
[aij ] e M21 = [bij ] as matrizes de mudana da base B1 para a base B2 e da base B2 para a
1
base B1 , respectivamente. Sabemos que M12
= M21 e que
X
X
wj =
aij vi
e
vj =
bij wi .
i

Sendo as bases ortonormais, aij = hvi , wj i = aji e bij = hwi , vj i = hvj , wi i = aji , mostrando
1

que M12
= M12 e M12
= M12
.
Exemplo 4.11 Consideremos as bases B1 = {e1 , e2 } e B2 = {f1 , f2 } do R2 , onde e1 =
(1, 0), e2 = (0, 1), f1 = (1/5)(3, 4) e f2 = (1/5)(4, 3). Ambas so ortonormais em
relao ao produto interno h(x1 , y1 ), (x2 , y2 )i = x1 x2 + y1 y2 . Temos
3
4
e1 + e2
5
5
4
3
e1 e2
=
5
5

f1 =
f1
e

3
4
f1 + f2
5
5
4
3
=
f1 f2 .
5
5

e1 =
e1
Assim

M12 = M21 =

3
5
4
5

4
5

35

a matriz identidade, mostrando que M12


A matriz M12 hermitiana e M12 M12
unitria.

4.5

Ortogonalizao de Gram-Schmidt

Podemos, a partir de uma base {v1 , . . . , vn } uma base de um espao vetorial V, obter
uma base ortogonal {w1 , . . . , wn } de V, seguindo o procedimento descrito em seguida e
conhecido como processo de ortogonalizao de Gram-Schmidt.
Defina
w1 = v1 .
Agora escreva
w2 = v2 12 w1

Notas de aula do Prof. Antonio Cndido Faleiros

69

e determine o escalar 12 para que a condio de ortogonalidade hw1 , w2 i = 0 seja satisfeita. Substitua w2 por v2 12 w1 nesta condio para obter
12 =

hw1 , v2 i
.
hw1 , w1 i

Em seguida, considere
w3 = v3 13 w1 23 w3
e determine 13 e 23 para tornar w3 ortogonal a w1 e w2 . Das condies de ortogonalidade
hw1 , w3 i = 0 e hw2 , w3 i = 0 calcule
13 =

hw1 , v3 i
hw1 , w1 i

23 =

hw2 , v3 i
.
hw2 , w2 i

Prosseguindo com este raciocnio, se chega a um conjunto ortogonal {w1 , . . . , wn } de


vetores que base de V. Observe que os vetores w1 , w2 , . . . , wn so definidos recursivamente
por
w1 = v1
e
wk = vk 1k w1 k1,k wk1
para k = 2, . . . , n, onde
ik =

hwi , vk i
.
hwi , wi i

A partir da base ortogonal {w1 , . . . , wn } pode-se determinar uma base ortonormal {q1 ,
. . . , qn }, onde qi = wi / kwi k . Esta base ortonormal pode ser obtida ao mesmo tempo em
que se obtm a base ortogonal. Comece com
w1 = v1

q1 = w1 / kw1 k

e continue com o processo de ortogonalizao, tomando


w2 = v2 r12 q1

w3 = v3 r13 q1 r23 q2

q2 = w2 / kw2 k ,
e

q3 = w3 / kw3 k ,

e assim por diante, at que, num passo genrico k,


wk = vk r1k q1 rk1,k qk1
onde
rik = hqi , vk i ,
para k = 2, . . . , n e i = 1, . . . , k 1.

qk = wk / kwk k ,

70

Notas de aula do Prof. Antonio Cndido Faleiros

Exemplo 4.12 Os ternos ordenados (1, 0, 0), (0, 3/5, 4/5), (0, 4/5, 3/5) formam uma
base ortonormal no espao vetorial Cn em relao ao produto interno
1 b1 + a2 b2 + a3 b3 .
h (a1 , a2 , a3 ), (b1 , b2 , b3 ) i = a
Exemplo 4.13 Os polinmios 1, x, x2 formam uma base ortonormal no espao vetorial
sobre C dos polinmios de grau menor ou igual a 2 e coeficientes complexos, munido com
o produto interno

a1 + a2 x + a3 x2 , b1 + b2 x + b3 x2 = a1 b1 + a
2 b2 + a3 b3 .

Exemplo 4.14 Considere o espao vetorial sobre C dos polinmios com coeficientes complexos de grau menor ou igual a 3, com o produto interno
Z 1
hf, gi =
f (x)g(x)dx.
1

O conjunto {1, x, x2 , x3 } uma base no ortogonal deste espao vetorial. A base ortogonal
obtida a partir dela, usando o procedimento de Gram-Schmidt,
{ 1, x, x2 1/3, x3 (3/5)x }.
Este procedimento pode ser estendido para o espao vetorial dos polinmios de grau
menor ou igual a n.
Denotemos por p0 (x), p1 (x), p2 (x), . . . os polinmios obtidos de 1, x, x2 , . . . pelo
processo de ortogonalizao de Gram-Schmidt, usando o produto interno definido acima.
Os polinmios Lk (x) = pk (x)/pk (1) continuam ortogonais dois a dois e so denominados
de polinmios de Legendre. Os quatro primeiros so
3
1
5
3
L0 (x) = 1, L1 (x) = x, L2 (x) = x2 , L3 (x) = x3 x.
2
2
2
2
Tanto {1, x, x2 , x3 } quanto {L0 (x), L1 (x), L2 (x), L3 (x)} so bases do espao dos polinmios
de grau menor ou igual a 3. A segunda possui a vantagem de ser ortogonal, o que a torna
mais adequada para determinados clculos. Os mtodos espectrais usam polinmios ortogonais para resolver equaes diferenciais parciais tanto analtica quanto numericamente.

4.6

Decomposio QR

Vamos analisar o caso especial do espao vetorial complexo Cn1 com o produto interno
hx, yi = x y.
Seja A = [v1 , . . . , vn ] uma matriz m n cujo coluna k vk . Um modo interessante
de olhar para o produto Ax, onde x = [x1 , . . . , xn ]T uma matriz em Cm1 consiste em
escrever
Ax = x1 v1 + + xn vn

Notas de aula do Prof. Antonio Cndido Faleiros

71

e observar que Ax uma combinao linear das colunas de A.


Mantendo a notao do pargrafo anterior, sendo b uma matriz coluna em Cm1 , a
igualdade matricial Ax = b, pode ser escrita na forma
b = x1 v1 + + xn vn
que pode ser interpretada do seguinte modo: x a matriz de b na base formada pelas
colunas de A. Se as colunas de A forem linearmente independentese b estiver na imagem
de A, a decomposio nica.
Ainda uma ltima observao, sendo A = [v1 , . . . , vn ], ento

v1

A = ...
vn

v1 vn
v2 vn
= [vi vj ] .

vn vn

v1 v1 v1 v2
v2 v1 v2 v2
A A =

vn v1 vn v2

Se {q1 , . . . , qn } for uma base ortonormal em Cn1 , ento qi qj = ij . A matriz quadrada


Q = [q1 , . . . , qn ], cuja coluna k qk , unitria pois Q Q = [qi qj ] = [ ij ] = I. Concluso,
quando as colunas de uma matriz quadrada formarem uma base ortonormal de Cn1 , ela
unitria.
Vamos iniciar com um caso particular, em que n = 3. Seja {v1 , v2 , v3 } uma base de
31
C
e {q1 , q2 , q3 } a base ortonormal de C31 obtida pelo processo de ortogonalizao
de Gram-Schmidt. Seja A = [v1 , v2 , v3 ] a matriz cuja coluna k vk e Q = [q1 , q2 , q3 ] a
matriz cuja coluna k qk . Sabemos, pelo desenvolvimento da seo anterior que
v1 = w1
v2 = r12 q1 + w2
v3 = r13 q1 + r23 q2 + w3
onde rik = hqi , vk i quando i 6= k ou ainda,
v1 = r11 q1
v2 = r12 q1 + r22 q2
v3 = r13 q1 + r23 q2 + r33 q3
com rkk = kwk k . Ento,

r33 r12 r13


[v1 , v2 , v3 ] = [q1 , q2 , q3 ] 0 r33 r23
0
0 r33

72

Notas de aula do Prof. Antonio Cndido Faleiros

ou A = QR, onde Q uma matriz unitria e

r33 r12 r13


R = 0 r33 r23
0
0 r33

triangular superior. Esta a chamada decomposio QR de uma matriz A,


Motivados por esse exemplo, vamos mostrar um processo para obter a decomposio
QR de uma matriz A em Cmn , analizando dois casos separadamente. No primeiro, todas
as colunas de A so linearmente independentes e, no segundo caso, nem todas as colunas
de A so linearmente independentes.
As colunas da matriz so linearmente independentes
Seja A = [v1 , . . . , vn ] uma matriz complexa de ordem m por n, cujas colunas v1 , . . . , vn
so vetores linearmente independentes de Cm1 , o que exige m n. Usando o processo
de ortogonalizao de Gram-Schmidt, podemos escrever obter uma matriz Q = [q1 , . . . ,
qn ] cujas colunas formam uma base ortonormal para o espao gerado pelas colunas de A
e onde
v1 = r11 q1
v2 = r12 q1 + r22 q2
v3 = r13 q1 + r23 q2 + r33 q3

Essas igualdades escritas na forma matricial resultam em

r11
0
[v1 , v2 , v3 , . . . , vn ] = [q1 , q2 , q3 , . . . , qn ]
0

que se resume em

r12 r13
r22 r23
0 r33

A=Q
denominada decomposio QR reduzida de A.
Nesta decomposio, observe que o espao hv1 i , gerado por v1 igual ao espao hq1 i
gerado por q1 , o espao hv1 , v2 i gerado por v1 e v2 igual ao espao hq1 , q2 i gerado por q1 ,
q2 , e assim por diante,
hq1 i = hv1 i ,
hq1 , q2 i = hv1 , v2 i ,
hq1 , q2 , q3 i = hv1 , v2 , v3 i ,
...

Notas de aula do Prof. Antonio Cndido Faleiros

73

Completemos a base {q1 , . . . , qn } com os vetores unitrios qn+1 , . . . , qm de modo que


{q1 , . . . , qn , . . . , qm } seja uma base ortonormal de Cm . A matriz Q = [q1 , . . . , qn , . . . , qm ]
e a matriz R obtida pela incluso
obtida pela incluso de m n colunas direita de Q
de m n linhas nulas na parte inferior de R so tais que
A = QR
que a chamada decomposio QR completa de A ou decomposio QR de A.
Realizado este desenvolvimento, podemos descrever o algoritmo clssico de GramSchmidt, que possibilita a obteno da decomposio QR de uma mariz A. Alertamos o
leitor de que este algoritmo numericamente instvel.
================================
Algoritmo 8.1. Algoritmo clssico de Gram-Schmidt (instvel)
Entrada: Base {v1 , . . . , vn } de Cn
Sada: Base ortonormal {q1 , . . . , qn } de Cn
================================
for k = 1 to n
wk = vk
for i = 1 to k 1
rik = qi vk
wk = wk rik qi
rkk = kwk k
qk = wk /rkk
================================
Soluo de Ax = b usando a decomposio QR
Quando A uma matriz quadrada de ordem m, cujas colunas so linearmente independentes, o sistema Ax = b possui uma nica soluo. Para resolver este sistema usando a
decomposio QR, procedemos do seguinte modo:
1. Calcule a decomposio A = QR.
2. Determine y = Q b.
3. Resolva o sistema Rx = y na varivel x.
As colunas da matriz so linearmente dependentes
Passemos ao caso em que m n e as colunas de A formam um conjunto linearmente
dependente. Neste caso, l pelas tantas, vk depende linearmente das colunas v1 , . . . , vk1 ,
sua esquerda, ou seja,
vk hv1 , . . . , vk1 i = hq1 , . . . , qk1 i

74

Notas de aula do Prof. Antonio Cndido Faleiros

e, para este valor de k,


wk = vk r1k q1 r2k q2 rk1,k qk1 = 0.
Quando isto ocorre, escolhemos um vetor unitrio qj , ortogonal aos vetores q1 , . . . , qj1 ,
obtendo um conjunto ortonormal {q1 , . . . , qj1 , qj }.
Vejamos um exemplo em que A = [v1 , v2 , v3 , v4 ]. Suponha que v1 e v2 so linearmente
independentes. Usando o mtodo de ortogonalizao de Gram-Schmidt, calculamos
v1 = r11 q1
v2 = r12 q1 + r22 q2
Supondo v3 no espao gerado por {q1 , q2 }, tem-se
w3 = v3 r13 q1 r23 q2 = 0
e
v3 = r13 q1 + r23 q2
Da, escolhe-se de modo arbitrrio um q3 unitrio, ortogonal a q1 e a q2 . Com esta escolha,
{q1 , q2 , q3 } ortonormal e o espao que ele gera contm o espao gerado por {v1 , v2 , v3 }.
Se v4 no pertencer ao espao gerado por {q1 , q2 , q3 }, Calcula-se
q4 =
quando ento

1
(v4 r14 q1 r24 q2 r34 q3 )
r44

r11 r12 r13


0 r22 r23
[v1 , v2 , v3 , v4 ] = [q1 , q2 , q3 , q4 ]
0
0
0
0
0
0

r14
r24

r34
r44

onde se observa que a matriz da direita triangular superior. Note-se que o espao gerado
por {q1 , q2 , q3 , q4 } contm o espao gerado por {v1 , v2 , v3 , v4 }.
e R.
As colunas
No caso genrico, este procedimento continua, at obter as matrizes Q
= [q1 , . . . , qn ], de ordem m por n, so vetores ortogonais entre si e possuem
da matriz Q
de ordem n por n, triangular superior. Para estas matrizes,
mdulo unitrio. A matriz R,
R.

A=Q
Esta fatorao de A conhecida como decomposio QR reduzida de A.
de modo que {q1 , . . . ,
Podemos acrescentar m n colunas qn+1 , . . . , qm direita de Q,
qn , . . . , qm } seja uma base ortonormal de Cm e assim, obter uma matriz unitria Q = [q1 ,
. . . , qn , . . . , qm ], de ordem m por m, cujas colunas formam uma base ortonormal de Cm .
obtendo
Na continuao, devemos acrescentar m n linhas nulas na parte inferior de R,
uma matriz R, de ordem m por n, triangular superior. As matrizes Q e R assim obtidas
so de tal forma que
A = QR.

Notas de aula do Prof. Antonio Cndido Faleiros

75

Esta a decomposio QR completa de A ou apenas decomposio QR de A.


Quando m < n, o procedimento semelhante ao anterior. A decomposio se encerra
quando obtemos o conjunto de m vetores B = {q1 , . . . , qm }, que formam uma base
ortonormal de Cm . A matriz quadrada Q = [q1 , . . . , qm ], de ordem m, e a matriz triangular
superior R de ordem m por n, obtidas no desenrolar do processo so tais que
A = QR.
Este produto conhecido como decomposio QR completa da matriz A ou decomposio
QR de A.
Exemplo 4.15 A decomposio QR de

1 3 0
1 0 1
0 1 2


1/ 2 3/22 1/11
2 3/ 2 1/ 2
1/ 2 3/ 22 1/ 11 0 11/ 22 7/ 22 .

0
2/ 22 3/ 11
0
0
5/ 11

Exemplo 4.16 A decomposio QR de

1 3
1 0
0 1



1/ 2 3/22 1/11
2 3/
2
p
1/ 2 3/ 22 1/ 11 0
11/2
p

0
0
2/11 3/ 11
0

1 1 2
0 1 1

Exemplo 4.17 A decomposio QR de


1 0 1
0 2 0


1/ 2 1/22
2/33
3/ 3
2 1/ 2 3/ 2
0

2/ 22
4/ 33 3/3
0 1/ 22 3/22

1/ 2 1/ 22 2/ 33 3/ 3 0
0
6/ 33

0
0
0
0
4/ 22 3/ 33
0

Exemplo 4.18 A decomposio QR de

1
0

1
0

1
1
0
0

2
1

1
0

76

1/ 2 1/6 1/ 3
0
2/ 6 13

1/ 2 1/ 6 1 3
0
0
0

Notas de aula do Prof. Antonio Cndido Faleiros



0
2 1/2 3/2

0
0 3/ 6 3/ 6

0
0
0
0
0
0
0
1

Exemplo 4.19 A decomposio QR de

1 1 2 0
0 1 1 1
1 0 1 3

A = QR, onde



1/ 2 1/6
1/ 3
Q = 0
2/ 6 1/3
1/ 2 1/ 6 1/ 3



2 1/2 3/2 3/ 2
R = 0 3/ 6 3/ 6 1/6 .
0
0
0
4/ 3

Captulo 5
Soma de subespaos
Sejam V1 , . . . , Vk subespaos vetoriais de V. O conjunto
V1 + + Vk = { v1 + + vk : vi Vi para i = 1, . . . , k }
um subespao vetorial de V e recebe o nome de soma de V1 , . . . , Vk .
Teorema 5.1 Sejam V e W dois subespaos de um espao vetorial U. Ento
dim(V + W ) = dim(V ) + dim(W ) dim(V W ).
Prova. Quando V est contido em W, ento V W = V e V + W = W. Neste caso,
dim(V ) + dim(W ) dim(V W ) = dim(V ) + dim(W ) dim(V ) = dim(W )
o que prova o teorema para este caso particular. Do mesmo modo se prova que o teorema
vale quando W est contido em V.
Vamos agora tratar o caso em que V W diferente de V e de W. Seja B1 = {u1 , . . . ,
up } uma base de V W. Vamos complet-la de modo que B2 = {u1 , . . . , up , v1 , . . . , vq }
seja base de V e B3 = {u1 , . . . , up , w1 , . . . , wr } seja base de W. O conjunto B4 = {u1 ,
. . . , up , v1 , . . . , vq , w1 , . . . , wr } gera V + W e, se for linearmente independente, ser base
de V + W. Neste caso,
dim(V + W ) = p + q + r = (q + p) + (r + p) p
= dim(V ) + dim(W ) dim(V W )
e o teorema estar provado.
Falta provar que B4 linearmente independente. Vamos mostrar que, se x1 , . . . , xp ,
y1 , . . . , yq , z1 , . . . , zr forem escalares tais que
x1 u1 + + xp up + y1 v1 + + yq vq + z1 w1 + + zr wr = 0,
ento todos eles so nulos. Analisemos esta possibilidade. Se algum yj for diferente de
zero, o vetor no nulo y1 v1 + + yq vq seria uma combinao linear dos elementos de
77

78

Notas de aula do Prof. Antonio Cndido Faleiros

B3 . Logo, ele estaria em W e em V ao mesmo tempo, estando na interseo V W


e assim y1 v1 + + yq vq poderia ser escrito como uma combinao linear de u1 , . . . ,
up , contrariando a hiptese de B2 ser base. Do mesmo modo no podemos ter um zk
diferente de zero. Logo, yj e zk so todos nulos e a equao se reduz a x1 u1 + + xp up =
0. Sendo B1 uma base, conclumos que x1 , . . . , xp so todos nulos. Da B4 linearmente
independente.

5.1

Soma direta

Definio 5.2 Sejam V1 , . . . , Vk subespaos vetoriais de V. Se todo v em V puder ser


escrito de forma nica como uma soma do tipo
v = v1 + + vk
onde vi Vi , diremos que V uma soma direta dos subespaos V1 , . . . , Vk e escreveremos
V = V1 Vk .
Se V = V1 V2 , ento V1 e V2 so denominados complementares.
Dois subespaos vetoriais V1 e V2 de V so disjuntos se a interseo V1 V2 contiver
apenas o zero.
Teorema 5.3 Sejam V1 e V2 subespaos vetorias de V tais que V = V1 + V2 . Ento V =
V1 V2 se e s se V1 , V2 forem disjuntos.
Prova. Se V = V1 V2 , seja v um vetor de V na interseo de V1 e V2 . Ento
0 = |{z}
0 + |{z}
v
v = |{z}
v + |{z}
V1

V2

V1

V2

e, como a decomposio nica, v = 0, provando que V1 e V2 so disjuntos.


Se V1 e V2 forem disjuntos, como V = V1 + V2 , todo v em V pode ser decomposto
numa soma v = v1 + v2 , com v1 em V1 e v2 em V2 . Se houvesse outra decomposio v =
w1 + wk , com w1 em V1 e w2 em V2 , ento v1 + v2 = w1 + w2 e assim, v1 w1 = w2
v2 . Sendo v1 w1 um vetor de V1 igual a w2 v2 , um vetor de V2 , ento v1 w1 est na
interseo de V1 com V2 e, como estes dois subespaos so disjuntos, v1 w1 = 0 ou v1 =
w1 . Com este resultado, obtemos w2 v2 = 0 ou v2 = w2 , provando que a decomposio
de v numa soma de um elemento de V1 com um elemento de V2 nica e assim, V = V1
V2 .
Quando V igual soma de mais do que dois subespaos, o fato de os espaos envolvidos
serem disjuntos dois a dois no suficiente para garantir que V seja a soma direta desses
subespaos como nos mostra o exemplo a seguir.

Notas de aula do Prof. Antonio Cndido Faleiros

79

Exemplo 5.4 Seja V = R2 e V1 = {(x, 0) R2 : x R}, V2 = {(0, y) R2 : y R},


V3 = {(x, x) R2 : x R}. Estes trs subespaos so disjuntos dois a dois, V = V1 +
V2 + V3 , mas V no a soma direta de V1 , V2 e V3 .
A condio de serem disjuntos ser substituida pela condio de serem independentes.
Os subespaos vetoriais V1 , . . . , Vk de V so independentes se
v1 + + vk = 0,
com vi em Vi , para i = 1, . . . , k, ento v1 = = vk = 0.
Uma caracterizao da independncia dos subespaos a seguinte: Os subespaos V1 ,
. . . , Vk so independentes se e s se Vj for disjunto da soma V1 + + Vj1 , para j = 2,
. . . , k. Dois espaos vetoriais V1 e V2 de V so independentes se e s se forem disjuntos.
Teorema 5.5 Sejam V1 , . . . , Vk subespaos vetoriais de um espao vetorial V tais que
V = V1 + + Vk . Ento V = V1 Vk se e s se V1 , . . . , Vk forem independentes.
Prova. Se V = V1 Vk , sejam v1 , . . . , vk vetores de V1 , . . . , Vk , respectivamente,
e tais que v1 + + vk = 0. Como 0 = 0+ + 0, da unicidade da decomposio,
conclumos que vi = 0 para i = 1, . . . , k. Logo, V1 , . . . , Vk so independentes.
Se V = V1 + + Vk e V1 , . . . , Vk forem independentes, todo v em V pode ser
decomposto numa soma v = v1 + + vk , com vi em Vi , para i = 1, . . . , k. Se houvesse
outra decomposio v = w1 + + wk , com wi em Vi , ento (v1 w1 )+ + (vk wk ) =
0 e, da independncia dos subespaos vetoriais Vi , conclumos que vi = wi , para i = 1,
. . . , k. Logo, a decomposio de v como soma de vetores de V1 , . . . , Vk nica e V = V1
Vk .

Teorema 5.6 Sejam V1 , . . . , Vk subespaos vetoriais de V, um espao vetorial com dimenso finita. Se V = V1 Vk ento
dim V = dim V1 + + dim Vk .
Prova. Seja Bi base de Vi para i = 1, . . . , k.
Se V = V1 Vk , todo v em V pode ser decomposto de forma nica numa soma
v = v1 + + vk , com vi em Vi , para i = 1, . . . , k. Cada vi pode ser decomposto de
forma nica nos vetores da base Bi . Logo, v pode ser escrito de forma nica como uma
combinao linear dos vetores da unio B1 Bk , provando que esta uma base de
V.

80

Notas de aula do Prof. Antonio Cndido Faleiros

5.2

Complemento ortogonal

Definio 5.7 Seja V um espao vetorial com produto interno e S um subespao vetorial
de V. O conjunto
S = {v V : hv, si = 0 para todo s em S }
um subespao de V, chamado de complemento ortogonal de S.
Para mostrar que um determinado vetor v est em S , basta mostrar que ele ortogonal a todo vetor de uma base de S. O nico vetor que est ao mesmo tempo em S e em
S o vetor nulo e da,
S S = {0}.
Teorema 5.8 Seja S um subespao vetorial de dimenso finita de um espao vetorial V
com produto interno. Ento V = S S .
Prova. Seja {v1 , . . . , vp } uma base ortonormal de S. Dado qualquer v em V, o vetor
w = v hv1 , vi v1 hvp , vi vp
ortogonal a todo vetor de S. Desta forma, qualquer vetor v pode ser decomposto numa
soma v = s+ w, onde s = hv1 , vi v1 + + hvp , vi vp pertence a S e w pertence a S e
assim, V = S+ S .
Vamos mostrar que esta decomposio nica. Se v = s1 + w1 , com s1 em S e w1 em

S , ento s + w = s1 + w1 e assim, s s1 = w1 w, mostrando que os vetores s s1 e


w1 w esto na interseo S S . Como a interseo s possui o vetor nulo, s = s e w =
w.
Se v um vetor de um subespao S de um espao vetorial V, ento v ortogonal

a todo vetor de S e assim ele pertence ao S , mostrando que S est contido no

complemento ortogonal do complemento ortogonal de S, isto , S S . Por outro


lado, V = S S = S S e assim, dim V = dim S+ dim S = dim S + dim S ,


que acarreta na igualdade dim S = dim S . Estando S contido em S e possuindo
ambos a mesma dimenso, eles so iguais

= S.
S

Captulo 6
Transformao adjunta
Sejam V e W espaos vetoriais complexos com dimenso finita e produto interno. Dado
uma tansformao linear L : V W, vamos mostrar que existe uma nica transformao
linear L : W V tal que
hLv, wi = hv, L wi .

para todo v em V e w em W.
Primeiro a existncia. Sendo B1 = {v1 , . . . , vn } uma base ortonormal de V e B2 =
{w1 , . . . , wm } uma base ortonormal de W podemos escrever Lvj , para j = 1, . . . , n, como
uma combinao linear dos elementos de B2
Lv1 = a11 w1 + a21 w2 + + am1 wm
Lv2 = a12 w1 + a22 w2 + + am2 wm

Lvn = a1n w1 + a2n w2 + + amn wm


Para definir uma transformao linear, basta estabelecer seu valor nos elementos de uma
base do seu domnio. Seja L : W V aquela transformao linear que leva wi , para i =
1, 2, . . . , m, nos seguintes vetores de V
L w1 = a
11 v1 + a12 v2 + + a1n vn

L w2 = a
21 v1 + a22 v2 + + a2n vn

m1 v1 + am2 v2 + + a
mn vn
L wm = a
Usando o smbolo de somatrio, os valores das transformaes lineares L e L nas bases
de seus respectivos domnios se escrevem
Lvj =
L wi =

m
X
i=1
n
X
j=1

81

aij wi
aij vj .

82

Notas de aula do Prof. Antonio Cndido Faleiros

Da ortonormalidade das bases B1 e B2 , segue hLvj , wi i = hvj , L wi i fazendo com que


hLv, wi = hv, L wi
para todo v em V e w em W, o que prova a existncia.
Agora a unicidade. Se T : W V for outra transformao linear para a qual
hLv, wi = hv, T wi
para todo v em V e w em W, ento
hv, L wi = hv, T wi
ou
hv, (L T )wi = 0

ainda para todo v em V e w em W. Fazendo v = (L T )w, obtemos


h (L T )w, (L T )w i = 0
ou (L T )w = 0 para todo w em W, mostrando que T = L , o que prova a unicidade.
A transformao linear L recebe o nome de transformao adjunta de L.
Se L : V W e T : W U forem duas transformaes lineares, ento
(T L) = L T .
Se A = [aij ] for a matriz de L : V W e B = [bij ] for a matriz de L : W V nas
bases ortonormais B1 e B2 de V e W, respectivamente, ento bij = aji e
B = A .
Esta relao entre as matrizes de L e L s se verifica se as bases forem ortonormais, como
nos mostra o prximo exemplo.
Este conceito de transformao adjunta se aplica a transformaes lineares entre espaos vetoriais reais. Neste caso, os escalares sero reais e a
ij = aij e
Exemplo 6.1 Seja L(x, y) = (2x + 3y, 5x + 7y, 11x + 13y) uma transformao linear do
R2 no R3 . Consideremos nestes dois espaos seus respectivos produtos internos euclidianos
h (x1 , y1 ), (x2 , y2 ) i = x1 x2 + y1 y2
e
h (x1 , y1 , z1 ), (x2 , y2 , z2 ) i = x1 x2 + y1 y2 + z1 z2 .

Seja B1 = {e1 , e2 } a base cannica do R2 e B2 = (f1 , f2 , f3 ) a base cannica do R3 que so


ortonormais em relao aos produtos internos euclidianos de R2 e R3 , respectivamente.
Temos
Le1 = 2f1 + 5f2 + 11f3
Le2 = 3f1 + 7f2 + 13f3

Notas de aula do Prof. Antonio Cndido Faleiros

83

e
L f1 = 2e1 + 3e2
L f2 = 5e1 + 7e2
L f3 = 11e1 + 13e2
de modo que
[L]12

2 3
= 5 7 ,
11 13

[L ]21 =

2 5 11
3 7 13

onde uma a transposta da outra.


Entretanto, se v1 = (1, 2), v2 = (0, 1), w1 = (1, 1, 1), w2 = (0, 1, 2) e w3 = (0, 0, 1)
ento B3 = {v1 , v2 } ser base de R2 e B4 = {w1 , w2 , w3 } ser base de R3 . Nenhuma das
duas ortonormal em relao ao produto interno euclidiano do R2 e R3 . O leitor poder
verificar que
Lv1 = 8w1 + 11w2 + 7w3
Lv2 = 3w1 + 4w2 + 2w3
e
L w1 = 18v1 13v2
L w2 = 27v1 21v2
L w3 = 11v1 9v2
As matrizes
[L]34

8 3
= 11 4
7 2

[L ]43 =

18
27 11
13 21 9

no so mais uma a adjunta da outra.


Dada a transformao linear L, a transformao adjunta L a nica que satisfaz
igualdade hLv, wi = hv, L wi para todo v em V e todo w em W. De fato, se T for
outra transformao linear para a qual hLv, wi = hv, T wi para todo v e todo w, ento
hv, T wi = hv, L wi e hv, T w L wi = 0 para todo v o que acarreta na igualdade T w =
L w para todo w, nos conduzindo igualdade T = L .
Para todo v em V e w em W, tem-se
hL w, vi = hv, L wi = hLv, wi = hw, Lvi ,
mostrando que a adjunta da adjunta igual a L, isto ,
(L ) = L.
Um operador linear L : V V auto-adjunto quando L = L.
Os operadores LL e L L so auto-adjuntos.

84

Notas de aula do Prof. Antonio Cndido Faleiros

Exemplo 6.2 Sejam x = (x1 , x2 , x3 ) e y = (y1 , y2 , y3 ) dois pontos do R3 , consideremos o


produto interno hx, yi = x1 y2 + x2 y2 + x2 y3 . Em relao a este produto interno, o operador
linear L : R3 R3 definido por L(x, y, z) = (2x+ 3y+ 5z, 3x+ y, 5x+ 4z) auto-adjunto
pois L = L.
Teorema 6.3 Sejam V e W espaos vetoriais com produto interno e L : V W linear.
Sendo L : W V a adjunta de L, vale a relao
Im (L) = ker(L ).
Prova. Se w Im (L) , ento hLv, wi = 0 ou hv, L wi = 0 para todo v V de onde
se conclui que L w = 0 mostrando que w est no ker(L ).
Reciprocamente, se w ker(L ), ento hLv, wi = hv, L wi = hv, 0i = 0 para todo
v V, provando, deste modo, que w ortogonal a todo elemento da imagem de L.
Conclui-se que w pertence ao complemento ortogonal da Im (L).
Como L = L, substituindo L por L na igualdade acima, segue
Im (L ) = ker(L)
ou
Im (L ) = ker(L)
Sejam V e W espaos vetoriais com produto interno e L : V W linear. Sendo
L : W V a adjunta de L,
V = ker(L) Im (L ).
Esta igualdade ocorre porque V = ker(L) ker(L) = ker(L) Im (L ).
Quando L auto-adjunta,
Im (L) = ker(L).
Teorema 6.4 Sejam V e W espaos vetoriais com produto interno e L : V W linear.
Sendo L : W V a adjunta de L,
1. Im (L) = Im (LL ).
2. ker(L ) = ker(LL ).
Prova. 1a. Inicialmente provaremos que Im LL Im L. Se w Im (LL ), ento
existe um w1 tal que w = LL w1 = L(L w1 ) provando que w Im (L).
1b. Vamos provar agora que Im (L) Im (LL ). Se w Im (L), ento w = Lv para
algum v em V. Podemos escrever de modo nico v = v1 + v2 onde v1 Im (L ) e v2
ker(L). Logo w = Lv = Lv1 + Lv2 = Lv1 . Como v1 ker(L) = Im (L ), existe w1 tal que
v1 = L w1 e assim w = LL w1 , mostrando que w Im (LL ), o que completa a prova da
recproca.

Notas de aula do Prof. Antonio Cndido Faleiros

85

2a. Se w ker(L ) ento L w = 0 e, em consequncia, LL w = 0, provando que


ker(L ) ker(LL ).
2b. Se w ker(LL ) ento L(L w) = 0 e L w pertence ao ker(L) e Im (L ) cuja
interseo contm apenas o zero. Logo, L w = 0, provando que w est no ker(L ). Com
isto, provamos que ker(LL ) ker(L ), o que completa a prova da parte 2 do teorema.

Resumindo: Para uma transformao linear L : V W e sua adjunta L : W V


valem as identidades
(L )
Im (L )
Im (LL )
ker(LL )

=
=
=
=

L
ker(L)
Im (L),
ker(L ).

Definio 6.5 Seja V um espao vetorial com produto interno. O operador linear L :
V V antiadjunto quando L = L e unitrio quando L = L1 .
Teorema 6.6 Numa base ortonormal, a matriz A = [aij ] de um operador auto-adjunto
hermitiana (A = A ), a de um operador antiadjunto antihermitiana (A = A ) e a
de um operador unitrio unitria (A = A1 ).
Teorema 6.7 O operador linear L : V V unitrio se e s se, para todo v1 e v2 em
V,
hLv1 , Lv2 i = hv1 , v2 i .
Para fixar a nomenclatura, apresentamos o quadro abaixo.
Espao Real
Espao Complexo
Operador
Matriz
Operador
Matriz
auto-adjunto simtrica
auto-adjunto hermitiana
antiadjunto
anti-simtrica antiadjunto
antihermitiana
ortogonal
ortogonal
unitrio
unitria

6.1

Posto de uma transformao linear

Definio 6.8 Sejam V e W espaos vetoriais e L : V W uma transformao linear.


A dimenso da imagem de L chamada de posto de L.
Sendo A uma matriz complexa de ordem m por n. Considerada como uma transformao linear de Cn em Cm , seu posto igual ao nmero de colunas linearmente
independentes que A possui.
O nmero de colunas linearmente independentes de uma matriz igual ao nmero de
suas linhas linearmente independente.

86

Notas de aula do Prof. Antonio Cndido Faleiros

Teorema 6.9 Sejam V e W espaos vetoriais de dimenso finita e L : V W uma


transformao linear. Seja A a representao matricial de L em relao a bases de V e
de W. O posto de L igual ao posto de A.
Exemplo 6.10 Seja L : R3 R3 definida por
L(x, y, z) = ( x + 2y z, 2x + 4y 2z, y + 2z )
= (x + 2y z)(1, 2, 0) + (y + 2z)(0, 0, 1),
cujo posto 2. A matriz de L em relao

A= 2
0

base cannica do R3

2 1
4 2
1 2

a primeira e terceira linha so linearmente independentes e a segunda o dobro da


primeira. As duas primeiras colunas so linearmente independentes e a terceira igual a
5 vezes a primeira mais 2 vezes a segunda. O posto de A dois.

Teorema 6.11 Sejam V e W espaos vetoriais com produto interno e dimenso finita.
Seja L : V W linear. O posto das transformaes lineares L, L , L L e LL so iguais.
Prova. Sabemos que
de onde obtemos

V = ker(L) Im (L ),
dim ker(L) + dim Im (L ) = dim V.

Por outro lado,


dim ker(L) + dim Im (L) = dim V.
Dessas duas igualdades conclumos que dim Im (L ) = dim Im (L) provando que o posto
de L igual ao posto de L .
Como Im (LL ) = Im (L) e Im (L L) = Im (L ), o teorema est provado.
Corolrio 6.12 Seja A uma matriz complexa. As matrizes A, A , AA e A A possuem
o mesmo posto.
Sejam V e W espaos vetoriais, ambos com dimenso finita. A imagem de uma
transformao linear L : V W est contida em W. Portanto, o posto de L deve ser
menor ou igual do que a dimenso de W. Se {v1 , . . . , vn } for uma base de V, qualquer
vetor v em V pode ser decomposto de modo nico como uma combinao linear v =
x1 v1 + + xn vn e assim, Lv = L(x1 v1 + + xn vn ) = x1 Lv1 + + xn Lvn , mostrando
que {Lv1 , . . . , Lvn } gera a imagem de L o que assim o posto de L deve ser menor ou
igual do que a dimenso de V. Conclumos que o posto de L no pode ser maior do que
a dimenso de V nem maior do que a dimenso de W. Motivados por este comentrio,
diremos que L tem posto mximo quando o posto de L for igual ao mnimo entre a
dimenso de V e a dimenso de W.

Notas de aula do Prof. Antonio Cndido Faleiros

87

Teorema 6.13 Sejam V e W espaos vetoriais com dimenso finita, ambos com produto
interno. Seja L : V W uma transformao linear com posto mximo.
1. Quando dim V dim W, a transformao linear L L : V V um isomorfismo.
2. Quando dim W dim V, a transformao linear LL : W W um isomorfismo.
Prova. Quando
1. posto(L) = dim V dim W, ento dim Im (L L) = dim Im (L) = dim(V ) e assim
L L sobrejetora e, portanto, um isomorfismo.
2. posto(L) = dim W dim V, ento dim Im (LL ) = dim Im (L ) = dim(W ) e assim
LL sobrejetora e, portanto, um isomorfismo.

6.2

Existncia de soluo dos sistemas lineares

As igualdades Im (L) = ker(L ) e Im (L ) = ker(L) possuem uma consequncia interessante para sistemas de equaes lineares Ax = b, onde A uma matriz complexa m n
e b uma matriz complexa m 1. Nestes sistemas, as matrizes A e b so dadas e o que
se deseja determinar se existem matrizes coluna complexas x de tamanho n 1 tais
que Ax = b. Tais matrizes x so denominadas solues do sistema Ax = b. Existindo
solues, importante determin-las. Um mtodo usado na obteno das solues o da
eliminao de Gauss.
A matriz A uma transformao linear de Cn1 em Cm1 .
O sistema Ax = b tem soluo se e s se b estiver na imagem de A. Da igualdade
Im(A) = ker(A ) conclmos que Ax = b tem soluo se e s se b for ortogonal a todo y
no ncleo de A isto ,
hb, yi = 0

para todo y em Cm1 soluo do sistema homogneo A y = 0.


O sistema homogneo Ax = 0 tem soluo x no nula se e s se x pertencer ao ncleo
de A. Da igualdade ker(A) = Im(A ) , conclumos que x soluo do sistema homogneo
Ax = 0 se e s se x for ortogonal imagem de A , isto hx, A yi = para todo y em Cm1 .
Percebe-se do comentado acima que h uma estreita relao entre os sistemas lineares
Ax = b e A y = c.

88

Notas de aula do Prof. Antonio Cndido Faleiros

Captulo 7
Projetores
Seja V um espao vetorial. Um operador linear P : V V um projetor em V se
P 2 = P. Sendo I : V V o operador identidade, o operador linear I P tambm um
projetor, denominado projetor complementar de P. Os projetores tambm recebem o
nome de operadores idempotentes.
Sejam S1 e S2 dois subespaos de V tais que V = S1 S2 . Considere o operador
P : V V definido por P (v1 + v2 ) = v1 , para todo v1 em S1 e v2 em S2 . O operador
assim definido um projetor, denominado projetor sobre S1 ao longo de S2 . Sob estas
condies, S1 a imagem de P e S2 o ncleo de P.
Se v estiver na imagem de P, ento existe w em V tal que P w = v. Sendo P uma
projeo, P 2 w = P w o que implica em P v = v. A imagem de (I P ) igual ao ncleo
de P e a imagem de P igual ao ncleo de I P.
Teorema 7.1 Seja P : V V um projetor. Ento V = Im (P ) ker(P ).
Prova. (1) Seja v um vetor em V. Podemos escrever v = P v+ (I P )v. Como P v
est na imagem de P e (I P )v est no ncleo de V, segue V = Im (P )+ ker(P ).
(2) Se v1 na Im (P ) e v2 no ker(P ) forem tais que v = v1 + v2 , ento P v = P v1 + P v2 .
Como P v1 = v1 e P v2 = 0, segue P v = v1 e (I P )v = v2 , mostrando que a decomposio
de v numa soma de um elemento da Im (P ) com um elemento do ker(P ) nica. Logo,
V = Im (P ) ker(P ).
De acordo com este teorema, todo projetor P um projetor sobre sua imagem ao
longo do seu ncleo.

7.1

Projetores ortogonais

Seja V um espao vetorial com produto interno. Um projetor P em V ortogonal se a


sua imagem e seu ncleo forem ortogonais. Quando este for o caso, se diz que P projeta
ortogonalmente sobre sua imagem.
89

90

Notas de aula do Prof. Antonio Cndido Faleiros

Seja P : V V um projetor ortogonal e S sua imagem. Se a dimenso de S for finita,


V = S S . Dado v em V, existe um nico s em S e um nico w em S para os quais
v = s+w e
P (v) = s.
Se B = {q1 , . . . , qk } for uma base ortonormal de S, podemos decompor P v nesta base e
escrever
P v = x1 q1 + + xk qk .
Para determinar x1 , . . . , xk , usamos o fato de v P v ser ortogonal a todo vetor de S. Isto
significa que hqi , v P vi = 0 para i = 1, . . . , k. Destas relaes e da ortonomalidade da
base B segue
0 = hqi , v P vi = hqi , vi hqi , x1 q1 + + xk qk i
= hqi , vi x1 hqi , q1 i xi hqi , qi i xk hqi , qk i
= hqi , vi xi hqi , qi i = hqi , vi xi
ou
xi = hqi , vi
o que nos permite escrever
P v = hq1 , vi q1 + + hqk , vi qk .
e provamos o prximo teorema.
Teorema 7.2 Seja S um subespao de dimenso finita de um espao vetorial V com produto interno. Seja {q1 , . . . , qk } uma base ortonormal de S. Se P for o projetor ortogonal
sobre S, ento, para todo v em V,
P v = hq1 , vi q1 + + hqk , vi qk .
A partir deste teorema obtemos outro de imediato para projetores em Cn1 . Vamos
lembrar que toda transformao linear L de Cn1 em Cn1 do tipo L(x) = Ax, onde A
uma matriz quadrada n n e iremos identificar a transformao linear L com a matriz
A. Se P for uma projeo em Cn1 , ento P ser uma matriz n n.
Corolrio 7.3 Considere o espao vetorial Cn1 com o produto interno hx, yi = x y.
Seja P um projetor ortogonal em Cn1 e {q1 , . . . , qk } uma base ortonormal da imagem
de P. Ento
P = q1 q1 + + qk qk .
Prova. Observe que q1 , q2 , . . . , qk so matrizes coluna do Cn1 . Sendo x uma matriz
coluna em Cn1 , podemos escrever
hqi , xi qi = (qi x)qi = qi (qi x) = (qi qi )x

Notas de aula do Prof. Antonio Cndido Faleiros

91

e assim,
P x = hq1 , xi q1 + + hqk , xi qk
= (q1 q1 )x + + (qk qk )x
= (q1 q1 + + qk qk ) x.
Como esta igualdade vale para todo x,
P = q1 q1 + + qk qk .

Quando P projeta ortogonalmente sobre o espao gerado por um nico vetor unitrio
q, temos
P = qq .
Se x for uma matriz coluna no nula em Cn1 , no necessariamente unitrio, ento q =
x/ kxk unitrio e a projeo ortogonal P sobre o espao gerado por x
xx
x x
= .
P = qq =
kxk kxk
xx

Vamos relembrar que, sendo x uma matriz coluna do Cn1 , ento x x um nmero real
e xx uma matriz complexa n por n.
O projetor complementar de P
I

xx
,
x x

onde I a matriz identidade n n e sua imagem o ncleo de P.


Teorema 7.4 Seja V um espao vetorial com dimenso finita e um produto interno. Um
projetor P : V V ortogonal se e s se for auto-adjunto.
Prova. (1) Seja P uma projeo ortogonal e S = Im (P ). Ento P uma projeo
sobre S ao longo de S . Sabemos que V = S S e, para todo v e w em V, existem e
so nicos v1 e w1 em S, v2 e w2 em S para os quais, v = v1 + v2 e w = w1 + w2 . Assim,
da ortogonalidade dos vetores,
hP v, wi = hv1 , w1 + w2 i = hv1 , w1 i
e
hv, P wi = hv1 + v2 , w1 i = hv1 , w1 i
provando que P auto-adjunto.
(2) Seja P uma projeo auto-adjunta de modo que
hP v, wi = hv, P wi

92

Notas de aula do Prof. Antonio Cndido Faleiros

para todo v e w em V. Se w estiver no ker(P ), ento


hP v, wi = hv, P wi = hv, 0i = 0,
e, como P v est na imagem de P, provamos que o ncleo e a imagem de P so ortogonais.
Logo, P um projetor ortogonal.
Teorema 7.5 Seja V um espao vetorial com produto interno e P : V V um projetor
ortogonal. O vetor P v o vetor da Im (P ) mais prximo de v.
Prova. Todo vetor u da imagem de P pode ser escrito na forma P v+ w, com w na
imagem de P. Assim, v P v pertence ao ker(P ) que ortogonal Im (P ) e acarretando
na ortogonalidade hv P v, wi = 0 e
kv uk2 = kv P v wk2 = hv P v w, v P v wi
= hv P v, v P vi hv P v, wi hw, v P vi + hw, wi
= kwk2 + kv P vk2 kv P vk2
provando que P v o ponto da imagem de P mais prximo de v.

7.2

Projetores ortogonais em Cm1

Nesta seo vamos considerar o espao vetorial Cm1 com o produto interno hx, yi = x y.
Usando uma base ortonormal
Seja P um projetor ortogonal em Cm1 e S sua imagem. Sendo P ortogonal, seu ncleo
S . Seja {q1 , . . . , qn } uma base ortonormal de S e {qn+1 , . . . , qm } uma base ortonormal
de S . Pelas propriedades provadas para uma projeo ortogonal P,
P qi = qi
P qi = 0

para
para

i = 1, . . . , n
i = n + 1, . . . , m

Seja
Q = [ q1 , . . . , qn , qn+1 , . . . , qm ]
a matriz cujas colunas so os vetores da base ortonormal {q1 , . . . , qn , qn+1 , . . . , qm } do
Cm1 e para a qual
P Q = Q,
onde uma matriz quadrada m m, onde os n primeiros elementos da diagonal so
iguais a 1 e todos os demais elementos so nulos. Podemos escrev-la usando blocos

I 0
=
0 0

Notas de aula do Prof. Antonio Cndido Faleiros

93

onde I a matriz identidade de tamanho n n. A matriz Q unitria pois suas colunas


so formadas a partir de uma base ortonormal de Cm1 . Sendo QQ a matriz identidade,
chega-se a
P = QQ .
Observe que apenas as n primeiras colunas de Q so relevantes neste produto. Eliminando = [q1 , . . . , qn ] com m linhas e n colunas para a qual
as obtemos a matriz Q
Q
.
P =Q
Como j se provou, P =

Pk

i=1 qi qi

e dela obtemos a identidade

Q
=
P =Q

k
X

qi qi

i=1

Usando uma base qualquer


Seja P um projetor ortogonal em Cm1 e v1 , . . . , vn matrizes coluna em Cm1 tais que
B = {v1 , . . . , vn } uma base da imagem de P. Para todo v em Cm1 , podemos escrever
P v = x1 v1 + + xk vn = Ax,
onde x = [x1 , . . . , xn ]T a matriz das coordenadas de P v na base B e A = [v1 , . . . , vn ]
uma matriz de ordem m por n, cujas colunas so v1 , . . . , vn . Esta matriz A define uma
transformao linear de Cn1 em Cm1 .
O vetor v P v est no complemento ortogonal da imagem de P e, para j = 1, . . . , n,
hvj , v P vi = 0

ou

vj P v = vj v,

de onde segue
vj Ax = vj v.
Como a j sima linha de A vj , a identidade acima resulta em
A Ax = A v.
Como as colunas de A so linearmente independentes, seu posto mximo e A A : Cn1
Cn1 um isomorfismo, possuindo assim uma inversa, o que nos permite escrever
x = (A A)1 A v
de onde resulta
P v = Ax = A(A A)1 A v.
Como esta igualdade vale para todo v em Cm1 ,
P = A(A A)1 A .
Se a base B for ortonormal, a matriz A unitria e da A = A1 . Com isto reobtemos
P = AA , vlida quando usamos uma base ortonormal.

94

Notas de aula do Prof. Antonio Cndido Faleiros

Exemplo 7.6 Determine o projetor ortogonal P sobre o espao gerado pelos vetores v1 =
(1, 2, 0)T e v2 = (0, 1, 1)T .
Inicialmente estabelecemos

1 0
A = [v1 , v2 ] = 2 1
0 1
e calculamos

1/3 1/3 1/3


P = A(A A)1 A = 1/3 5/6 1/6 .
1/3 1/6 5/6

Observe que P v1 = v1 e P v2 = v2 .

7.3

Ortogonalizao de Gram-Schmidt em Cm1

Vamos considerar o espao vetorial Cm1 com o produto interno hx, yi = x y. Pelo
processo de ortogonalizao de Gram-Schmidt, partindo de uma base {v1 , . . . , vm } de
Cm1 , pode-se obter uma base ortonormal {q1 , . . . , qm }, de modo iterativo
w1 = v1 e q1 =

w1
kw1 k

w2 = v2 hq1 , v2 i q1 e q2 =

w2
kw2 k

w3 = v3 hq1 , v3 i q1 hq2 , v3 i q2 e q3 =

w3
kw3 k

A partir de q1 = v1 / kv1 k determinam-se recursivamente os demais elementos da base


ortonormal, mediante a frmula
wj = vj

j1
X
i=1

hqi , vj i qi e qj =

wj
,
kwj k

vlida para j = 2, . . . , m. Como hqi , vj i qi = qi qi vj , esta recorrncia pode ser reescrita na


forma
!

j1
j1
X
X

wj = vj
qi qi vj = 1
qi qi vj
i=1

i=1

A projeo ortogonal sobre o subespao Sj gerado por {q1 , . . . , qj }


j =
j Q
Q

j
X
i=1

qi qi

Notas de aula do Prof. Antonio Cndido Faleiros

95

j = [q1 , . . . , qj ] a matriz cujas colunas so q1 , . . . , qj . A projeo ortogonal sobre


onde Q
o complemento orgogonal de Sj
j Q
j
Pj = I Q
e a frmula recursiva pode ser escrita de modo conciso como
wj
.
wj = Pj1 vj e qj =
kwj k
Conclui-se que o algoritmo clssico de Gram-Schmidt pode ser expresso em termos destes
projetores
P0 v1
P1 v2
Pm1 vm
, q2 =
, . . . , qm =
,
q1 =
kP0 v1 k
kP1 v2 k
kPm1 vm k
onde P0 a identidade e Pj , para j = 1, . . . , n 1, a projeo ortogonal sobre o
complemento ortogonal do espao gerado por {q1 , . . . , qj }.

7.4

Ortogonalizao modificada de Gram-Schmidt

Se q for uma matriz coluna unitria em Cm1 , a projeo ortogonal sobre o complemento
ortogonal do espao gerado por q
Pq = I qq .
Vamos, a partir de um conjunto linearmente independente {v1 , . . . , vn } em Cm1 , obter
um conjunto ortonormal de matrizes coluna {q1 , . . . , qn } em Cm1 . Observe que
Pq2 Pq1 = (I q2 q2 )(I q1 q1 ) = I q1 q1 q2 q2 + q1 q1 q2 q2 = I q1 q1 q2 q2
pois q1 q1 q2 q2 = 0, uma vez que q1 q2 = 0. Prosseguindo com esse raciocnio, obtemos
Pqj Pq2 Pq1 =

j
Y
i=1

(I qi qi ) =

= I

j
X
i=1

j Q
j
qi qi = I Q

j exatamente aquele
j Q
uma vez que qr qr qs qs = 0 para todo r 6= s. O projetor Pj = I Q
usado no algoritmo de Gram-Schmidt. A identidade
Pj = Pqj Pq2 Pq1
ser usada no algoritmo modificado. A obteno de Pj atravs das projees sucessivas
Pqj Pq2 Pq1 mais estvel numericamente do que o clculo clssico atravs da
matriz Pj . Em lugar de calcular wj pela frmula,
wj = Pj1 vj

96

Notas de aula do Prof. Antonio Cndido Faleiros

podemos usar outra


wj = Pqj1 Pq2 Pq1 vj .
O algoritmo modificado calcula wj usando a seqncia
(1)

= vj

(2)

= Pq1 wj = wj q1 q1 wj

wj
wj

(3)

wj

wj

(1)

(1)

(1)

(2)

(2)

(2)

= Pq2 wj = wj q2 q2 wj ,
..
.
(j)
(j1)
(j1)
(j1)

= wj = Pqj1 wj
= wj
qj1 qj1
wj
.

Na aritmtica computacional de preciso finita, este algoritmo introduz erros menores do


que o algoritmo clssico.
==============================
Algoritmo 8.2 Gram-Schmidt modificado (estvel)
Entrada: Um conjunto {v1 , . . . , vn } em Cm1 linearmente independente
Sada: Um conjunto ortonormal {q1 , . . . , qm } em Cm1
==============================
for j = 1 to n
wj = vj
for j = 1 to n
rjj = wj wj
qj = wj /rjj
for k = j + 1 to n
rjk = qj wk
wk = wk rjk qj
==============================
Na prtica, pode-se sobrescrever vj com wj e sobrescrever wj com qj para economizar
memria.

7.5

Contagem das operaes

Vamos calcular o nmero de flops realizados na execuo do algoritmo modificado de


Gram-Schmidt. Cada operao realizada contabilizar um flop em nossa contagem. Esta
operao pode ser uma adio, uma subtrao, uma multiplicao, uma diviso ou a
extrao de uma raiz quadrada. Quando m e n forem grandes, o loop que domina o
algoritmo o mais interno
for k = j + 1 to n
rjk = qj wk
wk = wk rjk qj

Notas de aula do Prof. Antonio Cndido Faleiros

97

O produto interno qj wk requer m multiplicaes e m1 adies. O clculo de wk rjk qj


necessita de m multiplicaes e um igual nmero de subtraes. Somamos 4m flops para
um nico lao do loop. Como o lao em k, que varia de j + 1 a n, est dentro de outro
em j que varia de 1 a n, o nmero de flops usado neste algoritmo
n
n
X
X

n
X
n2 n
4m = 4m
(n j) = 4m
= 2mn2 2mn 2mn2 ,
2
j=1 k=j+1
j=1

onde o smbolo tem o seguinte significado


nmero de flops
= 1.
m,n
2mn2
lim

Concluimos que a fatorao QR usando Gram-Schmidt modificado demanda a realizao


de 2mn2 flops.

98

Notas de aula do Prof. Antonio Cndido Faleiros

Captulo 8
Refletor de Householder
Seja v um vetor no nulo de Cm . A matriz
vv
v v
chamada de matriz de Householder ou refletor de Householder. Se u for mltiplo
de v e w for ortogonal a v, ento
Hv = I 2

Hv u = u

Hv w = w.

Todo u que est em S refletido em u e todo w no complemento ortogonal de S se


mantm inalterado. Esta observao nos permite dizer que a matriz Hv reflete os vetores
de Cm no complemento ortogonal de S.
Teorema 8.1 Seja v um vetor no nulo em Cm . O refletor
Hv = I 2

vv
v v

hermitiano e unitrio.
O refletor Hv hermitiano e unitrio mas no um projetor, visto que
Hv2 = I.
Sejam x e y dois vetores do Cm com normas iguais e hx, yi = hy, xi . Os vetores

1
(x + y)
2
1
w =
(x y)
2
so ortogonais e o refletor de Householder Hv tal que
v =

Hv x = y.
Este fato pode ser provado escrevendo x e y em termos de v e w
x=v+w

e
99

y = v w.

100

Notas de aula do Prof. Antonio Cndido Faleiros

Nota 8.2 Se os elementos de x e y forem todas reais, basta ter kxk = kyk para garantir
a igualdade entre hx, yi e hy, xi .
Podemos definir um refletor de Householder que leva um vetor x do Cm num outro
y = (y1 , 0, . . . , 0) onde apenas a primeira coordenada y1 no nula. Iremos us-lo para
calcular a decomposio QR de uma matriz usando refletores de Householder, que so
operadores auto-adjuntos. Vamos sua descrio.
O sinal de um nmero complexo z definido por sign(0) = 1 e, quando z 6= 0,
sign(z) =

z
.
|z|

Observe que o sinal um nmero complexo de mdulo unitrio. Se z for real, seu sinal
ser +1 ou 1. Para todo nmero complexo z,
sign(z)sign(z) = 1.
Teorema 8.3 Seja x = (x1 , x2 , . . . , xm )T um vetor no nulo em Cm , com x1 complexo
no nulo e e1 = (1, 0, . . . , 0)T o primeiro elemento da base cannica do Cm . O refletor
Hv , onde
1
v = (x + sign(x1 ) kxk e1 ) ,
2
leva x em y = sign(x1 ) kxk e1 , cujo nico elemento no nulo o primeiro.
Prova. O vetor
w=

1
(x sign(x1 ) kxk e1 )
2

ortogonal a v e
x = u + w,
sign(x1 ) kxk e1 = u w.
Portanto,
Hv (x) = Hv v + Hv w = v + w = sign(x1 ) kxk e1 .

O y definido neste teorema tem a forma (y1 , 0, . . . , 0)T , onde apenas y1 = sign(x1 ) kxk
no nulo. Esta escolha de u assegura que kxk kyk , o que fornece uma maior estabilidade numrica decomposio QR usando refletores de Householder descrita em seguida.

Notas de aula do Prof. Antonio Cndido Faleiros

8.1

101

Decomposio QR usando o refletor de Householder

A decomposio QR, baseada no processo de ortogonalizao de Gram-Schmidt o resultado de sucessivas multiplicaes direita de A = [v1 , . . . , vn ] por matrizes elementares,
todas triangulares superiores, resultando numa matriz ortogonal Q = [q1 , . . . , qn ]
A R1 Rn = Q.
A matriz R1 Rn triangular superior e sua inversa R nos fornece a decomposio
A = QR.
Por seu turno, a decomposio QR baseada nas matrizes de Householder ser o resultado da multiplicao esquerda de A por uma seqncia de matrizes ortogonais Q1 , . . . ,
Qn , que resultaro numa matriz triangular R
Qn Q1 A = R.
A matriz Q1 Qn ortogonal e sua inversa Q nos fornecer a decomposio A = QR.
A idia de Householder, proposta em 1958, foi a de escolher Qk para zerar aqueles
elementos da coluna k de A, situados abaixo da diagonal. A multiplicao pela matriz Qk
opera sobre A realizando uma combinao linear das linhas k, k + 1, . . . , m, mantendo as
primeiras k 1 colunas inalteradas e anulando os elementos da coluna k situados abaixo
da diagonal. A matriz Q1 uma matriz de Householder H1 e a forma geral de Qk , para
k = 2, . . . , n,

I 0
Qk =
0 Hk

onde I a matriz identidade de ordem k 1 e Hk uma matriz de Householder cuja


ordem m k+ 1.
Se x for o vetor de Cmk+1 formado pelos elementos da coluna k de A, extrados da
diagonal principal para baixo, o refletor de Householder Hk procurado I vv /v v, onde
v=

1
(x + sign(x1 ) kxk e1 ) ,
2

e e1 = (1, 0, . . . , 0) o primeiro elemento da base cannica do Cmk+1 . Pelo que foi visto
anteriormente,
Hk x = (y1 , 0, . . . , 0)T
onde y1 = sign(x1 ) kxk o nico elemento no
Sendo
(1)
a11
(1)
a21
(1)
(1) (1)
(1)
A = [a1 , a2 , . . . , an ] =
a31
..
.
(1)

am1

nulo de Hk x.
(1)

(1)

a12 a13
(1)
(1)
a22 a23
(1)
(1)
a32 a33
..
..
.
.
(1)
(1)
am2 am3

...

(1)

a1n
(1)
a2n
(1)
a3n
..
.
(1)

amn

102

Notas de aula do Prof. Antonio Cndido Faleiros

ento Q1 = H1 = I v1 v1 /v1 v1 onde



(1)
(1) (1)
a11 + sign(a11 ) a1

(1)

a21
1
(1)
v1 =
a31
2

..

.
(1)

am1

esto em Cm . Assim,

Q1 A =

(1)

e a1


(1) (2) (2)
sign(a11 ) a1 a12 a13
(2)

(1)

a11
(1)
a21
(1)
a31
..
.
(1)

am1

(2)

a1n

(2)

(2)

a22 a23 a2n


(2)
(2)
(2)
a32 a33 a3n
..
..
..
...
.
.
.
(2)
(2)
(2)
am2 am3 amn

0
0
..
.

Eliminando a primeira linha e a primeira coluna de Q1 A,


(2) (2)
a22 a23
a(2) a(2)
32
(2) (2)
33
A1 = [a2 , a3 , . . . , a(2)
..
n ] =
...
.
(2)
(2)
am2 am3

obtemos a matriz
(2)
a2n
(2)
a3n

..
...
.
(2)

amn

que de ordem m 1 por n 1. Toma-se H2 = I v2 v2 /v2 v2 , onde


(2)
(2)
(2) (2) (2)
a22 + sign a22 a2 e1
a22

(2)

(2)

1
a32
a32
(2)

v2 =
e a2 =
..
2
...

.
(2)
(2)
am2
am2
esto em Cm1 . Toma-se

Q2 =
e, com esta escolha,

Q2 Q1 A =


(1) (1)
sign(a11 ) a1
0
0
..
.

1 0
0 H2

(2)

(2)

a12

a13

0
..
.

a33
..
.

am3


(2) (2)
(3)
sign(a22 ) a2 a23
(3)

(3)

(2)

a1n

(3)
a2n

(3) .
a3n
..
...
.
(3)
amn

Notas de aula do Prof. Antonio Cndido Faleiros


Na terceira etapa, toma-se

103

1 0 0
Q3 = 0 1 0
0 0 H3

sendo H3 = I v3 v3 /v3 v3 , onde


(3)
(3) (3)
a33 + sign a33 a3

(3)
1
a43
v3 =
..
2

.
(3)

am3

(3)
a3

(3)

a33
(3)
a43
..
.
(3)

am3

esto em Cm2 . Com esta escolha,


(1) (1)
(2)
(2)
sign a11 a1
a12
a13

(2) (2)
(3)

a23
0
sign a22 a2


(3) (3)
Q2 Q1 A =

0
0
sign a33 a3

..
..
..

.
.
.
0
0
0
e o processo continua at obter uma matriz triangular superior

...

R = Qn Q2 Q1 A.
As matrizes Q1 , Q2 , . . . , Qn so todas unitrias, de modo que seu produto Qn Q2 Q1 ,
que denotaremos por Q , tambm unitria sendo Q sua inversa. Assim, Q A = R, que
resulta na decomposio
A = QR
onde Q unitria e R triangular superior.

8.2

O algoritmo para calcular R

O algoritmo seguinte calcula a matriz R, m por n, triangular superior da decomposio


QR de uma matriz A de ordem m por n, com m n. Alm de R, este algoritmo constri
os vetores de reflexo v1 , . . . , vn .
=================================
Algoritmo 10.1 Fatorao QR de Householder
Entrada: A = (aij ), de ordem m por n.
Sada: Substitui a matriz A por R, que triangular superior. Calcula ainda as reflexes
v1 , . . . , vn .
=================================

104

Notas de aula do Prof. Antonio Cndido Faleiros

for k = 1 to n
x = Ak:m,k
vk = x + sign(x1 ) kxk e1
vk = vk / kvk k
Ak:m, k:n = Ak:m, k:n 2vk (vk Ak:m, k:n )
=================================

8.3

Contagem das operaes

Em cada loop, o clculo dominante o de Ak:m, k:n . O vetor vk tem comprimento l =


m k+ 1. Para cada coluna de Ak:m, k:n , preciso calcular o produto interno vk Ak:m, j
o que exige 2l 1 flops, sendo l multiplicaes e l 1 adies. Calculado este produto
interno, precisamos de 1 flop para calcular 2(vk Ak:m, j ) e l multiplicaes para calcular
o produto deste escalar, 2(vk Ak:m, j ) pelo vetor vk . Finalmente, l subtraes para obter
Ak:m, j 2vk (vk Ak:m, j ). Efetuamos assim 4l operaes para calcular Ak:m, j em cada loop.
Para calcular as n k+ 1 colunas de Ak:m, k:n sero necessrios 4l(n k + 1) flops e na
execuo dos n loops exigir
n
X
k=1

4l(n k + 1) =

n
X

2
2
4(m k + 1)(n k + 1) = 2mn2 n3 + 2mn + n
3
3
k=1

flops. Usamos no clculo deste somatrio os seguintes resultados


n
X
k=1

1 = n,

n
X

1
k = n(n + 1),
2
k=1

n
X

1
k2 = (n + 3n2 + 2n3 ).
6
k=1

Admitindo que m e n crescem na mesma razo, fazendo m e n , obtemos


2
2mn2 n3
3
flops para executar o algoritmo de Householder.

8.4

O algoritmo para calcular Q

A matriz Q ainda no foi calculada. Podemos usar as frmulas


Q = Qn Q2 Q1
ou
Q = Q1 Q2 Qn

para obt-la. Lembramos aqui que as matrizes Qi so unitrias e assim Qi = Q1


i .

Podemos calcular Q b ou Qx. O prximo algoritmo calcula Q b.

Notas de aula do Prof. Antonio Cndido Faleiros

105

=================================
Algoritmo 10.2 Fatorao QR de Householder
Entrada: As reflexes v1 , . . . , vn de ordem m por 1 e b de ordem m por 1
Sada: Substitui b pelo vetor Q b de ordem m por 1.
=================================
for k = 1 to n
bk:m = bk:m 2vk (vk bk:m )
=================================
Podemos usar este algoritmo para obter Q , calculando suas colunas Q e1 , . . . , Q em
de Q .

8.5

O algoritmo para calcular Q

O prximo algoritmo calcula Qx.


=================================
Algoritmo 10.3 Fatorao QR de Householder
Entrada: As reflexes v1 , . . . , vn , de ordem m por 1 e o vetor x de ordem n por 1.
Sada: Substitui x pelo vetor Qx de ordem n por 1.
=================================
for k = n downto 1
xk:m = xk:m 2vk (vk xk:m )
=================================
Podemos usar este algoritmo para calcular as colunas Qe1 , . . . , Qem de Q. Este o
mtodo de escolha quando se deseja calcular a matriz unitria Q.
da decomposio reduzida, basta calcular as
Quando se deseja calcular apenas Q
colunas Qe1 , . . . , Qen .

106

Notas de aula do Prof. Antonio Cndido Faleiros

Captulo 9
Mnimos quadrados
Seja A uma matriz complexa m por n e b um vetor coluna do Cm . O sistema algbrico
Ax = b tem soluo se e somente se b for um ponto da imagem de A. Quando, alm disso
A for inversvel, Ax = b possui uma nica soluo dada por x = A1 b.
Quando b no pertencer imagem de A, o sistema algbrico Ax = b no tem soluo.
Entretanto, podemos escolher c na imagem de A que minimiza kc bk2 e resolver o sistema
Ax = c. O ponto c da imagem de A mais prximo de b a projeo ortogonal de b sobre
a imagem de A. Seja P b esta projeo. As solues de Ax = P b, minimizam kAx bk2 .
Quando o ker(A) = {0}, o sistema Ax = P b tem soluo nica. Entretanto, quando
ker(A) contiver vetores no nulos, o sistema Ax = P b possuir infinitas solues. De fato,
se n for um elemento no nulo do ncleo de A e x1 uma soluo de Ax = P b, ento, para
todo nmero complexo c, A(x1 + cn) = P b.
Se x for uma soluo de Ax = P b, podemos decomp-la numa soma x1 = r + n onde
r est na imagem de A e n est no ncleo de A, uma vez que Cn = Im (A ) ker(A).
Observe que r a projeo ortogonal de x sobre a imagem de A . Sendo x1 qualquer outra
soluo do sistema Ax = P b, ento A(x1 x) = 0 e x1 x = n1 pertence ao ncleo de A
e assim x1 = x + n1 = r+ (n + n1 ), onde n + n1 pertence ao ncleo de A e r a projeo
ortogonal sobre a imagem de A de uma soluo qualquer do sistema Ax = P b. Uma das
lies que se tira do raciocnio acima que projeo ortogonal sobre a imagem de A de
uma soluo x qualquer de Ax = P b sempre resulta no mesmo vetor r. Determinando
uma nica soluo do sistema Ax = P b e todas as solues do sistema homogneo Ax =
0, teremos em mos todas as solues do sistema no homogneo Ax = P b.
Cada soluo de Ax = P b uma soluo por mnimos quadrados de Ax = b.
A projeo ortogonal r de uma soluo do sistema Ax = P b sobre a imagem de A
chamada de soluo principal por mnimos quadrados de Ax = b.
Quando o sistema linear Ax = b tem soluo, suas solues coincidem com as solues
por mnimos quadrados de Ax = b.
Seguindo o esquema estabelecido at o momento, para obter a soluo principal por
mnimos quadrados de Ax = b, precisamos seguir a seguinte receita:
1. Determine P b, a projeo ortogonal de b sobre a imagem de A.
107

108

Notas de aula do Prof. Antonio Cndido Faleiros

2. Determine x, uma soluo de Ax = P b.


3. Determine r, a projeo ortogonal de x sobre a imagem de A , que ortogonal ao
ncleo de A.
Exerccio 9.1 Para as matrizes abaixo, determine: a projeo ortogonal P b de b sobre
a imagem de A, uma soluo de Ax = P b e a projeo ortogonal r de x sobre a imagem
de A .


1 2
1
1. A = 0 1 e b = 0 .
2 3
0


1 0 1
1

2 1 0
1 .
2. A =
eb=
3 1 1
1


1 2
1/ 2 0
Exerccio 9.2 Na decomposio QR de A = 0 1 , Q = 0 1 . Determine
1 2
1/ 2 0
a matriz que projeta sobre a imagem de A. Resolva o problema de mnimos quadrados
Ax = (1, 0, 0)T . (Sugesto: note que as colunas de Q do base ortogonal para a imagem
de A.)
A resoluo de um problema de mnimos quadrados bastante rdua. Felizmente
existe um atalho que nos dado pela proposio seguinte.
Teorema 9.3 Seja A uma matriz m por n e b um vetor coluna m por 1. Seja P a matriz
que projeta ortogonalmente sobre a imagem de A. Os sistemas lineares Ax = P b e A Ax =
A b possuem as mesmas solues.
Prova. Observe inicialmente que P b b Im (A) = ker(A ).
1. Se x for soluo de Ax = P b, ento Ax b = P b b pertence ao ncleo de A de
onde se conclui que A (Ax b) = 0 ou
A Ax = A b.
2. Se x for soluo de A Ax = A b, ento A (b Ax) = 0 e b Ax pertence ao
ncleo de A , que ortogonal imagem de A. Desta forma, b = Ax+ (b Ax) uma
decomposio de b em um vetor Ax na imagem de A e outro b Ax no seu complemento
ortogonal. Logo, P b = Ax.
Definio 9.4 A equao
A Ax = A b
chamada de equao normal do problema de mnimos quadrados para Ax = b.

Notas de aula do Prof. Antonio Cndido Faleiros

109

Embora seja redundante, nunca demais reafirmar que, se x for uma soluo da
equao normal, ento a projeo ortogonal de b sobre a imagem de A igual a Ax
P b = Ax.
Quando m n e a matriz A, de ordem m por n, possuir posto mximo n, suas colunas
sero linearmente independentes e o seu ncleo conter apenas o zero. A matriz A A ser
inversvel e o problema de mnimos quadrados para Ax = b ter uma nica soluo
x = (A A)1 A b.
Como P b = Ax, a projeo ortogonal P sobre a imagem de A ser dada pelo produto
P = A(A A)1 A .

9.1

Mnimos quadrados e a decomposio QR

R
a decomposio QR reduzida da matriz A. As colunas da matriz Q
= [q1 ,
Seja A = Q

. . . , qk ] formam uma base ortonormal da imagem de A e Q Q a matriz identidade k por


de ordem k por n, triangular superior,
k. A matriz R,
Q
Q
R
=R
R,

A A = R
e a equao normal A Ax = A b toma a forma
Rx
=R
Q
b.
R
triangular superior e R

Este sistema pode ser resolvido com facilidade, posto que R
triangular inferior.
Quando m n e a matriz A de ordem m por n possuir posto mximo n, as matrizes

so inversveis o que permite reduzir a equao normal forma


AAeR
=Q
b.
Rx
inversvel e esta equao tem soluo nica. A projeo P = A (A A)1
Neste caso, R
A assumir uma forma mais simples
1 R
Q
= Q
R(
R
R)
Q
.
P = A(A A)1 A = Q

9.2

Pseudo inversa

Quando m n e a matriz A de ordem m por n possuir posto mximo n, o problema de


mnimo quadrado para Ax = b tem uma nica soluo que coincide com a nica soluo
da equao normal
A Ax = A b.

110

Notas de aula do Prof. Antonio Cndido Faleiros

A matriz A A inversvel neste caso e


x = (A A)1 A b.
A matriz n por m
A+ = (A A)1 A ,
chamada de pseudo-inversa de A. Ela recebe este nome pois x = A+ b a soluo por
mnimos quadrados de Ax = b.
R
for a decomposio QR reduzida de A, ento
Sendo Q
b
1 Q
x=R
e a pseudo-inversa ser dada por
1 Q
.
A+ = R
Continuando com A de ordem m por n e posto mximo n, a matriz A A, alm de ser
inversvel, hermitiana e possui uma decomposio de Cholesky A A = R R, onde R
inversvel e triangular superior. Neste caso, a equao normal se reduz forma
R Rx = A b
e, sendo R triangular superior e R triangular inferior, muito simples resolver o sistema.

9.3

Reta de regresso

Sejam (x1 , y1 ), . . . , (xm , ym ) pontos de C2 . Determine a reta


y = c0 + c1 x
P
2
que minimiza o resduo m
i=1 (c0 + c1 xi yi ) .
Consideremos
em Cm o produto interno definido por hx, yi = x y e a norma definida

2
por kxk = x x. Sendo

1 x1
y1

c0

A = ... ... , c =
, d = ... ,
c1
1 xm
ym
ento

m
X
kAc dk = hAc d, Ac di =
(c0 + c1 xi yi )2 .
2

i=1

Portanto, o problema proposto equivalente ao problema de mnimos quadrados para


Ac = d no produto interno de Cm definido por hx, yi = x y.

Notas de aula do Prof. Antonio Cndido Faleiros

111

Se x1 , . . . , xm no forem todos iguais, a matriz A tem posto 2. A equao normal


A Ac = A d do problema de mnimos quadrados para Ac = d

Pm

Pm
c
x
y
m
i
0
i
i=1
i=1
Pm
Pm 2
= Pm
c1
i=1 xi
i=1 xi
i=1 xi yi

que ter soluo nica.


Sejam

1
1
(x1 + + xm ) e y = (y1 + + ym )
m
m
os valores mdios de x1 , . . . , xm e y1 , . . . , ym , respectivamente. Podemos fazer a decomposio A = W T, onde

1 (x1 x)

1
x

..
.
..
T =
W = .
,
0 1
1 (xm x)
x=

onde as colunas de W formam uma base ortogonal para a imagem de A e T inversvel.


Com esta decomposio, a equao normal A Ac = A d assume a forma

Pm
c0 + c1 x
yi
m P
0
i=1
P
=
m
m
2
c1
0
i=1 (xi x)
i=1 (xi x)yi
cuja soluo imediata

Pm
(xi x)yi
c1 = Pi=1
m
2
i=1 (xi x)

c0 = y c1 x.

Exerccio 9.5 Calcule a reta de regresso para os dados (1; 3), (2; 6), (3; 5, 5), (4; 6, 5).

9.4

Interpolao polinomial

Dados os pontos (x1 , y1 ), . . . , (xm , ym ), determine c0 , c1 , . . . , cm1 , de modo que o


polinmio
y = p(x) = c0 + c1 x + + cm1 xm1
seja tal que p(xi ) = yi , para i = 1, 2, . . . , m 1.
Estas condies nos levam ao sistema de equaes algbricas lineares Ac = d onde

c0
y1
1 x1 x21 xk1
c1
y2
1 x2 x2 xk
2
2

,
c
=
,
d
=
A = .. ..

.. .

.. . .
..
..
.
.
. .
. .
.
1 xm x2m xkm

ck

ym

Se os pontos x1 , x2 , . . . , xm forem todos distintos, a matriz A inversvel e o problema


tem soluo nica para qualquer y1 , y2 , . . . , ym .

112

Notas de aula do Prof. Antonio Cndido Faleiros

O polinmio p(x) assim obtido chamado de polinmio interpolador dos pares de


pontos (x1 , y1 ), . . . , (xm , ym ).
medida que o m cresce, o polinmio p oscila mais e mais. Se os pontos (xi , yi )
tiverem sido obtidos a partir de experimentos laboratoriais, p(x) pode no representar o
fenmeno que se pretende descrever.

9.5

Ajuste polinomial

Se os dados (xi , yi ), i = 1, 2, . . . , m, forem provenientes de experimentos, a interpolao


polinomial fornece um polinmio que oscila muito e no representa adequadamente os
dados obtidos experimentalmente. Quanto maior for o conjunto de dados, mais oscilante
o polinmio. Desta forma, muito mais interessante procurar um polinmio de grau
menor, que oscila menos e se ajuste melhor aos dados observados, embora no passe necessariamente por nenhum deles. Observando que dados experimentais so passveis de
erros, no um absurdo obter um polinmio que se ajuste a eles sem passar necessariamente por nenhum deles. Fica no ar a pergunta: qual o grau do polinmio a ser usado.
Em geral, quando se faz um experimento, existem modelos matemticos que descrevem o
fenmeno. Se no houver, busca-se um por tentativas e erros. O critrio de ajuste pode
ser aquele fornecido pelo problema de mnimos quadrados.
Dados os pontos (x1 , y1 ), . . . , (xm , ym ), determine o polinmio
y = p(x) = c0 + c1 x + + ck xk

P
2
de grau k menor do que m 1 que minimiza o resduo m
i=1 (p(xi ) yi ) .
Minimizar este resduo equivalente minimizao da norma kAc dk2 , onde

c0
y1
1 x1 x21 xk1
c1
y2
1 x2 x2 xk
2
2

,
c
=
,
d
=
A = .. ..
..
.. ,
.. . .
..
.
.
. .
. .
.
ck
ym
1 xm x2m xkm

de modo que o problema proposto equivalente quele dos mnimos quadrados para Ac =
d com o produto interno
hx, yi = x y.
Quando k = m 1 camos no caso anterior da interpolao polinomial.

9.6

Aproximao polinomial de funes

Um problema semelhante ao anterior consiste em determinar o polinmio


y = p(x) = c0 + c1 x + + ck xk

Notas de aula do Prof. Antonio Cndido Faleiros

113

de grau menor ou igual a k que melhor aproxima uma funo g(x) definida no intervalo
[a, b]. Logo surge a pergunta: em que sentido p(x) o melhor polinmio que aproxima
g(x)?
Numa tentativa de responder a esta indagao, legtima por sinal, poderamos pegar
m pontos a = x1 x2 xm = b igualmente espaados em [a, b] e assim determinar
o polinmio p(x) que minimiza a soma
S=

m
X
i=1

[p(xi ) g(xi )]2 .

Denotando g(xi ) por yi , podemos resolver este problema usando a tcnica anterior de
ajuste polinomial.
Entretanto, antes de encerrar o caso, vamos elaborar um pouco mais este problema.
Para m fixo, seja x = (b a)/m. Minimizar S ou S x a mesma coisa. medida
que o m cresce,
m
X
|p(xi ) g(xi )|2 x
S x =
i=1

converge para a integral


terno

Rb
a

[f (x) g(x)]2 dx. Tal fato motiva a definio do produto inhf, gi =

f (x)
g(x) dx

e a norma correspondente a ele

kf k =

s
Z

|f (x)|2 dx.

Rb
Nesta norma, kp gk2 = a |p(x) g(x)|2 dx.
O problema agora pode ser reformulado como segue: Seja g uma funo contnua,
definida no intervalo real [a, b]. Determine o polinmio p(x) = c0 + c1 x+ + ck xk de
grau menor ou igual a k, que minimiza
2

kp gk =

|p(x) g(x)|2 dx.

Sabemos que p obtido projetando g ortogonalmente sobre o espao dos polinmios


de grau menor ou igual a k. Podemos determinar este polinmio a partir de uma base
ortogonal para este espao vetorial. Sabemos que quando [a, b] = [1, 1], estes polinmios
esto relacionados aos polinmios de Legendre.

114

9.7

Notas de aula do Prof. Antonio Cndido Faleiros

Aproximao trigonomtrica

Podemos agora resolver um problema semelhante ao anterior, aproximando uma funo


real g(x), definida no intervalo [L, L], por uma funo trigonomrica
X

m
m
a0 X
k
k
f (x) =
+
x +
x
ak cos
bk sen
2
L
L
k=1
k=1
fazendo com que

kf gk =

|f (x) g(x)|2 dx

seja o menor possvel. A norma acima proveniente do produto interno


Z L
hf, gi =
f (x)
g (x) dx
L

e, o que interessante observar, o conjunto de funes

k
k
{ 1, cos
x , sen
x : k = 1, 2, . . . , m }
L
L
ortogonal em relao a este produto interno. Pode-se calcular que h1, 1i = 2L e


k
k
k
k
x , cos
x
= sen
x , sen
x
= L.
cos
L
L
L
L
Consequentemente,
a0
ak
bk

Z
1 L
=
g(x)dx
L L

Z
1 L
k
x dx
=
g(x) cos
L L
L

Z
1 L
k
x dx
=
g(x)sen
L L
L

para k = 1, 2, . . . , m.
Seja g(x) uma funo contnua por partes no intervalo [L, L] e h(x) sua extenso
peridica para toda a reta. medida que o m cresce, a aproximao trigonomtrica
converge para o valor mdio
g(x ) + g(x+ )
2
onde
g(x ) = lim g(s) e g(x+ ) = lim+ g(s).
sx

sx

A teoria que trata das aproximaes por funes trigonomtricas denominada de


Anlise de Fourier e a cincia que estuda as aproximaes por seqncias de funes
ortogonais denominada de Anlise Harmnica.

Captulo 10
Autovalores e autovetores
Definio 10.1 Seja V um espao vetorial e L : V V um operador linear. Um escalar
um autovalor de L se existir um vetor v, no nulo, tal que Lv = v. O vetor v
chamado de autovetor de L correspondente ao autovalor .
Uma matriz quadrada A define um operador linear de Rn em Rn se for real ou de Cn
em Cn se for complexa. Um nmero real um autovalor de A se existir uma matriz
coluna x de ordem n por 1, no nula, tal que Ax = x. O vetor coluna x chamado de
autovetor de A correspondente ao autovalor .
Sendo x um autovetor de A correspondente ao autovalor ento
(I A)x = 0,
onde I a matriz identidade. A equao matricial acima possui soluo no trivial se e
s se
det(I A) = 0.

Se A for uma matriz de ordem n, o det(I A) um polinmio de grau n em . Sobre o


corpo dos nmeros complexos, a equao polinomial
det(tI A) = 0
possui pelo menos uma raiz . Substituindo este valor na equao matricial (I A)x = 0,
determinamos os autovalores x. Lembre-se: quando uma equao matricial homognea
possui soluo no trivial, esta soluo no nica. Se x1 e x2 so dois autovetores de A
correspondentes ao mesmo autovalor e 1 , 2 forem dois escalares, ento 1 x1 + 2 x2
ser autovetor de A correspondentes ao autovalor . O conjunto
auto() = {x Cn : Ax = x}
um subespao vetorial de Cn , chamado de autoespao de A correspodente ao autovalor
.
A matriz tI A chamada de matriz caracterstica de A, o polinmio (t) =
det(tI A) chamado de polinmio caracterstico de A e a equao polinomial det(tI
A) = 0 chamada de equao caracterstica de A.
115

116

Notas de aula do Prof. Antonio Cndido Faleiros

Para obter os autovalores e autovetores de A, calcule as razes 1 , . . . , s da equao


caracterstica det(I A) = 0 e, para cada autovalor i , determine o conjunto soluo do
sistema homogneo
(I A)x = 0
para obter o autoespao de .
Se duas matrizes quadradas A e B forem semelhantes, ento existe uma matriz inversvel P tal que B = P AP 1 e
det(tI B) = det(tP 1 P P 1 AP ) = det(P 1 (tI A)P ) =
= det(P 1 ) det(tI A) det(P ) = det(tI A),
mostrando que matrizes semelhantes possuem a mesma equao caracterstica e, portanto,
os mesmos autovalores.
Para determinar autovalores e autovetores de um operador linear L : V V, onde V
um espao vetorial de dimenso finita n, escolhemos uma base B = {v1 , . . . , vn } de V e
calculamos a matriz de L na base B que denotamos por A. Um escalar autovalor de
L se e s se for autovalor de A. Um vetor v no nulo autovetor de L correspondente ao
autovalor se e s se a matriz coluna x das coordenadas de v na base B for um autovetor
de A correspondente ao autovalor .
De fato, se A = (aij ), ento
n
X
aij vi
Lvj =
i=1

e, se x = (x1 , . . . , xn ) , ento

v=

n
X

xi vi

i=1

e
Lv =

n
X
j=1

xj Lvj =

n
X
j=1

xj

n
X
i=1

aij vi =

n
n
X
X
i=1

j=1

aij xj

vi .

P Pn
P
Assim, Lv = v se e s se ni=1
vi = ni=1 xi vi e, da independncia linear
a
x
ij
j
j=1
P
P
dos elementos de B, esta igualdade se verifica se e s se nj=1 aij xj = ni=1 xi , para i =
1, . . . , n, que corresponde equao matricial Ax = x.
Desta forma, para calcular os autovalores e autovetores de um operador L num espao
vetorial de dimenso finita, basta calcular sua matriz A numa base B, determinar seus
autovalores 1 , . . . , s , que sero os autovetores de L. A cada autovalor i , determine o
autoespao de A correspondente a este autovalor
auto(i ) = {x Cn : Ax = i x}
para obter os autovetores v de L correspondente ao autovalor i que sero dados por
v = x1 v1 + + xn vn

Notas de aula do Prof. Antonio Cndido Faleiros

117

onde x = (x1 , . . . , xn )T autovetor de A correspondente ao autovalor i .


Seja um autovalor de L. Tal como no caso de matrizes, o conjunto
auto() = {v V : Lv = v}
um subespao vetorial de V, denominado de autoespao de L correspondente ao autovalor .
Se A for a matriz de L numa base B de V, ento tI A chamada de matriz
caracterstica de L, o polinmio det(tI A) chamado de polinmio caracterstico
de L e a equao polinomial det(tI A) = 0 chamada de equao caracterstica de
L.
Como as matrizes de uma transformao linear em bases diferentes so semelhantes, o
polinmio caracterstico de L no depende da base escolhida e, portanto, seus autovalores
no dependem da base escolhida. A mesmo acontece com os autovetores de L. Sua
determinao no depende da base escolhida.
Teorema 10.2 Autovetores de L correspondentes a autovalores distintos so linearmente
independentes.
Prova. Sejam v1 , . . . , vr os autovetores de L correspondentes aos autovalores distintos 1 , . . . , r . Vamos provar que estes autovetores formam um conjunto linearmente
independente.
1. Inicialmente provaremos que {v1 , v2 } linearmente independente. Sejam a1 e a2
dois escalares tais que a1 v1 + a2 v2 = 0. Multiplicando por 1 e por A vem
a1 1 v1 + a2 1 v2 = 0
e
a1 1 v1 + a2 2 v2 = 0.
Subtraindo uma da outra chega-se a a2 (1 2 )v2 = 0. Como 1 6= 2 e v2 6= 0, obtemos
a2 = 0 e, consequentemente, a1 = 0, provando que o conjunto {v1 , v2 } linearmente
independente. Do mesmo modo se prova que um conjunto formado por dois autovetores
{vi , vj } so linearmente independentes.
2. Vamos supor, como hiptese de induo, que qualquer subconjunto de {v1 , . . . , vr }
com menos de r elementos linearmente independente.
3. Vamos provar que {v1 , . . . , vr } linearmente independente. Consideremos a
equao
a1 v1 + a2 v2 + + ar vr = 0,
onde ai so escalares. Multiplicando-a por A e por 1 , obtemos
a1 1 v1 + a2 2 v2 + + ar r vr = 0
e
a1 1 v1 + a2 1 v2 + + ar 1 vr = 0.

118

Notas de aula do Prof. Antonio Cndido Faleiros

Subtraindo uma da outra vem


a2 (2 1 )v2 + + ar (r 1 )vr = 0
Sendo o conjunto {v2 , . . . , vr } linearmente independente, a2 (2 1 ) = = ar (r 1 ) =
0. Como os autovalores so distintos, a2 = = ar = 0 e, em conseqncia, a1 tambm
nulo, completando a prova de que o conjunto {v1 , . . . , vr } linearmente independente.
Teorema 10.3 Seja V um espao com produto interno e L : V V auto-adjunto. Os
autovalores de L so reais e os autovetores correspondentes a autovalores distintos so
ortogonais.
Prova. Se Lv = v, onde v um vetor no nulo e escalar, ento hLv, vi = hv, Lvi
hv, vi = hv, vi ou (
) hv, vi = 0, de onde se conclui que
= .
o que implica em
Se v e w forem autovetores correspondentes aos autovalores reais distintos e , ento,
de hLv, wi = hv, Lwi o que implica em hv, wi = hv, wi ou ( ) hv, wi = 0. Como
6= , hv, wi = 0.
Teorema 10.4 Seja V um espao com produto interno e L : V V linear. Os autovalores de L L so reais e no negativos, isto , se for autovalor de L L, ento 0.
Prova. Como L L auto-adjunto, seus autovalores so reais. Seja v um autovetor de
L L associado ao autovalor . De hLv, Lvi 0, segue
0 hLv, Lvi = hv, L Lvi = hv, vi = hv, vi
Como hv, vi > 0, conclui-se que 0.
Teorema 10.5 Seja V um espao com produto interno e L : V V antiadjunto. Os
autovalores de L so nmeros imaginrios puros (nmeros complexos com parte real nula)
e os autovetores correspondentes a autovalores distintos so ortogonais.
Prova. Se v for um autovetor de L, com Lv = v ento
hv, vi = hv, vi =
=
hLv, vi = hv, Lvi =
provando que um nmero imaginrio com parte real nula.
Sejam v e w autovetores de L com Lv = v, Lw = w e 6= . Ento
hv, wi = hv, wi .
hLv, wi = hv, Lwi =
=
Sendo e imaginrios puros e distintos,
6 e assim, hv, wi = 0.

Notas de aula do Prof. Antonio Cndido Faleiros

119

Teorema 10.6 Seja V um espao com produto interno e L : V V unitrio. Os autovalores de L so nmeros complexos com mdulo unitrio e os autovetores correspondentes
a autovalores distintos so ortogonais.
Prova. Seja v um autovetor de L, com Lv = v. Ento
hv, vi = hv, vi =
= 1,
hLv, Lvi = hv, vi =
mostrando que um nmero complexo de mdulo unitrio.
Sejam v e w autovetores de L com Lv = v, Lw = w e 6= . Se hv, wi 6= 0, ento
hLv, Lwi = hv, wi =
hv, wi = hv, wi =
= 1.
Como possui mdulo unitrio, podemos escrev-lo na forma = exp(i), onde um
de onde se conclui que = , o
nmero real. Assim
exp(i) = 1 e
= exp(i) =
que contraria a hiptese.
Definio 10.7 Seja p(t) = c0 + c1 t+ + ck tk um polinmio em t e A uma matriz
quadrada. Define-se p(A), o valor do polinmio p(t) na matriz A, por
p(A) = c0 I + c1 A + + ck Ak
onde I a matriz identidade com ordem igual de A. Se p(A) = 0, diremos que a matriz
A um zero do polinmio p(t).
Sejam Ak , k = 0, 1, . . . , r, matrizes quadradas de mesma ordem. Os elementos da
matriz
A(t) = A0 + A1 t + + Ar tr
so polinmios de grau menor ou igual a r.
Teorema 10.8 (Cayley-Hamilton) Toda matriz um zero do seu polinmio caracterstico.
Prova. Seja A uma matriz quadrada de ordem n e B = tI A sua matriz caracterstica. Seu polinmio caracterstico
det B = det(tI A) = tn + cn1 tn1 + + c1 t + c0
tem grau n. Cada elemento da adjunta clssica de B, denotada por adj(B), um polinmio
de grau n 1 ou inferior. Logo, adj(B) = Bn1 tn1 + + B1 t+ B0 um polinmio
matricial de grau n 1 ou inferior. Sabe-se que B 1 = adj(B)/ det(B) e assim,
det(B)I = adj(B) B.
Como
det(B)I = Itn + cn1 Itn1 + + c1 It + c0 I

120

Notas de aula do Prof. Antonio Cndido Faleiros

adj(B) B = Bn1 tn1 + + B1 t + B0 (tI A)


= Bn1 tn + (Bn2 Bn1 A)tn1 + + (B0 B1 A)t + B0 A
segue
I = Bn1
cn1 I = Bn2 Bn1

c1 I = B0 B1 A
c0 I = B0 A.
Multiplicando as igualdades, da primeira at a ltima por An , An1 , . . . , A e I, respectivamente, pela direita e adicionando os resultados, obtemos zero do lado direito e, do lado
esquerdo, o polinmio caracterstico
An + cn1 An1 + + c1 A + c0 I
calculado na matriz A. Isto prova o teorema de Cayley-Hamilton.
Matrizes triangulares em bloco so aquelas do tipo

A1 B
A=
0 A2
onde A1 e A2 so matrizes quadradas, podendo ter a mesma ordem ou no. Ento
det(A) = det(A1 ) det(A2 ).
A matriz caracterstica de A tambm triangular por blocos e
det(tI A) = det(tI A1 ) det(tI A2 ).
Teorema 10.9 Seja A uma matriz triangular em blocos, cujos blocos diagonais so A1 ,
. . . , Ar . Ento o polinmio caracterstico de A o produto dos polinmios caractersticos
de A1 , . . . , Ar , isto ,
det(tI A) = det(tI A1 ) det(tI Ar ).
O polinmio caracterstico de uma matriz quadrada complexa A pode ser fatorado em
fatores lineares,
(t) = (t 1 )p1 (t k )pk ,
onde 1 , . . . , k so suas razes e p1 , . . . , pk suas multiplicidades. O expoente pk a
multiplicidade algbrica do autovalor k .

Notas de aula do Prof. Antonio Cndido Faleiros

121

Definio 10.10 Seja um autovalor de uma matriz quadrada A de ordem n. A multiplicidade algbrica de a multiplicidade de como raz da equao caracterstica.
A multiplicade geomtrica de a dimenso do seu autoespao.

5 1 0
Exemplo 10.11 O polinmio caracterstico de A = 0 5 0 (t 5)3 . Logo, 5
0 0 5
um autovalor de A de multiplicidade algbrica 3. O autoespao deste autovalor gerado
por (1, 0, 0)T e (0, 0, 1)T . Logo, a multiplicidade geomtrica do autovalor 5 2.
Teorema 10.12 A multiplicidade geomtrica de um autovalor nunca excede sua multiplicidade algbrica.
Prova. Seja V um espao vetorial de dimenso n e L : V V um operador linear.
Seja g a multiplicidade geomtrica de um autovalor de L. Existem g autovetores v1 , . . . ,
vg linearmente independentes correspondentes ao autovalor . Completemos este conjunto
para obter uma base de V. Seja B = {v1 , . . . , vg , w1 , . . . , wr } esta base. A matriz de L
nesta base

0 c11 c1r
.. . . . .. .. . . . ..
. .
.
.

A C

c
0

p1
pr
M =
=
0 B
0 0 b11 b1r

. .
.
.
.
.
.. . . .. ..
. . ..
0 0 br1 brr

onde A = I. O polinmio caracterstico de M (t) = det(tI M) = det(tI A) det(tI


B) = (t )g det(tI B). Portanto, (t )g deve dividir (t). Para que isto ocorra, a
multiplicidade algbrica de deve ser maior ou igual a g.
Teorema 10.13 Uma matriz quadrada A de ordem n semelhante a uma matriz diagonal
D se e s se A tem n autovetores linearmente independentes.

Prova. 1. Se A for semelhante a uma matriz diagonal D, ento existe uma matriz
inversvel P tal que AP = P D. Os elementos diagonais de D so os autovalores de A e
as colunas de P os autovetores. Sendo inversvel, as colunas de P so vetores linearmente
independentes.
2. Se A tem n autovetores linearmente independentes, sejam eles {v1 , . . . , vn } que
formam uma base de V e para os quais Avi = i vi . Se P for a matriz cujas colunas so
formadas por esses vetores, temos AP = P D onde D = diag(1 , . . . , n ).
Nota 10.14 No teorema anterior, os n autovalores 1 , . . . , n no precisam ser todos
distintos.

122

Notas de aula do Prof. Antonio Cndido Faleiros

Seja P a matriz inversvel para a qual D = P 1 AP diagonal. Ento A = P DP 1


a chamada de fatorao diagonal de A.
Seja V um espao vetorial com dimenso n. Seja L : V V uma transformao linear,
cujo polinmio caracterstico
(t) = (t 1 )(t 2 ) (t n )
pode ser fatorado em n fatores distintos do primeito grau. Ento L possui n autovetores
linearmente independentes e portanto, possui uma representao matricial diagonal, na
base formada pelos autovetores. Os elementos da diagonal desta representao so os
autovalores i .
Se D for diagonal e seus elementos diagonais forem d11 , d22 , . . . , dnn denotaremos esta
matriz por D = diag(d11 , d22 , . . . , dnn ). Sendo A = P DP 1 , ento

m
m
m
1
.
Am = P DP 1 = P Dm P 1 = P diag(dm
11 , d22 , . . . , dnn )P
Sendo f (t) um polinmio,

f (A) = f P D P 1 = P f (D) P 1 = P diag( f (d11 ), f (d22 ), . . . , f (dnn ) )P 1 .

Alm disso, se os elementos diagonais de D forem no negativos, ento


p
p
k1 , . . . , kn P 1
B = P diag
uma raiz quadrada de A pois B 2 = A.

Captulo 11
Espaos Invariantes
Definio 11.1 Seja L : V V um operador linear e W um subespao de V. Se L(W )
W, diremos que W invariante sob L.
Exemplo 11.2 Seja L(x, y, z) = ( x y, x + y, z ) um operador definido no espao
vetorial dos ternos ordenados. O subespao W = { (x, y, 0) : x, y R } invariante sob
L.
O subespao gerado por um vetor w no nulo invariante sob L se e s se w for um
autovetor de L.
Seja L : V V linear e f (t) um polinmio. O ker f (L) invariante sob L. Se W for
invariante sob L, ento W invariante sob f (L).
Definio 11.3 Seja W um subespao vetorial de V e L : V V um operador linear.
Se W for invariante sob L podemos definir T : W W por T (w) = L(w) para todo w
em W. O operador T linear em W e recebe o nome de restrio de L em W.
Sendo W invariante sob L, ento invariante sob Lk , para todo k inteiro positivo. Se
f (t) for um polinmio, ento W invariante sob f (L). Sendo T a restrio de L a W,
para todo w em W, tem-se f (T )w = f (L)w.
Teorema 11.4 Seja L : V V linear e W subespao de V invariante sob L. Ento L
possui uma representao matricial em bloco

A C
0 B

onde A uma representao matricial da restrio de L em W.


123

124

Notas de aula do Prof. Antonio Cndido Faleiros

Prova. Seja {u1 , . . . , uj } uma base de W e {u1 , . . . , uj , v1 , . . . , vk } uma base de V.


Como W invariante frente a L,
L(u1 ) = a11 u1 + + aj1 uj

L(uj ) = a1j u1 + + ajj uj


L(v1 ) = c11 u1 + + cj1 uj + b11 v1 + + bk1 vk

L(vk ) = c1k u1 + + cjk uj + b1k v1 + + bkk vk


e, portanto, a representao matricial de L nesta base

a11 a1j
.. . . . ..
.
.

a
a
j1
jj

0 0
. .
..
. . ...
0 0

c11 c1k
.. . .
.
. ..
.

A C
cj1 cjk
.
=
0 B
b11 a1j
.. . .
.
. ..
.
bk1 bkk

Definio 11.5 Seja L : V V linear e V = W1 Wr , onde Wi invariante sob


L. Seja Li a restrio de L a Wi . Neste caso se diz que L a soma direta dos Li ou que
L decomponvel nos operadores Li , quando ento se escreve
L = L1 Lr .
Ainda se diz que os subespaos W1 , . . . , Wr reduzem L.
Teorema 11.6 Seja L : V V linear e W1 , . . . , Wr subespaos de V invariantes sob L
e tais que V = W1 Wr . Neste caso, L possui uma representao matricial diagonal
em bloco

A1 0 0
0 A2 0

A = ..
.. . .
..
.
. .
.
0 0 Ar
onde Ai uma representao matricial da restrio Li de L no subespao Wi .

Prova. Provaremos o teorema no caso em que V = W1 W2 . Sejam B1 = {u1 , . . . ,


ur } base de W1 e B2 = {w1 , . . . , ws } base de W2 . Como W1 e W2 so invariantes frente

Notas de aula do Prof. Antonio Cndido Faleiros

125

L,
L(u1 ) = a11 u1 + + ar1 ur

L(ur ) = a1r u1 + + arr ur


L(w1 ) = b11 w1 + + bs1 ws

L(ws ) = b1s w1 + + bss ws


Desta forma, a representao

a11
..
.

a
A = r1
0
.
..
0

matricial de L nesta base

a1r 0 0
.. . .
.
. . . ..
. ..
.
.

A 0
arr 0 0
.
=
0 B
0 b11 b1s

.. . .
.
. . . ..
. ..
.
.
0 bs1 bss

Nas condies do teorema anterior, temos L = L1 Lr . A matriz A chamada


de soma direta de A1 , . . . , Ar e se escreve
A = A1 Ar .

11.1

Polinmio mnimo

Para obter representaes matriciais simplificadas de um operador linear preciso obter


subespaos invariantes. Se f (t) for um polinmio e L for um operador linear, ento o
ncleo de f (L) invariante sob L. Este fato nos fornece um modo sistemtico de obter
subespaos invariantes.
Em particular vamos provar que
Teorema 11.7 Seja L : V V linear e g(t), h(t) polinmios mnicos primos entre si,
tais que L um zero do polinmio f (t) = g(t)h(t). Ento os subespaos ker g(L) e ker g(L)
so invariantes sob L e
V = ker g(L) ker h(L)
Sabemos que L um zero de seu polinmio caracterstico. Vamos provar que todo
polinmio que tem L como zero possui os mesmos fatores irredutveis. Dentre eles,
destaca-se o de menor grau, denominado de polinmio mnimo de L.
Definio 11.8 Seja L : V V um operador linear. O polinmio mnimo de L aquele
polinmio mnico de menor grau para o qual m(L) = 0.

126

Notas de aula do Prof. Antonio Cndido Faleiros

Teorema 11.9 Toda matriz quadrada possui um nico polinmio mnimo.


Prova. (Existncia) Sabemos que a matriz L um zero do seu polinmio caracterstico
e assim, existe pelo menos um polinmio no nulo que possui L como zero. Considere
o conjunto de todos os polinmios mnicos que se anulam em L. Existe pelo menos um
polinmio no nulo de grau mnimo neste conjunto. Este um polinmio mnimo de L.
(Unicidade) Seja m(t) o polinmio mnico de menor grau para o qual m(L) = 0. Seja
f (t) outro polinmio mnico de mesmo grau que m(t) e que possui L como zero. Ento
g(t) = f (t) m(t) no nulo e seu grau menor que o grau de m(t). Ao mesmo tempo,
g(L) = 0, contrariando a hiptese de m(t) ser o polinmio de menor grau que possui L
como zero.
Teorema 11.10 O polinmio mnimo de L divide todo polinmio que tem L como zero.
Em particular, o polinmio mnimo de L divide o polinmio caracterstico de L.
Prova. Seja m(t) o polinmio mnimo de L e f (t) um polinmio mnico para o qual
f (L) = 0. O grau de f (t) maior do que o grau de m(t) e, pelo algoritmo da diviso,
f (t) = q(t)m(t)+r(t), onde grau(r) < grau(m). Existem duas possibilidades: r(t) = 0 ou
r(t) 6= 0. Esta possibilidade, r(t) 6= 0, deve ser descartada pois nos leva a uma contradio,
considerando-se que r(A) = 0 e o grau(r) < grau(m). Logo, r(t) = 0 e m(t) divide f (t).

Teorema 11.11 Seja m(t) o polinmio mnimo e (t) o polinmio caracterstico de um


operador linear L : V V. Se a dimenso de V for n, ento (t) divide m(t)n .
Prova. Seja f (t) = c0 + c1 t + c2 t2 + + tr , qualquer polinmio mnico para o qual
f (L) = 0 ou
c0 I + c1 L + c2 L2 + + Lr = 0,
onde se pode explicitar c0 I

c0 I = c1 L c2 L2 Lr .
Esta expresso pode ser usada para eliminar c0 I em f (t)I.
f (t)I =
=
=
=

c0 I + c1 tI + c2 t2 I + + tr I
c1 (tI L) + c2 (t2 I L2 ) + + (tr I Lr )
(tI L)(c1 + c2 (tI + L) + + (tr1 I + tr2 L + + Lr1 ))
(tI L)B(t).

Se f (t) for o polinmio mnimo m(t) de L, vale (tI L)B(t) = m(t)I. Calculando o
determinante dos dois membros, segue
(t) det B(t) = m(t)n .

Notas de aula do Prof. Antonio Cndido Faleiros

127

Teorema 11.12 Os polinmios mnimo e caracterstico de um operador linear L possuem


os mesmos fatores irredutveis. Logo, possuem as mesmas razes.
Prova. Seja m(t) o polinmio mnimo e (t) o polinmio caracterstico de L.
Pelo teorema anterior, (t) divide m(t)n . Assim, os fatores irredutveis de (t) devem
ser fatores irredutveis de m(t)n que possui os mesmos fatores irredutveis que m(t).
Por outro lado, m(t) divide (t). Logo, os fatores irredutveis de m(t) tambm devem
ser fatores irredutveis de (t). Isto prova o teorema.
Corolrio 11.13 Um escalar um autovalor de um operador linear L se e s se for
uma raiz do polinmio mnimo de L.
Exemplo 11.14 Considere a matriz

2 2 5
A = 3 7 15 .
1 2 4



5
2
1

1
, eigenvectors:
, 0
1, 3 3Seu polinmio caracterstico

0
1
1
(t) = (t 1)2 (t 3).

Os candidatos a polinmio mnimo so (t) e


f (t) = (t 1)(t 3).
J sabemos que (A) = 0. Vamos verificar se f (A) = 0. Sendo f (t) = t2 4t + 3, um
clculo simples mostra que f (A) = A2 4A + 3I = 0. Logo, f (t) o polinmio mnimo
de A.
Exemplo 11.15 O polinmio caracterstico e mnimo da matriz

5 2 0
0 5 2
0 0 5
so ambos iguais a (t 5)3 .

Exemplo 11.16 Dada a matriz

5 2 0
A = 0 5 0 ,
0 0 5

seu polinmio caracterstico (t 5)3 e seu polinmio mnimo (t 5)2 .

128

Notas de aula do Prof. Antonio Cndido Faleiros

Exemplo 11.17 Dada a matriz

5 0 0
A = 0 5 0 ,
0 0 5

seu polinmio caracterstico (t )3 e seu polinmio mnimo (t ) .


Exemplo 11.18 Os polinmios caracterstico e

0 0

1 0
A=
0 1
so ambos iguais a t3 5t2 3t 2.

mnimo de

2
3
5

Exemplo 11.19 Os polinmios caracterstico e mnimo de

0 0 0 2
1 0 0 3

0 1 0 5
0 0 1 7

so ambos iguais a t4 7t3 5t2 3t 2.

Exemplo 11.20 Os polinmios caracterstico

0 0 0
1 0 0

0 1 0
0 0 1

e mnimo de

a0
a1

a2
a3

so ambos iguais a t4 a3 t3 a2 t2 a1 t a0 .

5 6
tem dois autovalores: 4 e 7. Os autovetores
Exemplo 11.21 A matriz A =
2
3

3
2
. Os polinmios caracterstico e mnimo so
e
correspondentes a eles so
1
3
iguais (t) = m(t) = t2 3t 28. Assim

1
1 3
5 6
2 3
4 0
=
.
3 2
3 1
0 7
11 3 2

5 6
so 1 e 8 e os autovetores correspondentes
Exemplo 11.22 Os autovalores de
3 2

2
1
.
e
a eles so, respectivamente,
1
1

Notas de aula do Prof. Antonio Cndido Faleiros

129

5 1
Exemplo 11.23 A matriz C =
possui um nico autovalor real = 4 e um
1 3
1
. Os polinmios caracterstico e mnimo
nico autovetor linearmente independente
1
so iguais (t) = m(t) = t2 8t + 16.

2 2
so 1 e 4. Os autovetores correspondentes
Exemplo 11.24 Os autovalores de
1 3

1
2
. Os polinmios carcterstico e mnimo so iguais: t2 5t + 4.
e
so
1
1

4 1 1
Exemplo 11.25 Os autovalores de 2 5 2 so 3 e 5. Correspondente a 1 =
2

1 1
1
1
3 temos dois autovetores LI 1 e 0 . Correspondente a 2 = 5 temos um
0
1

1
autovetor LI 2 . Seu polinmio caracterstico (t) = (t 3)2 (t 5) e mnimo
1
m(t) = (t 3) (t 5) .

3 1 1
Exemplo 11.26 Os autovalores de A = 0 6 3 so 3 e 5. Correspondentes ao
0 1
2


1
1

1
0 .
e
autovalor 1 = 3 temos dois autovetores linearmente independentes,
0
1

1

2 . O
Todos os autovetores correspondentes ao autovalor 2 = 5 so mltiplos de
1
2
polinmio caracterstico de A (t) = (t 3) (t 5) e o polinmio mnimo m(t) =
(t 3) (t 5) .

3 1 1
Exemplo 11.27 Os autovalores de 7 5 1 so 2 e 4 e os autovetores corre6 6 2

1
0

1
1 . O polinmio caracterstico e mnimo so (t) = m(t) =
spondentes so
e
0
1
2
(t 4) (t + 2) .

2 0 0
Exemplo 11.28 Dada a matriz 0 2 0 , seu polinmio caracterstico (t 2)3 e
0 0 2
seu polinmio mnimo t 2.

130

Notas de aula do Prof. Antonio Cndido Faleiros

2 1 0
Exemplo 11.29 Dada a matriz 0 2 0 , seu polinmio caracterstico (t 2)3 e
0 0 2
2
seu polinmio mnimo (t 2) .

2 1 0
Exemplo 11.30 Dada a matriz 0 2 1 , seu polinmio caracterstico (t 2)3 e
0 0 2
3
seu polinmio mnimo (t 2)

Exemplo 11.31 Dada a matriz

2
0
0
0
0

0
2
0
0
0

0
0
2
0
0

0
0
0
2
0

0
0
0
0
2

2
0
0
0
0

1
2
0
0
0

0
1
2
0
0

0
0
0
2
0

0
0
0
0
2

, seus autovetores

1
0
0
0
0

0
1
0
0
0


0
0
0
0 0 0

1 , 0 , 0 formam uma base de C5 . Seu polinmio caracterstico (t 2)5

0 1 0
1
0
0
e seu polinmio mnimo t 2.

0
1
2 1 0 0 0
0 0
0 2 0 0 0

Exemplo 11.32 Dada a matriz


0 0 2 0 0 , seus autovetores so 0 , 1 ,
0 0
0 0 0 2 0
0
0
0 0 0 0 2

0
0
0 0

0 , 0 , seu polinmio caracterstico (t 2)5 e seu polinmio mnimo (t 2)2 .

1 0
1
0

Exemplo 11.33 Dada a matriz

0
0
0
0
1

, seus autovetores so

1
0
0
0
0

, seu polinmio caracterstico (t 2)5 e seu polinmio mnimo (t 2)3 .

0
0
0
1
0

Notas de aula do Prof. Antonio Cndido Faleiros

131

0
1
2 1 0 0 0
0 0
0 2 1 0 0

, seus autovetores so 0 0
0
0
2
1
0
Exemplo 11.34 Dada a matriz

0 0
0 0 0 2 0
1
0
0 0 0 0 2
5
4
polinmio caracterstico: (t 2) , polinmio mnimo: (t 2) .

2 1 0 0 0
0 2 1 0 0

Exemplo 11.35 Dada a matriz


0 0 2 1 0 , seus autovetores so
0 0 0 2 1
0 0 0 0 2

1
0

0 , seu polinmio caracterstico (t 2)5 e seu polinmio mnimo (t 2)5

0
0

Nota 11.36 Parece-me que d para tirar uma regra para calcular a multiplicidade geomtrica de um autovalor: Calcule os polinmios caracterstico e mnimo da matriz e
fatore-os. Se o polinmio caracterstico possuir o fator (t )n o polinmio caracterstico ter o fator (t )m com m n. O nmero de autovetores correspondentes a
(multiplicidade geomtrica de ) n m + 1.

11.2

Matrizes em bloco

*** Incluir casos mais gerais do que apenas diagonais em bloco.


Se A e B forem matrizes quadradas, ento

A 0
D=
,
0 B
onde 0 so matrizes retangulares nulas, uma matriz diagonal em bloco. Se f (t) for
um polinmio em t, ento

f (A)
0
.
f (D) =
0
f (B)
Teorema 11.37 Sejam A1 e A2 so matrizes quadradas e

A1 0
A=
0 A2
uma matriz diagonal em bloco. Ento o polinmio mnimo de A igual ao mnimo mltiplo
comum dos polinmios mnimos dos blocos diagonais A1 e A2 .

132

Notas de aula do Prof. Antonio Cndido Faleiros

Prova. Sejam m(t), m1 (t) e m2 (t) os polinmios mnimos de A, A1 e A2 , respectivamente. Vamos provar que m(t) = mmc{m1 (t), m2 (t)}. Sendo m(t) o polinmio mnimo
de A, ento

m(A1 )
0
0 0
m(A) =
=
.
0
m(A2 )
0 0
Conclui-se que m(A1 ) = m(A2 ) = 0. Logo, m1 (t) e m2 (t) dividem m(t) e da, m(t)
multiplo comum de m1 (t) e m2 (t).
Vamos mostrar que A uma raiz de todo polinmio mltiplo de m1 (t) e m2 (t). Sendo
f (t) um mltiplo comum de m1 (t) e m2 (t), ento

0 0
f (A1 )
0
=0
=
f (A) =
0 0
0
f (A2 )

pois f (A1 ) = 0 e f (A2 ) = 0. Da A um zero de todo mltiplo comum de m1 (t) e m2 (t).


Sendo o polinmio mnimo o polimio de menor grau que possui A como raiz, m(t) o
mnimo mltiplo comum de g(t) e h(t).
Teorema 11.38 Seja A uma matriz diagonal em bloco, cujos blocos diagonais so A1 ,
A2 , . . . , Ar . Ento o polinmio mnimo de A igual ao mnimo mltiplo comum (mmc)
dos polinmios mnimos dos blocos diagonais Ai
mA (t) = mmc{ mA1 (t), mA2 (t), . . . , mAr (t) }.
Prova. A prova usa o teorema anterior e induo em r.
Nota 11.39 Frisamos que este teorema se aplica a matrizes diagonais em blocos, enquanto o Teorema (10.9) que anlogo a este e se refere aos polinmios caractersticos,
aplica-se a matrizes triangulares em blocos.

11.3

Decomposio primria

Teorema 11.40 Seja L : V V uma transformao linear e W invariante sob L. Seja


LW : W W a restrio de L em W. Sob estas hipteses, o polinmio mnimo de LW
divide o polinmio mnimo de L.
Prova. Se m(t) for o polinmio mnimo de L, ento m(L) = 0. Para todo w W,
temos m(LW )(w) = m(L)(w) = 0. Sendo LW um zero de m(t), o polinmio mnimo de
LW divide o polinmio mnimo de L.
Lembramos que, se f (t) e g(t) forem dois polinmios quaisquer,
f (t)g(t) = mdc(f (t), g(t))mmc(f (t), g(t))

Notas de aula do Prof. Antonio Cndido Faleiros

133

Teorema 11.41 Seja L : V V uma transformao linear, V1 e V2 invariantes sob L


de modo tal que V = V1 V2 . Sejam L1 e L2 as restries de L a V1 e V2 .
1. O polinmio mnimo de L o mnimo mltiplo comum dos polinmios mnimos de
L1 e L2 .
2. O polinmio caracterstico de L o produto dos polinmios caractersticos de L1 e
de L2 .
Prova. 1. Sejam m(t), m1 (t) e m2 (t) os polinmios mnimos de L, L1 e L2 , respectivamente. Pelo teorema anterior, m(t) divisvel por m1 (t) e por m2 (t).
Seja f (t) outro polinmio que tem L por raiz. Ento f (L1 ) = f (L2 ) = 0 e f divisvel
por m1 (t) e m2 (t). Provamos que todo polinmio que tem L por raiz mltiplo comum
de m1 (t) e m2 (t). Sendo m(t) o polinmio de menor grau que tem L como raiz,
m(t) = mmc(m1 (t), m2 (t)).
2. Se B1 = {u1 , . . . , ur } for uma base de V1 e B2 = {w1 , . . . , ws } for uma base de V2 ,
ento a unio B1 B2 uma base de V. Como V1 e V2 so invariantes sob L, para j = 1,
. . . , r, tem-se
r
X
Luj =
aij ui
i=1

e, para j = 1, . . . , s,

Lwj =

r
X

bij wi .

i=1

A matriz da transformao linear L nesta base triangular em bloco

A 0
.
M=
0 B
Consequentemente,
det(tI M) = det(tI A) det(tI B) = L1 (t)L2 (t).

Nota 11.42 No teorema anterior, se m1 (t) e m2 (t) forem primos entre si, ento m(t) =
m1 (t)m2 (t).
Teorema 11.43 Seja L : V V linear e g(t), h(t) polinmios mnicos primos entre si,
tais que L um zero do polinmio f (t) = g(t)h(t). Ento:
1. Os subespaos ker g(L) e ker h(L) so invariantes sob L e
V = ker g(L) ker h(L)

134

Notas de aula do Prof. Antonio Cndido Faleiros

2. Se f (t) for o polinmio mnimo de L, ento g(t) e h(t) so os polinmios mnimos


das restries de L ao ker g(L) e ao ker h(L), respectivamente.
Prova. Inicialmente, observamos que ker g(L) e ker h(L) so invariantes sob L.
1. Como g(t) e h(t) so primos entre si, existem polinmios r(t) e s(t) tais que
r(t)g(t) + s(t)h(t) = 1,
acarretando na igualdade
I = r(L)g(L) + s(L)h(L).
Sendo v um elemento de V, podemos escrever
v = r(L)g(L)v + s(L)h(L)v.
Nesta soma, r(L)g(L)v pertence ao ker h(L) e w = s(L)h(L)v pertence ao ker g(L).
De fato,
h(L)r(L)g(L)v = r(L)g(L)h(L)v = r(L)f (L)v = 0
pois f (L) = 0. De modo anlogo se prova que s(L)h(L)v pertence ao ker g(L).
Consequentemente,
V = ker g(L) + ker h(L).
Para completar a prova deste item, falta mostrar que esta decomposio nica.
Seja v = u+ w, uma decomposio de v, com u ker g(L) e w ker h(L). Ento,
u = r(L)g(L)u + s(L)h(L)u = s(L)h(L)u
= s(L)h(L)(u + w) = s(L)h(L)v.
De modo semelhante se prova que w = s(L)h(L)v.
Como a decomposio nica,
V = ker g(L) ker h(L).
2. Se f (t) = g(t)h(t) for o polinmio mnimo de L, ento ele divisvel pelos polinmios
mnimos m1 (t) e m2 (t) de L1 e L2 , como j se provou.
Por outro lado, g(L1 ) = 0 e h(L2 ) = 0. Portanto, m1 (t) divide g(t) e m2 (t) divide
h(t). Como g(t) e h(t) so primos entre si, o mesmo ocorre com m1 (t) e m2 (t) que
os divide.
Sendo m1 (t) e m2 (t) primos entre si e f (t) = mmc{m1 (t), m2 (t)}, segue
f (t) = m1 (t)m2 (t).
Por outro lado, f (t) = g(t)h(t), de onde segue que m1 (t) = g(t) e m2 (t) = h(t).

Notas de aula do Prof. Antonio Cndido Faleiros

135

Teorema 11.44 (Decomposio primria) Seja L : V V linear cujo polinmio mnimo


igual a
m(t) = f1 (t)n1 fr (t)nr
onde os polinmios fi (t) so mnicos, distintos e irredutveis. Ento fi (t)ni so os
polinmios mnimos das restries de L a Wi = ker (fi (L)ni ) e
V = W1 Wr .
Prova. Para simplificar a prova, vamos abordar o caso particular em que m(t) =
f1 (t)n1 f2 (t)n2 onde f1 (t), f2 (t) so polinmios mnicos, distintos e irredutveis. Certamente, f1 (t)n1 e f2 (t)n2 so primos entre si. Este teorema decorre imediatamente do
anterior.
De fato, sabemos que V = W1 W2 , onde Wi = ker fi (t)ni e que fi (t)ni , o polinmio
mnimo da restrio de L em Wi .
Teorema 11.45 Uma transformao linear L : V V possui uma representao matricial diagonal se e s se seu polinmio mnimo,
m(t) = (t 1 ) (t r )
for um produto de polinmios lineares distintos. Os elementos da diagonal principal desta
matriz so os autovalores 1 , . . . , r de L.
Prova. 1. Se L possui uma representao matricial diagonal D = diag( 1 , . . . , n ),
admitamos que apenas os r primeiros i so distintos. O polinmio caracterstico desta
transformao linear da forma (t) = (t 1 )n1 (t r )nr . O polinmio mnimo
possui os mesmos fatores de (t). Como (D 1 I) (D r I) = 0 o polinmio mnimo
de L (t 1 ) (t r ).
2. Sendo m(t) = (t 1 ) (t r ), ento existe uma decomposio de V numa soma
direta W1 Wr , onde Wi = ker(L i I) o autoespao de V correspondente ao
autovalor i . Se Bi = {vi1 , vi2 , . . . , visi } for uma base de Wi , ento L(vij ) = i vij . Seja B
a unio das bases Bi , para i = 1, . . . , r, que uma base de V. Nesta base, a matriz que
representa L diagonal.

11.4

Diagonalizao de operadores normais

Um operador L : V V diagonalizvel se existir uma base {v1 , . . . , vn } de V tal que


a matriz de L nesta base diagonal. Isto significa que a matriz de L numa base qualquer

136

Notas de aula do Prof. Antonio Cndido Faleiros

semelhante a uma matriz diagonal. Isto significa que, se A for a matriz de L numa base
de V, ento existe uma matriz inversvel P e uma matriz diagonal D tais que
A = P DP 1 .
Podemos nos perguntar qual a condio mais geral que um operador linear deve satisfazer para ser diagonalizvel. Quando o operador linear L : V V auto-adjunto,
antiadjunto ou unitrio, ento LL = L L. Esta a condio mais geral sob a qual um
operador diagonalizvel.
Definio 11.46 Um operador linear L : V V normal quando
LL = L L.
A matriz quadrada A que satisfaz AA = A A denominada matriz normal.
Exemplo 11.47 Os operadores auto-adjuntos, antiadjuntos e unitrios so normais.
Exemplo 11.48 Se L for normal, I for o operador identidade e um escalar, ento o
operador L I normal.
autovalor de L . Se L for um operador normal,
Se for autovalor de L, ento
provaremos logo em seguida que v autovetor de L correspondente ao autovalor se e s

se v for autovetor de L correspondente ao autovalor .


Quando L no normal, os autovetores de L no so, necessariamente, os autovetores
de L .
Seja V um espao vetorial de dimenso finita com produto interno e L : V V um
operador linear. Se S for um subespao de V invariante sob L ento S invariante sob
L . Agora, quando L for normal e S for invariante sob L, provaremos que tanto S quanto
S so invariantes sob L e L .
Teorema 11.49 Seja L um operador normal sobre um espao vetorial de dimenso finita
com produto interno. Se v for autovetor de L correspondente ao autovalor , ento v

autovetor de L correspondente ao autovalor .


Prova. Se L normal, LL = L L e, portanto, hLv, Lwi = hL v, L wi para todo
v e w em V. Em particular, para todo v em V, hLv, Lvi = hL v, L vi que nos fornece a

igualdade kLvk = kL vk . Para todo escalar , T = L I normal pois T = L I.

Sendo T normal, kT vk = kT vk para todo v em V. Desta forma, T v = 0 se e s se T v =


0. Conclui-se que v autovetor de L se e s se for autovetor de L .
Se for autovalor de L, seja v o autovetor correspondente. No item anterior provou-se
que v autovetor de L . Sendo o autovalor correspondente segue
hv, vi = hv, vi = hLv, vi = hv, L vi = hv, vi .


Sendo hv, vi 6= 0, segue = .

Notas de aula do Prof. Antonio Cndido Faleiros

137

Teorema 11.50 Seja L uma transformao normal sobre um espao vetorial de dimenso
finita com produto interno V. Ento
1. V possui uma base ortonormal formada por autovetores de L.
2. Seja A uma matriz complexa normal de ordem n. Existe uma matriz unitria U e
uma matriz diagonal D para as quais
A = U DU 1 .
Prova. 1. Seja n a dimenso de V. A transformao L possui pelo menos um autovetor
v de mdulo unitrio. O subespao vetorial W = ger(v) e W so invariantes sob L e
sob L . A dimenso de W 1 e a de W n 1.
Vamos provar que a restrio T de L em W normal. Para todo v e w em W
temos hv, T wi = hT v, wi = hLv, wi = hv, L wi de onde conclumos que o adjunto de T
a restrio de L a W . Para todo v em W , T T v = LL v = L Lv = T T v, mostrando
que T normal.
O teorema agora ser demonstrado por induo na dimenso n do espao.
Se n = 1, nada resta a provar: a base de V contm apenas um autovetor v1 de norma
unitria.
Vamos supor, como hiptese de induo, que o teorema vale para todos os operadores
normais em espaos vetoriais de dimenso n 1.
Provemos que o teorema vale para todo operador normal L definido em um espao
vetorial V de dimenso n. Seja v1 um autovetor de L e W = ger(v1 ). Seja T a restrio
de L a W . O operador T normal em W que tem dimenso n 1. Pela hiptese de
induo, W possui uma base ortonormal {v2 , . . . , vn } cujos elementos so autovetores de
T. Os autovetores de T so autovetores de L. Ao incluirmos v1 a este conjunto, obtemos
a base ortonormal {v1 , v2 , . . . , vn } formada por autovetores de L. Nela, a representao
matricial de L diagonal.
Teorema 11.51 Seja L um operador linear sobre um espao vetorial V de dimenso
finita. Se V possuir uma base ortonormal formada por autovetores de L, ento L
normal.
Prova. Seja B = {v1 , . . . , vn } uma base ortonormal de V cujos elementos so autovetores de L, de modo que Lvi = i vi para i = 1, . . . , n. O escalar i o autovalor de L
correspondente ao autovetor vi . Se decompondo L vi na base B, podemos escrever
X
aij vj
L vi =
j

onde, graas ortonormalidade da base B, aij = hL vi , vj i . Por outro lado,


aij = hL vi , vj i = hvi , Lvj i = hvi , j vj i = j hvi , vj i = j ij .

138

Notas de aula do Prof. Antonio Cndido Faleiros

i , de modo que L vi =
i vi . Mostramos
Isto significa que aij = 0 quando i 6= j e aii =

i vi =
i . Portanto, L Lvi = i
assim que vi autovetor de L correspondente ao autovalor
2
2

|i | vi e LL vi = i i vi = |i | vi . Sendo as transformaes L L e LL iguais em cada


elemento da base, so iguais no espao todo, provando que L normal.
Seja V um espao vetorial de dimenso finita com produto interno e L : V V uma
transformao normal. Sejam 1 , . . . , r os autovalores de L e Si = {v V : Lv = i v}
o autoespao do autovalor i . Se {v1i , . . . , vsi } for uma base ortonormal de Si , ento,
para todo v em Si temos L(v) = i hv1i , vi v1i + + i hvsi , vi vsi = i Pi (v), onde Pi
a projeo ortogonal de V sobre Si . Logo L coincide com i Pi em Si . Se a soma dos
autoespaos Si resultar numa decomposio de V em soma direta, ento
L = 1 P1 + + n Pn .
Teorema 11.52 (Verso projetiva do teorema espectral) Seja V um espao vetorial complexo com produto interno e dimenso n. Seja L : V V um operador normal e {v1 ,
. . . , vn } uma base ortonormal de V, formada pelos autovalores de L. Os autoespaos Si =
auto(i ), i = 1, . . . , r, so ortogonais dois a dois e sua soma igual a V. Se Pi : V V
for a projeo ortogonal sobre Si , ento
P1 + + Pn = I
e
L = 1 P1 + + n Pn .
Teorema 11.53 (Verso do teorema espectral para matriz real simtrica) Seja A uma
matriz normal de ordem n. Sejam 1 , . . . , r seus autovalores distintos. Ento
A = 1 P1 + + r Pr
onde Pi so as matrizes que projetam ortogonalmente sobre o autoespao de i . Estes
autoespaos so ortogonais e sua soma direta igual a Cn , de modo que
P1 + + Pk = I.

7
4 5
Exemplo 11.54 A matriz A = 4 2 4 simtrica. Seus autovalores so
5 4
7
6, 12 e 6. Os autovetores correspondentes so (1, 1, 1)T , (1, 0, 1)T e (1, 2, 1)T .
Para montar S tal que A = SDS 1 , tomamos as colunas de S iguais aos autovetores
normalizados

1/3 1/ 2 1/ 6
6 0 0
S = 1/3
e
D = 0 12 0 .
0
2/ 6
0 0 6
1/ 3 1/ 2
1/ 6

Notas de aula do Prof. Antonio Cndido Faleiros

139

Podemos escrever A como uma combinao linear de matrizes de projeo


A = 6P1 + 12P2 6P3 ,
onde

1/3 1/3 1/3


1/2 0 1/2
1 2 1
1
0
0 e P3 = 2 4 2
P1 = 1/3 1/3 1/3 , P2 = 0
6
1/3 1/3 1/3
1/2 0 1/2
1 2 1

0
1 1
Exemplo 11.55 A matriz A = 1 0 2 anti-simtrica. Seus autovalores so
1 2 0

0, i 5 e i 5. Os autovetores correspondentes so (2, 1, 1), (.4 .4899i, .2 .9798i,


1) e (.4 + .4899i, .2 + .9798i, 1).

1/3
Exemplo 11.56 A matriz A = 1/3
1/ 3
ores so 1; 0, 9381+ 0, 3464i e 0, 9381

2/ 6
9
1/6 1/ 2 ortogonal. Seus autoval1/ 6 1/ 2
0, 3464i. Os autovetores correspondentes so

(0, 5176; 1; 0, 4142),


(0, 1691 + 0, 9463i; 0, 3267 + 0, 4898i; 1),
(0, 1691 0, 9463i; 0, 3267 0, 4898i; 1).

11.5

Decomposio de Schur

Teorema 11.57 Dada uma matriz complexa A de ordem n, existe uma matriz unitria
U tal que
T = U AU
triangular superior.
Prova. Ser usada a induo sobre n. Se n = 1, A triangular superior e nada resta
a provar. Se n > 1, assuma, como hiptese de induo, que o teorema verdadeiro para
toda matriz quadrada de ordem n 1. Seja q1 um autovetor unitrio correspondente a um
autovalor 1 de A. Construa uma base de Cn onde um dos elementos q1 . Use o processo
de ortogonalizao de Gram-Schmidt para obter uma base ortonormal {q1 , . . . , qn } de
Cn . A matriz
U1 = [q1 , . . . , qn ]
unitria e
U1 AU1

1 b1
0 A1

140

Notas de aula do Prof. Antonio Cndido Faleiros

onde A1 uma matriz quadrada de ordem n 1. De acordo com a hiptese de induo,


existe uma matriz unitria V1 de ordem n 1 tal que
T1 = V1 A1 V1
triangular superior. A matriz
U2 =

1 0
0 V1

unitria e, sendo U = U1 U2 , segue


U AU = U2 (U1 AU1 ) U2

1 b1
1 0
1 0
=
0 A1
0 V1
0 V1

b1 a1
1 b1 a1
1
=
=T
=
0 V1 A1 V1
0 T1
que triangular superior.
Como A e T so semelhantes, possuem os mesmos autovalores e com a mesma multiplicidade. Sendo T triangular superior, os elementos da diagonal principal so seus
autovalores e, consequentemente, autovalores de A.
Nota 11.58 Sejam 1 , . . . , n os elementos da diagonal principal de T. Como matrizes
semelhantes possuem o mesmo determinante e o mesmo trao, segue
det(A) = 1 n

tr(A) = 1 + + n .

Teorema 11.59 (Teorema Espectral). Se H uma matriz hermitiana, existe uma matriz
unitria U tal que U HU diagonal.
Prova. Pelo teorema de Schur, existe U unitria tal que U HU = T triangular
superior. Como T = U H U = U HU = T, vemos que T simtica. Logo, tambm
triangular inferior, ou seja, diagonal.

0 1
no hermitiana mas ortogonalmente diagonalizvel, com
A matriz A =
1 0
1
U=
2

1 i
i 1

A matriz mais geral diagonalizvel a normal.


Teorema 11.60 Uma matriz de ordem n diagonalizvel unitariamente se e s se for
normal.

Notas de aula do Prof. Antonio Cndido Faleiros

141

Prova. Se A for uma matriz de ordem n diagonalizvel unitriamente, existe uma


matriz unitria U tal que D = U AU diagonal. Como D e D so diagonais, segue
que DD = D D, ou (U AU)(U A U) = (U A U )(U AU) de onde segue U AA U =
U A AU. Multiplicando esquerda por U e direita por U , obtemos AA = A A,
provando que A normal.
Se A for normal, ento AA = A A. Pelo teorema de Schur, existe uma matriz unitria
U tal que T = U AU triangular superior. Vamos provar por induo em n que T
diagonal. Se n = 1, a matriz T diagonal. Se n > 1, ento
T T = T T.
Sendo T = [tij ], ento igualando os elementos (1, 1) em na igualdade acima, obtemos
|t11 |2 + |t12 |2 + + |t1n |2 = |t11 |2
pois T triangular superior. Segue que t12 = = t1n = 0. Logo T tem a forma de blocos

t11 0
T =
0 T1
onde T1 normal e, por hiptese de induo, diagonal. Cnclui-se da que T diagonal,
completando a prova do teorema.

Nota 11.61 As matrizes normais reais 2 2 so as matrizes simtricas e aquelas com a


forma

a b
b a

11.6

Decomposio em valores singulares

Seja A uma matriz complexa m por n. A matriz A A auto-adjunta e seus autovalores


so todos positivos ou nulos. Podemos posicion-los em ordem descrescente
1 2 n 0.
Sendo A A auto-adjunta, existe uma base ortonormal {q1 , . . . , qn } de Cn onde qi o
autovetor correspondente ao autovalor i . A matriz
Q = [q1 , . . . , qn ]
cujas colunas so os autovetores de A A, unitria e
A AQ = QD

142

Notas de aula do Prof. Antonio Cndido Faleiros

onde
D = diag(1 , . . . , n ) uma matriz quadrada diagonal nn. Como i 0, definimos
i = i 0. Seja r n o nmero de valores i diferentes de zero, de modo que
1 r > 0

r+1 = = n = 0.

Para i = 1, . . . , r os vetores de Cm definidos por


1
pi = Aqi
i

formam um conjunto ortonormal. Uma vez que qr+1 , . . . , qn esto no ncleo de A (pois
so levados por A em 0), o conjunto {p1 , . . . , pr } uma base ortonormal da imagem de
A e, por este motivo r o posto de A que deve ser menor ou igual a m.
Para provar que {p1 , . . . , pr } um conjunto ortonormal, basta calcular, para 1 i,
j r, o produto interno
1
1
hAqi , Aqj i =
hqi , A Aqj i
hpi , pj i =
ij
i j
2
j
j
=
hqi , qj i =
hqi , qj i = ij .
ij
i
Pode-se completar {p1 , . . . , pr } de modo a obter uma base ortonormal {p1 , . . . , pr , pr+1 ,
. . . , pm } de Cm .
A matriz m m
P = [p1 , . . . , pr , pr+1 , . . . , pm ]
cujas colunas so os vetores pi , unitria e, pelo modo como foi construda,
AQ = P
onde
= diag{ 1 , . . . , r , 0, . . . , 0}.
uma matriz mn onde todos os elementos so nulos, excesso dos r primeiros elementos
da diagonal principal que so 1 r . Lembramos que r min(m, n).
Como Q unitria, obtemos a decomposio de A em valores singulares
A = P Q
Os nmeros reais 1 , . . . , r , 0, so denominado de valores singulares de A.
Usando a expresso de A deduzida acima, prova-se que
A AQ = Q

AA P = P

mostrando que as colunas qi de Q so autovetores da matriz A A, que as colunas pi de P


so autovetores da matriz AA e, tanto no primeiro quanto no segundo caso, autovetores
correspondentes aos autovalores 2i .
Lembramos que uma matriz diagonal mm e uma matriz diagonal nn.
Se A tiver posto mximo, ento r = min{m, n} e uma das duas matrizes, ou ,
possui todos os termos diagonais diferentes de zero e, portanto, no singular.
Provamos o seguinte teorema:

Notas de aula do Prof. Antonio Cndido Faleiros

143

Teorema 11.62 (Decomposio em valores singulares) Seja A uma matriz m n cujo


posto r (r min{m, n}). Ento:
1. Esta matriz possui r valores singulares 1 r no nulos (incluindo sua
multiplicidade).
2. Existe um conjunto ortonormal {q1 , . . . , qr } formado por autovetores de A A, correspondentes aos autovalores 21 2r tais que o conjunto
{p1 , . . . , pr } = {

1
1
Aq1 , . . . , Aqr }
1
r

uma base ortonormal da imagem de A.


3. Se {qr+1 , . . . , qn } for uma base ortonormal do ncleo de A, ento {q1 , . . . , qr , qr+1 ,
. . . , qn } uma base ortonormal de Cn . Sendo
{ p1 , . . . , pr , pr+1 , . . . , pm }
uma base ortonormal de Cm , ento
A = P Q
onde
P = [p1 , . . . , pm ]
Q = [q1 , . . . , qn ]
= diag( 1 , . . . , r )
onde apenas os primeiros r elementos da diagonal principal so diferentes de zero e
iguais a 1 , . . . , r .

1 2 0
.
Exemplo 11.63 Obtenha a decomposio em valores singulares de A =
2 1 0

1 2 0 1
Exemplo 11.64 Obtenha a decomposio em valores singulares de A = 1 0 2 1 .
2 2 2 2

6 6 6 6
6 8 4 6

Ento A A =
6 4 8 6 cujos autovalores so 24, 4, 0 e 0.Os autovetores corre6 6 6 6
spondentes a eles so

1
0
3
0

1
1 , 1 1 , 1 1 , 1 1
2 1
2 1
12 1
6 1
1
0
1
2

144

Notas de aula do Prof. Antonio Cndido Faleiros

Assim,

1/2
0 3/ 12
0
24
0
0
0
1/2 1/ 2 1/ 12 1/ 6

, = 0 2 0 0 .
Q=
1/2 1/ 2
1/12 1/ 6
0 0 0 0
1/2
0
1/ 12
2/ 6

Para determinar P, calculamos p1 = (1/ 24)Aq1 e p2 = (1/2)Aq2 para obter


1
1
1
1
1 ,
1 .
6
2
2
0

Como o contradomnio de A tem dimenso 3, precisamos de mais um vetor para formar

T
unitrio e fazendo-o ortogonal a p1 e a p2 .
a base. Calculamos p3 = p13 p23 p33

T
. Com estes vetores montamos
Obtemos ento p3 = (1/ 3) 1 1 1



1/6 1/ 2 1/3
P = 1/6 1/ 2
1/ 3 .
2/ 6
0
1/ 3

Nota: Na decomposio em valores singulares de A, AQ = P , de modo que P


kAq1 k2 =
k 1 p1P
k2 = 1 . Por outro lado, para qualquer x em Rn com kxk2 = 1, temos x = ni=1 i qi
onde ni=1 2i = 1. Da,
2 r
2
n
r

X
X
X

2
i Aqi =
i i pi =
2i 2i kpi k22
kAxk2 =

i=1

i=1

i=1

sendo a segunda igualdade verdadeira pois Aqi = 0 para i > r e a ltima igualdade se
justifica pela ortogonalidade dos pi . Como kpi k2 = 1, segue
kAxk22 =

r
X
i=1

2i 2i 21

r
X
i=1

2i 21

n
X

2i = 21 .

i=1

A primeira desigualdade se justifica pois 1 o maior valor singular e a segunda por termos
acrescentado parcelas positivas soma. Provamos que kAxk22 21 e que kAq1 k2 = 1 .
Logo,
kAk2 = sup kAxk2 = 1 .
xRn
kxk2 =1

Se restringirmos A ao espao ger(q1 ) podemos calcular 2 , repetindo o procedimento


acima
2 = sup kAxk2 .
xhq1 i
kxk2 =1

Certamente a decomposio por valores singulares no nica pois a escolha de Q e


de P no nica. Entretanto, temos o seguinte teorema:

Notas de aula do Prof. Antonio Cndido Faleiros

145

Teorema 11.65 Se
A = U ST
for outra decomposio por valores singulares de A, ento S = , as colunas t1 , . . . , tn de
T formam um conjunto ortonormal de autovetores de A A correspondentes aos autovalores
1 2 r 0 = = 0, as colunas u1 , . . . , um de U so autovetores de AA
correspondentes aos mesmos autovalores e, para i = 1, . . . , r,
ui =

1
Ati .
i

Prova. Como A A = T S U U ST = T (S S)T , vemos que a matriz diagonal S S


semelhante matriz A A e, portanto, possuem os mesmos autovalores, o que prova a
igualdade S = .
Da decomposio acima, obtemos A AT = T S S de onde segue que as colunas de T
formam um conjunto ortonormal de autovetores de A A correspondentes aos autovalores
1 2 r 0 = = 0.
Da mesma decomposio, obtemos AA U = USS de onde segue que as colunas de U
formam um conjunto ortonormal de autovetores de AA correspondentes aos autovalores
1 2 r 0 = = 0.
Ainda da decomposio, segue AT = U S, mostrando que ui = 1i Ati para i = 1, . . . ,
r.

146

Notas de aula do Prof. Antonio Cndido Faleiros

Captulo 12
Forma cannica de Jordan
12.1

Operadores nilpotentes

Definio 12.1 Um operador linear L : V V nilpotente se Lk = 0 para algum


inteiro k positivo. O menor k para o qual Lk = 0 chamado de ndice da nilpotncia
de L.
Se o ndice da nilpotncia de L for k, significa que existe v em V tal que Lk1 v 6= 0.
Observe que Lk = 0 quando Lk v = 0 para todo v em V. Se L for nilpotente com ndice
k, seu polinmio mnimo ser tk e assim o seu nico autovalor o zero.
Teorema 12.2 Seja L : V V linear e v V no nulo tal que Lk1 (v) 6= 0 e Lk (v) = 0.
Ento:
1. O conjunto S = { v, Lv, . . . , Lk1 (v) } linearmente independente.
2. O subespao gerado por S invariante sob L.
3. A restrio de L ao subespao gerado por S nilpotente com ndice k.
4. A matriz da restrio de L ao subespao
S da forma

0 0 0
1 0 0

0 1 0

0 0 1

.. .. ..
. . .
Prova. Vamos provar um item por vez.

gerado por S em relao base ordenada


0
0
0
0
..
.

1. Sejam 1 , . . . , k escalares tais que 1 v+ + k Lk1 v = 0. Aplicando Lk1 a


esta igualdade, obtemos 1 Lk1 v = 0. Como Lk1 v 6= 0, segue 1 = 0. Aplicando
sucessivamente Li igualdade inicial, com i = k 2, k 3, . . . , 1, se prova que 2 =
3 = = k = 0, o que prova a primeira parte do teorema.
147

148

Notas de aula do Prof. Antonio Cndido Faleiros

2. Seja w = 1 v+ + k Lk1 v, onde 1 , . . . , k so escalares, um vetor no subespao


gerado por S. Assim, Lw = 1 Lv+ + k1 Lk1 v e, portanto, Lw pertence ao
subespao gerado por S.
3. Seja T : [S] [S] a restrio de L ao subespao [S] gerado por S. Como T k w =
0 para todo elemento de [S] e T k1 v = Lk1 v 6= 0, conclumos que T nilpotente
com ndice k.
4. Como T (v) = Lv, T (Lv) = L2 v, . . . , T (Lk2 v) = Lk1 v, T (Lk1 v) = 0 e conclumos
que a matriz de T na base S exatamente aquela apresentada no enunciado.

Em particular, quando L for nilpotente, seu ndice de nilpotncia menor ou igual


dimenso do espao vetorial.
Teorema 12.3 Seja L : V V linear. Para todo inteiro i 0,
1. ker Li ker Li+1
2. L(ker Li+1 ) ker Li .
Prova. Se v pertence ao ker Li , ento Li v = 0 e Li+1 v = L(Li v) = L0 = 0. Logo, v
pertence ao ker Li+1 , o que prova a primeira parte do teorema.
Seja w um elemento de L(ker Li+1 ) = {Lv : v ker Li+1 }. Ento w = Lv para algum
v no ker Li+1 . Assim, Li w = Li+1 v = 0, provando que w pertence ao ker Li . Provamos a
segunda parte do teorema.
Teorema 12.4 Seja L : V V linear e i > 0 um inteiro. Pelo teorema anterior,
ker Li1 ker Li ker Li+1 .
Suponhamos que
{ u1 , . . . , ur }
{ u1 , . . . , ur , v1 , . . . , vs }
{ u1 , . . . , ur , v1 , . . . , vs , w1 , . . . , wt }
sejam bases de ker Li1 , ker Li e ker Li+1 . Ento o conjunto
{ u1 , . . . , ur , Lw1 , . . . , Lwt }
linearmente independente e est contido no ker Li .

Notas de aula do Prof. Antonio Cndido Faleiros

149

Prova. O teorema anterior assegura que os vetores Lw1 , . . . , Lwt pertencem ao ker Li .
Sejam 1 , . . . , r , 1 , . . . , t escalares tais que
1 u1 + + r ur + 1 Lw1 + + t Lwt = 0.
Aplicando Li1 a esta igualdade, segue
Li ( 1 w1 + + t wt ) = 0,
mostrando que a combinao linear 1 w1 + + t wt pertence ao ker Li e pode ser escrito
como uma combinao linear de u1 , . . . , ur , v1 , . . . , vs
1 w1 + + t wt = c1 u1 + + cr ur + d1 v1 + + ds vs .
Sendo {u1 , . . . , ur , v1 , . . . , vs , w1 , . . . , wt } uma base, conclumos que todos os escalares
na igualdade acima so nulos e, em particular, 1 = = t = 0. Sendo {u1 , . . . , ur }
uma base, deve-se ter tambm 1 = = r = 0, o que prova a independncia linear do
conjunto de vetores { u1 , . . . , ur , Lw1 , . . . , Lwt }.
Este resultado interessante pois ele nos permite inferir que s t. Sabemos que a
dimenso do ker Li cresce com i ou permanece inalterada. Alm disso, o acrscimo na
dimenso quando passamos do ker Li para o ker Li+1 nunca maior do que o acrscimo
na dimenso quando passamos do ker Li1 para o ker Li . ***
Teorema 12.5 (Forma cannica de um operador nilpotente) Seja L : V V um operador nilpotente com ndice k. Existe uma base na qual a representao matricial de L tem
a forma bloco diagonal

N1 0
0
0 N2 0

N = 0
.
0
N

..
..
.. . .
.
.
.
.
Cada bloco diagonal Ni uma matriz quadrada que pode ser 1 1 e nula ou ter a forma

0 1 0 0 0
0 0 1 0 0

.. .. .. . . .. ..

. . . .
Ni = . . .

0 0 0 1 0

0 0 0 0 1
0 0 0 0 0

As ordens de todos os blocos so menores ou iguais a k. Pelo menos um bloco tem ordem k.
O nmero de blocos igual nulidade de L. O nmero de blocos do tipo N determinado
de modo nico por L.
Em lugar de demonstrar vamos dar exemplos.

150

Notas de aula do Prof. Antonio Cndido Faleiros

Exemplo 12.6 Seja L : V V um operador linear nilpotente com ndice k. Denotemos


por Wi o ncleo de Li . Relembre inicialmente que, se
{u1 , . . . , ur }
{u1 , . . . , ur , v1 , . . . , vs }
{u1 , . . . , ur , v1 , . . . , vs , w1 , . . . , wt }
forem bases de Wi1 , Wi e Wi+1 , respectivamente, ento o conjunto
{ u1 , . . . , ur , L(w1 ), . . . , L(wt ) }
linearmente independente em Wi . Este fato nos fornece os fundamentos para obter
uma base de V na qual a representao de um operador nilpotente se encontra na forma
cannica preconizada.
1. Imaginemos que V tem dimenso n = 8 e que L : V V nilpotente com ndice
k = 4. Assim o ker L4 = V. Denotemos o ker Li por Wi . Seja {u1 , u2 , u3 , u4 , u5 , u6 ,
u7 , u8 } uma base de V = W4 = ker L4 , de modo que
{u1 , u2 , u3 } base do ker L.
{u1 , u2 , u3 , u4 , u5 } base do ker L2 .
{u1 , u2 , u3 , u4 , u5 , u6 , u7 } base do ker L3 .
{u1 , u2 , u3 , u4 , u5 , u6 , u7 , u8 } base de V = ker L4 .
Podemos construir o seguinte quadro
u1
L3 u8
w1

W1
u2
L2 u7
w5

W2
u3
u10
w8

u4
L2 u8
w2

W3
u5
Lu7
w6

u6
Lu8
w3

u7
u9
w7

W4
u8
u8
w4

A base ordenada {u1 , . . . , u8 } da segunda linha da tabela anterior substituda pela


base ordenada da terceira linha, que so renomeados na quarta linha para {w1 , . . . ,
w8 }. Os vetores u9 e u10 da terceira linha so construdos de modo que {Lu8 , u9 }
gere o mesmo subespao que {u6 , u7 } e {L3 u8 , L2 u7 , u10 } gere o mesmo subespao
que {u1 , u2 , u3 }.
Na base {w1 , w2 , w3 , w4 , w5 , w6 , w7 ,

0 1 0
0 0 1

0 0 0

0 0 0

0 0 0

0 0 0

0 0 0
0 0 0

w8 } a matriz de L possui a forma

0 0 0 0 0
0 0 0 0 0

1 0 0 0 0

0 0 0 0 0

0 0 1 0 0

0 0 0 1 0

0 0 0 0 0
0 0 0 0 0

Notas de aula do Prof. Antonio Cndido Faleiros

151

2. Consideremos ainda que V tem dimenso n = 8 e que L : V V nilpotente com


ndice k = 4. Seja {u1 , u2 , u3 , u4 , u5 , u6 , u7 , u8 } uma base de V = W4 , de modo que
{u1 , u2 , u3 , u4 } base de W1
{u1 , u2 , u3 , u4 , u5 , u6 } base de W2
{u1 , u2 , u3 , u4 , u5 , u6 , u7 } base de W3
{u1 , u2 , u3 , u4 , u5 , u6 , u7 , u8 } base de W4
Podemos construir o seguinte quadro seguindo o esquema anterior.
W1
u1
L3 u8
w1

u2
Lu9
w5

W2
u3
u10
w7

Na base {w1 , w2 , w3 , w4 , w5 , w6 , w7 ,

0 1 0
0 0 1

0 0 0

0 0 0

0 0 0

0 0 0

0 0 0
0 0 0

12.2

u4
u11
w8

u5
L2 u8
w2

u6
u9
w6

W3
u7
Lu8
w3

W4
u8
u8
w4

w8 } a matriz de L possui a forma

0 0 0 0 0
0 0 0 0 0

1 0 0 0 0

0 0 0 0 0

0 0 1 0 0

0 0 0 0 0

0 0 0 0 0
0 0 0 0 0

Forma cannica de Jordan

Teorema 12.7 Seja L : V V linear com polinmio caracterstico e mnimo iguais a


(t) = (t 1 )n1 (t r )nr
m(t) = (t 1 )m1 (t r )mr .
Ento L possui uma representao matricial em bloco diagonal J, denominada de forma
cannica de Jordan do operador L, cujos elementos diagonais tm a forma

i 1 0 0 0
0 i 1 0 0
. .
.. ..

. . ...
. .
. .
Jij =
.
0 0 0 ... 1 0

0 0 0 i 1
0

Para cada i fixado,

0 i

152

Notas de aula do Prof. Antonio Cndido Faleiros

1. H pelo menos um Jij de ordem mi e todos os demais so de ordem menores ou


iguais a mi .
2. A soma das ordens dos Jij ni .
3. O nmero de Jij igual multiplicidade geomtrica de i , que igual nulidade
de Ni = (Li i I).
4. O nmero de blocos Jij de cada ordem possvel univocamente determinado por L.
A matriz Jij denominada bloco de Jordan pertencente ao autovalor i .
Observe que
Jij = i I + N
onde

um bloco nilpotente.

1 0 0 0

0 1 0 0

.. . .
. .

. .. ..
.

N =

.
0 0 0
.. 1 0

0 0 0 0 1
0 0 0 0 0
0
0
..
.

Exemplo 12.8 Seja L : R7 R7 linear, cujos polinmios caracterstico e mnimo so


(t) = (t 2)4 (t 3)3
m(t) = (t 2)2 (t 3)2
A forma cannica de Jordan de L uma das seguintes

2 1
2 1
0 2

0 2

2
2
1

2
0 2
ou

3 1
3
1

0 3
0 3
3
3

A primeira matiz ocorre se L possui dois autovetores linearmente independentes pertencentes ao seu autovalor 2 e a segunda ocorre se L tem trs autovetores linearmente independentes pertencentes ao seu autovalor 2.

0 1
. A
Exemplo 12.9 Vamos determinar a forma cannica J da matriz A =
1 2
equao caracterstica de A ( 1)2 = 0 e uma base do autoespao correspondente ao

Notas de aula do Prof. Antonio Cndido Faleiros

153

0 0
. Calculamos ento (AI) =
e vemos que o zero
autovalor 1 v1 = 1 1
0 0
autovalor desta matriz e que qualquer vetor autovetor correspondente ao zero. Tomemos

T
v2 = 0 1 que,juntamente com v1 , forma uma base do espao das
matrizes 2 1. A
1 0
1 0
, cujas colunas so v1 e v2 , tem por inversa S 1 =
e tal
matriz S =
1 1
1 1

1 0
que J = S 1 AS =
.
0 1

3 2 5
Exemplo 12.10 Vamos determinar a forma cannica J da matriz A = 1 2 1 .
1 1 0
2
A equao caracterstica de A (1)(2) = 0. A multiplicidade algbrica do autovalor
1 1 e do autovalor 2 2. Uma base do autoespao correspondente ao autovalor 1 for
T
. Uma base do autoespao correspondente ao autovalor
mada pelo vetor v1 = 1 1 0

T
2 formada pelo
. Um conjunto gerador do autoespao de (A 2I)2 =
vetor 1 3 1
2 3 7

2 3 7 correspondente ao autovalor 0 formado pelos vetores v3 = 3 2 0 T


0 0 0

T
e v4 = 7 0 2
. Como nenhum deles mltiplo de 1 3 1
podemos tomar
v3 para gerar a uma cadeia de Jordan de comprimento 2, correspondente
ao autovalor
2

1
1
3

T
e calculamos v2 = (A 2I)v3 = 1 3 1
. A matriz S = 1 3 2 , cuja
0 1 0

2 3 7
1 0 0
0 1 tal que J = S 1 AS = 0 2 1 que a forma
inversa S 1 = 0
1 1 2
0 0 2
cannica da matriz A.

Exemplo 12.11 ***

12.3

Subespaos cclicos

Seja L : V V linear e v V no nulo (v 6= 0). Consideremos a seqncia


v, Lv, L2 v, . . .
Seja k o menor inteiro para o qual
Lk v [v, Lv, L2 v, . . . , Lk1 v],
indicando com isto que o conjunto
{v, Lv, L2 v, . . . , Lk1 v}

154

Notas de aula do Prof. Antonio Cndido Faleiros

linearmente independente.
O subespao vetorial
Z(v, L) = [v, Lv, L2 v, . . . , Lk1 v]
chamado de subespao cclico de V gerado por L e v. Sua dimenso k.
Este subespao a interseo de todos os subespaos L invariantes que contm v.
Denotemos por Lv a restrio de L a Z(v, L). Se
Lk v = a0 v a1 Lv a2 L2 v ak1 Lk1 v
ento
mv (t) = a0 + a1 t + a2 t2 + + ak1 tk1 + tk

o polinmio mnimo de Lv e a representao de Lv na base


{v, Lv, L2 v, . . . , Lk1 v}

C=

0 0 a0
0 0 a1
0 0 a2
..
. . . .. ..
. .
.
0 0 0 0 0 ak3
0 0 0 1 0 ak2
0 0 0 0 1 ak1
0
1
0
..
.

0
0
1
..
.

0
0
0
..
.

denominada de matriz companheira do polinmio mv (t). O polinmio mv (t) denominado de L anulador de v e Z(v, L).

12.4

Forma cannica racional

Lema 12.12 11.13. Seja L : V V linear, cujo polinmio mnimo f (t)n , onde f (t)
irredutvel. Ento existem v1 , v2 , . . . , vr tais que
V = Z(v1 , L) Z(vr , L).

O polinmio mnimo da restrio de L a Z(vi , L) f (t)ni , onde ni um nmero inteiro


menor ou iguais a n. Pode-se ordenar os expoentes ni de modo que
n = n1 n2 nr .
Qualquer outra decomposio de V em subespaos L cclicos tem o mesmo conjunto de
polinmios mnimos, que determinado de modo nico por L. Assim L tem uma representao matricial

C (1) 0
0
0 C (2)
0

C = ..
..
..
.
.
.
.
.
.
0
0 C (r)

Notas de aula do Prof. Antonio Cndido Faleiros

155

onde C (i) a matriz companheira do polinmio f (t)ni .


Teorema 12.13 (Forma cannica racional) Seja L : V V linear com polinmio mnimo
m(t) = f1 (t)m1 . . . fs (t)ms
onde fi (t) so polinmios mnicos irredutveis distintos. Ento L possui uma nica representao matricial em bloco

C1 0 0
0 C2 0

..
.. . .
..
.
. .
.
0 0 Cs
onde cada Ci uma matriz com o formato
(1)
Ci
0
0
0 C (2)
0

i
Ci = .
.
..
...
..
..
.
(r)
0
0 Ci
(j)

em que Ci
que

so matrizes companheiras de fi (t)nij onde se pode ordenar os nij de modo


m1 = n11 n12 n1r1

ms = ns1 ns2 nsrs

Esta a chamada forma cannica racional de L. Os polinmios fi (t)nij so chamados


de divisores elementares de L.

12.5

Forma triangular

Se um operador linear L possuir uma representao

a11 a12
0 a22

A = ..
.. . .
.
.
.
0
0

matricial triangular

a1n
a2n

..
.
ann

seu polinmio caracterstico pode ser fatorado em polinmios do primeiro grau


(t) = det(tI A) = (t a11 )(t a22 ) (t ann ).
A recproca tambm verdadeira.

156

Notas de aula do Prof. Antonio Cndido Faleiros

Teorema 12.14 Seja n a dimenso de V e L : V V um operador linear cujo polinmio


caracterstico (t) pode ser fatorado num produto de fatores lineares
(t) = (t 1 )n1 (t r )nr
onde os nmeros i , i = 1, . . . , r so distintos e n1 + + nr = n. Ento L possui uma
representao matricial em forma triangular.
Prova. *** Como (t) pode ser fatorado em polinmios do primeiro grau, L possui
ao menos um autovalor. Denotemo-lo 1 e por v1 o autovetor correspondente, de modo
que Lv1 = 1 v1 . Ento V = V1 (V1 ) onde V1 = ger(v1 ). O espao V1 invariantes sob
L. Seja L1 a restrio de L a V1 . {v12 , . . . , v1n } uma base ortonormal de (V1 ) . A matriz
de L nesta base da forma ***

12.6

Espaos quocientes

Esta uma maneira inteligente de definir projees em espaos vetoriais que no possuem produto interno.
Seja W um subespao vetorial de V. Dado v V, definimos o conjunto
v + W = {v + w : w W },
denominado de classe lateral de W em V. Observe que 0 + W = W.
Podemos definir duas operaes no conjunto das classes laterais de modo a torn-lo
um espao vetorial.
Seja W um subespao vetorial de V. Sejam u e v dois vetores em V e k um escalar
pertencente ao corpo sobre o qual se define o espao vetorial V. Definimos no conjunto
das classes laterais de W as operaes de adio de duas classes e multiplicao de uma
classe por um escalar por
(u + W ) + (v + W ) = (u + v) + W,
k(u + W ) = ku + W.
O conjunto das classes laterais, com estas duas operaes, um espao vetorial sobre
o mesmo corpo sobre o qual se define V. Este espao vetorial denominado espao
quociente de V por W e denotado por V /W. Se a dimenso de V for finita ento
dim(V /W ) = dim(V ) dim(W ).
Teorema 12.15 Seja L : V V linear e W um subespao L invariante de V. Ento L
em V /W definido por
induz um operador linear L
+ W ) = L(v) + W.
L(v
tambm o . Assim, o polinmio mnimo de
Se L for um zero de um polinmio, ento L

L divide o polinmio mnimo de L.

Notas de aula do Prof. Antonio Cndido Faleiros

157

Exemplo 12.16 Vamos apresentar um exemplo que mostra como se pode obter uma representao matricial triangular de uma transformao linear. Seja L : R3 R3 definida
por L(x, y, z) = (4x + y z, 2x + 5y 2z, x + y + 2z). A matriz de L na base cannica do
R3

4 1 1
A = 2 5 2
1 1 2
Os vetores v1 = (1, 1, 0), v2 = (0, 1, 0), v3 = (0, 0, 1) formam uma base do R3 .
Destacamos que v1 autovetor de L correspondente ao autovetor 3. Como
L(v1 ) = 3v1
L(v2 ) = v1 + 6v2 + v3
L(v3 ) = v1 3v2 + 2v3
a matriz de L na base {v1 , v2 , v3 }

3 1 1
B = 0 6 3 .
0 1
2

O espao vetorial W gerado por v1 invariante sob L. Observe que a matriz de L na


base {v1 , v2 , v3 } j possui a primeira coluna na forma desejada para se chegar forma
triangular.
Consideremos V = {v + W : v V } que o espao quociente V /W e a transformao
linear induzida L : V V definida por L(v) = L(v) + W. Para esta transformao,
L(v1 ) = 3v1 + W = W = 0
L(v2 ) = v1 + 6v2 + v3 + W = 6v 2 + v3
L(v3 ) = v1 3v2 + 2v3 + W = 3v 2 + 2v 3
de modo que a matriz de L em relao base {v 2 , v 3 } de V

6 3
C=
.
1 2
Vamos omitir a barra e olhar para L no espao gerado por v2 e v3 . Sabemos que
L(v2 ) = 6v2 + v3
L(v3 ) = 3v2 + 2v3
cuja matriz na base {v1 , v2 } C. Os autovalores de C so 5 e 3 e o autovetor relativo ao
autovalor 5 3v2 + v3 . Vamos ento passar da base {v1 , v2 , v3 } para a base {w1 , w2 , w3 }
onde
w1 = v1 ,
w2 = 3v2 + v3 ,
w3 = v3 .

158

Notas de aula do Prof. Antonio Cndido Faleiros

O w3 foi escolhido de modo arbitrrio, exigimos apenas que {w1 , w2 , w3 } seja uma base
de V. Podemos inverter as relaes acima para obter
v1 = w1 ,

v2 = (w2 w3 )/3,

v3 = w3 .

Da segue
L(w1 ) = 3w1
L(w2 ) = 2w1 + 5w2
L(w3 ) = w1 w2 + 3w3
e, nesta base, a matriz de L

3 2 1
D = 0 5 1
0 0
3

que est na forma triangular. Esta transformao linear pode ser representada por uma
matriz diagonal pois ela possui trs autovetores linearmente independente.

Captulo 13
Aplicaes
Aproximao por polinmios
Cadeias de Markov
Circuitos eltricos
Diferenas finitas
Elementos finitos
Equao de Schredinger
Sistemas de equaes diferenciais
Exponencial de matriz
Formas quadrticas
Cnicas e qudricas
Mnimos quadrados
Modelo econmico de Leontief
Mtodo hngaro para alocao de tarefas
Cifras de Hill
Programao linear
Sries de Fourier
Sistemas de equaes diferenciais
Tenso nos meios contnuos
Teoria dos grafos
Teoria dos jogos

159

160

Notas de aula do Prof. Antonio Cndido Faleiros

Apndice A
Matrizes
Uma matriz um arranjo retangular de nmeros, denominados de elementos da matriz,
dispostos em linhas e colunas. Quando uma matriz possuir m linhas e n colunas diremos
que uma matriz m n ou matriz m por n ou matriz de ordem m por n. Matrizes reais
so aquelas cujos elementos so nmeros reais e matrizes complexas so aquelas cujos
elementos so nmeros complexos. Em nosso curso trabalharemos com matrizes reais ou
complexas.
Uma matriz com uma nica coluna chamada de vetor coluna e uma matriz com
uma nica linha chamada de vetor linha. Se o nmero de linhas for igual ao nmero de
colunas se diz que a matriz quadrada. Uma matriz quadrada com n linhas e n colunas
uma matriz n por n ou de ordem n. Neste caso, em lugar de dizermos que a ordem da
matriz m por m, diremos apenas que a matriz de ordem m.
A menos que se especifique o contrrio, Rn o conjunto das matrizes coluna reais,
que possuem n linhas e uma coluna. Denotaremos por Cn ao conjunto de matrizes coluna
complexas, com n linhas e uma coluna. Designaremos o conjunto das matrizes reais m por
n pelo smbolo Rmn e das matrizes complexas de ordem m por n pelo smbolo Cmn .
Tambm usual escrever Amn para indicar que A possui m linhas e n colunas. Um
nmero real ou complexo ser denominado genericamente de escalar.
Usaremos a notao abreviada A = (aij ) para denotar uma matriz

a11 a1n

..
...
A = ...
.
am1 amn

onde aij o elemento da linha i e coluna j. No conjunto das matrizes m por n, se define
a adio de duas matrizes e a multiplicao de uma matriz por um escalar atravs das
frmulas
(aij ) + (bij ) = (aij + bij )
k (aij ) = (kaij )

onde k um escalar, (aij ) e (bij ) so matrizes de ordem m por n. Quando for conveniente,
escreveremos (aij )k em lugar de k(aij ).
161

162

Notas de aula do Prof. Antonio Cndido Faleiros

A matriz em que todos os elementos so nulos chamada de matriz nula e ser


denotada por 0.
Se A = (aij ), ento A = (aij ) chamada de matriz oposta de A. Definimos a
diferena entre as matrizes A e B de mesma ordem por A B = A + (B).
Propriedades
Nas propriedades enumeradas abaixo, A, B e C so matrizes de mesma ordem, incluindo
a matriz nula e k1 , k2 so escalares. O 1 indica a unidade escalar.
1. Associatividade: A + (B + C) = (A + B) + C.
2. Comutatividade: A + B = B+ A.
3. Elemento neutro: A + 0 = 0 + A = A.
4. Elemento oposto: A + (A) = (A) + A = 0.
5. Associatividade: (k1 k2 )A = k1 (k2 A).
6. Distributividade: (k1 + k2 )A = k1 A + k2 A.
7. Distributividade: k1 (A + B) = k1 A + k1 B.
8. Unidade: 1A = A
Estas propriedades indicam que o conjunto das matrizes m n com as operaes de
adio e multiplicao por um escalar um espao vetorial sobre o corpo dos escalares
que, em nosso caso, ser o corpo dos nmeros reais ou dos nmeros complexos.

A.1

Matrizes especiais

Seja A = (aij ) uma matriz m por n e p = min{m, n}. Os elementos a11 , a22 , . . . , app
formam a diagonal principal da matriz A. Uma matriz diagonal se todos os elementos
fora da diagonal principal forem nulos.
A matriz identidade I de ordem m a matriz diagonal cujos elementos da diagonal
principal so todos iguais a 1. O delta de Kronecker, definido para todo i e j inteiros por
ij = 1
ij = 0

se
se

i=j
i 6= j

pode ser usado para representar os elementos da matriz identidade. Em termos deste
smbolo, I = ( ij ) .
Se os elementos abaixo da diagonal principal da matriz A forem nulos, a matriz
triangular superior. Se os elementos direita da diagonal principal de A forem nulos,
a matriz triangular inferior.

Notas de aula do Prof. Antonio Cndido Faleiros

163

Uma matriz A simtrica se AT = A, anti-simtrica se AT = A e ortogonal


se AT = A1 .
Seja A = (aij ) uma matriz complexa de ordem m por n. Vamos indicar por a
ij ao

complexo conjugado de aij . A matriz A = (bij ) de ordem n por m, onde


ji
bij = a
a adjunta de A. Se A for real, ento A = AT . Uma matriz complexa A hermitiana
se A = A, anti-hermitiana se A = A e unitria se A = A1 . As matrizes reais
simtricas so hermitianas, as matrizes reais anti-simtricas so anti-hermitianas e as
matrizes reais ortogonais so unitrias.
Definio A.1 Uma matriz m por n possui a forma escalonada se:
1. As linhas nulas, se existirem, se encontram na parte inferior da matriz.
2. Ao percorrer as linhas de cima para baixo, o primeiro elemento no nulo de cada
linha vai se deslocando para a direita.
O primeiro elemento no nulo em cada linha, quando percorrida da esquerda para a
direira, chamado de piv da linha.
Definio A.2 Uma matriz m por n possui a forma escalonada reduzida se:
1. As linhas nulas, se existirem, se encontram na parte inferior da matriz.
2. O primeiro elemento no nulo em cada linha, quando percorrida da esquerda para
a direira, igual a 1. Este o piv da linha.
3. So nulos todos os demais elementos da coluna que contm o piv.
4. Ao percorrer as linhas de cima para baixo, o primeiro elemento no nulo de cada
linha vai se deslocando para a direita.

A.2

Multiplicao de matrizes

A multiplicao a operao que leva duas matrizes A = (aij )mn e B = (bjk )np na
matriz
n
!
X
AB =
aik bkj
k=1

de ordemque uma matriz m por p. Para efetuar o produto AB, o nmero de colunas de
A deve ser igual ao nmero de linhas de B. Quando este for o caso, se diz que A e B so
conformes para o produto.
A multiplicao de matrizes uma operao associativa e distributiva mas no
comutativa. Assim,

164

Notas de aula do Prof. Antonio Cndido Faleiros

1. A1 (B1 C1 ) = (A1 B1 )C1


2. A2 (B2 + C2 ) = A2 B2 + A2 C2
3. (A3 + B3 )C3 = A3 C3 + B3 C3
desde que as matrizes Ai , Bi e Ci sejam conformes para a adio e a multiplicao.
Se se o nmero de linhas for diferente do nmero de colunas em A e B, ento o produto
AB pode estar definido e o produto BA no.

A.3

Inversa

Uma matriz quadrada A de ordem m inversvel se existir uma matriz quadrada B de


ordem m tal que AB = BA = I, onde I a matriz identidade de ordem m. A matriz
B a inversa de A, sendo denotada por A1 . Sendo A = (aij ) e B = (bij ) , ento as
igualdades matriciais AB = BA = I resultam nas seguintes igualdades entre os elementos
de A, B e I
n
n
X
X
aik bkj = ij
e
bik akj = ij .
k=1

k=1

Se a matriz no for inversvel, diremos que singular.


A inversa de uma matriz nica pois, se B e C forem inversas de A, ento
B = BI = B(AC) = (BA)C = IC = C.
1

Se A for inversvel, ento A1 inversvel e (A1 ) = A. Se k for um escalar no nulo


e A for inversvel, ento kA inversvel e (kA)1 = k1 A1 .
Teorema A.3 Sejam A e B matrizes quadradas tais que AB = I. Isto suficiente para
garantir que BA = I.
Prova. A prova deste fato se baseia em um teorema da lgebra Linear que estabelece o
seguinte: Se as matrizes envolvidas forem de ordem n, o posto de I n e, consequentemente
o posto de A n, estabelecendo uma bijeo em Cn . Ento B necessariamente a bijeo
inversa e BA = I.
Se A e B forem inversveis ento AB inversvel e (AB)1 = A1 B 1 . Este resultado
pode ser generalizado. Se A1 , . . . , An forem inversveis, ento o produto A1 An
inversvel e
1
(A1 An )1 = A1
n A1 .
Se A for uma matriz inversvel, ento as equaes AX = B e Y A = C possuem soluo
nica dadas por X = A1 B e Y = CA1 .

Notas de aula do Prof. Antonio Cndido Faleiros

165

Se A for uma matriz quadrada, define-se as potncias inteiras de A por


A0 = I,
Ak = Ak1 A,

k 1
.
Ak = A1 = Ak

para todo k 1 inteiro.


O posto de uma matriz o nmero de suas colunas que so linearmente independentes.
A nulidade de uma matriz a dimenso do seu ncleo.
Teorema A.4 Seja A uma matriz m n. O posto de A mais a nulidade de A igual a
n.
Teorema A.5 O posto de uma matriz no se modifica se ela for multiplicada por uma
matriz inversvel.
Teorema A.6 Seja A uma matriz m n de posto k. Existe uma matriz P de ordem n,
e uma matriz Q de ordem m, ambas inversveis e tais que D = Q1 AP uma matriz
diagonal onde os k primeiros elementos da diagonal so iguais a 1 e os demais so todos
nulos.
Teorema A.7 Seja A uma matriz m n de posto k. Existe uma matriz inversvel Q de
ordem m, tal que A0 = Q1 A uma matriz escalonada reduzida.
A transposta da matriz A = (aij ) de ordem m por n a matriz AT = (bij ) , de ordem
n por m, onde bij = aji . Vale a propriedade
(AB)T = B T AT .
Teorema A.8 O nmero de linhas linearmente independentes de uma matriz igual ao
nmero de colunas linearmente independentes.
Prova. Seja A0 = Q1 A a matriz escalonada reduzida do teorema anterior. O nmero
de linhas no nulas o nmero de linhas linearmente independentes em A0 . Em A0 , as
colunas linearmente independentes so aquelas que contm os pivs. Logo, o nmero
de linhas linearmente independentes de A0 igual ao nmero de colunas linearmente
independentes. Como Q e QT so inversveis, o posto de A = QA0 e o de AT = (A0 )T QT
so idnticos, mostrando que o nmero de linhas e o nmero de colunas linearmente
independentes de A so iguais.

166

A.4

Notas de aula do Prof. Antonio Cndido Faleiros

Operaes elementares e matrizes elementares

Operaes elementares sobre linhas


1. Permutar duas linhas.
2. Multiplicar uma linha de A por um escalar no nulo.
3. Adicionar a uma linha um mltiplo de outra linha.
Operaes elementares sobre colunas so definidas de modo anlogo.
As operaes elementares podem ser executadas mediante o produto de matrizes elementares. A matriz que troca a linha i pela linha j aquela obtida a partir da matriz
identidade, trocando a linha i com a linha j. A matriz que multiplica a linha i de A por
um escalar k 6= 0 obtida a partir da identidade, trocando o elemento diagonal da linha
i por k. A matriz que adiciona um mltiplo k da linha i linha j obtida a partir da
matriz identidade, trocando o zero da linha i coluna j por k.
Se E for uma matriz elementar, EA realiza operaes elementares sobre as linhas de
A e AE realiza operaes elementares sobre as colunas de A, como mostram os exemplos
que seguem.
Se

0 1 0
E = 1 0 0 ,
0 0 1

ento a matriz EA obtida de A trocando a primeira linha com a segunda; AE uma


matriz obtida de A trocando a primeira coluna com segunda.
Se

0 0
E = 0 1 0 ,
0 0 1

ento a matriz EA obtida de A multiplicando a primeira linha por ; a matriz AE


obtida de A multiplicando a primeira coluna por .
Se

1 0
E = 0 1 0 ,
0 0 1

ento EA uma matriz obtida de A adicionando vezes a segunda linha primeira; AE


uma matriz obtida de A adicionando vezes a primeira coluna segunda.
As matrizes elementares so inversveis. Se uma matriz A for inversvel e E uma
matriz elementar, ento AE e EA so inversveis.
Se uma coluna ou uma linha de uma matriz for identicamente nula, ela singular. Se
uma coluna de uma matriz for uma combinao linear das outras, a matriz singular.
Teorema A.9 Uma matriz quadrada A inversvel se e s se puder ser escrita como um
produto matrizes elementares.

Notas de aula do Prof. Antonio Cndido Faleiros

167

Prova. Se A for o produto de matrizes elementares, ela inversvel pois as matrizes


elementares so inversveis. Vamos provar a recproca.
Como A = (aij ) inversvel, nenhuma de suas colunas identicamente nula. Pelo
menos um elemento da primeira coluna diferente de zero. Se a11 for igual a zero,
podemos permutar a primeira linha de A com outra cujo elemento da primeira coluna
diferente de zero. Denotemos ainda por a11 o elemento da primeira linha e primeira
coluna da matriz transformada. Podemos dividir a primeira linha por a11 de modo que
o elemento da primeira linha primeira coluna fique igual a 1. Agora, podemos adicionar
s demais linhas de A mltiplos da primeira de modo que todos os elementos da primeira
coluna, exceto o primeiro, fiquem iguais a zero. Esta matriz obtida de A atravs de
operaes elementares inversvel e ser denotada por A1 .
Se todos os elementos da segunda coluna de A1 da diagonal principal para baixo forem
nulos, a segunda coluna de A1 seria um mltiplo da primeira e esta matriz seria singular.
Como ela no singular, pelo menos um elemento da segunda coluna da diagonal principal
para baixo diferente de zero. Se necessrio, trocamos a segunda linha com outra abaixo
dela que possui elemento no nulo na segunda coluna. O elemento da segunda linha
segunda coluna desta matriz assim transformada no nulo e podemos dividir agora a
segunda linha por ele. O elemento (2, 2) fica igual a 1. Podemos agora adicionar s outras
linhas mltiplos da segunda de modo a anular todos os demais elementos da segunda
coluna. Observe que a primeira coluna no modificada neste processo pois o elemento
da primeira coluna da segunda linha zero. Denominemos esta nova matriz de A2 . Ela
foi obtida de A1 a partir de operaes elementares e, portanto, inversvel.
Continuando com este processo, chegamos matriz identidade, aplicando transformaes elementares sobre as linhas de A. Sejam E1 , E2 , . . . , Ek as matrizes elementares
que realizam estas operaes. Ento Ek E1 A = I e A = (Ek E1 )1 I = E11 Ek1 .
Como a inversa de uma matriz elementar elementar, A um produto de matrizes elementares.

168

Notas de aula do Prof. Antonio Cndido Faleiros

Apndice B
Determinante
B.1

Permutao

Uma funo bijetora : {1, 2, . . . , n} {1, 2, . . . , n} chamada de permutao


do conjunto {1, 2, . . . , n}. Basta apresentar a nupla ordenada ((1), . . . , (n)) para
estabelecer sem ambiguidade. A identidade (1, 2, . . . , n) uma permutao. Sendo
bijetora, a permutao inversvel e, se (i) = j, sua inversa 1 leva j em i.
Sejam j e k dois inteiros distintos no conjunto {1, 2, . . . , n}. Uma permutao que
leva j em k e k em j, mantendo fixos os outros inteiros, chamada de transposio.
Se for uma transposio, basta informar que (j) = k para inferir que (k) = j e que
(i) = i para todo i diferente de j e k.
Toda permutao a composio de um nmero finito de transposies. De fato,
sejam i , i = 1, . . . , n permutaes que tanto pode ser uma transposio quanto uma
identidade, definidas por
1 (1) = (1),
2 1 (2) = (2),
...,
n ( n1 2 1 (n)) = (n).
Estas equaes definem 1 , 2 , . . . , n sem ambiguidade. Observe que, se (1) = 1, ento
1 a identidade. Se (2) = 1 (2), 2 a identidade. Em geral, para k 2, sendo
(k) = k1 2 1 (k), ento k a permutao identidade. Em particular, n sempre
a identidade e foi colocada na composio apenas para ficarmos com um nmero exato de
n permutaes, entre transposies e identidades. A permutao igual composio
n 2 1.
Retirando as identidades desta composio, vemos que uma composio de permutaes que, entretanto, no nica. Todavia, duas decomposio de em permutaes
ter ou um nmero par de fatores ou um nmero mpar de fatores. Provaremos esta
afirmao logo adiante.
169

170

Notas de aula do Prof. Antonio Cndido Faleiros

Seja uma permutao de {1, 2, . . . , n}. Se i < j e (i) > (j) diremos que o par
(i, j) uma inverso de . Definimos o sinal de do seguinte modo: Se o nmero de
inverses de for par, seu sinal ser +1. Se o nmero de inverses de for mpar, seu
sinal ser 1. O sinal de ser denotado por sign().
A permutao identidade no apresenta nenhuma inverso. Portanto, seu sinal +1.
Teorema B.1 Sejam 1 e 2 duas permutaes de {1, 2, . . . , n}. Ento
sign( 2 1 ) = sign( 2 )sign( 1 ).
Prova. Observe a tabela que vem em seguida, onde i < j.
Inverses
1 2 21
1 (i) < 1 (j) 2 1 (i) < 2 1 (j) 0 0 0
1 (i) < 1 (j) 2 1 (i) > 2 1 (j) 0 1 1
1 (i) > 1 (j) 2 1 (i) < 2 1 (j) 1 1 0
1 (i) > 1 (j) 2 1 (i) > 2 1 (j) 1 0 1
Ela mostra que quando h uma inverso em 2 1 ou h uma inverso em 1 ou h
uma em 2 mas no em ambas ao mesmo tempo. Quando no h inverso em 2 1 ento
no h inverso nem em 1 nem em 2 ou ambas apresentam uma inverso. Isto significa
que o nmero de inverses de 2 1 e a soma do nmero de inverses em 1 e 2 tm a
mesma paridade. Isto implica na igualdade dos sinais
sign( 2 1 ) = sign( 2 )sign( 1 ).

Se uma permutao mantm um nmero k fixo, isto , se (k) = k, as inverses


envolvendo este nmero no precisam ser contadas no clculo do sinal. O nmero de
inverses (i, k), com i < k igual ao nmero de inverses (k, j) com k < j. Logo, o
nmero mantido fixo pela permutao sempre leva a um nmero par de inverses. Esta
observao til na prova do prximo teorema.
Teorema B.2 O sinal de uma transposio 1.
Prova. Se a transposio levar i em j e j em i, de acordo com a observao feita
acima, podemos ignorar as inverses relativas aos nmeros mantidos fixos. Sobram apenas
i e j, para os quais h uma inverso. Logo, o sinal da transposio 1.
Teorema B.3 Toda permutao uma composio de transposies. Esta composio
no nica. Entretanto, o nmero de transposies ou sempre par ou sempre mpar.
Prova. O sinal de toda transposio 1. Quando sign() = +1, qualquer decomposio de em transposies tem um nmero par de fatores. Quando sign() = 1, o
nmero de transposies que a compem mpar.

Notas de aula do Prof. Antonio Cndido Faleiros

171

Teorema B.4 O sinal de uma permutao igual ao sinal de sua inversa.


Prova. Como 1 a identidade cujo sinal +1, segue sign( 1 )sign() = sign( 1 ) =
1. Logo, sign( 1 ) e sign() so ambos iguais a +1 ou ambos iguais a 1.

B.2

Determinante

Seja A = (aij ) uma matriz quadrada de ordem n. O determinante de A definido por


X
det(A) =
sign()a1(1) a2(2) an(n)

onde pecorre o conjunto de todas as permutaes de {1, 2, . . . , n}.


Cada permutao de {1, 2, . . . , n} possui inversa . Se (i) = j, ento (j) = i
e ai(i) = a (j)j . Consequentemente, o produto a1(1) a2(2) an(n) uma reordenao
a (1)1 a (2)2 a (n)n e, portanto, so iguais. Como sign() = sign( ), segue
X
det(A) =
sign( )a (1)1 a (2)2 a (n)n

onde percorre o conjunto de todas as permutaes de {1, 2, . . . , n}.


Teorema B.5 O determinante de uma matriz igual ao determinante de sua transposta.
Prova. Se B = (bij ) for a transposta de A = (aij ), ento bij = aji . Assim,
X
det(A) =
sign()a(1)1 a(2)2 a(n)n

sign()b1(1) b2(2) bn(n) = det(B).

Teorema B.6 Se uma linha ou uma coluna de uma matriz quadrada for nula, seu determinante zero.
Prova. Quando a linha i for nula, ai(i) = 0 para toda permutao e assim, det(A) =
0. Uma coluna nula na matriz uma linha nula na transposta. Assim, det(AT ) = 0 e,
portanto, det(A) = 0.
Teorema B.7 Se permutarmos duas linhas de uma matriz, o determinante muda de
sinal. Se permutarmos duas colunas de uma matriz, o determinante muda de sinal.

172

Notas de aula do Prof. Antonio Cndido Faleiros

Prova. Seja B = (bij ) a matriz obtida de A = (aij ) permutando-se as linhas r e s, de


modo que brj = asj e bsj = arj . Assim,
X
sign() br(r) bs(s)
det(B) =

sign() as(r) ar(s)

sign() ar(s) as(r)

sign( ) ar, (r) as, (s)

onde a transposio que leva r em s e s em r. Como percorre todas as permutaes


possveis, tambm as percorre e assim,
X
det(B) =
sign() ar(r) as(s) = det(A).

Teorema B.8 Se duas linhas ou duas colunas de uma matriz quadrada forem iguais, seu
determinante zero.
Prova. Se duas linhas da matriz A so iguais, ao trocar uma linha pela outra, a matriz
A permanece inalterada e seu determinante troca de sinal. Logo, det(A) = det(A), o
que resulta em det(A) = 0.
Teorema B.9 Seja A = [v1 , . . . , vj + wj , . . . , vn ], B = [v1 , . . . , vj , . . . , vn ], e C = [v1 ,
. . . , wj , . . . , vn ], matrizes quadradas de ordem n, onde v1 , . . . , vn e wj so as colunas de
B e C. A coluna j de A vj + wj . Ento
det(A) = det(B) + det(C).
Prova. Imediata, a partir da definio.
Vale um teorema anlogo se os elementos de uma linha de A forem decompostos em
duas parcelas.
Teorema B.10 Sejam v1 , . . . , vn vetores coluna em Cn . Ento para todo escalar ,
det[v1 , . . . , vi , . . . , vn ] = det[v1 , . . . , vi , . . . , vn ]
O mesmo resultado se aplica ao multiplicarmos uma linha de A por um escalar .

Notas de aula do Prof. Antonio Cndido Faleiros

173

Prova. Imediata a partir da definio.


Corolrio B.11 Se A uma matriz quadrada de ordem n e um escalar,
det(A) = n det(A).
Teorema B.12 Se uma linha de uma matriz quadrada A for um mltiplo de outra linha
de A, ento det(A) = 0.
Prova. Se 6= 0, det[ . . . , vi , . . . , vi , . . . ] = det[ . . . , vi , . . . , vi , . . . ] = 0.
Quando = 0, uma linha da matriz nula e det(A) = 0.
Teorema B.13 O determinante de uma matriz no se altera se adicionarmos a uma de
suas colunas um mltiplo de outra. O mesmo resultado se aplica se adicionarmos a uma
de suas linhas um mltiplo de outra.
Prova. Se 6= 0, det[ . . . , vi , . . . , vj + vi , . . . ] = det[ . . . , vi , . . . , vj , . . . ]+ det[
. . . , vi , . . . , vi , . . . ] = det[ . . . , vi , . . . , vj , . . . ].
Teorema B.14 Se A = (aij ) for uma matriz quadrada triangular superior ou triangular
inferior, ento
det(A) = a11 a22 ann .
Prova. Se A for uma matriz quadrada de ordem n, triangular superior, ento aij = 0
quando i > j. Sendo uma permutao de {1, 2, . . . , n} termo
a1(1) a2(2) an(n)
ser no nulo apenas quando (1) 1, (2) 2, . . . , (n) n. Isto s ocorre se (n) = n,
. . . , (2) = 2, (1) = 1. Da, o nico termo no nulo do determinante de A a11 a22
ann .
Corolrio B.15 O determinante da matriz identidade igual a 1.
Teorema B.16 Seja A uma matriz quadrada. O det(A) 6= 0 se e s se A for inversvel.
Prova. Se A for inversvel, seja B a sua inversa. Como AB = I, det(A) det(B) = 1,
provando que det(A) 6= 0.
Quando A inversvel, suas colunas formam uma base da imagem indicando que suas
colunas so vetores linearmente independentes.
Se A for singular, uma de suas linhas combinao linear das outras e det(A) = 0.

174

Notas de aula do Prof. Antonio Cndido Faleiros

Teorema B.17 Se E for uma matriz elementar e A uma matriz quadrada, todas de
ordem n, ento det(EA) = det(E) det(A).
Prova. Se E for uma matriz elementar que permuta a linha i com a linha j, ento
det(E) = 1 e det(EA) = det(A), provando que det(EA) = det(E) det(A) para este
caso.
Se E for uma matriz elementar que multiplica uma linha por r, ento det(E) = r e
det(EA) = r det(A), provando que neste caso tambm vale o teorema.
Se E for uma matriz elementar que multiplica linha i um mltiplo r da linha j, ento
det(E) = 1 e det(EA) = det(A), provando que o teorema tambm vale neste ltimo caso,
o que completa a prova do teorema.
Corolrio B.18 Se E1 , E2 , . . . , Ek forem matrizes elementares e A for uma matriz
quadrada, todas de ordem n, ento det(E1 E2 Ek A) = det(E1 ) det(E2 ) det(Ek )
det(A).
Teorema B.19 Se A e B forem matrizes quadradas de mesma ordem,
det(AB) = det(A) det(B).
Prova. Se A for inversvel, A = E1 E2 Ek , onde E1 , E2 , . . . , Ek so matrizes
elementares. Assim, det(AB) = det(E1 E2 Ek B) = det(E1 ) det(E2 ) det(Ek )
det(B) = det(A) det(B).
Se A ou B for singular, AB singular e det(AB) = 0 e det(A) det(B) = 0.
Corolrio B.20 Se A for uma matriz quadrada inversvel, det(A1 ) = 1/ det(A).
Teorema B.21 Matrizes quadradas semelhantes possuem o mesmo determinante.
Prova. Se A e B forem matrizes quadradas semelhantes, ento existe uma matriz
inversvel P de modo que B = P AP 1 e det(B) = det(P ) det(A) det(P 1 ) = det(A).

B.3

Cofator

Seja A = (aij ) uma matriz quadrada de ordem n. Seu determinante


X
det(A) =
sign()a1(1) an(n)

onde o somatrio percorre todas as permutaes do conjunto S = {1, 2, . . . , n}.


Podemos agrupar esta soma do seguinte modo: tomemos todas as permutaes que levam
1 em 1, depois aquelas que levam 1 em 2 e assim por diante, at aquelas que levam 1 em

Notas de aula do Prof. Antonio Cndido Faleiros

175

n. Nas permutaes que levam 1 em 1 podemos colocar a11 em evidncia; nas que levam
1 em 2, o a12 pode ser colocado em evidncia e, naquelas que levam 1 em n podemos
colocar o a1n em evidncia e escrever
det(A) = a11 c11 + a12 c12 + a13 c13 + + a1n c1n .
O escalar c1j chamado
P de cofator de a1j .
Vemos que c11 = (1)=1 sign()a2(2) an(n) onde a soma percorre todas as permutaes que levam 1 em 1. A cada permutao em {1, 2, . . . , n} que mantm fixo o 1,
corresponde a uma permutao em S 0 = {2, 3, . . . , n}, onde (i) = (i) para i = 2, . . . ,
n. Ambas possuem o mesmo nmero de inverses e, portanto, possuem o mesmo sinal.
Para estabelecer o sinal de uma permutao, as inverses de um ponto fixo no precisam
ser contadas, uma vez que o nmero dessas inverses um nmero par. Logo, c11 =
P
sign()a2(2) an(n) o determinante de uma matriz que se obtm de A excluindo
a primeira linha e a primeira coluna. Denotamos este determinante por A11 .
Em geral, vamos denotar por Aij o determinante da matriz obtida quando se elimina
a linha i e a coluna j de A.
Para determinar o termo c12 faz-se o seguinte raciocnio: Permutando a primeira
coluna de A com a segunda, obtemos uma matriz B = (bij ) onde b11 = a12 e det(B) =
det(A). Desta igualdade segue b11 B11 + = a12 c12 + e, como a12 = b11 , se conclui
que c12 = B11 . O escalar B11 o determinante da matriz obtida de B ao excluir sua
primeira linha e sua primeira coluna, que so a primeira linha e a segunda coluna de A.
Este determinante foi denotado por A12 . Desta forma, c12 = A12 .
O termo c13 pode ser obtido trazendo a terceira coluna para o lugar da primeira,
fazendo duas permutaes: basta trocar esta coluna sucessivamente com as que esto
sua esquerda at conduzi-la para a posio da primeira. Neste processo, o sinal do
determinante da matriz se modifica duas vezes. O determinante da matriz final igual
ao de A. Por um raciocnio anlogo ao anterior, conclui-se que c13 = A13 , onde A13 o
determinante da matriz obtida ao eliminar a primeira linha e a terceira coluna de A.
Prosseguindo com o raciocnio anterior, chega-se ao desenvolvimento
det(A) = a11 c11 + a12 c12 + a13 c13 + + a1n c1n
onde c1j = (1)1j A1j o cofator de a1j e A1j o determinante da matriz obtida ao eliminar
a linha 1 e a coluna j de A. Esta frmula desenvolve o determinante pela primeira linha
e conhecida por desenvolvimento do determinante pela primeira linha.
De modo semelhante, podemos desenvolver o determinante pela linha i, usando o
argumento seguinte. O determinante de A a soma de diversas parcelas, cada uma com n
fatores. Dentre os fatores de uma parcela do determinante h um nico elemento da linha
i. Aquelas parcelas que possuem como fator um elemento da linha i coluna j, no contm
como fator outro elemento da linha i nem outro elemento da coluna j. Nas parcelas que
possuem o fator aij , vamos coloc-lo em evidncia. Denotemos por cij o termo que fica
multiplicado por aij e vamos cham-lo de cofator de aij . Assim,
det(A) = aij cij + ,

176

Notas de aula do Prof. Antonio Cndido Faleiros

onde os trs pontos se referem s parcelas que contm elementos da linha i e colunas
distintas da j. Mediante transposio de linhas e colunas, podemos transformar a matriz
A numa matriz B, onde o elemento aij fique posicionado na linha 1 coluna 1 de B.
Basta transpor i 1 vezes a linha i com as que esto acima, at posicion-la no topo da
matriz. Em seguida, mediante j 1 transposies da coluna j com as que esto sua
esquerda, coloca-se o elemento aij na primeira posio da matriz. A cada transposio, o
determinante muda de sinal. Como h um total de (i1)+(j 1) transposies, det(A) =
(1)(i1)+(j1) det(B) = (1)i+j det(B). O determinante de B possuir parcelas onde um
dos fatores o aij . Como aij ocupa a primeira linha primeira coluna de B, sabemos de
antemo que det(B) = aij cij + onde cij o determinante de uma matriz obtida de B
pela eliminao de sua linha 1 coluna 1. Ora, a matriz obtida ao eliminar a linha 1 coluna
1 de B igual matriz obtida ao eliminar a linha i coluna j de A. Assim, det(A) =
(1)i+j aij det Aij , onde Aij a matriz obtida de A retirando sua linha i e sua coluna j,
chamada de menor (i, j) de A. Provamos que o cofator de aij no desenvolvimento do
det(A) cij = (1)i+j det Aij .
Na soma que define o determinante de A, podemos colocar em evidncia os elementos
ai1 , ai2 , . . . , ain . A parcela que contm um desses fatores no conter os demais. Cada
um deles ser multiplicado pelo seu cofator e assim
det(A) = ai1 ci1 + ai2 ci2 + ai3 ci3 + + ain cin
onde cij = (1)i+j det A(i, j) o cofator de aij . Como os elementos ai1 , ai2 , . . . , ain so
todos da linha i, a frmula acima conhecida por desenvolvimento do determinante pela
linha i.
Um argumento semelhante nos permite desenvolver o determinante pela coluna j.
Obtemos ento o desenvolvimento do determinante pela coluna j
det(A) = a1j c1j + a2j c2j + a3j c3j + + anj cnj
Um modo prtico de utilizar estas frmulas consiste em aplicar transformaes elementares sobre a matriz zerando o maior nmero de elementos de uma linha ou de uma
coluna e usar as frmulas acima para reduzir o determinante original a uma soma de
outros envolvendo matrizes de ordem n 1. Este processo pode ser utilizado mais de
uma vez reduzindo sucessivamente a ordem das matrizes cujos determinantes precisam
ser calculados.
Definio B.22 Seja A uma matriz quadrada de ordem n. A matriz cujo elemento da
linha i coluna j cji (observe a ordem dos ndices em que primeiro vem o j e depois o i)
chamada de matriz adjunta clssica de A e denotada por adj(A).
Teorema B.23 Se A for inversvel, ento A adj(A) = adj(A) A = det(A) I.
Prova. Provamos que

X
j

aij cij = det(A).

Notas de aula do Prof. Antonio Cndido Faleiros

177

P
Se i for diferente de k, j akj cij corresponderia ao determinante de uma matriz em que
a linha i foi substituda pela linha k. As linhas i e k desta matriz seriam iguais e seu
determinante seria igual a zero. Portanto, para i 6= k,
X
akj cij = 0.
j

Podemos usar o delta de Kronecker para unificar estas duas expresses em destaque
X
akj cij = ik det(A).
j

Ora, o lado esquerdo desta expresso o elemento da linha k coluna i da matriz A adj(A)
e o lado direito o elemento da linha k coluna i da matriz det(A) I, provando que
A adj(A) = det(A) I.
O lado esquerdo da expresso tambm o elemento da linha i coluna k da matriz
adj(A) A e o lado direito o elemento da linha i coluna k da matriz det(A) I, provando
que adj(A) A = det(A) I.

B.4

Regra de Cramer

Consideremos um sistema de n equaes com n incgnitas


n
X

aij xj = bi ,

j=1

para i = 1, 2, . . . , n. Se a matriz A = (aij ) for inversvel, o sistema possui soluo nica.


O mtodo de Cramer fornece um meio de resolver o sistema usando determinantes. Ele
pouco eficiente e usado apenas para sistemas
pequenos.
P
Sendo cij os cofatores de aij ento i aij cik = jk det(A)
n
!
n
!
n
n
n
n
X
X
X
X
X
X
cik bi =
cik
aij xj =
aij cik xj =
det(A) jk xj = det(A)xk
i=1

i=1

j=1

j=1

i=1

j=1

Dividindo pelo det(A) segue


xk =
onde k =
k por b

Pn

i=1 cik bi

Pn

i=1 cik bi

det(A)

k
,
det(A)

o determinante de uma matriz obtida de A, trocando-se sua coluna

k = det

a11 a1,k1 b1 a1,k+1 a1n


a21 a2,k1 b2 a2,k+1 a2n
.. . .
..
..
..
..
...
.
.
.
.
.
.
an1 an,k1 bn an,k+1 ann

178

B.5

Notas de aula do Prof. Antonio Cndido Faleiros

Determinante de Vandermonde

Sejam x1 , . . . , xn nmeros reais. O nmero real

1
1

Vn (x1 , x2 , . . . , xn ) = det ..
.
1

x1 x21 xn1
1
x2 x22 xn1
2
..
.. . .
..
.
.
.
.
2
n1
xn xn xn

chamado de determinante de Vandermonde. Vamos mostrar que


Vn (x1 , . . . , xn ) = (xn x1 )(xn x2 ) (xn xn1 ).

Desenvolvendo Vn (x1 , . . . , xn ) pela ltima linha, vemos que o cofator de xn1


que
n
igual ao determinante de Vandermonde de ordem inferior
= Vn1 (x1 , . . . , xn1 ).
Calculando os determinantes de Vandermonde para n = 2 e n = 3, obtemos V2 (x1 , x2 ) =
x2 x1 e V3 (x1 , x2 , x3 ) = V2 (x1, x2 )(x3 x1 )(x3 x2 ) = (x2 x1 ) (x3 x1 )(x3 x2 ).
Vamos provar por induo que
Y
Vn (x1 , . . . , xn ) =
(xj xi ),
i<j

adotando como hiptese de induo a validade de


Y
Vn1 (x1 , . . . , xn1 ) =
(xj xi ).
i<j<n

Da,
Vn (x1 , . . . , xn ) = Vn1 (x1 , . . . , xn1 )
=

Y
(xn xi )
i<n

Y
(xj xi ) (xn xi )

i<j<n

Y
(xj xi )
=

i<n

i<j

Esta igualdade vale mesmo quando os xi no forem distintos dois a dois, caso em que o
determinante de Vandermonde nulo.
Trocando o nmero xn pela varivel x, Vn (x1 , . . . , xn1 , x) se torna um polinmio em
x de grau n 1 que possui x1 , . . . , xn1 como razes. Assim,
Vn (x1 , . . . , xn1 , x) = (x x1 )(x x2 ) (x xn1 ),
onde um nmero real que no depende de x.

Notas de aula do Prof. Antonio Cndido Faleiros

B.6

179

Determinante, uma definio alternativa

Seja A = (aij ) uma matriz m n e v1 = (a1j ) , v2 = (a2j ) . . . , vn = (anj ) suas colunas.


Usaremos a notao [v1 , . . . , vn ] para designar a matriz A. O determinante de A o
nmero real denotado por det(A) ou det A com as propriedades abaixo.
1. Multilinearidade
det[. . . , vi + wi , . . .] = det[. . . , vi , . . .] + det[. . . , wi , , . . .]
2. Alternatividade
det[. . . , vi , . . . , vj , . . .] = det[. . . , vj , . . . , vi , . . .].
3. Normalizao
det I = det[e1 , . . . , en ] = 1,
onde I a matriz identidade de ordem n e ej = (0, . . . , 0, 1, 0, . . . , 0)T a matriz
coluna n 1 cujo nico elemento no nulo o da linha j, que igual a 1.
Pela alternatividade, se uma coluna da matriz for nula ou se duas colunas forem iguais,
seu determinante nulo. Agora, usando a multilinearidade e a observao acima, se for
um escalar,
det(. . . , vi , . . . , vj + vi , . . .) = det(. . . , vi , . . . , vj , . . .).
Da fica evidente que, se uma coluna for uma combinao linear das demais, ento seu
determinante nulo. Se for uma permutao de {1, 2, . . . , n} ento a alternatividade
garante que
det[e(1) , e(2) , . . . , e(n) ] = sign()
P
pois a cada inverso de colunas h uma troca de sinal. Observando que vj = nij =1 aij j eij
obtemos
XX X
det(A) =

ai1 1 ai2 2 ain n det[ei1 , ei2 , . . . , ein ].


i1

i2

in

Se dois ndices em det[ei1 , ei2 , . . . , ein ] forem iguais, o determinante nulo. Logo, as
parcelas no nulas so aquelas em que {i1 , i2 , . . . , in } for uma permutao de {1, 2,
. . . , n} e assim,
XX X

sign(i1 , i2 , . . . , in )ai1 1 ai2 2 ain n


det(A) =
i1

i2

in

sign()a(1)1 a(2)2 a(n)n

onde o somatrio percorre todas as permutao de {1, 2, . . . , n}. Esta exatamente


a definio anterior. A frmula acima ainda indica que as trs propriedades enumeradas
na definio de determinante so suficientes para garantir a existncia e unicidade do
determinante.

180

Notas de aula do Prof. Antonio Cndido Faleiros

Referncias Bibliogrficas
[CaDoCo] Callioli, C.A., Domingues, H.H., e Costa R.C.F., lgebra Linear e Aplicaes.
Editora Atual.
[Franklin] Joel N. Franklin, Matrix Theory, Dover publications, Inc., 1993.
[Homan] Homann & Kunze, lgebra Linear. Editora da USP com Editora Polgono.
[Kolman]

Bernard Kolman, Introduo lgebra Linear com Aplicaes, sexta edio.


Editora LTC, 1998.

[Lang]

Serge Lang, lgebra Linear. Editora Edgard Blcher.

[Lawson]

Terry Lawson, lgebra Linear. Editora Edgard Blcher, 1997. Acompanham


este livro: Matlab Labs for Linear Algebra, Mathematica Labs for Linear
Algebra, Maple Labs for Linear Algebra.

[Lipschutz] Seymour Lipschutz, lgebra Linear. Coleo Schaum. Makron Books.


[Nering]

Evar D. Nering, Linear Algebra and Matrix Theory. John Wiley & Sons, 1970.

[Nicholson] W. Keith Nicholson, lgebra Linear, segunda ed. McGraw-Hill, 2004.


[NobDan]

Ben Noble & James W. Daniel, lgebra Linear Aplicada. Guanabara Koogan.

[Poole]

David Poole (Foi traduzido), Linear Algebra: A Modern Introduction (with


CD-ROM) 2ed. Brooks Cole 2005.

[RoHo]

Chris Rorres e Howard Anton, lgebra Linear com Aplicaes, oitava edio.
Editora Bookman, 2001.

[TrefBau]

Lloyd N. Trefethen and David Bau III, Numerical Linear Algebra. SIAM,
Society for Industrial and Applied Mathematics, 1997.

181

Você também pode gostar