Você está na página 1de 57

LGEBRA

DE
MATRIZES
Baseado no Captulo 2 do livro:
Linear Models in Statistics, A. C. Rencher, 2000
John Wiley & Sons, New York.

Material preparado pelo


Prof. Dr. Csar Gonalves de Lima
E-mail: cegdlima@usp.br

DCE/ESALQ USP
Fevereiro de 2007

NDICE
2.1. Matrizes e vetores ............................................................................................... 2
2.1.1 Matrizes, vetores e escalares .................................................................... 2
2.1.2. Igualdade de Matrizes ............................................................................... 3
2.1.3. Matriz Transposta ..................................................................................... 3
2.1.4. Alguns tipos especiais de matrizes ........................................................... 4
2.2. Operaes com matrizes ........................................................................................ 6
2.2.1. Adio de duas matrizes ........................................................................... 6
2.2.2. Produto de duas matrizes .......................................................................... 7
2.2.3. Soma Direta ............................................................................................ 14
2.2.4. Produto direto ou de Kronecker ............................................................. 14
2.2.5. Potncia de matriz quadrada ................................................................... 15
2.3. Matrizes particionadas ...................................................................................... 16
2.4. Posto (rank) de uma matriz .............................................................................. 18
2.5. Inversa de uma matriz ....................................................................................... 22
2.6. Matrizes positivas definidas ............................................................................. 25
2.7. Sistemas de equaes ........................................................................................ 29
2.8. Inversa generalizada ......................................................................................... 32
2.8.1. Definio e Propriedades ........................................................................ 32
2.8.2. Inversas Generalizadas e Sistemas de Equaes .................................... 36
2.9. Determinantes ................................................................................................... 37
2.10. Vetores ortogonais e matrizes .......................................................................... 39
2.11. Trao de uma matriz ......................................................................................... 41
2.12. Autovalores e autovetores ................................................................................ 42
2.12.1 Definio ............................................................................................... 42
2.12.2. Funes de uma matriz ......................................................................... 43
2.12.3. Produtos ................................................................................................ 45
2.12.4. Matrizes simtricas ............................................................................... 45
2.12.5. Matriz positiva definida e positiva semidefinida ................................. 46
2.13. Matrizes idempotentes ...................................................................................... 47
2.14. Derivadas de funes lineares e formas quadrticas ........................................ 48
2.15. Referncias citadas no texto ............................................................................. 50
2.16. Lista de exerccios adicionais ........................................................................... 51
Apndice. Introduo ao uso do proc iml .................................................................. 55

Material elaborado pelo Prof. Csar Gonalves de Lima

2
2.1. MATRIZES E VETORES
2.1.1. Matrizes, vetores e escalares.
Uma matriz um arranjo retangular de nmero ou de variveis em linhas e colunas.
Nesse texto estaremos considerando matrizes de nmeros reais, que sero denotadas
por letras maisculas em negrito. Os seus elementos sero agrupados entre colchetes.
Por exemplo:
1 1 0
1 1 0
1 1 1 1 1 1
10 12

A=
B=
;
X=
;

1 0 1
10 12 15 13 14 16
21 39

1 0 1
Para representar os elementos da matriz X como variveis, ns usamos:
x11
x
X = (xij) = 21
x31

x41

x12
x22
x32
x42

x13
x23

x33

x43

A notao X = (xij) representa uma matriz por meio de um elemento tpico. O


primeiro ndice indica a linha e o segundo ndice identifica a coluna. Uma matriz
genrica X tem n linhas e p colunas. A matriz X do Exemplo 1 tem n = 4 linhas e p =
3 colunas e ns dizemos que X 43, ou que a dimenso de X 43. Para indicar a
dimenso da matriz, podemos usar 4 X3 ou X (4 x 3) .
Um vetor uma matriz com uma nica coluna e denotado por letras minsculas, em negrito. Os elementos de um vetor so muitas vezes identificados por um
nico ndice, por exemplo,
y1
y = y2

y3
Geralmente o termo vetor est associado a um vetor coluna. Um vetor linha expresso como o transposto do vetor coluna, como por exemplo,
y = y t = [ y1 , y2 , y3 ] = [ y1

y2

y3 ]

(A transposta de uma matriz ser definida mais adiante).


Geometricamente, um vetor de n elementos est associado a um ponto no espao n-dimensional. Os elementos do vetor so as coordenadas do ponto. Em algumas
situaes, ns estaremos interessados em calcular:
(i) a distncia (d) da origem ao ponto (vetor),
(ii) a distncia (d) entre dois pontos (vetores), ou
(iii) o ngulo () entre as linhas formadas da origem at os dois pontos.
Material elaborado pelo Prof. Csar Gonalves de Lima

No contexto de matrizes e vetores, um nmero real chamado de um escalar.


Assim, os nmeros 2,5, -9 e 3,14 so escalares. Uma varivel representando um escalar ser denotada por uma letra minscula e sem negrito. Por exemplo: c = 3,14 indica um escalar.

2.1.2. Igualdade de Matrizes


Duas matrizes (ou dois vetores) so iguais se tm a mesma dimenso e se os elementos de posies correspondentes so iguais. Por exemplo:

3 2 4 3 2 4
=
1
3 7 1
3 7

mas
2 9 5
3 9
5

8 4
6 8 4
6

2.1.3. Matriz Transposta


Se ns trocarmos de posio as linhas e as colunas de uma matriz A, a matriz resultante conhecida como a transposta de A e denotada por A ou A t . Formalmente,
se nAp = (aij) ento a sua transposta dada por:
t
(2.3)
p A'n = A = (aij) = (aji)

3 2 4
Por exemplo: Se A =
A =
1
3
7

3 1
2 3 a sua transposta.

4 7

A notao (aji) indica que o elemento da i-sima linha e j-sima coluna de A encontrado na j-sima linha e i-sima coluna de A. Se A np ento A pn.
Teorema 2.1.A. Se A uma matriz qualquer, ento

(A) = A

(2.4)

Material elaborado pelo Prof. Csar Gonalves de Lima

4
2.1.4 Alguns tipos especiais de matrizes

Se a transposta de uma matriz A a mesma da matriz original, isto , se A = A ou,


equivalentemente, (aji) = (aij), ento dizemos que a matriz A simtrica. Por exemplo,
2
6
3
A = 2 10 7

6 7
9
simtrica. evidente que toda matriz simtrica quadrada.
A diagonal de uma matriz quadrada pAp= (aij) consiste dos elementos a11, a22,
, app, ou seja, diag(A) = (aii). No exemplo anterior, a diagonal da matriz A formada pelos elementos 3, 10 e 9.
Se a matriz nAn contm zeros em todas as posies fora da diagonal ela uma
matriz diagonal, como por exemplo,

0 0
8

0 3 0
D=
0
0 0

0
0 0

0
0

que tambm pode ser denotada como


D = diag(8, 3, 0, 4)

Ns usamos a notao diag(A) para indicar a matriz diagonal com os mesmos elementos da diagonal de A, como por exemplo,
2
6
3
A = 2 10 7

6 7
9

3 0 0
diag(A) = 0 10 0

0 0 9

Uma matriz diagonal com o nmero 1 em cada posio da sua diagonal chamada de matriz identidade e denotada por I, como por exemplo,
1 0 0
I(3) = diag(1, 1, 1) = 0 1 0

0 0 1

Material elaborado pelo Prof. Csar Gonalves de Lima

5
Uma matriz triangular superior uma matriz quadrada com zeros abaixo da
diagonal, como por exemplo,
7
0
T=
0

2 3 5
0 2 6

0 4
1

0 0
8

Um vetor de 1s denotado por j:


1
1
j(4) =
1

1
Uma matriz quadrada de 1s denotada por J, como por exemplo,
1 1 1
J(33) = 1 1 1

1 1 1
Ns denotamos um vetor de zeros por 0 e uma matriz de zeros por ou ,
por exemplo,
0
0(3) = 0 ,

0

0 0 0
(33) = = 0 0 0 .

0 0 0

2.2. OPERAES COM MATRIZES


2.2.1 Adio de duas matrizes

Se duas matrizes tm a mesma dimenso, sua soma encontrada adicionando os elementos correspondentes. Assim, se A(np) e B(np), ento C = A + B tambm np e
encontrada como C = (cij) = (aij + bij). Por exemplo,
4 11 5 6 18 2 2
7 3
+
=
2
8 5 3 4
2 5 12 3

Material elaborado pelo Prof. Csar Gonalves de Lima

6
A diferena D = A B entre as matrizes A e B definida similarmente: D = (dij) =
(aij bij). Duas propriedades importantes da adio de matrizes so dadas a seguir:
Teorema 2.2A. Se A e B so np, ento:
(i) A + B = B + A

(2.9)

(ii) (A + B) = A + B

(2.10)

2.2.2 Produto de duas matrizes

Para que o produto AB de duas matrizes seja possvel, o nmero de colunas da matriz
A deve ser igual ao nmero de linhas de B. Neste caso, dizemos que as matrizes A e
B so conformes. Ento, o (ij)-simo elemento do produto C = AB definido como:
cij =

aik bkj

(2.11)

que igual soma dos produtos dos elementos da i-sima linha de A pelos elementos
da j-sima coluna de B. Assim, ns multiplicamos todas as linhas de A por todas as
colunas de B. Se A (nm) e B (mp) ento C = AB (np). Por exemplo,
2 1 3
A(23) =
e B(32) =
4 6 5

1 4
2 6

3 8

Ento
(2)(1) + (1)(2) + (3)(3) (2)(4) + (1)(6) + (3)(8) 13 38
A
B
=
C
=
2  2
2 2
(4)(1) + (6)(2) + (5)(3) (4)(4) + (6)(6) + (5)(8) = 31 92

18 25 23

3BA3 = 3D3 = 28 38 36

38 51 49
Se A nm e B mp, onde n p, ento o produto AB definido, mas BA no
definido. Se A np e B pn, ento AB nn e BA pp. Neste caso, certamente, AB BA, como ilustrado no exemplo anterior. Se A e B so nn ento AB e BA
tm o mesmo tamanho, mas, em geral:
AB BA

(2.12)

A matriz identidade I(n) o elemento neutro da multiplicao de matrizes. Isto


quer dizer que, se A nn ento AI = IA = A.

Material elaborado pelo Prof. Csar Gonalves de Lima

7
A multiplicao de matrizes no comutativa e algumas manipulaes familiares com nmeros reais no podem ser feitas com matrizes. Entretanto, a multiplicao
de matrizes distributiva em relao soma ou subtrao:
A(B C) = AB AC

(2.13)

(A B)C = AC BC

(2.14)

Usando (2.13) e (2.14) ns podemos expandir produtos como (A B)(C D):


(A B)(C D) = (A B)C (A B)D
= AC BC AD + BD

(2.15)

A multiplicao envolvendo vetores segue as mesmas regras das matrizes. Suponha A(np), b(p1), c(p1) e d(n1). Ento:

Ab um vetor coluna n1

dA um vetor linha de dimenso 1p

bc um escalar correspondendo soma de produtos

bc uma matriz pp

cd uma matriz pn

Desde que bc uma soma de produtos (um escalar!) tem-se que bc = cb:
bc = b1c1 + b2c2 + + bpcp
cb = c1b1 + c2b2 + + cpbp

bc = cb

(2.16)

A matriz cd dada por


c1
c
2
cd = [d1 d2 dn] =
M

c p

c1d1 c1d 2
c d c d
2 2
2 1
M
M

c p d 1 c p d 2

L c1d n
L c2 d n

O
M

L c pdn

(2.17)

Similarmente:
b1
b
2
bb = [b1 b2 bp] = b12 + b22 + + b 2p =
M

b p

bi2

(2.18)

i =1

Material elaborado pelo Prof. Csar Gonalves de Lima

8
b1
b
2
bb = [b1 b2 bp] =
M

b p

b12 b1b2

2
b2b1 b2
M
M

b p b1 b p b2

L b1b p

L b2b p
O
M

L b 2p

(2.19)

Assim, bb uma soma de quadrados e bb uma matriz quadrada e simtrica.


A raiz quadrada da soma de quadrados dos elementos de um vetor bp1 igual
distncia da origem ao ponto b e conhecida como a norma euclidiana, ou o comprimento do vetor b:
p

comprimento de b = || b || =

b' b =

bi2

(2.20)

i =1

Se j um vetor n1 de 1s como definido em (2.6), ento por (2.18) e (2.19),


ns temos que:

jj = n,

1
1
jj =
M

1 L 1
1 L 1
= J(nn)
M O M

1 L 1

(2.21)

onde Jnn uma matriz quadrada de 1s como ilustrada em (2.7), Se a um vetor n1


e A uma matriz np, ento

aj = ja =

ai

(2.22)

i =1

jA =

[i ai1 i ai 2

i aip ]

j a1 j

j
2

e Aj = j
M

j anj

(2.23)

Assim, aj = ja a soma dos elementos em a, jA contem as somas das colunas de A


e Aj contem as somas das linhas de A. Note que em aj, o vetor j n1; em jA, o
vetor j n1 e em Aj, o vetor j p1.

Material elaborado pelo Prof. Csar Gonalves de Lima

9
1 2 3 4
Exemplo 1. Seja a matriz A = 5
1 6 4 e o vetor a =

2
5 4 0

2
5
ento:
1

8

1 2 3 4
i) j'A = [1 1 1] 5
1 6 4 = [8 4 13 8]

2
5 4 0

(totais das colunas de A)

1
1 2 3 4 6
1
ii) Aj = 5
1 6 4 = 16

1
2
5 4 0 11
1

(totais das linhas de A)

1
2
1
5

= ja = [1 1 1 1] = 16 (total dos elementos de a)


iii) aj = [2 5 1 8]
1
1


1
8

O produto de um escalar por uma matriz obtido multiplicando-se cada elemento da matriz pelo escalar:
ca11 ca12
ca
ca22
cA = (caij) = 21
M
M

can1 can 2

L ca1m
L ca2m
.
O
M

L canm

(2.24)

Desde que caij = aijc o produto de um escalar por uma matriz comutativo:

cA = Ac

(2.25)

A transposta do produto de duas matrizes igual ao produto das transpostas


em ordem reversa.

Teorema 2.2B. Se A np e B pm, ento:


(AB) = BA

(2.26)

Prova: Seja C = AB. Ento por (2.11), temos que C = (cij) = aik bkj
k =1

Por (2.3), a transposta de C = AB dada por:


Material elaborado pelo Prof. Csar Gonalves de Lima

10
(AB) = C = (cij) = (cji)
p
p

= a jk bki = bki a jk = BA.


k =1
k =1

Para ilustrar os passos dessa prova, vamos usar as matrizes A23 e B32:
a
a
AB = 11 12
a21 a22

a13
a23

b11 b12
b
b22
21

b31 b32

a11b12 + a12b22 + a13b32


a b + a b + a b
= 11 11 12 21 13 31

a21b11 + a22b21 + a23b31 a21b12 + a22b22 + a23b32


a b + a b + a b
(AB) = 11 11 12 21 13 31
a11b12 + a12b22 + a13b32

a21b11 + a22b21 + a23b31


a21b12 + a22b22 + a23b32

b11a21 + b21a22 + b31a23


b a + b a + b a
= 11 11 21 12 31 13

b12 a11 + b22 a12 + b32 a13 b12 a21 + b22 a22 + b32 a23
a11
b11 b21 b31
(AB) =
a12
b
b
b
12
22
32

a
13

a21
a22 = BA

a23

Corolrio 1. Se A, B e C so conformes, ento (ABC) = CBA.

Exemplo 2. Seja y = [y1, y2, , yn] um vetor de pesos de n frangos de corte. Para
calcular a mdia e a varincia dos pesos desses frangos, ns usamos:
1 n
1 n
y = yi
s2 =
( yi y )2

n i =1
n 1 i =1
1
jy, onde j um vetor n1 de
n
1s e n = jj. Para calcular a varincia precisamos, primeiramente, calcular o vetor de
desvios:
Matricialmente, a mdia pode ser calculada por y =

1
1
1

y y = y j y = y j j' y = y jjy = y Jy =
n
n
n

1
I J y
n

Onde I a matriz identidade nn e J uma matriz nn de 1s. Para calcular a soma


de quadrados de desvios fazemos:
Material elaborado pelo Prof. Csar Gonalves de Lima

11
n

( yi y )
i =1

1 1
= I J y I J y
n n

1
1
1
1 1

= y I J I J y = y I' I IJ J' I + 2 J' J y


n n
n
n
n

Mas J = J, II = I, IJ = J, JI = J = J, jj = n e JJ = jjjj = nJ. Ento:


n

( yi y )2
i =1

1
1
2

2
1
= y I J + 2 nJ y = y I J + J y = y I J y
n
n
n

Ento, a varincia pode ser calculada por:

s2 =

1 n
( yi y )2 = 1 y' I 1 J y

n 1 i =1
n 1
n

Supondo que A nm e B mp, seja a ti a i-sima linha da matriz A e bj, a jsima coluna da matriz B, de tal forma que:
a11
a
A = 21
M

a n1

a12
a 22
M
an 2

L a1m a1t

L a 2 m a t2
=
, B=
O M M

L a nm a tn

b11 b12
b
b22
21
M
M

bm1 bm 2

L b1 p
L b2 p
= [b1, b2, , bp]
O M

L bmp

Ento, por definio, o (ij)-simo elemento de AB a ti bj:


a1t b1 a1t b 2
t
a 2b1 at2b 2

AB =
M
M
t
t
a nb1 a nb 2

L a1t b p

L a t2b p
O
M

L a tnb p

a1t (b1 , b 2 , L, b p )
t

a 2 (b1 , b 2 , L, b p )

=
=

M
t

a n (b1 , b 2 , L , b p )

a1t B a1t
t t
a 2 B = a 2 B
M M
t t
a n B a n

(2.27)

A primeira coluna de AB pode ser expressa em termos de A como


a1t b1 a1t
t t
a 2b1 = a 2 b1 = Ab1
M M
t t
a nb1 a n
Material elaborado pelo Prof. Csar Gonalves de Lima

12
De forma anloga, a segunda coluna de AB Ab2 e assim por diante. Assim AB pode
ser escrita em termos das colunas de B:
AB = A[b1, b2, , bp] = [Ab1, Ab2, , Abp]

(2.28)

Qualquer matriz A pode ser multiplicada pela sua transposta para formar AA
ou AA. Algumas propriedades desses produtos so dadas no prximo Teorema.
Teorema 2.2C. Seja A uma matriz np. Ento AA e AA tm as seguintes propriedades:
(i) AA pp e obtida como produto das colunas de A.
(ii) AA nn e obtida como produto das linhas de A.
(iii) Ambas as matrizes AA e AA so simtricas.
(iv) Se AA = ento A = .
Seja A uma matriz quadrada nn e D = diag(d1, d2, , dn). No produto DA, a
i-sima linha de A multiplicada por di e em AD, a j-sima coluna de A multiplicada por dj. Por exemplo, se n = 3, ns temos:
DA

d1 0
= 0 d2

0 0

AD

a11 a12
= a21 a22

a31 a32

0 a11 a12
0 a21 a22

d 3 a31 a32

a13
a23

a33

a13
a23 =

a33

d1 0
0 d
2

0 0

d1a11 d1a12
d a
d 2 a22
2 21
d 3a31 d 3a32

d1a13
d 2 a23

d 3a33

(2.29)

0 d1a11 d 2 a12
0 = d1a21 d 2 a22

d 3 d1a31 d 2 a32

d 3a13
d 3a23

d 3a33

(2.30)

d12 a11 d1d 2 a12

DAD = d 2 d1a21 d 22 a22


d d a
3 1 31 d 3d 2 a32

d1d 3a13

d 2 d 3a23
d 32 a33

(2.31)

Vale notar que DA AD. Entretanto, no caso especial onde a matriz diagonal
a matriz identidade, (2.29) e (2.30) temos:
IA = AI = A

(2.32)

Se A retangular, (2.32) continua valendo, mas as identidades das duas igualdades so de dimenses diferentes.

Material elaborado pelo Prof. Csar Gonalves de Lima

13
Se A uma matriz simtrica e y um vetor, o produto:
yAy =

aii yi2

+ 2 aij yi y j

(2.33)

i j

chamado de forma quadrtica. Se x n1, y p1 e A np, o produto:


xAy =

aij xi y j

(2.34)

ij

chamado de forma bilinear.

2.2.3. Soma Direta


Dadas as matrizes A(mn) e B(rs) definimos a sua soma direta como
A 0
AB=
= C(m+r,n+s)
0 B

Algumas propriedades da soma direta de matrizes:

(i) A (A)
(ii) Se as dimenses so favorveis, ento:
(A B) + (C D) = (A + C) (B + D)
(A B)(C D) = AC BD

Exemplo 3. Sejam as matrizes:


3 5
A = [10 11 15] , B =
, C = [ 10 11 15]
4

Ento,
10 11 15 0 0
A B = 0 0 0 3 5

0 0 0 4 1

0
0
0
10 11 15
AC=

0 0 0 10 11 15

(Perceba que A+C = )

2.2.4. Produto direto ou de Kronecker


Dadas as matrizes A(mn) e B(rs) definimos o produto direto ou produto de Kronecker
de A por B como a matriz C(mr ns) de tal forma que:

Material elaborado pelo Prof. Csar Gonalves de Lima

14
a11B a12B
a B a B
22
C(mr ns) = A B = 21
M
M

am1B am 2B

L a1 n B
L a2 n B

O
M

L amn B

Algumas propriedades interessantes do produto direto de matrizes:


(i) A B B A , em geral
(ii) Se u e v so vetores, ento u v = v u = vu.
(iii) Se D(n) uma matriz diagonal e A uma matriz qualquer, ento:
D A = d11A d22A dnnA
(iv) Se as dimenses so favorveis

(A B)(C D) = AC BD
Exemplo 4. Sejam as matrizes:
1 2
A(22) =
,
3
4

0
1 1
B(23) =
,
3
5

1
y(31) = 1 .

0

Ento
0 2 2
0
1 1
3 5 6 6 10 12
,
AB =
3 3
0 4 4
0

9 15 18 12 20 24

2
1
1 2

0
0
Ay =
,
3
4

3 4

0
0

0
0
1 2 1 2
3 4 3 4
0
0

B A =
3 6 5 10 6 12

9 12 15 20 18 24

2
1
3
4

1 2
y A =

0
0

0
0

2.2.5 Potncia de matriz quadrada

Dada uma matriz quadrada A e um nmero k Z (conjunto dos nmeros inteiros e


positivos), definimos a k-sima potncia da matriz A como:
A k = AAA
A
142L
43
k vezes

Material elaborado pelo Prof. Csar Gonalves de Lima

15
Em relao sua segunda potncia, uma matriz quadrada A, ser chamada de:
(i) idempotente, se A 2 = A.
(ii) nilpotente, se A 2 = .
(iii) unipotente, se A 2 = I.
Teorema. Se P(n) uma matriz idempotente e se I(n) a matriz identidade de ordem n,
ento a matriz I P idempotente.

2.3. MATRIZES PARTICIONADAS

Muitas vezes conveniente particionar uma matriz em submatrizes. Por exemplo,


uma partio de uma matriz A em quatro submatrizes (quadradas ou retangulares) de
dimenses apropriadas, pode ser indicada simbolicamente como:
A
A = 11
A 21

A12
A 22

Para ilustrar, seja a matriz A(45) particionada como:


7
3
A=
9

2 5 8
4 0 2

4
7
A
= 11
A
3 6 5 2
21

1 2 1
6

A12
A 22

Onde:
7 2 5
8 4
9 3 6
A11 =
,
A
=
,
A
=
12
21

2 7
3 1 2 e A22 =

3
4
0

5 2
1
6

Se duas matrizes A e B so conformes, e se A e B so particionadas de tal forma que as submatrizes sejam apropriadamente conformes, ento o produto AB pode
ser encontrado usando a maneira usual de multiplicao (linha-por-coluna) tendo as
submatrizes como se fossem elementos nicos. Por exemplo:
A
AB = 11
A 21

A12 B11 B12


A 22 B 21 B 22

A B + A12B 21
= 11 11
A 21B11 + A 22B 21

A11B12 + A12B 22
A 21B12 + A 22B 22

(2.35)

Material elaborado pelo Prof. Csar Gonalves de Lima

16
Se B trocada por um vetor b particionado em dois conjuntos de elementos e
se A correspondentemente particionada em dois conjuntos de colunas, ento (2.35)
fica:
b
Ab = [A1, A2] 1 = A1b1 + A2b2
(2.36)
b 2
Onde o nmero de colunas de A1 igual ao nmero de elementos de b1 e A2 e b2 so
similarmente conformes.
A multiplicao particionada em (2.36) pode ser estendida para colunas individuais de A e elementos individuais de b:
b1
b
2
Ab = [a1, a2, , ap] = b1a1 + b2a2 + + bpap
M

b p

(2.37)

Assim, Ab pode ser expressa como uma combinao linear de colunas de A, na qual
os coeficientes so os elementos de b. Ns ilustramos (2.37) no seguinte exemplo:

Exemplo 5. Sejam:

6 2 3
A = 2
1 0 , b =

4
3 2

4
2

1

17
Ab = 10

20

Usando uma combinao linear de colunas de A como em (2.37), ns obtemos:


Ab = b1a1 + b2a2 + b3a3

6
2
3 24 4 3 17

= 4 2 + 2 1 + (1) 0 = 8 + 2 0 = 10



4
3
2 16 6 2 20
Por (2.28) e (2.29), as colunas do produto AB so combinaes lineares das colunas de A. Os coeficientes para a j-sima coluna de AB so os elementos da j-sima
coluna de B.

Material elaborado pelo Prof. Csar Gonalves de Lima

17
O produto de um vetor linha por uma matriz, aB, pode ser expresso como uma
combinao linear das linhas de B, na qual os coeficientes so os elementos de a:
b1t
t
b
aB = [a1, a2, , an] 2 = a1 b1t + a2 b t2 + + an b tn
M
t
b n

(2.38)

Por (2.27) e (2.38), as linhas do produto AB so combinaes lineares das linhas de


B. Os coeficientes da i-sima linha de AB so os elementos da i-sima linha de A.
Finalmente, notamos que se uma matriz A particionada como A = [A1, A2], ento:
A1t
A = [A1, A2] = t
A 2

(2.39)

2.4 POSTO (RANK) DE UMA MATRIZ

Antes de definirmos o posto (ou rank) de uma matriz, ns introduziremos a noo de


independncia linear e dependncia. Um conjunto de vetores {a1, a2, , ap} dito
linearmente dependente (l.d.) se pudermos encontrar um conjunto de escalares c1, c2,
, cp (nem todos nulos) de tal forma que:

c1a1 + c2a2 + + cpap = 0

(2.40)

Se no encontrarmos um conjunto de escalares c1, c2, , cp (nem todos nulos) que satisfaam (2.40), o conjunto de vetores {a1, a2, , ap} dito linearmente independente
(l.i.). Por (2.37), podemos reescrever essa definio da seguinte forma:

As colunas de A so linearmente independentes se Ac = 0 implica em c = 0.


Observe que se um conjunto de vetores inclui um vetor nulo, o conjunto de vetores
linearmente dependente.
Se (2.40) satisfeita, ento existe pelo menos um vetor ai que pode ser expresso como uma combinao linear dos outros vetores do conjunto. Entre vetores linearmente independentes no existem redundncias desse tipo.
Definio: O posto (rank) de qualquer matriz A (quadrada ou retangular) definido
como o nmero de colunas (linhas) linearmente independentes de A

Pode-se mostrar que o nmero de colunas l.i. de qualquer matriz igual ao nmero de
linhas l.i. dessa matriz.
Material elaborado pelo Prof. Csar Gonalves de Lima

18
Se a matriz A tem um nico elemento diferente de zero, com todos os demais
elementos iguais a zero, ento rank(A) = 1. O vetor 0 e a matriz tm posto zero.
Se a matriz retangular A(np) de posto p, onde p < n, ento A tem o maior posto
possvel e dito ter posto coluna completo.
Em geral, o maior posto possvel de uma matriz A(np) o min(n, p). Assim, em
uma matriz retangular, as linhas, as colunas ou ambas so linearmente dependentes.
Ns ilustramos esse fato no prximo exemplo.

Exemplo 6. O posto da matriz:

1 2 3
A=
2 4
5
igual a 2, porque as duas linhas so linearmente independentes, pois nenhuma linha
mltipla da outra. Conseqentemente, pela definio de posto, o nmero de colunas
l.i. tambm 2. Portanto, as trs colunas de A so l.d. e por (2.40) existem constantes
c1, c2 e c3 (nem todas nulas) tais que:
1
2
3 0
c1 + c2 + c3 =
5
2
4 0

(2.41)

Por (2.37) ns escrevemos (2.41) na forma


c1
1 2 3 0
c2 =
ou Ac = 0
5
2 4 0

c3

(2.42)

14
A soluo (no trivial) para (2.42) dada por qualquer mltiplo de c = 11 . Neste

12
caso o produto Ac = 0, mesmo com A 0 e c 0. Isso s possvel por causa da dependncia linear dos vetores-colunas de A.
Nem sempre fcil perceber que uma linha (ou coluna) uma combinao linear de outras linhas (ou colunas). Nesses casos pode ser difcil calcular o posto de
uma matriz. Entretanto, se conseguirmos obter a forma escalonada cannica (f.e.c.)
da matriz, o seu posto corresponder ao nmero de linhas (ou colunas) que tenham o
nmero 1 como lder. A obteno da f.e.c. de uma matriz feita atravs de operaes
elementares em suas linhas (ou colunas).

Material elaborado pelo Prof. Csar Gonalves de Lima

19
Definio: So chamadas de operaes elementares nas linhas da matriz A (e de
modo similar nas suas colunas):
(i) trocar a posio de duas linhas da matriz.
(ii) multiplicar uma linha da matriz por um escalar k 0 (li = kli).
(iii) somar a uma linha da matriz um mltiplo de outra linha (li = li + klj).
Teorema: Uma matriz A equivalente por linhas a uma matriz B se B pode ser obtida de A aplicando-se uma seqncia de operaes elementares sobre as suas linhas.
Definio: Dizemos que uma matriz A(nm) est na sua forma escalonada cannica ou
reduzida se ocorrer simultaneamente que:
(a) o primeiro elemento no nulo de cada linha no nula o nmero 1 (piv);
(b) toda coluna que tem um piv, tem todos os outros elementos nulos;
(c) o piv da linha i +1 ocorre direita do piv da linha i (i = 1, 2, , n 1).
(d) todas as linhas nulas (formadas inteiramente por zeros) ocorrem abaixo das
linhas no nulas.
Definio: Dizemos que uma matriz est na forma escalonada se ela satisfaz as propriedades (c) e (d), mas no necessariamente as propriedades (a) e (b).

Das matrizes apresentadas a seguir, B no est na forma escalonada, A e C esto nas suas formas escalonadas cannicas e D, na forma escalonada.
1 0 0
A = 0 1 0 , B =

0 0 0

1
0

0 0 0
0 0 1
, C =
0 1 0

1 0 0

1 2 1 2
0 0 0 0 , D =

4 0 3
0 3 0

0 0 1

Teorema. Dada uma matriz real A(np) sempre possvel obtermos a sua forma escalonada cannica (f.e.c.) atravs de operaes elementares.

Assim, calcular o posto da matriz A o mesmo que calcular o posto da f.e.c. de A,


pois so equivalentes. Portanto, calcular o posto da f.e.c. de A o mesmo que contar
o seu nmero de 1s pivs.

Material elaborado pelo Prof. Csar Gonalves de Lima

20
Exemplo 7. Vamos obter a f.e.c. da matriz A do Exemplo 2.4(a):

1 2 3
A=
2 4
5
(i) Fazendo l2 = l2 5l1, ns obtemos:
3
1 2 3 1 2
~
.
5
2 4 0 12 11

(ii) Fazendo l2 = l2 /12, ns obtemos:


3 1 2
3
1 2
0 12 11 ~ 0
.
1

11
/
12

(iii) Fazendo l1 = l1 + 2l2, obtemos:


3 1 0
7 / 6
1 2
~
0
1 11 / 12 0 1 11 / 12

7 / 6
1 0
Ento a f.e.c. de A a matriz
e o rank(A) = 2.
0
1

11
/
12

Definio: Dizemos que uma matriz quadrada est na forma de Hermite (Graybill
1969, p.120) se satisfaz as seguintes condies:
(a) uma matriz triangular superior;
(b) tem apenas valores zero ou um na sua diagonal;
(c) se tem o valor zero na diagonal, os elementos restantes na linha so zeros;
(d) se tem o valor um na diagonal, os elementos restantes da coluna em que aparece o nmero um, so nulos.
Definio: Dizemos que uma matriz quadrada est na forma de Echelon (Graybill,
1969, p.286) se ela satisfaz as condies de uma forma de Hermite e apresenta as
linhas de zeros abaixo das linhas que no so nulas.

Ns podemos estender (2.42) para produtos de matrizes. possvel encontrar


matrizes A 0 e B 0, tais que:
AB = 0
(2.43)
Por exemplo,
6 0 0
1 2 2
2 4 1 3 = 0 0

Material elaborado pelo Prof. Csar Gonalves de Lima

21
Ns tambm podemos explorar a dependncia linear das linhas ou colunas de
uma matriz para criar expresses tais como AB = CB, onde A C. Assim em uma
equao matricial, ns no podemos, em geral, cancelar uma matriz de ambos os
lados da equao. Uma exceo a essa regra ocorre quando as matrizes envolvidas
so quadradas e B uma matriz no-singular (ser definida na Seo 2.5).
Exemplo 8. Ns ilustramos a existncia de matrizes A, B e C tais que
onde A C. Sejam as matrizes:
1 2
1
1
1 3 2
2
, B = 0 1 , C =
A =

AB = CB =

2
0
1
5

1 0
O teorema seguinte d um caso geral e dois casos especiais para o posto
de duas matrizes.

AB = CB,

3 5
1 4 .

do produto

Teorema 2.4A.
(i) Se as matrizes A e B so conformes, ento rank(AB) rank(A) e rank(AB)
rank(B).
(ii) A multiplicao por uma matriz no-singular (ver Seo 2.5) no altera o posto
da matriz, isto , se B e C so no-singulares rank(AB) = rank(CA) = rank(A).
(iii) Para qualquer matriz A, rank(AA) = rank(AA) = rank(A) = rank(A).

Prova:
(i) Todas as colunas de AB so combinaes lineares das colunas de A (ver um comentrio no Exemplo 2.3) conseqentemente, o nmero de colunas l.i. de AB
menor ou igual ao nmero de colunas l.i. de A, e rank(AB) rank(A). Similarmente, todas as linhas de AB so combinaes lineares das linhas de B [ver
comentrio em (2.38)] e da, rank(AB) rank(B).
(ii) Se B no singular, existe uma matriz B -1 tal que B B -1 = I [ver (2.45) a seguir].
Ento, de (i) ns temos que:

rank(A) = rank(AB B -1 ) rank(AB) rank(A).


Assim ambas as desigualdades tornam-se igualdades e rank(A) = rank(AB). Similarmente, rank(A) = rank(CA) para C no-singular.

2.5. INVERSA DE UMA MATRIZ

Uma matriz quadrada de posto completo dita no-singular. Uma matriz A,


1
no-singular, tem inversa nica, denotada por A , com a propriedade que:
1

AA =A A=I

(2.45)

Material elaborado pelo Prof. Csar Gonalves de Lima

22
Um algoritmo simples (que trabalhoso se a dimenso da matriz grande!)
para obteno da inversa de uma matriz consiste em justapor matriz A uma matriz
identidade de mesma ordem. Opera-se simultaneamente sobre as linhas das duas matrizes at que no lugar da matriz A aparea a sua f.e.c. (neste caso, uma matriz iden1
tidade). Nesse momento, no lugar da matriz identidade estar a inversa A de A. Ou
seja:
1

[A | I ] ~ ~ [I | A ]

Exemplo 9. Seja a matriz quadrada:

4 7
A=
.
2 6
(1) Fazendo l2 = l2 (1/2) l1:
7
1 0
4 7 1 0 4
~
2 6 0 1 0 5 / 2 1 / 2 1

(2) Fazendo l2 = (2/5)l2:


1
0 4 7
1
0
4 7
~
0 5 / 2 1 / 2 1 0 1 1 / 5 2 / 5

(3) Fazendo l1 = l1 + (7) l2:


1
0 4 0 12 / 5 14 / 5
4 7
0 1 1 / 5 2 / 5 ~ 0 1 1 / 5
2 / 5


(4) Fazendo l1 = (1/4) l1:
3 / 5 7 / 10
4 0 12 / 5 14 / 5 1 0
~
0 1 1 / 5
2 / 5 0 1 1 / 5
2 / 5

Ento
4 7 1 0
2 6 0 1 ~ ~

3 / 5 7 / 10
1 0
1
A =
0 1 1 / 5

2 / 5

0.6 0.7
0.2
0.4

Se a matriz B no-singular e AB = CB, ento ns podemos multiplicar direita por


1
B os dois lados da igualdade, obtendo:
1

AB = CB ABB = CBB A = C
Importante: Se a matriz B singular ou retangular, ela no pode ser cancelada nos
dois lados da igualdade AB = CB.
Material elaborado pelo Prof. Csar Gonalves de Lima

23
Similarmente, se A no-singular ento o sistema Ax = c tem a soluo nica:
1

x=A c

(2.47)

Teorema 2.5A. Se A no singular, ento A no singular e a sua inversa pode ser


encontrada como:
1
1
(A) = (A )
(2.48)
Teorema 2.5B. Se A e B so matrizes no singulares de mesma dimenso, ento AB
no-singular e
1

(AB) = B A

(2.49)

Se a matriz A simtrica, no-singular e particionada como:


A12
A
A = 11

A 21 A 22
1

e se B = A22 A21(A11) A12, ento supondo que (A11) e B existem, a inversa de A


dada por
-1
-1
-1
-1
A11
A12B 1A 21A11
A12B 1
A11
A11
1
A =
(2.50)

1
-1
1
B
A
A
B

21 11
Como um caso especial de (2.50), consideremos a matriz no singular:
A
A = 11 t
(a12 )

a12
a22
1

onde A11 quadrada, a22 um escalar e a12 um vetor. Ento se (A11)


inversa de A pode ser expressa como:
1
A =
b
1

-1
-1
-1
-1
bA11
+ A11
a12 (a12 )t A11
A11
a12

-1
(a12 )t A11
1

existe, a

(2.51)

onde b = a22 (a12)t(A11) a12. Como um outro caso especial de (2.50) ns temos:
A
A = 11


A 22

que tem a inversa


A 1
1
A = 11

A 221

(2.52)

Material elaborado pelo Prof. Csar Gonalves de Lima

24
Se uma matriz quadrada da forma B + cc no singular, onde c um vetor e B
uma matriz no singular, ento:
B 1cc' B 1
1
1
(B + cc) = B
(2.53)
1 + c' B 1c

2.6 MATRIZES POSITIVAS DEFINIDAS


Formas quadrticas foram introduzidas em (2.33). Por exemplo, a forma quadrtica
3 y12 + y22 + 2 y32 + 4 y1 y2 + 5 y1 y3 6 y2 y3 pode ser expressa como:
3 y12 + y22 + 2 y32 + 4 y1 y2 + 5 y1 y3 6 y2 y3 = yAy
onde

y1
y = y2 ,

y3

3 4 5
A = 0 1 6 .

0 0 2

Entretanto, essa forma quadrtica pode ser expressa em termos da matriz simtrica:

2 5 / 2
3
1
(A + A) = 2
1 3.

2
5 / 2 3 2
Em geral, qualquer forma quadrtica yAy pode ser expressa como:
A + A'
yAy = y
y
2

(2.54)

Assim a matriz-ncleo da forma quadrtica pode sempre ser escolhida como uma
matriz simtrica (e nica!).

Exemplo 10. A varincia definida como s2 =

1
1

y' I J y = yAy uma forma


n 1
n

quadrtica e a sua matriz ncleo simtrica:


1
1 1
1

L

1 n
n
n n


1
1
1 1

1 L
A=

n
n
n = n(n 1)

n 1
M
M
M M


1
1 1
1

L 1
n
n
n n(n 1)

1
1
L
n(n 1)
n(n 1)

1
1
L

n(n 1)
n
M
M

1
1
L

n(n 1)
n

Material elaborado pelo Prof. Csar Gonalves de Lima

25
As somas de quadrados encontradas na anlise de regresso (Captulos 6 a 10)
e anlise de varincia (Captulos 11 a 14) podem ser expressas na forma yAy, onde y
um vetor de observaes. Tais formas quadrticas so positivas (ou no mnimo nonegativas) para todos os valores de y.
Se a matriz simtrica A tem a propriedade de yAy > 0 para todos os possveis
vetores de observaes y, com exceo de y = 0, ento a forma quadrtica yAy dita
positiva definida e A dita matriz positiva definida.
Similarmente, se yAy 0 para todos os possveis vetores de observaes y,
com exceo de y = 0, ento a forma quadrtica yAy dita positiva semidefinida e A
dita matriz positiva semidefinida.
Exemplo 11. Para ilustrar uma matriz positiva definida, considere:

2 1
A=

1 3

A forma quadrtica associada


yAy = 2 y12 2 y1 y2 + 3 y22 = 2( y1 0,5 y2 )2 + (5/2) y22

que claramente positiva a menos que y1 e y2 sejam ambos iguais a zero.


Para ilustrar uma matriz positiva semidefinida, considere:
(2 y1 y2 )2 + (3 y1 y3 )2 + (3 y2 2 y3 )2
que pode ser expresso como yAy, com
13 2 3
A = 2 10 6

3 6
5
Se 2 y1 = y2 , 3 y1 = y3 e 3 y2 = 2 y3 , ento (2 y1 y2 )2 + (3 y1 y3 )2 + (3 y2 2 y3 )2
= 0. Assim yAy = 0 para qualquer mltiplo de y = [1, 2, 3]. Para todos os outros
casos, yAy > 0 (com exceo de y = 0).

Teorema 2.6A.
(i) Se A positiva definida, ento todos os elementos aii da sua diagonal so positivos.
(ii) Se A positiva semidefinida, ento todos aii 0.

(Ver prova na pgina 23 do livro do Rencher)


Material elaborado pelo Prof. Csar Gonalves de Lima

26
Teorema 2.6B. Seja P uma matriz no-singular.
(i) Se A positiva definida, ento PAP positiva definida.
(ii) Se A positiva semidefinida, ento PAP positiva semidefinida.

(Ver prova na pgina 23 do livro do Rencher)


Corolrio 1. Seja A(pp) uma matriz positiva definida e seja a matriz B(kp) de posto
k p. Ento a matriz BAB positiva definida.
Corolrio 2. Seja A(pp) uma matriz positiva definida e seja a matriz B(kp). Se k > p
ou se rank(B) = r, onde r < k e r < p, ento a matriz BAB positiva semidefinida.

Teorema 2.6C. Uma matriz simtrica A positiva definida se e somente se existe


uma matriz no singular P tal que A = PP.

(Ver prova na pgina 23 do livro do Rencher)


Corolrio 1. Uma matriz positiva definida no-singular.

Um mtodo de fatorar uma matriz positiva definida A em um produto PP


chamado de decomposio de Cholesky [ver Seber (1977, pg.304-305)], pelo qual A
pode ser fatorado de modo nico em A = TT, onde T uma matriz no singular e
triangular superior.
Para qualquer matriz quadrada ou retangular B, a matriz BB positiva definida ou positiva semidefinida.
Teorema 2.6D. Seja a matriz B(np).
(i) Se rank(B) = p, ento BB positiva definida.
(ii) Se rank(B) < p, ento BB positiva semidefinida.

Prova:
(i) Para mostrar que yBBy > 0 para y 0, ns notamos que yBBy = (By)(By)
uma soma de quadrados e portanto, positiva definida, a menos que By = 0. Por
(2.37) ns podemos expressar By na forma:
By = y1b1 + y2b2 + + ypbp

Essa combinao linear no igual a 0 (para qualquer y 0) porque rank(B) = p


e as colunas de B so l.i.
Material elaborado pelo Prof. Csar Gonalves de Lima

27
(ii) Se rank(B) < p, ento ns podemos encontrar y 0 tal que
By = y1b1 + y2b2 + + ypbp = 0

porque as colunas de B so l.d. [ver (2.40)]. Da, yBBy 0.

Note que se B uma matriz quadrada, a matriz B = BB no necessariamente


positiva semidefinida. Por exemplo, seja a matriz:
1 2
B=

1 2
Ento:
1 2
2 4
B2 =
,
BB
=

4
8
1 2

Neste caso, B2 no positiva semidefinida, mas BB positiva semidefinida, porque


2
yBBy = 2(y1 2y2) 0.
1

Teorema 2.6E. Se A positiva definida, ento A positiva definida.

Prova: Pelo Teorema 2.6C, A = PP, onde P no singular. Pelos Teoremas 2.5A e
1
1
1
1
1 1
2.5B, A = (PP) = P (P) = P (P ), que positiva definida pelo Teorema 2.6C.
Teorema 2.6F. Se A positiva definida e particionada na forma

A
A = 11
A 21

A12
A 22

onde A11 e A22 so quadradas, ento A11 e A22 so positivas definidas.


I
Prova: Ns podemos escrever A11 como A11 = [I, 0] A , onde I tem a mesma di0
menso de A11. Ento, pelo Corolrio 1 do Teorema 2.6B, A11 positiva definida.

Material elaborado pelo Prof. Csar Gonalves de Lima

28
2.7 SISTEMAS DE EQUAES

O sistema de equaes de n equaes (lineares) e p incgnitas

a11x1 + a12x2 + + a1pxp = c1


a21x1 + a22x2 + + a2pxp = c2
(2.55)

an1x1 + an2x2 + + anpxp = cn


pode ser escrito na forma matricial como
Ax = c

(2.56)

onde A np, x p1 e c n1.


Note que:

Se n p ento os vetores x e c so de tamanhos diferentes.

Se n = p e A no-singular, ento por (2.47), existe um nico vetor soluo x =


1
A c.

Se n > p, tal que A tenha mais linhas que colunas (mais equaes do que incgnitas), ento, geralmente, o sistema Ax = c no tem soluo.

Se n < p, tal que A tenha menos linhas que colunas, ento o sistema Ax = c tem
um nmero infinito de solues.

Se o sistema (2.56) tem uma ou mais vetores solues, ele chamado de sistema
consistente. Se no tem soluo, ele chamado de sistema inconsistente.

Para ilustrar a estrutura de um sistema consistente, suponha que A seja pp


tenha posto r < p. Ento as linhas de A so linearmente dependentes e existe algum b
tal que [ver (2.38)]:
bA = b1 a1t + b2 a t2 + + bp a tp = 0

Ento, ns tambm podemos ter bc = b1c1 + b2 c2+ + bp cp = 0, porque a multiplicao de Ax = c por b (de ambos os lados) d:
bAx = bc

ou

0x = bc.

Por outro lado, se bc 0, no existe x tal que Ax = c. Portanto, para que Ax = c seja
consistente, a mesma relao (qualquer que seja) que existe entre as linhas de A deve
existir entre os elementos (linhas) de c. Isso formalizado comparando o posto de A
com o posto da matriz aumentada [A, c]. A notao [A, c] indica que c foi justaposta
matriz A como uma coluna adicional.
Teorema 2.7A O sistema de equaes Ax = c consistente (tem no mnimo uma
soluo) se e somente se rank(A) = rank[A, c].
Material elaborado pelo Prof. Csar Gonalves de Lima

29

Prova: Suponha que rank(A) = rank[A, c], de tal forma que justapor no altera o
posto da matriz A. Ento c uma combinao linear das colunas de A; isto ,
existe pelo menos um x tal que
x1a1 + x2a2 + + xpap = c
que, por (2.38) pode ser escrito como Ax = c. Assim, x uma soluo do sistema Ax = c.
Por outro lado, suponha que existe um vetor soluo x tal que Ax = c. Em geral,
tem-se que rank(A) rank[A, c] [ver Harville (1997, p.41)]. Mas desde que
existe um x tal que Ax = c, ns temos:

rank[A, c] = rank[A, Ax] = rank[A(I, x)]


rank(A)

[Teorema 2.4A(i)]

Por isso,

rank(A) rank[A, c] rank(A)


e da ns temos que rank(A) = rank[A, c].
Um sistema de equaes consistente pode ser resolvido pelos mtodos usuais
apresentados nos cursos bsicos de lgebra (mtodo da eliminao de variveis, por
exemplo). No processo, uma ou mais variveis podem terminar como constantes arbitrrias, gerando assim um nmero infinito de solues. Um mtodo alternativo para
resolver o sistema ser apresentado na Seo 2.8.2.
Exemplo 12. Considere o sistema de equaes:

x1 + 2x2 = 4
x1 x2 = 1
x1 + x2 = 3

ou

1 2
4
x

1 1 1 = 1

x2
1 1
3

A matriz aumentada :
1 2 4
[A, c] = 1 1 1

1 1 3

que tem rank[A, c] = 2 porque a terceira coluna igual soma de duas vezes a primeira coluna com a segunda coluna. Desde que rank[A, c] = 2 = rank(A), existe ao
menos uma soluo para o sistema.
Se adicionarmos duas vezes a primeira equao segunda equao, o resultado
um mltiplo da terceira equao. Assim, a terceira equao redundante e as duas
primeiras podem ser resolvidas para obter a soluo nica x = [2, 1].

Material elaborado pelo Prof. Csar Gonalves de Lima

30
4
x2
3
2
1
0
0

x1

Figura 2.1 Trs linhas representando as equaes do sistema do Exemplo 2.7(a)

A Figura 2.1 mostra as trs linhas que representam as trs equaes do sistema.
Note que as trs linhas cruzam no ponto de coordenadas (2, 1), que a soluo nica
do sistema de trs equaes.
Exemplo 13. Se trocarmos o nmero 3 por 2 na terceira equao do Exemplo 2.7(a),
a matriz aumentada fica:

1 2 4
[A, c] = 1 1 1

1 1 2

que tem posto 3, j que nenhuma combinao linear das colunas 0. Como rank[A,c]
= 3 rank(A) = 2, o sistema inconsistente.
As trs linhas que representam as trs equaes so apresentadas na Figura 2.2,
onde ns percebemos que as trs linhas no tm um ponto comum de interseo. Para
encontrar a melhor soluo aproximada, uma abordagem consiste em usar o mtodo
dos mnimos quadrados, que consiste em buscar os valores de x1 e x2 que minimizam
2
2
2
(x1 + 2x2 4) + (x1 x2 1) + (x1 + x2 2) = 0.
4
x2

3
2
1
0
0

x1

Figura 2.2 Trs linhas representando as equaes do sistema do Exemplo 2.7(b)


Material elaborado pelo Prof. Csar Gonalves de Lima

31
Exemplo 2.7(c) Considere o sistema:
x1 + x2 + x3 = 1

2x1 + x2 + 3x3 = 5
3x1 + 2x2 + 4x3 = 6
A terceira equao a soma das duas primeiras, mas a segunda no um mltiplo da
primeira. Assim rank(A) = 2 = rank[A, c] e o sistema consistente. Resolvendo as
duas primeiras equaes para x1 e x2 em termos de x3, ns obtemos:

x1 = 2x3 + 4,

x2 = x3 3

O vetor soluo pode ser expresso como:


2 x3 + 4
2 4
x = x3 3 = x3 1 + 3


x3
1 0
onde x3 uma constante arbitrria. Geometricamente, x uma linha representando a
interseo dos dois planos correspondentes s duas primeiras equaes.

2.8. INVERSA GENERALIZADA

Vamos considerar inversas generalizadas daquelas matrizes que no tm inversas no


sentido usual [ver (2.45)]. Uma soluo de um sistema consistente de equaes Ax =c
pode ser expresso em termos de uma inversa generalizada de A.
2.8.1 Definio e Propriedades

Uma inversa generalizada de uma matriz A np qualquer matriz A , que satisfaz:

AA A = A

(2.57)

Uma inversa generalizada no nica exceto quando A no-singular, neste caso A


1
= A . Uma inversa generalizada que satisfaz (2.57) tambm chamada de inversa
condicional.

Toda matriz (quadrada ou retangular) tem uma inversa condicional. Isso garantido mesmo para vetores. Por exemplo:
1
2
x=
3

4

ento x1 = [1, 0, 0, 0] uma inversa generalizada de x que


satisfaz (2.57). Outros exemplos so x 2 = [0, 1/2, 0, 0], x 3 = [0,
0, 1/3, 0] e x 4 = [0, 0, 0, 1/4]. Para cada x i , ns temos que:
x xi x = x 1 = x,

i = 1, 2, 3.

Nessa ilustrao, x um vetor coluna e x i um vetor linha. Esse modelo generalizado no seguinte teorema.
Material elaborado pelo Prof. Csar Gonalves de Lima

32

Teorema 2.8A. Se A np ento qualquer inversa generalizada A pn.

Exemplo 14. Seja:

2 2 3
A = 1 0 1

3 2 4

(2.58)

Como a terceira linha de A a soma das duas primeiras linhas, e a segunda linha no
um mltiplo da primeira, o rank(A) = 2. Sejam
A1

1 0
0

= 1 / 2 1 0 ,

0 0 0

A 2

1
0
0

= 0 3 / 2 1 / 2

0
0
0

(2.59)

Facilmente podemos verificar que A A1 A = A e A A 2 A = A.

Teorema 2.8B. Suponha que A np de posto r e que A particionada como

A
A = 11
A 21

A12
A 22

Onde A11 rr de posto r. Ento a inversa generalizada de A dada por


1
A11

A =

Onde as trs matrizes nulas 0 tm dimenses apropriadas para que A seja pn.

(Ver prova na pg. 30 no livro do Rencher)


Corolrio 1. Suponha A (np) de posto r e que A particionado como no Teorema
2.8B, onde A22 rr de posto r. Ento a inversa generalizada de A dada por

0 0
A =
1
0 A 22

onde as trs matrizes nulas so de dimenses apropriadas, tais que A pn.

Material elaborado pelo Prof. Csar Gonalves de Lima

33
A submatriz no-singular no precisa estar na posio A11 ou A22, como no
Teorema 2.8B e no seu corolrio. O Teorema 2.8B pode ser estendido para o seguinte

algoritmo para encontrar uma inversa condicional A , para qualquer matriz A (np)
de posto r [ver Searle, 1982, p.218]:
1. Encontre qualquer submatriz no-singular C(rr). No necessrio que os elementos de C ocupem posies (linhas e colunas) adjacentes em A.
1

2. Encontre C e a sua transposta (C ).


1

3. Substitua em A os elementos de C pelos elementos de (C ).


4. Substitua todos os outros elementos de A por zeros.
5. Transponha a matriz resultante.
1 1 0
1 1 0

Exemplo 15. Calcular uma inversa generalizada (condicional) de X =


1 0 1

1 0 1
Usando o algoritmo de Searle (e lembrando que o posto da matriz X 2), escolhemos
convenientemente:
1 0
1
C=
C =

0 1
0
0

0 0
1 0
X =
0 1

0 0

1 0
1
0 1 (C ) =

1 0
0 1

0 0 0 0
0 1 0 0 uma inversa condicional de X

0 0 1 0

Vale lembrar que escolhendo outras matrizes C e usando o algoritmo, podemos encontrar outras inversas condicionais de X.

Teorema 2.8C. Seja A (np) de posto r, seja A uma inversa generalizada de A e

seja (AA) uma inversa generalizada de AA. Ento:


(i) posto(AA) = posto(AA) = posto(A) = r.

(ii) (A) uma inversa generalizada de A; isto (A) = (A ).

(iii) A = A(AA) AA e A = AA(AA) A.

(iv) (AA) A uma inversa generalizada de A, isto , A = (AA) A.

(v) A(AA) A simtrica, rank[A(AA) A] = r e invariante escolha de

(AA) ; isto , A(AA) A permanece a mesma, para qualquer (AA) .


Material elaborado pelo Prof. Csar Gonalves de Lima

34
Uma inversa generalizada de uma matriz simtrica no necessariamente simtrica. Entretanto, tambm verdade que uma inversa generalizada simtrica de
uma matriz simtrica, sempre pode ser encontrada; ver Problema 2.45. Neste livro,
ns assumimos que as inversas generalizadas de matrizes simtricas tambm so simtricas.
Alm da inversa generalizada (condicional) definida em (2.57) existem outras,
mq
+
como a inversa de mnimos quadrados (A ) e a inversa de Moore-Penrose (A ) que
muito til em demonstraes envolvendo modelos lineares.
Definio: Dada a matriz A(np) ento toda matriz A mq (pn) que satisfaz as duas
condies seguintes, uma inversa de mnimos quadrados da matriz A:
mq

(a) AA A = A
mq

(b) AA

uma matriz simtrica


mq

Teorema. Toda matriz do tipo A = (AA) A uma inversa de mnimos qua


drados de A [qualquer que seja a inversa condicional (AA) ].

1
1
Exemplo 16. Obter uma inversa de mnimos quadrados de X =
1

1
4 2 2
Primeiramente calculamos XX = 2 2 0 . Escolhendo C =

2 0 2
goritmo de Searle, obtemos:

1 0
1 0

0 1

0 1

2 0
0 2 e usando o al

0
0 0
(XX) = 0 0,5 0

0 0 0,5

Ento uma inversa de mnimos quadrados de X igual a:


mq

0
0
0
0

= (XX) X = 0,5 0,5 0


0

0
0 0,5 0,5

Vale observar que escolhendo outras matrizes C e, correspondentemente, calculando outras inversas condicionais de XX, podemos encontrar outras inversas de
mnimos quadrados da matriz X.
Material elaborado pelo Prof. Csar Gonalves de Lima

35
+

Definio: Dada a matriz A (np) de posto r, ento a matriz A (pn), de posto r, que
satisfaz s quatro condies seguintes, definida como a inversa generalizada de
Moore-Penrose da matriz A:
+

(a) AA A = A
+

(b) A AA = A
+

(c) A A simtrica
+

(d) A A simtrica
+

Teorema 2. Para cada matriz A (np) existe sempre uma e s uma matriz A que
satisfaz as condies de Moore-Penrose.

A obteno da inversa de Moore-Penrose bastante trabalhosa. Geralmente elas so


obtidas atravs de algum pacote estatstico. No proc iml do SAS, por exemplo, ela
obtida com o comando ginv.

2.8.2. Inversas Generalizadas e Sistemas de Equaes

Uma soluo para um sistema de equaes pode ser expressa em termos de uma inversa generalizada.

Teorema 2.8D. Se o sistema de equaes Ax = c consistente e se A uma inversa

generalizada de A, ento x = A c uma soluo.

Ver prova na pg.32 do livro do Rencher.

Vale lembrar mais uma vez que diferentes escolhas de A , resultaro em diferentes
solues para Ax = c.
Teorema 2.8E. Se o sistema de equaes Ax = c consistente, ento todas as possveis solues podem ser obtidas das duas seguintes maneiras:

(i) Use uma A especfica em x = A c + (I A A)h e use todos os possveis valores para o vetor arbitrrio h.
(ii) Use todas as possveis inversas A em x = A c.

Ver prova em Searle (1982, p.238)


Uma condio necessria e suficiente para que o sistema Ax = c seja consistente pode
ser dado em termos de uma inversa generalizada (ver Graybill 1976, p.36).
Material elaborado pelo Prof. Csar Gonalves de Lima

36
Teorema 2.8F. O sistema de equaes Ax = c consistente se e somente se para

qualquer inversa generalizada A de A

AA c = c.

Ver prova na pg. 33 do livro do Rencher.


Observe que o Teorema 2.8F fornece uma alternativa ao Teorema 2.7A para decidir
se um sistema de equaes consistente.
2.9. DETERMINANTES

Antes de definirmos o determinante de uma matriz quadrada, precisamos definir permutao e nmero de inverses. Seja o conjunto dos cinco primeiros nmeros inteiros S = {1, 2, 3, 4, 5} arrumados em ordem crescente.
Qualquer outra ordem j1, j2, , j5 dos elementos de S chamada uma permutao de S. Por exemplo: 32451, 45321, 32541, 12354 so permutaes de S.
O nmero de permutaes possveis com n objetos (ndices, neste caso) igual
a n! = n(n 1)(n 2)(2)(1). Por exemplo: com os ndices {1, 2, 3} conseguimos 3! = 6 permutaes, a saber, {123, 132, 213, 231, 312, 321}.
Uma permutao j1, j2, , j5 de S tem uma inverso se um nmero inteiro jr
precede um inteiro menor js. Por exemplo: a permutao 32451 tem 5 inverses
porque: o 3 antes do 2; o 3 antes do 1; o 2 antes do 1; o quatro antes do 1 e o 5
antes do 1.

O determinante de uma matriz A (nn) uma funo escalar de A definida como a


soma algbrica de todos os seus n! possveis produtos elementares. Denota-se geralmente por

(A) = | A | = det(A) =

n!

pi
i =1

Cada produto elementar do tipo pi = a1j1 a2j2 a3j3 anjn em que, nos ndices j1,

j2, , jn so colocados os nmeros de alguma permutao simples do conjunto


{1, 2, , n}.
Em cada produto pi existe somente um elemento de cada linha e coluna.
Cada produto elementar recebe o sinal + ou , conforme o nmero de inverses
envolvidas em pi seja par ou mpar, respectivamente.

Essa definio no muito til para calcular o determinante de uma matriz, exceto
para o caso de matrizes 22 ou 33. Para matrizes maiores, existem programas especficos (proc iml do SAS, Mapple e MathCad por exemplo) para calcular os determinantes.
Material elaborado pelo Prof. Csar Gonalves de Lima

37
a11
Exemplo 17. Seja a matriz A = a 21

a31

a12
a 22
a32

a13 2 0 1
a 23 = 3 1 4

a33 5 6 7

Como n = 3, temos 3! = 6 permutaes, a saber:

pi

Permutao

No de inverses

Sinal

Valor de pi

a11 a22 a33

123

+p1 = 14

a11 a23 a32

132

p2 = 48

a12 a21 a33

213

p3 = 0

a12 a23 a31

231

+p 4 = 0

a13 a21 a32

312

+p5 = 18

a13 a22 a31

321

p6 = 5

det(A) =

pi

= 49

i =1

Teorema 2.9A.
(i) Se D = diag(d1, d2, , dn) ento det(D) =

di
i =1

(ii) O determinante de uma matriz triangular o produto dos elementos da diagonal.


(iii) Se A singular, det(A) = 0. Se A no-singular, det(A) 0.
(iv) Se A positiva definida, det(A) > 0.
(v) det(A) = det(A)
1

(vi) Se A no singular, det(A ) = 1/det(A)


Teorema 2.9B. Se a matriz A particionada como

A
A = 11
A 21

A12
,
A 22

e se A11 e A22 so quadradas e no singulares (mas no necessariamente do mesmo


tamanho) ento
1
det(A) = |A11| |A22 A21(A11) A12|
(2.70)
1

= |A22| |A11 A12(A22) A21|

(2.71)

Material elaborado pelo Prof. Csar Gonalves de Lima

38
Note a analogia de (2.70) e (2.71) com o caso do determinante de uma matriz A, 22:

det(A) = a11 a22 a21 a12 = a11 (a22 a21 a12/ a11) = a22 (a11 a12 a21/ a22)
(ver os Corolrios 1 a 4 nas pginas 35 e 36 do livro do Rencher)
Teorema 2.9C. Se A e B so quadradas e de mesmo tamanho, ento o determinante
do produto igual ao produto dos determinantes:

|AB| = |A| |B|

(2.76)

|AB| = |BA|

(2.77)

Corolrio 1.

Corolrio 2.
2

|A | = |A|

(2.77)

2.10. VETORES ORTOGONAIS E MATRIZES

Dois vetores nx1 a e b so ditos ortogonais se


a'b = a1b1 + a2b2 + + anbn = 0

(2.79)

Note que o termo ortogonal se aplica aos dois vetores e no a um nico vetor.
Geometricamente, dois vetores ortogonais so perpendiculares um ao outro.
Para mostrar que os vetores a e b so perpendiculares podemos calcular o ngulo formado entre eles.

cos() =

a' b
(a' a)(b' b)

(2.80)

Quando = 90, ab = (a' a )(b' b ) cos(90) = 0, porque cos(90) = 0. Assim a e b so


perpendiculares quando ab = 0.

4
1
Exemplo 18. Sejam os vetores a = e b = . Ento ab = 0 cos() = 0 o
2
2
ngulo formado entre eles de 90, ou seja, os vetores a e b so perpendiculares.

Material elaborado pelo Prof. Csar Gonalves de Lima

39

Figura 1. Vetores ortogonais


Se aa = 1, dizemos que o vetor a est normalizado. Um vetor b pode ser normalizado dividindo-o pelo seu comprimento (ou norma), b' b . Assim, o vetor:
c=

b
b' b

(2.81)

est normalizado, porque cc = 1.


Um conjunto de vetores c1, c2,, cp de dimenses p1 que so normalizados
(cici = 1, para todo i) e mutuamente ortogonais (cicj = 0, para todo i j) dito ser
um conjunto ortonormal de vetores. Se a matriz C = [c1, c2,, cp] pp tem colunas
ortonormais, C chamada matriz ortonormal. Desde que os elementos de CC so
produtos de colunas de C [ver Teorema 2.2C(i)], uma matriz ortonormal C tem a propriedade
CC = I

(2.82)

Pode ser mostrado que uma matriz ortogonal C tambm satisfaz


CC = I

(2.83)

Assim, uma matriz ortogonal C tem linhas ortogonais como tambm colunas ortogo1
nais. evidente que de (2.82) e (2.83), C = C , se C ortogonal.
Exemplo 19. Para ilustrar uma matriz ortogonal, partimos de:

1 1
1
A = 1 2 0

1
1 1
Material elaborado pelo Prof. Csar Gonalves de Lima

40
Que tem colunas mutuamente ortogonais, mas que no so ortonormais. Para normalizar as trs colunas, ns as dividimos pelos seus respectivos comprimentos, 3 , 6
e 2 , obtendo assim a matriz:
1 3
1 6
1 2

C = 1 3 2 6
0
1 3
1 6 1 2

cujas colunas so ortonormais. Note que as linhas de C tambm so ortonormais, tal


que C satisfaz (2.83) e (2.82).
A multiplicao de um vetor por uma matriz ortogonal tem o efeito de rotacionar os eixos; isto , se um ponto x transformado para z = Cx, onde C uma matriz
ortogonal, ento a distncia da origem a z a mesma que a distncia da origem a x:
zz = (Cx)(Cx) = xCCx = xx

(2.84)

Neste caso, a transformao de x para z conhecida como uma rotao.


Teorema 2.10A. Se uma matriz C (pp) ortonormal e se A (pp) uma matriz
qualquer, ento
(i) |C| = +1 ou 1
(ii) |CAC| = |A|
(iii) 1 cij 1, onde cij qualquer elemento da matriz C

2.11. TRAO DE UMA MATRIZ

O trao de uma matriz (nn) A = (aij) uma funo escalar definida como a soma
dos elementos da diagonal de A; isto ,

tr(A) =

i=1 aii
n

8 4 2
Por exemplo, se A = 2 3 6 , o trao de A igual a tr(A) = 8 + (3) + 9 = 14.

3 5 9

Teorema 2.11A.
(i) Se A e B so (nn) ento

tr(A B) = tr(A) tr( B)

(2.85)

(ii) Se A (np) e B (pn), ento

tr(AB) = tr(BA)

(2.86)

Note que em (2.86) n pode ser menor, igual ou maior que p


Material elaborado pelo Prof. Csar Gonalves de Lima

41
(iii) Se A (np)

tr(AA) =

a tj a j

(2.87)

j =1

onde aj a j-sima coluna de A.


(iv) Se A (np)

tr(AA) =

a i a ti

(2.88)

i =1

onde a ti a i-sima linha de A.


(v) Se A = (aij) uma matriz np ento:
n

aij2

tr(AA) = tr(AA) =

(2.89)

i =1 j =1

(vi) Se A (nn) e P (nn) qualquer matriz no-singular, ento:


1

tr(P AP) = tr(A)

(2.90)

(vii) Se A (nn) e C (nn) qualquer matriz ortogonal, ento:


tr(CAC) = tr(A)

(2.91)

(viii) Se A (np) de posto r e A (pn) uma inversa generalizada de A, ento:

tr(A A) = tr(A A ) = r

(2.92)

2.12 AUTOVALORES E AUTOVETORES


2.12.1 Definio
Definio: Para qualquer matriz quadrada A, um escalar e um vetor no-nulo x podem ser encontrados, de tal forma que:
Ax = x

(2.93)

Em (2.93), chamado um autovalor de A e x um autovetor de A (tambm


so chamados de valor caracterstico e vetor caracterstico de A, respectivamente).
Note que em (2.93) o vetor x transformado por A, em um mltiplo de si prprio, de
tal forma que o ponto Ax est sobre a linha que passa por x e a origem.
Para encontrar e x para uma matriz A, ns escrevemos (2.93) como:
(A I)x = 0

(2.94)

Material elaborado pelo Prof. Csar Gonalves de Lima

42
Por (2.37), (A I)x uma combinao das colunas de A I e por (2.40) e (2.94)
essas colunas so linearmente dependentes. Assim a matriz quadrada A I singular, e pelo Teorema 2.9A(iii) ns podemos resolver (2.94) para usando:
|A I| = 0

(2.95)

que conhecido como equao caracterstica.


Se A (nn) a sua equao caracterstica ter n razes, isto , A ter n autovalores 1, 2, ,n. Os s no sero necessariamente distintos ou todos diferentes de
zero, ou todos nmeros reais. Entretanto, os autovalores de uma matriz simtrica
sero reais, ver Teorema 2.12C. Depois de encontrar 1, 2, , n usando (2.95) os
autovetores correspondentes x1, x2, , xn podero ser encontrados usando (2.94).
Se i = 0, o correspondente autovetor no o vetor nulo, 0. Para perceber isso,
note que se = 0 ento (A I)x = 0 fica Ax = 0 que tem soluo para x porque A
singular e as suas colunas so linearmente dependentes [a matriz A singular porque
ela tem, ao menos, um autovalor nulo].
Exemplo 20. Para ilustrar autovalores e autovetores, considere a matriz:
1 2
A=

2 4
Por (2.95), a equao caracterstica :
2
1
|A I| =
= (1 )(4 ) 4 = 0
2 4
Ou seja

2 5 = ( 5) = 0

Que tem razes 1 = 5 e 2 = 0. Para encontrar o autovetor x1 correspondente a 1 = 5,


ns usamos (2.94),
2 x1 0
(1 5)
(A 5I)x = 0
x = 0
(
)
2
4

2
Que pode ser escrito como:
4x1 + 2x2 = 0
2 x1 x2 = 0
Como a primeira equao um mltiplo da segunda, temos que x2 = 2x1. Um vetor
soluo pode ser escrito com x1 = c como uma constante arbitrria.
x x
1
1
x 1 = 1 = 1 = x1 = c
x2 2 x1
2
2
1 / 5
Escolhendo c = 1/ 5 para normalizar o vetor, ns encontramos 1 =
.
2
/
5

Material elaborado pelo Prof. Csar Gonalves de Lima

43
1/ 5
De forma similar, correspondente 2 = 0, ns obtemos 2 =
.

2
/
5

Ento, a decomposio espectral de A


1 / 5
A = (5)
1
2 / 5

5 2

1/ 5
1 2 0 0
5 + (0)
1/ 5 2 / 5 =
+

2 4 0 0
2 / 5

2.12.2. Funes de uma matriz


Se um autovalor da matriz quadrada A com um correspondente autovetor x, ento
para certas funes g(A), um autovalor dado por g() e x o autovetor correspondente de g(A) como tambm de A. Ns ilustramos para alguns casos:

1. Se um autovalor de A, ento c um autovalor de cA, onde c uma constante


arbitrria, tal que c 0. Esse resultado facilmente demonstrado multiplicando-se
a relao de definio Ax = x por c:
cAx = cx

(2.96)

2. Se um autovalor de A e x o autovetor correspondente de A, ento c + k um


autovalor da matriz cA + kI e x o autovetor de cA + kI, onde c e k so escalares.
Para mostrar isso, adicionamos kx a (2.96):
cAx + kx = cx + kx
(cA + kI)x = (c + k)x

(2.97)

Assim c + k o autovalor de cA + kI e x o correspondente autovetor de cA + k.


Note que (2.97) no se estende a (A + B), onde A e B so matrizes nxn arbitrrias;
isto , A + B no tem autovalores A + B, onde A um autovalor de A e B, de B.
2

3. Se um autovalor de A, ento um autovalor de A . Isto pode ser demonstrado, multiplicando-se a relao de definio Ax = x por A:
2

AAx = Ax A x = Ax = (x) = x
2

(2.98)
2

Assim um autovalor de A e x o autovetor correspondente de A . Isso pode


ser estendido para:
k

Ax =x

(2.99)
1

4. Se um autovalor da matriz no-singular A, ento 1/ um autovalor de A .


1
Para demonstrar isso, ns multiplicamos Ax = x por A para obter:
1

A Ax = A x x = A x A x = (1/)x
1

(2.100)
1

Assim 1/ um autovalor de A e x um autovetor tanto de A quanto de A .

Material elaborado pelo Prof. Csar Gonalves de Lima

44

5. Os resultados em (2.96) e (2.99) podem ser usados para obter autovalores e autovetores de um polinmio em A. Por exemplo, se um autovalor de A, ento
3

(A + 4A 3A + 5I)x = A x + 4A x 3Ax + 5x
3

= x + 4 x 3x + 5x
3

= ( + 4 3 + 5)x
3

Assim, + 4 3 + 5 um autovalor de A + 4A 3A + 5I, e x o autovetor


correspondente.
Para certas matrizes, a propriedade (5) pode ser estendida para sries infinitas.
Por exemplo, se um autovalor de A, ento por (2.97), 1 um autovalor de
I A. Se I A no-singular, ento, por (2.100), 1/(1 ) um autovalor de
1
(I A) . Se 1 < < 1, ento 1/(1 ) pode ser representado pela srie (de Fourier)
1
2
3
=1++ + +
1
Correspondentemente, se todos os autovalores de A satisfazem 1 < < 1, ento
1

(I A) = I + A + A + A +

(2.101)

2.12.3. Produtos
Similar ao comentrio feito aps a apresentao de (2.97), os autovalores de AB no
so produtos da forma AB. Entretanto, os autovalores de AB so os mesmos de BA.

Teorema 2.12A. Se A e B so nn ou se A np e B pn, ento os autovalores


(no nulos) de AB so os mesmos daqueles de BA. Se x um autovetor de AB ento
Bx um autovetor de BA.
Teorema 2.12B. Seja A uma matriz nn.
1

(i) Se P qualquer matriz no-singular nn, ento P AP tem os mesmos autovalores.


(ii) Se C qualquer matriz ortogonal nn, ento CAC tem os mesmos autovalores.

2.12.4. Matrizes simtricas


Teorema 2.12C. Seja A (nn) uma matriz simtrica
(i) Os autovalores de A so nmeros reais.
(ii) Os autovetores x1, x2,, xn so mutuamente ortogonais; isto , xi xj = 0 para i j
Material elaborado pelo Prof. Csar Gonalves de Lima

45
Se os autovetores de uma matriz simtrica A so normalizados e colocados como colunas de uma matriz C, ento, pelo Teorema 2.12C(ii), C uma matriz ortogonal que
pode ser usada para expressar A em termos de seus autovalores e autovetores.

Teorema 2.12D. Se A uma matriz simtrica com autovalores 1, 2, ,n e autovetores normalizados x1, x2, ,xn ento A pode ser expressa como
A = CDC
=

(2.102)

i x i x ti

(2.103)

i =1

onde D = diag(1, 2, ,n) e C a matriz ortonormal C = [x1, x2, ,xn]. O resultado


mostrado em (2.102) ou (2.103) chamado de decomposio espectral de A.

Ver prova nas pg. 46-47.


Corolrio 1. Se A uma matriz simtrica e C e D so definidas como no Teorema
2.12D, ento C diagonaliza A, isto ,
CAC = D = diag(1, 2, ,n)

(2.105)

Teorema 2.12E. Se A uma matriz com autovalores 1, 2, ,n ento


(i) det(A) = | A | =

(2.106)

i
i =1

(ii) tr(A) =

(2.107

i =1

2.12.5. Matriz positiva definida e positiva semidefinida


Os autovalores 1, 2, 3,, n de matrizes positiva definidas (semidefinidas) so
positivos (no negativos).

Teorema 2.12F. Se A uma matriz com autovalores 1, 2, ,n ento


(i) Se A positiva definida ento i > 0 para i = 1, 2, , n
(ii) Se A positiva semidefinida ento i 0 para i = 1, 2, , n. O nmero de
autovalores i para os quais i > 0 igual ao posto de A.
Teorema A.5.2 Seja A uma matriz real e simtrica, nn, e D = diag(1, 2, ...,n) a
matriz diagonal que exibe as razes caractersticas de A. Ento:
a) i > 0, i A positiva definida.
b) i 0, i, i = 0 A positiva semi-definida.
c) i < 0, i A negativa definida.
Material elaborado pelo Prof. Csar Gonalves de Lima

46
d) i 0, i, i = 0 A negativa semi-definida.
e) i muda de sinal A no definida.
Se uma matriz A positiva definida, ns podemos encontrar a raiz quadrada
1/2
de A, denotada por A , como segue. Desde que os autovalores so positivos, ns podemos substituir a raiz quadrada i na decomposio espectral de A em (2.102)
para obter:
1/2
1/2
A = CD C
(2.108)
1/2

1/2

com D = diag( 1 , 2 , ,
1/2

n ). A matriz A
1/2

1/2

1/2

simtrica e tem a propriedade:

CD CCD C= A

(2.109)

2.13. MATRIZES IDEMPOTENTES


2

Uma matriz quadrada A dita idempotente se A = A. Neste texto, muitas das matrizes idempotentes so quadradas. Muitas das somas de quadrados nas anlises de regresso e de varincia (Captulos 11-14) podem ser expressas como formas quadrticas yAy. A idempotncia de A ou de um produto envolvendo A ser usada para estabelecer que yAy (ou um mltiplo de yAy) tem distribuio de qui-quadrado.

Teorema 2.13A. A nica matriz no-singular idempotente a matriz identidade.


Teorema 2.13B. Se A singular, simtrica e idempotente ento A positiva semidefinida.
Teorema 2.13C. Se A uma matriz nn, simtrica, idempotente e de posto r, ento
A tem r autovalores iguais a 1 e n r autovalores iguais a 0.
Teorema 2.13D. Se A uma matriz nn, simtrica, idempotente e de posto r, ento
posto(A) = tr(A) = r.
Teorema 2.13E. Se A uma matriz nn idempotente, P uma matriz nn no
singular e C uma matriz nn ortogonal, ento:
(i) I A idempotente.
(ii) A(I A) = 0 e (I A)A = 0
-1

(iii) P AP idempotente
(iv) CAC idempotente (se A simtrica, CAC uma matriz simtrica e idempotente).
Material elaborado pelo Prof. Csar Gonalves de Lima

47

Teorema 2.13F. Seja A uma matriz np de posto r, seja A qualquer inversa genera

lizada de A e seja (AA) uma inversa generalizada de AA. Ento A A, AA e

A(AA) A so todas idempotentes.


Teorema 2.13G. Supondo que a matriz simtrica A nn possa ser escrita como A =

i=1 A i para algum k, onde cada Ai uma matriz simtrica nn. Ento, quaisquer
k

duas das seguintes condies implicam na terceira condio:

1. A idempotente.
2. Cada A1, A2, , Ak idempotente.
3. AiAj = 0 para i j.
Teorema 2.13H. Se I =
se n =

i=1 A i , onde cada matriz Ai nn simtrica e de posto ri e


k

i=1 ri , ento so verdadeiras as seguintes afirmaes:


k

1. Cada A1, A2, , Ak idempotente.


2. AiAj = 0 para i j.

2.14 DERIVADAS DE FUNES LINEARES E FORMAS QUADRTICAS


Seja u = f(x) uma funo das variveis x1, x2, , xp em x = [x1, x2, , xp] e sejam
u / x1 , u / x2 , , u / x p as derivadas parciais.
Ns definimos u / x como:

u / x1

u u / x2
=
x M

u / x p

(2.110)

Em alguns casos ns podemos encontrar um mximo ou um mnimo de u resolvendo


u / x = 0.

Teorema 2.14A. Seja u = ax = xa , onde a = [a1, a2, , ap] um vetor de constantes. Ento

u
(a' x) (x' a)
=
=
=a
x
x
x

(2.111)

(Ver prova na pg. 51 do livro do Rencher).

Material elaborado pelo Prof. Csar Gonalves de Lima

48

Teorema 2.14B. Seja u = xAx, onde A uma matriz simtrica de constantes. Ento

u
(x' Ax)
=
= 2Ax
x
x

(2.112)

(Ver prova nas pg. 51-52 do livro do Rencher).

Exemplo 21. Admitamos o modelo de regresso linear yi = 0 + 1xi + i, para i = 1,


, n, expresso matricialmente como y = X + , onde:
y1 1 x1
1
y 1 x

2 0
2 =
+ 2

M M M 1 M


y n 1 x n
n
Procuraremos os estimadores de 0 e 1 que minimizam a soma de quadrados dos
desvios dos n valores observados de y em relao aos valores preditos y :
n

( yi y i )

i =1

i =1

i2

(
)
y

x
i 0 1i
i =1

Matricialmente, ns temos que:


n

i2 = = (y X ) (y X ) = yy 2 Xy + XX
i =1

Para encontrarmos que minimiza , calculamos a diferencial de em relao


a . Observando que:

(yy) = 0
(2 Xy) = 2Xy,


(
XX ) = 2XX ,

por (2.111)

por (2.112)

Da tem-se que:
'
= 2Xy + 2XX

Igualando o resultado a um vetor de zeros, obtemos o sistema de equaes normais:

XX = Xy

(7.8)

Como XX no-singular, a soluo do sistema nica e obtida por:


1
= (XX) Xy

Esta soluo chamada de soluo de mnimos quadrados.

Material elaborado pelo Prof. Csar Gonalves de Lima

49
Usando os dados do Exerccio 12, temos:

5.27 1 12
5.68 1 18

6.25 1 24

7.21 = 1 30
8.02 1 36

8.71 1 42
8.42 1 48

1

2
3
0
+ 4
1
5

6
7

O sistema de equaes lineares correspondente fica:

7 210 0 49.56
210 7308 = 1590.48

A soluo de mnimos quadrados fica:


1
0 7 210 49.56 1.0357143 0.029762
=
1590.48 = 0.029762
210
7308
0.000992

49.56
1590.48

3.9943
0 =

1 0.1029
E a reta de mnimos quadrados ajustada fica:

y i = 3.9943 + 0.1029xi

2.15. REFERNCIAS CITADAS NO TEXTO


Graybill, F. A. (1969). Introduction to Matrices with Applications in Statistics.
Belmont, CA: Wadsworth.
Rencher, A. C. (2000). Linear Models in Statistics. New York: Wiley,
Searle, S. R. (1982). Matrix Algebra Useful for Statistics. New York: Wiley.

EXERCCIOS
Ver exerccios das pginas 52-61 do livro texto.
Material elaborado pelo Prof. Csar Gonalves de Lima

50

2.16. LISTA DE EXERCCIOS ADICIONAIS


Nos exerccios 1, 2 e 3 considere as seguintes matrizes:

1 0
B = 2 1 ,
3 2

1 2 3
A=
,
2 1 4

3 1 3
C = 4
1 5 ,
2
1 3

2 4 5
E = 0
1 4
3
2 1

3 2
D=
,
4
2

4 5
F=

2 3

1) Se as operaes forem possveis, calcule:


(a) C + E

(b) AB e BA

(c)

1
2
D F
3
5

(d) BC + A

2) Verifique as seguintes propriedades:


(a) A(BD) = (AB)D

(b) A(C + E) = AC + AE

3) Verifique as seguintes propriedades:


(a) A = (A)

(b) (C + E) = C + E

(c) (AB) = BA

a + b c + d 4 6
4) Se
=
, calcule os valores de a, b, c e d.
c d a b 10 2

5) Sendo A e B matrizes quadradas, no singulares e de mesma ordem, escrever a


matriz de incgnitas, X, em funo de A e de B:
(a) XA = B
1

(d) ABA X = A

(b) (A + B)X = B

(c) ABX = B

(e) (AX) = B
1

6) Mostrar algebricamente que se A no singular ento (A)


a12
a
matriz A = 11
.
a
a
21
`22

= (A ), usando a

Material elaborado pelo Prof. Csar Gonalves de Lima

51

7) Sejam
2
b = 4

3
Escreva AB como uma combinao linear das colunas de A como em (2.37) e
verifique o resultado calculando Ab na maneira usual.
5 2 3
A=
,
7
3
1

8) Para os sistemas apresentados a seguir, pede-se:


(i) escreva-os na forma Ax = b,
(ii) classifique-os como consistentes ou inconsistentes comparando posto(A) e
posto(A M b);
(iii) obtenha uma soluo se o sistema for consistente.

x + y = 2

(b) y z = 3
z + x = 4

2x + 3y = 1
(a)
4 x + 5 y = 12
4a + 2b + 2c = 20

(d)
2a + 2b = 12

2a + 2c = 8

x + 2 y + 4z = 5

(c) 3 x y 2 z = 7
5 x 3 y + 6 z = 11

2x + 3y = 1
(e)
4 x + 6 y = 3

4 2 2 x1 20
9) Seja o sistema escrito na forma matricial Ax = b, ou 2 2 0 x2 = 12 .


2 0 2 x3 8
(a) Encontre uma inversa generalizada simtrica de A.
(b) Encontre uma inversa generalizada no simtrica de A.

(c) Encontre duas solues do sistema x = A b utilizando as inversas calculadas


nos itens anteriores e indique qual delas tem o menor comprimento.

(d) Mostre que a matriz AA idempotente.

10) As colunas da matriz seguinte so mutuamente ortogonais


1 1 1
A = 1 0 2

1 1 1
(a) Normalize as colunas de A e denote a matriz resultante por C
(b) Mostre que CC = CC =I.
Material elaborado pelo Prof. Csar Gonalves de Lima

52

4 2 2
11) Seja a matriz singular A = 2 2 0 .

2 0 2
(a) Encontre os autovalores (1, 2 e 3) e os autovetores normalizados (c1, c2 e c3).
(b) A matriz A positiva definida? Por qu?
(c) Mostre que tr(A) = 1 + 2 + 3 e que det(A) = (1)(2)(3)
(d) Mostre que a matriz diagonal que exibe os autovalores de A pode ser obtida por
D = diag(1, 2, 3) = CAC, onde C = [c1, c2, c3] a matriz formada pelos
autovetores normalizados de A.
(e) Se a matriz A for positiva definida ou positiva semidefinida, obtenha a sua raiz
1/2
1/2
quadrada que calculada como A = CD C, onde D = diag(1, 2, 3) a
matriz diagonal que exibe os autovalores de A e C = [c1, c2, c3] a matriz
formada pelos autovetores normalizados de A.

12. Os resultados experimentais apresentados na tabela a seguir foram obtidos de um


ensaio de irrigao onde se estudou y: produo de alfafa (t/ha) como uma funo
de x: quantidade de gua aplicada (ml/cm2).
x: gua
y: produo

12

18

24

30

36

42

48

5,27

5,68

6,25

7,21

8,02

8,71

8,42

(a) Construa um grfico de disperso y (produo) versus x (gua) para visualizar


o relacionamento linear entre as variveis.
(b) Escreva o modelo de regresso linear yi = a + bxi + i para os dados experimentais.
(c) Escreva o modelo de regresso linear na forma matricial, y = X + , identificando cada uma das matrizes.
(d) Verifique que r[X] = 2 e que r(XX) = 2 , ou seja, que XX no singular.

a
1
(e) Calcule = = (XX) Xy, y = X e = y y .
b
(f) Verifique que fazendo X = [x1, x2] y = a x1 + b x2.
(g) Verifique que o vetor ortogonal a y e a cada uma das colunas da matriz X.
(h) Verifique que || y ||2 = || y ||2 + || ||2.

Material elaborado pelo Prof. Csar Gonalves de Lima

53

13. Suponhamos um experimento fictcio de alimentao de sunos em que foram utilizadas 4 raes (1, 2, 3 e 4) num delineamento inteiramente casualizado com 5 repeties (leites). Os ganhos de peso observados, em quilogramas, constam do
quadro seguinte:
Tratamentos (raes)
1

35

40

39

27

19

35

27

12

31

46

20

13

15

41

29

28

30

33

45

30

Com base nesses dados, pede-se:


(a) Escrever o modelo yij = + ti + ij para todos os valores observados, onde yij
o ganho de peso do j-simo leito que recebeu o i-simo tratamento; uma
constante comum a todas as unidades experimentais; ti o efeito do i-simo tratamento e ij o erro associado parcela yij, para i = 1, 2, 3, 4 e j = 1, 2, 3, 4, 5.
(b) Construir a matriz do delineamento X e escrever o modelo na sua forma matricial, y = X + , onde = [, t1, t2, t3, t4].
(c) Escrever o sistema de equaes normais XX= Xy e calcular duas solues

(diferentes!) do sistema, utilizando = (XX) Xy, onde (XX) uma inversa


generalizada de XX.

(d) Calcular y = X = X(XX) Xy (vetor de observaes ajustado pelo modelo)


para cada uma das solues obtidas em (c) e verifique que os vetores resultantes so iguais.

(e) Calcular as somas de quadrados, utilizando as frmulas seguintes:


1

SQTotal = y I J y,
20

SQTrat = y X(X' X ) X' J y,


20

SQRes= y [I X(X' X ) X' ] y.


(f) Construir um quadro de ANOVA, sabendo que o nmero de graus de liberdade
associados a uma SQ igual ao posto da matriz ncleo da forma quadrtica
correspondente.
(g) Confira os resultados da ANOVA usando, por exemplo, o proc glm do SAS.

Material elaborado pelo Prof. Csar Gonalves de Lima

54

APNDICE: INTRODUO AO USO DO PROC IML


ASPECTOS GERAIS
O software SAS/IML (Interactive Matrix Language) uma linguagem de programao muito flexvel, tendo como principais vantagens a interatividade com o
usurio, a possibilidade de trabalhar com matrizes de forma simples, alm da possibilidade do uso de funes pr-programadas e outras procedures do SAS.
Os resultados dos comandos podem ser vistos imediatamente ou armazenados
para posterior utilizao, a critrio do usurio.
Operaes como inverso de matrizes, obteno de autovalores e autovetores etc.,
podem ser realizadas usando comandos, facilitando o trabalho e evitando a construo de algoritmos sofisticados que utilizam vrias linhas de programao.
O fato dos algoritmos empregados serem amplamente utilizados permite que os
resultados obtidos sejam muito confiveis. Alm disso, o SAS/IML faz uso muito
eficiente dos recursos do computador facilitando o trabalho com matrizes de grandes dimenses.

ALGUNS OPERADORES IMPORTANTES


A+B
A B:
A*B:
A/B
A#B
A[linha, coluna]
A[linha,]
A[,coluna]
A@B
A**p
A` ou t(A)
A||B
A//B
a:b

Soma as matrizes A e B
Subtrai a matriz B de A
Calcula o produto da matriz A por B
Divide cada elemento de A pelo respectivo elemento de B
Multiplica cada elemento de A pelo respectivo elemento de B
Seleciona o elemento de A na posio indicada.
Seleciona todos os elementos da linha indicada da matriz A.
Seleciona todos os elementos da coluna indicada da matriz A.
Calcula o produto direto (ou de Kronecker) das matrizes A e B
Eleva a matriz A a uma potncia p.
Calcula a transposta da matriz A
Concatena (junta) as matrizes A e B horizontalmente
Concatena (junta) as matrizes A e B verticalmente
Cria um vetor de ndices a, a+1, a+2, ..., b-1, b

Material elaborado pelo Prof. Csar Gonalves de Lima

55

ALGUMAS FUNES IMPORTANTES:


ABS(A)

Calcula o valor absoluto ou mdulo dos elementos da matriz A

ALL(A)

Verifica se todos os elementos da matriz A so nulos (retorna 0


ou 1).

ANY(A)

Verifica se algum elemento de A diferente de zero, (retorna 0


ou 1 como resposta).

DESIGN(vetor)

Cria uma matriz de delineamento de posto coluna incompleto a


partir do vetor indicado.

DESIGNF(vetor)

Cria uma matriz de delineamento de posto coluna completo


(rank-full) a partir do vetor fornecido.

DET(A)

Calcula o determinante da matriz A

DIAG(argumento)

Cria uma matriz diagonal a partir do argumento, que pode ser


uma matriz ou um vetor.

ECHELON(A)

Reduz a matriz A forma normal de Echelon.

EIGEN(A)

Calcula os autovalores e os autovetores normalizados da matriz


quadrada A.

EIGVAL(A)

Calcula os autovalores da matriz A e os coloca num vetor.

EIGVEC(A)

Calcula autovetores normalizados da matriz A e os coloca nas


colunas de uma matriz.

GINV(A)

Calcula a inversa generalizada de Moore-Penrose da matriz A

GSORTH(A)

Calcula a ortonormalizao de Gram-Schmidt de A.

HERMITE(A)

Reduz a matriz A forma normal de Hermite.

I (dimenso)

Cria uma matriz identidade com a dimenso especificada.

INV(A)

Calcula a inversa da matriz quadrada A.

J(nlinha, ncoluna, valor)

Cria uma matriz A nlinhancoluna de valores idnticos ao valor


especificado

MAX(A)

Encontra o maior elemento da matriz A.

MIN(A)

Encontra o menor elemento da matriz A.

NCOL(A)

Encontra o nmero de colunas da matriz A.

NROW(A)

Encontra o nmero de linhas da matriz A.


Material elaborado pelo Prof. Csar Gonalves de Lima

56

ORPOL(vetor, r)

Calcula polinmios ortogonais de graus 0, 1, ..., r, a partir do


vetor indicado.

PRINT(A)

Imprime a matriz A (ver mais detalhes!)

RANK(A)

Ordena os elementos da matriz A e retorna uma matriz com a


ordem dos seus elementos.

READ

L observaes de um arquivo de dados (data set) - (ver mais


detalhes!)

ROOT(A)

Executa a decomposio de Cholesky (A = UU, onde U uma


matriz triangular superior) da matriz A

SOLVE(A, B)

Resolve o sistema de equaes lineares AX = B, onde A uma


matriz quadrada e no singular.

T(A)
TRACE(A)
VECDIAG(A)

Calcula a matriz transposta de A


Calcula a soma dos elementos da diagonal da matriz A
Cria um vetor com os elementos da diagonal da matriz A

Material elaborado pelo Prof. Csar Gonalves de Lima

Você também pode gostar