Você está na página 1de 32

Capítulo 1

Espaços Lineares Finitos

1.1 Espaços Vetoriais


A estrutura básica da álgebra linear é o conceito de espaço vetorial de dimensão finita. A
definição de espaço vetorial envolve um corpo arbitrário, cujos elementos são chamados
de escalares. Comecemos com a definição formal de corpo.

Definição 1.1 (Corpo) Seja F um conjunto não-vazio de elementos, dotado de duas


operações, adição e multiplicação. A primeira associa a cada par de elementos x, y ∈ F
um elemento (x + y) ∈ F ; a segunda associa a cada par x, y um elemento xy ∈ F .
O conjunto F , munido destas duas operações é denominado corpo, se satisfaz os nove
axiomas abaixo:

Axioma 1.1 A soma é associativa,

(x + y) + z = x + (y + z) para todos x, y, z ∈ F .

Axioma 1.2 A adição é comutativa,

x+y =y+x para todos x, y ∈ F .

Axioma 1.3 Existe um único elemento neutro 0 ∈ F tal que x + 0 = x, para todo x ∈ F .

Axioma 1.4 Para cada x ∈ F , existe um único correspondente negativo (−x) ∈ F tal
que x + (−x) = 0.

Axioma 1.5 A multiplicação é associativa,

x(yz) = (xy)z para todos x, y, z ∈ F .

Axioma 1.6 A multiplicação é comutativa,

xy = yx para todos x, y ∈ F .

1
CAPÍTULO 1. ESPAÇOS LINEARES FINITOS 2

Axioma 1.7 Existe um único elemento neutro 1 ∈ F tal que 1x = x, para todo x ∈ F .

Axioma 1.8 A cada elemento não-nulo x ∈ F , existe um único inverso multiplicativo


x−1 ∈ F tal que xx−1 = 1.

Axioma 1.9 A multiplicação é distributiva com respeito à adição, isto é,


x(y + z) = xy + xz, para todos x, y, z ∈ F .

Exemplo 1.1 Com as propriedades usuais da adição e multiplicação, o conjunto R dos


números reais é um corpo. Portanto, se x é um número real, diremos que x é um escalar
real.

Definição 1.2 (Espaço Vetorial) Seja V um conjunto não-vazio sobre o qual estão
definidas as duas operações, adição e multiplicação por escalar. A primeira associa a
cada par de elementos u, v ∈ V um elemento (u + v) ∈ V ; a segunda associa a qualquer
u ∈ V e α ∈ F , um elemento αu ∈ V . Então V é chamado de espaço vetorial (sobre o
corpo F) se as propriedades abaixo são válidas para quaisquer elementos u, v, w ∈ V :

EV 1.1 A soma é associativa, (u + v) + w = u + (v + w).

EV 1.2 A soma é comutativa, u + v = v + u.

EV 1.3 Existe um elemento neutro ~0 ∈ V tal que u + ~0 = ~0 + u = u, para todo u ∈ V .

EV 1.4 Para cada u ∈ V , existe um correspondente negativo (−u) ∈ V , chamado de


simétrico de u, tal que u + (−u) = (−u) + u = ~0.

EV 1.5 α(βu) = (αβ)u, para quaisquer escalares α, β ∈ F .

EV 1.6 α(u + v) = αu + αv, para qualquer escalar α ∈ F .

EV 1.7 (α + β)u = αu + βu, para quaisquer escalares α, β ∈ F .

EV 1.8 1u = u, para o escalar unidade 1 ∈ F .


Obs.: Os elementos de um espaço vetorial são chamados de vetores.

Exemplo 1.2 Seja F um corpo artitrário. Denotemos F n o conjunto de todas as n-uplas


de elementos em F . Assim, F n é encarado como um espaço vetorial sobre F , onde a
adição e a multiplicação por escalar se definem como:
(a1 , a2 , . . . , an ) + (b1 , b2 , . . . , bn ) = (a1 + b1 , a2 + b2 , . . . , an + bn )
e
k(a1 , a2 , . . . , an ) = (ka1 , ka2 , . . . , kan ).
O vetor nulo F n é a n-upla de zeros:
0 = (0, 0. . . . , 0)
e o negativo de um vetor é:
−(a1 , a2 , . . . , an ) = (−a1 , −a2 , . . . , −an ).
CAPÍTULO 1. ESPAÇOS LINEARES FINITOS 3

Exemplo 1.3 Seja Mn×m o conjunto de todas as matrizes m×n sobre um corpo arbitrário
F . Então Mn×m é um espaço vetorial sobre F em relação às operações usuais de adição
de matrizes e multiplicação de um escalar por uma matriz.

1.2 Subespaços Vetoriais


Seja V um espaço vetorial sobre um corpo F . Um subespaço de V é um subconjunto S de
V que é um espaço vetorial sobre F com as operações de adição de vetores e multiplicação
por escalar de V . Segue um critério simples para identificar subespaços.

Proposição 1.1 S é um subespaço de V se e somente se:

1. 0 ∈ S;

2. αu + βu ∈ S , para quaisquer u, v ∈ S e α, β ∈ F ;

Exemplo 1.4 Seja V um espaço vetorial arbitrário. O conjunto {0} consistindo do vetor
nulo de V , e também o próprio espaço V , são exemplos triviais de subespaços de V .

Exemplo 1.5 Seja M2×2 o conjunto de todas as matrizes quadradas de ordem 2 sobre o
corpo dos reais.

a) O subconjunto S ⊂ M2×2de todas as matrizes triangulares


 inferiores
  é subespaço
 de
0 0 x1 0 x2 0
M2×2 . De fato, ∈ S e dadas as matrizes , ∈ S,
 0
 0    y 1 z1
 y 2 z2
x1 0 x2 0 αx1 + βx2 0
tem-se α +β = ∈ S para quais-
y1 z1 y2 z2 αy1 + βy2 αz1 + βz2
quer escalares reais α, β.

b) (Exercício) O subconjunto W ⊂ M2×2 de todas as matrizes simétricas é subespaço


de M2×2 .

c) O subconjunto U ⊂ M2×2de todas  as matrizes com  determinante


 zero não é subes-
0 0 0 0
paço de M2×2 . Note que ∈ U , pois det = 0. Mas essa condição
0 0 0 0
é apenas necessária,
 não
 suficiente
 para garantir
  Ué subespaço
que  de M2×2 . Por
1 0 0 0 1 0 0 0 1 0
outro lado, , ∈ U , mas + = ∈
/ U,
 0 0 0 1 0 0 0 1 0 1
1 0
pois det = 1 6= 0.
0 1

Exercício 1.1 Sejam U e W subespaços de um espaço vetorial V . Mostre que a inter-


seção U ∩ W é também um subespaço de V .
CAPÍTULO 1. ESPAÇOS LINEARES FINITOS 4

Definição 1.3 Sejam U e W subespaços de um espaço vetorial V . A soma U + W


consiste de todas as somas u + w, onde u ∈ U e w ∈ W , isto é

U + W = {u + w | u ∈ U, w ∈ W }.

Além disso, diremos que o espaço vetorial V é a soma direta de U e W , denotada por
V = U ⊕ W , se todo vetor v ∈ V pode escrever-se de maneira única como v = u + w,
onde u ∈ U e w ∈ W .

Exercício 1.2 Mostre que a soma U + W é também um subespaço de V .

Teorema 1.1 O espaço vetorial V é soma direta de seus subespaços U e W se e somente


se: V = U + W e U ∩ W = {0}.
Demonstração: Exercício.

1.3 Combinações Lineares, Geradores de um Espaço


Vetorial
Definição 1.4 (Combinação Linear) Sejam u1 , u2 , . . . , un vetores de um espaço veto-
rial V . Seja v ∈ V tal que v = α1 u1 + α2 u2 + . . . + αn un , onde αi ∈ F, ∀i = 1, 2, . . . , n,
então diremos que v é uma combinação linear dos vetores u1 , u2 , . . . , un .
O conjunto de todas essas combinações lineares, denotada por

ger(u1 , u2 , . . . , un ) ou [u1 , u2 , . . . , un ]

é chamado espaço gerado por u1 , u2 , . . . , un .


Por outro lado, dado um espaço vetorial V , diremos que os vetores u1 , u2 , . . . , un geram
V ou formam um conjunto gerador de V se, para todo vetor v ∈ S, existem escalares
α1 , α2 , . . . , αn , tais que v = α1 u1 + α2 u2 + . . . + αn un , isto é, se v é uma combinação linear
dos ui , i = 1, 2, . . . , n.
     
3 1 1 1 0 0
Exemplo 1.6 Dadas as matrizes A = , B = , C = e
  1 −1 1 0 1 1
0 2
D= , note que A = 3B−2C−D. Assim, diremos que a matriz A é combinação
0 −1
linear das matrizes B, C e D.

Exemplo 1.7 Definimos R2 = {(x, y)|x, y ∈ R}. Note que

(x, y) = (x, 0) + (0, y) = x(1, 0) + y(0, 1),

então diremos que os vetores (1, 0), (0, 1) geram R2 .


CAPÍTULO 1. ESPAÇOS LINEARES FINITOS 5

1.4 Dependência e Independência Linear


Definição 1.5 Um conjunto de vetores {u1 , u2 , . . . , un } é denominado linearmente in-
dependentes (L.I.) se a combinação linear α1 x1 + α2 u2 + . . . + αn un = ~0 só é verdadeira
para α1 = α2 = . . . = αn = 0. Caso contrário, o conjunto é denominado linearmente
dependente (L.D.).
Obs.: Um conjunto infinito S de vetores é L.D. se existem vetores v1 , v2 , . . . , vk em S
que são L.D.; caso contrário, S é L.I. Define-se ∅, o conjunto vazio, como L.I.

Exemplo 1.8 Os vetores (1, 0) e (0, 1) são L.I. De fato, tomemos o vetor nulo como
combinação linear dos vetores (1, 0) e (0, 1):

α(1, 0) + β(0, 1) = (0, 0)


⇒ (α, 0) + (0, β) = (α, β) = (0, 0) ⇒ α = β = 0.

Exemplo 1.9 Os vetores (1, 3) e (2, 6) são L.D. Note que:

2(1, 3) = (2, 6) ⇒ 2(1, 3) + 1(2, 6) = (0, 0)

Isto é, temos uma combinação linear do vetor nulo em termos dos vetores (1, 3) e (2, 6)
onde os escalares são não-nulos.

Exemplo 1.10 O conjunto {et , e2t } é L.I. De fato, tome α1 et + α2 e2t = 0. Derivando
essa expressão com respeito a t, tem-se: α1 et + 2α2 e2t = 0. Multiplicando essa última
igualdade por −1 e somando à primeira, segue que α2 e2t = 0 ⇒ α2 = 0. Substituindo em
qualquer uma das equações teremos α1 = 0.

Exercício 1.3 Determine se os vetores u = (1, −2, 1), v = (2, 1, −1) e w = (7, −4, 1) em
R3 são L.I. ou L.D.

Exercício 1.4 Suponha que os vetores u1 , u2 e u3 sejam L.I. Mostre que os vetores
v1 = u1 + u2 , v2 = u1 − u2 e v3 = u1 − 2u2 + u3 também são L.I.

Teorema 1.2 Num conjunto L.D, pelo menos um dos vetores pode ser escrito como com-
binação linear dos demais.
Demonstração: Sejam v1 , v2 , . . . , vk vetores L.D., então podemos escrever

α1 v1 + α2 v2 + . . . + αk vk = 0

com pelo menos um dos α0 s diferente de zero. Digamos que αj 6= 0, então


n
X αi
α1 v1 + α2 v2 + . . . + αj vj + . . . + αk vk = 0 ⇒ vj = − vi
i=1;i6=j
α j


CAPÍTULO 1. ESPAÇOS LINEARES FINITOS 6

Teorema 1.3 Todo conjunto que contém o vetor nulo é L.D.


Demonstração: Dado o conjunto de vetores {v1 , v2 , . . . , vk , 0}, podemos escrever

α1 v1 + α2 v2 + . . . + αk vk + λ0 = 0,

que é verdadeiro ∀ αi = 0 e λ 6= 0.

Teorema 1.4 Todo subconjunto de um conjunto L.I. é necessariamente L.I.


Demonstração: Seja {v1 , v2 , . . . , vj , vj+1 , . . . , vn } um conjunto L.I. Suponha que os j´s
primeiros vetores formam um conjunto L.D. Isso implicaria que α1 v1 +α2 v2 +. . .+αj vj = 0
com pelo menos um dos α0 s 6= 0. Conseqüentemente,

α1 v1 + α2 v2 + . . . + αj vj + 0vj+1 + . . . + 0vn = 0 ⇒ {v1 , v2 , . . . , vn } é L.D.,

o que é uma contradição.

1.5 Base e Dimensão


Definição 1.6 (Base) Um conjunto de vetores B = {u1 , u2 , . . . , un } é uma base de um
espaço vetorial V se B é um conjunto L.I. e é também um conjunto gerador de V .

Exemplo 1.11 Nos Exemplos 1.7 e 1.8, vimos que os vetores (1, 0) e (0, 1) geram R2 e
são L.I. Portanto, o conjunto E = {e1 = (1, 0), e2 = (0, 1)} é uma base de R2 , chamada
base canônica de R2 .

Teorema 1.5 Seja B = {u1 , u2 , . . . , un } uma base de um espaço vetorial V , então todo
vetor v ∈ V escreve-se de maneira única como combinação linear dos vetores de B.
Demonstração Como B gera V , o vetor v é uma combinação linear dos ui ´s, digamos
v = α1 u1 +α2 u2 +. . .+αn un . Suponha tambem que tenhamos v = β1 u1 +β2 u2 +. . .+βn un .
Subtraindo essas igualdades, obtemos 0 = (α1 − β1 )u1 + (α2 − β2 )u2 + . . . + (αn − βn )un .
Mas os ui ´s são L.I., logo cada um dos coeficientes dessa última igualdade é igual a zero:
α1 − β1 = α2 − β2 = . . . = αn − βn = 0 ⇒ αi = βi ∀ i = 1, 2, . . . , n.

Definição 1.7 Um espaço vetorial V tem dimensão finita n, se possui uma base com n
elementos. A notação usual é dimV = n.

Exemplo 1.12 Considere o espaço vetorial Pn (t) de polinômios de grau ≤ n. Os polinômios


1, t, t2 , . . . , tn formam uma base de Pn (t) e, portanto, dimPn (t) = n + 1.
CAPÍTULO 1. ESPAÇOS LINEARES FINITOS 7

Exercício 1.5 Verifique que o espaço Rn tem dimensão n.

Teorema 1.6 Seja V um espaço vetorial de dimensão finita n.

(i) Quaisquer n + 1 ou mais vetores em V são L.D.

(ii) Qualquer conjunto L.I. com n elementos é uma base de V .

(iii) Qualquer conjunto gerador de V com n elementos é uma base de V .

Demonstração: Exercício.

Teorema 1.7 Seja S um subespaço de um espaço vetorial V de dimensão finita n. Então


dimS ≤ n. Em particular, se dimS = n, então S = V .
Demonstração: Exercício.

Exemplo 1.13 Seja S um subespaço do espaço vetorial real R3 . Como dimR3 = 3, a


dimensão de S pode ser 0, 1, 2 ou 3.

(i) Se dimS = 0, então S = {0}, um ponto.

(ii) Se dimS = 1, então S é uma reta que passa pela origem.

(iii) Se dimS = 2, então S é um plano que passa pela origem.

(iv) Se dimS = 3, então S é todo o espaço R3 .

1.6 Coordenadas
Seja V um espaço vetorial de dimensão finita n e seja B = u1 , u2 , . . . , un uma base de V .
Sabemos que qualquer vetor v ∈ V escreve-se de maneira única como combinação linear
dos vetores de B, digamos,

v = α1 u1 + α2 u2 + . . . + αn un .

Esses escalares α1 , α2 , . . . , αn são chamados coordenadas de v em relação à base B. A


n-upla [v]B = (α1 , α2 , . . . , αn ) é chamada vetor das coordenadas de v em relação a B.

Sejam v = α1 u1 + α2 u2 + . . . + αn un e w = γ1 u1 + γ2 u2 + . . . + γn un . Se formarmos
uma nova base {u1 , u2 , . . . , uj−1 , w, uj+1 , . . . , un }, como mudam as coordenadas de w com
respeito à nova base?
Note que deve existir um γ diferente de zero, digamos que γj 6= 0. Logo, podemos
n
1
X γi
escrever uj = γj w − ui . Substituindo em v, segue
i=1;i6=j
γj
CAPÍTULO 1. ESPAÇOS LINEARES FINITOS 8

v = α1 u1 + α2 u2 + . . . + αj uj + . . . + αn un !
n
1 X γi
= α1 u1 + α2 u2 + . . . + αj w− ui + . . . + αn un
γj i=1;i6=j
γj
n  
αj X αi
= w+ αi − αj ui
γj γ
|{z} i=1;i6 = j | {z j }
∗ ∗

∗ Novas Coordenadas

Exemplo 1.14 Dada a base canônica de R2 , E = {e1 = (1, 0), e2 = (0, 1)}, podemos
escrever
(3, 2) = 3(1, 0) + 2(0, 1) e (1, 2) = 1(1, 0) + 2(0, 1).
Considere a nova base B = {(1, 2), (0, 1)} obtida pela substituição de e1 por (1, 2). Quere-
mos as coordenadas do vetor (3, 2) em relação a nova base B. Aplicando o procedimento
descrito anteriormente, temos
α1 3 γ2 2
α1 = 3, γ1 = 1 ⇒ = =3 e α2 − α1 = 2 − · 3 = −4
γ1 1 γ1 1
Logo, (3, 2) = 3(1, 2) − 4(0, 1).

Teorema 1.8 Considere os seguintes conjuntos Q = {u1 , u2 , . . . , um } e P = {v1 , v2 , . . . , vn },


ambos pertencentes ao espaço vetorial V , onde Q é um gerador de V e P é um conjunto
L.I. Então m ≥ n.
Demonstração: Vamos substituir um dos vetores u´s qualquer por v1 . Vamos supor
que o vetor substituído seja uj . Ou seja, formaremos um conjunto
Q1 = {u1 , u2 , . . . , uj−1 , v1 , uj+1 , . . . , um }.
Note que Q1 é um gerador de V .
Como Q é um gerador de V , então:
m m  
X 1 X αi
v1 = αi ui , 6 0 ⇒ xj = y 1 +
se αj = − ui
i=1
αj i=1;i6=j
αj

Mas, para qualquer w ∈ V , temos ainda que:


m
X
w= γi ui = γ1 u1 + γ2 u2 + . . . + γj uj + . . . + γm um
i=0
 X  αi 
1
= γ1 u1 + γ2 u2 + . . . + γj v1 + − ui + . . . + γm um
αj αj
γj X αi

= v1 + γi − γj ui
αj αj
Agora, vamos substituir o vetor uk , onde k 6= j, por v2 . Assim, formaremos o conjunto
CAPÍTULO 1. ESPAÇOS LINEARES FINITOS 9

Q2 = {u1 , u2 , . . . , uj−1 , v1 , uj+1 , . . . , uk−1 , v2 , uk+1 , . . . , um }.

Após um certo número de substituições, chegamos a três possíveis alternativas:

1. n = m;

2. m > n;

3. m < n → essa hipótese não é possível.

1.7 Espaços dotados de um Produto Interno e uma


Norma
Definição 1.8 Uma norma em um espaço vetorial V é uma função k k : V → R , que
associa a cada vetor u ∈ V um número real kuk, chamado a norma ou comprimento
de u, se satisfaz as seguintes condições para quaisquer u, v ∈ V e λ escalar:

N1) kuk ≥ 0 e a igualdade ocorre se e somente se u = 0;

N2) kλuk = |λ| · kuk;

N3) ku + vk ≤ kuk + kvk. (Desigualdade Triangular)

Um espaço vetorial normado é um par (V, k k) onde V é um espaço vetorial real


e k k é uma norma em V .

Obs.: Se kuk = 1, então u é chamado vetor unitário, e se diz normalizado. Todo


vetor não-nulo v ∈ V pode ser multiplicado pelo inverso de sua norma, obtendo-se o vetor
unitário
1
u= v.
kvk
Este processo é chamado normalização de v.

Definição 1.9 Seja V um espaço vetorial real. Um produto interno em V é uma função
h , i : V × V → R, que associa a cada par ordenado de vetores u, v ∈ V um número real
hu, vi, chamado o produto interno de u por v, se satisfaz as seguintes condições para
u, v, w ∈ V e λ ∈ R arbitrários:

P1) hu + w, vi = hu, vi + hw, vi;

P2) hλu, vi = λ · hu, vi;

P3) hu, vi = hv, ui;


CAPÍTULO 1. ESPAÇOS LINEARES FINITOS 10

P4) hu, ui ≥ 0 e a igualdade ocorre se e somente se u = 0.


p
A partir do produto interno, define-se a norma de um vetor u ∈ V por kuk = hu, vi,
ou seja, kuk2 = hu, vi.

Exemplo 1.15 Sejam u = (x1 , x2 , . . . , xn ) e v = (y1 , y2 , . . . , yn ) vetores em Rn . O pro-


duto escalar de u e v é dado por u · v = x1 y1 + x2 y2 + . . . + xn yn . Esta função define
um produto interno em Rn , chamado de pproduto interno usual em Rn . A norma kuk do
2
p
vetor u neste espaço é kuk = hu, vi = x21 + x22 + . . . + x2n . O espaço vetorial Rn com
o produto interno e a norma acima é chamado espaço-n Euclidiano.

Exercício 1.6 Verifique que hu, vi = x1 y1 − x1 y2 − x2 y1 + 3x2 y2 , onde u = (x1 , x2 ) e


u = (y1 , y2 ), é um produto interno em R2 .

Exercício 1.7 Seja V o espaço vetorial das matrizes m × n sobre R. Verifique que
hA, Bi = tr (B t A) é um produto interno em V , onde tr denota o traço da matriz, isto
é, a soma dos elementos da diagonal principal da matriz; e B t denota a transposta da
matriz B.

Teorema 1.9 (Desigualdade de Cauchy-Schwarz) Para quaisquer vetores u, v ∈ V ,

|hu, vi| ≤ kuk · kvk

Demonstração: A prova da Desigualdade de Cauchy-Schwarz será dada no Capítulo


2, onde abordaremos algumas desigualdades importantes. Além disso, usaremos esse
resultado para provar a Desigualdade Triangular.

Exercício 1.8 Para quaisquer vetores não-nulos u, v ∈ V , seja θ o ângulo formado por
u e v, onde 0◦ ≤ θ ≤ 180◦ . Mostre que

hu, vi
cosθ =
kuk · kvk

1.8 Espaços Métricos - Definições e Exemplos


Definição 1.10 Uma métrica num conjunto M é uma função d : M × M → R, que
associa a cada par ordenado de elementos x, y ∈ M um número real d(x, y), chamado a
distância de x a y, de modo que sejam safisfeitas as seguintes condições para quaisquer
x, y, z ∈ M :

(i) d(x, x) = 0;

(ii) Se x 6= y então d(x, y) > 0;

(iii) d(x, y) = d(y, x);


CAPÍTULO 1. ESPAÇOS LINEARES FINITOS 11

(iv) d(x, z) ≤ d(x, y) + d(y, z).

Definição 1.11 Um espaço métrico é um par (M, d), onde M é um conjunto e d é


uma métrica em M .

Exemplo 1.16 Sejam x = (x1 , x2 , . . . , xn ) e y = (y1 , y2 , . . . , yn ) ∈ Rn . Existem três


métricas naturais em Rn :
p
d1 (x, y) = (x1 − y1 )2 + . . . + (xn − yn )2 (Métrica Euclidiana)

d2 (x, y) = |x1 − y1 | + . . . + |xn − yn |

d3 (x, y) = max {|x1 − y1 | , . . . , |xn − yn |}

Exercício 1.9 Sejam d1 , d2 e d3 as métricas definidas no exemplo acima. Mostre que,


para quaisquer x, y ∈ Rn , tem-se:

d3 (x, y) ≤ d1 (x, y) ≤ d2 (x, y) ≤ n · d3 (x, y).

1.9 Seqüências de Cauchy


Definição 1.12 Uma seqüência (xn ) num espaço métrico M chama-se uma seqüên-
cia de Cauchy quando, para todo  > 0 dado , existe n0 ∈ N tal que m, n > n0 ⇒
d(xm , xn ) < .
Intuitivamente, os termos de uma seqüência de Cauchy vão se tornando cada vez mais
próximos uns dos outros, à medida que cresce o índice n. Se M ⊂ N , uma seqüência de
pontos xn ∈ M é de Cauchy em M se, e somente se, é de Cauchy em N .

Proposição 1.2 Toda seqüência convergente é de Cauchy.


Demonstração: Seja (xn ) uma seqüência convergente, isto é, existe um número real
finito a tal que lim xn = a no espaço métrico M . Então, dado  > 0, existe n0 ∈ N tal
que n > n0 ⇒ d(xn , a) < /2. Se tomarmos m, n > n0 teremos
 
d(xm , xn ) ≤ d(xm , a) + d(a, xn ) < + =
2 2
Logo, (xn ) é de Cauchy.

Exercício 1.10 Dê um contra-exemplo para a seguinte afirmação: "Nem toda seqüência


de Cauchy é convergente."
CAPÍTULO 1. ESPAÇOS LINEARES FINITOS 12

Proposição 1.3 Toda seqüência de Cauchy é limitada.


Demonstração: Seja (xn ) uma seqüência de Cauchy no espaço métrico M . Dado  =
1, existe n0 ∈ N tal que m, n > n0 ⇒ d(xm , xn ) < 1. Em particular, n > n0 ⇒
d(xn0 , xn ) < 1, ou seja, n > n0 ⇒ xn ∈ (xn0 − 1, xn0 + 1). Sejam α o menor e β o maior
elemento do conjunto X = {x1 , x2 , . . . , xn0 − 1, xn0 + 1}. Então xn ∈ [α, β] para cada
n ∈ N, logo (xn ) é limitada.


Exercício 1.11 Dê um contra-exemplo para a seguinte afirmação: "Nem toda seqüência


limitada é de Cauchy."
Dada a seqüência (xn ) no espaço métrico M , escrevamos Xn = {xn , xn+1 , . . .} para
cada n ∈ N. Temos X1 ⊃ X2 ⊃ . . . ⊃ Xn ⊃ . . . Como X1 = {x1 , . . . , xn−1 } ∪ Xn ,
um desses conjuntos é limitado se, e somente se, todos os demais o forem. Nesse caso,
diam(X1 ) ≥ diam(X2 ) ≥ . . . e portanto existe sempre lim diam(Xn ). A fim de que (xn )
seja uma seqüência de Cauchy, é necessário e suficiente que seja lim diam(Xn ) = 0.

Proposição 1.4 Uma seqüência de Cauchy que possui uma subseqüência convergente é
convergente (e tem o mesmo limite que a subseqüência).
Demonstração: Exercício.
Obs.: Se uma seqüência possui duas subseqüências que convergem para limites dis-
tintos então ela não é de Cauchy. Em particular, uma seqüência que possui apenas um
número finito de termos distintos só pode ser de Cauchy quando, a partir de uma certa
ordem, ela se torna constante.

1.10 Espaços Métricos Completos


Definição 1.13 Diz-se que o espaço metrico M é completo quando toda seqüência de
Cauchy é convergente.

Exemplo 1.17 O espaço Q dos números racionais não é completo. De fato, tomemos
a seqüência de números racionais x1 = 1 , x2√= 1, 4 , x3 = 1, 41 , x4 = 1, 414 , x5 =
1, 4142 , x6 = 1, 41421 , . . . , com limxn = 2. Note que essa seqüência é de Cauchy
no espaço métrico Q dos números racionais, mas (xn ) não é convergente em Q.
Alguns resultados:
1. A reta R é um espaço métrico completo.
2. Um subespaço fechado de um espaço métrico completo e completo. Reciprocamente,
um subespaço completo de qualquer espaço métrico é fechado.
3. O produto cartesiano M1 ×M2 ×. . .×Mn é completo se, e somente se, M1 , M2 , . . . , Mn
são completos. Dessa forma, Rn é completo.
CAPÍTULO 1. ESPAÇOS LINEARES FINITOS 13

4. (Critério de Cauchy para convergência uniforme) Seja M um espaço métrico


completo. A fim de que uma seqüência de aplicações fn : X → M convirja uni-
formemente em X, é necessário e suficiente que, para todo  > 0 dado, exista n0 ∈ N
tal que m, n > n0 ⇒ d(fm (x), fn (x)) <  para todo x ∈ X.

Definição 1.14 Um espaço vetorial normado completo é chamado Espaço de Banach.

Exemplo 1.18 Vimos anteriormente que o Rn é um espaço vetorial normado e completo.


Portanto, Rn é um espaço de Banach.

Definição 1.15 Um espaço vetorial H, dotado de um produto interno, e completo em


relação à norma definida por esse produto interno é chamado de Espaço de Hilbert.
n
X
n
Exemplo 1.19 O espaço euclidiano R como produto interno usual hu, vi = xi yi ,
i=1
onde u = (x1 , . . . , xn ) , v = (y1 , . . . , yn ) ∈ Rn , é um espaço de Hilbert.

Exemplo 1.20 Apresentamos agora um exemplo importante de espaço de Hilbert: o es-


paço das seqüências de quadrado somável, ou espaço `2 . Como conjunto, `2 é constituído
+∞
X
por todas as seqüências x = (x1 , . . . , xi , . . .) de números reais tais que x2i < +∞.
 i=1 
1 1 1 1 1 1 1 √1 √1
 
Assim, tomando x = 1, 2 , 4 , 8 , . . . , y = 1, 2 , 3 , 4 , . . . e z = 1, 2 , 3 , 4 , . . . , vemos

que x, y ∈ `2 pois 1/22n < +∞ e 1/n2 < +∞ mas z ∈ / `2 porque


P P P
1/n = +∞.
2
Também pertence a ` toda sequência x = (x1 , . . . , xi , . . .) tal que xi = 0 para i suficien-
temente grande.
v
u +∞
uX 2
2
Exercício 1.12 Dado x ∈ ` , mostre que kxk = t xi é uma norma de `2 .
i=1

Exercício 1.13 Verifique que `2 é um espaço vetorial com respeito às operações:


x + y = (xi + yi ) e λ · x = (λ · xi )
.

1.11 Ortogonalidade, Complementos Ortogonais


Seja V um espaço vetorial com produto interno. Diremos que os vetores u, v ∈ V são
ortogonais se
hu, vi = 0.
Assim, 0 ∈ V é ortogonal a todo vetor v ∈ V , pois
h0, vi = h0v, vi = 0 hv, vi = 0.
CAPÍTULO 1. ESPAÇOS LINEARES FINITOS 14

Reciprocamente, se u é ortogonal a todo vetor de V , segue que


hu, ui = 0 ⇒ u = 0.
Exemplo 1.21 Em Rn , os vetores u = (x1 , x2 , . . . , xn ) e v = (y1 , y2 , . . . , yn ) são ortogo-
nais se u · v = x1 y1 + x2 y2 + . . . + xn yn = 0.

Definição 1.16 Um conjunto S = {u1 , u2 , . . . , un } de vetores em V é chamado ortogo-


nal se hui , uj i = 0 para todo i 6= j, isto é, se cada dois de vetores em S são ortogonais; e
S é chamadoortonormal se S é ortogonal e os seus vetores são todos unitários, isto é,
0 para i 6= j
se hui , uj i = .
1 para i = j
Definição 1.17 Uma base B de um espaço vetorial V é chamada base ortogonal ou
base ortonormal conforme B seja um conjunto ortogonal ou ortonormal de vetores.

Exercício 1.14 Seja S um conjunto ortogonal de vetores não-nulos. Mostre que S é um


conjunto L.I.

Exercício 1.15 Seja {u1 , u2 , . . . , un } um conjunto ortogonal de vetores. Mostre que


ku1 + u2 + . . . + un k2 = ku1 k2 + ku2 k2 + . . . + kun k2 .
Definição 1.18 Seja S um subconjunto de um espaço com produto interno V. O com-
plemento ortogonal de S, denotado por S ⊥ , consiste de todos os vetores v ∈ V que são
ortogonais a todo vetor u ∈ S:
S ⊥ = {v ∈ V | hu, vi = 0 para todo u ∈ S} .
Exercício 1.16 Seja S um subconjunto de um espaço com produto interno V. Mostre que
S ⊥ é um subespaço de V .

Teorema 1.10 Seja W um subespaço de V . Então V é a soma direta de W e W ⊥ , isto


é, V = W ⊕ W ⊥ .
Demonstração: Exercício.

Exercício 1.17 Considere u = (0, 1, −2, 5) em R4 . Determine uma base para o comple-
mento ortogonal u⊥ de u.

Exercício 1.18 Suponha que S consiste dos seguintes vetores em R4 :


u1 = (1, 1, 0, −1) , u2 = (1, 2, 1, 3) , u3 = (1, 1, −9, 2) , u4 = (16, −13, 1, 3)
a) Mostre que S é uma base ortogonal de R4 .
b) Ache as coordenadas de um vetor arbitrário u = (a, b, c, d) ∈ R4 em relação à base S.

Exercício 1.19 Seja E = {e1 , e2 , . . . , en } uma base ortonormal de V . Mostre que, para
qualquer u ∈ V , tem-se que u = hu, e1 i e1 + hu, e2 i e2 + . . . + hu, en i en .
CAPÍTULO 1. ESPAÇOS LINEARES FINITOS 15

1.12 O Teorema da Projeção Ortogonal


Seja V um espaço com produto interno e sejam v, w ∈ V . A projeção de v ao longo de w
é dada por:
hv, wi
proj(v, w) = w.
kwk2
Dado qualquer v ∈ V , o coeficiente

hv, wi
c=
kwk2

é o único escalar tal que o vetor v − cw é ortogonal a w.

Teorema 1.11 (Unicidade) Seja X um espaço dotado de um produto interno e M um


subespaço de X, e seja x um vetor arbitrário de X. Se existe um vetor m0 ∈ M tal que

kx − m0 k ≤ kx − mk para todo m ∈ M ,

então m0 é único. Uma condição necessária e suficiente para a unicidade de m0 é que


x − m0 seja ortogonal a M .
Demonstração: A prova deste teorema consta de duas partes.
Primeiro mostraremos que se m0 é único, então x − m0 é ortogonal a M .
Prova por contradição: vamos negar a tese e chegar a uma contradição na hipótese.
Suponha que x − m0 não é ortogonal a M , isto é, podemos escolher um vetor unitário
m ∈ M , tal que m não é ortogonal a x − m0 . Assim, (x − m0 )m = δ 6= 0. Dessa forma,
tome um outro vetor m1 ∈ M tal que m1 = m0 + δm. Então,

kx − m1 k2 = kx − (m0 + δm)k2 = k(x − m0 ) − δmk2


= kx − m0 k2 − 2δ (x − m0 )m +|δ|2 kmk2
| {z } | {z }
|| ||
δ 1
2
= kx − m0 k − |δ|2
⇒ kx − m1 k < kx − m0 k

Mas isto contradiz a hipótese de que kx − m0 k é uma distância mínima.


Reciprocamente, agora suponha que (x − m0 ) é ortogonal a M . Mostraremos que m0 é
único.
kx − mk = k(x − m0 ) + (m0 − m)k
⇒ kx − mk2 = kx − m0 k2 + 2(x − m0 )(m0 − m) + k(m0 − m)k2
Mas (x − m0 )(m0 − m) = 0, pois (x − m0 )⊥M e (m0 − m) ∈ M ⇒ (x − m0 )⊥(m0 − m).
Logo,

kx − mk2 = kx − m0 k2 + k(m0 − m)k2


⇒ kx − m0 k < kx − mk para todo m ∈ M.
CAPÍTULO 1. ESPAÇOS LINEARES FINITOS 16

Portanto, m0 é único.


Teorema 1.12 (Existência) Seja H um espaço de Hilbert e M um subespaço fechado


de H. Então existe um único m0 ∈ M tal que
kx − m0 k ≤ kx − mk, para todo m ∈ M .
Uma condição necessária e suficiente para (x − m0 ) ser o único vetor minimizante é que
(x − m0 ) ⊥ M .
Demonstração: Se x ∈ M , basta tomar x = m0 e o teorema será válido. Por outro lado,
suponha x ∈
/ M . Defina δ = inf kx − mk. Então, devemos provar que kx − m0 k = δ.
m∈M
Para isso, defina uma seqüência {mi } em M tal que kx − mi k → δ. Precisamos também
de um resultado auxiliar:
A lei do Paralelogramo: kx + yk2 + kx − yk2 = 2 kxk2 + 2 kyk2
De fato,
kx + yk2 + kx − yk2 = (x + y)(x + y) + (x − y)(x − y)
= xx + xy + yx + yy + xx − xy − yx + yy
= 2xx + 2yy = 2 kxk2 + 2 kyk2
Então, pela Lei do Paralelogramo, segue que:
k(mi − x) + (x − mj )k2 + k(mi − x) − (x − mj )k2 = 2 kmi − xk2 + 2 kx − mj k2
2
2 2 2 (mi + mj )
kmi − mj k = 2 kmi − xk + 2 kx − mj k − 4 x −
2
(mi + mj )
Como ∈ M é uma combinação linear de mi e mj , tem-se que
2
(mi + mj )
x− ≥ δ.
2
Logo,
2
2 2 2 (mi + mj )
kmi − mj k = 2 kmi − xk +2 kx − mj k −4 x −
| {z } | {z } 2
≤ δ2 ≤ δ2 | {z }
≤ δ2

Portanto, no limite, tem-se que kmi − mj k → 0. Se kmi − mj k converge para zero quando
i, j → ∞, isto caracteriza a seqüência {mi } como uma Seqüência de Cauchy. Lembre, no
entanto, que {mi } é uma seqüência de elementos de M , e M é um subespaço fechado de
um espaço de Hilbert. Então, num espaço de Hilbert, e, obviamente, em seus subespaços,
toda seqüência de Cauchy tem um limite pertencente ao espaço. Então o limite de {mi },
digamos m0 , está em M . Deduzimos então que kx − m0 k = δ, pois kx − mi k → δ e m0 é
o limite de {mi }.

CAPÍTULO 1. ESPAÇOS LINEARES FINITOS 17

1.13 Processo de Ortogonalização de Gram-Schmidt


Seja B = {v1 , v2 , . . . , vn } uma base de um espaço vetorial V dotado de um produto interno.
A partir de B, podemos construir uma nova base β = {w1 , w2 , . . . , wn } tal que β seja uma
base ortogonal. Façamos
w 1 = v1
hv2 , w1 i
w 2 = v2 − w1
kw1 k2
hv3 , w1 i hv3 , w2 i
w3 = v3 − 2 w1 − w2
kw1 k kw2 k2
..
.
hvn , w1 i hvn , w2 i hvn , wn−1 i
w n = vn − 2 w1 − 2 w2 − . . . − wn−1
kw1 k kw2 k kwn−1 k2
Em outras palavras, para k = 2, 3, . . . , n, definimos

wk = vk − ck1 w1 − ck2 w2 − . . . − ck(k−1) wk−1 ,

hvk , wi i
onde cki = é a componente de vk ao longo de wi . Cada wk é ortogonal aos w´s
kwi k2
precedentes. Assim, w1 , w2 , . . . , wn constituem uma base ortogonal de V . A normalização
de cada wk dá uma base ortonormal para V .

Exemplo 1.22 Considere a base B = {v1 = (1, 1, 1), v2 = (0, 1, 1), v3 = (0, 0, 1)} de R3 .
Determinaremos uma base ortonormal para R3 a partir de B achando primeiro uma base
ortogonal usando o processo de Gram-Schmidt. Façamos
w1 = (1, 1, 1)  
h(0, 1, 1), (1, 1, 1)i 2 1 1
w2 = (0, 1, 1) − (1, 1, 1) = − , ,
k(1, 1, 1)k2  3 3 3 
2 1 1
(0, 0, 1), − , ,  
h(0, 0, 1), (1, 1, 1)i 3 3 3 2 1 1
w3 = (0, 0, 1) − (1, 1, 1) − − , ,
k(1, 1, 1)k2
 2
3 3 3

2 1 1
− , ,
  3 3 3
1 1
⇒ w3 = 0, − ,
2 2
Sejam u1 , u2 , u3 os vetores unitários na direção de w1 , w2 , w3 , respectivamente. Então,
 
w1 1 1 1
u1 = = √ ,√ ,√
kw1 k  3 3 3 
w2 2 1 1
u2 = = −√ , √ , √
kw2 k  6 6 6
w3 1 1
u3 = = 0, − √ , √
kw3 k 2 2
CAPÍTULO 1. ESPAÇOS LINEARES FINITOS 18

Exercício 1.20 Ache uma base ortonormal para o subespaço U de R4 gerado pelos ve-
tores:
v1 = (1, 1, 1, 1) , v2 = (1, 1, 2, 4) , v3 = (1, 2, −4, −3)

Exercício 1.21 Seja v = (1, 3, 5, 7). Ache a projeção de v sobre W , onde W é o sub-
espaço de R4 gerado por:
a) u1 = (1, 1, 1, 1) , u2 = (1, −3, 4, −2)
b) w1 = (1, 1, 1, 1) , w2 = (1, 2, 3, 2)
Capítulo 2

Algumas Desigualdades Importantes

2.1 Desigualdade de Cauchy-Schwarz


Seja V um espaço vetorial com um produto interno. Para quaisquer vetores u, v ∈ V ,

|hu, vi| ≤ kuk · kvk

Demonstração: Defina w = u + λv, onde λ é um real qualquer. Como

kwk2 = hw, wi ≥ 0

segue-se que
ku + λvk2 = hu + λv, u + λvi
= hu, ui + hu, λvi + hλv, ui + hλv, λvi
= hu, ui + 2λ hu, vi + λ2 hv, vi
= kuk2 + (2 hu, vi)λ + kvk2 λ2 ≥ 0.
Note que a desigualdade

kuk2 + (2 hu, vi)λ + kvk2 λ2 ≥ 0

é válida se, e somente se,


(2 hu, vi)2 − 4 kuk2 kvk2 ≤ 0
⇒ 4(hu, vi)2 ≤ 4 kuk2 kvk2 .
Extraindo a raiz quadrada em ambos os lados, segue o resultado:

|hu, vi| ≤ kuk · kvk .

19
CAPÍTULO 2. ALGUMAS DESIGUALDADES IMPORTANTES 20

2.2 Desigualdade Triangular (ou de Minkowski)


Seja V um espaço vetorial com um produto interno. Para quaisquer vetores u, v ∈ V ,
ku + vk ≤ kuk + kvk
Demonstração:
ku + vk2 = hu + v, u + vi
= hu, ui + hu, vi + hv, ui + hv, vi
= hu, ui + 2 hu, vi + hv, vi
= kuk2 + 2 hu, vi + kvk2 .
Segue da Desigualdade de Cauchy-Schwarz que hu, vi ≤ kuk · kvk, logo
ku + vk2 ≤ kuk2 + 2 kuk · kvk + kvk2
⇒ ku + vk2 ≤ (kuk + kvk)2 .
Extraindo a raiz quadrada em ambos os lados, segue o resultado:
ku + vk ≤ kuk + kvk


2.3 Desigualdade de Hölder


Sejam x = (x1 , x2 , . . . , xn ) e y = (y1 , y2 , . . . , yn ) vetores em Rn+ , isto é, xi , yi ≥ 0 para todo
i = 1, 2, . . . , n. Então,
X X 1/p X 1/q
xi y i ≤ xpi yi q
1 1
para p, q ∈ R tais que + = 1, onde 1 ≤ p ≤ +∞ e 1 ≤ q ≤ +∞.
p q
λp λ−q
Demonstração: Defina f : R → R dada por f (λ) = + . Minimizando esta
p q
função, temos:
f 0 (λ) = λp−1 − λ−(1+q) = 0 ⇒ λp+q = 1 ⇒ λ = 1 é ponto crítico de f,
e como
f 00 (λ) = (p − 1)λp−2 + (q + 1)λ−(q+2) ⇒ f 00 (1) = p + q ≥ 1,
segue que λ = 1 é ponto de mínimo de f . Portanto, f (λ) ≥ 1.

Agora defina λ = u1/q v −1/p e substitua esse valor em f (λ) ≥ 1:


p −q
u1/q v −1/p u1/q v −1/p
+ ≥1
p q
CAPÍTULO 2. ALGUMAS DESIGUALDADES IMPORTANTES 21

p q p q
! !
u q +1 v p +1 u q +1 v p +1
⇒ (u · v)−1 + ≥1⇒ + ≥ u · v.
p q p q
1 1 p+q
mas + =1⇒ = 1 ⇒ p + q = p · q, assim
p q p·q
p p+q p·q q q+p q·p
+1= = =p e +1= = = q.
q q q p p p
Portanto,
up v q
+ ≥ u · v.
p q
Para cada i = 1, 2, . . . , n, defina
xi yi
ui = P p 1/p e vi = P q 1/q .
( xi ) ( yi )

Assim, a última desigualdade pode ser escrita como

upi vq
ui · vi ≤ + i.
p q
Tomando a soma em ambos os lados da desigualdade, segue que
" #p " #q
P xi P yi
( xpi )1/p ( xqi )1/q
P P
X
ui vi ≤ + .
p q
Mas,
X  xp  1 X p
Pi p = P p xi = 1.
xi xi
Logo,
X 1 1
ui vi ≤
+ = 1.
p q
" # " #
X xi yi
⇒ · P q 1/q ≤ 1
( xpi )1/p
P
( yi )
X X 1/p X 1/q
⇒ xi yi ≤ xpi · yiq .

Para quaisquer xi , yi , a desigualdade de Hölder pode ser dada por


X X 1/p X 1/q
|xi yi | ≤ xpi · yiq .
CAPÍTULO 2. ALGUMAS DESIGUALDADES IMPORTANTES 22

Note que, se p = q = 2, a desigualdade de Hölder se torna a desigualdade de Cauchy-


Schwarz. X 1/2 X 1/2
X
|xi yi | ≤ x2i · yi2 ⇒ |xy| ≤ ||x|| · ||y||
Obs.: Em estatística, existe uma medida de associação linear entre duas variáveis
aleatórias, X e Y , definida como o coeficiente de correlação. Isto é,
Cov(X, Y )
nX,Y = .
σX σY
A contrapartida empírica deste conceito teórico é:
P
xi y i
nX,Y = P 1/2 P 1/2 ,
( x2i ) ( yi2 )
onde
−1 ≤ nX,Y ≤ 1.

2.4 Desigualdade de Chebychev


Se X é uma variável aleatória e K uma constante, então
1
P [|X − µ| ≥ Kσ] ≤ .
K2

Demonstração: Dada uma variável aleatória X, contínua, com correspondente função


densidade f (x), a média ou esperança de X é dada por
Z ∞
µ = E(X) = xf (x)dx.
−∞

e a variância de X é dada por


Z ∞
2
σ = V (X) = (x − µ)2 f (x)dx =
−∞
Zµ+kσ Z µ−kσ Z ∞
2 2
= (x − µ) f (x)dx + (x − µ) f (x)dx + (x − µ)2 f (x)dx
µ−kσ −∞ µ+kσ
Zµ−kσ Z∞
≥ (x − µ)2 f (x)dx + (x − µ)2 f (x)dx
−∞ µ+kσ
Z µ−kσ Z ∞ 
2 2 2
⇒σ ≥k σ f (x)dx + f (x)dx
−∞ µ+kσ

1 − P (x ∈ A) ou 1 − P (µ − kσ ≤ x ≤ µ + kσ) =
= 1 − P (|x − µ| < kσ) = P (|x − µ| ≥ kσ)
CAPÍTULO 2. ALGUMAS DESIGUALDADES IMPORTANTES 23

1
− P [|x − µ| ≥ kσ] ≥ −
k2
1 1
1 − P [|x − µ| ≥ kσ] ≥ 1 − ⇒ P [|x − µ| < kσ] ≥ 1 −
k2 k2

2.5 Desigualdade de Jensen


Se g(x) é uma função convexa, então g(E(X)) ≤ E(g(x)).

Demonstração: Note que se g é convexa, existe l(x) = a + bx tal que l(x) ≤ g(x)
para todo x, onde a igualdade ocorre num único ponto particular.

Digamos que a igualdade ocorre no ponto [E(X), g(E(x))].

E [(l(x))] = E(a + bX) = a + bE(X) = l[E(X)].

E[l(x)] = l[E(x)] ⇒ l[E(x)] = E[l(x)] ≤ E[g(x)]


g[E(x)] ≤ E[g(x)] ∼ Q.E.D.
Capítulo 3

Matrizes

Matrizes são arranjos de elementos em forma de tabelas retangulares com m linhas e n


colunas, especialmente úteis na manipulação de dados. Mais precisamente, uma matriz
A sobre um corpo F é uma tabela retangular de escalares normalmente representada da
seguinte forma:
 
a11 a12 · · · a1n
 a21 a22 · · · a2n 
A =  ..
 
.. .. .. 
 . . . . 
am1 am2 · · · amn
A matriz A também pode ser representada por A = [aij ]m×n , onde aij denota o
elemento que está posicionado na i-ésima linha com j-ésima coluna, i variando de 1 a
m, j variando de 1 a n, e m × n denota a ordem da matriz.
Duas matrizes A e B são iguais , A = B, se ambas tem a mesma ordem e se os
elementos correspondentes são iguais, isto é, aij = bij para todo i, j. Uma matriz com
apenas uma linha, m = 1, é chamada de matriz linha. Uma matriz com apenas uma
coluna, n = 1, é chamada de matriz coluna. Uma matriz cujos elementos são todos zero
é chamada de matriz nula.

Exemplo 3.1 Alguns exemplos de matrizes:


 
1 3 −5 0
a) A = é uma matriz 2 × 4.
−8 6 −1 2
 
2
b) B =  −1  é uma matriz coluna.
0
 
c) C = 2 −3 0 7 é uma matriz linha.
 
0 0
d) A matriz nula 3 × 2 é a matriz O =  0 0 .
0 0

24
CAPÍTULO 3. MATRIZES 25

   
x − y 3z + t 1 5
e) Calcule x, y, z e t para que = .
2x + y z − 2t 2 4
Pela definição de igualdade de matrizes, as quatro entradas correspondentes devem
ser iguais. Logo,

x+y =1 2x + y = 2 3z + t = 5 z − 2t = 4

Resolvendo o sistema de equações temos x = 1, y = 0, z = 2 e t = −1.

3.1 Operações com Matrizes


3.1.1 Adição e Multiplicação por escalar
Sejam a A = [aij ] e B = [bij ] duas matrizes de mesma ordem, m × n. A soma de A e B é
a matriz obtida somando-se os elementos correspondentes, isto é,
 
a11 + b11 a12 + b12 · · · a1n + b1n
 a21 + b21 a22 + b22 · · · a2n + b2n 
A + B = [aij + bij ] = 
 
.. .. ... .. 
 . . . 
am1 + bm1 am2 + bm2 · · · amn + bmn

O produto da matriz A pelo escalar k é a matriz obtida multiplicando-se cada elemento


de A por k, isto é,  
ka11 ka12 · · · ka1n
 ka21 ka22 · · · ka2n 
kA = [kaij ] =  ..
 
.. .. .. 
 . . . . 
kam1 kam2 · · · kamn
As matrizes A + B e kA também são matrizes de ordem m × n. Definimos também
−A = (−1)A, chamada de matriz oposta de A, e A − B = A + (−B), chamada de
diferença de A e B.
   
1 3 0 −1
Exemplo 3.2 Sejam A =  −5 0  e B =  5 7 , então:
−1 2 −2 1
   
1+0 3 + (−1) 1 2
A + B =  −5 + 5 0+7 = 0 7 
−1 + (−2) 2+1 −3 3
     
4 12 0 3 4 15
4A − 3B =  −20 0  +  −15 −21  =  −35 −21 
−4 8 6 −1 2 7
As propriedades da Soma de Matrizes e Multiplicação por Escalar são dadas no teo-
rema a seguir:
CAPÍTULO 3. MATRIZES 26

Teorema 3.1 Dadas quaisquer matrizes A, B e C de mesma ordem e quaisquer escalares


k, k1 e k2 , então:
(i) (A + B) + C = A + (B + C)
(ii) A + O = O + A = A, onde O denota a matriz nula de mesma ordem de A
(iii) A + (−A) = (−A) + A = O
(iv) A + B = B + A
(v) k(A + B) = kA + kB
(vi) (k1 + k2 )A = kA
(vii) (k1 k2 )A = k1 (k2 A)
(viii) 1 · A = A

3.1.2 Produto de Matrizes


Antes de definirmos o produto (geral) de matrizes, faremos um caso particular. Sejam
A = [ai ] uma matriz linha e B = [bj ] uma matriz coluna, ambas com o mesmo número
de elementos. O produto AB é definido como sendo o escalar (que é uma matriz 1 × 1)
obtido pelo somatório das multiplicações das entradas correspondentes, isto é,
 
b1
n
 b2 

  X
AB = a1 a2 · · · an  ..  = a1 b1 + a2 b2 + · · · + an bn = ak b k
 .  k=1
bn

Se o número de elementos das matrizes A e B são diferentes, o produto AB não é definido.


Dessa forma, para estendermos ao caso geral, é necessário que o número de colunas
de A seja igual ao número de linhas de B. Sejam A = [aij ] uma matriz de ordem m × p e
B = [bij ] uma matriz de ordem p × n. Então o produto AB é a matriz de ordem m × n
cuja entrada ij é obtida multiplicando-se a i-ésima linha de A pela j-ésima coluna de B,
isto é,  
c11 · · · c1n
AB =  ... cij .. 

. 
cm1 · · · cmn
onde
 
b1j
p
  b2j  X
cij = ai1 ai2 · · · aip  = ai1 b1j + ai2 b2j + · · · + aip bpj = aik bkj .
 
 ..
 .  k=1
bpj
CAPÍTULO 3. MATRIZES 27

Se o número de colunas da matriz A é diferente do número de linhas da matriz B, então


o produto AB não é definido.
 
  0 −1 4
1 −2 −6 0  1 8 3 
Exemplo 3.3 Sejam A = eB= , então:
5 3 9 −1  5 −7 0 
−1 7 −2
   
0 − 2 − 30 + 0 −1 − 16 + 42 + 0 4 − 6 + 0 + 0 −32 25 −2
AB = =
0 + 3 + 45 + 1 −5 + 24 − 63 − 7 20 + 9 + 0 + 2 49 −51 31
   
0 1 −1 4
Exemplo 3.4 Sejam A = eB= , então:
3 2 5 −2
       
0+5 0−2 5 −2 0 + 12 −1 + 8 12 7
AB = = e BA = =
−3 + 10 12 − 4 7 8 0−6 5−4 −6 1
O exemplo acima mostra que, em geral, a comutatividade não é válida para o produto
de matrizes, isto é, os produtos AB e BA não são necessariamente iguais.
O teorema a seguir mostra as propriedades do Produto de Matrizes:

Teorema 3.2 Sejam A, B e C matrizes e k um escalar. Desde que os produtos e somas


sejam bem definidos, então:

(i) (AB)C = A(BC)

(ii) A(B + C) = AB + AC

(iii) (A + B)C = AC + BC

(iv) k(AB) = (kA)B = A(kB)

3.2 Matriz Transposta


A transposta da matriz A, denotada por A0 ou At , é a matriz obtida a partir da matriz A,
tal que a i-ésima linha de A0 é igual a i-ésima coluna de A. De outro modo, se A = [aij ]
é uma matriz m × n, então A0 = [bij ] é a matriz n × m onde bij = aji .
 
  1 5
1 −2 −6
Exemplo 3.5 Seja A = então A0 =  −2 3 .
5 3 9
−6 9
As propriedades básicas da Transposição de Matrizes são dadas no teorema a seguir:

Teorema 3.3 Sejam A e B matrizes e k um escalar. Desde que os produtos e somas


sejam bem definidos, então:
CAPÍTULO 3. MATRIZES 28

(i) (A + B)0 = A0 + B 0

(ii) (A0 )0 = A

(iii) (kA)0 = kA0

(iv) (AB)0 = B 0 A0

3.3 Alguns Tipos Especiais de Matrizes


3.3.1 Matrizes Quadradas
Uma matriz quadrada é uma matriz com mesmo número de linhas e colunas. Diremos
que uma matriz n × n tem ordem n. As operações definidas anteriormente sempre podem
ser realizadas sobre matrizes quadradas.
Seja A = [aij ] uma matriz quadrada de ordem n. A diagonal principal de A é formada
por todos os elementos aij com i = j, isto é, a11 , a22 , . . . , ann . O traço de A, denotado
por tr(A), é a soma dos elementos da diagonal principal, isto é,

tr(A) = a11 + a22 + · · · + ann

O traço satisfaz as propriedades a seguir:

Teorema 3.4 Sejam A e B matrizes quadradas de mesma ordem e k um escalar, então:

(i) tr(A + B) = tr(A) + tr(B)

(ii) tr(kA) = k · tr(A)

(iii) tr(A0 ) = tr(A)

(iv) tr(AB) = tr(BA)

3.3.2 Matriz Identidade


A matriz identidade de ordem n, denotada por In (ou simplesmente I), é uma matriz
quadrada com 1 na diagonal principal e 0 em todas as outras entradas.
A matriz identidade também pode ser definida por I = [δij ], onde δij é a função delta
de Kronecker, definida por 
0 se i 6= j
δij =
1 se i = j
Para qualquer matriz A quadrada de ordem n, AI = IA = A. De um modo mais
geral, se B é uma matriz de ordem m × n, então BIn = Im B = B.
CAPÍTULO 3. MATRIZES 29

3.3.3 Matrizes Inversíveis (Não Singulares)


Uma matriz quadrada A é inversível (ou não singular ) se existe outra matriz quadrada
B, tal que
AB = BA = I
onde I é a matriz identidade. Diremos que tal matriz B é a inversa de A e denotaremos
B = A−1 .

Teorema 3.5 Se A é inversível, então B é única.


Demonstração Suponha que B1 e B2 são duas inversas de A, logo

AB1 = B1 A = I e AB2 = B2 A = I.

Então,
B1 = B1 I = B1 (AB2 ) = (B1 A)B2 = IB2 = B2

3.3.4 Matriz Triangular


Uma matriz quadrada A = [aij ] é triangular superior se todas as suas entradas abaixo da
diagonal principal são iguais a zero, isto é, se aij = 0 para todo i > j. Analogamente, A
será uma matriz triangular inferior se todas as suas entradas acima da diagonal principal
são iguais a zero, isto é, se aij = 0 para todo i < j.
 
1 2 3
Exemplo 3.6 A matriz A =  0 4 5  é triangular superior, enquanto a matriz B =
  0 0 6
−1 0
é triangular inferior.
4 7
Uma matriz quadrada D = [dij ] é diagonal se ela é, simultaneamente, triangular
superior e triangular inferior, isto é, se todos os elementos fora de sua diagonal principal
são iguais a zero.
 
3 0 0 0
 0 −1 0 0 
Exemplo 3.7 A matriz D =   0
 é diagonal.
0 4 0 
0 0 0 2

3.3.5 Matrizes Simétricas


Uma matriz A é simétrica se A = A0 , isto é, aij = aji . Uma matriz A é anti-simétrica se
A0 = −A, isto é, se aij = −aji . Dessa forma, os elementos da diagonal principal de uma
matriz anti-simétrica são todos iguais a zero, pois aii = −aii implica que aii = 0.
CAPÍTULO 3. MATRIZES 30

 
3 0 −1
Exemplo 3.8 A matriz A =  0 0 4  é simétrica, enquanto a matriz
  −1 4 −2
0 −2 3
B= 2 0 0  é anti-simétrica.
−3 0 0

3.3.6 Matrizes Ortogonais


Uma matriz quadrada é ortogonal se AA0 = A0 A = I, isto é, se A−1 = A0 . Dessa forma,
se a matriz A é ortogonal, o conjunto de vetores formado por suas linhas ou colunas é
ortonormal.
 
1/9 8/9 −4/9
Exercício 3.1 Verifique se a matriz A =  4/9 −4/9 −7/9  é ortogonal.
8/9 1/9 4/9

3.3.7 Matrizes Idempotentes


Seja A uma matriz quadrada, as potências de A são definidas do seguinte modo:

A0 = I A2 = AA A3 = A2 A ... An+1 = An A.

Uma matriz quadrada A é idempotente se A2 = A.

3.3.8 Matrizes Quadradas em Blocos


Seja A uma matriz quadrada. Com o auxílio de linhas pontilhadas horizontais e verticais
podemos criar uma partição em A dividindo-a em submatrizes chamadas blocos de A. Se os
blocos formam uma matriz quadrada, isto é, se há o mesmo número de linhas pontilhadas
horizontais e verticaise e se os blocos da diagonal são também matrizes quadradas, então
diremos que A é uma matriz quadrada em blocos.

Exemplo 3.9 Desculpe-me, mas ainda não consegui construir no Latex uma matriz di-
vidida por linhas pontilhadas.

3.4 Algumas Aplicações


OBS: Falta escrever o texto dessa aplicação.

yi = β1 + β2 xi2 + β3 xi3 · · · βx xik + εi ; i = 1, 2, · · · n.


CAPÍTULO 3. MATRIZES 31

Observações
  de Y:  Observações de X:
y1 1 x12 x13 · · · x1k
 y2  1 x12 x23 · · · x2 k 
   
 ..   .. .. .. . . .. 
. . . . . . 
yn 1 xn2 xn3 · · · xnk n×k

 
1 1 ··· 1  
x12 x22 · · · xn2  1 x12 x13 · · · x1k
  1 x12 x23 · · · x2 k 
0
Xk×n Xn×k = x13 x23 · · · xn3  ·  ..
   
.. .. ... .. 
 .. .. . . .  . . . . 
 . . . .. 
1 xn2 xn3 · · · xnk n×k
x1k x2k · · · xnk k×n
 P P P 
n xi2 xi3 · · · P xik
2 k
P P P

 x xi2 xi2 xi3 ··· xi2 xik 
 X 0
=  .. i2 .. .. ... .. = x xi
 .  i=1 i
P P . P . P 2.
xik xik xi2 xi2 xik ··· xi2

Exemplo 3.10
 
1
1 1
M o = In − i · i0 , onde i =  .. 
 
n .
1
   
1 0 ··· 0 1 1 ··· 1
0 1 ··· 0 1 1 1 · · ·
  1
M o =  .. ..  −  .. .. . .
 
.. . . .. 
. . . . n . . . .
0 0 ··· 1 1 1 ··· 1

   
o 1 0 1 0
M Y = In − ii Yn×1 = In Y − ii Y
n n
  P 
y1 yi
 y2  1 P yi 
=  ..  −  .. 
   
. n . 
P
yn yi
     
y1 Y y1 − Y
 y2  Y   y2 − Y 
=  ..  −  ..  =  .. 
     
 .  .  . 
yn Y yn − Y
CAPÍTULO 3. MATRIZES 32

Obs.:    
1 1 ··· 1 y1 P 
1 1 ··· 1  y2  yi
   P 
..  ·  ..  = P yi

 .. .. . .
. . . .  .  yi
1 1 ··· 1 yn
Outra matriz especial é a matriz inversa A−1 de uma matriz A.

A−1 A = AA−1 = I , note que A é quadrada.

M = [I − X(X 0 X)−1 X 0 ]

M e N são idempotentes
N = I − M = X(X 0 X)−1 X 0
N · N = X(X 0 X)−1 X 0 · X(X 0 X)−1 X 0 = X(X 0 X)−1 X 0 = N.
   

M · M = X(X 0 X)−1 X 0 · X(X 0 X)−1 X 0


   

= I − X(X 0 X)−1 X 0 − X(X 0 X)−1 X 0 + X(X 0 X)−1 X(X 0 X)−1 X 0


= I − X(X 0 X)−1 X 0 − X(X 0 X)−1 X 0 + X(X 0 X)−1 X 0 = I − X(X 0 X)−1 X 0 = M.

Você também pode gostar