Você está na página 1de 105

Geometria Analı́tica

Seme Gebara Neto


21 de agosto de 2018

Sumário
1 Equações lineares em uma incógnita, a reta real 2

2 Equações lineares em duas incógnitas, plano cartesiano 4

3 Vetores no plano 8

4 Coordenadas de vetores 11

5 Produto escalar 14

6 Retas em R2 17

7 Sistemas de duas equações e duas incógnitas, inversão de matrizes 2 × 2 22

8 Multiplicação de matrizes como movimentos do plano 29

9 Formas quadáticas em R2 33

10 Cônicas 34

11 Mudanças de coordenadas no plano 39

12 Mudança de base 42

13 Eixos de simetria de ax2 + bxy + cy 2 = d 44


13.1 Autovetores e autovalores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
13.2 Matrizes ortogonais 2x2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
13.3 Diagonalização de matrizes simétricas 2 × 2 . . . . . . . . . . . . . . . . . . . . . . 50

14 Mudança de origem 53

15 Equações quadráticas em sua forma geral 55

16 Mais exercı́cios 57

1
17 Geometria Analı́tica Espacial 60
17.1 Alguns fatos básicos de Geometria Euclidiana espacial . . . . . . . . . . . . . . . . . 60
17.2 Pontos e vetores em R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
17.3 Retas e planos no espaço . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
17.4 Produto vetorial e determinantes 3x3 . . . . . . . . . . . . . . . . . . . . . . . . . . 70
17.5 Retas reversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
17.6 Distâncias e Ângulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
17.7 Mais alguns exercı́cios sobre retas e planos no espaço . . . . . . . . . . . . . . . . . 79

18 Sistemas de Equações Lineares 80


18.1 Definições e exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
18.2 Possibilidades qualitativas de soluções de sistemas . . . . . . . . . . . . . . . . . . . 83
18.3 Escalonamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
18.4 A forma escalonada e reduzida de uma matriz . . . . . . . . . . . . . . . . . . . . . 85
18.5 Determinantes e escalonamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
18.6 Inversão de matrizes e escalonamento . . . . . . . . . . . . . . . . . . . . . . . . . . 89
18.7 Independência Linear em R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
18.8 O teorema de caracterização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

19 Mais exercı́cios 93

20 Espaços Euclidianos Rn 95
n
20.1 Independência Linear em R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
20.2 Subespaços de Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
20.3 Bases e dimensão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

21 Diagonalização de Matrizes 100


21.1 Mudanças de base em Rn e definições básicas . . . . . . . . . . . . . . . . . . . . . . 100
21.2 Matrizes diagonalizáveis e não diagonalizáveis . . . . . . . . . . . . . . . . . . . . . 102
21.3 Matrizes simétricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
21.4 Exemplos e exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

1 Equações lineares em uma incógnita, a reta real

A forma geral de uma equação linear com uma incógnita real é

ax = b,

onde a e b são números reais dados. O termo linear significa que trata-se de uma equação polinomial
de grau 1.

O conjunto solução da equação, que nesse texto será sempre denotado por S, é um subconjunto de
R e a análise, já suficientemente conhecida, é a seguinte:

2
• Se a 6= 0, então existe uma única solução x = ab . Em outras palavras, S é o conjunto unitário
S = { ab }.

• Se a = 0, então existem duas situações:

– se b 6= 0, então não existe solução (ou seja, S = ∅),


– se b = 0, então qualquer número real é solução (ou seja, S = R).

Já conhecemos um modo de se representar geometricamente os números reais através de um sistema


de coordenadas para uma reta. Dada uma reta r, escolhemos dois de seus pontos para representar
os números 0 e 1, digamos que o ponto A represente o 0 e o B represente o 1.

Isto confere à reta r uma origem, uma unidade de medida (o comprimento do segmento AB) e um
sentido positivo (de A para B). Comparando com o segmento unitário AB, vamos identificar os
pontos da reta com os números reais.

Dado um ponto P ∈ r, denote por k AP k o comprimento de AP . Existe um único número real t,


de modo que |t| =k AP k e que “compara” os sentidos dos segmentos orientados AP e AB, sendo
t positivo caso os segmentos orientados AP e AB tenham o mesmo sentido e negativo caso tenham
sentidos opostos. Se P = A, então claramente t = 0.
−→
Um modo de se abreviar isto é usar a notação AB para representar o segmento orientado, que
−→ −→
começa em A e termina em B. Assim, podemos escrever AP = tAB para simbolizar o modo como
o ponto P determina o número real t.
−→
Reciprocamente, dado um número real s, existe um único ponto Q da reta r, de modo que AQ =
−→
sAB, ou seja, o ponto Q está definido pelo fato de k AQ k= |s| k AB k o sinal de s determina se
os segmentos AQ e AB têm mesmo sentido (caso s > 0) ou sentidos contrários (caso s < 0). Se
s = 0, então claramente Q = A.

Segmentos orientados recebem o nome de vetores e trataremos deles com mais detalhes em breve.

Uma reta munida de um sistema de coordenadas chama-se eixo. Note que para determinar um
sistema de coordenadas numa reta foi necessário escolher dois pontos distintos. Isso garante que as
equações lineares usadas para identificar pontos do eixo com números reais tenham solução única.

Na ilustração abaixo, o número α ∈ R associado a P é positivo e maior que 1, enquanto o ponto Q


representa o valor − 21 .

3
Q A B P

0 1 α
− 21

2 Equações lineares em duas incógnitas, plano cartesiano

Como já foi dito, o termo linear está reservado para equações polinomiais de grau 1 nas incógnitas,

que agora serão x e y. Desse modo não há termos tipo cos x, y, x1 e nem mesmo xy, já que este
produto tem grau 2. Assim, a forma geral de uma equação linear com duas incógnitas é
ax + by = c,
onde a, b e c são números reais dados.

O conjunto solução S é agora um conjunto de pares ordenados de números reais. Por exemplo,
para a equação 3x − y = 1, temos (1, 2) ∈ S, enquanto (0, 0) 6∈ S. Já para uma equação homogênea,
isto é, quando c = 0, o par ordenado (0, 0) sempre faz parte da solução.

Todos conhecemos uma maneira geométrica de representar o conjunto de todos os pares ordenados
de números reais; isto é feito pelo plano cartesiano, isto é, a escolha de um sistema de coordenadas

4
para o plano que o torna o conhecido “plano xy”. Este sistema consiste de dois eixos perpendi-
culares, ambos com origem no ponto de interseção, com mesma unidade de medida e ordenados
de maneira que, quando percorremos o ângulo reto do sentido positivo do primeiro eixo (o eixo x)
para o sentido positivo do segundo (o eixo y), o giro é anti-horário. O plano cartesiano, ou plano
xy, ou plano coordenado, será denotado por R2 .

A convenção é que o sentido anti-horário seja chamado de sentido positivo de percurso do cı́rculo
(dos ângulos).

A associação de pontos do plano cartesiano e pares ordenados de números reais é imediata e vamos
usar o sinal de igualdade entre pontos e pares ordenados identificados.

Nem todas as equações lineares da forma ax+by = c devem num primeiro momento ser interpretadas
geometricamente, como por exemplo, se queremos saber quantas moedas de 5 centavos e quantas
moedas de 25 centavos devemos juntar para chegar a R$ 5,00. É claro que este problema tem várias
soluções, mas uma interpretação geométrica para ele poderia soar artificial.

No entanto, de maneira geral, se x e y podem ser números reais quaisquer, o conujunto solução
de ax + by = c pode ser visto como um subconjunto de R2 . Do ensino médio sabemos que uma
equação desse tipo representa uma reta.

De fato, voltando ao exemplo 3x − y = 1, já vimos que A = (1, 2) ∈ S e é fácil achar mais uma
solução, por exemplo, B = (0, −1). Afirmamos que o conjunto S é exatamente a reta r que passa
por (1, 2) e (0, −1). Para ver isso, Seja P = (a, b) um ponto qualquer do plano. Desenhando o
ponto P sobre a reta r e traçando paralelas aos eixos coordenados (projetando os pontos P e A no
eixo x), obtemos os pontos D e E. A conclusão, da semelhança entre os triângulos BAE e BP D,
a b+1
é: P ∈ r ⇔ = ⇔ 3a − b = 1 ⇔ P ∈ S.
1 3

5
6

4
P

A
2

−4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
B E D
−1

−2

−3

−4

−5

−6

−7

−8

Uma maneira de se enxergar a equação 3x − y = 1 é como um produto de uma matriz linha 1 × 2


por uma matriz coluna 2 × 1
 
 x
3 −1 = 1.
y

Em tempo: o produto de uma matriz linha por uma matriz coluna está definido sempre que ambas
têm o mesmo número de entradas
 eé a soma dos produtos das entradas correspondentes. Por
 x
exemplo, no caso acima, 3 −1 = (3)(x) + (−1)(y) = 3x − y e no caso geral de matrizes de
  y
 c
duas entradas tem-se a b = ac + bd. Um exemplo envolvendo matrizes de tês entradas é
  d
 2
1 3 4  0  = (1)(2) + (3)(0) + (4)(−1) = −2 e assim por diante.
−1

Exercı́cio. A matriz 3 −1 , chamada matriz dos coeficientes, tem um significado geométrico:

6
−→
desenhando o segmento que liga a origem ao ponto F = (3, −1), demonstre que o ângulo entre OF
e a reta r é o que parece, ou seja, é reto.
6

A
2

−4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
B F
−1

−2

−3

−4

−5

−6

−7

−8

 
 x
A análise completa da equação a b = c é a seguinte:
y
 
• Se a b 6= 0 0 , S é uma reta em R2 .
 
• Se a b = 0 0 , então S = ∅ quando c 6= 0 e S = R2 quando c = 0.

Exercı́cios.

1. No exemplo do texto, ambos os coeficientes, de x e de y na equação eram não nulos. Qual é


a reta solução quando apenas um deles é nulo?

2. Determine t ∈ R tal que o ponto (3t, 2 − t) esteja no conjunto solução de x − y = 0.

3. O ponto (3, −2) pertence à solução da equação 4x + 2y = 1? Por quê?

7
3 Vetores no plano

O conceito de vetor importante para matemática, fı́sica e aplicações e que nos ajudará a descrever
objetos geométricos no plano cartesiano. O que vamos fazer antes de pensarmos em coordenadas no
plano é intrı́nseco, e ocorre exatamente da mesma maneira para vetores no espaço tridimensional.

Certas grandezas, como força e velocidade, são chamadas vetoriais, por dependerem apenas de
intensidade, direção e sentido. Chamaremos de vetores segmentos orientados do plano, carac-
−→
terizados por terem um ponto inicial A e um ponto final B, e escreveremos AB.
−→
O comprimento do segmento, também chamado módulo ou norma do vetor, denotado por k AB k,
representa a intensidade da grandeza vetorial. Os pontos A e B, quando distintos, determinam
uma reta, que por sua vez representa a direção da grandeza vetorial envolvida. Quando A = B,
−→
AB é chamado de vetor nulo e não há como definir a direção associada (o que não tem importância
nenhuma: é o mesmo que dizer que todas as direções estão associadas ao vetor nulo). Há dois
−→ −→
sentidos possı́veis, AB e BA; quando se trata do vetor nulo, não há como definir o sentido.

O conceito de direção merece algum comentário. Uma reta define uma direção, mas uma direção
não determina uma reta. Uma direção é apenas representada por uma reta, e por qualquer outra
paralela a ela. Assim, quando falamos em direção, falamos do conjunto de (todas as) retas paralelas
a uma reta dada. Para determinar uma reta, além de uma direção, é necessário localizá-la, indicando
um ponto por onde ela passe.
−→
Por definição, dois vetores são iguais quando têm mesmos módulo, direção e sentido, isto é, AB =
−−→
CD se as retas AB e CD são paralelas, os segmentos AB e CD são congruentes e o sentido de
percurso é o mesmo. Em outras palavras, se os pontos A, B, C e D não estão alinhados, então
ABDC é um paralelogramo e o sentido dos lados opostos AB e CD é o mesmo.

Assim, um vetor V é uma coleção de segmentos orientados, todos paralelos, de comprimentos iguais
e com mesmo sentido. Um vetor V pode ser representado por qualquer um desses segmentos
orientados.

Existem operações que podem ser definidas com vetores, baseadas em observações do comporta-
mento de grandezas vetoriais, como força, por exemplo (lembre-se do conceito de força resultante,
que nada mais é do que a adição vetorial das forças envolvidas).

Definimos a adição ou soma de dois vetores V e W da seguinte maneira. Escolha um ponto


qualquer do plano, chame-o de A. O único representante de V com ponto inicial A, digamos
−→ −−→
V = AB, determina o ponto B. O representante W = BC com ponto inicial B determina o ponto
−→
C. Então V + W = AC.

8
B

V W
C

A
V+W

Observações.

1. Esta definição não depende do ponto A escolhido: tivéssemos escolhido outro ponto A0 ,
−−→ −−→
os pontos B 0 e C 0 estariam determinados por V = A0 B 0 e W = B 0 C 0 e o segmento A0 C 0
−−→ −→
resultaria com mesmos módulo, direção e sentido de AC, ou seja, A0 C 0 = AC (congruência
de triângulos).

− →
− →

2. O vetor nulo, denotado por 0 , é tal que V + 0 = 0 + V = V para todo vetor V .

3. Se V e W são paralelos, então V + W ainda é paralelo a ambos, pois na escolha de represen-


tantes terı́amos os pontos A, B e C alinhados (desenhe).

Se V e W são ambos não nulos e não são paralelos, pode ser aplicada a regra do paralelogramo:
escolha um ponto A do plano e tome os representantes para V e W começando de A, digamos
−→ −→
V = AB e W = AC. Nesse caso os vetores V e W (ou os pontos A, B e C) determinam um

9
paralelogramo com quarto vértice D; chamamos ABDC de paralelogramo gerado por V e W .
−−→
Nesse caso, a adição V + W está representada pela diagonal AD. Isto é devido ao fato de que os
−→ −−→
lados opostos AC e BD do paralelogramos representam o mesmo vetor W .

A partir da definição (ou da regra do paralelogramo, quando aplicável) vemos imediatamente que
V + W = W + V quaiquer que sejam os vetores V e W .

Definimos agora a multiplicação de vetor por escalar. A palavra “escalar” quer dizer número real.
Uma grandeza escalar é caracterizada por apenas um número real. A massa, por exemplo, medida
em quilogramas.

Sejam V um vetor e α ∈ R um escalar. O vetor αV está definido por:



− →

• k αV k= |α| k V k. Isto significa em particular que se α = 0 ou se V = 0 , então αV = 0 .

• αV tem a mesma direção de V .

• αV tem o mesmo sentido de V quando α > 0 e sentido oposto a V quando α < 0.

A C F H (1/2)V
-V G
B E
V
2V D

10
As oprerações de adição de vetores e multiplicação de vetor por escalar são chamadas operações
lineares, e logo veremos o porquê deste nome. Uma boa ilustração para o caso de adição de vetores
é um diagrama de forças atuando numa massa num plano inclinado. Faça alguns desenhos e pense
no assunto, a força resultante é o resultado da soma vetorial das forças envolvidas.

4 Coordenadas de vetores

O que fizemos até aqui sobre vetores não depende de um sistema de coordenadas, mas quando
queremos tratar algebricamente com tais objetos, vamos precisar. Considere um sistema de co-
ordenadas cartesianas para o plano e seja O a origem de R2 (O = (0, 0)). Dado um vetor V no
−→
plano, olhe para seu representante que tem ponto inicial na origem, digamos que seja V = OP . As
coordenadas de V são definidas como as coordenadas de seu ponto final P . Isto nos diz que ambos
os conjuntos { vetores no plano } e { pontos no plano } são representados pelo mesmo conjunto: o
conjunto de pares ordenados de números reais.

Podemos representar o conjunto de pares ordenados de números reais tanto por matrizes linha
x
{(x, y)|x, y ∈ R} (podendo ou não usar a vı́rgula) como por matrizes coluna |x, y ∈ R .
y
−→
Exemplo. Suponha que W = AB, com A = (3, −1) e B = (1, 5). Quais são as coordenadas de
W ? Isto se resolve com um desenho e com a definição de adição de vetores.

11
P
6

B
5

−4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
A
−1

−2

−3

−4

−5

−6

−7

−8

−→
Sabemos que as coordenadas de W são as coordenadas do ponto P quando W = OP . Olhando para
a figura, não é difı́cil concluir, já que as coordenadas são todas números inteiros, que W = (−2, 6).
−−→ −→ −−→ −→
De maneira geral, temos, pela definição de adição, OB = OA + W , ou seja, W = OB − OA.
−→ −−→
Como as coordenadas dos vetores OA e OB coincidem com as coordenadas dos pontos A e B
respectivamente, chegamos a
     
−→ 1 3 −2
W = AB = − =
5 −1 6
−→
Não havendo risco de confusão entre pontos√ e vetores, podemos resumir isso como AB = B √ − A.
Por exemplo, o vetor que liga o ponto (π, 2) ao ponto (1, 2) tem coordenadas (1 − π, 2 − 2).
 
1 
Exemplo. Se V = é um vetor no plano, as coordenadas de (−2)V são −2, 10 . De fato, o
−5 
segmento orientado que liga a origem ao ponto −2, 10 tem mesma direção, o dobro   do tamanho
1
e sentido contrário em relação ao segmento orientado que liga a origem ao ponto .
−5

12
Observação. É importante notar que dois vetores são paralelos se e somente se um é múltiplo
escalar do outro. Em particular o vetor nulo é paralelo a qualquer outro.

Usamos aqui operações com matrizes que ainda não foram definidas nesse texto: chamadas também
de operações lineares, a adição de matrizes está definida para matrizes M e N de mesmo ta-
manho e se faz entrada a entrada, resultando portanto numa matriz de mesmo tamanho. A
multiplicação de matrizes por escalar está definida para um número real α e para uma matriz
M , multiplicando-se cada entrada de M por α e tem como resultado uma matriz de mesmo
tamanho que M . Para maiores detalhes, veja por exemplo o livro do professor Dan Avritzer,
Geometria Analı́tica e Álgebra Linear - Uma Visão Geométrica, tomos I e II (disponı́veis em
http://www.mat.ufmg.br/ead/paginas/biblio-livros.htm).

A observação importante aqui é que, como vimos, as operações lineares com vetores são compatı́veis
com as operações lineares das matrizes que os representam num sistema de coordenadas.

Exercı́cios.

1. Quais são as coordenadas do ponto final do representante do vetor V = (3, 4) que tem ponto
inicial A = (3, 1)?
2. Quais são as coordenadas do ponto médio do segmento com extremos (1, 3) e (−4, 0)?
3. Dadas as coordenadas de dois vértices e do baricentro (encontro das medianas) de um
triângulo, é possı́vel determinar as coordenadas do terceiro vértice? Como?
   
1 4
4. Dados os vetores V = eW = , calcule as coordenadas de U = 3V − 2W .
2 2
5. Faça desenhos e conclua que, dados dois vetores V e W não nulos e não paralelos no plano,
eles geram um paralelogramo com diagonais V + W e V − W . Qual é o sendido de W − V ?
6. Sejam A e B matrizes de mesmo tamanho e α, β ∈ R. Mostre que
(a) (α + β)A = αA + βA.
(b) α(A + B) = αA + αB.

Em particular, estas propriedades distributivas valem para as opreações lineares com vetores.
7. Determine os três vértices de um triângulo sabendo que seus pontos médios são (5, 0), (3, 1)
e (4, 2).
8. Sendo A = (a1 , a2 ) e B = (b1 , b2 ), demonstre que as coordenadas do ponto médio do segmento
a2 + b 2
AB são ( a1 +b
2
1
, ).
2
9. A base média de um triângulo é o segmento que liga os pontos médios dos lados adjascentes
àquele que escolhemos como base. Mostre que a base média de um triângulo é paralela à base
e tem medida igual à metade da medida da base.
10. Considere os pontos A = (4, 6) e B = (6, 5). Determine pontos C sobre o eixo x e D sobre o
eixo y de modo que ABCD seja um paralelogramo contido no primeiro quadrante.

13
5 Produto escalar

O produto escalar tem esse nome porque é um produto entre vetores com resultado numérico.
Uma vez estudado o produto escalar, nosso plano R2 estará munido de uma “régua” e de um
“transferidor”.
Primeiramente, observe que para calcular a distância entre dois pontos no plano podemos usar o
−→
módulo (a norma) do vetor que os liga. Assim, a distância entre A e B é d(A, B) =k AB k. E para
calculá-la usamos o Teorema de Pitágoras: tomamos o ponto P , o ponto final do representante de
−→ −→ −→
AB que começa na origem, isto é, AB = OP . Sabemos calcular, a partir dos pontos A e B as
−→ −→
coordenadas de OP , digamos que OP = (a, b). Por Pitágoras,
−→ √
k AB k 2 = a2 + b2 , ou d(A, B) = a2 + b2 .
6

4
A
3

2
B

O a
−4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
−1
P
b
−2

−3

−4

−5

−6

−7

−8

Já para definir ângulos entre dois vetores não nulos, representamos ambos com mesmo ponto inicial
e escolhemos o menor valor entre os dois ângulos formados. Isto significa que o ângulo entre dois
vetores varia entre 0 e 180o .

14
D E F
B

θ=0
A θ
C
H G I

θ = 180o



Por convenção, não se define o ângulo entre o vetor nulo 0 e um outro vetor V mas permite-se
que assuma qualquer valor. Isto quer dizer que o vetor nulo é paralelo a qualquer outro vetor (pois
o ângulo pode ser pensado como 0o ), mas também é perpendicular a qualquer outro vetor (pois o
ângulo pode ser pensado como 90o ).

Definimos agora produto escalar entre dois vetores V e W . É chamado de produto escalar não à
toa, já que o resultado é um número real:

V · W =k V kk W k cos θ,

onde θ = ∠(V, W ) é o ângulo entre V e W .

É imediato que V · V =k V k 2

Também é fácil concluir que, sendo V e W não nulos, conhecendo V · W , saberemos calcular
V ·W
cos θ = .
k V kk W k

15
−→
Para calcular V ·W a partir das coordenadas de V e W , considere os pontos A e B tais que V = OA
−−→
e W = OB e olhe para o triângulo OAB (desenhe). O caso em que não há triângulo, isto é, quando
−→ −→
V e W são paralelos, fica de exercı́cio para o leitor. Como AB é tal que V + AB = W , segue
−→
AB = W − V (o que nos dá a interpretação da outra diagonal do paralelogramo gerado por V e
W ).

Usando a Lei dos Cossenos,


−→
k AB k 2 =k V k 2 + k W k 2 − 2 k V kk W k cos θ,

e daı́, usando a definição de produto escalar,


1 −→
V · W = − (k AB k 2 − k V k 2 − k W k 2 ).
2
−→
Sendo A = (a1 , a2 ) e B = (b1 , b2 ), temos AB = (b1 − a1 , b2 − a2 ) e portanto

1
V · W = − (b1 2 − 2a1 b1 + a1 2 + b2 2 − 2a2 b2 + a2 2 − a1 2 − a2 2 − b1 2 − b2 2 ) = a1 b1 + a2 b2 .
2

Assim, temos:
    
a1 b1  b1
• uma fórmula para V ·W em coordenadas, que pode ser resumida em · = a1 a2 =
a2 b2 b2
a1 b1 + a2 b2 (produto do primeiro como matriz linha pelo segundo como matriz coluna);

• uma régua, pois k V k 2 = V · V ; e


V ·W
• um transferidor, pois cos θ = quando ambos são não nulos.
k V kk W k

Uma consequência imediata é a caracterização de vetores ortogonais: V · W = 0 ⇔ ^(V, W ) = 90o


ou se um deles é nulo. Como dito antes, é convencional dizer que o vetor nulo é ortogonal a qualquer
outro: assim podemos dizer que dois vetores são ortogonais se e somente se o produto escalar entre
eles é zero.

Exercı́cios.

1. Os vetores (1, 3) e (6, −2) são ortogonais.

2. O triângulo formado pelos pontos (0, 5), (2, 2) e (5, 4) é retângulo e isósceles.

3. Dados os pontos A = (3, 2) e B = (1, −3), determine a reta mediatriz de AB exibindo dois
pontos distintos.

4. Dê exemplos de pares de vetores que formem ângulo agudo e obtuso (note que você terá de
controlar o sinal do produto escalar).

16
   
a1 b
5. Demonstre que a fórmula obtida para o cálculo do produto escalar, · 1 = a1 b1 +a2 b2 ,
    a2 b2
a1 b1
vale também para o caso em que os vetores e são paralelos.
a2 b2
6. Verifique que V · W = W · V para quaisquer vetores V e W .

7. Dadas as coordenadas de três vértices A, B e C de um triângulo, diga como obter as coorde-


nadas do pé da altura relativa ao vértice A.

8. Mostre que o produto escalar se comporta bem com as operações lineares, ou seja, que V ·
(αU + βW ) = αV · U + βV · W , para quaisquer vetores V , U e W e escalares α e β.

9. Dados os vetores (3, 4) e (12, 5), determine um vetor que está na direção da bissetriz do ângulo
formado por eles.

10. Determine o ponto C de modo que o triângulo formado por A = (0, 0), B = (1, 2) e C seja
retângulo em A e tenha ângulo de 30o no vértice B.

11. As operações lineares (adição e multiplicação por escalar) definidas geometricamente para
vetores produzem os mesmos resultados quando definidas algebricamente para as matrizes
(linha ou coluna) que representam os vetores.

6 Retas em R2

Voltando ao nosso exemplo inicial, o estudo  daequação 3x − y = 1, já vimos que o conjunto solução
3
S é uma reta de R2 e que o vetor N = , cujas coordenadas são os coeficientes de x e y na
−1
equação, é ortogonal (normal) à reta solução. Na verdade isso 
valeem geral: se a equação da reta
a
é ax + by = c (o que em particular significa que o vetor N = é não nulo), então o conjunto
b
solução é uma reta r ortogonal a N . Por este motivo, N é chamado de vetor normal a r.

Note que uma reta em R2 está completamente determinada por um ponto e por uma direção
ortogonal. Em outras palavras, dados um ponto A e uma reta s, existe uma única reta r passando
por A e perpendicular a s. Assim, dados um ponto e um vetor normal (não nulo, para que possa
definir a direção ortogonal), determinamos completamente a reta.

No caso do nossoexemplo
 inicial, podemos recuperar
  a equação a partir
 de  um ponto qualquer de
3 3 x
r, digamos A = , e do vetor normal N = . Um ponto X = ∈ R2 pertence à reta r
8 −1 y
−−→
se e somente se os vetores AX e N são ortogonais.

17
A
8
N

X
2

−4 −2 0 2 4 6 8 10 12 1

−2

−4

−6

−8

−10

−12

−14

18
Algebricamente, temos
−−→
   AX  · N = 0
x 3
− ·N = 0
y 8  
x−3 3
· = 0
y−8 −1
3x − 9 − y + 8 = 0
3x − y = 1.

Esta é chamada a equação geral da reta r; a notação muitas vezes é (no caso geral) r : ax + by = c.

Exercı́cio. Escolha outro ponto pertencente a r e outro vetor normal N2 . Observe que N2 é
obrigatoriamente um múltiplo escalar não nulo de N . Obtenha a equação geral da reta r e note
que, a menos de simplificação (isto é, a menos de multiplicação por um escalar não nulo), a equação
geral de uma reta é única.

Por outro lado, ainda no nosso exemplo 3x − y = 1 é importante descrever o conjunto solução da
equação explicitamente. Isso se faz resolvendo a equação em uma das incógnitas em função da
outra. Nesse caso, é mais fácil escrever y = 3x − 1 e a solução é o conjunto de pares ordenados
do plano nos quais a segunda coordenada é o triplo da primeira menos uma unidade. A variável
livre, no nosso caso x, é chamada de parâmetro e o conjunto solução tem a seguinte representação
(chamada paramétrica):
  
x
S = |x ∈ R
3x − 1
    
x 0
= + |x ∈ R
3x  −1
  
0 1
= +x |x ∈ R
−1  3 
0 1
= +t |t ∈ R .
−1 3

Note que na última igualdade a única modificação foi o nome do parâmetro, o que foi feito de
propósito, para enfatizar que ali x ou t tem um significado diferente de incógnita, mas sim de
cumprir a instrução de percorrer todo o conjunto dos números reais. Cada valor de x define um
ponto da reta; reciprocamente, cada ponto da reta está representado por um valor de x.

Por exemplo se x = 0, o ponto é o (0, −1). Para x = −3, o ponto é o (−3, −10). Para saber se o
ponto (1, 1) está ou não na reta, temos que resolver o sistema (de duas equações e uma incógnita)
(
x=1
3x − 1 = 1.

Não é difı́cil ver que este sistema não tem solução, logo (1, 1) 6∈ r.

19
A representação paramétrica de uma reta é muitas vezes chamada de equação paramétrica da reta
pelo fato de que
       
x x 0 1
∈r⇔ = +t |t ∈ R.
y y −1 3

Podemos simplesmente escrever r : A + tV | t ∈ R, onde A é um ponto por onde a reta passa, V é


um vetor (sempre não nulo) que determina a direção de r, e por isso chamado de vetor diretor de
r, e a adição deve ser vista em coordenadas.

Então, há dois modos de se determinar geometricamente uma reta no plano: ou por um de seus
pontos e um vetor diretor não nulo (o que é equivalente a dois pontos distintos da reta), ou por
um de seus pontos e um vetor normal não nulo. Traduzindo algebricamente, o primeiro modo dá
origem à representação paramétrica da reta e o segundo à sua equação geral.

Enquanto a equação geral de uma reta, como já vimos, é única, a representação paramétrica não.
Se, no nosso velho exemplo da reta de equação 3x − y = 1 tomamos um ponto diferente do (3, 8),
digamos B = (1, 2) e outro vetor diretor não nulo (que obrigatoriamente será um múltiplo escalar
de V ), digamos W = (2, 6), então
   
1 2
r: +t |t ∈ R.
2 6

Observação. Continuamos a chamar o parâmetro de t, mas note que o ponto associado a t = 0


na primeira representação é o (0, −1) e o ponto associado a t = 0 na segunda representação é o
(1, 2). O que fizemos foi na verdade dar dois sistemas de coordenadas diferentes para r; numa
parametrização, o ponto escolhido será a “origem” e o vetor diretor será o “segmento unitário que
aponta para o sentido positivo a partir da origem”. Em outras palavras, são dois eixos distintos,
embora a reta seja a mesma. A figura 1 ilustra duas parametrizações diferentes para r: r =
−→ −−→
{A + tAB|t ∈ R} = {C + λCD|λ ∈ R}.

Exercı́cios.

1. Considere os pontos A = (3/2, 1), B = (4, 2) e C = (5, 3), determine a equação geral e a
−−→
equação paramétrica das retas r, que passa por A e B, s, que passa por A e é paralela a BC
−−→
e u, que passa por A e tem vetor normal BC.

2. (a) Dê exemplo de uma equação geral de uma reta r que não seja nem vertical nem horizontal.
(b) Ache uma representação paramétrica da reta r que você escolheu no exercı́cio 1.
(c) Troque de vetor diretor na representação paramétrica do item (b) de modo que a primeira
 
1
coordenada do novo vetor diretor W seja 1, isto é, escreva W da forma W = .
a
Note que, neste caso, a segunda coordenada deste vetor diretor (= a) é exatamente o
coeficiente angular da reta.

20
6

5
B
4

3 −→
V = AB
2 A

C
1

−4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
−1

−−→−2
W = CD
−3
D
−4

−5

−6

−7

Figura 1: Duas parametrizações diferentes para r

21
 
−a
(d) Mostre que U = é ortogonal a W . Multiplicando U por −1/a, obtemos Z =
  1
1
, ainda ortogonal a W . Conclua que Z é vetor diretor de qualquer reta perpen-
−1/a
1
dicular a r, todas com coeficiente angular − , ou seja, retas perpendiculares no plano
a
têm coeficientes angulares “inversos opostos”, como já sabı́amos.
3. Como proceder para, a partir da equação paramétrica de uma reta chegar à sua equação
geral?
4. Escreva um roteiro para, dado um triângulo ABC, obter a medida da altura relativa ao vértice
A.
5. Determine b ∈ R tal que a reta de equação 3x + by = 12 intercepte os eixos x e y nos pontos
A e B e a distância entre A e B seja 5.
6. Determine todas as retas do plano que são perpendiculares à reta 3x + 4y + 5 = 0.
7. Determine o pé da perpendicular desde o ponto P = (4, 0) até a reta r : 2x−5 = 7. [sugestão.
Considere a forma paramétrica da reta que passa por P e é perpendicular a r, depois calcule
a interseção desta reta com r.]
8. Determine as coordenadas do ponto P que está sobre o eixo x e é equidistante de (3, −1) e
(1, −2).
9. Dados três pontos A, B e C, exiba um critério para sabermos se são ou não colineares (isto
é, se pertencem ou não à mesma reta).
10. O ângulo entre duas retas é definido como o menor ângulo formado por elas, com a convenção
que se têm a mesma direção (paralelas ou iguais) o ângulo é zero. Assim, o ângulo entre duas
retas no plano é sempre menor ou igual a um ângulo reto. Dadas as retas r : A + tV, t ∈ R
e s : B + λW, λ ∈ R, qual é o ângulo entre elas? Note que sua resposta estará em função de
V e W.

7 Sistemas de duas equações e duas incógnitas, inversão de


matrizes 2 × 2

Interpretamos a solução de uma equação linear em duas incógnitas como uma reta em R2 . Então,
no caso de um sistema de duas equações em duas incógnitas, sua solução representará a interseção
entre duas retas em R2 . Como já sabemos, dadas duas retas no plano, ou as retas são iguais,
ou são paralelas, ou são concorrentes. Em termos do sistema, estas possibilidades significam,
respectivamente, que o conjunto solução S é um conjunto infinito (a própria reta), ou S = ∅ (as
retas não se interceptam), ou S é um conjunto unitário (o ponto de interseção).

Um exemplo para o primeiro caso é o sistema


(
3x − y = 1
,
6x − 2y = 2

22
pois ambas as equações representam a mesma reta.

Um exemplo para o segundo caso é o sistema


(
3x − y = 1
,
3x − y = 0

pois as retas têm mesmo vetor normal, logo têm mesma direção e a origem, que é um ponto da
segunda reta, não pertence à primeira, logo as retas são paralelas.

Um exemplo para o terceiro caso é (


3x − y = 1
,
x − 2y = −3

já que os vetores normais (3, −1) e (1, −2) não são múltiplos, logo não são paralelos, logo as retas
não são paralelas, portanto se encontram num só ponto. Aliás, a solução é o ponto (1, 2), facilmente
calculável por “soma” ou “substituição”.

Um outro modo de se resolver o sistema é por escalonamento. Em primeiro lugar, observe que a
solução do sistema não muda se uma ou mais das seguintes operações é feita sobre alguma linha:
• L1 ↔ L2 (troca de posição das linhas)
• Li ← αLi , α 6= 0 (a i-ésima linha multiplicada por uma constante não nula)
• Li ← Li + αLj (a i-ésima linha é substituı́da por ela mesma mais um múltiplo escalar da
outra)

Estas operações, chamadas operações elemetares sobre linhas, não se restringem a sistemas 2 × 2,
vamos ver ainda como funciona o caso geral. Assim, existe uma técnica de, passo a passo, trocarmos
nosso sistema por um equivalente, de modo que a solução fique preservada.

Uma notação que abreviará muito nosso trabalho é a notação matricial. Usaremos o produto de
matrizes. Se você não conhece ou não lembra, está definido um pouco mais abaixo.

São formas equivalentes de se apresentar um sistema 2 × 2:


(     
ax + by = c a b x c
ou = .
dx + ey = f d e y f

Este
 sistema
 pode ser representado
 ainda por sua matriz aumentada, isto é, a matriz dos coeficientes
a b c
“aumentada” do vetor :
d e f
 
a b c
,
d e f

e as operações elementares sobre as linhas do sistema podem ser feitas diretamente nas linhas desta
matriz. Para ver isso, vamos voltar aos exemplos acima:

23
(  
3x − y = 1 3 −1 1
1. A matriz aumentada de é . Ao fazermos L2 ← L2 − 2L1 ficamos
6x − 2y = 2 6 −2 2
 
3 −1 1
com , mostrando que a informação contida na segunda linha era supérflua; a
0 0 0
solução deste sistema é a nossa famosa reta r.
(  
3x − y = 1 3 −1 1
2. Já para o sistema , a matriz aumentada é ; ao fazermos L2 ←
3x − y = 0 3 −1 0
 
3 −1 1
L2 − L1 , chegamos a . A segunda linha agora significa 0x + 0y = −1, o que é
0 0 −1
impossı́vel, logo esse sistema não tem solução.
(
3x − y = 1
3. Olhando agora para o sistema , temos:
x − 2y = −3
       
3 −1 1 L1 ↔L2 1 −2 −3 L2 ←L2 −3L−1 1 −2 −3 L2 ←(1/5)L2 1 −2 −3
−−−−→ −−−−−−−−→ −−−−−−−→ ,
1 −2 −3 3 −1 1 0 5 10 0 1 2

o que já nos diz, olhando para a segunda equação, que y = 2. Poderı́amos agora substituir
este valor na primeira equação e calcular diretamente o valor de x, mas também podemos
continuar escalonando:
 
1 0 1
L1 ←L1 +2L2
−−−−−−−→ .
0 1 2

(
x=1
A última matriz aumentada é equivalente ao sistema , cuja solução é a interseção
y=2
da reta horizontal y = 2 com a reta vertical x = 1, logo é o par ordenado (1, 2).

Vamos lembrar da definição de multiplicação de matrizes:

• primeiro,
  lembre-se do produto de uma “linha” A = (a1 , a2 , · · · , an ) por uma “coluna” B =
b1
 b2 
 .. , ambas com o mesmo número de entradas. Então
 
.
bn

AB = a1 b1 + a2 b2 + · · · + an bn ∈ R.

• se A é uma matriz m × n e B é uma matriz n × p, então o produto AB está definido (a


condição de compatibilidade é que o número de colunas de A seja igual ao número de linhas
de B, ou, em outras palavras, o número de entradas das linhas de A e das colunas de B seja o
mesmo), o resultado é uma matriz C = (cij )m×p na qual a entrada ij é o produto da i-ésima
linha de A pela j-ésima coluna de B.

24
Exercı́cios.

1. Calcule alguns produtos de matrizes de tamanho relativamente pequeno, para se familiarizar


com a regra.

2. Mostre que o produto de matrizes é distribuitivo. Sugestão: faça exemplos com matrizes
pequenas antes.

3. Mostre que o produto de matrizes é associativo. Sugestão: faça exemplos com matrizes
pequenas antes.

4. Dê exemplos de matrizes A e B tais que os produtos AB e BA estejam definidos, mas


AB 6= BA. Ou seja, o produto de matrizes não é comutativo.

5. A matriz identidade In é a matriz quadrada de ordem n (isto é, n × n) na qual as entradas


da diagonal principal são “1” e todas as outras nulas, isto é,
 
1 0 ··· 0
0 1 · · · 0
In =  .. .
 
. . . . .. 
.
0 0 ··· 1

Mostre que In é o elemento neutro da multiplicação de matrizes, ou seja, AIn = A e In B = B


para quaisquer matrizes A e B para as quais estes produtos estejam definidos.

Voltando um pouco à equação linear de uma incógnita ax = b, se a 6= 0, podemos resolvê-la


“isolando” x, multiplcando ambos os lados pelo inverso de a.

Dado que o produto de duas matrizes quadradas n × n é ainda uma matriz quadrada de ordem
n, uma pergunta natural é se um sistema associado a uma matriz quadrada pode ser resolvido
de forma semelhante. Por exemplo, já vimos que sistema 2 ×2,em sua forma matricial pode ser
x
escrito AX = B, onde A2×2 é a matriz dos coeficientes, X = é o vetor das incógnitas e B2×1
y
é o vetor constante. A pergunta acima pode ser reformulada para: existe uma matriz M2×2 tal que
M A = I2 ? Ou ainda, existe uma matriz inversa para A? Em caso afirmativo, multiplicando-se
ambos os lados da equação por M , terı́amos I2 X = M B e, como I2 X = X, terı́amos conseguido
“isolar” o vetor das incógnitas e resolver o sistema.

Para procurar as condições que uma matriz deve satisfazer para que sua inversa exista, vamos antes
definir precisamente o conceito.

Definição. Dada uma matriz quadrada A, dizemos que ela é invertı́vel se existe uma matriz
quadrada de mesma ordem M tal que M A = AM = I, onde I é a matriz identidade da mesma
ordem de A. Nesse caso, M será chamada de inversa de A. Se A é invertı́vel, em geral denotamos
sua inversa por A−1 . Se A não é invertı́vel, então é chamada de singular

Antes de fazermos qualquer conta, vamos ver que, se a inversa existe, então ela é única. Para esta
demonstração, suponha que M e N são ambas inversas para a matriz A. Então,

25
M = IM = (N A)M = N (AM ) = N I = N

ou seja, M = N e a inversa, quando existe, é de fato única.


   
a b x z
Dada uma matriz A = , chame de M = a “candidata” a inversa de A. Sabemos
c d y w
que M deve satisfazer AM = I, isto é,
    
a b x z 1 0
= .
c d y w 0 1

Esta equação pode ser “dividida” em duas, comparando as colunas das matrizes de ambos os lados
da equação. Assim, o que procuramos é resolver simultaneamente as equações
         
a b x 1 a b z 0
= e = ,
c d y 0 c d w 1

ou seja, dois sistemas lineares de duas equações e duas incógnitas com mesma matriz dos coeficientes.
Ora, para isso, podemos fazer um escalonamento simultâneo, escalonando a matriz dos coeficientes
aumentada das duas colunas constantes:
 
a b | 1 0
.
c d | 0 1

Em outras palavras, para encontrar a inversa de A, devemos escalonar a matriz A aumentada da


identidade.

Quanto às condições para a existência da inversa, observe primeiramente que não pode ser a = c = 0.
Pois, caso isso aconteça, então a equação matricial AM = I, de incógnita M , tem solução vazia
(verifique). Assim, devemos ter a 6= 0 ou c 6= 0.

Então, suponha que a 6= 0 e vamos ao escalonamento:

a b 1 0 L1 ←(1/a)L1 1 ab a1 0 L2 ←L2 −cL1


   
−−−−−−−→ −−−−−−−→
c d 0 1 c d 0 1
b 1 b 1
   
1 a a
0 1 a a
0
= .
0 d − bca − ac 1 0 ad−bc
a
− ac 1

Note agora que se ad − bc = det(A) = 0, então o segundo sistema é impossı́vel, indicando a não
existência de A−1 . Vamos supor então que det(A) 6= 0 e vamos continuar o escalonamento:
a
 b 1

L2 ← ad−bc L2 1 a 0
−−−−−−−→ a
c a
0 1 − ad−bc ad−bc

Para o último passo do escalonamento,

26
d −b
 
L1 ←L1 − ab L1
1 0
−−−−−−−→ ac−bd ad−bc .
−c a
0 1 ad−bc ad−bc

   
x z 1 d −b
Isso significa que a solução dos nossos sistemas simultâneos é = .
y w ad − bc −c a

Exercı́cio. Começamos supondo a 6= 0, mas poderı́amos ter começado supondo c 6= 0. Faça as


contas e verifique que, nesse caso, det(A) 6= 0 também seria uma condição necessária para garantir
solução única para os sistemas e a solução seria a mesma. Observe que a condição ad − bc 6= 0
implica a 6= 0 ou c 6= 0; fossem ambos nulos o determinante também seria. Portanto, a condição
det(A) 6= 0 é necessária e suficiente para que os sistemas acimas possuam única solução.

Então, encontramos a inversa de A? Formalmente ainda não: o que encontramos foi uma matriz
M tal que AM = I, mas a definição de matriz inversa diz que, para ser a inversa de A, M deve
satisfazer também M A = I.

Exercı́cio. Verifique que M A = I.

Como conclusão, caracterizamos todas as matrizes 2 × 2 invertı́veis e ainda temos uma fórmula
para calcular a inversa:

Teorema 7.1 Uma matriz A quadrada de ordem invertı́vel se e somente se det(A) 6= 0 e, nesse
2 é 
1 d −b
caso, sua inversa é dada por A−1 = .
det(A) −c a

Por outro lado, olhando para sistemas associados a matrizes singulares, ou seja, a matriz dos
coeficientes satisfaz det(A) = 0, e obrigatoriamente A tem duas linhas múltiplas. Isto implica que
após o escalonamento, a matriz dos coeficientes terá uma linha nula. Ao olharmos para a matriz
aumentada, esta linha pode ser da forma 0 = 0 e o sistema terá infinitas soluções, ou da forma
0 = k, para alguma constante não nula k indicando que o sistema não tem solução.

Observação.
 Se você não conhece, ou não lembra, o determinante de uma matriz 2 × 2 é definido
a b
por det = ad − bc. Esta definição e mais propriedades ainda serão discutidas no texto.
c d

Exemplos.
(
5x − 2y = −19
1. Olhe para o sistema . A matriz dos coeficientes, vamos chamá-la A é
2x + 3y = 0
tal que det(A) = 19 6= 0, portanto o sistema tem única solução. Sua matrizinversa
 é
1 3 2 −19
dada porA−1 = , logo a solução do sistema é dada por X = A−1 =
 −2
  19   5 0
1 3 2 −19 3
= .
19 −2 5 0 −2

27
(  
2x + 3y = 1 2 3 1
2. Já para o caso do sistema , a matriz aumentada , após escalonada
4x + 6y = 2 4 6 2
 
2 3 1
(L2 ← L2 − 2L1 ) fica e a solução do sistema é a solução da sua primeira equação,
0 0 0
isto é uma reta.
3. Se, no sitema do exemplo 2, trocamos a constante da segunda equação de 2 para qualquer
outro número, estamos no caso de solução vazia, pois multiplicar a primeira equação por 2
resulta
 numa equação
 incompatı́vel com a segunda. Em outras palavras, a matriz aumentada
2 3 1
seria , com k 6= 0, indicando solução vazia.
0 0 k

Em resumo, dada uma matriz A quadrada de ordem 2, se det(A) 6= 0, então qualquer sistema que
tem A como matriz dos coeficientes (AX = B) tem solução única dada por X = A−1 B. A solução,
claro, depende do vetor B, mas o fato da solução ser única, não. Por outro lado se det(A) = 0, o
sistema nunca terá solução única: de fato, se det(A) = 0, então as duas linhas são múltiplas e as
equações representam retas com mesma direção no plano. Nesse caso, ou as equações são múltiplas
e representam a mesma reta (que é a solução do sistema, portanto o sitema tem infinitas soluções),
ou as equações representam retas paralelas e o sistema tem solução vazia.

O último parágrafo demonstra o seguinte

Teorema 7.2 O sistema linear AX = B tem solução única (dada por X = A−1 B) se e somente
se det(A) 6= 0.

Observações.

1. É claro que estamos falando de matrizes quadradas, caso contrário o determinante nem estaria
definido. Por enquanto, o que foi demonstrado foi o caso de matrizes 2 × 2, mas o teorema
vale para matrizes de qualquer ordem.
2. Ainda no caso de A2×2 , se B = 0, isto é, no caso do sistema homogêneo AX = 0, já sabemos
que o vetor nulo sempre faz parte da solução e assim a solução de um sistema homogêneo
nunca é vazia. Então, se det(A) 6= 0, o sistema tem o vetor nulo como a única solução. Já
sendo det(A) = 0, a solução é uma reta r que passa pela origem, portanto, se det(A) = 0, o
sistema homogêneo associado a A admite solução não nula (na verdade, infinitas: qualquer
ponto de r que não seja a origem). Em outras palavras, sistemas homogêneos associados a
matrizes quadradas estão divididos em dois grupos: aqueles cuja solução é o conjunto unitário


{ 0 } e aqueles que admitem solução não nula.
3. Veremos que para matrizes quadradas de ordem n, a condição para a existência da inversa é
exatamente a mesma, isto é, uma matriz é invertı́vel se e somente se tem determinante não
nulo; veremos também que o escalonamento nos permite calcular a inversa para matrizes de
qualquer ordem. O resultado para sistemas homogêneos também é o mesmo: ou tem solução


única { 0 }, ou admite solução não nula.

Exercı́cios.

28
1. Pegue alguns exemplos de sistemas 2 × 2 de algum livro do ensino médio e resolva-os por
escalonamento, para se familiarizar com a técnica.

2. Conclua, via escalonamento, que o sistema



3x − y = 5

x+y =2

−2x + y = 1

tem solução vazia. Troque a segunda equação desse sistema por x + y = k, determine k ∈ R

para que o sistema tenha solução e calcule-a.


 
a 1−a
3. Dada a matriz A = , calcule os valores de a para os quais A seja invertı́vel.
3 2a
(
3x − a2 y = 1
4. Mostre que, independente do valor de a, o sistema tem única solução e
2x + y = 0
calcule-a em função de a.

5. Verifique que det(A−1 ) = (det(A))−1 no caso de matrizes 2×2. Também veremos mais adiante
que isso vale para qualquer que seja a ordem da matriz A.

8 Multiplicação de matrizes como movimentos do plano

Já vimos que sistemas de equações lineares de duas equações e duas incógnitas representam in-
terseções de retas em R2 . Mas há um outro modo de vê-los; para tanto, vamos interpretar a
multiplicação de matrizes como funções.
2 2
Uma   2 × 2 A pode ser vista como uma função A : R → R onde a imagem de cada vetor
matriz
x
X= ∈ R2 é o vetor AX ∈ R2 . Muitas vezes uma aplicação desse tipo é chamada de movimento
y
do plano, porque podemos desenhar o vetor X e sua imagem no mesmo plano cartesiano.

Exemplos.
 
0 −1
1. Seja A = . Então, A pode ser vista como aplicação do plano no plano
1 0

A : R2 →  R2 
x −y
7→
y x

Ou seja, trata-se de uma rotação de 90o no sentido positivo (faça desenhos).

29
       
a 0 x ax x
2. Se A = , então o movimento leva qualquer vetor em = a , isto é,
0 a   y ay y
x
multiplica o vetor pelo escalar a.
y
     
1 3 0 1
3. Seja M = e considere o triângulo retângulo ABC, sendo A = , B = e
  1 0 0 0
0 →
− −→ →

C = . Note que M ( 0 ) = M (AA) = 0 (isso vale para qualquer matriz M : a imagem
1    
−→ 1 −→ 0
da origem é sempre a origem). Calculando as imagens dos lados AB = e AC = ,
0 1
temos
    
−→ 1 3 1 1
M (AB) = =
1 0 0 1
e
    
−→ 1 3 0 3
M (AC) = = .
1 0 1 0
−→ −→
Logo, podemos observar que M não preserva ângulos (pois o ângulo entre AB e AC de 90o é
−→ −→
diferente do ângulo entre M (AB) e M (AC), que é 45o .
−→ −→
Tampouco M preserva distâncias: AC tem módulo 1, enquanto M (AC) tem módulo 3.

Exercı́cios (relativos ao exemplo).

(a) Calcule a imagem do terceiro lado do triângulo ABC.


−→ −→  −→ −→ 
(b) Explique porque os ângulos orientados ^(AB, AC) e ^ M (AB), M (AC) têm sinais
contrários.
   
−1/2 0 1
4. Seja M = . Agora defina V1 = , V2 = M V1 , V3 = M V2 e assim por diante,
0 2 1
isto é, Vn = M Vn−1 .

Exercı́cios (relativos ao exemplo).

(a) Calcule e desenhe V3 e V4 .


(b) O que acontece com Vn à medida em que n cresce?
   √ 
cos 30o −sen 30o 1 √1 − 3
5. A matriz R = R30o = = 2 é chamada rotação de 30o no
sen 30o cos 300 3 1
sentido positivo (anti-horário). Convença-se disso fazendo os seguintes cálculos e desenhos.

Exercı́cios (relativos ao exemplo).

30
(a) R preserva normas, isto é, se V é um vetor qualquer de R2 , então k R(V ) k=k V k.
 
a
(b) Tome agora um vetor W = tal que k W k= 1. Verifique que o ângulo (orientado)
b
entre V e R(V ) é 30o .

Esta
 é a formageral da matriz de rotação de um ângulo θ no sentido positivo: Rθ =
cos θ −sen θ
, e sempre preserva distâncias e ângulos.
sen θ cos θ

6. Se det(A) 6= 0, então dado qualquer vetor B ∈ R2 (no contradomı́nio), B tem uma única
pré-imagem, isto é, existe um único vetor X ∈ R2 (domı́nio) tal que AX = B. De fato,
trata-se de um sistema associado a uma matriz invertı́vel, portanto a solução existe e é única.
Diz-se nesse caso que A é sobrejetiva.
 
1 2
7. Isso não acontece para matrizes A com det(A) = 0: para A = , a tentativa de se achar
  1 2
1
uma pré-imagem para o vetor resulta num sistema impossı́vel (verifique). O motivo é
0
que, sendo det(A) = 0 para uma matriz A não nula, então a imagem de A como
 movimento
 do
1 4
plano é uma reta que passa pela origem. Como exemplo, olhe para B = . A imagem
  2 8
x
de B : R2 → R2 é o conjunto dos pontos da forma B , ou seja, os vetores da forma
  y
x + 4y
, ou, em outras palavras, o conjunto dos vetores em que a segunda coordenada é
2x + 8y  
t
o dobro da primeira, ou ainda, a reta r : |t ∈ R
2t

8. Voltando ao caso de matrizes A com det(A) 6= 0, mostraremos que A é injetiva, isto é, se Y
−−→ −→
e Z são pontos distintos no domı́nio, considerados como os vetores OY e OZ, então A(Y ) e
A(Z) serão distintos no contradomı́nio. Para se convencer disso, olhe para o vetor não nulo


Y − Z. Se fosse A(Y ) = A(Z), terı́amos A(Y ) − A(Z) = 0 . Mas isso é o mesmo que dizer
A(Y − Z) = 0, ou seja, que Y − Z é uma solução do sistema homogêneo AX = 0. Ora, como
det(A) 6= 0, esse sistema tem a origem como única solução, ou seja, Y − Z, por ser não nulo,
não pode ser solução. Essa contradição implica A(Y ) 6= A(Z).

Outra maneira de se enunciar a injetividade para matrizes quadradas é que, se det(A) 6= 0 e


V é um vetor não nulo, então AV também é não nulo.

Exercı́cio. Interpretando uma matriz A2×2 como movimento do plano, uma pergunta que poderia
ser feita é a seguinte: existe algum vetor não nulo X ∈ R2 (domı́nio) tal que AX = λX para algum


λ ∈ R? Ou: existe X 6= 0 tal que AX é um múltiplo de X? Dada a matriz A, como você faria
para responder essa questão? Geometricamente, a existência desse vetor significa que o vetor AX,
quando não nulo, tem a mesma direção de X. Por este motivo, a direção determinada por X é
chamada invariante pela multiplicação pela matriz A.

31
Note que já vimos exemplos em que não há direções invariantes (a rotações dos exemplos 1 e 5
acima) e um exemplo onde todas as direções são invariantes (a multiplicação por escalar do exemplo
2). Vamos ver agora um exemplo ainda simples mas com um comportamento diferente.
 
2 0
Seja A = . Uma direção invariante para A é dada por um vetor não nulo V tal que
0 −1  
x
AV = λV , para algum λ ∈ R. Para procuar V , chame-o de V = e note que a condição que
y
deve ser satisfeita, AV = λV , se escreve
   
2x λx
= .
−y λy

A primeira coordenada da equação acima nos diz que ou x = 0 ou λ = 2. Se x = 0, como queremos


V 6= 0, obrigatoriamente tomamos y6=0 e, nesse caso, a segunda coordenada implica   que λ =−1. 
0 0 0
Ou seja, vetores não nulos da forma são levados por A em vetores da forma = (−1) ,
y −y y
o que pode ser verificado diretamente. E, se escolhemos λ = 2, vemos que a segunda equação só
  y = 0. Nesse caso, para garantir V 6= 0, 
fica verdadeira para tomamos
 x 6=
 0.Ou seja, vetores não
x 2x x
nulos da forma são levados por A em vetores da forma = (2) . Portanto, a matriz
  0 0 0
2 0
A = tem exatamente duas direções invariantes, precisamente os eixos x e y. Quando
0 −1
olhamos apenas para as direções invariantes, o movimento definido por A é a multiplicação por um
escalar (2 no caso do eixo x e -1 no caso do eixo y).
 
a 0
Nada mudaria se escrevêssemos, de forma geral, A = : as direções invariantes seriam os
       0 b
x x 0 0
eixos x e y e terı́amos A =a eA =b .
0 0 y y

Exercı́cios.
 
1
1. Determine os valores de x para que o vetor X = represente uma direção invariante da
  x
1 1
matriz A = .
15 3
   
1 3 1
2. O vetor representa uma direção invariante da matriz ?
1 4 0

3. Se M é uma matriz 2 × 2 e ABC é um triângulo em R2 , os pontos M A, M B e M C (obtidos


por multiplicação de matrizes) são necessáriamente vértices de um triângulo? Dê exemplos.
   
2 2
4. Existem duas matrizes 2 × 2 distintas A e B tais que A = B ? Caso negativo,
1 1
demonstre; caso afirmativo, exiba um exemplo.

32
       
0 1 1 0
5. Encontre uma matriz que “transforma” o quadrado de vértices , , e no
0 0 1 1
  √   √   
0 2 1+ 2 1
losango de vértices , , e . Sugestão: a multiplicação por esta matriz
0 0 1 1
      √ 
1 0 1 2
leva os vetores i = ej= respectivamente em U = eV = . Essa matriz
0 1 1 0
é única? Por quê?

6. Seja A uma matriz 2 × 2. Se det A 6= 0, foi mostrado no exemplo 6 que A é sobrejetiva e no


exemplo 8 que A é injetiva.

(a) Suponha A injetiva e mostre que det A 6= 0, isto é, A é injetiva se e somente se det A 6= 0.
(b) Suponha A sobrejetiva e mostre que det A 6= 0, isto é, A é sobrejetiva se e somente se
det A 6= 0.
(c) Conclua que injetividade implica sobrejetividade e reciprocamente.

9 Formas quadáticas em R2

Mas por que procuramos direções invariantes de matrizes? Uma razão é que elas estão associadas
com eixos de simetria de elipses, hipérboles e parábolas, curvas (chamadas cônicas) que podem ser
interpretadas como soluções de equações quadráticas no plano, equações estas que têm coeficientes
definidos por uma certa matriz. Veremos um pouco adiante que as direções invariantes dessa matriz
determinam as direções de simetria da cônica.

Antes de definirmos as cônicas, vamos ver como matrizes definem coeficientes de equações quadráticas.

Definição 9.1 Uma forma quadrática no plano é uma expressão da forma ax2 + bxy + cy 2 , onde
a, b e c são números reais dados, não simultaneamente nulos.

Ou seja, uma forma quadrática no plano é uma função de domı́nio R2 e contradomı́nio R, dada por
uma expressão polinomial em duas variáveis, onde cada parcela tem grau exatamente 2. Para que
a forma seja de fato “quadrática”, exige-se, na definição, a condição de que a, b, c ∈ R não sejam
simultaneamente nulos.

Associamos formas quadráticas e matrizes quadradas de ordem dois escrevendo a forma quadrática
como um produto de matrizes:
  
2 2
 a b1 x
ax + bxy + cy = x y ,
b2 c y

desde que b1 + b2 = b. Para verificar, basta efetuar o produto de matrizes acima.

Assim, a uma forma quadrática está associada uma matriz 2 × 2 tal que os coeficientes de x2 e
y 2 são as entradas da diagonal principal e o coeficiente de xy é a soma das entradas da diagonal
secundária.

33
Na tentativa de representar formas quadráticas por matrizes
 quadradas, há um pequeno problema

a b
a ser contornado. Uma matriz quadrada qualquer A = define uma forma quadrática, mas,
c d
como vimos, a mesma forma quadrática pode estar representada por duas matrizes distintas: basta
que tenham mesma diagonal principal e que as entradas na diagonal secundária tenham a mesma
soma. A maneira mais conveniente de se tratar isso é com matrizes simétricas.

Matrizes simétricas são matrizes quadradas que têm simetria em relação à diagonal principal. Para
t
dizer isto de outra maneira, definimos a transposta de uma matriz Mn×m por ser a matriz Mm×n
que tem como linhas as colunas de M e como colunas as linhas de M , e dizemos que A é simétrica
⇔ At = A.

No caso 2 × 2, as matrizes simétricas são as matrizes cujas entradas da diagonal secundária são
iguais.

Agora podemos identificar o conjunto das formas quadráticas no plano com o conjunto das matrizes
2 2
simétricas
 2 × 2. Cada forma quadrática ax + bxy + cy define uma única matriz simétrica A =
a b/2
e reciprocamente.
b/2 c
2 2
O que faremos agora
 é o seguinte: começaremos estudando equações da forma ax + by = c, ou
 a 0 x
x y = c, ou seja, cuja parte quadrática está definida por uma matriz diagonal
0 b y
(matrizes que têm entradas não nulas somente na diagonal principal); diremos que uma equação
assim está na sua forma normal e veremos todos os casos possı́veis. De maneira geral, a solução de
uma equação deste tipo apresenta simetria em relação aos eixos x e y, que, como já foi visto, são
exatamente as direções invariantes de A.
  
 a b x
Na sequência estudaremos o caso mais geral x y = d (ou ax2 + 2bxy + cy 2 = d)
b c y
procurando pelas direções invariantes da matriz da forma quadrática, que serão também as direções
de simetria da curva solução, reduzindo a equação a uma forma normal.
 
1 3
Exercı́cio. Calcule as duas direções invariantes da matriz a = e mostre que são ortogonais.
3 1

Um pouco mais para a frente, estudaremos o caso mais geral possı́vel de equações quadráticas no
plano, ax2 + bxy + cy 2 + dx + ey = f , também a partir das direções invariantes da matriz da forma
quadrática.

Por enquanto, vamos nos concentrar em soluções de equações em sua forma normal.

10 Cônicas

Vamos estudar equações da forma ax2 + by 2 = c. Antes de mais nada, vejamos alguns

exemplos.

34
1. x2 + y 2 = 1 é a equação do cı́rculo de raio 1 centrado na origem (ou: a solução é o cı́rculo).

2. x2 + y 2 = −4. Claramente temos S = ∅.

3. x2 + y 2 = 0 tem como solução um conjunto unitário: S = {(0, 0)}.

4. Se um dos coeficientes de x2 ou y 2 é nulo, por exemplo, em x2 = 1, temos x = ±1. Lembrando


que nosso ambiente é o plano, a solução é o par de retas paralelas x = 1 e x = −1.

5. No caso anterior, se a constante é nula, a solução é uma reta. Por exemplo x2 = 0 tem como
solução a reta x = 0. E a solução pode ainda ser vazia, como por exemplo, em x2 = −1.

6. Também pode acontecer que a solução seja um par de retas concorrentes, por exemplo, a
equação x2 − y 2 = 0 pode ter seu lado esquerdo fatorado e fica (x − y)(x + y) = 0, cuja
solução é a união das soluções de x − y = 0 e de x + y = 0, ou seja, a união das retas y = x e
y = −x, que se encontram na origem.

Observe que o exemplo 1 acima poderia ter sido apresentado a partir da definição do cı́rculo como
o lugar geométrico dos pontos do plano cuja distância até a origem é 1 e a equação seria uma
consequência dessa propriedade. Os próximos exemplos partem da definição geométrica.

Exemplo: elipse. A elipse é o lugar geométrico dos pontos do plano cuja soma das distâncias a
dois pontos dados (focos) é constante. Ou seja, são dados dois pontos distintos F1 e F2 no plano e
uma constante k > d(F1 , F2 ) (maior que a distância entre os dois focos) e a elipse é o conjunto de
pontos X tais que d(X, F1 ) + d(X, F2 ) = k.

Pense num “compasso para construir elipses”: um pedaço de barbante de comprimento maior que
a distância entre os dois focos, com uma extremidade amarrada em cada foco, num prego ou numa
taxinha, por exemplo. Com o lápis sobre o plano mantendo sempre o barbante esticado, desenhamos
a elipse. As distâncias da ponta do lápis aos focos somam exatamente o comprimento do barbante,
onde quer que a ponta do lápis esteja. Procure figuras ou vı́deos dessa construção na internet.

Para derivar uma equação cuja solução seja uma elipse, localize os focos sobre o eixo x, nos pontos
(−c, 0) e (c, 0) (para c > 0). As interseções da elipse com os raios positivos dos eixos x e y serão
denotadas, respectivamente, pelos pontos (a, 0) e (0, b), de modo que a, b > 0. Desse modo, a
constante (isto é, o tamanho do barbante) é igual a 2a. Note que o ponto (0, b) equidista dos focos,
logo a distância a cada um dos focos é a (a metade do tamanho do barbante) e os números a, b e
c satisfazem uma relação de Pitágoras a2 = b2 + c2 .

35
b

F1 F2 a
0
(c, 0)

Assim, dado um ponto X = (x, y) no plano, ele estará na elipse se e somente se (X, F1 )+d(X, F2 ) =
2a, ou seja,
p p
(x − c)2 + y 2 + (x + c)2 + y 2 = 2a.

Como exercı́cio de manipulação algébrica, mostre (ou leia em algum outro texto) que esta equação
se simplifica em

x2 y 2
+ 2 = 1.
a2 b

A forma acima é a forma normal da elipse, a partir desta equação, usando as simetrias em relação
aos eixos x e y, é possı́vel construir (esboçar) o gráfico da elipse.

Exercı́cio. Equacione a elipse com focos sobre o eixo y e faça um esboço de seu gráfico.

36
Exemplo: hipérbole. A hipérbole é o lugar geométrico dos pontos do plano cuja diferença das
distâncias a dois pontos dados (focos) é constante. Ou seja, são dados dois pontos distintos F1 e
F2 no plano e uma constante 0 < k < d(F1 , F2 ) (menor que a distância entre os dois focos) e a
hipérbole é o conjunto de pontos X tais que |d(X, F1 ) − d(X, F2 )| = k.

Antes de equacionarmos esta curva, pensemos, a exemplo do que fizemos no caso da elipse, num
instrumento para construir arcos de hipérbole no plano. Vá desenhando à medida em que for lendo.
Fixados os focos, suponha que a distância entre eles seja d e pegue um barbante de comprimento
d − k, onde k < d é a constante de definição da hipérbole. Numa régua maior que d, cave uma
fenda central, paralela aos lados maiores da régua, com comprimento d. Fixe uma extremidade da
fenda no primeiro foco de maneira que a fenda possa girar em torno desse foco. Fixe uma ponta do
barbante no segundo foco e a outra ponta na outra extremidade da fenda. Como posição inicial,
coloque a fenda exatamente sobre o segmento que liga os focos. Com o auxı́lio de um lápis estique
o barbante. O lápis marca no papel um ponto P tal que a distância de P até o segundo foco é
d−k
(metade do tamanho do barbante). Concluı́mos que a distância de P ao primeiro foco é k/2.
2
Assim, a diferença entre as distâncias de P aos focos é k. Mantendo o barbante esticado e girando
a fenda em torno do primeiro foco, cada ponto Q do traço marcado pelo lápis também tem esta
propriedade: a diferença das distâncias de Q aos focos é exatamente k. Procure figuras ou vı́deos
na internet para ilustrar. Assim o lápis descreve um arco de hipérbole. Note que existe um outro
arco da curva, que não intercepta o primeiro, desenhado quando repetimos o procedimento fixando
uma extremidade da fenda no segundo foco e girando a fenda em torno dele.

Para deduzir a equação, fixamos os focos nos pontos F1 = (−c, 0) e F2 = (0, c), c > 0. A distância
entre os focos é portanto 2c. Se chamamos o ponto inicial P da construção acima de (a, 0), então,
k = 2a. A equação procurada é portanto |d(X, F1 ) − d(X, F2 )| = 2a, que, elevando ambos os lados
ao quadrado para eliminar o módulo, fica equivalente a
p p
( (x − c)2 + y 2 − (x + c)2 + y 2 )2 = 4a2 .

Como exercı́cio de manipulação algébrica, mostre que esta equação quando simplificada, se escreve
x2 y2
− = 1; chamando b2 = c2 − a2 , chegamos à forma normal da hipérbole (com focos no
a2 c 2 − a2
eixo x),
x2 y 2
− 2 = 1.
a2 b
Note que o gráfico tem simetria em relação aos eixos x e y. Assim, vamos fazer por enquanto um
b√ 2
esboço no primeiro quadrante a partir da equação y = x − a2 , obtida isolando y em função de
a
x quando ambos são positivos e √ x > a. Quando x for muito grande teremos as grandezas x2 − a2
2
e x muito próximas e portanto x2 − a2 muito próximo de x, embora sempre menor que x. Logo
b
o gráfico desta função se aproximará, por baixo, do gráfico da reta y = x. Refletindo este esboço
a
nos eixos x e y, temos o esboço da hipérbole, uma curva com duas componentes conexas, isto é,
b b
dois “pedaços”. As retas y = x e y = − x são chamadas assı́ntotas da hipérbole.
a a
Exercı́cio. Localizando os focos sobre o eixo y, derive a forma normal da hipérbole com focos no
eixo y e faça um esboço de seu gráfico.

37
38
Vimos, até agora oito exemplos de possibilidades de soluções para equações quadráticas da forma
ax2 + by 2 = c, as duas últimas, elipse e hipérbole, são também chamadas de cônicas, por estarem
também definidas como seções de um cone feitas por um plano. Um cone no espaço é gerado pela
rotação de uma reta g em torno de uma reta h, concorrente com g no ponto V . V é chamado vértice
do cone, g é a geratriz e h é o eixo. A elipse é a interseção de um cone com um plano “pouco
inclinado” com relação à geratriz (ou “menos inclinado”) e a hipérbole é a curva resultante de uma
seção do conte por um plano “muito inclinado” (“mais inclinado”). Procure figuras na internet e
confira que a hipérbole tem de fato duas componentes conexas.

Exemplo: parábola. Você deve ter perguntado, com razão, sobre a parábola, já que, muito

provavelmente foi a primeira curva quadrática que você estudou. De fato, a parábola não aparece
nesta forma normal porque as equações deste tipo possuem exatamente dois eixos de simetria
(os eixos coordenados), enquanto a parábola apresenta apenas um. A matriz que define  a forma
a 0
quadrática de uma parábola é da mesma forma dos exemplos 4 e 5 acima: A = , a 6= 0,
0 0
podendo acontecer do valor não nulo aparecer na posição (1, 1) ou (2, 2) da matriz. A diferença é
que a parábola “exige” a presença de um termo linear. Por exemplo, se o coeficiente de x2 é nulo,
então o coeficiente de y não pode ser e se o coeficiente de y 2 é nulo, o coeficiente de x não pode ser.
Formas normais são y = ax2 ou x = ay 2 , com gráficos suficientemente conhecidos.

A exemplo de elipses e hipérboles, a parábola também pode ser definida como um lugar geométrico:
é o lugar geométrico dos pontos do plano que equidistam de um ponto (foco) e uma reta (diretriz)
que não contém o foco. Ou ainda como seção de um cone, por um plano “tão inclinado” quanto
a geratriz. Pesquise como construir parábolas com réguas e barbantes a partir da definição como
lugar geométrico.

Exercı́cio. Para uma parábola, suponha que o foco é o ponto (0, c) e a diretriz é a reta y = −c,
c > 0 e deduza a equação desta curva. Para tanto, você vai ter que pensar como conseguir calcular
a distância de um ponto a uma reta, um exercı́cio importante de geometria analı́tica.

Veremos mais tarde, quando estudarmos a forma geral das equações quadráticas no plano, da forma
ax2 + bxy + cy 2 + dx + ey = f , que os nove tipos de exemplos vistos acima (vazio, ponto, cı́rculo,
elipse, reta, par de paralelas, parábola, par de concorrentes e hipérbole) são todas as possibilidades
para a solução.

11 Mudanças de coordenadas no plano

Até agora temos estudado objetos geométricos do plano a partir de sua representação algébrica,
por exemplo, pontos e vetores estão representados por pares ordenados de números reais, em geral
escritos como colunas. Também já estudamos retas e curvas como soluções de equações. Para
tanto, foi necessário fixar um sistema de coordenadas cartesianas.

Um sistema de coordenadas no plano é um modo de se associar, sem ambiguidade, pontos do plano


a representações algébricas. Um sistema de coordenadas pode não ser cartesiano:

39
Já vimos como definir um sistema de coordenadas na reta, através da escolha de dois pontos A e B
para representar o “0” e o “1”, ou seja, dado pela escolha de um ponto (A) e por um vetor diretor
−→
(AB). Assim, pontos da reta são representados por números reais, e a reta passa a se chamar eixo.

Lembre-se do que é usualmente definido no plano, um sistema Cartesiano, formado por dois eixos
perpendiculares, com origem comum no ponto de interseção, ambos com vetores diretores unitários
tais que o giro do primeiro para o segundo vetor se faz no sentido anti-horário. Pontos e vetores estão
associados (um ponto está associado ao vetor que começa na origem e termina nele) e representados
por matrizes coluna 2 × 1.

Com a mesma ideia de sistemas cartesianos podemos definir coordenadas no plano fixando dois
eixos concorrentes e com mesma origem. Basta escolher um ponto (a origem, em geral denotado
por O) e de um par ordenado de vetores não paralelos {V, W }. Feita esta escolha, os eixos deste
sistema de coordenadas, vamos chamá-los v e w, serão as retas que passam por O e têm vetores
diretores V e W . Isto significa que V define, além da direção do primeiro eixo, sua unidade de
medida e seu sentido positivo, assim como W para o segundo eixo.

Portanto, dado um ponto B no plano, por B existe uma única reta paralela ao eixo w, que corta
o eixo v num ponto P , assim como existe uma única paralela por B ao eixo v, cortando o eixo w
no ponto Q. Note que os pontos P e Q estão unicamente determinados a partir do ponto B. Pela
−−→ −→ −→
regra do paralelogramo para adição de vetores, o que fizemos foi escrever OB = OP + OQ. Como
−→ −→
sabemos que OP é um múltiplo de V e OQ é um múltiplo de W , existem números reais x e y
−−→ −−→
tais que OB = xV + yW , chamados de coordenadas  de B (ou de OB) em relação ao sistema de
x
coordenadas G = {O, {V, W }}. Escrevemos BG = .
y

40
V
P
W

Definições. Alguma nomenclatura agora ajuda a abreviar depois. Um par ordenado de vetores
que pode ser usado para definir coordenadas, ou seja um par ordenado de vetores não paralelos no
plano chama-se base.

Uma base B = {V, W } é chamada de positiva quando o giro de V para W ao longo do menor ângulo
é no sentido positivo ou anti-horário e negativa caso contrário. Quando não há a necessidade de se
explicitar a origem, denotamos AB para as coordenadas do ponto A em relação à base B.

Observe que coordenadas de 


vetores
 na base
 definida
 por eles mesmos são canônicas. Em sı́mbolos,
1 0
se B = {V, W }, temos VB = e WB = .
0 1

Se um vetor pode ser obtido por outros usando somente as operações de adição de vetores e
multiplicação de vetores por escalar, então, aquele é chamado de combinação linear destes. Assim,
determinar as coordenadas de um vetor em relação a uma base é escrevê-lo como combinação linear
dos vetores da base. Como já foi argumentado, essa decomposição é única.

Exemplo. O sistema de coordenadas usual do plano é dado por um ponto O e uma base positiva
formada por dois vetores unitários e perpendiculares. Esta base é em geral denotada por B0 = {i, j}
e é chamada de base usual ou canônica. O vetor i é um gerador do eixo x e j é um gerador do eixo
y. Nesse caso, as projeções paralelas a um eixo são perpendiculares ao outro e de qualquer modo
o que se faz para munir um vetor de coordenadas é decompô-lo como a soma de um múltiplo de i

41
com um múltiplo de j. Em casos onde não há perigo de confusão, não usamos ı́ncice para expressar
coordenadas em relação à base canônica: em vez de escrever UB0 , escrevemos apenas U .
Existem situações nas quais precisaremos (ou desejaremos) trabalhar com dois sistemas de coorde-
nadas simultaneamente, portanto, dado um objeto geométrico, seja um ponto, um vetor, uma reta,
uma cônica, devemos saber relacionar as matrizes ou equações que os representam em sistemas dife-
rentes. Assim, vamos observar um ente geométrico que existe e está bem definido, antes de fixarmos
um sistema de coordenadas para representá-lo algebricamente: um ponto B pode ser representado
por duas matrizes diferentes BB e BC , mas B não muda, o que muda são suas coordenadas.

12 Mudança de base

Vamos considerar, no momento, somente mudanças de base, isto é, fixemos a origem O até que se
diga o contrário. O que define as coordenadas de um vetor num sistema é sua decomposição como
combinação linear dos vetores da base. Assim, dadas as bases usual B0 , que define as coordenadas
usuais (x, y), e B = {V, W }, cujas coordenadas vamos denonimar (x0 , y 0 ), não é difı́cil deduzir a
equação que relaciona as coordenadas de um ponto B em cada uma das bases. Escreva
−−→
OB = xi + yj = x0 V + y 0 W.
   0
x x
Isto significa que X = são as coordenadas de B na base canônica e X 0 = são as
y y0
 B.Vamos
coordenadas de B na base  olhar para esta equação (a segunda) no sistema usual. Seu
1 0 x
lado esquerdo fica x +y = = X. Para a análise do lado direito, vamos considerar a
0 1 y
matriz A = [V, W ], que tem os vetores  V0 e W como colunas. É um exercı́cio de multiplicação de
x
matrizes ver que x0 V + y 0 W = [V, W ] 0 , isto é, o lado direito da equação fica AX 0 . Portanto, a
y
equação que relaciona as coordenadas de um vetor nas bases B0 e B é
X = AX 0 .

A matriz A é chamada de matriz de mudança de base. As colunas de A são uma base para o
plano, logo são vetores não paralelos. Portanto, as colunas de A não podem ser múltiplas e seu
determinante é não nulo. Em outras palavras, A é invertı́vel e qualquer sistema associado a A tem
única solução. Em particular, uma maneira equivalente de escrever a equação de mudança de base
é multiplicar ambos os lados por A−1 à esquerda, obtendo
X 0 = A−1 X.

Exemplos.
   
1 2
1. Sejam V = eW = . Seja A = [V, W ] (colunas) matriz 2 × 2 formada por V e W .
3  −2         
1 2 x + 2y 1 2 x x
Então, xV + yW = x +y = = =A , um exemplo
3 −2 3x − 2y 3 −2 y y
que ilustra que multiplicação de matriz por vetor é uma combinação linear das colunas da
matriz onde os escalares utilizados são as entradas do vetor.

42
   
1 2
2. Seja B = {U, V }, onde U = e V = . Se temos um ponto P do plano cujas
1   1
5
coordenadas na base usual são P = , para calcular PB , usamos a equação de mudança
−1
0 −1
de base.
 Para
 este caso, onde
 temos X e queremos calcular X , usamos PB = A P =
1 1 −2 5 −7
= .
−1 −1 1 −1 6
3. Se um vetor W do plano pode ser decomposto como W  =U − V , onde U e V são os vetores
1
da base do exemplo 2, ou, em outras palavras, WB = , então suas coordenadas na base
    −1  
1 2 1 −1
canônica são dadas por W = AWB = = .
1 1 −1 0
4. Outra pergunta importante é como achar a equação da reta r : 2x − 5y = 12 nas coordenadas
(x0 , y 0 ), definidas pela base B do
 exemplo 2. Basta escrever a equação de r explicitando o pro-
x0
   
 x 0
 1 2
duto de matrizes, r : 2 −5 = 12 e usar X = AX , ou seja, r : 2 −5 ,
y 1 1 y0
que, fazendo as contas, fica r : −3x0 − y 0 = 12.

5. O mesmo raciocı́nio se aplica a uma equação quadrática. Digamos que queremos a equação
3x2 + 4y 2 = 1 no sistema (x0 , y 0 ), ainda considerando
 a base
  do exemplo 2. Escrevendo
 3 0 x
a equação em sua forma matricial, temos x y = 1, ou X t M X = 1, onde
  0 4 y
3 0
. Novamente faremos a substituição X = AX 0 , só que agora,
t

X = x y eM =
0 4
olhando para a equação, precisaremos saber quem é X t . Veremos mais adiante num exercı́cio
que X t = (AX 0 )t = X 0t At , ou seja, a transposta de um produto de matrizes é o produto das
matrizes transpostas, mas em ordem contrária. Assim, substituindo X = AX 0 e X t = X 0t At
0t t
em
 X
t
MX =  1, 
ficamos
 com X A M AX 0 = 1. Calculando o produto de matrizes, At M A =
1 1 3 0 1 2 7 10
= . De maneira que a equação nas coordenadas (x0 , y 0 ) fica
2 1 0 4 1 1 10 16
7x02 + 20x0 y 0 + 16y 02 = 1.

Em tempo: a transposta de uma matriz Am×n é a matriz Atn×m cujas linhas são as colunas de
A (ou, equivalentemente, cujas colunas são as linhas de A).

6. O exemplo anterior serve também para uma observação sobre eixos de simetria. Os exemplos
de cônicas que vimos até agora são da forma ax2 + by 2 = c, que naturalmente têm os eixos
x e y como eixos de simetria. Isto acontece porque, na equação, as variáveis x e y aparecem
com expoente 2 e nenhum outro termo de grau 2 ou 1 aparece. Veja o caso da equação
5x2 + 3y 2 = 17, da qual o ponto P = (1, 2) faz parte da solução. Se refletirmos P no eixo
x, isto é, se trocarmos sua coordenada y de sinal, o ponto resultante Q = (1, −2) ainda faz
parte da solução. O mesmo ocorre com a reflexão de P no eixo y, trocando sua coordenada
x de sinal, resultando em T = (−1, 2). Agora, isto já não é verdade para uma equação
quadrática onde o coeficiente do termo xy seja diferente de 0. De fato, se consideramos a
equação x2 + 2xy + 3y 2 = 6, da qual (1, 1) faz parte da solução, veremos que nem (1, −1) nem
(−1, 1) fazem parte da solução.

43
7. Em ambas as equações do exemplo anterior, tanto 5x2 + 3y 2 = 17, como x2 + 2xy + 3y 2 = 6,
se um ponto faz parte da solução, então ao trocarmos ambas as coordenadas de sinal, o ponto
“oposto” ainda faz parte da solução. Isto significa que ambas têm simetria em relação à
origem. Por causa desta simetria, equações gerais da forma ax2 + bxy + cy 2 = d têm seu
conjunto solução centrado na origem, mas terá os eixos x e y como eixos de simetria se e
somente se o coeficiente b do termo xy for zero. Ou, equivalentemente, se a matriz da forma
quadrática for diagonal.

Exercı́cios. Para os exercı́cios abaixo, considere    B0 a base canônica, que define


a origem Ofixada,
3 2
coordenadas (x, y) e B = {V, W }, onde V = eW = , a base que define coordenadas
1 −1
(x0 , y 0 )
   
2 −1 −→
1. Sejam P = eQ= . Quais são as coordenadas de P Q na base B?
5 −1
 
0 0 3
2. Se U é um vetor cujas coordenadas no sistema (x , y ) são UB = , calcule o ponto final
  2
0
de U , quando seu ponto inicial é o ponto B = . Lembre-se que, na ausência de ı́ndice,
3
as coordenadas são relativas à base canônica.

3. Calcule a interseção das retas r : 2x − 5y = 7 e s : 2x0 − 5y 0 = 7.

4. Qual é a equação do cı́rculo x2 + y 2 = 16 no sistema (x0 , y 0 )?

5. Qual é a equação da curva x02 + y 02 = 4 no sistema usual?

 A uma matriz 2 × 2 cujas colunas são os vetores U1 e U2 . Mostre que a1 U1 + a2 U2 =


6. Sejam
a
A 1 .
a2

7. Sejam M uma matriz 2 × 2 e X um vetor. Mostre que (AX)t = X t At .

8. Se B e C são duas bases quaisquer, definindo, respectivamente as coordenadas (u, v) e (z, w),
estabeleça uma relação entre as coordenadas que elas definem.

9. Suponha que um novo sistema de coordenadas (x0 , y 0 ) é obtido do usual por uma rotação dos
vetores i e j da base canônica de 30o no sentido positivo. Qual é a equação do eixo x nas
novas coordenadas?

13 Eixos de simetria de ax2 + bxy + cy 2 = d

Vamos voltar agora ao problema de estudar as equações quadráticas da forma ax2 + bxy + cy 2 = d,
onde pelo menos um dos coeficientes a, b ou c é não nulo. Já vimos que existe uma e só uma matriz
simétrica que representa esta forma quadrática, obtida escrevendo a equação como

44
  
 a b/2 x
x y = d.
b/2 c y

Primeira pergunta: sempre existem eixos de simetria perpendiculares para o conjunto solução
da equação? Ou, de maneira equivalente, existe um sistema de coordenadas (x0 , y 0 ), com eixos
perpendiculares, no qual a equação da cônica tem o coeficiente de x0 y 0 nulo? Já vimos que este é o
caso se a matriz da forma quadrática é diagonal.

Segunda pergunta: caso exista, como podemos obter tal sistema de coordenadas?

As respostas são respectivamente “sim” e “fácil”; veremos agora como isso pode ser feito.

O próximo resultado é exatamente o que precisamos para estudar tais equações quadráticas (lembre-
se que a, b e c não são simultaneamente nulos):

Teorema 13.1 Dada uma equação da forma ax2 + bxy + cy 2 = d, o conjunto solução da equação
admite um par de eixos de simetria
 perpendiculares.
 Estes eixos são definidos por direções invari-
a b/2
antes da matriz simétrica M = .
b/2 c

Não adianta conhecer esse resultado se não dispusermos de uma técnica para determinar as direções
invariantes de uma matriz simétrica. Os conceitos envolvidos são os autovetores e autovalores da
matriz da forma quadrática, aparecem naturalmente na demonstração do resultado enunciado e
que veremos a seguir.

13.1 Autovetores e autovalores

Façamos uma breve recordação do que é uma direção invariante. Ao interpretarmos M2×2 como um
movimento do plano, isto é, uma função que atua num vetor V , multiplicando V por M à esquerda,

M : R2 → R2
,
V 7→ M V

M V é também um vetor e podemos olhar para a posição relativa dos vetores V e M V observando o
domı́nio e o contradomı́nio sobrepostos (e no sistema usual de coordenadas). Pode acontecer que V
e M V tenham a mesma direção, isto é, V pode ser um vetor não nulo tal que M V seja um múltiplo
do próprio V . Em sı́mbolos, um vetor não nulo V define uma direção invariante de M se existe
um número real λ tal que M V = λV . Nesse caso, V é chamado de autovetor de M associado ao
autovalor λ. Autovetores (autovalores) eventualmente são chamados de vetores (valores) próprios
ou caracterı́sticos da matriz M .

Mas como saber se uma matriz M tem autovalores e autovetores e como calculá-los? A partir da
equação

M V = λV

45
escrevemos

M V − λV = 0.

Observe que o “0” do lado direito da equação é o vetor nulo. Não se pode fatorar V nesta equação,
pois M é uma matriz e λ é um número. Mas, lembrando que a matriz identidade 2 × 2, denotada
I, é o elemento neutro da muliplicação de matrizes (logo IV = V ) e escrevendo

M V − λIV = 0,

agora sim podemos fatorar V ficando com

(M − λI)V = 0.

Interpretando V como incógnita, a equação acima é um sistema linear homogêneo de duas equações
e duas incógnitas que depende de um parâmetro real (λ). Procuramos, para este sistema, uma
solução não nula, já que V deve ser um autovetor.

A condição sobre λ para que o sistema admita soluções não nulas é que det(M − λI) = 0. Caso
contrário, isto é, se o determinante fosse não nulo, o sistema teria solução única e, como sabemos
que o vetor nulo é solução (pois o sistema é homogêneo), seria a única solução.

Assim, estamos procurando λ para que det(M − λI) = 0, ou, equivalentemente, para que o sistema
tenha as duas equações múltiplas. Na prática, isso quer dizer que o sistema dependerá de uma
equação e duas incógnitas, sua solução portanto sendo interpretada como uma reta que passa pela
origem. Todos os vetores desta reta (exceto a origem, claro) serão autovetores associados a λ.
 
2 −2
Exemplo. No caso da matriz A = , a condição para que λ seja um autovalor é
−1 0
det(A − λI) = 0, ou seja,
   
2 −2 1 0
det −λ =0
−1 0 0 1

ou
 
2 − λ −2
det =0
−1 −λ

ou (2 − λ)(−λ) − 2 = 0, ou ainda λ2 − 2λ − 2 = 0, uma equação de segundo grau em λ, chamada


equação caracterı́stica da matriz A. O polinômio (de grau 2) p(λ) = λ2 − 2λ − 2 é o polinômio
caracterı́stico da matriz A. Suas raı́zes, as soluções da equação caracterı́stica, são os autovalores de
A.
 
a b
Exercı́cio. A equação caracterı́stica da matriz é λ2 − (a + d)λ + (ad − bc) = 0.
c d

46
Assim, pensando genericamente, para uma matriz A2×2 qualquer, há três possibilidades: ou não
existem autovalores (o polinômio caracterı́stico não tem raı́zes reais), ou existe um único autovalor
(duas raı́zes reais iguais) ou existem dois autovalores distintos (duas raı́zes reais distintas).

Exercı́cio. Dê exemplos de matrizes 2 × 2 de cada um dos três tipos acima.

Antes de demonstrar o teorema, vamos ver como utilizá-lo.

Exemplo. Vamos estudar a equação 5x2 + 12xy = 1. Na sua forma matricial,


  
 5 6 x
x y = 1.
6 0 y
 
5 6
Pelo que diz o teorema, devemos procurar as direções invariantes de M = , ou seja, temos
6 0 
5−λ 6
que calcular os os autovalores da matriz M : a equação caracterı́stica é det = 0,
6 0−λ
isto é, λ2 − 5λ − 36 = 0, equação que podemos resolver de cabeça e obter as duas raı́zes: λ1 = 9 e
λ2 = −4.
 
x
Para o cálculo dos autovetores associados a λ1 = 9, procuramos soluções não nulas V = do
     y
x 5−9 6 x
sistema (M − 9I) = 0, ou seja, = 0, ou ainda
y 6 0−9 y
(
−4x + 6y = 0
.
6x − 9y = 0

Como era de se esperar, as equações são múltiplas (afinal de contas os valores de λ foram calculados
para isso) e para escrever a solução basta olhar uma delas, por exemplo, dividindo a primeira por
−2, ficamos com 2x − 3y =  0. Isolando
 uma dasincógnitas,
  por  exemplo,
 xem função
 de y,
3y/2 3/2 3
vemos que a solução é S1 = |y ∈ R = y |y ∈ R = y |y ∈ R , a reta
  y 1 2
3
gerada pelo vetor . Qualquer vetor não nulo desta reta é autovetor associado ao autovalor 9,
  2
3
escolhemos V1 = .
2

Para calcular um autovetor associado ao autovalor λ2 = −4, repetimos o processo e resolvemos o


−2
sistema (M −(−4)I)V = 0 e tomar uma solução particular, por exemplo, V2 = . Veremos um
3
pouco adiante que se os autovalores da matriz da forma quadrática são distintos, então as direções
invariantes são automaticamente ortogonais. Sabendo disso, para calcular V2 poderı́amos simples-
mente tomar a única direção perpendicular a V1 em R2 (como basta ser não nulo e perpendicular
a V1 , é fácil escolher V2 ).

Exercı́cio. Verifique, sem resolver o sistema, que V2 e λ2 sao autovetor e autovalor associados da
matriz M .

47
Obtidos os autovetores, vamos considerar uma mudança de base, da base canônica para a base de
autovetores da matriz M . Finalizando o exemplo, vamos escrever a equação 5x2 + 12xy = 1 nas
coordenadas (x0 , y 0 ) definidas pela base {V1 , V2 }.
  
 5 6 x
Para tanto, a partir da equação original x y = 1, escrita como X t M X = 1, e da
6 0 y
equação de mudança de base X = AX 0 , onde A = [V1 , V2 ] (colunas), substituimos X por AX 0
(consequentemente X t por X 0t At ) e ficamos com

X 0t At M AX 0 = 1.

 
t 117 0
Uma simples multiplicação de matrizes nos leva a A M A = , uma matriz diagonal, o
0 −52
que nos diz que a equação procurada é 117x02 −52y 02 = 1, equação de uma hipérbole que já sabemos
x02 y 02
colocar na forma normal − = 1 e consequentemente desenhá-la no sistema (x0 , y 0 ).
1 2 1 2
(√ ) (√ )
117 52
E, como sabemos localizar esse novo sistema a partir do usual, sabemos esboçar a solução da nossa
equação no sistema usual. Um esboço está na próxima figura.

Note que os eixos x0 e y 0 têm direção determinadas pelos autovetores de M e são eixos de simetria
da solução da equação.

13.2 Matrizes ortogonais 2x2

Observação. Para esboçar a curva no sistema (x0 , y 0 ) temos que tomar algum cuidado com a
escala, já que os autovetores V1 e V2 determinam também a unidade de medida dos novoseixos.

V1 1 3
Para contornar esta situação, podemos escolher autovetores unitários W1 = = √ e,
  kV1 k 13 2
V2 1 −2
do mesmo modo, W2 = =√ .
kV2 k 13 3
Nesse caso, além de tornar desnecessário o cuidado com a  mudança
 de escala, a matriz dos autove-
1 3 −2
tores (vamos chamá-la ainda de A), fica [W1 , W2 ] = √ , e o cálculo At M A nos fornece
  13 2 3
9 0
a matriz D = , chamada matriz dos autovalores, donde pode-se imediatamente concluir
0 −4
que a equação, nas novas coordenadas, é 9x02 − 4y 02 = 1.

Assim, há pelo menos duas vantagens em escolhermos autovetores unitários: não mudamos a escala
dos eixos coordenados e, ao fazermos a mudança de coordenadas da equação, já sabemos quem vão
ser os coeficientes de x02 e y 02 : exatamente os autovalores.

Na verdade, matrizes cujas colunas são vetores unitários e ortogonais são particularmente impor-
tantes.

48
49
Definição. Uma base do plano na qual os vetores são unitários e ortogonais é chamada base
ortonormal (“orto” de ortogonal e “normal” de normalizada para que seus módulos sejam 1). Uma
matriz cujas colunas são uma base ortonormal é chamada de matriz ortogonal.

Exercı́cios (propriedades de matrizes ortogonais).

1. Se A é uma matriz ortogonal, então | det A| = 1. A recı́proca é verdadeira? Isto é, se uma
matriz A tem seu determinante valendo 1 ou −1, então ela é ortogonal?

2. Se A é uma matriz ortogonal, então A−1 = At . A recı́proca é verdadeira? Isto é, matrizes
quadradas que satisfazem A−1 = At são ortogonais?

3. Matrizes ortogonais preservam produto escalar. Isto é, se A é uma matriz ortogonal e U e V
são dois vetores quaisquer, então AU · AV = U · V .

Observações (que podem ajudar a resolver os exercı́cios acima).

1. Se A é uma matriz ortogonal e A = [V, W ] (colunas), então V · V = 1, pois V · V = kV k2 = 1


já que V é unitário, e o mesmo vale para W : W · W = 1. E, como V e W são ortogonais,
temos V · W = 0.

2. O produto escalar pode ser escrito como produto de matrizes,


  escrevendo
  o primeiro vetor
u1 v
como linha e o segundo como coluna. De fato, se U = e V = 1 , então
u2 v2
 
 v1
U · V = u1 v1 + u2 v2 = u1 u2 = U t V.
v2

Este modo de escrever o produto escalar nos mostra que uma matriz qualquer M “passa de um
lado para o outro” num produto escalar a partir de sua transposta: (M U ) · V = (M U )t V =
(U t M t )V = U t (M t V ) = U · (M t V ).

Para “sentir” esta propriedade, dê exemplos de uma matriz 2 × 2 M e de vetores U e V ,


calcule M U e M t V e os produtos escalares (M U ) · V e U · (M t V ) e veja que são iguais.

Falta ainda a demonstração do teorema enunciado. O melhor tı́tulo para isso é o seguinte:

13.3 Diagonalização de matrizes simétricas 2 × 2

Passemos agora à demonstração do Teorema. O resultado nos diz que a equação quadrática
X t M X = d admite um sistema cartesiano de coordenadas (x0 , y 0 ) cujos eixos são eixos de si-
metria da solução (ou seja, o coeficiente de x0 y 0 na equação é nulo), dado por direções invariantes
da matriz simétrica M .
 
a b
Então, vamos partir da matriz simétrica M = e encontrar seus autovalores e autovetores.
b c

50
A equação caracterı́stica de M é det(M − λI) = 0, ou (a − λ)(c − λ) − b2 = 0, ou ainda λ2 − (a +
c)λ + ac − b2 = 0. Para resolver esta equação, calculamos o ∆ = (a + c)2 − 4ac + 4b2 . Simplificando,
podemos escrever ∆ = (a − c)2 + (2b)2 , isto é, ∆ é uma soma de quadrados. Assim, certamente
∆ ≥ 0, o que significa que existem autovalores reais.

Façamos separadamente a análise para ∆ = 0e para  ∆ > 0. Se ∆ = 0, então a = c e b = 0. Ora,


a 0
nesse caso, a matriz M já é diagonal: M = . A equação caracterı́stica é (λ − a)2 e a é o
0 a
único autovalor. Todas as direções do plano são direções invariantes de M , em particular os eixos x
e y do sistema usual são eixos de simetria para a equação original (que, nesse caso, é ax2 +ay 2 = d).
Assim, se ∆ = 0, o teorema é válido.

Vejamos agora o que acontece quando ∆ > 0. Nesse caso, a equação caracterı́stica tem duas raı́zes
reais distintas, vamos chamá-las λ1 e λ2 . Escolha autovetores unitários W1 associado a λ1 e W2
associado a λ2 . Vamos mostrar que W1 e W2 são mais que uma base: eles não são apenas não
paralelos, mas são ortogonais.

Ou seja, vamos mostrar que W1 · W2 = 0. Para ver isso, usando a observação 2 acima, podemos
escrever (M W1 ) · W2 = W1 · (M t W2 ), mas, como M é simétrica, temos M t = M , o que nos dá

(M W1 ) · W2 = W1 · (M W2 ).

Mas M W1 = λ1 W1 e M W2 = λ2 W2 , pois são autovetores e autovalores associados. Portanto

(λ1 W1 ) · W2 = W1 · (λ2 W2 ).

Olhando novamente para observação 2 acima, que nos diz que o produto escalar pode ser visto
como produto de matrizes, e usando a propriedade associativa do produto de matrizes, segue

λ1 (W1 · W2 ) = λ2 (W1 · W2 ),

que, passando para o mesmo lado da equação e fatorando, é o mesmo que

(λ1 − λ2 )(W1 · W2 ) = 0.

Ora, λ1 − λ2 6= 0, pois são raı́zes distintas da equação caracterı́stica. Concluı́mos que W1 · W2 = 0 e


que os autovetores são ortogonais. Ou seja, ficou demonstrado para matrizes 2 × 2 (e que também
vale para n × n em geral) o seguinte resultado:

Proposição 13.1 Para matrizes simétricas, autovetores associados a autovalores distintos são or-
togonais.

Assim, conseguimos uma base ortonormal {W1 , W2 } que define eixos x0 e y 0 que devem ser eixos de
simetria para a equação original. Para verificar isto, basta olhar para a equação neste novo sistema
de coordenadas e constatar que o coeficiente de x0 y 0 é nulo.

51
A relação entre as coordenadas
 usuais e asnovas coordenadas é X = AX 0 , onde A = [W1 , W2 ] é a
x0
 
x
matriz dos autovetores, X = e X0 = .
y y0

então, a forma quadrática X t M X, nas novas coordenadas, é escrita

X 0t At M AX.

Como At = A−1 (vide exercı́cio 2 acima), podemos escrever

X 0t A−1 M AX.
 
−1 λ1 0
Afirmamos que A M A = D, onde D = é a matriz (diagonal) dos autovalores. Note
0 λ2
que, uma vez mostrado esse fato, a forma quadrática, nas coordenadas (x0 , y 0 ) fica λ1 x02 + λ2 y 02 ,
donde a equação de fato terá x0 e y 0 como eixos de simetria. Mais ainda, uma vez demonstrado o
teorema, ao calcularmos os autovalores, saberemos imediatamente como será a equação na base de
autovetores.

Mostrar que A−1 M A = D é equivalente a mostrar que M A = AD. O lado esquerdo desta
equação pode ser escrito M [W1 , W2 ]. É um exercı́cio de multiplicação de matrizes ver que M A =
[M W1 , M W2 ] que por sua vez é igual a [λ1 W1 , λ2 W2 ].
 
λ1 0
Já para o lado direito temos AD = [W1 , W2 ] e a partir daqui é um simples exercı́cio de
0 λ2
multiplicação de matrizes ver que AD = [λ1 W1 , λ2 W2 ], concluindo que a igualdade é válida.

O teorema está demonstrado. Uma outra forma de se enunciar os mesmos resultados com outras
palavras é:

Teorema 13.2 Matrizes simétricas são diagonalizáveis por bases ortonormais, isto é, dada uma
matriz simétrica 2 × 2 M , existem matrizes A ortogonal e D diagonal tais que M = ADA−1 .

O leitor pode perguntar se, antes de fazermos a mudança de coordenadas de modo a que a equação
fique numa “forma normal”, se já se sabe que tipo de solução a equação apresenta. Para responder
a esta pergunta, a primeira observação é o fato que existem três tipos de equações resultantes no
sistema (x0 , y 0 ) dado por uma base de autovetores de M . E o tipo da equação depende do produto
dos autovetores, isto é, det D.

Se ambos os autovalores têm mesmo sinal (isto é, det D > 0), então a equação fica λ1 x02 + λ2 y 02 = d
e multiplicando por −1 se necessário, podemos supor os coeficientes de x02 e y 02 ambos positivos e,
consequentemente, a solução depende da constante d: se d > 0, então é uma elipse (admitindo o
cı́rculo como caso particular quando os autovalores são iguais); se d = 0 é um ponto (a origem) e
se d < 0 a solução é vazia. Equações assim são chamadas de tipo elı́ptico.

Já se os autovalores têm sinais opostos (det D < 0), então o mesmo acontece com os coeficientes de
x02 e y 02 na equação e a solução pode ser uma hipérbole, caso d 6= 0 ou um par de retas concorrentes,
caso d = 0. Estas são as de tipo hiperbólico.

52
A última possibilidade, uma equação de tipo parabólico ocorre quando um dos autovalores é zero
(ou det D = 0). Trocando a ordem dos autovalores se necessário, podemos supor λ2 = 0. Nesse
caso a equação assume a forma λ1 x02 = d, ou equivalentemente x02 = d0 (constante), e a solução
pode ser vazia, uma reta ou um par de retas paralelas, caso d < 0, d = 0 e d > 0 respectivamente.

Exemplos de todos os casos acima foram dados na seção “Cônicas”. O que fizemos (a análise
de todas as possibilidades) nos permite concluir que são todos os casos. Observe também que
o raciocı́nio acima nos diz uma vez mais que a parábola não ocorre como solução da equação
ax2 + bxy + cy 2 = d.

Exercı́cio. Na verdade, poderı́amos saber se uma equação é do tipo elı́ptico, hiperbólico ou


parabólico antes mesmo de calcular os autovalores: mostre que det M = det D.

14 Mudança de origem

Continuando no sentido de estudar a forma mais geral de equações quadráticas no plano, precisa-
remos entender mudanças de origem.

Para isso, vamos considerar sistemas de coordenadas com a mesma base - a base usual {i, j} - mas
origens diferentes. Escolha pontos O e Q no plano e defina coordenadas usuais (x, y) do sistema
{O, {i, j}} e (x0 , y 0 ) do sistema {Q, {i, j}}.

Seja B um ponto qualquer do plano. Suas coordenadas em relação à origem O são as coordenadas
−−→ −−→
do vetor OB e em relação à origem Q são as coordenadas de QB. Note que os pontos O, Q e
−−→ −→ −−→
B, a partir da definição de adição de vetores, satisfazem OB = OQ + QB. Esta equação, quando
observada do sistema usual de coordenadas, nos diz

X = Q + X 0,

onde X são as coordenadas do ponto B no sistema usual e X 0 as coordenadas de B em relação


à origem Q. Esta equação relaciona dois sistemas de coordenadas com mesmas bases, mas com
origens distintas.

53
y
y’

Q x’

x
O

Exemplos.

1. Seja Q o ponto (−1, 3) do plano. Sejam (x, y) coordenadas usuais e (x0 , y 0 ) coordenadas em
relação à origem Q. Se B é um ponto do plano, vamos denotar por BQ suas coordenadas em
relação a Q e, como de praxe, quando não houver
  ı́ndice, isto significa que as coordenadas
2
são as do sistema usual. Por exemplo, se B = , para obter BQ basta olhar para a relação
2      
2 −1 3
entre os sistemas de coordenadas e obter BQ = B − Q = − = .
2 3 −1

2. Um cı́rculo de raio 1 e centro Q = (5, 2) tem equação (x − 5)2 + (y − 2)2 = 1. De fato, observe
primeiramente que, nas coordenadas (x0 , y 0 ) definidas pelo sistema {(5, 2), {i, j}}, a equação
deste cı́rculo é x02 + y 02 = 1. Usando X 0 = X − Q, isto é, substituindo x0 = x − 5 e y 0 = y − 2,
obtemos a equação anunciada.

3. A parábola y = 4x2 −6x+1 pode ter seu vértice identificado a partir de um completamento de
3
quadrados: escrevemos y = 4(x2 − x) + 1 e procuramos uma constante positiva k 2 para que
2
3
o trinômio de segundo grau x − x + k 2 seja quadrado perfeito. Fazemos isso comparando-o
2
2
2 2 2 3
com (x − k) = x − 2kx + k , obtendo − x = −2kx. Como esta relação deve valer para
2

54
3 9
todo x, encontramos k = e consequentemente k 2 = . Voltando à equação original da
4 16
parábola, temos

3
y = 4(x2 − x) + 1
2
3
y = 4(x2 − x + k 2 − k 2 ) + 1
2
3 9 9
y = 4(x2 − x + ) − 4 + 1
2 16 16
3 5
y = 4(x − )2 −
4 4

5 3 5
Finalmente, escrevemos esta equação como y + = 4(x − )2 . Ao fazermos y 0 = y + e
4 4 4
0 3 0 02
x = x − , a equação fica numa forma normal y = 4x , cujo vértice é a origem do sistema
4
(x0 , y 0 ).

Para encontrar esta origem Q, basta olharmos para a equação de mudança de origem, X 0 =
2 2
X − Q (note   termos comparado com (x − k) em vez de(x + k) ).
queesteé o motivo por
0
x x − 3/4 3/4
Como temos = , segue que o vértice procurado é Q = .
y0 y − (−5/4) −5/4

15 Equações quadráticas em sua forma geral


Temos agora todas as ferramentas para estudar uma equação quadrática em duas variáveis na sua
forma mais geral: ax2 + bxy + cy 2 + dx + ey = f . A técnica é analisar primeiro a forma quadrática,
fazer uma mudança de base e encontrar um sistema de coordenadas cujos eixos são paralelos aos
eixos de simetria da solução; depois, fazer uma mudança de origem (completando quadrados, por
exemplo) para chegar a um sistema de eixos no qual a equação se escreva em sua forma normal.

Considere, por exemplo, a equação


√ √ 15
14x2 − 4xy + 11y 2 − 6 5x + 18 5y = − .
2
  
 14 −2 x
A forma quadrática desta equação é x y = X t M X. Para achar as direções dos
−2 11 y
eixos de simetria da solução, procuramos os autovetores de M .

A equação caracterı́stica, det(M − λI) − 0 é a equação de segundo grau λ2 − 25λ+ 150 =0, cujas
15 0
raı́zes são λ1 = 15 e λ2 = 10. A matriz dos autovalores é portanto a matriz D = .
0 10

55
  
−1 −2 x
Para calcular os autovetores associados a λ1 = 15, o sistema a ser resolvido é = 0,
    −2 −4 y
−2
cuja solução é a reta de equação x + 2y = 0, isto é, y |y ∈ R , da qual escolhemos o vetor
  1  
−2 1 −2
diretor . Dividindo por seu módulo para torná-lo unitário, obtemos V1 = √ .
1 5 1
Para calcular os autovetores associados a λ2 = 10, podemos resolver o sistema correspondente ou
simplesmente usar o teorema de diagonalização,
  que afirma que são ortogonais a V1 , e obtemos, por
1 1
exemplo, o vetor unitário V2 = √ .
5 2
 
1 −2 1
A matriz dos autovetores é portanto A = √ ; assim já sabemos localizar sistema de
5 1 2
coordenadas (x0 , y 0 ).

y’

x’

V2
V1

Escrevendo a equação original



    
 14 −2 x  x 15
x y + 5 −6 18 =−
−2 11 y y 2

e fazendo a mudança de base X = AX 0 , já vimos que a parte quadrática fica 15x02 + 10y 02 . Assim,
a equação, nas coordenadas (x0 , y 0 ) é

56

   0
02 02
 1 −2 1 x 15
15x + 10y + 5 −6 18 √ 0 =− ,
5 1 2 y 2

15 3
que se simplifica em 15x02 + 10y 02 + 30x0 + 30y 0 = − , ou ainda 3x02 + 2y 02 + 6x0 + 6y 0 = − .
2 2
A segunda mudança de coordenadas é uma mudança de origem, e se faz completando os quadrados.
Não é difı́cil ver que a equação pode ser escrita
9 9 3
3(x02 + 2x0 + 1) − 3 + 2(y 02 + 3y 0 + ) − = − ,
4 2 2

ou ainda
3
3(x0 + 1)2 + 2(y 0 + )2 = 6.
2
0
!
 00 
x x + 1
Fazendo a mudança de origem = 3 e comparando com X 00 = X 0 − Q, onde o ponto
y 00 y0 +
2
Q é a!origem do sistema (x00 , y 00 ), concluimos que as coordenadas do ponto Q no sistema (x0 , y 0 ) são
−1
3 . Assim, sabemos localizar o sistema (x00 , y 00 ) no sistema (x0 , y 0 ), marcando as coordenadas

2
da origem Q do sistema (x00 , y 00 ), nos eixos x0 e y 0 .
x002 y 002
Note que agora, a equação tem uma forma normal: 3x002 +2y 002 = 6, que é equivalente a + =
√ 2
√ 3
1, equação de uma elipse que corta o eixo x00 nos pontos ± 2 e o eixo y 00 nos pontos ± 3.

Juntando as peças, conseguimos localizar a elipse no sistema origial de coordenadas.

16 Mais exercı́cios
1. Seja {U, V } uma base do plano. Mostre que {U + V, U − V } também é base. Em geral,
determine a condição sobre a, b, c, d ∈ R para que {aU + bV, cU + dW } também seja base do
plano.
 
1
2. Escreva os vetores da base canônica do plano como combinação linear dos vetores e
  2
2
.
1
3. Qual é a equação da reta r : 8y − 3x = 2 nas coordenadas (x0 , y 0 ) dadas pela base {j, −i}? (i
e j são os vetores da base canônica).
 
0 1 1
4. Considere a mudança de base X = AX , onde A = e X são coordenadas usuais. Os
    1 2
0 3 −1
vetores cujas coordenadas no sistema X são e são ortogonais?
1 3

57
58
5. Na base canônica, a condição algébrica que determina paralelismo de vetores é: U e V são
paralelos se e somente se V = αU para algum α ∈ R. Numa base qualquer {W1 , W2 } esta
condição também é verdadeira?

6. Seja R a rotação de 45o no sentido positivo. Qual é a equação da parábola x2 = 2y no sistema


(x0 , y 0 ) dado pela base {Ri, −(Rj)}?

7. Quando giramos a hipérbole de equação 2x2 − y 2 = 1 de 60o no sentido negativo, obtemos a


curva h. Qual é a equação de h?

8. A elipse E é tangente interiormente à circunferência x2 + y 2 = 16, tangente exteriormente


à circunferência x2 + y 2 = 1 e tem focos sobre a reta y = x. Faça esboços das situações e
determine a equação de E nos seguintes casos:

(a) E tem dois pontos de tangência com cada uma das circunferências.
(b) E tem um ponto de tangência com cada uma das circunferências.

9. Uma hipérbole passa pela origem do sistema de coordenadas e tem como assı́ntotas as retas
x = 4 e y = −2. Qual é sua equação?

10. Faça mudanças de origem de modo que a equação fique puramente quadrática e esboce o
gráfico de sua solução para:

(a) 2x2 + 3y 2 − 8x − 6y + 11 = 0.
(b) 4x2 − 3y 2 + 8x + 12y − 8 = 0.

11. Faça mudanças de base para que a equação tenha a forma quadrática representada por uma
matriz diagonal (isto é, de modo que o coeficiente de x0 y 0 seja nulo) e esboce o gráfico da
solução para:

(a) x2 + 4xy + 4y 2 − 9 = 0.
(b) 2xy − 3y 2 = 5.

12. Para cada uma das equações abaixo, faça mudanças de coordenadas adequadas para trans-
formá-la numa forma normal e esboce o gráfico da solução.

(a) 2x2 − 4xy − y 2 + 20x − 2y + 17 = 0.


(b) 7x2 − 8xy + y 2 − 2x − 4y = 1.
(c) x2 + 2xy + y 2 − 4x + 1 = 0.
(d) 3x2 + 10xy + 3y 2 − 2x − 14y − 5 = 0.
(e) 12x2 + 24xy + 19y 2 − 12x − 40y + 31 = 0.
(f) x2 + 2xy + 5y 2 − 4x + 6y = 3 = 0.
(g) x2 + 2xy + y 2 + 2x − 4y + 1 = 0.
√ √
(h) x2 + 2xy 3 + 3y 2 + 2x 3 − 2y = 0.

13. Exercı́cios 6.3 do livro do Reginaldo.

59
17 Geometria Analı́tica Espacial

Vamos estudar nesta seção retas e planos no espaço, como representá-los algebricamente, suas
posições relativas, paralelismo e perpendicurarismo, interseções, ângulos e distâncias, e um pouco
de álgebra linear em dimensão três, em particular, sistemas de equações lineares com três incógnitas
que aparecem como modelos de diversos problemas geométricos e, embora ainda sem um tratamento
sistemático, não devemos hesitar em resolvê-los e interpretá-los.

17.1 Alguns fatos básicos de Geometria Euclidiana espacial

É preciso recordar alguns fatos da Geometria Euclidiana para que, com maior familiaridade, pos-
samos trabalhar com mais desenvoltura.

1. Dois pontos distintos no espaço determinam uma única reta. Retas em geral serão denotadas
por letras minúsculas do nosso alfabeto, por exemplo, r, s.

2. Três pontos não colineares no plano determinam um único plano. Planos serão denotados
por letras minúsculas gregas, como α, γ, π.

3. Se um plano contém dois pontos de uma reta, então ele contém todos os pontos daquela reta.

4. Dadas duas retas, elas podem ser coplanares (e, neste caso, são paralelas ou concorrentes)
ou não coplanares (chamadas de reversas). Um exemplo de retas reversas são arestas não
paralelas de faces opostas de um cubo.

5. Dados uma reta r e um ponto P , por P passa uma única reta paralela a r. Em geometria
plana, isto é um aximoma. Em geometria espacial não, mas não vem ao caso demonstrá-
lo neste curso. O leitor mais curioso pode ler o livro do Paulo Cezar Pinto Carvalho de
Geometria Espacial para detalhes.

Observação. Há outros modos possı́veis de se determinar um plano no espaço, reduzindo


cada caso à escolha de três pontos não colineares:

(a) Uma reta e um ponto fora dela. De fato, tome dois pontos distintos da reta e o ponto
fora dela; temos aı́ três pontos não colineares, logo um plano. Este plano, é claro, contém
a reta e o ponto dados.
(b) Duas retas concorrentes. De fato, tome o ponto de interseção e um ponto (distinto dele)
em cada reta; temos aı́ três pontos não colineares, logo um plano. Este plano contém
ambas as retas.
(c) Duas retas paralelas. Dadas duas paralelas, digamos r e s, tome um ponto A ∈ r e
B, C ∈ s, com B e C distintos; temos aı́ três pontos não colineares e portanto um plano
α. Este plano, é claro, contém s; para ver que também contém r, basta lembrar que, em
α, existe uma única reta por A e paralela a s. Esta reta tem que ser r, pois r é a única
reta do espaço que contém A e é paralela a s.

60
Observação. Estes modos de ser determinar um plano são intrı́nsecos, isto é, dependem de
objetos (retas e/ou pontos) contidos no plano.

Os próximos fatos também nos serão muito importantes, mas antes é necessário pensarmos
um pouco no que vem a ser o ângulo entre duas retas no espaço. Se as retas em questão são
coplanares, então ou são paralelas e o ângulo entre elas é zero, ou são concorrentes e definimos
o ângulo entre elas como sendo o menor dos dois formados; caso sejam iguais, ambos são retos
e as retas são perpendiculares. Se as retas, digamos r e s, não são coplanares, então escolha
um ponto qualquer P do espaço e por ali trace r0 paralela a r e s0 paralela a s. As retas r0 e
s0 são concorrentes (não são iguais porque r e s não são paralelas). Definimos o ângulo entre
r e s como sendo o ângulo entre r0 e s0 .

Exercı́cio. Escolha um ponto Q 6= P e por ali tome r00 e s00 paralelas a r e s respectivamente.
Mostre que ](r0 , s0 ) = ](r00 , s00 ), isto é, a definição de ângulo entre duas retas reversas não
depende do ponto escolhido para traçar as parelelas.

Voltemos aos fatos.

6. Duas retas paralelas a uma terceira são paralelas entre si.

7. A definição de perpendicularismo entre uma reta e um plano é a seguinte: dizemos que a reta
r é perpendicular ao plano α (e denotamos r ⊥ α) se r é ortogonal a todas as retas de α.
O fato que interessa aqui é: se uma reta é ortogonal a duas retas concorrentes de um plano,
então é ortogonal a todas as retas daquele plano, logo perpendicular ao plano.

Observação. A palavra “perpendicular” é reservada a objetos que se encontram, já a palavra


“ortogonal” pode ser usada em qualquer situação. Por exemplo, retas reversas podem ser
ortogonais, mas não perpendiculares.

8. Dados uma reta r e um ponto P , por P existe um único plano perpendicular a r.

9. Dados um plano π e um ponto P , por P existe uma única reta perpendicular a π.

Observação. Assim, uma outra maneira de se determinar um plano é por um ponto por
onde passa o plano e uma reta perpendicular ao plano. Não é intrı́nseco, já que necessita de
uma reta perpendicular, ou seja, um objeto que não está no plano.

Relembrando mais alguns fatos:

10. Duas retas perpendiculares a um mesmo plano são paralelas.

11. Dois planos perpendiculares a uma mesma reta são paralelos (dois planos são paralelos se não
se encontram).

12. Dois planos não paralelos se interceptam segundo uma reta. Em outras palavras, se a in-
terseção de dois planos distintos contém um ponto, então contém mais um, sendo sua in-
terseção exatamente a reta determinada por estes dois pontos.

61
13. Dizemos que dois planos são perpendiculares se o ângulo entre eles é 90o . Para caracterizar
esse fato, usamos a unicidade da direção perpendicular a um plano. Mais precisamente, dados
os planos π1 e π2 , tome r1 reta perpendicular a π1 e r2 perpendicular a π2 . Então π1 e π2 são
perpendiculares se e somente se r1 e r2 são ortogonais. Este fato não depende da escolha das
retas, pois quaisquer retas perpendiculares a π1 e π2 são respectivamente paralelas a r1 e r2 .

17.2 Pontos e vetores em R3

Vamos fixar um sistema de coordenadas cartesianas no espaço, um modo de associar a um ponto


do espaço uma tripla ordenada de números reais. Em analogia com o que se fez no plano, tome
três eixos, dois a dois perpendiculares, com origem comum no ponto de interseção e com mesma
unidade de medida. Cheme-os de eixos x, y e z e oriente-os de modo que o giro do raio positivo do
eixo x para o raio positivo do eixo y seja no sentido positivo (anti-horário), o mesmo acontecendo
com os giros do raio positivo do eixo y ao raio positivo do eixo z e do raio positivo do eixo z ao
raio positivo do eixo x. O espaço munido de um sistema cartesiano de coordenadas recebe o nome
de R3 .
incluir desenho

Os planos determinados pelos pares de eixos xy, yz e xz são chamados planos coordenados. Dado
um ponto B no espaço, por B existe uma única
  reta perpendicular ao plano xy, esta reta intercepta
a
o plano xy num ponto, digamos Q. Sejam as coordenadas do ponto Q no plano xy. Por B
b
passa um único plano perpendicular ao eixo z, este plano intercepta o eixo z num ponto, digamos
M . O ponto M definenoeixo z um número real c. Assim ficam definidas as coordenadas do ponto
a
B e escrevemos B =  b .
c

Se, por um lado, um ponto define uma tripla ordenada de números reais de maneira única, recipro-
camente uma tripla ordenada de números reais define exatamente um ponto.

O conceito de vetor no espaço é o mesmo já estudado no plano, o que muda agora é o ambiente.
Um vetor no espaço é um segmento orientado, definido por seu comprimento (módulo ou norma),
direção e sentido. A adição de vetores e a multiplicação de vetor por escalar têm exatamente as
mesmas definições geométricas que havia no plano, inclusive vale também no espaço a regra do
paralelogramo para a adição. A exemplo do que acontecia no plano, as coordenadas de um vetor
do espaço são as coordenadas de seu ponto final quando tomamos um representante que começa na
origem do sistema. Ou seja matrizes 3 × 1 representam tanto pontos como vetores.
−→
Exatamente como foi feito para vetores no plano, algebricamente podemos escrever AB = B − A,
isto é, as coordenadas de um vetor são a diferença entre as coordenadas de seu ponto final e as
coordenadas do seu ponto inicial.

As operações lineares (adição e multiplicação por escalar) são compatı́veis, em coordenadas, com
as mesmas operações entre as matrizes (colunas 3 × 1) que representam os vetores, isto é, definidas
entrada a entrada da matriz. E daqui podemos concluir que dois vetores são paralelos (isto é, têm

62
mesma direção) se e somente se são múltiplos escalares. Como o vetor nulo é múltiplo escalar de


todos os outros, 0 é paralelo a todos os vetores.

O módulo de um vetor pode ser agora calculado usando-se duas vezes Teorema de Pitágoras: com a
−−→
mesma nomenclatura do primeiro pagrágrafo, suponha que o V = OB, onde O é a origem. Então,
−−→ −→
por Pitágoras temos kOBk2 = kOQk2 + c2 e, usando Pitágoras novamente, desta vez no plano xy,
−−→
segue kOBk2 = a2 + b2 + c2 .
incluir desenho

O produto escalar também tem a mesma definição: Se V e W são vetores de R3 , então V · W =


kV kkW k cos θ, onde θ é o ângulo entre V e W , que varia entre 0 e 180o . Assim, V · W = 0 ocorre
exatamente quando um deles é o vetor nulo ou, quando ambos são não nulos, θ = 90o . Com a
convenção que o vetor nulo é ortogonal a todos os vetores, podemos dizer que dois vetores são
ortogonais se e somente se o produto escalar entre eles é zero. O mesmo argumento usado quando
t
o ambiente era o plano, a Lei dos Cossenos, permiteconcluir
  coordenadas, V · W = V W
que,em
1 2
(como produto de matrizes). Por exemplo, Se V = 2 e W = 1, então
3 2
     
1 2  2
V · W = 2 · 1 = 1 2 3 1 = (1)(2) + (2)(1) + (3)(2) = 10.
   
3 2 2

Vale lembrar que podemos escrever, para qualquer vetor V ∈ R3 , kV k2 = V · V .

17.3 Retas e planos no espaço

Retas no espaço são determinadas por dois pontos distintos. Equivalentemente, por um ponto e
um vetor diretor não nulo. Assim, da mesma forma que no plano, a representação paramétrica
para uma reta no espaço tem a forma r : A + tV, t ∈ R, onde A é um ponto e V um vetor diretor.
Lembre-se que uma parametrização é um sistema de coordenadas, isto é, torna a reta um eixo, com
origem em A, unidade de medida kV k e sentido positivo dado pelo sentido de V .
     
3 2 3 + 2t
Por exemplo, Se A = −1 e V = −2, temos r : −1 − 2t. Podemos então interpretar a
−6 3 3t − 6
3
reta r como
 imagem  de uma função P : R → R , onde a variável independente é o parâmetro t:
3 + 2t
P (t) = −1 − 2t. Dizemos que o ponto P (t) é o ponto genérico de r.
3t − 6

Assim,
  é fácil escolher pontos de r além deA: escolha
 valores para t. Se t = 1, temos P (1) =
5 −5
−3 ∈ r e para t = −4, temos P (−4) =  7  ∈ r.
−3 −18

63
Também é fácil decidir se um ponto está ou não em 
r. Trata-se
 de resolver um sistema de três
−1
equações e uma incógnita. Por exemplo, o ponto B =  3  pertence à reta r porque o sistema
−12
P (t) = B tem solução: de fato,

3 + 2t = −1

−1 − 2t = 3

3t − 6 = −12

 
7
tem solução única t = −2, portanto B = P (−2) ∈ r. Já para o ponto C = −5, o sistema
2
P (t) = C fica

3 + 2t = 7

−1 − 2t = −5 ,

3t − 6 = 2

que não tem solução, pois, para satisfazer as duas primeiras equações deverı́amos ter t = 2, mas
para a terceira teria de ser t = 8/3. Assim, C 6∈ r.

Se, em duas parametrizações, observamos que as retas têm vetores diretores múltiplos, então são
paralelas ou iguais. Para decidir, escolha um ponto de uma e verifique se pertence ou não à outra.
No primeiro caso são iguais, no último, são paralelas.

Outra maneira de se interpretar a representação paramétrica de r : A + tV , t ∈ R, chamada de


equação paramétrica de r, é dizer que um ponto X do espaço pertence à reta r se e somente se
−−→
X = A + tV , o que é o mesmo que X − A = tV , ou ainda AX = tV , ou seja,
−−→
X ∈ r ⇔ AX é um múltiplo do vetor diretor V .

Exercı́cio. Dê exemplos de parametrizações diferentes para a mesma reta e dê exemplos de para-
metrizações para duas retas paralelas.

Já planos no espaço podem ser determinados por duas maneiras. Uma é intrı́nseca, que sempre leva
a três pontos não colineares, que, em álgebra vetorial equivale a um ponto e dois vetores diretores
não paralelos. A outra, a partir de um ponto e uma reta perpendicular, equivale a um ponto e um
vetor normal.

Considere o plano π determinado por um ponto A e dois vetores não paralelos V e W . Como
já foi visto na seção 12, estes objetos determinam um sistema de coordenadas para o plano, o
que, por sua vez, é exatamente a representação paramétrica deste plano no espaço. Escrevemos
π : A + µV + γW , µ, γ ∈ R. Assim, se X é um ponto genérico do espaço, este ponto pertence a π
−−→
se e somente se AX é uma combinação linear dos vetores V e W . Analogamente ao que foi visto
há pouco para retas, esta maneira de se representar parametricamente o plano, isto é, dizer que

64
−−→
X ∈ π se e somente se existem escalares µ e γ tais que AX = µV + γW , pode ser chamada de
equação paramétrica do plano e também podemos escrever X = A + µV + γW , µ, γ ∈ R.
     
4 1 2
Se, por exemplo, A =  0 , V = −1 e W = 1, o ponto genérico do plano é dado
 −1  3 2
4 + µ + 2γ
por P (µ, γ) =  γ − µ , o plano sendo interpretado como imagem de uma função cujas
3µ + 2γ − 1
variáveis independentes são os parâmetros µ e γ e o contradomı́nio é o espaço R3 . É claro que
temos A = P (0, 0).

É fácil produzir outros exemplos de pontos


emπ, bastando escolher valores para µ e γ. Por exemplo,
9
para µ = −1 e γ = 3, temos P (−1, 3) = 4 ∈ π.
2

Decidir se um certo ponto B está ou não


 no  plano π é modelado por um sistema de três equações
8
e duas incógnitas. Por exemplo, B = −1 pertence a π pois o sistema P (µ, γ) = B,
7

4 + µ + 2γ = 8

γ − µ = −1 ,

3µ + 2γ − 1 = 7

 
7
tem solução única (µ, γ) = (2, 1), logo B = P (2, 1). Mas o ponto C = 7 não pertence a π pois
4
o sistema

4 + µ + 2γ = 7

γ−µ=7

3µ + 2γ − 1 = 4

não tem solução. Isto pode ser observado a partir da solução do subsistema 2x2 formado pela
primeira e pela terceira equações, que tem solução (µ, γ) = (1, 1), mas a substituição de µ = 1 e
λ = 1 na segunda equação torna-a falsa.

Se um plano β é dado por uma representação paramétrica da qual conhecemos a forma geral,
podemos reconhecer o pontoe os dois vetores diretores que definem esta parametrização: por
2 − 2t + s
exemplo, se β :  t − 2s − 1, t, s ∈ R, podemos escrever o ponto genérico como soma de três
1 + 4s
matrizes coluna, observando os coeficientes constantes (o ponto), e os coeficientes dos parâmetros
t e s (os vetores diretores). Assim,

65
     
2 −2 1
β : −1 + t 1 + s −2 , t, s ∈ R.
    
1 0 4

A outra forma de se determinar um plano, a partir de um ponto e de uma direção perpendicular


(ou seja, um ponto e um vetor normal não nulo), dá origem à equação geral do plano. A dedução
é bem simples. Sejam A um ponto e N um vetor normal que determinam o plano π. Então, um
−−→
ponto genérico X pertence a π se e somente se os vetores AX e N são perpendiculares. Ou seja,
−−→
X ∈ π ⇔ AX · N = 0, chamada equação geral de π.

Pela maneira que foi construı́da, vê-se que a equação geral do plano é única, a menos de multi-
plicação por um escalar não nulo.
       
−1 2 x x+1
−−→ −−→
Se, por exemplo, A = −1 e N = −2, sendo X = y , temos AX = y + 1 e AX ·N = 0
3 3 z z−3
se escreve 2(x + 1) − 2(y + 1) + 3(z − 3) = 0, ou ainda 2x − 2y + 3z = 9, que é a equação geral de
π. Daqui já se nota que os coeficientes de x, y e z na equação geral do plano são as coordenadas
de seu vetor normal.

Assim, outra maneira de se escrever a equação de π é dizer que ela é da forma 2x − 2y + 3z = d,


já que sabemos quem são os coeficientes, e calcular a constante d exigindo-se que a equação seja
satisfeita para o ponto A, ou seja, d = 2(−1) − 2(−1) + 3(3) = 9.
 
a
Esta observação é geral: se um plano tem vetor normal N =  b , então sua equação geral é
c
ax + by + cz = d, bastando, para determinar d, saber um ponto pelo qual ele passa.

Para produzir outros pontos do plano π a partir de sua equação, basta tomar coordenadas que
satisfazem a equação. Por exemplo,
  se queremos saber sua interseção com o eixo z, tomamos
0
x = y = 0 e vemos que o ponto 0 ∈ π. E, claro, para verificar se um ponto dado está ou não
3
em π, basta verificar se suas coordenadas satisfazem a equação.

Observações.

1. Ao contrário do que acontece quando o ambiente é R2 , em R3 retas não são dadas por uma
equação. O motivo é que, no plano, dado um ponto e um vetor não nulo (normal), existe uma
única reta que passa pelo ponto e tem direção perpendicular ao vetor dado, mas, no espaço,
existem muitas.

2. Se dois planos distintos têm vetores normais paralelos, então sua interseção é vazia: são
paralelos. Já se os vetores normais são não paralelos, encontram-se numa reta.

3. Dois planos são perpendiculares se e somente se têm vetores normais perpendiculares.

66
Suponha que temos dois planos com vetores normais não paralelos. Então sua interseção - uma
reta - é a solução de um sistema de duas equações e três incógnitas. Por exemplo, os planos
π1 : 3x + 2y + z = 4 e π2 : x − y + z = −1 têm interseção dada pela solução do sistema
(
3x + 2y + z = 4
.
x − y + z = −1

Para resolver, some a primeira linha com o dobro da segunda para obter 5x + 3z = 2. Escrevendo
2 − 3z
x em função de z, temos x = .
5
2 − 3z
Substituindo na segunda equação ficamos com − y + z = −1 e isolando y em função de z
5
7 + 2z
temos .
5
Interpretando z como parâmetro livre,
 



 2 3z 

 5 
 

 7 + 2z 
π1 ∩ π2 =   | z∈R ,

  5  

 
 z 

   
2/5 −3/5
que é a reta que passa pelo ponto 7/5 e tem vetor diretor  2/5 .
0 1

É importante saber como, a partir de um plano dado por sua equação, escrever uma representação
paramétrica para ele e vice-versa.

Como exemplo, vamos olhar para a equação do plano π : 2x − 2y + 3z = 9 acima e resolvê-la,


isto é, escrever uma das incógnitas em função das outras duas. Escolhendo
 isolar z, ficamos
 com
x
2 2 y
z = 3 − x + y, e o plano π é o conjunto de pontos do plano da forma  , x, y ∈ R.
 
3 3 2 2
3− x+ y
 3 3
0
Os parâmetros livres são x e y e, podemos identificar facilmente o ponto 0 e os dois vetores
3
   
1 0
 0  1
diretores   e   desta representação paramétrica do plano π.
2 2

3 3
Mais uma vez observamos que a representação paramétrica não é única: pelo menos mais duas são
naturais; no exemplo acima poderı́amos ter isolado x ou y como variável dependente.

A pergunta recı́proca, de chegar a equação geral do plano a partir de uma representação paramétrica
pode ser respondida como segue. Suponha que π : A + tV + sW , t, s ∈ R. A única coisa que

67
precisamos é determinar um vetor normal N , o que se faz exigindo que N seja simultaneamente
perpendicular aos vetores não paralelos V e W . Isto pode ser conseguido resolvendo-se um sistema
 
1
de duas equações e três incógnitas. Para ilustrar esta ideia, um exemplo numérico: se V = 2 e

    3
2 a
W = −1, procuramos um vetor normal N =  b  cujo produto escalar com V e com W seja
−1 c
zero, isto é,
(
a + 2b + c = 0 (I)
,
2a − b − c = 0 (II)

que pode ser resolvido somando-se I e II, obtendo 3a + b = 0, ou b = −3a, e substituindo em uma
das equações, digamos em II, ficando
 com 2a + 3a − c = 0 ou c  = 5a. Assim, todos os vetores
a 1
normais a π são da forma −3a, para a 6= 0. Escolhendo N = −3, a equação de π será da
5a 5
forma x − 3y + 5z = d, e a constante d está determinada pelo fato que o ponto A pertence ao plano.

Observação. Há na verdade uma maneira mais rápida de se produzir um vetor N que seja
simultaneamente perpendicular a dois vetores não paralelos V e W . Veremos que, além de facilitar
a passagem de uma representação paramétrica para a equação geral de um plano, há outras situações
onde uma “fábrica de vetores normais” será útil. Isto será feito na próxima seção, com a definição
de produto vetorial entre V e W . Antes, porém, é conveniente pensarmos um pouco mais em retas
e planos no espaço.

Exemplos e exercı́cios. Quando você ler um enunciado, pode ser que ele esteja comentado (no
caso dos exemplos), pode ser que ele esteja proposto como exercı́cio.
 
1
1. Determine a representação paramétrica da reta que passa pelos pontos A = 2 e B =

  3
4
−1;
−1
2. Determine a equação geral e uma representação paramétrica do plano que passa pelos pontos
A e B do exercı́cio anterior e pela origem.

3. 
Determine
 a equação geral do plano paralelo ao do exercı́cio anterior e que passa por C =
7
2.
0
4. Talvez a melhor maneira de se estudar a interseção de uma reta com um plano seja exigir
que as coordenadas de um ponto genérico da reta satisfaça a equação geral do plano. Sejam

68
 
1+t
r : P (t) = 2t − 1 e π : x − 2y + 3z + 9 = 0. Analisamos r ∩ π através da equação
5t
(1 + t) − 2(2t − 1) + 3(5t) + 9 = 0, que,
 simplificando,
 12t + 12= 0, cuja solução é t = −1.
fica 
0 1+µ
Isto nos diz que r ∩ π = P (−1) = −3 . Já a reta u :
   2µ  tem sua interseção com π
−5 2+µ
calculada por (1 + µ) − 2(2µ) + 3(2 + µ) + 9 = 0, que é equivalente a 16 = 0, o que é falso
e implica que a equação não tem solução (isto é, que u é paralela a π. Esta situação, do
coeficiente de µ ser zero, ocorre precisamente quando o vetor diretor da reta e o vetor normal
do plano são perpendiculares, pois o coeficiente de µ na equação da interseção de u e π é
exatamente o produto escalar entre o vetor diretor de u e o vetor normal a π.
5. Considerando o plano π e as retas r e u do item anterior:
(a) Dê exemplo de uma reta paralela a u e contida em π.
(b) Dê exemplo de uma reta reversa a u e contida em π.
(c) Dê exemplo de um plano que contém u e é paralelo a r.
(d) Determine o plano π2 que passa por r ∩ π e é perpendicular a u.
(e) Determine π ∩ π2 .
 
1
6. Determine a reta que passa por P = 1 e é perpendicular ao plano que passa pelos pontos

      1
2 0 2
A = −1 , B = 1 e C =
     3 .
0 8 −4
 
−1
7. Determine o plano que passa por Q =  7  e é perpendicular à reta que passa pela origem
  2
3
e tem vetor diretor 6.
5
8. Duas retas dadas podem ser coplanares (e, nesse caso, são concorrentes ou paralelas) ou
não coplanares (reversas). Para decidir a posição relativa, primeiro olhamos para os vetores
normais. Caso sejam paralelos (múltiplos), então as retas são paralelas ou iguais. Caso
contrário, são concorrentes ou reversas. Para a análise, em ambos os casos podemos igualar o
ponto genérico de uma reta ao ponto genérico da outra, sempre lembrando de mudar o nome
do parâmetro caso necessário. Eis alguns exercı́cios sobre isso:
   
1−t t−2
9. Dadas as retas  t − 2  e  1 − t , determine os valores de a e b para que sejam iguais.
3 + 2t a + bt
   
1−t t−6
10. Mostre que as retas  t − 2  e t − 3 são concorrentes e calcule seu ponto de inteseção.
3 + 2t t+5

69
   
3 1
11. Dê exemplos de retas reversas com vetores diretores 0 e 1.
  
1 4
12. Dois planos serão chamados
  perpendiculares se têm vetores normais ortogonais. Dados π :
1
x − 2y + 2z = 0 e A = 1, obtenha dois planos distintos por A, ambos perpendiculares a

1
π.
 
3 + 2t
13. Dado o plano π : 3x + 2y − z = 10 e a reta r : 2 + 4t, obtenha o único plano perpendicular
t−1
a π que contém r.

14. Dados π e r, discuta, a partir de sua posição relativa, a existência e unicidade de um plano
contendo r e perpendicular a π.

17.4 Produto vetorial e determinantes 3x3

Na seção anterior, ao nos depararmos com o problema de passar da representação paramétrica de


um plano para sua equação geral, vimos que seria útil uma maneira rápida de, dados dois vetores
não paralelos V e W , construirmos um vetor N não nulo e perpendicular a ambos. Este problema
pode ser resolvido em geral por um sistema de duas equações e três incógnitas: as incógnitas são
as coordenadas de N e as equações são V · N = 0 e W · N = 0. Um sistema como este sempre tem
como solução um conjunto com um parâmetro livre; fossem as incógnitas x, y e z, a solução seria
uma reta que passa pela origem. O que vamos fazer é escolher uma solução particular, chamada
produto vetorial entre V e W . Lembre-se que para definir um vetor, precisamos dizer quem é seu
módulo, direção e sentido. A definição a seguir é chamada “geométrica”; o motivo é claro.

Definição. Dados dois vetores quaiquer V e W no espaço, definimos o produto vetorial de V por
W como sendo o vetor V × W que satisfaz:

• (módulo) kV × W k = kV kkW ksen θ, onde θ é o ângulo entre V e W .

Observações.

1. sendo θ um ângulo entre 0o e 180o , temos sen θ ≥ 0, logo teremos kV × W k ≥ 0, como


deveria ser mesmo.
2. É claro que se um dos vetores V ou W for nulo (ou ambos nulos), então o produto
vetorial entre eles também é nulo.
3. Caso V e W sejam paralelos (o que inclui o caso em que um deles é nulo), são vetores
múltiplos e o ângulo entre eles será 0o ou 180o , caso em que sen θ = 0 e o produto
vetorial entre V e W é o vetor nulo. Reciprocamente, sendo ambos V e W não nulos, se
o produto vetorial entre eles é o vetor nulo, então sen θ = 0, logo V e W são paralelos.
Ou seja, V × W = 0 se e somente se V e W são paralelos.

70
4. Quando V e W não são paralelos, então eles formam um paralelogramo cuja área é
calculada como base x altura. Escolhendo V como base, então a altura é a projeção
do ponto final de W na reta onde V está desenhado e, como o ângulo entre eles é θ,
temos que a altura é kW ksen θ, donde a área do paralelogramo é kV kkW ksen θ, não
importanto se θ é agudo, obtuso ou reto. Ou seja, o módulo do produto vetorial é a área
do paralelogramo gerado pelos vetores. Note que, se um deles é nulo ou se são paralelos,
então eles não geram um paralelogramo, o que é coerente com o produto vetorial ser
zero nesses casos.

• (direção) V × W é perpendicular a ambos V e W . Isto define a direção de V × W quando


ele é não nulo, pois, nesse caso, V e W são não paralelos, portanto existe uma e somente uma
direção perpendicular a ambos. E, no caso de V × W = 0, tanto faz.

• O (sentido) de V × W é dado pela regra da mão direita ou pela regra da mão esquerda.

Observações.

1. Procure por ilustrações na internet da regra da mão direita e da mão esquerda. A


descrição da regra da mão direita é a seguinte: imagine que sua mão direita tem o
polegar esticado e os outros quatro dedos alinhados e um pouco dobrados (isto é, não
estão esticados nem totalmente fechados na palma da mão). Se os quatro são setas cujas
pontas são as unhas e se movimentam de V para W ao longo do menor ângulo entre
eles, então o polegar aponta no sentido de V × W . Já a regra da mão esquerda tem a
seguinte descrição: os dedos polegar, indicador e médio estão esticados. O polegar, que
vai representar o produto vetorial entre o médio e o indicador, fica direção perpendicular
aos outros dois. O médio e o indicador não precisam ser perpendiculares entre si.
2. Daı́ fica claro que W × V = −V × W .

Assim, o produto vetorial de dois vetores tem como resultado um vetor, enquanto o produto escalar
entre dois vetores tem como resultado um escalar, um número.

Mas de pouco adianta termos definido módulo, direção e sentido de V × W se não tivermos um
modo de calculá-lo em coordenadas. Apresentaremos uma fórmula a partir do determinante de
matrizes 3x3, logo convém fazer um breve estudo introdutório.
 
a11 a12 a13
Dada uma matriz 3x3 A = a21 a22 a23 , o determinante de A é o número real
a31 a32 a33
det A = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a12 a21 a33 − a11 a23 a32 ,

que pode ser calculado pela regra mnemônica que aprendemos no ensino médio, isto é, copiando as
duas primeiras colunas de A após a terceira, resultando numa matriz 3x5 da qual multiplicamos os
três elementos de cada uma das três diagonais paralelas à diagonal principal (incluindo a própria),
tomando cada um desses produtos como parcela positiva e multiplicando os três elementos de cada

71
uma das três diagonais na direção da diagonal secundária, tomando esses produtos como parcelas
negativas.
 
3 0 2
Por exemplo, se A = 1 −1 −1, então det A = 29.
2 5 0

Há um outro modo de se calcular o determinante, que se aplicará também a matrizes quadradas
de ordem superior, chamado método dos cofatores, onde o determinante de uma matriz é calculado
pela soma de três parcelas, cada uma sendo o produto de um fator pelo seu cofator. Os fatores são
determinados escolhendo-se livremente uma linha ou uma coluna da matriz A: são as três entradas
da linha ou coluna escolhida. Cada fator dá origem a uma matriz 2x2, eliminando-se de A a linha e
a coluna às quais o fator pertence. Dessa matriz 2x2 calculamos o determinante, que ainda receberá
um sinal, dependendo da posição do fator na matriz original.

Vamos exemplificar escolhendo a primeira linha. Temos

det A = a11 (−1)1+1 A11 + a12 (−1)1+2 A12 + a13 (−1)1+3 A13 ,

onde Aij , é o determinante da matriz 2x2 obtida eliminando-se de A sua i-ésima linha e sua j-ésima
coluna.
 
3 0 2
Por exemplo, no caso da matriz A = 1 −1 −1, temos, por cofatores a partir da primeira
 2 5 0    
1+1 −1 −1 1+2 1 −1 1+3 1 −1
linha, det A = (3)(−1) det + (0)(−1) det + (2)(−1) det =
5 0 2 0 2 5
(3)(5) + 0 + (2)(7) = 29.

Exercı́cio. Calcule o determinante de A pelo desenvolvimento em cofatores usando a segunda


coluna e verifique que o resultado é 29.

Não é difı́cil ver que o desenvolvimento em cofatores funciona sempre. No caso geral, quando
a11 a12 a13
A = a21 a22 a23 , faça, como exercı́cio, a comparação do desenvolvimento do determinante de
a31 a32 a33
A em cofatores pela segunda linha e verifique que você encontrou o número a11 a22 a33 + a12 a23 a31 +
a13 a21 a32 − a13 a22 a31 − a12 a21 a33 − a11 a23 a32 . Se achar necessário, faça isso também para uma coluna
qualquer da matriz A. A demonstração completa, claro, necessita que se verifique a igualdade para
todas as linhas e colunas de A.

O desenvolvimento em cofatores é particularmente útil quando temos uma linha ou uma coluna
com muitos zeros.

O cálculo do produto vetorial em coordenadas é feito a partir de um determinante “simbólico”,


isto é, do determinante de uma matriz cujas entradas da primeira linha não são números, mas
vetores. Uma rápida observação, em analogia à base canônica {i, j} de R2 : temos para R3 três
vetores canônicos, i, j e k, representando a unidade de medida e o sentido positivo dos eixos x, y

72
     
1 0 0
e z respectivamente, isto é, i = 0 , j = 1 e k = 0. Assim, um vetor qualquer pode ser
    
0 0  1
a
escrito como combinação linear de i, j e k: b  = ai + bj + ck.

c
   
v1 w1
A definição “algébrica” do produto vetorial é a seguinte: Se V = v2 e W = w2 , teremos
  
v3 w3
 
i i k
V × W = det v1 v2 v3  ,

w1 w2 w3

que deve ser desenvolvido pela primeira linha, resultando em

 
      v2 w3 − v3 w2
v2 v3 v v3 v v2
V × W = det i − det 1 j + det 1 k = v3 w1 − v1 w3  .
w2 w3 w1 w3 w1 w2
v1 w2 − v2 w1

       
1 0 i j k 7
Exemplo. Se  1  ×  2  = det 1 1 −4 = 1, e, usando o produto escalar, vemos
  
−4 −1 0 2 −1 2
imediatamente que é perpendicular a ambos os “fatores”.

É um exercı́cio, embora um pouco trabalhoso, mostrar que as definições geométrica e algébrica de


produto vetorial coincidem. Um roteiro para fazer isso é o seguinte. Primeiro, para comparar os
módulos, escreva kV × W k2 = kV k2 kW k2 sen 2 θ = kV k2
kW 2 2
k (1 − cos θ), abra em coordenadas e
v2 w3 − v3 w2

verifique a igualdade com o quadrado de v3 w1 − v1 w3  .
v1 w2 − v2 w1

A seguir, para comparar a direção, note que, para um vetor qualquer U , o produto escalarde U
U
por V × W , também chamado produto misto entre U , V e W , é dado por U · (V × W ) = det V ,
W
o determinante da matriz cujas linhas são os vetores U , V e W , e conclua que V · (V × W ) =
W · (V × W ) = 0. Observe que não há a necessidade do parêntese na notação, mas é didátco.

Finalmente, para comparar o sentido, é necessário um pouco mais de álgebra linear: uma tripla
ordenada de vetores no espaço é uma base para R3 se os três vetores não são coplanares. Não é
difı́cil ver que, caso três vetores formem uma base, a matriz cujas colunas são esses vetores tem
determinante não nulo. Isto ocorre porque o determinante é zero se e somente se uma das colunas
é combinação linear das outras duas, caso em que os vetores são coplanares. Dada uma base
{V, W, U } para R3 , dizemos que ela é positiva se os sentidos de rotação ao longo do menor ângulo
de V para W , de W para U e de U para V são positivos. Isto acontece, por exemplo, para a base

73
canônica {i, j, k}. Caso contrário, a base é negativa. O que a regra da mão direita diz, portanto,
é que, sendo V e W não paralelos, a base {V, W, V × W } é positiva. O próximo passo é observar
que uma base é positiva se e somente se a matriz cujas colunas são esses vetores (na ordem) tem
determinante positivo. Isto pode ser feito através da definição de produto misto. Por fim, basta
verificar que det[V, W, V × W ] > 0.

Vamos enunciar agora algumas propriedades do determinante seguidas de sua “interpretação” como
propriedades do produto vetorial, imediatas a partir de sua definição algébrica. Algumas destas
propriedades já foram observadas na definição geométrica. Estas propriedades também valem
para matrizes quadradas de ordem superior, faremos referência a elas no momento oportuno. As
demonstrações, no caso 3x3, são exercı́cios para o leitor.

1. det At = det A. Isto significa que as propriedades enunciadas a seguir para as linhas de A
valem também para as colunas de A, e vice-versa.

2. Se A tem duas linhas iguais, então det A = 0. Ou seja, V × V = 0.

3. Se A tem duas linhas múltiplas, então det A = 0. Ou seja, se V e W são paralelos, então
V × W = 0.

4. Se Uma linha
 é combinação linear das outras duas, então det A = 0. Em sı́mbolos, se
L1
A = L2  (linhas) e, por exemplo, L3 = aL1 + bL2 , a, b ∈ R, então det A = 0. A escrita
L3
genérica é Li = aLj + blk , com i, j, k ∈ {1, 2, 3} e distintos. Geometricamente, o fato de um
vetor U ser combinação linear de outros dois, digamos V e W , significa que U é a diagonal
de um paralelogramo cujos lados são múltiplos de V e W . Em outras palavras, significa que
U , V e W são coplanares. Reciprocamente, se det A = 0, então suas colunas são vetores
coplanares (caso contrário, são uma base de R3 ).

5. Se B é a matriz obtida de A trocando-se duas linhas de posição, então det B = − det A. Ou


seja, V × W = −W × V .

6. Se B é a matriz obtida de A multiplicando-se uma de suas linhas por um escalar a, então


det B = a det A. Ou seja, (aV ) × W = a(V × W ) e V × (aW ) = a(V × W ).

7. A próxima propriedade está ilustrada


 para a linha 1 da matriz
 A,
 mas vale também para
U1 + U2 U1 U2
as outras duas linhas: tem-se det  L2  = det L2  + det L2  (linhas). Ou seja,
L3 L3 L3
(U + V ) × W = U × W + V × W e U × (V + W ) = U × V + U × W .

As duas últimas propriedades dizem que o produto vetorial se comporta bem com as operações
lineares de adição de vetores e multiplicação de vetor por escalar, isto é, dizem que podemos usar
a propriedade distributiva.

74
17.5 Retas reversas

Vamos estudar algumas construções importantes a respeito de duas retas reversas dadas.

Dadas duas retas reversas r e s, existe um único par de planos paralelos α e β tal que r ⊂ α e s ⊂ β.
Há algumas maneiras de se concluir isso. Digamos que r : A + tV e s : B + uW . O plano que passa
por A e tem vetores diretores V e W (que contém a reta r) é o plano α (note que V e W não são
paralelos pois são vetores diretores de retas reversas). E o plano β é o que passa por B e é paralelo a
V e W (que contém a reta s). Como só existe uma direção que é simultaneamente perpendicular a
dois vetores não paralelos dados, os planos α e β têm mesmo vetor normal, portanto são paralelos.
Em outras palavras, poderı́amos ter escolhido um vetor normal N = V ×W , perpendicular a ambos
V e W e dizer que α é o plano por A e com vetor normal N , e β passa por B e tem o mesmo vetor
normal.
   
1 2
Exemplo. Sejam r a reta que passa por A = 0 e com vetor diretor V =
   1  e s a reta que
  1  −1
0 −1
passa por B = −3 e com vetor diretor W =
   2 . Verifique que, de fato elas são reversas.
0 1
Para o vetor normal dos planos α e β tomamos
   
i j k 3
N = V × W = det 2 1 −1 = −1 ,
  
−1 2 1 5

e, já que sabemos que A ∈ α, segue que a equação de α é 3x − y + 5z = 8. Similarmente, temos


β : 3x − y + 5z = 3, pois B ∈ β.

Você pode imaginar a situação pensando que construı́mos uma “caixa” de acrı́lico transparente, de
forma de um paralelepı́pedo e traçadas com um marcador estão as retas r e s em faces opostas (por
exemplo, na base e na tampa). As aspas se justificam porque os planos são infinitos, não limitados
como as faces de uma caixa de sapatos.

O leitor pode perguntar, a partir da ilustração acima, se existe uma reta que seja simultaneamente
perpendicular às retas reversas r e s. A resposta é que não só existe, mas é unica. Para construir
esta reta, note primeiramente que um vetor diretor para ela é exatamente o vetor N , normal aos
planos α e β. Vamos obter a perpendicular comum procurada como interseção de dois planos,
π1 e π2 . Note que, tendo N como vetor diretor, a reta procurada é paralela ou está contida em
qualquer plano que tenha N como vetor diretor. Assim, consideramos π1 como o plano que contém
r e é paralelo a N (ou seja, π1 está definido pelo ponto A e pelos vetores diretores V e N ) e π2 o
plano que contém s e é paralelo a N (ou seja, definido pelo ponto B e pelos vetores diretores W
e N ). Os planos π1 e π2 não são paralelos, já que os vetores V , W e N não são coplanares, logo
se interceptam numa reta. Um vetor diretor para esta reta é N , já que trata-se de uma direção
comum a ambos os planos. A reta u = π1 ∩ π2 é perpendicular a r (em π1 ) e é perpendicular a s
(em π2 ), logo é a reta procurada. É única graças ao fato de os planos π1 e π2 estarem unicamente
determinados a partir de r e s.

75
Fazendo
 as contas, que osvetores diretores de π1 são V e N , um vetor normal a π1 é V × N =
 já 
i j k 4
det 2 1 −1 = −13, assim, usando o fato que A ∈ π1 , temos π1 : 4x − 13y − 5z = −1.
3 −1 5 −5  
11
Similarmente, para π2 consideramos N2 = W × N =  8  e, como sabemos que B ∈ π2 , temos
−5
π2 : 11x + 8y − 5z = −24. Assim, a reta u é a solução do sistema que representa a interseção de π1
com π2 :
(
4x − 13y − 5z = −1
u: .
11x + 8y − 5z = −24

−23
Resolvendo, igualando 5z em ambas as equações, obtemos x = − 3y. Substituindo em uma
7
17
das equações, por exemplo, na primeira, obtemos z = −5y − , ou seja,
7
−23
 
 7 − 3y 
u: y  , y ∈ R.
 
 17 
−5y −
7

Podemos calcular exatamente os pontos P = u ∩ r e Q = u ∩ s, faça isso como exercı́cio.

Há outras maneiras de se conseguir a reta u. Por exemplo, é possı́vel calcular diretamente os pontos
P = π2 ∩ r e Q = π1 ∩ s.
   
3t − 2 2 + 2t
Exercı́cios. Dadas as retas r :  t  e s :  1 − t ,
3−t 4t
1. Mostre que são reversas.

2. Determine uma reta que passe pela origem e seja concorrente com r e s.

3. Dê exemplo de um ponto P de modo que não exista uma reta u que passe por P e intercepte
r e s.
 
1
4. Dado o vetor V = 1, obtenha dois planos cuja interseção seja uma reta m paralela a V e
1
concorrente com r e s.

5. Dê exemplos de vetores W tais que não seja possı́vel obter uma reta que seja ao mesmo tempo
paralela a W e concorrente com r e s.

76
17.6 Distâncias e Ângulos

A filosofia de definição de distância e ângulo entre dois objetos no espaço (pontos, retas e planos)
é, sempre que possı́vel, tomar a menor entre todas as medidas.
−→
Dados dois pontos A, B ∈ R3 , já sabemos que a distância entre eles é dada por d(A, B) = kABk.

Para calcular a distância de um ponto A a um plano π, vamos supor primeiramente que A 6∈ π. É


fácil ver que a menor distância é dada pelo segmento perpendicular de A a π. Assim, se B é o pé
da perpendicular de A até π, então d(A, π) = d(A, B) e isto vale também para o caso A ∈ π (no
qual A = B).
 
1
Por exemplo, se π : x + 2y + z = 13 e A = −1, vamos obter B como a interseção de π com a
2
reta perpendicular
  a π por A.
 Esta reta, vamos chamá-la r, tem como vetor diretor o vetor normal
1 1+t
a π, 2, logo r : P (t) = 2t − 1. Para calcular t tal que P (t) esteja também em π, exigimos
1 2+t
que as coordenadas de P (t) satisfaçam a equação de π, obtendo

(1 + t) + 2(2t − 1) + (2 + t) = 13,
 
3
−→
ou seja, t = 2. Logo, B = r ∩ π = P (2) = 3 e d(A, π) = kABk.

4

A mesma ideia de se calcular a distância de um ponto A a uma reta r se aplica: se A está fora de r,
então existe uma única reta s perpendicular a r por A. Sendo B = s∩r, teremos d(A, r) = d(A, B),
pois aı́ estará a menor distância possı́vel entre A e um ponto de r. No caso A ∈ r, existem muitas
retas por A e perpendiculares a r, mas a distância entre A e r será zero. De qualquer modo, o
ponto B, pé da perpendicular de A até r está unicamente determinado, mesmo quando A ∈ r, caso
em que teremos B = A.

Para calcular o ponto B, observe que, em qualquer caso, por A passa um único plano π perpendicular
a r. Vamos obter a equação deste plano e calcular π ∩ r.
   
3 2t − 3
Por exemplo, sendo A = 0 e r :  1 − t , um vetor normal a π é o próprio vetor diretor de r,
  2 t
2
−1. Como queremos A ∈ π, segue π : 2x − y + z = 8. Para calcular r ∩ π, procedemos como
1
no exemplo anterior, exigindo que as coordenadas do ponto P (t) satisfaça a equação de 
π, obtendo

2
2(2t − 3) − (1 − t) + (t) = 8, cuja solução é t = 5/2. Assim, B = π ∩ r = P (5/2) = −3/2 e
5/2
teremos d(A, r) = d(A, B).

77
Para calcular a distância entre dois planos, note primeiro que, se eles se interceptam, então a
distância é zero. Assim, a primeira coisa a fazer é obesrvar os vetores normais: se eles não são
paralelos, os planos também não serão, e a distância é zero. Caso π1 e π2 sejam paralelos e não
iguais, a distância entre eles será o comprimento de qualquer segmento perpendicular comum. Para
calcular este comprimento, escolha um ponto num dos planos, por exemplo, A ∈ π1 e o problema
está reduzido a calcular a distância de A a π2 , o que já sabemos como fazer.

Dados um plano π e uma reta r, como já foi dito, existem três posições relativas possı́veis: ou a
reta “fura” o plano, isto é, r ∩ π é um ponto; ou a reta está contida em π, isto é, r ∩ π = r; ou r
é paralela ao plano, caso em que r ∩ π = ∅. Somente no terceiro caso teremos d(r, π) > 0 e, para
calcular (o comprimento de qualquer segmento perpendicular comum entre r e π) escolhemos um
ponto qualquer A ∈ r e calculamos d(A, π), como nos exemplos anteriores. Pergunta: poderı́amos,
nesse caso, escolher um ponto B ∈ π e calcular a distância de B a r?

Dadas duas retas r e s, elas podem ser concorrentes, paralelas ou reversas. No primeiro caso, temos
claramente d(r, s) = 0. No segundo caso, temos de calcular o comprimento de qualquer segmento
perpendicular comum entre r e s, o que se faz escolhendo um ponto qualquer em A ∈ r e calculando
d(A, s). Finalmente, no terceiro caso, calculamos o comprimento do único segmento perpendicular
comum, o que já fizemos na subseção anterior, quando estudamos retas reversas. Nesse caso, isto
é, para calcular a distância entre duas retas reversas, há um outro modo de fazer: determinamos o
único par de planos paralelos tal que cada um deles contenha uma das retas e calculamos a distância
entre eles.

Ângulos entre vetores e ângulos entre retas já estão definidos, lembre-se apenas que o ângulo entre
vetores está entre 0 e 180o e o ângulo entre duas retas está entre 0 e 90o . Ou seja, se θ é o ângulo
V ·W Vr · Vs
entre V e W , então cos θ = e, se β é o ângulo entre r e s, temos cos β = | |.
kV kkW k kVr kkVs k

Já para se definir o ângulo entre dois planos π1 e π2 , a maneira natural é ao longo de sua reta
de interseção, como se seu olho estivesse dentro da reta, vendo cada plano como uma reta, como
os ponteiros de um relógio. Isto acontece porque nesse caso não há a “menor medida possı́vel”,
ao considerarmos todos os ângulos entre uma reta do primeiro plano e uma do segundo. De fato,
tomando um ponto P na interseção dos dois planos, existem retas r e s por P , uma em cada plano,
tais que o ângulo entre elas fique tão próximo de zero quanto se queira.

Para o cálculo, tomamos um ponto P da reta interseção e, por ali, o plano γ, perpendicular a ambos
π1 e π2 , isto é, γ é o plano perpendicular à reta de interseção por P . O plano γ intercepta π1 numa
reta r1 e o plano π2 numa reta r2 . Então, teremos ^(π1 , π2 ) = ^(r1 , r2 ), o que já sabemos como
calcular. Assim, o ângulo entre dois planos varia entre 0 e 90o .

Exercı́cio. Diga como se pode calcular o ângulo entre dois planos a partir de seus vetores normais.

Por último, vamos estudar o ângulo entre uma reta r e um plano π. Se r ⊂ π ou r k π, então,
claramente ^(r, π) = 0. Caso contrário, isto é, se r ∩ π é um ponto, consideremos primeiro o
caso r ⊥ π, ou ^(r, π) = 90o , que é caracterizado pelo fato de os vetores diretor de r normal a π
serem múltiplos. Nos outros casos, o menor ângulo possı́vel entre r e π será medido num plano γ,
perpendicular a π contendo r: teremos ^(r, π) = ^(r, s), onde s = π ∩ γ (demonstre).

78
A reta s será chamada projeção ortogonal de r sobre π e pode ser calculada a partir das projeções
ortogonais de dois pontos distintos de r sobre π. Já sabemos como calcular esta projeção, o pé da
perpendicular de um ponto a um plano, isto foi discutido ao falarmos de distância de um ponto a
um plano. De qualquer modo, o ângulo entre uma reta e um plano varia entre 0 e 90o .

Observe que, se r é perpendicular a π, então a projeção ortogonal de r sobre π é um ponto e, em


todos os outros casos, incluindo r ⊂ π e r k π, a projeção ortogonal de r sobre π é uma reta s e
vale ^(r, π) = ^(r, s).

Estes métodos não são os únicos para se calcular ângulos e distâncias. Por exemplo, no caso da
distãncia entre um ponto A e uma reta r, uma alternativa ao que foi apresentado é considerar todos
−−−→
os vetores que começam em A e terminam em r, que têm a forma AP (t), e calcular t para que este
−−−→
vetor seja ortogonal ao vetor diretor Vr ; a equação que modela esta situação é AP (t) · Vr = 0.

Exercı́cio. Mostre que esta equação tem uma única solução t, independente da posição relativa
entre A e r, interprete geometricamente.

17.7 Mais alguns exercı́cios sobre retas e planos no espaço


1. Determine
 a reta
 paralela
 ao plano π : 2x −
y + 3z =
 1, perpendicular à reta que passa pelos
1 0 4 + 3t
pontos 0 e 1 e intercepta a reta s : 5 + 6t.
1 2 t
2. Dois pontos são simétricos em relação a um plano se são extremos de um segmento perpendi-
 
1
cular ao plano que encontra o plano no seu ponto médio. Calcule o simétrico do ponto 4
2
em relação ao plano π : x − y + z = 2.

3. Dados um ponto A e uma reta r, diga como fazer (indicando a equação que modela a situação)
para obter o simétrico de A em relação a r. A definição de pontos simétricos em relação a
uma reta é a mesma do exercı́cio anterior, trocando “plano” por “reta”.

4. Determine
 a projeção
 ortogonal da origem sobre a interseção dos plaos π1 : x + y + z = 1 e
1+λ
π2 :  1 + µ  .
1+λ+µ
5. Dados π1 : x − y +z =−1 e π2 : x + y − z = 1, determine o plano que contém π1 ∩ π2 e
1
é normal ao vetor  1 . Isto é sempre possı́vel? Isto é, dados dois planos transversais e
−1
um vetor, sempre existe um plano que contém a interseção dos planos dados e é ortogonal ao
vetor dado? Explique geometricamente.

79
√ 
2
6. O vértice de uma pirâmide regular é P =  2  e sua base é um quadrado ABCD contido
  0
0
no plano π : x = z. Sendo A = 2, determine B, C e D e o volume de P ABCD.

0
7. Dados os planos α : x − y + z = −1, β : x + y − z = 1 e γ : x + y + 2z = 2, determine o plano
π que contém α ∩ β e é perpendicular a γ. É sempre possı́vel determinar π, independente das
posições relativas entre α, β e γ? Expique geometricamente.
   
3t + 1 5t − 1
8. Ache a reta que intercepta as retas r : 2t + 1 e s : 3t + 1 e forma ângulos congruentes
−3t t
com os eixos x, y e z.

9. Calcule a medida dos ângulos entre a diagonal de um cubo e suas faces.


 
1
10. A diagonal BC de um quadrado ABCD está contida na reta que passa por 0 e tem vetor

    0
0 1
diretor 1 . Conhecendo A = 1, determine os outros três vértices.
  
1 0
 
( 0
x+y =2
11. Ache os pontos de r : que distam 3 do ponto A = 2.
x−y−z =0 1
     
1+t 1 0
12. Ache os pontos de r :  t/2  que equidistam dos pontos 1 e 1. Interprete geome-
  
t 0 1
tricamente.
   
1+µ λ (
x−y−z =1
13. As retas r : 1 + µ, s :  λ  e t : determinam com o plano π :
µ −1 x=0
x + y − z = −1 um tetraedro. Calcule a altura relativa à face situada em π.

18 Sistemas de Equações Lineares

Os resultados aqui serão apresentados para sistemas em geral, de qualquer número de equações e
incógnitas. Mas os exemplos vão se concentrar em R3 .

80
18.1 Definições e exemplos

Um sistema de equações lineares é na verdade uma equação matricial AX = B, onde Am×n é a


matriz dos coeficientes, Xn×1 é o vetor das incógnitas e Bm×1 é o vetor constante. Trata-se de um
sistema de m equações e n incógintas.

Exemplo. O sistema     
2 −1 1 x 1
1 1 3 y  = 4
2 −3 0 z 8

pode ser interpretado como a interseção de três planos, escrevendo



2x − y + z = 1

x + y + 3z = 4 ,

2x − 3y = 8

ou, escrevendo-o como


       
2 −1 1 1
x 1 + y  1  + z 3 = 4 ,
2 −3 0 8

interpretado como a pergunta “o vetor B pode ser escrito como combinação linear das colunas de
A?”

Na verdade, qualquer sistema linear pode ser interpretado desta última forma.

Uma solução para AX = B é um vetor constante X0 que satisfaz a equação, isto é, tal que AX0 = B.
O conjunto de todas as soluções do sistema em geral é denotado S. Entendemos resolver o sistema
como representar sua solução S parametricamente.

Exemplos.

1. A solução de um sistema pode ser vazia: interpretando-o como interseção de três planos,
sendo dois deles paralelos (visualizados como o chão e o teto), por exemplo, π1 : x + y + z = 0
e π2 : x + y + z = 1 e escolhendo uma “parede” π3 : 3x − 2y − z = 6.

Exercı́cios.

(a) π3 é uma parede comum (isto é, perpendicular ao “chão”) ou inclinada?


(b) Verifique algebricamente que π1 ∩ π2 ∩ π3 = ∅.

81
2. Outra situação de solução vazia são três planos tais que dois a dois se interceptam segundo
três retas paralelas. Para um exemplo numérico, escolhemos livremente os dois primeiros,
por exemplo π1 : x + y + z = 0 e π2 :x − y− 2z= 1. Um vetor diretor para a reta π1 ∩ π2
i j k −1
é V = N1 × N2 = det 1 1  1  =  3 . Então π3 deve ter esse vetor como um
1 −1 −2 −2
dos diretores. Escolhendo um ponto A que não esteja nem em π1 nem em π2 e um segundo
vetorWdiretor não paralelo a V , teremos uma representação paramétrica de π3 . O ponto
0 1
A = 1 e o vetor W = 0 satisfazem o requerido. Para a equação de π3 , calculamos seu
0 0    
i j k 0
vetor normal N3 = V × W = det −1 3 −2 =  2 , logo π3 : 2y − 3z = 2.
1 0 0 −3

Exercı́cio. Verifique algebricamente que π1 ∩ π2 ∩ π3 = ∅ e apresente um argumento


geométrico para mostrar que este fato depende da escolha de W : veja o próximo exercı́cio.

3. A solução de um sistema pode ser um conjunto infinito.

Exercı́cio. Modifique o exemplo anterior para que π1 ∩ π2 ∩ π3 seja uma reta, obtenha sua
representação paramétrica. Trata-se de um exemplo de sistema cuja solução é um conjunto
infinito.

4. Outra configuração de três planos no espaço cuja interseção é uma reta é π1 = π2 e π3


transversal a eles.

5. A interseção de três planos iguais também é um exemplo de sistema cuja solução é um conjunto
infinito. Nesse caso, a representação paramétrica da solução (que é o próprio plano) tem dois
parâmetros livres.

6. A solução de um sistema pode ser um conjunto unitário: S = {ponto}. Para escolher três
planos que exemplifiquem esta situação, vamos olhar para seus vetores normais.

Exercı́cio. Verifique que em todos os exemplos anteriores (com S = ∅ ou S um conjunto


infinito), os vetores normais N1 , N2 e N3 são coplanares.

Assim, vamos escolher N1 , N2 e N3 de modo que eles sejam uma base de R3 . Nesse caso, é
um exercı́cio mostrar que a reta π1 ∩ π2 e o plano π3 não são paralelos, logo se interceptam
num ponto. O exemplo trivial é a origem como interseção dos planos coordenados x = 0,
y = 0 e z = 0; outro exemplo é

x + y + z = 0

2x − y + z = 1

3x + y − z = 2

82
Observação. O que fizemos foi ilustrar, via exemplos, uma propriedade importante de
sistemas associados a matrizes quadradas: o sistema AX = B tem solução única se e somente
se as linhas de A formam uma base de R3 , isto é, det A 6= 0. Este fato é independente do
vetor B. Ao longo desta seção, seguiremos caracterizando sistemas associados a matrizes
quadradas separando-os em dois tipos: aqueles com solução única e aqueles cuja solução é
vazia ou infinita.

7. Interpretando AX = B como a pergunta se B é uma combinação linear das colunas de


A = [C1 , C2 , C3 ], as interpretações geométricas para as possibilidades do conjunto solução são
as seguintes:

• S = ∅ se C1 , C2 e C3 são coplanares e B está fora deste plano;


• S é um conjunto infinito se C1 , C2 e C3 são colineares e B está nesta reta, ou se C1 , C2
e C3 coplanares (mas não colineares) e B está neste plano;
• S = {ponto} se C1 , C2 e C3 formam uma base para R3 e este fato não depende do vetor
B.

−−→
Um argumento geométrico para o último caso é que OB pode ser decomposto, de maneira
única, como combinação linear de C1 , C2 e C3 , interpretando {O, C1 , C2 , C3 } como um sistema
de coordenadas para o espaço, em analogia ao que fizemos com {O, i, j, k}.

18.2 Possibilidades qualitativas de soluções de sistemas

Já vimos que ocorrem três possibilidades, a saber, a solução pode ser um conjunto vazio, unitário
ou infinito. Veremos agora que não pode ocorrer mais nenhuma:

Proposição. Se X0 e X1 são duas soluções distintas de AX = B, então existem infinitas soluções.

Demonstração. Para ver isso, independente do ambiente onde as soluções estejam, podemos
pensar na reta que liga X0 a X1 , um conjunto infinito de pontos que depende de um parâmetro
−−−→
livre: X(t) = X0 + tX0 X1 , t ∈ R, e mostrar que, para qualquer valor de t, X(t) é solução de
AX = B. Para ver isso, escreva X(t) = X0 + t(X1 − X0 ) e calcule

AX(t) = A(X0 + t(X1 − X0 )) = AX0 + t(AX1 − AX0 ) = B + t(B − B) = B,

já que AX0 = B e AX1 = B. Assim, AX(t) = B para qualquer valor de t ∈ R, mostrando o que
foi enunciado.

18.3 Escalonamento
.

Podemos resolver sistemas de poucas equações e poucas incógnitas “na mão”, utilizando o que já
conhecemos sobre eles. Assim, o método que apresentaremos agora terá pouca utilidade prática
para sistemas, digamos, pequenos. Mas a aplicação computacional, como algoritmo para resolver

83
qualquer sistema linear de qualquer número de equações e incógnitas é imediata. Também tem
importância teórica na análise qualitativa de soluções de sistemas.

Lembre-se que, dado um sistema linear, as seguintes operações podem ser feitas nas suas linhas
(equações), sem alterar a solução, isto é, estas operações preservam a solução do sistema (já falamos
disso quando estudamos escalonamento em sistemas 2x2).

• (i): Li ↔ Lj (troca de posição das linhas)


• (ii): Li ← αLi , α 6= 0 (a i-ésima linha multiplicada por uma constante não nula)
• (iii): Li ← Li + αLj (a i-ésima linha é substituı́da por ela mesma mais um múltiplo escalar
de outra)

O método de Gauss é escalonar a matriz aumentada do sistema até podermos resolvê-lo facilmente.
   
3 2 1 2
Exemplo. O sistema AX = B, onde A = 1 1 1  e B = 2 pode ser escalonado a partir
1 0 −1 1
da matriz aumentada do sistema:
 
3 2 1 | 2
1 1 1 | 2 ,
1 0 −1 | 1

onde as linhas verticais, que separam A de B, por simplicidade não serão mais digitadas.

Procedendo com o escalonamento, podemos fazer:


 
L1 ↔ L3 1 0 −1 1
−−−−−−−−−−→  1 1 1 2
3 2 1 2
L2 ← L2 − L1  
L3 ← L3 − 3L1 1 0 −1 1
−−−−−−−−−−−−−−−→ 0 1 2 1
0 2 4 −1
L3 ← L3 − 2L2 1 0 −1 1
−−−−−−−−−−−−−−−→ 0 1 2 1
0 0 0 −3

A terceira linha da última matriz obtida nos diz que 0x + 0y + 0z = −3, uma equação impossı́vel,
de modo que o sistema, nesse caso, tem solução vazia.
 
2
Exemplo. Considere o exemplo anterior com o vetor constante trocado por  2 . Este vetor
−2
(a última coluna da matriz aumentada) sofreria modificações ditadas pelas operações que fize-
mos acima, já que as definições das operações do escalonamento dependem apenas da matriz dos
coeficientes. Assim, o passo a passo seria

84
       
2 −2 −2 −2
 2  →  2  →  4  →  4 ,
−2 2 8 0

de maneira que a matriz aumentada, no final do processo, seria


 
1 0 −1 −2
0 1 2 4 ,
0 0 0 0

(
x−z =2
que nos diz que a solução do sistema é a reta dada por S : , ou, parametricamente,
y + 2z = 4
  
 2+z 
S = 4 − 2z  , z ∈ R .
z
 

Exemplo. Para um exemplo solução unitária, tomamos um sistema 3x3 com a matriz dos coefici-
entes com determinante não nulo: 
x + y + z = 0

x + y + 2z = 0

x + 2y + 4z = 0

A matriz aumentada deste sistema não necessita da coluna que representa o vetor constante pois,
sendo o sistema homogêneo, esta coluna é o vetor nulo, que não se modifica com as operações (i),
(ii) e (iii). Assim,

  L2 ← L2 − L1  
1 1 1 L ← L3 − L1 1 1 1
1 1 2 −−−3−−−−−−−−−→ 0 0 1 ,
1 2 4 0 1 3

que nos permite concluir, pela segunda linha, que z = 0. Substituindo na terceira, segue y = 0 e,


finalmente, na primeira, x = 0. Ou seja, para este sistema, S = { 0 }.

18.4 A forma escalonada e reduzida de uma matriz

Para um algoritimo, é necessário saber quando parar. Para programar um computador para resolver
sistemas lineares de qualquer tamanho, vamos escalonar a matriz aumentada do sistema até que a
matriz dos coeficientes fique, digamos, na forma mais simples possı́vel. Esta forma será chamada
de forma escalonada e reduzida, este método recebe o nome de método de Gauss-Jordan.

Definição. Uma matriz A está na sua forma escalonada e reduzida (escrevemos AER ) se satisfaz:

1. O primeiro elemento não nulo de cada linha não nula, chamado pivô da linha, é 1.

85
2. O pivô de uma linha (a partir da segunda) está á direita do pivô da linha anterior.

3. Se uma coluna contém um pivô, então todas as outras entradas desta coluna são zero.

4. Linhas nulas ficam abaixo das linhas não nulas.

Exercı́cio. Dê exemplos de matrizes 3x2, 3x3 e 3x4 que estejam na forma escalonada e reduzida.

Vamos usar as operações (i), (ii) e (iii) para, após um número finito de passos, chegarmos à forma
escalonada e reduzida de uma matriz. Suponha que a matriz que vamos escalonar tenha n linhas.

• (I) Defina o conjunto de linhas como L1 , L2 , . . . , Ln .

• (II) Escolha uma das linhas não nulas com o pivô mais à esquerda possı́vel.

• (III) Troque com a primeira linha se necessário, temos o pivô da primeira linha mais à esquerda
possı́vel, usando a operação (i).

• (IV) Torne este pivô igual a 1, usando a operação (ii).

• (V) Zere os outros elementos da coluna deste pivô, usando a operação (iii).

• (VI) Troque as linhas de posição, se necessário, para que as linhas nulas fiquem abaixo das
não nulas.

• (VII) Defina o conjunto de linhas como L2 , L3 , . . . , Ln .

• (VIII) Repita os passos (II) - (V). Note que isso não mexe na L1 , nem na primeira coluna,
porque fora da L1 ela é foremada por zeros.

• (IV) Defina o conjunto de linhas como L3 , . . . , Ln .

• (X) Repita os passos (II) - (VI).

E assim por diante. Como a matriz tem um número finito de linhas, em algum momento terá sido
escolhida a última linha não nula; realizados ali os passos (II) - (VI), o escalonamento para e a
matriz estará na sua forma escalonada e reduzida.

Para resolver um sistema AX = B, escalonamos sua matriz aumentada [A|B] até chegar a [AER |B 0 ],
onde B 0 é o vetor constante modificado pelas operações do escalonamento. Em geral, temos B 0 6= B,
a exceção, como já vimos, são os sistemas homogêneos, onde B = 0, logo B 0 = 0.

Exercı́cio. Resolva o sistema abaixo, analisando as possibilidades de solução em função do valor


de a ∈ R:

x + 2y − z + 3w − u = 3

5x − y + 2z + 2w − u = a

4x − 3y + 3z − w = −5

86
Uma observação imediata, a partir do algoritmo acima, é que, sendo A uma matriz quadrada, se
AER não tem linhas nulas, então AER = I, isto é, para matrizes quadradas, acontece exatamente
uma das duas seguintes possibilidades: ou a forma escalonada e reduzida tem uma linha nula ou
ela é a identidade.

No primeiro caso, dependendo do vetor constante B, o sistema AX = B terá solução vazia ou


infinitas soluções; e, se AER = I, independente de B, o sistema AX = B terá uma única solução.

Este é mais um passo na caracterização de sistemas com soluções únicas que estamos procurando:
já sabı́amos que, se A é uma matriz quadrada, então AX = B tem única solução se e somente se
det A 6= 0. Agora sabemos também que AX = B tem única solução se e somente se AER = I.

Isto significa, é claro, que AER = I ⇔ det A 6= 0. O raciocı́nio desenvolvido na próxima subseção
também nos permitirá concluir este resultado. Estudaremos o comportamento do determinante sob
as operações (i), (ii) e (iii) com o intuito de se desenvolver um algoritmo eficiente para calcular
determinantes de matrizes “grandes”.

18.5 Determinantes e escalonamento

Já vimos como definir determinantes para matrizes quadradas de ordem 2 e 3. Na verdade, o
desenvolvimento em cofatores serve para definir também para matrizes de ordem superior, já que,
por exemplo, se a matriz é 4x4, podemos escolher qualquer linha ou coluna e teremos o produto de
4 fatores por 4 cofatores. Cada um dos cofatores, a menos de sinal, é um determinante 3x3. Assim,
se a matriz é n × n, o desenvolvimento em cofatores leva a n determinantes (n − 1) × (n − 1), cada
um deles leva a n − 1 determinantes (n − 2) × (n − 2) e assim por diante, até chegarmos na ordem
3 ou 2.

Nesta altura do campeonato, não podemos verificar que a definição é boa (ou seja, que podemos
escolher qualquer linha ou coluna), nem algumas das propriedades; isso exigiria uma matemática
mais sofisticada. Mas podemos fazer as contas, principalmente se há uma linha ou coluna com
muitos zeros.

Outra observação importante decorrente do desenvolvimento em cofatores é que, caso a matriz


seja triangular superior, isto é, todos as entradas abaixo da diagonal principal são nulas, então o
determinante nada mais é que a multiplicação dos elementos da diagonal principal.
 
2 5 11
Por exemplo, det 0 −10 6  = (2)(−10)(5).
0 0 5

Esta observação, juntamente com a técnica de escalonamento, nos mostrarão outro modo de fazer
a conta, computacionalmente muito mais eficiente, por reduzir significativamente o número de
multiplicações. Para cada passo do escalonamento, precisamos saber como o determinante muda,
logo vamos estudar seu comportamento quando são realizadas nas linhas de uma matriz as operações
(i), (ii) e (iii).

Já foi discutido, no caso de matrizes de ordem 3, mas são propriedades que valem para matrizes de
qualquer ordem, que:

87
• Se B é obtida de A por uma operação (i), isto é, pela troca de posição de duas de suas linhas,
então o determinante muda de sinal: det B = − det A.

• Se B é obtida de A por uma operação (ii), isto é, pela multiplicação de uma de suas linhas
por um escalar não nulo a, então, o determinante fica multiplicado por A: det B = a det A.

E agora vamos ver que

• Se B é obtida de A por uma operação (iii), isto é, pela troca de uma linha pela soma dela
mesma com um múltiplo escalar de outra, então o determinante não muda: det B = det A.

 
L1
 L2 
 .. 
 
 . 
 Lj 
 
Para verificar o último item, basta escrever A como uma matriz de linhas, A =   ... , onde, claro,

 
L 
 i
 . 
 .. 
Ln
Li está na posição i e Lj na posição j. Assim, se B é obtida de A trocando-se Li por Li + aLj ,
tem-se, lembrando que o determinante respeita a adição nas linhas de uma matriz,
     
L1 L1 L1
 L2   L2   L2 
..  ..   .. 
     
.  .   . 
 
 
 Lj   Lj   Lj 
     
det B = det 
 ..  = det  ...  + det  ...  = det A,
    
 .     
L + aL  L  aL 
 i j  i  j
 ..   . 
 .. 
 . 
 .. 
 . 
Ln Ln Ln

pois para uma matriz com duas duas linhas múltiplas, o determinante é zero.

Observação. Note que isto é mais um modo de concluir que AER = I ⇔ det A 6= 0.

Exemplo. Seja  
2 0 1
A =  1 3 −2 .
−3 2 1

Vamos escaloná-la até chegar a uma matriz triangular superior. Fazendo L1 ↔ L2 , obtemos
 
1 3 −2
B= 2 0 1 
−3 2 1

88
e det B = − det A. Continuando o escalonamento, fazemos as operações do tipo (iii) L2 ← L2 −2L1
e L3 ← L3 + 3L1 , obtendo
 
1 3 −2
C = 0 −6 5 
0 11 −5

e det C = det B, logo det A = − det C.

O próximo passo é fazer L2 ← (−1/6)L2 para obter


 
1 3 −2
D = 0 1 −5/6
0 11 −5
e det D = (−1/6) det C, logo, det A = 6 det D.

Mais um passo, agora L3 ← L3 − 11L2 , nos dá


 
1 3 −2
E = 0 1 −5/6  ,
0 0 −25/6

com det E = det D, logo, det A = 6 det E. A matriz E é triangular superior, portanto det E =
(1)(1)(−25/6), donde concluı́mos que det A = −25.
 
1 3 −1 3
 2 0 −1 1 
Exercı́cio. Calcule det 
−1 1 2
.
1
4 2 3 −3

18.6 Inversão de matrizes e escalonamento

Como já vimos quando discutimos inversão de matrizes 2x2, na tentativa de inverter uma matriz,
nos deparamos com sistemas lineares. Assim, vamos ver quais sistemas aparecem no caso 3x3 e
como resolvê-los, achando a inversa, caso exista, por escalonamento.

Lembre-se que uma matriz quadrada A é invertı́vel se existe B de mesma ordem tal que AB =
BA = I. Que uma destas igualdades implica a outra (e que, portanto, para procurar B = A−1
precisamos apenas resolver AB = I), e que a inversa, caso exista, é única.

Ora, a equação matricial AB = I pode ser mais detalhadamente descrita no caso 3x3 expliciando-se
as colunas, ficando A[C1 , C2 , C3 ] = [i, j, k], onde C1 , C2 e C3 são as colunas da candidata a inversa
B e i, j e k, os vetores da base canônica, são as colunas da matriz identidade 3x3. Assim, temos a
igualdade de matrizes

[AC1 , AC2 , AC3 ] = [i, j, k].

89
Estamos lidando, portanto, com três sistemas lineares com mesma matriz de coeficientes, cada um
deles tem como incógnita uma das colunas de B e como vetor constante uma coluna da identidade.

Logo podemos escaloná-los simultaneamente, já que, quem define as operações que serão utilizadas
é a matriz dos coeficientes. Ou seja, vamos considerar a matriz aumentada (3x6) [A|I]. Esquema-
ticamente, após terminado o escalonamento, teremos [AER |M ], onde M é uma matriz 3x3.

Se AER = I, então cada um dos sistemas tem solução única, de modo que M = A−1 .

Se AER tem uma linha nula, então é possı́vel mostrar que pelo menos um dos sistemas não tem
solução (faça como exercı́cio), logo a inversa não existe.

Assim, dada A, a inversa existe se e somente se AER = I, ou seja, se e somente se det A 6= 0. Isto
é coerente com a interpretação que já fizemos de um sistema ter solução única quando pudermos
isolar a incógnita (lembre-se de equações lineares nos reais, podemos isolar x de ax = b quando
a 6= 0 - isto é, quando o número a tem inverso - e isolar x multiplicando ambos os lados por 1/a).
Se existe A−1 , então a incógnita de AX = B pode ser isolada multiplicando-se ambos os lados por
A−1 à esquerda:

AX = B ⇔ A−1 AX = A−1 B ⇔ X = A−1 B

e A−1 B é a única solução do sistema.




1 1 0
Exemplo. Vamos decidir se A =  2 1 1 é invertı́vel e, caso afirmativo, calcular A−1 .
−3 2 1
Escalonando [A|I], temos:
 
1 1 0 | 1 0 0
[A|I] =  2 1 1 | 0 1 0
−3 2 1 | 0 0 1
L2 ↔ L2 − 2L1  
L3 ← L3 + 3L1 1 1 0 | 1 0 0
−−−−−−−−−−−−−−−→ 0 −1 1 | −2 1 0
0 5 1 | 3 0 1
L1 ← L1 + L2
L3 ← L3 + 5L2  
L2 ← −L2 1 0 1 | −1 1 0
−−−−−−−−−−−−−−−→ 0 1 −1 | 2 −1 0
0 0 6 | −7 5 1 
L3 ← (1/6)L3 1 0 1 | −1 1 0
−−−−−−−−−−−−−−→ 0 1 −1 | 2 −1 0 
0 0 1 | −7/6 5/6 1/6
L1 ← L1 − L3  
L2 ← L2 + L3 1 0 1 | 1/6 1/6 −1/6
−−−−−−−−−−−−−−→ 0 1 0 | 5/6 −1/6 1/6 
0 0 1 | −7/6 5/6 1/6

90
Assim, temos  
1 1 −1
1
A−1 =  5 −1 1  .
6
−7 5 1
 
−2 1 3
Exercı́cio. Dedida se A =  1 0 3 é invertı́vel e, em caso positivo, obtenha a inversa.
4 1 1

18.7 Independência Linear em R3

Dado um conjunto de vetores em R3 , podemos considerar o espaço gerado por eles, isto é, o conjunto
de todas as suas combinações lineares.

O conceito de independência linear, como o próprio nome diz, envolve perguntar se, para um certo
conjunto de vetores, um deles pode ser escrito como combinação linear dos outros.

A ideia geométrica é a seguinte. Uma reta r que passa pela origem é o conjunto dos múltiplos de
um vetor diretor, isto é, r : µV . Mas esta reta poderia ser parametrizada com dois parâmetros
livres, como r : µV + λW , desde que W e V sejam múltiplos.
 No
 segundo caso, um dos vetores está
µ + 2λ
sobrando como gerador. Por exemplo, o conjunto −µ − 2λ, que a priori tem dois parâmetros
  3µ + 6λ
1
livres, pode ser escrito (µ + 2λ) −1, descartando um dos vetores diretores.

3

Analogamente, se V e W são não paralelos, então π = {µV + λW, µ, λ ∈ R} é um plano pela


origem. Mas se tomamos U = 2V − 3W , podemos escrever π = {µV + λW + γU, µ, λ, γ ∈ R},
representação paramétrica que tem um dos vetores diretores “sobrando”.

Assim, de uma certa maneira, dizer que um conjunto de vetores é LD (ou linearmente dependente),
vai significar que o espaço das combinações lineares deles tem pelo menos um gerador sobrando,
porque um deles é combinação linear dos outros.

Formalmente, temos

Definição 18.1 Um conjunto de vetores em R3 é linearmente independente, ou LI, se nenhum


deles é uma combinação linear dos outros. Caso contrário é linearmente dependente, ou LD.

Exemplos.

1. Um conjunto de um vetor, {V } é LI se V 6= 0, e LD se V = 0. Em outras palavras, um


conjunto LI com um vetor gera uma reta.
2. Um conjunto de dois vetores {V, W } é LI se V e W não são múltiplos, isto é, não são
paralelos, ou, em outras palavras, um conjunto LI com dois vetores gera um plano. Caso
sejam múltiplos, são LD e geram no máximo uma reta.

91
3. Note que, em ambos os casos anteriores, a presença do vetor nulo no conjunto torna-o ime-
diatamente LD. Isto acontece sempre: se o vetor nulo pertence a um conjunto de vetores, ele
mesmo é combinação linear dos outros (basta tomar todos os escalares nulos) e o conjunto é
LD.

4. Um conjunto de três vetores {U, V, W } é LI se não são coplanares, ou seja, formam uma base
para R3 . Isso quer dizer, como já vimos, que eles geram todo o espaço. E, caso um deles seja
combinação linear dos outros - justamente o caso em que são coplanares, o conjunto é LD.

5. (Exercı́cio) Um conjunto com quatro ou mais vetores em R3 sempre é LD.

6. (Exercı́cio) Dado um conjunto de vetores, ele é LI se e somente se a única maneira de se


escrever o vetor nulo como combinação linear daqueles vetores é usando todos os escalares
nulos. Isto quer dizer que um conjunto {V1 , V2 , . . . , Vn } é LI se e somente se o sistema
homogêneo AX = 0 associado à matriz A cujas colunas são os vetores V1 , V2 , . . . , Vn admite
apenas a solução trivial.

No caso de três vetores em R3 , a matriz associada é quadrada de ordem 3. Assim, se os vetores são
LI, as colunas formam uma base e o determinante da matriz é não nulo.

Sejam U , V e W três vetores LI em R3 , todos representados com ponto inicial na origem. Como
são LI, W está fora do plano gerado por U e V e estes três vetores determinam um paralelepı́pedo
P . O volume deste sólido é v(P ) = área da base x altura. A área da base é a área do paralelogramo
determinado por U e V , que, como sabemos, tem valor kU × V k. A altura é a distância da origem à
projeção ortogonal do ponto final de W na reta gerada por U × V . Seja θ o ângulo entre os vetores
W e U × V . Há dois casos a considerar: se θ é agudo, a altura procurada é kW k cos θ e o volume
então fica

  
W U
v(P ) = kU × V kkW k cos θ = (U × V ) · W = W · (U × V ) = det  U  = det  V  ,
V W

que, já vimos, é o produto misto entre U , V e W .

Se θ é obtuso, então a altura procurada é kW k cos(180o − θ) = kW k(− cos θ) = kW k| cos θ| e o


volume então fica

   
W U
v(P ) = kU × V kkW k| cos θ| = |(U × V ) · W | = |W · (U × V )| = |det U | = | V |.
  
V W



U
A conclusão, em qualquer caso, é que v(P ) = |det  V |. Isto fornece mais um argumento que
W
mostra que o determinante de uma matriz é não nulo se e somente as colunas (ou as linhas, tanto
faz) formam uma base de R3 .

92
18.8 O teorema de caracterização

Ao longo de toda esta seção, de uma maneira ou de outra, olhamos com detalhes para matrizes
quadradas de ordem 3. Elas estão separadas em dois grupos: um onde o determinante é não nulo,
outro no qual o determinante é zero. O que fizemos foi apresentar uma série de argumentos que
demonstram o seguinte

Teorema 18.1 Seja A uma matriz quadrada de ordem 3. As seguintes afirmações são equivalentes:

1. O sistema AX = B tem única solução, e este fato não depende de B. Em particular, o


sistema homogêneo associado a A, AX = 0 admite apenas a solução trivial.

2. det A 6= 0.

3. AER = I.

4. A é uma matriz invertı́vel.

5. As colunas de A formam uma base para R3 (ou: as colunas de A são LI) (ou: as linhas de A
são LI).

Ou seja, cada uma destas condições caracteriza totalmente o grupo ao qual A faz parte.

Este teorema poderia ser enunciado a partir das negativas das condições. Ficaria assim:

Teorema 18.2 Seja A uma matriz quadrada de ordem 3. As seguintes afirmações são equivalentes:

1. O sistema AX = B tem como solução o conjunto vazio ou um conjunto infinito. Em parti-


cular, o sistema homogêneo associado a A, AX = 0 admite soluções não nulas.

2. det A = 0.

3. AER tem uma linha nula.

4. A é uma matriz singular (isto é, não invertı́vel).

5. As colunas de A são coplanares (ou: as colunas de A são LD) (ou: as linhas de A são LD).

19 Mais exercı́cios

Sempre que possı́vel, haverá uma motivação geométrica para que sejam analisados as equações e
os sistemas lineares que aparecem como modelo.
 
3−t
1. Dê exemplos de pontos distintos pertencentes à reta r : 2t − 2.
1+t

93
     
1 0 6
2. Dado o plano π : x + 2y − 5z = 12, decida se os pontos A =  2 ,B=
  1  e C = 1

−5 −2 0
pertencem ou não ao plano π.
 
1
3. Dado π : x − y − z = 0, determine a projeção perpendicular do ponto A = 2 sobre π.

1

4. Dado o cubo unitário determinado por {O, i, j, k}, seja P o ponto de encontro das diagonais
−→
da face superior. Determine o plano que passa pela origem e é perpendicular a OP .
 
1 + bt
5. Estude a posição relativa das retas r1 : a + 2t, onde t é o parâmetro e a e b são números
  1−t
6s − 1
reais e r2 :  −4s  em função dos números a e b.
1 + 2s
6. Sejamπ  : 3x − y + 2z = 8 e P o ponto de interseção de π com o eixo z. Considere o ponto
1
−→
Q = 1. Mostre que Q 6∈ π e decomponha o vetor P Q como combinação linear de dois
1
vetores perpendiculares, sendo um deles paralelo a π.

7. Dados os planos π : 2x − 3y + z = 0 e β : x + 3y − z = 1, obtenha uma representação


paramétrica para π ∩ β.

8. Dado π : x − y − z = 0, obtenha uma representação paramétrica para π onde os dois vetores


diretores sejam perpendiculares.
   
1 3
9. Dados os vetores U = −1 e V = 0, dê exemplo de vetores W1 , W2 e W3 tais que
  
−2 1

(a) Os conjuntos {U, V, W1 } e {U, V, W2 } são ambos LI, mas W1 e W2 não são paralelos.
(b) O conjunto {U, V, W3 } é LD mas W3 6= 0.
 
−1 a −1
10. Para quais valores de a ∈ R a matriz A =  1 −2 1  é invertı́vel?
a 0 −3
11. Calcule a distância entre os planos dados pelas equações x + y + z = 1 e x + y + z = 2.

12. Dadas duas retas reversas u : P (t) = A + tV e v : Q(s) = B + sW , um modo algébrico de


se obter a reta m perpendicular comum a r e s é o seguinte: sabemos que m tem que ter a
direção do vetor N = V × W , pois tem de ser perpendicular a ambas. Considere o conjunto
−−−−−−→
de todos os vetores que começam em u e terminam em v, isto é, P (t)Q(s). Para achar os
pontos onde m toca u e v, a exigência é que este vetor seja paralelo a N , isto é,

94
−−−−−−→
P (t)Q(s) = λN.

Mostre que esta equação é um sistema linear 3x3 nas variáveis t, s e λ, associado a uma
matriz cujas colunas são LI. Portanto, este sistema tem solução única e ao substituirmos os
valores de t e s encontrados nos pontos genéricos de u e v, obtemos os pontos desejados.

20 Espaços Euclidianos Rn

O conjunto Rn é o produto cartesiano de n cópias de R, representado pelo conjunto de todas as


matrizes coluna n × 1. De maneira equivalente poderı́amos ter escolhido as matrizes linha 1 × n.
−→
Do mesmo modo que em R2 ou R3 , um ponto P de Rn define o vetor OP , com ponto inicial na
origem. Reciprocamente, cada vetor define um ponto. As oprações lineares com matrizes definem
operações lineares em Rn , adição de vetores e multiplicação de vetor por escalar. A multiplicação
matricial de um vetor linha por um vetor coluna dá origem ao produto escalar entre dois vetores:
V · W = V tW .

Dizemos que dois vetores são ortogonais se o produto escalar entre eles é zero.
V ·W
Exercı́cio. Mostre que −1 ≤ ≤ 1. Conclua que podemos definir o ângulo entre dois
kV kkW k
vetores de Rn através do produto escalar.

20.1 Independência Linear em Rn

Analogamente ao que já fizemos, diremos que um conjunto de vetores em Rn é LD se um deles é


combinação linear dos outros e LI caso contrário.

Em R3 existem critérios geométricos que nos ajudam a caracterizar a independência linear, mas
em Rn , é necessário conhecer um critério algébrico.

Para deduzi-lo, considere um conjunto {V1 , . . . , Vk } de vetores de Rn e suponha que sejam LD,
ou seja, que um deles é combinação linear dos outros. Para fixar as ideias, digamos que Vk é
combinação linear de V1 , . . . , Vk−1 . Isto significa que existem escalares a1 , a2 , . . . , ak−1 tais que

Vk = a1 V1 + a2 V2 + · · · + ak−1 Vk−1

ou

a1 V1 + a2 V2 + · · · + ak−1 Vk−1 − Vk = 0,
 
a1
 .. 
o que nos diz que o vetor  .  é solução (não nula) do sistema homogêneo
 
ak−1 
−1

95
x1 V1 + x2 V2 + · · · + xk Vk = 0.

Portanto, é a análise de um sistema homogêneo que determina se V1 , . . . , Vk são LI ou LD: se existir


solução não nula, como no exemplo acima, os vetores são LD. Caso contrário, se o vetor nulo é a
única solução do sistema, nenhum deles é combinação linear dos outros, então os vetores são LI.

Em outras palavras, um conjunto de vetores é LI se e somente se a única maneira de se escrever o


vetor nulo como combinação linear deles é usando todos os escalares iguais a zero.

Exemplos.

1. Dois vetores não paralelos U e V em R2 , como sabemos, são LI. Note que, para escrever o zero
como combinação linear deles, devemos ter o vetor nulo como diagonal de um paralelogramo
com lados αU e βV . Ora, isto só é possı́vel para α = β = 0.

2. Um conjunto de m vetores em Rn com m > n é sempre LD, pois o sistema

x1 V1 + x2 V2 + · · · + xm Vm = 0

tem mais incógnitas que equações, logo sempre tem solução não nula.
     
1 2 0
 2
3 e W =  1 . Para determinar se
   
3. Em R4 , considere os vetores U =  0 , V = 1 −1
−1 1 −3
sãoLD
 ou LI,
 olhe para o sistema homogêneo xU + yV + zW = 0. Resolvendo-o, chegamos
 −2z 
a  z  . Escolhendo z = 1, concluı́mos que −2U + V + W = 0, o que significa que
z
 
qualquer um deles pode ser escrito como combinação linear dos outros dois. Por exemplo,
V = 2U − W . Assim, {U, V, W } é um conjunto LD.

20.2 Subespaços de Rn

Um subespaço de Rn é um conjunto de vetores fechado em relação às operações lineares. Assim, W


é um subespaço de Rn se, dados U, V ∈ W, então aU + bV ∈ W, para quaisquer escalares a e b.
Isto confere a W interesse próprio, e não apenas como subconjunto de Rn . É como se W fosse o
próprio espaço ambiente.

Note que o vetor nulo é uma combinação linear de quaisquer vetores de W, logo todos os subespaços
contêm a origem.

Exemplos.

1. O conjunto formado pelo vetor nulo, {0}, é um subespaço de Rn .

96
2. Uma reta r pela origem é um subespaço de R3 . De fato, quaisquer dois vetores de r são
múltiplos do vetor diretor, logo as combinações lineares deles também.

3. Exercı́cio: um plano pela origem é um subespaço de R3 .

4. O espaço R3 é obviamente subespaço de si mesmo.

Estes são todos os exemplos em R3 . Para se convencer disso, suponha que um subespaço
W ⊂ R3 contenha um vetor não nulo U . Então W contém a reta gerada por U . Há duas
possibiliddes: ou W é exatamente a reta gerada por U ou W contém ainda um vetor V LI com
U (não paralelo). Nese caso, W contém as combinações lineares de U e V , isto é, W contém
um plano pela origem. Se W contém um plano pela origem, ou é exatamente esse plano ou
W contém ainda um vetor W que seja LI com U e V (isto é, U , V e W não coplanares), W é
todo o R3 . E são todos os casos, pois qualquer outro vetor de R3 adicionado à base {U, V, W }
torna o conjunto LD. Um exercı́cio de imaginação nos leva a conjecturar o que acontece para
n > 3.

5. Seja AX = 0 um sistema homogêneo de n equações e k incógnitas, isto é, A é uma matriz n×k.
Então, o espaço das soluções é um subespaço de Rk . De fato, se U e V são soluções, qualquer
combinação linear deles também é: se AU = 0 e AV = 0, então A(aU +bV ) = aAU +bAV = 0.

6. Se W é um subespaço, então o conjunto de todos os vetores ortogonais a W também é um


subespaço, chamado subespaço ortogonal. De fato, este conjunto é dado por W⊥ = {V ∈
Rn | V · W = 0, ∀W ∈ W}. Como o produto escalar respeita combinações lineares, segue que
uma combinação linear de dois vetores de W⊥ ainda está lá.

7. Exercı́cio. Em R3 , o subespaço ortogonal a uma reta pela origem é um plano pela origem e
vice-versa.

8. O espaço gerado pelos vetores V1 , . . . , Vk , definido por ser o conjunto das combinações lineares
deles, é obviamente um subespaço de Rn . É denotado usando-se colchetes: [V1 , . . . , Vk ]. Por
exemplo, em R3 , seja
  
 2a − 3b + c 
W =  a + b − 2c  |a, b, c ∈ R .
−a + 2b − c
 

      
 2 −3 1 
Não é difı́cil ver que se trata de um subespaço, pois W = a  1  + b  1  + c −2 ,
−1 2 −1
 
isto é, é o espaço gerado por três vetores. Mas para melhor descrever W, é necessário per-
guntar se todos os geradores são essenciais. Ou, em outras palavras, se de fato precisamos
de três prarâmetros livres. A resposta está na análise da dependência linear dos geradores:
chamando-os
  de V1 , V2 e V3 , olhe para o sistema homogêneo xV1 +yV2 +zV3 = 0. Sua solução é
 y 
S = y  | y ∈ R . Tomando y = 1, isto significa que V1 + V2 + V3 = 0, ou V3 = −V1 − V2 .
y
 
Assim, V1 , V2 e V3 são LD e V3 está sobrando como gerador, e W = [V1 , V2 ]. Como V1 e V2

97
não são múltiplos, são LI (ambos são essenciais como geradores), logo W é um plano pela
origem.

9. Exercı́cio. Dada uma matriz A com n linhas, mostre que o conjunto {B ∈ Rn | o sistema
AX = B tem solução} é um subespaço do Rn . Sugestão: este conjunto é o espaço gerado
pelas colunas de A.

20.3 Bases e dimensão


Já vimos em R3 a ideia de identificar os geradores que estão “sobrando” e descartá-los; esta ideia
também está presente em Rn . Dado um conjunto de vetores V1 , . . . , Vk , ao descartarmos, um a
um, os que são combinações lineares dos outros, sobrará um conjunto LI. Por exemplo, considere
W = [U, V ] em Rn , onde V = 2U . Ou seja, U e V são LD e podemos escrever W = [U ]. Se U for
não nulo, W pode ser pensado como o conjunto dos múltiplos de U , ou uma “reta pela origem” de
Rn . O processo de encontar um conjunto minimal (LI) de geradores leva ao conceito de base:

Definição. Uma base para um subespaço W de Rn é um conjunto LI de geradores.

Uma boa pergunta para o momento é se todas as bases para um mesmo subespaço tem o mesmo
número de vetores. Quando pensamos no subespaço W, gerado pelos vetores U1 , . . . , Uk , temos
W = {x1 U1 + · · · + xk Uk }, uma representação paramétrica, onde os parâmetros livres são os xj .
Mas já foi visto várias vezes que a representação paramétrica para um subconjunto de Rn não é
única, assim digamos que W também seja descrito pelos geradores V1 , · · · , V` . Ao produzirmos uma
base a partir de cada um dos conjuntos de geradores, reduzindo-os a um conjunto minimal (LI),
chegaremos ao mesmo número de vetores?

A resposta é afirmativa: a demonstração deste fato se faz supondo que {U1 , . . . , Uk } e {V1 , . . . , V`
são ambas bases para W, com k 6= `, e chegando a uma contradição. Vamos apenas ilustrar este
argumento tomando valores particulares k = 2 e ` = 1. Ora neste caso é fácil ver que U1 e U2 são
ambos múltiplos de V1 , logo são múltiplos entre si, portanto LD, o que é uma contradição com o
fato de {U1 , U2 } ser base.

Definição. Dado um subespaço W ⊂ Rn , a dimensão de W é o número de vetores de uma (e


portanto de qualquer) base de W. Este número é denotado por dim W.

Exemplos.

1. Podemos considerar Rn como subespaço de si mesmo. Como uma base para Rn tem n
elementos (tome, por exemplo, a base canônica), temos dim Rn = n.

2. Um plano pela origem em R3 tem dimensão 2 e uma reta pela origem em R3 tem dimensão
1.

3. dim {0} = 0, independente do espaço ambiente.

4. O algoritmo para calcular a dimensão de um dado subespaço é identificar um conjunto de


geradores e descartar os que estão sobrando, se houver, até chegar a um conjunto LI, ou seja,
uma base. Depois é só contar o número de vetores. Por exemplo, seja

98
  

 a + 2b + 3d 

2a + 3b + c + 5d
  
W   |a, b, c, d ∈ R  .
 

 b−c+d 
−a + b − 3c
 

W é certamente um subespaço de R4 já que se trata de um conjunto de combinações lineares


de certos vetores. Mas, embora esta representação paramétrica tenha quatro parâmetros
livres, não se pode dizer imediatamente
 que
 dim
  W = 4. 
Como
  efeito, primeiro identificamos
1 2 0 3
 2  3  1  5
um conjunto de geradores, são eles   0 , 1, −1, 1, e agora verificamos se há
      

−1 1 −3 0
um ou mais sobrando, isto é, se são LD.

Para isto, como já visto, analisamos o sistema linear homogêneo


       
1 2 0 3
2 3 1 5
x
 0  + y 1 + z −1 + w 1 = 0,
      

−1 1 −3 0

 

 −2y − 3w  
y
 
cuja solução é S =  y + w . Então o sistema admite solução não nula e os geradores


 
w
 
de W são LD. Dando valores para y e w, identificamos um gerador que é combinação linear
dos outros. Chame os geradores listados acima de V1 , V2 , V3 e V4 , na ordem em que aparecem.
Escolhendo y = 0 e w = 1, temos V4 = 3V1 − V3 e podemos descartar V4 . Escolhendo y = 1 e
w = 0, temos V2 = 2V1 −V3 e também podemos descartar V2 . Olhando agora para os geradores
que sobrarm, V1 e V3 , vê-se imediatamente que não são múltiplos, formando portanto uma
base para W. Logo dim W = 2. Em outras palavras, W é um plano pela origem em R4 .

A observação, no caso de vetores com coordenadas inteiras, também ajuda e é legı́tima:


poderı́amos ter descartado V4 de imediato, notando que é a soma de V1 com V2 .

Exercı́cios.

1. Verifique que a interseção de dois subespaços de Rn também é um subespaço.

2. Calcule a dimensão da interseção de dois planos pela origem de R3 , para cada possı́vel posição
relativa entre eles.
  
 a+c 
3. Calcule a dimensão de W =  b + c  | a, b, c ∈ R .
a + 2b + c
 

99
4. 
Calcule a dimensão
 do espaço das soluções do sistema homogêneo AX = 0, onde A =
2 2 −1 1
−1 1 2 1 .
1 1 −2 −1
5. Todos os subespaços de Rn podem ser vistos como soluções de sitemas homogêneos. Para ver
isto, seja W um subespaço, e seja {U1 , . . . , Uk } uma base para W. Mostre que o subespaço
ortogonal a W é a solução do sistema homogêneo [U1 , . . . , Uk ]t X = 0. Mostre que dim W⊥ =
n − k. Supondo que {V1 , . . . , Vn−k } seja uma base para W⊥ , mostre que W é a solução
do sistema homogêneo [V1 , . . . , Vn−k ]X = 0. Sugestão: faça primeiro em R3 e interprete
geometricamente, para “sentir” o que acontece em dimensões maiores.

6. Sejam W1 e W2 dois subespaços de dimensão 3 em R4 , calcule dim W1 ∩ W2 para todas as


possı́veis “posições relativas” entre W1 e W2 .

21 Diagonalização de Matrizes

Parte deste conteúdo já foi visto quando estudamos cônicas, soluções de equações quadráticas em
R2 . Lá, associamos a cada equação uma matriz simétrica 2 × 2, para a qual encontramos uma base
ortonormal de autovetores, que por sua vez definia um novo sistema de coordenadas, com eixos
paralelos aos eixos de simetria da cônica; isto acontece porque na base de autovetores, a matriz é
diagonal.

Vamos estudar um pouco mais de diagonalização de matrizes, em dimensões maiores e sem que
necessariamente sejam simétricas. A sequência será mudança de base em Rn , autovalores e au-
tovetores para matrizes quadradas de ordem n, condições suficientes para que uma matriz seja
diagonalizável (ou para que não seja), diagonalização de matrizes simétricas.

Os teoremas serão enunciados sem demonstração, pois não fazem parte do objetivo deste curso. Na
verdade, os resultados serão ilustrativos e úteis para tomarmos alguns atalhos nas contas, mas o
cálculo de todos os autovalores e autovetores de uma dada matriz é suficiente para concluir se ela
é ou não diagonalizável.

21.1 Mudanças de base em Rn e definições básicas

A base canônica de Rn , em analogia à do R3 , é denotada por B0 e definida pelos vetores ej , que


têm 1 como entrada na j-ésima linha e zero em todas as outras. Em R2 e R3 , usamos as notações
particulares {i, j} e {i, j, k}.

Sejam (x1 , . . . , xn ) as coordenadas usuais de Rn , definidas pela base canônica e (x01 , . . . , x0n ), coorde-
nadas na base B = {V1 , . . . , Vn }. Dado um vetor qualquer U ∈ Rn , comparando as decomposições
de U nas bases B0 e B, temos

x1 e1 + · · · + xn en = x01 V1 + · · · x0n Vn ,

100
que é o mesmo que escrever X = AX 0 , onde A = [V1 , . . . , Vn ] (colunas). É imediato que det A 6= 0
e que X 0 = A−1 X é uma equação equivalente.

Já vimos que matrizes quadradas de ordem 2 podem ser vistas como movimentos do plano, isto
é, funções de R2 em R2 que “transformam” um vetor em outro via multiplicação. O mesmo
pode
 serfeito em qualquer dimensão. Só a tı́tulo de exemplo, lembre-se que a muliplicação por
0 −1
é uma rotação de 90o no sentido positivo. Tente se convencer que a muliplicação por
1 0 
0 −1 0
M = 1 0 0  é a rotação de 90o em torno do eixo z seguida da reflexão no plano xy em
0 0 −1  
2 0 0
R3 , enquanto que a multiplicação por N = 0 2 0 dilata (multiplica pelo escalar 2) vetores
0 0 1
do plano xy e não muda vetores do eixo z. Em geral, dado um vetor U ∈ R3 , para saber quem
é N U , basta decompô-lo em uma soma de um vetor no plano xy com um vetor no eixo z, já que
multiplicação de matrizes respeita combinações lineares.

Quando fazemos uma mudança de base, podemos imaginar que estamos mudando o ponto de vista
do observador do movimento causado pela multiplicação por uma matriz M , de modo que ele
enxergue esta ação pela multiplicação por uma outra matriz, digamos N , que, é claro, depende de
M . A mudança de coordenadas das canônicas (X) para as definidas pela base B (X 0 ) se faz através
da multiplicação por A−1 , onde A é a matriz cujas colunas são os vetores de B. Assim, N também
vai depender de A.

Com estas ideias, tentemos entender o movimento causado por N em (Rn , B), ou seja, em Rn
com as coordenadas X 0 . Primeiro, “voltamos” para (Rn , B0 ), pela multiplicação por A. Ou seja,
dado U ∈ (Rn , B), temos AU ∈ (Rn , B0 ). Agora multiplicamos por M , gerando o movimento
propriamente dito em (Rn , B0 ), obtendo o vetor M AU ∈ (Rn , B0 ). Finalmente, mudamos no-
vamente de coordenadas, de X para X 0 através da multiplicação por A−1 , chegando ao vetor
A−1 M AU ∈ (Rn , B).

Então, para qualquer vetor U , temos N U = A−1 M AU ∈ (Rn , B). Isto determina completamente
a matriz N a partir de M e A: N = A−1 M A. Como sempre, enfatizamos que as equações
M = AN A−1 e M A = AN são equivalentes. Isto motiva as seguintes definições.

Definição. Duas matrizes quadradas M e N são semelhantes ou conjugadas se existe uma matriz
A invertı́vel (de mesma ordem) tal que M = AN A−1 .

Sob este ponto de vista, diagonalização de matrizes nada mais é que perguntar se existe uma matriz
diagonal semelhante a M :

Definição. Uma matriz quadrada M é diagonalizável se é semelhante a uma matriz diagonal, isto
é, se existem matrizes D diagonal e A invertı́vel tais que M = ADA−1 .
 
λ1 0 · · · 0
Como esta equação é equivalente a M A = AD, se A = [V1 , . . . , Vn ] (colunas) e D =  ... ... . . . ... ,
 
0 0 · · · λn
−1
usando multiplicação de matrizes vemos que escrever M = ADA é o mesmo que escrever

101
[M V1 , . . . , M Vn ] = [λ1 V1 , . . . , λn Vn ],

e, comparando as colunas, vemos que cada coluna de A é um vetor não nulo (que, portanto, define
uma direção) que é levado por M num múltiplo de si mesmo, ou seja, trata-se de uma direção
invariante, expressão que já escutamos ao falarmos de autovetores:

Definição. Dada uma matriz M n × n, um autovetor de M é um vetor não nulo V ∈ Rn para o


qual existe um escalar λ (o autovalor associado) tal que M V = λV .

Com estas observações, dizer que uma matriz M é diagonalizável é o mesmo que dizer que existe
uma base de Rn formada por autovetores de M ; eles serão as colunas da matriz A. Ou ainda, é o
mesmo que dizer que existe uma base que define coordenadas em Rn nas quais a multiplicação por
M é a multiplicação por uma matriz diagonal.

21.2 Matrizes diagonalizáveis e não diagonalizáveis

Para verificar se uma dada matriz M é ou não diagonalizável, tratamos de encontar seus autovetores,
para saber se existe ou não uma base de Rn formada por eles. Para isso, como já vimos em dimensão
2, temos que encontrar os autovalores de M . A partir de M V = λV , chegamos a (M − λI)V = 0 e,
como queremos V 6= 0, exigimos det(M − λI) = 0. Esta equação é uma equação polinomial de grau
n (igual à ordem da matriz), chamada equação caracterı́stica. O polinômio de grau n det(M − λI)
é chamado polinômio caracterı́stico de M .

Autovalores são raı́zes reais da equação caracterı́stica, assim, um motivo para uma matriz não ser
diagonalizável é a equação caracterı́stica não ter raı́zes reais em número suficiente.
 
0 −1
Por exemplo, a rotação M = tem como equação caracterı́stica λ2 + 1 = 0, que não tem
1 0
raı́zes reais, logo não existem autovalores, logo M não é diagonalizável. De fato, geometricamente
é claro que não existem direções invariantes.

O outro motivo para uma matriznão ser  diagonalizável é a falta de autovetores. Isto acontece,
2 1
por exemplo, para a matriz M = , cuja equação caracterı́stica é (λ − 2)2 = 0 que tem duas
0 2
raı́zes reais e iguais. Então há autovalores em número suficiente,
 mas,   ao calcularmos os autovetores
0 1 x
associados ao autovalor duplo λ = 2, chegamos ao sistema = 0, cuja solução é o eixo
0 0 y
x. Assim, não existe uma base de R2 formada por autovetores de M , já que todos os autovetores
são múltiplos.

Não é uma coincidência este fato ocorrer para raı́zes múltiplas da equação caracterı́stica:

Teorema. A autovalores distintos de uma matriz M estão associados autovetores LI.

Assim, é imediato concluir que uma matriz M de ordem n que tem n autovalores distintos é
diagonalizável, pois n vetores LI em Rn formam uma base.

102
Outra conclusão é que, havendo autovalores em número suficiente, contados com multiplicidade,
então somente poderá haver “falta de autovetores” para os autovalores múltiplos. Vamos tornar
este conceito um pouco mais preciso:

Definição. Dada uma matriz M n × n, para cada autovalor λ, o autoespaço associado a λ é o


subespaço Sλ ⊂ Rn , o espaço solução do sistema homogêneo (M −λI)X = 0. Isto é, Sλ é o conjunto
de todos os autovetores de M associados a λ.

Então, a dimensão de um autoespaço é no mı́nimo 1, já que, se existe autovalor, existe autovetor.
A “falta de autovetores” está relacionada com o fato de um autoespaço não atingir sua dimensão
máxima. Para continuar a formalizar, vamos lembrar alguns resultados básicos sobre polinômios
caracterı́sticos e sua fatoração.

Primeiramente, note, pela própria definição, que o polinômio caracterı́stico de uma matriz n × n
tem grau n e o coeficiente de λn é 1 ou −1.

A seguir, um fato geral sobre polinômios de grau n é que em sua fatoração, além do fator de
grau zero (o coeficiente de λn ), aparecem apenas fatores de grau 1 (da forma (λ − a)) ou fatores
irredutı́veis de grau 2 (polinômios quadráticos sem raı́zes reais). E, como você já deve ter percebido,
fatores da forma (λ − a)k são a multiplicação de k fatores iguais de grau 1 e significam que a é
uma raı́z de multiplicidade k do polinômio caracterı́stico. Em outras palavras, este polinômio tem
entre suas raı́zes “k raı́zes reais e iguais a a”. É claro que a soma dos graus dos fatores é igual a n.
A ocorrência de fatores irredutı́veis de grau 2 no polinômio caracterı́stico de uma matriz é o que
chamamos anteriormente de falta de autovalores e constitui motivo para a não diagonalização da
matriz.

Definição. O grau algébrico de um autovalor a de uma matriz M é o grau de a como raiz do


polinômio caracterı́stico, isto é, o grau do fator (λ − a) em sua fatoração. A notação é g(a).

Teorema. Para cada autovalor a da matriz M , tem-se 1 ≤ dim Sa ≤ g(a). Assim, a dimensão
máxima que o autoespaço associado a a pode assumir é o grau algébrico de a como raiz da equação
caracterı́stica.

Logo:

Teorema. Uma matriz M n × n é diagonalizável se e somente se seu polinômio caracterı́stico


p(λ) tem n raı́zes reais, contadas com multipliciade, e a dimensão de cada autoespaço associado é
máxima.

Vamos fazer um resumo-ilustração dessas ideias para matrizes 3 × 3, nosso ambiente será, portanto,
o R3 . Na alálise a seguir, tomamos o coeficiente de λ3 no polinômio caracterı́stico como 1, mas
nada mudaria se fosse −1, já que as raı́zes são as mesmas.
1. p(λ) tem três raı́zes reais e distintas. Assim, p(λ) = (λ−a)(λ−b)(λ−c). Então, os autoespaços
Sa , Sb e Sc são gerados por vetores LI, logo estes geradores formam uma base de R3 , logo a
matriz M é diagonalizável. A matriz  D, a menos de multiplicação por escalar, é a matriz dos
a 0 0
autovalores, isto é, D = 0 b 0. A matriz A terá como colunas autovetores associados a
0 0 c
a, b e c respectivamente.

103
2. p(λ) tem apenas uma raiz real. Assim, p(λ) = (λ − a)q(λ), onde q(λ) é um fator irredutı́vel
de grau 2. A matriz M não é diagonalizável por falta de autovalores.
2
3. p(λ) tem três raı́zes reais, mas uma delas é dupla. Assim, p(λ) = (λ − a)  (λ − b), com
a 0 0
a 6= b. Nesse caso, na tentativa de diagonalizar M escrevemos D = 0 a 0. sabemos que
0 0 b
dim Sb = 1, tomamos um gerador desta reta para ser a terceira coluna da matriz A. Mas,
de acordo com os resultados acima, temos duas possibilidades para dim Sa : 1 ou 2. Se for
dim Sa = 2, então Sa é um plano transversal à reta Sb e tomando uma base para este plano,
teremos as duas primeiras colunas da matriz A; concluindo que M é diagonalizável. E, se for
dim Sa = 1, concluı́mos que M não será diagonalizável por falta de autovetores.

4. p(λ) tem três raı́zes reais e iguais, ou uma raiz tripla. Assim, p(λ) = (λ − a)3 . Aqui, temos
1 ≤ dim Sa ≤ 3. Se for o caso de dimensão máxima, isto é, dim Sa = 3, então existe uma base
de Sa , que nesse caso é o próprio R3 , formada por autovetores de M e a matriz
 é diagonalizável

a 0 0
(é um exercı́cio mostrar que isto só ocorre se M já é a matriz diagonal 0 a 0). Nos
0 0 a
outros casos, isto é, se dim Sa for igual a 1 ou 2, então a matriz M não é diagonalizável por
falta de autovetores.

21.3 Matrizes simétricas

Matrizes simétricas são sempre diagonalizáveis por uma matriz ortogonal (colunas formam uma
base ortonomral), a exemplo do que já sabemos em R2 .

Teorema. Se M é uma matriz simétrica n × n, então:

1. M tem n autovalores, contados com multiplicidade.

2. Se a é um autovalor de M , então dim Sa = g(a), ou seja, todos os autoespaços têm dimensão


máxima.

3. A autovalores distintos estão associados autoespaços ortogonais.

Para concluir que existe uma base ortonormal que diagonaliza M , falta apenas mostrar que, dado
um autoespaço Sa , podemos escolher (construir) uma base ortonormal para Sa . Este processo,
chamado ortogonalização de Gram-Schmidt, se faz a partir de projeções ortogonais.

Definição. Dados dois vetores U e V em Rn , sendo U não nulo, a projeção ortogonal de V sobre
U é a projeção ortogonal do ponto final de V na reta gerada por U . Lembre-se que desde que
começamos a falar de subespaços, sempre consideramos vetores com ponto inicial na origem. A
projeção de V sobre U é denotada por P rojU V e é claramente um múltiplo de U . Não é difı́cil
V ·U
achar qual é o escalar, deduzindo - faça como exercı́cio - que P rojU V = U . Outro exercı́cio
U ·U
que o leitor deve fazer é mostrar que V − P rojU V é ortogonal a U .

104
Assim, se um subespaço W de Rn tem dimensão 2, com base, digamos {V, W }, para acharmos
uma base ortonormal, primeiro vamos encontrar uma base ortogonal: decomponha W como soma
de dois vetores, W = W1 + W2 , sendo W1 paralelo a V e W2 ortogonal. O vetor W1 , isto é, a
componente de W paralela a V é inútil como gerador de W, pois V já gera essa direção. Assim,
substituı́mos a base {V, W } pela base ortogonal {V, W2 }. Em termos da projeção ortogonal, basta
tomar W1 = P rojV W e W2 = W − P rojV W . Como queremos uma base ortonormal, ainda falta
normalizar,
 istoé, dividir pela norma: a base procurada, formada por vetores ortogonais e unitários,
V W2
é , .
kV k kW2 k

Em geral, se dim W = k, dada uma base {V1 , . . . , Vk }, para conseguir uma base ortogonal, or-
togonalize, como acima, o conjunto {V1 , V2 } projetando V2 sobre V1 e descartando a componente
paralela, obtendo {V1 , W2 }. Agora tome V3 , projete-o ortogonalmente sobre o plano gerado por V1
e W2 ; isto se faz considerando a soma das projeções em cada uma das direções: P roj[V1 ,W2 ] V3 =
P rojV1 V3 + P rojW2 V3 . Descarte a componente de V3 nese plano, tomando W3 = V3 − P roj[V1 ,W2 ] V3 .
Proceda indutivamente, projetando V4 no espaço gerado por V1 , W2 e W3 e tomando apenas a com-
ponente ortogonal W4 e assim por diante. Como a dimensão de W é finita (afinal é um subespaço
de Rn ), em algum momento chegaremos a uma base ortogonal {V1 , W2 , · · · , Wk } que, normalizada,
será uma base ortonormal.

Assim, para matrizes simétricas M , existem matrizes diagonal D e ortogonal A tais que M =
ADA−1 .

21.4 Exemplos e exercı́cios

O enunciado é sempre o mesmo: “verifique se a seguinte matriz (M ) é diagonalizável. Em caso


negativo, justifique. Em caso afirmativo, determine matrizes D diagonal e A invertı́vel tais que
M = ADA−1 . Se M for simétrica, A deve ser ortogonal.” Claro, chegue ao final dos cálculos
apenas se sentir necessidade.

1. As matrizes dos exercı́cios 6.1.1, 6.1.2, 6.1.3 e 6.1.4 e 6.2.1 do livro (online) do Reginaldo.

2. Faça, se quiser, os exercı́cios teóricos 6.1.14, 6.1.15 e 6.1.19 do livro (online) do Reginaldo

105

Você também pode gostar