Você está na página 1de 118

Geometria Analı́tica

Seme Gebara Neto


26 de junho de 2023

Sumário
1 A reta real, equações lineares em uma incógnita 2

2 Equações lineares em duas incógnitas, plano cartesiano 4

3 Vetores no plano 7

4 Coordenadas para vetores 9

5 Produto escalar 12

6 Retas em R2 15

7 Sistemas lineares de duas equações e duas incógnitas 19

8 Inversão de matrizes em R2 24

9 Multiplicação de matrizes como movimentos do plano 29

10 Formas quadráticas em R2 33

11 Equações quadráticas no plano, cônicas 36

12 Sistemas de coordenadas no plano dados por uma origem e uma base 42

13 Mudanças de base no plano 44

14 Eixos de simetria de ax2 + bxy + cy 2 = d 48


14.1 Autovetores e autovalores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
14.2 Matrizes ortogonais 2x2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
14.3 Diagonalização de matrizes simétricas 2 × 2 . . . . . . . . . . . . . . . . . . . . . . 54

15 Mudança de origem 57

16 Equações quadráticas em sua forma geral 59

1
17 Geometria Analı́tica Espacial 64
17.1 Alguns fatos básicos de Geometria Euclidiana espacial . . . . . . . . . . . . . . . . . 64
17.2 Pontos e vetores em R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
17.3 Retas e planos no espaço . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
17.4 Produto vetorial e determinantes 3 × 3 . . . . . . . . . . . . . . . . . . . . . . . . . 77
17.5 Retas reversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
17.6 Distâncias e Ângulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

18 Sistemas de Equações Lineares 93


18.1 Definições e exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
18.2 Possibilidades qualitativas de soluções de sistemas . . . . . . . . . . . . . . . . . . . 96
18.3 Escalonamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
18.4 A forma escalonada e reduzida de uma matriz . . . . . . . . . . . . . . . . . . . . . 98
18.5 Determinantes e escalonamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
18.6 Inversão de matrizes e escalonamento . . . . . . . . . . . . . . . . . . . . . . . . . . 102
18.7 Independência Linear em R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
18.8 O teorema de caracterização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
18.9 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

19 Espaços Euclidianos Rn 107


19.1 Independência Linear em Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
19.2 Subespaços de Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
19.3 Bases e dimensão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

20 Diagonalização de Matrizes 112


20.1 Mudanças de base em Rn e definições básicas . . . . . . . . . . . . . . . . . . . . . . 113
20.2 Matrizes diagonalizáveis e não diagonalizáveis . . . . . . . . . . . . . . . . . . . . . 115
20.3 Matrizes simétricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
20.4 Exemplos e exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

1 A reta real, equações lineares em uma incógnita

Já conhecemos um modo de se representar geometricamente os números reais: através de um


sistema de coordenadas para uma reta. Dada uma reta r, escolhemos dois de seus pontos para
representar os números 0 e 1, digamos que o ponto A represente o 0 e o B represente o 1.

Isto confere à reta r uma origem, uma unidade de medida (o comprimento do segmento AB) e um
sentido positivo (de A para B). Comparando com o segmento unitário AB, vamos identificar os
pontos da reta com os números reais.

Dado um ponto P ∈ r, vamos associar a P um número real t comparando os segmentos (orientados)


AP e AB. Se P = A, então, t = 0. Supondo P e A distintos, os segmentos orientados AP e AB
podem ter o mesmo sentido ou sentidos opostos. No primeiro caso, o número real t será positivo,
no segundo caso teremos t < 0. Denotando por kAP k o comprimento do segmento AP , medido na
unidade kABk, teremos |t| = kAP k. O sinal de t representa o sentido do segmento orientado AP
quando comparado com o de AB.

2
Em outras palavras, munir uma reta de um sistema de coordendas é transformá-la numa fita métrica
infinita, bastando estabelecer a origem (A), a unidade de medida (kABk) e o sentido positivo (de
A para B).
−→
Um modo de se abreviar isto é usar a notação AB para representar o segmento orientado, que
−→ −→
começa em A e termina em B. Assim, podemos escrever AP = tAB para simbolizar o modo como
o ponto P determina o número real t.
−→ −→ −→ −→
Na ilustração abaixo, temos AP = 2AB e AQ = − 12 AB, isto é, o ponto P detrmina o número real
2 e o ponto Q determina o número real − 12 .

P
B
Q A
−→
AP

−→
AQ

figura 1

Reciprocamente, dado um número real t, ele determina um único ponto P da reta r, de modo que
−→ −→
AP = tAB, ou seja, o ponto P está definido pelo fato de kAP k = |t| (na unidade kABk) e o sinal
de t determina se os segmentos AP e AB têm mesmo sentido (caso t > 0) ou sentidos opostos (caso
−→ −→
t < 0). Se t = 0, então claramente P = A. Observamos o poder de sı́ntese da notação AP = tAB.

Segmentos orientados recebem o nome de vetores e trataremos deles com mais detalhes em breve.

Uma reta munida de um sistema de coordenadas chama-se eixo. Note que para estabelecer um
sistema de coordenadas numa reta foi necessário escolher dois pontos distintos. Ou, de modo
−→
equivalente, o ponto A e o segmento orientado AB. Diferentes pessoas ou diferentes situações
podem considerar outros dois pontos da reta para estabelecer um sistema de coordenadas. Pra
medir uma rua, por exemplo, posso escolher uma esquina para ser a origem, enquanto meu vizinho
escolheria outra. E ainda há duas escolhas para o sentido positivo. O que se quer enfatizar aqui é
que uma reta pode ter diferentes sistemas de coordenadas, isto é, a mesma fita pode ter diferentes
−→
graduações, dependendo da escolha de A e AB.
−→
A figura 2 abaixo ilustra a situação. O ponto A, no sistema definido por A e AB representa o
−−→
número 0, mas no sistema definido por C e CD representa um número positivo maior que 1.

B C D A

figura 2

Essa discussão está presente na análise de equações lineares em uma incógnita real.

3
A forma geral de uma equação linear com uma incógnita real é

ax = b,

onde a e b são números reais dados. O termo linear significa que trata-se de uma equação polinomial
de grau 1.

O conjunto solução da equação, que nesse texto será sempre denotado por S, é um subconjunto do
conjunto R dos números reais e a análise, já suficientemente conhecida, é a seguinte:

ˆ Se a 6= 0, então existe uma única solução x = ab . Em outras palavras, S é o conjunto unitário


S = { ab }. A localização desse ponto num eixo depende do sistema de coordenadas escolhido.

ˆ Se a = 0, há duas possibilidades:

– se b 6= 0, então não existe solução (ou seja, S = ∅),


– se b = 0, então qualquer número real é solução (ou seja, S = R).

Exercı́cio 1.1 Compare as duas discussões acima e dê exemplos cotidianos do uso de equações
lineares.

2 Equações lineares em duas incógnitas, plano cartesiano

Dizer que a equação é linear é o mesmo que dizer que a equação é polinomial de grau 1 nas

incógnitas, que agora serão x e y. Desse modo não há termos tipo cos x, y, x1 e nem mesmo xy,
já que este produto tem grau 2. A forma geral de uma equação linear com duas incógnitas é

ax + by = c,

onde a, b e c são números reais dados.

O conjunto solução S é agora um conjunto de pares ordenados de números reais. Por exemplo,
para a equação 3x − y = 1, temos (1, 2) ∈ S, enquanto (0, 0) 6∈ S. Já para uma equação homogênea,
isto é, quando c = 0, o par ordenado (0, 0) sempre faz parte da solução.

Conhecemos uma maneira geométrica de representar o conjunto de todos os pares ordenados de


números reais: o plano cartesiano. Isto é, a escolha de um sistema de coordenadas para o plano
que o torna o conhecido “plano xy”. Um sistema como este (cartesiano) consiste de dois eixos
perpendiculares, ambos com origem no ponto de interseção, com mesma unidade de medida e
ordenados de maneira que, quando percorremos o ângulo reto do sentido positivo do primeiro eixo
(o eixo x) para o sentido positivo do segundo (o eixo y), o giro é anti-horário. O plano cartesiano,
ou plano xy, ou plano coordenado, será denotado por R2 , o produto cartesiano de R por R.

A convenção é que o sentido anti-horário seja chamado de sentido positivo de percurso do cı́rculo
(dos ângulos).

A associação de pontos do plano cartesiano e pares ordenados de números reais é via projeções
perpendiculares do ponto aos eixos. Vamos usar o sinal de igualdade entre pontos (que são objetos
geométricos) e pares ordenados (algébricos) quando estiverem identificados.

4
Nem todas as equações lineares da forma ax+by = c devem num primeiro momento ser interpretadas
geometricamente, como por exemplo, se queremos saber quantas moedas de 5 centavos e quantas
moedas de 25 centavos devemos juntar para chegar a R$ 5,00 (note que há várias soluções).

No entanto, de maneira geral, se x e y podem ser números reais quaisquer, o conujunto solução
de ax + by = c pode ser visto como um subconjunto de R2 . Do ensino médio sabemos que uma
equação desse tipo representa uma reta.

De fato, voltando ao exemplo 3x − y = 1, já vimos que A = (1, 2) ∈ S e é fácil achar mais uma
solução, por exemplo, B = (0, −1). Afirmamos que o conjunto S é exatamente a reta r que passa
por (1, 2) e (0, −1). Para ver isso, Seja P = (a, b) um ponto qualquer da reta, distinto de A e B.
Traçando paralelas ao eixo y pelos pontos A e P , e uma paralela ao eixo x por B, obtemos nos
cruzamentos os pontos D = (1, −1) e E = (a, −1). A conclusão, da semelhança entre os triângulos
BAD e BP E, é:
a b+1
P ∈r⇒ = ⇒ 3a − b = 1 ⇒ P ∈ S
1 3
.
y y = 3x − 1

P
b

O
1 a x

B −1 D E

figura 3

De maneira similar, se tomamos um ponto genérico da solução S, isto é, um par ordenado P = (a, b)
que satisfaz 3a − b = 1, então a1 = b+1
3
e, por semelhança de triângulos, concluı́mos que P ∈ r.

Isso significa que os conjuntos r (a reta por A e B) e S (solução da equação 3x − y = 1) são iguais.

Uma maneira de se enxergar a equação 3x − y = 1 é como um produto de uma matriz linha 1 × 2


por uma matriz coluna 2 × 1 sendo igual a uma constante, dadas a matriz linha e a constante.
 
 x
3 −1 = 1.
y

5
Em tempo: o produto de uma matriz linha por uma matriz coluna está definido sempre que ambas
têm o mesmo número de entradas  eé a soma dos produtos das entradas correspondentes. Por
 x
exemplo, no caso acima, 3 −1 = (3)(x) + (−1)(y) = 3x − y e no caso geral de matrizes de
  y
 c
duas entradas tem-se a b = ac + bd. Um exemplo envolvendo matrizes de três entradas é
  d
 2
1 3 4  0  = (1)(2) + (3)(0) + (4)(−1) = −2 e assim por diante.
−1

Exercı́cio 2.1 No caso da reta de equação 3x − y = 1, a matriz 3 −1 , chamada matriz dos
coeficientes, tem um significado geométrico: desenhando o segmento que liga a origem O ao ponto
F = (3, −1), demonstre que o ângulo entre o segmento OF e a reta r é o que parece, ou seja, é
reto.
y

y = 3x − 1

O 3
x

−1
F

figura 4
 
 x
A análise completa da equação a b = c é a seguinte:
y
ˆ Se a b 6= 0 0 , S é uma reta em R2 .
 

ˆ Se a b = 0 0 , então S = ∅ quando c 6= 0 e S = R2 quando c = 0.


 

Exercı́cio 2.2 1. No exemplo do texto, ambos os coeficientes, de x e de y na equação eram não


nulos. Qual é a reta solução quando apenas um deles é nulo?
2. Determine t ∈ R tal que o ponto (3t, 2 − t) esteja no conjunto solução de x − y = 0. Desenhe
a situação no plano cartesiano.
3. O ponto (3, −2) pertence à solução da equação 4x + 2y = 1? Por quê? Desenhe a situação
no plano cartesiano.
4. Dê exemplos de aplicação de equações lineares em duas incógnitas.

6
3 Vetores no plano

O conceito de vetor importante para matemática, fı́sica e aplicações e nos ajudará a descrever ob-
jetos geométricos no plano cartesiano. O que vamos fazer antes de pensarmos em coordenadas é
intrı́nseco, e veremos que ocorre exatamente da mesma maneira para vetores no espaço tridimen-
sional.

Certas grandezas, como força e velocidade, são chamadas vetoriais, por dependerem apenas de
intensidade, direção e sentido. Chamaremos de vetores segmentos orientados do plano, carac-
−→
terizados por terem um ponto inicial A e um ponto final B, e escreveremos AB.
−→
O comprimento do segmento, também chamado módulo ou norma do vetor, denotado por kABk,
representa a intensidade da grandeza vetorial. Os pontos A e B, quando distintos, determinam uma
−→
reta, que por sua vez representa a direção da grandeza vetorial envolvida. Quando A = B, AB é
chamado de vetor nulo e não há direção associada (o que não tem importância nenhuma: também
−→
se poderia dizer que todas as direções estão associadas ao vetor nulo). Se A 6= B, os vetores AB
−→ −→ −→
e BA diferem apenas no sentido, pois a direção de ambos é dada pela reta AB e kABk = kBAk.
Quando se trata do vetor nulo, não há como definir o sentido.

O conceito de direção merece algum comentário. Uma reta define uma direção, mas uma direção
não determina uma reta. Uma direção é apenas representada por uma reta, e por qualquer outra
paralela a ela. Assim, quando falamos em direção, falamos do conjunto de (todas as) retas paralelas
a uma reta dada. Para determinar uma reta, além de uma direção, é necessário localizá-la, indicando
um ponto por onde ela passe.
−→
Por definição, dois vetores são iguais quando têm mesmos módulo, direção e sentido, isto é, AB =
−−→
CD se as retas AB e CD são paralelas, os segmentos AB e CD são congruentes e o sentido de
percurso é o mesmo. Em outras palavras, se os pontos A, B, C e D não estão alinhados, então
ABDC é um paralelogramo e o sentido dos lados opostos AB e CD é o mesmo.
A
~v
B

C
~v
D

figura 5

Assim, um vetor ~v é uma coleção de segmentos orientados, todos paralelos, de comprimentos iguais
e com mesmo sentido. O vetor ~v pode ser representado por qualquer um desses segmentos
orientados.

Existem operações que podem ser definidas com vetores, baseadas em observações do comporta-
mento de grandezas vetoriais, como força, por exemplo (lembre-se do conceito de força resultante,
que nada mais é do que a adição vetorial das forças envolvidas).

Definimos a adição ou soma de dois vetores ~v e w


~ da seguinte maneira. Escolha um ponto qualquer
−→
do plano, chame-o de A. O único representante de ~v com ponto inicial A, digamos ~v = AB,

7
−−→
determina o ponto B. O representante w~ = BC com ponto inicial B determina o ponto C. Então
−→
~v + w
~ = AC. Veja a figura 6.
B0
~v
0
A w~

B ~v + w
~
~v C0
A w
~

~v + w
~
C

figura 6

Observações 3.1

1. Esta definição não depende do ponto A escolhido: tivéssemos escolhido outro ponto A0 , os
−−→ −−→
pontos B 0 e C 0 estariam determinados por ~v = A0 B 0 e w~ = B 0 C 0 e o segmento A0 C 0 resul-
−−→ −→
taria com mesmos módulo, direção e sentido de AC, ou seja, A0 C 0 = AC (congruência de
triângulos).

2. O vetor nulo, denotado por ~0, é tal que ~v + ~0 = ~0 + ~v = ~v para todo vetor ~v .

3. Se ~v e w
~ são paralelos (isto é, têm mesma direção), então ~v + w
~ ainda é paralelo a ambos,
pois na escolha de representantes teremos os pontos A, B e C alinhados (desenhe).

Se ~v e w
~ são ambos não nulos e não são paralelos, pode ser aplicada a regra do paralelogramo: escolha
−→
um ponto A do plano e tome os representantes para ~v e w ~ começando de A, digamos ~v = AB e
−→
w
~ = AC. Nesse caso os vetores ~v e w ~ (ou os pontos A, B e C) determinam um paralelogramo com
quarto vértice D; chamamos ABDC de paralelogramo gerado por ~v e w. ~ Nesse caso, a adição ~v + w
~
−−→ −→ −−→
está representada pela diagonal AD. Isto é devido ao fato de que os lados opostos AC e BD do
paralelogramos representam o mesmo vetor w. ~

B
~v
A ~v + w
~
D
w
~

figura 7

A partir da definição (ou da regra do paralelogramo, quando aplicável) vemos imediatamente que
~v + w
~ =w ~ + ~v quaiquer que sejam os vetores ~v e w.
~

8
Definimos agora a multiplicação de vetor por escalar. A palavra “escalar” quer dizer número real.
Uma grandeza escalar é caracterizada por apenas um número real. A massa, por exemplo, que
pode ser medida em gramas. Ou a temperatura, que pode ser medida em graus Celcius.

A multiplicação do vetor ~v pelo escalar α ∈ R resulta num vetor. Para caracterizarmos o vetor α~v
é preciso definir seu módulo, sua direção e seu sentido:
ˆ kα~v k = |α|k~v k. Isto significa em particular que se α = 0 ou se ~v = ~0, então α~v = ~0.

ˆ α~v tem a mesma direção de ~v .

ˆ α~v tem o mesmo sentido de ~v quando α > 0 e sentido oposto a ~v quando α < 0.

~v 2~v −~v

1
2
~v

figura 8

As operrações de adição de vetores e multiplicação de vetor por escalar são chamadas operações
lineares, e logo veremos o porquê deste nome. Uma boa ilustração para o caso de adição de vetores
é um diagrama de forças atuando numa massa num plano inclinado. Faça alguns desenhos e pense
no assunto, a força resultante é o resultado da soma vetorial das forças envolvidas.

4 Coordenadas para vetores

O que fizemos até aqui sobre vetores não depende de um sistema de coordenadas, mas quando
queremos tratar algebricamente com tais objetos, vamos precisar. Considere um sistema de co-
ordenadas cartesianas para o plano e seja O a origem de R2 (O = (0, 0)). Dado um vetor ~v no
−→
plano, considere seu representante que tem ponto inicial na origem, digamos que seja ~v = OP .
As coordenadas de ~v são definidas como as coordenadas de seu ponto final P . Como cada vetor
no plano tem um único representante com ponto inicial na origem, concluı́mos que os conjuntos
{ vetores no plano } e { pontos no plano } são representados algebricamente da mesma maneira: o
conjunto de pares ordenados de números reais.

Podemos representar o conjunto de pares ordenados de números reais tanto por matrizes
 linha

x
{(x, y)|x, y ∈ R} (podendo ou não usar a vı́rgula) como por matrizes coluna |x, y ∈ R .
y
Nesse texto, usaremos preferencialmete as colunas.

Não é difı́cil
  concluir  que
 a adição de vetores
 se comporta bem em coordenadas. Isto significa que
a c a+c
se ~v = ew
~= , então ~v + w
~= . Convença-se disso, fazendo alguns desenhos com
b d b+d
exemplos numéricos.

9
−→
Exemplo 4.1 Suponha que w ~ = AB, com A = (3, −1) e B = (1, 5). Quais são as coordenadas de
w?
~ Isto se resolve com um desenho e com a definição de adição de vetores.

y
P
6
B
w
~
w
~

−2 O x
A

figura 9

−→
Sabemos que as coordenadas de w ~ são as coordenadas do ponto P quando w ~ = OP . Olhando para
a figura, não é difı́cil concluir, já que as coordenadas são todas números inteiros, que w
~ = (−2, 6).
−−→ −→ −−→ −→
De maneira geral, temos, pela definição de adição, OB = OA + w, ~ ou seja, w ~ = OB − OA.
−→ −−→
Como as coordenadas dos vetores OA e OB coincidem com as coordenadas dos pontos A e B
respectivamente, chegamos a
     
−→ 1 3 −2
w~ = AB = − =
5 −1 6

−→
Não havendo risco de confusão entre pontos
√ e vetores, podemos resumir isso como AB = B √ − A.
Por exemplo, o vetor que liga o ponto (π, 2) ao ponto (1, 2) tem coordenadas (1 − π, 2 − 2).

Assim como no caso da adição,


  a multiplicação de vetor por escalar também se comporta
 bem em
a αa
coordenadas, isto é, se ~v = é um vetor e α um escalar, então teremos α~v = . Convença-se
b αb
disso, fazendo alguns desenhos com exemplos numéricos.
   
1 −2
Exemplo 4.2 Se ~v = é um vetor no plano, as coordenadas de (−2)~v são . De fato,
−5   10
−2
o segmento orientado que liga a origem ao ponto tem mesma direção, o dobro do tamanho
10  
1
e sentido contrário em relação ao segmento orientado que liga a origem ao ponto .
−5

Observação 4.1 É importante notar que dois vetores são paralelos se e somente se um é múltiplo
escalar do outro. Em particular o vetor nulo é paralelo a qualquer outro.

Usamos aqui operações com matrizes que ainda não foram definidas nesse texto: chamadas também
de operações lineares são: a adição de matrizes, definida para matrizes M e N de mesmo
tamanho e se faz entrada a entrada, resultando portanto numa matriz de mesmo tamanho; e a a

10
multiplicação de matrizes por escalar, definida para um número real α e para uma matriz M ,
multiplicando-se cada entrada de M por α que tem como resultado uma matriz de mesmo tamanho
de M . Para maiores detalhes, veja por exemplo o livro do professor Dan Avritzer, Geometria
Analı́tica e Álgebra Linear - Uma Visão Geométrica, tomos I e II (disponı́veis em ).

A tı́tulo de ilustração, seguem dois exemplos:

     
1 1 2 0 −1 2 1 0 4
+ =
3 −1 0 6 −3 1 9 −4 1

   
1 2 12 24
−1
 = −12 0 
0   
12 
3 12   36 144
0 −1/2 0 −6

Enfatizamos novamente a observação que as operações lineares com vetores são compatı́veis com
as operações lineares das matrizes que os representam num sistema de coordenadas.

Exercı́cio 4.1 1. Quais são as coordenadas do ponto final do representante do vetor ~v = (3, 4)
que tem ponto inicial A = (3, 1)?

2. Quais são as coordenadas do ponto médio do segmento com extremos (1, 3) e (−4, 0)?

3. Dadas as coordenadas de dois vértices e do baricentro (encontro das medianas) de um triângulo,


é possı́vel determinar as coordenadas do terceiro vértice? Como?
   
1 4
4. Dados os vetores ~v = ew~= , calcule as coordenadas de ~u = 3~v − 2w.
~
2 2
5. Faça desenhos e conclua que, dados dois vetores ~v e w ~ não nulos e não paralelos no plano,
~ e ~v − w.
eles geram um paralelogramo com diagonais ~v + w ~ Crie sua estratégia para diferenciar
~v − w ~ − ~v .
~ de w

6. Mostre que as definições geométrica e algébrica de adição de vetores coincidem, fixado um


sistema de coordenadas. Faça o mesmo para multiplicação de vetor por escalar.

7. Sejam A e B matrizes de mesmo tamanho e α, β ∈ R. Mostre (pelo menos convença-se) que

(a) (α + β)A = αA + βA.


(b) α(A + B) = αA + αB.

Em particular, estas propriedades distributivas valem para as operações lineares com vetores.
É o motivo do nome “linear”.

8. Determine os três vértices de um triângulo sabendo que seus pontos médios de seus lados são
(5, 0), (3, 1) e (4, 2).

11
9. Sendo A = (a1 , a2 ) e B = (b1 , b2 ), demonstre que as coordenadas do ponto médio do segmento
AB são ( a1 +b
2
1 a2 +b2
, 2 ), um resultado já conhecido do ensino médio.

10. A base média de um triângulo é o segmento que liga os pontos médios dos lados adjascentes
àquele que escolhemos como base. Mostre que a base média de um triângulo é paralela à base
e tem medida igual à metade da medida da base. Pense vetorialmente.

11. Considere os pontos A = (4, 6) e B = (6, 5). Determine pontos C sobre o eixo x e D sobre o
eixo y de modo que ABCD seja um paralelogramo contido no primeiro quadrante.

5 Produto escalar

O produto escalar tem esse nome porque é um produto entre vetores com resultado numérico. Uma
vez estudado o produto escalar, o plano cartesiano R2 estará munido de uma “régua” e de um
“transferidor”, puramente algébricos.

Primeiramente, observe que para calcular a distância entre dois pontos no plano basta calcular o
−→
módulo (a norma) do vetor que os liga. A distância entre A e B é d(A, B) = kABk. Para a conta,
−→
o Teorema de Pitágoras: tomamos o ponto P , o ponto final do representante de AB que começa
−→ −→ −→
na origem, isto é, AB = OP . Sabemos calcular, a partir dos pontos A e B, as coordenadas de OP .
−→
Digamos que OP = (a, b). Por Pitágoras,
−→ √
kABk2 = a2 + b2 , ou d(A, B) = a2 + b2 .

P
b

−→
AB
b

|a|
a O x

figura 10

 
3  −→ p
Exemplo 5.1 Se A = e B = −2, 5 , então kABk = (−2 − 3)2 + (5 − 7)2 = 29.
7

Já para calcular ângulos entre dois vetores não nulos, representamos ambos com mesmo ponto
inicial (duas semirretas, se preferir). Eles formam dois ângulos. Ou esses ângulos são ambos 180o
(rasos), ou um é menor que o outro. Tomamos sempre o menor. Isto significa que o ângulo entre
dois vetores varia entre 0 e 180o . Em geral, o sı́mbolo para ângulos entre vetores será θ.

12
w
~
~v
θ=0

w
~ θ
θ w
~ ~v w
~
~v
~v θ = 180o

figura 11

Não existe ângulo formado entre o vetor nulo ~0 e um outro vetor ~v . Mas, por convenção, permite-se
pensar que “assuma qualquer valor”, por exemplo, o vetor nulo é paralelo a qualquer outro vetor
(pois o ângulo pode ser pensado como 0o ) e também perpendicular a qualquer outro vetor (pois o
ângulo pode ser pensado como 90o ).

Definimos agora o produto escalar entre dois vetores ~v e w.


~ É chamado de produto escalar não à
toa, já que o resultado é um número real:

h~v , wi
~ = k~v kkwk
~ cos θ,

onde θ = ^(~v , w)
~ é o ângulo entre ~v e w.
~

É imediato que se um dos vetores é nulo, então o produto escalar entre eles é zero. Observe também
que h~v , ~v i = k~v k2 .

Também é fácil concluir que, dados ~v e w ~ não nulos, conhecendo h~v , wi~ e os módulos de ~v e w, ~
h~v ,wi
~
saberemos calcular o ângulo entre eles, já que cos θ = k~vkkwk~
, pois cada valor de cos θ ∈ [0, 1] define
o o
um único valor de θ ∈ [0 , 180 ].
−→
Para calcular h~v , wi
~ a partir das coordenadas de ~v e w,
~ considere os pontos A e B tais que ~v = OA
−−→
ew~ = OB e olhe para o triângulo OAB (figura 12). O caso em que não há triângulo, isto é, quando
−→ −→
~v e w
~ são paralelos, fica como exercı́cio para o leitor. Como AB é tal que ~v + AB = w, ~ segue
−→
AB = w ~ − ~v (o que nos dá a interpretação da outra diagonal do paralelogramo gerado por ~v e w).
~

~ − ~v
w
w
~
θ
A
O ~v

figura 12

Chamando de θ o ângulo entre ~v e w


~ e usando a Lei dos Cossenos, temos
−→
kABk2 = k~v k2 + kwk
~ 2 − 2k~v kkwk
~ cos θ,

e daı́, usando a definição de produto escalar,

13
1 −→
~ = − (kABk2 − k~v k2 − kwk
h~v , wi ~ 2 ).
2
−→
Sendo A = (a1 , a2 ) e B = (b1 , b2 ), temos AB = (b1 − a1 , b2 − a2 ) e portanto

1
~ = − (b1 2 − 2a1 b1 + a1 2 + b2 2 − 2a2 b2 + a2 2 − a1 2 − a2 2 − b1 2 − b2 2 ) = a1 b1 + a2 b2 .
h~v , wi
2

Assim, temos:
     
a1 b1  b1
ˆ uma fórmula para h~v , wi
~ em coordenadas, que pode ser resumida em h , i = a1 a2 =
a2 b2 b2
a1 b1 + a2 b2 (produto do primeiro como matriz linha pelo segundo como matriz coluna);

ˆ uma régua, pois k~v k2 = h~v , ~v i; e


h~v ,wi
~
ˆ um transferidor, pois cos θ = k~v kkwk
~
quando ambos são não nulos.

Disso decorre a caracterização de vetores ortogonais: h~v , wi ~ = 90o ou se um deles é


~ = 0 ⇔ ^(~v , w)
nulo. Como dito antes, é convencional dizer que o vetor nulo é ortogonal a qualquer outro: assim
podemos dizer que dois vetores são ortogonais se e somente se o produto escalar entre eles é zero.

Exercı́cio 5.1 1. Os vetores (1, 3) e (6, −2) são ortogonais.

2. O triângulo formado pelos pontos (0, 5), (2, 2) e (5, 4) é retângulo e isósceles.

3. Dados os pontos A = (3, 2) e B = (1, −3), determine a reta mediatriz de AB exibindo dois
pontos distintos.

4. Dê exemplos de pares de vetores que formem ângulo agudo e obtuso (note que você terá de
controlar o sinal do produto escalar).
   
a b
5. Demonstre que a fórmula obtida para o cálculo do produto escalar, h 1 , 1 i = a1 b1 +
    a2 b2
a1 b1
a2 b2 , vale também para o caso em que os vetores e são paralelos.
a2 b2

6. Verifique que h~v , wi


~ = hw,
~ ~v i para quaisquer vetores ~v e w.
~

7. Dadas as coordenadas de três vértices A, B e C de um triângulo, diga como obter as coorde-


nadas do pé da altura relativa ao vértice A.

8. Mostre que o produto escalar se comporta bem com as operações lineares, ou seja, que h~v , (α~u+
~ = αh~v , ~ui + βh~v , wi,
β w)i ~ para quaisquer vetores ~v , ~u e w
~ e escalares α e β.

9. Dados os vetores (3, 4) e (12, 5), determine um vetor que está na direção da bissetriz do ângulo
formado por eles.

10. Determine o ponto C de modo que o triângulo formado por A = (0, 0), B = (1, 2) e C seja
retângulo em A e tenha ângulo de 30o no vértice B.

14
6 Retas em R2

Voltando ao nosso exemplo inicial, o estudo  daequação 3x − y = 1, já vimos que o conjunto solução
3
S é uma reta de R2 e que o vetor ~n = , cujas coordenadas são os coeficientes de x e y na
−1
equação, é ortogonal (normal) à reta solução. Na verdade isso 
vale em geral: se a equação da reta
a
é ax + by = c (o que em particular significa que o vetor ~n = é não nulo), então o conjunto
b
solução é uma reta r ortogonal a ~n. Por este motivo, ~n é chamado de vetor normal a r.
Note que uma reta em R2 está completamente determinada por um ponto e por uma direção
ortogonal. Em outras palavras, dados um ponto A e uma reta s, existe uma única reta r passando
por A e perpendicular a s. Assim, dados um ponto e um vetor normal não nulo (uma direção
ortogonal), determinamos completamente a reta.
No caso do nossoexemplo
 inicial, podemos recuperar
  a equação a partir
 de um ponto qualquer de
3 3 x
r, digamos A = , e do vetor normal ~n = . Um ponto X = ∈ R2 pertence à reta r
8 −1 y
−−→
se e somente se os vetores AX e ~n são ortogonais.
y

X
A ~n

figura 13

Algebricamente, temos
−−→
   hAX,
 ~ni = 0
x 3
h − , ~ni = 0
 y  8 
x−3 3
h , i = 0
y−8 −1
3x − 9 − y + 8 = 0
3x − y = 1.

15
Esta é chamada a equação geral da reta r; a notação muitas vezes é r : ax + by = c.

Exercı́cio 6.1 Escolha outro ponto pertencente a r e outro vetor normal ~n2 . Observe que ~n2 é
obrigatoriamente um múltiplo escalar não nulo de ~n. Obtenha a equação geral da reta r e note que,
a menos de simplificação, a equação geral de uma reta é única.

Por outro lado, ainda no nosso exemplo 3x − y = 1 é importante descrever o conjunto solução da
equação explicitamente. Isso se faz resolvendo a equação em uma das incógnitas em função da
outra. Nesse caso, é mais fácil escrever y = 3x − 1 e a solução é o conjunto de pares ordenados
do plano nos quais a segunda coordenada é o triplo da primeira menos uma unidade. A variável
livre, no nosso caso x, é chamada de parâmetro e o conjunto solução tem a seguinte representação
(chamada paramétrica):
  
x
S = |x ∈ R
3x − 1
    
x 0
= + |x ∈ R
3x  −1
  
0 1
= +x |x ∈ R
−1  3 
0 1
= +t |t ∈ R .
−1 3

Note que na última igualdade a única modificação foi o nome do parâmetro, o que foi feito de
propósito, para enfatizar que ali x ou t têm o mesmo papel, que é percorrer todo o conjunto dos
números reais. Cada valor de x define um ponto da reta; reciprocamente, cada ponto da reta está
representado por um valor de x.
   
0 −3
Por exemplo se x = 0, o ponto é o . Para x = −3, o ponto é o . Para saber se o
  −1 −10
1
ponto está ou não na reta, temos que resolver o sistema (de duas equações e uma incógnita)
1
(
x=1
3x − 1 = 1.

 
1
Não é difı́cil ver que este sistema não tem solução, logo 6∈ r.
1

A representação paramétrica de uma reta é muitas vezes chamada de equação paramétrica da reta
pelo fato de que
       
x x 0 1
∈r⇔ = +t |t ∈ R.
y y −1 3

Podemos simplesmente escrever r : A + t~v | t ∈ R, onde A é um ponto por onde a reta passa, ~v é
um vetor (sempre não nulo) que determina a direção de r, e por isso chamado de vetor diretor de
r.

16
Então, há dois modos de se determinar geometricamente uma reta no plano: ou por um de seus
pontos e um vetor diretor não nulo (o que é equivalente a dois pontos distintos da reta), ou por
um de seus pontos e um vetor normal não nulo. Traduzindo algebricamente, o primeiro modo dá
origem à representação paramétrica da reta e o segundo à sua equação geral.

Enquanto a equação geral de uma reta, como já vimos, é única, a representação paramétricanão.

3
Se, no nosso velho exemplo da reta de equação 3x − y = 1 tomamos um ponto diferente do ,
  8
1/3
digamos B = e outro vetor diretor não nulo (que obrigatoriamente será um múltiplo escalar
0  
2
de ~v ), digamos w
~= , então
6    
1/3 2
r: +t |t ∈ R.
0 6

Observação. Continuamos a chamar


  o parâmetro de t, mas note que o ponto associado a t = 0
0
na primeira representação é o e o ponto associado a t = 0 na segunda representação é o
  −1
1/3
. O que fizemos foi na verdade dar dois sistemas de coordenadas diferentes para r; numa
0
parametrização, o ponto escolhido será a “origem” e o vetor diretor será o “segmento unitário que
aponta para o sentido positivo a partir da origem”. Em outras palavras, duas graduações diferentes
para a mesma fita métrica. Como eixos, são distintos, embora a reta seja a mesma. A figura
−→
14 ilustra duas parametrizações diferentes para uma reta qualquer s: s = {A + tAB|t ∈ R} =
−−→
{C + λCD|λ ∈ R}.

C
x

figura 14

Exercı́cio 6.2 1. Considere os pontos A = ( 32 , 1), B = (4, 2) e C = (5, 3), determine a equação
geral e uma equação paramétrica das retas r, que passa por A e B, s, que passa por A e é
−−→ −−→
paralela a BC e u, que passa por A e tem vetor normal BC. Faça um esboço da situação no
plano R2 .

17
 
a
2. (a) Seja r uma reta que não é vertical nem horizontal. Seja ~v = um vetor diretor para
b
r. Observe que a 6= 0.
 
1 1
(b) Faça w = a ~v , isto é, escreva o vetor diretor de r da forma w~ = . Note que, neste
k
caso, a segunda coordenada deste vetor diretor (= k) é exatamente o coeficiente angular
da reta.
 
−k
(c) Mostre que ~u = ~ Multiplicando ~u por −1/k, obtemos ~z =
é ortogonal a w.
  1
1
, ainda ortogonal a w. ~ Conclua que ~z é vetor diretor de qualquer reta perpen-
−1/k
dicular a r, todas com coeficiente angular −1/k, ou seja, retas perpendiculares no plano
têm coeficientes angulares “inversos opostos”, uma caracterização bem conhecida.

3. Como proceder para, a partir da equação paramétrica de uma reta chegar à sua equação geral?

4. Escreva um roteiro para, dado um triângulo ABC, obter a medida da altura relativa ao vértice
A.

5. Determine b ∈ R tal que a reta de equação 3x + by = 12 intercepte os eixos x e y nos pontos


A e B e a distância entre A e B seja 5.

6. Determine todas as retas do plano que são perpendiculares à reta 3x + 4y + 5 = 0.

7. Determine o pé da perpendicular desde o ponto P = (4, 0) até a reta r : 2x − 5y = 7. Esse


ponto é chamado projeção ortogonal de P sobre r.

8. Determine as coordenadas do ponto P que está sobre o eixo x e é equidistante de (3, −1) e
(1, −2).

9. Dados três pontos A, B e C, exiba um critério para sabermos se são ou não colineares (isto
é, se pertencem ou não à mesma reta).

10. O ângulo entre duas retas é definido como o menor ângulo formado por elas, com a convenção
que se têm a mesma direção (paralelas ou iguais) o ângulo é zero. Assim, o ângulo entre duas
retas no plano é sempre menor ou igual a um ângulo reto. Dadas as retas r : A + t~v , t ∈ R
~ λ ∈ R, qual é o ângulo entre elas? Note que sua resposta estará em função de
e s : B + λw,
~v e w.
~

18
7 Sistemas lineares de duas equações e duas incógnitas

Interpretamos a solução de uma equação linear em duas incógnitas como uma reta em R2 . Então,
no caso de um sistema de duas equações em duas incógnitas, uma interpretação possı́vel - e natural
- é interseção entre duas retas em R2 . Como já sabemos, dadas duas retas distintas no plano,
ou são paralelas ou são concorrentes, não há outra possibilidade. Em termos do sistema, estas
possibilidades significam, respectivamente, que o conjunto solução S é um conjunto vazio (S = ∅,
as retas não se interceptam), ou S é um conjunto unitário (o ponto de interseção).

Para sistemas de duas equações ainda pode acontecer de as duas equações representarem a mesma
reta. Um exemplo para este caso é o sistema
(
3x − y = 1
,
6x − 2y = 2

pois ambas as equações representam a mesma reta. Nesse caso, S é um conjunto infinito, é a
própria reta de equação 3x − y = 1.

Um exemplo de sistema com solução vazia é o sistema


(
3x − y = 1
,
3x − y = 0


3
pois as retas têm mesmo vetor normal ~n = , logo têm mesma direção. Como a origem é um
−1
ponto da segunda reta, mas não pertence à primeira, segue que as retas são paralelas.

Um exemplo de sistema com solução única é


(
3x − y = 1
,
x − 2y = −3

já que os vetores normais (3, −1) e (1, −2) não são múltiplos, logo não são paralelos, logo as retas
não são paralelas, portanto se encontram num só ponto. Aliás, a solução é o ponto (1, 2), facilmente
calculável por “soma” ou “substituição”.

Em resumo, dado um sistema 2 × 2 (um sistema linear de duas equações e duas incógnitas), que
em geral tem a forma
(
ax + by = c
,
dx + ey = f

há apenas três possibilidades qualitativas, mutuamente exclusivas, para sua solução S: ou é um
ponto, ou vazia, ou uma reta.

Exercı́cio 7.1 Quais são todas as possibilidades qualitativas para um sistema de três equações e
duas incógnitas?

19
Existe outra interpretação geométrica para sistemas 2 × 2. Para apresentá-la, vamos primeiro
lembrar alguns fatos sobre multiplicação de matrizes.

O produto de uma matriz linha por uma matriz coluna já foi visto, elas precisam ter o mesmo
número de entradas e o resultado é um número real. No caso de matrizes com duas entradas (que
representam vetores no plano), esse produto representa o produto escalar entre vetores do plano:
 
 x
ab = ax + by.
y

O produto de uma matriz A por uma matriz coluna X exige que cada a linha da matriz A
tenha o mesmo número de entradas da coluna X. O resultado é uma matriz coluna com o mesmo
número de linhas de A. O que se faz é o produto de cada linha de A pela coluna X. O caso que
nos interessa agora é quando A é uma matriz 2 × 2 e X é um vetor no plano:
    
a b x ax + by
= .
c d y cx + dy

    
1 −1 2 −7
Por exemplo, = .
3 0 9 6

Poderı́amos continuar manipulando o caso geral acima:


            
a b x ax + by ax by a b
= = + =x +y .
c d y cx + dy cx dy c d

A expressão após a última igualdade é chamada de combinação linear das colunas de A usando
os escalares x e y. O motivo é claro, é uma combinação das colunas de A usando-se apenas as
operações lineares, adição de matrizes e multiplicação de matrizes por escalar.

Assim, o sistema
(
−2x + 5y = 3
3x + 2y = 1

pode ser escrito como


     
−2 5 3
x +y = ,
3 2 1

 
3
ou seja, pode ser interpretado como a seguinte pergunta: o vetor pode ser escrito como
    1
−2 5
combinação linear dos vetores e ?
3 2

Você pode estar se perguntando, com razão, onde está a interpretação geométrica disso, pois até
agora, todo o raciocı́nio foi algébrico. Muito bem, o que significa, no plano, a combinação linear
de dois vetores dados?

20
Comecemos com o caso mais geral: sejam dados ~v e w ~ vetores não paralelos no plano. Em particular
−→
são não nulos. Represente ambos com ponto inicial na origem O de R2 de modo que ~v = OA e
−−→
w
~ = OB. Então, todos os vetores do plano podem ser escritos de maneira única como combinação
−→
linear de ~v e w.
~ Para ver isso, tome um vetor qualquer ~u e escreva-o como OP , também com ponto
inicial na origem. Pelo ponto P , existe uma única reta r, paralela à reta OB. Essa reta r cruza a
reta OA num ponto, chame-o de X. Da mesma maneira, existe uma única reta s, paralela à reta
OA por P , que cruza a reta OB num ponto que vamos chamar de Y . Os pontos X e Y estão
unicamente determinados por ~u.

s
A
Y
~v w
~
B
O
~u
P

X
r

figura 15

−−→
Pela construção que fizemos, os vetores OX e ~v são paralelos, o que quer dizer que são múltiplos
−−→
escalares. Assim, existe um único escalar x ∈ R tal que OX = x~v . Analogamente, existe um único
−−→ −−→ −−→ −→
y ∈ R tal que OY = y w. ~ Ora, da adição de vetores, OX + OY = OP = ~u. Então conseguimos
escrever, de maneira única, ~u como combinação linear de ~v e w:
~

~u = x~v + y w.
~

Geometricamente, perguntar se ~u é combinação linear de ~v e w


~ é tentar posicionar ~u na diagonal
de um paralelogramo de lados paralelos a ~v e w.
~

Exercı́cio 7.2 Na figura 15 o ponto P não está na reta OA nem na reta OB. O que mudaria
nesse raciocı́nio se ele estivesse sobre uma dessas retas?

Assim, no exemplo que consideramos há pouco, isto é, o sistema


(
−2x + 5y = 3
,
3x + 2y = 1

 
3
interpretado como a pergunta se o vetor pode ser escrito como combinação linear dos vetores
    1    
−2 5 −2 5
e , tem única solução, já que os vetores e não são múltiplos escalares, logo
3 2 3 2
não são paralelos.

21
Exercı́cio
 7.3 Resolva esse sistema e verifique
  que de
 fato o conjunto solução é unitário, ou seja,
3 −2 5
escreva como combinação linear de e .
1 3 2

Mas, para um sistema 2×2, também pode ocorrer que o conjunto solução S do sistema x~v +y w
~ = ~u
seja vazio ou infinito. Em ambos os casos, obrigatoriamente os vetores ~v e w
~ devem ser paralelos.
Caso contrário, como vimos, S seria unitário.

Tomando então ~v e w
~ paralelos, a análise é a seguinte:

ˆ se ~u é paralelo a ~v e w,
~ então existem infinitas soluções para o sistema.

ˆ se ~u não é paralelo a ~v e w,
~ então não existem soluções para o sistema.

Exercı́cio 7.4 Dê exemplos, e faça esboços no plano, de sistemas de solução vazia ou infinita,
tentando escrever ~u como combinação linear de ~v e w.
~

Assim, qualquer que seja o par de vetores ~v e w~ não paralelos no plano, ele satisfaz a seguinte
propriedade: todos os vetores do plano podem ser escritos de maneira única como combinação
linear de ~v e w,
~ da forma x~v + y w.
~ Chamaremos um par ordenado como este de base para o plano
2
R e escreveremos B = {~v , w}. ~ 6= xw
~ É um par é ordenado pois em geral x~v + y w ~ + y~v .

Usando a notação de multiplicação de matrizes, são equivalentes formas de se apresentar um sistema


2 × 2:
(     
ax + by = e a b x e
ou = .
cx + dy = f c d y f

   
a b e
A matriz A = será chamada matriz dos coeficientes do sistema, enquanto o vetor ~u =
c d   f
x
será chamado constante. O vetor ~x = é o vetor das incógnitas.
y

Na primeira interpretação geométrica que fizemos de sistemas lineares 2 × 2, interseção de duas


retas, as linhas de A representavam os vetores normais ~n1 e ~n2 às retas dadas. Nossa conclusão foi
que o sistema tem solução única se e somente se as linhas de A não são paralelas.

Na segunda interpretação, perguntando se um dado vetor pode ser escrito como combinação linear
de dois outros, as colunas de A representavam os vetores ~v e w. ~ Nossa conclusão foi que o sistema
tem solução única se e somente se as colunas de A não são paralelas.

Portanto, dizer que as linhas de A não são paralelas é equivalente a dizer que as colunas de A não
são paralelas. Lembre-se que dois vetores só são paralelos quando um é múltiplo escalar do outro.
Desse modo, as linhas de A são uma base para o plano se e somente se as colunas de A são uma
base para o plano.

Exercı́cio 7.5 1. Seja {~u, ~v } uma base do plano. Mostre que {~u +~v , ~u −~v } também é base. Em
geral, determine a condição sobre a, b, c, d ∈ R para que {a~u + b~v , c~u + d~v } também seja base
do plano.

22
 
1
2. Escreva os vetores da base canônica do plano como combinação linear dos vetores e
  2
2
.
1

2
Em tempo,
  abase canônica do plano R é formada pelos vetores que geram os eixos x e  y, isto

1 0 2
é, e respectivamente. Esses vetores são chamados de i e j. Por exemplo, o vetor
0 1 −3
pode ser escrito
         
2 2 0 1 0
= + =2 −3 = 2i − 3j.
−3 0 −3 0 1
Em geral,
         
a a 0 1 0
= + =a +b = ai + bj.
b 0 b 0 1

23
8 Inversão de matrizes em R2

Pense mais uma vez numa equação linear de uma incógnita ax = b. Se a 6= 0, podemos resolvê-la
“isolando” x, multiplicando ambos os lados pelo inverso de a.

Existe uma analogia para sistemas 2 × 2, escritos como uma equação matricial A~x = ~b. Quais são
as condições sobre A que permitirão “isolar” o vetor das incógnitas ~x? Para ver isso, estudaremos
o conceito de matriz inversa.

Para tanto, é preciso lembrar a definição de multiplicação de matrizes. Se você está familiarizado,
pode pular para a definição de matriz invertı́vel.

Definição e propriedades do produto de matrizes

ˆ primeiro,
  lembre-se do produto de uma “linha” A = (a1 , a2 , · · · , an ) por uma “coluna” B =
b1
 b2 
 .. , ambas com o mesmo número de entradas. Então
 
.
bn

AB = a1 b1 + a2 b2 + · · · + an bn ∈ R.

ˆ se A é uma matriz m × n e B é uma matriz n × p, então o produto AB está definido. Esta


condição de compatibilidade significa que o número de colunas de A seja igual ao número de
linhas de B, ou, em outras palavras, que o número de entradas das linhas de A e das colunas
de B é o mesmo. De maneira que cada linha de A pode ser multiplicada por cada coluna de
B. O produto AB é uma matriz C = (cij )m×p na qual a entrada ij é o produto da i-ésima
linha de A pela j-ésima coluna de B.
 
 −1
Exemplo 8.1 1. 3 2 1  2  = 3.
2
    
3 2 a 3a + 2b
2. = .
2 −5 b 2a − 5b
 
  1 1 −2  
2 1 0 −2  0 2 0  0 −2 −4
3.  = .
0 −3 2 1 −4 1 −1 −7 −1 −2
1 3 0

Exercı́cio 8.1 (relativos ao produto de matrizes) 1. Calcule alguns produtos de matrizes


de tamanho relativamente pequeno, para se familiarizar com a regra.

2. Mostre (pelo menos convença-se) que o produto de matrizes é distribuitivo em relação à adição
de matrizes. Sugestão: faça exemplos com matrizes pequenas antes.

3. Mostre (pelo menos convença-se) que o produto de matrizes é associativo. Sugestão: faça
exemplos com matrizes pequenas antes.

24
4. A matriz identidade In é a matriz quadrada de ordem n (isto é, n × n) na qual as entradas
da diagonal principal são “1” e todas as outras nulas, isto é,
 
1 0 ··· 0
0 1 · · · 0
In =  .. .
 
. . .. 
. . .
0 0 ··· 1

Mostre que In é o elemento neutro da multiplicação de matrizes, ou seja, AIn = A e In B = B


para quaisquer matrizes A e B para as quais estes produtos estejam definidos.

O caso que nos interessa


  mais de perto
  é a multiplicação de matrizes 2 × 2. É simples, para
agora
a b x z
multiplicar A = por B = , multiplico a matriz A por cada uma das coluna de B,
c d y w
resultando nas duas colunas de AB, que também é uma matriz 2 × 2.

Assim,
    
a b x z ax + by az + bw
AB = = .
c d y w cx + dy cz + dw
   
2 1 1 2
Exercı́cio 8.2 1. Calcule os produtos AB e BA para A = e B = . O que
3 1 0 −1
você pode concluir?
 
1 0
2. O elemento neutro da multiplicação de matrizes 2 × 2 é a matriz identidade I = .
0 1
Verifique que AI = IA = A, para qualquer matriz 2 × 2 A.

A pergunta é portanto quais são as matrizes A que admitem inversa, isto é, para as quais existe
uma matriz M tal que M A = I. Embora a definição a seguir seja geral, vamos nos preocupar, por
enquanto, apenas com matrizes de ordem 2.

Definição 8.1 Dada uma matriz quadrada A, dizemos que ela é invertı́vel se existe uma matriz
quadrada de mesma ordem M tal que M A = AM = I, onde I é a matriz identidade da mesma
ordem de A. Nesse caso, M será chamada de inversa de A. Se A é invertı́vel, denotamos sua
inversa por A−1 . Se A não é invertı́vel, é também chamada de singular.

Não é claro, até o momento, que existem matrizes invertı́veis. Antes de fazermos qualquer conta,
vamos ver que, se a inversa existe, então ela é única. Para esta demonstração, suponha que M e
N são ambas inversas para a matriz A. Então,

M = IM = (N A)M = N (AM ) = N I = N

ou seja, M = N e a inversa, quando existe, é de fato única.


   
a b x z
Dada uma matriz A = , chame de M = a “candidata” a inversa de A. Sabemos
c d y w
que M deve satisfazer AM = I, isto é,

25
    
a b x z 1 0
= .
c d y w 0 1

Esta equação pode ser “dividida” em duas, comparando as colunas das matrizes de ambos os lados
da equação. Assim, o que procuramos é resolver simultaneamente as equações
         
a b x 1 a b z 0
= e = .
c d y 0 c d w 1

Observe
  primeiramente
  que não pode ser a = c = 0. Caso fosse assim, as colunas de AM seriam
b b
y ew , portanto múltiplas. Mas estamos procurando M para que AM = I, e as colunas
d d
   
1 0
de I são e , que não são múltiplas.
0 1

Então, suponha que a 6= 0.


1−by
No primeiro sistema, da primeira equação temos ax = 1 − by, portanto x = a
.

Substituindo na segunda equação, encontramos c( 1−by


a
) + dy = 0, donde c + (ad − bc)y = 0. Assim,
uma condição necessária para que o sistema tenha uma única solução é ad−bc 6= 0. E é exatamente
isso que precisamos, pois, lembre-se: se a inversa existe, é única.
−c d
Supondo ad − bc 6= 0, temos y = ad−bc e voltando à primeira equação encontramos x = ad−bc
. Um
−b a
cálculo similar leva a z = ad−bc e w = ad−bc .

Note que a condição ad − bc 6= 0, necessária para que a inversa exista, é também suficiente e já
garante que a e c não sejam simultaneamente nulos. Chamamos esse número de determinante da
matriz A e escrevermos  
a b
det(A) = det = ad − bc.
c d

Então, encontramos a inversa de A? Formalmente ainda não: o que encontramos foi uma matriz
M tal que AM = I, mas a definição de matriz inversa diz que, para ser a inversa de A, M deve
satisfazer também M A = I.

Exercı́cio 8.3 Verifique que M A = I, ou seja, M é de fato a inversa de A.

Uma vez feito o exercı́cio, podemos afirmar que, se det(A) 6= 0, então A é invertı́vel e
 
−1 1 d −b
A =
det(A) −c a

Exercı́cio 8.4 Começamos supondo a 6= 0, mas poderı́amos ter começado supondo c 6= 0. Faça
as contas e verifique que, nesse caso, det(A) 6= 0 também seria condição necessária e suficiente à
obtenção da inversa e a solução seria a mesma.

26
É uma conta grande, mas elementar, verificar que, para matrizes 2 × 2 A e B, vale det(AB) =
det(A) det(B). Assim, se uma matriz adimite inversa, temos AA−1 = I, logo det(AA−1 ) = det(I),
logo det(A) det(A−1 ) = 1, logo det(A) 6= 0.

Isso significa que caracterizamos todas as matrizes 2 × 2 invertı́veis: exatamente aquelas que têm
determinante não nulo. E ainda derivamos uma fórmula para o cálculo da inversa.

O que nos motivou a estudar inversão de matrizes foi a possibilidade de resolver um sistema linear
A~x = ~b “isolando” o vetor das incógnitas: se A admite inversa e M = A−1 , multiplicamos ambos
os lados da equação matricial por M à esquerda (lembre-se, do exercı́cio 2.2.1, que o produto de
matrizes não é comutativo). Veja:

A~x = ~b
M A~x = M~b
I~x = M~b
~x = M~b.

Ou seja, obtida a inversa de A, a única solução do sistema é ~x = A−1~b.


(
5x − 2y = −19
Exemplo. Considere o sistema . A matriz dos coeficientes, vamos chamá-
2x + 3y = 0
la A é tal que det(A) = 19 6=  0, portanto o sistema tem única solução. Sua matriz  inversa

−1 1 3 2 −1 −19
é dada por A = , logo a solução do sistema é dada por vecx = A =
  19 −2  5 0
1 3 2 −19 −3
= .
19 −2 5 0 2

Assim, sistemas com solução única são exatamente aqueles cuja matriz dos coeficientes é invertı́vel.
Já tı́nhamos concluı́do, há pouco, que esses sistemas estavam caracterizados pelo fato de as linhas
(ou as colunas) da matriz dos coeficientes formarem uma base para R2 .

Em resumo, podemos enunciar o seguinte resultado.

Teorema 8.1 Dada uma matriz A2×2 , as seguintes afirmativas são equivalentes:

1. Para qualquer vetor constante ~b, o sistema linear A~x = ~b tem solução única.

2. As linhas de A formam uma base para R2 .

3. As colunas de A formam uma base para R2 .

4. det(A) 6= 0.

5. A é invertı́vel.

Exercı́cio 8.5 1. Pegue alguns exemplos de sistemas 2 × 2 de algum livro do ensino médio e
resolva-os, descrevendo parametricamente sua solução, caso seja um conjunto infinito.

27
2. Mostre que o sistema 
3x − y = 5

x+y =2

−2x + y = 1

tem solução vazia. Troque a segunda equação desse sistema por x + y = k, determine k ∈ R

para que o sistema tenha solução e calcule-a.


     
1 3 −1 1
3. Seja A = . Obtenha as soluções dos sistemas A~x = e A~x = . Faça um
2 5 2 1
esboço da situação no plano R2 , interpretando os sistemas como interseção de retas.
 
a 1−a
4. Dada a matriz A = , calcule os valores de a para os quais A seja invertı́vel.
3 2a
(
3x − a2 y = 1
5. Mostre que, independente do valor de a, o sistema tem única solução e
2x + y = 0
calcule-a em função de a.

6. Verifique que, para matrizes 2 × 2, temos det(AB) = det(A) det(B). Como já observado no
texto, isso implica, no caso de matrizes invertı́veis, que det(A−1 ) = 1/ det(A). Também vere-
mos mais adiante que essas propriedades valem para qualquer que seja a ordem das matrizes
A e B.

7. Quando ~b = ~0, o sistema A~x = ~0 é chamado de homogêneo. Faça uma análise de sistemas
homogêneos 2 × 2 e classifique-os quanto ao tipo de solução.

28
9 Multiplicação de matrizes como movimentos do plano

Já vimos que sistemas de equações lineares de duas equações e duas incógnitas modelam interseções
de retas em R2 , mas também respondem se um vetor é combinação linear de dois vetores dados e
quando esta decomposição é única.

Isto é, dados uma matriz A e um vetor ~b, existem vetores ~x tal que A~x = ~b?

Esta interpretação 
considera
 uma matriz 2 × 2 A como uma função A : R2 → R2 onde a imagem
x
de cada vetor ~x = ∈ R2 é o vetor A~x ∈ R2 . Resolver um sistema é portanto saber se, dado
y
um vetor ~b na imagem de A, existe uma pré-imagem para ~b.

Por exemplo, resolver o sistema


(
2x = 6
−2x + y = 1

     
2 0 6
é procurar por escalares x e y tais que x +y = , isto é, tais que
−2 1 1
    
2 0 x 6
= .
−2 1 y 1

Transformações desse tipo, definidas por multiplicação de matrizes, podem ser interpretadas como
movimentos do plano, porque podemos desenhar o vetor ~x e sua imagem no mesmo plano cartesiano.
     
2 0 1 2
Por exemplo, se A = e ~x = , temos A~x = . A situação está ilustrada abaixo.
−2 1 1 −1

~x

x
A~x

figura 16
 
1
Exercı́cio 9.1 Para a matriz A do exemplo acima, represente graficamente os vetores w
~= e
3
sua imagem Aw.~

Vejamos mais alguns exemplos.

29
 
0 −1
1. Seja A = . Então, o movimento que A produz no plano é o seguinte:
1 0
    
x 0 −1 −y
7→ .
y 1 0 x

   
1 −3
Um exemplo numérico: a imagem do vetor é o vetor . De maneira geral, multi-
3 1
plicar um vetor pela matriz A é rotacioná-lo 90o no sentido positivo.

A~x

~x
x

figura 17
       
2 0 x 2x x
2. Se A = , então o movimento leva qualquer vetor em = 2 , isto é,
0 2    y  2y y
x −3 0
multiplica o vetor por 2. De maneira similar, B = multiplica vetores por
y 0 −3 
a 0
−3. Em geral, o movimento produzido por matrizes da forma A = é a multiplicação
0 a
pelo escalar a.

B~x

x
~x

A~x

figura 18

30
 
a b
3. Para qualquer matriz A = , a imagem do vetor nulo é o vetor nulo. Ou seja, no
c d
movimento produzido no plano por uma matriz, o vetor nulo nunca se mexe (ou: a origem é
um ponto fixo).
     
1 3 0 1
4. Seja M = e considere o triângulo retângulo ABC, sendo A = , B = e
  1 0     0 0
0 −→ 1 −→ 0
C= . Calculando as imagens dos lados AB = e AC = , temos
1 0 1
−−→0 −−→0
         
−→ 1 3 1 1 −→ 1 3 0 3
AB = M (AB) = = e AC = M (AC) = = .
1 0 0 1 1 0 1 0

−→ −→
Observamos que M não preserva ângulos (pois o ângulo entre AB e AC de 90o é diferente do
−−→ −−→ −→
ângulo entre AB 0 e AC 0 , que é 45o . Também M não preserva distâncias: AC tem módulo 1,
−−→
enquanto AC 0 tem módulo 3.

B0
C

B C0
A x

figura 19

Exercı́cio 9.2 Considerando o exemplo acima, calcule a imagem da hipotenusa de ABC.


   
−1/2 0 1
5. Seja M = . Agora defina ~v1 = , ~v2 = M~v1 , ~v3 = M~v2 e assim por diante, isto
0 2 1
é, ~vn = M~vn−1 .

Exercı́cio 9.3 Referente ao exemplo anterior, calcule e desenhe os vetores ~v3 e ~v4 . O que
você pode dizer quando n continua a crescer?
  √ 
cos 30o −sen 30o 1 −1
3 √
6. A matriz R = R30o = = é chamada rotação de 30o no
sen 30o cos 30o 2 1 3
sentido positivo (anti-horário).

Exercı́cio 9.4 (a) Quanto à matriz R do exemplo acima, verifique que R preserva distâncias,
isto é, se ~v é um vetor qualquer de R2 , então kR~v k = k~v k.
 
a
(b) Tome agora um vetor w ~ = . Verifique que o ângulo (orientado) medido de w
~ para
b
Rw ~ é de fato 30o . Conclua que R preserva ângulos.

31
 
cos θ −sen θ
De forma geral, a matriz de rotação de um ângulo θ no sentido positivo é Rθ = ,
sen θ cos θ
e sempre preserva distâncias e ângulos.

7. Se det(A) 6= 0, então dado qualquer vetor ~b ∈ R2 (no contradomı́nio), ~b tem uma única
pré-imagem, isto é, existe um único vetor ~x ∈ R2 (domı́nio) tal que A~x = ~b. Isto porque A
é invertı́vel e a solução do sistema é ~x = A−1~b. Assim, qualquer vetor ~b ∈ R2 é combinação
linear das colunas de A.
 
1 4
8. Isso não acontece para matrizes A com det(A) = 0: para a matriz A = , a tentativa
  2 8
1
de se achar uma pré-imagem para o vetor resulta num sistema impossı́vel (verifique).
0
O motivo é que, sendo det(A) = 0 para uma matriz A não nula, então a imagem de A como
movimento do  plano é uma reta que passa pela origem. Como exemplo, olhe para a própria  
1 4 2 2 x
matriz A = . A imagem de A : R → R é o conjunto dos pontos da forma A ,
2 8   y
x + 4y
ou seja, os vetores da forma , ou, em outras palavras, o conjunto dos vetores em
2x + 8y  
t
que a segunda coordenada é o dobro da primeira, ou ainda, a reta r : |t ∈ R.
2t

Exercı́cio 9.5 Considere uma matriz A, 2 × 2, com det(A) = 0. Mostre que existem vetores
distintos ~v e w
~ tais que A~v = Aw.
~

Olhando para uma matriz A2×2 como movimento do plano, uma pergunta que pode ser feita é a
seguinte: existe algum vetor não nulo ~x ∈ R2 (domı́nio) tal que A~x = λ~x para algum λ ∈ R? Ou:
existe ~x 6= ~0 tal que A~x é um múltiplo de ~x? Dada a matriz A, como você faria para responder essa
questão? Geometricamente, a existência desse vetor significa que o vetor A~x tem a mesma direção
de ~x. Por este motivo, a direção determinada por um tal ~x é chamada de direção invariante da
matriz A.

Note que já vimos exemplos em que não há direções invariantes (as rotações dos exemplos 1 e 6
acima) e um exemplo onde todas as direções são invariantes (a multiplicação por escalar do exemplo
2).

Exercı́cio 9.6 1. Em cada um dos itens abaixo, são dados uma matriz A e um vetor ~v . Diga
se ~v representa ou não uma direção invariante para A.
   
0 1 1
(a) A = , ~v = .
−1 2 1
   
−2 2 −1
(b) A = , ~v = .
2 1 2
   
−2 2 0
(c) A = , ~v = .
2 1 0
   
14 −3 −1
(d) A = , ~v = .
12 1 4

32
 
2 0
2. Seja A = . Determine, se existirem, todas as direções invariantes para A. Genera-
0 −1  
a 0
lize para matrizes da forma .
0 b

Seguem mais alguns problemas


 
1
Exercı́cio 9.7 1. Determine os valores de t ∈ R para que o vetor ~v = represente uma
  t
1 1
direção invariante da matriz A = .
15 3
   
1 3 1
2. O vetor representa uma direção invariante da matriz ?
1 4 0

3. Se M é uma matriz 2 × 2 e ABC é um triângulo em R2 , os pontos M A, M B e M C (obtidos


por multiplicação de matrizes) são necessariamente vértices de um triângulo? Dê exemplos.
   
2 2
4. Existem duas matrizes 2 × 2 distintas A e B tais que A = B ? Caso negativo,
1 1
demonstre; caso afirmativo, exiba um exemplo.
       
0 1 1 0
5. Encontre uma matriz que “transforma” o quadrado de vértices , , e no
0 0 1 1
  √   √   
0 2 1+ 2 1
losango de vértices , , e . Sugestão: uma possibilidade é a multi-
0 0 1 1
     
1 0 1
plicação por esta matriz levar os vetores i = ej= respectivamente em ~u = e
0 1 1
√ 
2
~v = . Essa matriz é única? Por quê?
0

~ em R2 , vale A~v 6= Aw.


6. Seja A uma matriz 2×2 tal que, para quaisquer vetores distintos ~v e w ~
Mostre que det A 6= 0.

10 Formas quadráticas em R2

Mas por que procuramos direções invariantes de matrizes? De certa forma, podemos dizer que, dada
uma matriz, queremos tirar uma radiografia, olhar para a essência das informações que lá estão
contidas. Encontrar suas direções invariantes ajuda. Uma razão prática é que equações quadráticas
no plano (duas incógnitas) estão associadas a certos tipos matrizes 2 × 2 cujas direções invariantes
são eixos de simetria da curva solução da equação. Essas curvas, algumas mais conhecidas, como
cı́rculos e parábolas, outras menos, como elipses e hipérboles, são chamadas cônicas. O motivo
para o nome é que elas podem ser obtidas a partir de um cone cortado por um plano no espaço.

Procure você mesmo animações e outras informações. Pode começar com https://www.youtube.
com/watch?v=Te1JKonAAKs.

Vamos ver então mais precisamente como matrizes definem coeficientes de equações quadráticas.

33
Definição 10.1 Uma forma quadrática no plano é uma expressão da forma ax2 + bxy + cy 2 , onde
a, b e c são números reais dados, não simultaneamente nulos.

Ou seja, uma forma quadrática no plano é uma função de domı́nio R2 e contradomı́nio R, dada por
uma expressão polinomial em duas variáveis, onde cada parcela tem grau exatamente 2. Para que
a forma seja de fato “quadrática”, exige-se, na definição, a condição de que a, b, c ∈ R não sejam
simultaneamente nulos.

Por exemplo, Q1 (x, y) = 3x2 − 2xy + 5y 2 , Q2 (x, y) = x2 − y 2 e Q3 (x, y) = 11xy são formas
quadráticas. Para saber qual é o valor de Q1 num dado par ordenado, basta substituir. Assim,
Temos Q1 (1, 2) = 3(1)2 − 2(1)(2) + 5(2)2 = 19.

Associamos formas quadráticas e matrizes quadradas de ordem dois escrevendo a forma quadrática
como um produto de matrizes:
  
2 2
 a b1 x
ax + bxy + cy = x y ,
b2 c y

desde que b1 + b2 = b. Para verificar, basta efetuar o produto de matrizes acima.

Assim, a uma forma quadrática estão associadas matrizes 2 × 2 tais que os coeficientes de x2 e
y 2 são as entradas da diagonal principal e o coeficiente de xy é a soma das entradas da diagonal
secundária.
  
 0 5 x
Por exemplo, para representar a forma quadrática 11xy poderı́amos escrever x y
   6 0 y
 0 −3 x
ou x y , além de muitas outras.
14 0 y

Portanto a tentativa de representar formas quadráticaspor matrizes


 quadradas apresenta um pe-
a b
queno problema: uma matriz quadrada qualquer A = define uma forma quadrática, mas,
c d
como vimos, a mesma forma quadrática pode estar representada por várias matrizes distintas:
basta que tenham mesma diagonal principal e que as entradas na diagonal secundária tenham a
mesma soma. Mas se exigirmos que as entradas da diagonal secundária sejam iguais, então cada
forma quadrática define uma única matriz. Por exemplo,
  
2 2
 3 −1 x
Q1 (x, y) = 3x − 2xy + 5y = x y .
−1 5 y

No fundo, o que estamos exigindo agora é que a matriz que representa a forma quadrática deve ser
simétrica.

Matrizes simétricas são matrizes quadradas que têm simetria em relação à diagonal principal. Para
dizer isto de outra maneira, definimos primeiramente a transposta de uma matriz Mn×m como sendo
t
a matriz Mm×n que tem como linhas as colunas de M e como colunas as linhas de M . Dizemos então
que uma matriz quadrada A é simétrica ⇔ At = A. Transpor uma matriz quadrada é portanto
“refleti-la na sua diagonal principal”, usando um abuso de linguagem.

Por exemplo, tem-se

34
   t  
 t 3 0 −1 1 2 −1 2 2  t  
3 2 1 1 7 1 7
= 2 −5 ,  2 4 −1 =  1 4 0 e = .
0 −5 1 7 1 7 1
1 1 2 0 6 2 −1 6

No caso 2 × 2, as matrizes simétricas são as matrizes cujas entradas da diagonal secundária são
iguais.

Agora podemos identificar o conjunto das formas quadráticas no plano com o conjunto das matrizes
2 2
simétricas
 2 × 2. Cada forma quadrática ax + bxy + cy define uma única matriz simétrica A =
a b/2
e reciprocamente.
b/2 c
 
2 2 −3/2
Outro exemplo, a única matriz simétrica que representa a forma 2x − 3xy é .
−3/2 0
2 2
O que  faremos
 agora
 é o seguinte: começaremos estudando equações da forma ax + by = c, ou
 a 0 x
x y = c, onde c é uma constante real. Ou seja, equações cuja forma quadrática
0 b y
está definida por uma matriz diagonal (matrizes que têm entradas não nulas somente na diagonal
principal); diremos que uma equação assim está na sua forma normal e veremos todos os casos
possı́veis.

A solução de uma equação desse tipo sempre apresenta simetria em relação aos eixos x e y. Isso
porque, se um ponto (h, k) ∈ R2 está no conjunto solução S da equação, então os pontos (−h, k)
(seu reflexo em relação ao eixo y); (h, −k) (seu reflexo em relação ao eixo x) e (−h, −k) (seu reflexo
em relação à origem) também estão em S.

De fato, veja no exemplo x2 − 3y 2 = −11 que os pontos (1, 2), (−1, 2), (1, −2) e (−1, −2) satisfazem
a equação.

Lembre-se de que  você já concluiu, no exercı́cio 9.6 (2), que se as direções invariantes de uma
a 0
matriz A = são exatamente os eixos x e y. Ou seja, nesse caso (quando o termo xy não
0 b
aparece na equação), os eixos de simetria da solução coincidem com as direções invariantes da
matriz.
  
 a b x
Na sequência estudaremos o caso mais geral x y = d (ou ax2 + 2bxy + cy 2 = d)
b c y
procurando pelas direções invariantes da matriz da forma quadrática, que serão também as direções
de simetria da curva solução, reduzindo a equação a uma forma normal. Veremos que matrizes
2 × 2 simétricas sempre possuem duas direções invariantes ortogonais. Ou seja, equações da forma
ax2 + 2bxy + cy 2 = d apresentam dois eixos de simetria que são perpendiculares.
 
1 3
Exercı́cio 10.1 Calcule as duas direções invariantes da matriz A = e mostre que são
3 1
ortogonais.

Um pouco mais para a frente, estudaremos o caso mais geral possı́vel de equações quadráticas no
plano, ax2 + bxy + cy 2 + dx + ey = f , também a partir das direções invariantes da matriz da forma
quadrática.

35
11 Equações quadráticas no plano, cônicas

O nome cônicas, como já dito, vem do fato que estas curvas são determinadas por interseções de
um cone com um plano no espaço. E todas as possibilidades de interseção de um cone com um
plano no espaço podem ser descritas no plano R2 como solução de uma equação quadrática.
 
2 2 a 0
Vamos estudar equações da forma ax + by = c, cuja forma quadrática é dada pela matriz .
0 b
Antes de mais nada, vejamos algumas situações que podem ocorrer.

Exemplos.

1. x2 + y 2 = 1 é a equação do cı́rculo de raio 1 centrado na origem (ou: a solução é o cı́rculo).


O esboço, conhecido, está na figura abaixo.

1 x

figura 20

2. x2 + y 2 = −4. Claramente temos S = ∅.

3. 3x2 + y 2 = 0 tem como solução um conjunto unitário: S = {(0, 0)}.

4. Se um dos coeficientes de x2 ou y 2 é nulo, por exemplo na equação x2 = 1, temos x = ±1.


Lembrando que nosso ambiente é o plano, a solução é o conjunto S = {(1, y) | y ∈ R} ∪
{(−1, y) | y ∈ R}, isto é, o par de retas paralelas x = 1 e x = −1.

x = −1 x=1

-1 1 x

figura 21

36
5. No caso anterior, se a constante é nula, a solução é uma reta. Por exemplo x2 = 0 tem como
solução a reta x = 0. E a solução pode ainda ser vazia, como por exemplo, em x2 = −1.
6. Também pode acontecer que a solução seja um par de retas concorrentes, por exemplo, a
equação x2 − y 2 = 0 pode ter seu lado esquerdo fatorado e fica (x − y)(x + y) = 0, cuja
solução é a união das soluções de x − y = 0 e de x + y = 0, ou seja, a união das retas y = x e
y = −x, que se encontram na origem.
y

y = −x y=x

figura 22

Observe que o exemplo 1 acima poderia ter sido apresentado a partir da definição do cı́rculo como
o lugar geométrico dos pontos do plano cuja distância até a origem é 1 e a equação seria uma
consequência dessa propriedade. De fato, a distância de um ponto (x, y) de R2 atéa origem
 é o
x
módulo do vetor que liga a origem a ele, isto é, o cı́rculo é o conjunto dos vetores tais que
  y
x p
= 1, ou seja, x2 + y 2 = 1, ou simplesmente x2 + y 2 = 1. Os próximos exemplos partem
y
da definição geométrica.
Exemplo: elipse. A elipse é o lugar geométrico dos pontos do plano cuja soma das distâncias a
dois pontos dados (focos) é constante. Ou seja, são dados dois pontos distintos F1 e F2 no plano e
uma constante k > d(F1 , F2 ) (maior que a distância entre os dois focos) e a elipse é o conjunto de
pontos X tais que d(X, F1 ) + d(X, F2 ) = k.
É possı́vel mostrar, você pode tentar achar isso na internet, que as definições de elipse como seção
de um cone no espaço por um plano e como lugar geométrico coincidem.
Pense numa “ferramenta para construir elipses”: um pedaço de barbante de comprimento maior
que a distância entre os dois focos, com uma extremidade fixada por um alfinete em cada foco. Com
o lápis sobre o plano mantendo sempre o barbante esticado, desenhamos a elipse. As distâncias da
ponta do lápis aos focos somam exatamente o comprimento do barbante, onde quer que a ponta
do lápis esteja. Você pode procurar figuras ou vı́deos dessa construção na internet.

F1 F2

37
F1 F2

F1 F2

figura 23

Para derivar uma equação cuja solução seja uma elipse, localize os focos sobre o eixo x, nos pontos
(−c, 0) e (c, 0) (para c > 0). Denote por (a, 0) a interseção da elipse com o raio positivo do eixo x.
O tamanho do barbante é a soma das distâncias desse ponto aos focos, que é 2a. Em particular,
a > c. Denote a interseção da elipse com o raio positivo do eixo y por (0, b). Este ponto. (0, b),
equidista dos focos, logo a distância a cada um dos focos é a metade do tamanho do barbante, a.
Os números a, b e c satisfazem uma relação de Pitágoras a2 = b2 + c2 .
y

−a c a x

figura 24

Assim, dado um ponto X = (x, y) no plano, ele estará na elipse se e somente se d(X, F1 )+d(X, F2 ) =
2a, ou seja,
p p
(x − c)2 + y 2 + (x + c)2 + y 2 = 2a.

Como exercı́cio de manipulação algébrica, verifique (ou leia e compreenda em algum outro texto)
que esta equação se simplifica em

x2 y 2
+ 2 = 1.
a2 b
38
A equação acima é a forma normal da elipse. A partir desta equação, usando as simetrias em
relação aos eixos x e y, é possı́vel construir (esboçar) o gráfico da elipse.

Exercı́cio 11.1 1. No primeiro quadrante, isto é, para x e y maiores ou iguais a zero, é possı́vel
isolar y como função de x na equação (a forma normal) da elipse. Faça isso e plote em
qualquer app o gráfico. Depois, use as simetrias em relação aos eixos x e y para obter um
esboço da elipse completa.

2. Equacione a elipse com focos sobre o eixo y e faça um esboço de seu gráfico.

Exemplo: hipérbole. A hipérbole é o lugar geométrico dos pontos do plano cuja diferença das
distâncias a dois pontos dados (focos) é constante. Ou seja, são dados dois pontos distintos F1 e
F2 no plano e uma constante 0 < k < d(F1 , F2 ) (menor que a distância entre os dois focos) e a
hipérbole é o conjunto de pontos X tais que |d(X, F1 ) − d(X, F2 )| = k.

Antes de equacionarmos esta curva, pensemos, a exemplo do que fizemos no caso da elipse, num
instrumento para construir arcos de hipérbole no plano. Vá desenhando à medida em que for lendo.

Fixados os focos, sem perda de generalidade desenhe-os na horizontal. A distância entre eles, a
distância focal, é simbolizada por d. Os instrumentos serão um barbante de comprimento `, onde
` < d, e um palito de comprimento exatamente d.

Fixe uma extremidade do palito num foco, de modo que ele possa girar em torno do foco. Fixe as
extremidades do barbante na ponta livre do palito e no outro foco. Como posição inicial, coloque o
palito precisamente sobre o segmento que liga os focos. Deixe o barbante inteiro em um só “lado”
(= semiplano) da reta que liga os focos, digamos do lado de baixo.

Com um lápis, estique o barbante e marque o ponto A. Esse ponto está sobre F1 F2 , sua distância
a F2 é `/2, a metade do comprimento do barbante, e sua distância a F1 é d − 2` . A diferença entre
as distâncias é portanto d − `.

Gire o palito para baixo (sentido horário) mantendo o barbante esticado, “prendendo” o barbante
no palito com o lápis. O lápis desliza no papel formando o arco de hipérbole.

Tome um ponto do traço do lápis, vamos chamá-lo P , ele está sobre o palito que foi girado. Uma
das extremidades do palito ainda é F1 , vamos chamar a outra de G. Se a distância de P a G é x,
então a distância de P a F1 é d − x, pois P é um ponto do segmento F1 G, que tem comprimento d.
Já a distância de P a F2 é ` − x, pois o barbante, de comprimento `, está esticado de F2 a P e de
P a G. A diferença das distâncias é portanto d − `. Concluı́mos que os pontos A e P pertencem à
hipérbole {X | |d(X, F1 ) − d(X, F2 )| = d − `}.

Repetindo o procedimento com o barbante do lado de cima e giro anti-horário, você desenha mais
um trecho da hipérbole.

Repetindo o procedimento trocando os papéis dos focos, você desenha o outro ramo da hipérbole.
Procure figuras ou vı́deos na internet para ilustrar. Em https://www.youtube.com/watch?v=
ETV_bWAPOqU você vai encontrar a animação de uma construção com régua e barbante, usando o
comprimento da régua - que seria nosso palito - diferente da nossa construção, mas que é útil para
entender o processo.

39
Para deduzir a equação, fixamos os focos nos pontos F1 = (−c, 0) e F2 = (c, 0), c > 0. A
distância entre os focos, chamada d na construção acima é portanto d = 2c. Se chamamos o ponto
inicial P da construção acima de (a, 0), então, a = d2 − 2` . A equação que define a hipérbole fica
|d(X, F1 ) − d(X, F2 )| = 2a. Chamando X = (x, y) e elevando ambos os lados ao quadrado para
eliminar o módulo, chegamos a
p p
( (x + c)2 + y 2 − (x − c)2 + y 2 )2 = 4a2 .

Como exercı́cio de manipulação algébrica, mostre (ou leia e compreenda em algum texto) que
2 2
esta equação quando simplificada, se escreve xa2 − c2y−a2 = 1; sendo b o número positivo tal que
b2 = c2 − a2 , chegamos à forma normal da hipérbole (com focos no eixo x),

x2 y 2
− 2 = 1.
a2 b

O texto https://www2.dbd.puc-rio.br/pergamum/tesesabertas/1512252_2017_completo.pdf,
dissertação de mestrado profissional em Matemática de Johann Senra Moreira, sob tı́tulo Cons-
trução das Cônicas Utilizando o Desenho Geométrico e Instrumentos Concretos, defendida em 2017,
traz a dedução da equação, tanto da elipse como da hipérbole, como também outras ilustrações dos
métodos de construção com barbante esticado que descrevemos.

A partir da forma normal da hipérbole, concluı́mos que o gráfico tem simetria em relação aos eixos
x e y.√Assim, vamos fazer por enquanto um esboço no primeiro quadrante a partir da equação
y = ab x2 − a2 , obtida isolando y em função de x quando ambos são positivos e x > a. Quando

x for muito grande teremos as grandezas x2 − a2 e x2 muito próximas e portanto x2 − a2 muito
próximo de x, embora sempre menor que x. Logo o gráfico desta função se aproximará, por baixo,
do gráfico da reta y = ab x, chamada, por esse motivo de assı́ntota do gráfico.

A figura abaixo ilustra o caso 2x2 − 3y 2 = 1, isto é, b < a, o que implica que a assı́ntota é menos
inclinada que a bissetriz y = x.

b
y= a
x

figura 25

Refletindo este esboço nos eixos x e y, temos o esboço da hipérbole, uma curva com duas com-
ponentes conexas, isto é, dois “ramos”. As retas y = ab x e y = − ab x são chamadas assı́ntotas da
hipérbole.

40
figura 26

Uma observação sobre a relação de Pitágoras b2 = c2 − a2 , utilizada para a dedução da equação


da hipérbole. Vimos que a inclinação da assı́ntota é b/a, então o ponto (a, b) está nessa reta. Isso
ilustra o triângulo retângulo do qual estamos falando, de hipotenusa c:

figura 27

Exercı́cio 11.2 1. Plote em qualquer app o gráfico da hipérbole no primeiro quadrante e a partir
das simetrias em relação aos eixos x e y faça um esboço completo.

2. Localize agora os focos sobre o eixo y, derive a forma normal da hipérbole com focos no eixo
y e faça um esboço de seu gráfico.

Vimos até agora oito exemplos de possı́veis de soluções para equações quadráticas da forma ax2 +
by 2 = c. Vazia, um ponto, um cı́rculo, uma reta, um par de retas paralelas, um par de retas concor-
rentes, uma elipse, uma hipérbole. As duas últimas, elipse e hipérbole, são também chamadas de
cônicas, por estarem também definidas como seções de um cone feitas por um plano. Um cone no
espaço é gerado pela rotação de uma reta g em torno de uma reta h, concorrente com g no ponto V .
V é chamado vértice do cone, g é a geratriz e h é o eixo. A elipse é a interseção de um cone com um
plano “pouco inclinado” com relação à geratriz (ou “menos inclinado”) e a hipérbole é a curva re-
sultante de uma seção do conte por um plano “muito inclinado” (“mais inclinado”). Procure figuras
na internet e confira que a hipérbole tem de fato duas componentes conexas. Sugestão: https://
www.ufrgs.br/espmat/disciplinas/geotri2014/modulo6/cont_conicas.html, onde você po-
derá até interagir com o uso do Geogebra programado para isso diretamente no site. Se tiver cu-
riosidade por uma aula “lousa e giz”, https://pt.khanacademy.org/math/geometry/xff63fac4:
hs-geo-conic-sections/alg2-graphs-of-circles-intro/v/introduction-to-conic-sections.

Exemplo: parábola. Você deve ter perguntado, com razão, sobre a parábola, já que, muito

41
provavelmente foi a primeira curva quadrática que você estudou. De fato, a parábola não aparece
nesta forma normal porque as equações deste tipo possuem exatamente dois eixos de simetria
(os eixos coordenados), enquanto a parábola apresenta apenas um. Apesar disso, trata-se de um
exemplo clássico de cônica (interseção de um cone com um plano “tão inclinado quanto” a geratriz)
e vamos tratar rapidamente dele aqui. A matriz da formaquadrática  da forma normal de uma
a 0
parábola é da mesma forma dos exemplos 4 e 5 acima: A = , a 6= 0, podendo acontecer do
0 0
valor não nulo aparecer na posição (1, 1) ou (2, 2) da matriz. A diferença é que a parábola “exige”
a presença de um termo linear: se o coeficiente de x2 é nulo, então o coeficiente de y não pode ser
e se o coeficiente de y 2 é nulo, o coeficiente de x não pode ser. Formas normais são ax2 − y = 0 ou
ay 2 − x = 0, com gráficos suficientemente conhecidos.

A exemplo de elipses e hipérboles, a parábola também pode ser definida como um lugar geométrico:
é o lugar geométrico dos pontos do plano que equidistam de um ponto (foco) e uma reta (diretriz)
que não contém o foco. Ou ainda como seção de um cone, por um plano “tão inclinado” quanto
a geratriz. Pesquise como construir parábolas com réguas e barbantes a partir da definição como
lugar geométrico, olhe por exemplo https://www.youtube.com/watch?v=5wAEXvK4vS8.

Exercı́cio 11.3 Para uma parábola, suponha que o foco é o ponto (0, c) e a diretriz é a reta y = −c,
c > 0 e deduza a equação desta curva. Para tanto, você vai ter deduzir como calcular a distância
de um ponto a uma reta, um exercı́cio importante em geometria analı́tica.

Veremos mais tarde, quando estudarmos a forma geral das equações quadráticas no plano, da forma
ax2 + bxy + cy 2 + dx + ey = f , que os nove tipos de exemplos vistos acima (vazio, ponto, cı́rculo,
elipse, reta, par de paralelas, parábola, par de concorrentes e hipérbole) são todas as possibilidades
para a solução. Enfatizamos novamente que parábolas não ocorrem como soluções de equações da
forma ax2 + bxy + cy 2 = d.

Exercı́cio 11.4 Demonstre que, dada uma equação da forma ax2 + by 2 = c, com a e b não si-
multaneamente nulos, a solução é de um dos oito tipos vistos acima (conjunto vazio, unitário, um
cı́rculo, uma reta, um par de retas paralelas, um par de retas concorrentes, uma elipse ou uma
hipérbole), ou seja, não ocorre outra possibilidade.

12 Sistemas de coordenadas no plano dados por uma ori-


gem e uma base

O próximo passo para estudarmos equações da forma ax2 + bxy + cy 2 = d com b 6= 0 é fazer uma
mudança de base no plano, algo como mudar o ponto de vista do observador, e encontrar um novo
sistema de coordenadas que simplifique a equação e que nos permita usar as formas normais vistas
na seção anterior para fazer um esboço do gráfico da solução.

Até agora temos estudado objetos geométricos do plano a partir de sua representação algébrica,
por exemplo, pontos e vetores estão representados por pares ordenados de números reais, em geral
escritos como colunas. Também já estudamos retas e curvas como soluções de equações. Para
tanto, foi necessário fixar um sistema de coordenadas cartesianas.

Um sistema de coordenadas no plano é um modo de se associar, sem ambiguidade, pontos do plano


a representações algébricas.

42
Lembre-se do que é usualmente definido no plano, um sistema cartesiano, o famoso “plano xy”,
formado por dois eixos perpendiculares, com origem comum no ponto de interseção, ambos com
vetores diretores unitários tais que o giro do primeiro para o segundo vetor se faz no sentido anti-
horário. Pontos e vetores estão associados (um ponto está associado ao vetor que começa na origem
e termina nele) e representados por matrizes coluna 2 × 1.

Em geral, esse sistema está definido ao fixarmos um ponto O (a origem) e uma base {i, j}, tal que
os vetores i e j sejam ortogonais e unitários, sendo o ângulo de 90o medido de i para j no sentido
positivo. O ponto O e o vetor diretor i determinam o eixo x, enquanto O e j determinam o eixo y.
−→
As coordenadas de um ponto P do plano (ou do vetor OP )são  obtidas através da projeção or-
−→ a −→
togonal de P aos eixos. Na verdade, ao escrevermos OP = , localizamos OP na diagonal do
b
−→
parelogramo (um retângulo) gerado pelos vetores ai e bj, isto é, OP = ai + bj. A base {i, j} é
1
chamada base canônica ou usual do plano cartesiano. Em coordenadas, temos claramente i =
  0
0
ej= .
1

Em resumo,          
−→ a a 0 1 0
OP = = + =a +b = ai + bj.
b 0 b 0 1

Com a mesma ideia de sistemas cartesianos podemos definir coordenadas no plano fixando dois eixos
concorrentes e com mesma origem. Basta escolher um ponto (a origem, em geral denotado por O)
e uma base {~v , w}
~ para o plano. Feita esta escolha, os eixos deste sistema de coordenadas, vamos
chamá-los x e y 0 , serão as retas que passam por O e têm vetores diretores ~v e w
0
~ respectivamente.
Isto significa que ~v define, além da direção do primeiro eixo, sua unidade de medida e seu sentido
positivo, assim como w ~ para o segundo eixo.

Para definir as coordenadas de um ponto P em relação ao sistema de origem O e base {~v , w}~ basta
−→
escrever OP como combinação linear de ~v e w,~ isto é, como diagonal de um paralelogramo com
lados paralelos a ~v e w.~ Vamos relembrar o raciocı́nio: por P existe uma única reta paralela a w,~
que corta o eixo x0 num ponto A, assim como existe uma única paralela por P a ~v , cortando o
eixo y 0 no ponto B (figura 28). Os pontos A e B estão unicamente determinados a partir do ponto
−→ −→ −−→ −→
P . Pela regra do paralelogramo, temos OP = OA + OB. Como sabemos que OA é um múltiplo
−→ −−→
de ~v , existe um único a ∈ R tal que OA = a~v Também OB é um múltiplo de w, ~ logo existe um
−−→ −→
único b ∈ R tal que OB = bw. ~ Os números a e b são chamados de coordenadas  de P (ou de OP )
a
em relação ao sistema de coordenadas G = {O, {~v , w}}.
~ Escrevemos PG = . No sistema G,
b   
1 0
como era de se esperar, os vetores da base têm coordenadas canônicas: ~vG = ew
~G = .
0 1
Lembramos mais uma vez que o raciocı́nio algébrico equivalente
  é dizer que, sendo 
A  a matriz
x −→ a
formada pelos vetores ~v e w~ como colunas, o sistema A = OP tem única solução .
y b

43
x0

B y0
~v w
~

figura 28

O sistema de coordenadas usual do plano, como já foi dito, é definido a partir de um ponto O
e uma base positiva formada por dois vetores unitários e perpendiculares. Em tempo: uma base
chama-se positiva quando o giro do primeiro vetor para o segundo ao longo do menor ângulo entre
eles é no sentido positivo. A base usual do plano é em geral denotada por B0 = {i, j}. Considere
a origem O fixada. Em casos onde não há perigo de confusão, não usamos ı́ncice para expressar
coordenadas em relação à base canônica: em vez de escrever ~uB0 ou PB0 escrevemos apenas ~u ou P .

Existem situações nas quais precisaremos (ou desejaremos) trabalhar com dois sistemas de coorde-
nadas simultaneamente, portanto, dado um objeto geométrico, seja um ponto, um vetor, uma reta,
uma cônica, devemos saber relacionar as matrizes ou equações que os representam em diferentes
sistemas. Observamos que o nosso ambiente é o plano, ele está lá e não muda, o que pode mudar
são os sistemas de coordenadas que usamos para representar algebricamente seus objetos. Ou seja,
um ponto no plano está lá, antes de fixarmos um sistema de coordenadas para representá-lo alge-
bricamente: um ponto P pode ser representado por duas matrizes diferentes PB e PC , mas P não
muda, o que muda são suas coordenadas.
2 2
A ideia que está por trás disto é a seguinte: dada uma equação  da forma
 ax + bxy + cy = d,
a b/2
cuja forma quadrática está representada pela matriz A = , faremos a mudança de
b/2 c
coordenadas para o sistema (x0 , y 0 ) dado pelas direções invariantes de A. Veremos que nesse sistema
os eixos x0 e y 0 são perpendiculares e além disso, eixos de simetria da solução. Nessas coordenadas
equação se escreverá λ1 x02 + λ2 y 02 = d, uma forma normal, e todas já foram estudadas na seção
anterior.

13 Mudanças de base no plano

Fixemos a origem O para o plano até que se diga o contrário. O que define as coordenadas de um
vetor num sistema é sua decomposição como combinação linear dos vetores da base. Assim, dadas
as bases usual B0 , que define as coordenadas usuais (x, y), e B = {~v , w},~ cujas coordenadas vamos
0 0
denominar (x , y ), não é difı́cil deduzir a equação que relaciona as coordenadas de um ponto P em
cada uma das bases. Escreva
−→
OP = xi + yj = x0~v + y 0 w.
~

44
   0
x 0 x
Isto significa que X = são as coordenadas de P na base canônica e X = são as
y y0
coordenadas
  de  P  B.
na base  Vamos olhar para esta equação no sistema usual. Seu lado esquerdo
1 0 x
fica x +y = = X. Para o lado direito, vamos considerar a matriz A = [~v , w] ~
0 1 y
que tem os vetores~v e w ~ como colunas. É um exercı́cio de multiplicação de matrizes ver que
0
x
x0~v + y 0 w
~ = [~v , w]
~ , isto é, o lado direito da equação fica AX 0 . Portanto, a equação que
y0
relaciona as coordenadas de um vetor nas bases B0 e B é

X = AX 0 .

A matriz A é chamada de matriz de mudança de base. As colunas de A são uma base para o plano,
portanto vetores não paralelos, logo det A 6= 0. Em outras palavras, A é invertı́vel e qualquer
sistema associado a A tem única solução. Em particular, uma maneira equivalente de escrever a
equação de mudança de base é multiplicar ambos os lados por A−1 à esquerda, obtendo

X 0 = A−1 X.

Exemplos.
   
1 2
1. Sejam ~v = ew~ = ~ (colunas) matriz 2 × 2. Então, x~v + y w
. Seja A = [~v , w] ~ =
  3   −2      
1 2 x + 2y 1 2 x x
x +y = = = A , um exemplo que ilustra que
3 −2 3x − 2y 3 −2 y y
multiplicação de matriz por vetor é uma combinação linear das colunas da matriz onde os
escalares utilizados são as entradas do vetor.
   
1 2
2. Seja B = {~u, ~v }, onde ~u = e ~v = . Se temos um ponto P do plano cujas coordenadas
  1 1
5
na base usual são P = , para calcular PB , usamos a equação de mudança de base. Para
−1
estecaso, onde
 temos X (istoé, P ) e queremos calcular X 0 (isto é, PB ), usamos PB = A−1 P =
1 1 −2 5 −7
−1
= .
−1 1 −1 6
3. Se um vetor w
~ do plano pode serdecomposto
 como w~ = ~u − ~v , onde ~u e ~v são os vetores da
1
base do exemplo 2, então w
~B = e suas coordenadas na base canônica são dadas por
     −1 
1 2 1 −1
w
~ = Aw~B = = .
1 1 −1 0
4. Outra pergunta importante é como achar a equação da reta r : 2x − 5y = 12 nas co-
ordenadas (x0 , y 0 ), definidas pela base B do exemplo
 2. Basta escrever a equação de r
 x
explicitando o produto de matrizes, r : 2 −5 = 12 e usar X = AX 0 , ou seja,
   0 y
 1 2 x
r : 2 −5 = 12, que, fazendo as contas, fica r : −3x0 − y 0 = 12.
1 1 y0

45
5. O mesmo raciocı́nio se aplica a uma equação quadrática. Digamos que queremos a equação
3x2 + 4y 2 = 1 no sistema (x0 , y 0 ), ainda considerando
 a base
  do exemplo 2. Escrevendo
 3 0 x
a equação em sua forma matricial, temos x y = 1, ou X t M X = 1, onde
  0 4 y
3 0
. Novamente faremos a substituição X = AX 0 , só que agora,
t

X = x y eM =
0 4
olhando para a equação, precisaremos saber quem é X t = (AX 0 )t .

   0 t    0 t  t
a b x 0 0
 a c x a b
Exercı́cio 13.1 Mostre que = x y = .
c d y0 b d y0 c d

Resolvido este exercı́cio, neste caso especı́fico sabemos que X t = (AX 0 )t = X 0t At , ou seja, a
transposta de um produto de matrizes é o produto das matrizes transpostas, mas em ordem
contrária (isso vale em geral, para qualquer produto de matrizes, mas não vamos fazê-lo agora).
Voltando ao exemplo, substituindo X = AX 0 e X t = X 0t At em  X tM X  = 1,  ficamos
 com

1 1 3 0 1 2
X 0t At M AX 0 = 1. Calculando o produto de matrizes, At M A = =
  2 1 0 4 1 1
7 10
. De maneira que a equação nas coordenadas (x0 , y 0 ) fica 7x02 + 20x0 y 0 + 16y 02 = 1.
10 16

Só lembrando: a transposta de uma matriz Am×n é a matriz Atn×m cujas linhas são as colunas
de A (ou, equivalentemente, cujas colunas são as linhas de A).

6. O exemplo anterior serve também para uma observação sobre eixos de simetria. Os exemplos
de cônicas que vimos até agora são da forma ax2 + by 2 = c, que naturalmente têm os eixos
x e y como eixos de simetria. Isto acontece porque, na equação, as variáveis x e y aparecem
com expoente 2 e nenhum outro termo de grau 2 ou 1 aparece. Veja o caso da equação
5x2 + 3y 2 = 17, da qual o ponto P = (1, 2) faz parte da solução. Se refletirmos P no eixo
x, isto é, se trocarmos sua coordenada y de sinal, o ponto resultante Q = (1, −2) ainda faz
parte da solução. O mesmo ocorre com a reflexão de P no eixo y, trocando sua coordenada
x de sinal, resultando em T = (−1, 2). Agora, isto já não é verdade para uma equação
quadrática onde o coeficiente do termo xy seja diferente de 0. De fato, se consideramos a
equação x2 + 2xy + 3y 2 = 6, da qual (1, 1) faz parte da solução, veremos que nem (1, −1) nem
(−1, 1) fazem parte da solução.

7. Em ambas as equações do exemplo anterior, tanto 5x2 + 3y 2 = 17, como x2 + 2xy + 3y 2 = 6,


se um ponto faz parte da solução, então ao trocarmos ambas as coordenadas de sinal, o ponto
“oposto” ainda faz parte da solução. Isto significa que ambas têm simetria em relação à
origem. Por causa desta simetria, equações gerais da forma ax2 + bxy + cy 2 = d têm seu
conjunto solução centrado na origem, mas terá os eixos x e y como eixos de simetria se e
somente se o coeficiente b do termo xy for zero. Ou, equivalentemente, se a matriz da forma
quadrática for diagonal.

 O fixada, B0 ={i, j} a base


Exercı́cio 13.2 Para os exercı́cios 1 a 5 abaixo, considere a origem
3 2
canônica, que define coordenadas (x, y) e B = {~v , w},
~ onde ~v = e w~ = , a base que
1 −1
define coordenadas (x0 , y 0 )

46
   
2 −1 −→
1. Sejam P = eQ= . Quais são as coordenadas de P Q na base B?
5 −1
 
0 0 3
2. Se ~u é um vetor cujas coordenadas no sistema (x , y ) são ~uB = , calcule o ponto final de
  2
0
~u, quando seu ponto inicial é o ponto A = . Lembre-se que, na ausência de ı́ndice, as
3
coordenadas são relativas à base canônica.

3. Calcule a interseção das retas r : 2x − 5y = 7 e s : 2x0 − 5y 0 = 7.

4. Qual é a equação do cı́rculo de centro na origem e raio 4 no sistema usual de coordenadas?


E no sistema (x0 , y 0 )?

5. Qual é a equação da curva x02 + y 02 = 4 no sistema usual? Podemos dizer que trata-se de um
cı́rculo?

 A uma matriz 2 × 2 cujas colunas são os vetores u~1 e u~2 . Mostre que a1 u~1 + a2~u2 =
6. Sejam
a
A 1 .
a2

7. Se B e C são duas bases quaisquer, definindo respectivamente as coordenadas (u, v) e (z, w),
estabeleça uma relação entre as coordenadas que elas definem.

8. Suponha que um novo sistema de coordenadas (x0 , y 0 ) é obtido do usual por uma rotação dos
vetores i e j da base canônica de 30o no sentido positivo, mantendo-se fixa a origem. Qual é
a equação do eixo x nas novas coordenadas?

9. Qual é a equação da reta r : 8y − 3x = 2 nas coordenadas (x0 , y 0 ) dadas pela base {j, −i}? (i
e j são os vetores da base canônica).
 
0 1 1
10. Considere a mudança de base X = AX , onde A = e X são coordenadas usuais. Os
  1 2
3 −1
vetores cujas coordenadas no sistema X 0 são e são ortogonais?
1 3
11. Na base canônica, a condição algébrica que determina paralelismo de vetores é: ~u e ~v são
paralelos se e somente se ~v = α~u para algum α ∈ R. Numa base qualquer {w ~ 2 } esta
~ 1, w
condição também é verdadeira?

12. Seja R a rotação de 45o no sentido positivo. Qual é a equação da parábola x2 = 2y no sistema
(x0 , y 0 ) dado pela base {Ri, −(Rj)}?

13. Quando giramos a hipérbole de equação 2x2 − y 2 = 1 de 60o no sentido negativo, obtemos a
curva h. Qual é a equação de h?

14. A elipse E é tangente interiormente à circunferência x2 + y 2 = 16, tangente exteriormente


à circunferência x2 + y 2 = 1 e tem focos sobre a reta y = x. Faça esboços das situações e
determine a equação de E nos seguintes casos:

(a) E tem dois pontos de tangência com cada uma das circunferências.
(b) E tem um ponto de tangência com cada uma das circunferências.

47
15. Uma hipérbole passa pela origem do sistema de coordenadas e tem como assı́ntotas as retas
x = 4 e y = −2. Qual é sua equação?

16. Considere a elipse L de equação x2 + 2y 2 = 1 e seja E a elipse obtida pela rotação de L de


45o no sentido positivo. Seja H a hipérbole de equação y 2 − x2 = k, onde k é uma constante
real. Determine k para que H ∩ E seja um conjunto com exatamente dois pontos (H e E
tangentes).

14 Eixos de simetria de ax2 + bxy + cy 2 = d

Vamos voltar agora ao problema de estudar as equações quadráticas da forma ax2 + bxy + cy 2 = d,
onde pelo menos um dos coeficientes a, b ou c é não nulo. Já vimos que existe uma e só uma matriz
simétrica que representa esta forma quadrática, obtida escrevendo a equação como
  
 a b/2 x
x y = d.
b/2 c y

Primeira pergunta: sempre existem eixos de simetria perpendiculares para o conjunto solução
da equação? Já vimos que este é o caso se a matriz da forma quadrática é diagonal. Então,
poderı́amos perguntar, de maneira equivalente, se existe um sistema de coordenadas (x0 , y 0 ), com
eixos perpendiculares, no qual a equação dada tem o coeficiente de x0 y 0 nulo?

Segunda pergunta: caso exista, como podemos obter tal sistema de coordenadas?

As respostas são respectivamente “sim” e “fácil”; veremos agora como isso pode ser feito.

O próximo resultado é exatamente o que precisamos para estudar tais equações quadráticas (lembre-
se que a, b e c não são simultaneamente nulos):

Teorema 14.1 Dada em R2 uma equação da forma ax2 + bxy + cy 2 = d, o conjunto solução da
equação admite um par de eixos de simetria
 perpendiculares.
 Estes eixos são definidos por direções
a b/2
invariantes da matriz simétrica M = .
b/2 c

Não adianta conhecer esse resultado se não dispusermos de uma técnica para determinar as direções
invariantes de uma matriz simétrica. Os conceitos envolvidos são os autovetores e autovalores da
matriz da forma quadrática, que aparecem naturalmente na demonstração do resultado enunciado
e que veremos a seguir.

14.1 Autovetores e autovalores

Façamos uma breve recordação do que é uma direção invariante. Ao interpretarmos M2×2 como um
movimento do plano, isto é, uma função que atua num vetor ~v , multiplicando ~v por M à esquerda,

M : R2 → R2
,
~v 7→ M~v

48
M~v é também um vetor e podemos olhar para a posição de ambos os vetores ~v e M~v no mesmo
plano, observando o domı́nio e o contradomı́nio sobrepostos (e no sistema usual de coordenadas).
Pode acontecer que ~v e M~v tenham a mesma direção, isto é, ~v pode ser um vetor não nulo tal
que M~v seja um múltiplo do próprio ~v . Em sı́mbolos, um vetor não nulo ~v define uma direção
invariante de M se existe um número real λ tal que M~v = λ~v . Nesse caso, ~v é chamado de
autovetor de M associado ao autovalor λ. Autovetores (autovalores) eventualmente são chamados
de vetores (valores) próprios ou caracterı́sticos da matriz M .

Mas como saber se uma matriz M tem autovalores e autovetores e como calculá-los? A partir da
equação
M~v = λ~v ,
 
a b
usando coordenadas, supondo que M = e chamando o vetor que queremos encontrar de
  c d
x
~v = , escrevemos
y
(
ax + by = λx
,
cx + dy = λy

ou, de maneira equivalente,


(
(a − λ)x + by = 0
.
cx + (d − λ)y = 0

Isto é, o problema de encontrar


 os autovetores
 de uma
 matriz
 é modelado
 num sistema linear cuja
a−λ b a b 1 0
matriz dos coeficientes é = −λ = M − λI, onde I é a matriz
c d−λ c d 0 1
identidade 2 × 2.

Observe que o vetor nulo é sempre solução desse sistema. No entanto, por definição, exigimos que
autovetores sejam não nulos, para que possam representar uma direção invariante. Assim, a solução
nula não serve e a matriz M só terá autovetores quando esse sistema tiver soluções não nulas.

Como já vimos, esse só será o caso se det(M − λI) = 0, pois caso contrário o sistema teria o vetor
nulo como sua única solução. Em outras palavras, uma condição necessária - e suficiente - sobre λ
para que a matriz admita autovetores é que det(M − λI) = 0. Esta equação é chamada equação
caracterı́stica e no nosso caso (matrizes 2 × 2), é uma equação polinomial de 2o grau em λ.

Como o autovalor λ deve ser um número real, pode haver três casos: M tem dois autovalores
distintos (se ∆ > 0); M tem dois autovalores iguais (se ∆ = 0), ou M não tem autovalores (se
∆ < 0).

Observe que dizer que λ satisfaz det(M − λI) = 0 é equivalentemente a dizer que que o sistema
tenha as duas equações múltiplas. Na prática, isso quer dizer que o sistema dependerá de uma
equação e duas incógnitas, sua solução portanto sendo interpretada como uma reta que passa pela
origem. Todos os vetores desta reta (exceto a origem, claro) serão autovetores associados a λ.

49
 
2 −2
Exemplo. No caso da matriz A = , a condição para que λ seja um autovalor é
−1 0
det(A − λI) = 0, ou seja,
   
2 −2 1 0
det −λ =0
−1 0 0 1

ou
 
2 − λ −2
det =0
−1 −λ

ou (2 − λ)(−λ) − 2 = 0, ou ainda λ2 − 2λ − 2 = 0 que é a equação caracterı́stica da matriz A. O


polinômio (de grau 2) p(λ) = λ2 − 2λ − 2 é o polinômio caracterı́stico da matriz A. Suas raı́zes, as
soluções da equação caracterı́stica, são os autovalores de A.
 
a b
Exercı́cio 14.1 Mostre que a equação caracterı́stica da matriz é λ2 −(a+d)λ+(ad−bc) =
c d
0. Dê exemplos de matrizes com dois autovalores distintos, com dois autovalores iguais e sem
autovalores.

Exemplo. Vamos estudar a equação 5x2 + 12xy = 1. Na sua forma matricial,


  
 5 6 x
x y = 1.
6 0 y

Como já dito, paraencontrar as direções de simetria da solução, devemos procurar as direções
5 6
invariantes de M = , ou seja, temos que calcular os os autovalores da matriz M . A equação
6 0 
5−λ 6
caracterı́stica é det = 0, isto é, λ2 − 5λ − 36 = 0, equação que podemos resolver
6 0−λ
de cabeça e obter as duas raı́zes: λ1 = 9 e λ2 = −4.
 
x
Para o cálculo dos autovetores associados a λ1 = 9, procuramos soluções não nulas ~v = do
     y
x 5−9 6 x
sistema (M − 9I) = 0, ou seja, = 0, ou ainda
y 6 0−9 y
(
−4x + 6y = 0
.
6x − 9y = 0

Como era de se esperar, as equações são múltiplas (os valores de λ foram calculados para isso) e
para escrever a solução basta olhar uma delas, por exemplo, dividindo a primeira por −2, ficamos
com 2x − 3y =  0. Isolando
 uma das incógnitas,
  por exemplo,
  x  em função
 de y, vemos que a
3y/2 3/2 3
solução é S1 = |y ∈ R = y |y ∈ R = y |y ∈ R , a reta gerada pelo
y 1 2

50
 
3
vetor . Qualquer vetor não nulo desta reta é autovetor associado ao autovalor 9. A escolha
2  
3
natural é ~v1 = .
2

Para calcular um autovetor associado ao autovalor λ2 = −4, repetimos o processo (verifique as


 o sistema (M − (−4)I)~v = 0 e tomamos uma solução particular não nula, por
contas): resolvemos
−2
exemplo, ~v2 = .
3

Uma observação é que os vetores ~v1 e ~v2 são ortogonais e assim formam uma base para R2 . Isto não é
uma coincidência: veremos que para matrizes simétricas, existe uma base ortogonal de autovetores.

Obtidos os autovetores, vamos considerar uma mudança de base, da base canônica para a base de
autovetores da matriz M . Finalizando o exemplo, vamos escrever a equação 5x2 + 12xy = 1 nas
coordenadas (x0 , y 0 ) definidas pela base {~v1 , ~v2 }.
  
 5 6 x
Para tanto, a partir da equação original x y = 1, escrita como X t M X = 1, e da
6 0 y
equação de mudança de base X = AX 0 , onde A = [~v1 , ~v2 ] (colunas), substituimos X por AX 0
(consequentemente X t por X 0t At - vide exercı́cio 13.1) e ficamos com

X 0t At M AX 0 = 1.

 
t 117 0
Uma simples multiplicação de matrizes nos leva a A M A = , uma matriz diagonal,
0 −52
o que nos diz que a equação procurada é 117x02 − 52y 02 = 1, equação de uma hipérbole, já que
02 02
sabemos colocá-la na forma normal ( √x1 )2 − ( √y1 )2 = 1 e consequentemente desenhá-la no sistema
117 52
(x0 , y 0 ). E, como sabemos localizar esse novo sistema a partir do usual, sabemos esboçar a solução
da nossa equação no sistema usual. Um esboço está na figura 24: note que os eixos x0 e y 0 têm
direção determinadas pelos autovetores de M e são eixos de simetria da solução da equação.

51
y0

~v2

x0

~v1
2

figura 29

Note que a interseção da hipérbole com o eixo x0 , que ocorre nos valores ± √117
1
medidos no eixo x0 ,
podem ser localizados a partir da unidade de medida do eixo x0 , dada pelo vetor ~v1 .

Exercı́cio 14.2 O eixo y é uma assı́ntota dessa hipérbole?

O leitor atento perguntará: tudo bem, a ideia funcionou para este exemplo, conseguimos “des-
vendar” a equação e esboçar sua solução com a mudança para a base de autovetores. Mas isso
sempre dará certo? Antes de demonstrarmos esse fato, vamos estudar um pouco mais sobre bases
ortogonais no plano.

Exercı́cio 14.3 Obtenha, e faça um esboço da situação, um sistema de eixos ortogonais x0 e y 0 de


maneira que, nas novas coordenadas, a equação

−7x2 + 16xy − 2y 2 = 1

tenha a forma ax02 + by 02 = 1.

14.2 Matrizes ortogonais 2x2

Continuando a olhar o exemplo anterior, observe que para esboçar a curva no sistema (x0 , y 0 ) tivemos
que tomar algum cuidado com a escala, já que os autovetores ~v1 e ~v2 determinam também a unidade

52
de medida dos novos eixos. Para contornar esta situação, podemos escolher autovetores unitários.
Lembre que qualquer múltiplo
  não nulo de ~v1 ainda é um atovetor associado  ao autovalor λ1 = 9 e
3 −2
~ 1 = k~~vv11 k = √113
tome w . Do mesmo modo, tome w ~ 2 = k~~vv22 k = √113 associado a λ2 = −4.
2 3

Nesse caso, além de tornar desnecessário o cuidado com a mudança   de escala, a matriz dos au-
3 −2
tovetores (vamos chamá-la ainda de A), fica [w ~ 2 ] = √113
~ 1, w , e o cálculo At M A retorna
  2 3
9 0
a matriz D = , a matriz dos autovalores, donde pode-se imediatamente concluir que a
0 −4
equação, nas novas coordenadas, é 9x02 − 4y 02 = 1.

Assim, há pelo menos duas vantagens em escolhermos autovetores unitários: não mudamos a escala
dos eixos coordenados e, ao fazermos a mudança de coordenadas da equação, já sabemos quem vão
ser os coeficientes de x02 e y 02 : exatamente os autovalores.

Na verdade, matrizes cujas colunas são vetores unitários e ortogonais são particularmente impor-
tantes.

Definição. Uma base do plano na qual os vetores são unitários e ortogonais é chamada base
ortonormal (“orto” de ortogonal e “normal” de normalizada para que seus módulos sejam 1). Uma
matriz 2 × 2 cujas colunas são uma base ortonormal é chamada de matriz ortogonal.

Exercı́cio 14.4 (Propriedades de matrizes ortogonais - aqui estamos considerando matrizes qua-
dradas de ordem 2, mas o conceito existe e as propriedades valem para matrizes quadradas de
qualquer ordem).

1. Se A é uma matriz ortogonal, então | det A| = 1. A recı́proca é verdadeira? Isto é, se uma
matriz A tem seu determinante valendo 1 ou −1, então ela é ortogonal?

2. Se A é uma matriz ortogonal, então A−1 = At . A recı́proca é verdadeira? Isto é, matrizes
quadradas que satisfazem A−1 = At são ortogonais?

3. Matrizes ortogonais preservam produto escalar. Isto é, se A é uma matriz ortogonal e ~u e ~v
são dois vetores quaisquer, então hA~u, A~v i = h~u, ~v i.

Observações (que podem ajudar a resolver os exercı́cios acima).

1. Se A é uma matriz ortogonal e A = [~v , w] ~ (colunas), então ~v é um vetor unitário, isto é,
k~v k = 1. O que é o mesmo que dizer que h~v , ~v i = 1. O mesmo vale para w:~ hw,
~ wi~ = 1. E,
como ~v e w~ são ortogonais, temos h~v , wi
~ = 0.

2. Lembre-se que no sistema usual de coordenadas, o produto escalar pode ser escrito como
produto
  de matrizes,
 escrevendo o primeiro vetor como linha e o segundo como coluna: se
u1 v
~u = e ~v = 1 , então
u2 v2
 
 v1
h~u, ~v i = u1 v1 + u2 v2 = u1 u2 = ~ut~v
v2

53
Este modo de escrever o produto escalar nos mostra que uma matriz qualquer M “passa de
um lado para o outro” num produto escalar a partir de sua transposta: hM~u, ~v i = (M~u)t~v =
(~ut M t )~v = ~ut (M t~v ) = h~u, M t~v i.

Na segunda igualdade foi usada mais uma vez a propriedade de que a transposta de um
produto de matrizes é igual ao produto das transpostas em ordem contrária.

Para se familiarizar melhor com esta propriedade se necessário, dê exemplos de uma matriz
2 × 2 M e de vetores ~u e ~v , calcule M~u, M t~v e os produtos escalares hM~u, ~v i e h~u, M t~v i e
veja que são iguais.

Falta ainda a demonstração do resultado enunciado: todas as equações da forma ax2 +bxy +cy 2 = d
têm um par de eixos de simetria ortogonais para a solução, dados por uma base ortonormal de
autovetores para a matriz de sua forma quadrática. O melhor tı́tulo para isso é o seguinte:

14.3 Diagonalização de matrizes simétricas 2 × 2

O resultado nos diz que a equação quadrática X t M X = d admite um sistema cartesiano de coorde-
nadas (x0 , y 0 ) cujos eixos são eixos de simetria da solução (ou seja, o coeficiente de x0 y 0 na equação
é nulo), dado por direções invariantes da matriz simétrica M .
 
a b
Então, vamos partir da matriz simétrica M = e encontrar seus autovalores e autovetores.
b c

Se b = 0, a matriz é diagonal, então os próprios eixos x e y são as direções de simetria procurada,


isto
 jáfoi visto. Um caso particular aı́ é quando a = c, e o movimento determinado pela matriz
a 0
é a multiplicação pelo escalar a. Nesse caso, a equação tem a forma ax2 + ay 2 = d (um
0 a
cı́rculo, se a e d têm o mesmo sinal) e todas as direções são invariantes, incluindo os eixos x e y.

Vamos ver o que acontece quando b 6= 0. A equação caracterı́stica de M é det(M − λI) = 0, ou


(a − λ)(c − λ) − b2 = 0, ou ainda

λ2 − (a + c)λ + ac − b2 = 0.

Para resolver esta equação, calculamos o ∆ = (a + c)2 − 4ac + 4b2 . Simplificando, podemos escrever
∆ = (a − c)2 + (2b)2 , isto é, ∆ é uma soma de quadrados. Assim, certamente ∆ > 0.

Para que ocorra ∆ = 0, devemos ter b = 0 e a = c, ou seja, a equação tem a forma ax2 + ay 2 = d e
a solução pode ser um cı́rculo, um ponto ou o conjunto vazio. Em qualquer caso, todas as direções
são invariantes, incluindo os eixos x e y, e a mudança de base não é necessária.

Como estamos supondo b 6= 0, temos na verdade ∆ > 0. O que significa que existem dois autovalores
reais distintos.

Vamos chamar as raı́zes da equação caracterı́stica, os autovalores, de λ1 e λ2 . Escolha autovetores


unitários w
~ 1 associado a λ1 e w
~ 2 associado a λ2 . Vamos mostrar que w ~1 e w~ 2 são mais que uma
base: eles são ortogonais.

54
Ou seja, vamos mostrar que hw ~ 1, w~ 2 i = 0. Para ver isso, usando a observação 2 acima, podemos
t
escrever hM w ~ 2 i = hw
~ 1, w ~ 1, M w~ 2 i, mas, como M é simétrica, temos M t = M , o que nos dá

hM w ~ 2 i = hw
~ 1, w ~ 2 i.
~ 1, M w

Temos M w
~ 1 = λ1 w
~1 e Mw
~ 2 = λ2 w
~ 2 , pois são autovetores e autovalores associados. Portanto

hλ1 w ~ 2 i = hw
~ 1, w ~ 2 i.
~ 1 , λ2 w

Da própria definição do produto escalar, segue

λ1 hw ~ 2 i = λ2 hw
~ 1, w ~ 2 i,
~ 1, w

que, passando para o mesmo lado da equação e fatorando, é o mesmo que

(λ1 − λ2 )hw ~ 2 i = 0.
~ 1, w

Ora, λ1 − λ2 6= 0, pois são raı́zes distintas da equação caracterı́stica. Concluı́mos que hw ~ 2i = 0 e


~ 1, w
que os autovetores são ortogonais. Ou seja, ficou demonstrado para matrizes 2 × 2 (e que também
vale para n × n em geral) o seguinte resultado:

Proposição 14.1 Para matrizes simétricas, autovetores associados a autovalores distintos são or-
togonais.

Assim, conseguimos uma base ortonormal {w ~ 2 } que define eixos x0 e y 0 que devem ser eixos de
~ 1, w
simetria para a equação original. Para verificar isto, basta olhar para a equação neste novo sistema
de coordenadas e constatar que o coeficiente de x0 y 0 é nulo.

A relação entre as coordenadas


 usuais e asnovas coordenadas é X = AX 0 , onde A = [w
~ 1, w
~ 2 ] é a
0
 
x x
matriz dos autovetores, X = e X0 = .
y y0

então, a forma quadrática X t M X, nas novas coordenadas, é

X 0t At M AX.

Como a matriz A é ortogonal e portanto At = A−1 (vide exercı́cio 2 acima), podemos escrever

X 0t A−1 M AX.
 
−1 λ1 0
Afirmamos que A M A = D, onde D = é a matriz dos autovalores. Note que, uma vez
0 λ2
verificada essa afirmação, a forma quadrática nas coordenadas (x0 , y 0 ) fica λ1 x02 + λ2 y 02 , donde a
equação de fato terá x0 e y 0 como eixos de simetria. Portanto, ao ao calcularmos os autovalores,
saberemos imediatamente como será a equação na base de autovetores.

55
Mostrar que A−1 M A = D é equivalente a mostrar que M A = AD. O lado esquerdo desta equação
pode ser escrito M [w
~ 1, w
~ 2 ]. É um exercı́cio de multiplicação de matrizes ver que M A = [M w ~ 1, M w
~ 2 ],
que por sua vez é igual a [λ1 w ~ 1 , λ2 w
~ 2 ], já que são autovalores e autovetores associados.
 
λ1 0
Já para o lado direito temos AD = [w ~ 1, w~ 2] e a partir daqui é um simples exercı́cio de
0 λ2
multiplicação de matrizes ver que AD = [λ1 w ~ 1 , λ2 w
~ 2 ], concluindo que a igualdade é válida.

Demonstramos o que querı́amos. Em outras palavras, verificamos que

Teorema 14.2 Matrizes simétricas são diagonalizáveis por bases ortonormais, isto é, dada uma
matriz simétrica 2 × 2 M , existem matrizes A ortogonal e D diagonal tais que M = ADA−1 .

O leitor pode perguntar se, antes de fazermos a mudança de coordenadas de modo a que a equação
fique numa “forma normal”, já sabemos que tipo de solução a equação apresenta. Para responder
a esta pergunta, a primeira observação é o fato que existem três tipos de equações resultantes no
sistema (x0 , y 0 ) dado por uma base de autovetores de M . E o tipo da equação depende do produto
dos autovetores, isto é, det D.

Se ambos os autovalores têm mesmo sinal (isto é, det D > 0), então a equação fica λ1 x02 + λ2 y 02 = d
e multiplicando por −1 se necessário, podemos supor os coeficientes de x02 e y 02 ambos positivos e,
consequentemente, a solução depende da constante d: se d > 0, então é uma elipse (admitindo o
cı́rculo como caso particular quando os autovalores são iguais); se d = 0 a solução é um ponto (a
origem) e se d < 0 a solução é vazia. Equações assim são chamadas de tipo elı́ptico.

Já se os autovalores têm sinais opostos (det D < 0), então o mesmo acontece com os coeficientes de
x02 e y 02 na equação e a solução pode ser uma hipérbole, caso d 6= 0 ou um par de retas concorrentes,
caso d = 0. Estas são as de tipo hiperbólico.

A última possibilidade, uma equação de tipo parabólico, ocorre quando um dos autovalores é zero
(ou det D = 0). Trocando a ordem dos autovalores se necessário, podemos supor λ2 = 0. Nesse
caso a equação assume a forma λ1 x02 = d, ou equivalentemente x02 = k (constante), e a solução
pode ser vazia, uma reta ou um par de retas paralelas, caso k < 0, k = 0 e k > 0 respectivamente.

Exemplos de todos os casos acima foram dados na seção “Cônicas”. O que fizemos (a análise de
todas as possibilidades) nos permite concluir que são todos os casos possı́veis. Observe também
que o raciocı́nio acima nos diz uma vez mais que a parábola não ocorre como solução da equação
ax2 + bxy + cy 2 = d.

Exercı́cio 14.5 Respondendo a pergunta, podemos sim saber se uma equação é do tipo elı́ptico,
hiperbólico ou parabólico antes mesmo de calcular os autovalores: mostre que det M = det D.

Outra possı́vel pergunta é se as matrizes A e D obtidas são únicas, isto é, a mudança de coordena-
das para uma base de autovetores sempre produz o mesmo resultado? A resposta aqui é não. Veja,
quando calculamos os autovalores, temos de escolher uma ordem entre eles. O primeiro autovalor
dará origem ao primeiro eixo do sistema (x0 , y 0 ). E sabemos que a ordem dos eixos é fundamental.
Então temos aı́ duas escolhas para D. Uma vez escolhida a ordem dos autovalores, estarão deter-
minados os dois eixos, mas para cada um deles há duas escolhas possı́veis de gerador (autovetor)
unitário, pois há duas escolhas possı́veis para o sentido positivo de um eixo. Assim, no total, há
oito possibilidades diferentes de se obter o par de matrizes A e D.

56
Exercı́cio 14.6 Ache as outras sete possibilidades para as matrizes A e D no exemplo que estu-
damos na seção 14.1, isto é, a equação 5x2 + 12xy = 1. Para cada uma, obtenha a nova equação.
Conclua que apesar disso não há oito equações diferentes.

15 Mudança de origem

Continuando no caminho para se estudar a forma mais geral de equações quadráticas no plano,
precisaremos entender mudanças de origem.

Para isso, vamos considerar dois sistemas de coordenadas com a mesma base - a base usual {i, j}
- mas origens diferentes. Escolha pontos O e Q no plano e defina coordenadas usuais (x, y) do
sistema {O, {i, j}} e (x0 , y 0 ) do sistema {Q, {i, j}}.

Seja B um ponto qualquer do plano. Suas coordenadas em relação à origem O são as coordenadas
−−→ −−→
do vetor OB e em relação à origem Q são as coordenadas de QB. Note que os pontos O, Q e
−−→ −→ −−→
B, a partir da definição de adição de vetores, satisfazem OB = OQ + QB. Esta equação, quando
observada do sistema usual de coordenadas, nos diz

X = Q + X 0,

onde X são as coordenadas do ponto B no sistema usual e X 0 as coordenadas de B em relação


à origem Q. Esta equação relaciona dois sistemas de coordenadas com mesmas bases, mas com
origens distintas. A situação está ilustrada na figura 30.
y

y0

x0

O x

figura 30

Exemplos.

57
1. Seja Q o ponto (−1, 3) do plano. Sejam (x, y) coordenadas usuais e (x0 , y 0 ) coordenadas em
relação à origem Q. Se B é um ponto do plano, vamos denotar por BQ suas coordenadas em
relação a Q e, como de praxe, quando não houver
  ı́ndice, isto significa que as coordenadas
2
são as do sistema usual. Por exemplo, se B = , para obter BQ basta olhar para a relação
2      
2 −1 3
entre os sistemas de coordenadas e obter BQ = B − Q = − = . Ou, se
2 3 −1
−−→
preferir, como sabemos que BQ são as coordenadas do vetor QB, basta calcular BQ = B − Q.

2. Um cı́rculo de raio 1 e centro Q = (5, 2) tem equação (x − 5)2 + (y − 2)2 = 1. De fato, observe
primeiramente que, nas coordenadas (x0 , y 0 ) definidas pelo sistema {(5, 2), {i, j}}, a equação
deste cı́rculo é x02 + y 02 = 1. Usando X 0 = X − Q, isto é, substituindo x0 = x − 5 e y 0 = y − 2,
obtemos a equação anunciada.

3. A parábola y = 4x2 −6x+1 pode ter seu vértice identificado a partir de um completamento de
quadrados: escrevemos y = 4(x2 − 23 x) + 1 e procuramos uma constante positiva k 2 para que
o trinômio de segundo grau x2 − 32 x + k 2 seja quadrado perfeito. Fazemos isso comparando-o
com (x − k)2 = x2 − 2kx + k 2 , obtendo − 32 x = −2kx. Como esta relação deve valer para todo
x, encontramos k = 34 e consequentemente k 2 = 16 9
. Voltando à equação original da parábola,
temos

y = 4(x2 − 32 x) + 1

y = 4(x2 − 32 x + k 2 − k 2 ) + 1

y = 4(x2 − 32 x + 9
16
) 9
− 4( 16 )+1

y = 4(x − 34 )2 − 5
4

Finalmente, escrevemos esta equação como y + 45 = 4(x − 43 )2 . Ao fazermos y 0 = y + 54 e


x0 = x − 43 , a equação fica numa forma normal y 0 = 4x02 . E, claro, o vértice dessa parábola
encontra-se na origem do sistema (x0 , y 0 ).

Para encontrar esta origem Q, basta olharmos para a equação de mudança de origem, X 0 =
X − Q (note que este éo motivo por termoscomparado x2 − 32 x + k 2 com (x − k)2 em vez 
de
0
 
x x − 3/4 3/4
(x+k)2 ). Como temos 0 = , segue que o vértice procurado é Q = .
y y − (−5/4) −5/4

58
y0

3/4
O

−5/4
Q x0

figura 31

Exercı́cio 15.1 Faça mudanças de origem de modo que a equação fique puramente quadrática e
esboce o gráfico de sua solução para:

1. 2x2 + 3y 2 − 8x − 6y + 11 = 0.

2. 4x2 − 3y 2 + 8x + 12y − 8 = 0.

16 Equações quadráticas em sua forma geral


Temos agora todas as ferramentas para estudar uma equação quadrática em duas variáveis na sua
forma mais geral: ax2 + bxy + cy 2 + dx + ey = f . A técnica é analisar primeiro a forma quadrática,
fazer uma mudança de base e encontrar um sistema de coordenadas cujos eixos são paralelos aos
eixos de simetria da solução; depois, fazer uma mudança de origem (completando quadrados, por
exemplo) para chegar a um sistema de eixos no qual a equação se escreva em sua forma normal.

Considere, por exemplo, a equação


√ √ 15
14x2 − 4xy + 11y 2 − 6 5x + 18 5y = − .
2
  
 14 −2 x
A forma quadrática desta equação é x y = X t M X. Para achar as direções dos
−2 11 y
eixos de simetria da solução, procuramos os autovetores de M .

A equação caracterı́stica, det(M − λI) = 0 é a equação de segundo grau λ2 − 25λ + 150 = 0, cujas
raı́zes são λ1= 15 e 
λ2 = 10. Uma das duas escolhas para a matriz dos autovalores é portanto a
15 0
matriz D = .
0 10

59
  
−1 −2 x
Para calcular os autovetores associados a λ1 = 15, o sistema a ser resolvido é = 0,
    −2 −4 y
−2
cuja solução é a reta de equação x + 2y = 0, isto é, y |y ∈ R , da qual escolhemos o vetor
  1  
−2 1 −2
diretor . Dividindo por seu módulo para torná-lo unitário, obtemos v~1 = 5
√ .
1 1

Para calcular os autovetores associados a λ2 = 10, podemos resolver o sistema correspondente ou


simplesmente usar a proposição
  14.1, que afirma que são ortogonais a v~1 , e obtemos, por exemplo,
1
o vetor unitário v~2 = √15 .
2
 
1 −2 1
A matriz dos autovetores ficou portanto A = √5 ; assim já sabemos localizar sistema de
1 2
coordenadas (x0 , y 0 ). O cı́rculo de raio 1 tracejado indica que os autovetores que geram os eixos x0
e y 0 são unitários.

y0

x0

~v2

~v1

figura 32

Escrevendo a equação original



    
 14 −2 x  x 15
x y + 5 −6 18 =−
−2 11 y y 2

60
e fazendo a mudança de base X = AX 0 , já vimos que a parte quadrática fica 15x02 + 10y 02 . Assim,
a equação, nas coordenadas (x0 , y 0 ) é

   0
02 02
 1 −2 1 x 15
15x + 10y + 5 −6 18 √ 0 =− ,
5 1 2 y 2

que se simplifica em
15
15x02 + 10y 02 + 30x0 + 30y 0 = − ,
2

ou ainda
3
3x02 + 2y 02 + 6x0 + 6y 0 = − .
2

A segunda mudança de coordenadas é uma mudança de origem, e pode ser feita completando
quadrados, como nos exemplos anteriores. Não é difı́cil ver que a equação pode ser escrita
9 9 3
3(x02 + 2x0 + 1) − 3 + 2(y 02 + 3y 0 + ) − = − ,
4 2 2

ou ainda
3
3(x0 + 1)2 + 2(y 0 + )2 = 6.
2
 00   0 
x x +1
Fazendo a mudança de origem = e comparando com X 00 = X 0 − Q, onde o ponto
y 00 y 0 + 3/2
Q
 é a origem
 do sistema (x00 , y 00 ), concluimos que as coordenadas do ponto Q no sistema (x0 , y 0 ) são
−1
. Assim, sabemos localizar o sistema (x00 , y 00 ) no sistema (x0 , y 0 ), marcando as coordenadas
−3/2
da origem Q do sistema (x00 , y 00 ), nos eixos x0 e y 0 .

y0

x0

~v2
~v1

−1

−3/2

61
figura 33

002 002
Note que agora, a equação tem uma forma normal: 3x002 +2y 002 = 6, que é equivalente a x2 + y 3 = 1,
√ √
equação de uma elipse que corta o eixo x00 nos pontos ± 2 e o eixo y 00 nos pontos ± 3.

Juntando as peças, conseguimos localizar a elipse no sistema origial de coordenadas.

y0

x0

~v2 y 00
~v1


3
x00


2

figura 34

Para finalizar a discussão sobre equações quadráticas, note que, no caso de equações em sua forma
geral, ax2 + bxy + cy 2 + dx + ey = f , parábolas podem ocorrer na solução. Por exemplo, y = x2
está na forma geral, pois tem a = 1, c = −1 e o resto das constantes nulas. Assim, ao fazermos
uma mudança de base seguida de uma mudança de origem podemos encontrar uma equação de
uma parábola. Na verdade, já ao fazermos a mudança de base, podemos encontrar a equação de
uma parábola e esboçar diretamente o gráfico, sem a mudança de origem.

Por exemplo, se ao fazermos a mudança de base para a base de autovetores obtivermos a equação
y 02 − x0 − 5y 0 + 6 = 0, já saberemos esboçar a parábola direto no sistema (x0 , y 0 ), não necessitando
da mudança de origem. Veremos que a parábola é a única novidade que pode ocorrer nos tipos de
solução possı́vel.

Lembre-se que ao estudarmos equações quadráticas em sua forma geral ax2 +bxy+cy 2 +dx+ey = f ,
(exercı́cio 14.3) o determinante da matriz da forma quadrática é det M = det D, o produto dos
autovalores. A análise completa, por listagem das possibilidades, é a seguinte:

1. Se det M > 0, então, após uma mudança de base e uma mudança de origem, chegamos a
uma equação do tipo λ1 x002 + λ2 y 002 = k, com os autovalores de mesmo sinal, que terá como
solução uma entre as quatro possibilidades: o vazio, um ponto, um cı́rculo ou uma elipse.

2. Se det M < 0, então, após uma mudança de base e uma mudança de origem, chegamos a
uma equação do tipo λ1 x002 + λ2 y 002 = k, com os autovalores de sinais trocados, que terá como
solução uma entre as duas possibilidades: uma hipérbole ou um par de retas concorrentes.

62
3. Se det M = 0, então, após fazermos uma mudança de base, chegamos a uma equação do tipo
λ1 x02 + d0 x0 + e0 y 0 + f = 0, com λ1 6= 0. Nesse caso, se e0 6= 0, trata-se de uma parábola. E se
e0 = 0, após uma mudança de origem, a equação terá a forma λ1 x002 = f 0 , e terá como solução
uma entre as três possibilidades: o vazio, uma reta ou um par de retas paralelas.

Exercı́cio 16.1 1. Para cada uma das equações abaixo, faça mudanças de coordenadas adequa-
das para transformá-la numa forma normal e esboce o gráfico da solução.

(a) 2x2 − 4xy − y 2 + 20x − 2y + 17 = 0.


(b) 7x2 − 8xy + y 2 − 2x − 4y = 1.
(c) x2 + 2xy + y 2 − 4x + 1 = 0.
(d) 3x2 + 10xy + 3y 2 − 2x − 14y − 5 = 0.
(e) 12x2 + 24xy + 19y 2 − 12x − 40y + 31 = 0.
(f ) x2 + 2xy + 5y 2 − 4x + 6y = 3 = 0.
(g) x2 + 2xy + y 2 + 2x − 4y + 1 = 0.
√ √
(h) x2 + 2xy 3 + 3y 2 + 2x 3 − 2y = 0.

2. Exercı́cios 6.3 do livro do prof. Reginaldo J. Santos: https: // www. dropbox. com/ s/
jj3xq0hjv2z39zp/ gaalt0. pdf? m (página 477, visto em 10/05/2019).

63
17 Geometria Analı́tica Espacial

Vamos estudar nesta seção retas e planos no espaço, como representá-los algebricamente, suas
posições relativas, paralelismo e perpendicurarismo, interseções, ângulos e distâncias, e um pouco
de álgebra linear em dimensão três, em particular, sistemas de equações lineares com três incógnitas
que aparecem como modelos de diversos problemas geométricos. Com isso, vamos nos familiarizar
com o comportamento de sistemas lineares em geral: como resolvê-los, os tipos de solução que
ocorrem, representação paramétrica da solução, interpretação geométrica.

17.1 Alguns fatos básicos de Geometria Euclidiana espacial

É preciso recordar alguns fatos da Geometria Euclidiana para que, com maior familiaridade, possa-
mos trabalhar com mais desenvoltura. Esses fatos não podem gerar mais dúvidas, então a sugestão
é que sejam lidos um a um, sejam feitos desenhos, sejam elaboradas perguntas, sejam discutidos
com outros estudantes.

Os fatos a seguir também convencionam alguma notação, que será usada ao longo do resto do
capı́tulo.

1. Dois pontos distintos no espaço determinam uma única reta. Retas em geral serão denotadas
por letras minúsculas do nosso alfabeto, por exemplo, r, s. Pontos serão denotados por letras
maiúsculas, como A, B, M , P .

2. Três pontos não colineares no espaço determinam um único plano. Planos serão denotados
por letras minúsculas gregas, como α, γ, π.

3. Se um plano contém dois pontos de uma reta, então ele contém todos os pontos daquela reta.
Em sı́mbolos: se r é uma reta que passa por A e B, α é um plano e se A, B ∈ α, então r ⊂ α.

4. Dadas duas retas, elas podem ser coplanares (e, neste caso, são paralelas ou concorrentes)
ou não coplanares (chamadas de reversas). Um exemplo de retas reversas são arestas não
paralelas de faces opostas de um cubo.

Exercı́cio 17.1 Dê mais três exemplos de retas reversas.

5. Dados uma reta r e um ponto P , por P passa uma única reta paralela a r. Em geometria
plana, isto é um axioma. Em geometria espacial não, mas não vem ao caso demonstrar o
resultado aqui. O leitor mais curioso pode ler o livro do Paulo Cezar Pinto Carvalho de
Geometria Espacial para detalhes.

6. Há outros modos possı́veis de se determinar um plano no espaço, reduzindo cada caso à
escolha de três pontos não colineares:

(a) Uma reta e um ponto fora dela. De fato, tome dois pontos distintos da reta e o ponto
fora dela; temos aı́ três pontos não colineares, logo um plano. Este plano, é claro, contém
a reta e o ponto dados.
(b) Duas retas concorrentes. De fato, tome o ponto de interseção e um ponto (distinto dele)
em cada reta; temos aı́ três pontos não colineares, logo um plano. Este plano contém
ambas as retas.

64
(c) Duas retas paralelas. Dadas duas paralelas, digamos r e s, tome um ponto A ∈ r e
B, C ∈ s, com B e C distintos; temos aı́ três pontos não colineares e portanto um plano
α. Este plano, é claro, contém s; para ver que também contém r, basta lembrar que, em
α, existe uma única reta por A e paralela a s. Esta reta tem que ser r, pois r é a única
reta do espaço que contém A e é paralela a s.

Estes modos de ser determinar um plano são intrı́nsecos, isto é, dependem de objetos (retas
e/ou pontos) contidos no plano.

Os próximos fatos também nos serão muito importantes, mas antes é necessário tornar precisa
a ideia de ângulo entre duas retas no espaço. Se as retas em questão são coplanares, então
ou são paralelas e o ângulo entre elas é zero, ou são concorrentes e definimos o ângulo entre
elas como sendo o menor dos dois formados. Caso duas retas formem dois ângulos iguais,
ambos são retos e as retas são perpendiculares. Agora, se as retas, digamos r e s, não são
coplanares, então escolha um ponto qualquer P do espaço e por ali trace r0 paralela a r e s0
paralela a s. As retas r0 e s0 são concorrentes (não são iguais porque r e s não são paralelas).
Definimos o ângulo entre r e s como sendo o ângulo entre r0 e s0 .

Exercı́cio 17.2 Escolha um ponto Q 6= P e por ali tome r00 e s00 paralelas a r e s respec-
tivamente. Mostre que ^(r0 , s0 ) = ^(r00 , s00 ), isto é, a definição de ângulo entre duas retas
reversas não depende do ponto escolhido para traçar as parelelas.

Voltemos aos fatos.

7. Duas retas paralelas a uma terceira são paralelas entre si. Em sı́mbolos,

r//t e s//t ⇒ r//s

8. Dados dois planos no espaço, ou são paralelos ou se interceptam segundo uma reta. Em
outras palavras, se a interseção de dois planos distintos contém um ponto, então contém mais
um, sendo sua interseção exatamente a reta determinada por estes dois pontos.

9. Dados um plano e uma reta, ocorre exatamente uma entre as seguintes situações: ou a reta
está contida no plano, ou intercepta o plano num ponto (transversais), ou a reta não intercepta
o plano (paralelos).

10. A definição de perpendicularismo entre uma reta e um plano é a seguinte: dizemos que a reta
r é perpendicular ao plano α (e denotamos r ⊥ α) se r é ortogonal a todas as retas de α.
O fato que interessa aqui é: se uma reta é ortogonal a duas retas concorrentes de um plano,
então é ortogonal a todas as retas daquele plano, logo perpendicular ao plano.

Observação. A palavra “perpendicular” é reservada a objetos que se encontram, já a palavra


“ortogonal” pode ser usada em qualquer situação. Por exemplo, retas reversas podem ser
ortogonais, mas não perpendiculares.

11. Dados uma reta r e um ponto P , por P existe um único plano perpendicular a r.

65
12. Dados um plano π e um ponto P , por P existe uma única reta perpendicular a π.

Assim, uma outra maneira de se determinar um plano é por um ponto por onde passa o
plano e uma reta perpendicular ao plano. Não é intrı́nseco, já que necessita de uma reta
perpendicular, ou seja, um objeto que não está no plano.

De modo dual, uma reta está completamente determinada por um ponto e um plano perpen-
dicular.

Relembrando mais alguns fatos:

13. Duas retas perpendiculares a um mesmo plano são paralelas.

14. Dois planos perpendiculares a uma mesma reta são paralelos (dois planos são paralelos se não
se encontram).

15. Dada uma reta r e um ponto A 6∈ r, por A existe uma única reta s perpendicular a r. De
fato, seja α o único plano perpendicular a r por A. A interseção de α com r é um ponto:
r ∩ α = {B}. A reta s é a reta AB. O ponto B chama-se projeção ortogonal de A sobre r.
Quando A ∈ r, existem muitas retas por A perpendiculares a r, mas sua projeção ortogonal
sobre r está bem definida: é o próprio A. Já a projeção ortogonal de um ponto P sobre
um plano π é definida como sendo o ponto Q, de interseção do plano π com a única reta t
perpendicular a π por P . Esta reta é única mesmo se P ∈ π (caso Q = P ).

16. Dado dois planos π1 e π2 no espaço, sejam r1 e r2 retas perpendiculares a π1 e π2 respectiva-


mente. Caso r1 e r2 sejam ortogonais, então chamaremos os planos π1 e π2 de perpendiculares.
Esse fato não depende da escolha das retas r1 e r2 , pois retas perpendiculares a um mesmo
plano são paralelas.

Exercı́cio 17.3 Verdadeiro ou falso?

1. Dadas duas retas reversas r e s, existe um único par de planos paralelos α e β com r ⊂ α e
s ⊂ β.

2. A projeção ortogonal de uma reta sobre um plano é sempre uma reta.

3. Dadas duas retas reversas, existe uma única reta perpendicular comum.

4. Duas retas paralelas a uma terceira são paralelas entre si.

5. Duas retas perpendiculares a uma terceira são ortogonais, isto é formam ângulo de 90o .

17.2 Pontos e vetores em R3

Vamos fixar um sistema de coordenadas cartesianas no espaço, um modo de associar a um ponto


do espaço uma tripla ordenada de números reais. Em analogia com o que se fez no plano, tome
três eixos, dois a dois perpendiculares, com origem comum no ponto de interseção e com mesma
unidade de medida. Cheme-os de eixos x, y e z e oriente-os de modo que o giro do raio positivo do
eixo x para o raio positivo do eixo y seja no sentido positivo (anti-horário), o mesmo acontecendo
com os giros do raio positivo do eixo y ao raio positivo do eixo z e do raio positivo do eixo z ao

66
raio positivo do eixo x. O espaço munido de um sistema cartesiano de coordenadas recebe o nome
de R3 .
z

y
x

figura 30

Os planos determinados pelos pares de eixos xy, yz e xz são chamados planos coordenados. Dado
um ponto P no espaço, por P existe uma única
  reta perpendicular ao plano xy, esta reta intercepta
a
o plano xy num ponto, digamos Q. Sejam as coordenadas do ponto Q no plano xy. Por P
b
passa um único plano perpendicular ao eixo z, este plano intercepta o eixo z num ponto, digamos
M . O ponto M definenoeixo z um número real c. Assim ficam definidas as coordenadas do ponto
a
P e escrevemos P = b . As coordenadas do ponto P também podem ser obtidas por projeções

c      
a 0 0
ortogonais do ponto aos eixos: os pontos 0 , b e 0 são, respectivamente, as projeções de
    
0 0 c
P nos eixos x, y e z.

Se, por um lado, um ponto define uma tripla ordenada de números reais de maneira única, recipro-
camente uma tripla ordenada de números reais define exatamente um ponto.

O conceito de vetor no espaço é o mesmo já estudado no plano, o que muda agora é o ambiente.
Um vetor no espaço é um segmento orientado, definido por seu comprimento (módulo ou norma),
direção e sentido. A adição de vetores e a multiplicação de vetor por escalar têm exatamente as
mesmas definições geométricas que havia no plano, inclusive vale também no espaço a regra do
paralelogramo para a adição. A exemplo do que acontecia no plano, as coordenadas de um vetor
do espaço são as coordenadas de seu ponto final quando tomamos como ponto inicial a origem do
sistema. Ou seja matrizes coluna 3 × 1 representam tanto pontos como vetores.
−→
Exatamente como foi feito para vetores no plano, algebricamente podemos escrever AB = B − A,
isto é, as coordenadas de um vetor são a diferença entre as coordenadas de seu ponto final e as
coordenadas do seu ponto inicial.

67
As operações lineares entre vetores (adição e multiplicação por escalar) são compatı́veis, em coorde-
nadas, com as mesmas operações entre as matrizes (colunas 3 × 1) que representam os representam,
isto é, definidas entrada a entrada da matriz. E daqui podemos concluir que dois vetores são pa-
ralelos (isto é, têm mesma direção) se e somente se são múltiplos escalares. Como o vetor nulo é
múltiplo escalar de todos os outros, ~0 é paralelo a todos os vetores.

O módulo
  de um vetor pode ser agora calculado usando-se duas vezes Teorema de Pitágoras: se
a
−→ −→ −→
~v =  b , escreva ~v = OP , onde O é a origem. Então, por Pitágoras temos kOP k2 = kOQk2 + c2
c
−→
e, usando Pitágoras novamente, desta vez no plano xy, segue kOP k2 = a2 + b2 + c2 .
z


−→ |c|
OP

a
Q

−→
OQ

O
|a|
|b|

b
y

figura 31

O produto escalar também tem a mesma definição: Se ~v e w ~ são vetores de R3 , então h~v , wi
~ =
o
k~v kkwk ~ que varia entre 0 e 180 . Assim, h~v , wi
~ cos θ, onde θ é o ângulo entre ~v e w, ~ = 0 ocorre
exatamente quando um deles é o vetor nulo ou, quando ambos são não nulos, θ = 90o . Com a
convenção que o vetor nulo é ortogonal a todos os vetores, podemos dizer que dois vetores são
ortogonais se e somente se o produto escalar entre eles é zero. O mesmo argumento usado quando o
ambiente era o plano, a Lei dos Cossenos, permite concluir que, em coordenadas, h~v , wi ~ = ~v tw,
~  isto
1
é, o produto do primeiro (como matriz linha) pelo segundo (coluna). Por exemplo, Se ~v = 2 e
3

68
 
2
~ = 1, então
w 
2
     
1 2  2
h~v , wi
~ = h 2 , 1 i = 1 2 3 1 = (1)(2) + (2)(1) + (3)(2) = 10.
   
3 2 2

Observe que podemos escrever, para qualquer vetor ~v ∈ R3 , k~v k2 = h~v , ~v i.


~v
Em analogia com vetores no plano, dado um vetor não nulo ~v ∈ R3 , o vetor w
~ = k~v k
é unitário
(isto é, kwk
~ = 1) e tem mesma direção e mesmo sentido de ~v .
Exercı́cio 17.4 Dado ~v ∈ R3 não nulo, descreva o conujunto {w ~ = k~v k · 21 }.
~ ∈ R3 | h~v , wi

17.3 Retas e planos no espaço

Retas no espaço são determinadas por dois pontos distintos. Equivalentemente, por um ponto e um
vetor diretor não nulo. Assim, com o mesmo raciocı́nio do plano R2 , a representação paramétrica
para uma reta no espaço tem a forma r : A + t~v , t ∈ R, onde A é um ponto e ~v um vetor diretor.
Lembre-se que uma parametrização é um sistema de coordenadas, isto é, torna a reta um eixo, com
origem em A, unidade de medida k~v k e sentido positivo dado pelo sentido de ~v .
     
3 2 3 + 2t
Por exemplo, Se A = −1 e ~v = −2, temos r : −1 − 2t. Podemos então interpretar a
−6 3 3t − 6
3
reta r como
 imagem
 de uma função P : R → R , onde a variável independente é o parâmetro t:
3 + 2t
P (t) = −1 − 2t. Dizemos que o ponto P (t) é o ponto genérico de r. P percorre r enquanto t
3t − 6
percorre R.
z

O
y

x ~v

69
figura 32

 
5
É fácil escolher pontos de r além de A: escolha valores para t. Se t = 1, temos P (1) = −3 ∈ r
  −3
−5
e para t = −4, temos P (−4) =  7  ∈ r.
−18

Também é fácil decidir se um ponto está ou não em 


r. Trata-se
 de resolver um sistema de três
−1
equações e uma incógnita. Por exemplo, o ponto B =  3  pertence à reta r porque o sistema
−12
P (t) = B tem solução: de fato,

3 + 2t = −1

−1 − 2t = 3

3t − 6 = −12

 
7
tem solução única t = −2, portanto B = P (−2) ∈ r. Já para o ponto C = −5, o sistema
2
P (t) = C fica

3 + 2t = 7

−1 − 2t = −5 ,

3t − 6 = 2

que não tem solução, pois, para satisfazer as duas primeiras equações deverı́amos ter t = 2, mas
para a terceira teria de ser t = 8/3 (ou: substituir t = 2 na terceira equação torna-a falsa). Assim,
C 6∈ r.

Se, em duas parametrizações, observamos que as retas têm vetores diretores múltiplos, então são
paralelas ou iguais. Para decidir, escolha um ponto de uma e verifique se pertence ou não à outra.
No primeiro caso são iguais, no último, são paralelas.

Outra maneira de se interpretar a representação paramétrica de r : A + t~v , t ∈ R, chamada de


equação paramétrica de r, é dizer que um ponto X do espaço pertence à reta r se e somente se
−−→
existe t ∈ R com X = A + t~v , o que é o mesmo que X − A = t~v , ou ainda AX = t~v , ou seja,
−−→
X ∈ r ⇔ AX é um múltiplo do vetor diretor ~v .

70
z r

~v

X
O
y
A
x

figura 33
Exercı́cio 17.5 Dê exemplos de parametrizações diferentes para a mesma reta e dê exemplos de
parametrizações para duas retas paralelas.

Já planos no espaço podem ser determinados por duas maneiras. Uma é intrı́nseca, que sempre leva
a três pontos não colineares, o que corresponde a um ponto e dois vetores diretores não paralelos. A
outra, a partir de um ponto e uma reta perpendicular, corresponde a um ponto e um vetor normal.
Considere o plano π determinado por um ponto A e dois vetores não paralelos ~v e w.
~ Como já foi
visto (seção 12) eles determinam um sistema de coordenadas para o plano π: dado um ponto X no
−−→
espaço, temos X ∈ π se e somente se AX é a diagonal de um paralelogramo com lados paralelos
a ~v e w.
~ Isto inclui o caso degenerado de paralelogramos com “lado zero”, que ocorre quando
−−→
AX é um múltiplo escalar de ~v ou w.~ Assim, dizer que X ∈ π é o mesmo que dizer que existem
−−→ −−→
escalares µ e γ tais que AX = µ~v + γ w. ~ Como em coordenadas temos AX = X − A, isto dá
~ µ, γ ∈ R. Também é comum escrever
origem à equação paramétrica do plano: X = A + µ~v + γ w;
π : A + µ~v + γ w;~ µ, γ ∈ R, ou ainda π = {A + µ~v + γ w~ | µ, γ ∈ R}, e chamar esse conjunto de
representação paramétrica do plano.
Nesta altura, deve ser claro por que a representação paramétrica da reta tem um parâmetro livre
e a do plano tem dois.
     
4 1 2
Se, por exemplo, A =  0 , ~v = −1 e w
   ~ = 1, o ponto genérico do plano é dado

 −1 3 2
4 + µ + 2γ
por P (µ, γ) =  γ − µ , o plano sendo interpretado como imagem de uma função cujas
3µ + 2γ − 1
variáveis independentes são os parâmetros µ e γ e o contradomı́nio é o espaço R3 . É claro que
temos A = P (0, 0).
É fácil produzir outros exemplos de pontos
emπ, bastando escolher valores para µ e γ. Por exemplo,
9
para µ = −1 e γ = 3, temos P (−1, 3) = 4 ∈ π.
2

71
Decidir se um certo ponto B está ou não
 no  plano π é modelado por um sistema de três equações
8
e duas incógnitas. Por exemplo, B = −1 pertence a π pois o sistema P (µ, γ) = B,
7

4 + µ + 2γ = 8

γ − µ = −1 ,

3µ + 2γ − 1 = 7

 
7
tem solução única (µ, γ) = (2, 1), logo B = P (2, 1). Mas o ponto C = 7 não pertence a π pois

4
o sistema

4 + µ + 2γ = 7

γ−µ=7

3µ + 2γ − 1 = 4

não tem solução. Isto pode ser observado a partir da solução do subsistema 2 × 2 formado pela
primeira e pela terceira equações, que tem solução (µ, γ) = (1, 1), mas a substituição de µ = 1 e
λ = 1 na segunda equação torna-a falsa.

Se um plano β é dado por uma representação paramétrica da qual conhecemos a forma geral,
podemos reconhecer o pontoe os dois vetores diretores que definem esta parametrização: por
2 − 2t + s
exemplo, se β : t − 2s − 1, t, s ∈ R, podemos escrever o ponto genérico como soma de três

1 + 4s
matrizes coluna, observando os coeficientes constantes (o ponto), e os coeficientes dos parâmetros
t e s (os vetores diretores). Assim,
     
2 −2 1
β : −1 + t 1 + s −2 , t, s ∈ R.
    
1 0 4

A outra forma de se determinar um plano, a partir de um ponto e de uma direção perpendicular


(ou seja, um ponto e um vetor normal não nulo), dá origem à equação geral do plano. A dedução é
bem simples, parecida com a dedução da equação de uma reta em R2 . Sejam A um ponto e ~n um
vetor normal que determinam o plano π. Então, um ponto X do espaço está em π se e somente se
−−→ −−→
os vetores AX e ~n são perpendiculares. Ou seja, X ∈ π ⇔ hAX, ~ni = 0, chamada equação geral
de π.

Pela maneira que foi construı́da, vê-se que a equação geral do plano é única, a menos de multi-
plicação por um escalar não nulo.
       
−1 2 x x+1
−−→ −−→
Se, por exemplo, A = −1 e ~n = −2, sendo X = y , temos AX = y + 1 e hAX, ~ni = 0
3 3 z z−3
se escreve 2(x + 1) − 2(y + 1) + 3(z − 3) = 0, ou ainda 2x − 2y + 3z = 9, que é a equação geral de

72
π. Daqui já se nota que os coeficientes de x, y e z na equação geral do plano são, nesta ordem, as
coordenadas de seu vetor normal. Costumamos denotar

π : 2x − 2y + 3z = 9.

Ou ainda, para se conseguir a equação de π, como sabemos que ela é da forma 2x − 2y + 3z = d, já
que sabemos que os coeficientes são as coordenadas de ~n, basta calcular a constante d exigindo-se
que a equação seja satisfeita para o ponto A, ou seja, d = 2(−1) − 2(−1) + 3(3) = 9.
 
a
Esta observação é geral: se um plano tem vetor normal ~n = b , então sua equação geral é

c
ax + by + cz = d, bastando, para determinar d, saber um ponto pelo qual ele passa.

Para produzir outros pontos do plano π a partir de sua equação, basta tomar coordenadas que
satisfazem a equação. Por exemplo,
  se queremos saber sua interseção com o eixo z, tomamos
0
x = y = 0 e vemos que o ponto 0 ∈ π. E, claro, para verificar se um ponto dado está ou não

3
em π, basta verificar se suas coordenadas satisfazem a equação.

Por exemplo, para que a origem O esteja num plano de equação ax + by + cz = d é preciso que a
constante d seja nula.

Note que, ao contrário do que acontece quando o ambiente é R2 , em R3 retas não são dadas por
uma equação. O motivo é que, no plano, dados um ponto e um vetor não nulo (normal), existe
uma única reta que passa pelo ponto e tem direção perpendicular ao vetor dado, mas, no espaço,
existem muitas (faça um desenho da situação).

No entanto, uma reta pode ser dada pela interseção de dois planos não paralelos, ou seja, como
solução de um sistema de equações com duas equações e três incógnitas.

Observamos algumas situações particulares. Se dois planos distintos têm vetores normais paralelos,
então sua interseção é vazia: são paralelos. Se dois planos têm vetores normais não paralelos,
encontram-se numa reta. Dois planos são perpendiculares se e somente se têm vetores normais
perpendiculares.

Suonha que dois planos têm vetores normais não paralelos. Então sua interseção - uma reta - é a
solução de um sistema de duas equações e três incógnitas. Por exemplo, os planos π1 : 3x+2y+z = 4
e π2 : x − y + z = −1 têm interseção dada pela solução do sistema
(
3x + 2y + z = 4
.
x − y + z = −1

Para resolver, some a primeira linha com o dobro da segunda para obter 5x + 3z = 2. Escrevendo
x em função de z, temos x = 2−3z
5
.
2−3z
Substituindo na segunda equação ficamos com 5
− y + z = −1 e isolando y em função de z temos
7+2z
5
.

73
Interpretando z como parâmetro livre,
 2−3z  
 5 
π1 ∩ π2 =  7+2z
5
 | z∈R ,
z
 

   
2/5 −3/5
que é a reta que passa pelo ponto 7/5 e tem vetor diretor  2/5 .
0 1

Observação. Quando estudamos sistemas 2 × 2, vimos que só existem três possibilidades para o
conjunto solução S. Ou é um conjunto vazio (não tem solução), ou unitário (solução única), ou
infinito. Isso vale para sistemas lineares de quaisquer números de equações e incógnitas.
A ideia da demonstração é simples. E é geométrica, se admitimos que dado um sistema, suas
soluções habitam um ambiente no qual podemos parametrizar uma reta quando conhecemos dois
de seus pontos. Assim, se um sistema tem duas soluções, que representam dois pontos distintos
naquele ambiente, mostra-se que todos os pontos da reta que os liga também são soluções do sistema.
Ou seja, se um sistema tem mais de uma solução, tem infinitas. Faremos esta demonstração com
detalhes na seção 12, e usaremos esta propriedade aqui, quando necessário.

É importante saber como, a partir de um plano dado por sua equação, escrever uma representação
paramétrica para ele e vice-versa.

Como exemplo, vamos olhar para a equação do plano π : 2x−2y+3z = 9 e resolvê-la, isto é, escrever
uma das incógnitas em função das outras duas. Escolhendo isolar z, ficamos
 com z = 3 − 32 x + 32 y,
x
e o plano π é o conjunto de pontos do espaço da forma  y , x, y ∈ R. Os parâmetros
2 2
3 −
 3x + 3y  
0 1
livres são x e y e, podemos identificar facilmente o ponto 0 e os dois vetores diretores  0 
  3 −2/3
0
e  1  desta representação paramétrica do plano π.
2/3

Mais uma vez observamos que a representação paramétrica não é única. Pelo menos mais duas são
naturais: no exemplo acima poderı́amos ter isolado x ou y como variável dependente.

A pergunta recı́proca, de chegar à equação geral do plano a partir de uma representação paramétrica
pode ser respondida como segue. Suponha que π : A + t~v + sw, ~ t, s ∈ R. A única coisa que
precisamos é determinar um vetor normal ~n, o que se faz exigindo que ~n seja simultaneamente
perpendicular aos vetores não paralelos ~v e w.~ Isto pode ser conseguido resolvendo-se um sistema
 
1
de duas equações e três incógnitas. Para ilustrar esta ideia, um exemplo numérico: se ~v = 2 e
    1
2 a
~ = −1, procuramos um vetor não nulo ~n =  b  cujo produto escalar com ~v e com w
w ~ seja
−1 c
zero, isto é,

74
(
a + 2b + c = 0 (I)
,
2a − b − c = 0 (II)

que pode ser resolvido somando-se I e II, obtendo 3a + b = 0, ou b = −3a, e substituindo em uma
das equações, digamos em II, ficando
 com 2a + 3a − c = 0 ou c  = 5a. Assim, todos os vetores
a 1
normais a π são da forma −3a, para a 6= 0. Escolhendo ~n = −3, a equação de π será da
5a 5
forma x − 3y + 5z = d, e a constante d está determinada pelo fato que o ponto A pertence ao plano.

Observação. Há na verdade uma maneira mais rápida de se produzir um vetor ~n que seja si-
multaneamente perpendicular a dois vetores não paralelos ~v e w. ~ Veremos que, além de facilitar a
passagem de uma representação paramétrica para a equação geral de um plano, há outras situações
onde uma “fábrica de vetores normais” será útil. Isto será feito na próxima seção, com a definição
de produto vetorial. Antes, porém, é conveniente pensarmos um pouco mais em retas e planos no
espaço.

Exercı́cio
  17.6 1. Determine
 a representação paramétrica da reta que passa pelos pontos A =
1 4
2 e B = −1;
3 −1
2. Determine a equação geral e uma representação paramétrica do plano que passa pelos pontos
A e B do exercı́cio anterior e pela origem.

3. 
Determine
 a equação geral do plano paralelo ao do exercı́cio anterior e que passa por C =
7
2.
0

Exemplo.
Talvez a melhor maneira de se estudar a interseção de uma reta com um plano seja exigir
que as coordenadas
 de um ponto genérico da reta satisfaçam a equação geral do plano. Sejam
1+t
r : P (t) = 2t − 1 e π : x − 2y + 3z + 9 = 0. Analisamos r ∩ π através da equação (1 + t) −
5t
2(2t − 1) + 3(5t) + 9 = 0,que,simplificando, fica  12t + 12 = 0, cuja solução é t = −1. Isto nos
0 1+µ
diz que r ∩ π = P (−1) = −3 . Já a reta u :
   2µ  tem sua interseção com π calculada por
−5 2+µ
(1 + µ) − 2(2µ) + 3(2 + µ) + 9 = 0, que é equivalente a 16 = 0, o que é falso e implica que a equação
não tem solução (isto é, que u é paralela a π). Esta situação, do coeficiente de µ ser zero, ocorre
precisamente quando o vetor diretor da reta e o vetor normal do plano são perpendiculares, pois
o coeficiente de µ na equação da interseção de u e π é exatamente o produto escalar entre o vetor
diretor de u e o vetor normal a π.

Exercı́cio 17.7 1. Considerando o plano π e as retas r e u do exemplo anterior:

(a) Dê exemplo de uma reta paralela a u e contida em π.

75
(b) Dê exemplo de uma reta reversa a u e contida em π.
(c) Dê exemplo de um plano que contém u e é paralelo a r.
(d) Determine o plano π2 que passa por r ∩ π e é perpendicular a u.
(e) Determine π ∩ π2 .
 
1
2. Determine a reta que passa por P = 1 e é perpendicular ao plano que passa pelos pontos
     1
2 0 2
A = −1, B = 1 e C =  3 .
0 8 −4
 
−1
3. Determine o plano que passa por Q =  7  e é perpendicular à reta que passa pela origem
  2
3
e tem vetor diretor 6.

5

Duas retas dadas podem ser coplanares (e, nesse caso, são concorrentes ou paralelas) ou não copla-
nares (reversas). Para decidir a posição relativa, primeiro olhamos para os vetores diretores. Caso
sejam paralelos (múltiplos), então as retas são paralelas ou iguais. Caso contrário, são concorrentes
ou reversas. Para a análise, em ambos os casos podemos igualar o ponto genérico de uma reta ao
ponto genérico da outra, sempre lembrando de mudar o nome do parâmetro caso necessário.
   
1−t t−2
Exercı́cio 17.8 1. Dadas as retas  t − 2  e  1 − t , determine os valores de a e b para
3 + 2t a + bt
que sejam iguais.
   
1−t t−6
2. Mostre que as retas  t − 2  e t − 3 são concorrentes e calcule seu ponto de inteseção.
3 + 2t t+5
   
3 1
3. Dê exemplos de retas reversas com vetores diretores 0 e 1.
  
1 4
4. Lembre-se que dois planossão perpendiculares se têm vetores normais ortogonais. Dados
1
π : x − 2y + 2z = 0 e A = 1, obtenha dois planos distintos por A, ambos perpendiculares
1
a π.
 
3 + 2t
5. Dado o plano π : 3x + 2y − z = 10 e a reta r : 2 + 4t, obtenha o único plano perpendicular
t−1
a π que contém r.
6. Dados π e r, discuta, a partir de sua posição relativa, a existência e unicidade de um plano
contendo r e perpendicular a π.

76
17.4 Produto vetorial e determinantes 3 × 3

Na seção anterior, ao nos depararmos com o problema de passar da representação paramétrica de


um plano para sua equação geral, vimos que seria útil uma maneira rápida de, dados dois vetores
não paralelos ~v e w,~ construirmos um vetor ~n não nulo e perpendicular a ambos. Este problema
pode ser resolvido em geral por um sistema de duas equações e três incógnitas: as incógnitas são
as coordenadas de ~n e as equações são h~v , ~ni = 0 e hw,
~ ~ni = 0. Um sistema como este sempre tem
infinitas soluções, escritas como um conjunto com um parâmetro livre. Interpretando a solução
como uma reta que passa pela origem, cada um dos pontos desta reta representa um vetor que
começa na origem. O que vamos fazer é escolher uma solução particular, chamada produto vetorial
entre ~v e w.
~ Lembre-se que para definir um vetor, precisamos explicitar módulo, direção e sentido.
A definição a seguir é chamada “geométrica”; o motivo é claro.

Definição. Dados dois vetores quaisquer ~v e w


~ no espaço, definimos o produto vetorial de ~v por w
~
como sendo o vetor ~v × w
~ que satisfaz:

ˆ (módulo) k~v × wk
~ = k~v kkwksen
~ θ, onde θ é o ângulo entre ~v e w.
~

Observações.

1. sendo θ um ângulo entre 0o e 180o , temos sen θ ≥ 0, logo teremos k~v × wk


~ ≥ 0, como
deveria ser mesmo.
2. É claro que se um dos vetores ~v ou w
~ for nulo (ou ambos nulos), então o produto vetorial
entre eles também é nulo.
3. Caso ~v e w~ sejam paralelos (o que inclui o caso em que um deles é nulo), são vetores
múltiplos e o ângulo entre eles será 0o ou 180o . De qualquer maneira, teremos sen θ = 0,
logo o produto vetorial entre ~v e w ~ é o vetor nulo. Reciprocamente, sendo ambos ~v e w~
não nulos, se o produto vetorial entre eles é o vetor nulo, então sen θ = 0, logo ~v e w
~
são paralelos. Ou seja, ~v × w
~ = 0 se e somente se ~v e w ~ são paralelos.
4. Quando ~v e w ~ não são paralelos, supondo-os com mesmo ponto inicial, eles formam um
paralelogramo cuja área é calculada por base × altura. Escolhendo ~v como base, então
a altura é a projeção do ponto final de w ~ na reta onde ~v está desenhado e, como o
ângulo entre eles é θ, temos que a altura é kwksen
~ θ, donde a área do paralelogramo
é k~v kkwksen
~ θ, não importanto se θ é agudo, obtuso ou reto. Ou seja, o módulo do
produto vetorial é a área do paralelogramo gerado pelos vetores. Note que, se um deles
é nulo ou se são paralelos, então eles não geram um paralelogramo, o que é coerente com
o produto vetorial ser zero nesses casos.

77
~v × w
~

w
~

~v

figura 34

ˆ (direção) ~v × w ~ é perpendicular a ambos ~v e w. ~ Isto define a direção de ~v × w ~ quando


ele é não nulo, pois, nesse caso, ~v e w
~ não são paralelos e existe uma e somente uma direção
perpendicular a ambos. E, no caso de ~v × w ~ = 0, tanto faz, para o vetor nulo não está definida
a direção.
ˆ O (sentido) de ~v × w
~ é dado pela regra da mão direita ou pela regra da mão esquerda.

A descrição da regra da mão direita é a seguinte: imagine que sua mão direita tem o polegar
esticado e os outros quatro dedos alinhados e um pouco dobrados (isto é, não estão esticados
nem totalmente fechados na palma da mão). Se os quatro são setas cujas pontas são as unhas
e se movimentam de ~v para w ~ ao longo do menor ângulo entre eles, então o polegar aponta
no sentido de ~v × w.
~

Já a regra da mão esquerda tem a seguinte descrição: os dedos polegar, indicador e médio
estão esticados, estando o indicador paralelo à palma da mão. O polegar, que vai representar
o produto vetorial entre o médio e o indicador, fica direção perpendicular aos outros dois. O
médio e o indicador não precisam ser perpendiculares entre si, basta não serem paralelos.

~v × w
~

θ ~v

w
~

θ w
~ ~v × w
~
~v

78
figura 35

Mais uma descrição para a definição do sentido de ~v × w~ quando ambos são não nulos é a
seguinte. O giro sobre o menor ângulo de w ~ para ~v × w,
~ observado do ponto final de ~v , deve
ter o mesmo sinal do giro de ~v para w, ~ para ~v × w
~ ou seja, os giros de ~v para vecw para e de w ~
(observado do ponto final de ~v ) ou são ambos no sentido anti-horário (positivo) ou ambos no
sentido horário.

~ × ~v = −~v × w.
Daı́ fica claro que w ~

Assim, o produto vetorial de dois vetores tem como resultado um vetor, enquanto o produto escalar
entre dois vetores tem como resultado um escalar, um número.

Mas de pouco adianta termos definido módulo, direção e sentido de ~v × w


~ se não tivermos um modo
de calculá-lo em coordenadas. Apresentaremos uma fórmula a partir do determinante de matrizes
3 × 3, logo convém fazer uma breve recordação.
 
a11 a12 a13
Dada uma matriz 3 × 3 A = a21 a22 a23 , o determinante de A é o número real
a31 a32 a33
det A = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a12 a21 a33 − a11 a23 a32 ,

que pode ser calculado pela regra mnemônica que aprendemos no ensino médio, isto é, copiando as
duas primeiras colunas de A após a terceira, resultando numa matriz 3 × 5 da qual multiplicamos os
três elementos de cada uma das três diagonais paralelas à diagonal principal (incluindo a própria),
tomando cada um desses produtos como parcela positiva e multiplicando os três elementos de cada
uma das três diagonais na direção da diagonal secundária, tomando esses produtos como parcelas
negativas.

+ + +
a11 a12 a13 a11 a12

a21 a22 a23 a21 a22

a31 a32 a33 a31 a32


− − −

figura 36

 
3 0 2
Por exemplo, se A = 1 −1 −1, então det A = 29.
2 5 0

Exercı́cio 17.9 Se A é uma matriz 3 × 3, então det At = det A.

79
Há um outro modo de se calcular o determinante, que se aplicará também a matrizes quadradas
de ordem superior, chamado método dos cofatores, onde o determinante de uma matriz 3 × 3 é
calculado pela soma de três parcelas, cada uma sendo o produto de um fator pelo seu cofator. Os
fatores são determinados escolhendo-se livremente uma linha ou uma coluna da matriz A: são as
três entradas da linha ou coluna escolhida. Cada fator dá origem a uma matriz 2 × 2, eliminando-se
de A a linha e a coluna às quais o fator pertence. Dessa matriz 2 × 2 calculamos o determinante,
que ainda receberá um sinal, dependendo da posição do fator na matriz original: se o fator é um
elemento aij , o sinal é (−1)i+j . Esse determinante com sinal é o cofator.

Vamos exemplificar escolhendo a primeira linha. Temos

det A = a11 (−1)1+1 A11 + a12 (−1)1+2 A12 + a13 (−1)1+3 A13 ,

onde Aij , é o determinante da matriz 2x2 obtida eliminando-se de A sua i-ésima linha e sua j-ésima
coluna.
 
3 0 2
Por exemplo, no caso da matriz A = 1 −1 −1, temos, por cofatores a partir da primeira
 2 5 0    
1+1 −1 −1 1+2 1 −1 1+3 1 −1
linha, det A = (3)(−1) det + (0)(−1) det + (2)(−1) det =
5 0 2 0 2 5
(3)(5) + 0 + (2)(7) = 29.

Exercı́cio. Calcule o determinante de A pelo desenvolvimento em cofatores usando a segunda


coluna e verifique que o resultado também é 29.

Não é difı́cil ver que o desenvolvimento em cofatores funciona sempre. No caso geral, quando
a11 a12 a13
A = a21 a22 a23 , faça, como exercı́cio, a comparação do desenvolvimento do determinante de
a31 a32 a33
A em cofatores pela segunda linha e verifique que você encontrou o número a11 a22 a33 + a12 a23 a31 +
a13 a21 a32 − a13 a22 a31 − a12 a21 a33 − a11 a23 a32 . Se achar necessário, faça isso também para uma coluna
qualquer da matriz A. A demonstração completa, claro, necessita que se verifique a igualdade para
todas as linhas e colunas de A.

O desenvolvimento em cofatores é particularmente útil quando temos uma linha ou uma coluna
com muitos zeros.

O cálculo do produto vetorial em coordenadas é feito a partir de um determinante “simbólico”,


isto é, do determinante de uma matriz cujas entradas da primeira linha não são números, mas
vetores. Uma rápida observação, em analogia à base canônica {i, j} de R2 : temos para R3 três
vetores canônicos, i, j e k, representando
  aunidade
 de 
medida
 e o sentido positivo dos eixos x, y
1 0 0
e z respectivamente, isto é, i = 0, j = 1 e k = 0. Assim, um vetor qualquer pode ser
0 0  1
a
escrito como combinação linear de i, j e k: b  = ai + bj + ck.

c

80
   
v1 w1
A definição “algébrica” do produto vetorial é a seguinte: Se ~v = v2 e w
  ~ = w2 , teremos

v3 w3
 
i j k
~v × w
~ = det v1 v2 v3  ,

w1 w2 w3

que, desenvolvido em cofatores pela primeira linha, resulta em


 
      v2 w3 − v3 w2
v2 v3 v v3 v v2
~v × w
~ = det i − det 1 j + det 1 k = v3 w1 − v1 w3  .
w2 w3 w1 w3 w1 w2
v1 w2 − v2 w1

       
1 0 i j k 7
Exemplo. Se  1  ×  2  = det 1 1 −4 = 1, e, usando o produto escalar, vemos
−4 −1 0 2 −1 2
imediatamente que é perpendicular a ambos os “fatores”.

É um exercı́cio, embora um pouco trabalhoso, mostrar que as definições geométrica e algébrica de


produto vetorial coincidem. Embora isso não precise ser feito agora, um roteiro para demonstrar
essa equivalência é o seguinte.

Primeiro, para comparar os módulos, escreva k~v × wk ~ 2 = k~v k2 kwk


~ 2 sen2 θ = k~v k2 kwk
~ 2 (1 − cos 2 θ),
escreva cos θ
em
 função do produto
 escalar, calcule em coordenadas e verifique a igualdade com o
v2 w3 − v3 w2

quadrado de v3 w1 − v1 w3 .
 
v1 w2 − v2 w1

A seguir, para comparar a direção, basta calcular os produtos escalares h~v , ~v × wi


~ e hw,
~ ~v × wi
~ e
mostrar que ambos são zero.

Finalmente, para comparar o sentido, primeiro definimos o produto misto entre os vetores ~u, ~v e w
~
como sendo o número real h~u, ~v × wi.
~

A seguir, concluı́mos que:


    
~u ~v
Exercı́cio 17.10 1. h~u, ~v × wi
~ = det  ~v  = det w ~  (linhas), que por sua vez é igual
w~ ~u
ao determinante da transposta det[~v , w,
~ ~u] (colunas).

~ e ~u é dado por V = |h~u, ~v × wi|.


2. O volume do paralelepı́pedo gerado por ~v , w ~

3. Os vetores ~v , w
~ e ~u são coplanares se e somente se det[~v , w,
~ ~u] = 0 (colunas).

Definimos agora o que vem a ser uma base para R3 : uma tripla ordenada de vetores não coplanares.
Portanto, uma matriz 3 × 3 cujas colunas são uma base tem determinante não nulo. Dada uma
~ ~u} para R3 , sem perda de generalidade podemos pensar que estão representados com
base {~v , w,
ponto inicial na origem. Olhamos para o sentido de rotação ao longo do menor ângulo: (1) de ~v
para w
~ observado do ponto final de ~u, (2) de w
~ para ~u observado do ponto final de ~v e (3) de ~u para

81
~v observado do ponto final de w.~ Dizemos que a base é positiva se o número de rotações negativas
observadas é par (nenhuma ou duas). Isto acontece, por exemplo, para a base canônica {i, j, k}
(nenhuma rotação negativa). Caso contrário, a base é negativa. Com esse conceito, poderı́amos ter
definido o sentido de ~v × w ~ não são paralelos, que a base {~v , w,
~ exigindo, quando ~v e w ~ ~v × w}
~ seja
positiva.

O próximo passo é observar que uma base é positiva se e somente se a matriz cujas colunas são
esses vetores (na ordem) tem determinante positivo. Isto pode ser feito através da definição de
produto misto, que no fundo é um produto escalar e portanto, ao calculá-lo, saberemos se o ângulo
entre os vetores é agudo, reto ou obtuso.

~ ~v × w]
Por fim, basta verificar que det[~v , w, ~ > 0.

Os detalhes da comparação entre as definições algébrica e geométrica do produto vetorial não são
essenciais para o que se segue; exceto o produto misto e sua relação com volumes de paralelepı́pedos,
por isso enunciado como exercı́cio. De maneira que fica a cargo da sua curiosidade fazer todos os
detalhes do roteiro que acabamos de apresentar.

Vamos relacionar agora propriedades do determinante de uma matriz com sua interpretação como
propriedades do produto vetorial e vice-versa, a partir da definição algébrica. Algumas destas
propriedades já foram observadas na definição geométrica. Estas propriedades também valem
para matrizes quadradas de ordem superior, faremos referência a elas no momento oportuno. As
demonstrações, no caso 3x3, são exercı́cios para o leitor.

Exercı́cio 17.11 Para cada um dos itens abaixo, dê um exemplo numérico.

1. Como já tinha sido observado, det At = det A. Isto significa que as propriedades enunciadas
a seguir para as linhas de A valem também para as colunas de A, e vice-versa.

2. Se A tem duas linhas iguais, então det A = 0. O que é equivalente, em termos do produto
vetorial, a ~v × ~v = 0.

3. Se A tem duas linhas múltiplas, então det A = 0. Em termos do produto vetorial, a proprie-
~ são paralelos, então ~v × w
dade é: se ~v e w ~ = 0.

4. Se uma linha é combinação linear das outras duas, então det A = 0. Em sı́mbolos, se A =
L1
L2  (linhas) e, por exemplo, L3 = aL1 + bL2 , a, b ∈ R, então det A = 0. A escrita genérica
L3
é Li = aLj + bLk , com i, j, k ∈ {1, 2, 3} e distintos. Geometricamente, o fato de um vetor
~u ser combinação linear de outros dois, digamos ~v e w,~ significa que ~u é a diagonal de um
paralelogramo cujos lados são múltiplos de ~v e w,~ ou seja, ~u, ~v e w
~ são coplanares. Daı́, a
matriz de linhas ~u, ~v e w
~ tem determinante nulo. Reciprocamente, se det A = 0, então suas
linhas (ou colunas) são coplanares, portanto uma é combinação linear das outras duas.

5. Se B é a matriz obtida de A trocando-se duas linhas de posição, então det B = − det A. A


~ × ~v = −~v × w.
propriedade relacionada é w ~

6. Se B é a matriz obtida de A multiplicando-se uma de suas linhas por um escalar a, então


det B = a det A. Isto está relacionado com o fato (a~v ) × w~ = ~v × (aw)
~ = a(~v × w),
~ que por
sua vez é uma consequência direta da definição geométrica.

82
7. A próxima propriedade está ilustrada para
 a primeira
 linha  da matriz A,
 mas
 vale também
M1 + M2 M1 M2
para as outras duas linhas: tem-se det  L2  = det  L2  + det  L2  (linhas). Não
L3 L3 L3
é difı́cil concluir isto usando o desenvolvimento em cofatores pela linha em questão. As
propriedades do produto vetorial relacionadas são

(~u + ~v ) × w
~ = ~u × w
~ + ~v × w
~

e
~u × (~v + w)
~ = ~u × ~v + ~u × w.
~

As duas últimas propriedades dizem que o produto vetorial se comporta bem com as operações
lineares de adição de vetores e multiplicação de vetor por escalar, isto é, dizem que podemos usar
a propriedade distributiva.

Exercı́cio 17.12 1. Determine aretaparalela


 ao plano π : 2x − 
y + 3z = 1, perpendicular à
1 0 4 + 3t
reta que passa pelos pontos 0 e 1 e intercepta a reta s : 5 + 6t.
1 2 t
2. Dados os planos α : x − y + z = −1, β : x + y − z = 1 e γ : x + y + 2z = 2, determine o plano
π que contém α ∩ β e é perpendicular a γ. É sempre possı́vel determinar π, independente das
posições relativas entre α, β e γ? Explique geometricamente.

17.5 Retas reversas

Vamos estudar algumas construções importantes a respeito de retas reversas, aplicando o conceito
de produto vetorial.

Dadas duas retas reversas r e s, existe um único par de planos paralelos α e β tal que r ⊂ α e
s ⊂ β. Há algumas maneiras de se concluir isso. Digamos que r : A + λ~v e s : B + γ w. ~ Logo os
vetores diretores ~v e w~ não são paralelos. O plano que passa por A e tem vetores diretores ~v e w ~
(que contém a reta r) é o plano α. E o plano β é o que passa por B e é paralelo a ~v e w
~ (que contém
a reta s). Como os vetores diretores são os mesmos para os planos α e β, eles são paralelos. Como
só existe uma direção que é simultaneamente perpendicular a dois vetores não paralelos dados, os
planos α e β têm mesmo vetor normal, podemos escolher ~n = ~v × w, ~ pois é perpendicular a ambos
~v e w.
~ Então, α é o plano por A e com vetor normal ~n, e β é o plano por B, também com vetor
normal ~n.

83
~n

α w
~
~v
r
A

~n
β
~v w
~
s B

figura 37

A reta gerada por A e w é paralela a s

A reta gerada por B e v é paralela a r

   
1 2
Exemplo. Sejam r a reta que passa por A = 0 e com vetor diretor ~v =  1  e s a reta que
  1 
 −1
0 −1
passa por B = −3 e com vetor diretor w
  ~=  2 .
0 1

Exercı́cio 17.13 Verifique que, de fato elas são reversas.

Para o vetor normal dos planos α e β tomamos


   
i j k 3
~ = det  2 1 −1 = −1 ,
~n = ~v × w
−1 2 1 5

e, já que sabemos que A ∈ α, segue que a equação de α é 3x − y + 5z = 8. Similarmente, temos


β : 3x − y + 5z = 3, pois B ∈ β.

Você pode imaginar a situação pensando que, dadas r e s construı́mos uma “caixa” de acrı́lico
transparente, de forma de um paralelepı́pedo e traçadas com um marcador estão as retas r em sua
base (α) e s em sua tampa (β). As aspas se justificam porque os planos são infinitos, não limitados
como as faces de uma caixa de sapatos.

O leitor pode perguntar, olhando a caixa de acrı́lico de cima (e vendo um par de concorrentes,
portanto), se existe uma reta que seja simultaneamente perpendicular às retas reversas r e s. A
resposta é que não só existe, mas é unica. Para construir esta reta, note primeiramente que um

84
vetor diretor para ela é exatamente o vetor ~n, normal aos planos α e β. Vamos obter a perpendicular
comum procurada como interseção de dois planos, π1 e π2 . Note que, tendo ~n como vetor diretor,
a reta procurada é paralela ou está contida em qualquer plano que tenha ~n como vetor diretor.
Assim, consideramos π1 como o plano que contém r e é paralelo a ~n (ou seja, π1 está definido pelo
ponto A e pelos vetores diretores ~v e ~n) e π2 o plano que contém s e é paralelo a ~n (ou seja, definido
pelo ponto B e pelos vetores diretores w ~ e ~n). Os planos π1 e π2 não são paralelos, pois os vetores ~v ,
w~ e ~n não são coplanares. Logo π1 e π2 se interceptam numa reta. Um vetor diretor para esta reta
é ~n, já que trata-se de uma direção comum a ambos os planos. A reta u = π1 ∩ π2 é perpendicular
a r (em π1 ) e é perpendicular a s (em π2 ), logo é a reta procurada. É única graças ao fato de os
planos π1 e π2 estarem unicamente determinados a partir de r e s.

~n ~n
~v
w
~

r
α

π2 π1
s
β

figura 38

Fazendo
 as contas,  já que
 os vetores
 diretores de π1 são ~v e ~n, um vetor normal para π1 é ~n1 = ~v ×~n =
i j k 4
det 2 1 −1 = −13, assim, usando o fato que A ∈ π1 , temos π1 : 4x − 13y − 5z = −1.
3 −1 5 −5  
11
Similarmente, para π2 consideramos ~n2 = w ~ × ~n =  8  e, como sabemos que B ∈ π2 , temos
−5
π2 : 11x + 8y − 5z = −24. Assim, a reta u é a solução do sistema que representa a interseção de π1
com π2 :
(
4x − 13y − 5z = −1
u: .
11x + 8y − 5z = −24

Resolvendo, igualando 5z em ambas as equações, obtemos x = −3y − 23 7


. Substituindo em uma
das equações, por exemplo, na primeira, obtemos z = −5y − 17
7
, ou seja,

85
 
−3y − 23/7
u: y  , y ∈ R.
−5y − 17/7

Podemos calcular exatamente os pontos P = u ∩ r e Q = u ∩ s, faça isso como exercı́cio.


Há outras maneiras de se conseguir a reta u. Por exemplo, é possı́vel calcular diretamente os pontos
P = π2 ∩ r e Q = π1 ∩ s.
   
3t − 2 2 + 2t
Exercı́cio 17.14 Dadas as retas r :  t  e s :  1 − t ,
3−t 4t
1. Mostre que são reversas.
2. Determine uma reta que passe pela origem e seja concorrente com r e s.
3. Dê exemplo de um ponto P de modo que não exista uma reta u que passe por P e intercepte
r e s.
 
1
4. Dado o vetor ~v = 1, obtenha dois planos cuja interseção seja uma reta m paralela a ~v e

1
concorrente com r e s.
5. Dê exemplos de vetores w
~ tais que não seja possı́vel obter uma reta que seja ao mesmo tempo
paralela a w
~ e concorrente com r e s.

17.6 Distâncias e Ângulos

A filosofia de definição de distância e ângulo entre dois objetos no espaço (pontos, retas e planos)
é, sempre que possı́vel, tomar a menor entre todas as medidas.
−→
Dados dois pontos A, B ∈ R3 , já sabemos que a distância entre eles é dada por d(A, B) = kABk,
cujo cálculo já é conhecido.
Para calcular a distância de um ponto A a um plano π, vamos supor primeiramente que A 6∈ π. É
fácil ver que a menor distância é dada pelo segmento perpendicular de A a π. Assim, se B é o pé
da perpendicular de A até π, então d(A, π) = d(A, B). Isto vale também para o caso A ∈ π (no
qual A = B, coerente com d(A, π) = 0).
Em qualquer caso, o ponto B está unicamente definido e recebe o nome de projeção ortogonal de
A sobre π.
A

86
figura 39

 
1
Por exemplo, se π : x + 2y + z = 13 e A = −1, vamos obter B como a interseção de π com a
2
reta perpendicular
  a π por A.
 Esta  reta, vamos chamá-la r, tem como vetor diretor o vetor normal
1 1+t
a π, 2, logo r : P (t) = 2t − 1. Para calcular t tal que P (t) esteja também em π, exigimos
1 2+t
que as coordenadas de P (t) satisfaçam a equação de π, obtendo

(1 + t) + 2(2t − 1) + (2 + t) = 13,
 
3
−→
ou seja, t = 2. Logo, B = r ∩ π = P (2) = 3 e d(A, π) = kABk, que já sabemos calcular.

4

A mesma ideia de se calcular a distância de um ponto A a uma reta r se aplica: se A está fora de r,
então existe uma única reta s perpendicular a r por A. Sendo B = s∩r, teremos d(A, r) = d(A, B),
pois aı́ estará a menor distância possı́vel entre A e um ponto de r. No caso A ∈ r, existem muitas
retas por A e perpendiculares a r, mas a distância entre A e r será zero. De qualquer modo, o
ponto B, pé da perpendicular de A até r está unicamente determinado, mesmo quando A ∈ r, caso
em que teremos B = A. Dizemos que B é a projeção ortogonal de A sobre r.

Para calcular o ponto B, observe que, em qualquer caso, por A passa um único plano π perpendicular
a r. Vamos obter a equação deste plano e calcular π ∩ r.

87
r

π A

figura 40

   
3 2t − 3
Por exemplo, sendo A = 0 e r :  1 − t , um vetor normal a π é o próprio vetor diretor de r,
  2 t
2
−1. Como queremos A ∈ π, segue π : 2x − y + z = 8. Para calcular r ∩ π, procedemos como
1
no exemplo anterior, exigindo que as coordenadas do ponto P (t) satisfaça a equação de 
π, obtendo

2
2(2t − 3) − (1 − t) + (t) = 8, cuja solução é t = 5/2. Assim, B = π ∩ r = P (5/2) = −3/2 e
5/2
teremos d(A, r) = d(A, B), que já sabemos calcular.

Para calcular a distância entre dois planos, note primeiro que, se eles se interceptam, então a
distância é zero. Assim, a primeira coisa a fazer é obesrvar os vetores normais: se eles não são
paralelos, os planos também não serão, e a distância é zero. Caso π1 e π2 sejam distintos e
paralelos, a distância entre eles será o comprimento de qualquer segmento perpendicular comum.
Para calcular este comprimento, escolha um ponto num dos planos, por exemplo, A ∈ π1 e o
problema está reduzido a calcular a distância de A a π2 , o que já sabemos como fazer.

Dados um plano π e uma reta r, como já foi dito, existem três posições relativas possı́veis: ou a
reta “fura” o plano, isto é, r ∩ π é um ponto; ou a reta está contida em π, isto é, r ∩ π = r; ou r

88
é paralela ao plano, caso em que r ∩ π = ∅. Somente no terceiro caso teremos d(r, π) > 0 e, para
calcular (o comprimento de qualquer segmento perpendicular comum entre r e π) escolhemos um
ponto qualquer A ∈ r e calculamos d(A, π), como nos exemplos anteriores.

Exercı́cio 17.15 Se, ao invés de escolher um ponto em r e calcular sua distância até π, obterı́amos
o mesmo resultado escolhendo um ponto B ∈ π e calculando a distância de B a r?

Dadas duas retas r e s, elas podem ser concorrentes, paralelas ou reversas. No primeiro caso, temos
claramente d(r, s) = 0. No segundo caso, temos de calcular o comprimento de qualquer segmento
perpendicular comum entre r e s, o que se faz escolhendo um ponto qualquer em A ∈ r e calculando
d(A, s). Finalmente, no terceiro caso, calculamos o comprimento do único segmento perpendicular
comum. Já sabemos como obter esse segmento; fizemos isso quando estudamos retas reversas. Há
outro modo de calcular a distância entre duas retas reversas: determinamos o único par de planos
paralelos α e β com r ⊂ α e s ⊂ β calculamos d(α, β).

Ângulos entre vetores e ângulos entre retas já estão definidos, lembre-se apenas que o ângulo entre
vetores está entre 0 e 180o e o ângulo entre duas retas está entre 0 e 90o . Ou seja, se θ é o ângulo
vr ,−
h−
→ →
~ então cos θ = k~h~
entre ~v e w, v ,wi
~
v kkwk
~
e, se β é o ângulo entre r e s, temos cos β = | vs i
kvr kk−

→ →
vs k
|.

Já para se definir o ângulo entre dois planos π1 e π2 , ao considerar todos os ângulos formados entre
uma reta de π1 com uma reta de π2 , não encontramos a “menor medida possı́vel”: tomando um
ponto P na interseção dos dois planos, existem retas r e s por P , uma em cada plano, tais que
o ângulo entre elas fique tão próximo de zero quanto se queira. A maneira natural de se medir o
ângulo entre dois planos é ao longo de sua reta de interseção, como se seu olho estivesse dentro da
reta, vendo cada plano como uma reta, como os ponteiros de um relógio.

^(π1 , π2 )

π1
π2

figura 41

Para o cálculo, tomamos um ponto P da reta interseção e, por ali, o plano γ, perpendicular a ambos
π1 e π2 , isto é, γ é o plano perpendicular à reta de interseção por P . O plano γ intercepta π1 numa
reta r1 e o plano π2 numa reta r2 . Então, teremos ^(π1 , π2 ) = ^(r1 , r2 ), o que já sabemos como
calcular. Assim, o ângulo entre dois planos varia entre 0 e 90o .

89
π1
π2

r1 ^(π1 , π2 ) r2
γ

figura 42

Exercı́cio 17.16 Diga como se pode calcular o ângulo entre dois planos a partir de seus vetores
normais.

Por último, vamos estudar o ângulo entre uma reta r e um plano π. Se r ⊂ π ou r k π, então,
claramente ^(r, π) = 0. Caso contrário, isto é, se r ∩ π é um ponto, consideremos primeiro o caso
r ⊥ π, ou ^(r, π) = 90o , o que é caracterizado pelo fato do vetor diretor de r ser paralelo ao vetor
normal a π.

Nos outros casos, quanto r não é perpendicular a π, o menor ângulo possı́vel entre r e π será medido
no (único) plano γ, perpendicular a π contendo r: teremos ^(r, π) = ^(r, s), onde s = π ∩ γ. Logo,
ângulo entre uma reta e um plano varia entre 0 e 90o . Já sabemos como fazer tudo isso.

A reta s é chamada projeção ortogonal de r sobre π e está determinada por projeções ortogonais
de dois pontos distintos de r sobre π. O ângulo entre uma reta e um plano varia entre 0 e 90o .

^(r, π)
s

90
figura 43

Observe que, se r é perpendicular a π, então a projeção ortogonal de r sobre π é um ponto e, em


todos os outros casos, incluindo r ⊂ π e r k π, a projeção ortogonal de r sobre π é uma reta s e
vale ^(r, π) = ^(r, s).

Estes métodos não são os únicos para se calcular ângulos e distâncias. Por exemplo, no caso da
distãncia entre um ponto A e uma reta r, uma alternativa ao que foi apresentado é considerar todos
−−−→
os vetores que começam em A e terminam em r, que têm a forma AP (t), e calcular t para que este
−−−→ −
vetor seja ortogonal ao vetor diretor → −
vr ; a equação que modela esta situação é hAP (t), →
vr i = 0.
−−−−→
Esta equação tem uma única solução t0 , e portanto d(A, r) = kAP (t0 )k.
−−−→ −
Exercı́cio 17.17 1. Mostre que a equação hAP (t), →vr i = 0 tem de fato uma única solução t0 ,
independente da posição relativa entre o ponto A e a reta r. Interprete geometricamente.

2. Dois pontos são simétricos em relação a um plano se são extremos de um segmento per-
pendicular
  ao plano que encontra o plano no seu ponto médio. Calcule o simétrico do ponto
1
4 em relação ao plano π : x − y + z = 2.
2

3. Dados um ponto A e uma reta r, diga como fazer (indicando a(s) equação(ões) que modela(m)
a situação) para obter o simétrico de A em relação a r. A definição de pontos simétricos em
relação a uma reta é a mesma do exercı́cio anterior, trocando “plano” por “reta”.

4. Determine
 a projeção
 ortogonal da origem sobre a interseção dos planos π1 : x + y + z = 1 e
1+λ
π2 :  1 + µ  .
1+λ+µ
√ 
2
5. O vértice de uma pirâmide regular é P =  2  e sua base é um quadrado ABCD contido
  0
0
no plano π : x = z. Sendo A = 2, determine B, C e D e o volume de P ABCD.
0
   
3t + 1 5t − 1
6. Ache a reta que intercepta as retas r : 2t + 1 e s : 3t + 1 e forma ângulos congruentes
−3t t
com os eixos x, y e z.

7. Calcule a medida dos ângulos entre a diagonal de um cubo e suas faces.


 
1
8. A diagonal BC de um quadrado ABCD está contida na reta que passa por 0 e tem vetor

    0
0 1
diretor 1. Conhecendo A = 1, determine os outros três vértices.
1 0

91
 
( 0
x+y =2
9. Ache os pontos de r : que distam 3 do ponto A = 2.

x−y−z =0 1
     
1+t 1 0
10. Ache os pontos de r :  t/2  que equidistam dos pontos 1 e 1. Interprete geometri-
t 0 1
camente.
   
1+µ λ (
x−y−z =1
11. As retas r : 1 + µ, s :  λ  e t : determinam com o plano π :
µ −1 x=0
x + y − z = −1 um tetraedro. Calcule a altura relativa à face situada em π.

92
18 Sistemas de Equações Lineares

Os resultados aqui serão apresentados para sistemas em geral, de qualquer número de equações e
incógnitas. Mas os exemplos vão se concentrar em R3 .

18.1 Definições e exemplos

Um sistema de equações lineares também é lido como uma equação matricial AX = B, onde Am×n
é a matriz dos coeficientes, Xn×1 é o vetor das incógnitas e Bm×1 é o vetor constante. Trata-se de
um sistema de m equações e n incógintas.

Exemplo. O sistema     
2 −1 1 x 1
1 1 3 y  = 4
2 −3 0 z 8

pode ser interpretado como a interseção de três planos, escrevendo



2x − y + z = 1

x + y + 3z = 4 ,

2x − 3y = 8

ou, escrevendo-o como


       
2 −1 1 1
x 1 + y 1 + z 3 = 4 ,
      
2 −3 0 8

interpretado como a pergunta “o vetor B pode ser escrito como combinação linear das colunas de
A?”

Na verdade, qualquer sistema linear pode ser interpretado desta forma.

Uma solução para AX = B é um vetor constante X0 que satisfaz a equação, isto é, tal que AX0 = B.
O conjunto de todas as soluções do sistema em geral é denotado S. Entendemos resolver o sistema
como representar sua solução S parametricamente.

Exemplos.

1. A solução de um sistema pode ser vazia: interpretando um sistema 3 × 3 como a interseção


de três planos, sendo dois deles paralelos (visualizados como o chão e o teto), por exemplo,
π1 : x + y + z = 0 e π2 : x + y + z = 1 e escolhendo uma “parede” π3 : 3x − 2y − z = 6.

93
figura 44

Exercı́cio 18.1 (a) π3 é uma parede comum (isto é, perpendicular ao “chão”) ou inclinada?
(b) Verifique algebricamente que π1 ∩ π2 ∩ π3 = ∅.

2. Outra situação de solução vazia são três planos que dois a dois se interceptam segundo três
retas paralelas. Para um exemplo numérico, escolhemos livremente os dois primeiros, desde
que se interceptem. Por exemplo π1 : x +  − y −2z = 1. Um vetor diretor
y + z = 0 e π2 : x 
i j k −1
para a reta π1 ∩ π2 é ~v = ~n1 × ~n2 = det 1 1 1  =  3 . Então π3 deve ter esse
1 −1 −2 −2
vetor como um dos diretores. Para escolher o ponto e o segundo vetor diretor para π3 , escolha
−→
A ∈ π1 e B ∈ π2 ambos fora da reta de interseção, ponha w ~ = AB e considere π3 o plano
determinado por A, ~v e w. ~ Nesse caso teremos π1 ∩ π2 ∩ π3 = ∅.

figura 45

Exercı́cio 18.2 (a) Sobre o exemplo 2 acima, escolha pontos A e B como descritos, obtenha
a equação de π3 e verifique algebricamente que o sistema tem solução vazia.
(b) Modifique a escolha de π3 para que tenhamos π1 ∩ π2 ∩ π3 = {reta} e resolva o sistema.

3. A solução de um sistema pode ser um conjunto infinito, como visto no item (b) do último
exercı́cio.

4. Outra configuração de três planos no espaço cuja interseção é uma reta é π1 = π2 e π3


transversal a eles. Nesse caso, o sistema 3 × 3 tem duas equações múltiplas.

5. A interseção de três planos iguais (as três equações múltiplas) também é um exemplo de
sistema cuja solução é um conjunto infinito. Nesse caso, a representação paramétrica da
solução, que é o próprio plano, tem dois parâmetros livres.

Exercı́cio 18.3 Em todos os exemplos anteriores, tem-se S = ∅ ou S é um conjunto infinito.


Verifique que em todos os casos, os vetores normais ~n1 , ~n2 e ~n3 são coplanares.

6. A solução de um sistema pode ser um conjunto unitário: S = {ponto}. Para escolher três
planos que exemplifiquem esta situação, vamos olhar para seus vetores normais.

94
Vamos escolher ~n1 , ~n2 e ~n3 de modo que eles sejam uma base de R3 . Nesse caso, é um exercı́cio
mostrar que a reta π1 ∩ π2 e o plano π3 não são paralelos, logo se interceptam num ponto.
O exemplo trivial é a origem como interseção dos planos coordenados x = 0, y = 0 e z = 0;
outro exemplo é

x + y + z = 0

2x − y + z = 1

3x + y − z = 2

Exercı́cio 18.4 Verifique que se π1 , π2 e π3 são planos tais que seus vetores normais formam
uma base de R3 , então a interseção de dois deles é uma reta transversal ao terceiro.

Observação. O que fizemos foi ilustrar, via exemplos, uma propriedade importante de
sistemas associados a matrizes quadradas: no caso 3 × 3, o sistema AX = B tem solução
única se e somente se as linhas de A formam uma base de R3 , isto é, det A 6= 0. Este fato é
independente do vetor B. Já havı́amos visto este resultado para sistemas 2 × 2 e veremos que
vale de maneira geral: se A é uma matriz quadrada de orndem n tal que det A 6= 0, então,
para qualquer vetor n × 1 B, o sistema linear AX = B tem única solução.
 
x
7. Escrevendo a matriz dos coeficientes A = [C1 , C2 , C3 ] (colunas), sendo X = y , o sistema
z
AX = B pode ser escrito como

xC1 + yC2 + zC3 = B

e portanto pode ser interpretado como a pergunta “B é uma combinação linear das colunas
de A?”. As interpretações geométricas para as possibilidades do conjunto solução são as
seguintes:

ˆ S = ∅ se C1 , C2 e C3 são coplanares e B está fora deste plano;


ˆ S é um conjunto infinito se C1 , C2 e C3 coplanares e B está neste plano. Note que isto
inclui o caso no qual C1 , C2 e C3 são colineares e B está nesta reta.
ˆ S = {ponto} se C1 , C2 e C3 formam uma base para R3 ; este fato não depende do vetor
B.

−−→
Um argumento geométrico para o último caso é que OB pode ser decomposto, de maneira
única, como combinação linear de C1 , C2 e C3 , interpretando {O, C1 , C2 , C3 } como um sistema
de coordenadas para o espaço, em analogia ao que fizemos com {O, i, j, k}. Ou seja, se C1 ,
−−→
C2 e C3 formam uma base, então OB é a diagonal de um paralelepı́pedo gerado por vetores
que são múltiplos de C1 , C2 e C3 .

95
figura 46

Lembre-se que as colunas de A formam uma base para R3 se e somente se as linhas de A


formam uma base para R3 , pois o determinante de uma matriz cujas colunas são uma base é
não nulo e o determinante de uma matriz coincide com o de sua transposta. Esses exemplos
são facilmente generalizados para matrizes quadradas de qualquer ordem.

18.2 Possibilidades qualitativas de soluções de sistemas

Já vimos que ocorrem três possibilidades, a saber, a solução pode ser um conjunto vazio, unitário
ou infinito. Veremos agora que não pode ocorrer mais nenhuma:

Proposição 18.1 Se X0 e X1 são duas soluções distintas de AX = B, então existem infinitas


soluções.

Demonstração. Para ver isso, independente do ambiente onde as soluções estejam, vetores estão
representados por matrizes coluna e podemos pensar na reta que liga X0 a X1 , um conjunto
−−−→
infinito de pontos que depende de um parâmetro livre: X(t) = X0 + tX0 X1 , t ∈ R. A ideia
agora é mostrar que, para qualquer valor de t, X(t) é solução de AX = B. Para ver isso, escreva
X(t) = X0 + t(X1 − X0 ) e calcule

AX(t) = A(X0 + t(X1 − X0 )) = AX0 + t(AX1 − AX0 ) = B + t(B − B) = B,

já que AX0 = B e AX1 = B. Assim, AX(t) = B para qualquer valor de t ∈ R, mostrando o que
foi enunciado.

18.3 Escalonamento

Podemos resolver sistemas de poucas equações e poucas incógnitas “na mão”, utilizando o que já
conhecemos sobre eles. Assim, o método que apresentaremos agora será útil para fezermos contas
com caneta para sistemas, digamos, pequenos. Mas a aplicação computacional, como algoritmo
para resolver qualquer sistema linear de qualquer número de equações e incógnitas será imediata.
Também tem importância teórica na análise qualitativa de soluções de sistemas.

Considerando um sistema linear, as seguintes operações podem ser feitas nas suas linhas (equações)
sem alterar a solução, isto é, estas operações preservam a solução do sistema:

ˆ (i): Li ↔ Lj (troca de posição das linhas)

ˆ (ii): Li ← αLi , α 6= 0 (a i-ésima linha é multiplicada por uma constante não nula)

ˆ (iii): Li ← Li + αLj (a i-ésima linha é substituı́da por ela mesma somada a um múltiplo
escalar de outra)

96
O método de Gauss é escalonar a matriz aumentada do sistema até podermos resolvê-lo facilmente.
   
3 2 1 2
Exemplo. O sistema AX = B, onde A = 1 1 1   e B = 2 pode ser escalonado a partir

1 0 −1 1
da matriz aumentada do sistema:
 
3 2 1 | 2
1 1 1 | 2 ,
1 0 −1 | 1

onde as linhas verticais, que separam A de B, por simplicidade não serão mais digitadas.

Procedendo com o escalonamento, podemos fazer:


 
L1 ↔ L3 1 0 −1 1
−−−−−−−−−−→ 1 1 1 2
3 2 1 2
L2 ← L2 − L1  
L3 ← L3 − 3L1 1 0 −1 1
−−−−−−−−−−−−−−−→  0 1 2 1
0 2 4 −1
L3 ← L3 − 2L2 1 0 −1 1
−−−−−−−−−−−−−−−→  0 1 2 1
0 0 0 −3

A terceira linha da última matriz obtida nos diz que 0x + 0y + 0z = −3, uma equação impossı́vel,
de modo que o sistema, nesse caso, tem solução vazia.
 
2
Exemplo. Considere o exemplo anterior com o vetor constante trocado por  2 . Este vetor (a
−2
última coluna da matriz aumentada) sofre modificações ditadas pelas operações que fizemos acima,
já que as definições das operações do escalonamento dependem apenas da matriz dos coeficientes.
Assim, o passo a passo fica
       
2 −2 −2 −2
 2  →  2  →  4  →  4 ,
−2 2 8 0

de maneira que a matriz aumentada, no final do processo, é


 
1 0 −1 −2
0 1 2 4 ,
0 0 0 0
(
x − z = −2
que nos diz que a solução do sistema é a reta dada por S : , ou, parametricamente,
y + 2z = 4
  
 −2 + z 
S =  4 − 2z  , z ∈ R .
z
 

97
Exemplo. Para um exemplo de solução unitária, tomamos um sistema 3 × 3 com a matriz dos
coeficientes com determinante não nulo:

x + y + z = 0

x + y + 2z = 0

x + 2y + 4z = 0

Para escalonarmos este sistema não é necessária a matriz aumentada, pois sendo o sistema ho-
mogêneo, a coluna do vetor constante é o vetor nulo, que não se modifica com as operações (i), (ii)
e (iii). Assim,

  L2 ← L2 − L1  
1 1 1 L3 ← L3 − L1 1 1 1
1 1 2 −−−−−−−−−−−−→ 0 0 1 ,
1 2 4 0 1 3

que nos permite concluir, pela segunda linha, que z = 0. Substituindo na terceira, segue y = 0 e,
finalmente, na primeira, x = 0. Ou seja, para este sistema, S = {~0}, a origem.

18.4 A forma escalonada e reduzida de uma matriz

Para um algoritimo, é necessário saber quando parar. Para programar um computador para resolver
sistemas lineares de qualquer tamanho, vamos escalonar a matriz aumentada do sistema até que a
matriz dos coeficientes fique, digamos, na forma mais simples possı́vel. Esta forma será chamada
de forma escalonada e reduzida, este método recebe o nome de método de Gauss-Jordan.

Definição. Uma matriz A está na sua forma escalonada e reduzida (escrevemos AER ) se satisfaz:

1. O primeiro elemento não nulo de cada linha não nula, chamado pivô da linha, é 1.

2. O pivô de uma linha (a partir da segunda) está à direita do pivô da linha anterior.

3. Se uma coluna contém um pivô, então todas as outras entradas desta coluna são zero.

4. Linhas nulas ficam abaixo das linhas não nulas.

Exercı́cio 18.5 Dê exemplos de matrizes 3 × 2, 3 × 3 e 3 × 4 que estejam na forma escalonada e


reduzida.

Vamos usar as operações (i), (ii) e (iii) para, após um número finito de passos, chegarmos à forma
escalonada e reduzida de uma matriz. Suponha que a matriz que vamos escalonar tenha n linhas.

ˆ (I) Defina o conjunto de linhas como L1 , L2 , . . . , Ln .

ˆ (II) Escolha uma das linhas não nulas com o pivô mais à esquerda possı́vel.

ˆ (III) Troque com a primeira linha se necessário, usando a operação (i), de modo que o pivô
da primeira linha esteja mais à esquerda possı́vel.

ˆ (IV) Torne este pivô igual a 1, usando a operação (ii).

98
ˆ (V) Zere os outros elementos da coluna deste pivô, usando a operação (iii).

ˆ (VI) Troque as linhas de posição, se necessário, para que as linhas nulas fiquem abaixo das
não nulas.

ˆ (VII) Defina o conjunto de linhas como L2 , L3 , . . . , Ln (a primeira linha é agora L2 ).

ˆ (VIII) Repita os passos (II) - (VI). Note que isso não altera o pivô de L1 , nem sua coluna,
nem as colunas à esquerda dela, porque fora de L1 a coluna que contém o pivô é formada por
zeros e as colunas à sua esquerda já são nulas.

ˆ (IV) Defina o conjunto de linhas como L3 , . . . , Ln .

ˆ (X) Repita os passos (II) - (VI), notando que a coluna que contém o pivô de L2 e as que estão
à sua esquerda não são mais alteradas.

E assim por diante. Como a matriz tem um número finito de linhas, em algum momento terá sido
escolhida a última linha não nula; realizados ali os passos (II) - (VI), o escalonamento para e a
matriz estará na sua forma escalonada e reduzida.

Para resolver um sistema AX = B, escalonamos sua matriz aumentada [A|B] até chegar a [AER |B 0 ],
onde B 0 é o vetor constante modificado pelas operações do escalonamento. Em geral, temos B 0 6= B;
a exceção, como já vimos, são os sistemas homogêneos, onde B = 0, logo B 0 = 0.

Exercı́cio 18.6 Resolva o sistema abaixo, analisando as possibilidades de solução em função do


valor de a ∈ R:

x + 2y − z + 3w − u = 3

5x − y + 2z + 2w − u = a

4x − 3y + 3z − w = −5

Uma observação imediata, a partir do algoritmo acima, é que, sendo A uma matriz quadrada, se
AER não tem linhas nulas, então AER = I, isto é, para matrizes quadradas, acontece exatamente
uma das duas seguintes possibilidades: ou a forma escalonada e reduzida tem uma linha nula ou
ela é a identidade.

No primeiro caso, dependendo do vetor constante B, o sistema AX = B terá solução vazia ou


infinitas soluções; e, se AER = I, independente de B, o sistema AX = B terá uma única solução.

Este é mais um passo na caracterização de sistemas com soluções únicas. Já tı́nhamos observado
que, se A é uma matriz quadrada, então AX = B tem única solução se e somente se det A 6= 0.
Agora sabemos também que AX = B tem única solução se e somente se AER = I.

Isto significa, é claro, que AER = I ⇔ det A 6= 0. O raciocı́nio desenvolvido na próxima subseção
também nos permitirá concluir este resultado. Estudaremos o comportamento do determinante sob
as operações (i), (ii) e (iii) com o intuito de se desenvolver um algoritmo eficiente para calcular
determinantes de matrizes “grandes”.

99
18.5 Determinantes e escalonamento

Já vimos como definir determinantes para matrizes quadradas de ordem 2 e 3. Na verdade, o
desenvolvimento em cofatores serve para definir também para matrizes de ordem superior, já que,
por exemplo, se a matriz é 4 × 4, podemos escolher qualquer linha ou coluna e teremos os produtos
de 4 fatores por 4 cofatores. Depois, basta somá-los. Cada um dos cofatores, a menos de sinal,
é um determinante 3 × 3. Assim, se a matriz é n × n, o desenvolvimento em cofatores leva a n
determinantes (n − 1) × (n − 1), cada um deles leva a n − 1 determinantes (n − 2) × (n − 2) e assim
por diante, até chegarmos na ordem 3 ou 2.

Nesta altura do campeonato, não podemos verificar que a definição é boa (ou seja, que podemos
escolher qualquer linha ou coluna que os resultados serão iguais), nem algumas das propriedades;
isso exigiria uma matemática mais sofisticada. Mas podemos acreditar nisso e fazer as contas,
escolhendo preferencialmente as linhas ou colunas com muitos zeros.

Outra observação importante decorrente do desenvolvimento em cofatores é que, caso a matriz


seja triangular superior, isto é, todos as entradas abaixo da diagonal principal são nulas, então o
determinante é igual ao produto dos elementos da diagonal principal.
 
2 5 11
Por exemplo, det 0 −10 6  = (2)(−10)(5).
0 0 5

Isto vale também, é claro, para matrizes triangulares inferiores.

Esta observação, juntamente com a técnica de escalonamento, nos mostrarão outro modo de calcular
determinantes, computacionalmente muito mais eficiente, por reduzir significativamente o número
de operações. Para cada passo do escalonamento, precisamos saber como o determinante muda, logo
vamos estudar seu comportamento quando são realizadas nas linhas de uma matriz as operações
(i), (ii) e (iii).

Já foi discutido, no caso de matrizes de ordem 3, mas são propriedades que valem para matrizes de
qualquer ordem, que:

ˆ Se B é obtida de A por uma operação (i), isto é, pela troca de posição de duas de suas linhas,
então o determinante muda de sinal: det B = − det A.

ˆ Se B é obtida de A por uma operação (ii), isto é, pela multiplicação de uma de suas linhas
por um escalar não nulo a, então, o determinante fica multiplicado por a: det B = a det A.

E agora vamos ver que

ˆ Se B é obtida de A por uma operação (iii), isto é, pela troca de uma linha pela soma dela
mesma com um múltiplo escalar de outra, então o determinante não muda: det B = det A.

100
 
L1
 L2 
 .. 
 
 . 
 Lj 
 
Para verificar o último item, basta escrever A como uma matriz de linhas, A =   ... , onde, claro,

 
L 
 i
 . 
 .. 
Ln
Li está na posição i e Lj na posição j. Assim, se B é obtida de A trocando-se Li por Li + aLj ,
tem-se, lembrando que o determinante respeita a adição nas linhas de uma matriz,
     
L1 L1 L1
 L2   L2   L2 
..  ..   .. 
     
.  .   . 
 
 
 Lj   Lj   Lj 
     
det B = det 
 ..  = det  ...  + det  ...  = det A,
    
 .     
L + aL  L  aL 
 i j  i  j
 ..   . 
 .. 
 . 
 .. 
 . 
Ln Ln Ln

pois para uma matriz com duas duas linhas múltiplas, o determinante é zero.

Observação. Note que isto é mais um modo de concluir que AER = I ⇔ det A 6= 0, pois as
operações (i), (ii) e (iii) mudam o determinante de uma matriz mas não o fato de ele ser nulo ou
não nulo.

Exemplo. Seja  
2 0 1
A =  1 3 −2 .
−3 2 1

Vamos escaloná-la até chegar a uma matriz triangular superior. Fazendo L1 ↔ L2 , obtemos
 
1 3 −2
B= 2 0 1 
−3 2 1

e det B = − det A. Continuando o escalonamento, fazemos as operações do tipo (iii) L2 ← L2 −2L1


e L3 ← L3 + 3L1 , obtendo
 
1 3 −2
C = 0 −6 5 
0 11 −5

e det C = det B, logo det A = − det C.

O próximo passo é fazer L2 ← (−1/6)L2 para obter

101
 
1 3 −2
D = 0 1 −5/6
0 11 −5
e det D = (−1/6) det C, logo, det A = 6 det D.

Mais um passo, agora L3 ← L3 − 11L2 , nos dá


 
1 3 −2
E = 0 1 −5/6 ,
0 0 25/6

com det E = det D, logo, det A = 6 det E. A matriz E é triangular superior, portanto det E =
(1)(1)(25/6), donde concluı́mos que det A = 25.
 
1 3 −1 3
 2 0 −1 1 
Exercı́cio 18.7 Calcule det −1 1 2
.
1
4 2 3 −3

18.6 Inversão de matrizes e escalonamento

Como já vimos quando discutimos inversão de matrizes 2 × 2, ao se tentar inverter uma matriz,
nos deparamos com sistemas lineares. Vamos ver quais sistemas aparecem no caso 3 × 3 e como
resolvê-los, achando a inversa, caso exista, por escalonamento.

Lembre-se que uma matriz quadrada A é invertı́vel se existe B de mesma ordem tal que AB =
BA = I. Que uma destas igualdades implica a outra (e que, portanto, para procurar B = A−1
precisamos apenas resolver AB = I), e que a inversa, caso exista, é única.

Ora, a equação matricial AB = I pode ser mais detalhadamente descrita no caso 3×3 explicitando-
se as colunas, ficando A[C1 , C2 , C3 ] = [i, j, k], onde C1 , C2 e C3 são as colunas da candidata a inversa
B e i, j e k, os vetores da base canônica, são as colunas da matriz identidade 3 × 3. Assim, temos
a igualdade de matrizes

[AC1 , AC2 , AC3 ] = [i, j, k].

Estamos lidando, portanto, com três sistemas lineares com mesma matriz de coeficientes, cada um
deles tem como incógnita uma das colunas de B e como vetor constante uma coluna da identidade.

Logo podemos escaloná-los simultaneamente, já que, quem define as operações que serão utilizadas
é a matriz dos coeficientes. Ou seja, vamos considerar a matriz aumentada 3 × 6 [A|I]. Esquema-
ticamente, após terminado o escalonamento, teremos [AER |M ], onde M é uma matriz 3 × 3.

Se AER = I, então cada um dos sistemas tem solução única, de modo que M = A−1 .

Se AER tem uma linha nula, então é possı́vel mostrar que os sistemas não podem ser resolvidos
simultaneamente (faça como exercı́cio), logo a inversa não existe.

102
Assim, dada A, a inversa existe se e somente se AER = I, ou seja, se e somente se det A 6= 0. Isto
é coerente com a interpretação que já fizemos de um sistema ter solução única quando pudermos
“isolar” a incógnita: se existe A−1 , então a incógnita de AX = B pode ser isolada multiplicando-se
ambos os lados por A−1 à esquerda:

AX = B ⇔ A−1 AX = A−1 B ⇔ X = A−1 B

e A−1 B é a única solução do sistema.




1 1 0
Exemplo. Vamos decidir se A =  2 1 1 é invertı́vel e, caso afirmativo, calcular A−1 .
−3 2 1
Escalonando [A|I], temos:
 
1 1 0 | 1 0 0
[A|I] =  2 1 1 | 0 1 0
−3 2 1 | 0 0 1
L2 ↔ L2 − 2L1  
L3 ← L3 + 3L1 1 1 0 | 1 0 0
−−−−−−−−−−−−−−−→ 0 −1 1 | −2 1 0
0 5 1 | 3 0 1
L1 ← L1 + L2
L3 ← L3 + 5L2  
L2 ← −L2 1 0 1 | −1 1 0
−−−−−−−−−−−−−−−→ 0 1 −1 | 2 −1 0
0 0 6 | −7 5 1 
L3 ← (1/6)L3 1 0 1 | −1 1 0
−−−−−−−−−−−−−−→ 0 1 −1 | 2 −1 0 
0 0 1 | −7/6 5/6 1/6
L1 ← L1 − L3  
L2 ← L2 + L3 1 0 0 | 1/6 1/6 −1/6
−−−−−−−−−−−−−−→ 0 1 0 | 5/6 −1/6 1/6 
0 0 1 | −7/6 5/6 1/6

Assim, temos  
1 1 −1
1
A−1 =  5 −1 1  .
6
−7 5 1
 
−2 1 3
Exercı́cio 18.8 Dedida se A =  1 0 3 é invertı́vel e, em caso positivo, obtenha a inversa.
4 1 1

Observação. O mesmo raciocı́nio pode ser usado para matrizes quadradas de qualquer ordem: se
An×n é uma matriz, a partir do escalonamento de [A|I], chegando a [AER |M ], concluı́mos que se
AER = I então A é invertı́vel e A−1 = M e que se AER tem uma linha nula então A não é invertı́vel.

103
18.7 Independência Linear em R3

Dado um conjunto de vetores em R3 , podemos considerar o espaço gerado por eles, isto é, o conjunto
de todas as suas combinações lineares.

O conceito de independência linear, como o próprio nome sugere, envolve perguntar se, para um
certo conjunto de vetores, um deles pode ser escrito como combinação linear dos outros.

A ideia geométrica é a seguinte. Uma reta r que passa pela origem é o conjunto dos múltiplos
de um vetor diretor, isto é, r : µ~v . Mas esta reta poderia ser parametrizada com dois parâmetros
livres, como r : µ~v + λw,
~ desde que w ~ e ~v fossem múltiplos.
 No
 segundo caso, um dos vetores está
µ + 2λ
sobrando como gerador. Por exemplo, o conjunto −µ − 2λ, que a priori tem dois parâmetros
  3µ + 6λ
1
livres, pode ser escrito (µ + 2λ) −1, descartando um dos vetores diretores.

3

~ não são paralelos, então π = {µ~v + λw,


Analogamente, se ~v e w ~ µ, λ ∈ R} é um plano pela origem.
Mas se tomamos ~u = 2~v − 3w,~ podemos escrever π = {µ~v + λw ~ + γ~u, µ, λ, γ ∈ R}, representação
paramétrica que tem um dos vetores diretores “sobrando”.

Assim, de uma certa maneira, dizer que um conjunto de vetores é LD (ou linearmente dependente),
vai significar que o espaço das combinações lineares deles tem pelo menos um gerador sobrando,
porque um deles é combinação linear dos outros.

Formalmente, temos

Definição 18.1 Um conjunto de vetores em R3 é linearmente independente, ou LI, se nenhum


deles é uma combinação linear dos outros. Caso contrário é linearmente dependente, ou LD.

Exemplos.

1. Um conjunto de um vetor, {~v } é LI se ~v 6= 0, e LD se ~v = 0. Em outras palavras, um conjunto


LI com um vetor gera uma reta e trata-se de uma convenção dizer que {~0} é LD.

2. Um conjunto de dois vetores {~v , w}


~ é LI se ~v e w
~ não são múltiplos, isto é, não são paralelos,
ou, em outras palavras, um conjunto LI com dois vetores gera um plano. Caso sejam múltiplos,
são LD e geram no máximo uma reta.

3. Note que, em ambos os casos anteriores, a presença do vetor nulo no conjunto torna-o ime-
diatamente LD. Isto acontece sempre: se o vetor nulo pertence a um conjunto de vetores, ele
mesmo é combinação linear dos outros (basta tomar todos os escalares nulos) e o conjunto é
LD.

4. Um conjunto de três vetores {~u, ~v , w}


~ é LI se não são coplanares, ou seja, formam uma base
3
para R . Isso quer dizer, como já vimos, que eles geram todo o espaço. E, caso um deles seja
combinação linear dos outros - justamente o caso em que são coplanares, o conjunto é LD.

Exercı́cio 18.9 1. Um conjunto com quatro ou mais vetores em R3 sempre é LD.

104
2. Dado um conjunto de vetores, ele é LI se e somente se a única maneira de se escrever o vetor
nulo como combinação linear daqueles vetores é usando todos os escalares nulos. Isto quer
dizer que um conjunto {~v1 , ~v2 , . . . , ~vn } é LI se e somente se o sistema homogêneo AX = 0
associado à matriz A cujas colunas são os vetores {~v1 , ~v2 , . . . , ~vn } admite apenas a solução
nula (também chamada solução trivial).

No caso de três vetores em R3 , a matriz associada é quadrada de ordem 3. Assim, se os vetores são
LI, as colunas formam uma base e o determinante da matriz é não nulo.

Sejam ~u, ~v e w~ três vetores LI em R3 , todos representados com ponto inicial na origem. Como são
LI, w~ está fora do plano gerado por ~u e ~v e estes três vetores determinam um paralelepı́pedo P .
O volume deste sólido é v(P ) = área da base x altura. A área da base é a área do paralelogramo
determinado por ~u e ~v , que, como sabemos, tem valor k~u × ~v k. A altura é a distância da origem à
projeção ortogonal do ponto final de w ~ na reta gerada por ~u × ~v . Seja θ o ângulo entre os vetores
~ e ~u × ~v . Há dois casos a considerar: se θ é agudo, a altura procurada é kwk
w ~ cos θ e se θ é obtuso,
então a altura procurada é kwk ~ cos(180o − θ) = kwk(−
~ cos θ) = kwk|
~ cos θ|. O volume, em ambos
os casos fica
   

w ~ ~u
v(P ) = k~u × ~v kkwk|
~ cos θ| = |hw,
~ ~u × ~v i| = det ~u = det ~v  .
  
~v w ~

Isto fornece mais um argumento que mostra que o determinante de uma matriz é não nulo se e
somente as colunas (ou as linhas, tanto faz) formam uma base de R3 .

18.8 O teorema de caracterização

Ao longo de toda esta seção, de uma maneira ou de outra, olhamos com detalhes para matrizes
quadradas de ordem 3. Elas estão separadas em dois grupos: um onde o determinante é não nulo,
outro no qual o determinante é zero. O que fizemos foi apresentar uma série de argumentos que
demonstram o seguinte

Teorema 18.1 Seja A uma matriz quadrada de ordem 3. As seguintes afirmações são equivalentes:

1. O sistema AX = B tem única solução, e este fato não depende de B. Em particular, o


sistema homogêneo associado a A, AX = 0, admite apenas a solução trivial.

2. det A 6= 0.

3. AER = I.

4. A é uma matriz invertı́vel.

5. As colunas de A são LI (ou: as colunas de A formam uma base para R3 ) (ou: as linhas de A
são LI) (ou: as linhas de A formam uma base para R3 ).

Ou seja, cada uma destas condições caracteriza totalmente o grupo ao qual A faz parte.

Este teorema poderia ser enunciado a partir das negativas das condições. Ficaria assim:

105
Teorema 18.2 Seja A uma matriz quadrada de ordem 3. As seguintes afirmações são equivalentes:
1. O sistema AX = B tem como solução o conjunto vazio ou um conjunto infinito. Em parti-
cular, o sistema homogêneo associado a A, AX = 0, admite soluções não nulas.
2. det A = 0.
3. AER tem uma linha nula.
4. A é uma matriz singular (isto é, não invertı́vel).
5. As colunas de A são LD (ou: as colunas de A são coplanares) (ou: as linhas de A são LD)
(ou: as linhas de A são coplanares).

Observação. Com as devidas adaptações nos itens “5”, quando se fala de coplanaridade, este
teorema vale para matrizes quadradas de qualquer ordem e os argumentos para a demonstração
são os mesmos.

18.9 Mais exercı́cios

Sempre que possı́vel, haverá uma motivação geométrica para que sejam analisados equações e
sistemas lineares que aparecem como modelo.
 
3−t
1. Dê exemplos de pontos distintos pertencentes à reta r : 2t − 2.
1+t
     
1 0 6
2. Dado o plano π : x + 2y − 5z = 12, decida se os pontos A =  2 ,B=
  1  e C = 1

−5 −2 0
pertencem ou não ao plano π.
 
1
3. Dado π : x − y − z = 0, determine a projeção perpendicular do ponto A = 2 sobre π.
1

4. Dado o cubo unitário em R3 determinado por {O, i, j, k}, seja P o ponto de encontro das
diagonais da face superior (isto é, a face oposta à que está no plano xy). Determine o plano
−→
que passa pela origem e é perpendicular a OP .
 
1 + bt
5. Estude a posição relativa das retas r1 : a + 2t, onde t é o parâmetro e a e b são números
  1−t
6s − 1
reais e r2 :  −4s  em função dos números a e b.
1 + 2s
6. Sejamπ  : 3x − y + 2z = 8 e P o ponto de interseção de π com o eixo z. Considere o ponto
1
−→
Q = 1. Mostre que Q 6∈ π e decomponha o vetor P Q como combinação linear de dois
1
vetores perpendiculares, sendo um deles paralelo a π.

106
7. Dados os planos π : 2x − 3y + z = 0 e β : x + 3y − z = 1, obtenha uma representação
paramétrica para π ∩ β.

8. Dado π : x − y − z = 0, obtenha uma representação paramétrica para π onde os dois vetores


diretores sejam perpendiculares.
   
1 3
9. Dados os vetores ~u = −1 e ~v = 0, dê exemplo de vetores w ~ 1, w
~2 e w
~ 3 tais que
−2 1

(a) Os conjuntos {~u, ~v , w


~ 1 } e {~u, ~v , w
~ 2 } são ambos LI, mas w
~1 e w
~ 2 não são paralelos.
(b) O conjunto {~u, ~v , w
~ 3 } é LD mas w
~ 3 6= 0.
 
−1 a −1
10. Para quais valores de a ∈ R a matriz A =  1 −2 1  é invertı́vel?
a 0 −3
11. Calcule a distância entre os planos dados pelas equações x + y + z = 1 e x + y + z = 2.

12. Dadas duas retas reversas a : P (t) = A + t~v e b : Q(s) = B + sw, ~ um modo algébrico de
se obter a reta m perpendicular comum a a e b é o seguinte: sabemos que m tem que ter a
direção do vetor ~n = ~v × w,
~ pois tem de ser perpendicular a ambas. Considere o conjunto
−−−−−−→
de todos os vetores que começam em a e terminam em b, isto é, P (t)Q(s), com parâmetros
livres t e s. Para achar os pontos onde m toca a e b, a exigência é que este vetor seja paralelo
a ~n, isto é,

−−−−−−→
P (t)Q(s) = λ~n.

Mostre que esta equação é um sistema linear 3 × 3 nas variáveis t, s e λ, associado a uma
matriz cujas colunas são LI. Portanto, este sistema tem solução única e ao substituirmos os
valores de t e s encontrados nos pontos genéricos de a e b, obtemos os pontos desejados.

19 Espaços Euclidianos Rn

O conjunto Rn é o produto cartesiano de n cópias de R, representado pelo conjunto de todas as


matrizes coluna n × 1. De maneira equivalente poderı́amos ter escolhido as matrizes linha 1 × n.
−→
Do mesmo modo que em R2 ou R3 , um ponto P de Rn define o vetor OP , com ponto inicial na
origem. Reciprocamente, cada vetor define um ponto. As oprações lineares com matrizes coluna
definem as operações lineares em Rn , adição de vetores e multiplicação de vetor por escalar. A
multiplicação matricial de um vetor linha por um vetor coluna dá origem ao produto escalar entre
~ = ~v t w.
dois vetores: h~v , wi ~

Dizemos que dois vetores são ortogonais se o produto escalar entre eles é zero.

Exercı́cio. Mostre a desigualdade de Cauchy-Schwarz: se ~v e w~ são dois vetores em Rn , então


−1 ≤ k~h~v ,wi
~
v kkwk
~
≤ 1. Conclua que podemos definir o ângulo entre dois vetores de Rn através do
produto escalar.

107
19.1 Independência Linear em Rn

Analogamente ao que já fizemos, diremos que um conjunto de vetores em Rn é LD se um deles é


combinação linear dos outros e LI caso contrário.

Em R3 existem critérios geométricos que nos ajudam a caracterizar a independência linear, mas
em Rn , é necessário conhecer um critério algébrico.

Para deduzi-lo, considere um conjunto {~v1 , . . . , ~vk } de vetores de Rn e suponha que sejam LD, ou
seja, que um deles é combinação linear dos outros. Para fixar as ideias, digamos que ~vk é combinação
linear de ~v1 , . . . , ~vk−1 . Isto significa que existem escalares a1 , a2 , . . . , ak−1 tais que

~vk = a1~v1 + a2~v2 + · · · + ak−1~vk−1

ou

a1~v1 + a2~v2 + · · · + ak−1~vk−1 − ~vk = 0,


 
a1
 .. 
o que nos diz que o vetor  .  é solução (não nula) do sistema homogêneo
 
ak−1 
−1
x1~v1 + x2~v2 + · · · + xk~vk = 0.

Portanto, é a análise de um sistema homogêneo que determina se ~v1 , . . . , ~vk são LI ou LD: se existir
solução não nula, como no exemplo acima, os vetores são LD. Caso contrário, se o vetor nulo é a
única solução do sistema, nenhum deles é combinação linear dos outros, então os vetores são LI.

Em outras palavras, um conjunto de vetores é LI se e somente se a única maneira de se escrever o


vetor nulo como combinação linear deles é usando todos os escalares iguais a zero.

Exemplos.

1. Dois vetores não paralelos ~u e ~v em R2 , como sabemos, são LI. Note que, para escrever o zero
como combinação linear deles, devemos ter o vetor nulo como diagonal de um paralelogramo
com lados α~u e β~v . Ora, isto só é possı́vel para α = β = 0.

2. Um conjunto de m vetores em Rn com m > n é sempre LD, pois o sistema

x1~v1 + x2~v2 + · · · + xm~vm = 0

tem mais incógnitas que equações, logo sempre tem solução não nula.

108
     
1 2 0
 2
3 e w
 
 1 . Para determinar se
 
3. Em R4 , considere os vetores ~u =  0 , ~
v = 1 ~ = −1
−1 1 −3
são
 LD ou
 LI, olhe para o sistema homogêneo x~
u + y~
v + z w
~ = 0. Resolvendo-o, chegamos a
 −2z 
 z  . Escolhendo z = 1, concluı́mos que −2~u +~v + w ~ = 0, o que significa que qualquer
z
 
um deles pode ser escrito como combinação linear dos outros dois. Por exemplo, ~v = 2~u − w.~
Assim, {~u, ~v , w}
~ é um conjunto LD.

19.2 Subespaços de Rn

Um subespaço de Rn é um conjunto de vetores fechado em relação às operações lineares. Assim, W


é um subespaço de Rn se, dados ~u, ~v ∈ W, então a~u + b~v ∈ W, para quaisquer escalares a e b. Isto
confere a W interesse próprio, e não apenas como subconjunto de Rn . É como se W fosse o próprio
espaço ambiente.

Note que o vetor nulo é uma combinação linear de quaisquer vetores de W, logo todos os subespaços
contêm a origem.

Exemplos.

1. O conjunto formado pelo vetor nulo, {0}, é um subespaço de Rn .

2. Uma reta r pela origem é um subespaço de R3 . De fato, quaisquer dois vetores de r são
múltiplos do vetor diretor, logo as combinações lineares deles também.

3. Exercı́cio: um plano pela origem é um subespaço de R3 .

4. O espaço R3 é obviamente subespaço de si mesmo.

Estes são todos os exemplos em R3 . Para se convencer disso, suponha que um subespaço
W ⊂ R3 contenha um vetor não nulo ~u. Então W contém a reta gerada por ~u. Há duas
possibiliddes: ou W é exatamente a reta gerada por ~u ou W contém ainda um vetor ~v LI com
~u (não paralelo). Nese caso, W contém as combinações lineares de ~u e ~v , isto é, W contém
um plano pela origem. Se W contém um plano pela origem, ou é exatamente esse plano ou
W contém ainda um vetor w ~ que seja LI com ~u e ~v (isto é, ~u, ~v e w
~ não coplanares) e W é
3 3
todo o R . E são todos os casos, pois qualquer outro vetor de R adicionado à base {~u, ~v , w}
~
torna o conjunto LD. Um exercı́cio de imaginação nos leva a conjecturar o que acontece para
n > 3.

5. Seja AX = 0 um sistema homogêneo de n equações e k incógnitas, isto é, A é uma matriz n×k.
Então, o espaço das soluções é um subespaço de Rk . De fato, se ~u e ~v são soluções, qualquer
combinação linear deles também é: se A~u = 0 e A~v = 0, então A(a~u + b~v ) = aA~u + bA~v = 0.

6. Se W é um subespaço, então o conjunto de todos os vetores ortogonais a W também é um


subespaço, chamado subespaço ortogonal. De fato, este conjunto é dado por W⊥ = {~v ∈
Rn | h~v , wi
~ = 0, ∀w
~ ∈ W}. Como o produto escalar respeita combinações lineares, segue que
uma combinação linear de dois vetores de W⊥ também está em W⊥ .

109
Exercı́cio 19.1 . Em R3 , o subespaço ortogonal a uma reta pela origem é um plano pela
origem e vice-versa.

7. O espaço gerado pelos vetores ~v1 , . . . , ~vk , definido por ser o conjunto das combinações lineares
deles, é obviamente um subespaço de Rn . É denotado usando-se colchetes: [~v1 , . . . , ~vk ]. Por
exemplo, em R3 , seja
  
 2a − 3b + c 
W=  a + b − 2c  | a, b, c ∈ R .
−a + 2b − c
 

      
 2 −3 1 
Não é difı́cil ver que se trata de um subespaço, pois W = a 1 + b 1 + c −2 ,
    
−1 2 −1
 
isto é, é o espaço gerado por três vetores. Mas para melhor descrever W, é necessário per-
guntar se todos os geradores são essenciais. Ou, em outras palavras, se de fato precisamos
de três prarâmetros livres. A resposta está na análise da dependência linear dos geradores:
chamando-os
  de ~v1 , ~v 2 e~
v3 , olhe para o sistema homogêneo x~v1 + y~v2 + z~v3 = 0. Sua solução é
 y 
S = y  | y ∈ R . Tomando y = 1, isto significa que ~v1 + ~v2 + ~v3 = 0, ou ~v3 = −~v1 − ~v2 .
y
 
Assim, ~v1 , ~v2 e ~v3 são LD e ~v3 está sobrando como gerador, e W = [~v1 , ~v2 ]. Como ~v1 e ~v2 não
são múltiplos, são LI (ambos são essenciais como geradores), logo W é um plano pela origem.

Exercı́cio 19.2 Dada uma matriz A com n colunas, mostre que o conjunto {B ∈ Rn | o
sistema AX = B tem solução} é um subespaço do Rn . Sugestão: este conjunto é o espaço
gerado pelas colunas de A.

19.3 Bases e dimensão


Já vimos em R3 a ideia de identificar os geradores que estão “sobrando” e descartá-los; esta ideia
também está presente em Rn . Dado um conjunto de vetores ~v1 , . . . , ~vk , ao descartarmos, um a
um, os que são combinações lineares dos outros, sobrará um conjunto LI. Por exemplo, considere
W = [~u, ~v ] em Rn , onde ~v = 2~u. Ou seja, ~u e ~v são LD e podemos escrever W = [~u]. Se ~u for não
nulo, W é o conjunto dos múltiplos de ~u, uma “reta pela origem” de Rn . O processo de encontar
um conjunto minimal (LI) de geradores leva ao conceito de base:

Definição. Um conjunto de geradores para um subespaço W é um um conjunto de vetores tal


que cada elemento de W pode ser escrito como uma combinação linear deles. Uma base para um
subespaço W de Rn é um conjunto LI de geradores.

Uma boa pergunta para o momento é se todas as bases para um mesmo subespaço tem o mesmo
número de vetores. Quando pensamos no subespaço W, gerado pelos vetores ~u1 , . . . , ~uk , temos
W = {x1~u1 + · · · + xk ~uk }, uma representação paramétrica, onde os parâmetros livres são os xj .
Mas já foi visto várias vezes que a representação paramétrica para um subconjunto de Rn não é
única, assim digamos que W também seja descrito pelos geradores ~v1 , · · · , ~v` . Ao produzirmos uma
base a partir de cada um dos conjuntos de geradores, reduzindo-os a um conjunto minimal (LI),
chegaremos ao mesmo número de vetores?

110
A resposta é afirmativa: a demonstração deste fato se faz supondo que os conjuntos {~u1 , . . . , ~uk }
e {~v1 , . . . , ~v` } são ambos bases para W, com k 6= `, e chegando a uma contradição. Vamos apenas
ilustrar este argumento tomando valores particulares k = 2 e ` = 1. Ora neste caso é fácil ver
que ~u1 e ~u2 são ambos múltiplos de ~v1 , logo são múltiplos entre si, portanto LD, o que é uma
contradição com o fato de {~u1 , ~u2 } ser base.

Definição. Dado um subespaço W ⊂ Rn , a dimensão de W é o número de vetores de uma (e


portanto de qualquer) base de W. Este número é denotado por dim W.

Exemplos.

1. Podemos considerar Rn como subespaço de si mesmo. Como uma base para Rn tem n
elementos (tome, por exemplo, a base canônica), temos dim Rn = n.

2. Um plano pela origem em R3 tem dimensão 2 e uma reta pela origem em R3 tem dimensão
1.

3. dim {0} = 0, independente do espaço ambiente.

4. O algoritmo para calcular a dimensão de um dado subespaço é identificar um conjunto de


geradores e descartar os que estão sobrando, se houver, até chegar a um conjunto LI, ou seja,
uma base. Depois é só contar o número de vetores. Por exemplo, seja
  

 a + 2b + 3d 

2a + 3b + c + 5d
  
W=   | a, b, c, d ∈ R .
 

 b−c+d 
−a + b − 3c
 

W é certamente um subespaço de R4 já que se trata de um conjunto de combinações lineares


de certos vetores. Mas, embora esta representação paramétrica tenha quatro parâmetros
livres, não se pode dizer imediatamente
 que
 dim
  W = 4. 
Como
  efeito, primeiro identificamos
1 2 0 3
 2  3  1  5
um conjunto de geradores, são eles   0 , 1, −1, 1, e agora verificamos se há
      

−1 1 −3 0
um ou mais sobrando, isto é, se são LD.

Para isto, como já visto, analisamos o sistema linear homogêneo


       
1 2 0 3
2 3 1 5
 0  + y 1 + z −1 + w 1 = 0,
x       

−1 1 −3 0

 

 −2y − 3w 
y
 
cuja solução é S =  y + w . Então o sistema admite solução não nula e os geradores


 
w
 
de W são LD. Dando valores para y e w, identificamos um gerador que é combinação linear

111
dos outros. Chame os geradores listados acima de ~v1 , ~v2 , ~v3 e ~v4 , na ordem em que aparecem.
Escolhendo y = 0 e w = 1, temos ~v4 = 3~v1 − ~v3 e podemos descartar ~v4 . Escolhendo y = 1 e
w = 0, temos ~v2 = 2~v1 −~v3 e também podemos descartar ~v2 . Olhando agora para os geradores
que sobrarm, ~v1 e ~v3 , vê-se imediatamente que não são múltiplos, formando portanto uma
base para W. Logo dim W = 2. Em outras palavras, W é um plano pela origem em R4 .

A observação mais atenta, no caso de vetores com coordenadas inteiras, também ajuda e é
legı́tima: poderı́amos ter descartado ~v4 de imediato, notando que é a soma de ~v1 com ~v2 .

Exercı́cio 19.3 1. Verifique que a interseção de dois subespaços de Rn também é um subespaço.

2. Calcule a dimensão da interseção de dois planos pela origem de R3 , para cada possı́vel posição
relativa entre eles.
  
 a+c 
3. Calcule a dimensão de W =  b+c  | a, b, c ∈ R .
a + 2b + c
 

4. 
Calcule a dimensão
 do espaço das soluções do sistema homogêneo AX = 0, onde A =
2 2 −1 1
−1 1 2 1 .
1 1 −2 −1
5. Todos os subespaços de Rn podem ser vistos como soluções de sitemas homogêneos. Para
ver isto, seja W um subespaço, e seja {~u1 , . . . , ~uk } uma base para W. Ou seja, dim W = k.
Vamos encontrar um sistema do qual W seja a solução.

(a) Mostre que o subespaço ortogonal a W é a solução do sistema homogêneo [~u1 , . . . , ~uk ]t X =
0.
(b) Mostre que dim W⊥ = n − k.
(c) Escolha uma base {~v1 , . . . , ~vn−k } para W⊥ e mostre que W é a solução do sistema ho-
mogêneo [~v1 , . . . , ~vn−k ]X = 0. Sugestão: faça primeiro em R3 e interprete geometrica-
mente, para “sentir” o que acontece em dimensões maiores.

6. Sejam W1 e W2 dois subespaços de dimensão 3 em R4 , o que você pode dizer sobre a dimensão
de W1 ∩ W2 ?

7. Descreva, com palavras, todos os possı́veis subespaços de Rn .

20 Diagonalização de Matrizes

Parte deste conteúdo já foi visto quando estudamos cônicas, soluções de equações quadráticas em
R2 . Lá, associamos à forma quadrática de cada equação uma matriz simétrica 2 × 2 M , para a
qual encontramos uma base ortonormal de autovetores. A matriz cujas colunas são esses vetores é
a matriz de mudança de base A, que por sua vez define um novo sistema de coordenadas através
da equação X = AX 0 e a equação nessas coordenadas é mais simples porque a matriz da forma
quadrática na base dos autovetores, A−1 M A, é uma matriz diagonal. Escrevemos

D = A−1 M A.

112
Vamos estudar um pouco mais de diagonalização de matrizes, em dimensões maiores e sem que
necessariamente sejam simétricas. A sequência será mudança de base em Rn , autovalores e au-
tovetores para matrizes quadradas de ordem n, condições suficientes para que uma matriz seja
diagonalizável (ou para que não seja), diagonalização de matrizes simétricas.

Os teoremas serão enunciados sem demonstração, pois não fazem parte do objetivo deste curso. Na
verdade, os resultados serão ilustrativos e úteis para tomarmos alguns atalhos nas contas, mas o
cálculo de todos os autovalores e autovetores de uma dada matriz é suficiente para concluir se ela
é ou não diagonalizável.

20.1 Mudanças de base em Rn e definições básicas

A base canônica de Rn , em analogia à do R3 , é denotada por B0 e definida pelos vetores ej , que


têm 1 como entrada na j-ésima linha e zero em todas as outras. Em R2 e R3 , usamos as notações
particulares {i, j} e {i, j, k}.

Sejam (x1 , . . . , xn ) as coordenadas usuais de Rn , definidas pela base canônica e (x01 , . . . , x0n ), coor-
denadas na base B = {~v1 , . . . , ~vn }. Dado um vetor qualquer ~u ∈ Rn , comparando as decomposições
de ~u nas bases B0 e B, temos

x1 e1 + · · · + xn en = x01~v1 + · · · x0n~vn ,

que é o mesmo que escrever X = AX 0 , onde A = [~v1 , . . . , ~vn ] (colunas). É imediato que det A 6= 0
e que X 0 = A−1 X é uma equação equivalente.

Já vimos que matrizes quadradas de ordem 2 podem ser vistas como movimentos do plano, isto
é, funções de R2 em R2 que “transformam” um vetor em outro via multiplicação. O mesmo
pode
 serfeito em qualquer dimensão. Só a tı́tulo de exemplo, lembre-se que a muliplicação por
0 −1
é uma rotação de 90o no sentido positivo. Tente se convencer que a muliplicação por
1 0 
0 −1 0
M = −1 0 0  é a rotação de 90o em torno do eixo z seguida da reflexão no eixo x em
0 0 −1  
2 0 0
R3 , enquanto que a multiplicação por N = 0 2 0 dilata (multiplica pelo escalar 2) vetores do
0 0 1
plano xy e não muda vetores do eixo z. A interpretação do movimento para estas matrizes é mais
fácil porque N é diagonal e M é “muito próxima” disso.

Quando fazemos uma mudança de base, podemos imaginar que estamos mudando o ponto de vista
do observador do movimento causado pela multiplicação por uma matriz M , de modo que ele
enxergue esta ação através da multiplicação por outra matriz, digamos D, que seja uma matriz
diagonal ou o mais próximo possı́vel. Como em R2 , temos D = A−1 M A

Com estas ideias, tentemos entender o movimento causado por D em (Rn , B), ou seja, em Rn com
as coordenadas X 0 . Primeiro, “voltamos” para (Rn , B0 ), pela multiplicação por A. Ou seja, dado
~u ∈ (Rn , B), ele está associado ao vetor A~u ∈ (Rn , B0 ). Agora multiplicamos por M , gerando o
movimento propriamente dito em (Rn , B0 ), obtendo o vetor M A~u ∈ (Rn , B0 ). Finalmente, mudamos

113
novamente de coordenadas, de X para X 0 através da multiplicação por A−1 , chegando ao vetor
A−1 M A~u ∈ (Rn , B).

figura 47

Então, para qualquer vetor ~u, temos D~u = A−1 M A~u ∈ (Rn , B) e quanto mais simples for D, mais
simples será a interpretação do movimento, agora na nova base.

Definição 20.1 Duas matrizes quadradas M e N são semelhantes ou conjugadas se existe uma
matriz A invertı́vel (de mesma ordem) tal que M = AN A−1 .

Sob este ponto de vista, diagonalização de matrizes nada mais é que perguntar se existe uma matriz
diagonal semelhante a M :

Definição 20.2 Uma matriz quadrada M é diagonalizável se é semelhante a uma matriz diagonal,
isto é, se existem matrizes D diagonal e A invertı́vel tais que M = ADA−1 .

 
λ1 0 · · · 0
Como esta equação é equivalente a M A = AD, se A = [~v1 , . . . , ~vn ] (colunas) e D =  ... ... . . . ... ,
 
0 0 · · · λn
−1
usando multiplicação de matrizes vemos que escrever M = ADA é o mesmo que escrever

[M~v1 , . . . , M~vn ] = [λ1~v1 , . . . , λn~vn ],

e, comparando as colunas, vemos que cada coluna de A é um vetor não nulo (que, portanto, define
uma direção) que é levado por M num múltiplo de si mesmo, ou seja, representa uma uma direção
invariante, expressão que já escutamos ao falarmos de autovetores:

Definição 20.3 Dada uma matriz M n × n, um autovetor de M é um vetor não nulo ~v ∈ Rn para
o qual existe um escalar λ (o autovalor associado) tal que M~v = λ~v .

Com estas observações, dizer que uma matriz M é diagonalizável é o mesmo que dizer que existe
uma base de Rn formada por autovetores de M ; eles serão as colunas da matriz A. Ou ainda, é o
mesmo que dizer que existe uma base que define coordenadas em Rn nas quais a multiplicação por
M é a multiplicação por uma matriz diagonal.

114
20.2 Matrizes diagonalizáveis e não diagonalizáveis

Para verificar se uma dada matriz M é ou não diagonalizável, tratamos de encontar seus autovetores,
para saber se existe ou não uma base de Rn formada por eles. Para isso, como já vimos em dimensão
2, temos que encontrar os autovalores de M . A partir de M~v = λ~v , chegamos a (M − λI)~v = 0 e,
como queremos ~v 6= 0, exigimos det(M − λI) = 0. Esta equação é uma equação polinomial de grau
n (igual à ordem da matriz), chamada equação caracterı́stica. O polinômio de grau n det(M − λI)
é chamado polinômio caracterı́stico de M .

Autovalores são raı́zes reais da equação caracterı́stica, assim, um motivo para uma matriz não ser
diagonalizável é a equação caracterı́stica não ter raı́zes reais em número suficiente.
 
0 −1
Por exemplo, a rotação M = tem como equação caracterı́stica λ2 + 1 = 0, que não tem
1 0
raı́zes reais, logo não existem autovalores, logo M não é diagonalizável. De fato, geometricamente
é claro que não existem direções invariantes.

O outro motivo para uma matriznão ser  diagonalizável é a falta de autovetores. Isto acontece,
2 1
por exemplo, para a matriz M = , cuja equação caracterı́stica é (λ − 2)2 = 0 que tem duas
0 2
raı́zes reais e iguais. Então há autovalores em número suficiente,
 mas,   ao calcularmos os autovetores
0 1 x
associados ao autovalor duplo λ = 2, chegamos ao sistema = 0, cuja solução é o eixo
0 0 y
2
x. Assim, não existe
 uma base de R formada por autovetores de M , já que todos os autovetores
1
são múltiplos de .
0

Não é uma coincidência este fato ocorrer para raı́zes múltiplas da equação caracterı́stica:

Teorema 20.1 A autovalores distintos de uma matriz M estão associados autovetores LI.

Por exemplo, se sabemos que uma dada matriz M tem três autovalores distintos, então existe um
conjunto com pelo menos três autovetores, associados a cada um dos autovalores, que é linearmente
independente.

Então, usando o teorema, podemos concluir que uma matriz M de ordem n que tem n autovalores
distintos é diagonalizável, pois terá n autovetores LI e n vetores LI em Rn formam uma base.

Outra conclusão é que, havendo autovalores em número suficiente, contados com multiplicidade,
então o único motivo para que a matriz não seja diagonalizável é a “falta de autovetores” para os
autovalores múltiplos. Vamos tornar este conceito um pouco mais preciso:

Definição 20.4 Dada uma matriz M n × n, para cada autovalor λ, o autoespaço associado a λ
é o subespaço Sλ ⊂ Rn , o espaço solução do sistema homogêneo (M − λI)X = 0. Isto é, fora da
origem, Sλ é o conjunto de todos os autovetores de M associados a λ.

Então, a dimensão de um autoespaço é no mı́nimo 1, já que, se existe autovalor, existe autovetor.
A “falta de autovetores” está relacionada com o fato de um autoespaço não atingir sua dimensão

115
máxima. Para continuar a formalizar, vamos lembrar alguns resultados básicos sobre polinômios
caracterı́sticos e sua fatoração.

Primeiramente, note, pela própria definição, que o polinômio caracterı́stico de uma matriz n × n
tem grau n e o coeficiente de λn é 1 ou −1. Mais precisamente, se p(λ) é o polinômio caracterı́stico
da matriz M , então p(λ) = (−1)n xn + · · · + a1 x + a0 .

De modo que em sua fatoração, a menos de sinal, só vão aparecer fatores da forma (λ − a) ou
fatores irredutı́veis de grau 2 (polinômios quadráticos sem raı́zes reais). Em geral,

p(λ) = (−1)n (λ − a1 )d1 · · · (λ − ak )dk b(λ),

onde cada aj é uma raiz real de p, com multiplicidade dj , e b(λ) é um produto de polinômios
irredutı́veis de grau 2. A soma dos graus de todos os fatores é igual a n. A ocorrência de fatores
irredutı́veis de grau 2 no polinômio caracterı́stico de uma matriz é o que chamamos anteriormente
de falta de autovalores e constitui motivo para a não diagonalização da matriz.

Definição 20.5 O grau algébrico de um autovalor a de uma matriz M é o grau de a como raiz do
polinômio caracterı́stico, isto é, o grau do fator (λ − a) em sua fatoração. A notação é g(a).

Teorema 20.2 Para cada autovalor a da matriz M , tem-se 1 6 dim Sa 6 g(a). Assim, a dimensão
máxima que o autoespaço associado a a pode assumir é o grau algébrico de a como raiz da equação
caracterı́stica.

Logo:

Teorema 20.3 Uma matriz M n × n é diagonalizável se e somente se seu polinômio caracterı́stico


p(λ) tem n raı́zes reais, contadas com multiplicidade, e a dimensão de cada autoespaço associado é
máxima.

Vamos fazer um resumo-ilustração dessas ideias para matrizes 3 × 3, nosso ambiente será, portanto,
o R3 . O coeficiente de λ3 no polinômio caracterı́stico de uma matriz de ordem 3 é sempre −1, mas
ao multiplicarmos a equação caracterı́stica por −1, não mudamos sua solução e podemos trabalhar
com o polinômio de sinal trocado, que tem coeficiente de λ3 igual a 1.

1. p(λ) tem três raı́zes reais e distintas. Assim, p(λ) = (λ−a)(λ−b)(λ−c). Então, os autoespaços
3
Sa , Sb e Sc são gerados por vetores LI, logo estes geradores formam uma base de R , logoa
a 0 0
matriz M é diagonalizável. A matriz D é a matriz dos autovalores, isto é, D = 0 b 0.

0 0 c
A matriz A terá como colunas autovetores associados a a, b e c respectivamente. Observe que
A não é única, mas as direções definidas por suas colunas sim.

2. p(λ) tem apenas uma raiz real. Assim, p(λ) = (λ − a)q(λ), onde q(λ) é um fator irredutı́vel
de grau 2. O autoespaço Sa tem dimensão 1, enquanto uma base de R3 deve ser formada por
3 vetores. A matriz M não é diagonalizável por falta de autovalores.

116
2
3. p(λ) tem três raı́zes reais, mas uma delas é dupla. Assim, p(λ) = (λ − a)  (λ − b), com
a 0 0
a 6= b. Nesse caso, na tentativa de diagonalizar M escrevemos D = 0 a 0. sabemos que

0 0 b
dim Sb = 1, tomamos um gerador desta reta para ser a terceira coluna da matriz A. Mas,
de acordo com os resultados acima, temos duas possibilidades para dim Sa : 1 ou 2. Se for
dim Sa = 2, então Sa é um plano transversal à reta Sb e tomando uma base para este plano,
teremos as duas primeiras colunas da matriz A; concluindo que M é diagonalizável. E, se for
dim Sa = 1, concluı́mos que M não será diagonalizável por falta de autovetores.

4. p(λ) tem três raı́zes reais e iguais, ou uma raiz tripla. Assim, p(λ) = (λ − a)3 . Aqui, temos
1 ≤ dim Sa ≤ 3. Se for o caso de dimensão máxima, isto é, dim Sa = 3, então existe uma base
de Sa , que nesse caso é o próprio R3 , formada por autovetores de M e a matriz
 é diagonalizável

a 0 0
(é um exercı́cio mostrar que isto só ocorre se M já é a matriz diagonal 0 a 0). Nos
0 0 a
outros casos, isto é, se dim Sa for igual a 1 ou 2, então a matriz M não é diagonalizável por
falta de autovetores.

Exercı́cio 20.1 Faça a mesma discussão para matrizes 4 × 4.

20.3 Matrizes simétricas

Matrizes simétricas são sempre diagonalizáveis por uma matriz ortogonal (colunas formam uma
base ortonomral), a exemplo do que já sabemos em R2 .

Teorema 20.4 Se M é uma matriz simétrica n × n, então:


1. M tem n autovalores, contados com multiplicidade.

2. Se a é um autovalor de M , então dim Sa = g(a), ou seja, todos os autoespaços têm dimensão


máxima.

3. A autovalores distintos estão associados autoespaços ortogonais.

Para concluir que existe uma base ortonormal que diagonaliza M , falta apenas mostrar que, dado
um autoespaço Sa , podemos escolher (construir) uma base ortonormal para Sa . Este processo,
chamado ortogonalização de Gram-Schmidt, se faz a partir de projeções ortogonais. Projeções
ortogonais já foram estudadas, sem o uso de fórmulas, quando vimos distâncias e ângulos no
espaço.

Dados dois vetores ~u e ~v em Rn , sendo ~u não nulo, a projeção ortogonal de ~v sobre ~u é o vetor
associado à projeção ortogonal ponto final de ~v na reta gerada por ~u. Lembre-se que desde que
começamos a falar de subespaços, sempre consideramos vetores com ponto inicial na origem. A
projeção de ~v sobre ~u é denotada por P~u (~v ) e é claramente um múltiplo de ~u. Não é difı́cil achar
h~v ,~
ui
qual é o escalar, deduzindo - faça como exercı́cio - que P~u (~v ) = h~
u,~ ui
~u. Outro exercı́cio que o leitor
deve fazer é mostrar que ~v − P~u (~v ) é ortogonal a ~u.

Assim, se um subespaço W de Rn tem dimensão 2, com base, digamos {~v , w},


~ para acharmos uma
base ortonormal, primeiro vamos encontrar uma base ortogonal: decomponha w ~ como soma de dois

117
vetores, w~ =w ~1 + w
~ 2 , sendo w
~ 1 paralelo a ~v e w
~ 2 ortogonal a ~v . O vetor w
~ 1 , isto é, a componente de
w
~ paralela a ~v é inútil como gerador de W, pois ~v já gera essa direção. Assim, substituı́mos a base
{~v , w}
~ pela base ortogonal {~v , w ~ 2 }. Em termos da projeção ortogonal, basta tomar w ~ 1 = P~v (w)
~ e
w
~2 = w ~ − P~v (w).
~ Como queremos uma base ortonormal, ainda falta normalizar, n isto
o é, dividir pela
~v w
~2
norma: a base procurada, formada por vetores ortogonais e unitários, é k~vk , kw~ 2 k .

Em geral, se dim W = k, dada uma base {~v1 , . . . , ~vk }, para conseguir uma base ortogonal, ortogona-
lize, como acima, o conjunto {~v1 , ~v2 } projetando ~v2 sobre ~v1 e descartando a componente paralela,
obtendo {~v1 , w
~ 2 }. Agora tome ~v3 , projete-o ortogonalmente sobre o plano gerado por ~v1 e w ~ 2 ; isto se
faz considerando a soma das projeções em cada uma das direções: P[~v1 ,w~ 2 ] (~v3 ) = P~v1 (~v3 ) + Pw~ 2 (~v3 ).
Descarte a componente de ~v3 nese plano, tomando w ~ 3 = ~v3 − P[~v1 ,w~ 2 ] (~v3 ). Proceda indutivamente,
projetando ~v4 no espaço gerado por ~v1 , w ~2 e w ~ 3 e tomando apenas a componente ortogonal w ~ 4 e as-
n
sim por diante. Como a dimensão de W é finita (afinal é um subespaço de R ), em algum momento
chegaremos a uma base ortogonal {~v1 , w ~ 2, · · · , w
~ k } que, normalizada, será uma base ortonormal.

Assim, para cada matriz simétrica M , existem matrizes diagonal D e ortogonal A tais que M =
ADA−1 .

20.4 Exemplos e exercı́cios

O enunciado é sempre o mesmo: “verifique se a seguinte matriz (M ) é diagonalizável. Em caso


negativo, justifique. Em caso afirmativo, determine matrizes D diagonal e A invertı́vel tais que
M = ADA−1 . Se M for simétrica, A deve ser ortogonal.” Claro, chegue ao final dos cálculos
apenas se sentir necessidade.

1. As matrizes dos exercı́cios 6.1.1, 6.1.2, 6.1.3 e 6.1.4 e 6.2.1 do livro (online) do Reginaldo.

2. Faça, se quiser, os exercı́cios teóricos 6.1.14, 6.1.15 e 6.1.19 do livro (online) do Reginaldo

118

Você também pode gostar