Apostila Seme Gabara

Geometria Analı́tica
Seme Gebara Neto

21 de agosto de 2018
Sumário
1 Equações lineares em uma incógnita, a reta real 2
2 Equações lineares em duas incógnitas, plano cartesiano 4
3 Vetores no plano 8
4 Coordenadas de vetores 11
5 Produto escalar 14
6 Retas em R2 17
7 Sistemas de duas equações e duas incógnitas, inversão de matrizes 2 × 2 22
8 Multiplicação de matrizes como movimentos do plano 29
9 Formas quadáticas em R2 33
10 Cônicas 34
11 Mudanças de coordenadas no plano 39
12 Mudança de base 42
13 Eixos de simetria de ax2 + bxy + cy 2 = d 44

13.1 Autovetores e autovalores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
13.2 Matrizes ortogonais 2x2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
13.3 Diagonalização de matrizes simétricas 2 × 2 . . . . . . . . . . . . . . . . . . . . . . 50
14 Mudança de origem 53
15 Equações quadráticas em sua forma geral 55
16 Mais exercı́cios 57
1
17 Geometria Analı́tica Espacial 60
17.1 Alguns fatos básicos de Geometria Euclidiana espacial . . . . . . . . . . . . . . . . . 60
17.2 Pontos e vetores em R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
17.3 Retas e planos no espaço . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
17.4 Produto vetorial e determinantes 3x3 . . . . . . . . . . . . . . . . . . . . . . . . . . 70
17.5 Retas reversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
17.6 Distâncias e Ângulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
17.7 Mais alguns exercı́cios sobre retas e planos no espaço . . . . . . . . . . . . . . . . . 79
18 Sistemas de Equações Lineares 80

18.1 Definições e exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
18.2 Possibilidades qualitativas de soluções de sistemas . . . . . . . . . . . . . . . . . . . 83
18.3 Escalonamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
18.4 A forma escalonada e reduzida de uma matriz . . . . . . . . . . . . . . . . . . . . . 85
18.5 Determinantes e escalonamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
18.6 Inversão de matrizes e escalonamento . . . . . . . . . . . . . . . . . . . . . . . . . . 89
18.7 Independência Linear em R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
18.8 O teorema de caracterização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
19 Mais exercı́cios 93
20 Espaços Euclidianos Rn 95
n
20.1 Independência Linear em R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
20.2 Subespaços de Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
20.3 Bases e dimensão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
21 Diagonalização de Matrizes 100

21.1 Mudanças de base em Rn e definições básicas . . . . . . . . . . . . . . . . . . . . . . 100
21.2 Matrizes diagonalizáveis e não diagonalizáveis . . . . . . . . . . . . . . . . . . . . . 102
21.3 Matrizes simétricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
21.4 Exemplos e exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
1 Equações lineares em uma incógnita, a reta real
A forma geral de uma equação linear com uma incógnita real é
ax = b,
onde a e b são números reais dados. O termo linear significa que trata-se de uma equação polinomial
de grau 1.
O conjunto solução da equação, que nesse texto será sempre denotado por S, é um subconjunto de
R e a análise, já suficientemente conhecida, é a seguinte:
2
• Se a 6= 0, então existe uma única solução x = ab . Em outras palavras, S é o conjunto unitário
S = { ab }.
• Se a = 0, então existem duas situações:
– se b 6= 0, então não existe solução (ou seja, S = ∅),

– se b = 0, então qualquer número real é solução (ou seja, S = R).
Já conhecemos um modo de se representar geometricamente os números reais através de um sistema

de coordenadas para uma reta. Dada uma reta r, escolhemos dois de seus pontos para representar
os números 0 e 1, digamos que o ponto A represente o 0 e o B represente o 1.
Isto confere à reta r uma origem, uma unidade de medida (o comprimento do segmento AB) e um
sentido positivo (de A para B). Comparando com o segmento unitário AB, vamos identificar os
pontos da reta com os números reais.
Dado um ponto P ∈ r, denote por k AP k o comprimento de AP . Existe um único número real t,

de modo que |t| =k AP k e que “compara” os sentidos dos segmentos orientados AP e AB, sendo
t positivo caso os segmentos orientados AP e AB tenham o mesmo sentido e negativo caso tenham
sentidos opostos. Se P = A, então claramente t = 0.
−→
Um modo de se abreviar isto é usar a notação AB para representar o segmento orientado, que
−→ −→
começa em A e termina em B. Assim, podemos escrever AP = tAB para simbolizar o modo como
o ponto P determina o número real t.
−→
Reciprocamente, dado um número real s, existe um único ponto Q da reta r, de modo que AQ =
−→
sAB, ou seja, o ponto Q está definido pelo fato de k AQ k= |s| k AB k o sinal de s determina se
os segmentos AQ e AB têm mesmo sentido (caso s > 0) ou sentidos contrários (caso s < 0). Se
s = 0, então claramente Q = A.
Segmentos orientados recebem o nome de vetores e trataremos deles com mais detalhes em breve.
Uma reta munida de um sistema de coordenadas chama-se eixo. Note que para determinar um
sistema de coordenadas numa reta foi necessário escolher dois pontos distintos. Isso garante que as
equações lineares usadas para identificar pontos do eixo com números reais tenham solução única.
Na ilustração abaixo, o número α ∈ R associado a P é positivo e maior que 1, enquanto o ponto Q

representa o valor − 21 .
3
Q A B P
0 1 α
− 21
2 Equações lineares em duas incógnitas, plano cartesiano
Como já foi dito, o termo linear está reservado para equações polinomiais de grau 1 nas incógnitas,
√
que agora serão x e y. Desse modo não há termos tipo cos x, y, x1 e nem mesmo xy, já que este
produto tem grau 2. Assim, a forma geral de uma equação linear com duas incógnitas é
ax + by = c,
onde a, b e c são números reais dados.
O conjunto solução S é agora um conjunto de pares ordenados de números reais. Por exemplo,
para a equação 3x − y = 1, temos (1, 2) ∈ S, enquanto (0, 0) 6∈ S. Já para uma equação homogênea,
isto é, quando c = 0, o par ordenado (0, 0) sempre faz parte da solução.
Todos conhecemos uma maneira geométrica de representar o conjunto de todos os pares ordenados
de números reais; isto é feito pelo plano cartesiano, isto é, a escolha de um sistema de coordenadas
4
para o plano que o torna o conhecido “plano xy”. Este sistema consiste de dois eixos perpendi-
culares, ambos com origem no ponto de interseção, com mesma unidade de medida e ordenados
de maneira que, quando percorremos o ângulo reto do sentido positivo do primeiro eixo (o eixo x)
para o sentido positivo do segundo (o eixo y), o giro é anti-horário. O plano cartesiano, ou plano
xy, ou plano coordenado, será denotado por R2 .
A convenção é que o sentido anti-horário seja chamado de sentido positivo de percurso do cı́rculo
(dos ângulos).
A associação de pontos do plano cartesiano e pares ordenados de números reais é imediata e vamos
usar o sinal de igualdade entre pontos e pares ordenados identificados.
Nem todas as equações lineares da forma ax+by = c devem num primeiro momento ser interpretadas
geometricamente, como por exemplo, se queremos saber quantas moedas de 5 centavos e quantas
moedas de 25 centavos devemos juntar para chegar a R$ 5,00. É claro que este problema tem várias
soluções, mas uma interpretação geométrica para ele poderia soar artificial.
No entanto, de maneira geral, se x e y podem ser números reais quaisquer, o conujunto solução
de ax + by = c pode ser visto como um subconjunto de R2 . Do ensino médio sabemos que uma
equação desse tipo representa uma reta.
De fato, voltando ao exemplo 3x − y = 1, já vimos que A = (1, 2) ∈ S e é fácil achar mais uma
solução, por exemplo, B = (0, −1). Afirmamos que o conjunto S é exatamente a reta r que passa
por (1, 2) e (0, −1). Para ver isso, Seja P = (a, b) um ponto qualquer do plano. Desenhando o
ponto P sobre a reta r e traçando paralelas aos eixos coordenados (projetando os pontos P e A no
eixo x), obtemos os pontos D e E. A conclusão, da semelhança entre os triângulos BAE e BP D,
a b+1
é: P ∈ r ⇔ = ⇔ 3a − b = 1 ⇔ P ∈ S.
1 3
5
6
4
P
A
2
−4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
B E D
−1
−2
−3
−4
−5
−6
−7
−8
Uma maneira de se enxergar a equação 3x − y = 1 é como um produto de uma matriz linha 1 × 2

por uma matriz coluna 2 × 1

x
3 −1 = 1.
y
Em tempo: o produto de uma matriz linha por uma matriz coluna está definido sempre que ambas
têm o mesmo número de entradas
eé a soma dos produtos das entradas correspondentes. Por
x
exemplo, no caso acima, 3 −1 = (3)(x) + (−1)(y) = 3x − y e no caso geral de matrizes de
y
c
duas entradas tem-se a b = ac + bd. Um exemplo envolvendo matrizes de tês entradas é
  d
2
1 3 4  0  = (1)(2) + (3)(0) + (4)(−1) = −2 e assim por diante.
−1

Exercı́cio. A matriz 3 −1 , chamada matriz dos coeficientes, tem um significado geométrico:
6
−→
desenhando o segmento que liga a origem ao ponto F = (3, −1), demonstre que o ângulo entre OF
e a reta r é o que parece, ou seja, é reto.
6
A
2
−4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
B F
−1
−2
−3
−4
−5
−6
−7
−8

x
A análise completa da equação a b = c é a seguinte:
y

• Se a b 6= 0 0 , S é uma reta em R2 .

• Se a b = 0 0 , então S = ∅ quando c 6= 0 e S = R2 quando c = 0.
Exercı́cios.
1. No exemplo do texto, ambos os coeficientes, de x e de y na equação eram não nulos. Qual é

a reta solução quando apenas um deles é nulo?
2. Determine t ∈ R tal que o ponto (3t, 2 − t) esteja no conjunto solução de x − y = 0.
3. O ponto (3, −2) pertence à solução da equação 4x + 2y = 1? Por quê?
7
3 Vetores no plano
O conceito de vetor importante para matemática, fı́sica e aplicações e que nos ajudará a descrever
objetos geométricos no plano cartesiano. O que vamos fazer antes de pensarmos em coordenadas no
plano é intrı́nseco, e ocorre exatamente da mesma maneira para vetores no espaço tridimensional.
Certas grandezas, como força e velocidade, são chamadas vetoriais, por dependerem apenas de
intensidade, direção e sentido. Chamaremos de vetores segmentos orientados do plano, carac-
−→
terizados por terem um ponto inicial A e um ponto final B, e escreveremos AB.
−→
O comprimento do segmento, também chamado módulo ou norma do vetor, denotado por k AB k,
representa a intensidade da grandeza vetorial. Os pontos A e B, quando distintos, determinam
uma reta, que por sua vez representa a direção da grandeza vetorial envolvida. Quando A = B,
−→
AB é chamado de vetor nulo e não há como definir a direção associada (o que não tem importância
nenhuma: é o mesmo que dizer que todas as direções estão associadas ao vetor nulo). Há dois
−→ −→
sentidos possı́veis, AB e BA; quando se trata do vetor nulo, não há como definir o sentido.
O conceito de direção merece algum comentário. Uma reta define uma direção, mas uma direção
não determina uma reta. Uma direção é apenas representada por uma reta, e por qualquer outra
paralela a ela. Assim, quando falamos em direção, falamos do conjunto de (todas as) retas paralelas
a uma reta dada. Para determinar uma reta, além de uma direção, é necessário localizá-la, indicando
um ponto por onde ela passe.
−→
Por definição, dois vetores são iguais quando têm mesmos módulo, direção e sentido, isto é, AB =
−−→
CD se as retas AB e CD são paralelas, os segmentos AB e CD são congruentes e o sentido de
percurso é o mesmo. Em outras palavras, se os pontos A, B, C e D não estão alinhados, então
ABDC é um paralelogramo e o sentido dos lados opostos AB e CD é o mesmo.
Assim, um vetor V é uma coleção de segmentos orientados, todos paralelos, de comprimentos iguais
e com mesmo sentido. Um vetor V pode ser representado por qualquer um desses segmentos
orientados.
Existem operações que podem ser definidas com vetores, baseadas em observações do comporta-
mento de grandezas vetoriais, como força, por exemplo (lembre-se do conceito de força resultante,
que nada mais é do que a adição vetorial das forças envolvidas).
Definimos a adição ou soma de dois vetores V e W da seguinte maneira. Escolha um ponto

qualquer do plano, chame-o de A. O único representante de V com ponto inicial A, digamos
−→ −−→
V = AB, determina o ponto B. O representante W = BC com ponto inicial B determina o ponto
−→
C. Então V + W = AC.
8
B
V W
C
A
V+W
Observações.
1. Esta definição não depende do ponto A escolhido: tivéssemos escolhido outro ponto A0 ,
−−→ −−→
os pontos B 0 e C 0 estariam determinados por V = A0 B 0 e W = B 0 C 0 e o segmento A0 C 0
−−→ −→
resultaria com mesmos módulo, direção e sentido de AC, ou seja, A0 C 0 = AC (congruência
de triângulos).
→
− →
− →
−
2. O vetor nulo, denotado por 0 , é tal que V + 0 = 0 + V = V para todo vetor V .
3. Se V e W são paralelos, então V + W ainda é paralelo a ambos, pois na escolha de represen-

tantes terı́amos os pontos A, B e C alinhados (desenhe).
Se V e W são ambos não nulos e não são paralelos, pode ser aplicada a regra do paralelogramo:
escolha um ponto A do plano e tome os representantes para V e W começando de A, digamos
−→ −→
V = AB e W = AC. Nesse caso os vetores V e W (ou os pontos A, B e C) determinam um
9
paralelogramo com quarto vértice D; chamamos ABDC de paralelogramo gerado por V e W .
−−→
Nesse caso, a adição V + W está representada pela diagonal AD. Isto é devido ao fato de que os
−→ −−→
lados opostos AC e BD do paralelogramos representam o mesmo vetor W .
A partir da definição (ou da regra do paralelogramo, quando aplicável) vemos imediatamente que
V + W = W + V quaiquer que sejam os vetores V e W .
Definimos agora a multiplicação de vetor por escalar. A palavra “escalar” quer dizer número real.
Uma grandeza escalar é caracterizada por apenas um número real. A massa, por exemplo, medida
em quilogramas.
Sejam V um vetor e α ∈ R um escalar. O vetor αV está definido por:

→
− →
−
• k αV k= |α| k V k. Isto significa em particular que se α = 0 ou se V = 0 , então αV = 0 .
• αV tem a mesma direção de V .
• αV tem o mesmo sentido de V quando α > 0 e sentido oposto a V quando α < 0.
A C F H (1/2)V
-V G
B E
V
2V D
10
As oprerações de adição de vetores e multiplicação de vetor por escalar são chamadas operações
lineares, e logo veremos o porquê deste nome. Uma boa ilustração para o caso de adição de vetores
é um diagrama de forças atuando numa massa num plano inclinado. Faça alguns desenhos e pense
no assunto, a força resultante é o resultado da soma vetorial das forças envolvidas.
4 Coordenadas de vetores
O que fizemos até aqui sobre vetores não depende de um sistema de coordenadas, mas quando
queremos tratar algebricamente com tais objetos, vamos precisar. Considere um sistema de co-
ordenadas cartesianas para o plano e seja O a origem de R2 (O = (0, 0)). Dado um vetor V no
−→
plano, olhe para seu representante que tem ponto inicial na origem, digamos que seja V = OP . As
coordenadas de V são definidas como as coordenadas de seu ponto final P . Isto nos diz que ambos
os conjuntos { vetores no plano } e { pontos no plano } são representados pelo mesmo conjunto: o
conjunto de pares ordenados de números reais.
Podemos representar o conjunto de pares ordenados de números reais tanto por matrizes linha
x
{(x, y)|x, y ∈ R} (podendo ou não usar a vı́rgula) como por matrizes coluna |x, y ∈ R .
y
−→
Exemplo. Suponha que W = AB, com A = (3, −1) e B = (1, 5). Quais são as coordenadas de
W ? Isto se resolve com um desenho e com a definição de adição de vetores.
11
P
6
B
5
−4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
A
−1
−2
−3
−4
−5
−6
−7
−8
−→
Sabemos que as coordenadas de W são as coordenadas do ponto P quando W = OP . Olhando para
a figura, não é difı́cil concluir, já que as coordenadas são todas números inteiros, que W = (−2, 6).
−−→ −→ −−→ −→
De maneira geral, temos, pela definição de adição, OB = OA + W , ou seja, W = OB − OA.
−→ −−→
Como as coordenadas dos vetores OA e OB coincidem com as coordenadas dos pontos A e B
respectivamente, chegamos a

−→ 1 3 −2
W = AB = − =
5 −1 6
−→
Não havendo risco de confusão entre pontos√ e vetores, podemos resumir isso como AB = B √ − A.
Por exemplo, o vetor que liga o ponto (π, 2) ao ponto (1, 2) tem coordenadas (1 − π, 2 − 2).

1
Exemplo. Se V = é um vetor no plano, as coordenadas de (−2)V são −2, 10 . De fato, o
−5
segmento orientado que liga a origem ao ponto −2, 10 tem mesma direção, o dobro do tamanho
1
e sentido contrário em relação ao segmento orientado que liga a origem ao ponto .
−5
12
Observação. É importante notar que dois vetores são paralelos se e somente se um é múltiplo
escalar do outro. Em particular o vetor nulo é paralelo a qualquer outro.
Usamos aqui operações com matrizes que ainda não foram definidas nesse texto: chamadas também
de operações lineares, a adição de matrizes está definida para matrizes M e N de mesmo ta-
manho e se faz entrada a entrada, resultando portanto numa matriz de mesmo tamanho. A
multiplicação de matrizes por escalar está definida para um número real α e para uma matriz
M , multiplicando-se cada entrada de M por α e tem como resultado uma matriz de mesmo
tamanho que M . Para maiores detalhes, veja por exemplo o livro do professor Dan Avritzer,
Geometria Analı́tica e Álgebra Linear - Uma Visão Geométrica, tomos I e II (disponı́veis em
http://www.mat.ufmg.br/ead/paginas/biblio-livros.htm).
A observação importante aqui é que, como vimos, as operações lineares com vetores são compatı́veis
com as operações lineares das matrizes que os representam num sistema de coordenadas.
Exercı́cios.
1. Quais são as coordenadas do ponto final do representante do vetor V = (3, 4) que tem ponto
inicial A = (3, 1)?
2. Quais são as coordenadas do ponto médio do segmento com extremos (1, 3) e (−4, 0)?
3. Dadas as coordenadas de dois vértices e do baricentro (encontro das medianas) de um
triângulo, é possı́vel determinar as coordenadas do terceiro vértice? Como?

1 4
4. Dados os vetores V = eW = , calcule as coordenadas de U = 3V − 2W .
2 2
5. Faça desenhos e conclua que, dados dois vetores V e W não nulos e não paralelos no plano,
eles geram um paralelogramo com diagonais V + W e V − W . Qual é o sendido de W − V ?
6. Sejam A e B matrizes de mesmo tamanho e α, β ∈ R. Mostre que
(a) (α + β)A = αA + βA.
(b) α(A + B) = αA + αB.
Em particular, estas propriedades distributivas valem para as opreações lineares com vetores.
7. Determine os três vértices de um triângulo sabendo que seus pontos médios são (5, 0), (3, 1)
e (4, 2).
8. Sendo A = (a1 , a2 ) e B = (b1 , b2 ), demonstre que as coordenadas do ponto médio do segmento
a2 + b 2
AB são ( a1 +b
2
1
, ).
2
9. A base média de um triângulo é o segmento que liga os pontos médios dos lados adjascentes
àquele que escolhemos como base. Mostre que a base média de um triângulo é paralela à base
e tem medida igual à metade da medida da base.
10. Considere os pontos A = (4, 6) e B = (6, 5). Determine pontos C sobre o eixo x e D sobre o
eixo y de modo que ABCD seja um paralelogramo contido no primeiro quadrante.
13
5 Produto escalar
O produto escalar tem esse nome porque é um produto entre vetores com resultado numérico.
Uma vez estudado o produto escalar, nosso plano R2 estará munido de uma “régua” e de um
“transferidor”.
Primeiramente, observe que para calcular a distância entre dois pontos no plano podemos usar o
−→
módulo (a norma) do vetor que os liga. Assim, a distância entre A e B é d(A, B) =k AB k. E para
calculá-la usamos o Teorema de Pitágoras: tomamos o ponto P , o ponto final do representante de
−→ −→ −→
AB que começa na origem, isto é, AB = OP . Sabemos calcular, a partir dos pontos A e B as
−→ −→
coordenadas de OP , digamos que OP = (a, b). Por Pitágoras,
−→ √
k AB k 2 = a2 + b2 , ou d(A, B) = a2 + b2 .
6
4
A
3
2
B
O a
−4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
−1
P
b
−2
−3
−4
−5
−6
−7
−8
Já para definir ângulos entre dois vetores não nulos, representamos ambos com mesmo ponto inicial
e escolhemos o menor valor entre os dois ângulos formados. Isto significa que o ângulo entre dois
vetores varia entre 0 e 180o .
14
D E F
B
θ=0
A θ
C
H G I
θ = 180o
→
−
Por convenção, não se define o ângulo entre o vetor nulo 0 e um outro vetor V mas permite-se
que assuma qualquer valor. Isto quer dizer que o vetor nulo é paralelo a qualquer outro vetor (pois
o ângulo pode ser pensado como 0o ), mas também é perpendicular a qualquer outro vetor (pois o
ângulo pode ser pensado como 90o ).
Definimos agora produto escalar entre dois vetores V e W . É chamado de produto escalar não à
toa, já que o resultado é um número real:
V · W =k V kk W k cos θ,
onde θ = ∠(V, W ) é o ângulo entre V e W .
É imediato que V · V =k V k 2
Também é fácil concluir que, sendo V e W não nulos, conhecendo V · W , saberemos calcular
V ·W
cos θ = .
k V kk W k
15
−→
Para calcular V ·W a partir das coordenadas de V e W , considere os pontos A e B tais que V = OA
−−→
e W = OB e olhe para o triângulo OAB (desenhe). O caso em que não há triângulo, isto é, quando
−→ −→
V e W são paralelos, fica de exercı́cio para o leitor. Como AB é tal que V + AB = W , segue
−→
AB = W − V (o que nos dá a interpretação da outra diagonal do paralelogramo gerado por V e
W ).
Usando a Lei dos Cossenos,

−→
k AB k 2 =k V k 2 + k W k 2 − 2 k V kk W k cos θ,
e daı́, usando a definição de produto escalar,

1 −→
V · W = − (k AB k 2 − k V k 2 − k W k 2 ).
2
−→
Sendo A = (a1 , a2 ) e B = (b1 , b2 ), temos AB = (b1 − a1 , b2 − a2 ) e portanto
1
V · W = − (b1 2 − 2a1 b1 + a1 2 + b2 2 − 2a2 b2 + a2 2 − a1 2 − a2 2 − b1 2 − b2 2 ) = a1 b1 + a2 b2 .
2
Assim, temos:

a1 b1 b1
• uma fórmula para V ·W em coordenadas, que pode ser resumida em · = a1 a2 =
a2 b2 b2
a1 b1 + a2 b2 (produto do primeiro como matriz linha pelo segundo como matriz coluna);
• uma régua, pois k V k 2 = V · V ; e

V ·W
• um transferidor, pois cos θ = quando ambos são não nulos.
k V kk W k
Uma consequência imediata é a caracterização de vetores ortogonais: V · W = 0 ⇔ ^(V, W ) = 90o

ou se um deles é nulo. Como dito antes, é convencional dizer que o vetor nulo é ortogonal a qualquer
outro: assim podemos dizer que dois vetores são ortogonais se e somente se o produto escalar entre
eles é zero.
Exercı́cios.
1. Os vetores (1, 3) e (6, −2) são ortogonais.
2. O triângulo formado pelos pontos (0, 5), (2, 2) e (5, 4) é retângulo e isósceles.
3. Dados os pontos A = (3, 2) e B = (1, −3), determine a reta mediatriz de AB exibindo dois
pontos distintos.
4. Dê exemplos de pares de vetores que formem ângulo agudo e obtuso (note que você terá de
controlar o sinal do produto escalar).
16

a1 b
5. Demonstre que a fórmula obtida para o cálculo do produto escalar, · 1 = a1 b1 +a2 b2 ,
a2 b2
a1 b1
vale também para o caso em que os vetores e são paralelos.
a2 b2
6. Verifique que V · W = W · V para quaisquer vetores V e W .
7. Dadas as coordenadas de três vértices A, B e C de um triângulo, diga como obter as coorde-

nadas do pé da altura relativa ao vértice A.
8. Mostre que o produto escalar se comporta bem com as operações lineares, ou seja, que V ·
(αU + βW ) = αV · U + βV · W , para quaisquer vetores V , U e W e escalares α e β.
9. Dados os vetores (3, 4) e (12, 5), determine um vetor que está na direção da bissetriz do ângulo
formado por eles.
10. Determine o ponto C de modo que o triângulo formado por A = (0, 0), B = (1, 2) e C seja
retângulo em A e tenha ângulo de 30o no vértice B.
11. As operações lineares (adição e multiplicação por escalar) definidas geometricamente para
vetores produzem os mesmos resultados quando definidas algebricamente para as matrizes
(linha ou coluna) que representam os vetores.
6 Retas em R2
Voltando ao nosso exemplo inicial, o estudo daequação 3x − y = 1, já vimos que o conjunto solução
3
S é uma reta de R2 e que o vetor N = , cujas coordenadas são os coeficientes de x e y na
−1
equação, é ortogonal (normal) à reta solução. Na verdade isso
valeem geral: se a equação da reta
a
é ax + by = c (o que em particular significa que o vetor N = é não nulo), então o conjunto
b
solução é uma reta r ortogonal a N . Por este motivo, N é chamado de vetor normal a r.
Note que uma reta em R2 está completamente determinada por um ponto e por uma direção
ortogonal. Em outras palavras, dados um ponto A e uma reta s, existe uma única reta r passando
por A e perpendicular a s. Assim, dados um ponto e um vetor normal (não nulo, para que possa
definir a direção ortogonal), determinamos completamente a reta.
No caso do nossoexemplo
inicial, podemos recuperar
a equação a partir
de um ponto qualquer de
3 3 x
r, digamos A = , e do vetor normal N = . Um ponto X = ∈ R2 pertence à reta r
8 −1 y
−−→
se e somente se os vetores AX e N são ortogonais.
17
A
8
N
X
2
−4 −2 0 2 4 6 8 10 12 1
−2
−4
−6
−8
−10
−12
−14
18
Algebricamente, temos
−−→
AX · N = 0
x 3
− ·N = 0
y 8
x−3 3
· = 0
y−8 −1
3x − 9 − y + 8 = 0
3x − y = 1.
Esta é chamada a equação geral da reta r; a notação muitas vezes é (no caso geral) r : ax + by = c.
Exercı́cio. Escolha outro ponto pertencente a r e outro vetor normal N2 . Observe que N2 é
obrigatoriamente um múltiplo escalar não nulo de N . Obtenha a equação geral da reta r e note
que, a menos de simplificação (isto é, a menos de multiplicação por um escalar não nulo), a equação
geral de uma reta é única.
Por outro lado, ainda no nosso exemplo 3x − y = 1 é importante descrever o conjunto solução da
equação explicitamente. Isso se faz resolvendo a equação em uma das incógnitas em função da
outra. Nesse caso, é mais fácil escrever y = 3x − 1 e a solução é o conjunto de pares ordenados
do plano nos quais a segunda coordenada é o triplo da primeira menos uma unidade. A variável
livre, no nosso caso x, é chamada de parâmetro e o conjunto solução tem a seguinte representação
(chamada paramétrica):

x
S = |x ∈ R
3x − 1

x 0
= + |x ∈ R
3x −1

0 1
= +x |x ∈ R
−1 3
0 1
= +t |t ∈ R .
−1 3
Note que na última igualdade a única modificação foi o nome do parâmetro, o que foi feito de
propósito, para enfatizar que ali x ou t tem um significado diferente de incógnita, mas sim de
cumprir a instrução de percorrer todo o conjunto dos números reais. Cada valor de x define um
ponto da reta; reciprocamente, cada ponto da reta está representado por um valor de x.
Por exemplo se x = 0, o ponto é o (0, −1). Para x = −3, o ponto é o (−3, −10). Para saber se o
ponto (1, 1) está ou não na reta, temos que resolver o sistema (de duas equações e uma incógnita)
(
x=1
3x − 1 = 1.
Não é difı́cil ver que este sistema não tem solução, logo (1, 1) 6∈ r.
19
A representação paramétrica de uma reta é muitas vezes chamada de equação paramétrica da reta
pelo fato de que

x x 0 1
∈r⇔ = +t |t ∈ R.
y y −1 3
Podemos simplesmente escrever r : A + tV | t ∈ R, onde A é um ponto por onde a reta passa, V é

um vetor (sempre não nulo) que determina a direção de r, e por isso chamado de vetor diretor de
r, e a adição deve ser vista em coordenadas.
Então, há dois modos de se determinar geometricamente uma reta no plano: ou por um de seus
pontos e um vetor diretor não nulo (o que é equivalente a dois pontos distintos da reta), ou por
um de seus pontos e um vetor normal não nulo. Traduzindo algebricamente, o primeiro modo dá
origem à representação paramétrica da reta e o segundo à sua equação geral.
Enquanto a equação geral de uma reta, como já vimos, é única, a representação paramétrica não.
Se, no nosso velho exemplo da reta de equação 3x − y = 1 tomamos um ponto diferente do (3, 8),
digamos B = (1, 2) e outro vetor diretor não nulo (que obrigatoriamente será um múltiplo escalar
de V ), digamos W = (2, 6), então

1 2
r: +t |t ∈ R.
2 6
Observação. Continuamos a chamar o parâmetro de t, mas note que o ponto associado a t = 0

na primeira representação é o (0, −1) e o ponto associado a t = 0 na segunda representação é o
(1, 2). O que fizemos foi na verdade dar dois sistemas de coordenadas diferentes para r; numa
parametrização, o ponto escolhido será a “origem” e o vetor diretor será o “segmento unitário que
aponta para o sentido positivo a partir da origem”. Em outras palavras, são dois eixos distintos,
embora a reta seja a mesma. A figura 1 ilustra duas parametrizações diferentes para r: r =
−→ −−→
{A + tAB|t ∈ R} = {C + λCD|λ ∈ R}.
Exercı́cios.
1. Considere os pontos A = (3/2, 1), B = (4, 2) e C = (5, 3), determine a equação geral e a
−−→
equação paramétrica das retas r, que passa por A e B, s, que passa por A e é paralela a BC
−−→
e u, que passa por A e tem vetor normal BC.
2. (a) Dê exemplo de uma equação geral de uma reta r que não seja nem vertical nem horizontal.
(b) Ache uma representação paramétrica da reta r que você escolheu no exercı́cio 1.
(c) Troque de vetor diretor na representação paramétrica do item (b) de modo que a primeira

1
coordenada do novo vetor diretor W seja 1, isto é, escreva W da forma W = .
a
Note que, neste caso, a segunda coordenada deste vetor diretor (= a) é exatamente o
coeficiente angular da reta.
20
6
5
B
4
3 −→
V = AB
2 A
C
1
−4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
−1
−−→−2
W = CD
−3
D
−4
−5
−6
−7
Figura 1: Duas parametrizações diferentes para r
21

−a
(d) Mostre que U = é ortogonal a W . Multiplicando U por −1/a, obtemos Z =
1
1
, ainda ortogonal a W . Conclua que Z é vetor diretor de qualquer reta perpen-
−1/a
1
dicular a r, todas com coeficiente angular − , ou seja, retas perpendiculares no plano
a
têm coeficientes angulares “inversos opostos”, como já sabı́amos.
3. Como proceder para, a partir da equação paramétrica de uma reta chegar à sua equação
geral?
4. Escreva um roteiro para, dado um triângulo ABC, obter a medida da altura relativa ao vértice
A.
5. Determine b ∈ R tal que a reta de equação 3x + by = 12 intercepte os eixos x e y nos pontos
A e B e a distância entre A e B seja 5.
6. Determine todas as retas do plano que são perpendiculares à reta 3x + 4y + 5 = 0.
7. Determine o pé da perpendicular desde o ponto P = (4, 0) até a reta r : 2x−5 = 7. [sugestão.
Considere a forma paramétrica da reta que passa por P e é perpendicular a r, depois calcule
a interseção desta reta com r.]
8. Determine as coordenadas do ponto P que está sobre o eixo x e é equidistante de (3, −1) e
(1, −2).
9. Dados três pontos A, B e C, exiba um critério para sabermos se são ou não colineares (isto
é, se pertencem ou não à mesma reta).
10. O ângulo entre duas retas é definido como o menor ângulo formado por elas, com a convenção
que se têm a mesma direção (paralelas ou iguais) o ângulo é zero. Assim, o ângulo entre duas
retas no plano é sempre menor ou igual a um ângulo reto. Dadas as retas r : A + tV, t ∈ R
e s : B + λW, λ ∈ R, qual é o ângulo entre elas? Note que sua resposta estará em função de
V e W.
7 Sistemas de duas equações e duas incógnitas, inversão de

matrizes 2 × 2
Interpretamos a solução de uma equação linear em duas incógnitas como uma reta em R2 . Então,
no caso de um sistema de duas equações em duas incógnitas, sua solução representará a interseção
entre duas retas em R2 . Como já sabemos, dadas duas retas no plano, ou as retas são iguais,
ou são paralelas, ou são concorrentes. Em termos do sistema, estas possibilidades significam,
respectivamente, que o conjunto solução S é um conjunto infinito (a própria reta), ou S = ∅ (as
retas não se interceptam), ou S é um conjunto unitário (o ponto de interseção).
Um exemplo para o primeiro caso é o sistema

(
3x − y = 1
,
6x − 2y = 2
22
pois ambas as equações representam a mesma reta.
Um exemplo para o segundo caso é o sistema

(
3x − y = 1
,
3x − y = 0
pois as retas têm mesmo vetor normal, logo têm mesma direção e a origem, que é um ponto da
segunda reta, não pertence à primeira, logo as retas são paralelas.
Um exemplo para o terceiro caso é (

3x − y = 1
,
x − 2y = −3
já que os vetores normais (3, −1) e (1, −2) não são múltiplos, logo não são paralelos, logo as retas
não são paralelas, portanto se encontram num só ponto. Aliás, a solução é o ponto (1, 2), facilmente
calculável por “soma” ou “substituição”.
Um outro modo de se resolver o sistema é por escalonamento. Em primeiro lugar, observe que a
solução do sistema não muda se uma ou mais das seguintes operações é feita sobre alguma linha:
• L1 ↔ L2 (troca de posição das linhas)
• Li ← αLi , α 6= 0 (a i-ésima linha multiplicada por uma constante não nula)
• Li ← Li + αLj (a i-ésima linha é substituı́da por ela mesma mais um múltiplo escalar da
outra)
Estas operações, chamadas operações elemetares sobre linhas, não se restringem a sistemas 2 × 2,
vamos ver ainda como funciona o caso geral. Assim, existe uma técnica de, passo a passo, trocarmos
nosso sistema por um equivalente, de modo que a solução fique preservada.
Uma notação que abreviará muito nosso trabalho é a notação matricial. Usaremos o produto de
matrizes. Se você não conhece ou não lembra, está definido um pouco mais abaixo.
São formas equivalentes de se apresentar um sistema 2 × 2:

(
ax + by = c a b x c
ou = .
dx + ey = f d e y f
Este
sistema
pode ser representado
ainda por sua matriz aumentada, isto é, a matriz dos coeficientes
a b c
“aumentada” do vetor :
d e f

a b c
,
d e f
e as operações elementares sobre as linhas do sistema podem ser feitas diretamente nas linhas desta
matriz. Para ver isso, vamos voltar aos exemplos acima:
23
(
3x − y = 1 3 −1 1
1. A matriz aumentada de é . Ao fazermos L2 ← L2 − 2L1 ficamos
6x − 2y = 2 6 −2 2

3 −1 1
com , mostrando que a informação contida na segunda linha era supérflua; a
0 0 0
solução deste sistema é a nossa famosa reta r.
(
3x − y = 1 3 −1 1
2. Já para o sistema , a matriz aumentada é ; ao fazermos L2 ←
3x − y = 0 3 −1 0

3 −1 1
L2 − L1 , chegamos a . A segunda linha agora significa 0x + 0y = −1, o que é
0 0 −1
impossı́vel, logo esse sistema não tem solução.
(
3x − y = 1
3. Olhando agora para o sistema , temos:
x − 2y = −3

3 −1 1 L1 ↔L2 1 −2 −3 L2 ←L2 −3L−1 1 −2 −3 L2 ←(1/5)L2 1 −2 −3
−−−−→ −−−−−−−−→ −−−−−−−→ ,
1 −2 −3 3 −1 1 0 5 10 0 1 2
o que já nos diz, olhando para a segunda equação, que y = 2. Poderı́amos agora substituir
este valor na primeira equação e calcular diretamente o valor de x, mas também podemos
continuar escalonando:

1 0 1
L1 ←L1 +2L2
−−−−−−−→ .
0 1 2
(
x=1
A última matriz aumentada é equivalente ao sistema , cuja solução é a interseção
y=2
da reta horizontal y = 2 com a reta vertical x = 1, logo é o par ordenado (1, 2).
Vamos lembrar da definição de multiplicação de matrizes:
• primeiro,
  lembre-se do produto de uma “linha” A = (a1 , a2 , · · · , an ) por uma “coluna” B =
b1
 b2 
 .. , ambas com o mesmo número de entradas. Então
 
.
bn
AB = a1 b1 + a2 b2 + · · · + an bn ∈ R.
• se A é uma matriz m × n e B é uma matriz n × p, então o produto AB está definido (a

condição de compatibilidade é que o número de colunas de A seja igual ao número de linhas
de B, ou, em outras palavras, o número de entradas das linhas de A e das colunas de B seja o
mesmo), o resultado é uma matriz C = (cij )m×p na qual a entrada ij é o produto da i-ésima
linha de A pela j-ésima coluna de B.
24
Exercı́cios.
1. Calcule alguns produtos de matrizes de tamanho relativamente pequeno, para se familiarizar

com a regra.
2. Mostre que o produto de matrizes é distribuitivo. Sugestão: faça exemplos com matrizes
pequenas antes.
3. Mostre que o produto de matrizes é associativo. Sugestão: faça exemplos com matrizes
pequenas antes.
4. Dê exemplos de matrizes A e B tais que os produtos AB e BA estejam definidos, mas

AB 6= BA. Ou seja, o produto de matrizes não é comutativo.
5. A matriz identidade In é a matriz quadrada de ordem n (isto é, n × n) na qual as entradas

da diagonal principal são “1” e todas as outras nulas, isto é,
 
1 0 ··· 0
0 1 · · · 0
In =  .. .
 
. . . . .. 
.
0 0 ··· 1
Mostre que In é o elemento neutro da multiplicação de matrizes, ou seja, AIn = A e In B = B

para quaisquer matrizes A e B para as quais estes produtos estejam definidos.
Voltando um pouco à equação linear de uma incógnita ax = b, se a 6= 0, podemos resolvê-la

“isolando” x, multiplcando ambos os lados pelo inverso de a.
Dado que o produto de duas matrizes quadradas n × n é ainda uma matriz quadrada de ordem
n, uma pergunta natural é se um sistema associado a uma matriz quadrada pode ser resolvido
de forma semelhante. Por exemplo, já vimos que sistema 2 ×2,em sua forma matricial pode ser
x
escrito AX = B, onde A2×2 é a matriz dos coeficientes, X = é o vetor das incógnitas e B2×1
y
é o vetor constante. A pergunta acima pode ser reformulada para: existe uma matriz M2×2 tal que
M A = I2 ? Ou ainda, existe uma matriz inversa para A? Em caso afirmativo, multiplicando-se
ambos os lados da equação por M , terı́amos I2 X = M B e, como I2 X = X, terı́amos conseguido
“isolar” o vetor das incógnitas e resolver o sistema.
Para procurar as condições que uma matriz deve satisfazer para que sua inversa exista, vamos antes
definir precisamente o conceito.
Definição. Dada uma matriz quadrada A, dizemos que ela é invertı́vel se existe uma matriz
quadrada de mesma ordem M tal que M A = AM = I, onde I é a matriz identidade da mesma
ordem de A. Nesse caso, M será chamada de inversa de A. Se A é invertı́vel, em geral denotamos
sua inversa por A−1 . Se A não é invertı́vel, então é chamada de singular
Antes de fazermos qualquer conta, vamos ver que, se a inversa existe, então ela é única. Para esta
demonstração, suponha que M e N são ambas inversas para a matriz A. Então,
25
M = IM = (N A)M = N (AM ) = N I = N
ou seja, M = N e a inversa, quando existe, é de fato única.

a b x z
Dada uma matriz A = , chame de M = a “candidata” a inversa de A. Sabemos
c d y w
que M deve satisfazer AM = I, isto é,

a b x z 1 0
= .
c d y w 0 1
Esta equação pode ser “dividida” em duas, comparando as colunas das matrizes de ambos os lados
da equação. Assim, o que procuramos é resolver simultaneamente as equações

a b x 1 a b z 0
= e = ,
c d y 0 c d w 1
ou seja, dois sistemas lineares de duas equações e duas incógnitas com mesma matriz dos coeficientes.
Ora, para isso, podemos fazer um escalonamento simultâneo, escalonando a matriz dos coeficientes
aumentada das duas colunas constantes:

a b | 1 0
.
c d | 0 1
Em outras palavras, para encontrar a inversa de A, devemos escalonar a matriz A aumentada da

identidade.
Quanto às condições para a existência da inversa, observe primeiramente que não pode ser a = c = 0.
Pois, caso isso aconteça, então a equação matricial AM = I, de incógnita M , tem solução vazia
(verifique). Assim, devemos ter a 6= 0 ou c 6= 0.
Então, suponha que a 6= 0 e vamos ao escalonamento:
a b 1 0 L1 ←(1/a)L1 1 ab a1 0 L2 ←L2 −cL1

−−−−−−−→ −−−−−−−→
c d 0 1 c d 0 1
b 1 b 1

1 a a
0 1 a a
0
= .
0 d − bca − ac 1 0 ad−bc
a
− ac 1
Note agora que se ad − bc = det(A) = 0, então o segundo sistema é impossı́vel, indicando a não
existência de A−1 . Vamos supor então que det(A) 6= 0 e vamos continuar o escalonamento:
a
b 1

L2 ← ad−bc L2 1 a 0
−−−−−−−→ a
c a
0 1 − ad−bc ad−bc
Para o último passo do escalonamento,
26
d −b

L1 ←L1 − ab L1
1 0
−−−−−−−→ ac−bd ad−bc .
−c a
0 1 ad−bc ad−bc

x z 1 d −b
Isso significa que a solução dos nossos sistemas simultâneos é = .
y w ad − bc −c a
Exercı́cio. Começamos supondo a 6= 0, mas poderı́amos ter começado supondo c 6= 0. Faça as

contas e verifique que, nesse caso, det(A) 6= 0 também seria uma condição necessária para garantir
solução única para os sistemas e a solução seria a mesma. Observe que a condição ad − bc 6= 0
implica a 6= 0 ou c 6= 0; fossem ambos nulos o determinante também seria. Portanto, a condição
det(A) 6= 0 é necessária e suficiente para que os sistemas acimas possuam única solução.
Então, encontramos a inversa de A? Formalmente ainda não: o que encontramos foi uma matriz
M tal que AM = I, mas a definição de matriz inversa diz que, para ser a inversa de A, M deve
satisfazer também M A = I.
Exercı́cio. Verifique que M A = I.
Como conclusão, caracterizamos todas as matrizes 2 × 2 invertı́veis e ainda temos uma fórmula
para calcular a inversa:
Teorema 7.1 Uma matriz A quadrada de ordem invertı́vel se e somente se det(A) 6= 0 e, nesse
2 é
1 d −b
caso, sua inversa é dada por A−1 = .
det(A) −c a
Por outro lado, olhando para sistemas associados a matrizes singulares, ou seja, a matriz dos
coeficientes satisfaz det(A) = 0, e obrigatoriamente A tem duas linhas múltiplas. Isto implica que
após o escalonamento, a matriz dos coeficientes terá uma linha nula. Ao olharmos para a matriz
aumentada, esta linha pode ser da forma 0 = 0 e o sistema terá infinitas soluções, ou da forma
0 = k, para alguma constante não nula k indicando que o sistema não tem solução.
Observação.
Se você não conhece, ou não lembra, o determinante de uma matriz 2 × 2 é definido
a b
por det = ad − bc. Esta definição e mais propriedades ainda serão discutidas no texto.
c d
Exemplos.
(
5x − 2y = −19
1. Olhe para o sistema . A matriz dos coeficientes, vamos chamá-la A é
2x + 3y = 0
tal que det(A) = 19 6= 0, portanto o sistema tem única solução. Sua matrizinversa
é
1 3 2 −19
dada porA−1 = , logo a solução do sistema é dada por X = A−1 =
−2
19 5 0
1 3 2 −19 3
= .
19 −2 5 0 −2
27
(
2x + 3y = 1 2 3 1
2. Já para o caso do sistema , a matriz aumentada , após escalonada
4x + 6y = 2 4 6 2

2 3 1
(L2 ← L2 − 2L1 ) fica e a solução do sistema é a solução da sua primeira equação,
0 0 0
isto é uma reta.
3. Se, no sitema do exemplo 2, trocamos a constante da segunda equação de 2 para qualquer
outro número, estamos no caso de solução vazia, pois multiplicar a primeira equação por 2
resulta
numa equação
incompatı́vel com a segunda. Em outras palavras, a matriz aumentada
2 3 1
seria , com k 6= 0, indicando solução vazia.
0 0 k
Em resumo, dada uma matriz A quadrada de ordem 2, se det(A) 6= 0, então qualquer sistema que
tem A como matriz dos coeficientes (AX = B) tem solução única dada por X = A−1 B. A solução,
claro, depende do vetor B, mas o fato da solução ser única, não. Por outro lado se det(A) = 0, o
sistema nunca terá solução única: de fato, se det(A) = 0, então as duas linhas são múltiplas e as
equações representam retas com mesma direção no plano. Nesse caso, ou as equações são múltiplas
e representam a mesma reta (que é a solução do sistema, portanto o sitema tem infinitas soluções),
ou as equações representam retas paralelas e o sistema tem solução vazia.
O último parágrafo demonstra o seguinte
Teorema 7.2 O sistema linear AX = B tem solução única (dada por X = A−1 B) se e somente
se det(A) 6= 0.
Observações.
1. É claro que estamos falando de matrizes quadradas, caso contrário o determinante nem estaria
definido. Por enquanto, o que foi demonstrado foi o caso de matrizes 2 × 2, mas o teorema
vale para matrizes de qualquer ordem.
2. Ainda no caso de A2×2 , se B = 0, isto é, no caso do sistema homogêneo AX = 0, já sabemos
que o vetor nulo sempre faz parte da solução e assim a solução de um sistema homogêneo
nunca é vazia. Então, se det(A) 6= 0, o sistema tem o vetor nulo como a única solução. Já
sendo det(A) = 0, a solução é uma reta r que passa pela origem, portanto, se det(A) = 0, o
sistema homogêneo associado a A admite solução não nula (na verdade, infinitas: qualquer
ponto de r que não seja a origem). Em outras palavras, sistemas homogêneos associados a
matrizes quadradas estão divididos em dois grupos: aqueles cuja solução é o conjunto unitário
→
−
{ 0 } e aqueles que admitem solução não nula.
3. Veremos que para matrizes quadradas de ordem n, a condição para a existência da inversa é
exatamente a mesma, isto é, uma matriz é invertı́vel se e somente se tem determinante não
nulo; veremos também que o escalonamento nos permite calcular a inversa para matrizes de
qualquer ordem. O resultado para sistemas homogêneos também é o mesmo: ou tem solução
→
−
única { 0 }, ou admite solução não nula.
Exercı́cios.
28
1. Pegue alguns exemplos de sistemas 2 × 2 de algum livro do ensino médio e resolva-os por
escalonamento, para se familiarizar com a técnica.
2. Conclua, via escalonamento, que o sistema


3x − y = 5

x+y =2

−2x + y = 1

tem solução vazia. Troque a segunda equação desse sistema por x + y = k, determine k ∈ R
para que o sistema tenha solução e calcule-a.

a 1−a
3. Dada a matriz A = , calcule os valores de a para os quais A seja invertı́vel.
3 2a
(
3x − a2 y = 1
4. Mostre que, independente do valor de a, o sistema tem única solução e
2x + y = 0
calcule-a em função de a.
5. Verifique que det(A−1 ) = (det(A))−1 no caso de matrizes 2×2. Também veremos mais adiante
que isso vale para qualquer que seja a ordem da matriz A.
8 Multiplicação de matrizes como movimentos do plano
Já vimos que sistemas de equações lineares de duas equações e duas incógnitas representam in-
terseções de retas em R2 . Mas há um outro modo de vê-los; para tanto, vamos interpretar a
multiplicação de matrizes como funções.
2 2
Uma 2 × 2 A pode ser vista como uma função A : R → R onde a imagem de cada vetor
matriz
x
X= ∈ R2 é o vetor AX ∈ R2 . Muitas vezes uma aplicação desse tipo é chamada de movimento
y
do plano, porque podemos desenhar o vetor X e sua imagem no mesmo plano cartesiano.
Exemplos.

0 −1
1. Seja A = . Então, A pode ser vista como aplicação do plano no plano
1 0
A : R2 → R2
x −y
7→
y x
Ou seja, trata-se de uma rotação de 90o no sentido positivo (faça desenhos).
29

a 0 x ax x
2. Se A = , então o movimento leva qualquer vetor em = a , isto é,
0 a y ay y
x
multiplica o vetor pelo escalar a.
y

1 3 0 1
3. Seja M = e considere o triângulo retângulo ABC, sendo A = , B = e
1 0 0 0
0 →
− −→ →
−
C = . Note que M ( 0 ) = M (AA) = 0 (isso vale para qualquer matriz M : a imagem
1
−→ 1 −→ 0
da origem é sempre a origem). Calculando as imagens dos lados AB = e AC = ,
0 1
temos

−→ 1 3 1 1
M (AB) = =
1 0 0 1
e

−→ 1 3 0 3
M (AC) = = .
1 0 1 0
−→ −→
Logo, podemos observar que M não preserva ângulos (pois o ângulo entre AB e AC de 90o é
−→ −→
diferente do ângulo entre M (AB) e M (AC), que é 45o .
−→ −→
Tampouco M preserva distâncias: AC tem módulo 1, enquanto M (AC) tem módulo 3.
Exercı́cios (relativos ao exemplo).
(a) Calcule a imagem do terceiro lado do triângulo ABC.

−→ −→ −→ −→
(b) Explique porque os ângulos orientados ^(AB, AC) e ^ M (AB), M (AC) têm sinais
contrários.

−1/2 0 1
4. Seja M = . Agora defina V1 = , V2 = M V1 , V3 = M V2 e assim por diante,
0 2 1
isto é, Vn = M Vn−1 .
(a) Calcule e desenhe V3 e V4 .

(b) O que acontece com Vn à medida em que n cresce?
√
cos 30o −sen 30o 1 √1 − 3
5. A matriz R = R30o = = 2 é chamada rotação de 30o no
sen 30o cos 300 3 1
sentido positivo (anti-horário). Convença-se disso fazendo os seguintes cálculos e desenhos.
30
(a) R preserva normas, isto é, se V é um vetor qualquer de R2 , então k R(V ) k=k V k.

a
(b) Tome agora um vetor W = tal que k W k= 1. Verifique que o ângulo (orientado)
b
entre V e R(V ) é 30o .
Esta
é a formageral da matriz de rotação de um ângulo θ no sentido positivo: Rθ =
cos θ −sen θ
, e sempre preserva distâncias e ângulos.
sen θ cos θ
6. Se det(A) 6= 0, então dado qualquer vetor B ∈ R2 (no contradomı́nio), B tem uma única
pré-imagem, isto é, existe um único vetor X ∈ R2 (domı́nio) tal que AX = B. De fato,
trata-se de um sistema associado a uma matriz invertı́vel, portanto a solução existe e é única.
Diz-se nesse caso que A é sobrejetiva.

1 2
7. Isso não acontece para matrizes A com det(A) = 0: para A = , a tentativa de se achar
1 2
1
uma pré-imagem para o vetor resulta num sistema impossı́vel (verifique). O motivo é
0
que, sendo det(A) = 0 para uma matriz A não nula, então a imagem de A como
movimento
do
1 4
plano é uma reta que passa pela origem. Como exemplo, olhe para B = . A imagem
2 8
x
de B : R2 → R2 é o conjunto dos pontos da forma B , ou seja, os vetores da forma
y
x + 4y
, ou, em outras palavras, o conjunto dos vetores em que a segunda coordenada é
2x + 8y
t
o dobro da primeira, ou ainda, a reta r : |t ∈ R
2t
8. Voltando ao caso de matrizes A com det(A) 6= 0, mostraremos que A é injetiva, isto é, se Y
−−→ −→
e Z são pontos distintos no domı́nio, considerados como os vetores OY e OZ, então A(Y ) e
A(Z) serão distintos no contradomı́nio. Para se convencer disso, olhe para o vetor não nulo
→
−
Y − Z. Se fosse A(Y ) = A(Z), terı́amos A(Y ) − A(Z) = 0 . Mas isso é o mesmo que dizer
A(Y − Z) = 0, ou seja, que Y − Z é uma solução do sistema homogêneo AX = 0. Ora, como
det(A) 6= 0, esse sistema tem a origem como única solução, ou seja, Y − Z, por ser não nulo,
não pode ser solução. Essa contradição implica A(Y ) 6= A(Z).
Outra maneira de se enunciar a injetividade para matrizes quadradas é que, se det(A) 6= 0 e

V é um vetor não nulo, então AV também é não nulo.
Exercı́cio. Interpretando uma matriz A2×2 como movimento do plano, uma pergunta que poderia
ser feita é a seguinte: existe algum vetor não nulo X ∈ R2 (domı́nio) tal que AX = λX para algum
→
−
λ ∈ R? Ou: existe X 6= 0 tal que AX é um múltiplo de X? Dada a matriz A, como você faria
para responder essa questão? Geometricamente, a existência desse vetor significa que o vetor AX,
quando não nulo, tem a mesma direção de X. Por este motivo, a direção determinada por X é
chamada invariante pela multiplicação pela matriz A.
31
Note que já vimos exemplos em que não há direções invariantes (a rotações dos exemplos 1 e 5
acima) e um exemplo onde todas as direções são invariantes (a multiplicação por escalar do exemplo
2). Vamos ver agora um exemplo ainda simples mas com um comportamento diferente.

2 0
Seja A = . Uma direção invariante para A é dada por um vetor não nulo V tal que
0 −1
x
AV = λV , para algum λ ∈ R. Para procuar V , chame-o de V = e note que a condição que
y
deve ser satisfeita, AV = λV , se escreve

2x λx
= .
−y λy
A primeira coordenada da equação acima nos diz que ou x = 0 ou λ = 2. Se x = 0, como queremos

V 6= 0, obrigatoriamente tomamos y6=0 e, nesse caso, a segunda coordenada implica que λ =−1.
0 0 0
Ou seja, vetores não nulos da forma são levados por A em vetores da forma = (−1) ,
y −y y
o que pode ser verificado diretamente. E, se escolhemos λ = 2, vemos que a segunda equação só
y = 0. Nesse caso, para garantir V 6= 0,
fica verdadeira para tomamos
x 6=
0.Ou seja, vetores não
x 2x x
nulos da forma são levados por A em vetores da forma = (2) . Portanto, a matriz
0 0 0
2 0
A = tem exatamente duas direções invariantes, precisamente os eixos x e y. Quando
0 −1
olhamos apenas para as direções invariantes, o movimento definido por A é a multiplicação por um
escalar (2 no caso do eixo x e -1 no caso do eixo y).

a 0
Nada mudaria se escrevêssemos, de forma geral, A = : as direções invariantes seriam os
0 b
x x 0 0
eixos x e y e terı́amos A =a eA =b .
0 0 y y
Exercı́cios.

1
1. Determine os valores de x para que o vetor X = represente uma direção invariante da
x
1 1
matriz A = .
15 3

1 3 1
2. O vetor representa uma direção invariante da matriz ?
1 4 0
3. Se M é uma matriz 2 × 2 e ABC é um triângulo em R2 , os pontos M A, M B e M C (obtidos

por multiplicação de matrizes) são necessáriamente vértices de um triângulo? Dê exemplos.

2 2
4. Existem duas matrizes 2 × 2 distintas A e B tais que A = B ? Caso negativo,
1 1
demonstre; caso afirmativo, exiba um exemplo.
32

0 1 1 0
5. Encontre uma matriz que “transforma” o quadrado de vértices , , e no
0 0 1 1
√ √
0 2 1+ 2 1
losango de vértices , , e . Sugestão: a multiplicação por esta matriz
0 0 1 1
√
1 0 1 2
leva os vetores i = ej= respectivamente em U = eV = . Essa matriz
0 1 1 0
é única? Por quê?
6. Seja A uma matriz 2 × 2. Se det A 6= 0, foi mostrado no exemplo 6 que A é sobrejetiva e no

exemplo 8 que A é injetiva.
(a) Suponha A injetiva e mostre que det A 6= 0, isto é, A é injetiva se e somente se det A 6= 0.
(b) Suponha A sobrejetiva e mostre que det A 6= 0, isto é, A é sobrejetiva se e somente se
det A 6= 0.
(c) Conclua que injetividade implica sobrejetividade e reciprocamente.
9 Formas quadáticas em R2
Mas por que procuramos direções invariantes de matrizes? Uma razão é que elas estão associadas
com eixos de simetria de elipses, hipérboles e parábolas, curvas (chamadas cônicas) que podem ser
interpretadas como soluções de equações quadráticas no plano, equações estas que têm coeficientes
definidos por uma certa matriz. Veremos um pouco adiante que as direções invariantes dessa matriz
determinam as direções de simetria da cônica.
Antes de definirmos as cônicas, vamos ver como matrizes definem coeficientes de equações quadráticas.
Definição 9.1 Uma forma quadrática no plano é uma expressão da forma ax2 + bxy + cy 2 , onde
a, b e c são números reais dados, não simultaneamente nulos.
Ou seja, uma forma quadrática no plano é uma função de domı́nio R2 e contradomı́nio R, dada por
uma expressão polinomial em duas variáveis, onde cada parcela tem grau exatamente 2. Para que
a forma seja de fato “quadrática”, exige-se, na definição, a condição de que a, b, c ∈ R não sejam
simultaneamente nulos.
Associamos formas quadráticas e matrizes quadradas de ordem dois escrevendo a forma quadrática
como um produto de matrizes:

2 2
a b1 x
ax + bxy + cy = x y ,
b2 c y
desde que b1 + b2 = b. Para verificar, basta efetuar o produto de matrizes acima.
Assim, a uma forma quadrática está associada uma matriz 2 × 2 tal que os coeficientes de x2 e
y 2 são as entradas da diagonal principal e o coeficiente de xy é a soma das entradas da diagonal
secundária.
33
Na tentativa de representar formas quadráticas por matrizes
quadradas, há um pequeno problema

a b
a ser contornado. Uma matriz quadrada qualquer A = define uma forma quadrática, mas,
c d
como vimos, a mesma forma quadrática pode estar representada por duas matrizes distintas: basta
que tenham mesma diagonal principal e que as entradas na diagonal secundária tenham a mesma
soma. A maneira mais conveniente de se tratar isso é com matrizes simétricas.
Matrizes simétricas são matrizes quadradas que têm simetria em relação à diagonal principal. Para
t
dizer isto de outra maneira, definimos a transposta de uma matriz Mn×m por ser a matriz Mm×n
que tem como linhas as colunas de M e como colunas as linhas de M , e dizemos que A é simétrica
⇔ At = A.
No caso 2 × 2, as matrizes simétricas são as matrizes cujas entradas da diagonal secundária são
iguais.
Agora podemos identificar o conjunto das formas quadráticas no plano com o conjunto das matrizes
2 2
simétricas
2 × 2. Cada forma quadrática ax + bxy + cy define uma única matriz simétrica A =
a b/2
e reciprocamente.
b/2 c
2 2
O que faremos agora
é o seguinte: começaremos estudando equações da forma ax + by = c, ou
a 0 x
x y = c, ou seja, cuja parte quadrática está definida por uma matriz diagonal
0 b y
(matrizes que têm entradas não nulas somente na diagonal principal); diremos que uma equação
assim está na sua forma normal e veremos todos os casos possı́veis. De maneira geral, a solução de
uma equação deste tipo apresenta simetria em relação aos eixos x e y, que, como já foi visto, são
exatamente as direções invariantes de A.

a b x
Na sequência estudaremos o caso mais geral x y = d (ou ax2 + 2bxy + cy 2 = d)
b c y
procurando pelas direções invariantes da matriz da forma quadrática, que serão também as direções
de simetria da curva solução, reduzindo a equação a uma forma normal.

1 3
Exercı́cio. Calcule as duas direções invariantes da matriz a = e mostre que são ortogonais.
3 1
Um pouco mais para a frente, estudaremos o caso mais geral possı́vel de equações quadráticas no
plano, ax2 + bxy + cy 2 + dx + ey = f , também a partir das direções invariantes da matriz da forma
quadrática.
Por enquanto, vamos nos concentrar em soluções de equações em sua forma normal.
10 Cônicas
Vamos estudar equações da forma ax2 + by 2 = c. Antes de mais nada, vejamos alguns
exemplos.
34
1. x2 + y 2 = 1 é a equação do cı́rculo de raio 1 centrado na origem (ou: a solução é o cı́rculo).
2. x2 + y 2 = −4. Claramente temos S = ∅.
3. x2 + y 2 = 0 tem como solução um conjunto unitário: S = {(0, 0)}.
4. Se um dos coeficientes de x2 ou y 2 é nulo, por exemplo, em x2 = 1, temos x = ±1. Lembrando

que nosso ambiente é o plano, a solução é o par de retas paralelas x = 1 e x = −1.
5. No caso anterior, se a constante é nula, a solução é uma reta. Por exemplo x2 = 0 tem como
solução a reta x = 0. E a solução pode ainda ser vazia, como por exemplo, em x2 = −1.
6. Também pode acontecer que a solução seja um par de retas concorrentes, por exemplo, a
equação x2 − y 2 = 0 pode ter seu lado esquerdo fatorado e fica (x − y)(x + y) = 0, cuja
solução é a união das soluções de x − y = 0 e de x + y = 0, ou seja, a união das retas y = x e
y = −x, que se encontram na origem.
Observe que o exemplo 1 acima poderia ter sido apresentado a partir da definição do cı́rculo como
o lugar geométrico dos pontos do plano cuja distância até a origem é 1 e a equação seria uma
consequência dessa propriedade. Os próximos exemplos partem da definição geométrica.
Exemplo: elipse. A elipse é o lugar geométrico dos pontos do plano cuja soma das distâncias a
dois pontos dados (focos) é constante. Ou seja, são dados dois pontos distintos F1 e F2 no plano e
uma constante k > d(F1 , F2 ) (maior que a distância entre os dois focos) e a elipse é o conjunto de
pontos X tais que d(X, F1 ) + d(X, F2 ) = k.
Pense num “compasso para construir elipses”: um pedaço de barbante de comprimento maior que
a distância entre os dois focos, com uma extremidade amarrada em cada foco, num prego ou numa
taxinha, por exemplo. Com o lápis sobre o plano mantendo sempre o barbante esticado, desenhamos
a elipse. As distâncias da ponta do lápis aos focos somam exatamente o comprimento do barbante,
onde quer que a ponta do lápis esteja. Procure figuras ou vı́deos dessa construção na internet.
Para derivar uma equação cuja solução seja uma elipse, localize os focos sobre o eixo x, nos pontos
(−c, 0) e (c, 0) (para c > 0). As interseções da elipse com os raios positivos dos eixos x e y serão
denotadas, respectivamente, pelos pontos (a, 0) e (0, b), de modo que a, b > 0. Desse modo, a
constante (isto é, o tamanho do barbante) é igual a 2a. Note que o ponto (0, b) equidista dos focos,
logo a distância a cada um dos focos é a (a metade do tamanho do barbante) e os números a, b e
c satisfazem uma relação de Pitágoras a2 = b2 + c2 .
35
b
F1 F2 a
0
(c, 0)
Assim, dado um ponto X = (x, y) no plano, ele estará na elipse se e somente se (X, F1 )+d(X, F2 ) =
2a, ou seja,
p p
(x − c)2 + y 2 + (x + c)2 + y 2 = 2a.
Como exercı́cio de manipulação algébrica, mostre (ou leia em algum outro texto) que esta equação
se simplifica em
x2 y 2
+ 2 = 1.
a2 b
A forma acima é a forma normal da elipse, a partir desta equação, usando as simetrias em relação
aos eixos x e y, é possı́vel construir (esboçar) o gráfico da elipse.
Exercı́cio. Equacione a elipse com focos sobre o eixo y e faça um esboço de seu gráfico.
36
Exemplo: hipérbole. A hipérbole é o lugar geométrico dos pontos do plano cuja diferença das
distâncias a dois pontos dados (focos) é constante. Ou seja, são dados dois pontos distintos F1 e
F2 no plano e uma constante 0 < k < d(F1 , F2 ) (menor que a distância entre os dois focos) e a
hipérbole é o conjunto de pontos X tais que |d(X, F1 ) − d(X, F2 )| = k.
Antes de equacionarmos esta curva, pensemos, a exemplo do que fizemos no caso da elipse, num
instrumento para construir arcos de hipérbole no plano. Vá desenhando à medida em que for lendo.
Fixados os focos, suponha que a distância entre eles seja d e pegue um barbante de comprimento
d − k, onde k < d é a constante de definição da hipérbole. Numa régua maior que d, cave uma
fenda central, paralela aos lados maiores da régua, com comprimento d. Fixe uma extremidade da
fenda no primeiro foco de maneira que a fenda possa girar em torno desse foco. Fixe uma ponta do
barbante no segundo foco e a outra ponta na outra extremidade da fenda. Como posição inicial,
coloque a fenda exatamente sobre o segmento que liga os focos. Com o auxı́lio de um lápis estique
o barbante. O lápis marca no papel um ponto P tal que a distância de P até o segundo foco é
d−k
(metade do tamanho do barbante). Concluı́mos que a distância de P ao primeiro foco é k/2.
2
Assim, a diferença entre as distâncias de P aos focos é k. Mantendo o barbante esticado e girando
a fenda em torno do primeiro foco, cada ponto Q do traço marcado pelo lápis também tem esta
propriedade: a diferença das distâncias de Q aos focos é exatamente k. Procure figuras ou vı́deos
na internet para ilustrar. Assim o lápis descreve um arco de hipérbole. Note que existe um outro
arco da curva, que não intercepta o primeiro, desenhado quando repetimos o procedimento fixando
uma extremidade da fenda no segundo foco e girando a fenda em torno dele.
Para deduzir a equação, fixamos os focos nos pontos F1 = (−c, 0) e F2 = (0, c), c > 0. A distância
entre os focos é portanto 2c. Se chamamos o ponto inicial P da construção acima de (a, 0), então,
k = 2a. A equação procurada é portanto |d(X, F1 ) − d(X, F2 )| = 2a, que, elevando ambos os lados
ao quadrado para eliminar o módulo, fica equivalente a
p p
( (x − c)2 + y 2 − (x + c)2 + y 2 )2 = 4a2 .
Como exercı́cio de manipulação algébrica, mostre que esta equação quando simplificada, se escreve
x2 y2
− = 1; chamando b2 = c2 − a2 , chegamos à forma normal da hipérbole (com focos no
a2 c 2 − a2
eixo x),
x2 y 2
− 2 = 1.
a2 b
Note que o gráfico tem simetria em relação aos eixos x e y. Assim, vamos fazer por enquanto um
b√ 2
esboço no primeiro quadrante a partir da equação y = x − a2 , obtida isolando y em função de
a
x quando ambos são positivos e √ x > a. Quando x for muito grande teremos as grandezas x2 − a2
2
e x muito próximas e portanto x2 − a2 muito próximo de x, embora sempre menor que x. Logo
b
o gráfico desta função se aproximará, por baixo, do gráfico da reta y = x. Refletindo este esboço
a
nos eixos x e y, temos o esboço da hipérbole, uma curva com duas componentes conexas, isto é,
b b
dois “pedaços”. As retas y = x e y = − x são chamadas assı́ntotas da hipérbole.
a a
Exercı́cio. Localizando os focos sobre o eixo y, derive a forma normal da hipérbole com focos no
eixo y e faça um esboço de seu gráfico.
37
38
Vimos, até agora oito exemplos de possibilidades de soluções para equações quadráticas da forma
ax2 + by 2 = c, as duas últimas, elipse e hipérbole, são também chamadas de cônicas, por estarem
também definidas como seções de um cone feitas por um plano. Um cone no espaço é gerado pela
rotação de uma reta g em torno de uma reta h, concorrente com g no ponto V . V é chamado vértice
do cone, g é a geratriz e h é o eixo. A elipse é a interseção de um cone com um plano “pouco
inclinado” com relação à geratriz (ou “menos inclinado”) e a hipérbole é a curva resultante de uma
seção do conte por um plano “muito inclinado” (“mais inclinado”). Procure figuras na internet e
confira que a hipérbole tem de fato duas componentes conexas.
Exemplo: parábola. Você deve ter perguntado, com razão, sobre a parábola, já que, muito
provavelmente foi a primeira curva quadrática que você estudou. De fato, a parábola não aparece
nesta forma normal porque as equações deste tipo possuem exatamente dois eixos de simetria
(os eixos coordenados), enquanto a parábola apresenta apenas um. A matriz que define a forma
a 0
quadrática de uma parábola é da mesma forma dos exemplos 4 e 5 acima: A = , a 6= 0,
0 0
podendo acontecer do valor não nulo aparecer na posição (1, 1) ou (2, 2) da matriz. A diferença é
que a parábola “exige” a presença de um termo linear. Por exemplo, se o coeficiente de x2 é nulo,
então o coeficiente de y não pode ser e se o coeficiente de y 2 é nulo, o coeficiente de x não pode ser.
Formas normais são y = ax2 ou x = ay 2 , com gráficos suficientemente conhecidos.
A exemplo de elipses e hipérboles, a parábola também pode ser definida como um lugar geométrico:
é o lugar geométrico dos pontos do plano que equidistam de um ponto (foco) e uma reta (diretriz)
que não contém o foco. Ou ainda como seção de um cone, por um plano “tão inclinado” quanto
a geratriz. Pesquise como construir parábolas com réguas e barbantes a partir da definição como
lugar geométrico.
Exercı́cio. Para uma parábola, suponha que o foco é o ponto (0, c) e a diretriz é a reta y = −c,
c > 0 e deduza a equação desta curva. Para tanto, você vai ter que pensar como conseguir calcular
a distância de um ponto a uma reta, um exercı́cio importante de geometria analı́tica.
Veremos mais tarde, quando estudarmos a forma geral das equações quadráticas no plano, da forma
ax2 + bxy + cy 2 + dx + ey = f , que os nove tipos de exemplos vistos acima (vazio, ponto, cı́rculo,
elipse, reta, par de paralelas, parábola, par de concorrentes e hipérbole) são todas as possibilidades
para a solução.
11 Mudanças de coordenadas no plano
Até agora temos estudado objetos geométricos do plano a partir de sua representação algébrica,
por exemplo, pontos e vetores estão representados por pares ordenados de números reais, em geral
escritos como colunas. Também já estudamos retas e curvas como soluções de equações. Para
tanto, foi necessário fixar um sistema de coordenadas cartesianas.
Um sistema de coordenadas no plano é um modo de se associar, sem ambiguidade, pontos do plano

a representações algébricas. Um sistema de coordenadas pode não ser cartesiano:
39
Já vimos como definir um sistema de coordenadas na reta, através da escolha de dois pontos A e B
para representar o “0” e o “1”, ou seja, dado pela escolha de um ponto (A) e por um vetor diretor
−→
(AB). Assim, pontos da reta são representados por números reais, e a reta passa a se chamar eixo.
Lembre-se do que é usualmente definido no plano, um sistema Cartesiano, formado por dois eixos
perpendiculares, com origem comum no ponto de interseção, ambos com vetores diretores unitários
tais que o giro do primeiro para o segundo vetor se faz no sentido anti-horário. Pontos e vetores estão
associados (um ponto está associado ao vetor que começa na origem e termina nele) e representados
por matrizes coluna 2 × 1.
Com a mesma ideia de sistemas cartesianos podemos definir coordenadas no plano fixando dois
eixos concorrentes e com mesma origem. Basta escolher um ponto (a origem, em geral denotado
por O) e de um par ordenado de vetores não paralelos {V, W }. Feita esta escolha, os eixos deste
sistema de coordenadas, vamos chamá-los v e w, serão as retas que passam por O e têm vetores
diretores V e W . Isto significa que V define, além da direção do primeiro eixo, sua unidade de
medida e seu sentido positivo, assim como W para o segundo eixo.
Portanto, dado um ponto B no plano, por B existe uma única reta paralela ao eixo w, que corta
o eixo v num ponto P , assim como existe uma única paralela por B ao eixo v, cortando o eixo w
no ponto Q. Note que os pontos P e Q estão unicamente determinados a partir do ponto B. Pela
−−→ −→ −→
regra do paralelogramo para adição de vetores, o que fizemos foi escrever OB = OP + OQ. Como
−→ −→
sabemos que OP é um múltiplo de V e OQ é um múltiplo de W , existem números reais x e y
−−→ −−→
tais que OB = xV + yW , chamados de coordenadas de B (ou de OB) em relação ao sistema de
x
coordenadas G = {O, {V, W }}. Escrevemos BG = .
y
40
V
P
W
Definições. Alguma nomenclatura agora ajuda a abreviar depois. Um par ordenado de vetores
que pode ser usado para definir coordenadas, ou seja um par ordenado de vetores não paralelos no
plano chama-se base.
Uma base B = {V, W } é chamada de positiva quando o giro de V para W ao longo do menor ângulo
é no sentido positivo ou anti-horário e negativa caso contrário. Quando não há a necessidade de se
explicitar a origem, denotamos AB para as coordenadas do ponto A em relação à base B.
Observe que coordenadas de

vetores
na base
definida
por eles mesmos são canônicas. Em sı́mbolos,
1 0
se B = {V, W }, temos VB = e WB = .
0 1
Se um vetor pode ser obtido por outros usando somente as operações de adição de vetores e
multiplicação de vetores por escalar, então, aquele é chamado de combinação linear destes. Assim,
determinar as coordenadas de um vetor em relação a uma base é escrevê-lo como combinação linear
dos vetores da base. Como já foi argumentado, essa decomposição é única.
Exemplo. O sistema de coordenadas usual do plano é dado por um ponto O e uma base positiva
formada por dois vetores unitários e perpendiculares. Esta base é em geral denotada por B0 = {i, j}
e é chamada de base usual ou canônica. O vetor i é um gerador do eixo x e j é um gerador do eixo
y. Nesse caso, as projeções paralelas a um eixo são perpendiculares ao outro e de qualquer modo
o que se faz para munir um vetor de coordenadas é decompô-lo como a soma de um múltiplo de i
41
com um múltiplo de j. Em casos onde não há perigo de confusão, não usamos ı́ncice para expressar
coordenadas em relação à base canônica: em vez de escrever UB0 , escrevemos apenas U .
Existem situações nas quais precisaremos (ou desejaremos) trabalhar com dois sistemas de coorde-
nadas simultaneamente, portanto, dado um objeto geométrico, seja um ponto, um vetor, uma reta,
uma cônica, devemos saber relacionar as matrizes ou equações que os representam em sistemas dife-
rentes. Assim, vamos observar um ente geométrico que existe e está bem definido, antes de fixarmos
um sistema de coordenadas para representá-lo algebricamente: um ponto B pode ser representado
por duas matrizes diferentes BB e BC , mas B não muda, o que muda são suas coordenadas.
12 Mudança de base
Vamos considerar, no momento, somente mudanças de base, isto é, fixemos a origem O até que se
diga o contrário. O que define as coordenadas de um vetor num sistema é sua decomposição como
combinação linear dos vetores da base. Assim, dadas as bases usual B0 , que define as coordenadas
usuais (x, y), e B = {V, W }, cujas coordenadas vamos denonimar (x0 , y 0 ), não é difı́cil deduzir a
equação que relaciona as coordenadas de um ponto B em cada uma das bases. Escreva
−−→
OB = xi + yj = x0 V + y 0 W.
0
x x
Isto significa que X = são as coordenadas de B na base canônica e X 0 = são as
y y0
B.Vamos
coordenadas de B na base olhar para esta equação (a segunda) no sistema usual. Seu
1 0 x
lado esquerdo fica x +y = = X. Para a análise do lado direito, vamos considerar a
0 1 y
matriz A = [V, W ], que tem os vetores V0 e W como colunas. É um exercı́cio de multiplicação de
x
matrizes ver que x0 V + y 0 W = [V, W ] 0 , isto é, o lado direito da equação fica AX 0 . Portanto, a
y
equação que relaciona as coordenadas de um vetor nas bases B0 e B é
X = AX 0 .
A matriz A é chamada de matriz de mudança de base. As colunas de A são uma base para o
plano, logo são vetores não paralelos. Portanto, as colunas de A não podem ser múltiplas e seu
determinante é não nulo. Em outras palavras, A é invertı́vel e qualquer sistema associado a A tem
única solução. Em particular, uma maneira equivalente de escrever a equação de mudança de base
é multiplicar ambos os lados por A−1 à esquerda, obtendo
X 0 = A−1 X.
Exemplos.

1 2
1. Sejam V = eW = . Seja A = [V, W ] (colunas) matriz 2 × 2 formada por V e W .
3 −2
1 2 x + 2y 1 2 x x
Então, xV + yW = x +y = = =A , um exemplo
3 −2 3x − 2y 3 −2 y y
que ilustra que multiplicação de matriz por vetor é uma combinação linear das colunas da
matriz onde os escalares utilizados são as entradas do vetor.
42

1 2
2. Seja B = {U, V }, onde U = e V = . Se temos um ponto P do plano cujas
1 1
5
coordenadas na base usual são P = , para calcular PB , usamos a equação de mudança
−1
0 −1
de base.
Para
este caso, onde
temos X e queremos calcular X , usamos PB = A P =
1 1 −2 5 −7
= .
−1 −1 1 −1 6
3. Se um vetor W do plano pode ser decomposto como W =U − V , onde U e V são os vetores
1
da base do exemplo 2, ou, em outras palavras, WB = , então suas coordenadas na base
−1
1 2 1 −1
canônica são dadas por W = AWB = = .
1 1 −1 0
4. Outra pergunta importante é como achar a equação da reta r : 2x − 5y = 12 nas coordenadas
(x0 , y 0 ), definidas pela base B do
exemplo 2. Basta escrever a equação de r explicitando o pro-
x0

x 0
1 2
duto de matrizes, r : 2 −5 = 12 e usar X = AX , ou seja, r : 2 −5 ,
y 1 1 y0
que, fazendo as contas, fica r : −3x0 − y 0 = 12.
5. O mesmo raciocı́nio se aplica a uma equação quadrática. Digamos que queremos a equação
3x2 + 4y 2 = 1 no sistema (x0 , y 0 ), ainda considerando
a base
do exemplo 2. Escrevendo
3 0 x
a equação em sua forma matricial, temos x y = 1, ou X t M X = 1, onde
0 4 y
3 0
. Novamente faremos a substituição X = AX 0 , só que agora,
t

X = x y eM =
0 4
olhando para a equação, precisaremos saber quem é X t . Veremos mais adiante num exercı́cio
que X t = (AX 0 )t = X 0t At , ou seja, a transposta de um produto de matrizes é o produto das
matrizes transpostas, mas em ordem contrária. Assim, substituindo X = AX 0 e X t = X 0t At
0t t
em
X
t
MX = 1,
ficamos
com X A M AX 0 = 1. Calculando o produto de matrizes, At M A =
1 1 3 0 1 2 7 10
= . De maneira que a equação nas coordenadas (x0 , y 0 ) fica
2 1 0 4 1 1 10 16
7x02 + 20x0 y 0 + 16y 02 = 1.
Em tempo: a transposta de uma matriz Am×n é a matriz Atn×m cujas linhas são as colunas de
A (ou, equivalentemente, cujas colunas são as linhas de A).
6. O exemplo anterior serve também para uma observação sobre eixos de simetria. Os exemplos
de cônicas que vimos até agora são da forma ax2 + by 2 = c, que naturalmente têm os eixos
x e y como eixos de simetria. Isto acontece porque, na equação, as variáveis x e y aparecem
com expoente 2 e nenhum outro termo de grau 2 ou 1 aparece. Veja o caso da equação
5x2 + 3y 2 = 17, da qual o ponto P = (1, 2) faz parte da solução. Se refletirmos P no eixo
x, isto é, se trocarmos sua coordenada y de sinal, o ponto resultante Q = (1, −2) ainda faz
parte da solução. O mesmo ocorre com a reflexão de P no eixo y, trocando sua coordenada
x de sinal, resultando em T = (−1, 2). Agora, isto já não é verdade para uma equação
quadrática onde o coeficiente do termo xy seja diferente de 0. De fato, se consideramos a
equação x2 + 2xy + 3y 2 = 6, da qual (1, 1) faz parte da solução, veremos que nem (1, −1) nem
(−1, 1) fazem parte da solução.
43
7. Em ambas as equações do exemplo anterior, tanto 5x2 + 3y 2 = 17, como x2 + 2xy + 3y 2 = 6,
se um ponto faz parte da solução, então ao trocarmos ambas as coordenadas de sinal, o ponto
“oposto” ainda faz parte da solução. Isto significa que ambas têm simetria em relação à
origem. Por causa desta simetria, equações gerais da forma ax2 + bxy + cy 2 = d têm seu
conjunto solução centrado na origem, mas terá os eixos x e y como eixos de simetria se e
somente se o coeficiente b do termo xy for zero. Ou, equivalentemente, se a matriz da forma
quadrática for diagonal.
Exercı́cios. Para os exercı́cios abaixo, considere B0 a base canônica, que define

a origem Ofixada,
3 2
coordenadas (x, y) e B = {V, W }, onde V = eW = , a base que define coordenadas
1 −1
(x0 , y 0 )

2 −1 −→
1. Sejam P = eQ= . Quais são as coordenadas de P Q na base B?
5 −1

0 0 3
2. Se U é um vetor cujas coordenadas no sistema (x , y ) são UB = , calcule o ponto final
2
0
de U , quando seu ponto inicial é o ponto B = . Lembre-se que, na ausência de ı́ndice,
3
as coordenadas são relativas à base canônica.
3. Calcule a interseção das retas r : 2x − 5y = 7 e s : 2x0 − 5y 0 = 7.
4. Qual é a equação do cı́rculo x2 + y 2 = 16 no sistema (x0 , y 0 )?
5. Qual é a equação da curva x02 + y 02 = 4 no sistema usual?
A uma matriz 2 × 2 cujas colunas são os vetores U1 e U2 . Mostre que a1 U1 + a2 U2 =

6. Sejam
a
A 1 .
a2
7. Sejam M uma matriz 2 × 2 e X um vetor. Mostre que (AX)t = X t At .
8. Se B e C são duas bases quaisquer, definindo, respectivamente as coordenadas (u, v) e (z, w),
estabeleça uma relação entre as coordenadas que elas definem.
9. Suponha que um novo sistema de coordenadas (x0 , y 0 ) é obtido do usual por uma rotação dos
vetores i e j da base canônica de 30o no sentido positivo. Qual é a equação do eixo x nas
novas coordenadas?
13 Eixos de simetria de ax2 + bxy + cy 2 = d
Vamos voltar agora ao problema de estudar as equações quadráticas da forma ax2 + bxy + cy 2 = d,
onde pelo menos um dos coeficientes a, b ou c é não nulo. Já vimos que existe uma e só uma matriz
simétrica que representa esta forma quadrática, obtida escrevendo a equação como
44

a b/2 x
x y = d.
b/2 c y
Primeira pergunta: sempre existem eixos de simetria perpendiculares para o conjunto solução
da equação? Ou, de maneira equivalente, existe um sistema de coordenadas (x0 , y 0 ), com eixos
perpendiculares, no qual a equação da cônica tem o coeficiente de x0 y 0 nulo? Já vimos que este é o
caso se a matriz da forma quadrática é diagonal.
Segunda pergunta: caso exista, como podemos obter tal sistema de coordenadas?
As respostas são respectivamente “sim” e “fácil”; veremos agora como isso pode ser feito.
O próximo resultado é exatamente o que precisamos para estudar tais equações quadráticas (lembre-
se que a, b e c não são simultaneamente nulos):
Teorema 13.1 Dada uma equação da forma ax2 + bxy + cy 2 = d, o conjunto solução da equação
admite um par de eixos de simetria
perpendiculares.
Estes eixos são definidos por direções invari-
a b/2
antes da matriz simétrica M = .
b/2 c
Não adianta conhecer esse resultado se não dispusermos de uma técnica para determinar as direções
invariantes de uma matriz simétrica. Os conceitos envolvidos são os autovetores e autovalores da
matriz da forma quadrática, aparecem naturalmente na demonstração do resultado enunciado e
que veremos a seguir.
13.1 Autovetores e autovalores
Façamos uma breve recordação do que é uma direção invariante. Ao interpretarmos M2×2 como um
movimento do plano, isto é, uma função que atua num vetor V , multiplicando V por M à esquerda,
M : R2 → R2
,
V 7→ M V
M V é também um vetor e podemos olhar para a posição relativa dos vetores V e M V observando o
domı́nio e o contradomı́nio sobrepostos (e no sistema usual de coordenadas). Pode acontecer que V
e M V tenham a mesma direção, isto é, V pode ser um vetor não nulo tal que M V seja um múltiplo
do próprio V . Em sı́mbolos, um vetor não nulo V define uma direção invariante de M se existe
um número real λ tal que M V = λV . Nesse caso, V é chamado de autovetor de M associado ao
autovalor λ. Autovetores (autovalores) eventualmente são chamados de vetores (valores) próprios
ou caracterı́sticos da matriz M .
Mas como saber se uma matriz M tem autovalores e autovetores e como calculá-los? A partir da
equação
M V = λV
45
escrevemos
M V − λV = 0.
Observe que o “0” do lado direito da equação é o vetor nulo. Não se pode fatorar V nesta equação,
pois M é uma matriz e λ é um número. Mas, lembrando que a matriz identidade 2 × 2, denotada
I, é o elemento neutro da muliplicação de matrizes (logo IV = V ) e escrevendo
M V − λIV = 0,
agora sim podemos fatorar V ficando com
(M − λI)V = 0.
Interpretando V como incógnita, a equação acima é um sistema linear homogêneo de duas equações
e duas incógnitas que depende de um parâmetro real (λ). Procuramos, para este sistema, uma
solução não nula, já que V deve ser um autovetor.
A condição sobre λ para que o sistema admita soluções não nulas é que det(M − λI) = 0. Caso
contrário, isto é, se o determinante fosse não nulo, o sistema teria solução única e, como sabemos
que o vetor nulo é solução (pois o sistema é homogêneo), seria a única solução.
Assim, estamos procurando λ para que det(M − λI) = 0, ou, equivalentemente, para que o sistema
tenha as duas equações múltiplas. Na prática, isso quer dizer que o sistema dependerá de uma
equação e duas incógnitas, sua solução portanto sendo interpretada como uma reta que passa pela
origem. Todos os vetores desta reta (exceto a origem, claro) serão autovetores associados a λ.

2 −2
Exemplo. No caso da matriz A = , a condição para que λ seja um autovalor é
−1 0
det(A − λI) = 0, ou seja,

2 −2 1 0
det −λ =0
−1 0 0 1
ou

2 − λ −2
det =0
−1 −λ
ou (2 − λ)(−λ) − 2 = 0, ou ainda λ2 − 2λ − 2 = 0, uma equação de segundo grau em λ, chamada

equação caracterı́stica da matriz A. O polinômio (de grau 2) p(λ) = λ2 − 2λ − 2 é o polinômio
caracterı́stico da matriz A. Suas raı́zes, as soluções da equação caracterı́stica, são os autovalores de
A.

a b
Exercı́cio. A equação caracterı́stica da matriz é λ2 − (a + d)λ + (ad − bc) = 0.
c d
46
Assim, pensando genericamente, para uma matriz A2×2 qualquer, há três possibilidades: ou não
existem autovalores (o polinômio caracterı́stico não tem raı́zes reais), ou existe um único autovalor
(duas raı́zes reais iguais) ou existem dois autovalores distintos (duas raı́zes reais distintas).
Exercı́cio. Dê exemplos de matrizes 2 × 2 de cada um dos três tipos acima.
Antes de demonstrar o teorema, vamos ver como utilizá-lo.
Exemplo. Vamos estudar a equação 5x2 + 12xy = 1. Na sua forma matricial,

5 6 x
x y = 1.
6 0 y

5 6
Pelo que diz o teorema, devemos procurar as direções invariantes de M = , ou seja, temos
6 0
5−λ 6
que calcular os os autovalores da matriz M : a equação caracterı́stica é det = 0,
6 0−λ
isto é, λ2 − 5λ − 36 = 0, equação que podemos resolver de cabeça e obter as duas raı́zes: λ1 = 9 e
λ2 = −4.

x
Para o cálculo dos autovetores associados a λ1 = 9, procuramos soluções não nulas V = do
y
x 5−9 6 x
sistema (M − 9I) = 0, ou seja, = 0, ou ainda
y 6 0−9 y
(
−4x + 6y = 0
.
6x − 9y = 0
Como era de se esperar, as equações são múltiplas (afinal de contas os valores de λ foram calculados
para isso) e para escrever a solução basta olhar uma delas, por exemplo, dividindo a primeira por
−2, ficamos com 2x − 3y = 0. Isolando
uma dasincógnitas,
por exemplo,
xem função
de y,
3y/2 3/2 3
vemos que a solução é S1 = |y ∈ R = y |y ∈ R = y |y ∈ R , a reta
y 1 2
3
gerada pelo vetor . Qualquer vetor não nulo desta reta é autovetor associado ao autovalor 9,
2
3
escolhemos V1 = .
2
Para calcular um autovetor associado ao autovalor λ2 = −4, repetimos o processo e resolvemos o

−2
sistema (M −(−4)I)V = 0 e tomar uma solução particular, por exemplo, V2 = . Veremos um
3
pouco adiante que se os autovalores da matriz da forma quadrática são distintos, então as direções
invariantes são automaticamente ortogonais. Sabendo disso, para calcular V2 poderı́amos simples-
mente tomar a única direção perpendicular a V1 em R2 (como basta ser não nulo e perpendicular
a V1 , é fácil escolher V2 ).
Exercı́cio. Verifique, sem resolver o sistema, que V2 e λ2 sao autovetor e autovalor associados da
matriz M .
47
Obtidos os autovetores, vamos considerar uma mudança de base, da base canônica para a base de
autovetores da matriz M . Finalizando o exemplo, vamos escrever a equação 5x2 + 12xy = 1 nas
coordenadas (x0 , y 0 ) definidas pela base {V1 , V2 }.

5 6 x
Para tanto, a partir da equação original x y = 1, escrita como X t M X = 1, e da
6 0 y
equação de mudança de base X = AX 0 , onde A = [V1 , V2 ] (colunas), substituimos X por AX 0
(consequentemente X t por X 0t At ) e ficamos com
X 0t At M AX 0 = 1.

t 117 0
Uma simples multiplicação de matrizes nos leva a A M A = , uma matriz diagonal, o
0 −52
que nos diz que a equação procurada é 117x02 −52y 02 = 1, equação de uma hipérbole que já sabemos
x02 y 02
colocar na forma normal − = 1 e consequentemente desenhá-la no sistema (x0 , y 0 ).
1 2 1 2
(√ ) (√ )
117 52
E, como sabemos localizar esse novo sistema a partir do usual, sabemos esboçar a solução da nossa
equação no sistema usual. Um esboço está na próxima figura.
Note que os eixos x0 e y 0 têm direção determinadas pelos autovetores de M e são eixos de simetria
da solução da equação.
13.2 Matrizes ortogonais 2x2
Observação. Para esboçar a curva no sistema (x0 , y 0 ) temos que tomar algum cuidado com a
escala, já que os autovetores V1 e V2 determinam também a unidade de medida dos novoseixos.

V1 1 3
Para contornar esta situação, podemos escolher autovetores unitários W1 = = √ e,
kV1 k 13 2
V2 1 −2
do mesmo modo, W2 = =√ .
kV2 k 13 3
Nesse caso, além de tornar desnecessário o cuidado com a mudança
de escala, a matriz dos autove-
1 3 −2
tores (vamos chamá-la ainda de A), fica [W1 , W2 ] = √ , e o cálculo At M A nos fornece
13 2 3
9 0
a matriz D = , chamada matriz dos autovalores, donde pode-se imediatamente concluir
0 −4
que a equação, nas novas coordenadas, é 9x02 − 4y 02 = 1.
Assim, há pelo menos duas vantagens em escolhermos autovetores unitários: não mudamos a escala
dos eixos coordenados e, ao fazermos a mudança de coordenadas da equação, já sabemos quem vão
ser os coeficientes de x02 e y 02 : exatamente os autovalores.
Na verdade, matrizes cujas colunas são vetores unitários e ortogonais são particularmente impor-
tantes.
48
49
Definição. Uma base do plano na qual os vetores são unitários e ortogonais é chamada base
ortonormal (“orto” de ortogonal e “normal” de normalizada para que seus módulos sejam 1). Uma
matriz cujas colunas são uma base ortonormal é chamada de matriz ortogonal.
Exercı́cios (propriedades de matrizes ortogonais).
1. Se A é uma matriz ortogonal, então | det A| = 1. A recı́proca é verdadeira? Isto é, se uma
matriz A tem seu determinante valendo 1 ou −1, então ela é ortogonal?
2. Se A é uma matriz ortogonal, então A−1 = At . A recı́proca é verdadeira? Isto é, matrizes
quadradas que satisfazem A−1 = At são ortogonais?
3. Matrizes ortogonais preservam produto escalar. Isto é, se A é uma matriz ortogonal e U e V
são dois vetores quaisquer, então AU · AV = U · V .
Observações (que podem ajudar a resolver os exercı́cios acima).
1. Se A é uma matriz ortogonal e A = [V, W ] (colunas), então V · V = 1, pois V · V = kV k2 = 1

já que V é unitário, e o mesmo vale para W : W · W = 1. E, como V e W são ortogonais,
temos V · W = 0.
2. O produto escalar pode ser escrito como produto de matrizes,

escrevendo
o primeiro vetor
u1 v
como linha e o segundo como coluna. De fato, se U = e V = 1 , então
u2 v2

v1
U · V = u1 v1 + u2 v2 = u1 u2 = U t V.
v2
Este modo de escrever o produto escalar nos mostra que uma matriz qualquer M “passa de um
lado para o outro” num produto escalar a partir de sua transposta: (M U ) · V = (M U )t V =
(U t M t )V = U t (M t V ) = U · (M t V ).
Para “sentir” esta propriedade, dê exemplos de uma matriz 2 × 2 M e de vetores U e V ,

calcule M U e M t V e os produtos escalares (M U ) · V e U · (M t V ) e veja que são iguais.
Falta ainda a demonstração do teorema enunciado. O melhor tı́tulo para isso é o seguinte:
13.3 Diagonalização de matrizes simétricas 2 × 2
Passemos agora à demonstração do Teorema. O resultado nos diz que a equação quadrática
X t M X = d admite um sistema cartesiano de coordenadas (x0 , y 0 ) cujos eixos são eixos de si-
metria da solução (ou seja, o coeficiente de x0 y 0 na equação é nulo), dado por direções invariantes
da matriz simétrica M .

a b
Então, vamos partir da matriz simétrica M = e encontrar seus autovalores e autovetores.
b c
50
A equação caracterı́stica de M é det(M − λI) = 0, ou (a − λ)(c − λ) − b2 = 0, ou ainda λ2 − (a +
c)λ + ac − b2 = 0. Para resolver esta equação, calculamos o ∆ = (a + c)2 − 4ac + 4b2 . Simplificando,
podemos escrever ∆ = (a − c)2 + (2b)2 , isto é, ∆ é uma soma de quadrados. Assim, certamente
∆ ≥ 0, o que significa que existem autovalores reais.
Façamos separadamente a análise para ∆ = 0e para ∆ > 0. Se ∆ = 0, então a = c e b = 0. Ora,

a 0
nesse caso, a matriz M já é diagonal: M = . A equação caracterı́stica é (λ − a)2 e a é o
0 a
único autovalor. Todas as direções do plano são direções invariantes de M , em particular os eixos x
e y do sistema usual são eixos de simetria para a equação original (que, nesse caso, é ax2 +ay 2 = d).
Assim, se ∆ = 0, o teorema é válido.
Vejamos agora o que acontece quando ∆ > 0. Nesse caso, a equação caracterı́stica tem duas raı́zes
reais distintas, vamos chamá-las λ1 e λ2 . Escolha autovetores unitários W1 associado a λ1 e W2
associado a λ2 . Vamos mostrar que W1 e W2 são mais que uma base: eles não são apenas não
paralelos, mas são ortogonais.
Ou seja, vamos mostrar que W1 · W2 = 0. Para ver isso, usando a observação 2 acima, podemos
escrever (M W1 ) · W2 = W1 · (M t W2 ), mas, como M é simétrica, temos M t = M , o que nos dá
(M W1 ) · W2 = W1 · (M W2 ).
Mas M W1 = λ1 W1 e M W2 = λ2 W2 , pois são autovetores e autovalores associados. Portanto
(λ1 W1 ) · W2 = W1 · (λ2 W2 ).
Olhando novamente para observação 2 acima, que nos diz que o produto escalar pode ser visto
como produto de matrizes, e usando a propriedade associativa do produto de matrizes, segue
λ1 (W1 · W2 ) = λ2 (W1 · W2 ),
que, passando para o mesmo lado da equação e fatorando, é o mesmo que
(λ1 − λ2 )(W1 · W2 ) = 0.
Ora, λ1 − λ2 6= 0, pois são raı́zes distintas da equação caracterı́stica. Concluı́mos que W1 · W2 = 0 e

que os autovetores são ortogonais. Ou seja, ficou demonstrado para matrizes 2 × 2 (e que também
vale para n × n em geral) o seguinte resultado:
Proposição 13.1 Para matrizes simétricas, autovetores associados a autovalores distintos são or-
togonais.
Assim, conseguimos uma base ortonormal {W1 , W2 } que define eixos x0 e y 0 que devem ser eixos de
simetria para a equação original. Para verificar isto, basta olhar para a equação neste novo sistema
de coordenadas e constatar que o coeficiente de x0 y 0 é nulo.
51
A relação entre as coordenadas
usuais e asnovas coordenadas é X = AX 0 , onde A = [W1 , W2 ] é a
x0

x
matriz dos autovetores, X = e X0 = .
y y0
então, a forma quadrática X t M X, nas novas coordenadas, é escrita
X 0t At M AX.
Como At = A−1 (vide exercı́cio 2 acima), podemos escrever
X 0t A−1 M AX.

−1 λ1 0
Afirmamos que A M A = D, onde D = é a matriz (diagonal) dos autovalores. Note
0 λ2
que, uma vez mostrado esse fato, a forma quadrática, nas coordenadas (x0 , y 0 ) fica λ1 x02 + λ2 y 02 ,
donde a equação de fato terá x0 e y 0 como eixos de simetria. Mais ainda, uma vez demonstrado o
teorema, ao calcularmos os autovalores, saberemos imediatamente como será a equação na base de
autovetores.
Mostrar que A−1 M A = D é equivalente a mostrar que M A = AD. O lado esquerdo desta
equação pode ser escrito M [W1 , W2 ]. É um exercı́cio de multiplicação de matrizes ver que M A =
[M W1 , M W2 ] que por sua vez é igual a [λ1 W1 , λ2 W2 ].

λ1 0
Já para o lado direito temos AD = [W1 , W2 ] e a partir daqui é um simples exercı́cio de
0 λ2
multiplicação de matrizes ver que AD = [λ1 W1 , λ2 W2 ], concluindo que a igualdade é válida.
O teorema está demonstrado. Uma outra forma de se enunciar os mesmos resultados com outras
palavras é:
Teorema 13.2 Matrizes simétricas são diagonalizáveis por bases ortonormais, isto é, dada uma
matriz simétrica 2 × 2 M , existem matrizes A ortogonal e D diagonal tais que M = ADA−1 .
O leitor pode perguntar se, antes de fazermos a mudança de coordenadas de modo a que a equação
fique numa “forma normal”, se já se sabe que tipo de solução a equação apresenta. Para responder
a esta pergunta, a primeira observação é o fato que existem três tipos de equações resultantes no
sistema (x0 , y 0 ) dado por uma base de autovetores de M . E o tipo da equação depende do produto
dos autovetores, isto é, det D.
Se ambos os autovalores têm mesmo sinal (isto é, det D > 0), então a equação fica λ1 x02 + λ2 y 02 = d
e multiplicando por −1 se necessário, podemos supor os coeficientes de x02 e y 02 ambos positivos e,
consequentemente, a solução depende da constante d: se d > 0, então é uma elipse (admitindo o
cı́rculo como caso particular quando os autovalores são iguais); se d = 0 é um ponto (a origem) e
se d < 0 a solução é vazia. Equações assim são chamadas de tipo elı́ptico.
Já se os autovalores têm sinais opostos (det D < 0), então o mesmo acontece com os coeficientes de
x02 e y 02 na equação e a solução pode ser uma hipérbole, caso d 6= 0 ou um par de retas concorrentes,
caso d = 0. Estas são as de tipo hiperbólico.
52
A última possibilidade, uma equação de tipo parabólico ocorre quando um dos autovalores é zero
(ou det D = 0). Trocando a ordem dos autovalores se necessário, podemos supor λ2 = 0. Nesse
caso a equação assume a forma λ1 x02 = d, ou equivalentemente x02 = d0 (constante), e a solução
pode ser vazia, uma reta ou um par de retas paralelas, caso d < 0, d = 0 e d > 0 respectivamente.
Exemplos de todos os casos acima foram dados na seção “Cônicas”. O que fizemos (a análise
de todas as possibilidades) nos permite concluir que são todos os casos. Observe também que
o raciocı́nio acima nos diz uma vez mais que a parábola não ocorre como solução da equação
ax2 + bxy + cy 2 = d.
Exercı́cio. Na verdade, poderı́amos saber se uma equação é do tipo elı́ptico, hiperbólico ou

parabólico antes mesmo de calcular os autovalores: mostre que det M = det D.
14 Mudança de origem
Continuando no sentido de estudar a forma mais geral de equações quadráticas no plano, precisa-
remos entender mudanças de origem.
Para isso, vamos considerar sistemas de coordenadas com a mesma base - a base usual {i, j} - mas
origens diferentes. Escolha pontos O e Q no plano e defina coordenadas usuais (x, y) do sistema
{O, {i, j}} e (x0 , y 0 ) do sistema {Q, {i, j}}.
Seja B um ponto qualquer do plano. Suas coordenadas em relação à origem O são as coordenadas
−−→ −−→
do vetor OB e em relação à origem Q são as coordenadas de QB. Note que os pontos O, Q e
−−→ −→ −−→
B, a partir da definição de adição de vetores, satisfazem OB = OQ + QB. Esta equação, quando
observada do sistema usual de coordenadas, nos diz
X = Q + X 0,
onde X são as coordenadas do ponto B no sistema usual e X 0 as coordenadas de B em relação

à origem Q. Esta equação relaciona dois sistemas de coordenadas com mesmas bases, mas com
origens distintas.
53
y
y’
Q x’
x
O
Exemplos.
1. Seja Q o ponto (−1, 3) do plano. Sejam (x, y) coordenadas usuais e (x0 , y 0 ) coordenadas em
relação à origem Q. Se B é um ponto do plano, vamos denotar por BQ suas coordenadas em
relação a Q e, como de praxe, quando não houver
ı́ndice, isto significa que as coordenadas
2
são as do sistema usual. Por exemplo, se B = , para obter BQ basta olhar para a relação
2
2 −1 3
entre os sistemas de coordenadas e obter BQ = B − Q = − = .
2 3 −1
2. Um cı́rculo de raio 1 e centro Q = (5, 2) tem equação (x − 5)2 + (y − 2)2 = 1. De fato, observe
primeiramente que, nas coordenadas (x0 , y 0 ) definidas pelo sistema {(5, 2), {i, j}}, a equação
deste cı́rculo é x02 + y 02 = 1. Usando X 0 = X − Q, isto é, substituindo x0 = x − 5 e y 0 = y − 2,
obtemos a equação anunciada.
3. A parábola y = 4x2 −6x+1 pode ter seu vértice identificado a partir de um completamento de
3
quadrados: escrevemos y = 4(x2 − x) + 1 e procuramos uma constante positiva k 2 para que
2
3
o trinômio de segundo grau x − x + k 2 seja quadrado perfeito. Fazemos isso comparando-o
2
2
2 2 2 3
com (x − k) = x − 2kx + k , obtendo − x = −2kx. Como esta relação deve valer para
2
54
3 9
todo x, encontramos k = e consequentemente k 2 = . Voltando à equação original da
4 16
parábola, temos
3
y = 4(x2 − x) + 1
2
3
y = 4(x2 − x + k 2 − k 2 ) + 1
2
3 9 9
y = 4(x2 − x + ) − 4 + 1
2 16 16
3 5
y = 4(x − )2 −
4 4
5 3 5
Finalmente, escrevemos esta equação como y + = 4(x − )2 . Ao fazermos y 0 = y + e
4 4 4
0 3 0 02
x = x − , a equação fica numa forma normal y = 4x , cujo vértice é a origem do sistema
4
(x0 , y 0 ).
Para encontrar esta origem Q, basta olharmos para a equação de mudança de origem, X 0 =
2 2
X − Q (note termos comparado com (x − k) em vez de(x + k) ).
queesteé o motivo por
0
x x − 3/4 3/4
Como temos = , segue que o vértice procurado é Q = .
y0 y − (−5/4) −5/4
15 Equações quadráticas em sua forma geral

Temos agora todas as ferramentas para estudar uma equação quadrática em duas variáveis na sua
forma mais geral: ax2 + bxy + cy 2 + dx + ey = f . A técnica é analisar primeiro a forma quadrática,
fazer uma mudança de base e encontrar um sistema de coordenadas cujos eixos são paralelos aos
eixos de simetria da solução; depois, fazer uma mudança de origem (completando quadrados, por
exemplo) para chegar a um sistema de eixos no qual a equação se escreva em sua forma normal.
Considere, por exemplo, a equação

√ √ 15
14x2 − 4xy + 11y 2 − 6 5x + 18 5y = − .
2

14 −2 x
A forma quadrática desta equação é x y = X t M X. Para achar as direções dos
−2 11 y
eixos de simetria da solução, procuramos os autovetores de M .
A equação caracterı́stica, det(M − λI) − 0 é a equação de segundo grau λ2 − 25λ+ 150 =0, cujas
15 0
raı́zes são λ1 = 15 e λ2 = 10. A matriz dos autovalores é portanto a matriz D = .
0 10
55

−1 −2 x
Para calcular os autovetores associados a λ1 = 15, o sistema a ser resolvido é = 0,
−2 −4 y
−2
cuja solução é a reta de equação x + 2y = 0, isto é, y |y ∈ R , da qual escolhemos o vetor
1
−2 1 −2
diretor . Dividindo por seu módulo para torná-lo unitário, obtemos V1 = √ .
1 5 1
Para calcular os autovetores associados a λ2 = 10, podemos resolver o sistema correspondente ou
simplesmente usar o teorema de diagonalização,
que afirma que são ortogonais a V1 , e obtemos, por
1 1
exemplo, o vetor unitário V2 = √ .
5 2

1 −2 1
A matriz dos autovetores é portanto A = √ ; assim já sabemos localizar sistema de
5 1 2
coordenadas (x0 , y 0 ).
y’
x’
V2
V1
Escrevendo a equação original

√

14 −2 x x 15
x y + 5 −6 18 =−
−2 11 y y 2
e fazendo a mudança de base X = AX 0 , já vimos que a parte quadrática fica 15x02 + 10y 02 . Assim,
a equação, nas coordenadas (x0 , y 0 ) é
56
√
0
02 02
1 −2 1 x 15
15x + 10y + 5 −6 18 √ 0 =− ,
5 1 2 y 2
15 3
que se simplifica em 15x02 + 10y 02 + 30x0 + 30y 0 = − , ou ainda 3x02 + 2y 02 + 6x0 + 6y 0 = − .
2 2
A segunda mudança de coordenadas é uma mudança de origem, e se faz completando os quadrados.
Não é difı́cil ver que a equação pode ser escrita
9 9 3
3(x02 + 2x0 + 1) − 3 + 2(y 02 + 3y 0 + ) − = − ,
4 2 2
ou ainda
3
3(x0 + 1)2 + 2(y 0 + )2 = 6.
2
0
!
00
x x + 1
Fazendo a mudança de origem = 3 e comparando com X 00 = X 0 − Q, onde o ponto
y 00 y0 +
2
Q é a!origem do sistema (x00 , y 00 ), concluimos que as coordenadas do ponto Q no sistema (x0 , y 0 ) são
−1
3 . Assim, sabemos localizar o sistema (x00 , y 00 ) no sistema (x0 , y 0 ), marcando as coordenadas
−
2
da origem Q do sistema (x00 , y 00 ), nos eixos x0 e y 0 .
x002 y 002
Note que agora, a equação tem uma forma normal: 3x002 +2y 002 = 6, que é equivalente a + =
√ 2
√ 3
1, equação de uma elipse que corta o eixo x00 nos pontos ± 2 e o eixo y 00 nos pontos ± 3.
Juntando as peças, conseguimos localizar a elipse no sistema origial de coordenadas.
16 Mais exercı́cios
1. Seja {U, V } uma base do plano. Mostre que {U + V, U − V } também é base. Em geral,
determine a condição sobre a, b, c, d ∈ R para que {aU + bV, cU + dW } também seja base do
plano.

1
2. Escreva os vetores da base canônica do plano como combinação linear dos vetores e
2
2
.
1
3. Qual é a equação da reta r : 8y − 3x = 2 nas coordenadas (x0 , y 0 ) dadas pela base {j, −i}? (i
e j são os vetores da base canônica).

0 1 1
4. Considere a mudança de base X = AX , onde A = e X são coordenadas usuais. Os
1 2
0 3 −1
vetores cujas coordenadas no sistema X são e são ortogonais?
1 3
57
58
5. Na base canônica, a condição algébrica que determina paralelismo de vetores é: U e V são
paralelos se e somente se V = αU para algum α ∈ R. Numa base qualquer {W1 , W2 } esta
condição também é verdadeira?
6. Seja R a rotação de 45o no sentido positivo. Qual é a equação da parábola x2 = 2y no sistema

(x0 , y 0 ) dado pela base {Ri, −(Rj)}?
7. Quando giramos a hipérbole de equação 2x2 − y 2 = 1 de 60o no sentido negativo, obtemos a

curva h. Qual é a equação de h?
8. A elipse E é tangente interiormente à circunferência x2 + y 2 = 16, tangente exteriormente

à circunferência x2 + y 2 = 1 e tem focos sobre a reta y = x. Faça esboços das situações e
determine a equação de E nos seguintes casos:
(a) E tem dois pontos de tangência com cada uma das circunferências.
(b) E tem um ponto de tangência com cada uma das circunferências.
9. Uma hipérbole passa pela origem do sistema de coordenadas e tem como assı́ntotas as retas
x = 4 e y = −2. Qual é sua equação?
10. Faça mudanças de origem de modo que a equação fique puramente quadrática e esboce o
gráfico de sua solução para:
(a) 2x2 + 3y 2 − 8x − 6y + 11 = 0.
(b) 4x2 − 3y 2 + 8x + 12y − 8 = 0.
11. Faça mudanças de base para que a equação tenha a forma quadrática representada por uma
matriz diagonal (isto é, de modo que o coeficiente de x0 y 0 seja nulo) e esboce o gráfico da
solução para:
(a) x2 + 4xy + 4y 2 − 9 = 0.
(b) 2xy − 3y 2 = 5.
12. Para cada uma das equações abaixo, faça mudanças de coordenadas adequadas para trans-
formá-la numa forma normal e esboce o gráfico da solução.
(a) 2x2 − 4xy − y 2 + 20x − 2y + 17 = 0.

(b) 7x2 − 8xy + y 2 − 2x − 4y = 1.
(c) x2 + 2xy + y 2 − 4x + 1 = 0.
(d) 3x2 + 10xy + 3y 2 − 2x − 14y − 5 = 0.
(e) 12x2 + 24xy + 19y 2 − 12x − 40y + 31 = 0.
(f) x2 + 2xy + 5y 2 − 4x + 6y = 3 = 0.
(g) x2 + 2xy + y 2 + 2x − 4y + 1 = 0.
√ √
(h) x2 + 2xy 3 + 3y 2 + 2x 3 − 2y = 0.
13. Exercı́cios 6.3 do livro do Reginaldo.
59
17 Geometria Analı́tica Espacial
Vamos estudar nesta seção retas e planos no espaço, como representá-los algebricamente, suas
posições relativas, paralelismo e perpendicurarismo, interseções, ângulos e distâncias, e um pouco
de álgebra linear em dimensão três, em particular, sistemas de equações lineares com três incógnitas
que aparecem como modelos de diversos problemas geométricos e, embora ainda sem um tratamento
sistemático, não devemos hesitar em resolvê-los e interpretá-los.
17.1 Alguns fatos básicos de Geometria Euclidiana espacial
É preciso recordar alguns fatos da Geometria Euclidiana para que, com maior familiaridade, pos-
samos trabalhar com mais desenvoltura.
1. Dois pontos distintos no espaço determinam uma única reta. Retas em geral serão denotadas
por letras minúsculas do nosso alfabeto, por exemplo, r, s.
2. Três pontos não colineares no plano determinam um único plano. Planos serão denotados
por letras minúsculas gregas, como α, γ, π.
3. Se um plano contém dois pontos de uma reta, então ele contém todos os pontos daquela reta.
4. Dadas duas retas, elas podem ser coplanares (e, neste caso, são paralelas ou concorrentes)
ou não coplanares (chamadas de reversas). Um exemplo de retas reversas são arestas não
paralelas de faces opostas de um cubo.
5. Dados uma reta r e um ponto P , por P passa uma única reta paralela a r. Em geometria
plana, isto é um aximoma. Em geometria espacial não, mas não vem ao caso demonstrá-
lo neste curso. O leitor mais curioso pode ler o livro do Paulo Cezar Pinto Carvalho de
Geometria Espacial para detalhes.
Observação. Há outros modos possı́veis de se determinar um plano no espaço, reduzindo

cada caso à escolha de três pontos não colineares:
(a) Uma reta e um ponto fora dela. De fato, tome dois pontos distintos da reta e o ponto
fora dela; temos aı́ três pontos não colineares, logo um plano. Este plano, é claro, contém
a reta e o ponto dados.
(b) Duas retas concorrentes. De fato, tome o ponto de interseção e um ponto (distinto dele)
em cada reta; temos aı́ três pontos não colineares, logo um plano. Este plano contém
ambas as retas.
(c) Duas retas paralelas. Dadas duas paralelas, digamos r e s, tome um ponto A ∈ r e
B, C ∈ s, com B e C distintos; temos aı́ três pontos não colineares e portanto um plano
α. Este plano, é claro, contém s; para ver que também contém r, basta lembrar que, em
α, existe uma única reta por A e paralela a s. Esta reta tem que ser r, pois r é a única
reta do espaço que contém A e é paralela a s.
60
Observação. Estes modos de ser determinar um plano são intrı́nsecos, isto é, dependem de
objetos (retas e/ou pontos) contidos no plano.
Os próximos fatos também nos serão muito importantes, mas antes é necessário pensarmos
um pouco no que vem a ser o ângulo entre duas retas no espaço. Se as retas em questão são
coplanares, então ou são paralelas e o ângulo entre elas é zero, ou são concorrentes e definimos
o ângulo entre elas como sendo o menor dos dois formados; caso sejam iguais, ambos são retos
e as retas são perpendiculares. Se as retas, digamos r e s, não são coplanares, então escolha
um ponto qualquer P do espaço e por ali trace r0 paralela a r e s0 paralela a s. As retas r0 e
s0 são concorrentes (não são iguais porque r e s não são paralelas). Definimos o ângulo entre
r e s como sendo o ângulo entre r0 e s0 .
Exercı́cio. Escolha um ponto Q 6= P e por ali tome r00 e s00 paralelas a r e s respectivamente.
Mostre que ](r0 , s0 ) = ](r00 , s00 ), isto é, a definição de ângulo entre duas retas reversas não
depende do ponto escolhido para traçar as parelelas.
Voltemos aos fatos.
6. Duas retas paralelas a uma terceira são paralelas entre si.
7. A definição de perpendicularismo entre uma reta e um plano é a seguinte: dizemos que a reta
r é perpendicular ao plano α (e denotamos r ⊥ α) se r é ortogonal a todas as retas de α.
O fato que interessa aqui é: se uma reta é ortogonal a duas retas concorrentes de um plano,
então é ortogonal a todas as retas daquele plano, logo perpendicular ao plano.
Observação. A palavra “perpendicular” é reservada a objetos que se encontram, já a palavra

“ortogonal” pode ser usada em qualquer situação. Por exemplo, retas reversas podem ser
ortogonais, mas não perpendiculares.
8. Dados uma reta r e um ponto P , por P existe um único plano perpendicular a r.
9. Dados um plano π e um ponto P , por P existe uma única reta perpendicular a π.
Observação. Assim, uma outra maneira de se determinar um plano é por um ponto por
onde passa o plano e uma reta perpendicular ao plano. Não é intrı́nseco, já que necessita de
uma reta perpendicular, ou seja, um objeto que não está no plano.
Relembrando mais alguns fatos:
10. Duas retas perpendiculares a um mesmo plano são paralelas.
11. Dois planos perpendiculares a uma mesma reta são paralelos (dois planos são paralelos se não
se encontram).
12. Dois planos não paralelos se interceptam segundo uma reta. Em outras palavras, se a in-
terseção de dois planos distintos contém um ponto, então contém mais um, sendo sua in-
terseção exatamente a reta determinada por estes dois pontos.
61
13. Dizemos que dois planos são perpendiculares se o ângulo entre eles é 90o . Para caracterizar
esse fato, usamos a unicidade da direção perpendicular a um plano. Mais precisamente, dados
os planos π1 e π2 , tome r1 reta perpendicular a π1 e r2 perpendicular a π2 . Então π1 e π2 são
perpendiculares se e somente se r1 e r2 são ortogonais. Este fato não depende da escolha das
retas, pois quaisquer retas perpendiculares a π1 e π2 são respectivamente paralelas a r1 e r2 .
17.2 Pontos e vetores em R3
Vamos fixar um sistema de coordenadas cartesianas no espaço, um modo de associar a um ponto

do espaço uma tripla ordenada de números reais. Em analogia com o que se fez no plano, tome
três eixos, dois a dois perpendiculares, com origem comum no ponto de interseção e com mesma
unidade de medida. Cheme-os de eixos x, y e z e oriente-os de modo que o giro do raio positivo do
eixo x para o raio positivo do eixo y seja no sentido positivo (anti-horário), o mesmo acontecendo
com os giros do raio positivo do eixo y ao raio positivo do eixo z e do raio positivo do eixo z ao
raio positivo do eixo x. O espaço munido de um sistema cartesiano de coordenadas recebe o nome
de R3 .
incluir desenho
Os planos determinados pelos pares de eixos xy, yz e xz são chamados planos coordenados. Dado
um ponto B no espaço, por B existe uma única
reta perpendicular ao plano xy, esta reta intercepta
a
o plano xy num ponto, digamos Q. Sejam as coordenadas do ponto Q no plano xy. Por B
b
passa um único plano perpendicular ao eixo z, este plano intercepta o eixo z num ponto, digamos
M . O ponto M definenoeixo z um número real c. Assim ficam definidas as coordenadas do ponto
a
B e escrevemos B =  b .
c
Se, por um lado, um ponto define uma tripla ordenada de números reais de maneira única, recipro-
camente uma tripla ordenada de números reais define exatamente um ponto.
O conceito de vetor no espaço é o mesmo já estudado no plano, o que muda agora é o ambiente.
Um vetor no espaço é um segmento orientado, definido por seu comprimento (módulo ou norma),
direção e sentido. A adição de vetores e a multiplicação de vetor por escalar têm exatamente as
mesmas definições geométricas que havia no plano, inclusive vale também no espaço a regra do
paralelogramo para a adição. A exemplo do que acontecia no plano, as coordenadas de um vetor
do espaço são as coordenadas de seu ponto final quando tomamos um representante que começa na
origem do sistema. Ou seja matrizes 3 × 1 representam tanto pontos como vetores.
−→
Exatamente como foi feito para vetores no plano, algebricamente podemos escrever AB = B − A,
isto é, as coordenadas de um vetor são a diferença entre as coordenadas de seu ponto final e as
coordenadas do seu ponto inicial.
As operações lineares (adição e multiplicação por escalar) são compatı́veis, em coordenadas, com
as mesmas operações entre as matrizes (colunas 3 × 1) que representam os vetores, isto é, definidas
entrada a entrada da matriz. E daqui podemos concluir que dois vetores são paralelos (isto é, têm
62
mesma direção) se e somente se são múltiplos escalares. Como o vetor nulo é múltiplo escalar de
→
−
todos os outros, 0 é paralelo a todos os vetores.
O módulo de um vetor pode ser agora calculado usando-se duas vezes Teorema de Pitágoras: com a
−−→
mesma nomenclatura do primeiro pagrágrafo, suponha que o V = OB, onde O é a origem. Então,
−−→ −→
por Pitágoras temos kOBk2 = kOQk2 + c2 e, usando Pitágoras novamente, desta vez no plano xy,
−−→
segue kOBk2 = a2 + b2 + c2 .
incluir desenho
O produto escalar também tem a mesma definição: Se V e W são vetores de R3 , então V · W =

kV kkW k cos θ, onde θ é o ângulo entre V e W , que varia entre 0 e 180o . Assim, V · W = 0 ocorre
exatamente quando um deles é o vetor nulo ou, quando ambos são não nulos, θ = 90o . Com a
convenção que o vetor nulo é ortogonal a todos os vetores, podemos dizer que dois vetores são
ortogonais se e somente se o produto escalar entre eles é zero. O mesmo argumento usado quando
t
o ambiente era o plano, a Lei dos Cossenos, permiteconcluir
  coordenadas, V · W = V W
que,em
1 2
(como produto de matrizes). Por exemplo, Se V = 2 e W = 1, então
3 2
     
1 2 2
V · W = 2 · 1 = 1 2 3 1 = (1)(2) + (2)(1) + (3)(2) = 10.
   
3 2 2
Vale lembrar que podemos escrever, para qualquer vetor V ∈ R3 , kV k2 = V · V .
17.3 Retas e planos no espaço
Retas no espaço são determinadas por dois pontos distintos. Equivalentemente, por um ponto e
um vetor diretor não nulo. Assim, da mesma forma que no plano, a representação paramétrica
para uma reta no espaço tem a forma r : A + tV, t ∈ R, onde A é um ponto e V um vetor diretor.
Lembre-se que uma parametrização é um sistema de coordenadas, isto é, torna a reta um eixo, com
origem em A, unidade de medida kV k e sentido positivo dado pelo sentido de V .
     
3 2 3 + 2t
Por exemplo, Se A = −1 e V = −2, temos r : −1 − 2t. Podemos então interpretar a
−6 3 3t − 6
3
reta r como
 imagem  de uma função P : R → R , onde a variável independente é o parâmetro t:
3 + 2t
P (t) = −1 − 2t. Dizemos que o ponto P (t) é o ponto genérico de r.
3t − 6
Assim,
  é fácil escolher pontos de r além deA: escolha
 valores para t. Se t = 1, temos P (1) =
5 −5
−3 ∈ r e para t = −4, temos P (−4) =  7  ∈ r.
−3 −18
63
Também é fácil decidir se um ponto está ou não em 
r. Trata-se
 de resolver um sistema de três
−1
equações e uma incógnita. Por exemplo, o ponto B =  3  pertence à reta r porque o sistema
−12
P (t) = B tem solução: de fato,

3 + 2t = −1

−1 − 2t = 3

3t − 6 = −12

 
7
tem solução única t = −2, portanto B = P (−2) ∈ r. Já para o ponto C = −5, o sistema
2
P (t) = C fica

3 + 2t = 7

−1 − 2t = −5 ,

3t − 6 = 2

que não tem solução, pois, para satisfazer as duas primeiras equações deverı́amos ter t = 2, mas
para a terceira teria de ser t = 8/3. Assim, C 6∈ r.
Se, em duas parametrizações, observamos que as retas têm vetores diretores múltiplos, então são
paralelas ou iguais. Para decidir, escolha um ponto de uma e verifique se pertence ou não à outra.
No primeiro caso são iguais, no último, são paralelas.
Outra maneira de se interpretar a representação paramétrica de r : A + tV , t ∈ R, chamada de

equação paramétrica de r, é dizer que um ponto X do espaço pertence à reta r se e somente se
−−→
X = A + tV , o que é o mesmo que X − A = tV , ou ainda AX = tV , ou seja,
−−→
X ∈ r ⇔ AX é um múltiplo do vetor diretor V .
Exercı́cio. Dê exemplos de parametrizações diferentes para a mesma reta e dê exemplos de para-
metrizações para duas retas paralelas.
Já planos no espaço podem ser determinados por duas maneiras. Uma é intrı́nseca, que sempre leva
a três pontos não colineares, que, em álgebra vetorial equivale a um ponto e dois vetores diretores
não paralelos. A outra, a partir de um ponto e uma reta perpendicular, equivale a um ponto e um
vetor normal.
Considere o plano π determinado por um ponto A e dois vetores não paralelos V e W . Como
já foi visto na seção 12, estes objetos determinam um sistema de coordenadas para o plano, o
que, por sua vez, é exatamente a representação paramétrica deste plano no espaço. Escrevemos
π : A + µV + γW , µ, γ ∈ R. Assim, se X é um ponto genérico do espaço, este ponto pertence a π
−−→
se e somente se AX é uma combinação linear dos vetores V e W . Analogamente ao que foi visto
há pouco para retas, esta maneira de se representar parametricamente o plano, isto é, dizer que
64
−−→
X ∈ π se e somente se existem escalares µ e γ tais que AX = µV + γW , pode ser chamada de
equação paramétrica do plano e também podemos escrever X = A + µV + γW , µ, γ ∈ R.
     
4 1 2
Se, por exemplo, A =  0 , V = −1 e W = 1, o ponto genérico do plano é dado
 −1  3 2
4 + µ + 2γ
por P (µ, γ) =  γ − µ , o plano sendo interpretado como imagem de uma função cujas
3µ + 2γ − 1
variáveis independentes são os parâmetros µ e γ e o contradomı́nio é o espaço R3 . É claro que
temos A = P (0, 0).
É fácil produzir outros exemplos de pontos

emπ, bastando escolher valores para µ e γ. Por exemplo,
9
para µ = −1 e γ = 3, temos P (−1, 3) = 4 ∈ π.
2
Decidir se um certo ponto B está ou não

 no  plano π é modelado por um sistema de três equações
8
e duas incógnitas. Por exemplo, B = −1 pertence a π pois o sistema P (µ, γ) = B,
7

4 + µ + 2γ = 8

γ − µ = −1 ,

3µ + 2γ − 1 = 7

 
7
tem solução única (µ, γ) = (2, 1), logo B = P (2, 1). Mas o ponto C = 7 não pertence a π pois
4
o sistema

4 + µ + 2γ = 7

γ−µ=7

3µ + 2γ − 1 = 4

não tem solução. Isto pode ser observado a partir da solução do subsistema 2x2 formado pela
primeira e pela terceira equações, que tem solução (µ, γ) = (1, 1), mas a substituição de µ = 1 e
λ = 1 na segunda equação torna-a falsa.
Se um plano β é dado por uma representação paramétrica da qual conhecemos a forma geral,
podemos reconhecer o pontoe os dois vetores diretores que definem esta parametrização: por
2 − 2t + s
exemplo, se β :  t − 2s − 1, t, s ∈ R, podemos escrever o ponto genérico como soma de três
1 + 4s
matrizes coluna, observando os coeficientes constantes (o ponto), e os coeficientes dos parâmetros
t e s (os vetores diretores). Assim,
65
     
2 −2 1
β : −1 + t 1 + s −2 , t, s ∈ R.
    
1 0 4
A outra forma de se determinar um plano, a partir de um ponto e de uma direção perpendicular

(ou seja, um ponto e um vetor normal não nulo), dá origem à equação geral do plano. A dedução
é bem simples. Sejam A um ponto e N um vetor normal que determinam o plano π. Então, um
−−→
ponto genérico X pertence a π se e somente se os vetores AX e N são perpendiculares. Ou seja,
−−→
X ∈ π ⇔ AX · N = 0, chamada equação geral de π.
Pela maneira que foi construı́da, vê-se que a equação geral do plano é única, a menos de multi-
plicação por um escalar não nulo.
       
−1 2 x x+1
−−→ −−→
Se, por exemplo, A = −1 e N = −2, sendo X = y , temos AX = y + 1 e AX ·N = 0
3 3 z z−3
se escreve 2(x + 1) − 2(y + 1) + 3(z − 3) = 0, ou ainda 2x − 2y + 3z = 9, que é a equação geral de
π. Daqui já se nota que os coeficientes de x, y e z na equação geral do plano são as coordenadas
de seu vetor normal.
Assim, outra maneira de se escrever a equação de π é dizer que ela é da forma 2x − 2y + 3z = d,

já que sabemos quem são os coeficientes, e calcular a constante d exigindo-se que a equação seja
satisfeita para o ponto A, ou seja, d = 2(−1) − 2(−1) + 3(3) = 9.
 
a
Esta observação é geral: se um plano tem vetor normal N =  b , então sua equação geral é
c
ax + by + cz = d, bastando, para determinar d, saber um ponto pelo qual ele passa.
Para produzir outros pontos do plano π a partir de sua equação, basta tomar coordenadas que
satisfazem a equação. Por exemplo,
  se queremos saber sua interseção com o eixo z, tomamos
0
x = y = 0 e vemos que o ponto 0 ∈ π. E, claro, para verificar se um ponto dado está ou não
3
em π, basta verificar se suas coordenadas satisfazem a equação.
Observações.
1. Ao contrário do que acontece quando o ambiente é R2 , em R3 retas não são dadas por uma
equação. O motivo é que, no plano, dado um ponto e um vetor não nulo (normal), existe uma
única reta que passa pelo ponto e tem direção perpendicular ao vetor dado, mas, no espaço,
existem muitas.
2. Se dois planos distintos têm vetores normais paralelos, então sua interseção é vazia: são
paralelos. Já se os vetores normais são não paralelos, encontram-se numa reta.
3. Dois planos são perpendiculares se e somente se têm vetores normais perpendiculares.
66
Suponha que temos dois planos com vetores normais não paralelos. Então sua interseção - uma
reta - é a solução de um sistema de duas equações e três incógnitas. Por exemplo, os planos
π1 : 3x + 2y + z = 4 e π2 : x − y + z = −1 têm interseção dada pela solução do sistema
(
3x + 2y + z = 4
.
x − y + z = −1
Para resolver, some a primeira linha com o dobro da segunda para obter 5x + 3z = 2. Escrevendo
2 − 3z
x em função de z, temos x = .
5
2 − 3z
Substituindo na segunda equação ficamos com − y + z = −1 e isolando y em função de z
5
7 + 2z
temos .
5
Interpretando z como parâmetro livre,
 
−


 2 3z 

 5 
 

 7 + 2z 
π1 ∩ π2 =   | z∈R ,

  5  

 
 z 
   
2/5 −3/5
que é a reta que passa pelo ponto 7/5 e tem vetor diretor  2/5 .
0 1
É importante saber como, a partir de um plano dado por sua equação, escrever uma representação
paramétrica para ele e vice-versa.
Como exemplo, vamos olhar para a equação do plano π : 2x − 2y + 3z = 9 acima e resolvê-la,

isto é, escrever uma das incógnitas em função das outras duas. Escolhendo
 isolar z, ficamos
 com
x
2 2 y
z = 3 − x + y, e o plano π é o conjunto de pontos do plano da forma  , x, y ∈ R.
 
3 3 2 2
3− x+ y
 3 3
0
Os parâmetros livres são x e y e, podemos identificar facilmente o ponto 0 e os dois vetores
3
   
1 0
 0  1
diretores   e   desta representação paramétrica do plano π.
2 2
−
3 3
Mais uma vez observamos que a representação paramétrica não é única: pelo menos mais duas são
naturais; no exemplo acima poderı́amos ter isolado x ou y como variável dependente.
A pergunta recı́proca, de chegar a equação geral do plano a partir de uma representação paramétrica
pode ser respondida como segue. Suponha que π : A + tV + sW , t, s ∈ R. A única coisa que
67
precisamos é determinar um vetor normal N , o que se faz exigindo que N seja simultaneamente
perpendicular aos vetores não paralelos V e W . Isto pode ser conseguido resolvendo-se um sistema
 
1
de duas equações e três incógnitas. Para ilustrar esta ideia, um exemplo numérico: se V = 2 e

    3
2 a
W = −1, procuramos um vetor normal N =  b  cujo produto escalar com V e com W seja
−1 c
zero, isto é,
(
a + 2b + c = 0 (I)
,
2a − b − c = 0 (II)
que pode ser resolvido somando-se I e II, obtendo 3a + b = 0, ou b = −3a, e substituindo em uma
das equações, digamos em II, ficando
 com 2a + 3a − c = 0 ou c  = 5a. Assim, todos os vetores
a 1
normais a π são da forma −3a, para a 6= 0. Escolhendo N = −3, a equação de π será da
5a 5
forma x − 3y + 5z = d, e a constante d está determinada pelo fato que o ponto A pertence ao plano.
Observação. Há na verdade uma maneira mais rápida de se produzir um vetor N que seja
simultaneamente perpendicular a dois vetores não paralelos V e W . Veremos que, além de facilitar
a passagem de uma representação paramétrica para a equação geral de um plano, há outras situações
onde uma “fábrica de vetores normais” será útil. Isto será feito na próxima seção, com a definição
de produto vetorial entre V e W . Antes, porém, é conveniente pensarmos um pouco mais em retas
e planos no espaço.
Exemplos e exercı́cios. Quando você ler um enunciado, pode ser que ele esteja comentado (no
caso dos exemplos), pode ser que ele esteja proposto como exercı́cio.
 
1
1. Determine a representação paramétrica da reta que passa pelos pontos A = 2 e B =

  3
4
−1;
−1
2. Determine a equação geral e uma representação paramétrica do plano que passa pelos pontos
A e B do exercı́cio anterior e pela origem.
3. 
Determine
 a equação geral do plano paralelo ao do exercı́cio anterior e que passa por C =
7
2.
0
4. Talvez a melhor maneira de se estudar a interseção de uma reta com um plano seja exigir
que as coordenadas de um ponto genérico da reta satisfaça a equação geral do plano. Sejam
68
 
1+t
r : P (t) = 2t − 1 e π : x − 2y + 3z + 9 = 0. Analisamos r ∩ π através da equação
5t
(1 + t) − 2(2t − 1) + 3(5t) + 9 = 0, que,
 simplificando,
 12t + 12= 0, cuja solução é t = −1.
fica 
0 1+µ
Isto nos diz que r ∩ π = P (−1) = −3 . Já a reta u :
   2µ  tem sua interseção com π
−5 2+µ
calculada por (1 + µ) − 2(2µ) + 3(2 + µ) + 9 = 0, que é equivalente a 16 = 0, o que é falso
e implica que a equação não tem solução (isto é, que u é paralela a π. Esta situação, do
coeficiente de µ ser zero, ocorre precisamente quando o vetor diretor da reta e o vetor normal
do plano são perpendiculares, pois o coeficiente de µ na equação da interseção de u e π é
exatamente o produto escalar entre o vetor diretor de u e o vetor normal a π.
5. Considerando o plano π e as retas r e u do item anterior:
(a) Dê exemplo de uma reta paralela a u e contida em π.
(b) Dê exemplo de uma reta reversa a u e contida em π.
(c) Dê exemplo de um plano que contém u e é paralelo a r.
(d) Determine o plano π2 que passa por r ∩ π e é perpendicular a u.
(e) Determine π ∩ π2 .
 
1
6. Determine a reta que passa por P = 1 e é perpendicular ao plano que passa pelos pontos

      1
2 0 2
A = −1 , B = 1 e C =
     3 .
0 8 −4
 
−1
7. Determine o plano que passa por Q =  7  e é perpendicular à reta que passa pela origem
  2
3
e tem vetor diretor 6.
5
8. Duas retas dadas podem ser coplanares (e, nesse caso, são concorrentes ou paralelas) ou
não coplanares (reversas). Para decidir a posição relativa, primeiro olhamos para os vetores
normais. Caso sejam paralelos (múltiplos), então as retas são paralelas ou iguais. Caso
contrário, são concorrentes ou reversas. Para a análise, em ambos os casos podemos igualar o
ponto genérico de uma reta ao ponto genérico da outra, sempre lembrando de mudar o nome
do parâmetro caso necessário. Eis alguns exercı́cios sobre isso:
   
1−t t−2
9. Dadas as retas  t − 2  e  1 − t , determine os valores de a e b para que sejam iguais.
3 + 2t a + bt
   
1−t t−6
10. Mostre que as retas  t − 2  e t − 3 são concorrentes e calcule seu ponto de inteseção.
3 + 2t t+5
69
   
3 1
11. Dê exemplos de retas reversas com vetores diretores 0 e 1.
  
1 4
12. Dois planos serão chamados
  perpendiculares se têm vetores normais ortogonais. Dados π :
1
x − 2y + 2z = 0 e A = 1, obtenha dois planos distintos por A, ambos perpendiculares a

1
π.
 
3 + 2t
13. Dado o plano π : 3x + 2y − z = 10 e a reta r : 2 + 4t, obtenha o único plano perpendicular
t−1
a π que contém r.
14. Dados π e r, discuta, a partir de sua posição relativa, a existência e unicidade de um plano
contendo r e perpendicular a π.
17.4 Produto vetorial e determinantes 3x3
Na seção anterior, ao nos depararmos com o problema de passar da representação paramétrica de

um plano para sua equação geral, vimos que seria útil uma maneira rápida de, dados dois vetores
não paralelos V e W , construirmos um vetor N não nulo e perpendicular a ambos. Este problema
pode ser resolvido em geral por um sistema de duas equações e três incógnitas: as incógnitas são
as coordenadas de N e as equações são V · N = 0 e W · N = 0. Um sistema como este sempre tem
como solução um conjunto com um parâmetro livre; fossem as incógnitas x, y e z, a solução seria
uma reta que passa pela origem. O que vamos fazer é escolher uma solução particular, chamada
produto vetorial entre V e W . Lembre-se que para definir um vetor, precisamos dizer quem é seu
módulo, direção e sentido. A definição a seguir é chamada “geométrica”; o motivo é claro.
Definição. Dados dois vetores quaiquer V e W no espaço, definimos o produto vetorial de V por
W como sendo o vetor V × W que satisfaz:
• (módulo) kV × W k = kV kkW ksen θ, onde θ é o ângulo entre V e W .
Observações.
1. sendo θ um ângulo entre 0o e 180o , temos sen θ ≥ 0, logo teremos kV × W k ≥ 0, como

deveria ser mesmo.
2. É claro que se um dos vetores V ou W for nulo (ou ambos nulos), então o produto
vetorial entre eles também é nulo.
3. Caso V e W sejam paralelos (o que inclui o caso em que um deles é nulo), são vetores
múltiplos e o ângulo entre eles será 0o ou 180o , caso em que sen θ = 0 e o produto
vetorial entre V e W é o vetor nulo. Reciprocamente, sendo ambos V e W não nulos, se
o produto vetorial entre eles é o vetor nulo, então sen θ = 0, logo V e W são paralelos.
Ou seja, V × W = 0 se e somente se V e W são paralelos.
70
4. Quando V e W não são paralelos, então eles formam um paralelogramo cuja área é
calculada como base x altura. Escolhendo V como base, então a altura é a projeção
do ponto final de W na reta onde V está desenhado e, como o ângulo entre eles é θ,
temos que a altura é kW ksen θ, donde a área do paralelogramo é kV kkW ksen θ, não
importanto se θ é agudo, obtuso ou reto. Ou seja, o módulo do produto vetorial é a área
do paralelogramo gerado pelos vetores. Note que, se um deles é nulo ou se são paralelos,
então eles não geram um paralelogramo, o que é coerente com o produto vetorial ser
zero nesses casos.
• (direção) V × W é perpendicular a ambos V e W . Isto define a direção de V × W quando

ele é não nulo, pois, nesse caso, V e W são não paralelos, portanto existe uma e somente uma
direção perpendicular a ambos. E, no caso de V × W = 0, tanto faz.
• O (sentido) de V × W é dado pela regra da mão direita ou pela regra da mão esquerda.
Observações.
1. Procure por ilustrações na internet da regra da mão direita e da mão esquerda. A

descrição da regra da mão direita é a seguinte: imagine que sua mão direita tem o
polegar esticado e os outros quatro dedos alinhados e um pouco dobrados (isto é, não
estão esticados nem totalmente fechados na palma da mão). Se os quatro são setas cujas
pontas são as unhas e se movimentam de V para W ao longo do menor ângulo entre
eles, então o polegar aponta no sentido de V × W . Já a regra da mão esquerda tem a
seguinte descrição: os dedos polegar, indicador e médio estão esticados. O polegar, que
vai representar o produto vetorial entre o médio e o indicador, fica direção perpendicular
aos outros dois. O médio e o indicador não precisam ser perpendiculares entre si.
2. Daı́ fica claro que W × V = −V × W .
Assim, o produto vetorial de dois vetores tem como resultado um vetor, enquanto o produto escalar
entre dois vetores tem como resultado um escalar, um número.
Mas de pouco adianta termos definido módulo, direção e sentido de V × W se não tivermos um
modo de calculá-lo em coordenadas. Apresentaremos uma fórmula a partir do determinante de
matrizes 3x3, logo convém fazer um breve estudo introdutório.
 
a11 a12 a13
Dada uma matriz 3x3 A = a21 a22 a23 , o determinante de A é o número real
a31 a32 a33
det A = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a12 a21 a33 − a11 a23 a32 ,
que pode ser calculado pela regra mnemônica que aprendemos no ensino médio, isto é, copiando as
duas primeiras colunas de A após a terceira, resultando numa matriz 3x5 da qual multiplicamos os
três elementos de cada uma das três diagonais paralelas à diagonal principal (incluindo a própria),
tomando cada um desses produtos como parcela positiva e multiplicando os três elementos de cada
71
uma das três diagonais na direção da diagonal secundária, tomando esses produtos como parcelas
negativas.
 
3 0 2
Por exemplo, se A = 1 −1 −1, então det A = 29.
2 5 0
Há um outro modo de se calcular o determinante, que se aplicará também a matrizes quadradas
de ordem superior, chamado método dos cofatores, onde o determinante de uma matriz é calculado
pela soma de três parcelas, cada uma sendo o produto de um fator pelo seu cofator. Os fatores são
determinados escolhendo-se livremente uma linha ou uma coluna da matriz A: são as três entradas
da linha ou coluna escolhida. Cada fator dá origem a uma matriz 2x2, eliminando-se de A a linha e
a coluna às quais o fator pertence. Dessa matriz 2x2 calculamos o determinante, que ainda receberá
um sinal, dependendo da posição do fator na matriz original.
Vamos exemplificar escolhendo a primeira linha. Temos
det A = a11 (−1)1+1 A11 + a12 (−1)1+2 A12 + a13 (−1)1+3 A13 ,
onde Aij , é o determinante da matriz 2x2 obtida eliminando-se de A sua i-ésima linha e sua j-ésima
coluna.
 
3 0 2
Por exemplo, no caso da matriz A = 1 −1 −1, temos, por cofatores a partir da primeira
2 5 0
1+1 −1 −1 1+2 1 −1 1+3 1 −1
linha, det A = (3)(−1) det + (0)(−1) det + (2)(−1) det =
5 0 2 0 2 5
(3)(5) + 0 + (2)(7) = 29.
Exercı́cio. Calcule o determinante de A pelo desenvolvimento em cofatores usando a segunda

coluna e verifique que o resultado é 29.
Não é difı́cil ver que o desenvolvimento em cofatores funciona sempre. No caso geral, quando
a11 a12 a13
A = a21 a22 a23 , faça, como exercı́cio, a comparação do desenvolvimento do determinante de
a31 a32 a33
A em cofatores pela segunda linha e verifique que você encontrou o número a11 a22 a33 + a12 a23 a31 +
a13 a21 a32 − a13 a22 a31 − a12 a21 a33 − a11 a23 a32 . Se achar necessário, faça isso também para uma coluna
qualquer da matriz A. A demonstração completa, claro, necessita que se verifique a igualdade para
todas as linhas e colunas de A.
O desenvolvimento em cofatores é particularmente útil quando temos uma linha ou uma coluna
com muitos zeros.
O cálculo do produto vetorial em coordenadas é feito a partir de um determinante “simbólico”,

isto é, do determinante de uma matriz cujas entradas da primeira linha não são números, mas
vetores. Uma rápida observação, em analogia à base canônica {i, j} de R2 : temos para R3 três
vetores canônicos, i, j e k, representando a unidade de medida e o sentido positivo dos eixos x, y
72
     
1 0 0
e z respectivamente, isto é, i = 0 , j = 1 e k = 0. Assim, um vetor qualquer pode ser
    
0 0  1
a
escrito como combinação linear de i, j e k: b  = ai + bj + ck.

c
   
v1 w1
A definição “algébrica” do produto vetorial é a seguinte: Se V = v2 e W = w2 , teremos
  
v3 w3
 
i i k
V × W = det v1 v2 v3  ,

w1 w2 w3
que deve ser desenvolvido pela primeira linha, resultando em
 
v2 w3 − v3 w2
v2 v3 v v3 v v2
V × W = det i − det 1 j + det 1 k = v3 w1 − v1 w3  .
w2 w3 w1 w3 w1 w2
v1 w2 − v2 w1
       
1 0 i j k 7
Exemplo. Se  1  ×  2  = det 1 1 −4 = 1, e, usando o produto escalar, vemos
  
−4 −1 0 2 −1 2
imediatamente que é perpendicular a ambos os “fatores”.
É um exercı́cio, embora um pouco trabalhoso, mostrar que as definições geométrica e algébrica de

produto vetorial coincidem. Um roteiro para fazer isso é o seguinte. Primeiro, para comparar os
módulos, escreva kV × W k2 = kV k2 kW k2sen 2 θ = kV k2
kW 2 2
k (1 − cos θ), abra em coordenadas e
v2 w3 − v3 w2

verifique a igualdade com o quadrado de v3 w1 − v1 w3 .
v1 w2 − v2 w1
A seguir, para comparar a direção, note que, para um vetor qualquer U , o produto escalarde U
U
por V × W , também chamado produto misto entre U , V e W , é dado por U · (V × W ) = det V ,
W
o determinante da matriz cujas linhas são os vetores U , V e W , e conclua que V · (V × W ) =
W · (V × W ) = 0. Observe que não há a necessidade do parêntese na notação, mas é didátco.
Finalmente, para comparar o sentido, é necessário um pouco mais de álgebra linear: uma tripla
ordenada de vetores no espaço é uma base para R3 se os três vetores não são coplanares. Não é
difı́cil ver que, caso três vetores formem uma base, a matriz cujas colunas são esses vetores tem
determinante não nulo. Isto ocorre porque o determinante é zero se e somente se uma das colunas
é combinação linear das outras duas, caso em que os vetores são coplanares. Dada uma base
{V, W, U } para R3 , dizemos que ela é positiva se os sentidos de rotação ao longo do menor ângulo
de V para W , de W para U e de U para V são positivos. Isto acontece, por exemplo, para a base
73
canônica {i, j, k}. Caso contrário, a base é negativa. O que a regra da mão direita diz, portanto,
é que, sendo V e W não paralelos, a base {V, W, V × W } é positiva. O próximo passo é observar
que uma base é positiva se e somente se a matriz cujas colunas são esses vetores (na ordem) tem
determinante positivo. Isto pode ser feito através da definição de produto misto. Por fim, basta
verificar que det[V, W, V × W ] > 0.
Vamos enunciar agora algumas propriedades do determinante seguidas de sua “interpretação” como
propriedades do produto vetorial, imediatas a partir de sua definição algébrica. Algumas destas
propriedades já foram observadas na definição geométrica. Estas propriedades também valem
para matrizes quadradas de ordem superior, faremos referência a elas no momento oportuno. As
demonstrações, no caso 3x3, são exercı́cios para o leitor.
1. det At = det A. Isto significa que as propriedades enunciadas a seguir para as linhas de A
valem também para as colunas de A, e vice-versa.
2. Se A tem duas linhas iguais, então det A = 0. Ou seja, V × V = 0.
3. Se A tem duas linhas múltiplas, então det A = 0. Ou seja, se V e W são paralelos, então
V × W = 0.
4. Se Uma linha
 é combinação linear das outras duas, então det A = 0. Em sı́mbolos, se
L1
A = L2  (linhas) e, por exemplo, L3 = aL1 + bL2 , a, b ∈ R, então det A = 0. A escrita
L3
genérica é Li = aLj + blk , com i, j, k ∈ {1, 2, 3} e distintos. Geometricamente, o fato de um
vetor U ser combinação linear de outros dois, digamos V e W , significa que U é a diagonal
de um paralelogramo cujos lados são múltiplos de V e W . Em outras palavras, significa que
U , V e W são coplanares. Reciprocamente, se det A = 0, então suas colunas são vetores
coplanares (caso contrário, são uma base de R3 ).
5. Se B é a matriz obtida de A trocando-se duas linhas de posição, então det B = − det A. Ou

seja, V × W = −W × V .
6. Se B é a matriz obtida de A multiplicando-se uma de suas linhas por um escalar a, então

det B = a det A. Ou seja, (aV ) × W = a(V × W ) e V × (aW ) = a(V × W ).
7. A próxima propriedade está ilustrada

 para a linha 1 da matriz
 A,
 mas vale também para
U1 + U2 U1 U2
as outras duas linhas: tem-se det  L2  = det L2  + det L2  (linhas). Ou seja,
L3 L3 L3
(U + V ) × W = U × W + V × W e U × (V + W ) = U × V + U × W .
As duas últimas propriedades dizem que o produto vetorial se comporta bem com as operações
lineares de adição de vetores e multiplicação de vetor por escalar, isto é, dizem que podemos usar
a propriedade distributiva.
74
17.5 Retas reversas
Vamos estudar algumas construções importantes a respeito de duas retas reversas dadas.
Dadas duas retas reversas r e s, existe um único par de planos paralelos α e β tal que r ⊂ α e s ⊂ β.
Há algumas maneiras de se concluir isso. Digamos que r : A + tV e s : B + uW . O plano que passa
por A e tem vetores diretores V e W (que contém a reta r) é o plano α (note que V e W não são
paralelos pois são vetores diretores de retas reversas). E o plano β é o que passa por B e é paralelo a
V e W (que contém a reta s). Como só existe uma direção que é simultaneamente perpendicular a
dois vetores não paralelos dados, os planos α e β têm mesmo vetor normal, portanto são paralelos.
Em outras palavras, poderı́amos ter escolhido um vetor normal N = V ×W , perpendicular a ambos
V e W e dizer que α é o plano por A e com vetor normal N , e β passa por B e tem o mesmo vetor
normal.
   
1 2
Exemplo. Sejam r a reta que passa por A = 0 e com vetor diretor V =
   1  e s a reta que
  1  −1
0 −1
passa por B = −3 e com vetor diretor W =
   2 . Verifique que, de fato elas são reversas.
0 1
Para o vetor normal dos planos α e β tomamos
   
i j k 3
N = V × W = det 2 1 −1 = −1 ,
  
−1 2 1 5
e, já que sabemos que A ∈ α, segue que a equação de α é 3x − y + 5z = 8. Similarmente, temos

β : 3x − y + 5z = 3, pois B ∈ β.
Você pode imaginar a situação pensando que construı́mos uma “caixa” de acrı́lico transparente, de
forma de um paralelepı́pedo e traçadas com um marcador estão as retas r e s em faces opostas (por
exemplo, na base e na tampa). As aspas se justificam porque os planos são infinitos, não limitados
como as faces de uma caixa de sapatos.
O leitor pode perguntar, a partir da ilustração acima, se existe uma reta que seja simultaneamente
perpendicular às retas reversas r e s. A resposta é que não só existe, mas é unica. Para construir
esta reta, note primeiramente que um vetor diretor para ela é exatamente o vetor N , normal aos
planos α e β. Vamos obter a perpendicular comum procurada como interseção de dois planos,
π1 e π2 . Note que, tendo N como vetor diretor, a reta procurada é paralela ou está contida em
qualquer plano que tenha N como vetor diretor. Assim, consideramos π1 como o plano que contém
r e é paralelo a N (ou seja, π1 está definido pelo ponto A e pelos vetores diretores V e N ) e π2 o
plano que contém s e é paralelo a N (ou seja, definido pelo ponto B e pelos vetores diretores W
e N ). Os planos π1 e π2 não são paralelos, já que os vetores V , W e N não são coplanares, logo
se interceptam numa reta. Um vetor diretor para esta reta é N , já que trata-se de uma direção
comum a ambos os planos. A reta u = π1 ∩ π2 é perpendicular a r (em π1 ) e é perpendicular a s
(em π2 ), logo é a reta procurada. É única graças ao fato de os planos π1 e π2 estarem unicamente
determinados a partir de r e s.
75
Fazendo
 as contas, que osvetores diretores de π1 são V e N , um vetor normal a π1 é V × N =
 já 
i j k 4
det 2 1 −1 = −13, assim, usando o fato que A ∈ π1 , temos π1 : 4x − 13y − 5z = −1.
3 −1 5 −5  
11
Similarmente, para π2 consideramos N2 = W × N =  8  e, como sabemos que B ∈ π2 , temos
−5
π2 : 11x + 8y − 5z = −24. Assim, a reta u é a solução do sistema que representa a interseção de π1
com π2 :
(
4x − 13y − 5z = −1
u: .
11x + 8y − 5z = −24
−23
Resolvendo, igualando 5z em ambas as equações, obtemos x = − 3y. Substituindo em uma
7
17
das equações, por exemplo, na primeira, obtemos z = −5y − , ou seja,
7
−23
 
 7 − 3y 
u: y  , y ∈ R.
 
 17 
−5y −
7
Podemos calcular exatamente os pontos P = u ∩ r e Q = u ∩ s, faça isso como exercı́cio.
Há outras maneiras de se conseguir a reta u. Por exemplo, é possı́vel calcular diretamente os pontos
P = π2 ∩ r e Q = π1 ∩ s.
   
3t − 2 2 + 2t
Exercı́cios. Dadas as retas r :  t  e s :  1 − t ,
3−t 4t
1. Mostre que são reversas.
2. Determine uma reta que passe pela origem e seja concorrente com r e s.
3. Dê exemplo de um ponto P de modo que não exista uma reta u que passe por P e intercepte
r e s.
 
1
4. Dado o vetor V = 1, obtenha dois planos cuja interseção seja uma reta m paralela a V e
1
concorrente com r e s.
5. Dê exemplos de vetores W tais que não seja possı́vel obter uma reta que seja ao mesmo tempo
paralela a W e concorrente com r e s.
76
17.6 Distâncias e Ângulos
A filosofia de definição de distância e ângulo entre dois objetos no espaço (pontos, retas e planos)
é, sempre que possı́vel, tomar a menor entre todas as medidas.
−→
Dados dois pontos A, B ∈ R3 , já sabemos que a distância entre eles é dada por d(A, B) = kABk.
Para calcular a distância de um ponto A a um plano π, vamos supor primeiramente que A 6∈ π. É

fácil ver que a menor distância é dada pelo segmento perpendicular de A a π. Assim, se B é o pé
da perpendicular de A até π, então d(A, π) = d(A, B) e isto vale também para o caso A ∈ π (no
qual A = B).
 
1
Por exemplo, se π : x + 2y + z = 13 e A = −1, vamos obter B como a interseção de π com a
2
reta perpendicular
  a π por A.
 Esta reta, vamos chamá-la r, tem como vetor diretor o vetor normal
1 1+t
a π, 2, logo r : P (t) = 2t − 1. Para calcular t tal que P (t) esteja também em π, exigimos
1 2+t
que as coordenadas de P (t) satisfaçam a equação de π, obtendo
(1 + t) + 2(2t − 1) + (2 + t) = 13,
 
3
−→
ou seja, t = 2. Logo, B = r ∩ π = P (2) = 3 e d(A, π) = kABk.

4
A mesma ideia de se calcular a distância de um ponto A a uma reta r se aplica: se A está fora de r,
então existe uma única reta s perpendicular a r por A. Sendo B = s∩r, teremos d(A, r) = d(A, B),
pois aı́ estará a menor distância possı́vel entre A e um ponto de r. No caso A ∈ r, existem muitas
retas por A e perpendiculares a r, mas a distância entre A e r será zero. De qualquer modo, o
ponto B, pé da perpendicular de A até r está unicamente determinado, mesmo quando A ∈ r, caso
em que teremos B = A.
Para calcular o ponto B, observe que, em qualquer caso, por A passa um único plano π perpendicular
a r. Vamos obter a equação deste plano e calcular π ∩ r.
   
3 2t − 3
Por exemplo, sendo A = 0 e r :  1 − t , um vetor normal a π é o próprio vetor diretor de r,
  2 t
2
−1. Como queremos A ∈ π, segue π : 2x − y + z = 8. Para calcular r ∩ π, procedemos como
1
no exemplo anterior, exigindo que as coordenadas do ponto P (t) satisfaça a equação de 
π, obtendo

2
2(2t − 3) − (1 − t) + (t) = 8, cuja solução é t = 5/2. Assim, B = π ∩ r = P (5/2) = −3/2 e
5/2
teremos d(A, r) = d(A, B).
77
Para calcular a distância entre dois planos, note primeiro que, se eles se interceptam, então a
distância é zero. Assim, a primeira coisa a fazer é obesrvar os vetores normais: se eles não são
paralelos, os planos também não serão, e a distância é zero. Caso π1 e π2 sejam paralelos e não
iguais, a distância entre eles será o comprimento de qualquer segmento perpendicular comum. Para
calcular este comprimento, escolha um ponto num dos planos, por exemplo, A ∈ π1 e o problema
está reduzido a calcular a distância de A a π2 , o que já sabemos como fazer.
Dados um plano π e uma reta r, como já foi dito, existem três posições relativas possı́veis: ou a
reta “fura” o plano, isto é, r ∩ π é um ponto; ou a reta está contida em π, isto é, r ∩ π = r; ou r
é paralela ao plano, caso em que r ∩ π = ∅. Somente no terceiro caso teremos d(r, π) > 0 e, para
calcular (o comprimento de qualquer segmento perpendicular comum entre r e π) escolhemos um
ponto qualquer A ∈ r e calculamos d(A, π), como nos exemplos anteriores. Pergunta: poderı́amos,
nesse caso, escolher um ponto B ∈ π e calcular a distância de B a r?
Dadas duas retas r e s, elas podem ser concorrentes, paralelas ou reversas. No primeiro caso, temos
claramente d(r, s) = 0. No segundo caso, temos de calcular o comprimento de qualquer segmento
perpendicular comum entre r e s, o que se faz escolhendo um ponto qualquer em A ∈ r e calculando
d(A, s). Finalmente, no terceiro caso, calculamos o comprimento do único segmento perpendicular
comum, o que já fizemos na subseção anterior, quando estudamos retas reversas. Nesse caso, isto
é, para calcular a distância entre duas retas reversas, há um outro modo de fazer: determinamos o
único par de planos paralelos tal que cada um deles contenha uma das retas e calculamos a distância
entre eles.
Ângulos entre vetores e ângulos entre retas já estão definidos, lembre-se apenas que o ângulo entre
vetores está entre 0 e 180o e o ângulo entre duas retas está entre 0 e 90o . Ou seja, se θ é o ângulo
V ·W Vr · Vs
entre V e W , então cos θ = e, se β é o ângulo entre r e s, temos cos β = | |.
kV kkW k kVr kkVs k
Já para se definir o ângulo entre dois planos π1 e π2 , a maneira natural é ao longo de sua reta
de interseção, como se seu olho estivesse dentro da reta, vendo cada plano como uma reta, como
os ponteiros de um relógio. Isto acontece porque nesse caso não há a “menor medida possı́vel”,
ao considerarmos todos os ângulos entre uma reta do primeiro plano e uma do segundo. De fato,
tomando um ponto P na interseção dos dois planos, existem retas r e s por P , uma em cada plano,
tais que o ângulo entre elas fique tão próximo de zero quanto se queira.
Para o cálculo, tomamos um ponto P da reta interseção e, por ali, o plano γ, perpendicular a ambos
π1 e π2 , isto é, γ é o plano perpendicular à reta de interseção por P . O plano γ intercepta π1 numa
reta r1 e o plano π2 numa reta r2 . Então, teremos ^(π1 , π2 ) = ^(r1 , r2 ), o que já sabemos como
calcular. Assim, o ângulo entre dois planos varia entre 0 e 90o .
Exercı́cio. Diga como se pode calcular o ângulo entre dois planos a partir de seus vetores normais.
Por último, vamos estudar o ângulo entre uma reta r e um plano π. Se r ⊂ π ou r k π, então,
claramente ^(r, π) = 0. Caso contrário, isto é, se r ∩ π é um ponto, consideremos primeiro o
caso r ⊥ π, ou ^(r, π) = 90o , que é caracterizado pelo fato de os vetores diretor de r normal a π
serem múltiplos. Nos outros casos, o menor ângulo possı́vel entre r e π será medido num plano γ,
perpendicular a π contendo r: teremos ^(r, π) = ^(r, s), onde s = π ∩ γ (demonstre).
78
A reta s será chamada projeção ortogonal de r sobre π e pode ser calculada a partir das projeções
ortogonais de dois pontos distintos de r sobre π. Já sabemos como calcular esta projeção, o pé da
perpendicular de um ponto a um plano, isto foi discutido ao falarmos de distância de um ponto a
um plano. De qualquer modo, o ângulo entre uma reta e um plano varia entre 0 e 90o .
Observe que, se r é perpendicular a π, então a projeção ortogonal de r sobre π é um ponto e, em

todos os outros casos, incluindo r ⊂ π e r k π, a projeção ortogonal de r sobre π é uma reta s e
vale ^(r, π) = ^(r, s).
Estes métodos não são os únicos para se calcular ângulos e distâncias. Por exemplo, no caso da
distãncia entre um ponto A e uma reta r, uma alternativa ao que foi apresentado é considerar todos
−−−→
os vetores que começam em A e terminam em r, que têm a forma AP (t), e calcular t para que este
−−−→
vetor seja ortogonal ao vetor diretor Vr ; a equação que modela esta situação é AP (t) · Vr = 0.
Exercı́cio. Mostre que esta equação tem uma única solução t, independente da posição relativa
entre A e r, interprete geometricamente.
17.7 Mais alguns exercı́cios sobre retas e planos no espaço

1. Determine
 a reta
 paralela
 ao plano π : 2x −
y + 3z =
 1, perpendicular à reta que passa pelos
1 0 4 + 3t
pontos 0 e 1 e intercepta a reta s : 5 + 6t.
1 2 t
2. Dois pontos são simétricos em relação a um plano se são extremos de um segmento perpendi-
 
1
cular ao plano que encontra o plano no seu ponto médio. Calcule o simétrico do ponto 4
2
em relação ao plano π : x − y + z = 2.
3. Dados um ponto A e uma reta r, diga como fazer (indicando a equação que modela a situação)
para obter o simétrico de A em relação a r. A definição de pontos simétricos em relação a
uma reta é a mesma do exercı́cio anterior, trocando “plano” por “reta”.
4. Determine
 a projeção
 ortogonal da origem sobre a interseção dos plaos π1 : x + y + z = 1 e
1+λ
π2 :  1 + µ  .
1+λ+µ
5. Dados π1 : x − y +z =−1 e π2 : x + y − z = 1, determine o plano que contém π1 ∩ π2 e
1
é normal ao vetor  1 . Isto é sempre possı́vel? Isto é, dados dois planos transversais e
−1
um vetor, sempre existe um plano que contém a interseção dos planos dados e é ortogonal ao
vetor dado? Explique geometricamente.
79
√ 
2
6. O vértice de uma pirâmide regular é P =  2  e sua base é um quadrado ABCD contido
  0
0
no plano π : x = z. Sendo A = 2, determine B, C e D e o volume de P ABCD.

0
7. Dados os planos α : x − y + z = −1, β : x + y − z = 1 e γ : x + y + 2z = 2, determine o plano
π que contém α ∩ β e é perpendicular a γ. É sempre possı́vel determinar π, independente das
posições relativas entre α, β e γ? Expique geometricamente.
   
3t + 1 5t − 1
8. Ache a reta que intercepta as retas r : 2t + 1 e s : 3t + 1 e forma ângulos congruentes
−3t t
com os eixos x, y e z.
9. Calcule a medida dos ângulos entre a diagonal de um cubo e suas faces.

 
1
10. A diagonal BC de um quadrado ABCD está contida na reta que passa por 0 e tem vetor

    0
0 1
diretor 1 . Conhecendo A = 1, determine os outros três vértices.
  
1 0
 
( 0
x+y =2
11. Ache os pontos de r : que distam 3 do ponto A = 2.
x−y−z =0 1
     
1+t 1 0
12. Ache os pontos de r :  t/2  que equidistam dos pontos 1 e 1. Interprete geome-
  
t 0 1
tricamente.
   
1+µ λ (
x−y−z =1
13. As retas r : 1 + µ, s :  λ  e t : determinam com o plano π :
µ −1 x=0
x + y − z = −1 um tetraedro. Calcule a altura relativa à face situada em π.
18 Sistemas de Equações Lineares
Os resultados aqui serão apresentados para sistemas em geral, de qualquer número de equações e
incógnitas. Mas os exemplos vão se concentrar em R3 .
80
18.1 Definições e exemplos
Um sistema de equações lineares é na verdade uma equação matricial AX = B, onde Am×n é a

matriz dos coeficientes, Xn×1 é o vetor das incógnitas e Bm×1 é o vetor constante. Trata-se de um
sistema de m equações e n incógintas.
Exemplo. O sistema     
2 −1 1 x 1
1 1 3 y  = 4
2 −3 0 z 8
pode ser interpretado como a interseção de três planos, escrevendo


2x − y + z = 1

x + y + 3z = 4 ,

2x − 3y = 8

ou, escrevendo-o como

       
2 −1 1 1
x 1 + y  1  + z 3 = 4 ,
2 −3 0 8
interpretado como a pergunta “o vetor B pode ser escrito como combinação linear das colunas de
A?”
Na verdade, qualquer sistema linear pode ser interpretado desta última forma.
Uma solução para AX = B é um vetor constante X0 que satisfaz a equação, isto é, tal que AX0 = B.
O conjunto de todas as soluções do sistema em geral é denotado S. Entendemos resolver o sistema
como representar sua solução S parametricamente.
Exemplos.
1. A solução de um sistema pode ser vazia: interpretando-o como interseção de três planos,
sendo dois deles paralelos (visualizados como o chão e o teto), por exemplo, π1 : x + y + z = 0
e π2 : x + y + z = 1 e escolhendo uma “parede” π3 : 3x − 2y − z = 6.
Exercı́cios.
(a) π3 é uma parede comum (isto é, perpendicular ao “chão”) ou inclinada?

(b) Verifique algebricamente que π1 ∩ π2 ∩ π3 = ∅.
81
2. Outra situação de solução vazia são três planos tais que dois a dois se interceptam segundo
três retas paralelas. Para um exemplo numérico, escolhemos livremente os dois primeiros,
por exemplo π1 : x + y + z = 0 e π2 :x − y− 2z= 1. Um vetor diretor para a reta π1 ∩ π2
i j k −1
é V = N1 × N2 = det 1 1  1  =  3 . Então π3 deve ter esse vetor como um
1 −1 −2 −2
dos diretores. Escolhendo um ponto A que não esteja nem em π1 nem em π2 e um segundo
vetorWdiretor não paralelo a V , teremos uma representação paramétrica de π3 . O ponto
0 1
A = 1 e o vetor W = 0 satisfazem o requerido. Para a equação de π3 , calculamos seu
0 0    
i j k 0
vetor normal N3 = V × W = det −1 3 −2 =  2 , logo π3 : 2y − 3z = 2.
1 0 0 −3
Exercı́cio. Verifique algebricamente que π1 ∩ π2 ∩ π3 = ∅ e apresente um argumento

geométrico para mostrar que este fato depende da escolha de W : veja o próximo exercı́cio.
3. A solução de um sistema pode ser um conjunto infinito.
Exercı́cio. Modifique o exemplo anterior para que π1 ∩ π2 ∩ π3 seja uma reta, obtenha sua
representação paramétrica. Trata-se de um exemplo de sistema cuja solução é um conjunto
infinito.
4. Outra configuração de três planos no espaço cuja interseção é uma reta é π1 = π2 e π3

transversal a eles.
5. A interseção de três planos iguais também é um exemplo de sistema cuja solução é um conjunto
infinito. Nesse caso, a representação paramétrica da solução (que é o próprio plano) tem dois
parâmetros livres.
6. A solução de um sistema pode ser um conjunto unitário: S = {ponto}. Para escolher três
planos que exemplifiquem esta situação, vamos olhar para seus vetores normais.
Exercı́cio. Verifique que em todos os exemplos anteriores (com S = ∅ ou S um conjunto

infinito), os vetores normais N1 , N2 e N3 são coplanares.
Assim, vamos escolher N1 , N2 e N3 de modo que eles sejam uma base de R3 . Nesse caso, é
um exercı́cio mostrar que a reta π1 ∩ π2 e o plano π3 não são paralelos, logo se interceptam
num ponto. O exemplo trivial é a origem como interseção dos planos coordenados x = 0,
y = 0 e z = 0; outro exemplo é

x + y + z = 0

2x − y + z = 1

3x + y − z = 2

82
Observação. O que fizemos foi ilustrar, via exemplos, uma propriedade importante de
sistemas associados a matrizes quadradas: o sistema AX = B tem solução única se e somente
se as linhas de A formam uma base de R3 , isto é, det A 6= 0. Este fato é independente do
vetor B. Ao longo desta seção, seguiremos caracterizando sistemas associados a matrizes
quadradas separando-os em dois tipos: aqueles com solução única e aqueles cuja solução é
vazia ou infinita.
7. Interpretando AX = B como a pergunta se B é uma combinação linear das colunas de

A = [C1 , C2 , C3 ], as interpretações geométricas para as possibilidades do conjunto solução são
as seguintes:
• S = ∅ se C1 , C2 e C3 são coplanares e B está fora deste plano;

• S é um conjunto infinito se C1 , C2 e C3 são colineares e B está nesta reta, ou se C1 , C2
e C3 coplanares (mas não colineares) e B está neste plano;
• S = {ponto} se C1 , C2 e C3 formam uma base para R3 e este fato não depende do vetor
B.
−−→
Um argumento geométrico para o último caso é que OB pode ser decomposto, de maneira
única, como combinação linear de C1 , C2 e C3 , interpretando {O, C1 , C2 , C3 } como um sistema
de coordenadas para o espaço, em analogia ao que fizemos com {O, i, j, k}.
18.2 Possibilidades qualitativas de soluções de sistemas
Já vimos que ocorrem três possibilidades, a saber, a solução pode ser um conjunto vazio, unitário
ou infinito. Veremos agora que não pode ocorrer mais nenhuma:
Proposição. Se X0 e X1 são duas soluções distintas de AX = B, então existem infinitas soluções.
Demonstração. Para ver isso, independente do ambiente onde as soluções estejam, podemos
pensar na reta que liga X0 a X1 , um conjunto infinito de pontos que depende de um parâmetro
−−−→
livre: X(t) = X0 + tX0 X1 , t ∈ R, e mostrar que, para qualquer valor de t, X(t) é solução de
AX = B. Para ver isso, escreva X(t) = X0 + t(X1 − X0 ) e calcule
AX(t) = A(X0 + t(X1 − X0 )) = AX0 + t(AX1 − AX0 ) = B + t(B − B) = B,
já que AX0 = B e AX1 = B. Assim, AX(t) = B para qualquer valor de t ∈ R, mostrando o que
foi enunciado.
18.3 Escalonamento
.
Podemos resolver sistemas de poucas equações e poucas incógnitas “na mão”, utilizando o que já
conhecemos sobre eles. Assim, o método que apresentaremos agora terá pouca utilidade prática
para sistemas, digamos, pequenos. Mas a aplicação computacional, como algoritmo para resolver
83
qualquer sistema linear de qualquer número de equações e incógnitas é imediata. Também tem
importância teórica na análise qualitativa de soluções de sistemas.
Lembre-se que, dado um sistema linear, as seguintes operações podem ser feitas nas suas linhas
(equações), sem alterar a solução, isto é, estas operações preservam a solução do sistema (já falamos
disso quando estudamos escalonamento em sistemas 2x2).
• (i): Li ↔ Lj (troca de posição das linhas)

• (ii): Li ← αLi , α 6= 0 (a i-ésima linha multiplicada por uma constante não nula)
• (iii): Li ← Li + αLj (a i-ésima linha é substituı́da por ela mesma mais um múltiplo escalar
de outra)
O método de Gauss é escalonar a matriz aumentada do sistema até podermos resolvê-lo facilmente.
   
3 2 1 2
Exemplo. O sistema AX = B, onde A = 1 1 1  e B = 2 pode ser escalonado a partir
1 0 −1 1
da matriz aumentada do sistema:
 
3 2 1 | 2
1 1 1 | 2 ,
1 0 −1 | 1
onde as linhas verticais, que separam A de B, por simplicidade não serão mais digitadas.
Procedendo com o escalonamento, podemos fazer:

 
L1 ↔ L3 1 0 −1 1
−−−−−−−−−−→  1 1 1 2
3 2 1 2
L2 ← L2 − L1  
L3 ← L3 − 3L1 1 0 −1 1
−−−−−−−−−−−−−−−→ 0 1 2 1
0 2 4 −1
L3 ← L3 − 2L2 1 0 −1 1
−−−−−−−−−−−−−−−→ 0 1 2 1
0 0 0 −3
A terceira linha da última matriz obtida nos diz que 0x + 0y + 0z = −3, uma equação impossı́vel,
de modo que o sistema, nesse caso, tem solução vazia.
 
2
Exemplo. Considere o exemplo anterior com o vetor constante trocado por  2 . Este vetor
−2
(a última coluna da matriz aumentada) sofreria modificações ditadas pelas operações que fize-
mos acima, já que as definições das operações do escalonamento dependem apenas da matriz dos
coeficientes. Assim, o passo a passo seria
84
       
2 −2 −2 −2
 2  →  2  →  4  →  4 ,
−2 2 8 0
de maneira que a matriz aumentada, no final do processo, seria

 
1 0 −1 −2
0 1 2 4 ,
0 0 0 0
(
x−z =2
que nos diz que a solução do sistema é a reta dada por S : , ou, parametricamente,
y + 2z = 4
  
 2+z 
S = 4 − 2z  , z ∈ R .
z
 
Exemplo. Para um exemplo solução unitária, tomamos um sistema 3x3 com a matriz dos coefici-
entes com determinante não nulo: 
x + y + z = 0

x + y + 2z = 0

x + 2y + 4z = 0

A matriz aumentada deste sistema não necessita da coluna que representa o vetor constante pois,
sendo o sistema homogêneo, esta coluna é o vetor nulo, que não se modifica com as operações (i),
(ii) e (iii). Assim,
  L2 ← L2 − L1  
1 1 1 L ← L3 − L1 1 1 1
1 1 2 −−−3−−−−−−−−−→ 0 0 1 ,
1 2 4 0 1 3
que nos permite concluir, pela segunda linha, que z = 0. Substituindo na terceira, segue y = 0 e,
→
−
finalmente, na primeira, x = 0. Ou seja, para este sistema, S = { 0 }.
18.4 A forma escalonada e reduzida de uma matriz
Para um algoritimo, é necessário saber quando parar. Para programar um computador para resolver
sistemas lineares de qualquer tamanho, vamos escalonar a matriz aumentada do sistema até que a
matriz dos coeficientes fique, digamos, na forma mais simples possı́vel. Esta forma será chamada
de forma escalonada e reduzida, este método recebe o nome de método de Gauss-Jordan.
Definição. Uma matriz A está na sua forma escalonada e reduzida (escrevemos AER ) se satisfaz:
1. O primeiro elemento não nulo de cada linha não nula, chamado pivô da linha, é 1.
85
2. O pivô de uma linha (a partir da segunda) está á direita do pivô da linha anterior.
3. Se uma coluna contém um pivô, então todas as outras entradas desta coluna são zero.
4. Linhas nulas ficam abaixo das linhas não nulas.
Exercı́cio. Dê exemplos de matrizes 3x2, 3x3 e 3x4 que estejam na forma escalonada e reduzida.
Vamos usar as operações (i), (ii) e (iii) para, após um número finito de passos, chegarmos à forma
escalonada e reduzida de uma matriz. Suponha que a matriz que vamos escalonar tenha n linhas.
• (I) Defina o conjunto de linhas como L1 , L2 , . . . , Ln .
• (II) Escolha uma das linhas não nulas com o pivô mais à esquerda possı́vel.
• (III) Troque com a primeira linha se necessário, temos o pivô da primeira linha mais à esquerda
possı́vel, usando a operação (i).
• (IV) Torne este pivô igual a 1, usando a operação (ii).
• (V) Zere os outros elementos da coluna deste pivô, usando a operação (iii).
• (VI) Troque as linhas de posição, se necessário, para que as linhas nulas fiquem abaixo das
não nulas.
• (VII) Defina o conjunto de linhas como L2 , L3 , . . . , Ln .
• (VIII) Repita os passos (II) - (V). Note que isso não mexe na L1 , nem na primeira coluna,
porque fora da L1 ela é foremada por zeros.
• (IV) Defina o conjunto de linhas como L3 , . . . , Ln .
• (X) Repita os passos (II) - (VI).
E assim por diante. Como a matriz tem um número finito de linhas, em algum momento terá sido
escolhida a última linha não nula; realizados ali os passos (II) - (VI), o escalonamento para e a
matriz estará na sua forma escalonada e reduzida.
Para resolver um sistema AX = B, escalonamos sua matriz aumentada [A|B] até chegar a [AER |B 0 ],
onde B 0 é o vetor constante modificado pelas operações do escalonamento. Em geral, temos B 0 6= B,
a exceção, como já vimos, são os sistemas homogêneos, onde B = 0, logo B 0 = 0.
Exercı́cio. Resolva o sistema abaixo, analisando as possibilidades de solução em função do valor

de a ∈ R:

x + 2y − z + 3w − u = 3

5x − y + 2z + 2w − u = a

4x − 3y + 3z − w = −5

86
Uma observação imediata, a partir do algoritmo acima, é que, sendo A uma matriz quadrada, se
AER não tem linhas nulas, então AER = I, isto é, para matrizes quadradas, acontece exatamente
uma das duas seguintes possibilidades: ou a forma escalonada e reduzida tem uma linha nula ou
ela é a identidade.
No primeiro caso, dependendo do vetor constante B, o sistema AX = B terá solução vazia ou

infinitas soluções; e, se AER = I, independente de B, o sistema AX = B terá uma única solução.
Este é mais um passo na caracterização de sistemas com soluções únicas que estamos procurando:
já sabı́amos que, se A é uma matriz quadrada, então AX = B tem única solução se e somente se
det A 6= 0. Agora sabemos também que AX = B tem única solução se e somente se AER = I.
Isto significa, é claro, que AER = I ⇔ det A 6= 0. O raciocı́nio desenvolvido na próxima subseção
também nos permitirá concluir este resultado. Estudaremos o comportamento do determinante sob
as operações (i), (ii) e (iii) com o intuito de se desenvolver um algoritmo eficiente para calcular
determinantes de matrizes “grandes”.
18.5 Determinantes e escalonamento
Já vimos como definir determinantes para matrizes quadradas de ordem 2 e 3. Na verdade, o
desenvolvimento em cofatores serve para definir também para matrizes de ordem superior, já que,
por exemplo, se a matriz é 4x4, podemos escolher qualquer linha ou coluna e teremos o produto de
4 fatores por 4 cofatores. Cada um dos cofatores, a menos de sinal, é um determinante 3x3. Assim,
se a matriz é n × n, o desenvolvimento em cofatores leva a n determinantes (n − 1) × (n − 1), cada
um deles leva a n − 1 determinantes (n − 2) × (n − 2) e assim por diante, até chegarmos na ordem
3 ou 2.
Nesta altura do campeonato, não podemos verificar que a definição é boa (ou seja, que podemos
escolher qualquer linha ou coluna), nem algumas das propriedades; isso exigiria uma matemática
mais sofisticada. Mas podemos fazer as contas, principalmente se há uma linha ou coluna com
muitos zeros.
Outra observação importante decorrente do desenvolvimento em cofatores é que, caso a matriz

seja triangular superior, isto é, todos as entradas abaixo da diagonal principal são nulas, então o
determinante nada mais é que a multiplicação dos elementos da diagonal principal.
 
2 5 11
Por exemplo, det 0 −10 6  = (2)(−10)(5).
0 0 5
Esta observação, juntamente com a técnica de escalonamento, nos mostrarão outro modo de fazer
a conta, computacionalmente muito mais eficiente, por reduzir significativamente o número de
multiplicações. Para cada passo do escalonamento, precisamos saber como o determinante muda,
logo vamos estudar seu comportamento quando são realizadas nas linhas de uma matriz as operações
(i), (ii) e (iii).
Já foi discutido, no caso de matrizes de ordem 3, mas são propriedades que valem para matrizes de
qualquer ordem, que:
87
• Se B é obtida de A por uma operação (i), isto é, pela troca de posição de duas de suas linhas,
então o determinante muda de sinal: det B = − det A.
• Se B é obtida de A por uma operação (ii), isto é, pela multiplicação de uma de suas linhas
por um escalar não nulo a, então, o determinante fica multiplicado por A: det B = a det A.
E agora vamos ver que
• Se B é obtida de A por uma operação (iii), isto é, pela troca de uma linha pela soma dela
mesma com um múltiplo escalar de outra, então o determinante não muda: det B = det A.
 
L1
 L2 
 .. 
 
 . 
 Lj 
 
Para verificar o último item, basta escrever A como uma matriz de linhas, A =   ... , onde, claro,

 
L 
 i
 . 
 .. 
Ln
Li está na posição i e Lj na posição j. Assim, se B é obtida de A trocando-se Li por Li + aLj ,
tem-se, lembrando que o determinante respeita a adição nas linhas de uma matriz,
     
L1 L1 L1
 L2   L2   L2 
..  ..   .. 
     
.  .   . 
 
 
 Lj   Lj   Lj 
     
det B = det 
 ..  = det  ...  + det  ...  = det A,
    
 .     
L + aL  L  aL 
 i j  i  j
 ..   . 
 .. 
 . 
 .. 
 . 
Ln Ln Ln
pois para uma matriz com duas duas linhas múltiplas, o determinante é zero.
Observação. Note que isto é mais um modo de concluir que AER = I ⇔ det A 6= 0.
Exemplo. Seja  
2 0 1
A =  1 3 −2 .
−3 2 1
Vamos escaloná-la até chegar a uma matriz triangular superior. Fazendo L1 ↔ L2 , obtemos
 
1 3 −2
B= 2 0 1 
−3 2 1
88
e det B = − det A. Continuando o escalonamento, fazemos as operações do tipo (iii) L2 ← L2 −2L1
e L3 ← L3 + 3L1 , obtendo
 
1 3 −2
C = 0 −6 5 
0 11 −5
e det C = det B, logo det A = − det C.
O próximo passo é fazer L2 ← (−1/6)L2 para obter

 
1 3 −2
D = 0 1 −5/6
0 11 −5
e det D = (−1/6) det C, logo, det A = 6 det D.
Mais um passo, agora L3 ← L3 − 11L2 , nos dá

 
1 3 −2
E = 0 1 −5/6  ,
0 0 −25/6
com det E = det D, logo, det A = 6 det E. A matriz E é triangular superior, portanto det E =
(1)(1)(−25/6), donde concluı́mos que det A = −25.
 
1 3 −1 3
 2 0 −1 1 
Exercı́cio. Calcule det 
−1 1 2
.
1
4 2 3 −3
18.6 Inversão de matrizes e escalonamento
Como já vimos quando discutimos inversão de matrizes 2x2, na tentativa de inverter uma matriz,
nos deparamos com sistemas lineares. Assim, vamos ver quais sistemas aparecem no caso 3x3 e
como resolvê-los, achando a inversa, caso exista, por escalonamento.
Lembre-se que uma matriz quadrada A é invertı́vel se existe B de mesma ordem tal que AB =
BA = I. Que uma destas igualdades implica a outra (e que, portanto, para procurar B = A−1
precisamos apenas resolver AB = I), e que a inversa, caso exista, é única.
Ora, a equação matricial AB = I pode ser mais detalhadamente descrita no caso 3x3 expliciando-se
as colunas, ficando A[C1 , C2 , C3 ] = [i, j, k], onde C1 , C2 e C3 são as colunas da candidata a inversa
B e i, j e k, os vetores da base canônica, são as colunas da matriz identidade 3x3. Assim, temos a
igualdade de matrizes
[AC1 , AC2 , AC3 ] = [i, j, k].
89
Estamos lidando, portanto, com três sistemas lineares com mesma matriz de coeficientes, cada um
deles tem como incógnita uma das colunas de B e como vetor constante uma coluna da identidade.
Logo podemos escaloná-los simultaneamente, já que, quem define as operações que serão utilizadas
é a matriz dos coeficientes. Ou seja, vamos considerar a matriz aumentada (3x6) [A|I]. Esquema-
ticamente, após terminado o escalonamento, teremos [AER |M ], onde M é uma matriz 3x3.
Se AER = I, então cada um dos sistemas tem solução única, de modo que M = A−1 .
Se AER tem uma linha nula, então é possı́vel mostrar que pelo menos um dos sistemas não tem
solução (faça como exercı́cio), logo a inversa não existe.
Assim, dada A, a inversa existe se e somente se AER = I, ou seja, se e somente se det A 6= 0. Isto
é coerente com a interpretação que já fizemos de um sistema ter solução única quando pudermos
isolar a incógnita (lembre-se de equações lineares nos reais, podemos isolar x de ax = b quando
a 6= 0 - isto é, quando o número a tem inverso - e isolar x multiplicando ambos os lados por 1/a).
Se existe A−1 , então a incógnita de AX = B pode ser isolada multiplicando-se ambos os lados por
A−1 à esquerda:
AX = B ⇔ A−1 AX = A−1 B ⇔ X = A−1 B
e A−1 B é a única solução do sistema.



1 1 0
Exemplo. Vamos decidir se A =  2 1 1 é invertı́vel e, caso afirmativo, calcular A−1 .
−3 2 1
Escalonando [A|I], temos:
 
1 1 0 | 1 0 0
[A|I] =  2 1 1 | 0 1 0
−3 2 1 | 0 0 1
L2 ↔ L2 − 2L1  
L3 ← L3 + 3L1 1 1 0 | 1 0 0
−−−−−−−−−−−−−−−→ 0 −1 1 | −2 1 0
0 5 1 | 3 0 1
L1 ← L1 + L2
L3 ← L3 + 5L2  
L2 ← −L2 1 0 1 | −1 1 0
−−−−−−−−−−−−−−−→ 0 1 −1 | 2 −1 0
0 0 6 | −7 5 1 
L3 ← (1/6)L3 1 0 1 | −1 1 0
−−−−−−−−−−−−−−→ 0 1 −1 | 2 −1 0 
0 0 1 | −7/6 5/6 1/6
L1 ← L1 − L3  
L2 ← L2 + L3 1 0 1 | 1/6 1/6 −1/6
−−−−−−−−−−−−−−→ 0 1 0 | 5/6 −1/6 1/6 
0 0 1 | −7/6 5/6 1/6
90
Assim, temos  
1 1 −1
1
A−1 =  5 −1 1  .
6
−7 5 1
 
−2 1 3
Exercı́cio. Dedida se A =  1 0 3 é invertı́vel e, em caso positivo, obtenha a inversa.
4 1 1
18.7 Independência Linear em R3
Dado um conjunto de vetores em R3 , podemos considerar o espaço gerado por eles, isto é, o conjunto
de todas as suas combinações lineares.
O conceito de independência linear, como o próprio nome diz, envolve perguntar se, para um certo
conjunto de vetores, um deles pode ser escrito como combinação linear dos outros.
A ideia geométrica é a seguinte. Uma reta r que passa pela origem é o conjunto dos múltiplos de
um vetor diretor, isto é, r : µV . Mas esta reta poderia ser parametrizada com dois parâmetros
livres, como r : µV + λW , desde que W e V sejam múltiplos.
 No
 segundo caso, um dos vetores está
µ + 2λ
sobrando como gerador. Por exemplo, o conjunto −µ − 2λ, que a priori tem dois parâmetros
  3µ + 6λ
1
livres, pode ser escrito (µ + 2λ) −1, descartando um dos vetores diretores.

3
Analogamente, se V e W são não paralelos, então π = {µV + λW, µ, λ ∈ R} é um plano pela

origem. Mas se tomamos U = 2V − 3W , podemos escrever π = {µV + λW + γU, µ, λ, γ ∈ R},
representação paramétrica que tem um dos vetores diretores “sobrando”.
Assim, de uma certa maneira, dizer que um conjunto de vetores é LD (ou linearmente dependente),
vai significar que o espaço das combinações lineares deles tem pelo menos um gerador sobrando,
porque um deles é combinação linear dos outros.
Formalmente, temos
Definição 18.1 Um conjunto de vetores em R3 é linearmente independente, ou LI, se nenhum

deles é uma combinação linear dos outros. Caso contrário é linearmente dependente, ou LD.
Exemplos.
1. Um conjunto de um vetor, {V } é LI se V 6= 0, e LD se V = 0. Em outras palavras, um

conjunto LI com um vetor gera uma reta.
2. Um conjunto de dois vetores {V, W } é LI se V e W não são múltiplos, isto é, não são
paralelos, ou, em outras palavras, um conjunto LI com dois vetores gera um plano. Caso
sejam múltiplos, são LD e geram no máximo uma reta.
91
3. Note que, em ambos os casos anteriores, a presença do vetor nulo no conjunto torna-o ime-
diatamente LD. Isto acontece sempre: se o vetor nulo pertence a um conjunto de vetores, ele
mesmo é combinação linear dos outros (basta tomar todos os escalares nulos) e o conjunto é
LD.
4. Um conjunto de três vetores {U, V, W } é LI se não são coplanares, ou seja, formam uma base
para R3 . Isso quer dizer, como já vimos, que eles geram todo o espaço. E, caso um deles seja
combinação linear dos outros - justamente o caso em que são coplanares, o conjunto é LD.
5. (Exercı́cio) Um conjunto com quatro ou mais vetores em R3 sempre é LD.
6. (Exercı́cio) Dado um conjunto de vetores, ele é LI se e somente se a única maneira de se

escrever o vetor nulo como combinação linear daqueles vetores é usando todos os escalares
nulos. Isto quer dizer que um conjunto {V1 , V2 , . . . , Vn } é LI se e somente se o sistema
homogêneo AX = 0 associado à matriz A cujas colunas são os vetores V1 , V2 , . . . , Vn admite
apenas a solução trivial.
No caso de três vetores em R3 , a matriz associada é quadrada de ordem 3. Assim, se os vetores são
LI, as colunas formam uma base e o determinante da matriz é não nulo.
Sejam U , V e W três vetores LI em R3 , todos representados com ponto inicial na origem. Como
são LI, W está fora do plano gerado por U e V e estes três vetores determinam um paralelepı́pedo
P . O volume deste sólido é v(P ) = área da base x altura. A área da base é a área do paralelogramo
determinado por U e V , que, como sabemos, tem valor kU × V k. A altura é a distância da origem à
projeção ortogonal do ponto final de W na reta gerada por U × V . Seja θ o ângulo entre os vetores
W e U × V . Há dois casos a considerar: se θ é agudo, a altura procurada é kW k cos θ e o volume
então fica
  
W U
v(P ) = kU × V kkW k cos θ = (U × V ) · W = W · (U × V ) = det  U  = det  V  ,
V W
que, já vimos, é o produto misto entre U , V e W .
Se θ é obtuso, então a altura procurada é kW k cos(180o − θ) = kW k(− cos θ) = kW k| cos θ| e o

volume então fica
   
W U
v(P ) = kU × V kkW k| cos θ| = |(U × V ) · W | = |W · (U × V )| = |det U | = | V |.
  
V W


U
A conclusão, em qualquer caso, é que v(P ) = |det  V |. Isto fornece mais um argumento que
W
mostra que o determinante de uma matriz é não nulo se e somente as colunas (ou as linhas, tanto
faz) formam uma base de R3 .
92
18.8 O teorema de caracterização
Ao longo de toda esta seção, de uma maneira ou de outra, olhamos com detalhes para matrizes
quadradas de ordem 3. Elas estão separadas em dois grupos: um onde o determinante é não nulo,
outro no qual o determinante é zero. O que fizemos foi apresentar uma série de argumentos que
demonstram o seguinte
Teorema 18.1 Seja A uma matriz quadrada de ordem 3. As seguintes afirmações são equivalentes:
1. O sistema AX = B tem única solução, e este fato não depende de B. Em particular, o

sistema homogêneo associado a A, AX = 0 admite apenas a solução trivial.
2. det A 6= 0.
3. AER = I.
4. A é uma matriz invertı́vel.
5. As colunas de A formam uma base para R3 (ou: as colunas de A são LI) (ou: as linhas de A
são LI).
Ou seja, cada uma destas condições caracteriza totalmente o grupo ao qual A faz parte.
Este teorema poderia ser enunciado a partir das negativas das condições. Ficaria assim:
Teorema 18.2 Seja A uma matriz quadrada de ordem 3. As seguintes afirmações são equivalentes:
1. O sistema AX = B tem como solução o conjunto vazio ou um conjunto infinito. Em parti-

cular, o sistema homogêneo associado a A, AX = 0 admite soluções não nulas.
2. det A = 0.
3. AER tem uma linha nula.
4. A é uma matriz singular (isto é, não invertı́vel).
5. As colunas de A são coplanares (ou: as colunas de A são LD) (ou: as linhas de A são LD).
19 Mais exercı́cios
Sempre que possı́vel, haverá uma motivação geométrica para que sejam analisados as equações e
os sistemas lineares que aparecem como modelo.
 
3−t
1. Dê exemplos de pontos distintos pertencentes à reta r : 2t − 2.
1+t
93
     
1 0 6
2. Dado o plano π : x + 2y − 5z = 12, decida se os pontos A =  2 ,B=
  1  e C = 1

−5 −2 0
pertencem ou não ao plano π.
 
1
3. Dado π : x − y − z = 0, determine a projeção perpendicular do ponto A = 2 sobre π.

1
4. Dado o cubo unitário determinado por {O, i, j, k}, seja P o ponto de encontro das diagonais
−→
da face superior. Determine o plano que passa pela origem e é perpendicular a OP .
 
1 + bt
5. Estude a posição relativa das retas r1 : a + 2t, onde t é o parâmetro e a e b são números
  1−t
6s − 1
reais e r2 :  −4s  em função dos números a e b.
1 + 2s
6. Sejamπ  : 3x − y + 2z = 8 e P o ponto de interseção de π com o eixo z. Considere o ponto
1
−→
Q = 1. Mostre que Q 6∈ π e decomponha o vetor P Q como combinação linear de dois
1
vetores perpendiculares, sendo um deles paralelo a π.
7. Dados os planos π : 2x − 3y + z = 0 e β : x + 3y − z = 1, obtenha uma representação

paramétrica para π ∩ β.
8. Dado π : x − y − z = 0, obtenha uma representação paramétrica para π onde os dois vetores

diretores sejam perpendiculares.
   
1 3
9. Dados os vetores U = −1 e V = 0, dê exemplo de vetores W1 , W2 e W3 tais que
  
−2 1
(a) Os conjuntos {U, V, W1 } e {U, V, W2 } são ambos LI, mas W1 e W2 não são paralelos.
(b) O conjunto {U, V, W3 } é LD mas W3 6= 0.
 
−1 a −1
10. Para quais valores de a ∈ R a matriz A =  1 −2 1  é invertı́vel?
a 0 −3
11. Calcule a distância entre os planos dados pelas equações x + y + z = 1 e x + y + z = 2.
12. Dadas duas retas reversas u : P (t) = A + tV e v : Q(s) = B + sW , um modo algébrico de

se obter a reta m perpendicular comum a r e s é o seguinte: sabemos que m tem que ter a
direção do vetor N = V × W , pois tem de ser perpendicular a ambas. Considere o conjunto
−−−−−−→
de todos os vetores que começam em u e terminam em v, isto é, P (t)Q(s). Para achar os
pontos onde m toca u e v, a exigência é que este vetor seja paralelo a N , isto é,
94
−−−−−−→
P (t)Q(s) = λN.
Mostre que esta equação é um sistema linear 3x3 nas variáveis t, s e λ, associado a uma
matriz cujas colunas são LI. Portanto, este sistema tem solução única e ao substituirmos os
valores de t e s encontrados nos pontos genéricos de u e v, obtemos os pontos desejados.
20 Espaços Euclidianos Rn
O conjunto Rn é o produto cartesiano de n cópias de R, representado pelo conjunto de todas as

matrizes coluna n × 1. De maneira equivalente poderı́amos ter escolhido as matrizes linha 1 × n.
−→
Do mesmo modo que em R2 ou R3 , um ponto P de Rn define o vetor OP , com ponto inicial na
origem. Reciprocamente, cada vetor define um ponto. As oprações lineares com matrizes definem
operações lineares em Rn , adição de vetores e multiplicação de vetor por escalar. A multiplicação
matricial de um vetor linha por um vetor coluna dá origem ao produto escalar entre dois vetores:
V · W = V tW .
Dizemos que dois vetores são ortogonais se o produto escalar entre eles é zero.
V ·W
Exercı́cio. Mostre que −1 ≤ ≤ 1. Conclua que podemos definir o ângulo entre dois
kV kkW k
vetores de Rn através do produto escalar.
20.1 Independência Linear em Rn
Analogamente ao que já fizemos, diremos que um conjunto de vetores em Rn é LD se um deles é

combinação linear dos outros e LI caso contrário.
Em R3 existem critérios geométricos que nos ajudam a caracterizar a independência linear, mas
em Rn , é necessário conhecer um critério algébrico.
Para deduzi-lo, considere um conjunto {V1 , . . . , Vk } de vetores de Rn e suponha que sejam LD,
ou seja, que um deles é combinação linear dos outros. Para fixar as ideias, digamos que Vk é
combinação linear de V1 , . . . , Vk−1 . Isto significa que existem escalares a1 , a2 , . . . , ak−1 tais que
Vk = a1 V1 + a2 V2 + · · · + ak−1 Vk−1
ou
a1 V1 + a2 V2 + · · · + ak−1 Vk−1 − Vk = 0,
 
a1
 .. 
o que nos diz que o vetor  .  é solução (não nula) do sistema homogêneo
 
ak−1 
−1
95
x1 V1 + x2 V2 + · · · + xk Vk = 0.
Portanto, é a análise de um sistema homogêneo que determina se V1 , . . . , Vk são LI ou LD: se existir

solução não nula, como no exemplo acima, os vetores são LD. Caso contrário, se o vetor nulo é a
única solução do sistema, nenhum deles é combinação linear dos outros, então os vetores são LI.
Em outras palavras, um conjunto de vetores é LI se e somente se a única maneira de se escrever o

vetor nulo como combinação linear deles é usando todos os escalares iguais a zero.
Exemplos.
1. Dois vetores não paralelos U e V em R2 , como sabemos, são LI. Note que, para escrever o zero
como combinação linear deles, devemos ter o vetor nulo como diagonal de um paralelogramo
com lados αU e βV . Ora, isto só é possı́vel para α = β = 0.
2. Um conjunto de m vetores em Rn com m > n é sempre LD, pois o sistema
x1 V1 + x2 V2 + · · · + xm Vm = 0
tem mais incógnitas que equações, logo sempre tem solução não nula.
     
1 2 0
 2
3 e W =  1 . Para determinar se
   
3. Em R4 , considere os vetores U =  0 , V = 1 −1
−1 1 −3
sãoLD
 ou LI,
 olhe para o sistema homogêneo xU + yV + zW = 0. Resolvendo-o, chegamos
 −2z 
a  z  . Escolhendo z = 1, concluı́mos que −2U + V + W = 0, o que significa que
z
 
qualquer um deles pode ser escrito como combinação linear dos outros dois. Por exemplo,
V = 2U − W . Assim, {U, V, W } é um conjunto LD.
20.2 Subespaços de Rn
Um subespaço de Rn é um conjunto de vetores fechado em relação às operações lineares. Assim, W

é um subespaço de Rn se, dados U, V ∈ W, então aU + bV ∈ W, para quaisquer escalares a e b.
Isto confere a W interesse próprio, e não apenas como subconjunto de Rn . É como se W fosse o
próprio espaço ambiente.
Note que o vetor nulo é uma combinação linear de quaisquer vetores de W, logo todos os subespaços
contêm a origem.
Exemplos.
1. O conjunto formado pelo vetor nulo, {0}, é um subespaço de Rn .
96
2. Uma reta r pela origem é um subespaço de R3 . De fato, quaisquer dois vetores de r são
múltiplos do vetor diretor, logo as combinações lineares deles também.
3. Exercı́cio: um plano pela origem é um subespaço de R3 .
4. O espaço R3 é obviamente subespaço de si mesmo.
Estes são todos os exemplos em R3 . Para se convencer disso, suponha que um subespaço
W ⊂ R3 contenha um vetor não nulo U . Então W contém a reta gerada por U . Há duas
possibiliddes: ou W é exatamente a reta gerada por U ou W contém ainda um vetor V LI com
U (não paralelo). Nese caso, W contém as combinações lineares de U e V , isto é, W contém
um plano pela origem. Se W contém um plano pela origem, ou é exatamente esse plano ou
W contém ainda um vetor W que seja LI com U e V (isto é, U , V e W não coplanares), W é
todo o R3 . E são todos os casos, pois qualquer outro vetor de R3 adicionado à base {U, V, W }
torna o conjunto LD. Um exercı́cio de imaginação nos leva a conjecturar o que acontece para
n > 3.
5. Seja AX = 0 um sistema homogêneo de n equações e k incógnitas, isto é, A é uma matriz n×k.
Então, o espaço das soluções é um subespaço de Rk . De fato, se U e V são soluções, qualquer
combinação linear deles também é: se AU = 0 e AV = 0, então A(aU +bV ) = aAU +bAV = 0.
6. Se W é um subespaço, então o conjunto de todos os vetores ortogonais a W também é um

subespaço, chamado subespaço ortogonal. De fato, este conjunto é dado por W⊥ = {V ∈
Rn | V · W = 0, ∀W ∈ W}. Como o produto escalar respeita combinações lineares, segue que
uma combinação linear de dois vetores de W⊥ ainda está lá.
7. Exercı́cio. Em R3 , o subespaço ortogonal a uma reta pela origem é um plano pela origem e
vice-versa.
8. O espaço gerado pelos vetores V1 , . . . , Vk , definido por ser o conjunto das combinações lineares
deles, é obviamente um subespaço de Rn . É denotado usando-se colchetes: [V1 , . . . , Vk ]. Por
exemplo, em R3 , seja
  
 2a − 3b + c 
W =  a + b − 2c  |a, b, c ∈ R .
−a + 2b − c
 
      
 2 −3 1 
Não é difı́cil ver que se trata de um subespaço, pois W = a  1  + b  1  + c −2 ,
−1 2 −1
 
isto é, é o espaço gerado por três vetores. Mas para melhor descrever W, é necessário per-
guntar se todos os geradores são essenciais. Ou, em outras palavras, se de fato precisamos
de três prarâmetros livres. A resposta está na análise da dependência linear dos geradores:
chamando-os
  de V1 , V2 e V3 , olhe para o sistema homogêneo xV1 +yV2 +zV3 = 0. Sua solução é
 y 
S = y  | y ∈ R . Tomando y = 1, isto significa que V1 + V2 + V3 = 0, ou V3 = −V1 − V2 .
y
 
Assim, V1 , V2 e V3 são LD e V3 está sobrando como gerador, e W = [V1 , V2 ]. Como V1 e V2
97
não são múltiplos, são LI (ambos são essenciais como geradores), logo W é um plano pela
origem.
9. Exercı́cio. Dada uma matriz A com n linhas, mostre que o conjunto {B ∈ Rn | o sistema
AX = B tem solução} é um subespaço do Rn . Sugestão: este conjunto é o espaço gerado
pelas colunas de A.
20.3 Bases e dimensão

Já vimos em R3 a ideia de identificar os geradores que estão “sobrando” e descartá-los; esta ideia
também está presente em Rn . Dado um conjunto de vetores V1 , . . . , Vk , ao descartarmos, um a
um, os que são combinações lineares dos outros, sobrará um conjunto LI. Por exemplo, considere
W = [U, V ] em Rn , onde V = 2U . Ou seja, U e V são LD e podemos escrever W = [U ]. Se U for
não nulo, W pode ser pensado como o conjunto dos múltiplos de U , ou uma “reta pela origem” de
Rn . O processo de encontar um conjunto minimal (LI) de geradores leva ao conceito de base:
Definição. Uma base para um subespaço W de Rn é um conjunto LI de geradores.
Uma boa pergunta para o momento é se todas as bases para um mesmo subespaço tem o mesmo
número de vetores. Quando pensamos no subespaço W, gerado pelos vetores U1 , . . . , Uk , temos
W = {x1 U1 + · · · + xk Uk }, uma representação paramétrica, onde os parâmetros livres são os xj .
Mas já foi visto várias vezes que a representação paramétrica para um subconjunto de Rn não é
única, assim digamos que W também seja descrito pelos geradores V1 , · · · , V` . Ao produzirmos uma
base a partir de cada um dos conjuntos de geradores, reduzindo-os a um conjunto minimal (LI),
chegaremos ao mesmo número de vetores?
A resposta é afirmativa: a demonstração deste fato se faz supondo que {U1 , . . . , Uk } e {V1 , . . . , V`
são ambas bases para W, com k 6= `, e chegando a uma contradição. Vamos apenas ilustrar este
argumento tomando valores particulares k = 2 e ` = 1. Ora neste caso é fácil ver que U1 e U2 são
ambos múltiplos de V1 , logo são múltiplos entre si, portanto LD, o que é uma contradição com o
fato de {U1 , U2 } ser base.
Definição. Dado um subespaço W ⊂ Rn , a dimensão de W é o número de vetores de uma (e

portanto de qualquer) base de W. Este número é denotado por dim W.
Exemplos.
1. Podemos considerar Rn como subespaço de si mesmo. Como uma base para Rn tem n
elementos (tome, por exemplo, a base canônica), temos dim Rn = n.
2. Um plano pela origem em R3 tem dimensão 2 e uma reta pela origem em R3 tem dimensão
1.
3. dim {0} = 0, independente do espaço ambiente.
4. O algoritmo para calcular a dimensão de um dado subespaço é identificar um conjunto de

geradores e descartar os que estão sobrando, se houver, até chegar a um conjunto LI, ou seja,
uma base. Depois é só contar o número de vetores. Por exemplo, seja
98
  

 a + 2b + 3d 

2a + 3b + c + 5d
  
W   |a, b, c, d ∈ R  .
 

 b−c+d 
−a + b − 3c
 
W é certamente um subespaço de R4 já que se trata de um conjunto de combinações lineares

de certos vetores. Mas, embora esta representação paramétrica tenha quatro parâmetros
livres, não se pode dizer imediatamente
 que
 dim
  W = 4. 
Como
  efeito, primeiro identificamos
1 2 0 3
 2  3  1  5
um conjunto de geradores, são eles   0 , 1, −1, 1, e agora verificamos se há
      
−1 1 −3 0
um ou mais sobrando, isto é, se são LD.
Para isto, como já visto, analisamos o sistema linear homogêneo

       
1 2 0 3
2 3 1 5
x
 0  + y 1 + z −1 + w 1 = 0,
      
−1 1 −3 0
 

 −2y − 3w  
y
 
cuja solução é S =  y + w . Então o sistema admite solução não nula e os geradores


 
w
 
de W são LD. Dando valores para y e w, identificamos um gerador que é combinação linear
dos outros. Chame os geradores listados acima de V1 , V2 , V3 e V4 , na ordem em que aparecem.
Escolhendo y = 0 e w = 1, temos V4 = 3V1 − V3 e podemos descartar V4 . Escolhendo y = 1 e
w = 0, temos V2 = 2V1 −V3 e também podemos descartar V2 . Olhando agora para os geradores
que sobrarm, V1 e V3 , vê-se imediatamente que não são múltiplos, formando portanto uma
base para W. Logo dim W = 2. Em outras palavras, W é um plano pela origem em R4 .
A observação, no caso de vetores com coordenadas inteiras, também ajuda e é legı́tima:

poderı́amos ter descartado V4 de imediato, notando que é a soma de V1 com V2 .
Exercı́cios.
1. Verifique que a interseção de dois subespaços de Rn também é um subespaço.
2. Calcule a dimensão da interseção de dois planos pela origem de R3 , para cada possı́vel posição
relativa entre eles.
  
 a+c 
3. Calcule a dimensão de W =  b + c  | a, b, c ∈ R .
a + 2b + c
 
99
4. 
Calcule a dimensão
 do espaço das soluções do sistema homogêneo AX = 0, onde A =
2 2 −1 1
−1 1 2 1 .
1 1 −2 −1
5. Todos os subespaços de Rn podem ser vistos como soluções de sitemas homogêneos. Para ver
isto, seja W um subespaço, e seja {U1 , . . . , Uk } uma base para W. Mostre que o subespaço
ortogonal a W é a solução do sistema homogêneo [U1 , . . . , Uk ]t X = 0. Mostre que dim W⊥ =
n − k. Supondo que {V1 , . . . , Vn−k } seja uma base para W⊥ , mostre que W é a solução
do sistema homogêneo [V1 , . . . , Vn−k ]X = 0. Sugestão: faça primeiro em R3 e interprete
geometricamente, para “sentir” o que acontece em dimensões maiores.
6. Sejam W1 e W2 dois subespaços de dimensão 3 em R4 , calcule dim W1 ∩ W2 para todas as

possı́veis “posições relativas” entre W1 e W2 .
21 Diagonalização de Matrizes
Parte deste conteúdo já foi visto quando estudamos cônicas, soluções de equações quadráticas em
R2 . Lá, associamos a cada equação uma matriz simétrica 2 × 2, para a qual encontramos uma base
ortonormal de autovetores, que por sua vez definia um novo sistema de coordenadas, com eixos
paralelos aos eixos de simetria da cônica; isto acontece porque na base de autovetores, a matriz é
diagonal.
Vamos estudar um pouco mais de diagonalização de matrizes, em dimensões maiores e sem que
necessariamente sejam simétricas. A sequência será mudança de base em Rn , autovalores e au-
tovetores para matrizes quadradas de ordem n, condições suficientes para que uma matriz seja
diagonalizável (ou para que não seja), diagonalização de matrizes simétricas.
Os teoremas serão enunciados sem demonstração, pois não fazem parte do objetivo deste curso. Na
verdade, os resultados serão ilustrativos e úteis para tomarmos alguns atalhos nas contas, mas o
cálculo de todos os autovalores e autovetores de uma dada matriz é suficiente para concluir se ela
é ou não diagonalizável.
21.1 Mudanças de base em Rn e definições básicas
A base canônica de Rn , em analogia à do R3 , é denotada por B0 e definida pelos vetores ej , que

têm 1 como entrada na j-ésima linha e zero em todas as outras. Em R2 e R3 , usamos as notações
particulares {i, j} e {i, j, k}.
Sejam (x1 , . . . , xn ) as coordenadas usuais de Rn , definidas pela base canônica e (x01 , . . . , x0n ), coorde-
nadas na base B = {V1 , . . . , Vn }. Dado um vetor qualquer U ∈ Rn , comparando as decomposições
de U nas bases B0 e B, temos
x1 e1 + · · · + xn en = x01 V1 + · · · x0n Vn ,
100
que é o mesmo que escrever X = AX 0 , onde A = [V1 , . . . , Vn ] (colunas). É imediato que det A 6= 0
e que X 0 = A−1 X é uma equação equivalente.
Já vimos que matrizes quadradas de ordem 2 podem ser vistas como movimentos do plano, isto
é, funções de R2 em R2 que “transformam” um vetor em outro via multiplicação. O mesmo
pode
serfeito em qualquer dimensão. Só a tı́tulo de exemplo, lembre-se que a muliplicação por
0 −1
é uma rotação de 90o no sentido positivo. Tente se convencer que a muliplicação por
1 0 
0 −1 0
M = 1 0 0  é a rotação de 90o em torno do eixo z seguida da reflexão no plano xy em
0 0 −1  
2 0 0
R3 , enquanto que a multiplicação por N = 0 2 0 dilata (multiplica pelo escalar 2) vetores
0 0 1
do plano xy e não muda vetores do eixo z. Em geral, dado um vetor U ∈ R3 , para saber quem
é N U , basta decompô-lo em uma soma de um vetor no plano xy com um vetor no eixo z, já que
multiplicação de matrizes respeita combinações lineares.
Quando fazemos uma mudança de base, podemos imaginar que estamos mudando o ponto de vista
do observador do movimento causado pela multiplicação por uma matriz M , de modo que ele
enxergue esta ação pela multiplicação por uma outra matriz, digamos N , que, é claro, depende de
M . A mudança de coordenadas das canônicas (X) para as definidas pela base B (X 0 ) se faz através
da multiplicação por A−1 , onde A é a matriz cujas colunas são os vetores de B. Assim, N também
vai depender de A.
Com estas ideias, tentemos entender o movimento causado por N em (Rn , B), ou seja, em Rn
com as coordenadas X 0 . Primeiro, “voltamos” para (Rn , B0 ), pela multiplicação por A. Ou seja,
dado U ∈ (Rn , B), temos AU ∈ (Rn , B0 ). Agora multiplicamos por M , gerando o movimento
propriamente dito em (Rn , B0 ), obtendo o vetor M AU ∈ (Rn , B0 ). Finalmente, mudamos no-
vamente de coordenadas, de X para X 0 através da multiplicação por A−1 , chegando ao vetor
A−1 M AU ∈ (Rn , B).
Então, para qualquer vetor U , temos N U = A−1 M AU ∈ (Rn , B). Isto determina completamente
a matriz N a partir de M e A: N = A−1 M A. Como sempre, enfatizamos que as equações
M = AN A−1 e M A = AN são equivalentes. Isto motiva as seguintes definições.
Definição. Duas matrizes quadradas M e N são semelhantes ou conjugadas se existe uma matriz
A invertı́vel (de mesma ordem) tal que M = AN A−1 .
Sob este ponto de vista, diagonalização de matrizes nada mais é que perguntar se existe uma matriz
diagonal semelhante a M :
Definição. Uma matriz quadrada M é diagonalizável se é semelhante a uma matriz diagonal, isto
é, se existem matrizes D diagonal e A invertı́vel tais que M = ADA−1 .
 
λ1 0 · · · 0
Como esta equação é equivalente a M A = AD, se A = [V1 , . . . , Vn ] (colunas) e D =  ... ... . . . ... ,
 
0 0 · · · λn
−1
usando multiplicação de matrizes vemos que escrever M = ADA é o mesmo que escrever
101
[M V1 , . . . , M Vn ] = [λ1 V1 , . . . , λn Vn ],
e, comparando as colunas, vemos que cada coluna de A é um vetor não nulo (que, portanto, define
uma direção) que é levado por M num múltiplo de si mesmo, ou seja, trata-se de uma direção
invariante, expressão que já escutamos ao falarmos de autovetores:
Definição. Dada uma matriz M n × n, um autovetor de M é um vetor não nulo V ∈ Rn para o

qual existe um escalar λ (o autovalor associado) tal que M V = λV .
Com estas observações, dizer que uma matriz M é diagonalizável é o mesmo que dizer que existe
uma base de Rn formada por autovetores de M ; eles serão as colunas da matriz A. Ou ainda, é o
mesmo que dizer que existe uma base que define coordenadas em Rn nas quais a multiplicação por
M é a multiplicação por uma matriz diagonal.
21.2 Matrizes diagonalizáveis e não diagonalizáveis
Para verificar se uma dada matriz M é ou não diagonalizável, tratamos de encontar seus autovetores,
para saber se existe ou não uma base de Rn formada por eles. Para isso, como já vimos em dimensão
2, temos que encontrar os autovalores de M . A partir de M V = λV , chegamos a (M − λI)V = 0 e,
como queremos V 6= 0, exigimos det(M − λI) = 0. Esta equação é uma equação polinomial de grau
n (igual à ordem da matriz), chamada equação caracterı́stica. O polinômio de grau n det(M − λI)
é chamado polinômio caracterı́stico de M .
Autovalores são raı́zes reais da equação caracterı́stica, assim, um motivo para uma matriz não ser
diagonalizável é a equação caracterı́stica não ter raı́zes reais em número suficiente.

0 −1
Por exemplo, a rotação M = tem como equação caracterı́stica λ2 + 1 = 0, que não tem
1 0
raı́zes reais, logo não existem autovalores, logo M não é diagonalizável. De fato, geometricamente
é claro que não existem direções invariantes.
O outro motivo para uma matriznão ser diagonalizável é a falta de autovetores. Isto acontece,
2 1
por exemplo, para a matriz M = , cuja equação caracterı́stica é (λ − 2)2 = 0 que tem duas
0 2
raı́zes reais e iguais. Então há autovalores em número suficiente,
mas, ao calcularmos os autovetores
0 1 x
associados ao autovalor duplo λ = 2, chegamos ao sistema = 0, cuja solução é o eixo
0 0 y
x. Assim, não existe uma base de R2 formada por autovetores de M , já que todos os autovetores
são múltiplos.
Não é uma coincidência este fato ocorrer para raı́zes múltiplas da equação caracterı́stica:
Teorema. A autovalores distintos de uma matriz M estão associados autovetores LI.
Assim, é imediato concluir que uma matriz M de ordem n que tem n autovalores distintos é
diagonalizável, pois n vetores LI em Rn formam uma base.
102
Outra conclusão é que, havendo autovalores em número suficiente, contados com multiplicidade,
então somente poderá haver “falta de autovetores” para os autovalores múltiplos. Vamos tornar
este conceito um pouco mais preciso:
Definição. Dada uma matriz M n × n, para cada autovalor λ, o autoespaço associado a λ é o

subespaço Sλ ⊂ Rn , o espaço solução do sistema homogêneo (M −λI)X = 0. Isto é, Sλ é o conjunto
de todos os autovetores de M associados a λ.
Então, a dimensão de um autoespaço é no mı́nimo 1, já que, se existe autovalor, existe autovetor.
A “falta de autovetores” está relacionada com o fato de um autoespaço não atingir sua dimensão
máxima. Para continuar a formalizar, vamos lembrar alguns resultados básicos sobre polinômios
caracterı́sticos e sua fatoração.
Primeiramente, note, pela própria definição, que o polinômio caracterı́stico de uma matriz n × n
tem grau n e o coeficiente de λn é 1 ou −1.
A seguir, um fato geral sobre polinômios de grau n é que em sua fatoração, além do fator de
grau zero (o coeficiente de λn ), aparecem apenas fatores de grau 1 (da forma (λ − a)) ou fatores
irredutı́veis de grau 2 (polinômios quadráticos sem raı́zes reais). E, como você já deve ter percebido,
fatores da forma (λ − a)k são a multiplicação de k fatores iguais de grau 1 e significam que a é
uma raı́z de multiplicidade k do polinômio caracterı́stico. Em outras palavras, este polinômio tem
entre suas raı́zes “k raı́zes reais e iguais a a”. É claro que a soma dos graus dos fatores é igual a n.
A ocorrência de fatores irredutı́veis de grau 2 no polinômio caracterı́stico de uma matriz é o que
chamamos anteriormente de falta de autovalores e constitui motivo para a não diagonalização da
matriz.
Definição. O grau algébrico de um autovalor a de uma matriz M é o grau de a como raiz do

polinômio caracterı́stico, isto é, o grau do fator (λ − a) em sua fatoração. A notação é g(a).
Teorema. Para cada autovalor a da matriz M , tem-se 1 ≤ dim Sa ≤ g(a). Assim, a dimensão
máxima que o autoespaço associado a a pode assumir é o grau algébrico de a como raiz da equação
caracterı́stica.
Logo:
Teorema. Uma matriz M n × n é diagonalizável se e somente se seu polinômio caracterı́stico

p(λ) tem n raı́zes reais, contadas com multipliciade, e a dimensão de cada autoespaço associado é
máxima.
Vamos fazer um resumo-ilustração dessas ideias para matrizes 3 × 3, nosso ambiente será, portanto,
o R3 . Na alálise a seguir, tomamos o coeficiente de λ3 no polinômio caracterı́stico como 1, mas
nada mudaria se fosse −1, já que as raı́zes são as mesmas.
1. p(λ) tem três raı́zes reais e distintas. Assim, p(λ) = (λ−a)(λ−b)(λ−c). Então, os autoespaços
Sa , Sb e Sc são gerados por vetores LI, logo estes geradores formam uma base de R3 , logo a
matriz M é diagonalizável. A matriz  D, a menos de multiplicação por escalar, é a matriz dos
a 0 0
autovalores, isto é, D = 0 b 0. A matriz A terá como colunas autovetores associados a
0 0 c
a, b e c respectivamente.
103
2. p(λ) tem apenas uma raiz real. Assim, p(λ) = (λ − a)q(λ), onde q(λ) é um fator irredutı́vel
de grau 2. A matriz M não é diagonalizável por falta de autovalores.
2
3. p(λ) tem três raı́zes reais, mas uma delas é dupla. Assim, p(λ) = (λ − a)  (λ − b), com
a 0 0
a 6= b. Nesse caso, na tentativa de diagonalizar M escrevemos D = 0 a 0. sabemos que
0 0 b
dim Sb = 1, tomamos um gerador desta reta para ser a terceira coluna da matriz A. Mas,
de acordo com os resultados acima, temos duas possibilidades para dim Sa : 1 ou 2. Se for
dim Sa = 2, então Sa é um plano transversal à reta Sb e tomando uma base para este plano,
teremos as duas primeiras colunas da matriz A; concluindo que M é diagonalizável. E, se for
dim Sa = 1, concluı́mos que M não será diagonalizável por falta de autovetores.
4. p(λ) tem três raı́zes reais e iguais, ou uma raiz tripla. Assim, p(λ) = (λ − a)3 . Aqui, temos
1 ≤ dim Sa ≤ 3. Se for o caso de dimensão máxima, isto é, dim Sa = 3, então existe uma base
de Sa , que nesse caso é o próprio R3 , formada por autovetores de M e a matriz
 é diagonalizável

a 0 0
(é um exercı́cio mostrar que isto só ocorre se M já é a matriz diagonal 0 a 0). Nos
0 0 a
outros casos, isto é, se dim Sa for igual a 1 ou 2, então a matriz M não é diagonalizável por
falta de autovetores.
21.3 Matrizes simétricas
Matrizes simétricas são sempre diagonalizáveis por uma matriz ortogonal (colunas formam uma
base ortonomral), a exemplo do que já sabemos em R2 .
Teorema. Se M é uma matriz simétrica n × n, então:
1. M tem n autovalores, contados com multiplicidade.
2. Se a é um autovalor de M , então dim Sa = g(a), ou seja, todos os autoespaços têm dimensão

máxima.
3. A autovalores distintos estão associados autoespaços ortogonais.
Para concluir que existe uma base ortonormal que diagonaliza M , falta apenas mostrar que, dado
um autoespaço Sa , podemos escolher (construir) uma base ortonormal para Sa . Este processo,
chamado ortogonalização de Gram-Schmidt, se faz a partir de projeções ortogonais.
Definição. Dados dois vetores U e V em Rn , sendo U não nulo, a projeção ortogonal de V sobre
U é a projeção ortogonal do ponto final de V na reta gerada por U . Lembre-se que desde que
começamos a falar de subespaços, sempre consideramos vetores com ponto inicial na origem. A
projeção de V sobre U é denotada por P rojU V e é claramente um múltiplo de U . Não é difı́cil
V ·U
achar qual é o escalar, deduzindo - faça como exercı́cio - que P rojU V = U . Outro exercı́cio
U ·U
que o leitor deve fazer é mostrar que V − P rojU V é ortogonal a U .
104
Assim, se um subespaço W de Rn tem dimensão 2, com base, digamos {V, W }, para acharmos
uma base ortonormal, primeiro vamos encontrar uma base ortogonal: decomponha W como soma
de dois vetores, W = W1 + W2 , sendo W1 paralelo a V e W2 ortogonal. O vetor W1 , isto é, a
componente de W paralela a V é inútil como gerador de W, pois V já gera essa direção. Assim,
substituı́mos a base {V, W } pela base ortogonal {V, W2 }. Em termos da projeção ortogonal, basta
tomar W1 = P rojV W e W2 = W − P rojV W . Como queremos uma base ortonormal, ainda falta
normalizar,
istoé, dividir pela norma: a base procurada, formada por vetores ortogonais e unitários,
V W2
é , .
kV k kW2 k
Em geral, se dim W = k, dada uma base {V1 , . . . , Vk }, para conseguir uma base ortogonal, or-
togonalize, como acima, o conjunto {V1 , V2 } projetando V2 sobre V1 e descartando a componente
paralela, obtendo {V1 , W2 }. Agora tome V3 , projete-o ortogonalmente sobre o plano gerado por V1
e W2 ; isto se faz considerando a soma das projeções em cada uma das direções: P roj[V1 ,W2 ] V3 =
P rojV1 V3 + P rojW2 V3 . Descarte a componente de V3 nese plano, tomando W3 = V3 − P roj[V1 ,W2 ] V3 .
Proceda indutivamente, projetando V4 no espaço gerado por V1 , W2 e W3 e tomando apenas a com-
ponente ortogonal W4 e assim por diante. Como a dimensão de W é finita (afinal é um subespaço
de Rn ), em algum momento chegaremos a uma base ortogonal {V1 , W2 , · · · , Wk } que, normalizada,
será uma base ortonormal.
Assim, para matrizes simétricas M , existem matrizes diagonal D e ortogonal A tais que M =
ADA−1 .
21.4 Exemplos e exercı́cios
O enunciado é sempre o mesmo: “verifique se a seguinte matriz (M ) é diagonalizável. Em caso

negativo, justifique. Em caso afirmativo, determine matrizes D diagonal e A invertı́vel tais que
M = ADA−1 . Se M for simétrica, A deve ser ortogonal.” Claro, chegue ao final dos cálculos
apenas se sentir necessidade.
1. As matrizes dos exercı́cios 6.1.1, 6.1.2, 6.1.3 e 6.1.4 e 6.2.1 do livro (online) do Reginaldo.
2. Faça, se quiser, os exercı́cios teóricos 6.1.14, 6.1.15 e 6.1.19 do livro (online) do Reginaldo
105

Apostila Seme Gabara

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Apostila Seme Gabara

Enviado por

Direitos autorais:

Formatos disponíveis

Geometria Analı́tica

Seme Gebara Neto

2 Equações lineares em duas incógnitas, plano cartesiano 4

7 Sistemas de duas equações e duas incógnitas, inversão de matrizes 2 × 2 22

8 Multiplicação de matrizes como movimentos do plano 29

11 Mudanças de coordenadas no plano 39

13 Eixos de simetria de ax2 + bxy + cy 2 = d 44

15 Equações quadráticas em sua forma geral 55

18 Sistemas de Equações Lineares 80

21 Diagonalização de Matrizes 100

1 Equações lineares em uma incógnita, a reta real

A forma geral de uma equação linear com uma incógnita real é

• Se a = 0, então existem duas situações:

– se b 6= 0, então não existe solução (ou seja, S = ∅),

Já conhecemos um modo de se representar geometricamente os números reais através de um sistema

Dado um ponto P ∈ r, denote por k AP k o comprimento de AP . Existe um único número real t,

Na ilustração abaixo, o número α ∈ R associado a P é positivo e maior que 1, enquanto o ponto Q

2 Equações lineares em duas incógnitas, plano cartesiano

Uma maneira de se enxergar a equação 3x − y = 1 é como um produto de uma matriz linha 1 × 2

1. No exemplo do texto, ambos os coeficientes, de x e de y na equação eram não nulos. Qual é

2. Determine t ∈ R tal que o ponto (3t, 2 − t) esteja no conjunto solução de x − y = 0.

3. O ponto (3, −2) pertence à solução da equação 4x + 2y = 1? Por quê?

Definimos a adição ou soma de dois vetores V e W da seguinte maneira. Escolha um ponto

3. Se V e W são paralelos, então V + W ainda é paralelo a ambos, pois na escolha de represen-

Sejam V um vetor e α ∈ R um escalar. O vetor αV está definido por:

• αV tem a mesma direção de V .

• αV tem o mesmo sentido de V quando α > 0 e sentido oposto a V quando α < 0.

onde θ = ∠(V, W ) é o ângulo entre V e W .

Usando a Lei dos Cossenos,

e daı́, usando a definição de produto escalar,

• uma régua, pois k V k 2 = V · V ; e

Uma consequência imediata é a caracterização de vetores ortogonais: V · W = 0 ⇔ ^(V, W ) = 90o

1. Os vetores (1, 3) e (6, −2) são ortogonais.

7. Dadas as coordenadas de três vértices A, B e C de um triângulo, diga como obter as coorde-

Podemos simplesmente escrever r : A + tV | t ∈ R, onde A é um ponto por onde a reta passa, V é

Observação. Continuamos a chamar o parâmetro de t, mas note que o ponto associado a t = 0

Figura 1: Duas parametrizações diferentes para r

7 Sistemas de duas equações e duas incógnitas, inversão de

Um exemplo para o primeiro caso é o sistema

Um exemplo para o segundo caso é o sistema

Um exemplo para o terceiro caso é (

São formas equivalentes de se apresentar um sistema 2 × 2:

Vamos lembrar da definição de multiplicação de matrizes:

• se A é uma matriz m × n e B é uma matriz n × p, então o produto AB está definido (a

1. Calcule alguns produtos de matrizes de tamanho relativamente pequeno, para se familiarizar

4. Dê exemplos de matrizes A e B tais que os produtos AB e BA estejam definidos, mas

5. A matriz identidade In é a matriz quadrada de ordem n (isto é, n × n) na qual as entradas

Mostre que In é o elemento neutro da multiplicação de matrizes, ou seja, AIn = A e In B = B

Voltando um pouco à equação linear de uma incógnita ax = b, se a 6= 0, podemos resolvê-la

ou seja, M = N e a inversa, quando existe, é de fato única.

Em outras palavras, para encontrar a inversa de A, devemos escalonar a matriz A aumentada da

Então, suponha que a 6= 0 e vamos ao escalonamento:

a b 1 0 L1 ←(1/a)L1 1 ab a1 0 L2 ←L2 −cL1

Para o último passo do escalonamento,

Exercı́cio. Começamos supondo a 6= 0, mas poderı́amos ter começado supondo c 6= 0. Faça as

Exercı́cio. Verifique que M A = I.

O último parágrafo demonstra o seguinte

2. Conclua, via escalonamento, que o sistema

para que o sistema tenha solução e calcule-a.

8 Multiplicação de matrizes como movimentos do plano

Ou seja, trata-se de uma rotação de 90o no sentido positivo (faça desenhos).

Exercı́cios (relativos ao exemplo).

(a) Calcule a imagem do terceiro lado do triângulo ABC.

Exercı́cios (relativos ao exemplo).

Observe que coordenadas de

Exercı́cios. Para os exercı́cios abaixo, considere B0 a base canônica, que define

A uma matriz 2 × 2 cujas colunas são os vetores U1 e U2 . Mostre que a1 U1 + a2 U2 =

Para calcular um autovetor associado ao autovalor λ2 = −4, repetimos o processo e resolvemos o

Façamos separadamente a análise para ∆ = 0e para ∆ > 0. Se ∆ = 0, então a = c e b = 0. Ora,