Escolar Documentos
Profissional Documentos
Cultura Documentos
Sumário
1 Equações lineares em uma incógnita, a reta real 2
3 Vetores no plano 8
4 Coordenadas de vetores 11
5 Produto escalar 14
6 Retas em R2 17
9 Formas quadáticas em R2 33
10 Cônicas 34
12 Mudança de base 42
14 Mudança de origem 53
16 Mais exercı́cios 57
1
17 Geometria Analı́tica Espacial 60
17.1 Alguns fatos básicos de Geometria Euclidiana espacial . . . . . . . . . . . . . . . . . 60
17.2 Pontos e vetores em R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
17.3 Retas e planos no espaço . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
17.4 Produto vetorial e determinantes 3x3 . . . . . . . . . . . . . . . . . . . . . . . . . . 70
17.5 Retas reversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
17.6 Distâncias e Ângulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
17.7 Mais alguns exercı́cios sobre retas e planos no espaço . . . . . . . . . . . . . . . . . 79
19 Mais exercı́cios 93
20 Espaços Euclidianos Rn 95
n
20.1 Independência Linear em R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
20.2 Subespaços de Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
20.3 Bases e dimensão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
ax = b,
onde a e b são números reais dados. O termo linear significa que trata-se de uma equação polinomial
de grau 1.
O conjunto solução da equação, que nesse texto será sempre denotado por S, é um subconjunto de
R e a análise, já suficientemente conhecida, é a seguinte:
2
• Se a 6= 0, então existe uma única solução x = ab . Em outras palavras, S é o conjunto unitário
S = { ab }.
Isto confere à reta r uma origem, uma unidade de medida (o comprimento do segmento AB) e um
sentido positivo (de A para B). Comparando com o segmento unitário AB, vamos identificar os
pontos da reta com os números reais.
Segmentos orientados recebem o nome de vetores e trataremos deles com mais detalhes em breve.
Uma reta munida de um sistema de coordenadas chama-se eixo. Note que para determinar um
sistema de coordenadas numa reta foi necessário escolher dois pontos distintos. Isso garante que as
equações lineares usadas para identificar pontos do eixo com números reais tenham solução única.
3
Q A B P
0 1 α
− 21
Como já foi dito, o termo linear está reservado para equações polinomiais de grau 1 nas incógnitas,
√
que agora serão x e y. Desse modo não há termos tipo cos x, y, x1 e nem mesmo xy, já que este
produto tem grau 2. Assim, a forma geral de uma equação linear com duas incógnitas é
ax + by = c,
onde a, b e c são números reais dados.
O conjunto solução S é agora um conjunto de pares ordenados de números reais. Por exemplo,
para a equação 3x − y = 1, temos (1, 2) ∈ S, enquanto (0, 0) 6∈ S. Já para uma equação homogênea,
isto é, quando c = 0, o par ordenado (0, 0) sempre faz parte da solução.
Todos conhecemos uma maneira geométrica de representar o conjunto de todos os pares ordenados
de números reais; isto é feito pelo plano cartesiano, isto é, a escolha de um sistema de coordenadas
4
para o plano que o torna o conhecido “plano xy”. Este sistema consiste de dois eixos perpendi-
culares, ambos com origem no ponto de interseção, com mesma unidade de medida e ordenados
de maneira que, quando percorremos o ângulo reto do sentido positivo do primeiro eixo (o eixo x)
para o sentido positivo do segundo (o eixo y), o giro é anti-horário. O plano cartesiano, ou plano
xy, ou plano coordenado, será denotado por R2 .
A convenção é que o sentido anti-horário seja chamado de sentido positivo de percurso do cı́rculo
(dos ângulos).
A associação de pontos do plano cartesiano e pares ordenados de números reais é imediata e vamos
usar o sinal de igualdade entre pontos e pares ordenados identificados.
Nem todas as equações lineares da forma ax+by = c devem num primeiro momento ser interpretadas
geometricamente, como por exemplo, se queremos saber quantas moedas de 5 centavos e quantas
moedas de 25 centavos devemos juntar para chegar a R$ 5,00. É claro que este problema tem várias
soluções, mas uma interpretação geométrica para ele poderia soar artificial.
No entanto, de maneira geral, se x e y podem ser números reais quaisquer, o conujunto solução
de ax + by = c pode ser visto como um subconjunto de R2 . Do ensino médio sabemos que uma
equação desse tipo representa uma reta.
De fato, voltando ao exemplo 3x − y = 1, já vimos que A = (1, 2) ∈ S e é fácil achar mais uma
solução, por exemplo, B = (0, −1). Afirmamos que o conjunto S é exatamente a reta r que passa
por (1, 2) e (0, −1). Para ver isso, Seja P = (a, b) um ponto qualquer do plano. Desenhando o
ponto P sobre a reta r e traçando paralelas aos eixos coordenados (projetando os pontos P e A no
eixo x), obtemos os pontos D e E. A conclusão, da semelhança entre os triângulos BAE e BP D,
a b+1
é: P ∈ r ⇔ = ⇔ 3a − b = 1 ⇔ P ∈ S.
1 3
5
6
4
P
A
2
−4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
B E D
−1
−2
−3
−4
−5
−6
−7
−8
Em tempo: o produto de uma matriz linha por uma matriz coluna está definido sempre que ambas
têm o mesmo número de entradas
eé a soma dos produtos das entradas correspondentes. Por
x
exemplo, no caso acima, 3 −1 = (3)(x) + (−1)(y) = 3x − y e no caso geral de matrizes de
y
c
duas entradas tem-se a b = ac + bd. Um exemplo envolvendo matrizes de tês entradas é
d
2
1 3 4 0 = (1)(2) + (3)(0) + (4)(−1) = −2 e assim por diante.
−1
Exercı́cio. A matriz 3 −1 , chamada matriz dos coeficientes, tem um significado geométrico:
6
−→
desenhando o segmento que liga a origem ao ponto F = (3, −1), demonstre que o ângulo entre OF
e a reta r é o que parece, ou seja, é reto.
6
A
2
−4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
B F
−1
−2
−3
−4
−5
−6
−7
−8
x
A análise completa da equação a b = c é a seguinte:
y
• Se a b 6= 0 0 , S é uma reta em R2 .
• Se a b = 0 0 , então S = ∅ quando c 6= 0 e S = R2 quando c = 0.
Exercı́cios.
7
3 Vetores no plano
O conceito de vetor importante para matemática, fı́sica e aplicações e que nos ajudará a descrever
objetos geométricos no plano cartesiano. O que vamos fazer antes de pensarmos em coordenadas no
plano é intrı́nseco, e ocorre exatamente da mesma maneira para vetores no espaço tridimensional.
Certas grandezas, como força e velocidade, são chamadas vetoriais, por dependerem apenas de
intensidade, direção e sentido. Chamaremos de vetores segmentos orientados do plano, carac-
−→
terizados por terem um ponto inicial A e um ponto final B, e escreveremos AB.
−→
O comprimento do segmento, também chamado módulo ou norma do vetor, denotado por k AB k,
representa a intensidade da grandeza vetorial. Os pontos A e B, quando distintos, determinam
uma reta, que por sua vez representa a direção da grandeza vetorial envolvida. Quando A = B,
−→
AB é chamado de vetor nulo e não há como definir a direção associada (o que não tem importância
nenhuma: é o mesmo que dizer que todas as direções estão associadas ao vetor nulo). Há dois
−→ −→
sentidos possı́veis, AB e BA; quando se trata do vetor nulo, não há como definir o sentido.
O conceito de direção merece algum comentário. Uma reta define uma direção, mas uma direção
não determina uma reta. Uma direção é apenas representada por uma reta, e por qualquer outra
paralela a ela. Assim, quando falamos em direção, falamos do conjunto de (todas as) retas paralelas
a uma reta dada. Para determinar uma reta, além de uma direção, é necessário localizá-la, indicando
um ponto por onde ela passe.
−→
Por definição, dois vetores são iguais quando têm mesmos módulo, direção e sentido, isto é, AB =
−−→
CD se as retas AB e CD são paralelas, os segmentos AB e CD são congruentes e o sentido de
percurso é o mesmo. Em outras palavras, se os pontos A, B, C e D não estão alinhados, então
ABDC é um paralelogramo e o sentido dos lados opostos AB e CD é o mesmo.
Assim, um vetor V é uma coleção de segmentos orientados, todos paralelos, de comprimentos iguais
e com mesmo sentido. Um vetor V pode ser representado por qualquer um desses segmentos
orientados.
Existem operações que podem ser definidas com vetores, baseadas em observações do comporta-
mento de grandezas vetoriais, como força, por exemplo (lembre-se do conceito de força resultante,
que nada mais é do que a adição vetorial das forças envolvidas).
8
B
V W
C
A
V+W
Observações.
1. Esta definição não depende do ponto A escolhido: tivéssemos escolhido outro ponto A0 ,
−−→ −−→
os pontos B 0 e C 0 estariam determinados por V = A0 B 0 e W = B 0 C 0 e o segmento A0 C 0
−−→ −→
resultaria com mesmos módulo, direção e sentido de AC, ou seja, A0 C 0 = AC (congruência
de triângulos).
→
− →
− →
−
2. O vetor nulo, denotado por 0 , é tal que V + 0 = 0 + V = V para todo vetor V .
Se V e W são ambos não nulos e não são paralelos, pode ser aplicada a regra do paralelogramo:
escolha um ponto A do plano e tome os representantes para V e W começando de A, digamos
−→ −→
V = AB e W = AC. Nesse caso os vetores V e W (ou os pontos A, B e C) determinam um
9
paralelogramo com quarto vértice D; chamamos ABDC de paralelogramo gerado por V e W .
−−→
Nesse caso, a adição V + W está representada pela diagonal AD. Isto é devido ao fato de que os
−→ −−→
lados opostos AC e BD do paralelogramos representam o mesmo vetor W .
A partir da definição (ou da regra do paralelogramo, quando aplicável) vemos imediatamente que
V + W = W + V quaiquer que sejam os vetores V e W .
Definimos agora a multiplicação de vetor por escalar. A palavra “escalar” quer dizer número real.
Uma grandeza escalar é caracterizada por apenas um número real. A massa, por exemplo, medida
em quilogramas.
A C F H (1/2)V
-V G
B E
V
2V D
10
As oprerações de adição de vetores e multiplicação de vetor por escalar são chamadas operações
lineares, e logo veremos o porquê deste nome. Uma boa ilustração para o caso de adição de vetores
é um diagrama de forças atuando numa massa num plano inclinado. Faça alguns desenhos e pense
no assunto, a força resultante é o resultado da soma vetorial das forças envolvidas.
4 Coordenadas de vetores
O que fizemos até aqui sobre vetores não depende de um sistema de coordenadas, mas quando
queremos tratar algebricamente com tais objetos, vamos precisar. Considere um sistema de co-
ordenadas cartesianas para o plano e seja O a origem de R2 (O = (0, 0)). Dado um vetor V no
−→
plano, olhe para seu representante que tem ponto inicial na origem, digamos que seja V = OP . As
coordenadas de V são definidas como as coordenadas de seu ponto final P . Isto nos diz que ambos
os conjuntos { vetores no plano } e { pontos no plano } são representados pelo mesmo conjunto: o
conjunto de pares ordenados de números reais.
Podemos representar o conjunto de pares ordenados de números reais tanto por matrizes linha
x
{(x, y)|x, y ∈ R} (podendo ou não usar a vı́rgula) como por matrizes coluna |x, y ∈ R .
y
−→
Exemplo. Suponha que W = AB, com A = (3, −1) e B = (1, 5). Quais são as coordenadas de
W ? Isto se resolve com um desenho e com a definição de adição de vetores.
11
P
6
B
5
−4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
A
−1
−2
−3
−4
−5
−6
−7
−8
−→
Sabemos que as coordenadas de W são as coordenadas do ponto P quando W = OP . Olhando para
a figura, não é difı́cil concluir, já que as coordenadas são todas números inteiros, que W = (−2, 6).
−−→ −→ −−→ −→
De maneira geral, temos, pela definição de adição, OB = OA + W , ou seja, W = OB − OA.
−→ −−→
Como as coordenadas dos vetores OA e OB coincidem com as coordenadas dos pontos A e B
respectivamente, chegamos a
−→ 1 3 −2
W = AB = − =
5 −1 6
−→
Não havendo risco de confusão entre pontos√ e vetores, podemos resumir isso como AB = B √ − A.
Por exemplo, o vetor que liga o ponto (π, 2) ao ponto (1, 2) tem coordenadas (1 − π, 2 − 2).
1
Exemplo. Se V = é um vetor no plano, as coordenadas de (−2)V são −2, 10 . De fato, o
−5
segmento orientado que liga a origem ao ponto −2, 10 tem mesma direção, o dobro do tamanho
1
e sentido contrário em relação ao segmento orientado que liga a origem ao ponto .
−5
12
Observação. É importante notar que dois vetores são paralelos se e somente se um é múltiplo
escalar do outro. Em particular o vetor nulo é paralelo a qualquer outro.
Usamos aqui operações com matrizes que ainda não foram definidas nesse texto: chamadas também
de operações lineares, a adição de matrizes está definida para matrizes M e N de mesmo ta-
manho e se faz entrada a entrada, resultando portanto numa matriz de mesmo tamanho. A
multiplicação de matrizes por escalar está definida para um número real α e para uma matriz
M , multiplicando-se cada entrada de M por α e tem como resultado uma matriz de mesmo
tamanho que M . Para maiores detalhes, veja por exemplo o livro do professor Dan Avritzer,
Geometria Analı́tica e Álgebra Linear - Uma Visão Geométrica, tomos I e II (disponı́veis em
http://www.mat.ufmg.br/ead/paginas/biblio-livros.htm).
A observação importante aqui é que, como vimos, as operações lineares com vetores são compatı́veis
com as operações lineares das matrizes que os representam num sistema de coordenadas.
Exercı́cios.
1. Quais são as coordenadas do ponto final do representante do vetor V = (3, 4) que tem ponto
inicial A = (3, 1)?
2. Quais são as coordenadas do ponto médio do segmento com extremos (1, 3) e (−4, 0)?
3. Dadas as coordenadas de dois vértices e do baricentro (encontro das medianas) de um
triângulo, é possı́vel determinar as coordenadas do terceiro vértice? Como?
1 4
4. Dados os vetores V = eW = , calcule as coordenadas de U = 3V − 2W .
2 2
5. Faça desenhos e conclua que, dados dois vetores V e W não nulos e não paralelos no plano,
eles geram um paralelogramo com diagonais V + W e V − W . Qual é o sendido de W − V ?
6. Sejam A e B matrizes de mesmo tamanho e α, β ∈ R. Mostre que
(a) (α + β)A = αA + βA.
(b) α(A + B) = αA + αB.
Em particular, estas propriedades distributivas valem para as opreações lineares com vetores.
7. Determine os três vértices de um triângulo sabendo que seus pontos médios são (5, 0), (3, 1)
e (4, 2).
8. Sendo A = (a1 , a2 ) e B = (b1 , b2 ), demonstre que as coordenadas do ponto médio do segmento
a2 + b 2
AB são ( a1 +b
2
1
, ).
2
9. A base média de um triângulo é o segmento que liga os pontos médios dos lados adjascentes
àquele que escolhemos como base. Mostre que a base média de um triângulo é paralela à base
e tem medida igual à metade da medida da base.
10. Considere os pontos A = (4, 6) e B = (6, 5). Determine pontos C sobre o eixo x e D sobre o
eixo y de modo que ABCD seja um paralelogramo contido no primeiro quadrante.
13
5 Produto escalar
O produto escalar tem esse nome porque é um produto entre vetores com resultado numérico.
Uma vez estudado o produto escalar, nosso plano R2 estará munido de uma “régua” e de um
“transferidor”.
Primeiramente, observe que para calcular a distância entre dois pontos no plano podemos usar o
−→
módulo (a norma) do vetor que os liga. Assim, a distância entre A e B é d(A, B) =k AB k. E para
calculá-la usamos o Teorema de Pitágoras: tomamos o ponto P , o ponto final do representante de
−→ −→ −→
AB que começa na origem, isto é, AB = OP . Sabemos calcular, a partir dos pontos A e B as
−→ −→
coordenadas de OP , digamos que OP = (a, b). Por Pitágoras,
−→ √
k AB k 2 = a2 + b2 , ou d(A, B) = a2 + b2 .
6
4
A
3
2
B
O a
−4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
−1
P
b
−2
−3
−4
−5
−6
−7
−8
Já para definir ângulos entre dois vetores não nulos, representamos ambos com mesmo ponto inicial
e escolhemos o menor valor entre os dois ângulos formados. Isto significa que o ângulo entre dois
vetores varia entre 0 e 180o .
14
D E F
B
θ=0
A θ
C
H G I
θ = 180o
→
−
Por convenção, não se define o ângulo entre o vetor nulo 0 e um outro vetor V mas permite-se
que assuma qualquer valor. Isto quer dizer que o vetor nulo é paralelo a qualquer outro vetor (pois
o ângulo pode ser pensado como 0o ), mas também é perpendicular a qualquer outro vetor (pois o
ângulo pode ser pensado como 90o ).
Definimos agora produto escalar entre dois vetores V e W . É chamado de produto escalar não à
toa, já que o resultado é um número real:
V · W =k V kk W k cos θ,
É imediato que V · V =k V k 2
Também é fácil concluir que, sendo V e W não nulos, conhecendo V · W , saberemos calcular
V ·W
cos θ = .
k V kk W k
15
−→
Para calcular V ·W a partir das coordenadas de V e W , considere os pontos A e B tais que V = OA
−−→
e W = OB e olhe para o triângulo OAB (desenhe). O caso em que não há triângulo, isto é, quando
−→ −→
V e W são paralelos, fica de exercı́cio para o leitor. Como AB é tal que V + AB = W , segue
−→
AB = W − V (o que nos dá a interpretação da outra diagonal do paralelogramo gerado por V e
W ).
1
V · W = − (b1 2 − 2a1 b1 + a1 2 + b2 2 − 2a2 b2 + a2 2 − a1 2 − a2 2 − b1 2 − b2 2 ) = a1 b1 + a2 b2 .
2
Assim, temos:
a1 b1 b1
• uma fórmula para V ·W em coordenadas, que pode ser resumida em · = a1 a2 =
a2 b2 b2
a1 b1 + a2 b2 (produto do primeiro como matriz linha pelo segundo como matriz coluna);
Exercı́cios.
2. O triângulo formado pelos pontos (0, 5), (2, 2) e (5, 4) é retângulo e isósceles.
3. Dados os pontos A = (3, 2) e B = (1, −3), determine a reta mediatriz de AB exibindo dois
pontos distintos.
4. Dê exemplos de pares de vetores que formem ângulo agudo e obtuso (note que você terá de
controlar o sinal do produto escalar).
16
a1 b
5. Demonstre que a fórmula obtida para o cálculo do produto escalar, · 1 = a1 b1 +a2 b2 ,
a2 b2
a1 b1
vale também para o caso em que os vetores e são paralelos.
a2 b2
6. Verifique que V · W = W · V para quaisquer vetores V e W .
8. Mostre que o produto escalar se comporta bem com as operações lineares, ou seja, que V ·
(αU + βW ) = αV · U + βV · W , para quaisquer vetores V , U e W e escalares α e β.
9. Dados os vetores (3, 4) e (12, 5), determine um vetor que está na direção da bissetriz do ângulo
formado por eles.
10. Determine o ponto C de modo que o triângulo formado por A = (0, 0), B = (1, 2) e C seja
retângulo em A e tenha ângulo de 30o no vértice B.
11. As operações lineares (adição e multiplicação por escalar) definidas geometricamente para
vetores produzem os mesmos resultados quando definidas algebricamente para as matrizes
(linha ou coluna) que representam os vetores.
6 Retas em R2
Voltando ao nosso exemplo inicial, o estudo daequação 3x − y = 1, já vimos que o conjunto solução
3
S é uma reta de R2 e que o vetor N = , cujas coordenadas são os coeficientes de x e y na
−1
equação, é ortogonal (normal) à reta solução. Na verdade isso
valeem geral: se a equação da reta
a
é ax + by = c (o que em particular significa que o vetor N = é não nulo), então o conjunto
b
solução é uma reta r ortogonal a N . Por este motivo, N é chamado de vetor normal a r.
Note que uma reta em R2 está completamente determinada por um ponto e por uma direção
ortogonal. Em outras palavras, dados um ponto A e uma reta s, existe uma única reta r passando
por A e perpendicular a s. Assim, dados um ponto e um vetor normal (não nulo, para que possa
definir a direção ortogonal), determinamos completamente a reta.
No caso do nossoexemplo
inicial, podemos recuperar
a equação a partir
de um ponto qualquer de
3 3 x
r, digamos A = , e do vetor normal N = . Um ponto X = ∈ R2 pertence à reta r
8 −1 y
−−→
se e somente se os vetores AX e N são ortogonais.
17
A
8
N
X
2
−4 −2 0 2 4 6 8 10 12 1
−2
−4
−6
−8
−10
−12
−14
18
Algebricamente, temos
−−→
AX · N = 0
x 3
− ·N = 0
y 8
x−3 3
· = 0
y−8 −1
3x − 9 − y + 8 = 0
3x − y = 1.
Esta é chamada a equação geral da reta r; a notação muitas vezes é (no caso geral) r : ax + by = c.
Exercı́cio. Escolha outro ponto pertencente a r e outro vetor normal N2 . Observe que N2 é
obrigatoriamente um múltiplo escalar não nulo de N . Obtenha a equação geral da reta r e note
que, a menos de simplificação (isto é, a menos de multiplicação por um escalar não nulo), a equação
geral de uma reta é única.
Por outro lado, ainda no nosso exemplo 3x − y = 1 é importante descrever o conjunto solução da
equação explicitamente. Isso se faz resolvendo a equação em uma das incógnitas em função da
outra. Nesse caso, é mais fácil escrever y = 3x − 1 e a solução é o conjunto de pares ordenados
do plano nos quais a segunda coordenada é o triplo da primeira menos uma unidade. A variável
livre, no nosso caso x, é chamada de parâmetro e o conjunto solução tem a seguinte representação
(chamada paramétrica):
x
S = |x ∈ R
3x − 1
x 0
= + |x ∈ R
3x −1
0 1
= +x |x ∈ R
−1 3
0 1
= +t |t ∈ R .
−1 3
Note que na última igualdade a única modificação foi o nome do parâmetro, o que foi feito de
propósito, para enfatizar que ali x ou t tem um significado diferente de incógnita, mas sim de
cumprir a instrução de percorrer todo o conjunto dos números reais. Cada valor de x define um
ponto da reta; reciprocamente, cada ponto da reta está representado por um valor de x.
Por exemplo se x = 0, o ponto é o (0, −1). Para x = −3, o ponto é o (−3, −10). Para saber se o
ponto (1, 1) está ou não na reta, temos que resolver o sistema (de duas equações e uma incógnita)
(
x=1
3x − 1 = 1.
Não é difı́cil ver que este sistema não tem solução, logo (1, 1) 6∈ r.
19
A representação paramétrica de uma reta é muitas vezes chamada de equação paramétrica da reta
pelo fato de que
x x 0 1
∈r⇔ = +t |t ∈ R.
y y −1 3
Então, há dois modos de se determinar geometricamente uma reta no plano: ou por um de seus
pontos e um vetor diretor não nulo (o que é equivalente a dois pontos distintos da reta), ou por
um de seus pontos e um vetor normal não nulo. Traduzindo algebricamente, o primeiro modo dá
origem à representação paramétrica da reta e o segundo à sua equação geral.
Enquanto a equação geral de uma reta, como já vimos, é única, a representação paramétrica não.
Se, no nosso velho exemplo da reta de equação 3x − y = 1 tomamos um ponto diferente do (3, 8),
digamos B = (1, 2) e outro vetor diretor não nulo (que obrigatoriamente será um múltiplo escalar
de V ), digamos W = (2, 6), então
1 2
r: +t |t ∈ R.
2 6
Exercı́cios.
1. Considere os pontos A = (3/2, 1), B = (4, 2) e C = (5, 3), determine a equação geral e a
−−→
equação paramétrica das retas r, que passa por A e B, s, que passa por A e é paralela a BC
−−→
e u, que passa por A e tem vetor normal BC.
2. (a) Dê exemplo de uma equação geral de uma reta r que não seja nem vertical nem horizontal.
(b) Ache uma representação paramétrica da reta r que você escolheu no exercı́cio 1.
(c) Troque de vetor diretor na representação paramétrica do item (b) de modo que a primeira
1
coordenada do novo vetor diretor W seja 1, isto é, escreva W da forma W = .
a
Note que, neste caso, a segunda coordenada deste vetor diretor (= a) é exatamente o
coeficiente angular da reta.
20
6
5
B
4
3 −→
V = AB
2 A
C
1
−4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
−1
−−→−2
W = CD
−3
D
−4
−5
−6
−7
21
−a
(d) Mostre que U = é ortogonal a W . Multiplicando U por −1/a, obtemos Z =
1
1
, ainda ortogonal a W . Conclua que Z é vetor diretor de qualquer reta perpen-
−1/a
1
dicular a r, todas com coeficiente angular − , ou seja, retas perpendiculares no plano
a
têm coeficientes angulares “inversos opostos”, como já sabı́amos.
3. Como proceder para, a partir da equação paramétrica de uma reta chegar à sua equação
geral?
4. Escreva um roteiro para, dado um triângulo ABC, obter a medida da altura relativa ao vértice
A.
5. Determine b ∈ R tal que a reta de equação 3x + by = 12 intercepte os eixos x e y nos pontos
A e B e a distância entre A e B seja 5.
6. Determine todas as retas do plano que são perpendiculares à reta 3x + 4y + 5 = 0.
7. Determine o pé da perpendicular desde o ponto P = (4, 0) até a reta r : 2x−5 = 7. [sugestão.
Considere a forma paramétrica da reta que passa por P e é perpendicular a r, depois calcule
a interseção desta reta com r.]
8. Determine as coordenadas do ponto P que está sobre o eixo x e é equidistante de (3, −1) e
(1, −2).
9. Dados três pontos A, B e C, exiba um critério para sabermos se são ou não colineares (isto
é, se pertencem ou não à mesma reta).
10. O ângulo entre duas retas é definido como o menor ângulo formado por elas, com a convenção
que se têm a mesma direção (paralelas ou iguais) o ângulo é zero. Assim, o ângulo entre duas
retas no plano é sempre menor ou igual a um ângulo reto. Dadas as retas r : A + tV, t ∈ R
e s : B + λW, λ ∈ R, qual é o ângulo entre elas? Note que sua resposta estará em função de
V e W.
Interpretamos a solução de uma equação linear em duas incógnitas como uma reta em R2 . Então,
no caso de um sistema de duas equações em duas incógnitas, sua solução representará a interseção
entre duas retas em R2 . Como já sabemos, dadas duas retas no plano, ou as retas são iguais,
ou são paralelas, ou são concorrentes. Em termos do sistema, estas possibilidades significam,
respectivamente, que o conjunto solução S é um conjunto infinito (a própria reta), ou S = ∅ (as
retas não se interceptam), ou S é um conjunto unitário (o ponto de interseção).
22
pois ambas as equações representam a mesma reta.
pois as retas têm mesmo vetor normal, logo têm mesma direção e a origem, que é um ponto da
segunda reta, não pertence à primeira, logo as retas são paralelas.
já que os vetores normais (3, −1) e (1, −2) não são múltiplos, logo não são paralelos, logo as retas
não são paralelas, portanto se encontram num só ponto. Aliás, a solução é o ponto (1, 2), facilmente
calculável por “soma” ou “substituição”.
Um outro modo de se resolver o sistema é por escalonamento. Em primeiro lugar, observe que a
solução do sistema não muda se uma ou mais das seguintes operações é feita sobre alguma linha:
• L1 ↔ L2 (troca de posição das linhas)
• Li ← αLi , α 6= 0 (a i-ésima linha multiplicada por uma constante não nula)
• Li ← Li + αLj (a i-ésima linha é substituı́da por ela mesma mais um múltiplo escalar da
outra)
Estas operações, chamadas operações elemetares sobre linhas, não se restringem a sistemas 2 × 2,
vamos ver ainda como funciona o caso geral. Assim, existe uma técnica de, passo a passo, trocarmos
nosso sistema por um equivalente, de modo que a solução fique preservada.
Uma notação que abreviará muito nosso trabalho é a notação matricial. Usaremos o produto de
matrizes. Se você não conhece ou não lembra, está definido um pouco mais abaixo.
Este
sistema
pode ser representado
ainda por sua matriz aumentada, isto é, a matriz dos coeficientes
a b c
“aumentada” do vetor :
d e f
a b c
,
d e f
e as operações elementares sobre as linhas do sistema podem ser feitas diretamente nas linhas desta
matriz. Para ver isso, vamos voltar aos exemplos acima:
23
(
3x − y = 1 3 −1 1
1. A matriz aumentada de é . Ao fazermos L2 ← L2 − 2L1 ficamos
6x − 2y = 2 6 −2 2
3 −1 1
com , mostrando que a informação contida na segunda linha era supérflua; a
0 0 0
solução deste sistema é a nossa famosa reta r.
(
3x − y = 1 3 −1 1
2. Já para o sistema , a matriz aumentada é ; ao fazermos L2 ←
3x − y = 0 3 −1 0
3 −1 1
L2 − L1 , chegamos a . A segunda linha agora significa 0x + 0y = −1, o que é
0 0 −1
impossı́vel, logo esse sistema não tem solução.
(
3x − y = 1
3. Olhando agora para o sistema , temos:
x − 2y = −3
3 −1 1 L1 ↔L2 1 −2 −3 L2 ←L2 −3L−1 1 −2 −3 L2 ←(1/5)L2 1 −2 −3
−−−−→ −−−−−−−−→ −−−−−−−→ ,
1 −2 −3 3 −1 1 0 5 10 0 1 2
o que já nos diz, olhando para a segunda equação, que y = 2. Poderı́amos agora substituir
este valor na primeira equação e calcular diretamente o valor de x, mas também podemos
continuar escalonando:
1 0 1
L1 ←L1 +2L2
−−−−−−−→ .
0 1 2
(
x=1
A última matriz aumentada é equivalente ao sistema , cuja solução é a interseção
y=2
da reta horizontal y = 2 com a reta vertical x = 1, logo é o par ordenado (1, 2).
• primeiro,
lembre-se do produto de uma “linha” A = (a1 , a2 , · · · , an ) por uma “coluna” B =
b1
b2
.. , ambas com o mesmo número de entradas. Então
.
bn
AB = a1 b1 + a2 b2 + · · · + an bn ∈ R.
24
Exercı́cios.
2. Mostre que o produto de matrizes é distribuitivo. Sugestão: faça exemplos com matrizes
pequenas antes.
3. Mostre que o produto de matrizes é associativo. Sugestão: faça exemplos com matrizes
pequenas antes.
Dado que o produto de duas matrizes quadradas n × n é ainda uma matriz quadrada de ordem
n, uma pergunta natural é se um sistema associado a uma matriz quadrada pode ser resolvido
de forma semelhante. Por exemplo, já vimos que sistema 2 ×2,em sua forma matricial pode ser
x
escrito AX = B, onde A2×2 é a matriz dos coeficientes, X = é o vetor das incógnitas e B2×1
y
é o vetor constante. A pergunta acima pode ser reformulada para: existe uma matriz M2×2 tal que
M A = I2 ? Ou ainda, existe uma matriz inversa para A? Em caso afirmativo, multiplicando-se
ambos os lados da equação por M , terı́amos I2 X = M B e, como I2 X = X, terı́amos conseguido
“isolar” o vetor das incógnitas e resolver o sistema.
Para procurar as condições que uma matriz deve satisfazer para que sua inversa exista, vamos antes
definir precisamente o conceito.
Definição. Dada uma matriz quadrada A, dizemos que ela é invertı́vel se existe uma matriz
quadrada de mesma ordem M tal que M A = AM = I, onde I é a matriz identidade da mesma
ordem de A. Nesse caso, M será chamada de inversa de A. Se A é invertı́vel, em geral denotamos
sua inversa por A−1 . Se A não é invertı́vel, então é chamada de singular
Antes de fazermos qualquer conta, vamos ver que, se a inversa existe, então ela é única. Para esta
demonstração, suponha que M e N são ambas inversas para a matriz A. Então,
25
M = IM = (N A)M = N (AM ) = N I = N
Esta equação pode ser “dividida” em duas, comparando as colunas das matrizes de ambos os lados
da equação. Assim, o que procuramos é resolver simultaneamente as equações
a b x 1 a b z 0
= e = ,
c d y 0 c d w 1
ou seja, dois sistemas lineares de duas equações e duas incógnitas com mesma matriz dos coeficientes.
Ora, para isso, podemos fazer um escalonamento simultâneo, escalonando a matriz dos coeficientes
aumentada das duas colunas constantes:
a b | 1 0
.
c d | 0 1
Quanto às condições para a existência da inversa, observe primeiramente que não pode ser a = c = 0.
Pois, caso isso aconteça, então a equação matricial AM = I, de incógnita M , tem solução vazia
(verifique). Assim, devemos ter a 6= 0 ou c 6= 0.
Note agora que se ad − bc = det(A) = 0, então o segundo sistema é impossı́vel, indicando a não
existência de A−1 . Vamos supor então que det(A) 6= 0 e vamos continuar o escalonamento:
a
b 1
L2 ← ad−bc L2 1 a 0
−−−−−−−→ a
c a
0 1 − ad−bc ad−bc
26
d −b
L1 ←L1 − ab L1
1 0
−−−−−−−→ ac−bd ad−bc .
−c a
0 1 ad−bc ad−bc
x z 1 d −b
Isso significa que a solução dos nossos sistemas simultâneos é = .
y w ad − bc −c a
Então, encontramos a inversa de A? Formalmente ainda não: o que encontramos foi uma matriz
M tal que AM = I, mas a definição de matriz inversa diz que, para ser a inversa de A, M deve
satisfazer também M A = I.
Como conclusão, caracterizamos todas as matrizes 2 × 2 invertı́veis e ainda temos uma fórmula
para calcular a inversa:
Teorema 7.1 Uma matriz A quadrada de ordem invertı́vel se e somente se det(A) 6= 0 e, nesse
2 é
1 d −b
caso, sua inversa é dada por A−1 = .
det(A) −c a
Por outro lado, olhando para sistemas associados a matrizes singulares, ou seja, a matriz dos
coeficientes satisfaz det(A) = 0, e obrigatoriamente A tem duas linhas múltiplas. Isto implica que
após o escalonamento, a matriz dos coeficientes terá uma linha nula. Ao olharmos para a matriz
aumentada, esta linha pode ser da forma 0 = 0 e o sistema terá infinitas soluções, ou da forma
0 = k, para alguma constante não nula k indicando que o sistema não tem solução.
Observação.
Se você não conhece, ou não lembra, o determinante de uma matriz 2 × 2 é definido
a b
por det = ad − bc. Esta definição e mais propriedades ainda serão discutidas no texto.
c d
Exemplos.
(
5x − 2y = −19
1. Olhe para o sistema . A matriz dos coeficientes, vamos chamá-la A é
2x + 3y = 0
tal que det(A) = 19 6= 0, portanto o sistema tem única solução. Sua matrizinversa
é
1 3 2 −19
dada porA−1 = , logo a solução do sistema é dada por X = A−1 =
−2
19 5 0
1 3 2 −19 3
= .
19 −2 5 0 −2
27
(
2x + 3y = 1 2 3 1
2. Já para o caso do sistema , a matriz aumentada , após escalonada
4x + 6y = 2 4 6 2
2 3 1
(L2 ← L2 − 2L1 ) fica e a solução do sistema é a solução da sua primeira equação,
0 0 0
isto é uma reta.
3. Se, no sitema do exemplo 2, trocamos a constante da segunda equação de 2 para qualquer
outro número, estamos no caso de solução vazia, pois multiplicar a primeira equação por 2
resulta
numa equação
incompatı́vel com a segunda. Em outras palavras, a matriz aumentada
2 3 1
seria , com k 6= 0, indicando solução vazia.
0 0 k
Em resumo, dada uma matriz A quadrada de ordem 2, se det(A) 6= 0, então qualquer sistema que
tem A como matriz dos coeficientes (AX = B) tem solução única dada por X = A−1 B. A solução,
claro, depende do vetor B, mas o fato da solução ser única, não. Por outro lado se det(A) = 0, o
sistema nunca terá solução única: de fato, se det(A) = 0, então as duas linhas são múltiplas e as
equações representam retas com mesma direção no plano. Nesse caso, ou as equações são múltiplas
e representam a mesma reta (que é a solução do sistema, portanto o sitema tem infinitas soluções),
ou as equações representam retas paralelas e o sistema tem solução vazia.
Teorema 7.2 O sistema linear AX = B tem solução única (dada por X = A−1 B) se e somente
se det(A) 6= 0.
Observações.
1. É claro que estamos falando de matrizes quadradas, caso contrário o determinante nem estaria
definido. Por enquanto, o que foi demonstrado foi o caso de matrizes 2 × 2, mas o teorema
vale para matrizes de qualquer ordem.
2. Ainda no caso de A2×2 , se B = 0, isto é, no caso do sistema homogêneo AX = 0, já sabemos
que o vetor nulo sempre faz parte da solução e assim a solução de um sistema homogêneo
nunca é vazia. Então, se det(A) 6= 0, o sistema tem o vetor nulo como a única solução. Já
sendo det(A) = 0, a solução é uma reta r que passa pela origem, portanto, se det(A) = 0, o
sistema homogêneo associado a A admite solução não nula (na verdade, infinitas: qualquer
ponto de r que não seja a origem). Em outras palavras, sistemas homogêneos associados a
matrizes quadradas estão divididos em dois grupos: aqueles cuja solução é o conjunto unitário
→
−
{ 0 } e aqueles que admitem solução não nula.
3. Veremos que para matrizes quadradas de ordem n, a condição para a existência da inversa é
exatamente a mesma, isto é, uma matriz é invertı́vel se e somente se tem determinante não
nulo; veremos também que o escalonamento nos permite calcular a inversa para matrizes de
qualquer ordem. O resultado para sistemas homogêneos também é o mesmo: ou tem solução
→
−
única { 0 }, ou admite solução não nula.
Exercı́cios.
28
1. Pegue alguns exemplos de sistemas 2 × 2 de algum livro do ensino médio e resolva-os por
escalonamento, para se familiarizar com a técnica.
tem solução vazia. Troque a segunda equação desse sistema por x + y = k, determine k ∈ R
5. Verifique que det(A−1 ) = (det(A))−1 no caso de matrizes 2×2. Também veremos mais adiante
que isso vale para qualquer que seja a ordem da matriz A.
Já vimos que sistemas de equações lineares de duas equações e duas incógnitas representam in-
terseções de retas em R2 . Mas há um outro modo de vê-los; para tanto, vamos interpretar a
multiplicação de matrizes como funções.
2 2
Uma 2 × 2 A pode ser vista como uma função A : R → R onde a imagem de cada vetor
matriz
x
X= ∈ R2 é o vetor AX ∈ R2 . Muitas vezes uma aplicação desse tipo é chamada de movimento
y
do plano, porque podemos desenhar o vetor X e sua imagem no mesmo plano cartesiano.
Exemplos.
0 −1
1. Seja A = . Então, A pode ser vista como aplicação do plano no plano
1 0
A : R2 → R2
x −y
7→
y x
29
a 0 x ax x
2. Se A = , então o movimento leva qualquer vetor em = a , isto é,
0 a y ay y
x
multiplica o vetor pelo escalar a.
y
1 3 0 1
3. Seja M = e considere o triângulo retângulo ABC, sendo A = , B = e
1 0 0 0
0 →
− −→ →
−
C = . Note que M ( 0 ) = M (AA) = 0 (isso vale para qualquer matriz M : a imagem
1
−→ 1 −→ 0
da origem é sempre a origem). Calculando as imagens dos lados AB = e AC = ,
0 1
temos
−→ 1 3 1 1
M (AB) = =
1 0 0 1
e
−→ 1 3 0 3
M (AC) = = .
1 0 1 0
−→ −→
Logo, podemos observar que M não preserva ângulos (pois o ângulo entre AB e AC de 90o é
−→ −→
diferente do ângulo entre M (AB) e M (AC), que é 45o .
−→ −→
Tampouco M preserva distâncias: AC tem módulo 1, enquanto M (AC) tem módulo 3.
30
(a) R preserva normas, isto é, se V é um vetor qualquer de R2 , então k R(V ) k=k V k.
a
(b) Tome agora um vetor W = tal que k W k= 1. Verifique que o ângulo (orientado)
b
entre V e R(V ) é 30o .
Esta
é a formageral da matriz de rotação de um ângulo θ no sentido positivo: Rθ =
cos θ −sen θ
, e sempre preserva distâncias e ângulos.
sen θ cos θ
6. Se det(A) 6= 0, então dado qualquer vetor B ∈ R2 (no contradomı́nio), B tem uma única
pré-imagem, isto é, existe um único vetor X ∈ R2 (domı́nio) tal que AX = B. De fato,
trata-se de um sistema associado a uma matriz invertı́vel, portanto a solução existe e é única.
Diz-se nesse caso que A é sobrejetiva.
1 2
7. Isso não acontece para matrizes A com det(A) = 0: para A = , a tentativa de se achar
1 2
1
uma pré-imagem para o vetor resulta num sistema impossı́vel (verifique). O motivo é
0
que, sendo det(A) = 0 para uma matriz A não nula, então a imagem de A como
movimento
do
1 4
plano é uma reta que passa pela origem. Como exemplo, olhe para B = . A imagem
2 8
x
de B : R2 → R2 é o conjunto dos pontos da forma B , ou seja, os vetores da forma
y
x + 4y
, ou, em outras palavras, o conjunto dos vetores em que a segunda coordenada é
2x + 8y
t
o dobro da primeira, ou ainda, a reta r : |t ∈ R
2t
8. Voltando ao caso de matrizes A com det(A) 6= 0, mostraremos que A é injetiva, isto é, se Y
−−→ −→
e Z são pontos distintos no domı́nio, considerados como os vetores OY e OZ, então A(Y ) e
A(Z) serão distintos no contradomı́nio. Para se convencer disso, olhe para o vetor não nulo
→
−
Y − Z. Se fosse A(Y ) = A(Z), terı́amos A(Y ) − A(Z) = 0 . Mas isso é o mesmo que dizer
A(Y − Z) = 0, ou seja, que Y − Z é uma solução do sistema homogêneo AX = 0. Ora, como
det(A) 6= 0, esse sistema tem a origem como única solução, ou seja, Y − Z, por ser não nulo,
não pode ser solução. Essa contradição implica A(Y ) 6= A(Z).
Exercı́cio. Interpretando uma matriz A2×2 como movimento do plano, uma pergunta que poderia
ser feita é a seguinte: existe algum vetor não nulo X ∈ R2 (domı́nio) tal que AX = λX para algum
→
−
λ ∈ R? Ou: existe X 6= 0 tal que AX é um múltiplo de X? Dada a matriz A, como você faria
para responder essa questão? Geometricamente, a existência desse vetor significa que o vetor AX,
quando não nulo, tem a mesma direção de X. Por este motivo, a direção determinada por X é
chamada invariante pela multiplicação pela matriz A.
31
Note que já vimos exemplos em que não há direções invariantes (a rotações dos exemplos 1 e 5
acima) e um exemplo onde todas as direções são invariantes (a multiplicação por escalar do exemplo
2). Vamos ver agora um exemplo ainda simples mas com um comportamento diferente.
2 0
Seja A = . Uma direção invariante para A é dada por um vetor não nulo V tal que
0 −1
x
AV = λV , para algum λ ∈ R. Para procuar V , chame-o de V = e note que a condição que
y
deve ser satisfeita, AV = λV , se escreve
2x λx
= .
−y λy
Exercı́cios.
1
1. Determine os valores de x para que o vetor X = represente uma direção invariante da
x
1 1
matriz A = .
15 3
1 3 1
2. O vetor representa uma direção invariante da matriz ?
1 4 0
32
0 1 1 0
5. Encontre uma matriz que “transforma” o quadrado de vértices , , e no
0 0 1 1
√ √
0 2 1+ 2 1
losango de vértices , , e . Sugestão: a multiplicação por esta matriz
0 0 1 1
√
1 0 1 2
leva os vetores i = ej= respectivamente em U = eV = . Essa matriz
0 1 1 0
é única? Por quê?
(a) Suponha A injetiva e mostre que det A 6= 0, isto é, A é injetiva se e somente se det A 6= 0.
(b) Suponha A sobrejetiva e mostre que det A 6= 0, isto é, A é sobrejetiva se e somente se
det A 6= 0.
(c) Conclua que injetividade implica sobrejetividade e reciprocamente.
9 Formas quadáticas em R2
Mas por que procuramos direções invariantes de matrizes? Uma razão é que elas estão associadas
com eixos de simetria de elipses, hipérboles e parábolas, curvas (chamadas cônicas) que podem ser
interpretadas como soluções de equações quadráticas no plano, equações estas que têm coeficientes
definidos por uma certa matriz. Veremos um pouco adiante que as direções invariantes dessa matriz
determinam as direções de simetria da cônica.
Antes de definirmos as cônicas, vamos ver como matrizes definem coeficientes de equações quadráticas.
Definição 9.1 Uma forma quadrática no plano é uma expressão da forma ax2 + bxy + cy 2 , onde
a, b e c são números reais dados, não simultaneamente nulos.
Ou seja, uma forma quadrática no plano é uma função de domı́nio R2 e contradomı́nio R, dada por
uma expressão polinomial em duas variáveis, onde cada parcela tem grau exatamente 2. Para que
a forma seja de fato “quadrática”, exige-se, na definição, a condição de que a, b, c ∈ R não sejam
simultaneamente nulos.
Associamos formas quadráticas e matrizes quadradas de ordem dois escrevendo a forma quadrática
como um produto de matrizes:
2 2
a b1 x
ax + bxy + cy = x y ,
b2 c y
Assim, a uma forma quadrática está associada uma matriz 2 × 2 tal que os coeficientes de x2 e
y 2 são as entradas da diagonal principal e o coeficiente de xy é a soma das entradas da diagonal
secundária.
33
Na tentativa de representar formas quadráticas por matrizes
quadradas, há um pequeno problema
a b
a ser contornado. Uma matriz quadrada qualquer A = define uma forma quadrática, mas,
c d
como vimos, a mesma forma quadrática pode estar representada por duas matrizes distintas: basta
que tenham mesma diagonal principal e que as entradas na diagonal secundária tenham a mesma
soma. A maneira mais conveniente de se tratar isso é com matrizes simétricas.
Matrizes simétricas são matrizes quadradas que têm simetria em relação à diagonal principal. Para
t
dizer isto de outra maneira, definimos a transposta de uma matriz Mn×m por ser a matriz Mm×n
que tem como linhas as colunas de M e como colunas as linhas de M , e dizemos que A é simétrica
⇔ At = A.
No caso 2 × 2, as matrizes simétricas são as matrizes cujas entradas da diagonal secundária são
iguais.
Agora podemos identificar o conjunto das formas quadráticas no plano com o conjunto das matrizes
2 2
simétricas
2 × 2. Cada forma quadrática ax + bxy + cy define uma única matriz simétrica A =
a b/2
e reciprocamente.
b/2 c
2 2
O que faremos agora
é o seguinte: começaremos estudando equações da forma ax + by = c, ou
a 0 x
x y = c, ou seja, cuja parte quadrática está definida por uma matriz diagonal
0 b y
(matrizes que têm entradas não nulas somente na diagonal principal); diremos que uma equação
assim está na sua forma normal e veremos todos os casos possı́veis. De maneira geral, a solução de
uma equação deste tipo apresenta simetria em relação aos eixos x e y, que, como já foi visto, são
exatamente as direções invariantes de A.
a b x
Na sequência estudaremos o caso mais geral x y = d (ou ax2 + 2bxy + cy 2 = d)
b c y
procurando pelas direções invariantes da matriz da forma quadrática, que serão também as direções
de simetria da curva solução, reduzindo a equação a uma forma normal.
1 3
Exercı́cio. Calcule as duas direções invariantes da matriz a = e mostre que são ortogonais.
3 1
Um pouco mais para a frente, estudaremos o caso mais geral possı́vel de equações quadráticas no
plano, ax2 + bxy + cy 2 + dx + ey = f , também a partir das direções invariantes da matriz da forma
quadrática.
Por enquanto, vamos nos concentrar em soluções de equações em sua forma normal.
10 Cônicas
Vamos estudar equações da forma ax2 + by 2 = c. Antes de mais nada, vejamos alguns
exemplos.
34
1. x2 + y 2 = 1 é a equação do cı́rculo de raio 1 centrado na origem (ou: a solução é o cı́rculo).
5. No caso anterior, se a constante é nula, a solução é uma reta. Por exemplo x2 = 0 tem como
solução a reta x = 0. E a solução pode ainda ser vazia, como por exemplo, em x2 = −1.
6. Também pode acontecer que a solução seja um par de retas concorrentes, por exemplo, a
equação x2 − y 2 = 0 pode ter seu lado esquerdo fatorado e fica (x − y)(x + y) = 0, cuja
solução é a união das soluções de x − y = 0 e de x + y = 0, ou seja, a união das retas y = x e
y = −x, que se encontram na origem.
Observe que o exemplo 1 acima poderia ter sido apresentado a partir da definição do cı́rculo como
o lugar geométrico dos pontos do plano cuja distância até a origem é 1 e a equação seria uma
consequência dessa propriedade. Os próximos exemplos partem da definição geométrica.
Exemplo: elipse. A elipse é o lugar geométrico dos pontos do plano cuja soma das distâncias a
dois pontos dados (focos) é constante. Ou seja, são dados dois pontos distintos F1 e F2 no plano e
uma constante k > d(F1 , F2 ) (maior que a distância entre os dois focos) e a elipse é o conjunto de
pontos X tais que d(X, F1 ) + d(X, F2 ) = k.
Pense num “compasso para construir elipses”: um pedaço de barbante de comprimento maior que
a distância entre os dois focos, com uma extremidade amarrada em cada foco, num prego ou numa
taxinha, por exemplo. Com o lápis sobre o plano mantendo sempre o barbante esticado, desenhamos
a elipse. As distâncias da ponta do lápis aos focos somam exatamente o comprimento do barbante,
onde quer que a ponta do lápis esteja. Procure figuras ou vı́deos dessa construção na internet.
Para derivar uma equação cuja solução seja uma elipse, localize os focos sobre o eixo x, nos pontos
(−c, 0) e (c, 0) (para c > 0). As interseções da elipse com os raios positivos dos eixos x e y serão
denotadas, respectivamente, pelos pontos (a, 0) e (0, b), de modo que a, b > 0. Desse modo, a
constante (isto é, o tamanho do barbante) é igual a 2a. Note que o ponto (0, b) equidista dos focos,
logo a distância a cada um dos focos é a (a metade do tamanho do barbante) e os números a, b e
c satisfazem uma relação de Pitágoras a2 = b2 + c2 .
35
b
F1 F2 a
0
(c, 0)
Assim, dado um ponto X = (x, y) no plano, ele estará na elipse se e somente se (X, F1 )+d(X, F2 ) =
2a, ou seja,
p p
(x − c)2 + y 2 + (x + c)2 + y 2 = 2a.
Como exercı́cio de manipulação algébrica, mostre (ou leia em algum outro texto) que esta equação
se simplifica em
x2 y 2
+ 2 = 1.
a2 b
A forma acima é a forma normal da elipse, a partir desta equação, usando as simetrias em relação
aos eixos x e y, é possı́vel construir (esboçar) o gráfico da elipse.
Exercı́cio. Equacione a elipse com focos sobre o eixo y e faça um esboço de seu gráfico.
36
Exemplo: hipérbole. A hipérbole é o lugar geométrico dos pontos do plano cuja diferença das
distâncias a dois pontos dados (focos) é constante. Ou seja, são dados dois pontos distintos F1 e
F2 no plano e uma constante 0 < k < d(F1 , F2 ) (menor que a distância entre os dois focos) e a
hipérbole é o conjunto de pontos X tais que |d(X, F1 ) − d(X, F2 )| = k.
Antes de equacionarmos esta curva, pensemos, a exemplo do que fizemos no caso da elipse, num
instrumento para construir arcos de hipérbole no plano. Vá desenhando à medida em que for lendo.
Fixados os focos, suponha que a distância entre eles seja d e pegue um barbante de comprimento
d − k, onde k < d é a constante de definição da hipérbole. Numa régua maior que d, cave uma
fenda central, paralela aos lados maiores da régua, com comprimento d. Fixe uma extremidade da
fenda no primeiro foco de maneira que a fenda possa girar em torno desse foco. Fixe uma ponta do
barbante no segundo foco e a outra ponta na outra extremidade da fenda. Como posição inicial,
coloque a fenda exatamente sobre o segmento que liga os focos. Com o auxı́lio de um lápis estique
o barbante. O lápis marca no papel um ponto P tal que a distância de P até o segundo foco é
d−k
(metade do tamanho do barbante). Concluı́mos que a distância de P ao primeiro foco é k/2.
2
Assim, a diferença entre as distâncias de P aos focos é k. Mantendo o barbante esticado e girando
a fenda em torno do primeiro foco, cada ponto Q do traço marcado pelo lápis também tem esta
propriedade: a diferença das distâncias de Q aos focos é exatamente k. Procure figuras ou vı́deos
na internet para ilustrar. Assim o lápis descreve um arco de hipérbole. Note que existe um outro
arco da curva, que não intercepta o primeiro, desenhado quando repetimos o procedimento fixando
uma extremidade da fenda no segundo foco e girando a fenda em torno dele.
Para deduzir a equação, fixamos os focos nos pontos F1 = (−c, 0) e F2 = (0, c), c > 0. A distância
entre os focos é portanto 2c. Se chamamos o ponto inicial P da construção acima de (a, 0), então,
k = 2a. A equação procurada é portanto |d(X, F1 ) − d(X, F2 )| = 2a, que, elevando ambos os lados
ao quadrado para eliminar o módulo, fica equivalente a
p p
( (x − c)2 + y 2 − (x + c)2 + y 2 )2 = 4a2 .
Como exercı́cio de manipulação algébrica, mostre que esta equação quando simplificada, se escreve
x2 y2
− = 1; chamando b2 = c2 − a2 , chegamos à forma normal da hipérbole (com focos no
a2 c 2 − a2
eixo x),
x2 y 2
− 2 = 1.
a2 b
Note que o gráfico tem simetria em relação aos eixos x e y. Assim, vamos fazer por enquanto um
b√ 2
esboço no primeiro quadrante a partir da equação y = x − a2 , obtida isolando y em função de
a
x quando ambos são positivos e √ x > a. Quando x for muito grande teremos as grandezas x2 − a2
2
e x muito próximas e portanto x2 − a2 muito próximo de x, embora sempre menor que x. Logo
b
o gráfico desta função se aproximará, por baixo, do gráfico da reta y = x. Refletindo este esboço
a
nos eixos x e y, temos o esboço da hipérbole, uma curva com duas componentes conexas, isto é,
b b
dois “pedaços”. As retas y = x e y = − x são chamadas assı́ntotas da hipérbole.
a a
Exercı́cio. Localizando os focos sobre o eixo y, derive a forma normal da hipérbole com focos no
eixo y e faça um esboço de seu gráfico.
37
38
Vimos, até agora oito exemplos de possibilidades de soluções para equações quadráticas da forma
ax2 + by 2 = c, as duas últimas, elipse e hipérbole, são também chamadas de cônicas, por estarem
também definidas como seções de um cone feitas por um plano. Um cone no espaço é gerado pela
rotação de uma reta g em torno de uma reta h, concorrente com g no ponto V . V é chamado vértice
do cone, g é a geratriz e h é o eixo. A elipse é a interseção de um cone com um plano “pouco
inclinado” com relação à geratriz (ou “menos inclinado”) e a hipérbole é a curva resultante de uma
seção do conte por um plano “muito inclinado” (“mais inclinado”). Procure figuras na internet e
confira que a hipérbole tem de fato duas componentes conexas.
Exemplo: parábola. Você deve ter perguntado, com razão, sobre a parábola, já que, muito
provavelmente foi a primeira curva quadrática que você estudou. De fato, a parábola não aparece
nesta forma normal porque as equações deste tipo possuem exatamente dois eixos de simetria
(os eixos coordenados), enquanto a parábola apresenta apenas um. A matriz que define a forma
a 0
quadrática de uma parábola é da mesma forma dos exemplos 4 e 5 acima: A = , a 6= 0,
0 0
podendo acontecer do valor não nulo aparecer na posição (1, 1) ou (2, 2) da matriz. A diferença é
que a parábola “exige” a presença de um termo linear. Por exemplo, se o coeficiente de x2 é nulo,
então o coeficiente de y não pode ser e se o coeficiente de y 2 é nulo, o coeficiente de x não pode ser.
Formas normais são y = ax2 ou x = ay 2 , com gráficos suficientemente conhecidos.
A exemplo de elipses e hipérboles, a parábola também pode ser definida como um lugar geométrico:
é o lugar geométrico dos pontos do plano que equidistam de um ponto (foco) e uma reta (diretriz)
que não contém o foco. Ou ainda como seção de um cone, por um plano “tão inclinado” quanto
a geratriz. Pesquise como construir parábolas com réguas e barbantes a partir da definição como
lugar geométrico.
Exercı́cio. Para uma parábola, suponha que o foco é o ponto (0, c) e a diretriz é a reta y = −c,
c > 0 e deduza a equação desta curva. Para tanto, você vai ter que pensar como conseguir calcular
a distância de um ponto a uma reta, um exercı́cio importante de geometria analı́tica.
Veremos mais tarde, quando estudarmos a forma geral das equações quadráticas no plano, da forma
ax2 + bxy + cy 2 + dx + ey = f , que os nove tipos de exemplos vistos acima (vazio, ponto, cı́rculo,
elipse, reta, par de paralelas, parábola, par de concorrentes e hipérbole) são todas as possibilidades
para a solução.
Até agora temos estudado objetos geométricos do plano a partir de sua representação algébrica,
por exemplo, pontos e vetores estão representados por pares ordenados de números reais, em geral
escritos como colunas. Também já estudamos retas e curvas como soluções de equações. Para
tanto, foi necessário fixar um sistema de coordenadas cartesianas.
39
Já vimos como definir um sistema de coordenadas na reta, através da escolha de dois pontos A e B
para representar o “0” e o “1”, ou seja, dado pela escolha de um ponto (A) e por um vetor diretor
−→
(AB). Assim, pontos da reta são representados por números reais, e a reta passa a se chamar eixo.
Lembre-se do que é usualmente definido no plano, um sistema Cartesiano, formado por dois eixos
perpendiculares, com origem comum no ponto de interseção, ambos com vetores diretores unitários
tais que o giro do primeiro para o segundo vetor se faz no sentido anti-horário. Pontos e vetores estão
associados (um ponto está associado ao vetor que começa na origem e termina nele) e representados
por matrizes coluna 2 × 1.
Com a mesma ideia de sistemas cartesianos podemos definir coordenadas no plano fixando dois
eixos concorrentes e com mesma origem. Basta escolher um ponto (a origem, em geral denotado
por O) e de um par ordenado de vetores não paralelos {V, W }. Feita esta escolha, os eixos deste
sistema de coordenadas, vamos chamá-los v e w, serão as retas que passam por O e têm vetores
diretores V e W . Isto significa que V define, além da direção do primeiro eixo, sua unidade de
medida e seu sentido positivo, assim como W para o segundo eixo.
Portanto, dado um ponto B no plano, por B existe uma única reta paralela ao eixo w, que corta
o eixo v num ponto P , assim como existe uma única paralela por B ao eixo v, cortando o eixo w
no ponto Q. Note que os pontos P e Q estão unicamente determinados a partir do ponto B. Pela
−−→ −→ −→
regra do paralelogramo para adição de vetores, o que fizemos foi escrever OB = OP + OQ. Como
−→ −→
sabemos que OP é um múltiplo de V e OQ é um múltiplo de W , existem números reais x e y
−−→ −−→
tais que OB = xV + yW , chamados de coordenadas de B (ou de OB) em relação ao sistema de
x
coordenadas G = {O, {V, W }}. Escrevemos BG = .
y
40
V
P
W
Definições. Alguma nomenclatura agora ajuda a abreviar depois. Um par ordenado de vetores
que pode ser usado para definir coordenadas, ou seja um par ordenado de vetores não paralelos no
plano chama-se base.
Uma base B = {V, W } é chamada de positiva quando o giro de V para W ao longo do menor ângulo
é no sentido positivo ou anti-horário e negativa caso contrário. Quando não há a necessidade de se
explicitar a origem, denotamos AB para as coordenadas do ponto A em relação à base B.
Se um vetor pode ser obtido por outros usando somente as operações de adição de vetores e
multiplicação de vetores por escalar, então, aquele é chamado de combinação linear destes. Assim,
determinar as coordenadas de um vetor em relação a uma base é escrevê-lo como combinação linear
dos vetores da base. Como já foi argumentado, essa decomposição é única.
Exemplo. O sistema de coordenadas usual do plano é dado por um ponto O e uma base positiva
formada por dois vetores unitários e perpendiculares. Esta base é em geral denotada por B0 = {i, j}
e é chamada de base usual ou canônica. O vetor i é um gerador do eixo x e j é um gerador do eixo
y. Nesse caso, as projeções paralelas a um eixo são perpendiculares ao outro e de qualquer modo
o que se faz para munir um vetor de coordenadas é decompô-lo como a soma de um múltiplo de i
41
com um múltiplo de j. Em casos onde não há perigo de confusão, não usamos ı́ncice para expressar
coordenadas em relação à base canônica: em vez de escrever UB0 , escrevemos apenas U .
Existem situações nas quais precisaremos (ou desejaremos) trabalhar com dois sistemas de coorde-
nadas simultaneamente, portanto, dado um objeto geométrico, seja um ponto, um vetor, uma reta,
uma cônica, devemos saber relacionar as matrizes ou equações que os representam em sistemas dife-
rentes. Assim, vamos observar um ente geométrico que existe e está bem definido, antes de fixarmos
um sistema de coordenadas para representá-lo algebricamente: um ponto B pode ser representado
por duas matrizes diferentes BB e BC , mas B não muda, o que muda são suas coordenadas.
12 Mudança de base
Vamos considerar, no momento, somente mudanças de base, isto é, fixemos a origem O até que se
diga o contrário. O que define as coordenadas de um vetor num sistema é sua decomposição como
combinação linear dos vetores da base. Assim, dadas as bases usual B0 , que define as coordenadas
usuais (x, y), e B = {V, W }, cujas coordenadas vamos denonimar (x0 , y 0 ), não é difı́cil deduzir a
equação que relaciona as coordenadas de um ponto B em cada uma das bases. Escreva
−−→
OB = xi + yj = x0 V + y 0 W.
0
x x
Isto significa que X = são as coordenadas de B na base canônica e X 0 = são as
y y0
B.Vamos
coordenadas de B na base olhar para esta equação (a segunda) no sistema usual. Seu
1 0 x
lado esquerdo fica x +y = = X. Para a análise do lado direito, vamos considerar a
0 1 y
matriz A = [V, W ], que tem os vetores V0 e W como colunas. É um exercı́cio de multiplicação de
x
matrizes ver que x0 V + y 0 W = [V, W ] 0 , isto é, o lado direito da equação fica AX 0 . Portanto, a
y
equação que relaciona as coordenadas de um vetor nas bases B0 e B é
X = AX 0 .
A matriz A é chamada de matriz de mudança de base. As colunas de A são uma base para o
plano, logo são vetores não paralelos. Portanto, as colunas de A não podem ser múltiplas e seu
determinante é não nulo. Em outras palavras, A é invertı́vel e qualquer sistema associado a A tem
única solução. Em particular, uma maneira equivalente de escrever a equação de mudança de base
é multiplicar ambos os lados por A−1 à esquerda, obtendo
X 0 = A−1 X.
Exemplos.
1 2
1. Sejam V = eW = . Seja A = [V, W ] (colunas) matriz 2 × 2 formada por V e W .
3 −2
1 2 x + 2y 1 2 x x
Então, xV + yW = x +y = = =A , um exemplo
3 −2 3x − 2y 3 −2 y y
que ilustra que multiplicação de matriz por vetor é uma combinação linear das colunas da
matriz onde os escalares utilizados são as entradas do vetor.
42
1 2
2. Seja B = {U, V }, onde U = e V = . Se temos um ponto P do plano cujas
1 1
5
coordenadas na base usual são P = , para calcular PB , usamos a equação de mudança
−1
0 −1
de base.
Para
este caso, onde
temos X e queremos calcular X , usamos PB = A P =
1 1 −2 5 −7
= .
−1 −1 1 −1 6
3. Se um vetor W do plano pode ser decomposto como W =U − V , onde U e V são os vetores
1
da base do exemplo 2, ou, em outras palavras, WB = , então suas coordenadas na base
−1
1 2 1 −1
canônica são dadas por W = AWB = = .
1 1 −1 0
4. Outra pergunta importante é como achar a equação da reta r : 2x − 5y = 12 nas coordenadas
(x0 , y 0 ), definidas pela base B do
exemplo 2. Basta escrever a equação de r explicitando o pro-
x0
x 0
1 2
duto de matrizes, r : 2 −5 = 12 e usar X = AX , ou seja, r : 2 −5 ,
y 1 1 y0
que, fazendo as contas, fica r : −3x0 − y 0 = 12.
5. O mesmo raciocı́nio se aplica a uma equação quadrática. Digamos que queremos a equação
3x2 + 4y 2 = 1 no sistema (x0 , y 0 ), ainda considerando
a base
do exemplo 2. Escrevendo
3 0 x
a equação em sua forma matricial, temos x y = 1, ou X t M X = 1, onde
0 4 y
3 0
. Novamente faremos a substituição X = AX 0 , só que agora,
t
X = x y eM =
0 4
olhando para a equação, precisaremos saber quem é X t . Veremos mais adiante num exercı́cio
que X t = (AX 0 )t = X 0t At , ou seja, a transposta de um produto de matrizes é o produto das
matrizes transpostas, mas em ordem contrária. Assim, substituindo X = AX 0 e X t = X 0t At
0t t
em
X
t
MX = 1,
ficamos
com X A M AX 0 = 1. Calculando o produto de matrizes, At M A =
1 1 3 0 1 2 7 10
= . De maneira que a equação nas coordenadas (x0 , y 0 ) fica
2 1 0 4 1 1 10 16
7x02 + 20x0 y 0 + 16y 02 = 1.
Em tempo: a transposta de uma matriz Am×n é a matriz Atn×m cujas linhas são as colunas de
A (ou, equivalentemente, cujas colunas são as linhas de A).
6. O exemplo anterior serve também para uma observação sobre eixos de simetria. Os exemplos
de cônicas que vimos até agora são da forma ax2 + by 2 = c, que naturalmente têm os eixos
x e y como eixos de simetria. Isto acontece porque, na equação, as variáveis x e y aparecem
com expoente 2 e nenhum outro termo de grau 2 ou 1 aparece. Veja o caso da equação
5x2 + 3y 2 = 17, da qual o ponto P = (1, 2) faz parte da solução. Se refletirmos P no eixo
x, isto é, se trocarmos sua coordenada y de sinal, o ponto resultante Q = (1, −2) ainda faz
parte da solução. O mesmo ocorre com a reflexão de P no eixo y, trocando sua coordenada
x de sinal, resultando em T = (−1, 2). Agora, isto já não é verdade para uma equação
quadrática onde o coeficiente do termo xy seja diferente de 0. De fato, se consideramos a
equação x2 + 2xy + 3y 2 = 6, da qual (1, 1) faz parte da solução, veremos que nem (1, −1) nem
(−1, 1) fazem parte da solução.
43
7. Em ambas as equações do exemplo anterior, tanto 5x2 + 3y 2 = 17, como x2 + 2xy + 3y 2 = 6,
se um ponto faz parte da solução, então ao trocarmos ambas as coordenadas de sinal, o ponto
“oposto” ainda faz parte da solução. Isto significa que ambas têm simetria em relação à
origem. Por causa desta simetria, equações gerais da forma ax2 + bxy + cy 2 = d têm seu
conjunto solução centrado na origem, mas terá os eixos x e y como eixos de simetria se e
somente se o coeficiente b do termo xy for zero. Ou, equivalentemente, se a matriz da forma
quadrática for diagonal.
8. Se B e C são duas bases quaisquer, definindo, respectivamente as coordenadas (u, v) e (z, w),
estabeleça uma relação entre as coordenadas que elas definem.
9. Suponha que um novo sistema de coordenadas (x0 , y 0 ) é obtido do usual por uma rotação dos
vetores i e j da base canônica de 30o no sentido positivo. Qual é a equação do eixo x nas
novas coordenadas?
Vamos voltar agora ao problema de estudar as equações quadráticas da forma ax2 + bxy + cy 2 = d,
onde pelo menos um dos coeficientes a, b ou c é não nulo. Já vimos que existe uma e só uma matriz
simétrica que representa esta forma quadrática, obtida escrevendo a equação como
44
a b/2 x
x y = d.
b/2 c y
Primeira pergunta: sempre existem eixos de simetria perpendiculares para o conjunto solução
da equação? Ou, de maneira equivalente, existe um sistema de coordenadas (x0 , y 0 ), com eixos
perpendiculares, no qual a equação da cônica tem o coeficiente de x0 y 0 nulo? Já vimos que este é o
caso se a matriz da forma quadrática é diagonal.
Segunda pergunta: caso exista, como podemos obter tal sistema de coordenadas?
As respostas são respectivamente “sim” e “fácil”; veremos agora como isso pode ser feito.
O próximo resultado é exatamente o que precisamos para estudar tais equações quadráticas (lembre-
se que a, b e c não são simultaneamente nulos):
Teorema 13.1 Dada uma equação da forma ax2 + bxy + cy 2 = d, o conjunto solução da equação
admite um par de eixos de simetria
perpendiculares.
Estes eixos são definidos por direções invari-
a b/2
antes da matriz simétrica M = .
b/2 c
Não adianta conhecer esse resultado se não dispusermos de uma técnica para determinar as direções
invariantes de uma matriz simétrica. Os conceitos envolvidos são os autovetores e autovalores da
matriz da forma quadrática, aparecem naturalmente na demonstração do resultado enunciado e
que veremos a seguir.
Façamos uma breve recordação do que é uma direção invariante. Ao interpretarmos M2×2 como um
movimento do plano, isto é, uma função que atua num vetor V , multiplicando V por M à esquerda,
M : R2 → R2
,
V 7→ M V
M V é também um vetor e podemos olhar para a posição relativa dos vetores V e M V observando o
domı́nio e o contradomı́nio sobrepostos (e no sistema usual de coordenadas). Pode acontecer que V
e M V tenham a mesma direção, isto é, V pode ser um vetor não nulo tal que M V seja um múltiplo
do próprio V . Em sı́mbolos, um vetor não nulo V define uma direção invariante de M se existe
um número real λ tal que M V = λV . Nesse caso, V é chamado de autovetor de M associado ao
autovalor λ. Autovetores (autovalores) eventualmente são chamados de vetores (valores) próprios
ou caracterı́sticos da matriz M .
Mas como saber se uma matriz M tem autovalores e autovetores e como calculá-los? A partir da
equação
M V = λV
45
escrevemos
M V − λV = 0.
Observe que o “0” do lado direito da equação é o vetor nulo. Não se pode fatorar V nesta equação,
pois M é uma matriz e λ é um número. Mas, lembrando que a matriz identidade 2 × 2, denotada
I, é o elemento neutro da muliplicação de matrizes (logo IV = V ) e escrevendo
M V − λIV = 0,
(M − λI)V = 0.
Interpretando V como incógnita, a equação acima é um sistema linear homogêneo de duas equações
e duas incógnitas que depende de um parâmetro real (λ). Procuramos, para este sistema, uma
solução não nula, já que V deve ser um autovetor.
A condição sobre λ para que o sistema admita soluções não nulas é que det(M − λI) = 0. Caso
contrário, isto é, se o determinante fosse não nulo, o sistema teria solução única e, como sabemos
que o vetor nulo é solução (pois o sistema é homogêneo), seria a única solução.
Assim, estamos procurando λ para que det(M − λI) = 0, ou, equivalentemente, para que o sistema
tenha as duas equações múltiplas. Na prática, isso quer dizer que o sistema dependerá de uma
equação e duas incógnitas, sua solução portanto sendo interpretada como uma reta que passa pela
origem. Todos os vetores desta reta (exceto a origem, claro) serão autovetores associados a λ.
2 −2
Exemplo. No caso da matriz A = , a condição para que λ seja um autovalor é
−1 0
det(A − λI) = 0, ou seja,
2 −2 1 0
det −λ =0
−1 0 0 1
ou
2 − λ −2
det =0
−1 −λ
46
Assim, pensando genericamente, para uma matriz A2×2 qualquer, há três possibilidades: ou não
existem autovalores (o polinômio caracterı́stico não tem raı́zes reais), ou existe um único autovalor
(duas raı́zes reais iguais) ou existem dois autovalores distintos (duas raı́zes reais distintas).
Como era de se esperar, as equações são múltiplas (afinal de contas os valores de λ foram calculados
para isso) e para escrever a solução basta olhar uma delas, por exemplo, dividindo a primeira por
−2, ficamos com 2x − 3y = 0. Isolando
uma dasincógnitas,
por exemplo,
xem função
de y,
3y/2 3/2 3
vemos que a solução é S1 = |y ∈ R = y |y ∈ R = y |y ∈ R , a reta
y 1 2
3
gerada pelo vetor . Qualquer vetor não nulo desta reta é autovetor associado ao autovalor 9,
2
3
escolhemos V1 = .
2
Exercı́cio. Verifique, sem resolver o sistema, que V2 e λ2 sao autovetor e autovalor associados da
matriz M .
47
Obtidos os autovetores, vamos considerar uma mudança de base, da base canônica para a base de
autovetores da matriz M . Finalizando o exemplo, vamos escrever a equação 5x2 + 12xy = 1 nas
coordenadas (x0 , y 0 ) definidas pela base {V1 , V2 }.
5 6 x
Para tanto, a partir da equação original x y = 1, escrita como X t M X = 1, e da
6 0 y
equação de mudança de base X = AX 0 , onde A = [V1 , V2 ] (colunas), substituimos X por AX 0
(consequentemente X t por X 0t At ) e ficamos com
X 0t At M AX 0 = 1.
t 117 0
Uma simples multiplicação de matrizes nos leva a A M A = , uma matriz diagonal, o
0 −52
que nos diz que a equação procurada é 117x02 −52y 02 = 1, equação de uma hipérbole que já sabemos
x02 y 02
colocar na forma normal − = 1 e consequentemente desenhá-la no sistema (x0 , y 0 ).
1 2 1 2
(√ ) (√ )
117 52
E, como sabemos localizar esse novo sistema a partir do usual, sabemos esboçar a solução da nossa
equação no sistema usual. Um esboço está na próxima figura.
Note que os eixos x0 e y 0 têm direção determinadas pelos autovetores de M e são eixos de simetria
da solução da equação.
Observação. Para esboçar a curva no sistema (x0 , y 0 ) temos que tomar algum cuidado com a
escala, já que os autovetores V1 e V2 determinam também a unidade de medida dos novoseixos.
V1 1 3
Para contornar esta situação, podemos escolher autovetores unitários W1 = = √ e,
kV1 k 13 2
V2 1 −2
do mesmo modo, W2 = =√ .
kV2 k 13 3
Nesse caso, além de tornar desnecessário o cuidado com a mudança
de escala, a matriz dos autove-
1 3 −2
tores (vamos chamá-la ainda de A), fica [W1 , W2 ] = √ , e o cálculo At M A nos fornece
13 2 3
9 0
a matriz D = , chamada matriz dos autovalores, donde pode-se imediatamente concluir
0 −4
que a equação, nas novas coordenadas, é 9x02 − 4y 02 = 1.
Assim, há pelo menos duas vantagens em escolhermos autovetores unitários: não mudamos a escala
dos eixos coordenados e, ao fazermos a mudança de coordenadas da equação, já sabemos quem vão
ser os coeficientes de x02 e y 02 : exatamente os autovalores.
Na verdade, matrizes cujas colunas são vetores unitários e ortogonais são particularmente impor-
tantes.
48
49
Definição. Uma base do plano na qual os vetores são unitários e ortogonais é chamada base
ortonormal (“orto” de ortogonal e “normal” de normalizada para que seus módulos sejam 1). Uma
matriz cujas colunas são uma base ortonormal é chamada de matriz ortogonal.
1. Se A é uma matriz ortogonal, então | det A| = 1. A recı́proca é verdadeira? Isto é, se uma
matriz A tem seu determinante valendo 1 ou −1, então ela é ortogonal?
2. Se A é uma matriz ortogonal, então A−1 = At . A recı́proca é verdadeira? Isto é, matrizes
quadradas que satisfazem A−1 = At são ortogonais?
3. Matrizes ortogonais preservam produto escalar. Isto é, se A é uma matriz ortogonal e U e V
são dois vetores quaisquer, então AU · AV = U · V .
Este modo de escrever o produto escalar nos mostra que uma matriz qualquer M “passa de um
lado para o outro” num produto escalar a partir de sua transposta: (M U ) · V = (M U )t V =
(U t M t )V = U t (M t V ) = U · (M t V ).
Falta ainda a demonstração do teorema enunciado. O melhor tı́tulo para isso é o seguinte:
Passemos agora à demonstração do Teorema. O resultado nos diz que a equação quadrática
X t M X = d admite um sistema cartesiano de coordenadas (x0 , y 0 ) cujos eixos são eixos de si-
metria da solução (ou seja, o coeficiente de x0 y 0 na equação é nulo), dado por direções invariantes
da matriz simétrica M .
a b
Então, vamos partir da matriz simétrica M = e encontrar seus autovalores e autovetores.
b c
50
A equação caracterı́stica de M é det(M − λI) = 0, ou (a − λ)(c − λ) − b2 = 0, ou ainda λ2 − (a +
c)λ + ac − b2 = 0. Para resolver esta equação, calculamos o ∆ = (a + c)2 − 4ac + 4b2 . Simplificando,
podemos escrever ∆ = (a − c)2 + (2b)2 , isto é, ∆ é uma soma de quadrados. Assim, certamente
∆ ≥ 0, o que significa que existem autovalores reais.
Vejamos agora o que acontece quando ∆ > 0. Nesse caso, a equação caracterı́stica tem duas raı́zes
reais distintas, vamos chamá-las λ1 e λ2 . Escolha autovetores unitários W1 associado a λ1 e W2
associado a λ2 . Vamos mostrar que W1 e W2 são mais que uma base: eles não são apenas não
paralelos, mas são ortogonais.
Ou seja, vamos mostrar que W1 · W2 = 0. Para ver isso, usando a observação 2 acima, podemos
escrever (M W1 ) · W2 = W1 · (M t W2 ), mas, como M é simétrica, temos M t = M , o que nos dá
(M W1 ) · W2 = W1 · (M W2 ).
(λ1 W1 ) · W2 = W1 · (λ2 W2 ).
Olhando novamente para observação 2 acima, que nos diz que o produto escalar pode ser visto
como produto de matrizes, e usando a propriedade associativa do produto de matrizes, segue
λ1 (W1 · W2 ) = λ2 (W1 · W2 ),
(λ1 − λ2 )(W1 · W2 ) = 0.
Proposição 13.1 Para matrizes simétricas, autovetores associados a autovalores distintos são or-
togonais.
Assim, conseguimos uma base ortonormal {W1 , W2 } que define eixos x0 e y 0 que devem ser eixos de
simetria para a equação original. Para verificar isto, basta olhar para a equação neste novo sistema
de coordenadas e constatar que o coeficiente de x0 y 0 é nulo.
51
A relação entre as coordenadas
usuais e asnovas coordenadas é X = AX 0 , onde A = [W1 , W2 ] é a
x0
x
matriz dos autovetores, X = e X0 = .
y y0
X 0t At M AX.
X 0t A−1 M AX.
−1 λ1 0
Afirmamos que A M A = D, onde D = é a matriz (diagonal) dos autovalores. Note
0 λ2
que, uma vez mostrado esse fato, a forma quadrática, nas coordenadas (x0 , y 0 ) fica λ1 x02 + λ2 y 02 ,
donde a equação de fato terá x0 e y 0 como eixos de simetria. Mais ainda, uma vez demonstrado o
teorema, ao calcularmos os autovalores, saberemos imediatamente como será a equação na base de
autovetores.
Mostrar que A−1 M A = D é equivalente a mostrar que M A = AD. O lado esquerdo desta
equação pode ser escrito M [W1 , W2 ]. É um exercı́cio de multiplicação de matrizes ver que M A =
[M W1 , M W2 ] que por sua vez é igual a [λ1 W1 , λ2 W2 ].
λ1 0
Já para o lado direito temos AD = [W1 , W2 ] e a partir daqui é um simples exercı́cio de
0 λ2
multiplicação de matrizes ver que AD = [λ1 W1 , λ2 W2 ], concluindo que a igualdade é válida.
O teorema está demonstrado. Uma outra forma de se enunciar os mesmos resultados com outras
palavras é:
Teorema 13.2 Matrizes simétricas são diagonalizáveis por bases ortonormais, isto é, dada uma
matriz simétrica 2 × 2 M , existem matrizes A ortogonal e D diagonal tais que M = ADA−1 .
O leitor pode perguntar se, antes de fazermos a mudança de coordenadas de modo a que a equação
fique numa “forma normal”, se já se sabe que tipo de solução a equação apresenta. Para responder
a esta pergunta, a primeira observação é o fato que existem três tipos de equações resultantes no
sistema (x0 , y 0 ) dado por uma base de autovetores de M . E o tipo da equação depende do produto
dos autovetores, isto é, det D.
Se ambos os autovalores têm mesmo sinal (isto é, det D > 0), então a equação fica λ1 x02 + λ2 y 02 = d
e multiplicando por −1 se necessário, podemos supor os coeficientes de x02 e y 02 ambos positivos e,
consequentemente, a solução depende da constante d: se d > 0, então é uma elipse (admitindo o
cı́rculo como caso particular quando os autovalores são iguais); se d = 0 é um ponto (a origem) e
se d < 0 a solução é vazia. Equações assim são chamadas de tipo elı́ptico.
Já se os autovalores têm sinais opostos (det D < 0), então o mesmo acontece com os coeficientes de
x02 e y 02 na equação e a solução pode ser uma hipérbole, caso d 6= 0 ou um par de retas concorrentes,
caso d = 0. Estas são as de tipo hiperbólico.
52
A última possibilidade, uma equação de tipo parabólico ocorre quando um dos autovalores é zero
(ou det D = 0). Trocando a ordem dos autovalores se necessário, podemos supor λ2 = 0. Nesse
caso a equação assume a forma λ1 x02 = d, ou equivalentemente x02 = d0 (constante), e a solução
pode ser vazia, uma reta ou um par de retas paralelas, caso d < 0, d = 0 e d > 0 respectivamente.
Exemplos de todos os casos acima foram dados na seção “Cônicas”. O que fizemos (a análise
de todas as possibilidades) nos permite concluir que são todos os casos. Observe também que
o raciocı́nio acima nos diz uma vez mais que a parábola não ocorre como solução da equação
ax2 + bxy + cy 2 = d.
14 Mudança de origem
Continuando no sentido de estudar a forma mais geral de equações quadráticas no plano, precisa-
remos entender mudanças de origem.
Para isso, vamos considerar sistemas de coordenadas com a mesma base - a base usual {i, j} - mas
origens diferentes. Escolha pontos O e Q no plano e defina coordenadas usuais (x, y) do sistema
{O, {i, j}} e (x0 , y 0 ) do sistema {Q, {i, j}}.
Seja B um ponto qualquer do plano. Suas coordenadas em relação à origem O são as coordenadas
−−→ −−→
do vetor OB e em relação à origem Q são as coordenadas de QB. Note que os pontos O, Q e
−−→ −→ −−→
B, a partir da definição de adição de vetores, satisfazem OB = OQ + QB. Esta equação, quando
observada do sistema usual de coordenadas, nos diz
X = Q + X 0,
53
y
y’
Q x’
x
O
Exemplos.
1. Seja Q o ponto (−1, 3) do plano. Sejam (x, y) coordenadas usuais e (x0 , y 0 ) coordenadas em
relação à origem Q. Se B é um ponto do plano, vamos denotar por BQ suas coordenadas em
relação a Q e, como de praxe, quando não houver
ı́ndice, isto significa que as coordenadas
2
são as do sistema usual. Por exemplo, se B = , para obter BQ basta olhar para a relação
2
2 −1 3
entre os sistemas de coordenadas e obter BQ = B − Q = − = .
2 3 −1
2. Um cı́rculo de raio 1 e centro Q = (5, 2) tem equação (x − 5)2 + (y − 2)2 = 1. De fato, observe
primeiramente que, nas coordenadas (x0 , y 0 ) definidas pelo sistema {(5, 2), {i, j}}, a equação
deste cı́rculo é x02 + y 02 = 1. Usando X 0 = X − Q, isto é, substituindo x0 = x − 5 e y 0 = y − 2,
obtemos a equação anunciada.
3. A parábola y = 4x2 −6x+1 pode ter seu vértice identificado a partir de um completamento de
3
quadrados: escrevemos y = 4(x2 − x) + 1 e procuramos uma constante positiva k 2 para que
2
3
o trinômio de segundo grau x − x + k 2 seja quadrado perfeito. Fazemos isso comparando-o
2
2
2 2 2 3
com (x − k) = x − 2kx + k , obtendo − x = −2kx. Como esta relação deve valer para
2
54
3 9
todo x, encontramos k = e consequentemente k 2 = . Voltando à equação original da
4 16
parábola, temos
3
y = 4(x2 − x) + 1
2
3
y = 4(x2 − x + k 2 − k 2 ) + 1
2
3 9 9
y = 4(x2 − x + ) − 4 + 1
2 16 16
3 5
y = 4(x − )2 −
4 4
5 3 5
Finalmente, escrevemos esta equação como y + = 4(x − )2 . Ao fazermos y 0 = y + e
4 4 4
0 3 0 02
x = x − , a equação fica numa forma normal y = 4x , cujo vértice é a origem do sistema
4
(x0 , y 0 ).
Para encontrar esta origem Q, basta olharmos para a equação de mudança de origem, X 0 =
2 2
X − Q (note termos comparado com (x − k) em vez de(x + k) ).
queesteé o motivo por
0
x x − 3/4 3/4
Como temos = , segue que o vértice procurado é Q = .
y0 y − (−5/4) −5/4
A equação caracterı́stica, det(M − λI) − 0 é a equação de segundo grau λ2 − 25λ+ 150 =0, cujas
15 0
raı́zes são λ1 = 15 e λ2 = 10. A matriz dos autovalores é portanto a matriz D = .
0 10
55
−1 −2 x
Para calcular os autovetores associados a λ1 = 15, o sistema a ser resolvido é = 0,
−2 −4 y
−2
cuja solução é a reta de equação x + 2y = 0, isto é, y |y ∈ R , da qual escolhemos o vetor
1
−2 1 −2
diretor . Dividindo por seu módulo para torná-lo unitário, obtemos V1 = √ .
1 5 1
Para calcular os autovetores associados a λ2 = 10, podemos resolver o sistema correspondente ou
simplesmente usar o teorema de diagonalização,
que afirma que são ortogonais a V1 , e obtemos, por
1 1
exemplo, o vetor unitário V2 = √ .
5 2
1 −2 1
A matriz dos autovetores é portanto A = √ ; assim já sabemos localizar sistema de
5 1 2
coordenadas (x0 , y 0 ).
y’
x’
V2
V1
e fazendo a mudança de base X = AX 0 , já vimos que a parte quadrática fica 15x02 + 10y 02 . Assim,
a equação, nas coordenadas (x0 , y 0 ) é
56
√
0
02 02
1 −2 1 x 15
15x + 10y + 5 −6 18 √ 0 =− ,
5 1 2 y 2
15 3
que se simplifica em 15x02 + 10y 02 + 30x0 + 30y 0 = − , ou ainda 3x02 + 2y 02 + 6x0 + 6y 0 = − .
2 2
A segunda mudança de coordenadas é uma mudança de origem, e se faz completando os quadrados.
Não é difı́cil ver que a equação pode ser escrita
9 9 3
3(x02 + 2x0 + 1) − 3 + 2(y 02 + 3y 0 + ) − = − ,
4 2 2
ou ainda
3
3(x0 + 1)2 + 2(y 0 + )2 = 6.
2
0
!
00
x x + 1
Fazendo a mudança de origem = 3 e comparando com X 00 = X 0 − Q, onde o ponto
y 00 y0 +
2
Q é a!origem do sistema (x00 , y 00 ), concluimos que as coordenadas do ponto Q no sistema (x0 , y 0 ) são
−1
3 . Assim, sabemos localizar o sistema (x00 , y 00 ) no sistema (x0 , y 0 ), marcando as coordenadas
−
2
da origem Q do sistema (x00 , y 00 ), nos eixos x0 e y 0 .
x002 y 002
Note que agora, a equação tem uma forma normal: 3x002 +2y 002 = 6, que é equivalente a + =
√ 2
√ 3
1, equação de uma elipse que corta o eixo x00 nos pontos ± 2 e o eixo y 00 nos pontos ± 3.
16 Mais exercı́cios
1. Seja {U, V } uma base do plano. Mostre que {U + V, U − V } também é base. Em geral,
determine a condição sobre a, b, c, d ∈ R para que {aU + bV, cU + dW } também seja base do
plano.
1
2. Escreva os vetores da base canônica do plano como combinação linear dos vetores e
2
2
.
1
3. Qual é a equação da reta r : 8y − 3x = 2 nas coordenadas (x0 , y 0 ) dadas pela base {j, −i}? (i
e j são os vetores da base canônica).
0 1 1
4. Considere a mudança de base X = AX , onde A = e X são coordenadas usuais. Os
1 2
0 3 −1
vetores cujas coordenadas no sistema X são e são ortogonais?
1 3
57
58
5. Na base canônica, a condição algébrica que determina paralelismo de vetores é: U e V são
paralelos se e somente se V = αU para algum α ∈ R. Numa base qualquer {W1 , W2 } esta
condição também é verdadeira?
(a) E tem dois pontos de tangência com cada uma das circunferências.
(b) E tem um ponto de tangência com cada uma das circunferências.
9. Uma hipérbole passa pela origem do sistema de coordenadas e tem como assı́ntotas as retas
x = 4 e y = −2. Qual é sua equação?
10. Faça mudanças de origem de modo que a equação fique puramente quadrática e esboce o
gráfico de sua solução para:
(a) 2x2 + 3y 2 − 8x − 6y + 11 = 0.
(b) 4x2 − 3y 2 + 8x + 12y − 8 = 0.
11. Faça mudanças de base para que a equação tenha a forma quadrática representada por uma
matriz diagonal (isto é, de modo que o coeficiente de x0 y 0 seja nulo) e esboce o gráfico da
solução para:
(a) x2 + 4xy + 4y 2 − 9 = 0.
(b) 2xy − 3y 2 = 5.
12. Para cada uma das equações abaixo, faça mudanças de coordenadas adequadas para trans-
formá-la numa forma normal e esboce o gráfico da solução.
59
17 Geometria Analı́tica Espacial
Vamos estudar nesta seção retas e planos no espaço, como representá-los algebricamente, suas
posições relativas, paralelismo e perpendicurarismo, interseções, ângulos e distâncias, e um pouco
de álgebra linear em dimensão três, em particular, sistemas de equações lineares com três incógnitas
que aparecem como modelos de diversos problemas geométricos e, embora ainda sem um tratamento
sistemático, não devemos hesitar em resolvê-los e interpretá-los.
É preciso recordar alguns fatos da Geometria Euclidiana para que, com maior familiaridade, pos-
samos trabalhar com mais desenvoltura.
1. Dois pontos distintos no espaço determinam uma única reta. Retas em geral serão denotadas
por letras minúsculas do nosso alfabeto, por exemplo, r, s.
2. Três pontos não colineares no plano determinam um único plano. Planos serão denotados
por letras minúsculas gregas, como α, γ, π.
3. Se um plano contém dois pontos de uma reta, então ele contém todos os pontos daquela reta.
4. Dadas duas retas, elas podem ser coplanares (e, neste caso, são paralelas ou concorrentes)
ou não coplanares (chamadas de reversas). Um exemplo de retas reversas são arestas não
paralelas de faces opostas de um cubo.
5. Dados uma reta r e um ponto P , por P passa uma única reta paralela a r. Em geometria
plana, isto é um aximoma. Em geometria espacial não, mas não vem ao caso demonstrá-
lo neste curso. O leitor mais curioso pode ler o livro do Paulo Cezar Pinto Carvalho de
Geometria Espacial para detalhes.
(a) Uma reta e um ponto fora dela. De fato, tome dois pontos distintos da reta e o ponto
fora dela; temos aı́ três pontos não colineares, logo um plano. Este plano, é claro, contém
a reta e o ponto dados.
(b) Duas retas concorrentes. De fato, tome o ponto de interseção e um ponto (distinto dele)
em cada reta; temos aı́ três pontos não colineares, logo um plano. Este plano contém
ambas as retas.
(c) Duas retas paralelas. Dadas duas paralelas, digamos r e s, tome um ponto A ∈ r e
B, C ∈ s, com B e C distintos; temos aı́ três pontos não colineares e portanto um plano
α. Este plano, é claro, contém s; para ver que também contém r, basta lembrar que, em
α, existe uma única reta por A e paralela a s. Esta reta tem que ser r, pois r é a única
reta do espaço que contém A e é paralela a s.
60
Observação. Estes modos de ser determinar um plano são intrı́nsecos, isto é, dependem de
objetos (retas e/ou pontos) contidos no plano.
Os próximos fatos também nos serão muito importantes, mas antes é necessário pensarmos
um pouco no que vem a ser o ângulo entre duas retas no espaço. Se as retas em questão são
coplanares, então ou são paralelas e o ângulo entre elas é zero, ou são concorrentes e definimos
o ângulo entre elas como sendo o menor dos dois formados; caso sejam iguais, ambos são retos
e as retas são perpendiculares. Se as retas, digamos r e s, não são coplanares, então escolha
um ponto qualquer P do espaço e por ali trace r0 paralela a r e s0 paralela a s. As retas r0 e
s0 são concorrentes (não são iguais porque r e s não são paralelas). Definimos o ângulo entre
r e s como sendo o ângulo entre r0 e s0 .
Exercı́cio. Escolha um ponto Q 6= P e por ali tome r00 e s00 paralelas a r e s respectivamente.
Mostre que ](r0 , s0 ) = ](r00 , s00 ), isto é, a definição de ângulo entre duas retas reversas não
depende do ponto escolhido para traçar as parelelas.
7. A definição de perpendicularismo entre uma reta e um plano é a seguinte: dizemos que a reta
r é perpendicular ao plano α (e denotamos r ⊥ α) se r é ortogonal a todas as retas de α.
O fato que interessa aqui é: se uma reta é ortogonal a duas retas concorrentes de um plano,
então é ortogonal a todas as retas daquele plano, logo perpendicular ao plano.
Observação. Assim, uma outra maneira de se determinar um plano é por um ponto por
onde passa o plano e uma reta perpendicular ao plano. Não é intrı́nseco, já que necessita de
uma reta perpendicular, ou seja, um objeto que não está no plano.
11. Dois planos perpendiculares a uma mesma reta são paralelos (dois planos são paralelos se não
se encontram).
12. Dois planos não paralelos se interceptam segundo uma reta. Em outras palavras, se a in-
terseção de dois planos distintos contém um ponto, então contém mais um, sendo sua in-
terseção exatamente a reta determinada por estes dois pontos.
61
13. Dizemos que dois planos são perpendiculares se o ângulo entre eles é 90o . Para caracterizar
esse fato, usamos a unicidade da direção perpendicular a um plano. Mais precisamente, dados
os planos π1 e π2 , tome r1 reta perpendicular a π1 e r2 perpendicular a π2 . Então π1 e π2 são
perpendiculares se e somente se r1 e r2 são ortogonais. Este fato não depende da escolha das
retas, pois quaisquer retas perpendiculares a π1 e π2 são respectivamente paralelas a r1 e r2 .
Os planos determinados pelos pares de eixos xy, yz e xz são chamados planos coordenados. Dado
um ponto B no espaço, por B existe uma única
reta perpendicular ao plano xy, esta reta intercepta
a
o plano xy num ponto, digamos Q. Sejam as coordenadas do ponto Q no plano xy. Por B
b
passa um único plano perpendicular ao eixo z, este plano intercepta o eixo z num ponto, digamos
M . O ponto M definenoeixo z um número real c. Assim ficam definidas as coordenadas do ponto
a
B e escrevemos B = b .
c
Se, por um lado, um ponto define uma tripla ordenada de números reais de maneira única, recipro-
camente uma tripla ordenada de números reais define exatamente um ponto.
O conceito de vetor no espaço é o mesmo já estudado no plano, o que muda agora é o ambiente.
Um vetor no espaço é um segmento orientado, definido por seu comprimento (módulo ou norma),
direção e sentido. A adição de vetores e a multiplicação de vetor por escalar têm exatamente as
mesmas definições geométricas que havia no plano, inclusive vale também no espaço a regra do
paralelogramo para a adição. A exemplo do que acontecia no plano, as coordenadas de um vetor
do espaço são as coordenadas de seu ponto final quando tomamos um representante que começa na
origem do sistema. Ou seja matrizes 3 × 1 representam tanto pontos como vetores.
−→
Exatamente como foi feito para vetores no plano, algebricamente podemos escrever AB = B − A,
isto é, as coordenadas de um vetor são a diferença entre as coordenadas de seu ponto final e as
coordenadas do seu ponto inicial.
As operações lineares (adição e multiplicação por escalar) são compatı́veis, em coordenadas, com
as mesmas operações entre as matrizes (colunas 3 × 1) que representam os vetores, isto é, definidas
entrada a entrada da matriz. E daqui podemos concluir que dois vetores são paralelos (isto é, têm
62
mesma direção) se e somente se são múltiplos escalares. Como o vetor nulo é múltiplo escalar de
→
−
todos os outros, 0 é paralelo a todos os vetores.
O módulo de um vetor pode ser agora calculado usando-se duas vezes Teorema de Pitágoras: com a
−−→
mesma nomenclatura do primeiro pagrágrafo, suponha que o V = OB, onde O é a origem. Então,
−−→ −→
por Pitágoras temos kOBk2 = kOQk2 + c2 e, usando Pitágoras novamente, desta vez no plano xy,
−−→
segue kOBk2 = a2 + b2 + c2 .
incluir desenho
Retas no espaço são determinadas por dois pontos distintos. Equivalentemente, por um ponto e
um vetor diretor não nulo. Assim, da mesma forma que no plano, a representação paramétrica
para uma reta no espaço tem a forma r : A + tV, t ∈ R, onde A é um ponto e V um vetor diretor.
Lembre-se que uma parametrização é um sistema de coordenadas, isto é, torna a reta um eixo, com
origem em A, unidade de medida kV k e sentido positivo dado pelo sentido de V .
3 2 3 + 2t
Por exemplo, Se A = −1 e V = −2, temos r : −1 − 2t. Podemos então interpretar a
−6 3 3t − 6
3
reta r como
imagem de uma função P : R → R , onde a variável independente é o parâmetro t:
3 + 2t
P (t) = −1 − 2t. Dizemos que o ponto P (t) é o ponto genérico de r.
3t − 6
Assim,
é fácil escolher pontos de r além deA: escolha
valores para t. Se t = 1, temos P (1) =
5 −5
−3 ∈ r e para t = −4, temos P (−4) = 7 ∈ r.
−3 −18
63
Também é fácil decidir se um ponto está ou não em
r. Trata-se
de resolver um sistema de três
−1
equações e uma incógnita. Por exemplo, o ponto B = 3 pertence à reta r porque o sistema
−12
P (t) = B tem solução: de fato,
3 + 2t = −1
−1 − 2t = 3
3t − 6 = −12
7
tem solução única t = −2, portanto B = P (−2) ∈ r. Já para o ponto C = −5, o sistema
2
P (t) = C fica
3 + 2t = 7
−1 − 2t = −5 ,
3t − 6 = 2
que não tem solução, pois, para satisfazer as duas primeiras equações deverı́amos ter t = 2, mas
para a terceira teria de ser t = 8/3. Assim, C 6∈ r.
Se, em duas parametrizações, observamos que as retas têm vetores diretores múltiplos, então são
paralelas ou iguais. Para decidir, escolha um ponto de uma e verifique se pertence ou não à outra.
No primeiro caso são iguais, no último, são paralelas.
Exercı́cio. Dê exemplos de parametrizações diferentes para a mesma reta e dê exemplos de para-
metrizações para duas retas paralelas.
Já planos no espaço podem ser determinados por duas maneiras. Uma é intrı́nseca, que sempre leva
a três pontos não colineares, que, em álgebra vetorial equivale a um ponto e dois vetores diretores
não paralelos. A outra, a partir de um ponto e uma reta perpendicular, equivale a um ponto e um
vetor normal.
Considere o plano π determinado por um ponto A e dois vetores não paralelos V e W . Como
já foi visto na seção 12, estes objetos determinam um sistema de coordenadas para o plano, o
que, por sua vez, é exatamente a representação paramétrica deste plano no espaço. Escrevemos
π : A + µV + γW , µ, γ ∈ R. Assim, se X é um ponto genérico do espaço, este ponto pertence a π
−−→
se e somente se AX é uma combinação linear dos vetores V e W . Analogamente ao que foi visto
há pouco para retas, esta maneira de se representar parametricamente o plano, isto é, dizer que
64
−−→
X ∈ π se e somente se existem escalares µ e γ tais que AX = µV + γW , pode ser chamada de
equação paramétrica do plano e também podemos escrever X = A + µV + γW , µ, γ ∈ R.
4 1 2
Se, por exemplo, A = 0 , V = −1 e W = 1, o ponto genérico do plano é dado
−1 3 2
4 + µ + 2γ
por P (µ, γ) = γ − µ , o plano sendo interpretado como imagem de uma função cujas
3µ + 2γ − 1
variáveis independentes são os parâmetros µ e γ e o contradomı́nio é o espaço R3 . É claro que
temos A = P (0, 0).
7
tem solução única (µ, γ) = (2, 1), logo B = P (2, 1). Mas o ponto C = 7 não pertence a π pois
4
o sistema
4 + µ + 2γ = 7
γ−µ=7
3µ + 2γ − 1 = 4
não tem solução. Isto pode ser observado a partir da solução do subsistema 2x2 formado pela
primeira e pela terceira equações, que tem solução (µ, γ) = (1, 1), mas a substituição de µ = 1 e
λ = 1 na segunda equação torna-a falsa.
Se um plano β é dado por uma representação paramétrica da qual conhecemos a forma geral,
podemos reconhecer o pontoe os dois vetores diretores que definem esta parametrização: por
2 − 2t + s
exemplo, se β : t − 2s − 1, t, s ∈ R, podemos escrever o ponto genérico como soma de três
1 + 4s
matrizes coluna, observando os coeficientes constantes (o ponto), e os coeficientes dos parâmetros
t e s (os vetores diretores). Assim,
65
2 −2 1
β : −1 + t 1 + s −2 , t, s ∈ R.
1 0 4
Pela maneira que foi construı́da, vê-se que a equação geral do plano é única, a menos de multi-
plicação por um escalar não nulo.
−1 2 x x+1
−−→ −−→
Se, por exemplo, A = −1 e N = −2, sendo X = y , temos AX = y + 1 e AX ·N = 0
3 3 z z−3
se escreve 2(x + 1) − 2(y + 1) + 3(z − 3) = 0, ou ainda 2x − 2y + 3z = 9, que é a equação geral de
π. Daqui já se nota que os coeficientes de x, y e z na equação geral do plano são as coordenadas
de seu vetor normal.
Para produzir outros pontos do plano π a partir de sua equação, basta tomar coordenadas que
satisfazem a equação. Por exemplo,
se queremos saber sua interseção com o eixo z, tomamos
0
x = y = 0 e vemos que o ponto 0 ∈ π. E, claro, para verificar se um ponto dado está ou não
3
em π, basta verificar se suas coordenadas satisfazem a equação.
Observações.
1. Ao contrário do que acontece quando o ambiente é R2 , em R3 retas não são dadas por uma
equação. O motivo é que, no plano, dado um ponto e um vetor não nulo (normal), existe uma
única reta que passa pelo ponto e tem direção perpendicular ao vetor dado, mas, no espaço,
existem muitas.
2. Se dois planos distintos têm vetores normais paralelos, então sua interseção é vazia: são
paralelos. Já se os vetores normais são não paralelos, encontram-se numa reta.
66
Suponha que temos dois planos com vetores normais não paralelos. Então sua interseção - uma
reta - é a solução de um sistema de duas equações e três incógnitas. Por exemplo, os planos
π1 : 3x + 2y + z = 4 e π2 : x − y + z = −1 têm interseção dada pela solução do sistema
(
3x + 2y + z = 4
.
x − y + z = −1
Para resolver, some a primeira linha com o dobro da segunda para obter 5x + 3z = 2. Escrevendo
2 − 3z
x em função de z, temos x = .
5
2 − 3z
Substituindo na segunda equação ficamos com − y + z = −1 e isolando y em função de z
5
7 + 2z
temos .
5
Interpretando z como parâmetro livre,
−
2 3z
5
7 + 2z
π1 ∩ π2 = | z∈R ,
5
z
2/5 −3/5
que é a reta que passa pelo ponto 7/5 e tem vetor diretor 2/5 .
0 1
É importante saber como, a partir de um plano dado por sua equação, escrever uma representação
paramétrica para ele e vice-versa.
A pergunta recı́proca, de chegar a equação geral do plano a partir de uma representação paramétrica
pode ser respondida como segue. Suponha que π : A + tV + sW , t, s ∈ R. A única coisa que
67
precisamos é determinar um vetor normal N , o que se faz exigindo que N seja simultaneamente
perpendicular aos vetores não paralelos V e W . Isto pode ser conseguido resolvendo-se um sistema
1
de duas equações e três incógnitas. Para ilustrar esta ideia, um exemplo numérico: se V = 2 e
3
2 a
W = −1, procuramos um vetor normal N = b cujo produto escalar com V e com W seja
−1 c
zero, isto é,
(
a + 2b + c = 0 (I)
,
2a − b − c = 0 (II)
que pode ser resolvido somando-se I e II, obtendo 3a + b = 0, ou b = −3a, e substituindo em uma
das equações, digamos em II, ficando
com 2a + 3a − c = 0 ou c = 5a. Assim, todos os vetores
a 1
normais a π são da forma −3a, para a 6= 0. Escolhendo N = −3, a equação de π será da
5a 5
forma x − 3y + 5z = d, e a constante d está determinada pelo fato que o ponto A pertence ao plano.
Observação. Há na verdade uma maneira mais rápida de se produzir um vetor N que seja
simultaneamente perpendicular a dois vetores não paralelos V e W . Veremos que, além de facilitar
a passagem de uma representação paramétrica para a equação geral de um plano, há outras situações
onde uma “fábrica de vetores normais” será útil. Isto será feito na próxima seção, com a definição
de produto vetorial entre V e W . Antes, porém, é conveniente pensarmos um pouco mais em retas
e planos no espaço.
Exemplos e exercı́cios. Quando você ler um enunciado, pode ser que ele esteja comentado (no
caso dos exemplos), pode ser que ele esteja proposto como exercı́cio.
1
1. Determine a representação paramétrica da reta que passa pelos pontos A = 2 e B =
3
4
−1;
−1
2. Determine a equação geral e uma representação paramétrica do plano que passa pelos pontos
A e B do exercı́cio anterior e pela origem.
3.
Determine
a equação geral do plano paralelo ao do exercı́cio anterior e que passa por C =
7
2.
0
4. Talvez a melhor maneira de se estudar a interseção de uma reta com um plano seja exigir
que as coordenadas de um ponto genérico da reta satisfaça a equação geral do plano. Sejam
68
1+t
r : P (t) = 2t − 1 e π : x − 2y + 3z + 9 = 0. Analisamos r ∩ π através da equação
5t
(1 + t) − 2(2t − 1) + 3(5t) + 9 = 0, que,
simplificando,
12t + 12= 0, cuja solução é t = −1.
fica
0 1+µ
Isto nos diz que r ∩ π = P (−1) = −3 . Já a reta u :
2µ tem sua interseção com π
−5 2+µ
calculada por (1 + µ) − 2(2µ) + 3(2 + µ) + 9 = 0, que é equivalente a 16 = 0, o que é falso
e implica que a equação não tem solução (isto é, que u é paralela a π. Esta situação, do
coeficiente de µ ser zero, ocorre precisamente quando o vetor diretor da reta e o vetor normal
do plano são perpendiculares, pois o coeficiente de µ na equação da interseção de u e π é
exatamente o produto escalar entre o vetor diretor de u e o vetor normal a π.
5. Considerando o plano π e as retas r e u do item anterior:
(a) Dê exemplo de uma reta paralela a u e contida em π.
(b) Dê exemplo de uma reta reversa a u e contida em π.
(c) Dê exemplo de um plano que contém u e é paralelo a r.
(d) Determine o plano π2 que passa por r ∩ π e é perpendicular a u.
(e) Determine π ∩ π2 .
1
6. Determine a reta que passa por P = 1 e é perpendicular ao plano que passa pelos pontos
1
2 0 2
A = −1 , B = 1 e C =
3 .
0 8 −4
−1
7. Determine o plano que passa por Q = 7 e é perpendicular à reta que passa pela origem
2
3
e tem vetor diretor 6.
5
8. Duas retas dadas podem ser coplanares (e, nesse caso, são concorrentes ou paralelas) ou
não coplanares (reversas). Para decidir a posição relativa, primeiro olhamos para os vetores
normais. Caso sejam paralelos (múltiplos), então as retas são paralelas ou iguais. Caso
contrário, são concorrentes ou reversas. Para a análise, em ambos os casos podemos igualar o
ponto genérico de uma reta ao ponto genérico da outra, sempre lembrando de mudar o nome
do parâmetro caso necessário. Eis alguns exercı́cios sobre isso:
1−t t−2
9. Dadas as retas t − 2 e 1 − t , determine os valores de a e b para que sejam iguais.
3 + 2t a + bt
1−t t−6
10. Mostre que as retas t − 2 e t − 3 são concorrentes e calcule seu ponto de inteseção.
3 + 2t t+5
69
3 1
11. Dê exemplos de retas reversas com vetores diretores 0 e 1.
1 4
12. Dois planos serão chamados
perpendiculares se têm vetores normais ortogonais. Dados π :
1
x − 2y + 2z = 0 e A = 1, obtenha dois planos distintos por A, ambos perpendiculares a
1
π.
3 + 2t
13. Dado o plano π : 3x + 2y − z = 10 e a reta r : 2 + 4t, obtenha o único plano perpendicular
t−1
a π que contém r.
14. Dados π e r, discuta, a partir de sua posição relativa, a existência e unicidade de um plano
contendo r e perpendicular a π.
Definição. Dados dois vetores quaiquer V e W no espaço, definimos o produto vetorial de V por
W como sendo o vetor V × W que satisfaz:
Observações.
70
4. Quando V e W não são paralelos, então eles formam um paralelogramo cuja área é
calculada como base x altura. Escolhendo V como base, então a altura é a projeção
do ponto final de W na reta onde V está desenhado e, como o ângulo entre eles é θ,
temos que a altura é kW ksen θ, donde a área do paralelogramo é kV kkW ksen θ, não
importanto se θ é agudo, obtuso ou reto. Ou seja, o módulo do produto vetorial é a área
do paralelogramo gerado pelos vetores. Note que, se um deles é nulo ou se são paralelos,
então eles não geram um paralelogramo, o que é coerente com o produto vetorial ser
zero nesses casos.
• O (sentido) de V × W é dado pela regra da mão direita ou pela regra da mão esquerda.
Observações.
Assim, o produto vetorial de dois vetores tem como resultado um vetor, enquanto o produto escalar
entre dois vetores tem como resultado um escalar, um número.
Mas de pouco adianta termos definido módulo, direção e sentido de V × W se não tivermos um
modo de calculá-lo em coordenadas. Apresentaremos uma fórmula a partir do determinante de
matrizes 3x3, logo convém fazer um breve estudo introdutório.
a11 a12 a13
Dada uma matriz 3x3 A = a21 a22 a23 , o determinante de A é o número real
a31 a32 a33
det A = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a12 a21 a33 − a11 a23 a32 ,
que pode ser calculado pela regra mnemônica que aprendemos no ensino médio, isto é, copiando as
duas primeiras colunas de A após a terceira, resultando numa matriz 3x5 da qual multiplicamos os
três elementos de cada uma das três diagonais paralelas à diagonal principal (incluindo a própria),
tomando cada um desses produtos como parcela positiva e multiplicando os três elementos de cada
71
uma das três diagonais na direção da diagonal secundária, tomando esses produtos como parcelas
negativas.
3 0 2
Por exemplo, se A = 1 −1 −1, então det A = 29.
2 5 0
Há um outro modo de se calcular o determinante, que se aplicará também a matrizes quadradas
de ordem superior, chamado método dos cofatores, onde o determinante de uma matriz é calculado
pela soma de três parcelas, cada uma sendo o produto de um fator pelo seu cofator. Os fatores são
determinados escolhendo-se livremente uma linha ou uma coluna da matriz A: são as três entradas
da linha ou coluna escolhida. Cada fator dá origem a uma matriz 2x2, eliminando-se de A a linha e
a coluna às quais o fator pertence. Dessa matriz 2x2 calculamos o determinante, que ainda receberá
um sinal, dependendo da posição do fator na matriz original.
det A = a11 (−1)1+1 A11 + a12 (−1)1+2 A12 + a13 (−1)1+3 A13 ,
onde Aij , é o determinante da matriz 2x2 obtida eliminando-se de A sua i-ésima linha e sua j-ésima
coluna.
3 0 2
Por exemplo, no caso da matriz A = 1 −1 −1, temos, por cofatores a partir da primeira
2 5 0
1+1 −1 −1 1+2 1 −1 1+3 1 −1
linha, det A = (3)(−1) det + (0)(−1) det + (2)(−1) det =
5 0 2 0 2 5
(3)(5) + 0 + (2)(7) = 29.
Não é difı́cil ver que o desenvolvimento em cofatores funciona sempre. No caso geral, quando
a11 a12 a13
A = a21 a22 a23 , faça, como exercı́cio, a comparação do desenvolvimento do determinante de
a31 a32 a33
A em cofatores pela segunda linha e verifique que você encontrou o número a11 a22 a33 + a12 a23 a31 +
a13 a21 a32 − a13 a22 a31 − a12 a21 a33 − a11 a23 a32 . Se achar necessário, faça isso também para uma coluna
qualquer da matriz A. A demonstração completa, claro, necessita que se verifique a igualdade para
todas as linhas e colunas de A.
O desenvolvimento em cofatores é particularmente útil quando temos uma linha ou uma coluna
com muitos zeros.
72
1 0 0
e z respectivamente, isto é, i = 0 , j = 1 e k = 0. Assim, um vetor qualquer pode ser
0 0 1
a
escrito como combinação linear de i, j e k: b = ai + bj + ck.
c
v1 w1
A definição “algébrica” do produto vetorial é a seguinte: Se V = v2 e W = w2 , teremos
v3 w3
i i k
V × W = det v1 v2 v3 ,
w1 w2 w3
v2 w3 − v3 w2
v2 v3 v v3 v v2
V × W = det i − det 1 j + det 1 k = v3 w1 − v1 w3 .
w2 w3 w1 w3 w1 w2
v1 w2 − v2 w1
1 0 i j k 7
Exemplo. Se 1 × 2 = det 1 1 −4 = 1, e, usando o produto escalar, vemos
−4 −1 0 2 −1 2
imediatamente que é perpendicular a ambos os “fatores”.
A seguir, para comparar a direção, note que, para um vetor qualquer U , o produto escalarde U
U
por V × W , também chamado produto misto entre U , V e W , é dado por U · (V × W ) = det V ,
W
o determinante da matriz cujas linhas são os vetores U , V e W , e conclua que V · (V × W ) =
W · (V × W ) = 0. Observe que não há a necessidade do parêntese na notação, mas é didátco.
Finalmente, para comparar o sentido, é necessário um pouco mais de álgebra linear: uma tripla
ordenada de vetores no espaço é uma base para R3 se os três vetores não são coplanares. Não é
difı́cil ver que, caso três vetores formem uma base, a matriz cujas colunas são esses vetores tem
determinante não nulo. Isto ocorre porque o determinante é zero se e somente se uma das colunas
é combinação linear das outras duas, caso em que os vetores são coplanares. Dada uma base
{V, W, U } para R3 , dizemos que ela é positiva se os sentidos de rotação ao longo do menor ângulo
de V para W , de W para U e de U para V são positivos. Isto acontece, por exemplo, para a base
73
canônica {i, j, k}. Caso contrário, a base é negativa. O que a regra da mão direita diz, portanto,
é que, sendo V e W não paralelos, a base {V, W, V × W } é positiva. O próximo passo é observar
que uma base é positiva se e somente se a matriz cujas colunas são esses vetores (na ordem) tem
determinante positivo. Isto pode ser feito através da definição de produto misto. Por fim, basta
verificar que det[V, W, V × W ] > 0.
Vamos enunciar agora algumas propriedades do determinante seguidas de sua “interpretação” como
propriedades do produto vetorial, imediatas a partir de sua definição algébrica. Algumas destas
propriedades já foram observadas na definição geométrica. Estas propriedades também valem
para matrizes quadradas de ordem superior, faremos referência a elas no momento oportuno. As
demonstrações, no caso 3x3, são exercı́cios para o leitor.
1. det At = det A. Isto significa que as propriedades enunciadas a seguir para as linhas de A
valem também para as colunas de A, e vice-versa.
3. Se A tem duas linhas múltiplas, então det A = 0. Ou seja, se V e W são paralelos, então
V × W = 0.
4. Se Uma linha
é combinação linear das outras duas, então det A = 0. Em sı́mbolos, se
L1
A = L2 (linhas) e, por exemplo, L3 = aL1 + bL2 , a, b ∈ R, então det A = 0. A escrita
L3
genérica é Li = aLj + blk , com i, j, k ∈ {1, 2, 3} e distintos. Geometricamente, o fato de um
vetor U ser combinação linear de outros dois, digamos V e W , significa que U é a diagonal
de um paralelogramo cujos lados são múltiplos de V e W . Em outras palavras, significa que
U , V e W são coplanares. Reciprocamente, se det A = 0, então suas colunas são vetores
coplanares (caso contrário, são uma base de R3 ).
As duas últimas propriedades dizem que o produto vetorial se comporta bem com as operações
lineares de adição de vetores e multiplicação de vetor por escalar, isto é, dizem que podemos usar
a propriedade distributiva.
74
17.5 Retas reversas
Vamos estudar algumas construções importantes a respeito de duas retas reversas dadas.
Dadas duas retas reversas r e s, existe um único par de planos paralelos α e β tal que r ⊂ α e s ⊂ β.
Há algumas maneiras de se concluir isso. Digamos que r : A + tV e s : B + uW . O plano que passa
por A e tem vetores diretores V e W (que contém a reta r) é o plano α (note que V e W não são
paralelos pois são vetores diretores de retas reversas). E o plano β é o que passa por B e é paralelo a
V e W (que contém a reta s). Como só existe uma direção que é simultaneamente perpendicular a
dois vetores não paralelos dados, os planos α e β têm mesmo vetor normal, portanto são paralelos.
Em outras palavras, poderı́amos ter escolhido um vetor normal N = V ×W , perpendicular a ambos
V e W e dizer que α é o plano por A e com vetor normal N , e β passa por B e tem o mesmo vetor
normal.
1 2
Exemplo. Sejam r a reta que passa por A = 0 e com vetor diretor V =
1 e s a reta que
1 −1
0 −1
passa por B = −3 e com vetor diretor W =
2 . Verifique que, de fato elas são reversas.
0 1
Para o vetor normal dos planos α e β tomamos
i j k 3
N = V × W = det 2 1 −1 = −1 ,
−1 2 1 5
Você pode imaginar a situação pensando que construı́mos uma “caixa” de acrı́lico transparente, de
forma de um paralelepı́pedo e traçadas com um marcador estão as retas r e s em faces opostas (por
exemplo, na base e na tampa). As aspas se justificam porque os planos são infinitos, não limitados
como as faces de uma caixa de sapatos.
O leitor pode perguntar, a partir da ilustração acima, se existe uma reta que seja simultaneamente
perpendicular às retas reversas r e s. A resposta é que não só existe, mas é unica. Para construir
esta reta, note primeiramente que um vetor diretor para ela é exatamente o vetor N , normal aos
planos α e β. Vamos obter a perpendicular comum procurada como interseção de dois planos,
π1 e π2 . Note que, tendo N como vetor diretor, a reta procurada é paralela ou está contida em
qualquer plano que tenha N como vetor diretor. Assim, consideramos π1 como o plano que contém
r e é paralelo a N (ou seja, π1 está definido pelo ponto A e pelos vetores diretores V e N ) e π2 o
plano que contém s e é paralelo a N (ou seja, definido pelo ponto B e pelos vetores diretores W
e N ). Os planos π1 e π2 não são paralelos, já que os vetores V , W e N não são coplanares, logo
se interceptam numa reta. Um vetor diretor para esta reta é N , já que trata-se de uma direção
comum a ambos os planos. A reta u = π1 ∩ π2 é perpendicular a r (em π1 ) e é perpendicular a s
(em π2 ), logo é a reta procurada. É única graças ao fato de os planos π1 e π2 estarem unicamente
determinados a partir de r e s.
75
Fazendo
as contas, que osvetores diretores de π1 são V e N , um vetor normal a π1 é V × N =
já
i j k 4
det 2 1 −1 = −13, assim, usando o fato que A ∈ π1 , temos π1 : 4x − 13y − 5z = −1.
3 −1 5 −5
11
Similarmente, para π2 consideramos N2 = W × N = 8 e, como sabemos que B ∈ π2 , temos
−5
π2 : 11x + 8y − 5z = −24. Assim, a reta u é a solução do sistema que representa a interseção de π1
com π2 :
(
4x − 13y − 5z = −1
u: .
11x + 8y − 5z = −24
−23
Resolvendo, igualando 5z em ambas as equações, obtemos x = − 3y. Substituindo em uma
7
17
das equações, por exemplo, na primeira, obtemos z = −5y − , ou seja,
7
−23
7 − 3y
u: y , y ∈ R.
17
−5y −
7
Há outras maneiras de se conseguir a reta u. Por exemplo, é possı́vel calcular diretamente os pontos
P = π2 ∩ r e Q = π1 ∩ s.
3t − 2 2 + 2t
Exercı́cios. Dadas as retas r : t e s : 1 − t ,
3−t 4t
1. Mostre que são reversas.
2. Determine uma reta que passe pela origem e seja concorrente com r e s.
3. Dê exemplo de um ponto P de modo que não exista uma reta u que passe por P e intercepte
r e s.
1
4. Dado o vetor V = 1, obtenha dois planos cuja interseção seja uma reta m paralela a V e
1
concorrente com r e s.
5. Dê exemplos de vetores W tais que não seja possı́vel obter uma reta que seja ao mesmo tempo
paralela a W e concorrente com r e s.
76
17.6 Distâncias e Ângulos
A filosofia de definição de distância e ângulo entre dois objetos no espaço (pontos, retas e planos)
é, sempre que possı́vel, tomar a menor entre todas as medidas.
−→
Dados dois pontos A, B ∈ R3 , já sabemos que a distância entre eles é dada por d(A, B) = kABk.
(1 + t) + 2(2t − 1) + (2 + t) = 13,
3
−→
ou seja, t = 2. Logo, B = r ∩ π = P (2) = 3 e d(A, π) = kABk.
4
A mesma ideia de se calcular a distância de um ponto A a uma reta r se aplica: se A está fora de r,
então existe uma única reta s perpendicular a r por A. Sendo B = s∩r, teremos d(A, r) = d(A, B),
pois aı́ estará a menor distância possı́vel entre A e um ponto de r. No caso A ∈ r, existem muitas
retas por A e perpendiculares a r, mas a distância entre A e r será zero. De qualquer modo, o
ponto B, pé da perpendicular de A até r está unicamente determinado, mesmo quando A ∈ r, caso
em que teremos B = A.
Para calcular o ponto B, observe que, em qualquer caso, por A passa um único plano π perpendicular
a r. Vamos obter a equação deste plano e calcular π ∩ r.
3 2t − 3
Por exemplo, sendo A = 0 e r : 1 − t , um vetor normal a π é o próprio vetor diretor de r,
2 t
2
−1. Como queremos A ∈ π, segue π : 2x − y + z = 8. Para calcular r ∩ π, procedemos como
1
no exemplo anterior, exigindo que as coordenadas do ponto P (t) satisfaça a equação de
π, obtendo
2
2(2t − 3) − (1 − t) + (t) = 8, cuja solução é t = 5/2. Assim, B = π ∩ r = P (5/2) = −3/2 e
5/2
teremos d(A, r) = d(A, B).
77
Para calcular a distância entre dois planos, note primeiro que, se eles se interceptam, então a
distância é zero. Assim, a primeira coisa a fazer é obesrvar os vetores normais: se eles não são
paralelos, os planos também não serão, e a distância é zero. Caso π1 e π2 sejam paralelos e não
iguais, a distância entre eles será o comprimento de qualquer segmento perpendicular comum. Para
calcular este comprimento, escolha um ponto num dos planos, por exemplo, A ∈ π1 e o problema
está reduzido a calcular a distância de A a π2 , o que já sabemos como fazer.
Dados um plano π e uma reta r, como já foi dito, existem três posições relativas possı́veis: ou a
reta “fura” o plano, isto é, r ∩ π é um ponto; ou a reta está contida em π, isto é, r ∩ π = r; ou r
é paralela ao plano, caso em que r ∩ π = ∅. Somente no terceiro caso teremos d(r, π) > 0 e, para
calcular (o comprimento de qualquer segmento perpendicular comum entre r e π) escolhemos um
ponto qualquer A ∈ r e calculamos d(A, π), como nos exemplos anteriores. Pergunta: poderı́amos,
nesse caso, escolher um ponto B ∈ π e calcular a distância de B a r?
Dadas duas retas r e s, elas podem ser concorrentes, paralelas ou reversas. No primeiro caso, temos
claramente d(r, s) = 0. No segundo caso, temos de calcular o comprimento de qualquer segmento
perpendicular comum entre r e s, o que se faz escolhendo um ponto qualquer em A ∈ r e calculando
d(A, s). Finalmente, no terceiro caso, calculamos o comprimento do único segmento perpendicular
comum, o que já fizemos na subseção anterior, quando estudamos retas reversas. Nesse caso, isto
é, para calcular a distância entre duas retas reversas, há um outro modo de fazer: determinamos o
único par de planos paralelos tal que cada um deles contenha uma das retas e calculamos a distância
entre eles.
Ângulos entre vetores e ângulos entre retas já estão definidos, lembre-se apenas que o ângulo entre
vetores está entre 0 e 180o e o ângulo entre duas retas está entre 0 e 90o . Ou seja, se θ é o ângulo
V ·W Vr · Vs
entre V e W , então cos θ = e, se β é o ângulo entre r e s, temos cos β = | |.
kV kkW k kVr kkVs k
Já para se definir o ângulo entre dois planos π1 e π2 , a maneira natural é ao longo de sua reta
de interseção, como se seu olho estivesse dentro da reta, vendo cada plano como uma reta, como
os ponteiros de um relógio. Isto acontece porque nesse caso não há a “menor medida possı́vel”,
ao considerarmos todos os ângulos entre uma reta do primeiro plano e uma do segundo. De fato,
tomando um ponto P na interseção dos dois planos, existem retas r e s por P , uma em cada plano,
tais que o ângulo entre elas fique tão próximo de zero quanto se queira.
Para o cálculo, tomamos um ponto P da reta interseção e, por ali, o plano γ, perpendicular a ambos
π1 e π2 , isto é, γ é o plano perpendicular à reta de interseção por P . O plano γ intercepta π1 numa
reta r1 e o plano π2 numa reta r2 . Então, teremos ^(π1 , π2 ) = ^(r1 , r2 ), o que já sabemos como
calcular. Assim, o ângulo entre dois planos varia entre 0 e 90o .
Exercı́cio. Diga como se pode calcular o ângulo entre dois planos a partir de seus vetores normais.
Por último, vamos estudar o ângulo entre uma reta r e um plano π. Se r ⊂ π ou r k π, então,
claramente ^(r, π) = 0. Caso contrário, isto é, se r ∩ π é um ponto, consideremos primeiro o
caso r ⊥ π, ou ^(r, π) = 90o , que é caracterizado pelo fato de os vetores diretor de r normal a π
serem múltiplos. Nos outros casos, o menor ângulo possı́vel entre r e π será medido num plano γ,
perpendicular a π contendo r: teremos ^(r, π) = ^(r, s), onde s = π ∩ γ (demonstre).
78
A reta s será chamada projeção ortogonal de r sobre π e pode ser calculada a partir das projeções
ortogonais de dois pontos distintos de r sobre π. Já sabemos como calcular esta projeção, o pé da
perpendicular de um ponto a um plano, isto foi discutido ao falarmos de distância de um ponto a
um plano. De qualquer modo, o ângulo entre uma reta e um plano varia entre 0 e 90o .
Estes métodos não são os únicos para se calcular ângulos e distâncias. Por exemplo, no caso da
distãncia entre um ponto A e uma reta r, uma alternativa ao que foi apresentado é considerar todos
−−−→
os vetores que começam em A e terminam em r, que têm a forma AP (t), e calcular t para que este
−−−→
vetor seja ortogonal ao vetor diretor Vr ; a equação que modela esta situação é AP (t) · Vr = 0.
Exercı́cio. Mostre que esta equação tem uma única solução t, independente da posição relativa
entre A e r, interprete geometricamente.
3. Dados um ponto A e uma reta r, diga como fazer (indicando a equação que modela a situação)
para obter o simétrico de A em relação a r. A definição de pontos simétricos em relação a
uma reta é a mesma do exercı́cio anterior, trocando “plano” por “reta”.
4. Determine
a projeção
ortogonal da origem sobre a interseção dos plaos π1 : x + y + z = 1 e
1+λ
π2 : 1 + µ .
1+λ+µ
5. Dados π1 : x − y +z =−1 e π2 : x + y − z = 1, determine o plano que contém π1 ∩ π2 e
1
é normal ao vetor 1 . Isto é sempre possı́vel? Isto é, dados dois planos transversais e
−1
um vetor, sempre existe um plano que contém a interseção dos planos dados e é ortogonal ao
vetor dado? Explique geometricamente.
79
√
2
6. O vértice de uma pirâmide regular é P = 2 e sua base é um quadrado ABCD contido
0
0
no plano π : x = z. Sendo A = 2, determine B, C e D e o volume de P ABCD.
0
7. Dados os planos α : x − y + z = −1, β : x + y − z = 1 e γ : x + y + 2z = 2, determine o plano
π que contém α ∩ β e é perpendicular a γ. É sempre possı́vel determinar π, independente das
posições relativas entre α, β e γ? Expique geometricamente.
3t + 1 5t − 1
8. Ache a reta que intercepta as retas r : 2t + 1 e s : 3t + 1 e forma ângulos congruentes
−3t t
com os eixos x, y e z.
Os resultados aqui serão apresentados para sistemas em geral, de qualquer número de equações e
incógnitas. Mas os exemplos vão se concentrar em R3 .
80
18.1 Definições e exemplos
Exemplo. O sistema
2 −1 1 x 1
1 1 3 y = 4
2 −3 0 z 8
interpretado como a pergunta “o vetor B pode ser escrito como combinação linear das colunas de
A?”
Na verdade, qualquer sistema linear pode ser interpretado desta última forma.
Uma solução para AX = B é um vetor constante X0 que satisfaz a equação, isto é, tal que AX0 = B.
O conjunto de todas as soluções do sistema em geral é denotado S. Entendemos resolver o sistema
como representar sua solução S parametricamente.
Exemplos.
1. A solução de um sistema pode ser vazia: interpretando-o como interseção de três planos,
sendo dois deles paralelos (visualizados como o chão e o teto), por exemplo, π1 : x + y + z = 0
e π2 : x + y + z = 1 e escolhendo uma “parede” π3 : 3x − 2y − z = 6.
Exercı́cios.
81
2. Outra situação de solução vazia são três planos tais que dois a dois se interceptam segundo
três retas paralelas. Para um exemplo numérico, escolhemos livremente os dois primeiros,
por exemplo π1 : x + y + z = 0 e π2 :x − y− 2z= 1. Um vetor diretor para a reta π1 ∩ π2
i j k −1
é V = N1 × N2 = det 1 1 1 = 3 . Então π3 deve ter esse vetor como um
1 −1 −2 −2
dos diretores. Escolhendo um ponto A que não esteja nem em π1 nem em π2 e um segundo
vetorWdiretor não paralelo a V , teremos uma representação paramétrica de π3 . O ponto
0 1
A = 1 e o vetor W = 0 satisfazem o requerido. Para a equação de π3 , calculamos seu
0 0
i j k 0
vetor normal N3 = V × W = det −1 3 −2 = 2 , logo π3 : 2y − 3z = 2.
1 0 0 −3
Exercı́cio. Modifique o exemplo anterior para que π1 ∩ π2 ∩ π3 seja uma reta, obtenha sua
representação paramétrica. Trata-se de um exemplo de sistema cuja solução é um conjunto
infinito.
5. A interseção de três planos iguais também é um exemplo de sistema cuja solução é um conjunto
infinito. Nesse caso, a representação paramétrica da solução (que é o próprio plano) tem dois
parâmetros livres.
6. A solução de um sistema pode ser um conjunto unitário: S = {ponto}. Para escolher três
planos que exemplifiquem esta situação, vamos olhar para seus vetores normais.
Assim, vamos escolher N1 , N2 e N3 de modo que eles sejam uma base de R3 . Nesse caso, é
um exercı́cio mostrar que a reta π1 ∩ π2 e o plano π3 não são paralelos, logo se interceptam
num ponto. O exemplo trivial é a origem como interseção dos planos coordenados x = 0,
y = 0 e z = 0; outro exemplo é
x + y + z = 0
2x − y + z = 1
3x + y − z = 2
82
Observação. O que fizemos foi ilustrar, via exemplos, uma propriedade importante de
sistemas associados a matrizes quadradas: o sistema AX = B tem solução única se e somente
se as linhas de A formam uma base de R3 , isto é, det A 6= 0. Este fato é independente do
vetor B. Ao longo desta seção, seguiremos caracterizando sistemas associados a matrizes
quadradas separando-os em dois tipos: aqueles com solução única e aqueles cuja solução é
vazia ou infinita.
−−→
Um argumento geométrico para o último caso é que OB pode ser decomposto, de maneira
única, como combinação linear de C1 , C2 e C3 , interpretando {O, C1 , C2 , C3 } como um sistema
de coordenadas para o espaço, em analogia ao que fizemos com {O, i, j, k}.
Já vimos que ocorrem três possibilidades, a saber, a solução pode ser um conjunto vazio, unitário
ou infinito. Veremos agora que não pode ocorrer mais nenhuma:
Demonstração. Para ver isso, independente do ambiente onde as soluções estejam, podemos
pensar na reta que liga X0 a X1 , um conjunto infinito de pontos que depende de um parâmetro
−−−→
livre: X(t) = X0 + tX0 X1 , t ∈ R, e mostrar que, para qualquer valor de t, X(t) é solução de
AX = B. Para ver isso, escreva X(t) = X0 + t(X1 − X0 ) e calcule
já que AX0 = B e AX1 = B. Assim, AX(t) = B para qualquer valor de t ∈ R, mostrando o que
foi enunciado.
18.3 Escalonamento
.
Podemos resolver sistemas de poucas equações e poucas incógnitas “na mão”, utilizando o que já
conhecemos sobre eles. Assim, o método que apresentaremos agora terá pouca utilidade prática
para sistemas, digamos, pequenos. Mas a aplicação computacional, como algoritmo para resolver
83
qualquer sistema linear de qualquer número de equações e incógnitas é imediata. Também tem
importância teórica na análise qualitativa de soluções de sistemas.
Lembre-se que, dado um sistema linear, as seguintes operações podem ser feitas nas suas linhas
(equações), sem alterar a solução, isto é, estas operações preservam a solução do sistema (já falamos
disso quando estudamos escalonamento em sistemas 2x2).
O método de Gauss é escalonar a matriz aumentada do sistema até podermos resolvê-lo facilmente.
3 2 1 2
Exemplo. O sistema AX = B, onde A = 1 1 1 e B = 2 pode ser escalonado a partir
1 0 −1 1
da matriz aumentada do sistema:
3 2 1 | 2
1 1 1 | 2 ,
1 0 −1 | 1
onde as linhas verticais, que separam A de B, por simplicidade não serão mais digitadas.
A terceira linha da última matriz obtida nos diz que 0x + 0y + 0z = −3, uma equação impossı́vel,
de modo que o sistema, nesse caso, tem solução vazia.
2
Exemplo. Considere o exemplo anterior com o vetor constante trocado por 2 . Este vetor
−2
(a última coluna da matriz aumentada) sofreria modificações ditadas pelas operações que fize-
mos acima, já que as definições das operações do escalonamento dependem apenas da matriz dos
coeficientes. Assim, o passo a passo seria
84
2 −2 −2 −2
2 → 2 → 4 → 4 ,
−2 2 8 0
(
x−z =2
que nos diz que a solução do sistema é a reta dada por S : , ou, parametricamente,
y + 2z = 4
2+z
S = 4 − 2z , z ∈ R .
z
Exemplo. Para um exemplo solução unitária, tomamos um sistema 3x3 com a matriz dos coefici-
entes com determinante não nulo:
x + y + z = 0
x + y + 2z = 0
x + 2y + 4z = 0
A matriz aumentada deste sistema não necessita da coluna que representa o vetor constante pois,
sendo o sistema homogêneo, esta coluna é o vetor nulo, que não se modifica com as operações (i),
(ii) e (iii). Assim,
L2 ← L2 − L1
1 1 1 L ← L3 − L1 1 1 1
1 1 2 −−−3−−−−−−−−−→ 0 0 1 ,
1 2 4 0 1 3
que nos permite concluir, pela segunda linha, que z = 0. Substituindo na terceira, segue y = 0 e,
→
−
finalmente, na primeira, x = 0. Ou seja, para este sistema, S = { 0 }.
Para um algoritimo, é necessário saber quando parar. Para programar um computador para resolver
sistemas lineares de qualquer tamanho, vamos escalonar a matriz aumentada do sistema até que a
matriz dos coeficientes fique, digamos, na forma mais simples possı́vel. Esta forma será chamada
de forma escalonada e reduzida, este método recebe o nome de método de Gauss-Jordan.
Definição. Uma matriz A está na sua forma escalonada e reduzida (escrevemos AER ) se satisfaz:
1. O primeiro elemento não nulo de cada linha não nula, chamado pivô da linha, é 1.
85
2. O pivô de uma linha (a partir da segunda) está á direita do pivô da linha anterior.
3. Se uma coluna contém um pivô, então todas as outras entradas desta coluna são zero.
Exercı́cio. Dê exemplos de matrizes 3x2, 3x3 e 3x4 que estejam na forma escalonada e reduzida.
Vamos usar as operações (i), (ii) e (iii) para, após um número finito de passos, chegarmos à forma
escalonada e reduzida de uma matriz. Suponha que a matriz que vamos escalonar tenha n linhas.
• (II) Escolha uma das linhas não nulas com o pivô mais à esquerda possı́vel.
• (III) Troque com a primeira linha se necessário, temos o pivô da primeira linha mais à esquerda
possı́vel, usando a operação (i).
• (V) Zere os outros elementos da coluna deste pivô, usando a operação (iii).
• (VI) Troque as linhas de posição, se necessário, para que as linhas nulas fiquem abaixo das
não nulas.
• (VIII) Repita os passos (II) - (V). Note que isso não mexe na L1 , nem na primeira coluna,
porque fora da L1 ela é foremada por zeros.
E assim por diante. Como a matriz tem um número finito de linhas, em algum momento terá sido
escolhida a última linha não nula; realizados ali os passos (II) - (VI), o escalonamento para e a
matriz estará na sua forma escalonada e reduzida.
Para resolver um sistema AX = B, escalonamos sua matriz aumentada [A|B] até chegar a [AER |B 0 ],
onde B 0 é o vetor constante modificado pelas operações do escalonamento. Em geral, temos B 0 6= B,
a exceção, como já vimos, são os sistemas homogêneos, onde B = 0, logo B 0 = 0.
86
Uma observação imediata, a partir do algoritmo acima, é que, sendo A uma matriz quadrada, se
AER não tem linhas nulas, então AER = I, isto é, para matrizes quadradas, acontece exatamente
uma das duas seguintes possibilidades: ou a forma escalonada e reduzida tem uma linha nula ou
ela é a identidade.
Este é mais um passo na caracterização de sistemas com soluções únicas que estamos procurando:
já sabı́amos que, se A é uma matriz quadrada, então AX = B tem única solução se e somente se
det A 6= 0. Agora sabemos também que AX = B tem única solução se e somente se AER = I.
Isto significa, é claro, que AER = I ⇔ det A 6= 0. O raciocı́nio desenvolvido na próxima subseção
também nos permitirá concluir este resultado. Estudaremos o comportamento do determinante sob
as operações (i), (ii) e (iii) com o intuito de se desenvolver um algoritmo eficiente para calcular
determinantes de matrizes “grandes”.
Já vimos como definir determinantes para matrizes quadradas de ordem 2 e 3. Na verdade, o
desenvolvimento em cofatores serve para definir também para matrizes de ordem superior, já que,
por exemplo, se a matriz é 4x4, podemos escolher qualquer linha ou coluna e teremos o produto de
4 fatores por 4 cofatores. Cada um dos cofatores, a menos de sinal, é um determinante 3x3. Assim,
se a matriz é n × n, o desenvolvimento em cofatores leva a n determinantes (n − 1) × (n − 1), cada
um deles leva a n − 1 determinantes (n − 2) × (n − 2) e assim por diante, até chegarmos na ordem
3 ou 2.
Nesta altura do campeonato, não podemos verificar que a definição é boa (ou seja, que podemos
escolher qualquer linha ou coluna), nem algumas das propriedades; isso exigiria uma matemática
mais sofisticada. Mas podemos fazer as contas, principalmente se há uma linha ou coluna com
muitos zeros.
Esta observação, juntamente com a técnica de escalonamento, nos mostrarão outro modo de fazer
a conta, computacionalmente muito mais eficiente, por reduzir significativamente o número de
multiplicações. Para cada passo do escalonamento, precisamos saber como o determinante muda,
logo vamos estudar seu comportamento quando são realizadas nas linhas de uma matriz as operações
(i), (ii) e (iii).
Já foi discutido, no caso de matrizes de ordem 3, mas são propriedades que valem para matrizes de
qualquer ordem, que:
87
• Se B é obtida de A por uma operação (i), isto é, pela troca de posição de duas de suas linhas,
então o determinante muda de sinal: det B = − det A.
• Se B é obtida de A por uma operação (ii), isto é, pela multiplicação de uma de suas linhas
por um escalar não nulo a, então, o determinante fica multiplicado por A: det B = a det A.
• Se B é obtida de A por uma operação (iii), isto é, pela troca de uma linha pela soma dela
mesma com um múltiplo escalar de outra, então o determinante não muda: det B = det A.
L1
L2
..
.
Lj
Para verificar o último item, basta escrever A como uma matriz de linhas, A = ... , onde, claro,
L
i
.
..
Ln
Li está na posição i e Lj na posição j. Assim, se B é obtida de A trocando-se Li por Li + aLj ,
tem-se, lembrando que o determinante respeita a adição nas linhas de uma matriz,
L1 L1 L1
L2 L2 L2
.. .. ..
. . .
Lj Lj Lj
det B = det
.. = det ... + det ... = det A,
.
L + aL L aL
i j i j
.. .
..
.
..
.
Ln Ln Ln
pois para uma matriz com duas duas linhas múltiplas, o determinante é zero.
Observação. Note que isto é mais um modo de concluir que AER = I ⇔ det A 6= 0.
Exemplo. Seja
2 0 1
A = 1 3 −2 .
−3 2 1
Vamos escaloná-la até chegar a uma matriz triangular superior. Fazendo L1 ↔ L2 , obtemos
1 3 −2
B= 2 0 1
−3 2 1
88
e det B = − det A. Continuando o escalonamento, fazemos as operações do tipo (iii) L2 ← L2 −2L1
e L3 ← L3 + 3L1 , obtendo
1 3 −2
C = 0 −6 5
0 11 −5
com det E = det D, logo, det A = 6 det E. A matriz E é triangular superior, portanto det E =
(1)(1)(−25/6), donde concluı́mos que det A = −25.
1 3 −1 3
2 0 −1 1
Exercı́cio. Calcule det
−1 1 2
.
1
4 2 3 −3
Como já vimos quando discutimos inversão de matrizes 2x2, na tentativa de inverter uma matriz,
nos deparamos com sistemas lineares. Assim, vamos ver quais sistemas aparecem no caso 3x3 e
como resolvê-los, achando a inversa, caso exista, por escalonamento.
Lembre-se que uma matriz quadrada A é invertı́vel se existe B de mesma ordem tal que AB =
BA = I. Que uma destas igualdades implica a outra (e que, portanto, para procurar B = A−1
precisamos apenas resolver AB = I), e que a inversa, caso exista, é única.
Ora, a equação matricial AB = I pode ser mais detalhadamente descrita no caso 3x3 expliciando-se
as colunas, ficando A[C1 , C2 , C3 ] = [i, j, k], onde C1 , C2 e C3 são as colunas da candidata a inversa
B e i, j e k, os vetores da base canônica, são as colunas da matriz identidade 3x3. Assim, temos a
igualdade de matrizes
89
Estamos lidando, portanto, com três sistemas lineares com mesma matriz de coeficientes, cada um
deles tem como incógnita uma das colunas de B e como vetor constante uma coluna da identidade.
Logo podemos escaloná-los simultaneamente, já que, quem define as operações que serão utilizadas
é a matriz dos coeficientes. Ou seja, vamos considerar a matriz aumentada (3x6) [A|I]. Esquema-
ticamente, após terminado o escalonamento, teremos [AER |M ], onde M é uma matriz 3x3.
Se AER = I, então cada um dos sistemas tem solução única, de modo que M = A−1 .
Se AER tem uma linha nula, então é possı́vel mostrar que pelo menos um dos sistemas não tem
solução (faça como exercı́cio), logo a inversa não existe.
Assim, dada A, a inversa existe se e somente se AER = I, ou seja, se e somente se det A 6= 0. Isto
é coerente com a interpretação que já fizemos de um sistema ter solução única quando pudermos
isolar a incógnita (lembre-se de equações lineares nos reais, podemos isolar x de ax = b quando
a 6= 0 - isto é, quando o número a tem inverso - e isolar x multiplicando ambos os lados por 1/a).
Se existe A−1 , então a incógnita de AX = B pode ser isolada multiplicando-se ambos os lados por
A−1 à esquerda:
90
Assim, temos
1 1 −1
1
A−1 = 5 −1 1 .
6
−7 5 1
−2 1 3
Exercı́cio. Dedida se A = 1 0 3 é invertı́vel e, em caso positivo, obtenha a inversa.
4 1 1
Dado um conjunto de vetores em R3 , podemos considerar o espaço gerado por eles, isto é, o conjunto
de todas as suas combinações lineares.
O conceito de independência linear, como o próprio nome diz, envolve perguntar se, para um certo
conjunto de vetores, um deles pode ser escrito como combinação linear dos outros.
A ideia geométrica é a seguinte. Uma reta r que passa pela origem é o conjunto dos múltiplos de
um vetor diretor, isto é, r : µV . Mas esta reta poderia ser parametrizada com dois parâmetros
livres, como r : µV + λW , desde que W e V sejam múltiplos.
No
segundo caso, um dos vetores está
µ + 2λ
sobrando como gerador. Por exemplo, o conjunto −µ − 2λ, que a priori tem dois parâmetros
3µ + 6λ
1
livres, pode ser escrito (µ + 2λ) −1, descartando um dos vetores diretores.
3
Assim, de uma certa maneira, dizer que um conjunto de vetores é LD (ou linearmente dependente),
vai significar que o espaço das combinações lineares deles tem pelo menos um gerador sobrando,
porque um deles é combinação linear dos outros.
Formalmente, temos
Exemplos.
91
3. Note que, em ambos os casos anteriores, a presença do vetor nulo no conjunto torna-o ime-
diatamente LD. Isto acontece sempre: se o vetor nulo pertence a um conjunto de vetores, ele
mesmo é combinação linear dos outros (basta tomar todos os escalares nulos) e o conjunto é
LD.
4. Um conjunto de três vetores {U, V, W } é LI se não são coplanares, ou seja, formam uma base
para R3 . Isso quer dizer, como já vimos, que eles geram todo o espaço. E, caso um deles seja
combinação linear dos outros - justamente o caso em que são coplanares, o conjunto é LD.
No caso de três vetores em R3 , a matriz associada é quadrada de ordem 3. Assim, se os vetores são
LI, as colunas formam uma base e o determinante da matriz é não nulo.
Sejam U , V e W três vetores LI em R3 , todos representados com ponto inicial na origem. Como
são LI, W está fora do plano gerado por U e V e estes três vetores determinam um paralelepı́pedo
P . O volume deste sólido é v(P ) = área da base x altura. A área da base é a área do paralelogramo
determinado por U e V , que, como sabemos, tem valor kU × V k. A altura é a distância da origem à
projeção ortogonal do ponto final de W na reta gerada por U × V . Seja θ o ângulo entre os vetores
W e U × V . Há dois casos a considerar: se θ é agudo, a altura procurada é kW k cos θ e o volume
então fica
W U
v(P ) = kU × V kkW k cos θ = (U × V ) · W = W · (U × V ) = det U = det V ,
V W
W U
v(P ) = kU × V kkW k| cos θ| = |(U × V ) · W | = |W · (U × V )| = |det U | = | V |.
V W
U
A conclusão, em qualquer caso, é que v(P ) = |det V |. Isto fornece mais um argumento que
W
mostra que o determinante de uma matriz é não nulo se e somente as colunas (ou as linhas, tanto
faz) formam uma base de R3 .
92
18.8 O teorema de caracterização
Ao longo de toda esta seção, de uma maneira ou de outra, olhamos com detalhes para matrizes
quadradas de ordem 3. Elas estão separadas em dois grupos: um onde o determinante é não nulo,
outro no qual o determinante é zero. O que fizemos foi apresentar uma série de argumentos que
demonstram o seguinte
Teorema 18.1 Seja A uma matriz quadrada de ordem 3. As seguintes afirmações são equivalentes:
2. det A 6= 0.
3. AER = I.
5. As colunas de A formam uma base para R3 (ou: as colunas de A são LI) (ou: as linhas de A
são LI).
Ou seja, cada uma destas condições caracteriza totalmente o grupo ao qual A faz parte.
Este teorema poderia ser enunciado a partir das negativas das condições. Ficaria assim:
Teorema 18.2 Seja A uma matriz quadrada de ordem 3. As seguintes afirmações são equivalentes:
2. det A = 0.
5. As colunas de A são coplanares (ou: as colunas de A são LD) (ou: as linhas de A são LD).
19 Mais exercı́cios
Sempre que possı́vel, haverá uma motivação geométrica para que sejam analisados as equações e
os sistemas lineares que aparecem como modelo.
3−t
1. Dê exemplos de pontos distintos pertencentes à reta r : 2t − 2.
1+t
93
1 0 6
2. Dado o plano π : x + 2y − 5z = 12, decida se os pontos A = 2 ,B=
1 e C = 1
−5 −2 0
pertencem ou não ao plano π.
1
3. Dado π : x − y − z = 0, determine a projeção perpendicular do ponto A = 2 sobre π.
1
4. Dado o cubo unitário determinado por {O, i, j, k}, seja P o ponto de encontro das diagonais
−→
da face superior. Determine o plano que passa pela origem e é perpendicular a OP .
1 + bt
5. Estude a posição relativa das retas r1 : a + 2t, onde t é o parâmetro e a e b são números
1−t
6s − 1
reais e r2 : −4s em função dos números a e b.
1 + 2s
6. Sejamπ : 3x − y + 2z = 8 e P o ponto de interseção de π com o eixo z. Considere o ponto
1
−→
Q = 1. Mostre que Q 6∈ π e decomponha o vetor P Q como combinação linear de dois
1
vetores perpendiculares, sendo um deles paralelo a π.
(a) Os conjuntos {U, V, W1 } e {U, V, W2 } são ambos LI, mas W1 e W2 não são paralelos.
(b) O conjunto {U, V, W3 } é LD mas W3 6= 0.
−1 a −1
10. Para quais valores de a ∈ R a matriz A = 1 −2 1 é invertı́vel?
a 0 −3
11. Calcule a distância entre os planos dados pelas equações x + y + z = 1 e x + y + z = 2.
94
−−−−−−→
P (t)Q(s) = λN.
Mostre que esta equação é um sistema linear 3x3 nas variáveis t, s e λ, associado a uma
matriz cujas colunas são LI. Portanto, este sistema tem solução única e ao substituirmos os
valores de t e s encontrados nos pontos genéricos de u e v, obtemos os pontos desejados.
20 Espaços Euclidianos Rn
Dizemos que dois vetores são ortogonais se o produto escalar entre eles é zero.
V ·W
Exercı́cio. Mostre que −1 ≤ ≤ 1. Conclua que podemos definir o ângulo entre dois
kV kkW k
vetores de Rn através do produto escalar.
Em R3 existem critérios geométricos que nos ajudam a caracterizar a independência linear, mas
em Rn , é necessário conhecer um critério algébrico.
Para deduzi-lo, considere um conjunto {V1 , . . . , Vk } de vetores de Rn e suponha que sejam LD,
ou seja, que um deles é combinação linear dos outros. Para fixar as ideias, digamos que Vk é
combinação linear de V1 , . . . , Vk−1 . Isto significa que existem escalares a1 , a2 , . . . , ak−1 tais que
Vk = a1 V1 + a2 V2 + · · · + ak−1 Vk−1
ou
a1 V1 + a2 V2 + · · · + ak−1 Vk−1 − Vk = 0,
a1
..
o que nos diz que o vetor . é solução (não nula) do sistema homogêneo
ak−1
−1
95
x1 V1 + x2 V2 + · · · + xk Vk = 0.
Exemplos.
1. Dois vetores não paralelos U e V em R2 , como sabemos, são LI. Note que, para escrever o zero
como combinação linear deles, devemos ter o vetor nulo como diagonal de um paralelogramo
com lados αU e βV . Ora, isto só é possı́vel para α = β = 0.
x1 V1 + x2 V2 + · · · + xm Vm = 0
tem mais incógnitas que equações, logo sempre tem solução não nula.
1 2 0
2
3 e W = 1 . Para determinar se
3. Em R4 , considere os vetores U = 0 , V = 1 −1
−1 1 −3
sãoLD
ou LI,
olhe para o sistema homogêneo xU + yV + zW = 0. Resolvendo-o, chegamos
−2z
a z . Escolhendo z = 1, concluı́mos que −2U + V + W = 0, o que significa que
z
qualquer um deles pode ser escrito como combinação linear dos outros dois. Por exemplo,
V = 2U − W . Assim, {U, V, W } é um conjunto LD.
20.2 Subespaços de Rn
Note que o vetor nulo é uma combinação linear de quaisquer vetores de W, logo todos os subespaços
contêm a origem.
Exemplos.
96
2. Uma reta r pela origem é um subespaço de R3 . De fato, quaisquer dois vetores de r são
múltiplos do vetor diretor, logo as combinações lineares deles também.
Estes são todos os exemplos em R3 . Para se convencer disso, suponha que um subespaço
W ⊂ R3 contenha um vetor não nulo U . Então W contém a reta gerada por U . Há duas
possibiliddes: ou W é exatamente a reta gerada por U ou W contém ainda um vetor V LI com
U (não paralelo). Nese caso, W contém as combinações lineares de U e V , isto é, W contém
um plano pela origem. Se W contém um plano pela origem, ou é exatamente esse plano ou
W contém ainda um vetor W que seja LI com U e V (isto é, U , V e W não coplanares), W é
todo o R3 . E são todos os casos, pois qualquer outro vetor de R3 adicionado à base {U, V, W }
torna o conjunto LD. Um exercı́cio de imaginação nos leva a conjecturar o que acontece para
n > 3.
5. Seja AX = 0 um sistema homogêneo de n equações e k incógnitas, isto é, A é uma matriz n×k.
Então, o espaço das soluções é um subespaço de Rk . De fato, se U e V são soluções, qualquer
combinação linear deles também é: se AU = 0 e AV = 0, então A(aU +bV ) = aAU +bAV = 0.
7. Exercı́cio. Em R3 , o subespaço ortogonal a uma reta pela origem é um plano pela origem e
vice-versa.
8. O espaço gerado pelos vetores V1 , . . . , Vk , definido por ser o conjunto das combinações lineares
deles, é obviamente um subespaço de Rn . É denotado usando-se colchetes: [V1 , . . . , Vk ]. Por
exemplo, em R3 , seja
2a − 3b + c
W = a + b − 2c |a, b, c ∈ R .
−a + 2b − c
2 −3 1
Não é difı́cil ver que se trata de um subespaço, pois W = a 1 + b 1 + c −2 ,
−1 2 −1
isto é, é o espaço gerado por três vetores. Mas para melhor descrever W, é necessário per-
guntar se todos os geradores são essenciais. Ou, em outras palavras, se de fato precisamos
de três prarâmetros livres. A resposta está na análise da dependência linear dos geradores:
chamando-os
de V1 , V2 e V3 , olhe para o sistema homogêneo xV1 +yV2 +zV3 = 0. Sua solução é
y
S = y | y ∈ R . Tomando y = 1, isto significa que V1 + V2 + V3 = 0, ou V3 = −V1 − V2 .
y
Assim, V1 , V2 e V3 são LD e V3 está sobrando como gerador, e W = [V1 , V2 ]. Como V1 e V2
97
não são múltiplos, são LI (ambos são essenciais como geradores), logo W é um plano pela
origem.
9. Exercı́cio. Dada uma matriz A com n linhas, mostre que o conjunto {B ∈ Rn | o sistema
AX = B tem solução} é um subespaço do Rn . Sugestão: este conjunto é o espaço gerado
pelas colunas de A.
Uma boa pergunta para o momento é se todas as bases para um mesmo subespaço tem o mesmo
número de vetores. Quando pensamos no subespaço W, gerado pelos vetores U1 , . . . , Uk , temos
W = {x1 U1 + · · · + xk Uk }, uma representação paramétrica, onde os parâmetros livres são os xj .
Mas já foi visto várias vezes que a representação paramétrica para um subconjunto de Rn não é
única, assim digamos que W também seja descrito pelos geradores V1 , · · · , V` . Ao produzirmos uma
base a partir de cada um dos conjuntos de geradores, reduzindo-os a um conjunto minimal (LI),
chegaremos ao mesmo número de vetores?
A resposta é afirmativa: a demonstração deste fato se faz supondo que {U1 , . . . , Uk } e {V1 , . . . , V`
são ambas bases para W, com k 6= `, e chegando a uma contradição. Vamos apenas ilustrar este
argumento tomando valores particulares k = 2 e ` = 1. Ora neste caso é fácil ver que U1 e U2 são
ambos múltiplos de V1 , logo são múltiplos entre si, portanto LD, o que é uma contradição com o
fato de {U1 , U2 } ser base.
Exemplos.
1. Podemos considerar Rn como subespaço de si mesmo. Como uma base para Rn tem n
elementos (tome, por exemplo, a base canônica), temos dim Rn = n.
2. Um plano pela origem em R3 tem dimensão 2 e uma reta pela origem em R3 tem dimensão
1.
98
a + 2b + 3d
2a + 3b + c + 5d
W |a, b, c, d ∈ R .
b−c+d
−a + b − 3c
−1 1 −3 0
um ou mais sobrando, isto é, se são LD.
−1 1 −3 0
−2y − 3w
y
cuja solução é S = y + w . Então o sistema admite solução não nula e os geradores
w
de W são LD. Dando valores para y e w, identificamos um gerador que é combinação linear
dos outros. Chame os geradores listados acima de V1 , V2 , V3 e V4 , na ordem em que aparecem.
Escolhendo y = 0 e w = 1, temos V4 = 3V1 − V3 e podemos descartar V4 . Escolhendo y = 1 e
w = 0, temos V2 = 2V1 −V3 e também podemos descartar V2 . Olhando agora para os geradores
que sobrarm, V1 e V3 , vê-se imediatamente que não são múltiplos, formando portanto uma
base para W. Logo dim W = 2. Em outras palavras, W é um plano pela origem em R4 .
Exercı́cios.
2. Calcule a dimensão da interseção de dois planos pela origem de R3 , para cada possı́vel posição
relativa entre eles.
a+c
3. Calcule a dimensão de W = b + c | a, b, c ∈ R .
a + 2b + c
99
4.
Calcule a dimensão
do espaço das soluções do sistema homogêneo AX = 0, onde A =
2 2 −1 1
−1 1 2 1 .
1 1 −2 −1
5. Todos os subespaços de Rn podem ser vistos como soluções de sitemas homogêneos. Para ver
isto, seja W um subespaço, e seja {U1 , . . . , Uk } uma base para W. Mostre que o subespaço
ortogonal a W é a solução do sistema homogêneo [U1 , . . . , Uk ]t X = 0. Mostre que dim W⊥ =
n − k. Supondo que {V1 , . . . , Vn−k } seja uma base para W⊥ , mostre que W é a solução
do sistema homogêneo [V1 , . . . , Vn−k ]X = 0. Sugestão: faça primeiro em R3 e interprete
geometricamente, para “sentir” o que acontece em dimensões maiores.
21 Diagonalização de Matrizes
Parte deste conteúdo já foi visto quando estudamos cônicas, soluções de equações quadráticas em
R2 . Lá, associamos a cada equação uma matriz simétrica 2 × 2, para a qual encontramos uma base
ortonormal de autovetores, que por sua vez definia um novo sistema de coordenadas, com eixos
paralelos aos eixos de simetria da cônica; isto acontece porque na base de autovetores, a matriz é
diagonal.
Vamos estudar um pouco mais de diagonalização de matrizes, em dimensões maiores e sem que
necessariamente sejam simétricas. A sequência será mudança de base em Rn , autovalores e au-
tovetores para matrizes quadradas de ordem n, condições suficientes para que uma matriz seja
diagonalizável (ou para que não seja), diagonalização de matrizes simétricas.
Os teoremas serão enunciados sem demonstração, pois não fazem parte do objetivo deste curso. Na
verdade, os resultados serão ilustrativos e úteis para tomarmos alguns atalhos nas contas, mas o
cálculo de todos os autovalores e autovetores de uma dada matriz é suficiente para concluir se ela
é ou não diagonalizável.
Sejam (x1 , . . . , xn ) as coordenadas usuais de Rn , definidas pela base canônica e (x01 , . . . , x0n ), coorde-
nadas na base B = {V1 , . . . , Vn }. Dado um vetor qualquer U ∈ Rn , comparando as decomposições
de U nas bases B0 e B, temos
x1 e1 + · · · + xn en = x01 V1 + · · · x0n Vn ,
100
que é o mesmo que escrever X = AX 0 , onde A = [V1 , . . . , Vn ] (colunas). É imediato que det A 6= 0
e que X 0 = A−1 X é uma equação equivalente.
Já vimos que matrizes quadradas de ordem 2 podem ser vistas como movimentos do plano, isto
é, funções de R2 em R2 que “transformam” um vetor em outro via multiplicação. O mesmo
pode
serfeito em qualquer dimensão. Só a tı́tulo de exemplo, lembre-se que a muliplicação por
0 −1
é uma rotação de 90o no sentido positivo. Tente se convencer que a muliplicação por
1 0
0 −1 0
M = 1 0 0 é a rotação de 90o em torno do eixo z seguida da reflexão no plano xy em
0 0 −1
2 0 0
R3 , enquanto que a multiplicação por N = 0 2 0 dilata (multiplica pelo escalar 2) vetores
0 0 1
do plano xy e não muda vetores do eixo z. Em geral, dado um vetor U ∈ R3 , para saber quem
é N U , basta decompô-lo em uma soma de um vetor no plano xy com um vetor no eixo z, já que
multiplicação de matrizes respeita combinações lineares.
Quando fazemos uma mudança de base, podemos imaginar que estamos mudando o ponto de vista
do observador do movimento causado pela multiplicação por uma matriz M , de modo que ele
enxergue esta ação pela multiplicação por uma outra matriz, digamos N , que, é claro, depende de
M . A mudança de coordenadas das canônicas (X) para as definidas pela base B (X 0 ) se faz através
da multiplicação por A−1 , onde A é a matriz cujas colunas são os vetores de B. Assim, N também
vai depender de A.
Com estas ideias, tentemos entender o movimento causado por N em (Rn , B), ou seja, em Rn
com as coordenadas X 0 . Primeiro, “voltamos” para (Rn , B0 ), pela multiplicação por A. Ou seja,
dado U ∈ (Rn , B), temos AU ∈ (Rn , B0 ). Agora multiplicamos por M , gerando o movimento
propriamente dito em (Rn , B0 ), obtendo o vetor M AU ∈ (Rn , B0 ). Finalmente, mudamos no-
vamente de coordenadas, de X para X 0 através da multiplicação por A−1 , chegando ao vetor
A−1 M AU ∈ (Rn , B).
Então, para qualquer vetor U , temos N U = A−1 M AU ∈ (Rn , B). Isto determina completamente
a matriz N a partir de M e A: N = A−1 M A. Como sempre, enfatizamos que as equações
M = AN A−1 e M A = AN são equivalentes. Isto motiva as seguintes definições.
Definição. Duas matrizes quadradas M e N são semelhantes ou conjugadas se existe uma matriz
A invertı́vel (de mesma ordem) tal que M = AN A−1 .
Sob este ponto de vista, diagonalização de matrizes nada mais é que perguntar se existe uma matriz
diagonal semelhante a M :
Definição. Uma matriz quadrada M é diagonalizável se é semelhante a uma matriz diagonal, isto
é, se existem matrizes D diagonal e A invertı́vel tais que M = ADA−1 .
λ1 0 · · · 0
Como esta equação é equivalente a M A = AD, se A = [V1 , . . . , Vn ] (colunas) e D = ... ... . . . ... ,
0 0 · · · λn
−1
usando multiplicação de matrizes vemos que escrever M = ADA é o mesmo que escrever
101
[M V1 , . . . , M Vn ] = [λ1 V1 , . . . , λn Vn ],
e, comparando as colunas, vemos que cada coluna de A é um vetor não nulo (que, portanto, define
uma direção) que é levado por M num múltiplo de si mesmo, ou seja, trata-se de uma direção
invariante, expressão que já escutamos ao falarmos de autovetores:
Com estas observações, dizer que uma matriz M é diagonalizável é o mesmo que dizer que existe
uma base de Rn formada por autovetores de M ; eles serão as colunas da matriz A. Ou ainda, é o
mesmo que dizer que existe uma base que define coordenadas em Rn nas quais a multiplicação por
M é a multiplicação por uma matriz diagonal.
Para verificar se uma dada matriz M é ou não diagonalizável, tratamos de encontar seus autovetores,
para saber se existe ou não uma base de Rn formada por eles. Para isso, como já vimos em dimensão
2, temos que encontrar os autovalores de M . A partir de M V = λV , chegamos a (M − λI)V = 0 e,
como queremos V 6= 0, exigimos det(M − λI) = 0. Esta equação é uma equação polinomial de grau
n (igual à ordem da matriz), chamada equação caracterı́stica. O polinômio de grau n det(M − λI)
é chamado polinômio caracterı́stico de M .
Autovalores são raı́zes reais da equação caracterı́stica, assim, um motivo para uma matriz não ser
diagonalizável é a equação caracterı́stica não ter raı́zes reais em número suficiente.
0 −1
Por exemplo, a rotação M = tem como equação caracterı́stica λ2 + 1 = 0, que não tem
1 0
raı́zes reais, logo não existem autovalores, logo M não é diagonalizável. De fato, geometricamente
é claro que não existem direções invariantes.
O outro motivo para uma matriznão ser diagonalizável é a falta de autovetores. Isto acontece,
2 1
por exemplo, para a matriz M = , cuja equação caracterı́stica é (λ − 2)2 = 0 que tem duas
0 2
raı́zes reais e iguais. Então há autovalores em número suficiente,
mas, ao calcularmos os autovetores
0 1 x
associados ao autovalor duplo λ = 2, chegamos ao sistema = 0, cuja solução é o eixo
0 0 y
x. Assim, não existe uma base de R2 formada por autovetores de M , já que todos os autovetores
são múltiplos.
Não é uma coincidência este fato ocorrer para raı́zes múltiplas da equação caracterı́stica:
Assim, é imediato concluir que uma matriz M de ordem n que tem n autovalores distintos é
diagonalizável, pois n vetores LI em Rn formam uma base.
102
Outra conclusão é que, havendo autovalores em número suficiente, contados com multiplicidade,
então somente poderá haver “falta de autovetores” para os autovalores múltiplos. Vamos tornar
este conceito um pouco mais preciso:
Então, a dimensão de um autoespaço é no mı́nimo 1, já que, se existe autovalor, existe autovetor.
A “falta de autovetores” está relacionada com o fato de um autoespaço não atingir sua dimensão
máxima. Para continuar a formalizar, vamos lembrar alguns resultados básicos sobre polinômios
caracterı́sticos e sua fatoração.
Primeiramente, note, pela própria definição, que o polinômio caracterı́stico de uma matriz n × n
tem grau n e o coeficiente de λn é 1 ou −1.
A seguir, um fato geral sobre polinômios de grau n é que em sua fatoração, além do fator de
grau zero (o coeficiente de λn ), aparecem apenas fatores de grau 1 (da forma (λ − a)) ou fatores
irredutı́veis de grau 2 (polinômios quadráticos sem raı́zes reais). E, como você já deve ter percebido,
fatores da forma (λ − a)k são a multiplicação de k fatores iguais de grau 1 e significam que a é
uma raı́z de multiplicidade k do polinômio caracterı́stico. Em outras palavras, este polinômio tem
entre suas raı́zes “k raı́zes reais e iguais a a”. É claro que a soma dos graus dos fatores é igual a n.
A ocorrência de fatores irredutı́veis de grau 2 no polinômio caracterı́stico de uma matriz é o que
chamamos anteriormente de falta de autovalores e constitui motivo para a não diagonalização da
matriz.
Teorema. Para cada autovalor a da matriz M , tem-se 1 ≤ dim Sa ≤ g(a). Assim, a dimensão
máxima que o autoespaço associado a a pode assumir é o grau algébrico de a como raiz da equação
caracterı́stica.
Logo:
Vamos fazer um resumo-ilustração dessas ideias para matrizes 3 × 3, nosso ambiente será, portanto,
o R3 . Na alálise a seguir, tomamos o coeficiente de λ3 no polinômio caracterı́stico como 1, mas
nada mudaria se fosse −1, já que as raı́zes são as mesmas.
1. p(λ) tem três raı́zes reais e distintas. Assim, p(λ) = (λ−a)(λ−b)(λ−c). Então, os autoespaços
Sa , Sb e Sc são gerados por vetores LI, logo estes geradores formam uma base de R3 , logo a
matriz M é diagonalizável. A matriz D, a menos de multiplicação por escalar, é a matriz dos
a 0 0
autovalores, isto é, D = 0 b 0. A matriz A terá como colunas autovetores associados a
0 0 c
a, b e c respectivamente.
103
2. p(λ) tem apenas uma raiz real. Assim, p(λ) = (λ − a)q(λ), onde q(λ) é um fator irredutı́vel
de grau 2. A matriz M não é diagonalizável por falta de autovalores.
2
3. p(λ) tem três raı́zes reais, mas uma delas é dupla. Assim, p(λ) = (λ − a) (λ − b), com
a 0 0
a 6= b. Nesse caso, na tentativa de diagonalizar M escrevemos D = 0 a 0. sabemos que
0 0 b
dim Sb = 1, tomamos um gerador desta reta para ser a terceira coluna da matriz A. Mas,
de acordo com os resultados acima, temos duas possibilidades para dim Sa : 1 ou 2. Se for
dim Sa = 2, então Sa é um plano transversal à reta Sb e tomando uma base para este plano,
teremos as duas primeiras colunas da matriz A; concluindo que M é diagonalizável. E, se for
dim Sa = 1, concluı́mos que M não será diagonalizável por falta de autovetores.
4. p(λ) tem três raı́zes reais e iguais, ou uma raiz tripla. Assim, p(λ) = (λ − a)3 . Aqui, temos
1 ≤ dim Sa ≤ 3. Se for o caso de dimensão máxima, isto é, dim Sa = 3, então existe uma base
de Sa , que nesse caso é o próprio R3 , formada por autovetores de M e a matriz
é diagonalizável
a 0 0
(é um exercı́cio mostrar que isto só ocorre se M já é a matriz diagonal 0 a 0). Nos
0 0 a
outros casos, isto é, se dim Sa for igual a 1 ou 2, então a matriz M não é diagonalizável por
falta de autovetores.
Matrizes simétricas são sempre diagonalizáveis por uma matriz ortogonal (colunas formam uma
base ortonomral), a exemplo do que já sabemos em R2 .
Para concluir que existe uma base ortonormal que diagonaliza M , falta apenas mostrar que, dado
um autoespaço Sa , podemos escolher (construir) uma base ortonormal para Sa . Este processo,
chamado ortogonalização de Gram-Schmidt, se faz a partir de projeções ortogonais.
Definição. Dados dois vetores U e V em Rn , sendo U não nulo, a projeção ortogonal de V sobre
U é a projeção ortogonal do ponto final de V na reta gerada por U . Lembre-se que desde que
começamos a falar de subespaços, sempre consideramos vetores com ponto inicial na origem. A
projeção de V sobre U é denotada por P rojU V e é claramente um múltiplo de U . Não é difı́cil
V ·U
achar qual é o escalar, deduzindo - faça como exercı́cio - que P rojU V = U . Outro exercı́cio
U ·U
que o leitor deve fazer é mostrar que V − P rojU V é ortogonal a U .
104
Assim, se um subespaço W de Rn tem dimensão 2, com base, digamos {V, W }, para acharmos
uma base ortonormal, primeiro vamos encontrar uma base ortogonal: decomponha W como soma
de dois vetores, W = W1 + W2 , sendo W1 paralelo a V e W2 ortogonal. O vetor W1 , isto é, a
componente de W paralela a V é inútil como gerador de W, pois V já gera essa direção. Assim,
substituı́mos a base {V, W } pela base ortogonal {V, W2 }. Em termos da projeção ortogonal, basta
tomar W1 = P rojV W e W2 = W − P rojV W . Como queremos uma base ortonormal, ainda falta
normalizar,
istoé, dividir pela norma: a base procurada, formada por vetores ortogonais e unitários,
V W2
é , .
kV k kW2 k
Em geral, se dim W = k, dada uma base {V1 , . . . , Vk }, para conseguir uma base ortogonal, or-
togonalize, como acima, o conjunto {V1 , V2 } projetando V2 sobre V1 e descartando a componente
paralela, obtendo {V1 , W2 }. Agora tome V3 , projete-o ortogonalmente sobre o plano gerado por V1
e W2 ; isto se faz considerando a soma das projeções em cada uma das direções: P roj[V1 ,W2 ] V3 =
P rojV1 V3 + P rojW2 V3 . Descarte a componente de V3 nese plano, tomando W3 = V3 − P roj[V1 ,W2 ] V3 .
Proceda indutivamente, projetando V4 no espaço gerado por V1 , W2 e W3 e tomando apenas a com-
ponente ortogonal W4 e assim por diante. Como a dimensão de W é finita (afinal é um subespaço
de Rn ), em algum momento chegaremos a uma base ortogonal {V1 , W2 , · · · , Wk } que, normalizada,
será uma base ortonormal.
Assim, para matrizes simétricas M , existem matrizes diagonal D e ortogonal A tais que M =
ADA−1 .
1. As matrizes dos exercı́cios 6.1.1, 6.1.2, 6.1.3 e 6.1.4 e 6.2.1 do livro (online) do Reginaldo.
2. Faça, se quiser, os exercı́cios teóricos 6.1.14, 6.1.15 e 6.1.19 do livro (online) do Reginaldo
105